解析 ‘Supervisor’ 模式：如何利用中心化 Agent 像产品经理一样分配任务给垂直领域的专家 Agent？ - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位同仁，各位对人工智能前沿技术抱有浓厚兴趣的朋友们，大家好！

今天，我将和大家深入探讨一个在构建复杂 Agent 系统中至关重要的模式——Supervisor 模式。想象一下，一个雄心勃勃的项目，需要处理各种专业任务，从市场分析到代码编写，从数据可视化到用户界面设计。如果只有一个全能的“超级 Agent”，它不仅会因为能力边界模糊而效率低下，更可能在处理专业任务时“胡言乱语”，也就是我们常说的“幻觉”。

这时，我们自然会想到人类世界的解决方案：项目经理与专家团队。项目经理负责统筹全局、分解任务、调度资源，而各个领域的专家则专注于自身擅长的专业领域。这就是 Supervisor 模式的核心理念：一个中心化的 Supervisor Agent，像产品经理一样，将复杂任务分配给各个垂直领域的专家 Agent。

引言：Agent 协作的必要性与挑战

随着大型语言模型（LLMs）能力的飞速发展，我们正迈入 Agent 时代。一个 Agent 不仅仅是调用 LLM API，它更是一个能够感知环境、进行规划、采取行动并反思的自主实体。然而，即使是最强大的 LLM，也并非万能。它可能在某些特定领域缺乏深度知识，或者在执行多步骤、跨领域任务时表现不佳。

单一 Agent 解决复杂问题的挑战主要体现在：

能力边界模糊： 一个通用 LLM 难以同时精通所有领域，容易在专业任务上表现平庸。
“幻觉”风险： 在不熟悉的领域，LLM 倾向于“编造”答案，而非承认无知。
效率低下： 大模型在每次推理时都要加载大量参数，处理简单任务时显得资源浪费。
可维护性差： 更改或升级特定功能意味着可能要重新训练或调整整个模型。

为了克服这些挑战，Agent 协作应运而生。通过将一个宏观任务分解为多个子任务，并分配给具有特定专长的 Agent，我们可以构建出更强大、更可靠、更高效的智能系统。而 Supervisor 模式，正是这种协作模式中的一种核心范式。

Supervisor 模式核心概念

Supervisor 模式是一种中心化的 Agent 协作架构。它的核心思想是引入一个“管理者”角色，即 Supervisor Agent，来协调多个“执行者”角色，即 Expert Agents。

核心角色：

Supervisor Agent (产品经理):
- 职责： 接收用户或系统的原始需求，理解其意图。将复杂任务分解为一系列更小、更具体的子任务。根据子任务的性质，识别并选择最合适的 Expert Agent。将子任务连同必要的上下文信息分配给 Expert Agent。监控任务执行进度。收集并整合 Expert Agents 的输出，形成最终的、有条理的结果。在必要时，进行迭代或修正。
- 能力： 强大的规划、推理和协调能力。需要能够理解高级指令，进行逻辑分解，并具备对 Expert Agents 能力的认知。
Expert Agents (垂直领域专家):
- 职责： 专注于特定领域（例如，代码生成、数据分析、报告撰写、图像处理）。掌握该领域深厚的知识和专业的工具（例如，Python 解释器、数据库查询接口、Web 搜索 API、代码库）。接收 Supervisor 分配的子任务，并利用其专业知识和工具进行高效执行。将子任务的执行结果清晰地返回给 Supervisor。
- 能力： 领域专业知识、工具使用能力、遵守指令的执行力。

工作流程概述：

整个模式的工作流程可以概括为以下几个阶段：

任务接收与理解： Supervisor 接收外部（用户或上层系统）提交的原始、高层次任务。
任务分解与规划： Supervisor 利用其规划能力，将高层任务分解为一系列相互关联、逻辑清晰的子任务。同时，它会为每个子任务制定执行策略，考虑依赖关系和并行性。
专家识别与选择： 对于每个子任务，Supervisor 根据其内容和所需能力，从可用的 Expert Agents 池中选择最适合的专家。
任务分配与调度： Supervisor 将分解后的子任务、相关上下文以及任何必要的数据，发送给选定的 Expert Agent。
执行与监控： Expert Agent 接收子任务后，利用其领域知识和工具进行处理。Supervisor 持续监控各个子任务的执行状态。
结果整合与反馈： 当 Expert Agent 完成子任务并返回结果后，Supervisor 收集所有子任务的输出，进行综合、提炼，并形成最终的解决方案或报告。如果发现问题或需要进一步细化，Supervisor 可能会启动新的分解-分配-执行循环。

这种分而治之的策略，使得系统能够有效应对复杂性，提高任务处理的准确性和效率。

Supervisor 模式的工作机制

让我们更细致地剖析 Supervisor 模式的各个环节。

1. 任务接收与理解

这是整个流程的起点。Supervisor 接收到的通常是自然语言形式的复杂指令。它需要利用自身的 LLM 能力，对指令进行深入理解，识别出核心目标、约束条件、关键实体以及用户期望的输出格式。

LLM 在此阶段的作用： 语义理解、意图识别、实体抽取。

2. 任务分解与规划

这是 Supervisor 最核心的能力之一。一个复杂任务往往不能一步到位。Supervisor 需要将其拆解成一系列更小、更具体的、可由单个 Expert Agent 处理的子任务。在分解过程中，Supervisor 需要考虑：

子任务的独立性： 尽可能让子任务独立，减少不必要的依赖。
依赖关系： 明确子任务之间的顺序，哪些可以并行，哪些必须串行。
输出格式： 确保每个子任务的输出能被后续子任务或最终整合所用。
专家匹配度： 分解出的子任务应能清晰地匹配到某个 Expert Agent 的能力。

LLM 在此阶段的作用： 链式思考（Chain of Thought）、规划（Planning）、问题分解。

例如，一个任务是“为一家新开的咖啡馆撰写一份包含市场分析、品牌定位和推广策略的商业计划书”。
Supervisor 可能会分解为：

子任务 1: 进行咖啡馆行业市场调研，分析竞争对手和潜在客户群体。（市场分析专家）
子任务 2: 根据调研结果，制定咖啡馆的品牌名称、Logo 理念和核心卖点。（品牌专家）
子任务 3: 设计线上和线下推广方案，包括社交媒体内容策略和开业活动计划。（营销专家）
子任务 4: 将以上所有信息整合，撰写结构化的商业计划书。（文档撰写专家）

3. 专家识别与选择

在分解任务后，Supervisor 需要为每个子任务找到最合适的 Expert Agent。这要求 Supervisor 维护一个“专家名录”，其中包含了每个 Expert Agent 的能力描述、擅长领域和可用的工具。

LLM 在此阶段的作用： 语义匹配、基于描述的推理。Supervisor 会根据子任务描述和 Expert Agents 的能力描述进行匹配。

表格：专家 Agent 能力描述示例

Agent 名称	角色/职责	核心能力	可用工具
`MarketAnalyst`	市场调研与趋势分析	经济学知识、数据解读、趋势预测	Web 搜索（Google Search）、数据查询 API (如统计局数据)、新闻聚合器
`BrandStrategist`	品牌定位与形象设计	营销学、心理学、创意设计	图像生成 API (如 DALL-E)、品牌名称生成器、用户调研工具
`MarketingExpert`	营销策略与推广方案制定	市场推广、社交媒体运营、广告投放	社交媒体 API、广告平台 API、内容日历工具
`CodeArchitect`	软件架构设计与代码生成	编程语言精通、系统设计、算法	Python 解释器、代码库、API 文档查询
`ReportWriter`	文本整理与报告撰写	写作、编辑、结构化表达	文档模板、语法检查器、摘要工具

4. 任务分配与调度

一旦确定了 Expert Agent，Supervisor 就需要将子任务和必要的上下文信息（如原始任务描述、上一个子任务的输出）传递给它。这通常通过某种通信机制实现。

通信机制：

简单模式： 在内存中直接调用 Expert Agent 的 execute_task 方法。
异步模式： 使用任务队列（如 Python 的 queue 模块、Celery、RabbitMQ、Kafka）来实现解耦和并发执行。Supervisor 将任务发布到队列，Expert Agents 从队列中消费任务。

5. 执行与监控

Expert Agent 接收到子任务后，会利用其内置的 LLM 进行推理，结合自身工具进行操作。例如，MarketAnalyst 可能会使用 Web Search 工具查询最新的咖啡馆行业报告。

Supervisor 在此期间会监控每个 Expert Agent 的执行状态。这可能包括：

超时检查： 避免 Expert Agent 无限期运行。
错误捕获： 识别 Expert Agent 执行中的错误。
进度更新： 如果 Expert Agent 能够提供中间状态更新，Supervisor 可以收集。

LLM 在 Expert Agent 中的作用： 工具选择、工具参数生成、结果解读、子任务执行决策。

6. 结果整合与反馈

Expert Agent 完成子任务后，会将结果返回给 Supervisor。Supervisor 的任务是收集所有 Expert Agent 的输出，并将其合成一个连贯、完整的最终结果。这可能涉及：

数据清洗与格式转换： 确保所有结果数据格式一致。
信息去重与冲突解决： 处理来自不同专家可能存在的冗余或矛盾信息。
逻辑串联与叙述组织： 将零散的专家输出整合成有逻辑的报告或方案。
迭代与修正： 如果最终结果不满足要求，Supervisor 可能会根据反馈重新规划，或要求某个 Expert Agent 重新执行特定子任务。

LLM 在此阶段的作用： 文本摘要、信息综合、结构化输出生成、批判性评估。

构建 Supervisor 模式：技术实现细节

现在，我们通过 Python 代码来具体看看如何实现 Supervisor 模式。我们将使用一个简化的模型，不依赖复杂的第三方 Agent 框架，而是通过类和函数来模拟其核心逻辑，以便大家理解其本质。

我们将设定一个场景：为客户生成一份关于某个主题的研究报告，其中包含信息检索、内容总结和报告撰写。

基础框架与组件

LLM 接口： 我们可以使用 OpenAI 的 gpt-4 或其他模型。
Agent 框架： 这里我们将自己实现简化版的 Agent 类。
工具集成： 定义简单的 Python 函数作为工具。
通信机制： 使用 Python 内存中的列表或字典作为任务队列和状态存储。

首先，我们定义一个抽象的 Tool 类和一些具体的工具：

import os
import json
import time
from typing import List, Dict, Any, Callable, Optional, Union
from abc import ABC, abstractmethod

# 假设我们有一个 LLM 客户端
# 实际项目中，这里会是 OpenAI(), Anthropic() 等
class MockLLM:
    """
    模拟 LLM 行为，用于演示。
    在真实场景中，会调用实际的 LLM API。
    """
    def generate(self, prompt: str, temperature: float = 0.7) -> str:
        print(f"n--- LLM 调用 (Prompt 长度: {len(prompt)}) ---")
        print(f"Prompt: {prompt[:500]}...") # 只打印部分 prompt
        # 实际的 LLM 调用会在这里发生，例如：
        # response = openai.chat.completions.create(...)
        # return response.choices[0].message.content

        # 模拟 LLM 的响应，根据 prompt 内容进行简单判断
        if "分解任务" in prompt:
            return json.dumps({
                "plan": [
                    {"task": "通过网络搜索获取主题相关的基础信息和最新进展。", "expert": "ResearchAnalyst"},
                    {"task": "总结这些信息，提炼出核心观点和关键数据。", "expert": "SummaryExpert"},
                    {"task": "根据总结内容，撰写一份结构化的研究报告。", "expert": "ReportWriter"}
                ],
                "reasoning": "为了生成全面的报告，需要先收集信息，然后提炼总结，最后组织成报告。"
            })
        elif "选择工具" in prompt and "search_web" in prompt:
            return json.dumps({"tool": "search_web", "args": {"query": "模拟搜索查询"}})
        elif "总结" in prompt:
            return "这是对模拟搜索结果的总结。"
        elif "撰写报告" in prompt:
            return "这是根据总结内容撰写的模拟研究报告。"
        elif "整合" in prompt:
            return "最终整合的报告内容。"
        else:
            return "LLM 模拟响应：任务已处理。"

# 初始化模拟 LLM
mock_llm = MockLLM()

class Tool(ABC):
    """抽象工具类"""
    def __init__(self, name: str, description: str):
        self.name = name
        self.description = description

    @abstractmethod
    def run(self, **kwargs) -> str:
        pass

class WebSearchTool(Tool):
    """模拟网络搜索工具"""
    def __init__(self):
        super().__init__("search_web", "通过网络搜索获取最新信息和数据。输入参数: query (string)")

    def run(self, query: str) -> str:
        print(f"执行工具: {self.name} - 搜索 '{query}'...")
        # 实际项目中，这里会调用真实的搜索 API，如 Google Search API
        time.sleep(1) # 模拟网络请求延迟
        if "咖啡馆市场" in query:
            return "模拟搜索结果：咖啡馆市场增长迅速，健康概念和特色体验是趋势。"
        elif "AI Agent 协作" in query:
            return "模拟搜索结果：AI Agent 协作模式多种多样，包括分层、群组和中心化模式。"
        else:
            return f"模拟搜索结果：关于 '{query}' 的一些通用信息。"

class TextSummarizerTool(Tool):
    """模拟文本摘要工具"""
    def __init__(self):
        super().__init__("summarize_text", "对长文本进行摘要，提取关键信息。输入参数: text (string)")

    def run(self, text: str) -> str:
        print(f"执行工具: {self.name} - 摘要文本 (长度: {len(text)})...")
        time.sleep(0.5)
        return f"模拟摘要：'{text[:50]}...' 的关键信息已提取。"

class ReportFormatterTool(Tool):
    """模拟报告格式化工具"""
    def __init__(self):
        super().__init__("format_report", "将原始内容格式化为结构化的报告。输入参数: content (string), title (string)")

    def run(self, content: str, title: str) -> str:
        print(f"执行工具: {self.name} - 格式化报告 '{title}'...")
        time.sleep(0.5)
        return f"### {title}nn{content}nn---n格式化完成。"

# 实例化工具
web_search_tool = WebSearchTool()
text_summarizer_tool = TextSummarizerTool()
report_formatter_tool = ReportFormatterTool()

1. 专家 Agent 的定义 (`ExpertAgent` Class)

每个专家 Agent 都会有自己的名称、描述和一套可用的工具。它接收 Supervisor 分配的任务，利用其 LLM 能力决定如何使用工具来完成任务。

class ExpertAgent:
    """
    垂直领域的专家 Agent，专注于特定任务并拥有专业工具。
    """
    def __init__(self, name: str, description: str, tools: Optional[List[Tool]] = None):
        self.name = name
        self.description = description
        self.tools = {tool.name: tool for tool in tools} if tools else {}
        self.llm = mock_llm # 每个专家 Agent 也可以有自己的 LLM 实例，或共享一个

    def _get_tools_description(self) -> str:
        """生成工具的描述字符串供 LLM 使用"""
        if not self.tools:
            return "No tools available."
        return "n".join([f"- {tool.name}: {tool.description}" for tool in self.tools.values()])

    def execute_task(self, task_description: str, context: Dict[str, Any] = None) -> Dict[str, Any]:
        """
        执行分配的子任务。
        Expert Agent 会根据任务描述和可用工具，决定是直接回答还是使用工具。
        """
        print(f"n[{self.name}] 接收任务: {task_description}")
        full_context = context if context else {}

        # 构造给 LLM 的 prompt，让它决定如何行动
        prompt = f"""
        你是一个名为 {self.name} 的专家 Agent。你的职责是 {self.description}。
        当前任务是：{task_description}
        可用的上下文信息：{json.dumps(full_context, indent=2)}

        你拥有以下工具：
        {self._get_tools_description()}

        请思考如何完成这个任务。你必须遵循以下格式来决定你的行动：

        <thought>
        你的思考过程，如何将任务分解为工具调用或直接回答。
        </thought>
        <action>
        {{
            "tool": "tool_name" OR "final_answer",
            "args": {{ "arg1": "value1", "arg2": "value2" }} OR {{ "answer": "your final answer" }}
        }}
        </action>

        请输出你的行动。
        """

        try:
            llm_response = self.llm.generate(prompt)
            # 尝试解析 LLM 的输出
            thought_start = llm_response.find("<thought>")
            thought_end = llm_response.find("</thought>")
            action_start = llm_response.find("<action>")
            action_end = llm_response.find("</action>")

            thought = llm_response[thought_start + len("<thought>"):thought_end].strip() if thought_start != -1 and thought_end != -1 else "未提供思考过程。"
            action_str = llm_response[action_start + len("<action>"):action_end].strip() if action_start != -1 and action_end != -1 else "{}"

            action = json.loads(action_str)

            print(f"[{self.name}] 思考: {thought}")
            print(f"[{self.name}] 决定行动: {action}")

            if action.get("tool") and action["tool"] != "final_answer":
                tool_name = action["tool"]
                tool_args = action.get("args", {})
                if tool_name in self.tools:
                    tool_output = self.tools[tool_name].run(**tool_args)
                    return {"status": "success", "output": tool_output, "agent_name": self.name}
                else:
                    return {"status": "error", "output": f"未知的工具: {tool_name}", "agent_name": self.name}
            else:
                final_answer = action.get("args", {}).get("answer", "未能生成最终答案。")
                return {"status": "success", "output": final_answer, "agent_name": self.name}

        except json.JSONDecodeError:
            print(f"[{self.name}] LLM 输出解析失败，尝试直接作为最终答案。")
            return {"status": "success", "output": llm_response, "agent_name": self.name}
        except Exception as e:
            return {"status": "error", "output": f"执行 Expert Agent 任务时发生错误: {e}", "agent_name": self.name}

# 实例化专家 Agent
research_analyst = ExpertAgent(
    name="ResearchAnalyst",
    description="专门负责通过网络搜索和数据分析获取信息。",
    tools=[web_search_tool]
)

summary_expert = ExpertAgent(
    name="SummaryExpert",
    description="擅长对大量文本进行摘要和提炼关键信息。",
    tools=[text_summarizer_tool]
)

report_writer = ExpertAgent(
    name="ReportWriter",
    description="负责将整理好的信息撰写成结构化、专业的报告。",
    tools=[report_formatter_tool]
)

expert_agents = [research_analyst, summary_expert, report_writer]

2. Supervisor Agent 的设计 (`SupervisorAgent` Class)

Supervisor Agent 负责整个流程的编排。它需要知道所有可用的 Expert Agent。

class SupervisorAgent:
    """
    中心化的 Supervisor Agent，负责任务分解、专家调度和结果整合。
    """
    def __init__(self, llm: Any, expert_agents: List[ExpertAgent]):
        self.llm = llm
        self.expert_agents = {agent.name: agent for agent in expert_agents}
        self.task_history: List[Dict[str, Any]] = [] # 记录任务执行历史和结果

    def _get_expert_descriptions(self) -> str:
        """生成专家 Agent 的描述字符串供 LLM 使用"""
        return "n".join([f"- {agent.name}: {agent.description}" for agent in self.expert_agents.values()])

    def plan_task(self, main_task: str) -> Dict[str, Any]:
        """
        利用 LLM 对主任务进行分解和规划。
        LLM 会输出一个包含子任务列表和每个子任务应分配给哪个专家的 JSON 结构。
        """
        prompt = f"""
        你是一个 Supervisor Agent，你的任务是接收一个复杂的主任务，并将其分解为一系列可由专家 Agent 执行的子任务。
        你需要为每个子任务指定一个合适的专家。

        主任务是: {main_task}

        可用的专家 Agent 及其描述如下：
        {self._get_expert_descriptions()}

        请思考如何分解这个任务，并规划执行步骤。你的输出必须是 JSON 格式，包含一个 'plan' 列表和 'reasoning'。
        'plan' 列表中的每个元素都是一个字典，包含 'task' (子任务描述) 和 'expert' (要分配的专家名称)。

        输出示例：
        {{
            "plan": [
                {{"task": "子任务1描述", "expert": "ExpertAgentName1"}},
                {{"task": "子任务2描述", "expert": "ExpertAgentName2"}}
            ],
            "reasoning": "你的任务分解和规划的理由。"
        }}
        """
        print("n--- Supervisor 规划阶段 ---")
        try:
            llm_response = self.llm.generate(prompt)
            plan_data = json.loads(llm_response)
            print(f"Supervisor 规划结果: {json.dumps(plan_data, indent=2)}")
            return plan_data
        except json.JSONDecodeError as e:
            print(f"Supervisor 规划失败：LLM 输出不是有效的 JSON。错误: {e}n原始输出:n{llm_response}")
            return {"plan": [], "reasoning": "规划失败，请检查 LLM 输出格式。"}

    def assign_and_execute(self, sub_task: Dict[str, Any], context: Dict[str, Any]) -> Dict[str, Any]:
        """
        将子任务分配给指定的专家 Agent 并执行。
        """
        expert_name = sub_task["expert"]
        task_description = sub_task["task"]

        if expert_name not in self.expert_agents:
            return {"status": "error", "output": f"未知专家 Agent: {expert_name}", "expert_name": expert_name}

        expert = self.expert_agents[expert_name]
        print(f"n--- Supervisor 分配任务给 [{expert_name}] ---")
        result = expert.execute_task(task_description, context)
        self.task_history.append({"sub_task": sub_task, "result": result, "context_in": context})
        return result

    def integrate_results(self, main_task: str, results: List[Dict[str, Any]]) -> str:
        """
        整合所有专家 Agent 的结果，生成最终的报告或解决方案。
        """
        print("n--- Supervisor 整合结果阶段 ---")
        aggregated_output = ""
        for res in results:
            if res["status"] == "success":
                aggregated_output += f"[{res['agent_name']}] 完成结果:n{res['output']}nn"
            else:
                aggregated_output += f"[{res['agent_name']}] 错误: {res['output']}nn"

        prompt = f"""
        你是一个 Supervisor Agent，你的任务是将以下专家 Agent 的输出整合起来，形成一个针对主任务的最终、连贯的报告或解决方案。

        主任务是: {main_task}

        以下是各个专家 Agent 提供的结果：
        {aggregated_output}

        请根据这些结果，生成一个最终的、结构化的报告或解决方案。确保内容完整、逻辑清晰，并直接回答主任务。
        """
        final_report = self.llm.generate(prompt)
        print("Supervisor 最终报告生成完毕。")
        return final_report

3. 整体流程编排

现在，我们将 Supervisor 和 Expert Agents 组合起来，演示一个端到端的任务。

def run_supervisor_workflow(main_task: str):
    """
    运行 Supervisor 模式的工作流。
    """
    supervisor = SupervisorAgent(llm=mock_llm, expert_agents=expert_agents)

    # 1. Supervisor 规划任务
    plan_data = supervisor.plan_task(main_task)
    if not plan_data["plan"]:
        print("任务规划失败，无法执行。")
        return

    execution_results = []
    current_context = {"main_task": main_task} # 初始化上下文

    # 2. 逐个执行子任务
    for i, sub_task in enumerate(plan_data["plan"]):
        print(f"n--- 执行子任务 {i+1}/{len(plan_data['plan'])}: {sub_task['task']} ---")

        # 将上一个任务的输出作为当前任务的上下文
        if execution_results:
            last_successful_output = [res["output"] for res in execution_results if res["status"] == "success"]
            current_context["previous_outputs"] = "n".join(last_successful_output)

        # 模拟 LLM 在 ExpertAgent 中判断是否需要工具调用的能力
        # 这里为了简化，我们让 ExpertAgent 的 execute_task 方法内部处理工具调用逻辑
        result = supervisor.assign_and_execute(sub_task, current_context)
        execution_results.append(result)

        # 更新上下文，将当前任务的输出加入
        if result["status"] == "success":
            current_context[f"output_from_{result['agent_name']}_task_{i}"] = result["output"]
            print(f"[{result['agent_name']}] 任务完成，输出已添加到上下文。")
        else:
            print(f"[{result['agent_name']}] 任务失败: {result['output']}")
            # 实际系统中需要更复杂的错误处理和重试机制
            break # 简化处理，失败则停止

    # 3. Supervisor 整合结果
    if all(res["status"] == "success" for res in execution_results):
        final_report = supervisor.integrate_results(main_task, execution_results)
        print("n--- 最终报告 ---")
        print(final_report)
    else:
        print("n--- 任务执行过程中存在失败，无法生成完整报告。---")
        for res in execution_results:
            if res["status"] == "error":
                print(f"失败任务：{res['sub_task']['task']}，错误：{res['output']}")

# 运行示例
if __name__ == "__main__":
    task_1 = "为一篇关于 'AI Agent 协作模式' 的技术文章收集资料并撰写初稿。"
    run_supervisor_workflow(task_1)

    print("n" + "="*80 + "n")

    task_2 = "分析当前咖啡馆市场的最新趋势，并提出3个潜在的创新点。"
    run_supervisor_workflow(task_2)

在上面的代码中：

MockLLM 模拟了 LLM 的行为，它会根据 prompt 的关键词返回预设的 JSON 或文本。在真实项目中，这里会替换为 openai.chat.completions.create 等实际的 API 调用。
Tool 类及其子类定义了各种外部功能，如 WebSearchTool。
ExpertAgent 类封装了特定领域的知识和工具使用逻辑。它的 execute_task 方法是其核心，通过 LLM 决定是直接回答还是调用工具。
SupervisorAgent 类是核心协调者。plan_task 负责任务分解和专家选择，assign_and_execute 负责将任务分发给专家，integrate_results 负责收集和整合所有专家的输出。
run_supervisor_workflow 函数展示了如何将这些组件串联起来，模拟一个完整的 Supervisor 模式任务执行流程。

请注意，为了演示清晰，MockLLM 的行为是硬编码的，实际的 LLM 会根据输入的 Prompt 动态生成响应，并且解析 LLM 输出中的 <thought> 和 <action> 标签需要更鲁棒的正则或基于结构化输出（如 JSON 模式）的解析。

表格：Supervisor 与 Expert Agent 的职责对比

职责	Supervisor Agent (产品经理)	Expert Agent (垂直领域专家)
主要目标	完成整个复杂任务，确保整体项目成功	高效、准确地完成分配给自己的子任务
任务级别	宏观、高层次任务的分解与协调	具体、细粒度子任务的执行
核心能力	规划、分解、调度、监控、整合、迭代	领域知识、工具使用、执行力、结果反馈
决策范围	任务路径、专家选择、资源分配、最终成果质量	如何最佳地执行当前子任务、何时使用何种工具
信息流	接收原始需求 -> 分配子任务 -> 接收子任务结果 -> 输出最终结果	接收子任务和上下文 -> 执行 -> 输出子任务结果
工具使用	通常不直接使用业务工具，而是协调专家使用	直接使用其领域相关的专业工具（如搜索、代码解释器、API）

Supervisor 模式的优势

模块化与可维护性： 每个 Expert Agent 都是独立的模块，可以独立开发、测试、升级和替换，而不会影响其他部分。这大大提高了系统的可维护性。
专业化与效率： 专家 Agent 专注于特定领域，能够利用其专业知识和工具更高效、更准确地完成任务，减少了通用 LLM 在不熟悉领域的“幻觉”和错误。
可扩展性： 当需要处理新的任务类型时，只需开发新的 Expert Agent 并将其注册给 Supervisor 即可，无需修改现有 Agent。这使得系统易于扩展。
复杂任务处理能力： Supervisor 能够将一个看似无法解决的复杂问题分解为一系列可管理的子问题，通过分而治之的策略，最终解决整体问题。
鲁棒性与故障隔离： 即使某个 Expert Agent 在执行子任务时失败，Supervisor 也可以捕获错误，尝试重试、更换专家或调整计划，避免整个系统崩溃。
资源优化： 专家 Agent 可以根据其任务需求，调用大小适中的 LLM 模型或特定工具，避免了每次都使用大型通用模型的资源浪费。
透明度与可解释性： 任务分解和专家调度的过程使得整个任务执行流程更加透明，易于追踪和调试。

面临的挑战与考量

尽管 Supervisor 模式带来了诸多优势，但在实际应用中也面临一些挑战：

Supervisor 的智能水平： Supervisor 的任务分解、专家选择和结果整合能力是整个系统成功的关键。如果 Supervisor 的规划能力不足，可能会导致任务分解不合理、专家选择错误或结果整合不佳。这要求 Supervisor 背后有强大的 LLM 支持，并精心设计其 Prompt。
通信开销： 频繁的 Agent 间通信（任务分配、结果返回、上下文传递）会引入额外的延迟和计算开销，尤其是在分布式系统中。
任务粒度： 任务分解的粒度是一个平衡问题。分解过细会增加通信和协调的开销；分解过粗则可能使 Expert Agent 无法独立处理，或导致其内部逻辑过于复杂。
上下文管理： 在多步任务中，如何有效地在不同 Expert Agent 之间传递和维护上下文信息至关重要。过多的上下文会超出 LLM 的 token 限制，过少的上下文可能导致 Expert Agent 无法理解任务背景。
错误处理与重试机制： Expert Agent 可能会失败（工具调用失败、LLM 生成错误），Supervisor 需要有健壮的错误处理、重试策略和回溯机制。
成本： 多个 Agent 意味着可能涉及更多的 LLM 调用，这可能会增加总体运行成本。
专家冲突与协调： 如果多个 Expert Agent 的输出存在冲突或不一致，Supervisor 需要具备解决冲突的能力，这本身也是一个复杂的推理任务。

实际应用场景

Supervisor 模式在许多需要复杂、多步骤、跨领域协作的场景中都展现出巨大潜力：

复杂软件开发：
- Supervisor： 需求分析师/项目经理 Agent。
- Expert Agents：
  - RequirementAnalyst: 澄清用户需求。
  - CodeArchitect: 设计系统架构。
  - CodeGenerator: 编写特定模块代码。
  - TestEngineer: 编写测试用例并执行。
  - DocumentWriter: 撰写技术文档。
- 流程： Supervisor 接收高级软件需求，分解为设计、编码、测试、文档子任务，并分配给相应专家。
研究与报告生成：
- Supervisor： 研究项目经理 Agent。
- Expert Agents：
  - DataScientist: 进行数据收集与分析。
  - InformationRetriever: 通过网络搜索和数据库查询获取信息。
  - ContentSummarizer: 总结关键信息和发现。
  - ReportFormatter: 将内容组织成结构化报告。
- 流程： Supervisor 接收研究主题，分解为数据获取、分析、总结、报告撰写等步骤。
智能客服与支持：
- Supervisor： 客户服务经理 Agent。
- Expert Agents：
  - IssueClassifier: 分类用户问题。
  - KnowledgeBaseQuery: 查询知识库提供解决方案。
  - TechnicalSupport: 提供技术故障排除建议。
  - BillingSpecialist: 处理账单和支付问题。
- 流程： Supervisor 接收用户请求，首先由分类专家识别问题类型，然后分配给相应的专业 Agent 处理。
自动化营销：
- Supervisor： 营销策略师 Agent。
- Expert Agents：
  - MarketAnalyst: 分析市场趋势和受众。
  - ContentCreator: 撰写营销文案、生成图片。
  - CampaignManager: 设计和执行广告投放策略。
  - PerformanceAnalyst: 监控广告效果并提供优化建议。
- 流程： Supervisor 接收营销目标，分解为市场研究、内容创作、活动执行和效果分析等环节。

未来发展方向

Supervisor 模式仍有巨大的发展空间：

自适应的 Supervisor： 能够从历史任务执行数据中学习和优化任务分解、专家选择策略，甚至能根据专家表现动态调整分配。
动态专家发现与注册： 引入一种机制，让 Expert Agent 可以按需被发现和注册，而不是预先配置好所有专家，从而实现更灵活的系统。
多层级 Supervisor 结构： 对于极其复杂的巨型任务，可以构建一个层级化的 Supervisor 结构，上层 Supervisor 负责宏观规划，下层 Supervisor 负责更细粒度的子任务协调。
人类-Agent 协作： Supervisor 可以作为人机协作的接口，在关键决策点将任务交给人类审查或批准，或者在专家 Agent 无法处理时寻求人类帮助。

总结

Supervisor 模式通过分而治之的策略，显著提升了 Agent 系统处理复杂任务的能力。它模仿了人类团队的协作模式，将宏观规划与专业执行相结合，是构建强大、智能 Agent 应用的关键范式。随着 Agent 技术和 LLM 能力的不断发展，Supervisor 模式无疑将成为我们构建下一代智能系统的基石。