深入 ‘Dynamic Role Assignment’：根据任务上下文实时修改 Agent 的 System Prompt 以切换其角色属性 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

各位编程领域的专家、开发者，以及对人工智能前沿技术充满热情的同仁们：

大家好！

今天，我们齐聚一堂，共同探讨一个在构建高度智能、适应性强的AI Agent时至关重要的主题——“动态角色分配”（Dynamic Role Assignment）。在传统的AI Agent设计中，我们往往赋予Agent一个相对固定、预设的身份和行为模式，这通过其“系统提示”（System Prompt）来定义。然而，在面对真实世界日益复杂、多变的任务场景时，这种静态的设定开始显现出其局限性。一个合格的AI Agent，就像一位经验丰富的多面手，应当能够根据当前任务的上下文，实时地调整其“帽子”，切换其“角色属性”，从而以最恰当的姿态和专业知识来应对挑战。

本次讲座，我将深入剖析如何通过实时修改Agent的System Prompt，来实现这种动态的角色切换。我们将从基础概念出发，逐步深入到架构模式、实现细节、最佳实践，并展望其广阔的应用前景与面临的挑战。我的目标是为您提供一个全面而严谨的技术视角，并辅以丰富的代码示例，助您将这一强大范式融入到您未来的AI Agent设计中。

AI Agent与System Prompt的基础

在我们深入探讨动态角色分配之前，有必要先回顾一下AI Agent的基本构成及其System Prompt的关键作用。

什么是AI Agent？

在人工智能领域，一个AI Agent通常被视为一个能够感知环境、进行思考、规划行动并执行任务的实体。它通常由以下几个核心组件构成：

大型语言模型（LLM）：作为Agent的“大脑”，负责理解、推理、生成文本。
工具（Tools）：Agent用于与外部世界交互的接口，例如搜索引擎、代码解释器、API调用器等。
记忆（Memory）：存储上下文信息，包括短期对话历史和长期知识库，以便Agent能够进行连贯且知情的交互。
规划（Planning）：Agent根据目标拆解任务、制定执行步骤的能力。
反馈（Feedback）：Agent根据执行结果进行自我修正或学习的能力。

System Prompt：Agent的宪法与身份

System Prompt是LLM Agent设计中一个极其关键的元素。它不是用户直接输入的部分，而是在LLM处理用户请求之前，预先注入到对话上下文中的指令。它的作用类似于为Agent设定一个“宪法”或“身份证明”，明确规定了Agent的：

角色（Persona）：例如，“你是一个友善的客服助手”，“你是一个严谨的编程专家”。
行为准则（Behavioral Guidelines）：例如，“始终保持礼貌”，“优先提供简洁的答案”。
任务目标（Goals）：例如，“帮助用户解决技术问题”，“创作一篇富有创意的故事”。
约束条件（Constraints）：例如，“不要提供医疗建议”，“输出格式必须是JSON”。
输出格式（Output Format）：例如，“以Markdown格式回复”，“回答必须包含一个示例”。

一个静态System Prompt的示例：

STATIC_SYSTEM_PROMPT = """
你是一个专业的编程助手。你的任务是帮助用户理解复杂的编程概念，提供代码示例，并协助调试。
请确保你的回答准确、清晰、简洁，并始终使用Python语言作为示例（除非用户明确指定其他语言）。
当你提供代码时，请将其放在Markdown代码块中。
不要提供超出编程领域或不相关的信息。
"""

# 模拟Agent与用户交互
def interact_with_static_agent(user_query: str, system_prompt: str):
    print(f"--- Static Agent Interaction ---")
    print(f"System Prompt: {system_prompt}")
    print(f"User Query: {user_query}")
    # 实际场景中，这里会调用LLM API，将system_prompt和user_query组合发送
    # 简化模拟输出
    if "Python" in user_query or "代码" in user_query:
        print("Agent Response: 好的，我将以编程专家的角色为您解答。请问有什么具体的编程问题吗？")
    elif "天气" in user_query:
        print("Agent Response: 抱歉，我是一个编程助手，无法为您提供天气信息。")
    else:
        print("Agent Response: 好的，我将以编程专家的角色为您解答。请问有什么编程相关的问题？")
    print("--------------------------------n")

# 示例调用
interact_with_static_agent("请解释Python中的装饰器。", STATIC_SYSTEM_PROMPT)
interact_with_static_agent("今天天气怎么样？", STATIC_SYSTEM_PROMPT)

静态System Prompt的局限性

尽管System Prompt功能强大，但当它被静态定义时，会带来显著的局限性：

缺乏适应性：一个预设为“编程专家”的Agent，在面对用户提出的“写一首关于秋天的诗”这类请求时，可能会表现得笨拙、拒绝或生成不符合预期的内容。它无法灵活地切换到“诗人”的角色。
效率低下：为了覆盖多种任务，可能需要设计多个独立的Agent，或构建一个极其庞大、复杂的单一System Prompt，这会增加维护成本和LLM的token消耗。
用户体验受损：用户可能需要明确地告诉Agent“请你现在扮演一个XX角色”，这增加了交互的认知负担。
难以扩展：当需要引入新的任务类型或角色时，修改或重新训练Agent的成本较高。

下表总结了静态与动态System Prompt的对比：

特性	静态System Prompt	动态System Prompt
灵活性	较低，Agent行为受固定角色限制	较高，Agent能根据上下文切换角色
适应性	难以处理多样化任务，可能拒绝或生成不相关内容	能更好地适应多领域、多模态任务，提升任务成功率
开发维护	相对简单，但任务扩展需创建新Agent或修改大型提示	架构更复杂，但角色管理和复用性强
用户体验	用户需明确角色指令，或Agent可能表现出“固执”	更自然、流畅的交互，Agent能主动适应用户意图
资源效率	可能需要多个Agent实例应对不同场景	单一Agent实例可服务多场景，潜在降低资源消耗
实现难度	简单	中等偏高

核心概念：根据任务上下文实时修改System Prompt

动态角色分配的核心思想，正是在Agent与用户交互的运行时（runtime），根据当前的“任务上下文”（Task Context），智能地识别出Agent最应该扮演的“角色属性”（Role Persona），并实时地修改或生成其System Prompt。这使得Agent能够像一个真正的多面手一样，在不同任务间无缝切换其专业知识、语气、行为模式和输出格式。

动态角色分配的定义

动态角色分配是指AI Agent在接收到新的输入或面对新的任务时，通过分析输入内容、历史对话、外部环境信息等上下文线索，自动识别出最适合当前情境的预定义或生成的新角色，并据此调整其System Prompt，从而改变其行为、能力和输出风格的过程。

为什么它如此强大？

想象一下一个人类专家：当您向律师咨询法律问题时，他会以法律专家的身份回答；当您向医生咨询健康问题时，他会以医生的身份回答；当您让他写一封信时，他会切换到文书专家的角色。这个过程是自然且高效的。动态角色分配赋予了AI Agent类似的能力：

增强的灵活性与通用性：一个Agent可以同时是编程专家、创意写手、客服代表，甚至是数据分析师，而无需部署多个独立的Agent实例。
更自然的交互体验：用户无需显式地告诉Agent“请以XX身份回答”，Agent能主动理解并适应用户的意图。
更高的任务成功率：通过匹配最合适的角色，Agent能够调用最相关的知识和技能，提高解决问题的效率和质量。
降低开发与维护成本：通过模块化的角色定义，可以更方便地添加、修改或组合新的能力。
更精细的控制：可以为特定任务微调Agent的行为，而不会影响其在其他任务中的表现。

关键组成部分

实现动态角色分配，通常需要以下几个核心组件协同工作：

上下文提取与理解（Context Extraction & Understanding）：这是整个流程的第一步，也是最关键的一步。Agent需要能够从用户输入、对话历史、外部系统状态等来源中，准确地识别出当前任务的意图、主题、紧急程度等关键信息。
- 方法：
  - 关键词匹配：最简单直接，但容易误判。
  - 正则表达式：用于识别特定模式。
  - 自然语言处理（NLP）技术：实体识别、意图分类、主题建模。
  - 小型分类LLM：使用一个轻量级LLM专门进行意图识别。
  - 嵌入向量相似度：将用户查询与预定义的任务/角色描述进行向量相似度匹配。
角色映射与定义（Role Mapping & Definition）：需要一个结构化的存储，包含所有预定义的角色及其对应的System Prompt模板、约束条件、可使用的工具等。
- 结构：通常是字典、JSON文件或数据库。
- 内容：每个角色至少包含一个 name 和一个 prompt_template。
提示生成与修改引擎（Prompt Generation & Modification Engine）：根据上下文分析的结果，从角色定义库中选择合适的角色，并动态地填充模板中的变量，最终生成或修改Agent的System Prompt。

架构模式与实现策略

实现动态角色分配有多种架构模式，从简单到复杂，我们可以根据实际需求进行选择。

模式一：预定义角色模板与变量填充

这是最直接、最常用的方法。我们预先定义好一系列角色，每个角色对应一个System Prompt模板。当Agent识别出特定任务时，就选择对应的模板，并用从上下文中提取到的信息填充模板中的占位符。

概念流程：

用户提交请求。
Agent的上下文分析模块识别请求意图。
根据意图，从预定义的角色库中选择最匹配的角色模板。
根据任务细节，填充模板中的动态变量（例如，用户的名字、特定主题等）。
生成最终的System Prompt，并将其与用户请求一同发送给LLM。

示例代码结构：

# 1. 角色定义库
ROLE_TEMPLATES = {
    "customer_support": {
        "name": "客服助手",
        "prompt": "你是一个友善且专业的客服助手。你的目标是帮助用户解决问题，提供清晰准确的答案。请使用礼貌的语言，并尽可能提供解决方案。如果你无法解决，请引导用户联系人工客服。",
        "keywords": ["问题", "帮助", "咨询", "客服", "订单"],
        "tools": ["knowledge_base_search", "order_status_api"]
    },
    "technical_expert": {
        "name": "技术专家",
        "prompt": "你是一个资深的编程和技术专家。你的任务是解释复杂的概念，提供代码示例，并协助调试。请确保你的回答严谨、准确，并深入浅出。专注于技术细节，避免闲聊。",
        "keywords": ["代码", "编程", "bug", "调试", "算法", "API"],
        "tools": ["code_interpreter", "documentation_search"]
    },
    "creative_writer": {
        "name": "创意写手",
        "prompt": "你是一个富有想象力和创造力的写手。你的任务是根据用户的要求创作故事、诗歌、文案等。请发挥你的创造力，使用生动的语言，并注意情感表达。",
        "keywords": ["写", "创作", "故事", "诗", "文案", "剧本"],
        "tools": ["thesaurus", "grammar_checker"]
    },
    "general_assistant": {
        "name": "通用助手",
        "prompt": "你是一个多功能的通用助手。你的任务是根据用户的要求提供广泛的信息和帮助。如果你不确定最佳角色，请采用此通用角色。",
        "keywords": ["什么", "如何", "信息", "通用"],
        "tools": ["web_search"]
    }
}

# 2. 上下文分析（简化版：关键词匹配）
def analyze_context_simple(user_query: str) -> str:
    user_query_lower = user_query.lower()
    for role_name, role_info in ROLE_TEMPLATES.items():
        for keyword in role_info["keywords"]:
            if keyword in user_query_lower:
                return role_name
    return "general_assistant" # 默认角色

# 3. 动态提示生成
def construct_dynamic_system_prompt_pattern1(user_query: str) -> str:
    selected_role_name = analyze_context_simple(user_query)
    role_info = ROLE_TEMPLATES.get(selected_role_name, ROLE_TEMPLATES["general_assistant"])

    # 可以在这里进一步填充变量，例如用户名称
    # dynamic_info = {"user_name": "张三"} # 假设从会话状态中获取
    # final_prompt = role_info["prompt"].format(**dynamic_info)

    final_prompt = role_info["prompt"]
    print(f"DEBUG: Selected Role: {role_info['name']}")
    return final_prompt

# 模拟Agent交互
def interact_with_dynamic_agent_pattern1(user_query: str):
    print(f"--- Dynamic Agent Interaction (Pattern 1) ---")
    dynamic_system_prompt = construct_dynamic_system_prompt_pattern1(user_query)
    print(f"Dynamic System Prompt: {dynamic_system_prompt}")
    print(f"User Query: {user_query}")
    # 实际场景中，这里会调用LLM API
    print("Agent Response: (LLM会根据上述动态Prompt生成回复)")
    print("-------------------------------------------------n")

# 示例调用
interact_with_dynamic_agent_pattern1("我的订单状态是什么？我需要帮助。", )
interact_with_dynamic_agent_pattern1("请解释一下Python的GIL机制，并给出代码示例。", )
interact_with_dynamic_agent_pattern1("写一个关于未来科技的短篇故事。", )
interact_with_dynamic_agent_pattern1("今天有什么新闻吗？", )

模式二：分层提示构建

这种模式将System Prompt分解为更小的、可组合的模块。例如，一个Agent可能有一个通用的“基础人格”模块，然后根据任务上下文添加“任务特定指令”、“行为约束”或“输出格式要求”等模块。

概念流程：

定义一系列提示片段（Prompt Fragments），每个片段代表一个特定的指令或属性。
用户提交请求，上下文分析模块识别意图。
根据意图，动态选择并组合这些提示片段。
将组合后的字符串作为最终的System Prompt发送给LLM。

优点：高度模块化，复用性强，可以更灵活地构建复杂而精细的角色。

示例代码结构：

# 1. 提示片段库
PROMPT_FRAGMENTS = {
    "base_persona": "你是一个乐于助人的AI助手。",
    "politeness_rule": "请始终保持礼貌和友善。",
    "error_handling_rule": "如果遇到无法回答的问题，请告知用户你的局限性。",
    "tech_expert_addon": "作为一名技术专家，专注于提供准确的技术解释和代码示例。",
    "creative_writer_addon": "作为一名创意写手，请发挥你的想象力，创作引人入胜的内容。",
    "customer_support_addon": "作为一名客服，请优先解决用户问题，并提供解决方案。",
    "markdown_output_format": "请将代码或结构化内容放在Markdown代码块中。",
    "json_output_format": "请以严格的JSON格式输出结果。",
}

# 2. 角色配置（定义哪些片段组合成一个角色）
ROLE_CONFIGS = {
    "customer_support": [
        "base_persona", "politeness_rule", "error_handling_rule", "customer_support_addon"
    ],
    "technical_expert": [
        "base_persona", "error_handling_rule", "tech_expert_addon", "markdown_output_format"
    ],
    "creative_writer": [
        "base_persona", "creative_writer_addon", "politeness_rule"
    ],
    "data_analyst": [
        "base_persona", "tech_expert_addon", "json_output_format",
        "请以严谨的数据分析师身份，提供数据洞察和分析报告。" # 也可以直接加入字符串
    ],
    "general_assistant": [
        "base_persona", "politeness_rule", "error_handling_rule"
    ]
}

# 3. 上下文分析（可以复用模式一的逻辑，或更复杂的LLM分类）
def analyze_context_for_layered(user_query: str) -> str:
    user_query_lower = user_query.lower()
    if "订单" in user_query_lower or "客服" in user_query_lower or "退款" in user_query_lower:
        return "customer_support"
    elif "代码" in user_query_lower or "编程" in user_query_lower or "算法" in user_query_lower:
        return "technical_expert"
    elif "写" in user_query_lower or "故事" in user_query_lower or "诗歌" in user_query_lower:
        return "creative_writer"
    elif "数据" in user_query_lower or "分析" in user_query_lower or "报告" in user_query_lower:
        return "data_analyst"
    return "general_assistant"

# 4. 动态提示生成
def construct_dynamic_system_prompt_pattern2(user_query: str) -> str:
    selected_role_name = analyze_context_for_layered(user_query)

    # 获取对应角色的片段名称列表
    fragment_names = ROLE_CONFIGS.get(selected_role_name, ROLE_CONFIGS["general_assistant"])

    # 组合片段
    combined_prompt_parts = []
    for name_or_str in fragment_names:
        if name_or_str in PROMPT_FRAGMENTS:
            combined_prompt_parts.append(PROMPT_FRAGMENTS[name_or_str])
        else:
            combined_prompt_parts.append(name_or_str) # 允许直接添加字符串

    final_prompt = "n".join(combined_prompt_parts)
    print(f"DEBUG: Selected Role Config: {selected_role_name}")
    return final_prompt

# 模拟Agent交互
def interact_with_dynamic_agent_pattern2(user_query: str):
    print(f"--- Dynamic Agent Interaction (Pattern 2) ---")
    dynamic_system_prompt = construct_dynamic_system_prompt_pattern2(user_query)
    print(f"Dynamic System Prompt:n{dynamic_system_prompt}")
    print(f"User Query: {user_query}")
    # 实际场景中，这里会调用LLM API
    print("Agent Response: (LLM会根据上述动态Prompt生成回复)")
    print("-------------------------------------------------n")

# 示例调用
interact_with_dynamic_agent_pattern2("我的退款申请进展如何？")
interact_with_dynamic_agent_pattern2("请帮我分析一下这份销售数据，总结一下趋势。")
interact_with_dynamic_agent_pattern2("写一个关于宇宙探索的科幻故事开头。")

模式三：LLM驱动的角色选择与提示生成（高级）

在更复杂的场景中，我们可以利用一个专门的LLM（或者Agent自身的主LLM）来完成上下文分析和角色选择的工作，甚至让LLM直接生成或精炼System Prompt。

概念流程：

用户提交请求。
将用户请求（可能还有部分对话历史）发送给一个“意图分类LLM”或“元LLM”。
这个LLM的任务是识别用户意图，并输出一个建议的角色名称，甚至是一个初步的System Prompt草稿。
根据LLM的输出， Agent进一步精炼System Prompt（例如，结合预设的安全指令），然后发送给主LLM。

优点：能够处理更复杂、更模糊的意图，减少人工规则的维护。

挑战：增加了LLM调用的次数（可能带来延迟和成本），对意图分类LLM的Prompt Engineering要求较高。

示例代码结构：

# 模拟一个LLM意图分类器
def llm_based_intent_classifier(user_query: str) -> str:
    # 实际场景中，这里会调用一个LLM API，传入user_query和分类任务的prompt
    # 例如：
    # response = openai.ChatCompletion.create(
    #     model="gpt-3.5-turbo",
    #     messages=[
    #         {"role": "system", "content": "你是一个意图分类器。根据用户问题，请返回最匹配的角色名称，如 'customer_support', 'technical_expert', 'creative_writer'。如果无法确定，返回 'general_assistant'。"},
    #         {"role": "user", "content": f"用户查询：{user_query}"}
    #     ],
    #     temperature=0
    # )
    # return response.choices[0].message.content.strip()

    # 简化模拟
    user_query_lower = user_query.lower()
    if "订单" in user_query_lower or "客服" in user_query_lower or "退款" in user_query_lower:
        return "customer_support"
    elif "代码" in user_query_lower or "编程" in user_query_lower or "算法" in user_query_lower:
        return "technical_expert"
    elif "写" in user_query_lower or "故事" in user_query_lower or "诗歌" in user_query_lower:
        return "creative_writer"
    return "general_assistant"

# 1. 角色定义库 (复用Pattern 1 或 Pattern 2 的结构)
ROLE_TEMPLATES_LLM_DRIVEN = {
    "customer_support": {
        "name": "客服助手",
        "prompt": "你是一个友善且专业的客服助手。请解决用户问题，提供清晰准确的答案。",
    },
    "technical_expert": {
        "name": "技术专家",
        "prompt": "你是一个资深的编程和技术专家。请解释复杂的概念，提供代码示例。",
    },
    "creative_writer": {
        "name": "创意写手",
        "prompt": "你是一个富有想象力和创造力的写手。请根据用户的要求创作内容。",
    },
    "general_assistant": {
        "name": "通用助手",
        "prompt": "你是一个多功能的通用助手。请提供广泛的信息和帮助。",
    }
}

# 2. 动态提示生成
def construct_dynamic_system_prompt_pattern3(user_query: str) -> str:
    # 使用LLM进行角色选择
    selected_role_name = llm_based_intent_classifier(user_query)

    # 从预定义模板中获取基础Prompt
    role_info = ROLE_TEMPLATES_LLM_DRIVEN.get(selected_role_name, ROLE_TEMPLATES_LLM_DRIVEN["general_assistant"])
    base_prompt = role_info["prompt"]

    # 可以在这里添加额外的安全指令或会话特定信息
    additional_instructions = "请始终保持信息准确，并遵守以下安全指南：[安全指南内容]。"
    final_prompt = f"{base_prompt}n{additional_instructions}"

    print(f"DEBUG: LLM Classified Role: {role_info['name']}")
    return final_prompt

# 模拟Agent交互
def interact_with_dynamic_agent_pattern3(user_query: str):
    print(f"--- Dynamic Agent Interaction (Pattern 3 - LLM Driven) ---")
    dynamic_system_prompt = construct_dynamic_system_prompt_pattern3(user_query)
    print(f"Dynamic System Prompt:n{dynamic_system_prompt}")
    print(f"User Query: {user_query}")
    # 实际场景中，这里会调用LLM API
    print("Agent Response: (LLM会根据上述动态Prompt生成回复)")
    print("-------------------------------------------------------n")

# 示例调用
interact_with_dynamic_agent_pattern3("我的账户被冻结了，需要找客服解决。")
interact_with_dynamic_agent_pattern3("如何用Kubernetes部署一个微服务？")
interact_with_dynamic_agent_pattern3("给我写一个童话故事，主角是一只勇敢的小猫。")

实现动态角色分配：一个综合Agent示例

现在，让我们把这些概念整合到一个更完整的DynamicAgent类中，模拟一个能够根据上下文动态调整自身System Prompt的Agent。我们将使用Python，并假设有一个LLMClient来模拟与大型语言模型的交互。

import time
from typing import Dict, Any, List

# 模拟LLM客户端
class MockLLMClient:
    def __init__(self, latency: float = 0.5):
        self.latency = latency

    def chat_completion(self, messages: List[Dict[str, str]]) -> str:
        time.sleep(self.latency) # 模拟网络延迟和处理时间

        system_prompt = next((m['content'] for m in messages if m['role'] == 'system'), "")
        user_query = next((m['content'] for m in messages if m['role'] == 'user'), "")

        response_prefix = ""
        if "编程专家" in system_prompt or "技术专家" in system_prompt:
            response_prefix = "作为一名技术专家，我将为您解答："
        elif "客服助手" in system_prompt:
            response_prefix = "作为一名客服助手，我理解您的问题，并为您提供帮助："
        elif "创意写手" in system_prompt:
            response_prefix = "作为一名创意写手，我将用我的想象力为您创作："
        elif "数据分析师" in system_prompt:
            response_prefix = "作为一名数据分析师，我将为您提供洞察："
        else:
            response_prefix = "我将尽力为您提供帮助："

        return f"{response_prefix} (根据您的请求和当前角色，LLM生成了回复：'{user_query}')"

# 1. 角色定义 - 使用更丰富的结构，包含描述和建议的工具
# 实际中，这些可以存储在数据库或配置文件中
FULL_ROLE_DEFINITIONS = {
    "customer_support": {
        "name": "客服助手",
        "description": "友善且专业的客服助手，解决用户问题，提供清晰准确的答案。",
        "base_prompt": "你是一个友善且专业的客服助手。你的目标是帮助用户解决问题，提供清晰准确的答案。请使用礼貌的语言，并尽可能提供解决方案。",
        "keywords": ["问题", "帮助", "咨询", "客服", "订单", "退款", "售后"],
        "tools": ["knowledge_base_search", "order_status_api", "escalate_to_human"]
    },
    "technical_expert": {
        "name": "技术专家",
        "description": "资深的编程和技术专家，解释复杂概念，提供代码示例，协助调试。",
        "base_prompt": "你是一个资深的编程和技术专家。你的任务是解释复杂的概念，提供代码示例，并协助调试。请确保你的回答严谨、准确，并深入浅出。专注于技术细节，避免闲聊。当你提供代码时，请将其放在Markdown代码块中。",
        "keywords": ["代码", "编程", "bug", "调试", "算法", "API", "开发", "部署", "Python", "Java", "Kubernetes"],
        "tools": ["code_interpreter", "documentation_search", "stack_overflow_search"]
    },
    "creative_writer": {
        "name": "创意写手",
        "description": "富有想象力和创造力的写手，创作故事、诗歌、文案等。",
        "base_prompt": "你是一个富有想象力和创造力的写手。你的任务是根据用户的要求创作故事、诗歌、文案等。请发挥你的创造力，使用生动的语言，并注意情感表达。",
        "keywords": ["写", "创作", "故事", "诗", "文案", "剧本", "歌词", "小说"],
        "tools": ["thesaurus", "grammar_checker", "idea_generator"]
    },
    "data_analyst": {
        "name": "数据分析师",
        "description": "严谨的数据分析师，提供数据洞察和分析报告。",
        "base_prompt": "你是一个严谨的数据分析师。你的任务是根据提供的数据进行分析，发现趋势，提供洞察，并生成清晰的报告。请使用专业的统计术语和图表（如果适用）。",
        "keywords": ["数据", "分析", "报告", "趋势", "统计", "洞察", "图表", "Excel", "SQL"],
        "tools": ["spreadsheet_tool", "sql_query_tool", "chart_generator"]
    },
    "general_assistant": {
        "name": "通用助手",
        "description": "多功能的通用助手，提供广泛的信息和帮助。",
        "base_prompt": "你是一个多功能的通用助手。你的任务是根据用户的要求提供广泛的信息和帮助。如果你不确定最佳角色，请采用此通用角色。",
        "keywords": ["什么", "如何", "信息", "通用", "查询", "帮助我"],
        "tools": ["web_search"]
    }
}

class DynamicAgent:
    def __init__(self, llm_client: MockLLMClient, role_definitions: Dict[str, Any], default_role: str = "general_assistant"):
        self.llm_client = llm_client
        self.role_definitions = role_definitions
        self.default_role = default_role
        self.current_role_name: str = default_role
        self.system_prompt: str = role_definitions[default_role]["base_prompt"]
        self.conversation_history: List[Dict[str, str]] = [] # 存储对话历史

        print(f"DynamicAgent initialized with default role: {default_role}")

    # 上下文分析：这里使用一个更智能的LLM调用来分类意图
    def _analyze_context_llm_based(self, user_query: str, history: List[Dict[str, str]]) -> str:
        # 构建一个用于意图分类的Prompt
        role_names = ", ".join(self.role_definitions.keys())
        role_descriptions = "n".join([f"- {name}: {info['description']}" for name, info in self.role_definitions.items()])

        classification_prompt = f"""
你是一个意图分类器。根据用户最新的查询以及对话历史，判断用户最可能希望由以下哪个角色来处理：
可用的角色有：{role_names}。
每个角色的描述如下：
{role_descriptions}

请只输出最匹配的角色名称，不要包含任何额外说明。如果无法确定，请输出 '{self.default_role}'。
---
对话历史（如果存在）：
{self._format_history(history)}
---
用户查询：{user_query}
角色：
"""
        # 模拟调用LLM进行分类
        # 实际中，这里会是一个独立的LLM API调用
        # 为简化，这里仍然使用关键词匹配模拟LLM的分类结果

        user_query_lower = user_query.lower()
        for role_name, role_info in self.role_definitions.items():
            for keyword in role_info["keywords"]:
                if keyword in user_query_lower:
                    return role_name

        return self.default_role

    def _format_history(self, history: List[Dict[str, str]], limit: int = 5) -> str:
        """格式化最近的对话历史以便LLM理解"""
        if not history:
            return "无历史对话。"

        formatted_parts = []
        for turn in history[-limit:]: # 只取最近几轮
            role = "用户" if turn["role"] == "user" else "助手"
            formatted_parts.append(f"{role}: {turn['content']}")
        return "n".join(formatted_parts)

    def _construct_dynamic_system_prompt(self, user_query: str, history: List[Dict[str, str]]) -> str:
        # 1. 识别当前任务的意图，选择最佳角色
        selected_role_name = self._analyze_context_llm_based(user_query, history)

        # 2. 更新Agent的当前角色状态
        self.current_role_name = selected_role_name

        # 3. 获取对应角色的基础Prompt
        role_info = self.role_definitions.get(selected_role_name, self.role_definitions[self.default_role])
        base_prompt = role_info["base_prompt"]

        # 4. (可选) 添加通用的安全指令或会话上下文信息
        # 例如，可以根据用户的会话ID动态插入用户偏好、上次交互信息等
        # security_guidance = "请始终遵守公司内部的安全和隐私政策。"
        # current_date_info = f"今天是{time.strftime('%Y年%m月%d日')}。"
        # dynamic_context_info = f"用户ID: {self.user_id_from_session}" # 假设有session信息

        # final_system_prompt = f"{base_prompt}n{security_guidance}n{current_date_info}n{dynamic_context_info}"
        final_system_prompt = base_prompt

        return final_system_prompt

    def run(self, user_query: str) -> str:
        print(f"n--- Agent Processing User Query ---")
        print(f"User: {user_query}")

        # 动态构建System Prompt
        new_system_prompt = self._construct_dynamic_system_prompt(user_query, self.conversation_history)

        # 如果System Prompt发生变化，则打印提示
        if new_system_prompt != self.system_prompt:
            print(f"Role Switch Detected! New Role: {self.current_role_name}")
            print(f"New System Prompt:n{new_system_prompt}n")
            self.system_prompt = new_system_prompt # 更新Agent的System Prompt
        else:
            print(f"Current Role: {self.current_role_name} (No switch needed)")

        # 构建发送给LLM的消息列表
        messages = [
            {"role": "system", "content": self.system_prompt}
        ]
        # 添加历史对话 (LLM通常会处理有限的历史)
        messages.extend(self.conversation_history)
        # 添加当前用户查询
        messages.append({"role": "user", "content": user_query})

        # 调用LLM获取响应
        llm_response_content = self.llm_client.chat_completion(messages)

        # 更新对话历史
        self.conversation_history.append({"role": "user", "content": user_query})
        self.conversation_history.append({"role": "assistant", "content": llm_response_content})

        print(f"Agent ({self.current_role_name}): {llm_response_content}")
        print("-----------------------------------")

        return llm_response_content

# 初始化LLM客户端和Agent
mock_llm = MockLLMClient()
agent = DynamicAgent(llm_client=mock_llm, role_definitions=FULL_ROLE_DEFINITIONS)

# 模拟一系列用户交互
agent.run("你好，我有一个关于订单的问题需要咨询。")
agent.run("我的订单号是 XYZ123，请帮我查询一下状态。")
agent.run("好的，谢谢。另外，我想了解一下Python的asyncio模块是如何工作的？")
agent.run("哇，解释得很清楚！那如果我想写一个关于太空探险的短篇故事，你有什么建议吗？")
agent.run("可以帮我分析一下我们公司上个月的销售数据吗？想知道增长趋势。")
agent.run("好的，谢谢你！") # 继续通用助手角色

代码解释：

MockLLMClient: 这是一个模拟的LLM客户端，用于演示Agent如何与LLM交互。在真实场景中，这会是对OpenAI、Anthropic或其他LLM提供商API的调用。它根据System Prompt中的关键词模拟不同的回复前缀。
FULL_ROLE_DEFINITIONS: 这是一个字典，存储了所有预定义的角色。每个角色有名称、描述、核心System Prompt模板、用于意图识别的关键词列表，以及该角色可能需要使用的“工具”列表（虽然在此示例中工具没有实际实现，但展示了设计思路）。
DynamicAgent 类:
- __init__: 初始化Agent，包括LLM客户端、角色定义和默认角色。
- _analyze_context_llm_based: 这是核心的上下文分析模块。它接收用户查询和对话历史，并尝试识别最佳角色。虽然函数名暗示LLM驱动，但为了避免多层LLM调用带来的复杂性，这里仍然使用关键词匹配进行模拟。在实际应用中，这可以是一个专门的轻量级LLM调用，或者更复杂的NLP模型。
- _format_history: 辅助函数，将对话历史格式化为LLM易于理解的字符串。
- _construct_dynamic_system_prompt: 根据_analyze_context_llm_based的结果，选择对应的角色定义，并构建最终的System Prompt。这里还可以加入额外的全局指令或会话特定信息。
- run: 这是Agent的主执行方法。它首先调用_construct_dynamic_system_prompt来获取最新的System Prompt。如果System Prompt发生变化，它会打印角色切换的提示。然后，它将这个动态生成的System Prompt、对话历史和当前用户查询组合起来，发送给LLM客户端获取响应。最后，更新对话历史并返回LLM的回复。

通过运行这个示例，您可以看到Agent如何根据用户查询的内容，动态地判断应该扮演“客服助手”、“技术专家”、“创意写手”或“数据分析师”的角色，并相应地调整其System Prompt，从而改变其行为模式。

高级考量与最佳实践

实现动态角色分配并非一蹴而就，还需要考虑诸多高级因素以确保其鲁棒性、效率和安全性。

1. 状态管理与记忆

角色切换不应导致Agent“失忆”。Agent需要维护一个连贯的对话历史和会话状态。

短期记忆（Short-term Memory）：通常是最近的几轮对话，直接作为LLM上下文的一部分。
长期记忆（Long-term Memory）：存储更持久的用户偏好、历史交互摘要、知识库等。当角色切换时，长期记忆可以提供新的上下文，帮助新角色更好地理解用户。
显式上下文传递：在System Prompt中包含关键的会话变量（如用户ID、当前主题、上一个角色等），帮助LLM维持连贯性。

2. 角色转换的平滑性

abrupt的角色切换可能让用户感到困惑。

角色确认：Agent可以在切换角色后，主动向用户确认：“好的，我现在将以技术专家的身份为您解答Python问题。”
过渡语：使用平滑的过渡语，如“根据您新的问题，我将调整我的关注点。”
保持核心人格：无论角色如何切换，Agent的核心“价值观”或“基础人格”（如礼貌、乐于助人）应保持不变，可以通过基础System Prompt片段来实现。

3. 安全与防护机制

动态System Prompt带来了更大的灵活性，但也可能引入新的安全风险。

全局安全指令：无论哪个角色，都应在System Prompt中包含不可逾越的全局安全指令，例如“禁止生成有害、歧视性或非法内容”。
角色权限隔离：限制特定角色只能访问其职责范围内的工具和信息。例如，客服角色不能访问敏感的开发工具。
输入验证与过滤：在将用户输入用于角色识别或Prompt生成之前，进行严格的验证和清洗，防止Prompt注入攻击。
LLM输出审查：对LLM的最终输出进行后处理，检查是否符合安全规范和预期行为。

4. 评估与迭代

如何衡量动态角色分配的有效性？

任务成功率：Agent在不同角色下完成任务的比例。
响应质量：回复的相关性、准确性、完整性和一致性。
用户满意度：通过用户反馈、会话时长、重复使用率等指标衡量。
A/B测试：对比静态与动态System Prompt的表现。
Prompt Engineering：持续优化角色定义中的Prompt模板和关键词，使其更准确、更鲁棒。

5. 可伸缩性与管理

当角色数量变得庞大时，管理和维护将成为挑战。

角色库管理系统：使用数据库或专门的配置管理工具来存储、检索和更新角色定义。
角色选择算法优化：对于大量角色，简单的关键词匹配可能效率低下或不准确。可以采用向量数据库（Embedding Vector Database）进行语义搜索，或者更复杂的机器学习模型进行多分类。
角色层次结构：定义角色之间的父子关系或依赖关系，例如“技术专家”下可以有“Python专家”和“Java专家”。

6. 人机协作（Human-in-the-Loop）

在某些情况下，人类的干预是必要的。

人工干预点：在Agent无法确定最佳角色时，可以提示用户进行选择，或将请求转交给人工客服。
角色覆盖：允许管理员或用户手动覆盖Agent自动选择的角色。

实际应用场景

动态角色分配的潜力巨大，可以应用于各种需要Agent灵活适应多任务环境的场景。

智能客服系统：
- 场景：用户先咨询订单状态（客服角色），然后询问产品技术细节（技术支持角色），接着可能抱怨产品质量并要求退款（投诉处理角色）。
- 优势：一个Agent即可处理多种请求，提升用户体验，降低客服转接率。
教育与辅导机器人：
- 场景：学生先问概念解释（教师角色），然后请求解题步骤（解题专家角色），接着需要鼓励和反馈（心理辅导师角色）。
- 优势：提供个性化、多维度的学习支持，适应学生的不同学习阶段和需求。
内容创作助手：
- 场景：用户让Agent写一篇新闻稿（记者角色），然后要求将其润色成一篇富有情感的散文（诗人/作家角色），最后可能要求将其转换为营销文案（营销专家角色）。
- 优势：在一个工作流中实现多种风格和目的的内容生成。
编程与开发助手：
- 场景：开发者先寻求代码解释（代码解释器角色），然后要求重构某段代码（代码优化师角色），接着生成单元测试（测试工程师角色），最后调试一个Bug（调试专家角色）。
- 优势：成为一个全能的开发伙伴，覆盖软件开发生命周期的多个环节。
个人助理：
- 场景：安排日程（秘书角色），提供健康建议（健康顾问角色），推荐餐厅（生活顾问角色）。
- 优势：提供更全面、更贴心的服务。

挑战与未来展望

尽管动态角色分配前景广阔，但仍面临一些挑战：

上下文理解的模糊性：当用户意图不明确或多重意图混杂时，准确识别最佳角色仍然是一个难题。过度的角色切换可能导致Agent行为不稳定。
成本与延迟：如果角色识别或Prompt生成本身需要额外的LLM调用，可能会增加系统的响应延迟和运营成本。
角色冲突与一致性：当两个角色有潜在冲突或行为准则不一致时，如何确保Agent的整体行为逻辑保持一致和合理。
角色组合的复杂性：如何有效地管理和组合数百甚至数千个角色，以及它们之间的交互规则。
自适应角色学习：当前大部分角色仍需预定义。未来的方向是让Agent能够根据与用户的长期交互，自主学习、定义甚至创造新的角色。
多模态角色切换：当Agent处理语音、图像、视频等多模态输入时，如何基于这些信息进行动态角色分配。

展望未来，动态角色分配将是构建更智能、更通用、更人性化AI Agent的关键一步。它使得AI Agent不再是一个刻板的工具，而是一个能够理解并适应复杂世界的多面手。随着LLM能力的不断增强和AI架构的不断演进，我们有理由相信，动态角色分配将成为下一代智能系统中不可或缺的核心能力。

总结与展望

我们深入探讨了动态角色分配这一强大范式，它通过实时修改Agent的System Prompt，使其能够根据任务上下文灵活切换角色属性。从基本概念到架构模式，再到详细的Python代码实现，我们看到了这种方法如何赋予AI Agent前所未有的适应性和通用性。尽管挑战依然存在，但其在提升用户体验、降低开发成本和扩展Agent能力方面的巨大潜力，无疑预示着智能系统将迈向一个更加灵活、高效和智能的未来。

AI Agent与System Prompt的基础

什么是AI Agent？

System Prompt：Agent的宪法与身份

静态System Prompt的局限性

核心概念：根据任务上下文实时修改System Prompt

动态角色分配的定义

为什么它如此强大？

关键组成部分

架构模式与实现策略

模式一：预定义角色模板与变量填充

模式二：分层提示构建

模式三：LLM驱动的角色选择与提示生成（高级）

实现动态角色分配：一个综合Agent示例

高级考量与最佳实践

1. 状态管理与记忆

2. 角色转换的平滑性

3. 安全与防护机制

4. 评估与迭代

5. 可伸缩性与管理

6. 人机协作（Human-in-the-Loop）

实际应用场景

挑战与未来展望

总结与展望

发表回复 取消回复

发表回复取消回复