解析 ‘Self-Introspection Nodes’：在输出结果前，Agent 如何审查自己的推理路径是否存在逻辑谬误？ - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

清醒的自我审视：Agent 如何在推理路径中发现逻辑谬误？

各位听众，各位同仁：

欢迎来到今天的技术讲座。随着人工智能技术，特别是大型语言模型（LLM）的飞速发展，我们正在见证 Agent 系统在复杂任务中展现出前所未有的能力。这些 Agent 能够理解自然语言指令，规划行动，甚至与环境互动。然而，能力越大，责任也越大。一个 Agent 在执行任务时，其推理过程中的任何逻辑谬误都可能导致错误的决策、不准确的输出，乃至产生严重的后果。

今天，我们将深入探讨一个核心问题：Agent 如何在其输出结果生成之前，对其自身的推理路径进行“自我审查”（Self-Introspection Nodes），以发现并纠正潜在的逻辑谬误？我们将从编程专家的视角，结合实际代码示例，剖析这一关键机制。

第一讲：理解“自我审视节点”及其必要性

什么是“自我审视节点”？

在 Agent 的复杂任务执行流中，“自我审视节点”指的是 Agent 在其推理链条中的特定阶段，暂停当前的推理过程，转而对之前已经生成的或正在构建的推理步骤进行元认知（meta-cognition）式的审视与评估。这种审视的目标是主动识别推理过程中可能存在的逻辑漏洞、矛盾、不一致性、不完整性或不合理假设。

简单来说，它就像 Agent 内置的一个批判性思考模块，在“说出来”或“行动”之前，先问自己一句：“我刚才想的对吗？有没有什么问题？”

为什么需要自我审视？

Agent 的能力主要来源于其底层 LLM 的强大语言理解、生成和模式识别能力。然而，LLM 本身存在固有局限性，使得自我审视成为必需：

逻辑谬误的普遍性：
LLM 并非天生的逻辑学家。它们通过海量文本数据学习模式，但这些模式不总是严格的逻辑规则。Agent 可能会在推理中犯下各种逻辑谬误，例如：
- 滑坡谬误 (Slippery Slope)：错误地认为某个初始行为必然会导致一系列消极后果。
- 稻草人谬误 (Straw Man)：歪曲对方观点，然后攻击被歪曲的观点。
- 循环论证 (Circular Reasoning)：结论已经在前提中被假设。
- 诉诸权威 (Appeal to Authority)：仅仅因为某权威人物说了，就认为是真的，而不考虑其专业领域或证据。
- 非黑即白谬误 (False Dilemma)：将复杂问题简化为两个极端选项。
- 因果倒置/错误归因 (Post Hoc Ergo Propter Hoc / False Cause)：错误地将时间上先后发生的两件事视为因果关系。
- 证据不足的概括 (Hasty Generalization)：基于少量不具代表性的样本得出普遍结论。
这些谬误在人类推理中很常见，在 Agent 的生成性推理中也时有发生，尤其是在面对模棱两可或信息不完整的场景时。
AI 幻觉与不确定性：
LLM 有时会“幻觉”出不存在的事实或信息，或者对不确定的信息表现出过度自信。自我审视可以帮助 Agent 识别其推理前提是否基于事实、其信息来源是否可靠，从而降低幻觉的风险。
任务复杂性与错误传播：
在多步骤、长链条的复杂任务中，早期步骤中的微小错误可能会在后续推理中被放大，导致最终结果完全偏离。自我审视节点能及时中断这种错误传播，在错误发生时就进行修正。
信任与可靠性：
用户对 AI 系统的信任建立在其可靠性和准确性之上。一个能够自我审查并纠正错误的 Agent，其输出结果将更值得信赖，尤其是在高风险应用领域（如医疗诊断、金融分析、法律咨询）中，这一点至关重要。

第二讲：建模 Agent 的推理路径

为了让 Agent 能够审查自己的推理，首先它必须能够清晰地“看到”并“理解”自己的推理过程。这涉及到如何将 Agent 的思维过程外部化和结构化。

如何表示推理过程？

思维链 (Chain-of-Thought, CoT)：
CoT 是一种通过提示工程技术，引导 LLM 逐步思考，并将其中间推理步骤显式地输出出来的方法。这些步骤构成了一个线性的推理序列。

# 模拟一个LLM客户端
class LLMClient:
    def generate(self, prompt: str, model_name: str = "gpt-4", temperature: float = 0.7) -> str:
        """
        模拟LLM的文本生成接口。
        在实际应用中，这里会调用OpenAI、Anthropic等API。
        """
        print(f"n--- LLM Input (Model: {model_name}, Temp: {temperature}) ---")
        print(prompt)
        print("--------------------------------------------------")
        # 这是一个模拟输出，实际会根据prompt内容动态生成
        if "请逐步思考" in prompt or "思考过程" in prompt:
            if "25乘以15" in prompt:
                return "思考过程：n1. 25可以分解为20和5。n2. 20乘以15等于300。n3. 5乘以15等于75。n4. 300加上75等于375。n最终答案：375。"
            elif "所有鸟都会飞" in prompt:
                return "思考过程：n1. 前提是'所有鸟都会飞'。n2. '企鹅是鸟'是已知事实。n3. 根据前提和事实，得出结论'企鹅会飞'。n最终答案：企鹅会飞。" # 故意制造一个逻辑谬误例子
            elif "修正推理" in prompt and "企鹅" in prompt:
                return "修正后的思考过程：n1. 原始推理基于'所有鸟都会飞'的错误前提。n2. 尽管企鹅是鸟，但并非所有鸟都会飞，企鹅就是不能飞的鸟类之一。n3. 因此，从'企鹅是鸟'不能推导出'企鹅会飞'。n最终结论：原始推理存在谬误，企鹅不会飞。"
            elif "逻辑谬误" in prompt and "思考过程" in prompt:
                if "企鹅" in prompt:
                    return "审查结果：n1. 步骤1 '前提是所有鸟都会飞'：这是一个错误的普遍性假设，并非所有鸟都会飞。n2. 步骤3 '得出结论企鹅会飞'：基于错误的普遍性前提，推导出错误结论。n存在的逻辑谬误类型：证据不足的概括（Hasty Generalization）和错误前提（False Premise）。"
                elif "25乘以15" in prompt:
                    return "审查结果：n此推理过程逻辑清晰，计算步骤正确，未发现明显的逻辑谬误。"
        elif "生成最终答案" in prompt:
             if "25乘以15" in prompt:
                 return "375"
             elif "企鹅" in prompt:
                 return "企鹅会飞" # 原始错误答案
        return "这是一个模拟的LLM响应。"

llm_client = LLMClient()

# 示例：CoT
problem = "请计算25乘以15，并逐步思考。"
cot_prompt = f"问题：{problem}n请逐步思考并给出最终答案。"
cot_output = llm_client.generate(cot_prompt)
print(f"nCoT Output:n{cot_output}")
# CoT Output:
# 思考过程：
# 1. 25可以分解为20和5。
# 2. 20乘以15等于300。
# 3. 5乘以15等于75。
# 4. 300加上75等于375。
# 最终答案：375。

思维树 (Tree-of-Thought, ToT)：
ToT 是 CoT 的扩展，它允许 Agent 在推理过程中探索多个可能的路径或分支，而不是局限于单一的线性链条。在每个节点，Agent 可以生成多个中间思考，然后评估这些思考的质量，选择最有前景的路径继续深入。这在解决需要搜索或回溯的复杂问题时尤其有用。

Agent 需要能够表示这些分支和它们的评估分数。

结构化日志 (Structured Logging)：
Agent 可以将其思考过程、决策点、使用的工具、观察结果等信息以结构化的格式（如 JSON）记录下来。这种格式便于后续的程序化解析和审查。

{
  "task_id": "math_problem_001",
  "steps": [
    {
      "step_id": 1,
      "action": "Decompose problem",
      "thought": "将25分解为20和5，便于乘法。",
      "result": "Components: [20, 5]"
    },
    {
      "step_id": 2,
      "action": "Multiply component 1",
      "thought": "计算20乘以15。",
      "result": "300"
    },
    {
      "step_id": 3,
      "action": "Multiply component 2",
      "thought": "计算5乘以15。",
      "result": "75"
    },
    {
      "step_id": 4,
      "action": "Combine results",
      "thought": "将分步结果相加。",
      "result": "375"
    }
  ],
  "final_answer": 375
}

通过上述方法，Agent 的“思考”不再是黑箱操作，而是可被检查和分析的显式数据。

第三讲：Agent 识别逻辑谬误的机制

一旦 Agent 能够表示其推理路径，下一步就是如何让它识别出路径中的逻辑谬误。

谬误的定义与识别

Agent 识别逻辑谬误的能力主要来源于以下几个方面：

内化规则 (Internalized Rules from Training)：
LLM 在训练过程中接触了大量的逻辑文本、批判性论文、辩论分析等。这些数据中蕴含了逻辑推理的模式和谬误的例子。因此，LLM 在一定程度上能够通过模式匹配来识别一些显而易见的逻辑错误。这是一种隐式学习。

显式指令 (Explicit Instructions via Prompts)：
通过精心设计的提示词，我们可以明确告知 Agent 什么是逻辑谬误，并要求它在审查时关注这些特定类型。这是一种外化的、指导性的方式。

# 提示 Agent 关注常见的逻辑谬误
fallacy_definitions = """
常见的逻辑谬误包括：
- 滑坡谬误 (Slippery Slope)：声称某个行为必然导致一系列负面后果。
- 稻草人谬误 (Straw Man)：歪曲对方论点以攻击之。
- 循环论证 (Circular Reasoning)：结论已包含在前提中。
- 诉诸权威 (Appeal to Authority)：仅凭权威言论而非证据支持。
- 非黑即白谬误 (False Dilemma)：将复杂问题简化为两个极端选项。
- 错误归因 (False Cause)：错误地将时间上先后发生的两件事视为因果关系。
- 证据不足的概括 (Hasty Generalization)：基于少量不具代表性的样本得出普遍结论。
- 错误前提 (False Premise)：推理的起点就是错误的。
"""

元知识 (Meta-Knowledge)：
Agent 可以在其知识库中存储关于不同领域推理模式的元知识。例如，在数学推理中，需要严格遵守算术规则；在科学推理中，需要证据支持和可证伪性；在法律推理中，需要遵循特定法规和判例。这些元知识可以指导 Agent 在不同上下文中进行更专业的逻辑审查。

核心技术：元提示与自校正

元提示（Meta-Prompting）是实现自我审视的关键。它指的是 Agent 不仅接收解决问题的原始提示，还会接收一个关于如何审视和改进其解决方案的“元提示”。这通常表现为一个多阶段的对话或任务流。

自校正循环：
元提示通常驱动一个自校正循环：

生成初步推理：Agent 根据原始问题生成一个初步的推理路径和答案。
启动自我审查：Agent 接收一个元提示，指示它审查上一步的推理。
识别并解释谬误：Agent 根据元提示的指导，在推理路径中寻找逻辑谬误，并解释谬误的类型和原因。
提出修正方案：Agent 根据识别出的谬误，提出改进或修正推理的方案。
执行修正并重新推理：Agent 采纳修正方案，重新执行推理过程，生成新的推理路径和答案。
迭代：如果需要，可以重复上述循环，直到 Agent 对其推理路径的质量满意。

第四讲：实现自我审查：具体技术与代码实践

现在，我们将通过具体的代码示例来展示 Agent 如何实现自我审查。

方法一：结构化推理与分步审查

这种方法要求 Agent 在生成推理时就遵循一定的结构，然后专门设计一个元提示来审视这个结构化的推理。

场景：判断一个简单逻辑推理的有效性。

# Agent的推理函数
def agent_reason_and_critique(problem: str) -> str:
    """
    Agent 尝试解决问题，然后自我审查其推理。
    """
    print(f"n--- 解决问题阶段 ---")
    reasoning_prompt = f"""
    请你充当一个逻辑推理专家。
    问题：{problem}
    请逐步思考，列出你的每一个推理步骤，并最终给出你的答案。
    """
    initial_reasoning_output = llm_client.generate(reasoning_prompt, temperature=0.5)
    print(f"nAgent 初步推理:n{initial_reasoning_output}")

    # 提取思考过程以便审查
    # 实际应用中，可能需要更复杂的解析，例如正则表达式或JSON解析
    if "思考过程：" in initial_reasoning_output:
        reasoning_path = initial_reasoning_output.split("思考过程：")[1].split("最终答案：")[0].strip()
    else:
        reasoning_path = initial_reasoning_output # 如果没有明确的“思考过程”，就审查整个输出

    print(f"n--- 自我审查阶段 ---")
    critique_prompt = f"""
    你刚才对以下问题进行了推理：
    问题：{problem}

    你的推理过程如下：
    {reasoning_path}

    请你现在扮演一个严格的逻辑审查员，对上述推理过程进行批判性分析。
    特别注意以下几点：
    1.  推理的前提是否真实或合理？
    2.  每一步的推导是否逻辑严谨？是否存在跳跃、矛盾或不一致？
    3.  是否使用了任何逻辑谬误？（例如：滑坡谬误、稻草人谬误、循环论证、诉诸权威、非黑即白、错误归因、证据不足的概括、错误前提等）
    4.  最终结论是否能够从推理过程正确推导出来？

    请详细说明你发现的任何逻辑谬误，说明谬误的类型，并解释为什么这是一个谬误。如果推理没有问题，也请说明。
    """ + fallacy_definitions # 引入谬误定义

    critique_output = llm_client.generate(critique_prompt, temperature=0.2)
    print(f"nAgent 自我审查结果:n{critique_output}")

    if "谬误" in critique_output or "错误" in critique_output:
        print(f"n--- 修正推理阶段 ---")
        correction_prompt = f"""
        基于你对以下问题的推理及其自我审查结果：
        问题：{problem}
        原始推理过程：
        {reasoning_path}
        自我审查结果：
        {critique_output}

        请你根据自我审查的结果，修正你的原始推理，并给出修正后的思考过程和最终答案。
        """
        corrected_reasoning_output = llm_client.generate(correction_prompt, temperature=0.5)
        print(f"nAgent 修正后的推理:n{corrected_reasoning_output}")
        return corrected_reasoning_output
    else:
        print("nAgent 认为推理没有问题，直接给出最终答案。")
        final_answer_prompt = f"""
        根据你最初的推理：
        {initial_reasoning_output}
        请直接提取最终答案。
        """
        final_answer = llm_client.generate(final_answer_prompt, temperature=0.1)
        return final_answer

# 示例 1: 一个有明显逻辑谬误的问题
problem_with_fallacy = "前提：所有鸟都会飞。企鹅是鸟。结论：企鹅会飞。请评估这个推理的有效性。"
print("n--- 运行示例 1：存在谬误的推理 ---")
agent_reason_and_critique(problem_with_fallacy)

# 示例 2: 一个正确的数学问题
problem_correct = "请计算25乘以15。"
print("n--- 运行示例 2：正确的推理 ---")
agent_reason_and_critique(problem_correct)

代码解析：

agent_reason_and_critique 函数模拟了 Agent 的工作流程。
解决问题阶段：Agent 首先尝试用 reasoning_prompt 解决问题，并输出其思考过程。
自我审查阶段：Agent 构造 critique_prompt，其中包含了原始问题、Agent 自己的初步推理，以及对逻辑谬误的明确指导。这要求 Agent 扮演一个“逻辑审查员”。
llm_client.generate 在这里会根据 prompt 内容返回预设的模拟结果，但在实际环境中，这将是 LLM 根据 prompt 进行实时推理。
修正推理阶段：如果审查结果指出存在谬误，Agent 会使用 correction_prompt 结合审查结果来修正其推理。这个循环可以进一步迭代，直到审查结果满意。

方法二：批判性反思循环

这种方法将自我审查集成到 Agent 的核心决策循环中，使得 Agent 可以在每一步或每隔几步进行反思。

import json

class ReflectiveAgent:
    def __init__(self, llm_client: LLMClient):
        self.llm_client = llm_client
        self.history = []

    def run_task(self, initial_problem: str, max_iterations: int = 3) -> dict:
        current_state = {"problem": initial_problem, "reasoning_path": "", "final_answer": None}
        self.history.append({"iteration": 0, "type": "initial_problem", "content": initial_problem})

        for i in range(max_iterations):
            print(f"n--- 迭代 {i+1}：生成/修正推理 ---")
            reasoning_prompt = f"""
            你正在尝试解决以下问题：{current_state['problem']}
            当前的推理路径是：
            {current_state['reasoning_path'] if current_state['reasoning_path'] else '无'}

            请你继续或重新开始你的思考。请逐步思考，并以JSON格式输出你的推理步骤和最终答案的草稿。
            格式要求：
            {{
                "steps": [
                    {{"step_id": 1, "thought": "...", "action": "...", "result": "..."}},
                    ...
                ],
                "draft_answer": "...",
                "confidence": "low/medium/high"
            }}
            """
            raw_reasoning = self.llm_client.generate(reasoning_prompt, temperature=0.6, model_name="gpt-4")
            try:
                reasoning_output = json.loads(raw_reasoning)
                current_state['reasoning_path'] = json.dumps(reasoning_output['steps'], indent=2)
                current_state['final_answer'] = reasoning_output.get('draft_answer')
                self.history.append({"iteration": i+1, "type": "reasoning_output", "content": reasoning_output})
            except json.JSONDecodeError:
                print(f"警告：LLM未能生成有效的JSON。原始输出：{raw_reasoning}")
                current_state['reasoning_path'] = raw_reasoning # 存储原始文本以供审查
                reasoning_output = {"steps": [], "draft_answer": "解析失败"}
                self.history.append({"iteration": i+1, "type": "reasoning_output_raw", "content": raw_reasoning})

            print(f"n--- 迭代 {i+1}：自我审查 ---")
            critique_prompt = f"""
            你已经生成了以下推理路径和草稿答案：
            问题：{current_state['problem']}
            推理步骤：
            {current_state['reasoning_path']}
            草稿答案：{current_state['final_answer']}

            请你作为一名严格的逻辑审查员，对上述推理过程和草稿答案进行批判性分析。
            关注点：
            1.  前提是否正确？
            2.  推理链条是否连贯、无跳跃？
            3.  是否存在逻辑谬误（如循环论证、错误归因、证据不足的概括等）？
            4.  最终答案是否从推理中正确得出？
            5.  是否有更优的推理路径或更准确的答案？

            请以JSON格式输出审查结果和改进建议：
            {{
                "critique": "详细的审查意见，指出问题和优点。",
                "fallacies_found": ["谬误类型1", "谬误类型2"],
                "is_correct": true/false,
                "confidence_in_critique": "low/medium/high",
                "improvement_suggestions": "如果发现问题，提供如何改进推理的建议。"
            }}
            """ + fallacy_definitions # 引入谬误定义

            raw_critique = self.llm_client.generate(critique_prompt, temperature=0.2, model_name="gpt-4")
            try:
                critique_output = json.loads(raw_critique)
                self.history.append({"iteration": i+1, "type": "critique_output", "content": critique_output})

                print(f"审查结果：{critique_output.get('critique', 'N/A')}")
                print(f"发现谬误：{critique_output.get('fallacies_found', '无')}")
                print(f"是否正确：{critique_output.get('is_correct', '未知')}")

                if not critique_output.get('is_correct', True) or critique_output.get('fallacies_found'):
                    print(f"改进建议：{critique_output.get('improvement_suggestions', '无')}")
                    # 将改进建议融入到下一次迭代的推理prompt中
                    current_state['reasoning_path'] = f"基于以下问题和审查建议，请重新思考：n问题：{current_state['problem']}n前次推理：{current_state['reasoning_path']}n审查意见：{critique_output['critique']}n改进建议：{critique_output['improvement_suggestions']}n请重新生成详细的JSON推理步骤和最终答案。"
                else:
                    print("Agent 认为推理没有问题。")
                    return current_state # 如果Agent认为没问题，就结束循环
            except json.JSONDecodeError:
                print(f"警告：LLM未能生成有效的JSON审查结果。原始输出：{raw_critique}")
                # 如果审查结果解析失败，Agent可以选择继续或停止，这里选择停止以避免无限循环
                return current_state

        print("n--- 达到最大迭代次数，返回当前最佳结果 ---")
        return current_state

# 使用ReflectiveAgent
reflective_agent = ReflectiveAgent(llm_client)
print("n--- 运行 ReflectiveAgent 示例：有谬误的推理 ---")
final_result_reflective = reflective_agent.run_task(problem_with_fallacy)
print(f"nReflectiveAgent 最终结果:n{json.dumps(final_result_reflective, indent=2)}")

print("n--- 运行 ReflectiveAgent 示例：正确的数学推理 ---")
final_result_reflective_math = reflective_agent.run_task(problem_correct)
print(f"nReflectiveAgent 最终结果:n{json.dumps(final_result_reflective_math, indent=2)}")

代码解析：

ReflectiveAgent 类维护一个 history 列表来记录每次迭代的状态。
循环迭代：Agent 在每次迭代中首先生成或修正推理，然后进行自我审查。
结构化输出：强制 Agent 以 JSON 格式输出推理步骤和审查结果，这使得程序能够更容易地解析和处理。
反馈机制：如果审查发现问题，improvement_suggestions 会被提取并融入到下一次推理的 prompt 中，形成一个有效的反馈循环。
max_iterations 限制了循环的次数，防止无限循环。
通过 is_correct 和 fallacies_found 字段，Agent 可以决定是否继续迭代。

方法三：利用外部工具进行验证

对于某些特定类型的逻辑谬误，特别是那些涉及事实核查、数学计算或形式逻辑验证的，Agent 可以调用外部工具来辅助审查。

场景：验证一个数学计算或事实陈述。

# 模拟外部工具
class ExternalTools:
    def check_calculation(self, expression: str) -> dict:
        """模拟一个计算器工具"""
        try:
            result = eval(expression) # 简化处理，实际应使用更安全的数学表达式解析器
            return {"status": "success", "result": result, "is_correct": True}
        except Exception as e:
            return {"status": "error", "message": str(e), "is_correct": False}

    def check_fact(self, fact_statement: str) -> dict:
        """模拟一个知识图谱或事实数据库查询工具"""
        known_facts = {
            "所有鸟都会飞": False, # 这是个错误的前提
            "企鹅是鸟": True,
            "25乘以15等于375": True,
            "所有哺乳动物都是胎生": False, # 鸭嘴兽是反例
            "太阳从东边升起": True
        }
        is_true = known_facts.get(fact_statement, "unknown")
        return {"status": "success", "fact_statement": fact_statement, "is_true": is_true}

tools = ExternalTools()

def agent_with_tool_validation(problem: str) -> str:
    print(f"n--- 带有工具验证的 Agent 解决问题 ---")
    reasoning_prompt = f"""
    问题：{problem}
    请逐步思考，并以JSON格式输出你的推理步骤。如果需要进行数学计算或事实核查，请在步骤中明确指出，并假设你可以调用外部工具 `tools.check_calculation(expression)` 或 `tools.check_fact(statement)`。
    格式要求：
    {{
        "steps": [
            {{"step_id": 1, "thought": "...", "action": "...", "tool_call": null}},
            {{"step_id": 2, "thought": "...", "action": "Call Tool", "tool_call": {{"name": "check_fact", "args": ["企鹅是鸟"]}}}},
            ...
        ],
        "final_answer_draft": "..."
    }}
    """
    raw_reasoning = llm_client.generate(reasoning_prompt, temperature=0.5)
    try:
        reasoning_plan = json.loads(raw_reasoning)
        print(f"nAgent 初始推理计划:n{json.dumps(reasoning_plan, indent=2)}")

        executed_steps = []
        for step in reasoning_plan['steps']:
            if step.get("tool_call"):
                tool_name = step["tool_call"]["name"]
                tool_args = step["tool_call"]["args"]
                tool_output = None
                if tool_name == "check_calculation":
                    tool_output = tools.check_calculation(*tool_args)
                elif tool_name == "check_fact":
                    tool_output = tools.check_fact(*tool_args)
                step["tool_output"] = tool_output # 将工具输出添加到步骤中
                print(f"-> 调用工具 {tool_name}，参数 {tool_args}，结果：{tool_output}")
                if tool_output and not tool_output.get("is_true", True): # 如果工具发现事实不真
                    print(f"!!! 警告：工具验证发现前提 '{tool_args[0]}' 是错误的。需要修正推理。")
                    # 这里Agent可以重新生成推理，或者直接指出错误
                    critique_info = f"在步骤 {step['step_id']} 中，工具 {tool_name} 验证发现前提 '{tool_args[0]}' 是错误的。原始推理基于错误前提。"
                    correction_prompt = f"""
                    你之前的推理计划中，在执行到某个步骤时，外部工具发现了一个关键前提是错误的。
                    问题：{problem}
                    原始推理计划：
                    {json.dumps(reasoning_plan['steps'], indent=2)}
                    工具验证发现的问题：{critique_info}

                    请你根据这个新的信息，重新思考并生成一个修正后的推理计划和最终答案。
                    再次以JSON格式输出，并确保你的推理基于正确的事实。
                    """
                    corrected_raw_reasoning = llm_client.generate(correction_prompt, temperature=0.5)
                    try:
                        corrected_plan = json.loads(corrected_raw_reasoning)
                        print(f"nAgent 修正后的推理计划:n{json.dumps(corrected_plan, indent=2)}")
                        return json.dumps(corrected_plan, indent=2) # 返回修正后的计划
                    except json.JSONDecodeError:
                        return f"修正推理时LLM未能生成有效JSON。原始输出：{corrected_raw_reasoning}"
            executed_steps.append(step)

        # 如果所有工具验证都通过，进行最终审查
        final_critique_prompt = f"""
        你已经完成了以下问题的推理，并执行了所有必要的工具验证。
        问题：{problem}
        执行后的推理步骤（包含工具输出）：
        {json.dumps(executed_steps, indent=2)}
        最终草稿答案：{reasoning_plan['final_answer_draft']}

        请你现在作为最终的逻辑审查员，对整个过程进行总结性审查。
        1.  所有前提是否都已通过验证？
        2.  推理链条是否逻辑严谨？
        3.  最终答案是否准确？
        请给出你的最终结论和答案。
        """
        final_review_output = llm_client.generate(final_critique_prompt, temperature=0.1)
        print(f"nAgent 最终审查结果:n{final_review_output}")
        return final_review_output

    except json.JSONDecodeError:
        return f"LLM未能生成有效的JSON推理计划。原始输出：{raw_reasoning}"

# 示例 1: 使用工具验证一个错误的前提
problem_with_tool_check = "前提：所有鸟都会飞。企鹅是鸟。结论：企鹅会飞。请评估这个推理的有效性。在推理过程中请核查'所有鸟都会飞'和'企鹅是鸟'这两个事实。"
print("n--- 运行带有工具验证的 Agent 示例 1 ---")
agent_with_tool_validation(problem_with_tool_check)

# 示例 2: 使用工具验证一个数学计算
problem_math_with_tool_check = "请计算 (123 + 45) * 6，并在计算前核实123+45的结果。"
print("n--- 运行带有工具验证的 Agent 示例 2 ---")
agent_with_tool_validation(problem_math_with_tool_check)

代码解析：

ExternalTools 类模拟了外部计算器和事实数据库。
Agent 在 reasoning_prompt 中被告知可以调用这些工具，并需要在其推理计划中明确指出工具调用。
主函数解析 Agent 的推理计划，并在遇到 tool_call 时实际调用模拟工具。
即时反馈：如果工具验证发现关键前提是错误的，Agent 会立即中断当前推理，并使用 correction_prompt 重新规划和修正。这体现了“自我审视节点”的及时纠错能力。
即使所有工具验证都通过，Agent 也会进行一次最终的总结性审查。

方法四：多路径探索与一致性检查 (Self-Consistency)

这种方法不直接审查单一步骤的逻辑，而是通过生成多个独立的推理路径，然后检查这些路径的最终结果是否一致。如果结果不一致，则表明至少有一条路径可能存在问题，需要进行更深入的审查或重新推理。

def agent_with_self_consistency(problem: str, num_paths: int = 3) -> str:
    print(f"n--- 运行带有自洽性检查的 Agent ---")
    all_results = []
    reasoning_paths_detail = []

    for i in range(num_paths):
        print(f"n--- 生成第 {i+1} 条推理路径 ---")
        reasoning_prompt = f"""
        问题：{problem}
        请你独立思考，逐步推导并给出最终答案。请专注于给出最准确的答案。
        """
        raw_output = llm_client.generate(reasoning_prompt, temperature=0.8 + i*0.1) # 略微增加温度，鼓励多样性
        all_results.append(raw_output)
        reasoning_paths_detail.append({"path_id": i+1, "output": raw_output})
        print(f"路径 {i+1} 输出:n{raw_output}")

    # 提取最终答案
    extracted_answers = []
    for output in all_results:
        # 假设答案在“最终答案：”之后
        if "最终答案：" in output:
            answer = output.split("最终答案：")[-1].strip().replace('.', '').replace(',', '')
            extracted_answers.append(answer)
        else:
            extracted_answers.append(output.strip()) # 如果没有明确的，就取整个输出

    print(f"n所有路径提取的答案: {extracted_answers}")

    # 检查一致性
    from collections import Counter
    answer_counts = Counter(extracted_answers)
    most_common_answer, count = answer_counts.most_common(1)[0]

    if count < num_paths: # 如果最常见的答案不是所有路径都同意的
        print(f"n!!! 警告：推理路径结果不一致。最常见答案是 '{most_common_answer}' ({count}/{num_paths})。")
        # 触发深入审查
        deep_critique_prompt = f"""
        你在解决以下问题时，生成了 {num_paths} 条独立的推理路径，但它们的最终答案不一致。
        问题：{problem}
        所有推理路径的详细输出如下：
        {json.dumps(reasoning_paths_detail, indent=2)}
        提取到的答案列表：{extracted_answers}
        最常见的答案是：'{most_common_answer}'

        请你现在充当一个高级逻辑分析师。
        1.  分析为什么会出现不一致？
        2.  指出哪些推理路径可能存在逻辑谬误或错误假设。
        3.  提供一个最终的、经过验证的正确答案，并给出最可靠的推理过程。
        """
        final_decision = llm_client.generate(deep_critique_prompt, temperature=0.2)
        print(f"nAgent 深度审查及最终决策:n{final_decision}")
        return final_decision
    else:
        print(f"n所有推理路径结果一致。最终答案：{most_common_answer}")
        return most_common_answer

# 示例: 可能会产生不一致结果的问题 (例如，模糊问题或复杂推理)
problem_ambiguous = "如果一个村庄里，所有理发师都只给不给自己理发的人理发，那么这个村庄的理发师给自己理发吗？请解释你的推理。"
print("n--- 运行自洽性 Agent 示例 1 ---")
agent_with_self_consistency(problem_ambiguous, num_paths=3)

# 示例: 简单数学问题，预期会一致
problem_simple_math = "请计算 12 + 8 * 3 的结果。"
print("n--- 运行自洽性 Agent 示例 2 ---")
agent_with_self_consistency(problem_simple_math, num_paths=3)

代码解析：

Agent 独立生成 num_paths 条推理路径，通过稍微提高 temperature 来鼓励生成多样化的思考。
extracted_answers 收集每条路径的最终答案。
Counter 用于统计答案的出现频率。
不一致性检测：如果最常见的答案并没有被所有路径认同（即 count < num_paths），Agent 就会触发一个深度审查。
深度审查：Agent 接收所有路径的详细信息，并被要求分析不一致的原因，指出可能的谬误，并给出最终的、经过验证的答案和推理。

方法五：强化学习与经验积累 (Reinforcement Learning and Experience Accumulation)

这种方法是在 Agent 长期运行中不断优化其自我审查能力。Agent 在每次任务执行后，如果其输出被外部环境或人类评估为错误，它会收到一个负反馈信号。Agent 可以利用这些反馈来：

调整其生成推理的策略，使其更倾向于生成可审查的、结构化的路径。
优化其自我审查提示词，使其能更有效地识别出导致先前错误的谬误类型。
学习哪些类型的任务或推理模式更容易出错，从而在这些情况下更频繁或更深入地进行自我审查。

这通常涉及到更复杂的训练框架，例如：

奖励模型 (Reward Model)：训练一个模型来评估 Agent 推理路径的质量和最终答案的正确性。
策略优化 (Policy Optimization)：使用强化学习算法（如 PPO）来优化 Agent 的决策策略，使其在生成推理和进行自我审查时能够最大化奖励。

虽然直接的代码示例会非常复杂，但核心思想是：Agent 不仅在当前任务中自我审视，还在跨任务、跨时间维度上“学习如何更好地自我审视”。

第五讲：挑战与未来展望

尽管“自我审视节点”为提升 Agent 的可靠性提供了强大途径，但仍面临诸多挑战：

固有局限性：Agent 的自我审查能力最终受限于其底层 LLM 的智能水平。如果 LLM 自身不理解某个复杂的逻辑概念，它可能无法识别出相关的谬误。这类似于人类自身的认知盲点。
计算成本：生成多条推理路径、进行多轮次的自我审查和修正，都会显著增加 Agent 的计算开销和延迟，尤其是在资源受限或需要实时响应的场景中。
可解释性与透明度：虽然自我审查增加了推理过程的透明度，但审查本身也是由 LLM 生成的文本。如何确保审查意见的准确性和无偏性，以及如何让人类用户真正理解 Agent 的审查逻辑，仍是一个挑战。
谬误识别的全面性：人类已知的逻辑谬误类型繁多，且在不同语境下表现各异。让 Agent 识别所有类型的谬误，并对它们进行精确分类，是一个持续的研究方向。

展望未来，“自我审视节点”将继续发展：

更精细的元认知模型：Agent 将能更深入地理解自身的知识边界、不确定性来源，并主动寻求外部验证。
与形式逻辑的结合：将 LLM 的强大语言理解能力与形式逻辑推理器的精确性相结合，实现混合式推理和验证。
持续学习与适应：Agent 将通过与环境和人类的持续交互，不断改进其自我审查策略，使其更加高效和准确。
多模态审查：在处理图像、视频等多模态信息时，Agent 也能对其感知和推理过程进行自我审视。

通过今天的讲座，我们深入探讨了 Agent 如何通过“自我审视节点”来发现并纠正推理路径中的逻辑谬误。从结构化推理到批判性反思循环，再到利用外部工具和自洽性检查，这些技术共同构建了一个更加可靠、值得信赖的智能 Agent 系统。这一领域的持续进步，将是构建真正智能、自主和负责任 AI 的关键。

第一讲：理解“自我审视节点”及其必要性

什么是“自我审视节点”？

为什么需要自我审视？

第二讲：建模 Agent 的推理路径

如何表示推理过程？

第三讲：Agent 识别逻辑谬误的机制

谬误的定义与识别

核心技术：元提示与自校正

第四讲：实现自我审查：具体技术与代码实践

方法一：结构化推理与分步审查

方法二：批判性反思循环

方法三：利用外部工具进行验证

方法四：多路径探索与一致性检查 (Self-Consistency)

方法五：强化学习与经验积累 (Reinforcement Learning and Experience Accumulation)

第五讲：挑战与未来展望

发表回复 取消回复

发表回复取消回复