人工智能 - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2025年12月29日

什么是 ‘Dynamic Prompt Templating’？利用 Jinja2 模板实现具备逻辑判断（If/Else）的复杂提示词

各位编程爱好者、AI工程师们，大家好！今天，我们齐聚一堂，共同探讨一个在构建智能应用，尤其是基于大型语言模型（LLM）的应用中日益重要的主题——“动态提示词模板化”（Dynamic Prompt Templating）。在当前LLM技术飞速发展的时代，如何高效、灵活地与这些模型交互，已成为决定应用质量与用户体验的关键。静态的、硬编码的提示词早已无法满足我们日益复杂的业务需求。我们需要一种机制，能够让我们的提示词像代码一样，具有生命力，能够根据上下文、用户输入、系统状态等动态地调整自身。而这，正是动态提示词模板化所要解决的核心问题。我们将深入剖析其原理，并以强大的Python模板引擎Jinja2作为我们的工具，手把手地构建出能够实现复杂逻辑判断（If/Else）、循环、模块化等高级功能的动态提示词系统。第一章：理解提示词工程与动态化的必然性在深入技术细节之前，我们首先需要对“提示词工程”（Prompt Engineering）有一个清晰的认知。简单来说，提示词工程就是设计和优化与大型语言模型交互的输入文本（即“提示词”），以引导模型生成我们期望的、高质量的输出。一个好的提示词，如 …

继续阅读“什么是 ‘Dynamic Prompt Templating’？利用 Jinja2 模板实现具备逻辑判断（If/Else）的复杂提示词”

2025年12月29日

深入 ‘Prompt Versioning’：如何利用 LangSmith 追踪提示词迭代对 Agent 成功率的影响曲线

讲座题目：深入 Prompt Versioning：如何利用 LangSmith 追踪提示词迭代对 Agent 成功率的影响曲线各位同仁，各位对大模型与 Agent 技术充满热情的开发者们，大家好！今天，我们将深入探讨一个在构建和维护高性能 AI Agent 过程中至关重要的主题：提示词版本控制（Prompt Versioning），以及如何借助 LangSmith 这一强大的平台，系统地追踪提示词迭代对 Agent 成功率的影响曲线。在当今大模型驱动的应用开发中，提示词（Prompt）已成为连接人类意图与模型能力的“代码”，其重要性不言而喻。对于多步骤、复杂推理的 Agent 系统而言，提示词的设计与优化更是决定其能否稳定、高效运行的关键。引言：提示词工程的精髓与 Agent 系统的挑战在人工智能领域，特别是大型语言模型（LLM）的兴起，提示词工程（Prompt Engineering）已从一门艺术逐渐演变为一门科学。它不再仅仅是编写几个关键词或句子，而是精心构造输入，以引导模型产生期望的输出。对于简单的问答系统，一个好的提示词足以显著提升用户体验。然而，当我们谈论 AI A …

继续阅读“深入 ‘Prompt Versioning’：如何利用 LangSmith 追踪提示词迭代对 Agent 成功率的影响曲线”

2025年12月29日

解析 ‘Tree of Thoughts’ (ToT)：利用 LangChain 构建一个支持回溯和并行路径搜索的思维树

深入解析 ‘Tree of Thoughts’ (ToT)：利用 LangChain 构建支持回溯与并行路径搜索的思维树尊敬的各位技术同仁：欢迎来到今天的讲座。我们将深入探讨一种前沿的、能显著提升大型语言模型（LLM）解决复杂问题能力的范式——思维树（Tree of Thoughts, ToT）。不同于传统的链式思考（Chain of Thought, CoT），ToT赋予LLM规划、探索和自我修正的能力，使其能够更有效地应对需要多步骤推理、决策和评估的任务。我们将聚焦如何利用LangChain这一强大的框架，从零开始构建一个支持回溯和并行路径搜索的ToT系统。 1. 深入理解思维树 (Tree of Thoughts, ToT) 1.1. ToT 的起源与核心思想大型语言模型在处理开放式、多步骤推理任务时，常常面临挑战。传统的提示工程技术，如零样本（Zero-shot）或少样本（Few-shot）提示，以及链式思考（Chain of Thought, CoT），虽然在一定程度上提高了模型的推理能力，但它们本质上是线性的。CoT提示模型生成一系列中间推理步 …

继续阅读“解析 ‘Tree of Thoughts’ (ToT)：利用 LangChain 构建一个支持回溯和并行路径搜索的思维树”

2025年12月29日

什么是 ‘Negative Prompts’？在 LangChain 中如何显式告诉 Agent “不要做什么”以减少误操作

大模型时代下的指令精度与挑战随着大型语言模型（LLM）技术的飞速发展，我们正步入一个由人工智能驱动的全新时代。LLM强大的文本生成、理解和推理能力，使得构建智能助手、自动化工作流程、甚至是自主决策系统成为可能。在LangChain这样的框架中，通过将LLM与各种工具（Tools）、内存（Memory）和规划（Planning）机制相结合，我们能够创建出功能强大、能够执行复杂任务的Agent。这些Agent能够理解自然语言指令，自主选择并调用工具，从而完成从数据查询到代码生成等一系列操作。然而，大模型的强大能力也伴随着一个核心挑战：控制。LLM本质上是概率模型，它们的“创造性”和“泛化能力”在带来惊喜的同时，也可能导致它们偏离预期，产生不准确、不安全、不相关甚至是有害的输出或行为。例如，一个旨在提供金融建议的Agent可能会在用户不经意间询问健康问题时，尝试给出医疗建议；一个负责处理敏感数据的Agent可能会在某种特定输入下，无意中泄露信息；或者一个代码生成Agent可能会生成不符合安全规范的代码。为了确保Agent的行为符合我们的期望，并最大限度地减少误操作，我们不仅需要明确地告 …

继续阅读“什么是 ‘Negative Prompts’？在 LangChain 中如何显式告诉 Agent “不要做什么”以减少误操作”

2025年12月29日

解析 ‘Output Formatting’ (XML/JSON)：为什么 XML 在处理长文本嵌套时通常比 JSON 更稳定？

各位同仁，下午好。今天，我们将深入探讨数据序列化领域中的一个经典议题：在处理长文本与复杂嵌套结构时，为什么 Extensible Markup Language (XML) 通常比 JavaScript Object Notation (JSON) 表现出更高的稳定性。作为编程专家，我们不仅仅要了解语法，更要理解其背后的设计哲学、工程实践以及它们如何影响我们系统的健壮性。数据序列化：现代软件的基石在现代分布式系统、微服务架构以及客户端-服务器通信中，数据序列化是不可或缺的环节。它允许我们将程序中的复杂数据结构（如对象、列表）转换为一种可传输或可存储的格式，并在接收端将其反序列化回原始结构。这种能力是实现系统间互操作性的核心。常见的序列化格式多种多样，但 XML 和 JSON 无疑是其中最主流的两种。它们各有千秋，在不同的应用场景中展现出独特的优势。JSON 以其轻量、易读、与 JavaScript 原生兼容的特性，迅速成为 RESTful API 和 Web 应用的首选。而 XML 凭借其强大的结构描述能力、丰富的工具生态系统和久经考验的企业级应用，长期以来一直是数据交换、文档存 …

继续阅读“解析 ‘Output Formatting’ (XML/JSON)：为什么 XML 在处理长文本嵌套时通常比 JSON 更稳定？”

2025年12月29日

深入 ‘System Message’ 角色锁定：如何防止用户通过‘绕过攻击（Jailbreak）’篡改 Agent 的核心指令？

各位开发者、技术同仁们：欢迎来到今天的讲座，我们将深入探讨一个在构建基于大语言模型（LLM）的Agent时至关重要且日益严峻的挑战——如何防止用户通过“绕过攻击”（Jailbreak）篡改Agent的核心指令，从而确保其行为的鲁棒性、安全性和可控性。在当今AI快速发展的时代，Agent作为能够理解、推理、规划并执行任务的智能实体，正变得越来越普及。而其核心指令，通常通过“System Message”或“System Prompt”形式提供，是Agent行为的“宪法”，决定了它的角色、能力、限制和目标。一旦这些核心指令被恶意用户成功绕过或篡改，后果将是灾难性的：从生成不当内容、泄露敏感信息，到执行有害操作、损害品牌声誉，甚至引发法律责任。因此，对Agent核心指令进行角色锁定，使其能够抵抗各种绕过攻击，是构建任何可靠Agent的基石。本次讲座将从编程专家的视角，围绕这一主题，提供一系列从Prompt工程、输入输出处理、架构设计到模型训练的深度防御策略，并辅以详尽的代码示例，力求逻辑严谨、切实可行。 1. 引言：Agent核心指令的脆弱性与绕过攻击的威胁 1.1 什么是System …

继续阅读“深入 ‘System Message’ 角色锁定：如何防止用户通过‘绕过攻击（Jailbreak）’篡改 Agent 的核心指令？”

2025年12月29日

什么是 ‘Few-shot Prompting’ 的动态采样？利用向量索引动态为当前问题匹配最相关的示例

各位同仁，各位对人工智能充满热情的开发者们，大家上午好！今天，我将带领大家深入探讨一个在大型语言模型（LLM）时代日益重要的技术：Few-shot Prompting 中的动态采样 (Dynamic Sampling in Few-shot Prompting)。具体来说，我们将聚焦于如何利用强大的向量索引 (Vector Indexes) 技术，为每一个特定的问题，智能地匹配并检索出最相关的示例，从而显著提升我们与LLM交互的效率和效果。在过去几年里，LLM展现出了令人惊叹的语言理解和生成能力。从文本摘要到代码生成，从情感分析到复杂推理，它们的应用场景几乎无所不包。然而，要让这些模型在特定任务上发挥最佳性能，仅仅提供一个简单的指令往往是不够的。这就是 Few-shot Prompting 登场的原因。第一章：Few-shot Prompting 的基石与挑战 1.1 Few-shot Prompting 概述 Few-shot Prompting，顾名思义，是指在向大型语言模型发出请求时，除了提供任务指令和待处理的查询（Query）之外，还会附带少量（"few&quo …

继续阅读“什么是 ‘Few-shot Prompting’ 的动态采样？利用向量索引动态为当前问题匹配最相关的示例”

2025年12月29日

解析 ‘Chain of Thought’ (CoT)：如何在 Prompt 中诱导模型进行多步推演以提升逻辑精度？

各位开发者，各位对人工智能前沿技术抱有热忱的同仁们：欢迎来到今天关于大型语言模型（LLM）高级Prompt工程的讲座。今天，我们将深入探讨一个在过去几年中显著提升LLM能力，尤其是在复杂逻辑推理方面表现的关键技术——Chain of Thought (CoT)，即“思维链”或“推理链”。我们将从编程专家的视角，剖析CoT的原理，它如何诱导模型进行多步推演，从而提升逻辑精度，并提供详尽的代码示例和实践指导。一、引言：直面LLM的推理挑战大型语言模型在文本生成、翻译、摘要等任务上展现了惊人的能力，但当面对需要多步推理、复杂计算或深刻逻辑理解的问题时，它们有时会显得力不从心。传统的“直接问答”式Prompt，即直接提出问题并期望模型给出最终答案，常常会导致模型“跳过”中间推理过程，直接给出看似合理但实则错误的结论。这就像一个学生在数学考试中只写答案不写步骤，一旦答案错误，我们无从得知问题出在哪里。例如，考虑一个简单的算术题：“一个商店有100个苹果。第一天卖了35个，第二天卖了42个。商店还剩下多少个苹果？”如果直接问LLM最终答案，它可能会直接计算 100 – 35 – 42，或 …

继续阅读“解析 ‘Chain of Thought’ (CoT)：如何在 Prompt 中诱导模型进行多步推演以提升逻辑精度？”

2025年12月29日

深入 ‘Fine-tuning’ vs ‘RAG’：在什么场景下你应该选择微调模型而不是在 LangChain 里塞上下文？

各位同仁，各位技术爱好者，大家好！今天，我们齐聚一堂，共同探讨生成式AI领域中两个至关重要且常被拿来比较的概念：Retrieval Augmented Generation (RAG) 和 Fine-tuning (微调)。随着大型语言模型（LLMs）的普及，我们面临的挑战不再仅仅是如何使用它们，更是如何高效、精准、经济地将它们应用于特定业务场景。我们常常会听到这样的疑问：我的LLM不够聪明，它不知道我们公司的内部规章制度，它也无法以我们期望的语气与客户交流。面对这些问题，我们应该选择在LangChain这样的框架中塞入大量上下文，也就是RAG，还是应该投入资源去微调一个模型呢？这并非一个简单的二元选择题。作为编程专家，我们的职责是深入理解这两种方案的原理、优势、局限性，并根据具体的业务需求、数据特点和资源预算，做出最明智的战略决策。今天的讲座，我将带大家抽丝剥茧，深入剖析RAG与Fine-tuning，尤其聚焦于在何种场景下，我们应该果断选择微调模型，而非仅仅依赖上下文填充。一、生成式AI的挑战与解决方案概览大型语言模型，如GPT系列、Llama系列，以其惊人的通用知识和强大 …

继续阅读“深入 ‘Fine-tuning’ vs ‘RAG’：在什么场景下你应该选择微调模型而不是在 LangChain 里塞上下文？”

2025年12月29日

解析 ‘Tokenization’ 陷阱：为什么不同的分词器（Tiktoken vs SentencePiece）会影响 RAG 的分割边界？

在构建基于检索增强生成 (RAG) 系统的过程中，我们常常关注检索模块的效率、生成模型的性能，以及如何设计高效的向量数据库。然而，一个看似基础却极易被忽视的环节——分词 (Tokenization)，却可能成为影响整个RAG系统性能的关键“陷阱”。不同的分词器，如OpenAI模型家族使用的Tiktoken和广泛应用于多语言场景的SentencePiece，其工作原理和分词结果的差异，将直接影响我们的文档分割边界，进而对RAG的检索准确性和生成质量产生深远影响。今天，我们将深入探讨这一陷阱，剖析不同分词器的工作机制，并通过代码实例展示它们如何导致RAG系统中的分割边界问题，并提出相应的缓解策略。第一章：分词的基石——为什么我们需要Tokenization？在深入探讨分词器的差异之前，我们首先要理解分词在自然语言处理（NLP）特别是大型语言模型（LLM）中的核心作用。 1.1 什么是分词？分词是将连续的文本序列切分成更小、有意义的单元（tokens）的过程。这些单元可以是单词、子词（subword）、字符或字节。LLM不能直接处理原始文本，它们需要将文本转换为模型能够理解的数值表示 …

继续阅读“解析 ‘Tokenization’ 陷阱：为什么不同的分词器（Tiktoken vs SentencePiece）会影响 RAG 的分割边界？”