retrieval - 智猿学院-前后端，数据库，人工智能，云计算等领域前沿技术讲座

2026年1月8日

深入 ‘Retrieval with Feedback’：根据生成阶段的幻觉检测结果，反向修正检索词的循环回路

各位同仁，大家好！今天，我们齐聚一堂，共同探讨人工智能领域一个至关重要且充满挑战的话题——如何构建更可靠、更值得信赖的大型语言模型（LLM）应用。特别是，我们将深入剖析“带反馈的检索增强生成（Retrieval with Feedback）”这一前沿范式，并聚焦于其核心机制：如何根据生成阶段的幻觉检测结果，反向修正检索词，形成一个智能的循环回路。在RAG（Retrieval Augmented Generation）日益普及的今天，我们都看到了它在提升LLM答案准确性和时效性方面的巨大潜力。然而，RAG并非银弹，它也面临着自身固有的挑战，其中最令人头疼的莫过于“幻觉”（Hallucinations）。当LLM生成了看似合理但实际与检索到的事实不符，甚至完全虚构的内容时，就产生了幻觉。这不仅损害了用户对系统的信任，也限制了RAG在关键业务场景中的应用。传统的RAG流程是线性的：用户查询 -> 检索相关文档 -> LLM基于文档生成答案。这个过程中，检索结果的好坏直接决定了最终答案的质量。一旦检索到了不相关、不充分或带有误导性的信息，LLM就可能步入幻觉的泥潭。而“带反馈 …

继续阅读“深入 ‘Retrieval with Feedback’：根据生成阶段的幻觉检测结果，反向修正检索词的循环回路”

2026年1月5日

探讨 ‘Memory-augmented Retrieval’：利用历史对话的 Checkpoint 作为查询权重，提升检索的相关性

尊敬的各位同仁，欢迎来到本次关于“Memory-augmented Retrieval”的讲座。今天我们将深入探讨如何利用历史对话的“Checkpoint”作为查询权重，显著提升检索系统的相关性，尤其是在多轮对话和复杂交互场景中。在当今的AI时代，检索增强生成（Retrieval-Augmented Generation, RAG）已成为构建高效、知识密集型大语言模型（LLM）应用的核心范式。然而，传统的RAG系统在处理动态、上下文敏感的对话时，常常暴露出其局限性。我们的目标是超越静态查询，迈向真正动态、情境感知的检索。 1. RAG的局限性：上下文之殇与记忆的缺失首先，让我们快速回顾一下RAG的基本原理。RAG通过将用户查询与外部知识库中的相关信息相结合，增强LLM生成回复的能力。其核心流程通常包括：用户查询：接收用户的输入。检索：根据查询从向量数据库或其他知识库中检索最相关的文档片段。生成：将查询和检索到的文档片段作为上下文输入给LLM，由LLM生成最终回复。这个流程在单轮问答或信息检索任务中表现出色。然而，当我们将RAG应用于多轮对话、客服机器人、智能助手等需要“记忆 …

继续阅读“探讨 ‘Memory-augmented Retrieval’：利用历史对话的 Checkpoint 作为查询权重，提升检索的相关性”

2026年1月5日

什么是 ‘Multi-hop Retrieval Loops’：利用 LangGraph 实现跨越 5 个不同向量库的深度关联探索

在当前信息爆炸的时代，如何高效、深度地从海量非结构化数据中提取洞察，是企业和个人面临的巨大挑战。大型语言模型（LLM）以其卓越的理解、生成和推理能力，为这一挑战带来了新的解决方案。然而，尽管LLM能力强大，它们也存在知识时效性、专业领域知识不足以及对复杂、多步骤推理能力有限的局限。为了弥补这些不足，检索增强生成（Retrieval Augmented Generation, RAG）范式应运而生。RAG通过在LLM生成答案之前，先从外部知识库中检索相关信息，然后将这些信息作为上下文输入给LLM，从而极大地提升了LLM回答的准确性、时效性和专业性。然而，传统的RAG往往局限于单次检索，难以应对那些需要多步逻辑推理、跨越多个信息源才能解决的复杂问题。这就引出了“Multi-hop Retrieval Loops”——多跳检索循环的概念。它模仿人类在解决复杂问题时的思维过程：将大问题分解为小问题，逐个解决，并将中间结果作为下一步推理的依据，逐步深入、关联信息。要实现这种复杂、有状态、多代理的工作流，我们需要一个强大的编排框架。LangGraph，作为LangChain的扩展，正是为此而生 …

继续阅读“什么是 ‘Multi-hop Retrieval Loops’：利用 LangGraph 实现跨越 5 个不同向量库的深度关联探索”

2026年1月4日

深入 ‘Multi-step Retrieval’：将复杂问题拆解为多个步骤，并在图中循环进行针对性知识补充

各位同仁，各位对人工智能与信息检索技术充满热情的开发者们，下午好！今天，我们将深入探讨一个在构建智能系统、特别是问答系统中日益重要的范式——“多步检索”（Multi-step Retrieval）。在当今信息爆炸的时代，我们面对的问题不再是简单的关键词匹配，而是充满复杂性、需要深度理解和推理的挑战。传统的一次性检索往往难以招架，而多步检索正是为了应对这些挑战而生，它模拟了人类解决复杂问题的思维过程：将大问题拆解为小问题，逐步获取知识，并根据中间结果动态调整策略，最终构建出完整而准确的答案。复杂问题的本质与传统检索的局限性在进入多步检索的核心机制之前，我们首先需要明确什么是“复杂问题”，以及为什么传统的单步检索（例如，基于向量相似度或关键词匹配的检索增强生成RAG）在此类问题面前显得力不从心。一个“复杂问题”通常具备以下一个或多个特征：多实体/多关系：问题涉及多个独立的实体及其之间的复杂关联。示例： “找出所有在过去两年内获得过A轮融资，并且其核心产品使用Rust语言开发的SaaS公司。” 多跳推理：需要通过一系列逻辑步骤才能得出答案，每个步骤都依赖前一个步骤的结果。示 …

继续阅读“深入 ‘Multi-step Retrieval’：将复杂问题拆解为多个步骤，并在图中循环进行针对性知识补充”

2025年12月31日

深入 ‘Small-to-Big Retrieval’：在向量库中存储句子级 Embedding，在返回时加载段落级上下文

各位同仁，各位对向量检索与大型语言模型（LLM）应用充满热情的开发者们，下午好！今天，我们将深入探讨一种在检索增强生成（RAG）领域日益受到关注的精妙策略——“Small-to-Big Retrieval”。顾名思义，这种方法在向量库中存储粒度更小的单元（例如句子级）的Embedding，但在实际返回给LLM时，却加载并提供粒度更大的上下文（例如段落级）。这并非简单的技巧，而是对RAG系统核心挑战——召回精度与上下文完整性——的深刻理解与优雅应对。 1. RAG的挑战：语义鸿沟与上下文困境在深入Small-to-Big之前，我们首先要回顾RAG系统面临的根本性挑战。RAG的初衷是赋予LLM访问外部知识的能力，以克服其知识截止日期、幻觉问题以及特定领域知识不足的限制。其基本流程是：用户提出问题 -> 将问题Embedding化 -> 在向量数据库中检索相关文档块（chunks）-> 将检索到的块作为上下文与用户问题一并提交给LLM。这个看似简单的流程，却隐藏着一个核心难题：如何有效地切分文档？小块（例如句子、短语）：优点：语义粒度细，Embedding更精准 …

继续阅读“深入 ‘Small-to-Big Retrieval’：在向量库中存储句子级 Embedding，在返回时加载段落级上下文”

2025年11月21日

通过 Prompt+Retrieval 联合评估建设 RAG 质量量化体系的工程方案

Prompt+Retrieval 联合评估：构建 RAG 质量量化体系的工程实践大家好，今天我们来聊聊如何构建一个可靠的 RAG (Retrieval-Augmented Generation) 质量量化体系。RAG 系统，简单来说，就是通过检索外部知识来增强生成模型的输出。这在很多场景下非常有用，比如问答系统、文档总结、内容创作等等。但如何评估 RAG 系统的质量，确保它能够准确、完整、可靠地回答问题，是我们需要解决的关键问题。今天我们将探讨一种基于 Prompt+Retrieval 联合评估的方案，并深入探讨其工程实现细节。 RAG 质量评估的挑战在深入具体的方案之前，我们先来了解一下 RAG 质量评估面临的挑战：多维度评估： RAG 系统的质量不是一个单一指标可以衡量的。我们需要考虑多个维度，比如检索的相关性、生成答案的准确性、答案的完整性、以及是否包含有害信息等等。数据标注成本：传统的评估方法依赖大量的人工标注数据，这成本高昂且耗时。主观性：评估结果往往受到评估者主观判断的影响，缺乏客观性。可解释性：我们不仅要评估 RAG 系统的性能，还要了解它为什么会产生 …

继续阅读“通过 Prompt+Retrieval 联合评估建设 RAG 质量量化体系的工程方案”