好的,我们开始。 RAG 检索召回太宽泛:语义压缩提升相关性 大家好,今天我们来探讨一个在构建 RAG(Retrieval-Augmented Generation)系统时经常遇到的问题:检索召回太宽泛,导致结果相关性不高。我们会重点讨论如何通过语义压缩技术来提升检索结果的相关性,让 RAG 系统更好地服务于我们的应用。 一、RAG 系统简介与宽泛召回的挑战 RAG 系统,简单来说,就是先从外部知识库检索相关信息,然后将检索到的信息与用户查询一起输入到生成模型中,生成最终的答案或内容。它结合了信息检索和生成模型的优势,使得模型能够利用外部知识,避免幻觉,并生成更准确、更全面的内容。 一个典型的 RAG 流程包括以下几个步骤: 文档准备: 将原始文档分割成更小的块(chunks),例如段落或句子。 向量化: 使用嵌入模型(embedding model)将每个 chunk 转换为向量表示。 索引构建: 将向量化的 chunk 存储到向量数据库中,构建索引,以便快速检索。 查询向量化: 将用户查询转换为向量表示,使用与文档向量化相同的嵌入模型。 检索: 在向量数据库中搜索与查询向量最相似的 …