RAG:17种优化策略
RAG的17种优化策略主要分为文档分块优化、检索排序优化、反馈与自适应优化三大类以下是完整17种策略汇总及核心特点一、文档分块优化5种这类优化聚焦于优化知识表示提升后续检索精准性Simple RAG基础分块原理将原始文档按固定字符数/长度硬切分切分后直接进行向量化和Top-K检索是所有RAG策略的基础起点特点实现简单技术成本低响应速度快但易割裂语义连续性检索精度低GPT评分为0.3分Semantic Chunking语义切分原理通过句法树/NLP模型动态切割文本合并高相似度相邻句子保证每个块都是完整语义单元特点保留语义完整性技术成本低响应速度快但仍存在小块上下文丢失问题检索精度中等GPT评分为0.5分Context Enriched Retrieval上下文增强原理找到目标相关块后同步召回其前后相邻段落组成更大的上下文块避免信息断裂特点轻量化解决信息不完整问题帮助模型理解完整语义技术成本低检索精度中等GPT评分为0.6分Contextual Chunk Headers块标题增强原理对切分后的大段文本调用大模型生成概括性块标题向量化时将标题文本共同编码检索时同时计算标题和文本与查询的相似度特点增强全局信息感知更精准评估相关性技术成本低检索精度中等GPT评分为0.5分Document Augmentation文档增强原理将每个文本块转化为一组覆盖核心内容的问题分别存储文本和问题的向量检索时综合计算查询与文本、问题的相似度特点匹配精度高能弥补语义鸿沟即使原文未出现关键词也能命中检索精度高GPT评分为0.8分二、检索排序优化4种这类优化聚焦于提升召回和排序的精准性降低噪音干扰Query Transformation查询转换原理对用户原始口语化查询进行改写优化包含查询重写、回溯扩展、子查询分解三种常见方式适配多样化提问场景特点处理模糊/复杂意图提升整体召回率交互式场景实用性高技术成本中等检索精度中等GPT评分为0.5分Re-ranker重排序原理先通过向量快速粗召回Top-K结果再用Cross-Encoder等模型对结果二次语义打分排序特点消除相似不相关噪音大幅提升结果相关性是当前RAG系统最常用的核心组件之一技术成本中等检索精度高GPT评分为0.7分RSE相关片段提取原理在已经检索到的长段落中通过BERT指针网络定位提取和查询最相关的关键片段特点处理复杂跨段落信息表现优异适合法律文书、科研论文等深度理解场景技术成本中等检索精度高GPT评分为0.8分Contextual Compression上下文压缩原理调用LLM过滤掉检索结果中的无关信息仅保留核心有用内容精炼上下文特点降低token消耗减少无关信息对答案生成的干扰技术成本中等检索精度高GPT评分为0.75分三、反馈与自适应优化8种这类优化聚焦于后处理与动态迭代实现RAG系统的持续进化Small-to-Big Retrieval小块查大块答原理切分文档为父子块小块用于检索计算相似度最终输入大模型生成回答时使用完整的父块特点兼顾检索精准性和上下文完整性在准确性和完整性之间取得较好平衡检索精度高GPT评分为0.85分Feedback Loop反馈闭环原理收集用户点击、满意度等反馈数据用于迭代训练排序模型优化检索结果排序特点让系统持续适应用户真实查询习惯适合智能客服等高频交互场景Adaptive RAG自适应路由原理根据问题类型、复杂度动态选择匹配的检索策略而非所有查询采用统一流程特点平衡精度和效率避免不必要的计算开销Self RAG自我决策原理让大模型自主判断当前问题是否需要外部检索不需要则直接回答需要再启动检索流程特点减少不必要检索提升响应效率同时降低无关检索引入的错误Knowledge Graph RAG知识图谱融合原理将文档解析为实体三元组构建知识图谱检索时结合图谱推理补充关联信息特点适合处理需要多实体关联推理的复杂问题提升答案逻辑性Hierarchical Indices多级索引原理构建文档树形分层索引先粗检索定位文档/章节再细粒度检索具体内容特点适配大规模长文档场景分层检索提升检索效率减少无效计算HyDE假设文档嵌入原理先让大模型生成一个针对查询的理想答案再用这个理想答案反向检索知识库中匹配的支撑材料特点解决碎片化文档检索难题提升语义匹配精准性RAG Fusion原理对查询进行多版本改写分别检索后对多个检索结果进行融合重排序提升相关片段召回率特点扩大检索覆盖面降低单轮检索漏检概率适合复杂开放问题