Day6:微调 vs RAG 场景区分(面试高频)

发布时间:2026/6/5 20:19:20
Day6:微调 vs RAG 场景区分(面试高频)
Day5微调 vs RAG 场景区分面试高频一、先明确两个核心概念1. 微调Fine-tuning就是我们前面学的 SFT / LoRA核心逻辑是用标注数据训练模型参数把知识 / 风格 “刻进模型里”训练后模型自带该能力不用每次额外输入2. RAGRetrieval-Augmented Generation检索增强生成核心逻辑是不改动模型本身额外加一个 “知识库检索” 环节提问时先从外部知识库检索相关内容再把检索结果 问题一起喂给模型让模型基于检索到的信息回答二、核心区别对比面试必背表格表格对比维度微调Fine-tuningRAG检索增强生成核心逻辑训练模型参数让模型 “学会”不改动模型给模型 “查资料”数据依赖需要高质量标注数据只需要结构化 / 非结构化知识库无需标注硬件成本高需要显卡算力低普通服务器就能跑更新成本高数据 / 业务变更后要重新训练低直接更新知识库即可知识准确性依赖训练数据过时知识会误导依赖检索结果信息可实时更新长上下文支持受模型上下文窗口限制可通过分块 检索突破窗口限制典型场景固定话术、风格对齐、轻量领域知识实时信息查询、大知识库问答、需要溯源三、通俗场景类比超好懂微调就像给学生上课把知识点教进他脑子里之后他遇到相关问题就能直接答。RAG就像开卷考试学生本身不变做题时给他一本参考资料他照着资料回答。四、面试高频场景题该选微调还是 RAG✅ 优先选 微调 的场景对话风格、语气、固定话术统一比如客服固定回复模板轻量、稳定的领域知识如固定产品参数、企业内部流程数据量不大、长期稳定不变的业务需要模型 “天生自带” 某种能力不想每次都检索✅ 优先选 RAG 的场景知识需要频繁更新如实时新闻、政策、最新数据知识库体量很大如企业百万级文档、行业百科需要回答可溯源用户要求看到引用的原文出处数据质量参差不齐无法做高质量标注五、组合使用工业界主流方案实际项目中两者常结合使用用微调统一模型的输出风格、格式、话术用RAG补充最新、最详细的业务知识最终实现风格统一 内容准确 信息可溯源