RAG 知识库问答效果差?先检查切块、召回和上下文污染
发布时间:2026/6/9 9:56:20
分类:文化教育
浏览:1234

很多团队做 RAG 知识库问答,第一版效果差时会立刻换模型、换向量数据库、换 embedding。其实大多数问题不在模型,而在文档切块、召回策略、上下文拼接和答案校验。模型只是最后一环,前面任何一步做错,最后都会表现成“模型胡说”。如果你的知识库问答经常答非所问、找不到资料、引用错文档、或者回答看起来很自信但和原文不一致,先不要急着调 prompt。按下面这个流程查。先确认问题属于哪一类RAG 失败不是一种问题,而是一串问题。先分类,才能排查。表现可能原因答案完全无关召回错文档答案缺关键细节切块太粗或召回数量不够答案引用错来源chunk 元数据或引用拼接错答案编造内容prompt 没限制来源,或上下文不足答案重复啰嗦召回 chunk 重复,去重不足答案前后矛盾多版本文档混在一起不要只看最终回答。RAG 排查必须把中间结果打印出来:用户问题、召回 chunk、分数、来源、拼接后的上下文和最终回答。文档切块是第一道坑切块不是把文档按固定长度切开这么简单。切块方式决定模型能不能拿到完整语义。常见错误有:按固定字符数硬切,打断标题和段落;chunk 太大,召回后上下文噪声太多;chunk 太小,答案需要的信息被拆散;