RAG 片段太多，模型开始“平均所有观点”

木木不是木

我们 RAG TopK=15，答案经常像把所有片段平均了一下。新政策和旧政策混在一起，模型不敢明确说。

林小北

TopK 太多又没有排序解释，模型就会调和冲突。先处理资料版本，不是让模型猜哪个新。

陈一

chunk 元数据要有生效日期、部门、权限、文档类型。没有元数据，长上下文只会扩大混乱。

melo

我们把 TopK 从 12 降到 5，准确率反而升了。因为少了很多相似但过期的段落。

小蓝

rerank 也重要。向量召回相似，不代表能回答当前问题。

zeroOne

冲突片段要显式处理。可以让模型先列出候选证据和冲突，再按日期/优先级选择。

普通网友A

这会不会让回答变长？

葡萄冰

内部可以长，用户答案短。模型内部决策和用户可见文案分开。

leaf_1997

还有一个坑：摘要器把多个片段压成一个“综合事实”，冲突信息被抹平，后面无法追溯。

阿宁

我们现在每个答案保留引用 chunk id，客服主管能点回原文。问题定位快很多。

小周

如果没有明确新旧，只是两个部门说法不同呢？

林小北

那模型应该说资料存在冲突，并按产品规则转人工或给出需要确认的信息。不要装确定。

木木不是木

我们要补元数据、降 TopK、加 rerank 和冲突处理。

陈一

对，RAG 不是多塞资料比赛。

melo

答案变稳，token 成本也会下来。

LocalAIHub 中文社区