Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
那模型不知道新旧。把 source title、status、updated_at 放进去,并明确优先级。
只放进去还不够。检索层也要过滤,比如 status=published,effective_date <= now。
我见过两个文件标题一样,一个是 2022,一个是 2025,模型直接混合回答。
用更强模型能解决吗?
能缓解一点,不能替代数据清理。强模型也会被坏上下文带偏。
还有系统提示污染。开发测试时塞的“示例答案”忘了删,线上模型会照着学。
我们有 few-shot 示例,可能有旧口径。
示例也要版本化。业务规则变了,few-shot 不更新,比没示例更危险。
权限污染也要小心。A 部门资料被塞进 B 用户上下文,模型不一定主动拒绝。
所以先清文档状态,再改检索过滤,再审 prompt 示例。
对,别先调温度。温度不是清洁剂。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗