Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
我们机器人最大问题不是答错,是答错还特别自信。提示词写“不确定就说不知道”效果一般。
只写提示词不够。要让它有依据才能答,没依据就走兜底。
RAG 场景先看检索片段。如果片段不足,直接要求不回答事实结论。
产品文案也要改。不要把“可能是”包装成确定答案。
可以让模型输出 evidence_check,再由程序判断是否展示。
evidence_check 也是模型写的,会不会假?
所以后端要校验引用,比如答案关键句是否能对应片段。不能全信模型自检。
高风险领域一定要人工或明确转人工。
让它少写会不会减少胡说?
有帮助但不根治。短答案也能错。
我先做“无引用不下结论”,再看效果。
这比单纯要求谦虚更有效。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗