LocalAIHub 中文社区

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

上下文里放模型评测结果，会不会影响答案？

AI 工程讨论

15 帖子 12 发布者 185 浏览 1 关注中

陈离线
陈离线
陈一

写于

#3

评测结果应该给路由系统和产品决策看，不该塞进回答上下文。
1 条回复最后回复

0
小离线
小离线
小满

写于

#4

我们曾经在 prompt 里写“你擅长严格遵守事实”，结果它确实更像严格，但错的时候更难看出来。
1 条回复最后回复

0
L 离线
L 离线
leaf_1997

写于

#5

提示可以要求引用证据、说明不确定，但不要给它虚假的身份和排名。
1 条回复最后回复

0
普离线
普离线
普通网友A

写于

#6

那写“如果不确定就说不知道”可以吗？
1 条回复最后回复

0
N 离线
N 离线
nora

写于

#7

可以，但要配合检索证据和拒答策略。单句提示挡不住所有幻觉。
1 条回复最后回复

0
Z 离线
Z 离线
zeroOne

写于

#8

上下文污染很隐蔽。你把模型评测、内部标签、调试字段塞进去，模型可能在用户答案里露出来。
1 条回复最后回复

0
葡离线
葡离线
葡萄冰

写于

#9

前端最忌讳显示“置信度 0.72”“rerank_score”这种东西。用户看了只会困惑。
1 条回复最后回复

0
R 离线
R 离线
rootless

写于

#10

内部元数据和用户可见内容要分层。模型需要的证据给模型，系统评分不一定给模型。
1 条回复最后回复

0
小离线
小离线
小周

写于

#11

如果让模型根据自己置信度决定升级呢？
1 条回复最后回复

0
阿离线
阿离线
阿航

写于

#12

可以参考，但不能只信自评。模型经常不知道自己错。用检索分、规则风险、用户反馈一起判断。
1 条回复最后回复

0
赵离线
赵离线
赵赵

写于

#13

明白，不把“评测第一名”写进系统提示。评测结果只用于路由和监控。
1 条回复最后回复

0
林离线
林离线
林小北

写于

#14

对。让模型做事，不要给它打鸡血。
1 条回复最后回复

0
陈离线
陈离线
陈一

写于

#15

真正增强答案的是证据和任务边界，不是夸它。
1 条回复最后回复

0

你好！看起来您对这段对话很感兴趣，但您还没有一个账号。

厌倦了每次访问都刷到同样的帖子？您注册账号后，您每次返回时都能精准定位到您上次浏览的位置，并可选择接收新回复通知（通过邮件或推送通知）。您还能收藏书签、为帖子顶，向社区成员表达您的欣赏。

有了你的建议，这篇帖子会更精彩哦 💗