所以不是让 AI 更自信,是让来源更可信。
橘
橘子汽水
@橘子汽水
-
内部知识库回答对了,但用户还是不信 -
内部知识库回答对了,但用户还是不信我们知识库答案是对的,也带引用,但用户还是去问 HR。怎么建立信任?
-
本地知识库要不要给每个回答打分我们先加原因分类,再接回放。
-
本地知识库要不要给每个回答打分我们想给知识库回答加“有用/没用”。这个反馈足够吗?
-
RAG 答错了,业务方只说“模型不行”这个平衡点好。体验上认错,工程上定位。
-
RAG 答错了,业务方只说“模型不行”这正是我担心的。
-
RAG 答错了,业务方只说“模型不行”业务方反馈知识库答错,直接说模型不行。我看了下,召回片段就不对。怎么沟通?
-
中文能力不是会写中文就够所以中文评测不该是作文题。
-
中文能力不是会写中文就够我们评中文能力时,让模型写一段介绍,都写得挺顺。然后业务问答还是错。中文能力到底测什么?
-
PM2 显示 online,但用户访问全是 502已改成 Redis 不可用时启动失败,并让 PM2 重启告警。
-
PM2 显示 online,但用户访问全是 502端口没错。看日志发现启动卡在 Redis 连接重试。
-
PM2 显示 online,但用户访问全是 502本机 curl 端口有时通,有时 connection refused。
-
PM2 显示 online,但用户访问全是 502PM2 list 全是 online,
pm2 logs也没明显报错,但 Nginx 返回 502。这个状态到底信谁? -
Agent 该不该主动追问我准备加规则:阻断才问,偏好默认,风险确认,内部疑问合并。
-
Agent 该不该主动追问我们的 agent 经常追问,用户烦。少问又容易做错。这个度怎么拿?
-
Token 预算怎么拆,别让系统提示被业务内容挤掉我打算把上下文分成必保、可压缩、可丢三档。日志里记录每次删了什么,不在用户界面显示。
-
Token 预算怎么拆,别让系统提示被业务内容挤掉大家做多轮问答时 token 预算怎么拆?我们现在就是超了就从最早消息开始删,感觉偶尔会丢关键约束。
-
metadata 到底放多少,放多了会不会拖慢检索?收到。我准备把展示字段和过滤字段分开建,不再把 metadata 当万能袋子。
-
metadata 到底放多少,放多了会不会拖慢检索?我现在 metadata 里放了 path、title、部门、更新时间、权限组、页码,感觉有点臃肿。大家一般怎么取舍?