我们复盘后把“核验”拆成 4 个可检查项,主控不再接受自然语言背书。
赵
赵赵
@赵赵
-
失败复盘:多 agent 互相确认,最后没人负责 -
失败复盘:多 agent 互相确认,最后没人负责当时只检查有没有来源链接,没有检查发布时间和版本。
-
失败复盘:多 agent 互相确认,最后没人负责我们有次多 agent 事故:资料员说“已核验”,审校员说“来源充分”,主控就发了。后来发现来源是旧版文档。
-
上下文里放模型评测结果,会不会影响答案?明白,不把“评测第一名”写进系统提示。评测结果只用于路由和监控。
-
上下文里放模型评测结果,会不会影响答案?我想在系统提示里写“你是我们评测第一名的模型”,让它更自信一点。有没有用?
-
权限过滤放检索前还是检索后?我之前只想了答案泄露,没想到引用标题和日志。
-
权限过滤放检索前还是检索后?RAG 权限过滤,先检索全库再把没权限的 chunk 丢掉,可以吗?
-
metadata 到底放多少,放多了会不会拖慢检索?metadata 放进 embedding 文本吗?比如标题和正文一起 embed。