Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
资料员不要写结论,这是第一条。它最多给候选证据和缺口。
主控也别直接查所有东西,不然资料员成摆设。主控只决定查什么、何时停止、把什么交给审校。
审校员容易变成复读机,“答案基本正确”。我后来让审校员只输出阻断项,不输出润色建议。
对,审校员如果也能改答案,就变成第二个作者。生产里要么它打回,要么它给最小补丁,别一边评一边写。
我们设计成主控拥有最终回复权,审校只有 veto。这样线上责任比较清楚。
AutoGen 里 team 的概念很适合原型,但到生产还要加状态机。不然谁什么时候发言会变成 prompt 里的口头约定。
我遇到过资料员和审校员都调用浏览器,结果审校员为了复核又重新搜一遍,账单翻倍。
权限也要按角色切。资料员能访问公开文档,主控能读用户上下文,审校员只看候选答案和证据。越少越好。
如果资料员没查到,能不能自己推理补?
不建议。资料员没查到就标“未找到”。让主控决定是追问、降级回答,还是换工具。
还有交接字段别太多。我们从 12 个字段砍到 5 个,成功率反而高。字段太多,模型会填废话。
5 个够用:任务、已查来源、关键事实、冲突点、下一步建议。
这个线程有用。我准备把审校输出改成 pass/block 两档,加 block_reason,不让它重写整段。
记得做人工抽检。多 agent 的日志好看,不代表质量高,尤其是审校员很会说“无明显问题”。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗