Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
Agent 执行日志应该展示给用户吗?我们产品想做“工作过程透明”,但我怕太啰嗦。
分三层:用户看进度,人看审计,工程看调试。别把同一份日志给所有人。
用户不需要看 token、tool_call_id、raw JSON。看“正在读取政策文档”“已找到 3 个相关条款”就够。
审计层要能追责:谁发起、用了什么工具、读了哪些资源、写了什么外部系统。
工程层才需要原始错误、请求耗时、重试次数、trace id。
但生产 UI 里别出现“trace id”。可以有“复制诊断信息”按钮,点开给支持人员。
执行日志还有一个作用:约束 agent。它知道每一步会被记录,就更适合做高风险操作。
这个说法别神化。日志不是心理威慑,是后验检查和失败复盘材料。
我们给每个工具调用记录输入摘要,不记录完整输入。比如“读取 12 个文档”,不把文档全文打进日志。
敏感字段必须结构化脱敏。不要靠模型自觉别写。
长任务里,用户看到每一步太累。我更喜欢里程碑进度:已收集、正在核对、等待确认、完成。
失败时要写人能理解的下一步。比如“浏览器登录已过期,需要重新授权”,比“tool timeout”强。
还有成本日志。内部看每次任务花了多少模型调用和浏览器步骤,方便判断值不值得自动化。
明白。用户态时间线、审计态操作记录、工程态 trace 分开。
对。透明不是把底层噪音倒出来,是让人知道它在干什么、能不能信。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗