Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
UI 上有环境标识吗?
有,但在顶部小角落。截图里其实能看到 staging。
人也会错,只是 agent 错得更快。发外部群之前应该有确认页,显示来源环境和接收方。
消息发送工具必须高风险。让 agent 生成草稿可以,真正发送要人点确认。
还有工具层禁止 staging 数据流向外部渠道。不要指望模型识别“这个不能发”。
我们做了 data_classification:测试、内部、客户可见。发送工具只接受客户可见材料。
日志里有完整截图吗?注意二次泄漏。
这个也中招了。事故复盘文档里贴了原图,后来才打码。
复盘要改三层:环境隔离、发送确认、日志脱敏。只改 prompt 没用。
Prompt 可以补一句“发送前确认环境”,但只能当最后一层提醒。
还有演练。拿 staging 故意做相似页面,看 agent 会不会拦住。
我们现在外发动作全改成人审,agent 只生成草稿和证据清单。
这个改法对。事故不是为了证明 agent 不行,是为了把不可逆动作收回来。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗