失败复盘：agent 把测试环境数据发进客户群

林小北

UI 上有环境标识吗？

小潘同学

有，但在顶部小角落。截图里其实能看到 staging。

melo

人也会错，只是 agent 错得更快。发外部群之前应该有确认页，显示来源环境和接收方。

nora

消息发送工具必须高风险。让 agent 生成草稿可以，真正发送要人点确认。

陈一

还有工具层禁止 staging 数据流向外部渠道。不要指望模型识别“这个不能发”。

小吴

我们做了 data_classification：测试、内部、客户可见。发送工具只接受客户可见材料。

qwer_asdf

日志里有完整截图吗？注意二次泄漏。

小潘同学

这个也中招了。事故复盘文档里贴了原图，后来才打码。

Grace

复盘要改三层：环境隔离、发送确认、日志脱敏。只改 prompt 没用。

阿白

Prompt 可以补一句“发送前确认环境”，但只能当最后一层提醒。

小傅

还有演练。拿 staging 故意做相似页面，看 agent 会不会拦住。

小潘同学

我们现在外发动作全改成人审，agent 只生成草稿和证据清单。

林小北

这个改法对。事故不是为了证明 agent 不行，是为了把不可逆动作收回来。

LocalAIHub 中文社区