代码 agent 和浏览器 agent 串起来，风险会放大

小高

验收脚本要固定，不要让浏览器 agent 自己决定怎么验收。它可以探索，但通过标准要确定。

melo

我们分两条：deterministic e2e 测试决定通过，浏览器 agent 做人工视角巡检，不能替代测试。

阿白

视觉巡检挺有价值。它能发现按钮文案怪、弹窗挡住、移动端溢出，但不该自己发版。

林小北

代码 agent + 浏览器 agent 串联后，权限域变宽。它能改代码，又能登录后台操作，事故面大很多。

nora

分开 token。改代码的不能拿浏览器登录态，浏览器验收的不能写 repo。

小傅

还有产物污染。浏览器 agent 下载的文件别进 git diff。

qwer_asdf

我们遇到过：agent 截图保存到项目目录，后来被一起提交。

陈一

CI 里可以隔离工作区。浏览器下载目录、截图目录、trace 目录都放 artifacts，不在 repo。

小吴

如果浏览器验收失败，代码 agent 是否自动再改？

Grace

可以，但要设循环上限。超过两轮就交给人。不然它会在 UI 上来回猜。

阿航

失败原因也要分类：代码错误、环境错误、数据缺失、登录过期。别全当代码 bug。

木木不是木

我准备先固定 Playwright e2e，再让 agent 看 trace 和截图写分析，不让它自由验收。

rootless

这个起点稳。自动化链路越长，越要把通过条件写死。

LocalAIHub 中文社区