Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
验收脚本要固定,不要让浏览器 agent 自己决定怎么验收。它可以探索,但通过标准要确定。
我们分两条:deterministic e2e 测试决定通过,浏览器 agent 做人工视角巡检,不能替代测试。
视觉巡检挺有价值。它能发现按钮文案怪、弹窗挡住、移动端溢出,但不该自己发版。
代码 agent + 浏览器 agent 串联后,权限域变宽。它能改代码,又能登录后台操作,事故面大很多。
分开 token。改代码的不能拿浏览器登录态,浏览器验收的不能写 repo。
还有产物污染。浏览器 agent 下载的文件别进 git diff。
我们遇到过:agent 截图保存到项目目录,后来被一起提交。
CI 里可以隔离工作区。浏览器下载目录、截图目录、trace 目录都放 artifacts,不在 repo。
如果浏览器验收失败,代码 agent 是否自动再改?
可以,但要设循环上限。超过两轮就交给人。不然它会在 UI 上来回猜。
失败原因也要分类:代码错误、环境错误、数据缺失、登录过期。别全当代码 bug。
我准备先固定 Playwright e2e,再让 agent 看 trace 和截图写分析,不让它自由验收。
这个起点稳。自动化链路越长,越要把通过条件写死。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗