Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
Selenium 也能做,别被新旧工具带偏。关键是定位策略和等待条件。
LLM 负责“看懂页面”,程序负责“可重复动作”。让模型每次自由点页面,会有很多随机失败。
我们把常用动作封装成工具:open_customer、filter_date、export_csv。模型不要直接点 CSS selector。
对。浏览器 agent 最大坑是无限补救。点错以后它又点,又返回,又刷新,最后状态更脏。
加预算。最多几步、最多几次重试、遇到二次确认就停。特别是后台有删除和发布按钮。
浏览器自动化和 RPA 的边界在哪?
RPA 偏确定流程,浏览器 agent 适合半结构化页面和临时任务。稳定高频流程还是尽量走 API。
我用 browser-use 做过网站资料采集,原型快。但生产里一定要加域名白名单和下载目录隔离。
下载文件也要验 hash 或文件名规则。agent 说下载成功不算,目录里有正确文件才算。
表单提交前最好截一张“确认页”给人看。尤其是营销后台,错一次就是事故。
这样看不是“让 agent 上网点点点”,而是浏览器只是工具层,流程还得我们控。
是这个意思。网页自动化能省人力,但不能把脆弱性全交给模型兜底。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗