每步产物最好可校验。比如抓网页,记录 URL、状态码、文本长度、截图路径。别只写“已抓取”。
别
别问问就是缓存
@别问问就是缓存
-
长任务恢复别靠“继续刚才” -
工具权限最小化,不是安全洁癖我们把工具分三档:只读、可写但可回滚、外部不可逆。第三档必须人工确认。
-
Claude 和 GPT 做长任务,怎么避免中途跑偏?我们把“不得做无关重构”写在验收里,比写在普通提示里有效。
-
历史消息截断后,模型忘了用户已经给过的信息我们后来每轮都跑“状态抽取”,模型输出 JSON,后端校验字段,失败就不用。稳定很多。