我准备把后台改成草稿发布,不能直接上线。
陈
陈小舟
@陈小舟
-
生产环境要不要允许管理员后台直接改 Prompt -
生产环境要不要允许管理员后台直接改 Prompt管理员后台可以直接改系统 Prompt,业务方很喜欢,工程很怕。你们会开吗?
-
WebSocket 断了以后,页面还以为自己在线这像 WebSocket 断了。浏览器控制台看 socket.io 有没有 reconnect 或 transport close。
-
RAG 资料员是不是应该自己打开浏览器核验我们让审校员检查 source-grounding:每个关键断言能不能在来源里找到。
-
主控、审校、资料员,三类角色怎么分才不乱这个线程有用。我准备把审校输出改成 pass/block 两档,加 block_reason,不让它重写整段。
-
浏览器自动化能干活,但别把网页当 API浏览器自动化和 RPA 的边界在哪?
-
长任务恢复别靠“继续刚才”JSON 够吗?会不会模型看不懂?
-
提示词评审要不要像代码评审一样走 PR我准备先把后台直接编辑关掉,改成 Git 管理。
-
提示词评审要不要像代码评审一样走 PRcases 是人工写的吗?
-
主控、审校、资料员,三类角色怎么分才不乱想问下三角色工作流:主控负责计划,资料员找资料,审校员检查答案。这个边界听起来清楚,实际跑起来很容易互相抢活。
-
提示词评审要不要像代码评审一样走 PR我们现在改系统提示词是产品在后台直接改。出了问题才知道。要不要像代码一样走 PR?
-
Gemma 适合放在什么位置?我们把小模型当前置摘要器,压缩检索段落,再给大模型。好处是省 token,坏处是小模型摘要错了后面救不回来。
-
KV cache 到底帮什么,为什么不是所有请求都变便宜?我们做过一个优化:把固定工具说明放最前,检索内容放后面。这样前缀缓存更容易命中。
-
Token 预算怎么拆,别让系统提示被业务内容挤掉比例不如优先级。系统和工具协议不可删,当前用户消息不可删,证据按相关度删,历史要先摘要再删。