我们准备把决议和待办单独存,不进自由摘要。
阿
阿宁
@阿宁
-
上下文摘要会不会把关键责任改没了 -
上下文摘要会不会把关键责任改没了长对话做摘要记忆时,模型把“待确认”总结成“已确认”。这个风险怎么控?
-
Postgres 没报错,NodeBB 发帖却越来越慢禁掉热门插件后发帖 900ms。Postgres 也回落了。
-
Postgres 没报错,NodeBB 发帖却越来越慢抓到了一个 8 秒查询,来自首页热门主题排序。
-
Postgres 没报错,NodeBB 发帖却越来越慢autovacuum 没动静,表膨胀我没看过。
-
Postgres 没报错,NodeBB 发帖却越来越慢pg_stat_activity里有很多 active,query 都是 topics 和 posts。 -
Postgres 没报错,NodeBB 发帖却越来越慢发帖从 1 秒变成 10 秒,NodeBB 日志没有异常。Postgres CPU 只有 20%,是不是数据库可以排除?
-
AI 教育产品里,模型讲得很顺不代表学生学会了还有安全边界。低龄学生不能让模型随便扩展到不合适内容。
-
企业知识库到底要不要强制引用来源我们做过一个妥协:普通总结不强制引用;问“制度怎么规定”“能不能报销”“谁审批”这种,必须引用。
-
让 agent 控制本地电脑,先想清楚撤销先从可回滚的小动作开始,别一上来“帮我清理电脑”。
-
让 agent 控制本地电脑,先想清楚撤销文件整理先做预览。移动、重命名、删除都要有清单和撤销脚本。
-
工具调用失败,agent 应该重试几次幂等读操作可以指数退避。写操作要 operation_id,先查状态再重试。
-
长任务恢复别靠“继续刚才”不是给模型自由看懂,是程序读状态,决定下次给模型什么上下文。
-
失败复盘:agent 把测试环境数据发进客户群先说结论,这不是模型笨,是权限和环境隔离没做好。
-
长任务恢复别靠“继续刚才”我们自己做得很土:每个阶段落一个 JSON,里面写阶段状态和文件列表。断了从最后一个 completed 阶段开始。
-
失败样例要不要公开给全团队看我准备先建一个脱敏库,每周挑 10 条复盘。
-
工具权限最小化,不是安全洁癖最小权限不是只防黑客,也防模型误用工具。尤其文件系统、浏览器登录态、发消息、下单这种。
-
失败样例要不要公开给全团队看对,这也是我担心的。
-
RAG 片段太多,模型开始“平均所有观点”我们现在每个答案保留引用 chunk id,客服主管能点回原文。问题定位快很多。
-
失败样例要不要公开给全团队看我们收集了一批机器人失败样例,产品想只在小群里看。我觉得应该公开给研发、运营、业务一起看。