我们准备加 PR 模板:AI 辅助、验证命令、风险点。
小
小陈在改bug
@小陈在改bug
-
AI 自动写代码,代码所有权怎么算 -
AI 自动写代码,代码所有权怎么算团队开始用代码 agent,PR 里有一半是 AI 写的。代码所有权怎么算?
-
让 AI 写 SQL,生产环境怎么加护栏这个好。确认的不是 SQL 文本,是动作说明。
-
让 AI 写 SQL,生产环境怎么加护栏想让 AI 帮运营写查询 SQL。只读库是不是就安全了?
-
历史截断把用户刚说的限制条件截没了我们先做状态槽位和最近两轮原文保留。
-
历史截断把用户刚说的限制条件截没了那历史截断策略要改成重要消息保留?
-
历史截断把用户刚说的限制条件截没了我们现在就是从头开始丢,直到 token 够。
-
历史截断把用户刚说的限制条件截没了我们聊天助手最近有个问题,用户前面说“只看上海政策”,后面追问“那报销呢”,模型回答成全国政策。看日志发现历史被截断了。
-
执行日志给谁看,决定怎么写明白。用户态时间线、审计态操作记录、工程态 trace 分开。
-
执行日志给谁看,决定怎么写Agent 执行日志应该展示给用户吗?我们产品想做“工作过程透明”,但我怕太啰嗦。
-
工具调用 schema 写太宽,模型就开始乱填我先把 priority 和 category 改 enum,再加后端校验。
-
工具调用 schema 写太宽,模型就开始乱填我们现在是模型填完就直接建单。
-
模型评测里“代码能力”到底测什么?从 git 历史里找真实修复 commit,回到修复前,让模型重做。这个比手写题真实。
-
工具调用 schema 写太宽,模型就开始乱填比如 priority,我写的是 string。
-
工具调用 schema 写太宽,模型就开始乱填我们有个创建工单工具,参数 schema 写得比较宽,结果模型经常把用户描述塞到不该塞的字段里。
-
DeepSeek 推理模型适不适合所有问题都开?还有一点,复杂问题可能需要工具,不只是推理。能查数据库比脑补聪明。
-
Claude 和 GPT 做长任务,怎么避免中途跑偏?这就是范围边界没锁。工具层面也能限制可写路径。
-
模型评测里“代码能力”到底测什么?测能不能改旧代码。算法题像面试,生产任务像接手同事留下的项目。
-
模型评测集别只抄公开榜单代码模型评测要跑测试。光让模型解释算法,和能改你们的老项目,不是一回事。
-
Claude 和 GPT 做长任务,怎么避免中途跑偏?代码任务尤其要限制范围。模型看到顺手能改的东西,会忍不住“清理一下”。