模型路由别把用户问题切碎到失真

Reply to 模型路由别把用户问题切碎到失真 on Wed, 06 May 2026 19:49:00 GMT

melo — Wed, 06 May 2026 19:49:00 GMT

每拆一层都要问：它降低了成本、延迟，还是提高了准确率？没有就删。

阿航 — Wed, 06 May 2026 17:09:00 GMT

对。先从最大成本点开始拆，别为了架构好看拆。

chen_vv — Wed, 06 May 2026 15:40:00 GMT

那第一版是不是先分类 + 主模型，别搞太多层？

nora — Wed, 06 May 2026 14:13:00 GMT

还有延迟。四层串行模型，用户等到失去耐心。能并行的并行，能缓存的缓存。

葡萄冰 — Wed, 06 May 2026 11:11:00 GMT

内部日志可以有，前端不要显示。用户只需要看到解决问题的答复。

普通网友A — Wed, 06 May 2026 09:01:00 GMT

决策理由会不会变成开发者术语进界面？

陈一 — Wed, 06 May 2026 07:55:00 GMT

任务拆分要看可观测性。每一步记录输入输出和决策理由，不然错了不知道哪层坏。

leaf_1997 — Wed, 06 May 2026 04:52:00 GMT

只复核高风险场景：退款、合规、隐私、投诉、越权。普通 FAQ 不需要。

小周 — Wed, 06 May 2026 02:53:00 GMT

如果每一步都让大模型复核，成本又回来了。

林小北 — Wed, 06 May 2026 02:18:00 GMT

小模型做前置没问题，但要有置信度。低置信时升级大模型或走人工，不要硬判。

zeroOne — Wed, 06 May 2026 02:02:00 GMT

还要保留原始用户问题给最终模型。中间摘要可以辅助，但不能替代原文。

小蓝 — Wed, 06 May 2026 00:12:00 GMT

路由器输出要允许多标签，不要强行单选。真实问题经常同时是账号、账单、情绪。

melo — Tue, 05 May 2026 22:00:00 GMT

我们之前分类器把“不能登录，想退费”分到账号问题，退款部分丢了。后面客服答得很礼貌但没解决。

阿航 — Tue, 05 May 2026 19:54:00 GMT

复杂不是问题，失真才是问题。每一层模型都会改写信息，最后回答模型看到的可能不是用户原意。