补配置后挂了半小时,通知正常了。
葡
葡萄冰
@葡萄冰
-
WebSocket 断了以后,页面还以为自己在线 -
WebSocket 断了以后,页面还以为自己在线我们单实例,先补内层 Nginx。
-
WebSocket 断了以后,页面还以为自己在线我外层 Nginx 配了 upgrade,内层没有。
-
WebSocket 断了以后,页面还以为自己在线控制台有
websocket error,但页面没有明显提示。 -
WebSocket 断了以后,页面还以为自己在线NodeBB 页面能打开,但在线人数、通知、打字状态都不动。刷新后短暂正常,过几分钟又停。
-
选模型最后卡在“大家都说不错”,怎么做决策?还要让真实使用者参与。工程师觉得强,客服同事可能觉得语气奇怪。
-
RAG 片段太多,模型开始“平均所有观点”内部可以长,用户答案短。模型内部决策和用户可见文案分开。
-
Kimi、Claude、GPT 长上下文下,历史消息还要不要摘要?会,所以情绪要结构化保留,比如“用户对重复解释不耐烦”。必要时保留原句。
-
上下文里放模型评测结果,会不会影响答案?前端最忌讳显示“置信度 0.72”“rerank_score”这种东西。用户看了只会困惑。
-
模型卡里的上下文长度,和实际可用长度不是一回事如果真实体验没测过,别这么写。可以写“支持长文档处理”,但验收要看准确率和延迟。
-
GPT/Claude 作为高价兜底,怎么定义“该升级”?一般不用。用户关心问题解决,不关心内部路由。除非产品定位就是多模型透明。
-
中文能力评测,不要只看古诗和成语最后别忘人工盲评,去掉模型名。品牌滤镜会影响判断。
-
上下文压缩用模型摘要,错了怎么办?不建议直接暴露内部摘要。可以在需要确认时用面向用户的话:“我理解你要修改收件地址,对吗?”
-
GLM 做企业材料写作,怎么避免全是公文味?用户邮件里最烦的是“已为您反馈相关部门”。如果没有真实动作,别让模型写。
-
模型路由别把用户问题切碎到失真内部日志可以有,前端不要显示。用户只需要看到解决问题的答复。
-
Token 成本控制,别等账单出来才优化我们还做了“无答案短路”。检索分数太低,先澄清或说资料不足,不让模型长篇猜。
-
Kimi 长文阅读强,但知识库问答仍要权限过滤但引用太多会不会用户烦?
-
中文能力评测,不要只看古诗和成语我们测客服中文,会放“你们这破系统又扣我钱了”这种句子,看模型能不能既不顶嘴也不乱承诺。
-
历史消息截断后,模型忘了用户已经给过的信息前端也能帮一点,用户已填写信息放在表单态,不要都混在聊天里。
-
Token 预算怎么拆,别让系统提示被业务内容挤掉面向用户别说 token。可以说“我会基于当前问题和关键记录回答”。内部日志再记压缩比例。