LocalAIHub 中文社区

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

葡

葡萄冰

@葡萄冰

关注

0

帖子

最新最佳有争议的

WebSocket 断了以后，页面还以为自己在线

葡葡萄冰

补配置后挂了半小时，通知正常了。

实践复盘 websocket nginx realtime
WebSocket 断了以后，页面还以为自己在线

葡葡萄冰

我们单实例，先补内层 Nginx。

实践复盘 websocket nginx realtime
WebSocket 断了以后，页面还以为自己在线

葡葡萄冰

我外层 Nginx 配了 upgrade，内层没有。

实践复盘 websocket nginx realtime
WebSocket 断了以后，页面还以为自己在线

葡葡萄冰

控制台有 websocket error，但页面没有明显提示。

实践复盘 websocket nginx realtime
WebSocket 断了以后，页面还以为自己在线

葡葡萄冰

NodeBB 页面能打开，但在线人数、通知、打字状态都不动。刷新后短暂正常，过几分钟又停。

实践复盘 websocket nginx realtime
选模型最后卡在“大家都说不错”，怎么做决策？

葡葡萄冰

还要让真实使用者参与。工程师觉得强，客服同事可能觉得语气奇怪。

AI 工程讨论 qwen deepseek llama gemma glm
RAG 片段太多，模型开始“平均所有观点”

葡葡萄冰

内部可以长，用户答案短。模型内部决策和用户可见文案分开。

AI 工程讨论 rag topk 上下文压缩证据冲突
Kimi、Claude、GPT 长上下文下，历史消息还要不要摘要？

葡葡萄冰

会，所以情绪要结构化保留，比如“用户对重复解释不耐烦”。必要时保留原句。

AI 工程讨论 kimi claude gpt 历史消息
上下文里放模型评测结果，会不会影响答案？

葡葡萄冰

前端最忌讳显示“置信度 0.72”“rerank_score”这种东西。用户看了只会困惑。

AI 工程讨论 prompt 模型偏见上下文污染
模型卡里的上下文长度，和实际可用长度不是一回事

葡葡萄冰

如果真实体验没测过，别这么写。可以写“支持长文档处理”，但验收要看准确率和延迟。

AI 工程讨论模型卡上下文长度长上下文
GPT/Claude 作为高价兜底，怎么定义“该升级”？

葡葡萄冰

一般不用。用户关心问题解决，不关心内部路由。除非产品定位就是多模型透明。

AI 工程讨论 gpt claude 成本控制置信度
中文能力评测，不要只看古诗和成语

葡葡萄冰

最后别忘人工盲评，去掉模型名。品牌滤镜会影响判断。

AI 工程讨论中文能力 qwen glm kimi gpt
上下文压缩用模型摘要，错了怎么办？

葡葡萄冰

不建议直接暴露内部摘要。可以在需要确认时用面向用户的话：“我理解你要修改收件地址，对吗？”

AI 工程讨论上下文压缩事实校验
GLM 做企业材料写作，怎么避免全是公文味？

葡葡萄冰

用户邮件里最烦的是“已为您反馈相关部门”。如果没有真实动作，别让模型写。

AI 工程讨论 glm 中文写作企业文档风格控制
模型路由别把用户问题切碎到失真

葡葡萄冰

内部日志可以有，前端不要显示。用户只需要看到解决问题的答复。

AI 工程讨论小模型大模型任务拆分
Token 成本控制，别等账单出来才优化

葡葡萄冰

我们还做了“无答案短路”。检索分数太低，先澄清或说资料不足，不让模型长篇猜。

AI 工程讨论 token prompt caching 小模型
Kimi 长文阅读强，但知识库问答仍要权限过滤

葡葡萄冰

但引用太多会不会用户烦？

AI 工程讨论 kimi 长上下文 rag 知识库
中文能力评测，不要只看古诗和成语

葡葡萄冰

我们测客服中文，会放“你们这破系统又扣我钱了”这种句子，看模型能不能既不顶嘴也不乱承诺。

AI 工程讨论中文能力 qwen glm kimi gpt
历史消息截断后，模型忘了用户已经给过的信息

葡葡萄冰

前端也能帮一点，用户已填写信息放在表单态，不要都混在聊天里。

AI 工程讨论历史消息多轮对话
Token 预算怎么拆，别让系统提示被业务内容挤掉

葡葡萄冰

面向用户别说 token。可以说“我会基于当前问题和关键记录回答”。内部日志再记压缩比例。

AI 工程讨论 token预算系统提示成本控制