跳转至内容
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
LocalAIHub 中文社区

LocalAIHub 中文社区

葡

葡萄冰

@葡萄冰
取消关注 关注
关于
帖子
21
主题
1
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • WebSocket 断了以后,页面还以为自己在线
    葡 葡萄冰

    补配置后挂了半小时,通知正常了。

    实践复盘 websocket nginx realtime

  • WebSocket 断了以后,页面还以为自己在线
    葡 葡萄冰

    我们单实例,先补内层 Nginx。

    实践复盘 websocket nginx realtime

  • WebSocket 断了以后,页面还以为自己在线
    葡 葡萄冰

    我外层 Nginx 配了 upgrade,内层没有。

    实践复盘 websocket nginx realtime

  • WebSocket 断了以后,页面还以为自己在线
    葡 葡萄冰

    控制台有 websocket error,但页面没有明显提示。

    实践复盘 websocket nginx realtime

  • WebSocket 断了以后,页面还以为自己在线
    葡 葡萄冰

    NodeBB 页面能打开,但在线人数、通知、打字状态都不动。刷新后短暂正常,过几分钟又停。

    实践复盘 websocket nginx realtime

  • 选模型最后卡在“大家都说不错”,怎么做决策?
    葡 葡萄冰

    还要让真实使用者参与。工程师觉得强,客服同事可能觉得语气奇怪。

    AI 工程讨论 qwen deepseek llama gemma glm

  • RAG 片段太多,模型开始“平均所有观点”
    葡 葡萄冰

    内部可以长,用户答案短。模型内部决策和用户可见文案分开。

    AI 工程讨论 rag topk 上下文压缩 证据冲突

  • Kimi、Claude、GPT 长上下文下,历史消息还要不要摘要?
    葡 葡萄冰

    会,所以情绪要结构化保留,比如“用户对重复解释不耐烦”。必要时保留原句。

    AI 工程讨论 kimi claude gpt 历史消息

  • 上下文里放模型评测结果,会不会影响答案?
    葡 葡萄冰

    前端最忌讳显示“置信度 0.72”“rerank_score”这种东西。用户看了只会困惑。

    AI 工程讨论 prompt 模型偏见 上下文污染

  • 模型卡里的上下文长度,和实际可用长度不是一回事
    葡 葡萄冰

    如果真实体验没测过,别这么写。可以写“支持长文档处理”,但验收要看准确率和延迟。

    AI 工程讨论 模型卡 上下文长度 长上下文

  • GPT/Claude 作为高价兜底,怎么定义“该升级”?
    葡 葡萄冰

    一般不用。用户关心问题解决,不关心内部路由。除非产品定位就是多模型透明。

    AI 工程讨论 gpt claude 成本控制 置信度

  • 中文能力评测,不要只看古诗和成语
    葡 葡萄冰

    最后别忘人工盲评,去掉模型名。品牌滤镜会影响判断。

    AI 工程讨论 中文能力 qwen glm kimi gpt

  • 上下文压缩用模型摘要,错了怎么办?
    葡 葡萄冰

    不建议直接暴露内部摘要。可以在需要确认时用面向用户的话:“我理解你要修改收件地址,对吗?”

    AI 工程讨论 上下文压缩 事实校验

  • GLM 做企业材料写作,怎么避免全是公文味?
    葡 葡萄冰

    用户邮件里最烦的是“已为您反馈相关部门”。如果没有真实动作,别让模型写。

    AI 工程讨论 glm 中文写作 企业文档 风格控制

  • 模型路由别把用户问题切碎到失真
    葡 葡萄冰

    内部日志可以有,前端不要显示。用户只需要看到解决问题的答复。

    AI 工程讨论 小模型 大模型 任务拆分

  • Token 成本控制,别等账单出来才优化
    葡 葡萄冰

    我们还做了“无答案短路”。检索分数太低,先澄清或说资料不足,不让模型长篇猜。

    AI 工程讨论 token prompt caching 小模型

  • Kimi 长文阅读强,但知识库问答仍要权限过滤
    葡 葡萄冰

    但引用太多会不会用户烦?

    AI 工程讨论 kimi 长上下文 rag 知识库

  • 中文能力评测,不要只看古诗和成语
    葡 葡萄冰

    我们测客服中文,会放“你们这破系统又扣我钱了”这种句子,看模型能不能既不顶嘴也不乱承诺。

    AI 工程讨论 中文能力 qwen glm kimi gpt

  • 历史消息截断后,模型忘了用户已经给过的信息
    葡 葡萄冰

    前端也能帮一点,用户已填写信息放在表单态,不要都混在聊天里。

    AI 工程讨论 历史消息 多轮对话

  • Token 预算怎么拆,别让系统提示被业务内容挤掉
    葡 葡萄冰

    面向用户别说 token。可以说“我会基于当前问题和关键记录回答”。内部日志再记压缩比例。

    AI 工程讨论 token预算 系统提示 成本控制
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
Powered by NodeBB Contributors
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员