Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
对,工程成本也算成本。若 Llama 中文评测能过,没必要为了潮流换。
但评测要覆盖真实中文输入,包括错字、口语、半句、地区表达。不要拿标准普通话样本糊弄自己。
还有 token 效率。中文 token 数更高时,同样上下文窗口装的信息会少,账单也变。
如果产品里英文资料很多,最终回答中文,可以让模型先读英文再中文解释。这个场景 Llama 未必差。
多模型会不会增加一致性问题?同一个问题不同模型回答口径不同。
会,所以要把业务口径放在知识和规则层,不要寄托在模型记忆。路由后也要统一输出检查。
我们先做中文用户评测。如果 Llama 过不了口吻和术语,再引入 Qwen 做中文主路由。
合理。已有基础设施是优势,但用户体验是验收。
记得让真实客服同事盲评,他们最能看出“像不像人话”。
还有客户别看到中英混杂。这个要单独测。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗