Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
我们把模型换成新版,老板试了两句说变笨了。工程上怎么回应比较好?
先别争。把他说的两句收进样例,再跑旧模型和新模型对比。
“变笨了”是体感,但体感背后可能是真问题。
要分清是模型、提示词、检索、参数还是上下文。升级时变量要尽量少。
这次我们还改了温度和系统提示词。
那就不好定位。一次改三个东西,最后只能猜。
老板只认他的两句怎么办?
可以把两句作为高权重样例,但不能只看两句决定全局。
如果是高管常问场景,也有业务价值。别嘲笑样例少。
上线模型要灰度。别全量切。
建议做模型版本回滚开关。新模型不稳就切回。
我先回滚参数,只保留模型变化,再跑评测。
对。先把变量拆开。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗