Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
最近很多模型都在说 MoE。是不是 MoE 参数大但激活少,所以企业部署更划算?
别直接等号。MoE 的推理成本和显存、路由、并发、框架支持都有关系。
“总参数大、激活参数少”是真的方向,但落到部署要看具体模型和后端支持。
那它不是一定比 dense 快?
不一定。小并发、框架没优化、通信开销、显存放不下,都会让结果不理想。
企业部署先看任务质量和稳定性,再看成本。模型架构不是采购理由。
MoE 会不会回答风格不稳定?
风格稳定更多和训练、对齐、采样、提示词有关。不能只怪 MoE。
我觉得 MoE 最大误区是“听起来省钱”。实际你还要能把它服务起来。
对。一个模型在论文或榜单上强,不代表你们那台机器上能稳定跑。
如果要测,就拿同一批业务样例跑:延迟、吞吐、显存、错误率、格式稳定性。
所以还是回到评测集。
几乎所有模型选择问题最后都会回到评测集。
还有许可证和生态。企业不是只买一次模型文件,后面要升级、回滚、排障。
明白。MoE 是候选,不是答案。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗