LocalAIHub 中文社区

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

MoE 模型是不是天然更适合企业部署

AI 工程讨论

15 帖子 12 发布者 193 浏览 1 关注中

小离线
小离线
小谢

写于

#1

最近很多模型都在说 MoE。是不是 MoE 参数大但激活少，所以企业部署更划算？
1 条回复最后回复

0
阿离线
阿离线
阿白

写于

#2

别直接等号。MoE 的推理成本和显存、路由、并发、框架支持都有关系。
1 条回复最后回复

0
陈离线
陈离线
陈一

写于

#3

“总参数大、激活参数少”是真的方向，但落到部署要看具体模型和后端支持。
1 条回复最后回复

0
小离线
小离线
小谢

写于

#4

那它不是一定比 dense 快？
1 条回复最后回复

0
林离线
林离线
林小北

写于

#5

不一定。小并发、框架没优化、通信开销、显存放不下，都会让结果不理想。
1 条回复最后回复

0
M 离线
M 离线
melo

写于

#6

企业部署先看任务质量和稳定性，再看成本。模型架构不是采购理由。
1 条回复最后回复

0
普离线
普离线
普通网友A

写于

#7

MoE 会不会回答风格不稳定？
1 条回复最后回复

0
N 离线
N 离线
nora

写于

#8

风格稳定更多和训练、对齐、采样、提示词有关。不能只怪 MoE。
1 条回复最后回复

0
小离线
小离线
小满

写于

#9

我觉得 MoE 最大误区是“听起来省钱”。实际你还要能把它服务起来。
1 条回复最后回复

0
阿离线
阿离线
阿航

写于

#10

对。一个模型在论文或榜单上强，不代表你们那台机器上能稳定跑。
1 条回复最后回复

0
小离线
小离线
小吴

写于

#11

如果要测，就拿同一批业务样例跑：延迟、吞吐、显存、错误率、格式稳定性。
1 条回复最后回复

0
小离线
小离线
小谢

写于

#12

所以还是回到评测集。
1 条回复最后回复

0
G 离线
G 离线
Grace

写于

#13

几乎所有模型选择问题最后都会回到评测集。
1 条回复最后回复

0
R 离线
R 离线
ray_work

写于

#14

还有许可证和生态。企业不是只买一次模型文件，后面要升级、回滚、排障。
1 条回复最后回复

0
小离线
小离线
小谢

写于

#15

明白。MoE 是候选，不是答案。
1 条回复最后回复

0

你好！看起来您对这段对话很感兴趣，但您还没有一个账号。

厌倦了每次访问都刷到同样的帖子？您注册账号后，您每次返回时都能精准定位到您上次浏览的位置，并可选择接收新回复通知（通过邮件或推送通知）。您还能收藏书签、为帖子顶，向社区成员表达您的欣赏。

有了你的建议，这篇帖子会更精彩哦 💗