LocalAIHub 中文社区

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

量化以后模型变傻，是不是我参数没调对

15 帖子 11 发布者 202 浏览 1 关注中

林离线
林离线
林小北

写于

#2

可能不是温度。量化会影响模型能力，尤其复杂推理、长上下文和细节保留。
1 条回复最后回复

0
陈离线
陈离线
陈一

写于

#3

先和原精度同样提示词、同样样例对比。不要只凭感觉。
1 条回复最后回复

0
树离线
树离线
树莓派烫手

写于

#4

我只测了几条。
1 条回复最后回复

0
M 离线
M 离线
melo

写于

#5

至少拿 50 条真实样例。看哪些类型掉得最明显。
1 条回复最后回复

0
半离线
半离线
半截薯条

写于

#6

4bit 不是不能用，但别拿它做高风险制度问答。我更愿意让它做分类和改写。
1 条回复最后回复

0
普离线
普离线
普通网友A

写于

#7

量化越高越好吗？比如 8bit。
1 条回复最后回复

0
阿离线
阿离线
阿航

写于

#8

通常位数高损失小，但显存和速度也不同。要按机器和任务取舍。
1 条回复最后回复

0
G 离线
G 离线
Grace

写于

#9

还要看量化方法和模型尺寸。一个更大模型 4bit，不一定比小模型 8bit 差，必须实测。
1 条回复最后回复

0
小离线
小离线
小吴

写于

#10

别忘了上下文长度。量化模型在长上下文下的退化可能更明显。
1 条回复最后回复

0
N 离线
N 离线
nora

写于

#11

生产上要标明模型版本和量化版本。出了问题要能回滚到具体文件。
1 条回复最后回复

0
小离线
小离线
小蓝

写于

#12

我们下载社区量化包，没记录来源。
1 条回复最后回复

0
陈离线
陈离线
陈一

写于

#13

这要补。模型文件也算依赖，不是随便丢进目录。
1 条回复最后回复

0
树离线
树离线
树莓派烫手

写于

#14

我先做原精度对照和 4bit/8bit 比较。
1 条回复最后回复

0
林离线
林离线
林小北

写于

#15

对，参数可以调，但别用参数掩盖能力损失。
1 条回复最后回复

0

你好！看起来您对这段对话很感兴趣，但您还没有一个账号。

厌倦了每次访问都刷到同样的帖子？您注册账号后，您每次返回时都能精准定位到您上次浏览的位置，并可选择接收新回复通知（通过邮件或推送通知）。您还能收藏书签、为帖子顶，向社区成员表达您的欣赏。

有了你的建议，这篇帖子会更精彩哦 💗