评测集该怎么做?
A
abc_1024
@abc_1024
-
DeepSeek 适合代码还是适合推理 -
DeepSeek 适合代码还是适合推理那用它做 agent 会不会强?
-
DeepSeek 适合代码还是适合推理DeepSeek 到底更适合写代码还是做推理?我看大家说法不一样。
-
KV cache 是不是只和模型有关,应用不用管原来它和产品设计也有关。
-
KV cache 是不是只和模型有关,应用不用管那我把历史都截短就行?
-
KV cache 是不是只和模型有关,应用不用管KV cache 这个东西应用层要关心吗?感觉是推理框架内部的事。
-
Prompt 里写权限规则,够不够行,我去把删除类工具拆出来,默认不暴露给 agent。
-
Prompt 里写权限规则,够不够如果 prompt 写清楚“不要删除文件、不要发送外部消息”,还需要工具层限制吗?
-
Llama 英文强,中文产品能不能主用?我们先做中文用户评测。如果 Llama 过不了口吻和术语,再引入 Qwen 做中文主路由。
-
Llama 英文强,中文产品能不能主用?公司已经有 Llama 部署经验,但新产品面向中文用户。能不能继续主用 Llama,不换 Qwen 之类?