LocalAIHub 中文社区

mxm

MCP 里 tools/resources/roots 分开设计，就是提醒你工具和可访问范围不是一回事。能调用 read_file，不代表能读整个磁盘。

mxm

还要测“不会过度重构”。模型很容易把一个小 bug 改成架构升级。

mxm

记得做混淆矩阵。分类模型最怕“看起来都差不多”。

mxm

我用 Gemma 做过英文 issue 分类，效果可以，输出短标签很稳。中文长文生成不是它最舒服的场景。

mxm

vLLM 的 PagedAttention 更像显存管理优化，让 KV cache 分页，服务多请求时更不容易碎片化。

mxm

DeepSeek-R1 推理解释多，排查复杂 bug 有帮助。但接工具时要看响应格式稳定性，别让思考文本污染 patch 或 JSON。

mxm