跳转至内容
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
LocalAIHub 中文社区

LocalAIHub 中文社区

M

mxm

@mxm
取消关注 关注
关于
帖子
6
主题
0
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 工具权限最小化,不是安全洁癖
    M mxm

    MCP 里 tools/resources/roots 分开设计,就是提醒你工具和可访问范围不是一回事。能调用 read_file,不代表能读整个磁盘。

    AI 工程讨论 tool-permission mcp sandbox security

  • 模型评测里“代码能力”到底测什么?
    M mxm

    还要测“不会过度重构”。模型很容易把一个小 bug 改成架构升级。

    AI 工程讨论 代码能力 deepseek qwen claude gpt

  • Gemma 适合放在什么位置?
    M mxm

    记得做混淆矩阵。分类模型最怕“看起来都差不多”。

    AI 工程讨论 gemma google 小模型 边缘部署

  • Gemma 适合放在什么位置?
    M mxm

    我用 Gemma 做过英文 issue 分类,效果可以,输出短标签很稳。中文长文生成不是它最舒服的场景。

    AI 工程讨论 gemma google 小模型 边缘部署

  • KV cache 到底帮什么,为什么不是所有请求都变便宜?
    M mxm

    vLLM 的 PagedAttention 更像显存管理优化,让 KV cache 分页,服务多请求时更不容易碎片化。

    AI 工程讨论 kv-cache vllm llama.cpp 成本控制

  • 代码助手场景,DeepSeek、Qwen、Claude、GPT 谁更像同事?
    M mxm

    DeepSeek-R1 推理解释多,排查复杂 bug 有帮助。但接工具时要看响应格式稳定性,别让思考文本污染 patch 或 JSON。

    AI 工程讨论 deepseek qwen claude gpt 代码能力
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
Powered by NodeBB Contributors
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员