LocalAIHub 中文社区

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

世界

本论坛之外的主题。此处表达的观点和意见可能不代表本论坛及其成员的立场。

海量内容尽在指尖 …

不妨将此视为您专属的全球发现信息流。它汇集了来自互联网各处及其他社区的有趣讨论，一应俱全。

虽然您可以浏览当前的热门内容，但使用该信息流的最佳方式是将其个性化。通过注册账号，您可以关注特定的创作者和主题，从而过滤掉无关信息，只查看对您真正重要的内容。

准备好开始了吗？注册一个账号，即可关注他人、在收到回复时获得通知，并收藏您喜欢的内容。

注册登录

小

小小谢

AI 工程讨论

模型蒸馏适合小团队做吗

小团队有没有必要搞模型蒸馏？想把大模型能力压到小模型里，本地跑便宜点。

13 0 0 回复

M melo

省钱路径很多，训练通常不是第一条。
小

小小傅

AI 工程讨论

GraphRAG 是不是企业知识库下一步必做

最近看到很多 GraphRAG，感觉企业知识库是不是迟早要上图谱？

13 0 0 回复

M melo

先把文档、权限、引用做好，再谈图。地基别跳。
小

小小谢

AI 工程讨论

PagedAttention 听起来很底层，为什么 vLLM 经常提

vLLM 文档和文章经常提 PagedAttention。应用开发要懂到什么程度？

13 0 0 回复

小小吴

最后还是看指标：首 token、吞吐、失败率、显存、恢复时间。
小

小小李不困

AI 工程讨论

论文读书会怎么避免变成 PPT 表演

我们想搞 AI 论文读书会，但以前别的读书会最后都变成 PPT 表演。怎么做更有用？

13 0 0 回复

G Grace

对。工程读论文是为了降低误判，不是为了证明团队懂术语。
A

A abc_1024

AI 工程讨论

KV cache 是不是只和模型有关，应用不用管

KV cache 这个东西应用层要关心吗？感觉是推理框架内部的事。

13 0 0 回复

M melo

这句可以贴在需求评审里。
南

南南瓜

AI 工程讨论

AI 搜索结果要不要像搜索引擎一样列十条

我们做内部 AI 搜索，产品想直接给答案，不显示传统搜索结果。有人觉得不安心。

13 0 0 回复

阿阿航

对，它应该是检索、阅读、引用三个动作合在一起。
小

小小曹

AI 工程讨论

AI 客服的“转人工”按钮到底该多明显

业务方想把转人工按钮藏深一点，怕用户都点人工。我觉得这会引发反感。

13 0 0 回复

小小曹

这个我们没做，难怪转人工体验也差。
阿

阿阿树

实践复盘

会议纪要里的人名识别错了，后果比想象大

会议纪要把“张工负责接口”识别成“张总负责接口”，大家笑了一下，但我觉得挺危险。

13 0 0 回复

小小吴

AI 纪要不是录音转文字那么简单，后面接系统就变成业务动作了。
不

不不想写周报

AI 工程讨论

AI 办公工具为什么容易变成另一个待办系统

我们接了 AI 办公助手，结果大家说又多了一个入口。它会总结、建待办，但没人回去看。

13 0 0 回复

半半糖

“AI 小岛”这个词挺准。很多产品死在这里。
小

小小满

AI 工程讨论

数据分级表写出来了，AI 系统怎么真的执行

公司有数据分级表，但 AI 系统接入时没人知道怎么落地。表上写“内部敏感”，代码里怎么体现？

13 0 0 回复

M melo

数据分级不是 Excel，是每条链路上的字段和判断。
郭

郭郭同学

AI 工程讨论

AI 教育产品要不要允许学生直接问答案

AI 家教里，学生直接问“这题答案是什么”，我们要不要给？

13 0 0 回复

郭郭同学

我们先做三档：提示、步骤、答案，老师端可配置。
小

小小吴

AI 工程讨论

AI 能力中心到底是组织，还是一个群聊

公司准备搞 AI 能力中心，但现在看起来像把几个会用 AI 的人拉个群。这样有用吗？

13 0 0 回复

小小吴

这个我能拿去开会说。先别建大平台，先建三件可维护的东西。
不

不不想写周报

AI 工程讨论

AI 能不能替团队写周报，最后为什么卡在权限和口径

我们想做自动周报：从 Jira、飞书、Git 提交里抓信息，让 AI 总结。听起来简单，做起来全是坑。

14 0 0 回复

陈陈一

对。AI 写得再顺，流程不对还是不能用。
小

小小李不困

AI 工程讨论

读 Transformer 论文，对做应用到底有什么用

问个可能有点基础的问题：做 AI 应用的人有必要读 Transformer 原论文吗？还是看科普就够了。

14 0 0 回复

米米饭

读完记得回来说哪段最卡。很多人都是卡在同几个地方。
小

小小曹

AI 工程讨论

Speculative Decoding 听起来很美，应用层要关心吗

推理优化里经常看到 speculative decoding。做应用层的人要不要关心，还是交给 vLLM/SGLang 这种后端？

14 0 0 回复

半半截薯条

老板问就说：我们先量血压，再决定吃什么药。
王

王王小明明

实践复盘

私有化部署报价为什么比调用 API 贵这么多

客户问我们私有化部署，报价一算比直接调 API 贵很多。他们不理解，说不是本地更省钱吗？

14 0 0 回复

王王小明明

明白。私有化不是省钱神药，要先问约束。
半

半半糖

AI 工程讨论

量化模型回答变差，怎么判断是量化锅还是提示词锅

我们从原版模型换到 4bit 量化，客服问答明显变短，有时候格式也乱。怎么判断是不是量化导致的？

14 0 0 回复

阿阿白

凭感觉没错，感觉是报警器。但最后得靠样例定位。
小

小小谢

AI 工程讨论

MoE 模型是不是天然更适合企业部署

最近很多模型都在说 MoE。是不是 MoE 参数大但激活少，所以企业部署更划算？

14 0 0 回复

小小谢

明白。MoE 是候选，不是答案。
郭

郭郭同学

AI 工程讨论

AI 教育产品里，模型讲得很顺不代表学生学会了

AI 家教 demo 很惊艳，学生问什么都能讲。可是怎么判断它真的提升学习效果？

14 0 0 回复

米米饭

学习效果这事要慢慢测，别拿一场 demo 当结论。
小

小小曹

AI 工程讨论

AI 客服回答太像模板，是提示词问题还是产品问题

我们客服机器人被吐槽“像复制粘贴”。我改了几版提示词，要求自然一点，效果还是很尬。

14 0 0 回复

小小曹

我先把差评样本拉出来，分类型调。之前确实全靠感觉。