Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
本论坛之外的主题。此处表达的观点和意见可能不代表本论坛及其成员的立场。
海量内容尽在指尖 …
不妨将此视为您专属的全球发现信息流。它汇集了来自互联网各处及其他社区的有趣讨论,一应俱全。
虽然您可以浏览当前的热门内容,但使用该信息流的最佳方式是将其个性化。通过注册账号,您可以关注特定的创作者和主题,从而过滤掉无关信息,只查看对您真正重要的内容。
准备好开始了吗?注册一个账号,即可关注他人、在收到回复时获得通知,并收藏您喜欢的内容。
我们想用 GPT/Claude 当裁判,评 Qwen/DeepSeek 的回答。这样会不会天然偏向自己的风格?
我们讨论模型路由,有人觉得复杂。一个模型全走到底不是更简单吗?
我们准备用模型做代码助手,评测时大家拿 LeetCode 题测。这样有意义吗?
我们评中文能力时,让模型写一段介绍,都写得挺顺。然后业务问答还是错。中文能力到底测什么?
我们把一个流程从开源模型换成 GPT/Claude 后,demo 很漂亮,但线上还是被用户问崩了。是不是模型还不够强?
我把一个中文模型量化到 4bit 后速度上来了,但回答明显变短,还经常漏条件。是不是温度参数没调好?
我们内部评模型,大家一直问“准确率多少”。但很多生成任务很难算准确率。
中文长文分析想在 GLM 和 Kimi 之间选。材料是招标文件、会议纪要、制度合集,大家怎么分工?
我看到 Gemma 小模型部署挺轻,想给团队做默认助手,负责总结、改写、简单问答。靠谱吗?
DeepSeek 到底更适合写代码还是做推理?我看大家说法不一样。
我们知识库问答经常答错,但不是没检索到,而是检索到太多相似旧文档。这个怎么治?
Llama 系列生态很强,本地部署资料也多。中文业务场景能直接用吗?
我们想用 Qwen 做中文业务问答,主要是制度、客服、表格说明。有人生产里用过吗?
我们聊天助手最近有个问题,用户前面说“只看上海政策”,后面追问“那报销呢”,模型回答成全国政策。看日志发现历史被截断了。
我们算 AI 成本时只按用户问题数量估算,结果账单比预期高很多。是不是应该按 token 算?
现在好多模型都支持很长上下文了,企业知识库是不是可以直接把文档塞进去,不做 RAG?
我们准备给内部知识库换模型,老板贴了几个榜单截图,说排名高的直接上。这样选会不会太粗?
升级一个 UI 插件后,NodeBB 后台左侧菜单少了几项。管理员以为权限被改,查了半天。
恢复演练时帖子都在,搜索结果全空。过了半小时还是空,是不是恢复失败?
我们重启 Docker 后,NodeBB 附件和部分配置像回到昨天。数据库还在,上传目录不对。