Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
简单不等于可靠。长上下文解决“放得下”,没解决“找得准”和“证据可控”。
但 RAG 调参很烦,切块、向量库、rerank 都是坑。
是坑,所以要看场景。10 页项目说明直接塞上下文可以;几千份制度不行。
Lost in the Middle 那篇提醒过,长上下文里信息位置也会影响模型使用。不是塞进去就等于读懂。
长上下文成本也要算。每次把大文档塞进去,延迟和费用都上去。
还有权限。你不能为了省 RAG,把用户无权看的文档也一起塞给模型。
我反而觉得长上下文能减少切块复杂度。先检索章节,再给大段上下文。
这个我同意。RAG 和长上下文不是二选一,可以检索少量大块。
最怕把长上下文当垃圾桶。日志、历史聊天、文档全塞,最后不知道模型依据什么答。
我们做会议纪要问答,单会 2 小时转写直接塞效果不错。跨项目知识库还是 RAG。
所以边界是资料规模、更新频率、权限和引用要求?
对,还有成本和可解释。企业里“为什么这么答”比“能不能答”更重要。
别把技术路线变宗教。短资料长上下文,长期知识 RAG,关键事实结构化。
这句比较准。生产系统通常是混合,不是单一招式。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗