Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
能解决一部分,尤其是问题短、文档块多、相似标题很多的时候。
先别上来就全链路 rerank。可以 top_30 召回,rerank 到 top_5,再看延迟。
reranker 不是修复垃圾召回的。前 30 里没有答案,rerank 也变不出来。
我以为 reranker 就是重新排序,为什么会变慢很多?
因为它通常要看 query 和每个候选 chunk 的交互,不是只算一次向量距离。
我们 bge-reranker-v2-m3 本地跑,CPU 直接慢到用户怀疑网页卡死。后来只给高风险问题开。
可以按意图开关。导航类、明确标题类不 rerank;制度解释、冲突证据类 rerank。
rerank 前最好去重。同一页相邻块全进候选,reranker 也浪费。
我们加 reranker 后引用更稳,但答案没变聪明。老板一开始不理解,说怎么多花 700ms 只为了引用顺序。
这 700ms 有时候值得。企业 RAG 里,错引比慢一点更难接受。
有没有线上 API 方案?不想自己部署。
Cohere 有 rerank API,注意数据出境和成本。内部制度文档别随便外发。
我先做 A/B:无 rerank、rerank 全量、只对低置信问题 rerank。
记得看失败类型。reranker 变好的是排序,不是权限、解析、切块这些问题。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗