普通 RAG、结构化查询、GraphRAG 是工具箱,不是升级路线。
M
MingK
@MingK
-
GraphRAG 适合公司知识库吗? -
生产知识库最该先监控什么?延迟也要按阶段。总耗时高时,你要知道是向量库慢还是 LLM 慢。
-
reranker 延迟太高,怎么不把体验拖死?本地 CPU 跑 reranker 很吃力。要么 GPU,要么更小模型,要么 API。
-
GraphRAG 适合公司知识库吗?如果问“过去半年客户投诉主要集中在哪些产品线”,图和社区摘要可能有用。
-
多租户知识库,应该一个 collection 还是每个租户一个?会。collection 数量不是无限免费的,监控和配置也会爆。
-
RAG 里 top_k 应该设多少?那先别改 top_k,先看切块。小块需要 parent chunk 或上下文扩展。
-
答案对了但引用错了,算不算失败?也可能是引用选择策略错了。生成用了 A,最后展示引用时按相似度又选了 B。
-
混合检索到底是 BM25 + 向量,还是又一个调参黑洞?Weaviate 的 hybrid 搜索文档也值得参考,思路是结合稀疏和稠密分数。
-
本地知识库更新,是重建全量还是增量?可以用 ingestion pipeline 记录转换步骤和缓存,但还是要有自己的版本表。
-
引用校验怎么做,不能只显示“来源:文档 A”吧?会。所以显示片段时要带标题和相邻上下文,不是只高亮半句。
-
chunk 里要不要放摘要?文档级 summary index 可以用来先找文档,再进文档内 chunk 检索。
-
长上下文模型出来以后,RAG 还有必要吗?还有权限。你不能为了省 RAG,把用户无权看的文档也一起塞给模型。
-
PDF 表格该直接转 Markdown,还是单独建表?是的,RAG 不等于所有东西都塞向量库。数字类事实经常更适合 SQL。
-
RAG 测试集到底怎么建,不想只靠感觉调参指标分开看:检索有没有拿到证据,生成有没有忠实,引用有没有对上。
-
权限过滤放检索前还是检索后?可以用角色组、ACL version、可见集合预计算。不要每次传几千个 doc_id。
-
Qdrant payload filter 能不能当权限过滤用?做过,小规模可以。doc_id 太多时 filter 会变大,要看 Qdrant 负载。
-
PDF 表格该直接转 Markdown,还是单独建表?报价表不要只当文本。列名、单位、币种、有效期都要结构化。
-
pgvector 做小团队知识库够不够?如果你们 RLS 已经用起来,权限过滤会舒服很多,但别忘了应用层也要带 tenant 条件。
-
reranker 是不是生产 RAG 必选?因为它通常要看 query 和每个候选 chunk 的交互,不是只算一次向量距离。
-
metadata 到底放多少,放多了会不会拖慢检索?path 和页码一定要有,不然用户问出处时很难回到原文。