LocalAIHub 中文社区

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

M

MingK

@MingK

关注

0

帖子

最新最佳有争议的

GraphRAG 适合公司知识库吗？

M MingK

普通 RAG、结构化查询、GraphRAG 是工具箱，不是升级路线。

AI 工程讨论 graphrag 知识图谱社区摘要
生产知识库最该先监控什么？

M MingK

延迟也要按阶段。总耗时高时，你要知道是向量库慢还是 LLM 慢。

实践复盘生产监控 rag 质量回归
reranker 延迟太高，怎么不把体验拖死？

M MingK

本地 CPU 跑 reranker 很吃力。要么 GPU，要么更小模型，要么 API。

实践复盘 reranker batching
GraphRAG 适合公司知识库吗？

M MingK

如果问“过去半年客户投诉主要集中在哪些产品线”，图和社区摘要可能有用。

AI 工程讨论 graphrag 知识图谱社区摘要
多租户知识库，应该一个 collection 还是每个租户一个？

M MingK

会。collection 数量不是无限免费的，监控和配置也会爆。

AI 工程讨论多租户 collection qdrant milvus
RAG 里 top_k 应该设多少？

M MingK

那先别改 top_k，先看切块。小块需要 parent chunk 或上下文扩展。

AI 工程讨论 topk rerank context-budget
答案对了但引用错了，算不算失败？

M MingK

也可能是引用选择策略错了。生成用了 A，最后展示引用时按相似度又选了 B。

实践复盘产品信任
混合检索到底是 BM25 + 向量，还是又一个调参黑洞？

M MingK

Weaviate 的 hybrid 搜索文档也值得参考，思路是结合稀疏和稠密分数。

AI 工程讨论 hybrid-search bm25 sparse-vector qdrant
本地知识库更新，是重建全量还是增量？

M MingK

可以用 ingestion pipeline 记录转换步骤和缓存，但还是要有自己的版本表。

实践复盘本地知识库增量更新 hash ingestion
引用校验怎么做，不能只显示“来源：文档 A”吧？

M MingK

会。所以显示片段时要带标题和相邻上下文，不是只高亮半句。

AI 工程讨论引用校验 ragas trulens citation
chunk 里要不要放摘要？

M MingK

文档级 summary index 可以用来先找文档，再进文档内 chunk 检索。

AI 工程讨论 chunk-summary embedding metadata
长上下文模型出来以后，RAG 还有必要吗？

M MingK

还有权限。你不能为了省 RAG，把用户无权看的文档也一起塞给模型。

AI 工程讨论长上下文 rag 边界 lost in the mid
PDF 表格该直接转 Markdown，还是单独建表？

M MingK

是的，RAG 不等于所有东西都塞向量库。数字类事实经常更适合 SQL。

AI 工程讨论 pdf 表格解析 camelot pymupdf
RAG 测试集到底怎么建，不想只靠感觉调参

M MingK

指标分开看：检索有没有拿到证据，生成有没有忠实，引用有没有对上。

AI 工程讨论 rag 评估 ragas deepeval 测试集
权限过滤放检索前还是检索后？

M MingK

可以用角色组、ACL version、可见集合预计算。不要每次传几千个 doc_id。

AI 工程讨论权限过滤 rls acl 访问控制
Qdrant payload filter 能不能当权限过滤用？

M MingK

做过，小规模可以。doc_id 太多时 filter 会变大，要看 Qdrant 负载。

AI 工程讨论 qdrant payload 权限过滤多租户
PDF 表格该直接转 Markdown，还是单独建表？

M MingK

报价表不要只当文本。列名、单位、币种、有效期都要结构化。

AI 工程讨论 pdf 表格解析 camelot pymupdf
pgvector 做小团队知识库够不够？

M MingK

如果你们 RLS 已经用起来，权限过滤会舒服很多，但别忘了应用层也要带 tenant 条件。

实践复盘 pgvector postgresql hnsw 小团队
reranker 是不是生产 RAG 必选？

M MingK

因为它通常要看 query 和每个候选 chunk 的交互，不是只算一次向量距离。

AI 工程讨论 reranker bge-reranker cohere
metadata 到底放多少，放多了会不会拖慢检索？

M MingK

path 和页码一定要有，不然用户问出处时很难回到原文。

AI 工程讨论 metadata 文档治理 llamaindex