跳转至内容
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
LocalAIHub 中文社区

LocalAIHub 中文社区

M

MingK

@MingK
取消关注 关注
关于
帖子
20
主题
0
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • GraphRAG 适合公司知识库吗?
    M MingK

    普通 RAG、结构化查询、GraphRAG 是工具箱,不是升级路线。

    AI 工程讨论 graphrag 知识图谱 社区摘要

  • 生产知识库最该先监控什么?
    M MingK

    延迟也要按阶段。总耗时高时,你要知道是向量库慢还是 LLM 慢。

    实践复盘 生产监控 rag 质量回归

  • reranker 延迟太高,怎么不把体验拖死?
    M MingK

    本地 CPU 跑 reranker 很吃力。要么 GPU,要么更小模型,要么 API。

    实践复盘 reranker batching

  • GraphRAG 适合公司知识库吗?
    M MingK

    如果问“过去半年客户投诉主要集中在哪些产品线”,图和社区摘要可能有用。

    AI 工程讨论 graphrag 知识图谱 社区摘要

  • 多租户知识库,应该一个 collection 还是每个租户一个?
    M MingK

    会。collection 数量不是无限免费的,监控和配置也会爆。

    AI 工程讨论 多租户 collection qdrant milvus

  • RAG 里 top_k 应该设多少?
    M MingK

    那先别改 top_k,先看切块。小块需要 parent chunk 或上下文扩展。

    AI 工程讨论 topk rerank context-budget

  • 答案对了但引用错了,算不算失败?
    M MingK

    也可能是引用选择策略错了。生成用了 A,最后展示引用时按相似度又选了 B。

    实践复盘 产品信任

  • 混合检索到底是 BM25 + 向量,还是又一个调参黑洞?
    M MingK

    Weaviate 的 hybrid 搜索文档也值得参考,思路是结合稀疏和稠密分数。

    AI 工程讨论 hybrid-search bm25 sparse-vector qdrant

  • 本地知识库更新,是重建全量还是增量?
    M MingK

    可以用 ingestion pipeline 记录转换步骤和缓存,但还是要有自己的版本表。

    实践复盘 本地知识库 增量更新 hash ingestion

  • 引用校验怎么做,不能只显示“来源:文档 A”吧?
    M MingK

    会。所以显示片段时要带标题和相邻上下文,不是只高亮半句。

    AI 工程讨论 引用校验 ragas trulens citation

  • chunk 里要不要放摘要?
    M MingK

    文档级 summary index 可以用来先找文档,再进文档内 chunk 检索。

    AI 工程讨论 chunk-summary embedding metadata

  • 长上下文模型出来以后,RAG 还有必要吗?
    M MingK

    还有权限。你不能为了省 RAG,把用户无权看的文档也一起塞给模型。

    AI 工程讨论 长上下文 rag 边界 lost in the mid

  • PDF 表格该直接转 Markdown,还是单独建表?
    M MingK

    是的,RAG 不等于所有东西都塞向量库。数字类事实经常更适合 SQL。

    AI 工程讨论 pdf 表格解析 camelot pymupdf

  • RAG 测试集到底怎么建,不想只靠感觉调参
    M MingK

    指标分开看:检索有没有拿到证据,生成有没有忠实,引用有没有对上。

    AI 工程讨论 rag 评估 ragas deepeval 测试集

  • 权限过滤放检索前还是检索后?
    M MingK

    可以用角色组、ACL version、可见集合预计算。不要每次传几千个 doc_id。

    AI 工程讨论 权限过滤 rls acl 访问控制

  • Qdrant payload filter 能不能当权限过滤用?
    M MingK

    做过,小规模可以。doc_id 太多时 filter 会变大,要看 Qdrant 负载。

    AI 工程讨论 qdrant payload 权限过滤 多租户

  • PDF 表格该直接转 Markdown,还是单独建表?
    M MingK

    报价表不要只当文本。列名、单位、币种、有效期都要结构化。

    AI 工程讨论 pdf 表格解析 camelot pymupdf

  • pgvector 做小团队知识库够不够?
    M MingK

    如果你们 RLS 已经用起来,权限过滤会舒服很多,但别忘了应用层也要带 tenant 条件。

    实践复盘 pgvector postgresql hnsw 小团队

  • reranker 是不是生产 RAG 必选?
    M MingK

    因为它通常要看 query 和每个候选 chunk 的交互,不是只算一次向量距离。

    AI 工程讨论 reranker bge-reranker cohere

  • metadata 到底放多少,放多了会不会拖慢检索?
    M MingK

    path 和页码一定要有,不然用户问出处时很难回到原文。

    AI 工程讨论 metadata 文档治理 llamaindex
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
Powered by NodeBB Contributors
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员