跳转至内容
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
LocalAIHub 中文社区

LocalAIHub 中文社区

小

小路灯

@小路灯
取消关注 关注
关于
帖子
27
主题
0
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • 生产知识库最该先监控什么?
    小 小路灯

    自动指标只能告诉你哪里可能坏,不能替代人工复盘。

    实践复盘 生产监控 rag 质量回归

  • 答案对了但引用错了,算不算失败?
    小 小路灯

    旧帖补一句:别让 UI 把“相关来源”写成“答案依据”。这两个含义差很多。

    实践复盘 产品信任

  • reranker 延迟太高,怎么不把体验拖死?
    小 小路灯

    UI 状态有用,但别用 UI 掩盖链路慢。1.9s 还是要优化。

    实践复盘 reranker batching

  • GraphRAG 适合公司知识库吗?
    小 小路灯

    不是。小团队也能试,但别一上来把制度问答改成图谱工程。

    AI 工程讨论 graphrag 知识图谱 社区摘要

  • 多租户知识库,应该一个 collection 还是每个租户一个?
    小 小路灯

    还有大租户影响小租户的问题。一个超大客户更新索引,会不会拖慢其他人?

    AI 工程讨论 多租户 collection qdrant milvus

  • chunk 里要不要放摘要?
    小 小路灯

    会。所以摘要要可追溯,最好只作辅助,不作最终引用。

    AI 工程讨论 chunk-summary embedding metadata

  • 本地知识库更新,是重建全量还是增量?
    小 小路灯

    看数据量。生产里 2 倍临时空间通常比半夜修脏数据便宜。

    实践复盘 本地知识库 增量更新 hash ingestion

  • 引用校验怎么做,不能只显示“来源:文档 A”吧?
    小 小路灯

    最好保留人工抽检。引用校验目前别追求一步到位。

    AI 工程讨论 引用校验 ragas trulens citation

  • RAG 里 top_k 应该设多少?
    小 小路灯

    还有引用数量。答案引用 12 个来源,用户通常看不下去。

    AI 工程讨论 topk rerank context-budget

  • 混合检索到底是 BM25 + 向量,还是又一个调参黑洞?
    小 小路灯

    对。用户输入有编号、法规条款、接口名时提高关键词权重;自然语言问题走向量为主。

    AI 工程讨论 hybrid-search bm25 sparse-vector qdrant

  • NotebookLM 和自己做知识库,差别到底在哪?
    小 小路灯

    对,自研产品应该学习它的“围绕来源工作”,不是只学聊天框。

    AI 工程讨论 notebooklm 知识库产品 团队协作

  • 答案对了但引用错了,算不算失败?
    小 小路灯

    我站产品。企业知识库里引用错就是失败,因为用户要靠它复核。

    实践复盘 产品信任

  • RAG 测试集到底怎么建,不想只靠感觉调参
    小 小路灯

    慢但值。你不标,后面每次上线都靠玄学。

    AI 工程讨论 rag 评估 ragas deepeval 测试集

  • PDF 表格该直接转 Markdown,还是单独建表?
    小 小路灯

    这个折中不错,但要防摘要漏列。价格、阈值、日期别只在摘要里。

    AI 工程讨论 pdf 表格解析 camelot pymupdf

  • 长上下文模型出来以后,RAG 还有必要吗?
    小 小路灯

    这个我同意。RAG 和长上下文不是二选一,可以检索少量大块。

    AI 工程讨论 长上下文 rag 边界 lost in the mid

  • 权限过滤放检索前还是检索后?
    小 小路灯

    权限变化要能重放。谁在什么时候能看什么文档,要有审计口径。

    AI 工程讨论 权限过滤 rls acl 访问控制

  • 扫描版 PDF 入库,OCR 错字会让 RAG 变玄学
    小 小路灯

    OCR 错字不只影响召回,也会影响引用可信度。用户看到错字会直接不信系统。

    实践复盘 ocr pdf paddleocr tesseract

  • 引用校验怎么做,不能只显示“来源:文档 A”吧?
    小 小路灯

    TruLens 那个 RAG triad 思路挺有用:答案、上下文、问题之间分别看。

    AI 工程讨论 引用校验 ragas trulens citation

  • Milvus 对我们是不是太重了?
    小 小路灯

    还有备份恢复演练。向量库不是只要能查,误删 collection 时能不能回来才是生产问题。

    AI 工程讨论 milvus 向量数据库 filtered-search hybrid-search

  • Chroma 本地知识库跑 demo 很顺,团队用会不会翻车?
    小 小路灯

    不一定。先列需求:多少 chunk、几个人、是否多租户、是否要备份恢复、是否要过滤。

    实践复盘 chroma 本地开发 client-server metadata-filter
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
Powered by NodeBB Contributors
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员