跳转至内容
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
LocalAIHub 中文社区

LocalAIHub 中文社区

小

小满满

@小满满
取消关注 关注
关于
帖子
10
主题
0
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • RAG 资料员是不是应该自己打开浏览器核验
    小 小满满

    浏览器抓页面时注意 cookie。不要把登录后的内部页面当公开来源。

    AI 工程讨论 rag browser researcher-agen source

  • 浏览器自动化能干活,但别把网页当 API
    小 小满满

    我用 browser-use 做过网站资料采集,原型快。但生产里一定要加域名白名单和下载目录隔离。

    AI 工程讨论 browser-automat playwright selenium agent

  • 执行日志给谁看,决定怎么写
    小 小满满

    用户不需要看 token、tool_call_id、raw JSON。看“正在读取政策文档”“已找到 3 个相关条款”就够。

    AI 工程讨论 tracing audit observability agent

  • GraphRAG 适合公司知识库吗?
    小 小满满

    我们试过在项目复盘文档上做实体关系,找人和系统关系挺好。但查具体配置不如向量。

    AI 工程讨论 graphrag 知识图谱 社区摘要

  • 混合检索到底是 BM25 + 向量,还是又一个调参黑洞?
    小 小满满

    我们失败样例大多是缩写。HRBP、OKR、SOP,向量能懂一点,但关键词更稳。

    AI 工程讨论 hybrid-search bm25 sparse-vector qdrant

  • NotebookLM 和自己做知识库,差别到底在哪?
    小 小满满

    这个范围感很重要。很多误答来自用户以为在问“某项目”,系统其实搜了全公司。

    AI 工程讨论 notebooklm 知识库产品 团队协作

  • 引用校验怎么做,不能只显示“来源:文档 A”吧?
    小 小满满

    我们遇到过最尴尬的是答案对了,引用错了。用户还是判系统不可信。

    AI 工程讨论 引用校验 ragas trulens citation

  • Chroma 本地知识库跑 demo 很顺,团队用会不会翻车?
    小 小满满

    还有环境复现。demo 在你电脑上好用,不代表服务器上路径、字体、PDF 解析都一致。

    实践复盘 chroma 本地开发 client-server metadata-filter

  • Qdrant payload filter 能不能当权限过滤用?
    小 小满满

    有人做过 query 前先算可访问 doc_id 集合,再传 filter 吗?

    AI 工程讨论 qdrant payload 权限过滤 多租户

  • 中文知识库 embedding 用 bge-m3 还是 bge-large-zh?
    小 小满满

    我们从 text2vec 换到 bge-m3,召回明显好一些,但真正提升来自重切块,不全是 embedding 功劳。

    AI 工程讨论 embedding bge 中文检索 多语言
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
Powered by NodeBB Contributors
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员