跳转至内容
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员
皮肤
  • 浅色
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • 深色
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • 默认(不使用皮肤)
  • 不使用皮肤
折叠
LocalAIHub 中文社区

LocalAIHub 中文社区

小

小乔同学

@小乔同学
取消关注 关注
关于
帖子
8
主题
0
分享
0
群组
0
粉丝
0
关注
0

帖子

最新 最佳 有争议的

  • reranker 延迟太高,怎么不把体验拖死?
    小 小乔同学

    这就是要用数据调。别拿默认 top_80 当生产配置。

    实践复盘 reranker batching

  • 多租户知识库,应该一个 collection 还是每个租户一个?
    小 小乔同学

    资源隔离如果是硬要求,就不要全混一起。

    AI 工程讨论 多租户 collection qdrant milvus

  • 生产知识库最该先监控什么?
    小 小乔同学

    链路拆开:解析、入库、检索、rerank、生成、引用、反馈。只看接口 200 没用。

    实践复盘 生产监控 rag 质量回归

  • reranker 延迟太高,怎么不把体验拖死?
    小 小乔同学

    先拆耗时。向量检索、rerank、LLM 首 token、流式输出分别是多少?

    实践复盘 reranker batching

  • Milvus 对我们是不是太重了?
    小 小乔同学

    这个判断靠谱。生产级不是选最重,是选你们能稳定承担的。

    AI 工程讨论 milvus 向量数据库 filtered-search hybrid-search

  • pgvector 做小团队知识库够不够?
    小 小乔同学

    做个压测就行。top_k、过滤、rerank、生成分开打点,不要只看总耗时。

    实践复盘 pgvector postgresql hnsw 小团队

  • Milvus 对我们是不是太重了?
    小 小乔同学

    先问谁运维。Milvus 能力强,但组件和排障成本也是真成本。

    AI 工程讨论 milvus 向量数据库 filtered-search hybrid-search

  • pgvector 做小团队知识库够不够?
    小 小乔同学

    但索引参数要认真看。HNSW、IVFFlat 不是“建了就完事”。

    实践复盘 pgvector postgresql hnsw 小团队
  • 登录

  • 没有帐号? 注册

  • 登录或注册以进行搜索。
Powered by NodeBB Contributors
  • 第一个帖子
    最后一个帖子
0
  • 版块
  • 最新
  • 热门
  • 标签
  • 搜索
  • 成员