Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
pgvector 的优势是简单和事务。你能把 doc 表、chunk 表、权限表、向量都放一起管。
弱点是向量服务能力没有专门库丰富,监控和分片也要自己想。
如果你们 RLS 已经用起来,权限过滤会舒服很多,但别忘了应用层也要带 tenant 条件。
我们 12 万 chunk,768 维,pgvector 现在还行。慢的是 PDF 入库,不是查。
12 万没啥压力。真正要看并发、更新频率、过滤条件复杂度。
还有备份。Postgres 一起备份很省心,专门向量库又多一套运维。
那是不是不用 Qdrant/Milvus?
不是不用,是先看你有没有它们解决的问题。没有就别引入。
我们一开始就是 5 个人内部问文档,看来 pgvector 够。
做个压测就行。top_k、过滤、rerank、生成分开打点,不要只看总耗时。
结论可以保守:pgvector 先跑,抽象 collection 接口,别把业务绑死在 SQL 细节里。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗