Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
第一个风险是你把 demo 当服务。持久化、备份、权限、并发、监控都要补。
Chroma 很适合快速验证,特别是本地原型。团队用至少开 server 模式,别每个人一个本地文件夹。
metadata filter 可以做一些分类和权限,但权限别只靠它。
我们翻车点是重建 collection 时前端还能问,结果半小时里新旧数据混着答。
ingest 要有版本。新索引建完再切流量,不要边删边写。
Chroma 删除数据也要规划,删文档以后旧向量还在是很常见的脏数据来源。
我是不是应该直接换 Qdrant?
不一定。先列需求:多少 chunk、几个人、是否多租户、是否要备份恢复、是否要过滤。
小团队内部工具,Chroma 也能撑一段。但要承认它是一个组件,不是完整知识库产品。
我现在没有权限系统,只是研发组内部用。
那先把 doc_id、chunk_id、hash、source_path 这些打牢,后面迁移不难。
还有环境复现。demo 在你电脑上好用,不代表服务器上路径、字体、PDF 解析都一致。
这句扎心。我先把入库流程容器化,别靠本机环境。
这就对了。Chroma 不是问题,随手搭的流程才是问题。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗