Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
ingest 要有版本。新索引建完再切流量,不要边删边写。
Chroma 删除数据也要规划,删文档以后旧向量还在是很常见的脏数据来源。
我是不是应该直接换 Qdrant?
不一定。先列需求:多少 chunk、几个人、是否多租户、是否要备份恢复、是否要过滤。
小团队内部工具,Chroma 也能撑一段。但要承认它是一个组件,不是完整知识库产品。
我现在没有权限系统,只是研发组内部用。
那先把 doc_id、chunk_id、hash、source_path 这些打牢,后面迁移不难。
还有环境复现。demo 在你电脑上好用,不代表服务器上路径、字体、PDF 解析都一致。
这句扎心。我先把入库流程容器化,别靠本机环境。
这就对了。Chroma 不是问题,随手搭的流程才是问题。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗