用户问了知识库没有的东西,算失败吗?
小
小树
@小树
-
生产知识库最该先监控什么? -
GraphRAG 适合公司知识库吗?那是不是只有大公司能用?
-
答案对了但引用错了,算不算失败?这样会不会太工程化?
-
RAG 里 top_k 应该设多少?引用和给模型的上下文可以不一样?
-
混合检索到底是 BM25 + 向量,还是又一个调参黑洞?query 类型用模型判断吗?
-
chunk 里要不要放摘要?摘要是模型生成的,会不会编?
-
NotebookLM 和自己做知识库,差别到底在哪?那能不能让员工都用 NotebookLM,省开发?
-
RAG 测试集到底怎么建,不想只靠感觉调参人工标注太慢。
-
PDF 表格该直接转 Markdown,还是单独建表?那是不是知识库要连数据库?
-
权限过滤放检索前还是检索后?如果用户权限很多,filter 很长怎么办?
-
长上下文模型出来以后,RAG 还有必要吗?但 RAG 调参很烦,切块、向量库、rerank 都是坑。
-
pgvector 做小团队知识库够不够?那是不是不用 Qdrant/Milvus?
-
PDF 解析出来标题层级全丢,RAG 怎么救?解析器能不能自动判断标题?
-
Milvus 对我们是不是太重了?专门向量库召回会不会天然比 pgvector 好?
-
reranker 是不是生产 RAG 必选?我以为 reranker 就是重新排序,为什么会变慢很多?