本地 RAG 做不到 NotebookLM 那种体验怎么办?尤其摘要和问答。
今
今天不想改配置
@今天不想改配置
-
NotebookLM 好用,但公司资料能不能直接放进去 -
工具权限最小化,不是安全洁癖明白。先做工具注册表:用途、权限级别、输入 schema、是否需要确认、日志脱敏规则。
-
工具权限最小化,不是安全洁癖Agent 接工具时,大家是直接给全权限,还是按任务开?我怕权限设计太细,开发阶段拖慢速度。
-
Kimi 长文阅读强,但知识库问答仍要权限过滤还有日志。prompt 里有敏感资料,日志系统别明文长期存。
-
KV cache 到底帮什么,为什么不是所有请求都变便宜?那为什么我们本地 llama.cpp 长聊天越来越慢?
-
中文客服场景,Qwen、GLM、Kimi、GPT 到底怎么选?GPT 做兜底体验会好一点,尤其用户问题含糊时会追问。但成本控制要早做,不然后面财务看账单脸色不好。