LocalAIHub 中文社区

青

改成 /healthz 10 秒一次，深度检查 1 分钟一次，日志单独过滤。

青

FRP 流量也涨了，我没想到监控会走外网再回来。

青

我们四个监控点都在打 /，每个 1 秒一次。

青

Nginx access log 一天从 200M 涨到 8G，NodeBB 也变慢。最后发现健康检查每秒打首页。

青

我准备把记忆拆成 preference、project_fact、decision、avoidance 四类。

青

给 agent 加长期记忆后，回答明显贴近用户了，但也开始带偏。比如它老记得我以前用 Python，就默认所有方案都用 Python。

青

任务路由可以按不确定度。小模型先判断“是否需要多步推理”，需要再上 R1 或同类模型。

青

我们本地 32B 量化 Qwen 做中文知识库，速度和效果平衡不错。Llama 放在英文研发文档摘要。

青

我原来想拿 GraphRAG 解决所有召回问题，现在看不现实。

青

摘要要有版本。用户后来改口，旧摘要必须覆盖，不然状态里同时有两个订单号。

青

我们内部是小任务 Qwen，本地隐私代码也用它；跨模块重构用 Claude/GPT。DeepSeek 放在方案推理和 code review 前置。

青

最近看到 GraphRAG，感觉比普通 RAG 高级。公司知识库是不是应该直接上？

青

我们把表格转 Markdown 后，模型会把上一行的价格拿给下一行产品。

青

我补个反例。客服知识库短问答，如果块太大，模型会把相邻问题混在一起答。

青菜