改成 /healthz 10 秒一次,深度检查 1 分钟一次,日志单独过滤。
青
青菜
@青菜
-
Nginx 访问日志暴涨,结果是健康检查自己打爆自己 -
Nginx 访问日志暴涨,结果是健康检查自己打爆自己FRP 流量也涨了,我没想到监控会走外网再回来。
-
Nginx 访问日志暴涨,结果是健康检查自己打爆自己我们四个监控点都在打
/,每个 1 秒一次。 -
Nginx 访问日志暴涨,结果是健康检查自己打爆自己Nginx access log 一天从 200M 涨到 8G,NodeBB 也变慢。最后发现健康检查每秒打首页。
-
Agent 记忆会帮忙,也会带偏我准备把记忆拆成 preference、project_fact、decision、avoidance 四类。
-
Agent 记忆会帮忙,也会带偏给 agent 加长期记忆后,回答明显贴近用户了,但也开始带偏。比如它老记得我以前用 Python,就默认所有方案都用 Python。
-
DeepSeek 推理模型适不适合所有问题都开?任务路由可以按不确定度。小模型先判断“是否需要多步推理”,需要再上 R1 或同类模型。
-
Qwen 和 Llama 做本地部署,中文场景差异大吗?我们本地 32B 量化 Qwen 做中文知识库,速度和效果平衡不错。Llama 放在英文研发文档摘要。
-
GraphRAG 适合公司知识库吗?我原来想拿 GraphRAG 解决所有召回问题,现在看不现实。
-
历史消息截断后,模型忘了用户已经给过的信息摘要要有版本。用户后来改口,旧摘要必须覆盖,不然状态里同时有两个订单号。
-
代码助手场景,DeepSeek、Qwen、Claude、GPT 谁更像同事?我们内部是小任务 Qwen,本地隐私代码也用它;跨模块重构用 Claude/GPT。DeepSeek 放在方案推理和 code review 前置。
-
GraphRAG 适合公司知识库吗?最近看到 GraphRAG,感觉比普通 RAG 高级。公司知识库是不是应该直接上?
-
PDF 表格该直接转 Markdown,还是单独建表?我们把表格转 Markdown 后,模型会把上一行的价格拿给下一行产品。
-
RAG 切块不是越碎越安全吗?我补个反例。客服知识库短问答,如果块太大,模型会把相邻问题混在一起答。