我先做 p50/p95、错误率、Token、重启、检索耗时。
好
好困但在看日志
@好困但在看日志
-
生产 AI 系统的“最小监控”应该有哪些 -
生产 AI 系统的“最小监控”应该有哪些想给 AI 服务补监控。最小集合应该有哪些?
-
PM2 显示 online,但外面访问一直 502找到了,Nginx 配的是 8848,容器映射实际是 8849。PM2 没问题。
-
PM2 显示 online,但外面访问一直 502我刚才只 curl 127.0.0.1:端口,没有带 Host。
-
PM2 显示 online,但外面访问一直 502服务 PM2 是 online,端口本机 curl 也通,但外面访问 502。这个一般看哪?
-
NodeBB 跑三天后慢下来,重启五分钟又正常我碰过类似,最后是某个插件在请求里做全站统计,每次打开首页都扫主题表。
-
长任务恢复别靠“继续刚才”我先拆成阶段:采集、清洗、归类、人工抽检、导入。每阶段写状态和产物。
-
长任务恢复别靠“继续刚才”Agent 跑 40 分钟的资料整理,中途断了。现在只能让它“继续刚才”,结果它重复做了半天。长任务怎么恢复?