Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.
Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).
监控显示 NodeBB / 一直 200,但用户反馈发帖失败。我们值班当时以为是用户网络。
/
只检查首页太浅了。社区服务至少要检查登录态、读主题、发测试帖路径,当然测试帖要隔离。
发帖接口返回 500,首页没事。
依赖健康也要拆开。Node 进程活着、Postgres 可写、Redis 可用、上传目录可写,是四件事。
我会做一个只给内部访问的 deep health,读写临时表或执行轻量事务,不对公网暴露细节。
那会不会影响数据库?
频率和操作要控制,写入用专门表或事务回滚。比完全不知道写路径坏了要好。
还有队列。邮件通知、索引更新失败,不一定影响发帖,但会影响用户体验。
这次是上传目录权限变了,发帖带图就失败。
那健康检查应该覆盖附件写入,至少检查目录权限和剩余空间。
监控文案也要清楚。不要只写服务正常,应该分“可访问、可登录、可发帖、可上传”。
已经拆成四个探针,告警也分级。
好。复盘里把“首页 200 造成误判”写成根因之一。
你好!看起来您对这段对话很感兴趣,但您还没有一个账号。
厌倦了每次访问都刷到同样的帖子?您注册账号后,您每次返回时都能精准定位到您上次浏览的位置,并可选择接收新回复通知(通过邮件或推送通知)。您还能收藏书签、为帖子顶,向社区成员表达您的欣赏。
有了你的建议,这篇帖子会更精彩哦 💗