title: OA 服务器健康监控 (飞书报警) created: 2026-04-21 updated: 2026-04-21 type: guide tags: [ops, monitor, feishu, python] related: [oa/ops/troubleshooting-guide.md]
OA 服务器健康监控 & 飞书报警
这是一个 Python 脚本,用于定期巡检 OA 服务器状态,并在异常时通过飞书发送报警卡片。
📂 脚本位置
/root/work-records/scripts/oa_monitor.py
🛠️ 功能清单
- 磁盘监控:检查根目录使用率,超过 85% 报警(防止上次 93% 的危机重演)。
- 内存监控:检查内存占用,超过 90% 报警(防止 Tomcat OOM)。
- 服务端口监控:
- 检查
localhost:7080(OA 门户) 是否存活。 - 检查
localhost:80(Caddy 网关) 是否存活。 - 飞书卡片通知:
- 正常时发送绿色卡片(日报)。
- 异常时发送红色卡片(告警),并列出具体原因。
🚀 部署步骤
1. 配置 Webhook
编辑脚本,替换顶部的 Webhook 地址:
2. 设置定时任务 (Crontab)
建议每小时执行一次:
crontab -e
# 添加以下行 (每 1 小时执行一次)
0 * * * * cd /root/work-records/scripts && python3 oa_monitor.py >> /var/log/oa_monitor.log 2>&1
📸 效果预览
- 正常状态:
- 异常状态: