跳转至

title: OA 服务器健康监控 (飞书报警) created: 2026-04-21 updated: 2026-04-21 type: guide tags: [ops, monitor, feishu, python] related: [oa/ops/troubleshooting-guide.md]


OA 服务器健康监控 & 飞书报警

这是一个 Python 脚本,用于定期巡检 OA 服务器状态,并在异常时通过飞书发送报警卡片。

📂 脚本位置

/root/work-records/scripts/oa_monitor.py

🛠️ 功能清单

  1. 磁盘监控:检查根目录使用率,超过 85% 报警(防止上次 93% 的危机重演)。
  2. 内存监控:检查内存占用,超过 90% 报警(防止 Tomcat OOM)。
  3. 服务端口监控
  4. 检查 localhost:7080 (OA 门户) 是否存活。
  5. 检查 localhost:80 (Caddy 网关) 是否存活。
  6. 飞书卡片通知
  7. 正常时发送绿色卡片(日报)。
  8. 异常时发送红色卡片(告警),并列出具体原因。

🚀 部署步骤

1. 配置 Webhook

编辑脚本,替换顶部的 Webhook 地址:

FEISHU_WEBHOOK_URL = "https://open.feishu.cn/open-apis/bot/v2/hook/YOUR_TOKEN"

2. 设置定时任务 (Crontab)

建议每小时执行一次:

crontab -e

# 添加以下行 (每 1 小时执行一次)
0 * * * * cd /root/work-records/scripts && python3 oa_monitor.py >> /var/log/oa_monitor.log 2>&1

📸 效果预览

  • 正常状态
    🤖 OA 巡检日报
    磁盘: 65% | 内存: 40%
    OA 门户: ✅ | Caddy 网关: ✅
    
  • 异常状态
    🚨 OA 异常告警
    磁盘: 95% (红字警告)
    OA 门户: ❌ 异常
    报警信息: 磁盘空间不足... OA 服务端口无响应...