0%

监控内存利用率

内存利用率利用率监控脚本:自动报警与状态分析

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
#!/bin/bash

# 配置参数
THRESHOLD=1024 # 内存报警阈值(MB)
CHECK_INTERVAL=60 # 检查间隔(秒),如果作为定时任务可注释
MAIL="example@mail.com" # 接收报警的邮箱
LOG_FILE="/var/log/memory_monitor.log" # 日志文件路径

# 确保日志文件存在
touch $LOG_FILE
chmod 644 $LOG_FILE

# 日志函数
log() {
echo "[$(date +%F" "%H:%M:%S)] $1" >> $LOG_FILE
}

# 获取系统信息
get_system_info() {
DATE=$(date +%F" "%H:%M)
# 兼容不同版本的ifconfig输出
IP=$(hostname -I | awk '{print $1}') # 更可靠的IP获取方式
if [ -z "$IP" ]; then
IP=$(ifconfig | grep 'inet ' | grep -v '127.0.0.1' | head -1 | awk '{print $2}')
fi
}

# 获取内存信息
get_memory_info() {
# 使用更详细的内存计算方式
MEM_INFO=$(free -m | grep Mem)
TOTAL=$(echo $MEM_INFO | awk '{print $2}')
USED=$(echo $MEM_INFO | awk '{print $3}')
FREE=$(echo $MEM_INFO | awk '{print $4}')
BUFFER=$(echo $MEM_INFO | awk '{print $6}')
CACHE=$(echo $MEM_INFO | awk '{print $7}')
# 实际可用内存 = 空闲内存 + 缓冲区 + 缓存
AVAILABLE=$((FREE + BUFFER + CACHE))
# 内存使用率(百分比)
USAGE_RATE=$((USED * 100 / TOTAL))
}

# 发送报警邮件
send_alert() {
SUBJECT="内存报警: $IP 内存不足"
BODY="
服务器内存使用率过高,请及时处理!

日期时间: $DATE
服务器IP: $IP
总内存: $TOTAL MB
已用内存: $USED MB
空闲内存: $FREE MB
缓冲内存: $BUFFER MB
缓存内存: $CACHE MB
实际可用内存: $AVAILABLE MB
内存使用率: $USAGE_RATE%

报警阈值: $THRESHOLD MB
"
echo "$BODY" | mail -s "$SUBJECT" $MAIL
log "发送内存报警邮件至 $MAIL"
}

# 主函数
main() {
get_system_info
get_memory_info

# 记录内存状态
log "内存状态 - 总内存: $TOTAL MB, 已用: $USED MB, 可用: $AVAILABLE MB, 使用率: $USAGE_RATE%"

# 检查是否需要报警
if [ $AVAILABLE -lt $THRESHOLD ]; then
log "内存不足! 可用内存 $AVAILABLE MB 低于阈值 $THRESHOLD MB"
send_alert
fi
}

# 如果作为独立脚本运行,循环监控;如果作为定时任务,只运行一次
if [ "$1" != "cron" ]; then
while true; do
main
sleep $CHECK_INTERVAL
done
else
main
fi

脚本优点

  1. 精准的内存计算逻辑
    不仅简单计算表面空闲内存,还通过 实际可用内存 = 空闲内存 + 缓冲区 + 缓存 的公式,贴合 Linux 内存管理机制(缓存和缓冲区可被系统自动释放),避免误报。同时增加内存使用率百分比,直观反映内存压力。
  2. 灵活的运行模式
    支持两种运行方式:
    • 作为独立进程循环监控(适合临时值守);
    • 作为定时任务通过 crontab 运行(适合长期监控),适配不同场景需求。
  3. 完善的日志系统
    所有监控状态(正常 / 报警)均记录到日志文件,便于追溯内存变化趋势,为问题分析提供历史数据支持。
  4. 健壮的异常处理
    • 兼容不同 Linux 发行版的 IP 地址获取方式(hostname -Iifconfig 双重兼容);
    • 自动创建日志文件并设置权限,避免因文件不存在导致脚本报错。
  5. 清晰的报警信息
    报警邮件包含总内存、已用内存、缓存、使用率等详细指标,而非简单的 “内存不足” 提示,帮助运维人员快速判断问题严重程度
  6. 模块化设计
    将系统信息获取、内存计算、日志记录、邮件发送等功能拆分为独立函数,便于后续修改或增加新功能(如添加微信 / 短信报警)

使用方法

  1. 保存脚本为memory_monitor.sh
  2. 修改脚本中的配置参数(尤其是邮箱地址)
  3. 赋予执行权限:chmod +x memory_monitor.sh
  4. 运行方式:
    • 直接运行(循环监控):./memory_monitor.sh
    • 作为定时任务(添加到 crontab):*/5 * * * * /path/to/memory_monitor.sh cron

注意事项

  1. 确保系统已安装mail工具,否则需要先安装(如yum install mailx
  2. 首次使用建议测试邮件发送功能是否正常
  3. 根据服务器内存大小调整合适的报警阈值
  4. 对于生产环境,建议结合更专业的监控工具(如 Prometheus+Grafana)使用

欢迎关注我的其它发布渠道

表情 | 预览
快来做第一个评论的人吧~
Powered By Valine
v1.3.10