Ubuntu 分卷监控实用指南
一 快速巡检与定位
- 容量与 inode:使用 df -hT 查看各分卷的总容量、已用/可用空间、使用率与文件系统类型;使用 df -i 检查是否发生 inode 耗尽(很多“磁盘满”其实是 inode 满)。
- 目录占用定位:用 du -sh /path 汇总目录大小;用 ncdu /path 交互式找出大目录/大文件(需安装:sudo apt install ncdu)。
- 块设备与分区拓扑:用 lsblk -f 查看设备、分区、文件系统与挂载点关系;用 sudo fdisk -l 或 sudo parted -l 查看分区表;用 blkid 查看 UUID/文件系统类型。
- 硬件健康:对物理盘执行 sudo smartctl -a /dev/sda 查看 S.M.A.R.T. 健康信息(需安装 smartmontools)。
二 实时性能与瓶颈定位
- 安装性能工具集:sudo apt install sysstat iotop dstat。
- 设备级 I/O:用 iostat -x 1 观察关键指标——%util(设备利用率,接近 100% 表示磁盘饱和)、await(平均 I/O 响应时间)、r/s/w/s(每秒读写次数)、rkB/s/wkB/s(吞吐)。
- 系统级 I/O:用 vmstat 1 关注 wa(I/O 等待占比)、bi/bo(块设备读写)。
- 进程级 I/O:用 sudo iotop -o 仅显示正在做 I/O 的进程,并按 Shift+P 按 I/O 速率排序。
- 多盘对比与综合视图:用 dstat -d –disk-util 同时观察多块盘的利用率与吞吐。
三 LVM 专项监控
- 层级关系梳理:用 lsblk 确认 逻辑卷 → 卷组 → 物理卷 的映射与挂载点。
- 容量与剩余空间:用 vgdisplay 查看卷组总容量与剩余空间;用 pvdisplay 查看物理卷分配情况;用 lvdisplay 查看逻辑卷大小与属性。
- 性能关联分析:定位到具体 物理盘(如 /dev/sdX) 后用 iostat -x 1 观察 %util/await,避免只看挂载点而误判瓶颈位置。
四 自动化巡检与阈值告警
- 轻量脚本示例(按挂载点或设备路径,支持自定义阈值):
#!/usr/bin/env bash set -euo pipefail if [ $# -ne 3 ]; then echo "Usage: $0 <mount_point_or_device> <warn%> <crit%>" exit 3 fi mp="$1"; warn="$2"; crit="$3" used=$(df -P "$mp" | awk 'NR==2{gsub(/%/,"",$5); print $5}') if [ "$used" -ge "$crit" ]; then echo "CRITICAL: $mp usage ${used}% (threshold ${crit}%)" exit 2 elif [ "$used" -ge "$warn" ]; then echo "WARNING: $mp usage ${used}% (threshold ${warn}%)" exit 1 else echo "OK: $mp usage ${used}%" exit 0 fi用法示例:chmod +x check_mount.sh && ./check_mount.sh / 85 95。
- 定时巡检与落盘:
- cron:每分钟记录一次 df
* * * * * root df -h >> /var/log/df.log 2>&1 - systemd Timer(每 5 分钟执行一次):创建服务 disk-check.service 与定时器 disk-check.timer,启用:
sudo systemctl daemon-reload && sudo systemctl enable –now disk-check.timer
- cron:每分钟记录一次 df
- 集中监控与可视化:
- 轻量实时:安装 Netdata(访问 http://服务器IP:19999)查看分卷 I/O 速率、空间使用 等。
- 传统平台:Zabbix/Nagios/Munin 配置分卷使用率阈值告警(如 >80% 警告、>90% 严重)。
五 常见排错要点
- 同时监控 容量与 inode(df -h 与 df -i),很多异常由 inode 耗尽引起。
- 分清 挂载点 与 物理盘:性能瓶颈常出现在承载该分卷的 物理盘,用 iostat -x 1 观察 %util/await 更准确。
- 目录增长定位优先用 ncdu,快速清理或制定扩容策略。
- 对生产盘定期做 S.M.A.R.T. 健康检查(smartctl -a),与容量/I-O 告警配合降低风险。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 55@qq.com 举报,一经查实,本站将立刻删除。转转请注明出处:https://www.szhjjp.com/n/1486125.html