通过ZABBIX,您可以监控服务器的内存使用情况并设置相应的警报。ZABBIX默认的剩余内存报警是:当主机的平均可用内存低于20M时触发警报。具体来说,可以在ZABBIX的监控系统中设置以下参数来监控内存使用率:
看你的是什么品牌服务器嘛,一般服务器都有BMC带外管理平台可以看硬件信息,zabbix通过snmp或者IPMI两种协议方式来获取服务器硬件状态信息来实现监控,内存有故障会收到相应提示。
收起zabbix 默认的监控模板是无法获取内存条的硬件故障信息的(能够获取基于操作系统的内存使用情况,包括内存容量、虚拟内存、可用内存等)。
需要获取硬件信息有2种方式,都需要自定义监控项
1、自定义监控脚本(如果有 IPMI 可以通过 IPMI 获取,没有 IPMI 的可以通过 dmidecode 或 demsg 指令)并提取内存设备信息
2、通过脚本分析并判断故障内存的槽位信息
3、提取并显示故障槽位信息,正常可以反馈0
可以通过Zabbix的监控功能来检测服务器内存条是否有故障。具体方法如下:
需要注意的是,Zabbix只能检测内存使用情况,不能直接检测内存条是否有故障。因此,如果内存使用率或者内存空闲量异常,需要进一步检测内存条是否有故障。