Vmware 虚拟平台监控、邮件告警、企业微信告警配置
8 Vmware 虚拟平台监控
阅读 zabbix 官方文档,官方提供了 Vmware 虚拟机监控模板,并对模板进行了解释说明,但未对相应名词做解释,如果不了解 Vmware 组件,可能对出现的名词不容易理解。
官方监控虚拟机相关文档 URL :
重要信息说明:
VMware vCenter :VMware 平台用于管理的服务端,管理群集、主机、虚拟机、存储等。
VMware hypervisors :主机,安装了 ESXI 软件的服务器。
Template VM VMware“ 模板应用于 VMware vCenter 和 VMware hypervisors 监控。
Template VM VMware Hypervisor 和 Template VM VMware Guest 模板由自动发现使用,通常设置为自动链接到主机。
low-level discovery 规则自动发现 VMware hypervisors 和虚拟机, LDD 就是自动发现。
采用官方提供的监控模板流程是这样实现的,首先建立监控主机,可以监控的对象是 VMware vCenter 虚拟化平台或者是 ESXI 主机,链接 Template VM VMware 模板,等待 zabbix server 服务自动发现,而后对群集、主机、虚拟机等进行监控。
有一节单讲组配置,制定 VMware 下群集、主机、虚拟机、存储等命名规范。
8.1 自发现模板配置
主要通过创建主机 VMware vCenter 和 ESXI ,连接 Template VM VMware 模板,进行自发现获取群集、主机、虚拟机、存储等信息。
8.1.1 创建主机
此处创建主机为 Vmware Vcenter 平台,配置如下:
{$URL} https://IP 地址 /sdk
{$USERNAME} 账
为了使 zabbix 平台 Vmware 分组分类整洁明了,方便管理审阅,规范 zabbix 下虚拟化平台分组名称。
- 首先宏观分 3 大类, Vmware 平台、 ESXI 主机和 WM 虚拟机
Zabbix 创建主机组的命名规范:用于添加 Vmware Vcenter 的组
8.3 规范模板中组的命名
Template VM VMware 模板修改,需要修改 Vmware 自动发现主机与自动发现虚拟机的主机模板。
根据 8.2 节, zabbix 命名规范,修改组模板的三项:
1 、 Vmware 虚拟机组 群集 Cluster :{#CLUSTER.NAME}
2 、 Vmware 虚拟机组 数据中心 Datecenter :{#DATACENTER.NAME}
3 、 Vmware 虚拟机组 主机 ESXI :{#HV.NAME}
要先创建 zabbix 主机组:Vmware 平台 VM 虚拟机组,才能在此处的 “ 群组 ” 中添加。
说明:包括所有虚拟机,跨数据中心。
配置如下图:
Balloon 产生会在某种程度上说明:内存资源不足。此情况发生在,需要 vm kernel 调度其他 VM 虚拟机上空闲的内存资源,给内存不足的 VM 虚拟机。
创建触发器:
名称:虚拟机电源关闭:{HOST.NAME}
问题表现形式:{Template VM VMware Guest:vmware.vm.powerstate[{$URL},{HOST.HOST}].abschange()}=1
恢复表达式:{Template VM VMware Guest:vmware.vm.powerstate[{$URL},{HOST.HOST}].last()}<>0
注意:表达式多种多样,但有的并不一定能实现。
重要关键指标:共享内存大小、气球内存大小、交换内存大小、压缩内存大小。
内存资源严重性逐步提高。共享、气球内存是 VM 合理利用内存的方式,避免:交换内存、压缩内存的产生。
共享内存大小:
监控群集整体状态
未 错,邮箱不能收到邮件可能被邮箱服务器屏蔽掉了, 139 邮箱收不到信息,
未 错,邮箱能收到邮件说明发送正常。
9.1.2 zabbix 界面配置
1 、设定发送 mail 途径
管理》 警媒介类型》 Email ,配置截图如下:
配置》动作》创建动作》动作、操作、恢复操作、确认操作,根据情况来设定。
详细配置,见 9.3 节。
9.2.1 zabbix linux 下配置
本例中使用发送告警邮件的账 为 1833XXXX@139.com ,移动 139 邮箱,邮箱开启短信功能,手机就可以收到告警短信,
1 、关闭 sendmail 和 postfix 服务,重启域名服务。
set from 邮件从该邮件发出
set smtp 配置邮件服务的 smtp 域名地址
set smtp-auth 使用这个邮箱账户发送告警信息,需要填写用户名密码。
3 、mail 发邮件测试
1 、设定发送 mail 途径
管理》 警媒介类型》创建媒介类型,配置截图如下:
配置》动作》创建动作》动作、操作、恢复操作、确认操作,根据情况来设定。
详细配置,见 9.3 节。
动作功能:将告警信息以什么样的方式,什么样的内容形式发送给运维人员知晓。
界面配置示意图:动作名称是:外部邮件方式。需要创建
【故障】服务器 :{HOSTNAME1} 发生 : {TRIGGER.NAME} 故障
默认信息如:
告警主机 :{HOSTNAME1}
告警时间 :{EVENT.DATE} {EVENT.TIME}
告警等级 :{TRIGGER.SEVERITY}
告警信息 : {TRIGGER.NAME}
告警项目 :{TRIGGER.KEY1}
问题详情 :{ITEM.NAME}
事件 ID:{EVENT.ID}
操作细节
1-1 触发一次告警
步骤持续时间默认 0 为 1 小时
仅送到 选择创建的脚本名称 send_mail_script
9.3.2 恢复操作
10 微信告警
微信告警是指企业微信告警,首先要注册一个企业微信,之后完成微信告警配置(可搜索参考 上文章)。
10.1 脚本
这里提供一个优化测试好的脚本模板,以供交流

10.2 消息配置
【故障】数据中心监控平台
告警主机:{HOST.NAME}
告警信息:{TRIGGER.NAME}
告警等级:{TRIGGER.SEVERITY}
告警日期:{EVENT.DATE}
告警时间:{EVENT.TIME}
事件 ID :{EVENT.ID}
https://mp.weixin.qq.com/s/KevXBoSg1YYFNe9av8TzmA
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!