对于所有企业来说,系统的健康运行是根基,为保障系统稳定运转,运维监控系统和监控工具顺势而出,高效的监控工具可释放运维人员>80%的工作量,事前预警系统故障,事后用于溯源定位,运维监控系统以不可挡的趋势变为产品生命周期中最重要的环节。
与此同时,业界提供了诸多开源、功能强大的监控系统可供选择,如下列举。
开源运维监控系统
目前相对比较成熟的开源运维监控系统有zabbix、nagios和open-falcon。
Nagios是一个主要用于监控系统运行状态和 络信息的监控系统。Nagios能监控所指定的本地或远程主机以及服务,同时提供异常通知等功能。
Open-Falcon是小米运维部门开发出来的互联 企业级监控系统,目前包括小米、金山云、美团、京东金融、赶集 等都在使用Open-Falcon。Open-Falcon 整体可以分为两部分,即绘图组件、告警组件。
zabbix是一个老牌监控系统,基于web界面的企业级开源监控软件。Zabbix服务器需要LAMP环境或LNMP环境,提供分布式系统监控与 络监视功能。其具备主机的性能监控, 络设备性能监控,数据库性能监控,多种告警方式,详细 表、图表的绘制等功能。监测对象可以是Linux或Windows服务器,也可以是路由器、交换机等 络设备,通过SNMP、zabbix Agent、PING、端口监视等方法提供对远程 络服务器等监控、数据收集等功能。
Zabbix服务基础架构
Zabbix属于C/S架构(被监控的server须要安装监控软件,既能够主动链接客户端,也能够被动的让客户端推送本身的状态),基于C++开发,监控中心支持web界面配置和管理。sql单server节点能够支持上万台客户端(可支持同时上万台的server监控,并发量高,若是超过必定的量,性能可能会下降,可是咱们能够增长Proxy代理点来充当监控服务器来减轻压力)
Zabbix的5个组件
?zabbix-server 监控中心,接收客户端上 信息,负责配置、统计、操做数据。bootstrap;
?数据存储 存放数据,好比mysql;
?web界面 也叫web UI,在web界面下操做配置是zabbix简单易用的主要缘由;
?zabbix-proxy 可选组件,它能够代替zabbix-server的功能,减轻server的压力;
?zabbix-agent 客户端软件,负责采集各个监控服务或项目的数据,并上 。
zabbix的主要特点
?安装与配置相对简单;
?支持多语言(包括中文);
?免费开源;
?自动发现服务器与 络设备;
?分布式监视以及WEB集中管理功能;
?可以无agent监视;
?用户安全认证和柔软的授权方式;
?通过WEB界面设置或查看监视结果;
?Email、短信、微信等通知功能。
监控实践
服务器监控
某用户每日例行监控中需要提供50台机器的CPU、内存、磁盘使用率的信息截图,通过zabbix页面“最新数据”模块可以筛选出相关数据。
服务器告警
由于用户内部系统均与外 隔离,通过配置“组态—动作”模块实现触发器告警,并通过短信方式发送至用户组的手机 码,可配置告警解除后的短信通知。
通过“监控中—事件”模块可查看历史告警信息。
当某台主机频繁告警,可以通过“监测中—图形”模块的走势图,快速帮助定位并溯源问题原因。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!