监控告警01–夜莺部署与接入

监控告警01–夜莺部署与接入

  • 1 滴滴夜莺简介
  • 2 部署
    • 2.1 docker-compose部署
    • 2.2 二进制部署 v4 版本
    • 2.3 客户端部署
  • 3 告警配置
    • 3.1 邮件告警
    • 3.2 飞书告警
    • 3.3 短信告警
    • 3.4 电话告警
  • 4 测试效果
  • 5 说明
    • 5.1 常见问题
    • 5.2 参考文档

1 滴滴夜莺简介

夜莺是滴滴开源的一套监控告警系统,其主要包括如下四个子系统,分别是:

  1. 用户资源中心(RDB)
  2. 资产管理系统(AMS)
  3. 任务执行中心(JOB)
  4. 监控告警系统(MON)
    更多详细介绍请参考官方文档:滴滴夜莺官方文档

2 部署

2.1 docker-compose部署

线上部署docker-compose版本无意义,步骤如下:

优点:速度快
缺点:重启容器后数据会丢失

2.2 二进制部署 v4 版本

安装常见软件(此处以centos系统为例子)

启动服务:

2.3 客户端部署

从管理机器上同步agent目录到待安装机器上, 然后启动agent即可(建议将夜莺相关的文件统一放在n9e用户目录下)

若需要更改agent上 server ip,直接修改 agent/etc/address.yml 中的ip即可

设置开机启动

3 告警配置

3.1 邮件告警

在系统配置-》smtp配置找那个添加好对应的smpt信息即可,例如:
smtpHost: smtp.163.com
smtpPort: 465
smtpUser: your_email@163.com
smtpPass: ******

3.2 飞书告警

改源码中的钉钉模块,然后手动编译server模块,替换上述安装步骤中的server即可。

  1. 修改server中的
  2. 修改server/con/sender_im.go 中的 dingtalk.RobotSend函数,使之与dingtalk.go 对应

3.3 短信告警

配置短线看告警需要配置server.yaml, 并且自己购买短信服务包,编写端口告警接口,然后替换server.yaml 中的 http://127.0.0.1:2008/sms

阿里云短信成本:
国际-500条,12month有效期, 250rmb
国内-5000条,24month有效期, 180rmb

3.4 电话告警

同上,也需要自己购买电话服务包,然后自己写接口,并同步更改server.yaml 中的电话接口。

4 测试效果

夜莺系统 址: http://your_ip_ip
默认用户名密码: root/root.2020
1)即时看图:
可以看到指定节点下机器的具体属性,如果是具体机器则需要选择为设备相关,若为具体组件则需要选择设备无关

监控告警01--夜莺部署与接入

5 说明

5.1 常见问题

  1. 使用n9e后,首先需要对依赖的组件进行监控,确保各组件能正常运行,否则会影响服务
    例如:redis挂了会导致告警不生效

5.2 参考文档

  1. 夜莺官方 docs/intro
  2. Nightingale 国产监控夜莺 v4 来了,大幅降低部署维护难度
  3. didi/nightingale github

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年5月26日
下一篇 2021年6月1日

相关推荐