浅谈 Linux 系统中的 SNMP Trap
(Simple Network Management Protocol)TCP/IP
SNMPSNMP
SNMP 管理控制框架
简而言之,SNMP 协议是用来管理设备的协议,何谓管理呢斗胆将其归纳为两个基本点:监控(get)和配置(set)。也就是说:人们管理一个设备的基本手段可以归纳为 get 和 set 两种操作。如图 1 所示。
图 1. SNMP 基本管理控制框架
如果 NMS( 管系统 ) 需要查询被管理设备的状态,则需要通过 SNMP 的 get 操作获得设备的状态信息;同样,如果 NMS 需要修改或者配置被管理设备的参数,则需要通过 SNMP 的 set 操作来完成。
什么是 MIB/h3>
MIB 是描述被管理设备上的参数的数据结构。如前所述,管理一个设备,就是利用 SNMP 协议,通过 络对被管理设备上的参数进行 get 和 set 操作。
那么如何组织被管理设备上的参数呢数情况下,可以 get 和 set 的参数实在多得惊人,假如仅仅简单地线性罗列它们,操作会十分不便。想象一下把 1000 个参数列成一张表,需要使用的时候查询这样一张表会有多么困难啊如您打算在地球上找一个城市,”Ithaca”,如果没有归类和分级,则需要查找一张巨大的表格。但如果告诉您城市” Ithaca”是:南美洲国家圭亚那的北部城市”Ithaca”,那么就容易些了吧/p>
被管理的设备相当复杂,拥有很多可以被管理的参数,需要对它们进行归类,分级。管理信息库 (MIB) 是一个具有分层特性的信息的集合,我们可以通过 SNMP 去存取它。MIB 的成员是一些被管理的对象 (Managed Object),以对象标示符 (Object Identifiers) 来区分它们。被管理的对象由一个或多个对象实例 (Object Instances) 组成,本质上,这些对象实例就是变量。
在 MIB 的层次结构中,一个对象标示符唯一标识了被管理对象。MIB 的层次结构可以被描述成无根名的树,树的级别被不同的组织所划分。如下图所示:
图 2. MIB 树
很多能够被 SNMP 管理的对象都是由标准组织定义好的。比如系统磁盘的信息,用 OID ”1.3.6.1.4.1.2021.9” 表示。这串数字是国际标准化组织协商定义好的,大家都要去遵循它。当然,国际组织不可能预知未来,如果您要开发的设备有一些管理需求没有任何 RFC 定义过,那么您也可以编写自己的 MIB 文件来定义私有的 MIB 对象。
什么是 SNMP Trap
前面介绍的 get/set 操作都是从 NMS 发送到被管理设备的。但有时候,能够从被管理设备主动发送信息到 NMS 也是非常必要的。
SNMP Trap 是 SNMP 的一部分,当被监控段出现特定事件,可能是性能问题,甚至是 络设备接口宕掉等,代理端会给管理站发告警事件。假如在特定事件出现的时刻,不是由 Agent 主动通知 NMS,那么 NMS 必须不断地对 Agent 进行轮询。这是非常浪费计算资源的方法,正如人们用中断通知 CPU 数据的到达,而不是让 CPU 进行轮询一样。Trap 通知是更加合理的选择。
NET-SNMP 简介
在 Linux 系统中,我们可以选择 net-snmp 来处理绝大多数和 SNMP 相关的工作。
NET-SNMP 是一种开放源代码的 SNMP 协议实现。它支持 SNMP v1, SNMP v2c 与 SNMP v3,并可以使用 IPV4 及 IPV6 。也包含 SNMP Trap 的所有相关实现。Net-snmp 包含了 snmp 实用程序集和完整的 snmp 开发库。
用户使用 net-snmp 提供的工具,可以完成很多关于 SNMP 的操作,具体说来,包括以下一些命令行应用程序:
一些应用程序可以用来从支持 SNMP 的设备获得数据。其中 snmpget, snmpgetnext 可以支持独立请求,比如:
1 2 |
该命令获得单个独立的 MIB 对象 system.sysUpTime.0 的值。
而 snmpwalk, snmptable, snmpdelta 则用来支持重复请求。
1 2 3 4 5 6 |
上面的命令返回所有 system 节点以下的 MIB 对象的值。
命令 snmpset 对支持 SNMP 的设备配置属性。如下例所示:
1 2 3 4 5 6 |
命令 snmpdf, snmpnetstat, snmpstatus 可以从支持 SNMP 的设备获取特定的信息。比如下面的命令从目标系统上获得类似 netstat 的信息:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
|
snmptranslate 命令将 MIB OIDs 的两种表现形式 ( 数字及文字 ) 相互转换。并显示 MIB 的内容与结构,如下所示:
1 2 3 4 |
Net-snmp 还提供了一个基于 Tk/perl 的,图形化的 MIB 浏览器 tkmib。
图 2. Tkmib 界面
Net-snmp 还提供了一个回应 SNMP 查询的客户端 snmpd. 它集成了大量 SNMP 的模块 . 并可通过动态链接库 , 外部脚本与命令 , 多路 SNMP 技术 (SMUX), 以及可扩客户端协议 (AgentX) 进行扩展 .
此外,net-snmp 还包含了用来开发 SNMP 应用程序的程序库。支持 C 与 perl 的 APIs。因此您可以使用 net-snmp 的工具集完成一些关于 SNMP 的工作,也可以依赖 net-snmp 提供的开发包自己写程序开发您所需要的 snmp 应用。
NET-SNMP 的安装
不同的 Linux 发行版有不同的包管理机制,因此在这里,我打算写下从源代码安装 net-snmp 的过程,适用于各种 Linux 发行版。
到 sourceforge 站下载适合的 net-snmp 版本,解压。
执行文件目录下的 configure 可执行文件,如果想指定程序包的安装路径,那么您首先建立相应的文件夹来存放安装信息,您可以写成 ./configure –prefix= 您指定的路径名。参数 –prefix 用来告诉系统安装信息存放的路径,如果您没有指定路径,直接执行 ./configure,那么程序包都会安装在系统默认的目录下,通常为:/usr/local 下。例如:
1 |
在配置过程中需要进行一些简单的选择:
1 2 3 4 5 6 7 8 9 |
|
之后编译并且安装:
1 |
Snmp Trap 的发送和接收演示
图 4. SNMP Trap 实验环境
设计一个 Trap 消息
Trap 消息也是用 MIB 来定义的。在下面的例子中,我们定义了一个 Trap 消息:nodeDown
清单 1. Trap nodeDown 的 MIB 定义
1 2 3 4 |
nodeDown 被定义为 Notification 类型,即 SNMPv2 类型的 Trap。
图 5. 包含 Trap nodedown 的完整 MIB 树
NodeDown 对象位于 notification 节点下,子 OID 为 1。该 Trap 消息中我们打算包含两个数据对象:Host 名字和 IP 地址。Host 和 ip 位于 enterprises.sampleTest.data 分支下。
搭建接受 Trap 的 snmptrapd 进程
可以利用 Net-snmp 提供的 snmptrapd 应用程序作为后台 SNMP Trap 服务器,负责接收被管理设备发送过来的 Trap 消息。
在图 4 实验机 M1 的命令行窗口中输入以下命令:
1 |
该命令启动了一个 snmptrapd 进程,守候在 UDP 端口 1622 上,侦听 SNMP Trap 消息。-c 命令行指定了名为 mysnmptrapd.conf 的配置文件。文件内容如下:
1 2 3 |
其中,以 traphandle 开头的一行定义了 snmptrapd 进程接收到 Trap 消息后应该执行的动作。在本例中,lognotify 是一个 shell 脚本,功能是将接收到的 Trap 信息写入文件 checkfile。
以 authCommunity 开头的一行配置了 snmptrapd 的安全设置,表示可以接收 community 为”public”的 SNMP Trap,并且本进程可以有 log,net 和 execute 的权限。
Log 权限表明收到 Trap 之后 snmptrapd 可以记录日志;execute 表明收到 Trap 之后可以执行 traphandle 中所指定的操作。Net 表示 snmptrapd 可以将接收到的 Trap 信息转发到其他的 Receiver 去。(假如需要转发,还需要对给定的 OID 指定以 forward 为开始的处理细节:forward OID|default DESTINATION)
脚本 lognotify 代码如下:
清单 2. Lognotify 脚本
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
|
使用 snmptrap 发送 SNMP Trap
可以用命令 snmptrap 在测试机 M2 上发送一个 SNMP Trap。假定 Trap 定义在文件 sample-trap.mib 中。在测试机 M2 上输入以下命令:
1 2 |
您在试验的时候,将 IP 地址替换为 M1 的真实 IP 地址即可。在上面的例子命令中我们只设置了 Trap nodeDown 消息中的 host 信息。其 OID 为 IBM-DW-SAMPLE::nodeDown.1。字母 s 表示该 OID 的类型为 string。“M1”为该 OID 变量的值。
打开文件 checkfile,应该能够看到如下信息:
1 2 3 4 5 |
还不错,这表示我们已经能够用 snmptrap 发送 Trap;并且能够使用 snmptrapd 来接收 Trap 消息了。
此例虽然简单,但却是 SNMP Trap 的典型应用。实际生产环境中的 SNMP Trap 应用的基本模型和本例是类似的。
此外,有的时候,我们可能不仅需要 net-snmp 所提供的现成工具,还需要在自己开发的应用程序中编码发送 Trap。Net-snmp 不仅提供了现成的工具,也提供了开发库,下面我们来看看如何在 C 程序中调用 net-snmp 的库函数进行 SNMP Trap 的开发吧。
C 语言直接调用 API 进行 SNMP Trap 处理
C/C++ 依旧是很多系统必须的编程语言,当您的 C/C++ 程序需要发送 SNMP Trap 时,便可以考虑使用 net-snmp 提供的 SNMP 库函数来实现。
所需要的头文件
为了使用 netsnmp 的 API,必须 include 以下这些头文件:
1 2 |
初始化
在使用 netsnmp 库之前,先要做一些必要的初始化工作。 函数 init_snmp 初始化 SNMP Library。 假如在调用 init_snmp 函数时指定了文件名,init_snmp 函数将读取配置文件,设置诸如 Access Control 等具体配置。否则会使用默认的 /etc 下面的配置文件。
初始化 SNMP 库之后,我们就可以打开一个会话 session。此后所有和 NMS 的信息交互都在该 session 内进行,因为可能在同一台机器上运行多个 SNMP 进程,每个进程都需要自己独立的 session 来和 NMS 进行信息交互。
调用函数 snmp_sess_init 成功后将返回一个 session 数据结构。我们用该数据结构来设置 session 的属性,比如 peer 的 IP 信息。
这里 peer 就是图 2 中的 M2,在我本人的试验环境下,该机器的 IP 地址为 16.157.76.227。因此在下面的代码中,我将 peername 设置为 16.157.76.227。
还可以设置其它的必要信息,比如 Community,即用于 SNMP 安全的 区设置,前面 snmptrapd 设置为 public,因此这里也设置为 public。这类似于通行密码,不过安全性的确比较弱。
Session 属性设置好之后便可以使用函数 snmp_open 打开 session。示例代码如下。
清单 3. 代码最大长度示例
1 2 3 4 5 6 7 8 9 10 |
打开一个会话之后,程序可以通过该会话发送 Trap 给 NMS,也可以从 NMS 接受 SNMP get/set 操作。
创建 pdu,发送 Trap
图 3. SNMP Trap PDU 格式
其中各个组成部分的解释如下: sysUpTime– 被管理设备上一次初始化 络到本 Trap 发送以来的累积时间。 snmpTrapOID– 表示本 PDU 是一个 Trap,有固定的值。对于一般的 Trap,RFC1907 给出了通用的定义。用户自定义的 Trap 通常是由以下几个部分连接而成:SNMPv1 Enterprise parameter + ‘0’ + SNMPv1 Specific trap code。 VarBindList– 变量列表,所谓变量就是 Trap 消息中所携带的信息单元。
下面的代码片断用来填充如图三所示的一个 PDU。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
|
首先调用函数 snmp_pdu_create 创建一个 SNMPv2 的 Trap PDU。然后调用 snmp_add_var 向该 PDU 中添加图三所示的三个部分。 sysUpTime 在 SNMPv2-MIB 中定义,其 OID 为”1.3.6.1.2.1.1.3.0”。我们只需要通过 get_uptime() 函数获得该值,然后调用 snmp_add_var 将该变量加入刚才创建的 PDU 中。
同理,snmpTrapOID 也是固定的 :” 1.3.6.1.6.3.1.1.4.1.0”。同样利用 snmp_add_var 函数将我们定义的 OID 为“IBM-DW-SAMPLE::nodeDown”的 Trap 加入该 PDU。 稍稍留意一下,您应该可以发现,sysUpTime 的类型为’t’,即 timestamp;而 snmpTrapOID 的类型为’ o ’,即 OID 类型。PDU 内的每一个元素都拥有自己的类型。 在该 Trap 中,我们还打算携带两个变量:IBM-DW-SAMPLE::host 和 IBM-DW-SAMPLE::ip。表示一些真正有趣的信息。 添加这两个变量的代码如下所示:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
用 snmp_parse_oid 解析相应变量的 OID,然后就可以调用 snmp_add_var 将您想设置的值加入 PDU 中了。假如您直接在代码中使用”HP-DW-SAMPLE::ip”的 OID,(即 1.3.6.1.4.1.10234.10.2),那么可以不需要调用 snmp_parse_oid。该函数只是把一个好记的字符串翻译为一串数字的 OID。不过这就好比用 16.157.1.2 而不使用 www.ibm.com 一样。
至此,一个 SNMP Trap PDU 就创建成功了。将该 PDU 发送出去即可:
1 2 3 4 |
结束清理
程序结束之前需要做清理工作,代码如下:
1 2 3 |
一个基本的 SNMP Trap 发送程序就这样完成了。我们在 M1 上编译运行它:
1 2 |
在 M2 上查看 checkfile,可以验证所收到的 Trap 消息的内容。假如您能看到该文件中正确的内容,那么恭喜您,您已经拥有了编程发送 SNMP Trap 的能力了。
结束语
补充linux服务器snmp常用oid :
系统参数(1.3.6.1.2.1.1) |
|||
OID |
描述 |
备注 |
请求方式 |
.1.3.6.1.2.1.1.1.0 |
获取系统基本信息 |
SysDesc |
GET |
.1.3.6.1.2.1.1.3.0 |
监控时间 |
sysUptime |
GET |
.1.3.6.1.2.1.1.4.0 |
系统联系人 |
sysContact |
GET |
.1.3.6.1.2.1.1.5.0 |
获取机器名 |
SysName |
GET |
.1.3.6.1.2.1.1.6.0 |
机器坐在位置 |
SysLocation |
GET |
.1.3.6.1.2.1.1.7.0 |
机器提供的服务 |
SysService |
GET |
.1.3.6.1.2.1.25.4.2.1.2 |
系统运行的进程列表 |
hrSWRunName |
WALK |
.1.3.6.1.2.1.25.6.3.1.2 |
系统安装的软件列表 |
hrSWInstalledName |
WALK |
络接口(1.3.6.1.2.1.2) |
|||
OID |
描述 |
备注 |
请求方式 |
.1.3.6.1.2.1.2.1.0 |
络接口的数目 |
IfNumber |
GET |
.1.3.6.1.2.1.2.2.1.2 |
络接口信息描述 |
IfDescr |
WALK |
.1.3.6.1.2.1.2.2.1.3 |
络接口类型 |
IfType |
WALK |
.1.3.6.1.2.1.2.2.1.4 |
接口发送和接收的最大IP数据 [BYTE] |
IfMTU |
WALK |
.1.3.6.1.2.1.2.2.1.5 |
接口当前带宽[bps] |
IfSpeed |
WALK |
.1.3.6.1.2.1.2.2.1.6 |
接口的物理地址 |
IfPhysAddress |
WALK |
.1.3.6.1.2.1.2.2.1.8 |
接口当前操作状态[up|down] |
IfOperStatus |
WALK |
.1.3.6.1.2.1.2.2.1.10 |
接口收到的字节数 |
IfInOctet |
WALK |
.1.3.6.1.2.1.2.2.1.16 |
接口发送的字节数 |
IfOutOctet |
WALK |
.1.3.6.1.2.1.2.2.1.11 |
接口收到的数据包个数 |
IfInUcastPkts |
WALK |
.1.3.6.1.2.1.2.2.1.17 |
接口发送的数据包个数 |
IfOutUcastPkts |
WALK |
CPU及负载 |
|||
OID |
描述 |
备注 |
请求方式 |
. 1.3.6.1.4.1.2021.11.9.0 |
用户CPU百分比 |
ssCpuUser |
GET |
. 1.3.6.1.4.1.2021.11.10.0 |
系统CPU百分比 |
ssCpuSystem |
GET |
. 1.3.6.1.4.1.2021.11.11.0 |
空闲CPU百分比 |
ssCpuIdle |
GET |
. 1.3.6.1.4.1.2021.11.50.0 |
原始用户CPU使用时间 |
ssCpuRawUser |
GET |
.1.3.6.1.4.1.2021.11.51.0 |
原始nice占用时间 |
ssCpuRawNice |
GET |
. 1.3.6.1.4.1.2021.11.52.0 |
原始系统CPU使用时间 |
ssCpuRawSystem. |
GET |
. 1.3.6.1.4.1.2021.11.53.0 |
原始CPU空闲时间 |
ssCpuRawIdle |
GET |
. 1.3.6.1.2.1.25.3.3.1.2 |
CPU的当前负载,N个核就有N个负载 |
hrProcessorLoad |
WALK |
. 1.3.6.1.4.1.2021.11.3.0 |
ssSwapIn |
GET |
|
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!
Java【虚拟机】面试题
上一篇
2019年3月21日
软件工程第四次作业
下一篇
2019年3月21日
|