ptn、各类告警

NE_NOT_LOGIN 

告警解释 

NE_NOT_LOGIN表示 元未登录。 

告警属性 

告警ID 告警级别 告警类型 

无法从 元侧查询该 元的配置数据。 · 

无法在 管上管理该 元。 

可能原因 

· 原因1: 元与 管通讯中断。 · 

原因2:用户退出登录或登录失败。 

处理步骤 

· 

原因1: 元与 管通讯中断。  

解决 元与 管通讯中断方法,参见NE_COMMU_BREAK。

原因2:用户退出登录或登录 元失败。  以其他正确的 元用户登录 元。 

· 

查看告警是否结束,若未结束,请进行下一步。 · 

如果故障依然存在,请联系华为工程师。 

   

MPLS_TUNNEL_LOCV 

告警解释 

MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。连续3个周期内没有收到希望的CV/FFD 文时出现此告警。 

告警属性 

告警ID     告警级别      告警类型 

0x320E       紧急          通信 

告警参数 

在 管中浏览告警时,选中该告警,在“告警详细信息”中会显示该告警的相关参数。告警参数的格式为“告警参数(16进制): 参数1 参数2数n”,如:告警参数(16进制):0x01 0x08每个参数的含义说明参见下表。

参数名称 参数含义 

参数1 表示单板ID。 

对系统的影响 

告警产生时,会触发MPLS APS倒换,将业务倒换到保护Tunnel。 · 

MPLS_TUNNEL_FDI告警将抑制MPLS_TUNNEL_LOCV告警的上 。 

可能原因 

告警MPLS_TUNNEL_LOCV产生的可能原因如下: 

· 

原因1:Tunnel的Ingress节点停止CV/FFD。 · 

原因2:物理链路故障。 

原因3:Ingress节点的单板正在复位。 · 

原因4:业务接口配置错误。 · 

原因5: 络出现严重拥塞。 

原因6:CPU占用率饱和,无法处理ARP协议 文。 

处理步骤 

· 

原因1:Tunnel的Ingress节点停止CV/FFD。

1. 在 管上分别进入上 告警的Tunnel的Ingress节点和Egress节点的“ 元管理器”,在功能树中选择“配置 > MPLS管理 > 单播Tunnel管理”。选择“OAM参数”选项卡。 

2. 查看两端的“检测方式”和“检测 文类型”参数配置是否一致。  

如果两端的参数 则 

不一致, 修改任一节点的参数配置使两端一致后,单击“应用”。 

一致, 继续下一步。 

3. 查看Ingress节点的“CV/FFD状态”参数。  

如果是 则 

“停止”, 右键单击该条Tunnel,在弹出的菜单中单击“启动CV/FFD”。查看告警是否清除。 

“启动”, 排查下一原因。 

· 

原因2:物理链路故障。 

1. 在 管上查看Egress节点是否存在HARD_BAD、ETH_LOS或ETH_LINK_DOWN告警,具体操作请参见在U2000上查询当前告警。  

如果 则 

存在, 优先清除这些告警后,查看本告警是否清除。 

不存在, 排查下一原因。 

· 

原因3:Ingress节点的单板正在复位。  

1. 在 管上查看Ingress节点是否存在COMMUN_FAIL告警。  

如果 则 

存在, 说明Ingress节点的单板可能正在复位,优先清除COMMUN_FAIL告警后,查看本告警是否清除。 

不存在, 排查下一原因。 

· 

原因4:接口配置错误。 

1. 对照 元规划表,查看Tunnel是否配置在正确的接口之上,例如查看下一跳IP地址。  

如果 则 

不正确, 重新正确配置Tunnel的接口。查看告警是否清除。 

正确, 排查下一原因。 

· 

原因5: 络出现严重拥塞。  

1. 检查故障Tunnel的带宽是否已被完全占用。  

如果 则 

是, 增大Tunnel带宽配置或消除非法发送大数据量的根源。查看告警是否清除。 

否, 继续下一步。 

2. 可选:对于动态Tunnel,查看业务路由是否经过了带宽较低的物理链路。

如果 则 

是, 重新配置正确的路由约束条件。查看告警是否清除。 

否, 排查下一原因。 

· 

原因6:CPU占用率饱和,无法处理ARP协议 文。  1. 在 管上查看是否存在CPU_BUSY告警。 

2. 如果存在,优先清除CPU_BUSY告警后,查看本告警是否清除。  

    

ETH_LINK_DOWN 

告警解释 

ETH_LINK_DOWN为 口连接故障告警。该告警表示以太 连接错误,端口协商失败。 

· 

在数据传输时, 口协商失败,无法接收数据,业务中断。 · 

ETH_LOS告警将抑制ETH_LINK_DOWN告警的上 。 

· 

ETH_LINK_DOWN告警将抑制LAG_MEMBER_DOWN和MAC_FCS_EXC告警的上 。 

可能原因 

告警ETH_LINK_DOWN产生的可能原因如下: 

· 

原因1:本端 元和对端 元的端口工作模式不一致,造成协商失败。 · 

原因2:端口内环回。 

· 

原因3:纤缆连接到错误的端口。 · 

原因4:单板故障。 

处理步骤 

· 

原因1:本端 元和对端 元的端口工作模式不一致,造成协商失败。  1. 在 管上查看两端 元的以太 端口工作模式是否一致。 2. 若不一致,修改设置,使两端的端口工作模式一致后,查看告警是否清除。具体操作请参见查询和设置以太 接口工作模式。

原因2:端口内环回。  

1. 在 管上查看两端端口是否存在LOOP_ALM告警,具体操作请参见在U2000上查询当前告警。 

2. 若存在,优化清除LOOP_ALM告警后,查看本告警是否清除。  

· 

原因3:纤缆连接到错误的端口。  

1. 对照 元规划表,查看上 告警的端口是否错插了纤缆,造成两端端口工作模式不一致。 2. 重新正确连接纤缆,清除告警。 

· 

原因4:单板故障。  

1. 在 管上查看两端 元的相关单板是否存在HARD_BAD等硬件类告警。 

2. 若存在,更换存在硬件类告警的单板后,查看本告警是否清除。具体操作请参见部件更换。 

    

ETH_LOS 

告警解释 

ETH_LOS为以太 端口连接丢失告警。该告警表示以太 端口接收不到以太 信 。

该告警产生时,以太 端口接收不到数据,业务中断。 

· 

LSR_NO_FITED和LASER_MOD_ERR告警将抑制ETH_LOS告警的上 。 · 

ETH_LOS告警将抑制其它以太 业务的相关告警。 

可能原因 

告警ETH_LOS产生的可能原因如下: 

· 

原因1:以太 端口的电缆或光纤没有连接好。 · 

原因2:电缆或光纤故障。 

· 

可选:原因3:本端 元接收光功率过低。 · 

原因4:单板故障。 

处理步骤 

· 

原因1:以太 端口的电缆或光纤没有连接好。 

1. 检查以太 端口的电缆或光纤是否接好,插紧松脱的电缆或光纤。 

· 

原因2:电缆或光纤故障。  

1. 检查电缆或光纤是否存在故障,更换故障的电缆或光纤。 

· 

可选:原因3:本端 元接收光功率过低。  

1. 在 管上查看对端 元是否存在OUT_PWR_ABN告警。若存在,优先清除该告警后,查看本告警是否清除。具体操作请参见在U2000上查询当前告警。 

2. 若告警未清除,清洁接收光口及光纤头表面。具体操作请参见检查及清洁光纤连接器。 

3. 若告警仍未消除,检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。正确使用法兰盘或光衰减器。  

4. 若告警仍未消除,通过增减光衰减器调整光功率至正常范围内。 

· 

原因4:单板故障。  

1. 更换上 告警的处理板。具体操作请参见部件更换。 2. 若告警未消除,更换对端 元对应的处理板。 

    

OUT_PWR_ABN

告警解释 

OUT_PWR_ABN告警表示输出光功率异常。 

告警属性 

告警ID 告警级别 告警类型 

0x001A 紧急 设备 

告警参数 

无 

对系统的影响 

该告警产生时,业务的传输性能受到影响,严重时会造成业务的中断。 

可能原因 

告警OUT_PWR_ABN产生的可能原因如下: 

· 

原因1:输出光功率过高或过低。 · 

原因2:单板故障。 

处理步骤 

· 

原因1:输出光功率过高或过低。  

  1. 更换上 告警的端口的光模块,查看告警是否清除。具体操作请参见更换可插拔光模块。

原因2:单板故障。  

1. 更换上 告警的单板,查看告警是否清除。具体操作请参见部件更换。 

     

SWDL_NEPKGCHECK 

告警解释 

SWDL_NEPKGCHECK告警表示包加载软件包中某个文件丢失或校验通不过且无法修复。主机在软件包文件巡检时发现文件丢失或校验通不过时,会自动从其它区的完整软件包进行修复,如果无法修复即上 此告警。 

告警属性 

告警ID 告警级别 告警类型 

0x023e 紧急 处理失败 

告警参数 

无 

对系统的影响 

· 

该告警产生时, 元将不能完成包加载操作。

若主机在软件包文件巡检时发现文件完整,没有丢失,告警将自动清除。 

可能原因 

SWDL_NEPKGCHECK告警产生的原因如下: 文件类型不匹配或丢失。 

处理步骤 

· 

原因:文件类型不匹配或丢失。  

1. 检查文件类型是否匹配、文件是否有丢失,如存在不匹配或丢失,重新下载匹配的软件。 

2. 重新进行软件包加载,更新软件包,查看告警是否清除。具体操作请参见《升级指导书》。  

   

NE_COMMU_BREAK 

告警解释 

元与 管通讯中断。 

告警属性 

告警ID 告警级别 告警类型

1 紧急 通信 

告警参数 

无。 

对系统的影响 

无法在 管上管理该 元。 

可能原因 

· 

原因1:该 元所属的 关 元无法与 管通讯,导致该 元通讯失败。 

· 原因2:该 元主控故障。 

· 原因3:该 元与 关 元之间的光纤故障。 

· 

原因4: 络规模过大,导致 元间ECC通信的规模超过 元处理能力的极限。 

处理步骤 

· 

原因1:该 元所属的 关 元无法与 管通讯,导致该 元通讯失败。  

  1. 检查该 关 元是否上 GNE_CONNECT_FAIL告警,若上 该告警,请先结束该告警,参见GNE_CONNECT_FAIL的告警解决方法。 2. 在 管上查看当前告警,检查该告警是否结束。如果告警不能结束,继续下一步。

1 紧急 通信 

告警参数 

无。 

对系统的影响 

无法在 管上管理该 元。 

可能原因 

· 

原因1:该 元所属的 关 元无法与 管通讯,导致该 元通讯失败。 

· 原因2:该 元主控故障。 

· 原因3:该 元与 关 元之间的光纤故障。 

· 

原因4: 络规模过大,导致 元间ECC通信的规模超过 元处理能力的极限。 

处理步骤 

· 

原因1:该 元所属的 关 元无法与 管通讯,导致该 元通讯失败。  

  1. 检查该 关 元是否上 GNE_CONNECT_FAIL告警,若上 该告警,请先结束该告警,参见GNE_CONNECT_FAIL的告警解决方法。 2. 在 管上查看当前告警,检查该告警是否结束。如果告警不能结束,继续下一步。

2. 在各子 中选择适当的普通 元,并将其转换为 关 元。  

说明:  

当子 中仍具有多个环路和链路时,将处于最多环路和链路的设备设置为 关 元,以避免大量的管理信息需要通过基于DCC这种窄带宽信道传送,从而减少DCN再次发生拥塞的可能性。 3. 关闭冗余子 之间的ECC连接。  

· 

关闭通过扩展ECC(自动/人工)实现的ECC子 之间的互通。 · 

关闭通过STM-N光/电口实现的ECC子 之间的互通。 

· 

如果故障依然存在,请联系华为工程师。 

参考信息 

表1 SCC单板指示灯说明 

指示灯丝印 指示灯名称 指示灯状态 状态描述 STAT 

硬件状态灯 

亮(绿色) 单板工作正常。 亮(红色) 

子架有紧急告警产生。 

亮(黄色) 子架有重要告警产生。

表1 SCC单板指示灯说明 

指示灯丝印 指示灯名称 指示灯状态 状态描述 灭 

单板没有开工或单板没有被创建或单板没有上电状态。 

PROG 软件状态灯 亮(红色) 表示内存自检失败或者上层软件加载不成功或者逻辑文件FPGA丢失或者上层软件丢失。 

快速闪烁(红色) 100毫秒亮100

毫秒灭。 BOOTROM自检失败。 

快速闪烁(绿色) 100毫秒亮100

毫秒灭。

表1 SCC单板指示灯说明 

指示灯丝印 指示灯名称 指示灯状态 状态描述 正在进行写FLASH操作或软件加载。 

慢速闪烁(绿色) 300毫秒亮300

毫秒灭。 表示正处在BIOS引导阶段。 

亮(绿色) 

表示上层软件初始化或者软件正常运行。 

SRV 

业务告警指示灯 亮(绿色) 

业务工作正常。 亮(红色) 

业务有紧急或重要告警。 

亮(黄色) 

业务有次要和远端告警。 

灭 

没有配置业务。

表1 SCC单板指示灯说明 

指示灯丝印 指示灯名称 指示灯状态 状态描述 ALMC 

告警关断指示灯 亮(黄色) 

当前处在告警长期切除状态。 

灭 有告警立刻用声音提示。 

        

MAC_FCS_SD 

告警解释 

MAC_FCS_SD为MAC层检测到误码劣化越限告警。软件定时检测MAC芯片接收字节数和误码字节数,计算误码是否超过劣化门限,超过设置的门限即上 此 警。 

告警属性 

告警ID 告警级别 告警类型 

0x31FB 次要 通信

告警参数 

无 

对系统的影响 

· 

该告警产生时,业务性能下降,甚至中断。 

可能原因 

告警MAC_FCS_SD产生的可能原因如下: 

· 

原因1:线路信 劣化。 

· 

可选:原因2:输入光功率不正常。 · 

可选:原因3:光纤头表面不清洁。 

处理步骤 

· 

原因1:线路信 劣化。  

1. 在 管上查看是否存在LOOP_ALM告警。若存在,优先清除LOOP_ALM告警后,查看本告警是否清除。具体操作请参见在U2000上查询当前告警。  

2. 若告警未清除,在 管上检查是否存在DOS攻击等。若存在,消除非法发送大量数据的根源,查看告警是否清除。 

3. 若告警仍未清除,查看光纤或电缆是否存在故障。更换故障的光纤或电缆后,查看告警是否清除。

可选:原因2:输入光功率不正常。  

1. 查看上 本告警的端口是否同时上 IN_PWR_ABN告警。 2. 若存在,优先清除IN_PWR_ABN告警后,查看本告警是否清除。 

· 

可选:原因3:光纤头表面不清洁。  

1. 清洁光纤头表面和处理板接收光口。具体操作请参见检查及清洁光纤连接器。 

    

LSR_WILL_DIE 

告警解释 

LSR_WILL_DIE为激光器寿命即将终止告警。该告警表示激光器不可用。 

告警属性 

告警ID 告警级别 告警类型 

0x0038 紧急 设备 

告警参数 

无 

对系统的影响

该告警产生时,业务会出现误码。若不及时更换光模块,激光器损坏后,会导致业务中断。 

· 

LSR_NO_FITED和LASER_MOD_ERR告警将抑制LSR_WILL_DIE告警的上 。 

可能原因 

告警LSR_WILL_DIE产生的可能原因如下: 

· 

原因1:激光器老化。 

· 

原因2:单板的检测电路故障。 

处理步骤 

· 

原因1:激光器老化。  

1. 更换光模块,查看告警是否清除。具体操作请参见更换可插拔光模块。 

· 

原因2:单板的检测电路故障。  

1. 更换上 告警的单板,查看告警是否清除。具体操作请参见部件更换。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年8月26日
下一篇 2021年9月1日

相关推荐