ptn、各类告警

NE_NOT_LOGIN 

告警解释 

NE_NOT_LOGIN表示网元未登录。 

告警属性 

告警ID 告警级别 告警类型 

无法从网元侧查询该网元的配置数据。 · 

无法在网管上管理该网元。 

可能原因 

· 原因1:网元与网管通讯中断。 · 

原因2:用户退出登录或登录失败。 

处理步骤 

· 

原因1:网元与网管通讯中断。  

解决网元与网管通讯中断方法,参见NE_COMMU_BREAK。

原因2:用户退出登录或登录网元失败。  以其他正确的网元用户登录网元。 

· 

查看告警是否结束,若未结束,请进行下一步。 · 

如果故障依然存在,请联系华为工程师。 

   

MPLS_TUNNEL_LOCV 

告警解释 

MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。连续3个周期内没有收到希望的CV/FFD报文时出现此告警。 

告警属性 

告警ID     告警级别      告警类型 

0x320E       紧急          通信 

告警参数 

在网管中浏览告警时,选中该告警,在“告警详细信息”中会显示该告警的相关参数。告警参数的格式为“告警参数(16进制): 参数1 参数2数n”,如:告警参数(16进制):0x01 0x08每个参数的含义说明参见下表。

参数名称 参数含义 

参数1 表示单板ID。 

对系统的影响 

告警产生时,会触发MPLS APS倒换,将业务倒换到保护Tunnel。 · 

MPLS_TUNNEL_FDI告警将抑制MPLS_TUNNEL_LOCV告警的上报。 

可能原因 

告警MPLS_TUNNEL_LOCV产生的可能原因如下: 

· 

原因1:Tunnel的Ingress节点停止CV/FFD。 · 

原因2:物理链路故障。 

原因3:Ingress节点的单板正在复位。 · 

原因4:业务接口配置错误。 · 

原因5:网络出现严重拥塞。 

原因6:CPU占用率饱和,无法处理ARP协议报文。 

处理步骤 

· 

原因1:Tunnel的Ingress节点停止CV/FFD。

1. 在网管上分别进入上报告警的Tunnel的Ingress节点和Egress节点的“网元管理器”,在功能树中选择“配置 > MPLS管理 > 单播Tunnel管理”。选择“OAM参数”选项卡。 

2. 查看两端的“检测方式”和“检测报文类型”参数配置是否一致。  

如果两端的参数 则 

不一致, 修改任一节点的参数配置使两端一致后,单击“应用”。 

一致, 继续下一步。 

3. 查看Ingress节点的“CV/FFD状态”参数。  

如果是 则 

“停止”, 右键单击该条Tunnel,在弹出的菜单中单击“启动CV/FFD”。查看告警是否清除。 

“启动”, 排查下一原因。 

· 

原因2:物理链路故障。 

1. 在网管上查看Egress节点是否存在HARD_BAD、ETH_LOS或ETH_LINK_DOWN告警,具体操作请参见在U2000上查询当前告警。  

如果 则 

存在, 优先清除这些告警后,查看本告警是否清除。 

不存在, 排查下一原因。 

· 

原因3:Ingress节点的单板正在复位。  

1. 在网管上查看Ingress节点是否存在COMMUN_FAIL告警。  

如果 则 

存在, 说明Ingress节点的单板可能正在复位,优先清除COMMUN_FAIL告警后,查看本告警是否清除。 

不存在, 排查下一原因。 

· 

原因4:接口配置错误。 

1. 对照网元规划表,查看Tunnel是否配置在正确的接口之上,例如查看下一跳IP地址。  

如果 则 

不正确, 重新正确配置Tunnel的接口。查看告警是否清除。 

正确, 排查下一原因。 

· 

原因5:网络出现严重拥塞。  

1. 检查故障Tunnel的带宽是否已被完全占用。  

如果 则 

是, 增大Tunnel带宽配置或消除非法发送大数据量的根源。查看告警是否清除。 

否, 继续下一步。 

2. 可选:对于动态Tunnel,查看业务路由是否经过了带宽较低的物理链路。

如果 则 

是, 重新配置正确的路由约束条件。查看告警是否清除。 

否, 排查下一原因。 

· 

原因6:CPU占用率饱和,无法处理ARP协议报文。  1. 在网管上查看是否存在CPU_BUSY告警。 

2. 如果存在,优先清除CPU_BUSY告警后,查看本告警是否清除。  

    

ETH_LINK_DOWN 

告警解释 

ETH_LINK_DOWN为网口连接故障告警。该告警表示以太网连接错误,端口协商失败。 

· 

在数据传输时,网口协商失败,无法接收数据,业务中断。 · 

ETH_LOS告警将抑制ETH_LINK_DOWN告警的上报。 

· 

ETH_LINK_DOWN告警将抑制LAG_MEMBER_DOWN和MAC_FCS_EXC告警的上报。 

可能原因 

告警ETH_LINK_DOWN产生的可能原因如下: 

· 

原因1:本端网元和对端网元的端口工作模式不一致,造成协商失败。 · 

原因2:端口内环回。 

· 

原因3:纤缆连接到错误的端口。 · 

原因4:单板故障。 

处理步骤 

· 

原因1:本端网元和对端网元的端口工作模式不一致,造成协商失败。  1. 在网管上查看两端网元的以太网端口工作模式是否一致。 2. 若不一致,修改设置,使两端的端口工作模式一致后,查看告警是否清除。具体操作请参见查询和设置以太网接口工作模式。

原因2:端口内环回。  

1. 在网管上查看两端端口是否存在LOOP_ALM告警,具体操作请参见在U2000上查询当前告警。 

2. 若存在,优化清除LOOP_ALM告警后,查看本告警是否清除。  

· 

原因3:纤缆连接到错误的端口。  

1. 对照网元规划表,查看上报告警的端口是否错插了纤缆,造成两端端口工作模式不一致。 2. 重新正确连接纤缆,清除告警。 

· 

原因4:单板故障。  

1. 在网管上查看两端网元的相关单板是否存在HARD_BAD等硬件类告警。 

2. 若存在,更换存在硬件类告警的单板后,查看本告警是否清除。具体操作请参见部件更换。 

    

ETH_LOS 

告警解释 

ETH_LOS为以太网端口连接丢失告警。该告警表示以太网端口接收不到以太网信号。

该告警产生时,以太网端口接收不到数据,业务中断。 

· 

LSR_NO_FITED和LASER_MOD_ERR告警将抑制ETH_LOS告警的上报。 · 

ETH_LOS告警将抑制其它以太网业务的相关告警。 

可能原因 

告警ETH_LOS产生的可能原因如下: 

· 

原因1:以太网端口的电缆或光纤没有连接好。 · 

原因2:电缆或光纤故障。 

· 

可选:原因3:本端网元接收光功率过低。 · 

原因4:单板故障。 

处理步骤 

· 

原因1:以太网端口的电缆或光纤没有连接好。 

1. 检查以太网端口的电缆或光纤是否接好,插紧松脱的电缆或光纤。 

· 

原因2:电缆或光纤故障。  

1. 检查电缆或光纤是否存在故障,更换故障的电缆或光纤。 

· 

可选:原因3:本端网元接收光功率过低。  

1. 在网管上查看对端网元是否存在OUT_PWR_ABN告警。若存在,优先清除该告警后,查看本告警是否清除。具体操作请参见在U2000上查询当前告警。 

2. 若告警未清除,清洁接收光口及光纤头表面。具体操作请参见检查及清洁光纤连接器。 

3. 若告警仍未消除,检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。正确使用法兰盘或光衰减器。  

4. 若告警仍未消除,通过增减光衰减器调整光功率至正常范围内。 

· 

原因4:单板故障。  

1. 更换上报告警的处理板。具体操作请参见部件更换。 2. 若告警未消除,更换对端网元对应的处理板。 

    

OUT_PWR_ABN

告警解释 

OUT_PWR_ABN告警表示输出光功率异常。 

告警属性 

告警ID 告警级别 告警类型 

0x001A 紧急 设备 

告警参数 

无 

对系统的影响 

该告警产生时,业务的传输性能受到影响,严重时会造成业务的中断。 

可能原因 

告警OUT_PWR_ABN产生的可能原因如下: 

· 

原因1:输出光功率过高或过低。 · 

原因2:单板故障。 

处理步骤 

· 

原因1:输出光功率过高或过低。  

  1. 更换上报告警的端口的光模块,查看告警是否清除。具体操作请参见更换可插拔光模块。

原因2:单板故障。  

1. 更换上报告警的单板,查看告警是否清除。具体操作请参见部件更换。 

     

SWDL_NEPKGCHECK 

告警解释 

SWDL_NEPKGCHECK告警表示包加载软件包中某个文件丢失或校验通不过且无法修复。主机在软件包文件巡检时发现文件丢失或校验通不过时,会自动从其它区的完整软件包进行修复,如果无法修复即上报此告警。 

告警属性 

告警ID 告警级别 告警类型 

0x023e 紧急 处理失败 

告警参数 

无 

对系统的影响 

· 

该告警产生时,网元将不能完成包加载操作。

若主机在软件包文件巡检时发现文件完整,没有丢失,告警将自动清除。 

可能原因 

SWDL_NEPKGCHECK告警产生的原因如下: 文件类型不匹配或丢失。 

处理步骤 

· 

原因:文件类型不匹配或丢失。  

1. 检查文件类型是否匹配、文件是否有丢失,如存在不匹配或丢失,重新下载匹配的软件。 

2. 重新进行软件包加载,更新软件包,查看告警是否清除。具体操作请参见《升级指导书》。  

   

NE_COMMU_BREAK 

告警解释 

网元与网管通讯中断。 

告警属性 

告警ID 告警级别 告警类型

1 紧急 通信 

告警参数 

无。 

对系统的影响 

无法在网管上管理该网元。 

可能原因 

· 

原因1:该网元所属的网关网元无法与网管通讯,导致该网元通讯失败。 

· 原因2:该网元主控故障。 

· 原因3:该网元与网关网元之间的光纤故障。 

· 

原因4:网络规模过大,导致网元间ECC通信的规模超过网元处理能力的极限。 

处理步骤 

· 

原因1:该网元所属的网关网元无法与网管通讯,导致该网元通讯失败。  

  1. 检查该网关网元是否上报GNE_CONNECT_FAIL告警,若上报该告警,请先结束该告警,参见GNE_CONNECT_FAIL的告警解决方法。 2. 在网管上查看当前告警,检查该告警是否结束。如果告警不能结束,继续下一步。

1 紧急 通信 

告警参数 

无。 

对系统的影响 

无法在网管上管理该网元。 

可能原因 

· 

原因1:该网元所属的网关网元无法与网管通讯,导致该网元通讯失败。 

· 原因2:该网元主控故障。 

· 原因3:该网元与网关网元之间的光纤故障。 

· 

原因4:网络规模过大,导致网元间ECC通信的规模超过网元处理能力的极限。 

处理步骤 

· 

原因1:该网元所属的网关网元无法与网管通讯,导致该网元通讯失败。  

  1. 检查该网关网元是否上报GNE_CONNECT_FAIL告警,若上报该告警,请先结束该告警,参见GNE_CONNECT_FAIL的告警解决方法。 2. 在网管上查看当前告警,检查该告警是否结束。如果告警不能结束,继续下一步。

2. 在各子网中选择适当的普通网元,并将其转换为网关网元。  

说明:  

当子网中仍具有多个环路和链路时,将处于最多环路和链路的设备设置为网关网元,以避免大量的管理信息需要通过基于DCC这种窄带宽信道传送,从而减少DCN再次发生拥塞的可能性。 3. 关闭冗余子网之间的ECC连接。  

· 

关闭通过扩展ECC(自动/人工)实现的ECC子网之间的互通。 · 

关闭通过STM-N光/电口实现的ECC子网之间的互通。 

· 

如果故障依然存在,请联系华为工程师。 

参考信息 

表1 SCC单板指示灯说明 

指示灯丝印 指示灯名称 指示灯状态 状态描述 STAT 

硬件状态灯 

亮(绿色) 单板工作正常。 亮(红色) 

子架有紧急告警产生。 

亮(黄色) 子架有重要告警产生。

表1 SCC单板指示灯说明 

指示灯丝印 指示灯名称 指示灯状态 状态描述 灭 

单板没有开工或单板没有被创建或单板没有上电状态。 

PROG 软件状态灯 亮(红色) 表示内存自检失败或者上层软件加载不成功或者逻辑文件FPGA丢失或者上层软件丢失。 

快速闪烁(红色) 100毫秒亮100

毫秒灭。 BOOTROM自检失败。 

快速闪烁(绿色) 100毫秒亮100

毫秒灭。

表1 SCC单板指示灯说明 

指示灯丝印 指示灯名称 指示灯状态 状态描述 正在进行写FLASH操作或软件加载。 

慢速闪烁(绿色) 300毫秒亮300

毫秒灭。 表示正处在BIOS引导阶段。 

亮(绿色) 

表示上层软件初始化或者软件正常运行。 

SRV 

业务告警指示灯 亮(绿色) 

业务工作正常。 亮(红色) 

业务有紧急或重要告警。 

亮(黄色) 

业务有次要和远端告警。 

灭 

没有配置业务。

表1 SCC单板指示灯说明 

指示灯丝印 指示灯名称 指示灯状态 状态描述 ALMC 

告警关断指示灯 亮(黄色) 

当前处在告警长期切除状态。 

灭 有告警立刻用声音提示。 

        

MAC_FCS_SD 

告警解释 

MAC_FCS_SD为MAC层检测到误码劣化越限告警。软件定时检测MAC芯片接收字节数和误码字节数,计算误码是否超过劣化门限,超过设置的门限即上报此报警。 

告警属性 

告警ID 告警级别 告警类型 

0x31FB 次要 通信

告警参数 

无 

对系统的影响 

· 

该告警产生时,业务性能下降,甚至中断。 

可能原因 

告警MAC_FCS_SD产生的可能原因如下: 

· 

原因1:线路信号劣化。 

· 

可选:原因2:输入光功率不正常。 · 

可选:原因3:光纤头表面不清洁。 

处理步骤 

· 

原因1:线路信号劣化。  

1. 在网管上查看是否存在LOOP_ALM告警。若存在,优先清除LOOP_ALM告警后,查看本告警是否清除。具体操作请参见在U2000上查询当前告警。  

2. 若告警未清除,在网管上检查是否存在DOS攻击等。若存在,消除非法发送大量数据的根源,查看告警是否清除。 

3. 若告警仍未清除,查看光纤或电缆是否存在故障。更换故障的光纤或电缆后,查看告警是否清除。

可选:原因2:输入光功率不正常。  

1. 查看上报本告警的端口是否同时上报IN_PWR_ABN告警。 2. 若存在,优先清除IN_PWR_ABN告警后,查看本告警是否清除。 

· 

可选:原因3:光纤头表面不清洁。  

1. 清洁光纤头表面和处理板接收光口。具体操作请参见检查及清洁光纤连接器。 

    

LSR_WILL_DIE 

告警解释 

LSR_WILL_DIE为激光器寿命即将终止告警。该告警表示激光器不可用。 

告警属性 

告警ID 告警级别 告警类型 

0x0038 紧急 设备 

告警参数 

无 

对系统的影响

该告警产生时,业务会出现误码。若不及时更换光模块,激光器损坏后,会导致业务中断。 

· 

LSR_NO_FITED和LASER_MOD_ERR告警将抑制LSR_WILL_DIE告警的上报。 

可能原因 

告警LSR_WILL_DIE产生的可能原因如下: 

· 

原因1:激光器老化。 

· 

原因2:单板的检测电路故障。 

处理步骤 

· 

原因1:激光器老化。  

1. 更换光模块,查看告警是否清除。具体操作请参见更换可插拔光模块。 

· 

原因2:单板的检测电路故障。  

1. 更换上报告警的单板,查看告警是否清除。具体操作请参见部件更换。

来源:木走

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年8月26日
下一篇 2021年9月1日

相关推荐