CN109495322A - 网络故障定位方法、相关设备及计算机存储介质 - Google Patents

网络故障定位方法、相关设备及计算机存储介质 Download PDF

Info

Publication number
CN109495322A
CN109495322A CN201811598784.7A CN201811598784A CN109495322A CN 109495322 A CN109495322 A CN 109495322A CN 201811598784 A CN201811598784 A CN 201811598784A CN 109495322 A CN109495322 A CN 109495322A
Authority
CN
China
Prior art keywords
failure
network
network equipment
bridge
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811598784.7A
Other languages
English (en)
Other versions
CN109495322B (zh
Inventor
曹明
黄文能
张剑
赵晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201811598784.7A priority Critical patent/CN109495322B/zh
Publication of CN109495322A publication Critical patent/CN109495322A/zh
Application granted granted Critical
Publication of CN109495322B publication Critical patent/CN109495322B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0686Additional information in the notification, e.g. enhancement of specific meta-data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/48Routing tree calculation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Abstract

本申请实施例公开了网络故障定位方法,包括:网络设备检测到故障并确定故障原因;根据所述故障原因生成故障报文,并向故障分析设备发送所述故障报文,故障分析设备接收网络设备发送的故障报文,获取所述故障报文对应的故障信息,在所述故障信息满足预设条件的情况下,确定所述网络设备为目标设备。通过实施本申请实施例,能够解决人工分析二层网络由于生成树协议导致的网络故障时定位不准确、效率低下等问题。

Description

网络故障定位方法、相关设备及计算机存储介质
技术领域
本发明涉及通信技术领域,尤其涉及一种网络故障定位方法、相关设备及计算机存储介质。
背景技术
随着网络技术的飞速发展和广泛应用,通信技术已经应用到人类活动的各个领域。在网络系统的运行过程中,时常会出现各种网络故障,在故障出现时,如何及时发现网络故障原因,确定网络故障位置,就成为摆在管理人员和技术人员面前的实际问题,因此,对网络系统故障监测技术的研究具有重要意义。
目前在二层网络中,交换机通过运行生成树协议(spanning tree protocol,STP)来消除网络中的环路,避免由于环路的存在而造成广播风暴,在运行STP的网络中,当网络中出现链路闪断、网络拥塞等原因导致原来的根桥频繁脱离网络,二层网络需要反复进行根桥、根端口以及指定端口的选举时,网络的逻辑拓扑就会反复变化,媒体访问控制(mediaaccess control,MAC)地址表会频繁刷新而造成整个网络振荡,目前在二层网络出现上述由于STP协议导致的网络振荡时,主要是依靠技术人员对网络系统中各网元的信息进行分析进而确定故障原因以及对网络故障进行定位,这种采用人工分析的方式准确性低,效率低下。
发明内容
本申请实施例公开了网络故障定位方法、相关设备及计算机存储介质,能够解决人工分析STP协议导致的网络故障时定位不准确、效率低下等问题。
第一方面,本申请实施例公开了一种网络故障定位方法,应用于包括故障分析设备和多个网络设备的网络故障定位系统中,应用于故障分析设备一侧的方法包括:
故障分析设备接收网络设备发送的故障报文,其中,所述故障报文包括所述网络设备检测到的故障原因以及所述网络设备与第一根桥之间的路径开销值,所述第一根桥为所述网络设备所在的网络根据生成树协议确定的根节点;
所述故障分析设备获取所述故障报文对应的故障信息;其中,所述故障信息包括所述网络设备周期性发送所述故障报文的次数、所述故障原因对应的故障优先级以及所述网络设备与所述第一根桥之间的路径开销值;
在所述故障信息满足预设条件的情况下,确定所述网络设备为目标设备,所述预设条件包括所述网络设备发送故障报文的次数大于或者等于预设次数、所述故障原因对应的故障优先级高于预设优先级、所述网络设备与所述第一根桥之间的路径开销值小于预设开销值,所述目标设备为确定网络故障原因的优先排查设备。
在上述方法中,通过获取网络设备发送的故障报文中的故障信息并对故障信息进行分析,从而能够确定二层网络中由于运行STP协议导致的网络故障的故障原因并对故障进行定位,避免人工采集网络设备配置信息、分析故障原因并对故障进行定位带来的故障定位不准确、效率低下等问题,提高了故障原因分析以及故障定位的效率和准确性。
可选地,所述故障报文承载有故障标识,所述故障标识用于指示所述故障原因;其中,
在所述故障标识为第一故障标识的情况下,表明所述故障原因为所述网络设备与所述第一根桥之间的网络拓扑发生变化;或者,
在所述故障标识为第二故障标识的情况下,表明所述故障原因为所述第一根桥与所述网络设备之间的通信链路异常,所述通信链路异常包括所述网络设备与所述第一根桥之间的链路发生闪断、所述网络设备与所述第一根桥之间的网络发生拥塞或所述网络设备与所述第一根桥之间的网元发生软件异常;或者,
在所述故障标识为第三故障标识的情况下,表明所述故障原因为所述网络设备所在的网络中出现比所述第一根桥优先级高的第二根桥,且所述第二根桥与所述网络设备之间的通信链路异常,所述第二根桥为所述第二根桥发送的第二桥接协议数据单元(bridgeprotocol data unit,BPDU)报文的优先级高于所述第一根桥发送的第一BPDU报文的情况下,所述网络设备所在的网络根据生成树协议确定的根节点。
通过在故障报文中承载故障标识指示故障原因,能够减少故障原因占用的字节数,使故障分析设备能够根据故障标识快速获取故障原因以及故障原因对应的优先级。可选地,在所述故障原因为所述网络设备与所述第一根桥之间的网络拓扑发生变化的情况下:
所述网络设备接收所述第一根桥发送的所述第一BPDU报文的端口发生变化,或者,所述网络设备接收到的所述第一根桥发送的所述第一BPDU报文的存活时间字段或者路径开销字段中的一个或者多个变化;
在所述故障原因为所述第一根桥与所述网络设备之间的通信链路异常的情况下:
所述网络设备接收不到所述第一根桥发送的所述第一BPDU报文;
所述故障原因为所述网络设备所在的网络中出现比所述第一根桥优先级高的第二根桥,且所述第二根桥与所述网络设备之间的通信链路异常的情况下:
所述网络设备接收不到所述第二根桥发送的所述第二BPDU报文。
通过确定不同故障原因对应的故障结果,能够使运维人员根据不同的结果采用不同的恢复措施,减少故障恢复时间。
可选地,所述故障报文还包括所述网络设备的互联网协议地址,所述互联网协议地址用于在确定所述网络设备为目标设备后,供用户登录所述网络设备以排除故障。
可选地,根据所述故障报文中的原因字段确定所述故障原因对应的故障优先级,所述原因字段承载有所述故障标识;
根据所述故障报文中的路径开销字段确定所述网络设备与所述第一根桥之间的路径开销值。
可选地,所述故障报文为协议报文,所述故障信息承载于所述协议报文的扩展字段中,所述扩展字段包括原因字段以及路径开销字段,其中,所述原因字段用于承载所述故障原因,所述路径开销字段用于承载所述路径开销值,所述协议报文包括网络拓扑发现协议(neighbor topology discovery protocol,NTDP)报文、简单网络管理协议(simplenetwork management protocol,SNMP)报文中的任意一种。
可选地,在所述故障信息满足预设条件的情况下,确定所述网络设备为目标设备,包括:
确定所述网络设备为符合第一预设条件的网元,其中,所述第一预设条件为所述网络设备在预设时间段发送故障报文的次数大于或者等于预设次数;
确定所述网络设备为符合第二预设条件的网元,其中,所述第二预设条件为所述网络设备是第一候选网元中,发送的故障报文中故障原因对应的故障优先级高于预设优先级,所述第一候选网元为在预设时间段发送故障报文的次数大于或者等于预设次数的网元;
确定所述网络设备为符合第三预设条件的网元,其中,所述第三预设条件为所述网络设备是第二候选网元中,与所述第一根桥之间的路径开销值小于预设开销值的网元,所述第二候选网元为在所述第一候选网元中故障原因对应的故障优先级高于预设优先级的网元。
可选地,在所述故障信息满足预设条件的情况下,确定所述网络设备为目标设备,包括:
确定所述网络设备为符合第一预设条件的网元,其中,所述第一预设条件为所述网络设备在预设时间段发送故障报文的次数大于或者等于预设次数;
确定所述网络设备为符合第二预设条件的网元,其中,所述第二预设条件为所述网络设备发送的故障报文中故障原因对应的故障优先级在第一候选网元中最高,所述第一候选网元为在预设时间段发送故障报文的次数大于或者等于预设次数的网元;
确定所述网络设备为符合第三预设条件的网元,其中,所述第三预设条件为所述网络设备是第二候选网元中与所述第一根桥之间的路径开销值最小的网元,所述第二候选网元为在所述第一候选网元中故障原因对应的故障优先级最高的网元。
通过对发送故障报文的网络设备根据预设条件进行筛选,能够减少需要排查的网络设备的数量,进而能够提高故障排除的效率,减少故障恢复时间。
第二方面,本申请实施例公开了一种网络故障定位方法,应用于包括故障分析设备和多个网络设备的网络故障定位系统中,应用于网络设备一侧的方法包括:
网络设备检测到故障并确定故障原因;
根据所述故障原因生成故障报文,所述故障报文包括所述网络设备确定的故障原因以及所述网络设备与第一根桥之间的路径开销值,所述第一根桥为所述网络设备所在的网络根据生成树协议确定的根节点;
向故障分析设备发送所述故障报文。
通过网络中检测到网络故障的网络设备分析故障原因,根据故障原因生成故障报文并将故障报文发送给故障分析设备,以使故障分析设备通过分析多个网络设备发送的故障报文,确定故障原因并对故障进行定位,能够避免人工采集网络设备配置信息并对故障原因进行分析带来的故障原因分析不准确、效率低下等问题,提高故障原因分析以及故障定位的效率和准确性。
可选地,所述网络设备检测到故障并确定故障原因,包括:
在所述网络设备检测到接收所述第一根桥发送的第一接协议数据单元BPDU报文的端口发生变化,或者,在所述网络设备接收到的所述第一BPDU报文中的存活时间字段或者路径开销字段中的一个或者多个变化的情况下,确定所述故障原因为所述网络设备与所述第一根桥之间的网络拓扑发生变化;或者,
在所述网络设备接收不到所述第一根桥发送的所述第一BPDU报文的情况下,所述故障原因为所述第一根桥与所述网络设备之间的通信链路异常,所述通信链路异常包括所述网络设备与所述第一根桥之间的链路发生闪断、所述网络设备与所述第一根桥之间的网络发生拥塞、所述网络设备与所述第一根桥之间的网元发生软件异常;或者,
在所述网络设备接收到的第二根桥发送的第二BPDU报文的优先级高于所述第一根桥发送的第一BPDU报文之后,所述网络设备接收不到所述第二根桥发送的所述第二BPDU报文的情况下,所述故障原因为所述网络设备所在的网络中出现比所述第一根桥优先级高的第二根桥,且所述第二根桥与所述网络设备之间的通信链路异常,其中,所述第二根桥为所述第二根桥发送的第二桥接协议数据单元BPDU报文的优先级高于所述第一根桥发送的第一BPDU报文的情况下,所述网络设备所在的网络根据生成树协议确定的根节点。
网络设备根据端口状态、是否能够按照协议规定的周期接收到BPDU报文、接收到BPDU报文的端口是否发生变化或接收到的BPDU报文中的字段是否发生变化等,分析所述故障并确定故障原因,避免人工采集网络设备配置信息并对故障原因进行分析带来的故障原因分析不准确、效率低下等问题,能够提高故障原因分析以及故障定位的效率和准确性。
可选地,所述故障报文承载有故障标识,所述故障标识用于指示所述故障原因;其中,
在所述故障标识为第一故障标识的情况下,表明所述故障原因为所述网络设备与所述第一根桥之间的网络拓扑发生变化;或者,
在所述故障标识为第二故障标识的情况下,表明所述故障原因为所述第一根桥与所述网络设备之间的通信链路异常;或者
在所述故障标识为第三故障标识的情况下,表明所述故障原因为所述网络设备所在的网络中出现比所述第一根桥优先级高的第二根桥,且所述第二根桥与所述网络设备之间的通信链路异常。
通过采用故障标识指示故障原因,能够减少故障报文承载的数据量,减少故障报文发送的时间。
可选地,所述故障报文还包括所述网络设备的互联网协议地址,所述互联网协议地址用于在确定所述网络设备为目标设备后,供用户登录所述网络设备以排除故障。
可选地,所述故障报文为协议报文,所述故障信息承载于所述协议报文的扩展字段中,所述扩展字段包括原因字段以及路径开销字段,其中,所述原因字段用于承载所述故障原因,所述路径开销字段用于承载所述路径开销值,所述协议报文包括网络拓扑发现协议NTDP报文、简单网络管理协议SNMP报文中的任意一种。
第三方面,本申请实施例提供一种网络故障定位系统,包括故障分析设备以及多个网络设备,其中,故障分析设备用于执行如上第一方面或者第一方面的任意可能的实施方式中所描述的方法;所述多个网络设备中的每个网络设备用于执行如上第二方面或者第二方面的任意可能的实施方式中所描述的方法。
第四方面,本申请实施例提供一种网络设备,所述网络设备包括:
通信模块,用于接收网络设备发送的故障报文,其中,所述故障报文包括所述网络设备检测到的故障原因以及所述网络设备与第一根桥之间的路径开销值,所述第一根桥为所述网络设备所在的网络根据生成树协议确定的根节点;
处理模块,用于获取所述故障报文对应的故障信息;其中,所述故障信息包括所述网络设备周期性发送所述故障报文的次数、所述故障原因对应的故障优先级以及所述网络设备与所述第一根桥之间的路径开销值;
所述处理模块,还用于在所述故障信息满足预设条件的情况下,确定所述网络设备为目标设备,所述预设条件包括所述网络设备在预设时间段发送故障报文的次数大于或者等于预设次数、所述故障原因对应的故障优先级高于预设优先级、所述网络设备与所述第一根桥之间的路径开销值小于预设开销值,所述目标设备为确定网络故障原因的优先排查设备。
可选地,所述故障报文承载有故障标识,所述故障标识用于指示所述故障原因;其中,
在所述故障标识为第一故障标识的情况下,表明所述故障原因为所述网络设备与所述第一根桥之间的网络拓扑发生变化;或者,
在所述故障标识为第二故障标识的情况下,表明所述故障原因为所述第一根桥与所述网络设备之间的通信链路异常,所述通信链路异常包括所述网络设备与所述第一根桥之间的链路发生闪断、所述网络设备与所述第一根桥之间的网络发生拥塞或所述网络设备与所述第一根桥之间的网元发生软件异常;或者,
在所述故障标识为第三故障标识的情况下,表明所述故障原因为所述网络设备所在的网络中出现比所述第一根桥优先级高的第二根桥,且所述第二根桥与所述网络设备之间的通信链路异常,所述第二根桥为所述第二根桥发送的第二桥接协议数据单元BPDU报文的优先级高于所述第一根桥发送的第一BPDU报文的情况下,所述网络设备所在的网络根据生成树协议确定的根节点。
可选地,在所述故障原因为所述网络设备与所述第一根桥之间的网络拓扑发生变化的情况下:
所述网络设备接收所述第一根桥发送的所述第一BPDU报文的端口发生变化,或者,所述网络设备接收到的所述第一根桥发送的所述第一BPDU报文的存活时间字段或者路径开销字段中的一个或者多个变化;
在所述故障原因为所述第一根桥与所述网络设备之间的通信链路异常的情况下:
所述网络设备接收不到所述第一根桥发送的所述第一BPDU报文;
所述故障原因为所述网络设备所在的网络中出现比所述第一根桥优先级高的第二根桥,且所述第二根桥与所述网络设备之间的通信链路异常的情况下:
所述网络设备接收不到所述第二根桥发送的所述第二BPDU报文。
可选地,所述故障报文还包括所述网络设备的互联网协议地址,所述互联网协议地址用于在确定所述网络设备为目标设备后,供用户登录所述网络设备以排除故障。
可选地,根据所述故障报文中的原因字段确定所述故障原因对应的故障优先级,所述原因字段承载有所述故障标识;
根据所述故障报文中的路径开销字段确定所述网络设备与所述第一根桥之间的路径开销值。
可选地,所述故障报文为协议报文,所述故障信息承载于所述协议报文的扩展字段中,所述扩展字段包括原因字段以及路径开销字段,其中,所述原因字段用于承载所述故障原因,所述路径开销字段用于承载所述路径开销值,所述协议报文包括网络拓扑发现协议NTDP报文、简单网络管理协议SNMP报文中的任意一种。
第五方面,本申请实施例提供另一种网络设备,所述网络设备包括:
处理模块,用于检测到故障并确定故障原因;
所述处理模块,还用于根据所述故障原因生成故障报文,所述故障报文包括所述网络设备确定的故障原因以及所述网络设备与第一根桥之间的路径开销值,所述第一根桥为所述网络设备所在的网络根据生成树协议确定的根节点;
通信模块,用于向故障分析设备发送所述故障报文。
可选地,所述处理模块具体用于:在所述网络设备检测到接收所述第一根桥发送的第一接协议数据单元BPDU报文的端口发生变化,或者,在所述网络设备接收到的所述第一BPDU报文中的存活时间字段或者路径开销字段中的一个或者多个变化的情况下,确定所述故障原因为所述网络设备与所述第一根桥之间的网络拓扑发生变化;或者,
在所述网络设备接收不到所述第一根桥发送的所述第一BPDU报文的情况下,所述故障原因为所述第一根桥与所述网络设备之间的通信链路异常,所述通信链路异常包括所述网络设备与所述第一根桥之间的链路发生闪断、所述网络设备与所述第一根桥之间的网络发生拥塞、所述网络设备与所述第一根桥之间的网元发生软件异常;或者,
在所述网络设备接收到的第二根桥发送的第二BPDU报文的优先级高于所述第一根桥发送的第一BPDU报文之后,所述网络设备接收不到所述第二根桥发送的所述第二BPDU报文的情况下,所述故障原因为所述网络设备所在的网络中出现比所述第一根桥优先级高的第二根桥,且所述第二根桥与所述网络设备之间的通信链路异常,其中,所述第二根桥为所述第二根桥发送的第二桥接协议数据单元BPDU报文的优先级高于所述第一根桥发送的第一BPDU报文的情况下,所述网络设备所在的网络根据生成树协议确定的根节点。
可选地,所述故障报文承载有故障标识,所述故障标识用于指示所述故障原因;其中,
在所述故障标识为第一故障标识的情况下,表明所述故障原因为所述网络设备与所述第一根桥之间的网络拓扑发生变化;或者,
在所述故障标识为第二故障标识的情况下,表明所述故障原因为所述第一根桥与所述网络设备之间的通信链路异常;或者,
在所述故障标识为第三故障标识的情况下,表明所述故障原因为所述网络设备所在的网络中出现比所述第一根桥优先级高的第二根桥,且所述第二根桥与所述网络设备之间的通信链路异常。
可选地,所述故障报文还包括所述网络设备的互联网协议地址,所述互联网协议地址用于在确定所述网络设备为目标设备后,供用户登录所述网络设备以排除故障。
可选地,所述故障报文为协议报文,所述故障信息承载于所述协议报文的扩展字段中,所述扩展字段包括原因字段以及路径开销字段,其中,所述原因字段用于承载所述故障原因,所述路径开销字段用于承载所述路径开销值,所述协议报文包括网络拓扑发现协议NTDP报文、简单网络管理协议SNMP报文中的任意一种。
第六方面,本申请实施例提供一种网络设备,包括处理器、通信接口以及存储器;所述存储器用于存储指令,所述处理器用于执行所述指令,所述通信接口用于接收或者发送数据;其中,所述处理器执行所述指令时执行如上第一方面或者第一方面的任意可能的实施方式中所描述的方法,或者,所述处理器执行所述指令时执行如上第二方面或者第二方面的任意可能的实施方式中所描述的方法。
第七方面,本申请提供一种非瞬态计算机存储介质,所述计算机非瞬态介质存储有用于网络故障定位的计算机程序,所述计算机程序被处理器执行时实现如上第一方面或者第一方面的任意可能的实施方式中所描述的方法,或者,所述计算机程序被处理器执行时实现如上第二方面或者第二方面的任意可能的实施方式中所描述的方法。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种根桥选举的示意图;
图2A-图2F是本申请实施例提供的出现网络振荡的场景示意图;
图3是本申请实施例提供的一种网络定位方法的交互示意图;
图4是本申请实施例提供的一种响应报文格式中扩展字段示意图;
图5是本申请实施例提供的一种网络故障定位系统的示意图;
图6是本申请实施例提供的另一种网络故障定位系统的示意图。
具体实施方式
在复杂的网络环境中,网络故障是一个不可避免的问题,例如在以太网通信中,为了提高网络的可靠性,通常会使用冗余链路,但是使用冗余链路会在交换网络中产生环路,使得数据链路层报文在网络中被循环转发导致网络瘫痪。为防止交换网络中的环路问题,生成树协议(spanning tree protocol,STP)被应用在网络中,网络通过运行STP协议选出网络中的根桥、每个非根桥的根端口以及每个非根桥的指定端口,阻塞每个非根桥的非指定端口,从而能够将物理上的网状拓扑改造成逻辑上的树状拓扑,达到消除网络环路的目的,避免广播风暴大量占用交换机的资源。
网络在运行STP时,网络中会进行根桥的选举,根桥的选举是在交换网络中选出优先级最高的唯一设备作为根桥(root bridge,RB),用于向网络中其他设备发送桥接协议数据单元(bridge protocol data unit,BPDU),网络中的设备在使能STP协议后,在初始化过程中,每个设备都认为自己是根桥,设备间通过BPDU的传递,在相邻设备间进行协议优先级的比较,其中,BPDU中包括网桥ID(bridge identification,BID)字段,BID字段包括2个字节的桥优先级和6个字节的设备的媒体访问控制(media access control,MAC)地址,在进行协议优先级的比较时,先比较桥优先级,桥优先级值最小的为根桥,若桥优先级值相等,再比较设备的MAC地址,MAC地址最小的为根桥。如图1所示,图1中设备A、设备B与设备C相互连接,各设备的优先级与MAC地址如图1中所示,因为上述三个设备的桥优先级均为缺省值32768,通过比较MAC地址,则最终选择设备A作为根桥。在完成根桥的选举之后,网络中的其他非根桥设备需要在不同的端口中选出一个到根桥路径开销(cost of path)最小的端口作为根端口,并在每一个物理网段的不同端口之间选举出一个离下游设备最近的端口作为指定端口,用于接收下游设备发送的数据,最后阻塞非根桥的非指定端口,上述过程即为一次生成树的收敛过程。
但是,在应用STP的网络中,当网络中存在攻击设备反复抢占根桥或者链路闪断等原因导致原来的根桥频繁脱离网络,网络需要反复进行根桥、根端口以及非根端口的选举时,网络的逻辑拓扑就会反复变化,MAC地址表会反复刷新造成整个网络振荡。
在出现上述网络振荡问题时,当前主要是依靠人工采集每个设备的STP配置信息进而分析网络故障,这种故障排查方式效率低下,并且由于网络的变化,采集的信息并不能真实反映同一时间点多个设备的状态,从而会造成误判导致故障定位错误以及故障原因分析错误。
针对上述问题,本申请实施例提供一种网络故障定位方法,在对本申请实施例提供的网络故障定位方法进行阐述之前,首先介绍本申请实施例提供的出现网络振荡时的六种主要的场景以及故障原因,所述六种主要场景如下:
场景一:网络拓扑变化后根端口变化导致网络振荡
如图2A所示,网元A为网络中的根桥,在网元B与网元A之间存在其他网元组成的上游网络,网元B的根端口为端口1,由于根端口是非根桥到根桥路径开销值最小的端口,可以用于接收根桥发送的BPDU报文,当网元B的上游网络的网络拓扑发生变化时,网元B当前的根端口到根桥的路径开销值会发生变化,使得端口1到根桥的路径开销值不再是最小路径开销值,网元B的端口2成为到根桥的路径开销值最小的端口,则网元B的根端口由端口1切换到端口2,由于网元B的根端口发生变化,则网元B的下游网络中各网元当前的根端口也可能不再是到根桥路径开销值最小的端口,网元B下游网络中的各网元也会重新选择根端口,导致网元B及网元B下游网络的逻辑拓扑发生变化,若网元B上游网络的网络拓扑反复变化,则网元B的根端口也会反复变化,网元B以及网元B下游网络的逻辑拓扑也会反复变化,从而导致网络振荡。
场景二:网络拓扑变化后BPDU报文的字段变化导致网络振荡
如图2B所示,网元A为网络中的根桥,在网元B与网元A之间存在其他网元组成的上游网络。网元B接收到根桥发送的BPDU报文中包含该BPDU报文的存活时间(message age)以及路径开销,其中,BPDU每经过一台交换机,message age表示BPDU报文经过的跳数,BPDU每经过一台交换机,message age字段的值增加1,路径开销字段的值表示网络设备的端口到达根桥的链路开销之和。若网元B相邻两次接收到的BPDU报文中message age字段的值或者路径开销字段的值中有任意一个或者多个不一样,则表明网元B的上游网络的网络拓扑发生了变化,例如,图2B中,在第一时刻,所述根桥发送的BPDU报文通过网元E之后到达网元B,此时网元B接收到的BPDU报文中message age字段的值为1,在第二时刻,所述根桥发送给BPDU报文通过网元F以及网元E之后到达网元B,此时网元B接收到的BPDU报文中messageage的值为2,则网元B前后两次接收到的BPDU报文中的message age的值不一样,说明所述网元2上游的网络拓扑发生了变化,当网元B的上游网络的网络拓扑发生变化时,网元B的下游网络中各网元当前的根端口可能不再是到根桥路径开销值最小的端口,则网元B下游网络中的各网元会重新选择根端口,导致网元B下游网络的逻辑拓扑发生变化,若网元B上游网络的网络拓扑反复变化,则网元B以及网元B下游网络的逻辑拓扑也会反复变化,MAC地址表反复刷新,从而导致网络振荡。
场景三:链路闪断导致网络振荡
如图2C所示,网元A为网络中的根桥,在网元B与网元A之间的连接的链路出现链路闪断时,网元B以及网元B下游网络中的网元都无法按照协议规定的周期接收到根桥发送的BPDU报文,网元B以及网元B下游网络中的网元会重新选举新根桥以及非根桥的根端口等,例如BPDU报文中hello time字段配置的时间是2秒,若网元B在上一次接收到BPDU报文之后,在2秒后没有再次接收到BPDU报文,则网元B以及网元B下游的网元会根据STP协议重新选举根桥,若重新选举出的新根桥为网元B,而在网桥A与网元B之间的链路恢复时,网元A又会重新被选举为根桥,如果网元A与网元B之间的链路反复出现链路闪断,则网络中的根桥会在网元A与网元B之间反复切换,导致网络的逻辑拓扑会反复变化,MAC地址表反复刷新,从而导致整个网络振荡。
场景四:网络拥塞或者软件故障导致网络振荡
如图2D所示,网元A为网络中的根桥,网元B与网元A之间连接有其他网元组成的上游网络,若因为网元B与网元A之间的上游网络出现拥塞,或者网元B上游网络中的网元发生软件故障等原因,导致网元B与根桥之间的通信链路发生异常,网元B以及网元B下游网络中的网元无法按照协议规定的周期接收到网元A发送的BPDU报文,网元B以及网元B下游网络中的网元会重新选举新根桥以及非根桥的根端口等,例如重新选举出的新根桥为网元B。而在网元B以及网元B下游网络中的网元能够按照协议规定的周期接收到BPDU时,网元A又会重新被选举为根桥,如果上述导致网元B间歇接受不到BPDU报文的情况反复出现,则网络中的根桥会在网元A与网元B之间反复切换,导致网络的逻辑拓扑会反复变化,MAC地址表反复刷新,从而导致整个网络振荡。
场景五:根抢占后链路闪断导致网络振荡
如图2E所示,图2E中,网元A是网络中的根桥,在网络中的网元E发送的BPDU报文的优先级比网元A发送的BPDU报文的优先级更高的情况下,根据STP协议,网元E会被选为网络中的新根桥,将上述情况称为根抢占。在出现根抢占情况之后,将原根桥(网元A)称为第一根桥,新根桥(网元B)称为第二根桥,若所述第二根桥与网元B之间的链路出现链路闪断,网元A会再次被选举为根桥,待网元E与网元B之间的链路恢复时,网元E又会被选举为根桥,如果网元E与网元B之间的链路反复出现链路闪断,则网络中的根桥会在网元A与网元E之间反复切换,导致网络的逻辑拓扑会反复变化,MAC地址表反复刷新,从而导致整个网络振荡。
场景六:根抢占后网络拥塞或者软件故障导致网络振荡
如图2F所示,图2F中,网元A是网络中的根桥,在网络中的网元E发送的BPDU报文的优先级比网元A发送的BPDU报文的优先级更高的情况下,根据STP协议,网元E会被选为网络中的新根桥,将上述情况称为根抢占。在出现根抢占情况之后,若由于网元E与网元B之间的网络出现网络拥塞、网元B上游的网元出现软件故障等原因,导致网元B以及网元B的下游网络中的网元无法按照协议规定的周期接收网元E发送的BPDU报文,网元A会再次被选举为根桥,而在网元B以及网元B下游网络中的网元能够按照协议规定的周期接收到BPDU时,网元E又会被选举为根桥,如果上述导致网元B接收不到网元E发送的BPDU报文的状况反复出现,则网络中的根桥会在网元A与网元B之间反复切换,导致网络的逻辑拓扑会反复变化,MAC地址表反复刷新,从而导致整个网络振荡。
可以理解,在一些可能的实施例中,还可能出现其他由于运行STP协议导致网络振荡的场景以及造成网络振荡的原因,上述的六种场景以及每种场景对应的故障原因仅作为举例,不能理解为具体限定。
请参见图3,图3是本申请实施例提供的一种网络定位方法中故障分析设备与网络设备之间的交互示意图,在实际的网络拓扑中,网络中包括多个网元(一个根桥和多个非根桥网元)以及故障分析设备,图中仅以一个网元作为网络设备与所述故障分析设备交互进行说明,如图3所示,所述网络故障定位方法包括如下步骤:
S102、网络设备在检测到故障的情况下,确定故障原因。
本申请实施例中,所述网络设备为检测到故障的网元,在所述网络设备检测到故障的情况下,所述网络设备根据端口状态、是否能够按照协议规定的周期接收到BPDU报文、接收到BPDU报文的端口是否发生变化或接收到的BPDU报文中的字段是否发生变化等,分析所述故障并确定故障原因,所述故障原因包括上述六种场景中所描述的故障原因中的一种或多种。
S104、根据所述故障原因生成故障报文并向故障分析设备发送所述故障报文。
所述网络设备在确定所述故障原因之后,然后根据所述故障原因生成故障报文,所述故障报文包括原因字段以及路径开销字段,其中,所述原因字段用于承载所述故障原因,所述路径开销字段用于承载所述网络设备与所述网络设备所在网络的根桥之间的路径开销值。
可以理解,所述网络设备生成所述故障报文之后,所述网络设备可以主动将所述故障报文发送给所述故障分析设备,也可以在所述故障分析设备周期性的发送维护信息请求报文,所述网络设备接收到所述维护信息请求报文之后,将所述故障报文发送给所述故障分析设备,从而周期性的向所述故障分析设备发送所述故障报文。
S106、故障分析设备接收网络设备发送的故障报文,获取所述故障报文对应的故障信息。
所述故障信息包括所述网络设备连续发送故障报文的次数、所述故障原因对应的优先级、所述网络设备与根桥之间的路径开销值。
所述故障分析设备在接收到所述网络设备发送的所述故障报文之后,所述故障分析设备根据所述故障报文中的原因字段确定与所述故障原因对应的优先级,其中,优先级用于表示故障需要优先处理的程度,优先级越高,表示故障越需要优先处理,每种故障原因对应一种故障优先级;所述故障分析设备根据所述故障报文中的路径开销字段确定所述网络设备与所述根桥之间的路径开销值。
S108、在所述故障信息满足预设条件的情况下,确定所述网络设备为目标设备。
其中,所述目标设备为排除网络故障的优先排查设备,可以理解,在网络由于运行STP协议导致网络振荡的情况下,可能由于某一个网络设备出现故障而导致该网络设备下游的所有网络设备均检测到故障,进而向所述故障分析设备发送故障报文,例如,在上述场景三中,在网元B与网元A之间的连接的链路出现链路闪断时,网元B以及网元B下游网络中的网元都无法按照协议规定的周期接收到根桥发送的BPDU报文,则网元B以及所述网元B下游的网络均会向所述故障分析设备发送故障报文,若对每个发送故障报文的网络设备均进行排查,则会降低确定故障原因以及排出故障的效率,因此需要对每个网络设备发送的故障报文进行分析,已确定一个或者多个优先排查设备,以提高确定故障原因以及排出故障的效率。具体的,故障分析设备在获取所述故障信息之后,分析所述网络设备是否满足预设条件,在满足所述预设条件的情况下,确定所述网络设备为目标设备。其中,所述预设条件包括:第一预设条件:所述网络设备在预设时长内发送故障报文的次数大于或者等于预设次数;第二预设条件:所述网络设备发送的故障报文中故障原因对应的故障优先级高于预设优先级;第三预设条件,所述网络设备与所述根桥之间的路径开销值小于预设开销值。可以理解,若所述网络设备是在接收到所述故障分析设备发送的维护信息请求报文之后,将所述故障报文发送给所述故障分析设备,则上述第一预设条件可以为所述网络设备周期性发送故障报文的次数。
本申请实施例中,所述故障报文还包括所述网络设备的互联网协议(InternetProtocol,IP)地址、所述网络设备检测到的存在故障的物理端口类型和端口号以及所述网络设备的MAC地址等,所述IP地址用于在确定所述网络设备为目标设备之后,供用户登录所述网络设备,并根据所述网络设备的端口号排除故障。
本申请实施例中提供的网络故障定位方法,通过网络中检测到网络故障的网络设备分析故障原因,根据故障原因生成故障报文并将故障报文发送给故障分析设备,故障分析设备通过分析多个网络设备发送的故障报文,确定每个网络设备是否满足预设条件,在多个网络设备中确定排除网络故障的最优排查网元,从而能够在网络由于STP出现网络震荡时,通过网络中的设备分析故障原因、根据故障原因生成故障报文并对故障报文进行分析进而对故障进行定位,避免人工采集网络设备配置信息、分析故障原因并对故障进行定位带来的故障定位不准确、效率低下等问题,提高了故障定位的效率和准确性。
本申请实施例中,上述步骤S102中,在所述网络设备所在的网络由于网络链路发生异常等原因发生运行STP的网络发生振荡的情况下,所述网络设备检测到故障后,所述网络设备根据所述网络设备的根端口接收BPDU报文的状态,确定网络振荡的故障原因。具体的,若所述网络设备检测到接收BPDU的端口发生变化,则确定所述故障原因为场景一中的所述网络设备上游网络的网络拓扑变化后所述网络设备的根端口变化导致网络振荡。若所述网络设备检测到相邻两次接收到的BPDU报文中的字段反复发生变化,例如BPDU报文中的message age字段的值发生变化,或者路径开销(cost of path)字段的值发生变化等,则确定所述故障原因为场景二中的网络拓扑变化后BPDU报文字段发生变化导致网络振荡。若所述网络设备在协议规定的周期内没有接收到根桥发送的BPDU报文,所述网络设备检测到根端口出现链路闪断,则确定故障原因为场景三中的链路闪断。若所述网络设备在协议规定的周期内没有接收到所述根桥发送的BPDU报文但又没有检测到根端口出现链路闪断,则确定所述故障原因为场景四中的所述网络设备上游网络中的网元软件发生故障或者所述网络设备上游网络出现网络拥塞等。若所述网络设备接收到其他网元发送的优先级更高的BPDU报文,根据STP协议选举出新的根桥之后,所述网络设备在协议规定的周期内接收不到所述优先级别更高的BPDU报文,并且所述网络设备检测到根端口出现链路闪断,则确定故障原因为场景五中的根抢占后发生链路闪断。若所述网络设备接收到其他网元发送的优先级更高的BPDU报文,根据STP协议选举出新的根桥之后,所述网络设备在协议规定的周期内接收不到新的根桥发送的优先级别更高的BPDU报文网元,但又没有检测到根端口出现链路闪断,则确定所述故障原因为场景六中的根抢占后所述网络设备与所述第二根桥之间的网元中的软件出现故障或者所述网络设备与新根桥之间的上游网络出现网络拥塞。
在一种可能的实施方式中,上述步骤S104中,可以对上述六种故障场景下的故障原因赋予故障标识,将所述故障标识承载于所述故障报文中发送给所述故障分析设备。由于上述场景一与场景二中故障原因均是网络设备上游网络的网络拓扑变化,则可以用第一故障标识表示故障原因为所述网络设备上游网络的网络拓扑变化;由于上述场景三和场景四中的故障原因均是所述网络设备与根桥之间的通信链路异常,则可以用第二故障标识表示故障原因为所述通信链路异常;由于上述场景五与场景六中的故障原因均是根抢占之后,新的根桥与所述网络设备之间的通信链路异常,则可以用第三故障标识表示故障原因为根抢占之后,新的根桥与所述网络设备之间的通信链路异常。
在另一种可能的实施方式中,由于相同的故障原因可以导致不同结果,不同的结果会采用不同的故障排除措施,例如上述场景一和场景二中故障原因均是由于所述网络设备上游网络的网络拓扑发生变化,场景一中网络拓扑变化导致的是所述网络设备的根端口发生变化,场景二中网络拓扑变化导致的是所述网络设备接收到的BPDU报文中的messageage字段的值或者路径开销字段的值发生变化;另外,相同的故障原因可能对应的故障根因不同,不同的故障根因会采用不同的故障排除措施,例如上述场景三与场景四中故障原因均是由于所述网络设备与根桥之间的通信链路异常,但是场景三中是由于所述链路闪断导致通信链路异常,场景四中是由于网络拥塞或者软件异常导致通信链路异常。因此,可以对上述六种故障场景分别赋予不同的故障标识,例如,第一故障标识对应的故障原因为所述网络设备上游网络的网络拓扑发生变化,对应的故障结果为所述网络设备的根端口发生变化进而使得所述网络设备下游的网络拓扑发生变化。第二故障标识对应的故障原因同样为所述网络设备上游网路的网络拓扑发生变化,但对应的故障结果为所述网络设备接收到的根桥发送的BPDU报文中的字段发生变化进而使得所述网络设备下游网络的网络拓扑发生变化。第三故障标识对应的故障原因为所述网络设备与根桥之间的链路发生链路闪断,对应的故障结果为所述网络设备不能按照协议规定的周期接收根桥发送的BPDU报文。第四故障标识对应故障原因为所述网络设备上游网络中的网元软件发生故障或者所述网络设备上游网络出现网络拥塞,对应的故障结果为所述网络设备不能按照协议规定的周期接收根桥发送的BPDU报文。第五故障标识对应的故障原因为根抢占后所述网络设备与新的根桥之间发生链路闪断,对应的故障结果为所述网络设备不能按照协议规定的周期接收根桥发送的BPDU报文。第六故障标识对应故障原因为根抢占后所述网络设备与新的根桥之间的网元中的软件出现故障或者所述网络设备与新的根桥之间的上游网络出现网络拥塞,对应的故障结果为所述网络设备不能按照协议规定的周期接收根桥发送的BPDU报文。在网络设备检测到故障并确定故障原因之后,将所述故障原因对应的故障标识承载于所述故障报文的原因字段中发送给所述故障分析设备。
本申请实施例中,每个故障原因可以对应一个故障优先级,例如上述场景一中的故障原因对应第一故障优先级,上述场景二中的故障原因对应第二故障优先级,以此类推,故障场景六中的故障原因对应第六故障优先级,其中,第六故障优先级大于第五故障优先级,第五故障优先级大于第四故障优先级,以此类推,第二故障优先级大于第一故障优先级。每个故障优先级也可以对应两个或者两个以上的故障原因,例如,上述场景一和场景二中的故障原因均是因为所述网络设备上游网络的网络拓扑变化,则可以将场景一和场景二两种场景中的故障原因对应的故障优先级设置为第一故障优先级;场景三和场景四中的故障原因均是由于所述网络设备与根桥之间的通信链路异常,网络设备无法在协议规定的周期内接收到BPDU报文导致的网络振荡,则将场景三和场景四两种场景中的故障原因对应的故障优先级设置为第二故障优先级,场景五和场景六两种场景的故障原因均是根抢占后所述网络设备与根桥之间的通信链路异常,则将场景五和场景六两种场景中的故障原因对应的故障优先级设置为第三故障优先级,其中,第三故障优先级大于第二故障优先级,第二故障优先级大于第一故障优先级。可以理解,上述故障原因对应的故障优先级只是用于举例,不能理解为具体限定。
上述每个故障原因对应有一个故障标识以及一个故障优先级,则每个故障标识对应一个故障优先级,在一种可能的实施方式中,故障原因、故障标识与故障优先级的对应关系可以如下表1所示,将故障原因、故障标识与故障标识对应的故障优先级存储在所述故障分析设备中,以供所述故障分析设备根据所述网络设备发送的故障报文中的故障标识确定所述网络设备检测到的故障原因的故障优先级。
表1故障场景、故障原因、故障标识与故障优先级的对应关系表
场景 故障原因 故障标识 故障优先级
场景一 网络拓扑反复变化后根端口变化 第一故障标识 第一故障优先级
场景二 网络拓扑反复变化后BPDU报文的字段变化 第二故障标识 第一故障优先级
场景三 反复出现链路闪断 第三故障标识 第二故障优先级
场景四 反复出现网络拥塞或者软件故障 第四故障标识 第二故障优先级
场景五 根抢占后反复出现链路闪断 第五故障标识 第三故障优先级
场景六 根抢占后反复出现网络拥塞或者软件故障 第六故障标识 第三故障优先级
本申请实施例中,步骤S104中的所述故障报文可以是当前网络支持的协议报文,例如邻居拓扑发现协议(neighbor topology discovery protocol,NTDP)报文、简单网络管理协议(simple network management protocol,SNMP)报文、远程终端协议telnet报文等。所述网络设备将所述故障信息承载于所述网络设备发送给所述故障分析设备的协议报文的扩展字段中,网络中的网元均支持将所述故障信息写入协议报文的扩展字段中,故障分析设备支持获取所述协议报文的扩展字段中的故障信息,例如,以NTDP报文为例,对NTDP报文进行扩展,使NTDP报文携带采用类型长度值(type length value,TLV)格式编码的扩展字段,故障分析设备每隔预设的时间发送一次NTDP报文,网络中的每个网元在接收到所述NTDP请求报文之后,判断是否存在故障,若不存在,则向所述网络分析设备发送不携带扩展字段的NTDP响应报文,若某个网络设备监测到自身存在故障,则该网络设备向所述故障分析设备发送携带扩展字段的NTDP响应报文,其中,携带扩展字段的NTDP响应报文格式包括两个部分,第一部分为NTDP响应报文的内容,第二部分为扩展字段部分,如图4所示,图4是本申请实施例提供的一种NTDP响应报文中扩展字段部分的示意图,所述扩展字段部分包括:
类型和长度(type&length):表示扩展TLV的类型是0x100,长度是26字节;
原因(cause):用于承载故障标识,表示不同的故障原因;
路径开销(root cost):用于承载所述网络设备到根桥的路径开销;
端口类型和端口号(int type&int num):表示所述网络设备上出现故障的物理端口类型和端口号;
互联网协议地址(IP):表示所述网络设备的IP地址,用于维护工程师通过所述IP地址进行远程登录管理;
桥物理地址(bridge MAC):表示所述网络设备的MAC地址。
多生成树实例(multiple spanning tree instance,MSTI):MSTI字段表示所述网络设备检测到故障的实例号;
报文序列号(info num):表示该协议报文的序列号,防止该协议报文反复处理及防止报文环路。
在一种可能的实施方式中,所述故障信息可以不承载于协议报文的扩展字段中,所述网络设备在生成包括上述扩展字段中信息的所述故障报文之后,立即将所述故障报文发送给所述故障分析设备,或者所述故障分析设备将所述故障报文保存在网络设备中,所述故障分析设备按照已有的信息获取机制,例如文件传输协议(file transfer protocol,FTP)、SNMP等,获取所述故障报文。
本申请实施例中,上述步骤106中确定所述网络设备是否为目标设备的方法如下:
首先,确定所述网络设备是否满足第一预设条件,即确定所述网络设备在预设时长发送故障报文的次数是否大于或者等于预设次数,如果小于所述预设次数,则表示所述网络设备不满足第一预设条件,不能作为目标设备,如果大于或者等于所述预设次数,则表示所述网络设备可能为目标设备;
然后,在所述网络设备在预设时长内发送故障报文的次数大于或者等于所述预设次数的情况下,再确定所述网络设备是否满足所述第二预设条件,即确定在第一候选网元中,所述网络设备发送的故障报文中故障原因对应的故障优先级是否高于预设优先级,若不是,则表示所述网络设备不能作为目标设备,若是,则表示所述网络设备可能为目标设备,其中,所述第一候选网元为在所述预设时长内发送故障报文的次数大于或者等于预设次数的网元;
最后,在所述网络设备的故障原因对应的故障优先级高于所述预设优先级的情况下,再确定所述网络设备是否满足所述第三预设条件,即确定在第二候选网元中,所述网络设备与根桥之间路径开销值是否小于预设路径开销值,在所述网络设备与所述根桥之间路径开销值小于预设路径开销值的情况下,确定所述网络设备为目标设备,其中,所述第二候选网元为在所述第一候选网元中故障原因对应的故障优先级高于所述预设优先级的网元。
在一种可能的实施方式中,基于上述三个预设条件最终确定的目标设备的数量可能较多,例如,系统设置有六个故障优先级,所述预设优先级为第三优先级,所述预设路径开销值为76,在所有向所述故障分析设备发送故障报文的网络设备中,有十个网络设备满足上述三个预设条件,这十个网络设备检测到的故障原因对应的故障优先级包括第四优先级、第五优先级以及第六优先级,这十个网络设备到根桥的路径开销值包括19和38。可以理解,网络设备检测到的故障原因对应的故障优先级越高,网络设备离网桥的越近,故障的影响越大,越需要优先排查,因此,在采用上述三个预设条件确定出多个目标设备之后,可以再从所述多个目标设备中筛选故障优先级最高的网元作为第三候选网元,最后从所述第三候选网元中筛选出路径开销值最小的网元作为最终的故障网元;或者,将上述第二预设条件和第三预设条件设置为如下:第二预设条件:所述网络设备发送的故障报文对应的故障优先级在所述第一候选网元中最高;第三预设条件:所述网络设备与根桥之间的路径开销值在所述第二候选网元中最小。
举例来讲,若所述网络设备是在接收到所述故障分析设备发送的维护信息请求报文之后,将所述故障报文发送给所述故障分析设备,所述故障分析设备每隔10秒发送一次NTDP请求报文,在网络中有六个网元检测到故障的情况下,在某一时刻,所述故障分析设备接收到这六个网络设备发送的携带有扩展字段的NTDP响应报文之后,获取到的故障信息如下表2所示:
表2故障信息
网络设备 故障报文数量 故障标识 路径开销
网元1 5 第一故障标识 38
网元2 7 第五故障标识 19
网元3 6 第六故障标识 38
网元4 6 第四故障标识 19
网元5 7 第六故障标识 38
网元6 7 第二故障标识 76
根据表2中的数据,所述故障分析设备首先根据接收到的每个网络设备周期性发送的故障报文的数量,将周期性发送故障报文数量大于或者等于所述预设次数的网络设备作为第一候选网元,若所述预设次数为6,则表2中,在当前时刻,故障分析设备只接收到网元1连续发送的五个故障报文,确定所述网元1不满足所述第一预设条件,不能作为第一候选网元,网元2至网元6为第一候选网元。然后,所述故障分析设备根据所述第一候选网元发送的故障报文中的故障标识,确定故障原因以及故障原因对应的故障优先级,进而确定所述第一候选网元中每个候选网元对应的故障优先级在所述第一候选网元中是否最高,将在所述第一候选网元中故障优先级最高的一个或者多个网络设备作为第二候选网元,例如,上述场景一至场景六分别对应第一故障标识至第六故障标识,以场景一和场景二两种场景中的两种故障原因对应的故障优先级为第一故障优先级,场景三和场景四两种场景中的两种故障原因对应的故障优先级为第二故障优先级,场景五和场景六两种场景中的两种故障原因对应的故障优先级为第三故障优先级,则第五故障标识和第六故障标识对应的分别为场景五和场景六中的故障原因,即网元2、网元3以及网元5在所述第一候选网元中对应的故障优先级最高,确定网元2、网元3以及网元5为第二候选网元。最后,所述故障分析设备根据所述第二候选网元中每个网络设备与所述根桥的路径开销值,确定每个网络设备与根桥的路径开销值是否在所述第二候选网元中最小,将与所述根桥之间路径开销值最小的网络设备作为目标设备,所述目标设备即为排出网络故障的最优排查网元,根据表2中的数据,所述第二候选网元中,网元2与所述根桥的路径开销值最小,则确定网元2为目标设备。
上述实施例中,确定网络设备是否满足预设条件时,首先确定是否满足预设条件一,再确定是否满足预设条件二,最后再确定是否满足条件三,可以理解,在判断所述网络设备是否满足上述三个预设条件时,也可以先确定是否满足条件一,再确定是否满足条件三,最后确定是否满足条件二;还可以先确定是否满足条件二,再确定是否满足条件一,最后确定是否满足条件三,本申请实施例不做具体限定。
在一种可能的实施例中,所述网络设备所在的网络支持多生成树协议(multiplespanning tree protocol,MSTP),MSTP把一个交换网络划分成多个域,每个域内形成多棵生成树,生成树之间彼此独立,每个生成树就是一个MSTI。在所述网络设备所在的网络运行MSTP的情况下,所述网络设备可能属于多个MSTI,上述扩展字段中MSTI字段表示所述网络设备检测到的故障所属的MSTI的实例号。举例来讲,若网络中存在100个网元,所述100个网元被划分为500个MSTI,每个MSTI对应一个实例号,则该网络中一个网元会属于多个MSTI,即一个网元属于多个生成树,如果一个网元检测到故障,则该故障可能是该网元所属的多个生成树中的一个生成树出现故障,也可能是该网元所属的多个生成树中的两个或者两个以上的生成树出现故障。在网络设备所属的多个生成树中的两个或者两个以上的生成树发生故障的情况下,所述网络设备会在多个生成树中检测到故障,则所述网络设备发送给所述故障分析设备的NTDP响应报文中可以包括多个扩展字段,所述多个扩展字段中的每个扩展字段用于承载所述网络设备在其中一个生成树中的故障信息,每个扩展字段中的MSTI字段的实例号表示所述网络设备在哪个实例号对应的MSTI中检测到故障,其中,所述网络设备在所述多个生成树中的每个生成树中分析得到的故障原因可能相同,也可能不同。
在所述网络设备所在的网络运行MSTP的情况下,所述网络设备发送的故障报文中,可能包括多个MSTI对应的故障信息,在所述网络设备发送了多个MSTI对应的故障信息的情况下,所述故障分析设备根据故障报文中MSTI字段的实例号对所述网络设备发送的故障信息进行区分,将每个实例号对应的故障信息作为一个网元的故障报文,进行上述预设条件的判断,进而确定每个实例号对应的故障信息是否满足预设条件,若所述多个实例号对应的故障信息中有一个或者一个以上的实例号对应的故障信息满足所述预设条件,则将该网络设备作为目标设备。
结合上文图1-图4所示的相关实施例,下面阐述本申请实施例涉及的相关网络设备及系统。请参见图5,图5是本申请实施例提供的一种网络故障定位系统,该系统100可包括第一网络设备102和多个第二网络设备104。其中,第一网络设备102包括通信模块1021以及处理模块1022。第二网络设备104包括通信模块1041以及处理模块1042。其中,
处理模块1022用于对第一网络设备102的动作进行控制管理。例如,处理模块1022可用于执行图3中步骤S106、S108和/或用于执行本申请方法实施例中所述故障分析设备所执行的其它步骤。通信模块1021用于支持第一网络设备102与其他设备或模块的通信,例如,通信模块1021用于支持第一网络设备102执行图3中步骤S106中接收故障报文,和/或用于执行本文所描述的技术的其它步骤。
处理模块1042用于对第二网络设备104的动作进行控制管理。例如,处理模块1042可用于执行如图3中步骤S102、S104和/或用于执行本申请方法实施例中所述网络设备所执行的其它步骤。通信模块1041用于支持第二网络设备104与其他设备或模块的通信,例如,通信模块1041用于支持第二网络设备104执行图3中步骤S104和/或用于执行本文所描述的技术的其它步骤。
可选地,第一网络设备102中还可包括存储模块1023。该存储模块1023用于存储第一网络设备102的程序代码和数据。处理模块1022可调用存储模块1023中的程序代码实现上述方法实施例中描述的以故障分析设备为执行主体的部分实施步骤或全部实施步骤。第二网络设备104还可包括存储模块1043。该存储模块1043用于存储第二网络设备104的程序代码和数据。处理模块1042可调用存储模块1043中的程序代码实现上述方法实施例中描述的以网络设备为执行主体的部分实施步骤或全部实施步骤。
其中,处理模块1022和处理模块1042可以是处理器或控制器,例如可以是中央处理器(central processing unit,CPU),通用处理器,数字信号处理器(digital signalprocessor,DSP),专用集成电路(application-specific integrated circuit,ASIC),现场可编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。通信模块(具体可为通信模块1021或1041)可以是通信接口、收发器、收发电路等,其中,通信接口是统称,可以包括一个或多个接口,例如通信模块与处理模块之间的接口、计算设备与其他设备之间的接口等。存储模块(具体可为存储模块1023或1043)可以是存储器,或者其他用于提供存储功能的服务或模块。
请参见图6所示,图6是本申请实施例提供的另一种网络故障定位系统,该网络故障定位系统110包括第一网络设备112和多个第二网络设备114。其中,第一网络设备112包括通信接口1121、处理器1122以及存储器1123,可选地,第一网络设备112还可以包括总线1124。其中,通信接口1121、处理器1122以及存储器1123可以通过总线1124相互连接;总线1124可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。所述总线1124可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
同样地,第二网络设备114包括通信接口1141、处理器1142以及存储器1143,可选地,第二网络设备114还可以包括总线1144。其中,通信接口1141、处理器1142以及存储器1143可以通过总线1144相互连接,关于总线1144可参见前文总线1124的相关阐述。其中:
处理器(具体可为处理器1122或1142)可以由一个或者多个通用处理器构成,例如CPU。处理器可用于运行相关程序代码中处理功能的程序。也就是说,处理器执行程序代码可以实现上述处理模块的功能。其中,关于处理模块具体可参见前述实施例中的相关阐述。具体的,处理器1122可用于运行存储器1123中的相关程序代码以实现处理模块1122的功能,或者处理模块1122可用于执行图3中步骤S106、S108和/或用于执行本申请方法实施例中所述故障分析设备所执行的其它步骤。
处理器1142可用于运行存储器1143中的相关程序代码以实现处理模块1142的功能,或者执行如图3中步骤S102、S104和/或用于执行本申请方法实施例中所述网络设备所执行的其它步骤。
通信接口(具体可为通信接口1121或1141)可以为有线接口(例如以太网接口)或无线接口(例如蜂窝网络接口或使用无线局域网接口),用于与其他模块或设备进行通信。例如,本申请实施例中通信接口1121具体可用于接收第二网络设备发送的报文,或者向第二网络设备发送报文等。
存储器(具体可为存储器1123或1143)可以包括易失性存储器(volatilememory),例如随机存取存储器(random access memory,RAM);存储器也可以包括非易失性存储器(non-volatile memory),例如只读存储器(read-only memory,ROM)、快闪存储器(flash memory)、硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);存储器还可以包括上述种类的存储器的组合。存储器可用于存储一组程序代码,以便于处理器调用存储器中存储的程序代码以实现本申请实施例中涉及的通信模块和/或处理模块的功能,本申请实施例并不做限定。
需要说明的,图5或图6仅仅是本申请实施例的一种可能的实现方式,实际应用中,网故障定位系统还可以包括更多或更少的部件,这里不作限制。关于本申请实施例中未示出或未描述的内容,可参见前述方法实施例中的相关阐述,这里不再赘述。
本发明实施例还提供一种计算机非瞬态存储介质,所述计算机非瞬态存储介质中存储有指令,当其在处理器上运行时,执行图3中步骤S106、S108和/或用于执行本申请方法实施例中所述故障分析设备所执行的其它步骤。
本发明实施例还提供一种计算机非瞬态存储介质,所述计算机非瞬态存储介质中存储有指令,当其在处理器上运行时,如图3中步骤S102、S104和/或用于执行本申请方法实施例中所述网络设备所执行的其它步骤。
结合本发明实施例公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于RAM、闪存、ROM、可擦除可编程只读存储器(erasable programmableROM,EPROM)、电可擦可编程只读存储器(Electrically EPROM,EEPROM)、寄存器、硬盘、移动硬盘、只读光盘(CD-ROM)或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于计算设备中。当然,处理器和存储介质也可以作为分立组件存在于计算设备中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (16)

1.一种网络故障定位方法,其特征在于,包括:
故障分析设备接收网络设备发送的故障报文,其中,所述故障报文包括所述网络设备检测到的故障原因以及所述网络设备与第一根桥之间的路径开销值,所述第一根桥为所述网络设备所在的网络根据生成树协议确定的根节点;
所述故障分析设备获取所述故障报文对应的故障信息;其中,所述故障信息包括所述网络设备周期性发送所述故障报文的次数、所述故障原因对应的故障优先级以及所述网络设备与所述第一根桥之间的路径开销值;
在所述故障信息满足预设条件的情况下,确定所述网络设备为目标设备,所述预设条件包括所述网络设备在预设时间段发送故障报文的次数大于或者等于预设次数、所述故障原因对应的故障优先级高于预设优先级、所述网络设备与所述第一根桥之间的路径开销值小于预设开销值,所述目标设备为确定网络故障原因的优先排查设备。
2.根据权利要求1所述的方法,其特征在于,所述故障报文承载有故障标识,所述故障标识用于指示所述故障原因;其中,
在所述故障标识为第一故障标识的情况下,表明所述故障原因为所述网络设备与所述第一根桥之间的网络拓扑发生变化;或者,
在所述故障标识为第二故障标识的情况下,表明所述故障原因为所述第一根桥与所述网络设备之间的通信链路异常,所述通信链路异常包括所述网络设备与所述第一根桥之间的链路发生闪断、所述网络设备与所述第一根桥之间的网络发生拥塞或所述网络设备与所述第一根桥之间的网元发生软件异常;或者,
在所述故障标识为第三故障标识的情况下,表明所述故障原因为所述网络设备所在的网络中出现比所述第一根桥优先级高的第二根桥,且所述第二根桥与所述网络设备之间的通信链路异常,所述第二根桥为所述第二根桥发送的第二桥接协议数据单元BPDU报文的优先级高于所述第一根桥发送的第一BPDU报文的情况下,所述网络设备所在的网络根据生成树协议确定的根节点。
3.根据所述权利要求2所述的方法,其特征在于,
在所述故障原因为所述网络设备与所述第一根桥之间的网络拓扑发生变化的情况下:
所述网络设备接收所述第一根桥发送的所述第一BPDU报文的端口发生变化,或者,所述网络设备接收到的所述第一根桥发送的所述第一BPDU报文的存活时间字段或者路径开销字段中的一个或者多个变化;
在所述故障原因为所述第一根桥与所述网络设备之间的通信链路异常的情况下:
所述网络设备接收不到所述第一根桥发送的所述第一BPDU报文;
所述故障原因为所述网络设备所在的网络中出现比所述第一根桥优先级高的第二根桥,且所述第二根桥与所述网络设备之间的通信链路异常的情况下:
所述网络设备接收不到所述第二根桥发送的所述第二BPDU报文。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述故障报文还包括所述网络设备的互联网协议地址,所述互联网协议地址用于在确定所述网络设备为目标设备后,供用户登录所述网络设备以排除故障。
5.根据权利要求2至4所述的方法,其特征在于,
根据所述故障报文中的原因字段确定所述故障原因对应的故障优先级,所述原因字段承载有所述故障标识;
根据所述故障报文中的路径开销字段确定所述网络设备与所述第一根桥之间的路径开销值。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述故障报文为协议报文,所述故障信息承载于所述协议报文的扩展字段中,所述扩展字段包括原因字段以及路径开销字段,其中,所述原因字段用于承载所述故障原因,所述路径开销字段用于承载所述路径开销值,所述协议报文包括网络拓扑发现协议NTDP报文、简单网络管理协议SNMP报文中的任意一种。
7.一种网络故障定位方法,其特征在于,包括:
网络设备检测到故障并确定故障原因;
根据所述故障原因生成故障报文,所述故障报文包括所述网络设备确定的故障原因以及所述网络设备与第一根桥之间的路径开销值,所述第一根桥为所述网络设备所在的网络根据生成树协议确定的根节点;
向故障分析设备发送所述故障报文。
8.根据权利要求7所述的方法,其特征在于,所述网络设备检测到故障并确定故障原因,包括:
在所述网络设备检测到接收所述第一根桥发送的第一接协议数据单元BPDU报文的端口发生变化,或者,在所述网络设备接收到的所述第一BPDU报文中的存活时间字段或者路径开销字段中的一个或者多个变化的情况下,确定所述故障原因为所述网络设备与所述第一根桥之间的网络拓扑发生变化;或者,
在所述网络设备接收不到所述第一根桥发送的所述第一BPDU报文的情况下,所述故障原因为所述第一根桥与所述网络设备之间的通信链路异常,所述通信链路异常包括所述网络设备与所述第一根桥之间的链路发生闪断、所述网络设备与所述第一根桥之间的网络发生拥塞、所述网络设备与所述第一根桥之间的网元发生软件异常;或者,
在所述网络设备接收到的第二根桥发送的第二BPDU报文的优先级高于所述第一根桥发送的第一BPDU报文之后,所述网络设备接收不到所述第二根桥发送的所述第二BPDU报文的情况下,所述故障原因为所述网络设备所在的网络中出现比所述第一根桥优先级高的第二根桥,且所述第二根桥与所述网络设备之间的通信链路异常,其中,所述第二根桥为所述第二根桥发送的第二桥接协议数据单元BPDU报文的优先级高于所述第一根桥发送的第一BPDU报文的情况下,所述网络设备所在的网络根据生成树协议确定的根节点。
9.根据权利要求8所述的方法,其特征在于,所述故障报文承载有故障标识,所述故障标识用于指示所述故障原因;其中,
在所述故障标识为第一故障标识的情况下,表明所述故障原因为所述网络设备与所述第一根桥之间的网络拓扑发生变化;或者,
在所述故障标识为第二故障标识的情况下,表明所述故障原因为所述第一根桥与所述网络设备之间的通信链路异常;或者,
在所述故障标识为第三故障标识的情况下,表明所述故障原因为所述网络设备所在的网络中出现比所述第一根桥优先级高的第二根桥,且所述第二根桥与所述网络设备之间的通信链路异常。
10.根据权利要求7至9任一项所述的方法,其特征在于,所述故障报文还包括所述网络设备的互联网协议地址,所述互联网协议地址用于在确定所述网络设备为目标设备后,供用户登录所述网络设备以排除故障。
11.根据权利要求7至10任一项所述的方法,其特征在于,所述故障报文为协议报文,所述故障信息承载于所述协议报文的扩展字段中,所述扩展字段包括原因字段以及路径开销字段,其中,所述原因字段用于承载所述故障原因,所述路径开销字段用于承载所述路径开销值,所述协议报文包括网络拓扑发现协议NTDP报文、简单网络管理协议SNMP报文中的任意一种。
12.一种网络故障定位系统,其特征在于,包括故障分析设备以及多个网络设备,所述故障分析设备用于执行如权利要求1-6中任一项所述的方法,所述多个网络设备中每个网络设备用于执行如权利要求7-11中任一项所述的方法。
13.一种网络设备,其特征在于,包括执行如权利要求1-6任一项所述的方法的单元。
14.一种网络设备,其特征在于,包括执行如权利要求7-11任一项所述的方法的单元。
15.一种网络设备,其特征在于,包括处理器、通信接口以及存储器;所述存储器用于存储指令,所述处理器用于执行所述指令,所述通信接口用于接收或者发送数据;其中,所述处理器执行所述指令时执行如上权利要求1-10任一项所述的方法。
16.一种非瞬态计算机存储介质,所述计算机非瞬态介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-10任一项所述的方法。
CN201811598784.7A 2018-12-25 2018-12-25 网络故障定位方法、相关设备及计算机存储介质 Active CN109495322B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811598784.7A CN109495322B (zh) 2018-12-25 2018-12-25 网络故障定位方法、相关设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811598784.7A CN109495322B (zh) 2018-12-25 2018-12-25 网络故障定位方法、相关设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN109495322A true CN109495322A (zh) 2019-03-19
CN109495322B CN109495322B (zh) 2022-03-29

Family

ID=65712036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811598784.7A Active CN109495322B (zh) 2018-12-25 2018-12-25 网络故障定位方法、相关设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN109495322B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110611596A (zh) * 2019-09-30 2019-12-24 广州竞远安全技术股份有限公司 一种局域网故障定位系统
CN111131249A (zh) * 2019-12-24 2020-05-08 国网北京市电力公司 数据的处理方法及装置
CN111147303A (zh) * 2019-12-27 2020-05-12 迈普通信技术股份有限公司 消息处理方法、装置、网络系统、电子设备及存储介质
CN111988170A (zh) * 2020-08-07 2020-11-24 锐捷网络股份有限公司 一种终端故障定位方法及装置
CN112367196A (zh) * 2020-10-30 2021-02-12 锐捷网络股份有限公司 一种检测网络通信故障的方法、装置及电子设备
CN113242141A (zh) * 2021-03-31 2021-08-10 联想(北京)有限公司 一种用户面网元的故障检测方法及装置
CN113542057A (zh) * 2021-06-23 2021-10-22 浙江中控技术股份有限公司 基于冗余设备的通信故障检测方法、设备和系统
CN113708995A (zh) * 2021-08-20 2021-11-26 深圳市风云实业有限公司 一种网络故障诊断方法、系统、电子设备及存储介质
CN113890819A (zh) * 2021-09-29 2022-01-04 杭州迪普科技股份有限公司 故障处理方法、装置及系统
CN114520760A (zh) * 2020-11-20 2022-05-20 华为技术有限公司 一种跨域故障分析的方法及系统
CN114978939A (zh) * 2022-06-10 2022-08-30 中煤科工重庆设计研究院(集团)有限公司 一种网络链路质量的检测方法
CN115102841A (zh) * 2022-07-04 2022-09-23 大陆汽车研发(重庆)有限公司 网络故障恢复方法、装置、设备及存储介质
CN115378852A (zh) * 2022-08-18 2022-11-22 北京中航弱电系统工程有限公司 一种网络线路排障方法、装置及存储介质
CN115550094A (zh) * 2022-12-01 2022-12-30 深圳市人马互动科技有限公司 一种局域网自组网方法以及装置
CN117290151A (zh) * 2023-11-27 2023-12-26 宁德时代新能源科技股份有限公司 电源模块的故障原因确定方法、装置、设备、系统和介质
CN117290150A (zh) * 2023-11-27 2023-12-26 宁德时代新能源科技股份有限公司 故障原因确定方法、装置、设备、系统和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060203735A1 (en) * 2005-03-14 2006-09-14 Fujitsu Limited Bridge apparatus and control packet processing apparatus in a spanning tree protocol network
CN101102268A (zh) * 2007-08-03 2008-01-09 华为技术有限公司 Ip环网,ip环网路由设备,及报文转发方法
US20110305458A1 (en) * 2009-02-25 2011-12-15 Huawei Technologies Co., Ltd. Method and device for service adaptation
CN103457778A (zh) * 2013-09-09 2013-12-18 华为技术有限公司 以太网交换网络的通信方法和设备
CN106452862A (zh) * 2016-09-29 2017-02-22 北京东土科技股份有限公司 一种确定环形网络的方法及装置
CN107294856A (zh) * 2016-03-31 2017-10-24 华为技术有限公司 确定拓扑变化的方法、设备及系统
CN108512751A (zh) * 2017-02-28 2018-09-07 华为技术有限公司 一种端口状态处理方法以及网络设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060203735A1 (en) * 2005-03-14 2006-09-14 Fujitsu Limited Bridge apparatus and control packet processing apparatus in a spanning tree protocol network
CN101102268A (zh) * 2007-08-03 2008-01-09 华为技术有限公司 Ip环网,ip环网路由设备,及报文转发方法
US20110305458A1 (en) * 2009-02-25 2011-12-15 Huawei Technologies Co., Ltd. Method and device for service adaptation
CN103457778A (zh) * 2013-09-09 2013-12-18 华为技术有限公司 以太网交换网络的通信方法和设备
CN107294856A (zh) * 2016-03-31 2017-10-24 华为技术有限公司 确定拓扑变化的方法、设备及系统
CN106452862A (zh) * 2016-09-29 2017-02-22 北京东土科技股份有限公司 一种确定环形网络的方法及装置
CN108512751A (zh) * 2017-02-28 2018-09-07 华为技术有限公司 一种端口状态处理方法以及网络设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHRISTINE ALFI,YARA K.HILAL: "Network fabric fault-tolerance for Ethernet-based Networked Control Systems", 《INDIN》 *
肖勇,连春雨: "基于故障定位集的无线传感器网络故障检测", 《计算机测量与控制》 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110611596A (zh) * 2019-09-30 2019-12-24 广州竞远安全技术股份有限公司 一种局域网故障定位系统
CN111131249A (zh) * 2019-12-24 2020-05-08 国网北京市电力公司 数据的处理方法及装置
CN111131249B (zh) * 2019-12-24 2022-08-12 国网北京市电力公司 数据的处理方法及装置
CN111147303B (zh) * 2019-12-27 2022-05-17 迈普通信技术股份有限公司 消息处理方法、装置、网络系统、电子设备及存储介质
CN111147303A (zh) * 2019-12-27 2020-05-12 迈普通信技术股份有限公司 消息处理方法、装置、网络系统、电子设备及存储介质
CN111988170A (zh) * 2020-08-07 2020-11-24 锐捷网络股份有限公司 一种终端故障定位方法及装置
CN111988170B (zh) * 2020-08-07 2023-04-28 锐捷网络股份有限公司 一种终端故障定位方法及装置
CN112367196A (zh) * 2020-10-30 2021-02-12 锐捷网络股份有限公司 一种检测网络通信故障的方法、装置及电子设备
CN112367196B (zh) * 2020-10-30 2023-03-21 锐捷网络股份有限公司 一种检测网络通信故障的方法、装置及电子设备
CN114520760B (zh) * 2020-11-20 2023-08-22 华为技术有限公司 一种跨域故障分析的方法及系统
CN114520760A (zh) * 2020-11-20 2022-05-20 华为技术有限公司 一种跨域故障分析的方法及系统
CN113242141A (zh) * 2021-03-31 2021-08-10 联想(北京)有限公司 一种用户面网元的故障检测方法及装置
CN113542057A (zh) * 2021-06-23 2021-10-22 浙江中控技术股份有限公司 基于冗余设备的通信故障检测方法、设备和系统
CN113542057B (zh) * 2021-06-23 2022-11-01 浙江中控技术股份有限公司 基于冗余设备的通信故障检测方法、设备和系统
CN113708995B (zh) * 2021-08-20 2023-04-07 深圳市风云实业有限公司 一种网络故障诊断方法、系统、电子设备及存储介质
CN113708995A (zh) * 2021-08-20 2021-11-26 深圳市风云实业有限公司 一种网络故障诊断方法、系统、电子设备及存储介质
CN113890819A (zh) * 2021-09-29 2022-01-04 杭州迪普科技股份有限公司 故障处理方法、装置及系统
CN114978939A (zh) * 2022-06-10 2022-08-30 中煤科工重庆设计研究院(集团)有限公司 一种网络链路质量的检测方法
CN115102841A (zh) * 2022-07-04 2022-09-23 大陆汽车研发(重庆)有限公司 网络故障恢复方法、装置、设备及存储介质
CN115102841B (zh) * 2022-07-04 2023-11-28 大陆汽车研发(重庆)有限公司 网络故障恢复方法、装置、设备及存储介质
CN115378852A (zh) * 2022-08-18 2022-11-22 北京中航弱电系统工程有限公司 一种网络线路排障方法、装置及存储介质
CN115550094A (zh) * 2022-12-01 2022-12-30 深圳市人马互动科技有限公司 一种局域网自组网方法以及装置
CN117290151A (zh) * 2023-11-27 2023-12-26 宁德时代新能源科技股份有限公司 电源模块的故障原因确定方法、装置、设备、系统和介质
CN117290150A (zh) * 2023-11-27 2023-12-26 宁德时代新能源科技股份有限公司 故障原因确定方法、装置、设备、系统和介质
CN117290150B (zh) * 2023-11-27 2024-04-19 宁德时代新能源科技股份有限公司 故障原因确定方法、装置、设备、系统和介质
CN117290151B (zh) * 2023-11-27 2024-06-18 宁德时代新能源科技股份有限公司 电源模块的故障原因确定方法、装置、设备、系统和介质

Also Published As

Publication number Publication date
CN109495322B (zh) 2022-03-29

Similar Documents

Publication Publication Date Title
CN109495322A (zh) 网络故障定位方法、相关设备及计算机存储介质
US11228515B2 (en) Data packet detection method, device, and system
CN113079091B (zh) 一种主动随流检测的方法、网络设备以及通信系统
KR101324877B1 (ko) 네트워크 감시 방법, 시스템 및 컴퓨터 판독가능 저장 매체
US8672566B2 (en) Node apparatus and communication method
US11784915B2 (en) Multicast packet processing method and device
JPH077518A (ja) ネットワーク解析方法
CN108123824A (zh) 一种网络故障检测方法及装置
WO2021093465A1 (zh) 发送报文、接收报文以进行oam的方法、装置及系统
CN105530115B (zh) 一种实现操作管理维护功能的方法及装置
JP2009016987A (ja) リモートトラフィック監視方法
CN109660624A (zh) 内容分发网络资源的规划方法、服务器及存储介质
JP2017188814A (ja) ネットワーク装置
US20140092725A1 (en) Method and first network node for managing an ethernet network
CN104506369B (zh) 一种丢包位置的检测方法和设备
WO2021027420A1 (zh) 用于数据传输的方法和装置
CN111211977B (zh) 一种支持外界多异构信道连接的舰船通信方法及系统
CN108111423A (zh) 流量传输管理方法、装置及网络分路设备
CN115955690A (zh) 不良网络链路性能的基于无线信号强度的检测
JP2011244312A (ja) ノード装置、最適パス決定方法及びプログラム
US10904123B2 (en) Trace routing in virtual networks
CN110120891A (zh) 组网中阻止链路回切的方法、装置、网络设备及存储介质
Wu et al. A network business quality intelligent assessment and fault location method based on IFIT
CN107104837A (zh) 路径检测的方法和控制设备
CN108718267A (zh) 一种rpr环中数据报文传输方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant