CN107819594A - 网络故障定位方法及装置 - Google Patents

网络故障定位方法及装置 Download PDF

Info

Publication number
CN107819594A
CN107819594A CN201610817420.8A CN201610817420A CN107819594A CN 107819594 A CN107819594 A CN 107819594A CN 201610817420 A CN201610817420 A CN 201610817420A CN 107819594 A CN107819594 A CN 107819594A
Authority
CN
China
Prior art keywords
node
message
forward node
chain
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610817420.8A
Other languages
English (en)
Other versions
CN107819594B (zh
Inventor
王姝懿
王大勇
毕以峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201610817420.8A priority Critical patent/CN107819594B/zh
Publication of CN107819594A publication Critical patent/CN107819594A/zh
Application granted granted Critical
Publication of CN107819594B publication Critical patent/CN107819594B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种网络故障定位方法及装置,其中,该方法包括:控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文,该控制面设备接收该第一转发节点集合中的转发节点反馈的第二诊断报文,以及确定反馈该第二诊断报文的转发节点,得到第二转发节点集合,其中,该第二诊断报文是由该第一转发节点集合中的转发节点复制该第一诊断报文得到的报文;该控制面设备依据该第二转发节点集合确定存在网络故障的节点。采用上述技术方案,解决了相关技术中定位网络故障难度大,精确度低的问题,实现了便捷精确的找出存在网络故障的节点。

Description

网络故障定位方法及装置
技术领域
本发明涉及通信领域,具体而言,涉及一种网络故障定位方法及装置。
背景技术
相关技术中报文交换过程中,基于internet协议的报文交换网络通信业务,是由路径两端的通信双方和路径中的一系列网络设备按照规则协力完成。一个报文从始发端主机发出后,将发送给路径中的第一个转发设备,后者对报文进行处理后将之发送给路径上的第二个转发设备,如此重复直至发送到接收端主机。每个转发设备及其出向端口,和它所指向的路径上的下一个转发设备,组成一个有方向的链路。网络传输的完整路径就是由这样的有方向链路按顺序组合而成,也称为转发节点集合。当网络中的任意一个转发设备产生物理故障时,比如端口损坏,或者逻辑故障,或者路径指示和路径上的其他设备不一致,都会使得报文无法送达接收端从而导致通信失败,此时管理员会收到故障申告,指示是何种业务何种路径产生故障,但是现有技术并不能精确地定位故障
相关技术中软件定义网络(Software Defined Network,简称为SDN)是一种新型的数据通信网络技术。SDN的特点是控制和转发分离,将原有网络中转发设备的控制部分分离出来,由独立系统实现,剩余的转发部分由网络设备实现。前者可称为控制面设备/控制层,后者可称为转发面或者转发层。随着云计算及SDN/NFV的广泛应用,网络虚拟化以及叠加网络的出现使得网络拓扑结构更加复杂,网络管理人员定位故障的难度加大。
针对相关技术中定位网络故障难度大,精确度低的问题,目前还没有有效的解决方案。
发明内容
本发明实施例提供了一种网络故障定位方法及装置,以至少解决相关技术中定位网络故障难度大,精确度低的问题。
根据本发明的一个实施例,提供了一种网络故障定位方法,包括:
控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文,其中,所述第一转发节点集合中的转发节点以所述指定节点为起始节点,依次向下一转发节点转发所述第一诊断报文;
所述控制面设备接收所述第一转发节点集合中的转发节点反馈的第二诊断报文,以及确定反馈所述第二诊断报文的转发节点,得到第二转发节点集合,其中,所述第二诊断报文是由所述第一转发节点集合中的转发节点复制所述第一诊断报文得到的报文;
所述控制面设备依据所述第二转发节点集合确定存在网络故障的节点。
可选地,在控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,所述方法还包括:所述控制面设备下发复制命令到所述第一转发节点集合中的转发节点,其中,所述复制命令用于指示所述第一转发节点集合中的转发节点复制所述第一诊断报文得到所述第二诊断报文,并将所述第二诊断报文反馈到所述控制面设备。
可选地,在所述控制面设备依据所述第二转发节点集合确定存在网络故障的节点之后,所述控制面设备删除向所述第一转发节点集合中的转发节点下发的复制命令。
可选地,所述第一诊断报文是所述控制面设备在软件定义网络SDN报文转发失败时依据与所述SDN报文对应的业务信息构造的。
可选地,所述控制面设备依据所述第二转发节点集合确定存在网络故障的节点包括:
所述控制面设备将所述第一转发节点集合与所述第二转发节点集合进行比较,找出属于第一转发节点集合但不属于第二转发节点集合中的节点,得到第三转发节点集合,确定所述第三转发节点集合中位于所述业务路径上所述第一诊断报文前进方向的第一个节点为存在网络故障的节点。
可选地,在控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,所述方法还包括:
所述控制面设备向所述第一转发节点集合中的除指定节点外的所有转发节点下发复制命令,其中,所述复制命令用于指示所述第一转发节点集合中的转发节点复制所述第一诊断报文得到所述第二诊断报文,并将所述第二诊断报文反馈到所述控制面设备。
可选地,在控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,所述方法还包括:
所述控制面设备从所述第一转发节点集合中的所述指定节点之后的节点开始,依次选择下一个节点作为当前节点,所述控制面设备下发复制命令到所述当前节点,其中,在所述控制面设备接收到所述当前节点反馈的第二诊断报文之后,所述控制面设备选择所述当前节点的下一个节点为当前节点,并下发复制命令,其中,所述复制命令用于指示所述当前节点复制第一诊断报文得到第二诊断报文,并将所述第二诊断报文反馈到所述控制面设备。
可选地,在控制面设备向业务路径中上的第一转发节点集合中的指定节点发送第一诊断报文之后,所述方法还包括:
在以下之一情况下,所述控制面设备删除向所述当前节点下发的复制命令:
所述控制面设备接收到所述当前节点反馈的所述第二诊断报文;
所述控制面设备在预设时间内没有收到所述当前节点反馈的所述第二诊断报文。
可选地,所述指定节点包括:所述第一转发节点集合中的首节点。
根据本发明的另一个实施例,提供了一种网络故障定位装置,应用于控制面设备,包括:
发送模块,用于向业务路径上第一转发节点集合中的指定节点发送第一诊断报文,其中,所述第一转发节点集合中的转发节点以所述指定节点为起始节点,依次向下一转发节点转发所述第一诊断报文;
接收模块,用于接收所述第一转发节点集合中的转发节点反馈的第二诊断报文,以及确定反馈所述第二诊断报文的转发节点,得到第二转发节点集合,其中,所述第二诊断报文是由所述第一转发节点集合中的转发节点复制所述第一诊断报文得到的报文;
确定模块,用于依据所述第二转发节点集合确定存在网络故障的节点。
可选地,所述发送模块还用于在控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,所述控制面设备下发复制命令到所述第一转发节点集合中的转发节点,其中,所述复制命令用于指示所述第一转发节点集合中的转发节点复制所述第一诊断报文得到所述第二诊断报文,并将所述第二诊断报文反馈到所述控制面设备。
可选地,所述确定模块还用于在依据所述第二转发节点集合确定存在网络故障的节点之后,删除向所述第一转发节点集合中的转发节点下发的复制命令。
可选地,所述第一诊断报文是所述控制面设备在软件定义网络SDN报文转发失败时依据与所述SDN报文对应的业务信息构造的。
可选地,所述确定模块还用于将所述第一转发节点集合与所述第二转发节点集合进行比较,找出属于第一转发节点集合但不属于第二转发节点集合中的节点,得到第三转发节点集合,确定所述第三转发节点集合中位于所述业务路径上所述第一诊断报文前进方向的第一个节点为存在网络故障的节点。
可选地,所述发送模块还用于在向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,向所述第一转发节点集合中的除指定节点外的所有转发节点下发复制命令,其中,所述复制命令用于指示所述第一转发节点集合中的转发节点复制所述第一诊断报文得到所述第二诊断报文,并将所述第二诊断报文反馈到所述控制面设备。
可选地,所述发送模块还用于在向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,从所述第一转发节点集合中的所述指定节点之后的节点开始,依次选择下一个节点作为当前节点,并下发复制命令到所述当前节点,其中,在所述控制面设备接收到所述当前节点反馈的第二诊断报文之后,所述发送模块选择所述当前节点的下一个节点为当前节点,并下发复制命令,其中,所述复制命令用于指示所述当前节点复制第一诊断报文得到第二诊断报文,并将所述第二诊断报文反馈到所述控制面设备。
可选地,所述确定模块还用于在所述控制面设备向业务路径中上的第一转发节点集合中的指定节点发送第一诊断报文之后,在以下之一情况下,删除向所述当前节点下发的复制命令:
所述控制面设备接收到所述当前节点反馈的所述第二诊断报文;
所述控制面设备在预设时间内没有收到所述当前节点反馈的所述第二诊断报文。
可选地,所述指定节点包括:所述第一转发节点集合中的首节点。
根据本发明的又一个实施例,还提供了一种存储介质。该存储介质设置为存储用于执行以下步骤的程序代码:
控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文,其中,所述第一转发节点集合中的转发节点以所述指定节点为起始节点,依次向下一转发节点转发所述第一诊断报文;
所述控制面设备接收所述第一转发节点集合中的转发节点反馈的第二诊断报文,以及确定反馈所述第二诊断报文的转发节点,得到第二转发节点集合,其中,所述第二诊断报文是由所述第一转发节点集合中的转发节点复制所述第一诊断报文得到的报文;
所述控制面设备依据所述第二转发节点集合确定存在网络故障的节点。
通过本发明,控制面设备向转发集合中的转发节点下发第一诊断保报文,转发节点将该第一诊断报文复制后反馈信息给控制面设备,并将第一诊断报文转发到下一节点,下一节点执行与上一节点同样的复制反馈动作并转发到下一节点,最终控制面设备依据反馈信息的节点与转发节点集合的对比,找出存在网络故障的节点。解决了相关技术中定位网络故障难度大,精确度低的问题,实现了便捷精确的找出存在网络故障的节点。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种网络故障定位方法的流程图;
图2是根据本发明实施例提供的网络故障定位装置的示意图;
图3是根据本发明实施例的调度单元处理过程示意图;
图4是根据本发明实施例的定位单元的处理流程示意图;
图5是根据本发明实施例的一种网络故障定位装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
实施例1
本申请实施例运行在SDN网络场景下,是一种SDN网络场景下的端到端故障定位方法。需要指出的是,本申请实施例中提供的上述信息传输方法的运行环境并不限于上述网络架构。
在本实施例中提供了一种运行于上述网路场景的一种网络故障定位方法,图1是根据本发明实施例的一种网络故障定位方法的流程图,如图1所示,该流程包括如下步骤:
步骤S102,控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文,其中,该第一转发节点集合中的转发节点以该指定节点为起始节点,依次向下一转发节点转发该第一诊断报文;
步骤S104,该控制面设备接收该第一转发节点集合中的转发节点反馈的第二诊断报文,以及确定反馈该第二诊断报文的转发节点,得到第二转发节点集合,其中,该第二诊断报文是由该第一转发节点集合中的转发节点复制该第一诊断报文得到的报文;
步骤S106,该控制面设备依据该第二转发节点集合确定存在网络故障的节点。
通过上述步骤,控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文,该控制面设备接收该第一转发节点集合中的转发节点反馈的第二诊断报文,以及确定反馈该第二诊断报文的转发节点,得到第二转发节点集合,该控制面设备依据该第二转发节点集合确定存在网络故障的节点。解决了相关技术中定位网络故障难度大,精确度低的问题,实现了便捷精确的找出存在网络故障的节点。
可选地,上述步骤的执行主体可以为SDN场景下的控制面设备,但不限于此。
在本申请的一个可选实施例中,在控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,该控制面设备下发复制命令到该第一转发节点集合中的转发节点,其中,该复制命令用于指示该第一转发节点集合中的转发节点复制该第一诊断报文得到该第二诊断报文,并将该第二诊断报文反馈到该控制面设备。该可选实施例中向所有第一转发节点集合中的转发节点下发复制报文,在后续的可选实施例中还有两种下发复制报文的方式。
可选地,在该控制面设备依据该第二转发节点集合确定存在网络故障的节点之后,该控制面设备删除向该第一转发节点集合中的转发节点下发的复制命令。其实在接收到一个节点的第二诊断报文之后,控制面设备已经可以将下发到该节点的复制命令删除,用于防止有类似诊断报文的其他报文经过该节点,该节点继续对类似报文执行复制命令,扰乱控制面设备找出故障设备。
可选地,该第一诊断报文是该控制面设备在软件定义网络SDN报文转发失败时依据与该SDN报文对应的业务信息构造的。该第一诊断报文是控制面设备依据故障申告信息和业务信息构造具有特定特征的第一诊断报文,但是像上一个可选实施例记载的,也有可能有类似报文与该第一诊断报文具有类似的特定特征。
可选地,在流程图中的S106记载了,依据第二转发节点集合找出网络故障点,本领域技术人员可能会有各种方法,本可选实施例提供了一种找出故障节点的方法,该控制面设备将该第一转发节点集合与该第二转发节点集合进行比较,找出属于第一转发节点集合但不属于第二转发节点集合中的节点,得到第三转发节点集合,确定该第三转发节点集合中位于该业务路径上该第一诊断报文前进方向的第一个节点为存在网络故障的节点。对于没有向控制面设备发送第二诊断报文的第三转发节点集合,可以确定的是该集合中的节点没有接收到第一诊断报文,(复制报文是控制面设备向每个转发节点单独发送的),由此确定第三转发节点集合中处于第一诊断报文前景方向的第一个节点为存在网络故障的节点。
可选地,在控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,该控制面设备向该第一转发节点集合中的除指定节点外的所有转发节点下发复制命令,其中,该复制命令用于指示该第一转发节点集合中的转发节点复制该第一诊断报文得到该第二诊断报文,并将该第二诊断报文反馈到该控制面设备。这是下发复制命令的又一种方式,给除指定节点外的转发节点下发复制命令,本领域技术人员可以确定指定节点的网络连接正常。
可选地,在控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,该方法还包括:该控制面设备从该第一转发节点集合中的该指定节点之后的节点开始,依次选择下一个节点作为当前节点,该控制面设备下发复制命令到该当前节点,其中,在该控制面设备接收到该当前节点反馈的第二诊断报文之后,该控制面设备选择该当前节点的下一个节点为当前节点,并下发复制命令,其中,该复制命令用于指示该当前节点复制第一诊断报文得到第二诊断报文,并将该第二诊断报文反馈到该控制面设备。上述实施例是下发复制命令的另一种方式。
可选地,在控制面设备向业务路径中上的第一转发节点集合中的指定节点发送第一诊断报文之后,在以下之一情况下,该控制面设备删除向该当前节点下发的复制命令:该控制面设备接收到该当前节点反馈的该第二诊断报文;该控制面设备在预设时间内没有收到该当前节点反馈的该第二诊断报文。
可选地,该指定节点包括:该第一转发节点集合中的首节点。本申请中记载的是一种网路故障定位方法,在查找之初可以依据人工选择从指定节点开始,首节点到指定节点这段的转发节点是否有故障可以通过其他方法检测。当然,在可选实施例中也可以从首节点开始。
为了解决相关技术中存在的问题,本发明实施例公开了一种实现SDN网络端到端的故障定位方法,在SDN网络报文转发失败时,管理员根据故障申告得到具体的业务路径或业务路径集合,以及业务特征,然后针对每一条路径模拟实际的报文发送流程,最终实现对网络进行端到端的精确故障定位,本发明实施例不影响所有转发设备的正常业务,适用于至少具有两个转发节点的网络传输路径。
本发明实施例中提出的技术方案步骤如下,以下步骤的行为主体为控制面设备:
第一步:根据申告的业务信息,构造一个具有特定特征的诊断报文。
第二步:根据业务路径,得到路径中的各转发节点集合。
第三步:对转发节点集合下发复制上送诊断报文的指令(在该实施例中复制上送诊断报文的指令与之前的复制指令是同样的含义,复制控制面设备下发的第一诊断报文,得到第二诊断报文,并将该第二诊断报文上传到控制面设备,需要指出的是,在之前的实施例中,第一诊断报文与第二诊断报文没有实质性差别,单就是依据第一诊断报文复制得来的)。
第四步:从首节点开始向转发节点发送诊断报文。
第五步:接收转发节点复制上送的诊断报文,根据报文的发送节点信息判断故障位置,删除之前下发的复制上送指令。
对以上第三、四、五步存在两种子方案:
子方案1:
第一步:向路径中除首节点外的所有转发节点下发携带复制上送诊断报文指令的流表。
第二步:向路径首节点发送诊断报文。
第三步:接收转发节点复制上送的诊断报文。将接收到报文的发送节点信息,和转发节点集合比对,找出无对应复制诊断报文的转发节点或转发节点集,在找出的转发节点或转发节点集中,标记位于路径中报文前进方向上的第一个节点为故障节点。
第四步:删除第三步中下发的流表。
子方案2:
第一步:从报文前进方向上第二个转发节点开始,依次选择节点作为当前节点,下发携带复制上送诊断报文指令的流表。
第二步:向路径首节点发送诊断报文。
第三步:控制面接收转发面上送的报文,或者超时收不到。
第四步:删除上述步骤中下发的流表。
第五步:选择当前节点所在路径上报文前进方向的下一个转发节点作为当前节点,下发携带复制命令,重复子方案2中的第三步到第五步的操作,直至路径上最后一个转发节点(需要指出的是,在该子方案2中,每个转发节点在将诊断报文复制之后,将该诊断报文转发到下一转发节点)。
第六步:将接收到报文的发送节点信息,和转发节点集合比对,找出无对应复制诊断报文的转发节点或转发节点集,在找出的转发节点或转发节点集中,标记位于路径中报文前进方向上的第一个节点为故障节点。
为了执行上述实施例中记载的方法步骤,本申请文件还记载了一种装置,附加在控制面上,基于故障申告信息,完成端到端的故障定位过程,图2是根据本发明实施例提供的网络故障定位装置的示意图,该装置包含:
调度单元:选择目标转发节点,向目标转发节点下发复制诊断报文并上送的指令。在接收到上送的复制诊断报文或者超出预定时间后,删除下发的指令。
定位单元:综合收到的所有上送的诊断报文,以及路径转发节点信息,定位故障节点。
诊断报文生成单元:根据报文转发失败时申告的故障信息,得到业务特征,生成具有特定特征的诊断报文。
图3是根据本发明实施例的调度单元处理过程示意图,如图3所示:
步骤S301,调用诊断报文生成单元生成诊断报文。
步骤S302,根据业务路径,得到转发路径中的转发节点集合。
步骤S303,向转发节点集合中非首节点下发匹配诊断报文复制上送的指令。
步骤S304,向转发节点集合中首节点发送诊断报文。
步骤S305,各转发节点在转发报文时,针对诊断报文会复制一份上送。
步骤S306,在收到所有转发节点复制上送的诊断报文,或者接收超时后,删除步骤S303下发的复制指令。
步骤S307,将转发节点集合和收到的诊断报文发送给定位单元处理。
图4是根据本发明实施例的定位单元的处理流程示意图,如图4所示,步骤如下:
步骤S401,调用诊断报文生成单元生成诊断报文。
步骤S402,根据业务路径,得到转发路径中的转发节点集合。
步骤S403,按照路径上报文前进方向节点顺序,从第二个节点开始,选择作为当前节点。
步骤S404,向当前节点下发匹配诊断报文复制上送的指令。
步骤S405,向转发路径上首节点发送诊断报文。各转发节点转发诊断报文,当前转发节点在转发的同时复制一份诊断报文上送。
步骤S406,若收到上送的诊断报文,则删除步骤S404下发的指令,选择当前节点的下一节点作为当前节点,继续步骤S404。若没有下一节点,则进行步骤S408。
步骤S407,若经过超时时限的时间没有收到上送的诊断报文,则删除步骤S404下发的流表。选择当前节点的下一节点作为当前节点,继续步骤S404。若没有下一节点,则进行步骤S408。
步骤S408,将转发节点集合和收到的诊断报文发送给定位单元处理。
定位单元处理过程是,接收到路径转发节点集合和转发节点上送的诊断报文后,若所有转发节点都可以和上送诊断报文对应,对应指的是该上送报文来自该转发节点,则判断为不存在故障。若存在无法对应的转发节点,则位于报文前进方向上的第一个无法对应的转发节点,判断为故障节点。
诊断报文生成单元的处理过程是,根据故障申告内容,包括但不限于传输协议类型,发送和接收方地址,发送和接收方传输端口等,构造出和被申告的业务一致的传输报文作为诊断报文。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例该的方法。
实施例2
在本实施例中还提供了一种网络故障定位装置,应用于控制面设备,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图5是根据本发明实施例的一种网络故障定位装置的结构框图,如图5所示,该装置包括:
发送模块52,用于向业务路径上第一转发节点集合中的指定节点发送第一诊断报文,其中,该第一转发节点集合中的转发节点以该指定节点为起始节点,依次向下一转发节点转发该第一诊断报文;
接收模块54,与发送模块52连接,用于接收该第一转发节点集合中的转发节点反馈的第二诊断报文,以及确定反馈该第二诊断报文的转发节点,得到第二转发节点集合,其中,该第二诊断报文是由该第一转发节点集合中的转发节点复制该第一诊断报文得到的报文;
确定模块56,与接收模块54连接,用于依据该第二转发节点集合确定存在网络故障的节点。
可选地,该发送模块52还用于在控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,该控制面设备下发复制命令到该第一转发节点集合中的转发节点,其中,该复制命令用于指示该第一转发节点集合中的转发节点复制该第一诊断报文得到该第二诊断报文,并将该第二诊断报文反馈到该控制面设备。
可选地,该确定模块56还用于在依据该第二转发节点集合确定存在网络故障的节点之后,删除向该第一转发节点集合中的转发节点下发的复制命令。
可选地,该第一诊断报文是该控制面设备在软件定义网络SDN报文转发失败时依据与该SDN报文对应的业务信息构造的。
可选地,该确定模块56还用于将该第一转发节点集合与该第二转发节点集合进行比较,找出属于第一转发节点集合但不属于第二转发节点集合中的节点,得到第三转发节点集合,确定该第三转发节点集合中位于该业务路径上该第一诊断报文前进方向的第一个节点为存在网络故障的节点。
可选地,该发送模块52还用于在向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,向该第一转发节点集合中的除指定节点外的所有转发节点下发复制命令,其中,该复制命令用于指示该第一转发节点集合中的转发节点复制该第一诊断报文得到该第二诊断报文,并将该第二诊断报文反馈到该控制面设备。
可选地,该发送模块52还用于在向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,从该第一转发节点集合中的该指定节点之后的节点开始,依次选择下一个节点作为当前节点,并下发复制命令到该当前节点,其中,在该控制面设备接收到该当前节点反馈的第二诊断报文之后,该发送模块52选择该当前节点的下一个节点为当前节点,并下发复制命令,其中,该复制命令用于指示该当前节点复制第一诊断报文得到第二诊断报文,并将该第二诊断报文反馈到该控制面设备。
可选地,该确定模块56还用于在该控制面设备向业务路径中上的第一转发节点集合中的指定节点发送第一诊断报文之后,在以下之一情况下,删除向该当前节点下发的复制命令:该控制面设备接收到该当前节点反馈的该第二诊断报文;该控制面设备在预设时间内没有收到该当前节点反馈的该第二诊断报文。
可选地,该指定节点包括:该第一转发节点集合中的首节点。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
实施例3
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
S1,控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文,其中,该第一转发节点集合中的转发节点以该指定节点为起始节点,依次向下一转发节点转发该第一诊断报文;
S2,该控制面设备接收该第一转发节点集合中的转发节点反馈的第二诊断报文,以及确定反馈该第二诊断报文的转发节点,得到第二转发节点集合,其中,该第二诊断报文是由该第一转发节点集合中的转发节点复制该第一诊断报文得到的报文;
S3,该控制面设备依据该第二转发节点集合确定存在网络故障的节点。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,在本实施例中,处理器根据存储介质中已存储的程序代码执行山上述实施例中记载的方法步骤。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (18)

1.一种网络故障定位方法,其特征在于,包括:
控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文,其中,所述第一转发节点集合中的转发节点以所述指定节点为起始节点,依次向下一转发节点转发所述第一诊断报文;
所述控制面设备接收所述第一转发节点集合中的转发节点反馈的第二诊断报文,以及确定反馈所述第二诊断报文的转发节点,得到第二转发节点集合,其中,所述第二诊断报文是由所述第一转发节点集合中的转发节点复制所述第一诊断报文得到的报文;
所述控制面设备依据所述第二转发节点集合确定存在网络故障的节点。
2.根据权利要求1所述的方法,其特征在于,在控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,所述方法还包括:
所述控制面设备下发复制命令到所述第一转发节点集合中的转发节点,其中,所述复制命令用于指示所述第一转发节点集合中的转发节点复制所述第一诊断报文得到所述第二诊断报文,并将所述第二诊断报文反馈到所述控制面设备。
3.根据权利要求2所述的方法,其特征在于,在所述控制面设备依据所述第二转发节点集合确定存在网络故障的节点之后,所述控制面设备删除向所述第一转发节点集合中的转发节点下发的复制命令。
4.根据权利要求1所述的方法,其特征在于,所述第一诊断报文是所述控制面设备在软件定义网络SDN报文转发失败时依据与所述SDN报文对应的业务信息构造的。
5.根据权利要求1所述的方法,其特征在于,所述控制面设备依据所述第二转发节点集合确定存在网络故障的节点包括:
所述控制面设备将所述第一转发节点集合与所述第二转发节点集合进行比较,找出属于第一转发节点集合但不属于第二转发节点集合中的节点,得到第三转发节点集合,确定所述第三转发节点集合中位于所述业务路径上所述第一诊断报文前进方向的第一个节点为存在网络故障的节点。
6.根据权利要求1所述的方法,其特征在于,在控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,所述方法还包括:
所述控制面设备向所述第一转发节点集合中的除指定节点外的所有转发节点下发复制命令,其中,所述复制命令用于指示所述第一转发节点集合中的转发节点复制所述第一诊断报文得到所述第二诊断报文,并将所述第二诊断报文反馈到所述控制面设备。
7.根据权利要求1所述的方法,其特征在于,在控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,所述方法还包括:
所述控制面设备从所述第一转发节点集合中的所述指定节点之后的节点开始,依次选择下一个节点作为当前节点,所述控制面设备下发复制命令到所述当前节点,其中,在所述控制面设备接收到所述当前节点反馈的第二诊断报文之后,所述控制面设备选择所述当前节点的下一个节点为当前节点,并下发复制命令,其中,所述复制命令用于指示所述当前节点复制第一诊断报文得到第二诊断报文,并将所述第二诊断报文反馈到所述控制面设备。
8.根据权利要求7所述的方法,其特征在于,在控制面设备向业务路径中上的第一转发节点集合中的指定节点发送第一诊断报文之后,所述方法还包括:
在以下之一情况下,所述控制面设备删除向所述当前节点下发的复制命令:
所述控制面设备接收到所述当前节点反馈的所述第二诊断报文;
所述控制面设备在预设时间内没有收到所述当前节点反馈的所述第二诊断报文。
9.根据权利要求1至8任一项所述的方法,其特征在于,所述指定节点包括:所述第一转发节点集合中的首节点。
10.一种网络故障定位装置,应用于控制面设备,其特征在于,包括:
发送模块,用于向业务路径上第一转发节点集合中的指定节点发送第一诊断报文,其中,所述第一转发节点集合中的转发节点以所述指定节点为起始节点,依次向下一转发节点转发所述第一诊断报文;
接收模块,用于接收所述第一转发节点集合中的转发节点反馈的第二诊断报文,以及确定反馈所述第二诊断报文的转发节点,得到第二转发节点集合,其中,所述第二诊断报文是由所述第一转发节点集合中的转发节点复制所述第一诊断报文得到的报文;
确定模块,用于依据所述第二转发节点集合确定存在网络故障的节点。
11.根据权利要求10所述的装置,其特征在于,所述发送模块还用于在控制面设备向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,所述控制面设备下发复制命令到所述第一转发节点集合中的转发节点,其中,所述复制命令用于指示所述第一转发节点集合中的转发节点复制所述第一诊断报文得到所述第二诊断报文,并将所述第二诊断报文反馈到所述控制面设备。
12.根据权利要求11所述的装置,其特征在于,所述确定模块还用于在依据所述第二转发节点集合确定存在网络故障的节点之后,删除向所述第一转发节点集合中的转发节点下发的复制命令。
13.根据权利要求10所述的装置,其特征在于,所述第一诊断报文是所述控制面设备在软件定义网络SDN报文转发失败时依据与所述SDN报文对应的业务信息构造的。
14.根据权利要求10所述的装置,其特征在于,所述确定模块还用于将所述第一转发节点集合与所述第二转发节点集合进行比较,找出属于第一转发节点集合但不属于第二转发节点集合中的节点,得到第三转发节点集合,确定所述第三转发节点集合中位于所述业务路径上所述第一诊断报文前进方向的第一个节点为存在网络故障的节点。
15.根据权利要求10所述的装置,其特征在于,所述发送模块还用于在向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,向所述第一转发节点集合中的除指定节点外的所有转发节点下发复制命令,其中,所述复制命令用于指示所述第一转发节点集合中的转发节点复制所述第一诊断报文得到所述第二诊断报文,并将所述第二诊断报文反馈到所述控制面设备。
16.根据权利要求10所述的装置,其特征在于,所述发送模块还用于在向业务路径上第一转发节点集合中的指定节点发送第一诊断报文之前,从所述第一转发节点集合中的所述指定节点之后的节点开始,依次选择下一个节点作为当前节点,并下发复制命令到所述当前节点,其中,在所述控制面设备接收到所述当前节点反馈的第二诊断报文之后,所述发送模块选择所述当前节点的下一个节点为当前节点,并下发复制命令,其中,所述复制命令用于指示所述当前节点复制第一诊断报文得到第二诊断报文,并将所述第二诊断报文反馈到所述控制面设备。
17.根据权利要求16所述的装置,其特征在于,所述确定模块还用于在所述控制面设备向业务路径中上的第一转发节点集合中的指定节点发送第一诊断报文之后,在以下之一情况下,删除向所述当前节点下发的复制命令:
所述控制面设备接收到所述当前节点反馈的所述第二诊断报文;
所述控制面设备在预设时间内没有收到所述当前节点反馈的所述第二诊断报文。
18.根据权利要求10至17任一项所述的装置,其特征在于,所述指定节点包括:所述第一转发节点集合中的首节点。
CN201610817420.8A 2016-09-12 2016-09-12 网络故障定位方法及装置 Active CN107819594B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610817420.8A CN107819594B (zh) 2016-09-12 2016-09-12 网络故障定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610817420.8A CN107819594B (zh) 2016-09-12 2016-09-12 网络故障定位方法及装置

Publications (2)

Publication Number Publication Date
CN107819594A true CN107819594A (zh) 2018-03-20
CN107819594B CN107819594B (zh) 2022-08-02

Family

ID=61601366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610817420.8A Active CN107819594B (zh) 2016-09-12 2016-09-12 网络故障定位方法及装置

Country Status (1)

Country Link
CN (1) CN107819594B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112787843A (zh) * 2020-06-16 2021-05-11 中兴通讯股份有限公司 故障节点的检测方法和存储介质及电子装置
CN113992567A (zh) * 2021-10-26 2022-01-28 新华三信息安全技术有限公司 一种报文转发方法及装置
CN116319260A (zh) * 2023-05-09 2023-06-23 新华三技术有限公司 一种网络故障诊断方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080005199A1 (en) * 2006-06-30 2008-01-03 Microsoft Corporation Collection-Based Object Replication
CN102164051A (zh) * 2011-05-18 2011-08-24 西安交通大学 面向业务的故障检测与定位方法
US20150249587A1 (en) * 2012-09-20 2015-09-03 Ntt Docomo, Inc. Method and apparatus for topology and path verification in networks
CN104917623A (zh) * 2014-03-10 2015-09-16 中兴通讯股份有限公司 一种实现sdn网络通信管理的方法及装置
CN105743687A (zh) * 2014-12-12 2016-07-06 中兴通讯股份有限公司 节点故障的判断方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080005199A1 (en) * 2006-06-30 2008-01-03 Microsoft Corporation Collection-Based Object Replication
CN102164051A (zh) * 2011-05-18 2011-08-24 西安交通大学 面向业务的故障检测与定位方法
US20150249587A1 (en) * 2012-09-20 2015-09-03 Ntt Docomo, Inc. Method and apparatus for topology and path verification in networks
CN104917623A (zh) * 2014-03-10 2015-09-16 中兴通讯股份有限公司 一种实现sdn网络通信管理的方法及装置
CN105743687A (zh) * 2014-12-12 2016-07-06 中兴通讯股份有限公司 节点故障的判断方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
简江涛: "《基于域间依赖模型的多域故障诊断算法》", 《计算机技术与发展》 *
简江涛: "《基于域间依赖模型的多域故障诊断算法》", 《计算机技术与发展》, 30 April 2015 (2015-04-30) *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112787843A (zh) * 2020-06-16 2021-05-11 中兴通讯股份有限公司 故障节点的检测方法和存储介质及电子装置
CN112787843B (zh) * 2020-06-16 2022-04-29 中兴通讯股份有限公司 故障节点的检测方法和存储介质及电子装置
CN113992567A (zh) * 2021-10-26 2022-01-28 新华三信息安全技术有限公司 一种报文转发方法及装置
CN116319260A (zh) * 2023-05-09 2023-06-23 新华三技术有限公司 一种网络故障诊断方法、装置、设备及存储介质
CN116319260B (zh) * 2023-05-09 2023-08-18 新华三技术有限公司 一种网络故障诊断方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN107819594B (zh) 2022-08-02

Similar Documents

Publication Publication Date Title
CN101772918B (zh) 服务链的操作、管理和维护(oam)
CN102197627B (zh) 组播流量收敛的改善
CN105897507B (zh) 节点设备的状态检测方法和装置
CN104702468B (zh) 确定传输路径的方法、设备和系统
CN103138988B (zh) 网络故障的定位处理方法及装置
CN101179456A (zh) 一种网络设备测试方法及装置
CN106685733A (zh) 一种fc‑ae‑1553网络快速配置与自动化测试方法
CN107819594A (zh) 网络故障定位方法及装置
CN109633351A (zh) 智能it运维故障定位方法、装置、设备及可读存储介质
CN104852828A (zh) 一种网络时延检测方法,装置及系统
CN102882704A (zh) 一种issu的软重启升级过程中的链路保护方法和设备
CN111800354A (zh) 消息处理方法及装置、消息处理设备及存储介质
CN109739527A (zh) 一种客户端灰度发布的方法、装置、服务器和存储介质
CN105743687B (zh) 节点故障的判断方法及装置
CN106685693A (zh) 一种网络异常检测方法、系统及网络设备
CN109379764A (zh) 报文发送方法及装置
CN105391601A (zh) 一种网管设备的性能测试方法及系统
WO2017028303A1 (zh) 探测前传拓扑的方法和装置
CN111935767B (zh) 一种网络仿真系统
JP2009260754A (ja) 通信試験装置、通信試験機能を有するネットワーク、接続試験方法および接続試験プログラム
CN105763347B (zh) 用于获取参数的方法、网络设备及系统
CN100488117C (zh) 一种电信设备自动获取拓扑关系的方法
JP2016146555A (ja) サービス影響原因推定装置、サービス影響原因推定プログラム、及びサービス影響原因推定方法
CN114205263A (zh) 用于Ether CAT网络的通信方法、系统和存储介质
CN111669290B (zh) 网元管理方法、管理服务器和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant