CN108429625B - 一种实现故障诊断的方法及装置 - Google Patents

一种实现故障诊断的方法及装置 Download PDF

Info

Publication number
CN108429625B
CN108429625B CN201710075976.9A CN201710075976A CN108429625B CN 108429625 B CN108429625 B CN 108429625B CN 201710075976 A CN201710075976 A CN 201710075976A CN 108429625 B CN108429625 B CN 108429625B
Authority
CN
China
Prior art keywords
network element
network
diagnosis message
determining
east
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710075976.9A
Other languages
English (en)
Other versions
CN108429625A (zh
Inventor
马西照
李慧艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201710075976.9A priority Critical patent/CN108429625B/zh
Priority to PCT/CN2018/072836 priority patent/WO2018145560A1/zh
Publication of CN108429625A publication Critical patent/CN108429625A/zh
Application granted granted Critical
Publication of CN108429625B publication Critical patent/CN108429625B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/40Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using virtualisation of network functions or resources, e.g. SDN or NFV entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/20Arrangements for monitoring or testing data switching networks the monitoring system or the monitored elements being virtualised, abstracted or software-defined entities, e.g. SDN or NFV

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种实现故障诊断的方法及装置,包括:接收到上报的通信线路(LOC)告警的情况下,将LOC告警涉及的连接网络分解为对应的至少两个网元和至少一个单位链路;对分解获得的每一个网元和每一条单位链路分别进行通路检测;根据所有网元和单位链路的通路检测生成故障诊断结果。其中,单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口(NNI)到东向网元的入端口的NNI之间的线路构成。本发明实施例简化了故障诊断的处理过程,提升了故障诊断效率。

Description

一种实现故障诊断的方法及装置
技术领域
本文涉及但不限于软件定义网络(SDN)技术,尤指一种实现故障诊断的方法及装置。
背景技术
在分组传送网(PTN,Packet Transport Network)网络中,控制平面与转发平面往往集中在交换设备(Switch)上实现。这种实现方式决定了交换设备的复杂性,另一方面管理平面与交换设备的接口是厂家私有定义的,具有不透明性。留给用户的接口是黑盒,没有扩展性。
图1为相关技术的SDN网络的结构框图,如图1所示,在SDN网络中,将控制平面从交换设备中独立出来,交换设备(Switch)仅负责数据转发。控制平面由控制器(Controller)组成。控制器负责维护全网拓扑、路由计算、标签分配等。控制器与交换设备的接口是南向接口。控制器与应用(APP)之间的接口为北向接口。南向接口、北向接口对用户是可见的,具有良好的扩展性。为提高网络的生存性,传统的PTN网络中,采用的技术有操作控制管理传输协议(TP-OAM)、内容管理框架(CFM)。但上述两种技术仅能检测整条链路(伪线(PW)、分层服务提供商(LSP)、私有化虚拟局域网服务(VPWS))的连通性,并不能检测是哪段链路断了,不利于工程维护。
为解决上述缺陷,相关技术的做法是:由连接的首节点在此连接上发送链路跟踪(LTM)报文;包括:首节点先发送生存时间值(TTL)=1的LTM报文,每个收到LTM报文的节点都将TTL减1之后继续转发,当有交换设备将TTL减1之后为0,则回应链路跟踪回复(LTR)报文。中间每个交换设备对LTR报文做转发处理。首节点在规定的时间内收到LTR报文,则认为此断链路是通的,否则认为链路是断的。依此类推,首节点依次发送TTL=2、TTL=3、…TTL=N的LTM报文,直到收不到TTL=X的LTR报文,则首节点可以判断哪段链路是断的。实施上述做法时存在以下问题:1、首节点需要知道全网的TOP视图,用来决定TTL=X的最大值,增加了Switch的复杂性。2、上述过程通常在用户看到链路连通性告警后,由用户按需触发检测;若由用户同时指定TTL=X的最大值,则增加了用户维护时间与成本。尤其在一个由上万节点上万条连接组成的网络中,做按需维护,维护成本大大增加。3、当链路中有多段链路同时故障时,上述方法无法实现故障检测。
综上,相关技术进行故障诊断的方法诊断复杂、且存在维护和多段链路同时故障无法检测的问题。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供一种实现故障诊断的方法及投影装置,能够简化故障诊断的处理过程。
本发明实施例提供了一种实现故障诊断的方法,包括:
接收到上报的通信线路LOC告警的情况下,将LOC告警涉及的连接网络分解为对应的至少两个网元和至少一条单位链路;
对分解获得的每一个网元和每一条单位链路分别进行通路检测;
根据所有网元和单位链路的通路检测生成故障诊断结果;
其中,所述单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口NNI到东向网元的入端口的NNI之间的线路构成。
可选的,所述对分解获得的每一条单位链路进行通路检测包括:
将分解获得的所有单位链路按照由西向东的顺序进行正向排列后,按照正向排列对每一条单位链路分别进行正向通路检测,按照由东向西的反向排列对每一条单位链路分别进行反向通路检测。
可选的,所述对分解获得的每一条单位链路进行通路检测包括:
对每一个所述单位链路,在东向网元的入端口下发访问控制列表(ACL)规则;在所述单位链路的西向网元的出端口下发诊断报文;在第一预设时长内接收到东向网元根据ACL规则提取的诊断报文时,确定所述单位链路为正向通路;在第一预设时长内未接收到东向网元根据ACL规则提取的诊断报文时,确定所述单位链路为正向断路;
对每一个所述单位链路,在西向网元的出端口下发访问控制列表(ACL)规则;在所述单位链路的东向网元的入端口下发诊断报文;在第一预设时长内接收到西向网元根据ACL规则提取的诊断报文时,确定所述单位链路为反向通路;在第一预设时长内未接收到西向网元根据ACL规则提取的诊断报文时,确定所述单位链路为反向断路;
其中,所述诊断报文的封装与需要诊断的业务的封装相同。
可选的,所述对分解获得的每一个网元进行通路检测包括:
区分LOC告警涉及的所述连接网络分解获得的网元按照网络结构划分为始节点、中间节点、尾节点;
对分解获得的所有网元按照中间节点、始节点、尾节点的顺序进行通路检测;
其中,所述中间节点按照从西向到东向的方向进行排序。
可选的,所述对分解获得的每一个网元进行通路检测包括:
对划分的属于中间节点的网元,确定属于中间节点的所述网元是否支持出端口的提包功能;
确定属于中间节点的所述网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第二预设时长内接接收到网元根据ACL提取并上送的诊断报文时,确定所述网元为通路;在第二预设时长内未接接收到网元根据ACL提取并上送的诊断报文时,确定所述网元为断路;
确定属于中间节点的所述网元不支持出端口的提包功能时,在确定所述网元与相邻的东向网元的链路为通路的情况下,向所述东向网元的入端口下发ACL规则;在所述网元的入端口下发诊断报文;在第三预设时长内接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在第三预设时长内未接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路。
可选的,所述对分解获得的每一个网元进行通路检测包括:
对划分的属于首节点的网元,确定属于首节点的网元是否支持出端口的提包功能;
确定属于首节点的所述网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第四预设时长内接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在第四预设时长内未接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路;
确定属于首节点的所述网元不支持出端口的提包功能时,在确定所述网元与相邻的东向网元的链路为通路的情况下,向所述东向网元的入端口下发ACL规则;在所述网元的入端口下发诊断报文;在第五预设时长内接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在所述网元的入端口下发诊断报文;在第五预设时长内未接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路。
可选的,所述对分解获得的每一个网元进行通路检测包括:
对划分的属于尾节点的网元,确定属于尾节点的所述网元是否支持出端口的提包功能;
确定属于尾节点的所述网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第六预设时长内接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在第六预设时长内未接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路。
可选的,所述方法还包括:
完成每一个网元或单位链路的通路检测时,删除下发的所述ACL规则。
另一方面,本发明实施例还提供一种实现故障诊断的装置,包括:分解单元、检测单元和生成单元;其中,
分解单元用于,接收到上报的通信线路LOC告警的情况下,将LOC告警涉及的连接网络分解为对应的至少两个网元和至少一条单位链路;
检测单元用于,对分解获得的每一个网元和每一条单位链路分别进行通路检测;
生成单元用于,根据所有网元和单位链路的通路检测生成故障诊断结果;
其中,所述单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口NNI到东向网元的入端口的NNI之间的线路构成。
可选的,所述检测单元用于对分解获得的每一条单位链路进行通路检测包括:
对每一个所述单位链路,在东向网元的入端口下发访问控制列表(ACL)规则;在所述单位链路的西向网元的出端口下发诊断报文;在第一预设时长内接收到东向网元根据ACL规则提取的诊断报文时,确定所述单位链路为正向通路;在第一预设时长内未接收到东向网元根据ACL规则提取的诊断报文时,确定所述单位链路为正向断路;
对每一个所述单位链路,在西向网元的出端口下发访问控制列表(ACL)规则;在所述单位链路的东向网元的入端口下发诊断报文;在第一预设时长内接收到西向网元根据ACL规则提取的诊断报文时,确定所述单位链路为反向通路;在第一预设时长内未接收到西向网元根据ACL规则提取的诊断报文时,确定所述单位链路为反向断路;
其中,所述诊断报文的封装与需要诊断的业务的封装相同。
可选的,所述检测单元用于对分解获得的每一个网元进行通路检测包括:
区分LOC告警涉及的所述连接网络分解获得的网元按照网络结构划分为始节点、中间节点、尾节点;
对分解获得的所有网元按照中间节点、始节点、尾节点的顺序进行通路检测;
其中,所述中间节点按照从西向到东向的方向进行排序。
可选的,所述检测单元具体用于:
对划分的属于中间节点的网元,确定属于中间节点的所述网元是否支持出端口的提包功能;确定属于中间节点的所述网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第二预设时长内接接收到网元根据ACL提取并上送的诊断报文时,确定所述网元为通路;在第二预设时长内未接接收到网元根据ACL提取并上送的诊断报文时,确定所述网元为断路;确定属于中间节点的所述网元不支持出端口的提包功能时,在确定所述网元与相邻的东向网元的链路为通路的情况下,向所述东向网元的入端口下发ACL规则;在所述网元的入端口下发诊断报文;在第三预设时长内接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在第三预设时长内未接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路。
对划分的属于首节点的网元,确定属于首节点的网元是否支持出端口的提包功能;确定属于首节点的所述网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第四预设时长内接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在第四预设时长内未接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路;确定属于首节点的所述网元不支持出端口的提包功能时,在确定所述网元与相邻的东向网元的链路为通路的情况下,向所述东向网元的入端口下发ACL规则;在所述网元的入端口下发诊断报文;在第五预设时长内接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在所述网元的入端口下发诊断报文;在第五预设时长内未接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路。
对划分的属于尾节点的网元,确定属于尾节点的所述网元是否支持出端口的提包功能;确定属于尾节点的所述网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第六预设时长内接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在第六预设时长内未接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路。
再一方面,本发明实施例还提供一种实现故障诊断的装置,包括:存储器和处理器;其中,
所述处理器被配置为执行所述存储器中的程序指令;
所述程序指令在所述处理器读取执行以下操作:
接收到上报的通信线路LOC告警的情况下,将LOC告警涉及的连接网络分解为对应的至少两个网元和至少一条单位链路;
对分解获得的每一个网元和每一条单位链路分别进行通路检测;
根据所有网元和单位链路的通路检测生成故障诊断结果;
其中,所述单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口NNI到东向网元的入端口的NNI之间的线路构成。
与相关技术相比,本申请技术方案包括:接收到上报的通信线路(LOC)告警的情况下,将LOC告警涉及的连接网络分解为对应的至少两个网元和至少两个单位链路;对分解获得的每一个网元和每一条单位链路分别进行通路检测;根据所有网元和单位链路的通路检测生成故障诊断结果;其中,所述单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口(NNI)到东向网元的入端口的NNI之间的线路构成。本发明实施例简化了故障诊断的处理过程,提升了故障诊断效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为相关技术的SDN网络的结构框图;
图2为本发明实施例实现故障诊断的方法的流程图;
图3为本发明实施例单位链路的示意图;
图4为本发明一可选实施例对单位链路进行通路检测的方法流程图;
图5为本发明一可选实施例对中间节点进行通路检测的方法流程图;
图6为本发明一可选实施例对首节点进行通路检测的方法流程图;
图7为本发明一可选实施例对尾节点进行通路检测的方法流程图;
图8为本发明实施例实现故障诊断的装置的结构框图;
图9为本发明第一应用示例的方法流程图;
图10为第一应用示例上报至客户端的检测结果示意图;
图11为本发明第二应用示例的方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图2为本发明实施例实现故障诊断的方法的流程图,如图2所示,包括:
步骤200、接收到上报的通信线路(LOC)告警的情况下,将LOC告警涉及的连接网络分解为对应的至少两个网元和至少一条单位链路;
其中,单位链路由相邻的两个网元中西向网元的出端口的网络节点接口(NNI)到东向网元的入端口的NNI之间的线路构成。图3为本发明实施例单位链路的示意图,如图3所示,交换设备1的出端口的NNI和交换设备2的入端口的NNI构成单位链路。至少一条单位链路包括一条或一条以上单位链路;至少两个网元包括两个或两个以上网元。
步骤201、对分解获得的每一个网元和每一条单位链路分别进行通路检测;
可选的,本发明实施例对分解获得的每一条单位链路进行通路检测包括:
将分解获得的所有单位链路按照由西向东的顺序进行正向排列后,按照正向排列对每一条单位链路分别进行正向通路检测,按照由东向西的反向排列对每一条单位链路分别进行反向通路检测。
图4为本发明一可选实施例对单位链路进行通路检测的方法流程图,如图4所示,包括:
400、对每一条单位链路,在东向网元的入端口下发访问控制列表(ACL)规则;
401、在单位链路的西向网元的出端口下发诊断报文;
402、在第一预设时长内接收到东向网元根据ACL规则提取的诊断报文时,确定单位链路为正向通路;在第一预设时长内未接收到东向网元根据ACL规则提取的诊断报文时,确定单位链路为正向断路;
其中,诊断报文的封装与需要诊断的业务的封装相同。
对反向连接,对每一条单位链路,在西向网元的出端口下发访问控制列表(ACL)规则;在单位链路的东向网元的入端口下发诊断报文;在第一预设时长内接收到西向网元根据ACL规则提取的诊断报文时,确定单位链路为反向通路;在第一预设时长内未接收到西向网元根据ACL规则提取的诊断报文时,确定单位链路为反向断路;
可选的,本发明实施例对分解获得的每一个网元进行通路检测包括:
区分LOC告警涉及的连接网络分解获得的网元按照网络结构划分为始节点、中间节点、尾节点;
对分解获得的所有网元按照中间节点、始节点、尾节点的顺序进行通路检测;
其中,中间节点按照从西向到东向的方向进行排序。
需要说明的是,ACL规则为相关技术中已有的规则,表1为本发明实施例ACL规则的示例,表中包含的内容为本领域技术人员公知的内容,在此不做赘述。
Figure BDA0001224347760000091
Figure BDA0001224347760000101
表1
图5为本发明一可选实施例对中间节点进行通路检测的方法流程图,如图5所示,包括:
步骤500、对划分的属于中间节点的网元,确定属于中间节点的网元是否支持出端口的提包功能;确定属于中间节点的网元支持出端口的提包功能时,执行步骤5010;确定属于中间节点的网元不支持出端口的提包功能时,执行步骤5020;
需要说明的时,网元是否支持出端口的提包功能可以通过设备支持的版本号进行确定,包括根据版本好确定是否支持egress flow table,根据确定的是否支持egressflow table确定是否出端口的提包功能。确定是否支持出端口的提包功能可以采用相关技术中已有的方法实现。
步骤5010、向属于中间节点的网元的出端口下发ACL规则;
步骤5011、在属于中间节点的网元的入端口下发诊断报文;
步骤5012、在第二预设时长内接接收到网元根据ACL提取并上送的诊断报文时,确定该属于中间节点的网元为通路;在第二预设时长内未接接收到网元根据ACL提取并上送的诊断报文时,确定该属于中间节点的网元为断路;
步骤5020、在确定属于中间节点的网元与相邻的东向网元的链路为通路的情况下,向东向网元的入端口下发ACL规则;
步骤5021、在属于中间节点的网元的入端口下发诊断报文;
步骤5022、在第三预设时长内接收到东向网元根据ACL规则提取并上送的诊断报文时,确定该属于中间节点的网元为通路;在第三预设时长内未接收到东向网元根据ACL规则提取并上送的诊断报文时,确定该属于中间节点的网元为断路。
图6为本发明一可选实施例对首节点进行通路检测的方法流程图,如图6所示,包括:
步骤600、对划分的属于首节点的网元,确定属于首节点的网元是否支持出端口的提包功能;
确定属于首节点的网元支持出端口的提包功能时,执行步骤6010;确定属于首节点的网元不支持出端口的提包功能时,执行步骤6020;
步骤6010、向属于首节点的网元的出端口下发ACL规则;
步骤6011、在属于首节点的网元的入端口下发诊断报文;
步骤6012、在第四预设时长内接收到该属于首节点的网元根据ACL规则提取并上送的诊断报文时,确定该属于首节点的网元为通路;在第四预设时长内未接收到该属于首节点的网元根据ACL规则提取并上送的诊断报文时,确定该属于首节点的网元为断路;
步骤6020、在确定属于首节点的网元与相邻的东向网元的链路为通路时,向东向网元的入端口下发ACL规则;
步骤6021、在该属于首节点的网元的入端口下发诊断报文;
步骤6022、在第五预设时长内接收到东向网元根据ACL规则提取并上送的诊断报文时,确定该属于首节点的网元为通路;在网元的入端口下发诊断报文;在第五预设时长内未接收到东向网元根据ACL规则提取并上送的诊断报文时,确定该属于首节点的网元为断路。
图7为本发明一可选实施例对尾节点进行通路检测的方法流程图,如图7所示,包括:
步骤700、对划分的属于尾节点的网元,确定属于尾节点的网元是否支持出端口的提包功能;
步骤701、确定属于尾节点的网元支持出端口的提包功能时,向网元的出端口下发ACL规则;
步骤702、在属于尾节点的网元的入端口下发诊断报文;
步骤703、在第六预设时长内接收到该属于尾节点的网元根据ACL规则提取并上送的诊断报文时,确定该属于尾节点的网元为通路;在第六预设时长内未接收到该属于尾节点的网元根据ACL规则提取并上送的诊断报文时,确定该属于尾节点的网元为断路。
本发明实施例LOC告警涉及的连接网络可能不包含首节点和尾节点,如监测的是标签交换路径(LSP)或者伪线(PW),则待检测节点列表中不包含首尾节点。LOC告警涉及的连接网络包含首尾节点,可以通过使用监测虚拟专线服务(VPWS,virtual private wireservice)业务的通用工业协议(CIP)连通性,通过连通性检测确定是否包含首尾节点。
步骤202、根据所有网元和单位链路的通路检测生成故障诊断结果。
这里,网元和单位链路的通断结果进行汇总整理后,即可以生成故障诊断结果。
可选的,本发明实施例方法还包括:
完成每一个网元或单位链路的通路检测时,删除下发的ACL规则。
需要说明的是,本发明实施例上述步骤可以以控制器作为执行主体进行应用实施。
另外,本发明实施例第一预设时长、第二预设时长、第三预设时长、第四预设时长、第五预设时长、第六预设时长等可以根据网络参数设置为相同或不同,可以默认设置采用MPLS-TP OAM标准中的超时时间。若采用带内组网,在一条路径跨越多个网元时则诊断报文延时较长。为防止误诊断的情况发生,可在客户端与控制器之间增加一个超时时间的选项,此选项与组网环境相关,一般可以作为管理网元、和设备通过ping的平均值1.5-2倍。本发明实施例为防止由于CPU阻塞而导致的丢包,或传送链路丢包率较高而导致诊断报文丢弃;控制器可以通过增加诊断报文个数、增加诊断次数、提高诊断报文优先级来提高检测准确性;本发明实施例可以与设备CPU利用率检测、传送链路丢包率检测、管理通道连通性、管理通道丢包率检测配合使用,以获得更好的检测效果。当控制器、客户端将检测结果上报用户后,用户去工程现场修复了故障。控制器可每隔15分钟(时间可设置)重新开启检测,将最新的连接状态上报给用户,例如先前故障链路已经修复。可在客户端与控制器之间增加一个“重新检测的时间间隔”选项。或可在客户端与控制器之间增加一个“立即执行重新检测”的选项,通过接收外部指令的方式进行设置。
与相关技术相比,本申请技术方案包括:接收到上报的通信线路(LOC)告警时,将LOC告警涉及的连接网络分解为对应的至少两个网元和至少一个单位链路;对分解获得的每一个网元和每一条单位链路分别进行通路检测;根据所有网元和单位链路的通路检测生成故障诊断结果。其中,单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口(NNI)到东向网元的入端口的NNI之间的线路构成。本发明实施例简化了故障诊断的处理过程,提升了故障诊断效率。
图8为本发明实施例实现故障诊断的装置的结构框图,如图8所示,包括:分解单元、检测单元和生成单元;其中,
分解单元用于,接收到上报的通信线路LOC告警的情况下,将LOC告警涉及的连接网络分解为对应的至少两个网元和至少一条单位链路;
其中,单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口(NNI)到东向网元的入端口的NNI之间的线路构成。
检测单元用于,对分解获得的每一个网元和每一条单位链路分别进行通路检测;
可选的,本发明实施例检测单元用于对分解获得的每一条单位链路进行通路检测包括:
将分解获得的所有单位链路按照由西向东的顺序进行正向排列后,按照正向排列对每一条单位链路分别进行正向通路检测,按照由东向西的反向排列对每一条单位链路分别进行反向通路检测。
可选的,检测单元用于对分解获得的每一条单位链路进行通路检测包括:
对每一条单位链路,在东向网元的入端口下发访问控制列表(ACL)规则;在单位链路的西向网元的出端口下发诊断报文;在第一预设时长内接收到东向网元根据ACL规则提取的诊断报文时,确定单位链路为正向通路;在第一预设时长内未接收到东向网元根据ACL规则提取的诊断报文时,确定单位链路为正向断路;
对每一条单位链路,在西向网元的出端口下发访问控制列表(ACL)规则;在单位链路的东向网元的入端口下发诊断报文;在第一预设时长内接收到西向网元根据ACL规则提取的诊断报文时,确定单位链路为反向通路;在第一预设时长内未接收到西向网元根据ACL规则提取的诊断报文时,确定单位链路为反向断路;
其中,诊断报文的封装与需要诊断的业务的封装相同。
可选的,检测单元用于对分解获得的每一个网元进行通路检测包括:
区分LOC告警涉及的连接网络分解获得的网元按照网络结构划分为始节点、中间节点、尾节点;
对分解获得的所有网元按照中间节点、始节点、尾节点的顺序进行通路检测;
其中,中间节点按照从西向到东向的方向进行排序。
可选的,本发明实施例检测单元对分解获得的每一个网元进行通路检测包括:
对划分的属于中间节点的网元,确定属于中间节点的网元是否支持出端口的提包功能;
确定属于中间节点的网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第二预设时长内接接收到网元根据ACL提取并上送的诊断报文时,确定网元为通路;在第二预设时长内未接接收到网元根据ACL提取并上送的诊断报文时,确定网元为断路;
确定属于中间节点的网元不支持出端口的提包功能时,在确定网元与相邻的东向网元的链路为通路的情况下,向东向网元的入端口下发ACL规则;在网元的入端口下发诊断报文;在第三预设时长内接收到东向网元根据ACL规则提取并上送的诊断报文时,确定网元为通路;在第三预设时长内未接收到东向网元根据ACL规则提取并上送的诊断报文时,确定网元为断路。
可选的,检测单元对分解获得的每一个网元进行通路检测包括:
对划分的属于首节点的网元,确定属于首节点的网元是否支持出端口的提包功能;
确定属于首节点的网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第四预设时长内接收到网元根据ACL规则提取并上送的诊断报文时,确定网元为通路;在第四预设时长内未接收到网元根据ACL规则提取并上送的诊断报文时,确定网元为断路;
确定属于首节点的网元不支持出端口的提包功能时,在确定网元与相邻的东向网元的链路为通路的情况下,向东向网元的入端口下发ACL规则;在网元的入端口下发诊断报文;在第五预设时长内接收到东向网元根据ACL规则提取并上送的诊断报文时,确定网元为通路;在网元的入端口下发诊断报文;在第五预设时长内未接收到东向网元根据ACL规则提取并上送的诊断报文时,确定网元为断路。
可选的,检测单元对分解获得的每一个网元进行通路检测包括:
对划分的属于尾节点的网元,确定属于尾节点的网元是否支持出端口的提包功能;
确定属于尾节点的网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第六预设时长内接收到网元根据ACL规则提取并上送的诊断报文时,确定网元为通路;在第六预设时长内未接收到网元根据ACL规则提取并上送的诊断报文时,确定网元为断路。
生成单元用于,根据所有网元和单位链路的通路检测生成故障诊断结果。
这里,网元和单位链路的通断结果进行汇总整理后,即可以生成故障诊断结果。
可选的,本发明实施例装置还包括:
删除单元,用于检测单元完成每一个网元或单位链路的通路检测时,删除下发的ACL规则。
与相关技术相比,本申请技术方案包括:接收到上报的通信线路(LOC)告警时,将LOC告警涉及的连接网络分解为对应的至少两个网元和至少两个单位链路;对分解获得的每一个网元和每一条单位链路分别进行通路检测;根据所有网元和单位链路的通路检测生成故障诊断结果。其中,单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口(NNI)到东向网元的入端口的NNI之间的线路构成。本发明实施例简化了故障诊断的处理过程,提升了故障诊断效率。
再一方面,本发明实施例还提供一种实现故障诊断的装置,包括:存储器和处理器;其中,
处理器被配置为执行存储器中的程序指令;
程序指令在处理器读取执行以下操作:
接收到上报的通信线路LOC告警的情况下,将LOC告警涉及的连接网络分解为对应的至少两个网元和至少一条单位链路;
对分解获得的每一个网元和每一条单位链路分别进行通路检测;
根据所有网元和单位链路的通路检测生成故障诊断结果;
其中,单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口NNI到东向网元的入端口的NNI之间的线路构成。
以下通过应用示例对本发明进行清楚详细的说明,应用示例仅用于陈述本发明,并不用于限定本发明的保护范围。
应用示例1
本应用示例中的网元通过设备支持的版本号(例如、版本号为6以下)确定不支持出端口的提包功能且不包含首尾节点,应用示例用于检测LSP的连通性。
图9为本发明第一应用示例的方法流程图,如图9所示,包括:
步骤900、控制器将LOC告警涉及的连接网络分解为对应的至少两个网元和至少一条单位链路;包括:控制器分解出需要通路检测的单位链路,单位链路可以以链路列表的方式存在,单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口(NNI)到东向网元的入端口的NNI之间的线路构成,可以通过{第一网元、第一端口,第二网元、第二端口}的方式表示,其中,第一网元可以是西向网元,第二网元可以是东向网元,第一端口可以是出端口,第二端口可以是入端口。本应用示例单位链路包括:{Switch1、1端口,Switch2、2端口}{Switch2、1端口,Switch3、2端口}{Switch3、1端口,Switch4、2端口}共3个。需要检测的网元包括:中间节点Switch2、中间节点Switch3。
步骤901、控制器对每一条单位链路进行通路检测;包括:检测{Switch1、1端口,Switch2、2端口}、{Switch2、1端口,Switch3、2端口}和{Switch3、1端口,Switch4、2端口}3个单位链路的通路情况,包括:在{Switch2、2端口}下发ACL规则,在{Switch1,1端口}下发诊断报文;如果该单位链路断开,导致定时器计时超过第一预设时长,控制器标记此链路为“断”;控制器删除上述ACL规则。控制器在{Switch3、2端口}下发ACL规则,在{Switch2、1端口}下发诊断报文。假设控制器在定时器在第一预设时长内收到了诊断报文,标记此链路为“通”,控制器删除上述ACL规则;控制器在{Switch4、2端口}下发ACL规则,在{Switch3、1端口}下发诊断报文如果该单位链路断开,导致定时器计时超过第一预设时长,控制器标记此链路为“断”;控制器删除上述ACL规则。
步骤902、控制器对中间节点进行通路检测;包括检测{中间节点Switch2}和{中间节点Switch3}的连通性。由于交换设备不支持出端口提取报文;且单位链路{Switch2、1端口,Switch3、2端口}是“通”的。因此,控制器在{Switch3、2端口}下发ACL规则,在{Switch2、2端口}下发诊断报文。控制器在第三预设时长内收到了诊断报文,标记此节点为“通”的;控制器删除上述ACL规则。本应用示例,由于交换设备不支持出端口提取报文,且链路{Switch3、1端口,Switch4、2端口}是“断”的,因此控制器无法诊断所述节点的连通性。
本应用示例可以以相同原理检测连接的反向。检测结果为:{Switch4、2端口,Switch3、1端口}是“断”的,{Switch3、2端口,Switch2、1端口}是“通”的,{Switch2、2端口,Switch1、1端口}是“断”的。{中间节点Switch3}是“通”的。
步骤903、控制器将检测结果上报客户端;本应用示例客户端可以时应用(APP),可以以不同的线条形状分别标识单位链路和网元的通断。图10为第一应用示例上报至客户端的检测结果示意图,如图10所示,用实线表示连接为通路,虚线为断路,线段加点的线为检测结果未知的线路,其中,上半部分示意图表示正向连接的故障检测结果,下半部分示意图表示反向连接的故障检测结果。
可选地,当修复了单位链路{Switch1、1端口,Switch2、2端口}{Switch3、1端口,Switch4、2端口}的双向连接时,本发明实施例可以检测到LSP的LOC告警消失,控制器将上述所有链路、节点标记为“通”的,将更新的检测结果上报客户端。
可选地,当修复了链路{Switch1、1端口,Switch2、2端口}{Switch3、1端口,Switch4、2端口}的双向连接。但仍然检测到正向LSP存在LOC,反向LSP不存在LOC。则控制器将反向LSP的所有单位链路、网元标记为“通”的上报至客户端。
同时,本应用示例可以设定重新进行通路检测的时间,以使控制器重新检测正向LSP的连通性。此时,单位链路{Switch1、1端口,Switch2、2端口}、{Switch3、1端口,Switch4、2端口}是“通”的,借用于链路{Switch3、1端口,Switch4、2端口},控制器向{Switch4、2端口}下发ACL规则,向{Switch3、2端口}下发诊断报文,在第一预设时长内,控制器未收到预期的诊断报文,控制器将{中间节点Switch3}标记为“断”的。控制器将LSP正向{中间节点Switch3}状态“断”、其它节点链路状态“通”,反向所有链路、节点状态“通”上报给客户端。
应用示例2
本应用示例中的网元通过设备支持的版本号(例如、版本号为6以下)确定支持出端口的提包功能,本应用示例连接包含首尾节点,应用示例用于检测VPWS CIP之间的连通性。
图11为本发明第二应用示例的方法流程图,如图11所示,包括:
本应用示例控制器接收到VPWS CIP间的LOC告警。
步骤1100、控制器将LOC告警涉及的连接网络分解为对应的至少两个网元和至少一条单位链路;包括:控制器分解出需要通路检测的单位链路,单位链路可以以链路列表的方式存在,单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口(NNI)到东向网元的入端口的NNI之间的线路构成,可以通过{第一网元、第一端口,第二网元、第二端口}的方式表示,其中,第一网元可以是西向网元,第二网元可以是东向网元,第一端口可以是出端口,第二端口可以是入端口。本应用示例单位链路包括:{Switch1、1端口,Switch2、2端口}{Switch2、1端口,Switch3、2端口}{Switch3、1端口,Switch4、2端口}共3个。需要检测的网元包括:中间节点Switch2、中间节点Switch3、首节点Switch1、尾节点Switch4共4个网元。
步骤1101:控制器对每一条单位链路进行通路检测;对单位连接的通路检测方法和应用示例1相同,在此不做赘述。
步骤1102:控制器对中间节点、首节点和尾节点进行通路检测;其中,对中间节点的通路检测与应用示例1的检测方法相同,在此不做赘述。对首节点首节点Switch1;由于设备支持出端口提取报文,因此,控制器在{Switch1、1端口}下发ACL规则,在{Switch1、2端口}下发诊断报文。控制器在第四预设时长内接收到了诊断报文,标记此节点为“通”。控制器删除上述ACL规则。对尾节点Switch4,由于设备支持出端口提取报文,因此,控制器在{Switch4、1端口}下发ACL规则,在{Switch4、2端口}下发诊断报文;控制器在第四预设时长内未收到诊断报文,标记此节点为“断”。控制器删除上述ACL规则。
本应用示例可以以相同原理检测连接的反向。检测结果为:{Switch4、2端口,Switch3、1端口}是“通”的,{Switch3、2端口,Switch2、1端口}是“断”的,{Switch2、2端口,Switch1、1端口}是“断”的。中间节点Switch3是“断”的,中间节点Switch2是“通”的。首节点Switch4是“通”的,尾节点Switch1是“通”的。
步骤1103、控制器将检测结果上报客户端。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的每个模块/单元可以采用硬件的形式实现,例如通过集成电路来实现其相应功能,也可以采用软件功能模块的形式实现,例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明不限制于任何特定形式的硬件和软件的结合。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (13)

1.一种实现故障诊断的方法,其特征在于,所述实现故障诊断的方法应用于控制器,所述实现故障诊断的方法包括:
接收到上报的通信线路LOC告警的情况下,将LOC告警涉及的连接网络分解为对应的至少两个网元和至少一条单位链路;
对分解获得的每一个网元和每一条单位链路分别进行通路检测;
根据所有网元和单位链路的通路检测生成故障诊断结果;
其中,所述单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口NNI到东向网元的入端口的NNI之间的线路构成。
2.根据权利要求1所述的方法,其特征在于,所述对分解获得的每一条单位链路进行通路检测包括:
将分解获得的所有单位链路按照由西向东的顺序进行正向排列后,按照正向排列对每一条单位链路分别进行正向通路检测,按照由东向西的反向排列对每一条单位链路分别进行反向通路检测。
3.根据权利要求1所述的方法,其特征在于,所述对分解获得的每一条单位链路进行通路检测包括:
对每一个所述单位链路,在东向网元的入端口下发访问控制列表ACL规则;在所述单位链路的西向网元的出端口下发诊断报文;在第一预设时长内接收到东向网元根据ACL规则提取的诊断报文时,确定所述单位链路为正向通路;在第一预设时长内未接收到东向网元根据ACL规则提取的诊断报文时,确定所述单位链路为正向断路;
对每一个所述单位链路,在西向网元的出端口下发访问控制列表ACL规则;在所述单位链路的东向网元的入端口下发诊断报文;在第一预设时长内接收到西向网元根据ACL规则提取的诊断报文时,确定所述单位链路为反向通路;在第一预设时长内未接收到西向网元根据ACL规则提取的诊断报文时,确定所述单位链路为反向断路;
其中,所述诊断报文的封装与需要诊断的业务的封装相同。
4.根据权利要求1所述的方法,其特征在于,所述对分解获得的每一个网元进行通路检测包括:
区分LOC告警涉及的所述连接网络分解获得的网元按照网络结构划分为始节点、中间节点、尾节点;
对分解获得的所有网元按照中间节点、始节点、尾节点的顺序进行通路检测;
其中,所述中间节点按照从西向到东向的方向进行排序。
5.根据权利要求4所述的方法,其特征在于,所述对分解获得的每一个网元进行通路检测包括:
对划分的属于中间节点的网元,确定属于中间节点的所述网元是否支持出端口的提包功能;
确定属于中间节点的所述网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第二预设时长内接接收到网元根据ACL提取并上送的诊断报文时,确定所述网元为通路;在第二预设时长内未接接收到网元根据ACL提取并上送的诊断报文时,确定所述网元为断路;
确定属于中间节点的所述网元不支持出端口的提包功能时,在确定所述网元与相邻的东向网元的链路为通路的情况下,向所述东向网元的入端口下发ACL规则;在所述网元的入端口下发诊断报文;在第三预设时长内接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在第三预设时长内未接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路。
6.根据权利要求4所述的方法,其特征在于,所述对分解获得的每一个网元进行通路检测包括:
对划分的属于首节点的网元,确定属于首节点的网元是否支持出端口的提包功能;
确定属于首节点的所述网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第四预设时长内接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在第四预设时长内未接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路;
确定属于首节点的所述网元不支持出端口的提包功能时,在确定所述网元与相邻的东向网元的链路为通路的情况下,向所述东向网元的入端口下发ACL规则;在所述网元的入端口下发诊断报文;在第五预设时长内接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在所述网元的入端口下发诊断报文;在第五预设时长内未接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路。
7.根据权利要求4所述的方法,其特征在于,所述对分解获得的每一个网元进行通路检测包括:
对划分的属于尾节点的网元,确定属于尾节点的所述网元是否支持出端口的提包功能;
确定属于尾节点的所述网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第六预设时长内接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在第六预设时长内未接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路。
8.根据权利要求3、5、6或7所述的方法,其特征在于,所述方法还包括:
完成每一个网元或单位链路的通路检测时,删除下发的所述ACL规则。
9.一种实现故障诊断的装置,其特征在于,包括:分解单元、检测单元和生成单元;其中,
分解单元用于,接收到上报的通信线路LOC告警的情况下,将LOC告警涉及的连接网络分解为对应的至少两个网元和至少一条单位链路;
检测单元用于,对分解获得的每一个网元和每一条单位链路分别进行通路检测;
生成单元用于,根据所有网元和单位链路的通路检测生成故障诊断结果;
其中,所述单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口NNI到东向网元的入端口的NNI之间的线路构成。
10.根据权利要求9所述的装置,其特征在于,所述检测单元用于对分解获得的每一条单位链路进行通路检测包括:
对每一个所述单位链路,在东向网元的入端口下发访问控制列表ACL规则;在所述单位链路的西向网元的出端口下发诊断报文;在第一预设时长内接收到东向网元根据ACL规则提取的诊断报文时,确定所述单位链路为正向通路;在第一预设时长内未接收到东向网元根据ACL规则提取的诊断报文时,确定所述单位链路为正向断路;
对每一个所述单位链路,在西向网元的出端口下发访问控制列表ACL规则;在所述单位链路的东向网元的入端口下发诊断报文;在第一预设时长内接收到西向网元根据ACL规则提取的诊断报文时,确定所述单位链路为反向通路;在第一预设时长内未接收到西向网元根据ACL规则提取的诊断报文时,确定所述单位链路为反向断路;
其中,所述诊断报文的封装与需要诊断的业务的封装相同。
11.根据权利要求9所述的装置,其特征在于,所述检测单元用于对分解获得的每一个网元进行通路检测包括:
区分LOC告警涉及的所述连接网络分解获得的网元按照网络结构划分为始节点、中间节点、尾节点;
对分解获得的所有网元按照中间节点、始节点、尾节点的顺序进行通路检测;
其中,所述中间节点按照从西向到东向的方向进行排序。
12.根据权利要求11所述的装置,其特征在于,所述检测单元具体用于:
对划分的属于中间节点的网元,确定属于中间节点的所述网元是否支持出端口的提包功能;确定属于中间节点的所述网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第二预设时长内接接收到网元根据ACL提取并上送的诊断报文时,确定所述网元为通路;在第二预设时长内未接接收到网元根据ACL提取并上送的诊断报文时,确定所述网元为断路;确定属于中间节点的所述网元不支持出端口的提包功能时,在确定所述网元与相邻的东向网元的链路为通路的情况下,向所述东向网元的入端口下发ACL规则;在所述网元的入端口下发诊断报文;在第三预设时长内接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在第三预设时长内未接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路;
对划分的属于首节点的网元,确定属于首节点的网元是否支持出端口的提包功能;确定属于首节点的所述网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第四预设时长内接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在第四预设时长内未接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路;确定属于首节点的所述网元不支持出端口的提包功能时,在确定所述网元与相邻的东向网元的链路为通路的情况下,向所述东向网元的入端口下发ACL规则;在所述网元的入端口下发诊断报文;在第五预设时长内接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在所述网元的入端口下发诊断报文;在第五预设时长内未接收到所述东向网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路;
对划分的属于尾节点的网元,确定属于尾节点的所述网元是否支持出端口的提包功能;确定属于尾节点的所述网元支持出端口的提包功能时,则向网元的出端口下发ACL规则;在网元的入端口下发诊断报文;在第六预设时长内接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为通路;在第六预设时长内未接收到网元根据ACL规则提取并上送的诊断报文时,确定所述网元为断路。
13.一种实现故障诊断的装置,其特征在于,包括:存储器和处理器;其中,
所述处理器被配置为执行所述存储器中的程序指令;
所述程序指令在所述处理器读取执行以下操作:
接收到上报的通信线路LOC告警的情况下,将LOC告警涉及的连接网络分解为对应的至少两个网元和至少一条单位链路;
对分解获得的每一个网元和每一条单位链路分别进行通路检测;
根据所有网元和单位链路的通路检测生成故障诊断结果;
其中,所述单位链路由相邻的两个网元中:西向网元的出端口的网络节点接口NNI到东向网元的入端口的NNI之间的线路构成。
CN201710075976.9A 2017-02-13 2017-02-13 一种实现故障诊断的方法及装置 Active CN108429625B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710075976.9A CN108429625B (zh) 2017-02-13 2017-02-13 一种实现故障诊断的方法及装置
PCT/CN2018/072836 WO2018145560A1 (zh) 2017-02-13 2018-01-16 链路故障诊断方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710075976.9A CN108429625B (zh) 2017-02-13 2017-02-13 一种实现故障诊断的方法及装置

Publications (2)

Publication Number Publication Date
CN108429625A CN108429625A (zh) 2018-08-21
CN108429625B true CN108429625B (zh) 2021-10-15

Family

ID=63107941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710075976.9A Active CN108429625B (zh) 2017-02-13 2017-02-13 一种实现故障诊断的方法及装置

Country Status (2)

Country Link
CN (1) CN108429625B (zh)
WO (1) WO2018145560A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110943864B (zh) * 2019-11-29 2023-04-07 北京金山云网络技术有限公司 分布式存储系统的网络异常定位方法及装置
CN112804122B (zh) * 2021-01-12 2022-07-22 昆高新芯微电子(江苏)有限公司 报文链路的故障诊断方法、装置及计算机可读存储介质
CN113452564B (zh) * 2021-06-29 2023-03-24 杭州迪普科技股份有限公司 一种基于acl的故障诊断方法及装置
CN114567542B (zh) * 2022-02-16 2023-09-15 烽火通信科技股份有限公司 硬管道专线逐跳业务检测方法、装置、设备及存储介质
CN114866398B (zh) * 2022-03-24 2024-01-09 阿里巴巴(中国)有限公司 网络故障诊断方法及装置
CN115361312B (zh) * 2022-10-21 2023-01-24 之江实验室 一种基于链路流量的环网节点间链路状态监测方法和装置
CN115834436B (zh) * 2022-11-24 2024-05-03 中国联合网络通信集团有限公司 网络连通性检测方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101043383A (zh) * 2006-03-20 2007-09-26 中兴通讯股份有限公司 一种环型网络中检测单通故障的方法
CN101986604A (zh) * 2010-10-29 2011-03-16 中兴通讯股份有限公司 分组传送网的链路故障定位方法及系统
CN101989934A (zh) * 2009-08-06 2011-03-23 中兴通讯股份有限公司 一种数据环网故障检测及定位的方法和系统
CN103220201A (zh) * 2013-04-24 2013-07-24 杭州华三通信技术有限公司 一种环网故障检测保护方法和设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100395994C (zh) * 2005-06-23 2008-06-18 华为技术有限公司 自动交换光网络中通道故障的处理方法
US8670302B2 (en) * 2010-06-10 2014-03-11 Infinera Corporation Activation signaling in transport networks
US11132277B2 (en) * 2012-12-28 2021-09-28 Iii Holdings 2, Llc System and method for continuous low-overhead monitoring of distributed applications running on a cluster of data processing nodes
CN104796298B (zh) * 2014-01-22 2019-06-07 新华三技术有限公司 一种sdn网络故障分析的方法及装置
CN105490932A (zh) * 2014-09-19 2016-04-13 中兴通讯股份有限公司 一种双向转发检测的方法、设备和系统
CN105634857A (zh) * 2014-11-26 2016-06-01 中兴通讯股份有限公司 链路连通性检测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101043383A (zh) * 2006-03-20 2007-09-26 中兴通讯股份有限公司 一种环型网络中检测单通故障的方法
CN101989934A (zh) * 2009-08-06 2011-03-23 中兴通讯股份有限公司 一种数据环网故障检测及定位的方法和系统
CN101986604A (zh) * 2010-10-29 2011-03-16 中兴通讯股份有限公司 分组传送网的链路故障定位方法及系统
CN103220201A (zh) * 2013-04-24 2013-07-24 杭州华三通信技术有限公司 一种环网故障检测保护方法和设备

Also Published As

Publication number Publication date
CN108429625A (zh) 2018-08-21
WO2018145560A1 (zh) 2018-08-16

Similar Documents

Publication Publication Date Title
CN108429625B (zh) 一种实现故障诊断的方法及装置
US10868730B2 (en) Methods, systems, and computer readable media for testing network elements of an in-band network telemetry capable network
JP7108674B2 (ja) 故障根本原因決定方法及び装置並びにコンピュータ記憶媒体
US10652078B2 (en) Triggered in-band operations, administration, and maintenance in a network environment
US10142203B2 (en) Ethernet fault management systems and methods
CN109495322B (zh) 网络故障定位方法、相关设备及计算机存储介质
US11095546B2 (en) Network device service quality detection method and apparatus
US10075370B2 (en) Network performance diagnostics system
US8774010B2 (en) System and method for providing proactive fault monitoring in a network environment
US10015066B2 (en) Propagation of frame loss information by receiver to sender in an ethernet network
CN102195857A (zh) 一种网络拓扑结构与节点信息搜集方法
CN106936656B (zh) 一种实现丢包检测的方法、装置和系统
US9929966B2 (en) Preservation of a TTL parameter in a network element
CN105743687B (zh) 节点故障的判断方法及装置
US20140092725A1 (en) Method and first network node for managing an ethernet network
EP2129042B1 (en) A multicast network system, node and a method for detecting a fault of a multicast network link
US8625439B2 (en) System and method for communicating alarms between devices of a packet network
CN106803803B (zh) 虚拟局域网络复原方法、系统及其装置
US8351324B2 (en) Analyzing service impacts on virtual private networks
US20230254244A1 (en) Path determining method and apparatus, and computer storage medium
US8614958B2 (en) Systems and methods of snooping connectivity fault messages to configure maintenance end point for alarm suppression messages
CN108282383B (zh) 一种实现故障处理的方法及设备
Senevirathne et al. Requirements for Operations, Administration, and Maintenance (OAM) in Transparent Interconnection of Lots of Links (TRILL)
CN112187676B (zh) 一种交换机端口恢复的方法和设备
CN118041718A (zh) 一种具备防阻塞功能的车机网络通信方法、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant