CN110290017B - 故障节点定位方法及pe设备 - Google Patents

故障节点定位方法及pe设备 Download PDF

Info

Publication number
CN110290017B
CN110290017B CN201910683392.9A CN201910683392A CN110290017B CN 110290017 B CN110290017 B CN 110290017B CN 201910683392 A CN201910683392 A CN 201910683392A CN 110290017 B CN110290017 B CN 110290017B
Authority
CN
China
Prior art keywords
head
end node
message
signature
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910683392.9A
Other languages
English (en)
Other versions
CN110290017A (zh
Inventor
郭威
李金平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Big Data Technologies Co Ltd
Original Assignee
New H3C Big Data Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Big Data Technologies Co Ltd filed Critical New H3C Big Data Technologies Co Ltd
Priority to CN201910683392.9A priority Critical patent/CN110290017B/zh
Publication of CN110290017A publication Critical patent/CN110290017A/zh
Application granted granted Critical
Publication of CN110290017B publication Critical patent/CN110290017B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • H04L43/0829Packet loss
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/50Routing or path finding of packets in data switching networks using label swapping, e.g. multi-protocol label switch [MPLS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开实施例提供一种故障节点定位方法及PE设备,当非首端节点位于首端节点和目的节点当前通信所用的标签交换路径时,非首端节点每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到签名报文在该周期内的丢包率,并在丢包率大于设定丢包率时,向首端节点发送故障定位报文,故障定位报文包括签名报文在该周期内的丢包率和非首端节点的地址信息。如此,本公开通过非首端节点对具有预设签名标识的签名报文进行收发包的差异统计,并向首端节点反馈故障定位报文,使得首端节点能够快速得知每个非首端节点的丢包情况,从而快速定位存在性能故障的非首端节点,避免定位耗费大量时间。

Description

故障节点定位方法及PE设备
技术领域
本公开涉及通信技术领域,具体而言,涉及一种故障节点定位方法及PE设备。
背景技术
在基于多协议标签交换的二层虚拟专用网络(Multi-Protocol Label SwitchingL2Virtual Private Network,MPLS L2VPN)的故障测试中,快速重路由(Fast Reroute,FRR)的切换性能是故障测试的一个关键指标。现网中经常可能会出现两个节点之间的某段链路出现故障,或者某个节点突然宕机,需要通过快速重路由功能将当前的交换路径切换到另一条标签交换路径(Label Switching Path,LSP),使用户业务能够在最短时间内恢复。在实际的切换性能测试中,通常的做法是在进行FRR切换后,待业务稳定后再计算切换时间,一般切换时间要低于设定时间才能满足性能测试要求。但是当切换时间大于设定时间时,则难以从整个网络中的诸多节点中定位存在性能问题的节点。
发明内容
有鉴于此,本公开实施例的目的在于提供一种故障节点定位方法及PE设备,以解决或者改善上述问题。
根据本公开实施例的一个方面,提供一种故障节点定位方法,应用于多协议标签交换MPLS网络中的非首端节点,所述MPLS网络还包括首端节点和目的节点,所述首端节点和所述目的节点之间具有至少两条标签交换路径,每条标签交换路径上包括至少一个非首端节点,所述方法包括:
当所述非首端节点位于所述首端节点和所述目的节点当前通信所用的标签交换路径时,每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到所述签名报文在该周期内的丢包率,其中,所述签名报文为具有预设签名标识的报文;
判断所述丢包率是否大于设定丢包率;
当所述丢包率大于设定丢包率时,向所述首端节点发送故障定位报文,所述故障定位报文包括所述签名报文在该周期内的丢包率和所述非首端节点的地址信息。
在一种可能的实施方式中,所述每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到所述签名报文在该周期内的丢包率的步骤,包括:
根据每个周期内接收到的签名报文数量,得到该周期的签名报文接收速率,并根据每个周期内发送给下一跳节点的签名报文数量,得到该周期的签名报文发送速率;
根据所述签名报文接收速率和所述签名报文发送速率之间的差值得到签名报文的丢包率。
在一种可能的实施方式中,所述每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到所述签名报文在该周期内的丢包率的步骤之前,所述方法还包括:
对接收到的数据报文中的数据字段进行识别,判断所述数据字段中是否包括所述预设签名标识;
若判定所述数据字段中包括所述预设签名标识,则确定所述数据报文为签名报文。
在一种可能的实施方式中,所述每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到所述签名报文在该周期内的丢包率的步骤之前,所述方法还包括:
接收所述首端节点发送的路由跟踪报文时;
记录所述路由跟踪报文中所述首端节点的地址信息;
向下一跳节点转发所述路由跟踪报文,并向所述首端节点返回路由跟踪响应报文,以使所述首端节点记录每个非首端节点返回的路由跟踪响应报文中包含的该非首端节点的地址信息和该非首端节点在所述MPLS网络中的节点位置顺序。
在一种可能的实施方式中,所述当所述丢包率大于设定丢包率时,向所述首端节点发送故障定位报文的步骤,包括:
当所述丢包率大于设定丢包率时,生成故障定位报文,并在所述故障定位报文中添加所述签名报文在该周期内的丢包率和所述非首端节点的地址信息;
根据记录的所述首端节点的地址信息将所述故障定位报文发送给所述首端节点。
根据本公开的另一方面,提供一种故障节点定位方法,应用于多协议标签交换MPLS网络中的首端节点,所述MPLS网络还包括目的节点,所述首端节点与所述目的节点之间具有至少两条标签交换路径,每条标签交换路径包括至少一个非首端节点,所述方法包括:
向当前与所述目的节点通信所使用的标签交换路径中的非首端节点发送签名报文,以使所述非首端节点每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计以得到所述签名报文在该周期内的丢包率,并将所述签名报文转发给下一跳节点,其中,所述签名报文中包括预设签名标识;
接收任意一个非首端节点在统计得到的所述签名报文在该周期内的丢包率大于设定丢包率时发送的故障定位报文,并对所述故障定位报文进行记录,所述故障定位报文包括所述签名报文在该周期内的丢包率和该非首端节点的地址信息。
在一种可能的实施方式中,所述向当前与所述目的节点通信所使用的标签交换路径中的非首端节点发送签名报文的步骤,包括:
根据预设的故障检测策略,生成具有所述预设签名标识的签名报文,所述故障检测策略包括所述预设签名标识和故障检测频率;
按照所述故障检测频率向当前与所述目的节点通信所使用的标签交换路径中的非首端节点发送所述签名报文。
在一种可能的实施方式中,所述首端节点向当前与所述目的节点通信所使用的标签交换路径中的非首端节点发送签名报文的步骤之前,所述方法还包括:
向每条标签交换路径中的非首端节点发送路由跟踪报文,以使所述非首端节点记录所述路由跟踪报文中所述首端节点的地址信息,并继续向下一跳节点转发所述路由跟踪报文;
接收每个非首端节点返回的路由跟踪响应报文,并记录每个非首端节点返回的路由跟踪响应报文中包含的该非首端节点的地址信息和该非首端节点在所述MPLS网络中的节点位置顺序。
根据本公开的另一方面,提供一种故障节点定位方法,应用于多协议标签交换MPLS网络,所述MPLS网络包括首端节点和目的节点,所述首端节点和所述目的节点之间具有至少两条标签交换路径,每条标签交换路径上包括至少一个非首端节点,所述方法包括:
所述首端节点向当前与所述目的节点通信所使用的标签交换路径中的非首端节点发送签名报文,其中,所述签名报文中包括预设签名标识;
所述非首端节点每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到所述签名报文在该周期内的丢包率;
当任意一个非首端节点得到的丢包率大于设定丢包率时,该非首端节点向所述首端节点发送故障定位报文,所述故障定位报文包括所述签名报文在该周期内的丢包率和该非首端节点的地址信息;
所述首端节点对所述故障定位报文进行记录。
根据本公开的另一方面,提供一种PE设备,所述PE设备包括机器可读存储介质及处理器,所述机器可读存储介质存储有机器可执行指令,所述处理器在执行所述机器可执行指令时,该PE设备作为所述非首端节点实现前述对应的故障节点定位方法,或者该PE设备作为所述首端节点实现前述对应的故障节点定位方法。
基于上述任一方面,相较于现有技术而言,当非首端节点位于首端节点和目的节点当前通信所用的标签交换路径时,非首端节点每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到签名报文在该周期内的丢包率,并在丢包率大于设定丢包率时,向首端节点发送故障定位报文,故障定位报文包括签名报文在该周期内的丢包率和非首端节点的地址信息。如此,通过非首端节点对具有预设签名标识的签名报文进行收发包的差异统计,并向首端节点反馈故障定位报文,使得首端节点能够快速得知每个非首端节点的丢包情况,从而快速定位存在性能故障的非首端节点,避免定位耗费大量时间。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了一种MPLS网络的示意图;
图2示出了图1中所示的MPLS网络的FRR切换示意图;
图3示出了本公开实施例所提供的一种故障节点定位方法的流程示意图;
图4示出了本公开实施例所提供的另一种故障节点定位方法的流程示意图;
图5示出了本公开实施例所提供的另一种故障节点定位方法的流程示意图;
图6示出了本公开实施例所提供的PE设备的结构示意框图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。
参照图1,示出了一种MPLS网络的示意图,该MPLS网络中可包括首端节点NE41、非首端节点NE31、NE21、NE32、NE22以及目的节点NE11。
首端节点NE41和目的节点NE11之间具有至少两条LSP,例如图1中所示的主LSP和备LSP,主LSP上包括非首端节点NE31、NE21,备LSP上包括非首端节点NE32、NE22。
首端节点NE41和非首端节点NE31、NE21、NE32、NE22可以是服务商边缘(ProviderEdge,PE)设备,目的节点NE11可以是用户边缘(Customer Edge,CE)设备。其中,首端节点NE41和非首端节点NE31、NE21、NE32、NE22均可以为标签交换路由器(Label SwitchingRouter,LSR)。
其中,PE设备与CE设备通信连接,负责VPN业务的接入,完成报文从用户网络到公网隧道、从公网隧道到用户网络的映射与转发。两个PE设备之间可以通过伪线(PseudoWire,PW)进行虚拟双向连接。
如图1所示的MPLS L2VPN组网中,NE41作为PE分别与主LSP上的NE31和备LSP上的NE32建立L2VPN,NE31和NE32作为多段伪线分别和NE21和NE22建立L2VPN,NE21和NE22分别连接NE11侧的两条聚合链路。NE11侧包括一个聚合口,通过该聚合口进行单活收发。
请结合参见图2,NE41的主下一跳为NE31、备下一跳为NE32。当NE41通过主LSP与NE11进行报文转发时,可以将NE11连接NE21的聚合口置为UP状态,NE11连接NE22的聚合口置为DOWN状态。这时,NE41发送的报文会发往主下一跳NE31,报文的完整走向则为NE41->NE31->NE21->NE11。
如果NE21宕机,则NE11选择的聚合口会切换到NE22,也即将NE11连接NE21的聚合口由UP切换到DOWN,将NE11连接NE22的聚合口由DOWN切换到UP。此时,NE41会触发FRR切换,将和NE11当前通信所用的LSP切换到备LSP,也即此时NE11的下一跳节点由主下一跳NE31切换到备下一跳NE32,这时,NE41发送的报文会发往备下一跳NE32,报文的最终走向则切换为NE41->NE32->NE22->NE11。以上组网中,通常会使用到双向转发检测(BidirectionalForwarding Detection,BFD)技术进行故障通报,以使NE41触发FRR切换。
需要说明的是,图1和图2仅为一种简化的MPLS网络的示例性示意图,本公开实施例不对MPLS网络中各类型节点的数量进行限制。例如,在其它MPLS网络中,还可以包括其它更多的备用LSP,或者图1和图2中的主LSP还可以包括除去NE31、NE21之外其它更多的非首端节点,同样地,备LSP上也可以包括除去NE32、NE22之外其它更多的非首端节点。
如果上述示例的NE21或其它节点宕机,NE21到NE11之间的链路意外中断,此时根据组网部署,从NE41发出的报文需要快速切换到NE32至NE22进行转发,从NE11发起的反向报文需要快速切换到NE22至NE32进行转发。
发明人在研究过程中发现,在MPLS组网中往往会部署多重业务,不仅限于L2VPN业务,在运营商测试中,也会同时部署多重其他业务来模拟。而在运营商测试中,模拟性能故障测试最具复杂性同时也最难进行问题定位。例如图2所示的场景中,如果出现NE21宕机,在众多业务中,发现NE41由NE31切换到NE32进行转发,切换时间通常要求在300ms以内,然而实际测试发现切换时间可能远远超过300ms。针对这种情况,如前述背景技术所提及的技术问题,当前难以从整个网络中的诸多节点中定位存在性能问题的节点。
为此,经研究后发现,如果仅仅采用传统的节点端口计数方案,那么首端节点的端口发出的报文会同时包含协议报文、BFD报文以及其他业务类型的数据报文等,导致难以准确在每个非首端节点上针对某一个业务的报文收发数量进行计算以得到丢包数量,并且还需要在每个非首端节点进行观察,使得故障定位效率极低。
鉴于此,发明人经过仔细研究后发现,可以根据MPLS组网的理解和经验分析,得出大概丢包的非首端节点,但是仍旧难以确认每个非首端节点具体的丢包情况。仍旧以上述示例为例,当NE21重启后,报文的转发路径则切换到NE41->NE32->NE22->NE11,从人工的网络经验部署分析,主要丢包节点应该在NE31和NE22上。详细地,NE41的出方向发送报文给NE31,如果NE41感知与NE31之间的L2VPN PW故障的速度比较慢,则会继续将报文发给NE31,而NE31认为NE21已经故障,那么NE31则会丢弃接收到的NE41的报文。另外,如果NE41切换结束,将报文发给NE32,则NE32会继续发给NE22,但是此时NE22和NE11之间的聚合口可能还没切换到UP状态,因为NE11之前选择连接NE21的聚合口为UP状态,切换到连接NE22的聚合口还需要一定时间。如果这个切换时间较长,那么NE22连接NE11的聚合口仍旧处于DOWN状态,如此NE22则会丢包。
以上经过极其复杂的人工分析,才能大概得出可能存在故障的丢包节点,在此基础上还需要进一步去验证该故障的丢包节点(例如上述NE31和NE22)是否丢包,如果丢包,还需要对比具体的丢包情况,确认这些故障节点的处理是否还存在性能优化空间。然而如前述,MPLS组网中各种类型的报文太多,将难以比对特定L2VPN业务的丢包数量。
为此,基于上述技术问题的发现,发明人提出下述技术方案以解决或者改善上述问题。需要注意的是,以上现有技术中的方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开实施例针对上述问题所提出的解决方案,都应该是发明人在发明创造过程中对本公开做出的贡献,而不应当理解为本领域技术人员所公知的技术内容。
本公开发明人提出一种故障节点定位方法及PE设备,当端非首端节点位于首端节点和目的节点当前通信所用的标签交换路径时,非首节点每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到签名报文在该周期内的丢包率,并在丢包率大于设定丢包率时,向首端节点发送故障定位报文,故障定位报文包括签名报文在该周期内的丢包率和非首端节点的地址信息。如此,本公开通过非首端节点对具有预设签名标识的签名报文进行收发包的差异统计,并向首端节点反馈故障定位报文,使得首端节点能够快速得知每个非首端节点的丢包情况,从而快速定位存在性能故障的非首端节点,避免定位耗费大量时间。
下面结合图3对本公开实施例提供的故障节点定位方法进行详细阐述,该故障节点定位方法可以由MPLS网络中的任意一个非首端节点执行。例如,在图1和图2所示的MPLS组网中,非首端节点可以为NE31、NE21、NE32、NE22。应当理解,在其它实施例中,本实施例的故障节点定位方法其中部分步骤的顺序可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除。该故障节点定位方法的详细步骤介绍如下。
步骤S110,当非首端节点位于首端节点和目的节点当前通信所用的标签交换路径时,每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到签名报文在该周期内的丢包率。
本实施例中,首端节点会向当前与目的节点通信所使用的标签交换路径中的非首端节点发送签名报文,该签名报文为具有预设签名标识的报文。详细地,首端节点可以配置有预设的故障检测策略,该故障检测策略包括预设签名标识和故障检测频率,在此基础上生成具有预设签名标识的签名报文,然后按照故障检测频率向当前与目的节点通信所使用的标签交换路径中的非首端节点发送签名报文。
例如图1中,NE41作为首端节点,NE11作为目的节点,如果NE41与NE11通信所使用的LSP为主LSP,预设签名标识可以为“Switchingtest”,那么NE41可以根据设定的故障检测频率向NE31、NE21发送具有“Switchingtest”标识的签名报文;又例如,如果NE41与NE11通信所使用的LSP为备LSP,那么NE41则可以根据设定的故障检测频率向NE32、NE22发送具有“Switchingtest”标识的签名报文。
非首端节点会对接收到的每个数据报文中的数据字段进行识别,判断数据字段中是否包括预设签名标识,若数据字段中包括预设签名标识,则确定数据报文为签名报文,并将该签名报文纳入收发统计中,而针对不包括预设签名标识的其它数据报文,则不纳入收发统计中。以NE41向NE31发送签名报文A为例,NE31在接收到签名报文A后,会去识别签名报文A中的数据字段中是否存在“Switchingtest”标识,如果存在,则将该签名报文A纳入收发统计中,同时会将该签名报文A通过入方向的端口继续发送给NE21。
如此,签名报文作为数据报文使用,携带的数据字段可编辑为预设签名标识,同时每个非首端节点都使用相同的预设签名标识的识别配置,这样当接收到的报文的数据字段为该预设签名标识,则纳入报文收发统计中,从而避免每个非首端节点接收到太多各种类型的数据报文而难以比对具体L2VPN业务的丢包情况。
另外,首端节点也可以和其它测试节点联动发送签名报文,即其它测试节点发出的数据报文中的数据字段中设置前述的预设签名标识,作为签名报文使用,这样首端节点无需发送测试的签名报文,从而降低首端节点的性能占用。
进一步地,非首端节点会每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到签名报文在该周期内的丢包率。例如,非首端节点可以根据每个周期内接收到的签名报文数量,得到该周期的签名报文接收速率,并根据每个周期内发送给下一跳节点的签名报文数量,得到该周期的签名报文发送速率。接着,根据签名报文接收速率和签名报文发送速率之间的差值得到签名报文的丢包率。
以NE31为例,NE31在接收到首端节点或者其它测试节点发送的签名报文后,可以每隔t秒(例如10秒、15秒)对接收到的签名报文和发送给NE21的签名报文分别进行统计,假设在t1周期内接收到的签名报文数量为a1,发送给NE21的签名报文数量为b1,那么NE31在这t1周期内的签名报文接收速率为a1/10,签名报文发送速率为b1/10,那么NE31在这t1周期内的丢包率为(a1-b1)/10。
步骤S120,判断该周期内签名报文在该非首端节点上的丢包率是否大于设定丢包率。
步骤S130,当丢包率大于设定丢包率时,向首端节点发送故障定位报文。
本实施例中,当丢包率大于设定丢包率时,该非首端节点会生成故障定位报文,并在故障定位报文中添加签名报文在该周期内的丢包率和非首端节点的地址信息,然后根据记录的首端节点的地址信息将故障定位报文发送给首端节点。
首端节点在接收到任意一个非首端节点发送的故障定位报文后,会记录该故障定位报文,如此可以记录到所有存在故障的非首端节点发送的故障定位报文。
其中,故障定位报文可以包括签名报文在该周期内的丢包率和非首端节点的地址信息,首端节点可以根据地址信息确定具体是哪一个非首端节点出现故障,并且可以确定知道每个非首端节点的丢包率,从而通过显示接收到的签名报文列表以及对应的每个签名报文的具体时间,得出的丢包率列表,从而进行快速的问题定位。
可选地,故障定位报文还可以携带其它参数,例如非首端节点的节点信息、VLAN信息、VPN信息等其它各类便于定位的信息,这些信息在故障定位报文的报文头之后,可包含可选项标记位,通过可选项标记位可以自定义这些信息的显示顺序。
仍旧以上述示例为例,假设NE31的地址信息为31.1.1.1,NE41的地址信息为41.1.1.1,设定丢包率为c。如果NE31在t1周期内的丢包率(a1-b1)/10>c,那么则生成故障定位报文,并在故障定位报文中添加签名报文在该t1周期内的丢包率(a1-b1)/10和NE31的地址信息31.1.1.1,然后根据记录的NE41的地址信息41.1.1.1,将故障定位报文发送给NE41。
通过上述设计,仍旧以前述示例中的NE21宕机为例,如果NE41感知与NE31之间的L2VPN PW故障的速度比较慢,则会继续将签名报文发给NE31,而NE31认为NE21已经故障,那么NE31则会丢弃接收到的NE41的签名报文。那么根据上述实施例提供的方案,NE31的丢包率则不满足要求。另外,如果NE41切换结束,将签名报文发给NE32,则NE32会继续将签名报文发给NE22,但是此时NE22和NE11之间的聚合口可能还没切换到UP状态,因为NE11之前选择连接NE21的聚合口为UP状态,切换到连接NE22的聚合口还需要一定时间。如果这个切换时间较长,那么NE22连NE11的聚合口仍旧处于DOWN状态,如此NE22会丢弃接收到的签名报文,那么根据上述实施例提供的方案,NE22的丢包率则不满足要求。这时,NE31和NE22则会向NE41发送故障定位报文,NE41可以根据NE31和NE22发送的故障定位报文定位NE31和NE22,并得知NE31和NE22的丢包情况。这样,用户就可以根据NE41上NE31和NE22的丢包情况,来针对性地定位NE31和NE22的性能问题,并及时采取下一步措施。
由此,本实施例通过非首端节点对具有预设签名标识的签名报文进行收发包的差异统计,并向首端节点反馈故障定位报文,使得首端节点能够快速得知每个非首端节点的丢包情况,从而快速定位存在性能故障的非首端节点,避免定位耗费大量时间。
作为一种实施方式,在步骤S110之前,首端节点可以向每条标签交换路径中的非首端节点分别发送路由跟踪(traceroute)报文。非首端节点在接收到路由跟踪报文后,记录路由跟踪报文中首端节点的地址信息,然后向下一跳节点转发路由跟踪报文,并向首端节点返回路由跟踪响应报文。首端节点记录每个非首端节点返回的路由跟踪响应报文中包含的该非首端节点的地址信息和该非首端节点在MPLS网络中的节点位置顺序。如此,后续发生故障的非首端节点可以根据记录的首端节点的地址信息向首端节点反馈故障定位报文,同时首端节点可以根据非首端节点反馈的故障定位报文得知该非首端节点在MPLS组网中的节点位置顺序,以便于快速定位发生故障的非首端节点。
例如图1中,NE41可以分别向NE31和NE32发送路由跟踪报文,该路由跟踪报文中包括NE41的地址信息。NE31在接收到路由跟踪报文后记录NE41的地址信息,并向NE41反馈路由跟踪响应报文,该路由跟踪响应报文中包括NE31的地址信息,同时将路由跟踪报文继续发送给NE21,NE21记录NE41的地址信息,并向NE41反馈路由跟踪响应报文,该路由跟踪响应报文中包括NE21的地址信息。同样地,NE32在接收到路由跟踪报文后记录NE41的地址信息,并向NE41反馈路由跟踪响应报文,该路由跟踪响应报文中包括NE32的地址信息,同时将路由跟踪报文继续发送给NE22,NE22记录NE41的地址信息,并向NE41反馈路由跟踪响应报文,该路由跟踪响应报文中包括NE22的地址信息。NE41分别记录NE31、NE21、NE32和NE22反馈的跟踪响应报文中NE31、NE21、NE32和NE22各自的地址信息和在MPLS组网中的节点位置顺序。
进一步地,图4示出了本公开实施例提供的另一种故障节点定位方法的流程示意图。与上面实施例不同的是,本实施例提供的故障节点定位方法由MPLS网络中的首端节点执行,例如,在图1和图2所示的MPLS组网中,首端节点可以为NE41。可以理解的是,接下来要描述的故障节点定位方法中涉及的步骤在上面实施例中已经描述过,具体各个步骤的详尽内容可参照上面的实施例描述,下面仅对首端节点执行步骤进行简要说明。
步骤S210,首端节点向当前与目的节点通信所使用的标签交换路径中的非首端节点发送签名报文,以使每个非首端节点每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计以得到签名报文在该周期内的丢包率,并将签名报文转发给下一跳节点,其中,签名报文中包括预设签名标识。
步骤S220,接收任意一个非首端节点在统计得到的签名报文在该周期内的丢包率大于设定丢包率时发送的故障定位报文,并对故障定位报文进行记录。其中,故障定位报文包括签名报文在该周期内的丢包率和该非首端节点的地址信息。
作为一种实施方式,针对步骤S210,首端节点可以根据预设的故障检测策略,生成具有预设签名标识的签名报文,故障检测策略包括预设签名标识和故障检测频率。接着,按照故障检测频率向当前与目的节点通信所使用的标签交换路径中的非首端节点发送签名报文。
作为一种实施方式,在步骤S210之前,首端节点可以向每条标签交换路径中的非首端节点发送路由跟踪报文,以使非首端节点记录路由跟踪报文中首端节点的地址信息,并继续向下一跳节点转发路由跟踪报文。接着,首端节点接收每个非首端节点返回的路由跟踪响应报文,并记录每个非首端节点返回的路由跟踪响应报文中包含的该非首端节点的地址信息和该非首端节点在MPLS网络中的节点位置顺序。
进一步地,图5示出了本公开实施例提供的另一种故障节点定位方法的流程示意图。与上面实施例不同的是,本实施例提供的故障节点定位方法由图1中所示的MPLS网络中的首端节点和非首端节点配合执行。可以理解的是,接下来要描述的故障节点定位方法中涉及的步骤在上面实施例中已经描述过,具体各个步骤的详尽内容可参照上面的实施例描述,下面仅对MPLS网络执行步骤进行简要说明。
步骤S310,首端节点向当前与目的节点通信所使用的标签交换路径中的非首端节点发送签名报文,其中,签名报文中包括预设签名标识。
步骤S320,非首端节点每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到签名报文在该周期内的丢包率。
步骤S330,当任意一个非首端节点得到的丢包率大于设定丢包率时,该非首端节点向首端节点发送故障定位报文,故障定位报文包括签名报文在该周期内的丢包率和该非首端节点的地址信息。
步骤S340,首端节点对故障定位报文进行记录。
进一步地,图6示出了本公开实施例提供的PE设备100的结构示意框图,本实施例中,该PE设备100可以是指首端节点,例如图1中所示的NE41,也可以是指非首端节点,例如图1中所示的NE31、NE21、NE32以及NE22,其包括机器可读存储介质120和处理器130。
其中,处理器130可以是一个通用的中央处理器(Central Processing Unit,CPU),微处理器,特定应用集成电路(Application-Specific Integrated Circuit,ASIC),或一个或多个用于控制上述图3中所示的非首端节点执行的方法实施例或者图4中所示的首端节点执行的方法实施例提供的故障节点定位方法的程序执行的集成电路。
机器可读存储介质120可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(Electrically Erasable Programmabler-Only Memory,EEPROM)、只读光盘(Compactdisc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。机器可读存储介质120可以是独立存在,通过通信总线与处理器130相连接。机器可读存储介质120也可以和处理器集成在一起。其中,机器可读存储介质120用于存储执行本公开方案的机器可执行指令。处理器130用于执行机器可读存储介质120中存储的机器可执行指令,以执行上述图3中所示的非首端节点执行的方法实施例或者图4中所示的首端节点执行的方法实施例提供的故障节点定位方法。
由于本公开实施例提供的PE设备100是上述图3中所示的非首端节点执行的方法实施例或者图4中所示的首端节点执行的方法实施例提供的故障节点定位方法的另一种实现形式,且PE设备可用于上述图3中所示的非首端节点执行的方法实施例或者图4中所示的首端节点执行的方法实施例提供的故障节点定位方法,因此其所能获得的技术效果可参考上述方法实施例,在此不再赘述。
进一步地,基于同一发明构思,本公开实施例还提供了一种机器可读存储介质,该机器可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述故障节点定位方法的步骤。
具体地,该机器可读存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该机器可读存储介质上的计算机程序被运行时,能够执行上述故障节点定位方法。
本公开实施例是参照根据本公开实施例的方法、设备(如图5的PE设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
尽管在此结合各实施例对本公开进行了描述,然而,在实施所要求保护的本公开过程中,本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书,可理解并实现所述公开实施例的其他变化。在权利要求中,“包括”一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
以上所述,仅为本公开的各种实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

Claims (7)

1.一种故障节点定位方法,其特征在于,应用于多协议标签交换MPLS网络中的非首端节点,所述MPLS网络还包括首端节点和目的节点,所述首端节点和所述目的节点之间具有至少两条标签交换路径,每条标签交换路径上包括至少一个非首端节点,所述方法包括:
接收所述首端节点发送的路由跟踪报文时,记录所述路由跟踪报文中所述首端节点的地址信息;
向下一跳节点转发所述路由跟踪报文,并向所述首端节点返回路由跟踪响应报文,以使所述首端节点记录每个非首端节点返回的路由跟踪响应报文中包含的该非首端节点的地址信息和该非首端节点在所述MPLS网络中的节点位置顺序;
当所述非首端节点位于所述首端节点和所述目的节点当前通信所用的标签交换路径时,每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到所述签名报文在该周期内的丢包率,其中,所述签名报文为具有预设签名标识的报文;
判断所述丢包率是否大于设定丢包率;
当所述丢包率大于设定丢包率时,向所述首端节点发送故障定位报文,所述故障定位报文包括所述签名报文在该周期内的丢包率和所述非首端节点的地址信息;
所述每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到所述签名报文在该周期内的丢包率的步骤,包括:
根据每个周期内接收到的签名报文数量,得到该周期的签名报文接收速率,并根据每个周期内发送给下一跳节点的签名报文数量,得到该周期的签名报文发送速率;
根据所述签名报文接收速率和所述签名报文发送速率之间的差值得到签名报文的丢包率。
2.根据权利要求1所述的故障节点定位方法,其特征在于,所述每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到所述签名报文在该周期内的丢包率的步骤之前,所述方法还包括:
对接收到的数据报文中的数据字段进行识别,判断所述数据字段中是否包括所述预设签名标识;
若判定所述数据字段中包括所述预设签名标识,则确定所述数据报文为签名报文。
3.根据权利要求1所述的故障节点定位方法,其特征在于,所述当所述丢包率大于设定丢包率时,向所述首端节点发送故障定位报文的步骤,包括:
当所述丢包率大于设定丢包率时,生成故障定位报文,并在所述故障定位报文中添加所述签名报文在该周期内的丢包率和所述非首端节点的地址信息;
根据记录的所述首端节点的地址信息将所述故障定位报文发送给所述首端节点。
4.一种故障节点定位方法,其特征在于,应用于多协议标签交换MPLS网络中的首端节点,所述MPLS网络还包括目的节点,所述首端节点与所述目的节点之间具有至少两条标签交换路径,每条标签交换路径包括至少一个非首端节点,所述方法包括:
向每条标签交换路径中的非首端节点发送路由跟踪报文,以使所述非首端节点记录所述路由跟踪报文中所述首端节点的地址信息,并继续向下一跳节点转发所述路由跟踪报文;
接收每个非首端节点返回的路由跟踪响应报文,并记录每个非首端节点返回的路由跟踪响应报文中包含的该非首端节点的地址信息和该非首端节点在所述MPLS网络中的节点位置顺序;
向当前与所述目的节点通信所使用的标签交换路径中的非首端节点发送签名报文,以使所述非首端节点每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计以得到所述签名报文在该周期内的丢包率,并将所述签名报文转发给下一跳节点,其中,所述签名报文中包括预设签名标识;
所述非首端节点每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到所述签名报文在该周期内的丢包率的方式为:
根据每个周期内接收到的签名报文数量,得到该周期的签名报文接收速率,并根据每个周期内发送给下一跳节点的签名报文数量,得到该周期的签名报文发送速率;
根据所述签名报文接收速率和所述签名报文发送速率之间的差值得到签名报文的丢包率;
接收任意一个非首端节点在统计得到的所述签名报文在该周期内的丢包率大于设定丢包率时发送的故障定位报文,并对所述故障定位报文进行记录,所述故障定位报文包括所述签名报文在该周期内的丢包率和该非首端节点的地址信息。
5.根据权利要求4所述的故障节点定位方法,其特征在于,所述向当前与所述目的节点通信所使用的标签交换路径中的非首端节点发送签名报文的步骤,包括:
根据预设的故障检测策略,生成具有所述预设签名标识的签名报文,所述故障检测策略包括所述预设签名标识和故障检测频率;
按照所述故障检测频率向当前与所述目的节点通信所使用的标签交换路径中的非首端节点发送所述签名报文。
6.一种故障节点定位方法,其特征在于,应用于多协议标签交换MPLS网络,所述MPLS网络包括首端节点和目的节点,所述首端节点和所述目的节点之间具有至少两条标签交换路径,每条标签交换路径上包括至少一个非首端节点,所述方法包括:
所述首端节点向每条标签交换路径中的非首端节点发送路由跟踪报文,以使所述非首端节点记录所述路由跟踪报文中所述首端节点的地址信息,并继续向下一跳节点转发所述路由跟踪报文;
所述首端节点接收每个非首端节点返回的路由跟踪响应报文,并记录每个非首端节点返回的路由跟踪响应报文中包含的该非首端节点的地址信息和该非首端节点在所述MPLS网络中的节点位置顺序;
所述首端节点向当前与所述目的节点通信所使用的标签交换路径中的非首端节点发送签名报文,其中,所述签名报文中包括预设签名标识;
所述非首端节点每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到所述签名报文在该周期内的丢包率;
所述非首端节点每隔预设周期对接收到的签名报文和发送给下一跳节点的签名报文分别进行统计,得到所述签名报文在该周期内的丢包率的方式为:
根据每个周期内接收到的签名报文数量,得到该周期的签名报文接收速率,并根据每个周期内发送给下一跳节点的签名报文数量,得到该周期的签名报文发送速率;
根据所述签名报文接收速率和所述签名报文发送速率之间的差值得到签名报文的丢包率;
当任意一个非首端节点得到的丢包率大于设定丢包率时,该非首端节点向所述首端节点发送故障定位报文,所述故障定位报文包括所述签名报文在该周期内的丢包率和该非首端节点的地址信息;
所述首端节点对所述故障定位报文进行记录。
7.一种PE设备,其特征在于,所述PE设备包括机器可读存储介质及处理器,所述机器可读存储介质存储有机器可执行指令,所述处理器在执行所述机器可执行指令时,该PE设备作为所述非首端节点实现权利要求1-3中任意一项所述的故障节点定位方法,或者该PE设备作为所述首端节点实现权利要求4-5中任意一项所述的故障节点定位方法。
CN201910683392.9A 2019-07-26 2019-07-26 故障节点定位方法及pe设备 Active CN110290017B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910683392.9A CN110290017B (zh) 2019-07-26 2019-07-26 故障节点定位方法及pe设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910683392.9A CN110290017B (zh) 2019-07-26 2019-07-26 故障节点定位方法及pe设备

Publications (2)

Publication Number Publication Date
CN110290017A CN110290017A (zh) 2019-09-27
CN110290017B true CN110290017B (zh) 2022-06-10

Family

ID=68022623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910683392.9A Active CN110290017B (zh) 2019-07-26 2019-07-26 故障节点定位方法及pe设备

Country Status (1)

Country Link
CN (1) CN110290017B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110971938B (zh) * 2019-12-11 2022-03-01 聚好看科技股份有限公司 数据传输方法、装置及系统
CN114205221B (zh) * 2020-08-26 2024-01-02 北京华为数字技术有限公司 一种故障查询方法及装置
CN116760765A (zh) * 2023-08-10 2023-09-15 新华三技术有限公司 一种网络状态检测方法、装置、电子设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100583784C (zh) * 2005-03-30 2010-01-20 华为技术有限公司 在多协议标签交换网络中监测丢包率的方法
CN101958810B (zh) * 2010-10-27 2013-01-23 华为数字技术有限公司 用于中间节点自主实现故障定位的方法及系统
CN102546248B (zh) * 2011-12-30 2016-03-30 华为技术有限公司 多协议标签交换环境下精确定位故障位置的方法、装置及系统
CN106301821A (zh) * 2015-05-15 2017-01-04 中兴通讯股份有限公司 一种隧道丢包检测方法、装置及网络通信设备
CN106411625A (zh) * 2015-07-27 2017-02-15 中兴通讯股份有限公司 链路报文丢包测量方法、系统及目标节点、发起端节点

Also Published As

Publication number Publication date
CN110290017A (zh) 2019-09-27

Similar Documents

Publication Publication Date Title
US11570285B2 (en) Packet processing method, network node, and system
JP7479490B2 (ja) パケット処理方法及び装置、ネットワークデバイス並びに記憶媒体
EP3278503B1 (en) Method of packet marking for flow analytics
US8116200B2 (en) Source routing approach for network performance and availability measurement of specific paths
US7940695B1 (en) Failure detection for tunneled label-switched paths
CN101523354B (zh) 用于多段伪线的保护的装置和方法
US9491046B2 (en) System and method for switching traffic from sub-optimal primary P2MP to standby P2MP
US7463591B1 (en) Detecting data plane liveliness of a label-switched path
CN110290017B (zh) 故障节点定位方法及pe设备
US7120118B2 (en) Multi-path analysis for managing machine communications in a network
US20130089100A1 (en) Point-To-Point Based Multicast Label Distribution Protocol Local Protection Solution
WO2019057211A1 (zh) 信号劣化故障的处理方法、系统、装置和存储介质
US20140029443A1 (en) Interprovider virtual private network path identification
CN107347032A (zh) 报文转发方法及装置
EP3188413B1 (en) Method, apparatus, and system for implementing packet loss detection
WO2017000802A1 (zh) 一种业务故障定位方法及装置
US20120134365A1 (en) Method and network device for associated channel capability negotiation
CN101964743A (zh) 多协议标签交换路径aps保护管理方法、设备及系统
CN113615132A (zh) 快速泛洪拓扑保护
US11516122B2 (en) Validating active and inactive paths in a multiprotocol label switching (MPLS) network
CN111884872B (zh) 一种业务路径的性能测试方法和装置
CN112671652A (zh) 报文转发方法及装置
CN111224870B (zh) 一种SR-MPLS Anycast场景下的故障修复方法、设备和存储介质
CN111654440A (zh) 一种智能选路的方法、电子设备以及存储介质
CN111726287B (zh) 一种环网的保护方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant