CN101710896B - 一种链路质量探测方法和装置 - Google Patents

一种链路质量探测方法和装置 Download PDF

Info

Publication number
CN101710896B
CN101710896B CN200910224020A CN200910224020A CN101710896B CN 101710896 B CN101710896 B CN 101710896B CN 200910224020 A CN200910224020 A CN 200910224020A CN 200910224020 A CN200910224020 A CN 200910224020A CN 101710896 B CN101710896 B CN 101710896B
Authority
CN
China
Prior art keywords
message
node
probe message
quality
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200910224020A
Other languages
English (en)
Other versions
CN101710896A (zh
Inventor
兰巨龙
王滨
张建辉
周佳
王苏南
卜佑军
赵昕
曲晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PLA Information Engineering University
Original Assignee
PLA Information Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PLA Information Engineering University filed Critical PLA Information Engineering University
Priority to CN200910224020A priority Critical patent/CN101710896B/zh
Publication of CN101710896A publication Critical patent/CN101710896A/zh
Application granted granted Critical
Publication of CN101710896B publication Critical patent/CN101710896B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种链路质量探测方法和装置,该方法包括:节点周期性的广播探测消息;当节点收到相邻节点发送的探测消息后,并针对该探测消息向该相邻节点发送确认消息,并根据收到的探测消息的时间、编号与上一次收到的探测消息的时间和编号,评估反向链路质量;当节点收到相邻节点发送的确认消息后,将查看所述收到的确认消息的编号,并根据该编号对应的该节点发送的探测消息的时间,评估正向链路质量。该方法在探测链路质量时能够有效避免误报。

Description

一种链路质量探测方法和装置
技术领域
本发明属于通信技术领域,尤其涉及一种链路质量探测的方法和装置。
背景技术
随着互联网的迅速发展,人类通信对其依赖性日益增强,目前的互联网已经发展成为一个全球性的通信网络,过去许多在电信网和有线电视网中传输的业务也开始转向互联网。随着规模的不断扩大,互联网呈现出许多特点:(1)大量实时业务开始在互联网上传输,例如VoIP、在线聊天、视频点播、多用户在线游戏等,这些业务要求毫秒级的故障恢复时间;(2)业务复用程度越来越高,尤其是密集波分复用(dense wave-length division multiplexing,DWDM)技术的采用使单根光纤拥有T bits/s数量级的传输能力。这样,单根链路故障造成的后果非常严重;(3)大量关键性(mission-critical)业务,如电子商务,在互联网上传输,这些业务对网络可用性要求很高。上述新特征对传统互联网的故障恢复能力提出了挑战。与此同时,互联网是一个拓扑结构不断变化的动态网络,这是因为:(1)互联网是一个即联即用的网络,不断的有新的设备加入互联网或损坏的设备离开互联网,使其拓扑结构不断变化;(2)自然灾害(如地震等)、设备断电、自然老化等导致节点或链路出现硬件故障;(3)人为原因造成配置错误或软件漏洞,使网络设备运行异常;(4)对网络进行日常维护需要关闭某些设备;(5)网络攻击频繁发生,恶劣的网络攻击能够短时间内造成大量网络设备瘫痪。这些原因使互联网拓扑结构频繁变化,迫切需要通过故障恢复来保证其可靠性。鉴于互联网的规模,无法实现满足实时业务要求的快速故障恢复。
对于传统的动态路由协议,在最优路径发生链路失效时,路由协议通过路由协议的重新收敛实现重路由,如RIP可通过触发更新迅速通告不可达信息,OSPF和IS-IS通过迅速泛洪通告链路失效信息。但这两种机制都存在缺点:触发更新将在全网广播不可达信息,可能引发广播风暴;OSPF和IS-IS的通过泛洪向全网发送链路失效信息,虽然收敛速度较RIP有明显的提升但是仍不够理想。2001年A.Basu和J.G.Riecke在“OSPF的稳定性问题”(A.Basu and J.G.Riecke,“Stability issues in OSPF routing,”in Proc.ACMSigcomm,Aug.2001.)一文中研究得到结论:可通过减少HELLO间隔加快OSPF收敛,但是HELLO间隔过小会引发路由抖动,增加网络的不稳定性。
另外在IP路由收敛完成之前,数据包会因为目的节点不可达或路由产生环路等原因而被丢弃;为了满足网络稳定性要求,短暂性的、频繁发作的故障会被过滤掉而不被处理,然而,这些故障正是网络中最常见的故障。为了解决这个问题,人们提出了使用主动式故障恢复技术,所谓主动式故障恢复就是在故障产生之前就计算好替代路径,当故障发生时直接利用替代路径进行通信。和传统的主动式故障恢复不同,这里的主动式故障恢复不必为替代路径预留网络资源。使用主动式故障恢复能够在毫秒数量级的时间内完成故障恢复,而且这类方案特别适合解决短暂性的、频繁发作的故障,可以作为IP路由收敛完成之前进行故障恢复的一道防线。
目前主动式故障恢复主要存在两类技术路线:
(1)多径路由机制,所谓多径路由机制就是在源和目的节点对之间同时建立K(K大于等于2)条链路分离或者节点分离路径,然后将从源到目的节点的流量在多条路径上按照某种规则进行均衡划分;
(2)多下一跳路由机制,所谓多下一跳路由机制就是在每个节点都备份多个可达目的节点的备用节点,当最优下一跳出现故障时,启用备用节点,从而保证转发的连续性和网络的可用性。
但是这些技术的使用依赖于链路或节点故障检测的效率,要求加快故障检测,同时兼顾故障检测的准确性,实现故障的快速准确隔离。故障的检测速度和准确性是一对矛盾,为满足IP网络快速检测故障的目标,需要抑制IP路由收敛过程,由此带来的故障检测不准确的问题需要通过故障隔离来解决。
为了快速的检测链路故障,目前主要使用以下的几种方法:
1.互联网工程任务组(Internet Engineering Task Force,IETF)草案中提出的“双向故障检测协议”(Bidirectional Forwarding Detection,BFD)。
BFD是一种Hello包机制,当需要检测两个节点之间的链路状态时,一个节点在一定时间段内给另外一个节点发送一定数量的Hello检测包,接收端在该段时间内接收对应的Hello检测包,如果在该段时间内连续丢失一定数量的包,则认为节点之间的链路故障.如果节点支持,该种技术还可以从源端发出Hello包,接收端节点不进行检测,仅仅将这种包进行环回,再回送给源端节点,由节点A来自己检测包是否丢失,来决定链路是否可用。另外,两节点之间可以通过协商,仅仅在需要时,对链路进行检测。该技术存在以下缺点:
(1)BFD是一种通过判断是否连续丢预定个数的数据包,进而判断链路是否可用的机制。但是对于链路为可用、只是偶尔间断丢包的情况,则无法实现检测和上报。
(2)BFD是一种点到点检测的机制,当两个节点之间有多条可达条路径时,检测包只能走其中一条,因此产生误报。
(3)BFD无法对链路的质量进行感知和评估,仅仅能够判断某条路径/链路是否可达。
2.Ping和路由跟踪(Trace Route)技术
Ping是一种验证通道和设备是否正常的技术。源节点通过发送一个因特网控制包协议(ICMP)包到目的节点来探测他们之间的连通性,其中间的节点对该数据包进行转发。
Ping只能检侧出某两个节点之间的链路是否有故障,但无法对故障的发生点进行定位.因此,业界通过Trace Route技术对故障进行定位。TraceRoute技术利用数据包中的生命周期TTL(Time to Live)字段对包进行跳数的控制。TTL的取值表示该包可以被发送的跳数。源节点发出的初始检测包中TTL取值为1,第一个转发节点收到该包后该数据包丢弃,并返回一个ICMP超时包,此时源节点判断和第一个转发节点之间的链路正常,接着发送第二个数据包,其中的TTL取值为2,该数据包到达第二个转发时,节点将该数据包丢弃,并向源节点返回一个ICMP超时包,如果源节点收到该ICMP超时包,则认为第一个和第二个转发节点之间的链路无故障;依次类推,直到源节点收到目的节点返回的ICMP超时包,则源节点认为其和目的节点之间的链路无故障。一旦某段发生故障,则源节点将不能收到某个转发节点返回的包,由此可以判定节点之间的链路产生故障,且将故障点定位在无法收到返回包的节点。
在实际应用中,经常用Ping计数来判断链路通断,用Trace Route来定位故障点。该技术存在如下缺点:
(1)链路故障中,存在一种大流量但偶尔丢包的情况,即:链路中数据包的流量很大,但只丢失少量的数据包。要检测这种情况下的链路故障,需要快速地发送测试数据包,使链路中的数据包流量达到很大,由此才能检测出偶尔丢包的故障,但是由于Ping包需通过控制平面发送,控制平面较低的处理速度导致Ping包的发送速率不能太高;因此对于上述大流量但偶尔丢包的情况很难检测出来。
(2)Ping包检测的是双向链路,即要有来有回,当故障发生时,无法判断是去的链路故障,还是回来的链路故障;通过Trace Route来定位故障点时,也会有同样问题。对于一些应用,只有单向链路检测需求时,Ping无法完成这种检测,Trace Route也无法完成故障点定位。
(3)Ping和Trace Route包容易造成误报,Ping和Trace Route包为点到点的检测包,该包对于设备都是由起始点的控制层面发起,再通过起始点的数据平面转发到对端,即终点的数据平面,然后再送给终点的控制平面。当控制平面出现问题时,虽然数据平面没有问题,也同样会导致Ping失败,从而报告故障。但是,对于实际的业务链路,仅仅走数据平面,和控制平面无关,因此会造成故障误报。
另外,Ping由于是控制平面发起,而控制平面一般有比较繁重的计算和管理任务在运行,所以不可能长时间的快速发送ping检测包。而且控制平面的通道带宽为了防止对设备的攻击,一般都进行了限制,大流量的Ping包会被丢弃一部分,造成检测不准确。
(4)在被测链路中间有多条路可达时,两节点间的链路存在等值多路径(ECMP,Equal Cost Multi Path)时,Ping包只能走其中一条链路,存在检测的链路和实际数据走的链路不一致时,导致检测结果无效。
(5).Trace Route的发包速度相对Ping的发包速度较慢,可能Ping检测出有偶尔丢包,但是Trace route无法检测出来,从而无法进行定位;
(6)如果要使用快速的Trace Route,需要发送几倍的包才能检测到故障,对带宽耗费较大。
3.一种检测网络链路故障并定位故障的方法
在对网络链路检测时,在链路的源节点连续顺序发送携带序列号的检测包,检测包通过链路的中间节点转发到目的节点,所述各检测包的序列号符合预定顺序;链路的非源节点对所接收检测包的序列号进行顺序识别,以此判断接收检测包的状况,并对检测包的接收状况进行计数统计;链路上的节点向网管设备上报计数信息和对应链路的标识;网管设备根据各节点上报的计数信息判断节点接收检测包的状况,并以此判断对应的链路是否发生丢包故障,如果发生丢包,则进一步根据各个节点的计数信息的差别定位链路的故障点。
该技术存在如下缺点:
(1)该方法属于一种集中控制的方法,所有的节点接收到检测包后,需要将自己的对检测包的统计情况向网络中的网管设备上报,网关设备依据这些统计信息对链路故障进行定位,这种方法最大的问题就是所有的节点和网管的链路状况是否能够保证实时畅通,如果不能保证那么如何保证统计信息能够及时有效的传递,如果统计信息不能及时有效的传递,那么最后网管得到的结果意义不大;
(2)网管是整个网络故障检测的瓶颈,当网管出现故障将导致整个网络故障检测系统的无法正常工作;
(3)该方法最后仍然是由控制平面来做出最终的判断,起始点的数据平面转发到对端,即终点的数据平面,然后再送给终点的控制平面,然后控制平面再将数据传输到网管的。当控制平面出现问题时,虽然数据平面没有问题,也同样会导致传输失败,从而报告故障。但是,对于实际的业务链路,仅仅走数据平面,和控制平面无关,因此会造成故障误报。
(4)该方法仅仅是依据检测包的序号对链路故障进行判断,而正常的网络状态下也是存在包的乱序,该方法将包的乱序也判断为一种故障,所以会产生误报;
(5)很多情况下从源端到目的端会存在多条等值多路径,这些路径可能会存在交叉,那么当带有多个路径标签的相同数据包到达某交叉节点时,该节点如何判断这些对应路径标签的数据包发往哪些对应的节点,所以势必会产生误报;
(6)此种方法会大量的消耗节点的计算资源和网络的带宽,且这种方法不具有实时性,所以应用价值不大。
发明内容
有鉴于此,本发明的目的在于提供一种链路质量探测方法和装置,能够有效地避免链路故障误报。
为实现上述目的,本发明实施例提供一种链路质量探测方法,包括:
节点周期性的广播探测消息;
当节点收到相邻节点发送的探测消息后,并针对该探测消息向该相邻节点发送确认消息,并根据收到的探测消息的时间、编号与上一次收到的探测消息的时间和编号,评估反向链路质量;
当节点收到相邻节点发送的确认消息后,将查看所述收到的确认消息的编号,并根据该编号对应的该节点发送的探测消息的时间,评估正向链路质量。
优选地,所述评估正向链路质量包括:
当节点判断从发送探测消息到接收到该探测消息对应的确认消息的时间间隔小于或等于之前发出探测消息到接收到确认消息的时间间隔平均值时,则判定链路质量稳定。
优选地,所述正向链路评估质量还包括:当连续三个探测消息到接收到对应的确认消息都小于或等于之前发出的探测消息到接收到确认消息的时间间隔平均值,则减小所述节点发送探测消息的周期。
优选地,所述评估正向链路质量包括:
当节点判断从发送探测消息到接收到该探测消息对应的确认消息的时间间隔大于之前发出探测消息到接收到确认消息的时间间隔平均值时,则判定链路质量变差。
优选地,所述评估正向链路质量包括:
当连续三个探测消息到接收到对应的确认消息都大于之前发出的探测消息到接收到确认消息的时间间隔平均值,则增加所述节点发送探测消息的周期。
优选地,所述评估正向链路质量包括:
当节点发送的探测消息以后,在三个之前发出的探测消息到接收到确认消息的时间间隔平均值的时间间隔内均没有收到确认消息以后,将发送探测消息的时间间隔在上一个周期的基础上减半后,继续发送下一序号的探测消息,如果在继续的三个之前发出的探测消息到接收到确认消息的时间间隔平均值的时间间隔内仍没有收到对应的确认消息,则对该节点进行隔离,判定链路出现故障。
优选地,所述评估反向链路质量包括:
当收到相邻节点发送的探测消息后,将此收到的探测消息的序号预期的序号进行比较,如果高于预期的序号,则得知该节点没有收到相邻节点发送的探测消息,判定反向链路质量不稳定。
优选地,所述评估反向链路质量包括:
当收到相邻节点发送的探测消息后,如果该收到的探测消息的序号低于最后一次收到的消息的序号,则得知该接收到的探测消息发生过延期,判定反向链路质量不稳定。
优选地,所述评估反向链路质量包括:
当在节点未收到相邻节点通知减小探测消息发送间隔的前提下,如果该节点接收到该相邻节点的探测消息的周期变小,则判定反向链路质量不稳定。
优选地,所述方法还包括:在判定反向链路质量不稳定以后,相邻节点减少探测消息的发送周期,加速探测反向链路质量。
另一方面,本发明还提供一种链路质量探测装置,包括:
广播单元,用于周期性的广播探测消息;
探测消息接收单元,用于接收相邻节点发送的探测消息;
反向链路质量评估单元,用于针对该探测消息向该相邻节点发送确认消息,并根据收到的探测消息的时间、编号与上一次收到的探测消息的时间和编号,评估反向链路质量;
确认消息接收单元,用于接收相邻节点发送的确认消息;
正向链路质量评估单元,用于查看所述收到的确认消息的编号,并根据该编号对应的该节点发送的探测消息的时间,评估正向链路质量。
由上述技术方案可知,本发明提供的方法和装置在实现链路质量探测的过程中能够有效避免误报的发生。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种链路质量探测的方法流程图;
图2是本发明实施例一中正向链路质量的评估的流程图;
图3是本发明实施例一中对隔离节点的处理流程图;
图4是本发明实施例一中反向链路质量的评估的流程图;
图5是本发明实施例二中反向链路质量的评估的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种链路质量探测方法,该方法的核心思想在于:使用节点之间相互发送带序号的探测包和相应的应答包,通过记录探测包的序列号和对应的发送周期的变化,进行链路质量的双向探测和预测。每个节点在探测完自己的邻居后,将得到自己和邻居节点之间链路的质量,对于以多路径技术作为主动式故障恢复方法的网络而言,节点将这些检测/预测值进行泛洪,将该消息泛洪到整个网络,这样网络中所有的节点都知道了网络中的链路状况,在选择路径进行转发时可以避开哪些链路质量不好的路径;而对于以多下一跳技术做为主动式故障恢复方法的网络而言,节点不需要将这些值进行泛洪。
具体地,在本发明实施例中,每一个节点都要向其邻居节点按照一定的周期发送探测消息,例如Detect报文,并且对邻居发送过来的探测消息进行回复,发送确认消息,例如IHU(“I Heard You”)报文。节点根据所收到的探测消息的历史记录,来评估反向链路的链路质量。通过发送出去的探测消息的回复确认信息的记录来知道链路的正向的链路质量。
以下不妨以探测消息为Detect消息报文,确认消息为IHU消息报文为例,详细说明本发明实施例。
如图1所示,本发明实施例提供的链路质量探测方法包括如下步骤:
步骤S101:节点周期性地广播Detect消息,每个Detect消息都包括一个序号和发送时间间隔;
步骤S102:当节点收到相邻节点发送的Detect消息报文后,首先立刻向该邻居节点回复该消息的IHU消息,并根据当前收到的Detect消息的时间、编号和上一次收到的Detect消息的时间和编号,评估反向的链路质量;
步骤S103:当节点收到IHU报文后,将查看其携带的编号,并根据该编号对应的该节点发送的探测消息的时间,评估正向链路质量。
其中步骤S103中对于正向链路质量的评估可以采用如下方法:
请同时参见图2,ΔTi表示序号为i的Detect消息其从发送Detect消息到接收到该消息的IHU消息的时间间隔,而ΔTi表示前面收到的Detect消息及其IHU消息的时间间隔的平均值。Detect消息的发送时间间隔按照以下的规则进行相应的调整:
1)当ΔTi/ΔTi≥1时,说明该时间间隔低于平均值,说明链路质量比较稳定,此时当连续三个Detect的时间间隔均低于平均值时,相应的增加Detect消息的发送间隔周期;
2)当ΔTi/ΔTi<1时,说明该时间间隔高于平均值,说明链路质量不稳定或在变差,此时当连续三个Detect的时间间隔均高于平均值时,相应的减少Detect消息的发送间隔周期;
3)当发送的Detect在3ΔTi时间内,没有收到IHU消息,那么将发送Detect消息的时间间隔在上一个周期T的基础上减半后,继续发送下一序号的Detect消息,但是要求T/2>2ΔTi,如果仍然在3ΔTi时间内,没有收到对应的IHU消息,那么对该节点进行隔离,初步认为该链路出现故障或链路出现拥塞。
4)对于隔离的节点,将不再用作下一跳的数据的转发,以T/2的周期发送Detect消息进行探测,并根据以下的情况做相应的调整,详见图3:
a.当连续收到三个Detect消息的IHU消息,那么解除隔离,恢复正常;
b.如果隔离后连续6个Detect消息无应答,那么认为该节点故障,不再进行Detect消息的探测,在等待6个周期,如果期间未能收到节点发送过来的Detect消息,那么判定节点/链路故障,将该邻居节点删除;
c.如果在隔离后还能收到对方发送过来的Detect消息,或者还能收到IHU消息,那么继续以T/2的周期发送Detect消息进行探测,直到恢复正常或者判定节点故障为止。
其中,如图4所示,步骤S102中评估反向的链路质量具体包括:
当出现下述情况时说明反向链路质量不稳定,节点应该立刻减少Detect消息的发送间隔周期,加速探测链路质量:
情况1:当收到其它节点发送过来的一个Detect消息后,此消息中的序号和该邻居应该发送过来的序列号对比,如果其序号高于预期的序号(例如上一次收到的消息的序号加1),那么就说明其没有收到若干消息。
情况2:如果这个序号低于最近一次收到的消息的序号,说明这是一个延期到达的Detect消息。
情况3:Detect消息的发送周期在这个邻居在没有提前通知的情况下减小了发送Detect的间隔。
下面举例说明节点对链路质量的感知,假设节点A与邻居节点B进行互发hello消息。
情况1:节点A向节点B发送Hello报文,并且在最大容忍时间间隔内收到了节点B回送的对应序号的IHU报文
(1)节点A可以得到以下结论:
节点A可以判断链路A→B和B→A均是连通的;
依据ΔT和ΔT的比值可以对整个双向链路的质量进行评估。
(2)节点B可以依据收到的Detect报文中的序号和周期判断链路质量得到以下结论:
如果序号与预期不符,则链路A→B质量变差;
如果序号与实际的相符,但是周期变大,说明链路A→B和B→A其中之一或者同时变差;
如果序号与实际的相符,但是周期变小,说明链路A→B和B→A其中之一或者同时变好;
情况2:节点A向节点B发送Detect报文,并且在最大容忍时间间隔内未收到了节点B回送的IHU报文节点A可以得到以下结论:
说明链路A→B和B→A其中之一或者同时变差;
情况3:节点A向节点B发送Detect报文,并且在最大容忍时间间隔内未收到了节点B回送对应序号的IHU报文,但是收到了之前序号的IHU报文,节点A可以得到以下结论:
说明链路A→B和B→A其中之一或者同时变差,或者链路A→B发生故障;
情况4:节点A向节点B发送Detect报文,并且在最大容忍时间间隔内未收到了节点B回送的IHU报文,但是节点A可以收到节点B发送过来的Detect报文,此时节点A可以得到以下结论:
说明链路A→B发生故障。
情况5:节点A向节点B发送Detect报文,并且在最大容忍时间间隔内未收到了节点B回送的IHU报文,但是节点A也未收到节点B发送过来的Detect报文,此时节点A可以得到以下结论:
说明链路A→B和B→A同时发生故障或者链路B→A出现故障。
当节点对链路的质量进行评估后,可以得到对应链路质量的评估结果,我们假设得到的结果为以下三个:链路状况良好、链路不稳定和链路故障,当节点对自己和邻居节点之间的链路探测完后,将会得到一个评估结果,节点将对链路的评估结果泛洪发送给网络中的其它节点,其它节点收到评估结果后将在进行选路时避开那些不稳定的和发生故障的链路。
另外,本实施例中的Detect表文可以采用下表的格式:
其中序号表示该Detect消息的序号,该序号为一递增的mod 216的正整数;周期为发送该消息和上一次发送Detect消息的时间间隔周期。
而IHU报文可以采用下表的格式:
其中序号表示对应序号Detect消息的IHU。
本发明实施例提供的方法在实现链路质量探测的过程中避免误报的发生。
本发明另一实施例相应提供一种链路质量探测装置,如图5所示,该装置500包括:广播单元501,用于周期性的广播探测消息;探测消息接收单元502,用于接收相邻节点发送的探测消息;反向链路质量评估单元503,用于针对该探测消息向该相邻节点发送确认消息,并根据收到的探测消息的时间、编号与上一次收到的探测消息的时间和编号,评估反向链路质量;确认消息接收单元504,用于接收相邻节点发送的确认消息;正向链路质量评估单元505,用于查看所述收到的确认消息的编号,并根据该编号对应的该节点发送的探测消息的时间,评估正向链路质量。其中本实施例中的各个单元模块的工作过程与本发明前一实施例中提供的方法相同,这里不再赘述。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种链路质量探测方法,其特征在于,包括:
节点周期性的广播探测消息;
当节点收到相邻节点发送的探测消息后,并针对该探测消息向该相邻节点发送确认消息,并根据收到的探测消息的时间、编号与上一次收到的探测消息的时间和编号,评估反向链路质量;所述评估反向链路质量包括:当收到相邻节点发送的探测消息后,将此收到的探测消息的序号预期的序号进行比较,如果高于预期的序号,则得知该节点没有收到相邻节点发送的探测消息,判定反向链路质量不稳定;当收到相邻节点发送的探测消息后,如果该收到的探测消息的序号低于最后一次收到的消息的序号,则得知该接收到的探测消息发生过延期,判定反向链路质量不稳定;以及当在节点未收到相邻节点通知减小探测消息发送间隔的前提下,如果该节点接收到该相邻节点的探测消息的周期变小,则判定反向链路质量不稳定;
当节点收到相邻节点发送的确认消息后,将查看所述收到的确认消息的编号,并根据该编号对应的该节点发送的探测消息的时间,评估正向链路质量;所述评估正向链路质量包括:当时,判定链路质量稳定;当时,判定链路质量变差;以及,当节点发送的探测消息在
Figure FDA00001777923900013
时间内,未收到确认消息,则将发送探测消息的时间间隔在上一个周期T的基础上减半后,继续发送下一序号的探测消息,如果继续在
Figure FDA00001777923900014
时间内,仍未收到对应的确认消息,则对该节点进行隔离,判定链路出现故障;其中,ΔTi表示序号为i的探测消息其从发送探测消息到接收到该消息的确认消息的时间间隔,表示之前发出探测消息到接收到确认消息的时间间隔的平均值。
2.根据权利要求1所述的方法,其特征在于,当评估正向链路质量稳定后,还包括:
当连续三个探测消息到接收到对应的确认消息都小于或等于之前发出的探测消息到接收到确认消息的时间间隔平均值,则减小所述节点发送探测消息的周期。
3.根据权利要求1所述的方法,其特征在于,当评估正向链路质量变差后,还包括:
当连续三个探测消息到接收到对应的确认消息都大于之前发出的探测消息到接收到确认消息的时间间隔平均值,则增加所述节点发送探测消息的周期。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:在判定反向链路质量不稳定以后,相邻节点减少探测消息的发送周期,加速探测反向链路质量。
5.一种链路质量探测装置,其特征在于,包括:
广播单元,用于周期性的广播探测消息;
探测消息接收单元,用于接收相邻节点发送的探测消息;
反向链路质量评估单元,用于针对该探测消息向该相邻节点发送确认消息,并根据收到的探测消息的时间、编号与上一次收到的探测消息的时间和编号,评估反向链路质量;所述评估反向链路质量包括:当收到相邻节点发送的探测消息后,将此收到的探测消息的序号预期的序号进行比较,如果高于预期的序号,则得知该节点没有收到相邻节点发送的探测消息,判定反向链路质量不稳定;当收到相邻节点发送的探测消息后,如果该收到的探测消息的序号低于最后一次收到的消息的序号,则得知该接收到的探测消息发生过延期,判定反向链路质量不稳定;以及当在节点未收到相邻节点通知减小探测消息发送间隔的前提下,如果该节点接收到该相邻节点的探测消息的周期变小,则判定反向链路质量不稳定;
确认消息接收单元,用于接收相邻节点发送的确认消息;
正向链路质量评估单元,用于查看所述收到的确认消息的编号,并根据该编号对应的该节点发送的探测消息的时间,评估正向链路质量;所述评估正向链路质量包括:当
Figure FDA00001777923900021
时,判定链路质量稳定;当
Figure FDA00001777923900022
时,判定链路质量变差;以及,当节点发送的探测消息在
Figure FDA00001777923900023
时间内,未收到确认消息,则将发送探测消息的时间间隔在上一个周期T的基础上减半后,继续发送下一序号的探测消息,如果继续在
Figure FDA00001777923900031
时间内,仍未收到对应的确认消息,则对该节点进行隔离,判定链路出现故障;其中,ΔTi表示序号为i的探测消息其从发送探测消息到接收到该消息的确认消息的时间间隔,
Figure FDA00001777923900032
表示之前发出探测消息到接收到确认消息的时间间隔的平均值。
CN200910224020A 2009-11-30 2009-11-30 一种链路质量探测方法和装置 Expired - Fee Related CN101710896B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910224020A CN101710896B (zh) 2009-11-30 2009-11-30 一种链路质量探测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910224020A CN101710896B (zh) 2009-11-30 2009-11-30 一种链路质量探测方法和装置

Publications (2)

Publication Number Publication Date
CN101710896A CN101710896A (zh) 2010-05-19
CN101710896B true CN101710896B (zh) 2012-10-03

Family

ID=42403656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910224020A Expired - Fee Related CN101710896B (zh) 2009-11-30 2009-11-30 一种链路质量探测方法和装置

Country Status (1)

Country Link
CN (1) CN101710896B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104168211B (zh) * 2013-05-16 2017-07-21 腾讯科技(深圳)有限公司 一种网络流控方法、相关设备和系统
CN106789624A (zh) * 2017-04-11 2017-05-31 广东浪潮大数据研究有限公司 一种失效路由恢复方法
CN112787881A (zh) * 2019-11-11 2021-05-11 中兴通讯股份有限公司 通信链路检测方法、通信装置、存储介质
CN110838994B (zh) * 2019-11-14 2021-09-28 天津津航计算技术研究所 基于广播协议的冗余以太网的链路状态监控方法
CN112953785B (zh) * 2019-12-10 2022-03-01 烽火通信科技股份有限公司 用于多核处理器的通信设备的链路检测方法及系统
CN113225762B (zh) * 2020-02-04 2022-11-22 大唐移动通信设备有限公司 一种流控制传输协议链路的建立方法及装置
CN113453248B (zh) * 2020-03-27 2022-11-15 大唐移动通信设备有限公司 流控制传输协议链路的删除方法及装置
US11616694B2 (en) * 2020-04-23 2023-03-28 Hewlett Packard Enterprise Development Lp Unidirectional link detection misconfiguration auto-detection
CN111614562A (zh) * 2020-05-29 2020-09-01 深信服科技股份有限公司 多级组网的链路质量探测方法、装置、设备及存储介质
CN115086217A (zh) * 2021-03-10 2022-09-20 中国移动通信集团四川有限公司 链路质量的动态检测方法及系统
CN113595828B (zh) * 2021-07-28 2022-09-20 北京邮电大学 软件定义网络拓扑探测方法及系统
CN113595939B (zh) * 2021-07-28 2022-03-18 北京邮电大学 软件定义网络单向链路发现方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1442987A (zh) * 2001-10-05 2003-09-17 三星电子株式会社 用于大规模并行路由器的冗余机制协议
CN1925429A (zh) * 2006-09-30 2007-03-07 杭州华为三康技术有限公司 一种实现快速检测的方法和设备
CN101022457A (zh) * 2007-03-12 2007-08-22 北京交通大学 无线多跳网络音频、数据传输节点设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1442987A (zh) * 2001-10-05 2003-09-17 三星电子株式会社 用于大规模并行路由器的冗余机制协议
CN1925429A (zh) * 2006-09-30 2007-03-07 杭州华为三康技术有限公司 一种实现快速检测的方法和设备
CN101022457A (zh) * 2007-03-12 2007-08-22 北京交通大学 无线多跳网络音频、数据传输节点设备

Also Published As

Publication number Publication date
CN101710896A (zh) 2010-05-19

Similar Documents

Publication Publication Date Title
CN101710896B (zh) 一种链路质量探测方法和装置
CN101247288B (zh) 链路质量检测方法和链路质量检测设备
CN101729303B (zh) 测量网络性能参数的方法和装置
AU2006349311B2 (en) Resiliency schemes in communications networks
CN101132320B (zh) 检测接口故障的方法及网络节点设备
CN100512292C (zh) 一种实时恢复业务的装置及方法
KR101537633B1 (ko) 패킷 전송 네트워크의 보호 스위칭 장치 및 방법
CN102195822B (zh) 一种故障检测的方法和服务提供商边缘设备
CN101610535B (zh) 多链路直连场景下保证bfd会话稳定性的方法、系统及装置
US7660236B2 (en) System and method of multi-nodal APS control protocol signaling
CN101483592B (zh) 一种抑制双向转发检测链路振荡的方法及装置
WO2011100882A1 (zh) 链路检测方法、装置和系统
CN102215127A (zh) 一种信号劣化处理方法、装置及节点设备
EP3029883B1 (en) Network protection method and apparatus, next-ring node, and system
US20100296412A1 (en) Method, Device, and System for Establishing Label Switching Path in Fast Rerouting Switching
CN101330496A (zh) 一种检测以太网组播环路的方法及装置
CN101997747B (zh) 故障lsp信息通告的方法和装置
CN102487338A (zh) 根据网络抖动调整bfd发送间隔的方法及装置
WO2012124099A1 (ja) ルータ装置、及びルータ装置における回線切り替え方法
CN108683602A (zh) 一种数据中心网络负载均衡方法
Anand et al. Netreplay: a new network primitive
EP2573977A1 (en) Subnet protection method and device for transport multi-protocol label switching (tmpls) network
CN102223241B (zh) 网络变化通知方法和设备
Kim et al. Protection switching methods for point‐to‐multipoint connections in packet transport networks
US8553530B1 (en) Operating state control in redundancy protection systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121003

Termination date: 20161130

CF01 Termination of patent right due to non-payment of annual fee