CN101459549A - 链路故障处理方法及数据转发装置 - Google Patents

链路故障处理方法及数据转发装置 Download PDF

Info

Publication number
CN101459549A
CN101459549A CNA200710179574XA CN200710179574A CN101459549A CN 101459549 A CN101459549 A CN 101459549A CN A200710179574X A CNA200710179574X A CN A200710179574XA CN 200710179574 A CN200710179574 A CN 200710179574A CN 101459549 A CN101459549 A CN 101459549A
Authority
CN
China
Prior art keywords
link
module
forwarding device
data forwarding
neighborhood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200710179574XA
Other languages
English (en)
Other versions
CN101459549B (zh
Inventor
闫刚
詹葆荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN200710179574XA priority Critical patent/CN101459549B/zh
Priority to EP08867396A priority patent/EP2222023B1/en
Priority to PCT/CN2008/073512 priority patent/WO2009082923A1/zh
Publication of CN101459549A publication Critical patent/CN101459549A/zh
Priority to US12/815,184 priority patent/US8331222B2/en
Application granted granted Critical
Publication of CN101459549B publication Critical patent/CN101459549B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • H04L45/023Delayed use of routing table updates
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • H04L45/026Details of "hello" or keep-alive messages

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供了链路故障处理方法与数据转发装置。所述方法为检测到一链路发生故障,启动一定时器;发送故障检测会话掉线通知;所述定时器超时前接收到检测报文,保持与通过所述链路连接的邻居路由设备的邻居关系,生成路由信息,发送所述路由信息。同时本发明还提供了实施所述方法的数据转发装置。本发明实施例可以缩短上层应用模块的收敛时长,提高其收敛性能;并且,节省数据转发装置的CPU资源,提高其工作性能。

Description

链路故障处理方法及数据转发装置
技术领域
本发明涉及通信技术,尤其是链路故障处理方法及数据转发装置。
背景技术
随着网络的飞速普及以及网络应用的不断丰富,网络上的流量不断膨胀,网络规模也越来越大,其中的网络设备也越来越难以维护与管理。为此,要求网络设备具备的一个越来越重要的特征就是:要求网络设备具有故障检测功能,以便于相邻网络设备之间的路径在通信过程中的出现故障时,网络设备可以对该故障进行快速检测,较快地建立起替代故障通信通道的新通信通道,或者将通信由故障通信通道切换到其它链路进行。现有的一些网络设备,例如:同步数字体系(Synchronous Digital Hierarch,以下简称:SDH)设备、弹性分组环(Resilient Packet Ring,以下简称:RPR),已经具有上述的故障检测功能。但是,仍有很多硬件与软件不具有上述的故障检测功能,例如:转发引擎、互联网协议(Internet Protocol,以下简称:IP)数据报文转发设备的接口等,无法实现端到端的检测。
现有的网络系统中,一般采用慢Hello机制对网络设备之间的路径进行故障检测,在没有硬件设备的帮助下,故障检测所需时间较长,例如:采用开放最短路径优先(Open Shortest Path First,以下简称:OSPF)协议对网络设备之间的路径进行故障检测需要2秒左右的检测时间,利用中间系统到中间系统(Intermediate System-to-Intermediate System,以下简称:ISIS)协议对网络设备之间的路径进行故障检测需要1秒左右的检测时间,在数据传输速率较高时,例如:数据传输速率达到吉比特数量级时,较长的检测时间会导致大量数据丢失;并且,上述对路径进行故障检测需要网络设备节点支持路由协议,对于不支持路由协议的节点,无法进行链路状态检测。
为了提高网络设备之间路径的故障检测速度,缩短故障检测时间,现有技术在网络设备中增加了双向故障检测(Bidirectional Failure Detection,以下简称:BFD)模块,由该BFD模块来快速发送故障检测数据包,从而实现对链路故障的快速检测。通过BFD模块,能够对网络系统中或网络系统之间的任何类型的数据通道,例如:直接的物理链路、虚电路、隧道、多协议标记交换(Multi-Protocol Label Switch,以下简称:MPLS)的标记交换通道(LabelSwitched Path,以下简称:LSP)、多跳路由通道、以及非直接的通道等,进行故障检测。当BFD模块检测到链路故障时,通知网络设备中的上层应用模块,例如:内部网关协议(Interior Gateway Protocol,以下简称:IGP)模块、边界网关协议(Border Gateway Protocol,以下简称:BGP)模块、MPLS模块、组播模块等,由上层应用模块对根据检测到的故障进行相应的处理。
如图1所示,为现有技术利用BFD协议进行链路故障检测的流程图,以路由器A中的BFD模块进行故障检测为例,其包括如下步骤:
步骤101,路由器A中的BFD模块超时没有接收到路由器B中的BFD模块发送的BFD报文,认为路由器A与路由器B之间的链路出现故障;
步骤102,路由器A中的BFD模块向该路由器A中的IGP模块发送BFD报文掉线(BFD Session Down)的通知消息;
步骤103,路由器A中的IGP模块断开路由器A与路由器B之间的邻居关系,并据此生成表示路由器A周围网络拓扑结构的新链路状态信息,将网络拓扑变化的信息扩散(Flooding)到同一自治域内的所有其它路由器;同时,向路由器A中的BFD模块发送删除BFD会话的通知消息;
步骤104,路由器A中的BFD模块删除BFD会话。
在路由器A与路由器B之间的链路故障消除后,路由器A中的IGP模块依靠慢握手(Hello)机制重新发现邻居路由器B,并建立与路由器B之间的邻居关系,计算到路由器B的路由,并指示路由器A中的BFD模块重新创建BFD会话。
在实现发明的过程中发现,发明人发现现有技术中至少存在以下问题:
BFD模块检测到链路故障时,IGP模块断开与采用该故障链路的相应路由器之间的邻居关系,生成新链路状态信息将网络拓扑变化的信息扩散到同一自治域内的所有路由器,并通知BFD模块删除BFD报文,在故障链路恢复后,IGP模块再依靠自身的慢Hello机制重新发现邻居路由器建立与该邻居路由器之间的邻居关系,计算到该邻居路由器的路由,此时,若路由器之间的链路出现闪断情况,即:可以快速恢复的短暂链路失效,链路失效的时间小于Hello报文的发送周期,例如:该链路失效的时间为毫秒级,则由于IGP模块发送Hello报文的缺省时间比较长,一般为10秒,重新建立邻居关系所需的时间较长,此时,即使故障链路提前恢复,也需要等待IGP模块重新建立邻居关系,并进行路由计算后才可使用该链路,IGP模块的收敛时间较长,降低了故障链路恢复的收敛性能;并且,大量的路由计算耗费了路由器的大量中央处理器(Central Processing Unit,以下简称:CPU)资源,影响了路由器的工作性能。
发明内容
本发明实施例所要解决的技术问题是:缩短数据转发装置间链路闪断时的收敛时间,提高故障链路恢复的收敛性能,节约数据转发装置的CPU资源,提高数据转发装置的工作性能。
根据本发明的第一个方面,提供的一种链路故障处理方法包括以下步骤:
检测到一链路发生故障,启动一定时器;
发送故障检测会话掉线通知;
所述定时器超时前接收到检测报文,保持与通过所述链路连接的邻居路由设备的邻居关系,生成路由信息,发送所述路由信息。
根据本发明的第二个方面,提供的一种数据转发装置,包括:
计时模块,用于计时;
报文接收模块,用于接收检测报文,并与计时模块连接;
故障检测模块,用于利用所接收到的检测报文检测与该装置相连接的链路是否发生故障;
邻居关系管理单元,用于在检测到链路故障后在计时模块超时前通过所述链路接收到检测报文时,保持与通过该链路连接的邻居路由设备的邻居关系;
通知单元,用于发送链路故障检测会话掉线通知;
上层应用模块,用于生成表示所述数据转发装置周围网络拓扑结构的链路状态路由信息并发送所述路由信息。
本发明实施例在第一数据转发装置与第二数据转发装置之间的链路闪断时,保持第一数据转发装置与第二数据转发装置之间的邻居关系,这样,在故障链路恢复时,不需要等待数据转发装置依靠自身的慢Hello机制重新发现邻居数据转发装置并重新建立二者之间的邻居关系,计算二者之间的路由,与现有技术相比,缩短了上层应用模块的收殓时长,提高了其收殓性能;并且,由于不需要重新进行路由计算,节省了数据转发装置的CPU资源,提高了其工作性能。
附图说明
图1为现有技术利用BFD协议进行链路故障检测的流程图。
图2为本发明链路故障处理方法第一实施例的流程图。
图3为本发明链路故障处理方法第二实施例的流程图。
图4为本发明链路故障处理方法第三实施例的流程图。
图5为本发明数据转发装置第一实施例的结构示意图。
图6为本发明数据转发装置第二实施例的结构示意图。
图7为本发明数据转发装置第三实施例的结构示意图。
图8为本发明数据转发装置第四实施例的结构示意图。
图9为本发明数据转发装置第五实施例的结构示意图。
图10为本发明数据转发装置第六实施例的结构示意图。
具体实施方式
本发明实施例在第一数据转发装置与第二数据转发装置之间的链路闪断时,保持第一数据转发装置与第二数据转发装置之间的邻居关系,这样,在链路故障恢复后,不需要重新发现并建立第一数据转发装置与第二数据转发装置之间的邻居关系,从而缩短数据转发装置间链路闪断时的收敛时间,提高故障链路恢复的收敛性能,避免路由计算洪泛,节约数据转发装置的CPU资源,提高数据转发装置的工作性能。
本发明以下各实施例的数据转发装置可以是以IP为基础的数据转发设备,例如:路由器。数据转发装置中,故障检测模块可以是BFD模块或RPR环;上层应用模块可以是IGP模块、BGP模块、MPLS模块或组播模块。以下以路由器作为数据转发装置,以BFD模块作为故障检测模块,以IGP模块作为上层应用模块为例,对本发明的实施例进行说明。其中,不同数据转发装置中BFD模块之间发送的故障检测报文为BFD报文。
本发明实施例提供的一种链路故障处理方法,包括以下步骤:检测到一链路发生故障,启动一定时器;发送故障检测会话掉线通知;所述定时器超时前接收到检测报文,保持与通过所述链路连接的邻居路由设备的邻居关系,生成路由信息,发送所述路由信息。
如图2所示,为本发明链路故障处理方法第一实施例的流程图,其包括以下步骤:
步骤201,第一路由器中的第一BFD模块在预定的BFD会话接收时刻未接收到第二路由器发送的BFD会话时,获知第一路由器与第二路由器之间的链路发生故障,启动定时模块开始计时。
步骤202,第一BFD模块向第一路由器中的第一IGP模块发送BFD会话掉线的掉线通知消息。
步骤203,第一IGP模块保持第一路由器与第二路由器之间的邻居关系,生成表示第一路由器与第二路由器之间的链路断开后第一路由器周围网络拓扑结构的新链路状态报文,并将其发送到同一自治域内的其它路由器。
步骤204,第一BFD模块根据定时模块的计时信息,判断在距离未接收到第二路由器发送的BFD会话的预定的BFD会话接收时刻起的闪断时长内,是否接收到第二路由器发送的BFD报文,该闪断时长为定时器上预先设置的时长,在该时长范围内通过第一路由器与第二路由器之间的链路接收到第二路由器发送的BFD会话,表示链路发生闪断,超越该时长未接收到第二路由器发送的BFD会话,则表示链路发生非闪断故障,若在闪断时长内接收到第二路由器发送的BFD报文,执行步骤205,否则,执行步骤207。
具体地,上述闪断时长小于Hello报文的发送周期。所述时间通过定时器模块计时,在定时器超时前收到第二路由器发送的BFD报文则表示链路发生闪断故障,定时器超时,没有收到第二路由器发送的BFD报文则表示链路发生非闪断故障。
步骤205,第一BFD模块向第一IGP模块发送接收到第二路由器发送的BFD报文(BFD Session Up)的BFD恢复通知消息。
步骤206,第一IGP模块生成新链路状态报文,并将其扩散到第一路由器自治域内的其它路由器,该新链路状态报文表示第一路由器与第二路由器之间的链路恢复后第一路由器周围网络拓扑结构。
步骤207,第一BFD模块向第一IGP模块发送与第二路由器之间的链路出现故障的链路故障通知消息。
步骤208,第一IGP模块断开与第二路由器之间的邻居关系,生成表示第一路由器的新的邻居关系的邻居关系表并存储。
步骤209,第一IGP模块通知第一BFD模块删除该第一BFD模块生成的BFD报文。
步骤210,第一BFD模块删除该第一BFD模块生成的BFD报文。
若第一路由器与第二路由器之间的邻居关系断开,且BFD会话已被删除,则第一路由器与第二路由器之间的链路故障消除后,第二路由器无法重新向第一路由器中的第一BFD模块发送BFD会话,需要第一IGP模块依靠HELLO机制去重新发现第一路由器,建立与第一路由器之间的邻居关系,并对第一路由器与第二路由器之间的路由进行计算。
由于第一路由器与第二路由器之间的邻居关系保持,在第一路由器与第二路由器之间的链路故障消除后,第一路由器便可接收到第二路由器发送的BFD报文,而不需要等待IGP模块依靠自身的慢Hello机制重新发现邻居路由器并重新建立二者之间的邻居关系,计算二者之间的路由,缩短了IGP模块的收殓时长,提高了其收敛性能,并且,由于减少了路由计算,节省了路由器的CPU资源,提高了其工作性能。
如图3所示,为本发明链路故障处理方法第二实施例的流程图,其包括以下步骤:
步骤301,第一路由器中的第一BFD模块在预定的BFD会话接收时刻未接收到第二路由器发送的BFD会话时,获知第一路由器与第二路由器之间的链路发生故障,启动定时模块开始计时。
步骤302,第一BFD模块向第一路由器中的第一IGP模块发送BFD会话掉线的掉线通知消息。
步骤303,第一IGP模块保持第一路由器与第二路由器之间的邻居关系,生成表示第一路由器与第二路由器之间的链路断开后第一路由器周围网络拓扑结构的新链路状态报文,并将其扩散到同一自治域内的其它路由器。
步骤304,第一IGP模块根据定时模块的计时信息,判断在距离第一IGP模块发送的BFD会话掉线的掉线通知消息起的闪断时长内,是否接收到第一BFD模块发送的接收到第二路由器发送的BFD报文的BFD恢复通知消息,所述闪断时长为定时器上预先设置的时长,在该时长范围内接收到第二路由器发送的BFD会话,表示链路发生闪断,超越该时长未接收到第二路由器发送的BFD会话,则表示链路发生非闪断故障,若在闪断时长内接收到第二路由器发送的BFD报文,执行步骤305,否则,执行步骤306。
具体地,上述闪断时长可以小于Hello报文的发送周期。
步骤305,第一IGP模块接收到第一BFD模块发送的BFD恢复通知消息时,生成表示第一路由器与第二路由器之间的链路恢复后第一路由器周围网络拓扑结构的新链路状态报文,并扩散到第一路由器自治域内的其它路由器。
步骤306,第一IGP模块断开与第二路由器之间的邻居关系,生成表示第一路由器的新的邻居关系的邻居关系表并存储。
步骤307,第一IGP模块通知第一BFD模块删除该第一BFD模块生成的BFD报文。
步骤308,第一BFD模块删除该第一BFD模块生成的BFD报文。
如图4所示,为本发明链路故障处理方法第三实施例的流程图,其包括以下步骤:
步骤401,第一路由器中的第一BFD模块在预定的BFD会话接收时刻未接收到第二路由器发送的BFD会话时,获知第一路由器与第二路由器之间的链路发生故障,启动定时模块开始计时。
步骤402,第一BFD模块根据定时模块的计时信息,判断在距离未接收到第二路由器发送的BFD会话的预定的BFD会话接收时刻起的闪断时长内,是否接收到第二路由器发送的BFD报文,所述闪断时长为定时器上预先设置的时长,在该时长范围内接收到第二路由器发送的BFD会话,表示链路发生闪断,超越该时长未接收到第二路由器发送的BFD会话,则表示链路发生非闪断故障,若在闪断时长内接收到第二路由器发送的BFD报文,执行步骤403,否则,执行步骤404。
具体地,上述闪断时长小于Hello报文的发送周期。
步骤403,第一BFD模块不向第一IGP模块发送BFD会话掉线的掉线通知消息。
步骤404,第一BFD模块向第一IGP模块发送与第二路由器之间的链路出现故障的链路故障通知消息。
步骤405,第一IGP模块断开与第二路由器之间的邻居关系,生成表示第一路由器的新的邻居关系的邻居关系表并存储。
步骤406,第一IGP模块通知第一BFD模块删除该第一BFD模块生成的BFD报文。
步骤407,第一BFD模块删除该第一BFD模块生成的BFD报文。
本发明的上述实施例中,闪断时长可以动态变化,以适应突发事件引起的网络变化。通常情况下,一个正常运行的网络是稳定的,发生频繁的网络变化的概率很小,因此,可以统计在某一时间段内,路由器与相邻路由器之间的链路闪断的次数,如果网络拓扑变化比较频繁,则可以随着链路闪断次数的增加而增长闪断时长,避免占用路由器的大量CPU资源。例如:可以将第一次链路闪断的闪断时长设置的较短,例如:毫秒级。
如图5所示,为本发明数据转发装置第一实施例的结构示意图,该实施例可以实现如图2与所示实施例的流程,该实施例的数据转发装置包括:
计时模块,用于计时;
报文接收模块,与计时模块连接,用于接收检测报文;
第一故障检测模块,用于利用检测报文检测与该装置相连接的链路是否发生故障;用于对数据转发装置之间的链路进行故障检测,根据计时模块的计时信息,在数据转发装置与相邻数据转发装置之间的链路闪断时,相应生成故障检测报文掉线的掉线通知消息或故障检测报文恢复通知消息,在数据转发装置与相邻数据转发装置之间的链路发生非闪断故障时,生成链路故障通知消息;
第一上层应用模块,与第一故障检测模块连接,用于根据第一故障检测模块的链路故障检测结果,对数据转发装置之间进行邻居关系管理,根据第一故障检测模块发送的通知消息,在链路闪断时,保持数据转发装置与相邻数据转发装置之间的邻居关系,生成表示数据转发装置周围网络拓扑结构的新链路状态信息并扩散到同一自治域内的相邻数据转发装置;在链路发生非闪断故障时,断开数据转发装置与相邻数据转发装置之间的邻居关系,并指示第一故障检测模块删除其产生的故障检测报文。
再参见图5,其中,第一故障检测模块可以包括:
报文生成单元,用于生成故障检测报文;
报文发送单元,与报文生成单元连接,用于向相邻数据转发装置发送报文生成单元生成的故障检测报文,以及接收相邻数据转发装置发送的故障检测报文;
第一通知单元,分别与计时模块、报文接收模块及第一上层应用模块连接,用于根据计时模块的计时信息,在接收模块在预定报文接收时刻未接收到相邻数据转发装置发送的故障检测报文时,生成并向第一上层应用模块发送故障检测报文掉线的掉线通知消息,并启动计时模块开始计时,在报文接收模块距离预定报文接收时刻的闪断时长内接收到相邻数据转发装置发送的故障检测报文时,生成并向第一上层应用模块发送故障检测报文恢复通知消息,在报文接收模块距离预定报文接收时刻的闪断时长内未接收到相邻数据转发装置发送的故障检测报文时,生成并向第一上层应用模块发送链路故障通知消息;
删除单元,分别与第一上层应用模块及报文生成单元连接,用于根据第一上层应用模块的指示,删除报文生成单元生成的故障检测报文。
进一步地,在上述各实施例中,第一上层应用模块可以包括:
链路状态管理单元,用于在数据转发装置与相邻数据转发装置之间的链路闪断时,生成表示数据转发装置周围网络拓扑结构的新链路状态信息,并扩散到同一自治域内的相邻数据转发装置;
第一邻居关系管理单元,用于在数据转发装置与相邻数据转发装置之间的链路闪断时,保持数据转发装置与相邻数据转发装置之间的邻居关系,在数据转发装置与相邻数据转发装置之间的链路发生非闪断故障时,断开数据转发装置与相邻数据转发装置之间的邻居关系;
删除指示单元,与第一故障检测模块或其中的删除单元连接,用于在数据转发装置与相邻数据转发装置之间的链路发生非闪断故障时,指示第一故障检测模块或其中的删除单元删除其生成的故障检测报文;
第一调度单元,分别与链路状态管理单元、第一邻居关系管理单元、删除指示单元与第一故障检测模块,或第一故障检测模块中的删除单元连接,用于根据第一故障检测模块发送的通知消息,在数据转发装置与相邻数据转发装置之间的链路闪断时,指示链路状态管理单元生成新链路状态信息并扩散到同一自治域内的相邻数据转发装置,在链路发生非闪断故障时,指示邻居关系管理模块断开数据转发装置与相邻数据转发装置之间的邻居关系,并指示删除指示模块向第一故障检测模块发送删除故障检测报文的删除指示信息。
再参见图5,上述实施例中,第一上层应用模块还可以包括存储单元,与第一邻居关系管理单元连接,用于存储数据转发装置的邻居关系表。
另外,在上述实施例中,数据转发装置还可以包括:统计模块与设置模块。其中,统计模块与第一故障检测模块或其中的报文收发单元连接,用于统计在某一时间段内,数据转发装置与其它数据转发装置之间的链路闪断的次数;设置模块,分别与统计模块及计时模块连接,用于根据统计模块的统计结果,在次数增加时,将计时模块上设置的用于表示数据转发装置与其它数据转发装置之间的链路闪断的闪断时长增长。如图6所示,为本发明数据转发装置第二实施例的结构示意图。
如图7所示,为本发明数据转发装置第三实施例的结构示意图,该实施例可以实现如图3所示实施例的流程,该实施例的数据转发装置包括:
计时模块,用于计时;
第二故障检测模块,与计时模块连接,用于对数据转发装置之间的链路进行故障检测,根据计时模块的计时信息,在数据转发装置与相邻数据转发装置之间的链路闪断时,相应生成故障检测报文掉线的掉线通知消息或故障检测报文恢复通知消息;
第二上层应用模块,分别与计时模块及第二故障检测模块连接,用于根据第二故障检测模块的链路故障检测结果,对数据转发装置之间进行邻居关系管理,接收到第二故障检测模块发送的掉线通知消息时,启动计时模块开始计时,保持数据转发装置与相邻数据转发装置之间的邻居关系,生成表示数据转发装置周围网络拓扑结构的新链路状态信息并扩散到同一自治域内的相邻数据转发装置,在距离接收到第二故障检测模块发送的掉线通知消息起的闪断时长未接收到第二故障检测模块发送的故障检测报文恢复通知消息时,断开数据转发装置与相邻数据转发装置之间的邻居关系,并指示故障检测模块删除产生的故障检测报文。
再参见图7,其中的第二故障检测模块可以包括:
报文生成单元,用于生成故障检测报文;
报文收发单元,与报文生成单元连接,用于向相邻数据转发装置发送报文生成单元生成的故障检测报文,以及接收相邻数据转发装置发送的故障检测报文;
第二通知单元,分别与报文收发单元、计时模块及第二上层应用模块连接,用于根据计时模块的计时信息,在报文收发单元在预定报文接收时刻未接收到相邻数据转发装置发送的故障检测报文时,生成并向第二上层应用模块发送故障检测报文掉线的掉线通知消息,并启动计时模块开始计时,在报文收发单元距离预定报文接收时刻的闪断时长内接收到相邻数据转发装置发送的故障检测报文时,生成并向第二上层应用模块发送故障检测报文恢复通知消息;
删除单元,分别与第二上层应用模块及报文生成单元连接,用于根据第二上层应用模块的指示,删除报文生成单元生成的故障检测报文。
进一步地,图7所述实施例中的第二上层应用模块可以包括:
链路状态管理单元,用于在数据转发装置与相邻数据转发装置之间的链路闪断时,生成表示数据转发装置周围网络拓扑结构的新链路状态信息,并扩散到同一自治域内的相邻数据转发装置;
第一邻居关系管理单元,用于在数据转发装置与相邻数据转发装置之间的链路闪断时,保持数据转发装置与相邻数据转发装置之间的邻居关系,在数据转发装置与相邻数据转发装置之间的链路发生非闪断故障时,断开数据转发装置与相邻数据转发装置之间的邻居关系;
删除指示单元,与第二故障检测模块或其中的删除单元连接,用于在数据转发装置与相邻数据转发装置之间的链路发生非闪断故障时,指示第二故障检测模块或其中的删除单元删除其生成的故障检测报文;
第二调度单元,分别与链路状态管理单元、第一邻居关系管理单元、删除指示单元、计时模块及第二故障检测模块,或第二故障检测模块中的删除单元连接,用于根据第二故障检测模块发送的通知消息,在数据转发装置与相邻数据转发装置之间的链路闪断时,启动计时模块开始计时,指示链路状态管理单元生成新链路状态信息并扩散到同一自治域内的相邻数据转发装置,在距离接收到第二故障检测模块发送的掉线通知消息起的闪断时长内未接收到第二故障检测模块发送的故障检测报文恢复通知消息时,指示邻居关系管理模块断开数据转发装置与相邻数据转发装置之间的邻居关系,并指示删除指示模块向第二故障检测模块发送删除故障检测报文的删除指示信息。
再参见图7,第二上层应用模块还可以包括存储单元,与第一邻居关系管理单元连接,用于存储数据转发装置的邻居关系表。
另外,在上述实施例中,数据转发装置还可以包括统计模块与设置模块。其中,统计模块与第二故障检测模块或其中的报文收发单元连接,用于统计在某一时间段内,数据转发装置与其它数据转发装置之间的链路闪断的次数;设置模块,分别与统计模块及计时模块连接,用于根据统计模块的统计结果,在次数增加时,将计时模块上设置的用于表示数据转发装置与其它数据转发装置之间的链路闪断的闪断时长增长。如图8所示,为本发明数据转发装置第四实施例的结构示意图。
如图9所示,为本发明数据转发装置第五实施例的结构示意图,该实施例可以实现如图4所示实施例的流程,该实施例的数据转发装置包括
计时模块,用于计时;
第三故障检测模块,与计时模块连接,用于对数据转发装置之间的链路进行故障检测,根据计时模块的计时信息,在数据转发装置与相邻数据转发装置之间的链路发生非闪断故障时,生成链路故障通知消息;
第三上层应用模块,与第三故障检测模块连接,用于在接收到第三故障检测模块发送的链路故障通知消息时,断开数据转发装置与相邻数据转发装置之间的邻居关系,并指示第三故障检测模块删除生成的故障检测报文。
再参见图9,第三故障检测模块可以包括:
报文生成单元,用于生成故障检测报文;
报文收发单元,与报文生成单元连接,用于向相邻数据转发装置发送报文生成单元生成的故障检测报文,以及接收相邻数据转发装置发送的故障检测报文;
第三通知单元,分别与计时模块、报文收发单元与第三上层应用模块连接,用于根据计时模块的计时信息,当报文收发单元在未接收到相邻数据转发装置发送的故障检测报文的预定报文接收时刻起的闪断时长内,未接收到相邻数据转发装置发送的故障检测报文时,生成并向第三上层应用模块发送链路故障通知消息;
删除单元,分别与第三上层应用模块及报文生成单元连接,用于根据第三上层应用模块的指示,删除报文生成单元生成的故障检测报文。
进一步地,第三上层应用模块可以包括:
第二邻居关系管理单元,用于在接收到报文收发单元发送的链路故障通知消息时,断开数据转发装置与相邻数据转发装置之间的邻居关系;
删除指示单元,分别与第二邻居关系管理单元及第三故障检测模块,或第三故障检测模块中的删除单元连接,用于在第二邻居关系管理单元断开数据转发装置与相邻数据转发装置之间的邻居关系后,指示第三故障检测模块或其中的删除单元删除该第三故障检测模块生成的故障检测报文。
再参见图9,第三上层应用模块还可以包括存储单元,与第二邻居关系管理单元连接,用于存储数据转发装置的邻居关系表。
另外,在上述实施例中,数据转发装置还可以包括统计模块与设置模块。其中,统计模块与第三故障检测模块或其中的报文收发单元连接,用于统计在某一时间段内,数据转发装置与其它数据转发装置之间的链路闪断的次数;设置模块,分别与统计模块及计时模块连接,用于根据统计模块的统计结果,在次数增加时,将计时模块上设置的用于表示数据转发装置与其它数据转发装置之间的链路闪断的闪断时长增长。如图10所示,为本发明数据转发装置第六实施例的结构示意图。
本发明实施例在第一数据转发装置与第二数据转发装置之间的链路闪断时,保持第一数据转发装置与第二数据转发装置之间的邻居关系,这样,在故障链路恢复时,不需要等待数据转发装置依靠自身的慢Hello机制重新发现邻居数据转发装置并重新建立二者之间的邻居关系,计算二者之间的路由,与现有技术相比,缩短了上层应用模块的收殓时长,提高了其收殓性能;并且,由于不需要重新进行路由计算,节省了数据转发装置的CPU资源,提高了其工作性能;
另外,闪断时长可以动态变化,随着链路闪断次数的增加而增长闪断时长,级可以适应突发事件引起的网络变化,也可以避免占用路由器的大量CPU资源。
最后所应说明的是:以上实施例仅用以说明本发明的技术方案,而非对本发明作限制性理解。尽管参照上述较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这种修改或者等同替换并不脱离本发明技术方案的精神和范围。

Claims (11)

1、一种链路故障处理方法,其特征在于,包括以下步骤:
检测到一链路发生故障,启动一定时器;
发送故障检测会话掉线通知;
所述定时器超时前接收到检测报文,保持与通过所述链路连接的邻居路由设备的邻居关系,生成路由信息,发送所述路由信息。
2、根据权利要求1所述的链路故障处理方法,其特征在于,所述方法进一步包括:
在所述定时器超时前由所述链路接收到故障检测报文,发送链路恢复通知信息。
3、根据权利要求1所述的链路故障处理方法,其特征在于,所述方法进一步包括:
所述定时器超时,断开与通过所述链路连接的邻居路由设备的邻居关系,建立新的邻居关系,生成邻居关系表。
4、根据权利要求1所述的链路故障处理方法,其特征在于,所述保持与邻居路由设备的邻居关系并生成新的路由信息,发送所述路由信息具体为:
生成表示所述链路断开后与通过所述链路连接的路由器周围网络拓扑结构的链路状态报文,并将其发送到同一自治域内的其它路由器。
5、根据权利要求1所述的链路故障处理方法,其特征在于,所述检测到一链路发生故障中的检测方法为双向故障检测。
6、根据权利要求1所述的链路故障处理方法,其特征在于,预置所述定时器,所述定时器超时时间时长小于握手报文的发送周期。
7、一种数据转发装置,其特征在于,包括:
计时模块,用于计时;
报文接收模块,用于接收检测报文,并与计时模块连接;
故障检测模块,用于利用所接收到的检测报文检测与该装置相连接的链路是否发生故障;
邻居关系管理单元,用于在检测到链路故障后在计时模块超时前通过所述链路接收到检测报文时,保持与通过该链路连接的邻居路由设备的邻居关系;
通知单元,用于发送链路故障检测会话掉线通知;
上层应用模块,用于生成表示所述数据转发装置周围网络拓扑结构的链路状态路由信息并发送所述路由信息。
8、根据权利要求7所述的数据转发装置,其特征在于,所述故障检测模块包括:
报文生成单元,用于生成故障检测报文;
报文收发单元,用于向相邻数据转发装置发送所述报文生成单元生成的故障检测报文,以及接收所述相邻数据转发装置发送的故障检测报文;
删除单元,用于删除所述报文生成单元生成的故障检测报文。
9、根据权利要求7或8所述的数据转发装置,其特征在于,所述第一上层应用模块包括:
链路状态管理单元,用于在计时模块超时前由所述链路接收到检测报文时,生成表示所述数据转发装置周围网络拓扑结构的新链路状态信息,并扩散到同一自治域内的相邻数据转发装置;
第一邻居关系管理单元,在计时模块超时前由所述链路接收到检测报文时,保持所述数据转发装置与所述相邻数据转发装置之间的邻居关系,在所述数据转发装置与所述相邻数据转发装置之间的链路发生非闪断故障时,断开所述数据转发装置与所述相邻数据转发装置之间的邻居关系。
10、根据权利要求7所述的数据转发装置,其特征在于,所述上层应用模块还包括:
存储单元,用于存储所述数据转发装置的邻居关系表。
11、根据权利要求9所述的数据转发装置,其特征在于,还包括:
统计模块,用于统计在某一时间段内,所述数据转发装置与所述相邻数据转发装置之间的链路闪断故障的次数;
设置模块,用于根据所述统计模块的统计结果,在所述次数增加时,增加所述计时模块上超时时长。
CN200710179574XA 2007-12-14 2007-12-14 链路故障处理方法及数据转发装置 Active CN101459549B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN200710179574XA CN101459549B (zh) 2007-12-14 2007-12-14 链路故障处理方法及数据转发装置
EP08867396A EP2222023B1 (en) 2007-12-14 2008-12-15 Link fault processing method and data forwarding device
PCT/CN2008/073512 WO2009082923A1 (fr) 2007-12-14 2008-12-15 Procédé de traitement de défaut de liaison et dispositif de transfert de données
US12/815,184 US8331222B2 (en) 2007-12-14 2010-06-14 Link fault handling method and data forwarding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200710179574XA CN101459549B (zh) 2007-12-14 2007-12-14 链路故障处理方法及数据转发装置

Publications (2)

Publication Number Publication Date
CN101459549A true CN101459549A (zh) 2009-06-17
CN101459549B CN101459549B (zh) 2011-09-21

Family

ID=40770192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200710179574XA Active CN101459549B (zh) 2007-12-14 2007-12-14 链路故障处理方法及数据转发装置

Country Status (4)

Country Link
US (1) US8331222B2 (zh)
EP (1) EP2222023B1 (zh)
CN (1) CN101459549B (zh)
WO (1) WO2009082923A1 (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101997723A (zh) * 2010-11-18 2011-03-30 中兴通讯股份有限公司 一种业务切换方法及装置
CN102355408A (zh) * 2011-08-16 2012-02-15 杭州华三通信技术有限公司 一种通信设备的链路状态变更控制方法和装置
WO2011157111A3 (zh) * 2011-05-30 2012-05-03 华为技术有限公司 确定故障指示状态的方法、节点和系统
WO2012119522A1 (zh) * 2011-03-10 2012-09-13 华为技术有限公司 链路故障处理方法及装置
WO2012151834A1 (zh) * 2011-07-01 2012-11-15 中兴通讯股份有限公司 一种sctp偶联闪断时ue的处理方法及系统
CN103023772A (zh) * 2012-09-14 2013-04-03 中兴国通通讯装备技术(北京)有限公司 支持多Flex通道的软终端及其自适应动态接入方法
CN103125099A (zh) * 2010-10-28 2013-05-29 日本电气株式会社 传输设备、传输系统和故障通知方法
CN103401714A (zh) * 2013-08-01 2013-11-20 广东威创视讯科技股份有限公司 一种网络连接状态检测方法及客户端
CN103905318A (zh) * 2014-04-04 2014-07-02 华为技术有限公司 发送、加载转发表项的方法、控制器和转发节点
CN104980295A (zh) * 2014-04-09 2015-10-14 中兴通讯股份有限公司 防止网络节点老化的方法、装置及系统
CN105659562A (zh) * 2013-07-11 2016-06-08 格罗方德股份有限公司 利用簇中并行性进行容障处理
CN106330606A (zh) * 2016-08-23 2017-01-11 杭州迪普科技有限公司 一种检测链路单通的方法和装置
CN106487696A (zh) * 2015-08-28 2017-03-08 中兴通讯股份有限公司 链路故障检测方法及装置
CN108632108A (zh) * 2018-01-11 2018-10-09 西门子电力自动化有限公司 基于轮询协议的监控方法、装置与及可读存储介质
CN110166325A (zh) * 2019-06-12 2019-08-23 首钢京唐钢铁联合有限责任公司 一种通信网络故障的确定方法及装置
CN110278094A (zh) * 2018-03-13 2019-09-24 中兴通讯股份有限公司 链路恢复方法及装置、系统、存储介质、电子装置
WO2019228385A1 (zh) * 2018-06-01 2019-12-05 华为技术有限公司 管理虚拟专用网络的方法和设备
CN111654434A (zh) * 2020-04-08 2020-09-11 新华三信息安全技术有限公司 一种流量切换的方法、装置以及转发设备

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101778014B (zh) * 2010-01-12 2012-04-04 华为技术有限公司 分析业务质量劣化的方法及装置
US8804489B2 (en) * 2010-09-29 2014-08-12 Telefonaktiebolaget L M Ericsson (Publ) Fast flooding based fast convergence to recover from network failures
US9215136B2 (en) * 2013-06-27 2015-12-15 Cisco Technology, Inc. Aggregated delivery of tunnel fault messages on common ethernet segments
CN105592490B (zh) * 2015-08-31 2019-04-09 新华三技术有限公司 一种路由切换方法及设备
US9942134B2 (en) 2015-09-30 2018-04-10 International Business Machines Corporation Holding of a link in an optical interface by a lower level processor until authorization is received from an upper level processor
CN107426030B (zh) * 2017-08-09 2020-11-06 杭州迪普科技股份有限公司 一种链路故障提醒方法及装置
CN113438693A (zh) 2017-11-17 2021-09-24 华为技术有限公司 信号传输的方法和装置
CN111049926B (zh) * 2019-12-24 2022-09-20 浙江中控技术股份有限公司 一种数据传输方法及相关设备
CN112671649A (zh) * 2020-12-22 2021-04-16 广州技象科技有限公司 基于物联网传输故障检测的路径选择方法及装置
CN113472642B (zh) * 2021-06-10 2023-06-13 新华三信息安全技术有限公司 一种保护切换方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5260945A (en) * 1989-06-22 1993-11-09 Digital Equipment Corporation Intermittent component failure manager and method for minimizing disruption of distributed computer system
CN1319320C (zh) * 2002-10-22 2007-05-30 华为技术有限公司 一种实现网络中链路状态穿通的方法
US7020814B2 (en) * 2003-03-18 2006-03-28 Cisco Technology, Inc. Method and system for emulating a Fiber Channel link over a SONET/SDH path
DE602004025280D1 (de) * 2003-12-17 2010-03-11 Nec Corp Netzwerk, routereinrichtung, routenaktualisierungs-unterdrückungsverfahren dafür und programm dafür
CN100426896C (zh) * 2004-03-16 2008-10-15 华为技术有限公司 D通路上的链路接入规程断链判断方法
EP1816801A1 (en) * 2006-02-03 2007-08-08 BRITISH TELECOMMUNICATIONS public limited company Method of operating a network
CN100433660C (zh) * 2006-09-30 2008-11-12 杭州华三通信技术有限公司 一种实现快速检测的方法和设备
US8488444B2 (en) * 2007-07-03 2013-07-16 Cisco Technology, Inc. Fast remote failure notification

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103125099A (zh) * 2010-10-28 2013-05-29 日本电气株式会社 传输设备、传输系统和故障通知方法
CN103125099B (zh) * 2010-10-28 2016-03-16 日本电气株式会社 传输设备、传输系统和故障通知方法
US9032242B2 (en) 2010-10-28 2015-05-12 Nec Corporation Transmission device, transmission system, and fault notification method
CN101997723A (zh) * 2010-11-18 2011-03-30 中兴通讯股份有限公司 一种业务切换方法及装置
WO2012119522A1 (zh) * 2011-03-10 2012-09-13 华为技术有限公司 链路故障处理方法及装置
US9471408B2 (en) 2011-05-30 2016-10-18 Huawei Technologies Co., Ltd. Method, node and system for determining fault indication state
WO2011157111A3 (zh) * 2011-05-30 2012-05-03 华为技术有限公司 确定故障指示状态的方法、节点和系统
CN102858024A (zh) * 2011-07-01 2013-01-02 中兴通讯股份有限公司 一种sctp偶联闪断时ue的处理方法及系统
WO2012151834A1 (zh) * 2011-07-01 2012-11-15 中兴通讯股份有限公司 一种sctp偶联闪断时ue的处理方法及系统
CN102355408A (zh) * 2011-08-16 2012-02-15 杭州华三通信技术有限公司 一种通信设备的链路状态变更控制方法和装置
CN103023772B (zh) * 2012-09-14 2015-12-09 中兴国通通讯装备技术(北京)有限公司 支持多Flex通道的软终端及其自适应动态接入方法
CN103023772A (zh) * 2012-09-14 2013-04-03 中兴国通通讯装备技术(北京)有限公司 支持多Flex通道的软终端及其自适应动态接入方法
CN105659562A (zh) * 2013-07-11 2016-06-08 格罗方德股份有限公司 利用簇中并行性进行容障处理
CN105659562B (zh) * 2013-07-11 2019-02-22 格罗方德股份有限公司 一种用于容障的方法和数据处理系统和包括用于容障的计算机可用代码的存储设备
CN103401714A (zh) * 2013-08-01 2013-11-20 广东威创视讯科技股份有限公司 一种网络连接状态检测方法及客户端
CN103401714B (zh) * 2013-08-01 2017-02-08 广东威创视讯科技股份有限公司 一种网络连接状态检测方法及客户端
CN103905318A (zh) * 2014-04-04 2014-07-02 华为技术有限公司 发送、加载转发表项的方法、控制器和转发节点
CN103905318B (zh) * 2014-04-04 2017-12-15 华为技术有限公司 发送、加载转发表项的方法、控制器和转发节点
CN104980295A (zh) * 2014-04-09 2015-10-14 中兴通讯股份有限公司 防止网络节点老化的方法、装置及系统
CN106487696A (zh) * 2015-08-28 2017-03-08 中兴通讯股份有限公司 链路故障检测方法及装置
WO2017036165A1 (zh) * 2015-08-28 2017-03-09 中兴通讯股份有限公司 链路故障检测方法及装置
CN106487696B (zh) * 2015-08-28 2019-07-23 中兴通讯股份有限公司 链路故障检测方法及装置
CN106330606A (zh) * 2016-08-23 2017-01-11 杭州迪普科技有限公司 一种检测链路单通的方法和装置
CN106330606B (zh) * 2016-08-23 2019-09-06 杭州迪普科技股份有限公司 一种检测链路单通的方法和装置
CN108632108A (zh) * 2018-01-11 2018-10-09 西门子电力自动化有限公司 基于轮询协议的监控方法、装置与及可读存储介质
CN110278094A (zh) * 2018-03-13 2019-09-24 中兴通讯股份有限公司 链路恢复方法及装置、系统、存储介质、电子装置
WO2019228385A1 (zh) * 2018-06-01 2019-12-05 华为技术有限公司 管理虚拟专用网络的方法和设备
CN110557317A (zh) * 2018-06-01 2019-12-10 华为技术有限公司 管理虚拟专用网络的方法和设备
US11799688B2 (en) 2018-06-01 2023-10-24 Huawei Technologies Co., Ltd. Method for managing virtual private network, and device
CN110166325A (zh) * 2019-06-12 2019-08-23 首钢京唐钢铁联合有限责任公司 一种通信网络故障的确定方法及装置
CN110166325B (zh) * 2019-06-12 2022-10-04 首钢京唐钢铁联合有限责任公司 一种通信网络故障的确定方法及装置
CN111654434A (zh) * 2020-04-08 2020-09-11 新华三信息安全技术有限公司 一种流量切换的方法、装置以及转发设备
CN111654434B (zh) * 2020-04-08 2022-05-27 新华三信息安全技术有限公司 一种流量切换的方法、装置以及转发设备

Also Published As

Publication number Publication date
CN101459549B (zh) 2011-09-21
US8331222B2 (en) 2012-12-11
WO2009082923A1 (fr) 2009-07-09
EP2222023A1 (en) 2010-08-25
US20100260041A1 (en) 2010-10-14
EP2222023B1 (en) 2013-03-27
EP2222023A4 (en) 2011-05-25

Similar Documents

Publication Publication Date Title
CN101459549B (zh) 链路故障处理方法及数据转发装置
EP1972095B1 (en) Communication connection control systems and methods
CN101340380B (zh) 一种实现主备倒换中双向转发检测包无中断转发的方法和装置
CN101610535B (zh) 多链路直连场景下保证bfd会话稳定性的方法、系统及装置
CN101483592B (zh) 一种抑制双向转发检测链路振荡的方法及装置
CN100512128C (zh) 保护组播转发路径的方法和系统和业务路由器
CN101710896B (zh) 一种链路质量探测方法和装置
CN108924044B (zh) 链路维持方法、pe设备及可读存储介质
WO2006034629A1 (fr) Procede de rearrangement de protection dans un systeme mpls
CN101160901A (zh) 共享格状网恢复的实现方法及装置
CN100442767C (zh) 一种实现快速路由收敛的路由器平稳重启的方法
CN101944951A (zh) 网络间链路快速回切的方法及装置
US20090201804A1 (en) Restoring aggregated circuits with circuit integrity checks in a hierarchical network
CN101110848A (zh) 一种检测通道故障的方法
CN103873336A (zh) 分布式弹性网络互连的业务承载方法及装置
CN102238067B (zh) 一种快速环网保护协议环上的切换方法和装置
CN101909006B (zh) 双向转发检测报文发送、接收方法及其装置与通信系统
JP5655696B2 (ja) ネットワーク及びその障害救済方法
CN103138957A (zh) 一种业务路径回切的方法、设备及系统
EP2573977A1 (en) Subnet protection method and device for transport multi-protocol label switching (tmpls) network
CN101069394B (zh) 故障补救方法和数据包通信装置
CN102223241B (zh) 网络变化通知方法和设备
WO2015154583A1 (zh) 控制通道协议状态的更新方法、装置及系统
US7298695B1 (en) Method and apparatus for delaying start of restoration of low priority services
CN102055635B (zh) 一种以太环网的拓扑管理方法及环网节点

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant