CN100539515C - 电信网络中的死锁检测 - Google Patents
电信网络中的死锁检测 Download PDFInfo
- Publication number
- CN100539515C CN100539515C CNB2006100654260A CN200610065426A CN100539515C CN 100539515 C CN100539515 C CN 100539515C CN B2006100654260 A CNB2006100654260 A CN B2006100654260A CN 200610065426 A CN200610065426 A CN 200610065426A CN 100539515 C CN100539515 C CN 100539515C
- Authority
- CN
- China
- Prior art keywords
- predetermined
- connection
- source
- section
- connects
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/22—Alternate routing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
- Computer And Data Communications (AREA)
- Geophysics And Detection Of Objects (AREA)
- Interface Circuits In Exchanges (AREA)
Abstract
描述了一种用于检查电信网络中的死锁的方法,该电信网络包括用于保护第一预定连接上的业务的第一激活备用连接。该方法包括以下步骤:通过检查第一预定连接的段是可用还是不可用,来检查第一预定连接的返回阻止状态;在检测到第一预定连接的返回阻止状态的情况下,标识使用第一预定连接的不可用段的激活备用连接,并且标识相应的预定连接;通过检查相应段是可用还是不可用,来检查每个被标识的相应预定连接的返回阻止状态;在检测到被标识的相应预定连接的返回阻止状态的情况下,检查相应的不可用段是否包含于第一备用连接中。该方法还提供了死锁所涉及的预定连接的指示。
Description
技术领域
本发明涉及电信领域,并且特别涉及网络资源的动态共享。更特别地,本发明涉及一种用于死锁检测的方法。
背景技术
为了平衡在连接的不同段上的业务(traffic)负荷以及在不同网络单元(路由器,交换机)上的业务负荷,流量工程(TE,traffic engineering)工具被用于现代电信网络以计算承载用户业务的连接,以使这些段和网络单元中没有任何一个被过度使用或使用不足。通过在由TE工具所计算的、穿过指定网络单元的连接上承载用户业务来实现这个目的;这个连接通常被定义为“预定”(或“标称”)连接。
在这个情景中,在预定连接段上发生故障的情况下,备用连接被计算并被激活以保护预定连接上的业务,即将用户业务从预定连接重新路由到备用连接。备用连接可以被预先计算(这个过程通常被定义为“保护”)或者运行时(run-time)被计算(其通常被定义为“恢复”)。在第一情况下,在故障发生之前计算或分配备用连接,如果被计算,则该备用连接被存储;该备用连接可以完全分离于预定连接,即预定和备用连接不具有公共段,或者备用和预定连接可以部分地分离,即预定和备用连接具有至少一个公共段。在完全分离的备用连接的情况下,通常预先计算一个备用连接,这是因为其可以在预定连接的任何段发生故障之后保护该预定连接,而在部分分离的备用连接的情况下,对于段上的每个可能的故障都需要一个(或至少一个)预先计算的备用连接。相反,在恢复中,在运行时计算备用连接,即在故障发生之后。与恢复相比,保护的优点通常是较少的恢复时间,而缺点是需要更多的网络资源(例如一些段被预先分配并且仅用于保护,或者需要可用段用于分离的备用连接)。
当故障清除时,在流量工程网络中,为了在由TE工具所计算的预定连接上承载用户业务,业务总是从备用返回到预定连接。此外,需要所述返回(reversion),这是因为在备用连接上发生另一个故障的情况下,另一个备用连接的计算更加复杂并且该计算可能失败。
在传统的网络中,备用连接的计算可以由集中网络管理器来执行,该集中网络管理器控制网络单元并控制穿过该网络单元的连接(预定和备用);集中管理器是运行在管理站上并执行网络管理功能的软件应用,并且其负责连接的配置、监控告警以及连接的性能,从而在预定连接的段上发生故障的情况下为保护预定连接而提供备用连接。为了实现这些功能,集中管理器在MIB(管理信息库)中存储受控域内的预定连接的标识符列表,并且为每个预定连接存储源和目的网络单元以及中间网络单元的列表(或者由两个网络单元所标识的段的列表)。在包括保护机制的流量工程网络中,中央管理器为每个预定连接存储由TE工具所计算的中间网络单元的列表,并且在为保护预定连接而激活备用连接的情况下,其还存储备用连接的中间网络单元的列表。集中管理器可以被直接连接到被管理网络单元,或者通过在承载用户数据的同一物理网络中的承载控制数据的信道、或通过仅承载控制数据的不同物理网络而被间接连接到被管理网络单元。在新的网络结构中,基于ITU-T G.8080/Y.1304(11/2001)中定义的自动交换光网络(ASON),备用连接是由控制也定义为传输平面单元(TPE,transport plane element)的一个或多个网络单元的控制平面单元(CPE,control plane element)来计算的,从而保护始于受控网络单元(也定义为源网络单元)的预定连接;为了实现这些功能,每个CPE存储始于受控网络单元的预定连接的标识符列表,并且为每个预定连接存储源和目的网络单元以及由TE工具所计算的预定连接的中间网络单元的列表(或者由两个网络单元所标识的段的列表),并且在为保护预定连接而激活备用连接的情况下,该CPE还存储备用连接的中间网络单元的列表。CPE在图1.1-1.5中用CPE1、CPE2、CPE3、CPE4、CPE5、CPE6、CPE7、CPE8、CPE9和CPE10来示意地表示;它们彼此互连并且根据信令协议进行通信,为了提供快速的故障检测,传输平面内新连接的快速有效的配置修改了先前建立的连接,并且执行提供备用连接以保护预定连接的快速恢复功能。不同的信令协议可以适合ASON结构,如RFC2205、RFC2209与RFC2750中定义的资源预留协议(RSVP)、RFC3209和ITU-T G.7713.2中定义的资源预留协议流量工程(RSVP-TE)、RFC3036中定义的标签分配协议(LDP)、ITU-T G.7713.3和RFC3472中定义的基于约束的标签分配协议(CR(constraint based)-LDP),以及ITU-T G.7713.1中定义的专用网间接口(PNNI)。
参照RSVP协议,基础规范被设计成允许网络单元(路由器)在提供连接之前预先判定网络是否可以满足针对连接所定义的服务质量(QoS)需求。通过发送Path消息来执行新的预定或备用连接的配置,并且在成功配置连接的情况下,在Path消息的反方向中接收Resv消息,或者在未成功配置(例如由于缺乏网络资源)的情况下接收Path_err消息。利用Path和Resv消息以类似于新的预定连接的方式、但以“先接后切(make beforebreak)(即在终止备用连接之前建立预定连接)”的方式来进行返回。增加了若干扩展以支持被明确路由的连接(定义为LSP=标记交换路径)的提供与维护。最后,RSVP-TE允许连接的聚集,定义为LSP隧道,其共享了共享网络资源的公共路由和公共池(pool),这减少了网络中承载的信息量。此外,当在段上检测到故障时,为了将业务从预定连接路由到备用连接,必须尽快通知所有的源CPE,所述源CPE控制穿过故障段的预定连接的源网络单元。定义Notify消息以报告故障,并且由IETF发布的因特网草案draft-ietf-mpls-generalized-rsvp-te-09.txt(2002年9月)来描述该Notify消息,并且周期地更新该Notify消息;所述消息包括已检测到故障的、控制网络单元的CPE的地址。
在流量工程网络中,动态共享网络资源的概念应用:网络资源(段或段的部分带宽)可以被分配给不止一个备用连接,同时其必须被分配给一个预定连接。例如,在将用户业务从第一预定连接重新路由到第一备用连接之后,第二备用连接可以使用第一预定连接的可用段(即段不再由第一预定连接使用并且不受故障影响),以保护受故障影响的第二预定连接。所述机制允许更好地使用网络资源,但是不同连接对相同资源的同时使用会产生阻止情况,也定义为“死锁”。死锁在ASON网络中更可能发生,这是因为分布式管理器即CPE的并行性,这会例如为了恢复而基本上同时需要使用相同的资源(段)。
图1.1、1.2、1.3、1.4和1.5示出了为具有涉及两个预定连接的死锁所需要的步骤的例子;预定连接(c1,c2)用实线表示,备用连接(b,b2,b1)用虚线表示。参照图1.1,第一预定连接(c1)穿过网络单元1、8和10,第二预定连接(c2)穿过网络单元2、3、4、6和9。在时刻t1(图1.2),故障F1发生在第一预定连接的段8-10上,并且提供(预先计算或运行时计算)第一备用连接(b)以保护第一预定连接,该第一备用连接穿过网络单元1、4、7、9和10。在时刻t2(图1.3),故障F2发生在第二预定连接的分段4-6上,并且提供第二备用连接(b2)以保护第二预定连接,该第二备用连接穿过网络单元2,1,8和9:第二备用连接使用第一预定连接的段1-8,由于第一预定连接在第一备用连接上被重新路由,因此段1-8是可用的。在时刻t3(图1.4),故障F3发生在第一备用连接的段4-7上,提供(通常运行时计算)第三备用连接(b1)以保护第一预定连接,该第三备用连接穿过网络单元1,2,3,5,7,9和10:第三备用连接使用第二预定连接的段2-3,因为第二预定连接在第二备用连接上被重新路由,因此段2-3是可用的。图1.5示出了第一和第二预定连接的死锁:当所有故障清除时,b1与b2都不能分别返回到c1和c2,这是因为c1和c2的一个段是不可用的。所述附图示意地示出了互连网络单元的网络资源。例如,段1-2承载两个备用连接(b1和b2);有可能使用一个物理介质(光纤、同轴电缆、无线链路)在不同时隙上(或者在不同波长上)承载两个备用连接,或可选地使用两个不同的物理介质。在这个例子中,段1-2必须提供足够的网络资源用于承载网络单元1与2之间的b1和b2,并且b2在段1-8上必须使用由c1使用的相同网络资源(物理介质和带宽)。
图1.5示出了涉及两个连接的死锁,但是在承载许多连接的电信网络中,死锁可以包括不止两个连接;例如,图2示出了包括四个连接的死锁,其中每个备用连接使用随后的预定连接的段。在这个情景中,从备用到预定连接的返回是不可能的,尽管网络中出现任何故障。
现今避免了死锁,即不会达到死锁情况,但是根据两个解决方案来防止该情况。在第一解决方案中,执行网络资源的部分共享:预先分配一组段以提供备用连接,并且这些段被用于保护不同的预定连接。定义用于分配共享段的规则来避免死锁,例如对于网络内的每个预定连接定义不同的优先级,或者使用先到先服务规则。参照优先级规则,第一个例子是当对于相应预定连接的段上的故障、两个不同的预定连接需要使用相同的段用于保护时:这些段被分配给具有最高优先级的预定连接(这也利用“争用(contention)”来表示)。在该第一解决方案中,网络资源的利用没有被优化(这是因为仅共享所述组的段),并且因此对于预定连接的保护需要更多资源;此外,其需要规则的定义,这在包括许多连接的网络的情况下会比较复杂。在第二解决方案中,执行网络资源的完全共享;实际上,如上所述,在从预定到备用连接路由业务之后,预定连接的可用段可以用于备用连接,即也可以动态共享预定连接的段。在这个第二个解决方案中避免了死锁,这是因为最初成功建立的现有连接随后被故意终止(也用“先占”来表示);参照图1.4,在清除故障F1的情况下,如果c1具有比c2高的优先级,则释放b2(保护c2)。为了避免业务丢失,计算另一个备用连接以保护c2(网络中需要其它段),然后释放b2,并且因此业务可以从备用b1返回到预定连接c1。这个第二解决方案具有第一解决方案的相同缺点,即需要规则的定义并且需要更多的网络资源;此外,由于管理器存储受控域的所有连接(和优先级)的列表,因此第二解决方案在由中央管理器控制的网络中是可能的,但是由于每个CPE仅存储始于受控网络单元的连接(和优先级)的列表,因此该第二解决方案在由分布式管理器控制的网络中是不可能的。
发明内容
考虑到已知解决方案的缺点,本发明的主要目的是提供一种支持更好的网络资源利用的方法;这通过根据本发明的方法来执行。基本思想是:
a)通过检查第一预定连接的段是可用还是不可用,来检查第一预定连接的返回阻止状态;并且在检测到第一预定连接的返回阻止状态的情况下,
b)标识使用第一预定连接的不可用段的激活备用连接,并且标识相应的预定连接;
c)通过检查相应的段是可用还是不可用,来检查每个被标识的相应预定连接的返回阻止状态;并且在检测到被标识的相应预定连接的返回阻止状态的情况下,
d)检查相应的不可用段是否包含于第一备用连接中。
这种解决方案的优点是更好的网络资源利用、自动的死锁检测、对于检测需要较少的时间,并且对于连接不需要任何规则的定义。相关优点是死锁所涉及的预定连接的检测;如果相应的不可用段包含于所述第一备用连接中,则所述死锁涉及所述第一预定连接和被标识的相应预定连接。
附图说明
图1.1-1.5示出了对于涉及电信网络的两个预定连接的死锁所需要的步骤的例子;
图2示出了包括四个预定连接的死锁;
图3示意地示出了用于图1.5的两个预定连接的死锁检测的本发明的方法;
图4示意地示出了用于三个预定连接的死锁检测的本发明的方法。
具体实施方式
为了实现网络资源的更好利用,在流量工程网络中应用网络资源的完全共享,并且因此如果没有定义规则,则会发生死锁。在当前这种情况下,网络操作员仅能够从网络管理站检测用于指示预定连接的返回阻止状态的告警,以指示尽管在预定连接上没有发生故障,然而由于预定连接的至少一个段不可用,因此从备用到预定连接的返回是不可能的,但是现在他还需要知道返回阻止状态的理由,其可以是死锁或不同的理由。例如以不可逆状态保护第二预定连接的第二备用连接可以使用第一预定连接的不可用段,该不可逆状态指示第二备用连接针对在第二预定连接的至少一个段上的故障而保护第二预定连接(这在图1.3中示出:如果F1清除,则不能将业务从b重新路由到c1);在这种情况下,为了避免业务丢失,从第二备用连接(b2)到第二预定连接(c2)的返回是不可能的。相反,在死锁的返回阻止状态的情况下,网络操作员需要知道死锁情况并且最终知道死锁所涉及的预定连接。
参照图3、图1.1和图1.5,控制由第一备用连接b1所保护的第一预定连接c1的管理器(集中式或者分布式),检查c1的状态并且检测c1的返回阻止状态,其指示不可能从b1返回到c1,这是因为c1的至少一个段是不可用的。在中央管理器在MIB中存储预定连接的标识符列表并对于每个预定连接存储源、目的及中间网络单元的情况下,在(例如从检测到F1清除的网络单元8)接收到F1清除的指示之后,读取所存储的信息并且检查c1的所有段是否可用,并且检测到至少一个段是不可用的(图1.5的段1-8)。返回阻止状态的理由可以是:至少一个第二备用连接使用c1的一个段以保护受故障影响的第二预定连接,或者该理由可以是涉及c1的死锁。在检测到c1的返回阻止状态之后,控制c1的管理器标识使用c1的不可用段的激活备用连接,并且标识对应于这些激活备用连接的预定连接。结果是第一列表包括由使用c1的至少一个段的备用连接所保护的相应预定连接,并且阻止从b1到c1的返回;所述列表包括c2、c4和c5。对于第一列表的每个被标识的相应预定连接,管理器检查状态,其可以是再次返回阻止或者不可逆;返回阻止状态指示从第一列表的备用连接到相应预定连接的返回是不可能的,这是因为相应预定连接的至少一个相应段是不可用的,而不可逆的状态指示返回是不可能的,这是因为相应预定连接受到故障的影响。在图3的例子中,c2是返回阻止状态,而c4与c5是分别对于预定连接c4和c5上的故障F4和F5的不可逆状态(c4、b4、c5、b5、F4、F5和F6在图1.1和图1.5中未示出)。对于返回阻止状态中的每个被标识的相应预定连接,管理器检查相应的不可用段是否包含于第一备用连接b1中,并且如果发生这种情况,其检测涉及第一预定连接和被标识的相应预定连接的死锁。在这个例子中,控制c2的管理器检查c2的不可用段(图1.5的2-3)是否包含于第一备用连接b1中。通过标识使用c2的不可用段的激活备用连接并且标识对应于这些激活备用连接的预定连接,来实现上述操作。结果是第二列表包括由阻止从b2返回到c2的备用连接所保护的预定连接。在图3的例子中,第二列表包括c1和c6:这意味着c2是由c1阻止返回的,而c1也是由c2阻止返回的,并且这是涉及c1和c2的死锁的指示,c1和c2相互阻止的。最后,控制c6的管理器对于c6上的故障F4来检测c6的不可逆状态(c6、b6和F4未在图1.1和图1.5中示出)。图3示出了从c1开始的方法,但是利用不同的第一和第二列表,从c2开始达到相同的结果(即涉及c1和c2的死锁检测)。
参照图4,对于涉及三个预定连接的死锁而示出了更一般的情景。控制c8的管理器检查第一预定连接c8的状态、检测c8的返回阻止状态,以及标识由使用c8的至少一个段的第二备用连接所保护的第二预定连接的第一列表:所述第一列表包括c9、c19和c16。管理器检查c9、c19和c16的状态:c9、c19和c16再次为返回阻止状态。从返回阻止状态中的第一列表的每个第二预定连接开始,重复所述方法。从c9开始,标识了由使用c9的至少一个段的第三备用连接所保护的第三预定连接的第二列表:所述第二列表包括c10和c11并且不包括c8,即没有检测到死锁。管理器检查c10和c11的状态:c11对于故障F11是不可逆状态,而c10再次为返回阻止状态。从返回阻止状态中的第二列表的每个第三预定连接开始,即在这个例子中从c10开始,标识了由使用c10的至少一个段的第四备用连接所保护的第四预定连接的第三列表:所述第三列表包括c13并且不包括任何先前的返回阻止的预定连接,也就是既不是c8也不是c9(没有检测到死锁)。管理器检查第三列表的第四预定连接的状态,即c13的状态,其再次为返回阻止。从返回阻止状态中的第三列表的每个第四预定连接开始,即从c13开始,标识了由使用c13的至少一个段的第五备用连接所保护的第五预定连接的第四列表:所述第四列表包括c15和c18并且不包括任何先前的返回阻止的预定连接,也就是既不是c8、c9也不是c10(没有检测到死锁)。管理器检查第四列表的第五预定连接的状态,即c15和c18的状态:c15再次为返回阻止状态,而c18对于故障F18是不可逆状态。从返回阻止状态中的第四列表的每个第五预定连接开始,即从c15开始,标识了由使用c15的至少一个段的第六备用连接所保护的第六预定连接的第五列表:所述第五列表包括c20并且不包括任何先前的返回阻止的预定连接,也就是既不是c8、c9、c10也不是c13(没有检测到死锁)。管理器检查c20的状态,其对于故障F20是不可逆状态:所述方法没有检测到涉及连接c8、c9、c10、c11、c13、c15、c18和c20的任何死锁,这是因为在网络中出现故障F11、F18和F20。通过考虑第一列表的后续返回阻止的第二预定连接来重复所述方法,该连接是c19。在第二列表包括c12的情况下,c12对于故障F12是不可逆状态:所述方法没有检测到涉及c8、c19和c12的任何死锁,这是因为在网络中存在故障F12。最后,通过考虑第一列表的最后的返回阻止的第二预定连接来重复所述方法,该连接是c16。从c16开始,标识了由使用c16的至少一个段的第三备用连接所保护的第三预定连接的第二列表:所述第二列表包括c14和c17。c17对于故障F17是不可逆状态,而c14再次为返回阻止状态。从返回阻止状态中的第二列表的每个第三预定连接开始,即从c14开始,标识了由使用c14的至少一个段的第四备用连接所保护的第四预定连接的第三列表:所述第三列表包括c16和c8。c16已经包含于第一列表中:这指示了涉及c8、c16和c14的死锁。实际上,在预定连接c8、c16和c14上没有出现故障,但是由于它们相互阻止,因此返回是不可能的。第三列表也包括c8,其是返回阻止状态中的第一预定连接:这再次指示了涉及c8、c16和c14的死锁。
图4示出了从c8开始的方法,但是利用不同的列表,从死锁所涉及的任何预定连接开始(即从c16、c14或c8开始)达到相同的结果(即涉及c8、c16和c14的死锁检测)。此外,图4示出了包括两个预定连接(c8和c16)的第三列表,这两个连接都包含于先前的列表中,并且因此对于检测死锁而言有两种可能性,但是所述第三列表可以仅包括已包含于先前列表中的一个预定连接(仅c8或者仅c16),并且达到相同的结果(涉及c8、c16和c14的死锁检测)。
本发明的方法可以通过运行在中央管理站的硬件上或ASON网络的CPE的硬件上的软件程序来被执行。中央管理站可以是工作站或个人计算机,而CPE的硬件可以是微处理器,该微处理器可以被嵌入ASIC(专用集成电路)或FPGA(现场可编程门阵列)中或位于其外部。编程语言可以例如是C、C++或者Java。
对于网络操作员,软件程序的结果是图形用户接口,其不仅包括预定连接的返回阻止状态的第一指示,而且包括涉及预定连接的死锁的第二指示。在检测到死锁情况下,图形用户接口还可以包括死锁所涉及的预定连接的指示。例如参照图4,图形用户接口可以包括死锁的指示,以及涉及连接c8、c16和c14的指示。
在中央管理站的情况下,例如在网络操作员请求之后开始死锁检测,其检测指示预定连接的返回阻止状态的告警,并且从该预定连接开始所述方法。网络操作员可以从不止一个预定连接检测告警,并且可以例如从对应于被接收第一告警的预定连接来开始死锁检测过程。在CPE的情况下,每个源CPE自动作出反应,并且从受控预定连接开始独立地执行所述死锁检测的方法。参照图4的例子,控制c8的CPE开始执行始于c8的方法,如图4所示,而控制c16的CPE从c16开始,并且因此将建立不同的列表,并且控制c14的CPE从c14开始。无论如何,结果是相同的,即每个CPE将检测到涉及c8、c16和c14的死锁。
信令协议可以被用于在CPE之间承载消息,并且需要协议的扩展来实现本发明的方法,例如定义新消息或者定义已知消息中的新字段。特别地,可以使用RSVP协议,在Path_err消息中定义新的对象(object),并且在Notify消息中定义新的对象。此外,每个中间CPE还存储穿过受控网络单元的连接的信息、预定连接的特定标识符,并且对于每个预定连接存储源CPE的地址(即控制预定连接的源网络单元的CPE);为了尽快将故障通知给控制穿过故障段的预定连接的所有源CPE,以及为了将不可用段通知给请求该不可用段以配置连接的源CPE来说,需要这样做。利用Path消息的新对象或利用已定义的Notify Request对象,在发送Path消息时建立预定或备用连接期间可以执行所述信息的存储:在接收到承载预定连接的标识符信息和源CPE地址的消息之后,每个中间CPE在本地存储所述信息。参照图1.5和图1.3,控制从b1到c1的返回的源CPE(即控制网络单元1的CPE1),周期地检查c1的所有段是否可用于发送Path消息用于请求c1的配置,而接收指示c1上的至少一个段不可用的Path_err消息:这是c1为返回阻止状态的指示。可选地,CPE1通过信令协议接收清除c1上的故障F1的指示,例如通过Notify消息中的新对象。根据RFC2205(9/1997),Path_err消息包括已检测到错误的、控制网络单元的CPE的地址,即临近于不可用段的网络单元(例如用于不可用段2-8的中间CPE8),但是为了执行本发明的方法,CPE1需要知道源CPE的地址,所述源CPE控制由使用c1的不可用段的备用连接所保护的预定连接,并且CPE1还需要知道这些预定连接的标识符。Path_err消息中的新对象被用于承载这些信息,并且Notify消息中的新对象用于执行本发明的方法。在这个例子中,CPE1从CPES接收Path_err消息,该消息不仅包括(已检测到错误的)CPE8的地址,还包括源CPE2的地址以及受控预定连接c2的标识符,这是因为c2是由使用c1的段1-8的b2来保护的。CPE1还从控制临近于b4所用段的c1的网络单元的CPE接收Path_err消息,该消息包括这个CPE的地址、控制c4的源CPE4的地址以及c4的标识符。最后,CPE1从控制临近于b5所用段的c1的网络单元的CPE接收Path_err消息,该消息包括这个CPE的地址、控制c5的源CPE5的地址以及c5的标识符。结果是第一列表包括源CPE的地址,以及由使用c1的段的备用连接所保护的受控预定连接的标识符。
然后CPE1通过向CPE2、CPE4和CPE5发送Notify消息来请求第一列表的预定连接的状态,所述Notify消息包括指示第一列表的源CPE地址的新对象、受控预定连接的标识符和受控预定连接状态的请求;因此,发送到CPE2的Notify消息的新对象包括CPE2的地址、c2的标识符和c2状态请求的指示,而发送到CPE4的Notify消息的新对象包括CPE4的地址、c4的标识符和c4状态请求的指示,并且最后,发送到CPE5的Notify消息的新对象包括CPE5的地址、c5的标识符和c5状态请求的指示。CPE2、CPE4和CPE5通过向CPE1发送指示受控预定连接状态的Path_err消息来分别答复所述请求,所述状态对于故障可以是不可逆的或者是返回阻止的。在第一种情况中,所述消息包括故障的指示(并且最终包括控制网络单元的、检测到故障的CPE的地址)、控制受故障影响的预定连接的源CPE的地址,以及受故障影响的预定连接的标识符。在第二种情况中,所述消息包括预定连接的返回阻止状态的指示、控制返回阻止状态中的预定连接的源CPE的地址,以及返回阻止状态中的预定连接的标识符;所述消息还包括控制由阻止返回的备用连接所保护的预定连接的源CPE地址,以及由阻止返回的备用连接所保护的预定连接的标识符。特别地,CPE2向CPE1发送包括新对象的新Path_err消息,该新对象包括CPE2的地址、c2的标识符和c2的返回阻止状态的指示;该新对象还包括CPE1的地址和c1的标识符。CPE2还向CPE1发送包括新对象的新Path_err消息,该新对象包括CPE2的地址、c2的标识符和c2的返回阻止状态的指示;该新对象还包括CPE6的地址和c6的标识符。CPE4向CPE2发送新的Path_err消息,该消息包括故障的指示、控制受故障影响的c4的CPE4的地址,以及受故障影响的c4的标识符。CPE5向CPE2发送新的Path_err消息,该消息包括故障的指示、控制受故障影响的c5的CPE5的地址,以及受故障影响的c5的标识符。结果是第二列表包括源CPE的地址,以及由使用c2的段的备用连接所保护的受控预定连接的标识符。在从CPE2接收了Path_err消息之后,CPE1检测涉及预定连接c1和c2的死锁,所述Path_err消息包括CPE2的地址、c2的标识符和c2的返回阻止状态的指示、CPE1的地址以及由阻止c2的b1所保护的受控连接c1的标识符。最后,CPE1在从CPE2接收Path_err消息之后,CPE2向CPE6发送新的Notify消息,其中所述Path_err消息包括CPE2的地址、c2的标识符以及c2的返回阻止状态的指示、CPE6的地址以及由阻止c2的b6所保护的受控连接c6的标识符,所述Notify消息包括CPE6的地址、c6的标识符以及c6的状态请求的指示;然后CPE6向CPE2发送c6的不可逆状态,即新的Path_err消息包括故障的指示、控制受故障影响的预定连接的CPE6的地址,以及受故障影响的c6的标识符。
应当指出,CPE2、CPE4、CPE5和CPE6检测返回阻止状态或者如对于CPE1所解释的不可逆状态,即发送Path消息并从中间CPE接收Path_err消息,该Path_err消息包括由阻止返回的备用连接所保护的预定连接的列表,或者包括预定连接上的故障的指示以及检测到故障的CPE的地址;例如,中间CPE8向源CPE2发送Path_err消息,该消息包括CPE1的地址和c1的标识符。然后,CPE2、CPE4、CPE5和CPE6向CPE1发送返回阻止状态或如上所述的不可逆状态的指示。
如上所述的信令协议的新消息是由控制平面单元来发送的;每个CPE是硬件设备,其包括适于将消息发送到其它CPE的硬件装置(例如发送器),并且包括适于从其它CPE接收消息的硬件装置(例如接收器)。
Claims (7)
1.一种用于检查电信网络中的死锁的方法,所述电信网络包括用于保护第一预定连接(c1)上的业务的第一激活备用连接(b1),该方法包括以下步骤:
a)通过检查所述第一预定连接的段(1,8)是可用还是不可用,来检查所述第一预定连接的返回阻止状态;
其特征在于,在检测到所述第一预定连接的返回阻止状态的情况下:
b)标识使用所述第一预定连接的不可用段的激活备用连接(b2),并且标识相应的预定连接(c2,c4,c5);
c)通过检查相应的段(2,3)是可用还是不可用,来检查每个被标识的相应预定连接(c2,c4,c5)的返回阻止状态;并且在检测到被标识的相应预定连接的返回阻止状态的情况下,
d)检查相应不可用段(2,3)是否包含于所述第一激活备用连接(b1)中。
2.根据权利要求1的方法,其特征在于,如果所述相应不可用段包含于所述第一激活备用连接中,则所述死锁涉及所述第一预定连接和被标识的相应预定连接。
3.根据权利要求1或2的方法,其中,所述网络包括:
-第一源控制平面单元(CPE1),用于控制所述第一预定连接和所述第一激活备用连接的源网络单元(1),所述第一源控制平面单元由第一地址来标识,并且所述第一预定连接由第一标识符来标识;
-第二源控制平面单元(CPE2),用于控制所述被标识的激活备用连接(b2)和相应的被标识预定连接(c2)的源网络单元(2),所述第二源控制平面单元由第二地址来标识,并且所述相应的被标识预定连接由第二标识符来标识;
-第一中间控制平面单元(CPE8),用于控制临近于所述第一预定连接的不可用段的网络单元(8),并且存储所述第二地址和第二标识符;所述第一源控制平面单元、第二源控制平面单元和第一中间控制平面单元是通过信令协议来彼此互连的,并且其中,在步骤b)中,通过从所述第一中间控制平面单元到所述第一源控制平面单元发送所述被存储第二地址和被存储第二标识符,来标识所述相应的预定连接。
4.根据权利要求3的方法,其中,所述网络还包括第二中间控制平面单元(CPE3),用于控制临近于所述相应的被标识预定连接的相应不可用段的网络单元(3),所述第二中间控制平面单元存储所述第一地址和第一标识符,并且其中,在步骤c)中,所述返回阻止状态是通过以下操作来被检查的:
-在所述第一源控制平面单元接收来自所述第一中间控制平面单元的所述被存储第二地址和被存储第二标识符,并且然后向所述第二源控制平面单元发送所述相应的被标识预定连接状态的请求、所述被接收第二地址以及所述被接收第二标识符;
-在所述第二源控制平面单元接收所述状态请求,并且然后发送所述相应的被标识连接配置的请求;
-在所述第二源控制平面单元接收来自所述第二中间控制平面单元的所述第一地址和第一标识符。
5.根据权利要求4的方法,该方法还在步骤c)中从所述第二源控制平面单元向所述第一源控制平面单元发送所述被接收第一地址、被接收第一标识符以及被标识的相应预定连接的返回阻止状态的指示。
6.根据权利要求5的方法,其中,在步骤d)中,在从所述第二源控制平面单元接收所述第一地址、第一标识符以及被标识的相应预定连接的返回阻止状态的指示之后,在所述第一源控制平面单元执行所述检查。
7.一种用于控制电信网络的至少一个网络单元(8,1,2)的设备(CPE8,CPE1,CPE2),所述电信网络包括用于保护第一预定连接(c1)上的业务的第一激活备用连接(b1),所述设备包括:
a)适于通过检查所述第一预定连接的段(1,8)是可用还是不可用来检查所述第一预定连接的返回阻止状态的装置,
其特征在于,还包括,在检测到所述第一预定连接的返回阻止状态的情况下:
b)适于标识使用所述第一预定连接的不可用段的激活备用连接(b2),并且标识相应的预定连接(c2,c4,c5)的装置;
c)适于通过检查相应的段(2,3)是可用还是不可用来检查每个被标识的相应预定连接(c2,c4,c5)的返回阻止状态的装置;以及,在检测到被标识的相应预定连接的返回阻止状态的情况下,
d)适于检查相应不可用段(2,3)是否包含于所述第一激活备用连接(b1)中的装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05290643.5 | 2005-03-23 | ||
EP05290643A EP1705831B1 (en) | 2005-03-23 | 2005-03-23 | Deadlock detection in a telecommunication network |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1838614A CN1838614A (zh) | 2006-09-27 |
CN100539515C true CN100539515C (zh) | 2009-09-09 |
Family
ID=34942033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2006100654260A Expired - Fee Related CN100539515C (zh) | 2005-03-23 | 2006-03-21 | 电信网络中的死锁检测 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7742403B2 (zh) |
EP (1) | EP1705831B1 (zh) |
CN (1) | CN100539515C (zh) |
AT (1) | ATE453263T1 (zh) |
DE (1) | DE602005018440D1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101515827B (zh) * | 2009-03-31 | 2011-12-07 | 中兴通讯股份有限公司 | 一种自动交换光网络业务错联阻错的方法及系统 |
US7962615B1 (en) * | 2010-01-07 | 2011-06-14 | International Business Machines Corporation | Multi-system deadlock reduction |
EP3085031B1 (en) * | 2013-12-20 | 2020-07-22 | Telefonaktiebolaget LM Ericsson (publ) | Method and network node for managing resource allocation in traffic restoration |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05134886A (ja) * | 1990-11-30 | 1993-06-01 | Fujitsu Ltd | デツドロツク検出方式 |
DE60200530T2 (de) * | 2001-04-04 | 2004-09-23 | Alcatel | Mechanismus und Verfahren zur Bestimmung und schnellen Wiederherstellung einer minimalen Kapazität in einem vermaschten Netz |
GB0111869D0 (en) * | 2001-05-15 | 2001-07-04 | Marconi Comm Ltd | Restoration protection in communication networks |
JP3972664B2 (ja) * | 2002-01-23 | 2007-09-05 | 日本電気株式会社 | パス障害回復方式及び障害復旧後の切戻方式並びにそれらを用いるノード |
US7096251B2 (en) * | 2002-01-23 | 2006-08-22 | Sun Microsystems, Inc. | Calculation of layered routes in a distributed manner |
US7352706B2 (en) * | 2002-09-16 | 2008-04-01 | Finisar Corporation | Network analysis scalable analysis tool for multiple protocols |
EP1531634A1 (en) * | 2003-11-13 | 2005-05-18 | Alcatel | Method for restoring a connection in a telecommunication network |
-
2005
- 2005-03-23 DE DE602005018440T patent/DE602005018440D1/de active Active
- 2005-03-23 AT AT05290643T patent/ATE453263T1/de not_active IP Right Cessation
- 2005-03-23 EP EP05290643A patent/EP1705831B1/en not_active Ceased
-
2006
- 2006-03-21 CN CNB2006100654260A patent/CN100539515C/zh not_active Expired - Fee Related
- 2006-03-21 US US11/384,493 patent/US7742403B2/en not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
RSVP-TE: Extensions to RSVP for LSP Tunnels. D. Awduche et al.Request for Comments: 3209. 2001 |
RSVP-TE: Extensions to RSVP for LSP Tunnels. D. Awduche et al.Request for Comments: 3209. 2001 * |
Also Published As
Publication number | Publication date |
---|---|
DE602005018440D1 (de) | 2010-02-04 |
ATE453263T1 (de) | 2010-01-15 |
EP1705831B1 (en) | 2009-12-23 |
CN1838614A (zh) | 2006-09-27 |
US20060215549A1 (en) | 2006-09-28 |
EP1705831A1 (en) | 2006-09-27 |
US7742403B2 (en) | 2010-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4661892B2 (ja) | 通信ネットワークシステム、通信装置、経路設計装置及び障害回復方法 | |
US7782892B2 (en) | Method and an apparatus for consistency verification of traffic engineering link timeslot status | |
US20120014246A1 (en) | Method and system for setting up path through autonomous distributed control, and communication device | |
US20100128611A1 (en) | Transmitting apparatus, alarm control method, and computer product | |
CN103620560A (zh) | 计算机网络中的故障防御 | |
CN102480368B (zh) | 一种聚合链路的保护方法及系统 | |
CN101299893B (zh) | 一种自动交换光网络中基于状态转换的迁移方法 | |
EP2216939A1 (en) | Maintaining method for automatic switched optical network system when operation engenders alarm | |
US7539128B2 (en) | Method for protecting and restoring link using optical label merging and dynamic resource sharing with network load | |
US8532481B2 (en) | Dual fault tolerant optical networking with fast protection performance | |
EP2254289A1 (en) | Method, device, and system for establishing label switching path in fast rerouting switching | |
CN100531092C (zh) | 智能光网络的业务重路由触发方法 | |
EP2838231A1 (en) | Network system and access controller and method for operating the network system | |
CN100539515C (zh) | 电信网络中的死锁检测 | |
EP2704382B1 (en) | Method for managing services in a generalized-multi-protocol label switching, GMPLS, controlled network | |
US8868967B2 (en) | Method and system for connection-error handling of service in an automatically switched optical network | |
US7460783B2 (en) | Method and apparatus for dynamic provisioning of reliable connections in the presence of multiple failures | |
US20200220806A1 (en) | Provisioning recovery paths in a mesh network | |
US8676947B2 (en) | Resource reservation apparatus and method | |
CN113037622B (zh) | 一种防止bfd震荡的系统及方法 | |
Kim et al. | Rapid and efficient protection for all-optical WDM mesh networks | |
Cho | Trade-off between Resource Efficiency and Fast Protection for Shared Mesh Protection | |
US8724984B1 (en) | Automated notification of upcoming network disruptive maintenance events to allow traffic to be rerouted | |
CN112154628B (zh) | 拆除经过通信网络的标签交换路径 | |
KR100462852B1 (ko) | 부가 mpls 서비스를 위한 레이블 포워딩 정보 관리방법 및 레이블 에지 라우터 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090909 Termination date: 20180321 |
|
CF01 | Termination of patent right due to non-payment of annual fee |