WO2008119294A1

WO2008119294A1 - Procédé et matériel de restauration du commerce en réseau

Info

Publication number: WO2008119294A1
Application number: PCT/CN2008/070589
Authority: WO
Inventors: Peng Zheng
Original assignee: Huawei Technologies Co., Ltd.
Priority date: 2007-03-29
Filing date: 2008-03-26
Publication date: 2008-10-09
Also published as: CN101056203A; CN100512154C

Description

一种恢复网络业务的方法及装置本申请要求于 2007 年 03 月 29 日提交中国专利局、申请号为 200710064922.9、发明名称为 "一种提高多层网络业务恢复性能的方法及装置"的中国专利申请的优先权，其全部内容通过引用结合在本申请中。技术领域

本发明涉及网络通信技术领域，特别涉及一种恢复网络业务的方法及装置。背景技术

随着网络大融合和网络扁平化的发展，原有不同类型网络之间的界限逐渐模糊，在统一控制平面下的广义的多层网络成为追求的目标，最终实现不同层网络之间灵活高效的混合调度，以优化网络业务的管理和提高网络的生存性。在多层网络的混合调度中，釆用分层的隧道技术能够有效地提高业务调度的效率，屏蔽不同层业务之间的影响，使得在业务调度中只需要关注不同层隧道之间的接口以及策略的协调。可能的多层网络混合调度的情况有：因特网协议 IP ( Internet Protocol ) +时分复用 TDM ( Time Division Multiplexing ) 、 IP+波分复用 WDM ( Wavelength Division

Multiplexing ) 、 TDM+WDM以及 TDM不同颗粒，如同步数字体系 SDH ( Synchronous Digital Hierarchy )的 VC12和 VC4。在这些多层网络中称处于承载位置的网络为服务层，相对于服务层的上层网络被称为客户层，这些网络中承载的业务在配置和动态恢复方面存在着很大的相似性。服务层一般对应的颗粒较大，对网络故障的响应较为直接和快速，故障的恢复效率较高，但端到端的灵活性较差；而客户层一般对应颗粒较小，数量较多，在网络故障发生的时候影响面较广，故障恢复效率较低，但端到端灵活性较高。

参见图 5 ,为釆用分段的服务层隧道来承载小颗粒的客户层标签交换路径 LSP (Label Switch Path)的示意图，这种承载方式是提高资源利用率和网络整体恢复效率的有效途径，但需要解决新建和故障恢复等情况下分段隧道和上层 LSP的合理调度问题，既要保证客户层业务具有较高性能的保护恢复能力，又要保证网络在发生故障的时候动荡较小。以上的目标在很多情况下是存在矛盾的，只有通过不同层隧道调度的协调和折中，才能达到最终满意的效果。在目前的多层隧道的恢复策略中釆用自底向上的恢复方式，在判定故障通告中的故障信息之后首先恢复服务层隧道，如果服务层隧道恢复失败则直接恢复客户层。因而快速地判定服务层隧道是否能成功恢复则是关系到业务恢复性能的重要问题。例如，用 SDH的分段 VC4隧道来承载 VC12LSP的情况下，为了提高 VC12LSP的恢复性能，同时又考虑整体恢复效率的因素，故障发生时需要快速判定 VC4隧道能否成功恢复，此功能对提高 VC12LSP的恢复性能起重要的作用。

现有技术中，釆用客户层信令超时等待的方法判定服务层隧道是否能够成功恢复，从而决定客户层是否进行恢复。如果服务层隧道可以进行正常的恢复，则服务层隧道恢复后客户层业务就恢复，否则，客户层进行等待直到恢复定时器超时，发起客户层业务的端到端恢复，此时客户层可能会重新选择其他服务层隧道作为自己的业务承载层。

但是，在出现服务层隧道末节点失效的情况下，由于首末节点作为本层隧道信令的源和宿出现故障时信令会导致服务层无法及时恢复，因而客户业务的整体恢复性能受到很大影响，很难满足网络业务对恢复性能的要求。发明内容

本发明实施例提供了一种恢复网络业务的方法及装置，可缩短客户业务的整体恢复时间，满足网络业务对恢复性能的要求。本发明实施例提供的一种恢复网络业务的方法，包括：

接收故障通告，判断故障所在服务层的隧道末节点是否失效；如果所述服务层的隧道末节点失效，则进行客户层隧道的恢复；如果所述服务层的隧道末节点没有失效，则进行服务层隧道的恢复。

本发明实施例还提供一种恢复网络业务的装置，包括判断模块和故障恢复模块；

所述判断模块，用于接收故障通告，判断故障所在的服务层的隧道末节点是否失效，并将判断结果发送给所述故障恢复模块；所述故障恢复模块，用于接收所述判断结果；如果所述判断结果是所述服务层的隧道末节点失效，则进行客户层隧道的恢复；如果所述判断结果是所述服务层的隧道末节点没有失效，则进行服务层隧道的恢复。

本发明实施例中，通过自底向上的隧道恢复策略并结合末节点是否失效，以判断是进行服务层隧道的恢复还是直接进行客户业务的恢复，既保证了网络整体恢复效率的提升，又保证了单条业务在各种情况下较优的恢复性能。附图说明

图 1是本发明实施例 1中的一种恢复网络业务的方法的流程图；图 2是本发明实施例 1中的 VC-4隧道承载 VC-12LSP的示意图；图 3是本发明实施例 2中恢复网络业务的装置的结构图；

图 4是本发明实施例 3中恢复网络业务的装置的结构图；

图 5是现有技术中釆用分段服务层隧道承载小颗粒客户层 LSP的示意图。具体实施方式

现有的业务恢复的技术方案中，当客户业务首节点收到故障通告时启动恢复定时器，定时器超时时长一般设为秒级。如果服务层隧道可以进行正常的恢复，则服务层隧道恢复后客户层业务就恢复，否则，客户层进行等待直到恢复定时器超时，发起客户层业务的端到端恢复，此时客户层可能会重新选择其他服务层隧道作为自己的业务承载层。但是，通过超时等待的方法判定服务层的恢复结果，在出现服务层隧道末节点失效的情况下，由于首末节点是本层隧道信令的源和宿，在源和宿出现故障时信令是无法绕开的，因而服务层是无法恢复的，客户端需要等到定时器超时才能进行恢复。由于服务层隧道正常恢复一般是几十毫秒，而恢复定时器超时时长为秒级，因而客户业务的整体恢复性能受到很大影响，很难满足网络业务对恢复性能的要求。鉴于此，本发明实施例提供了一种恢复网络业务的方法及装置，可缩短客户业务的整体恢复时间，满足网络业务对恢复性能的要求。

下面结合附图和具体实施例对本发明作进一步说明，但本发明不局限于以下实施例。

本发明实施例提供的技术方案中，客户层承载在分段隧道上，当服务层隧道首节点接收到故障通告，如果判定服务层的末节点失效，则由服务层隧道的首节点通知客户业务的首节点，使其自行恢复；如果判定服务层末节点没有失效，客户层业务不会执行任何动作，等待服务层进行恢复。

实施例 1

参见图 1 , 本发明实施例公开了一种恢复网络业务的方法，具体包括以下步骤：

步骤 101 : 当光纤任意一处发生了故障，相应的服务层隧道首节点和客户层 LSP首节点就会接收到故障通告，故障通告中包含有发生告警的节点标识和端口标识。此时客户层 LSP并不作任何动作，等待服务层隧道首节点首先定位故障的位置。

步骤 102：收到故障通告的服务层隧道首节点遍历与发生告警的节点和端口相关的所有服务层隧道的路径资源信息。

步骤 103：根据服务层隧道首节点遍历的路径资源信息判断发生告警的端口是否为该服务层隧道末节点的上游节点的出端口，如果是，执行步骤 104, 否则执行步骤 105。

步骤 104：发生告警的端口是服务层隧道末节点的上游节点的出端口，因而判定可能是该服务层隧道的末节点失效，需要进一步判定末节点是否可达。

由于在判定末节点是否可达之前需要等待故障状态路由扩散完毕，此时启动路由查询定时器，定时时长为 50毫秒。釆用定时器等待故障状态路由扩散完毕的原因是需要确认在该节点的所有端口都发生告警的情况下，该节点才算失效。也可以不启动该路由查询定时器，只要有一个端口告警，就直接进行判断末节点是否可达的步骤。

路由查询定时器超时后，判断末节点是否可达，如果末节点可达，执行步骤 105 , 如果末节点不可达，执行步骤 106。

判断末节点是否可达可以以各隧道的首末节点作为源和宿，在流量工程（TE, Traffic Engineering )数据库中进行路由计算，如果可以计算出路由，说明末节点可达，如果无法计算出路由，即计算失败，说明末节点不可达，就能判定末节点已经失效。

判断末节点是否可达也可以釆用双向转发检测 BFD ( Bidirecation Forwarding Detection )协议来实现。通过运行 BFD协议在首末节点间定时（如 10毫秒）发送 Hello (握手）报文，以判定两点间接口的工作状态，如果首节点长时间收不到末节点的握手消息，则说明末节点已经无法正常工作，就能判定末节点不可达，已经失效。这种做法在纯 IP网络中较为常见，在可以及时上报端口故障的网络中可以直接判定端口的状态，所以并不依赖于此种通过 BFD协议定时状态查询的协议来检测故障，但釆用 BFD协议的方法也是可以达到同样的判断末节点失效的效果的。

步骤 105: 隧道首节点发起服务层隧道的恢复。

步骤 106: 末节点不可达，则末节点失效，此服务层隧道无法恢复，这时查找此隧道承载的所有客户业务的首节点，并向这些首节点发送底层恢复失败的通告，由这些客户层首节点分别进行客户层隧道的恢复。

下面以多条 VC-12 LSP承载在多条分段的 VC-4隧道上为例，具体说明本发明实施例。

参见图 2, 客户层为两条 VC-12 LSP: VC-12 LSP A和 VC-12 LSP B, 服务层为 3条分段的 VC-4隧道： FA1、 FA2和 FA3。上述两条 VC-12LSP承载在 3条 VC-4隧道上。其中 1、 2、 3、 4、 5分别为节点。分别以 A、 B、 C三处发生故障为例，具体说明本发明实施例。

1 ) 当 A处发生断纤故障的时候，节点 2接收到故障通告，该故障通告中包含：告警节点为节点 2, 端口为 A。节点 2查找以本节点为首节点的 VC-4 隧道的 HOP信息，发现端口 A不是本隧道末节点 4的上游节点 3的出口，则立即发起隧道 FA2的重路由恢复。

2 ) 当 B处发生断纤故障的时候，节点 2接收到故障通告，该故障通告中包含：告警节点为节点 3 , 端口为 B。节点 2查找以本节点为首节点的 VC-4 隧道的 HOP信息，发现端口 B是本隧道末节点 4的上游节点 3的出端口，说明节点 4有可能失效。

这时先启动 50毫秒定时器，定时器超时后，查找 TE数据库以节点 2、 4 为源宿节点进行路由计算，如果计算出了路由，说明节点 4可达，不是失效节点，则立即发起隧道 FA2的重路由恢复。

如果无法计算出路由，说明节点 4不可达，是失效节点，则节点 2查找经过本节点的各上层 VC-12LSP的首节点，本例中对应 VC-12 LSP A和 VC-12 LSP B , 其首节点分别为 2号节点和 1号节点，然后通过远端通知机制通知节点 1和节点 2发起 LSP A和 LSP B重路由恢复。

3 ) 当 C处发生断纤故障的时候，节点 2接收到故障通告，该故障通告中包含：告警节点为节点 4 , 端口为 C。节点 2查找以本节点为首节点的 VC-4 隧道的 HOP信息，发现端口 C是本隧道末节点 4的入端口，认为末节点没有失效，则立即发起隧道 FA2的重路由恢复。

实施例 2

参见图 3 ,本发明实施例还提供了一种恢复网络业务的装置，包括判断模块 201和故障恢复模块 202。

判断模块 201 ,用于在收到故障通告后判断与故障相关的服务层隧道末节点是否失效，并将判断结果发送给故障恢复模块 202;

故障恢复模块 202, 用于接收所述判断模块发送的判断结果，如果所述服务层隧道末节点失效，则进行客户层隧道的恢复；如果所述服务层隧道末节点没有失效，则进行 Λ良务层隧道的恢复。

其中判断模块 201可以具体包括上游节点判断单元 201 a、等待单元 201 c 和末节点可达性判断单元 201b;

上游节点判断单元 201a用于判断所述发生告警的端口是否为所述隧道末节点的上游节点的出端口，如果是，则将判断结果发送给等待单元 201c, 如果不是，则所述服务层隧道末节点没有失效；

等待单元 201c, 用于等待故障状态路由扩散完毕，并将已等待完毕的信号发送给所述末节点可达性判断单元 201b;

末节点可达性判断单元 201b,用于接收所述等待单元 201c发送的已等待完毕的信号后，判断所述服务层隧道末节点是否可达，如果所述服务层隧道末节点不可达，则服务层隧道末节点失效，如果所述服务层隧道末节点可达，否则所述 ^良务层隧道末节点没有失效。末节点可达性判断单元 201b包括路由计算判断单元，用于以所述服务层隧道的首末节点作为源和宿，在流量工程 TE数据库中进行路由计算，如果可以计算出路由，则所述服务层隧道末节点可达，如果无法计算出路由，则所述 Λ良务层隧道末节点不可达。

末节点可达性判断单元 201b也可以包括一个定时查询单元，用于服务层隧道首节点通过运行 BFD协议向服务层隧道末节点定时发送 Hello报文，如果所述服务层隧道首节点在设定时间内收不到服务层隧道末节点的握手消息，则判断服务层隧道末节点不可达。

实施例 3

在故障判断模块 201中等待单元等待故障状态路由扩散完毕的原因是需要确认在该节点的所有端口都发生告警的情况下，该节点才算失效。也可以不釆用该等待单元，只要有一个端口告警，就直接进行判断末节点是否可达的步骤。

参见图 4, 判断模块 201可以具体包括上游节点判断单元 201a和末节点可达性判断单元 201b。

上游节点判断单元 201a用于判断所述发生告警的端口是否为所述隧道末节点的上游节点的出端口，如果是，则将判断结果发送给末节点可达性判断单元 202b, 如果不是，则所述服务层隧道末节点没有失效。

末节点可达性判断单元 201b用于接收所述上游节点判断单元 201a发送的判断结果，如果所述发生告警的端口是所述服务层隧道末节点的上游节点的出端口，则判断所述服务层隧道末节点是否可达，如果所述服务层隧道末节点不可达，则服务层隧道末节点失效，如果所述服务层隧道末节点可达，否则所述 ^良务层隧道末节点没有失效。

其它模块的内容和连接关系与实施例 2 中所述的装置相同，这里不再赘述。

上述实施例中，服务层隧道首节点通过故障定位和路由检测的手段，通过判断与故障相关的末节点是否失效，可以在很短时间内判定出服务层隧道是否可以恢复成功，这样可缩短客户业务的整体恢复时间，满足网络业务对恢复性能的要求。既保证了网络整体恢复效率的提升，又保证了单条业务在各种情况下最优的恢复性能。

以上所述的实施例，只是用于说明本发明原理和特性的示范性的优选的具体实施例，本领域的技术人员在不脱离本发明的实质和原理的前提下进行的通常变化和等同替换都应包含在本发明的保护范围内。

Claims

权利要求

1. 一种恢复网络业务的方法，其特征在于，包括：

2. 如权利要求 1所述的方法，其特征在于，所述判断故障所在服务层的隧道末节点是否失效的步骤，包括：

遍历告警节点和告警端口的隧道的路径资源信息，确定所述告警端口是所述服务层的隧道末节点的上游节点的出端口，确定所述服务层的隧道末节点不可达，确定所述 Λ良务层的隧道末节点失效。

3. 如权利要求 1所述的方法，其特征在于，所述判断故障所在服务层的隧道末节点是否失效的步骤，包括：

遍历告警节点和告警端口的隧道的路径资源信息，确定所述告警端口不是所述服务层的隧道末节点的上游节点的出端口，确定所述服务层的隧道末节点未失效。

4. 如权利要求 1所述的方法，其特征在于，所述判断故障所在服务层的隧道末节点是否失效的步骤，包括：

遍历告警节点和告警端口的隧道的路径资源信息，确定所述告警端口是所述服务层的隧道末节点的上游节点的出端口，确定所述服务层的隧道末节点可达，确定所述服务层的隧道末节点未失效。

5. 如权利要求 2 或 4所述的方法，其特征在于，所述判断故障所在服务层的隧道末节点是否失效的步骤，包括：在判断所述服务层的隧道末节点是否可达的步骤之前，等待故障状态路由扩散完毕。

6. 如权利要求 5所述的方法，其特征在于，所述判断所述服务层的隧道末节点是否可达的步骤具体包括：

以所述服务层的隧道的首节点和末节点作为源和宿，在流量工程数据库中进行路由计算，如果计算出路由，则确定所述服务层的隧道末节点可达，如果无法计算出路由，则确定所述服务层的隧道末节点不可达。

7. 如权利要求 5所述的方法，其特征在于，所述判断所述服务层的隧道末节点是否可达的步骤具体包括：

所述服务层的隧道首节点通过运行双向转发检测协议向所述服务层的隧道末节点定时发送握手消息，如果所述服务层的隧道首节点在设定时间内收到所述服务层的隧道末节点反馈的握手响应消息，则所述服务层的隧道末节点可达；如果所述服务层的隧道首节点在设定时间内未收到所述服务层的隧道末节点反馈的握手响应消息，则所述服务层的隧道末节点不可达。

8. 一种恢复网络业务的装置，其特征在于，包括判断模块和故障恢复模块；

所述判断模块，用于接收故障通告，判断故障所在的服务层的隧道末节点是否失效，并将判断结果发送给所述故障恢复模块；

所述故障恢复模块，用于接收所述判断结果；如果所述判断结果是所述服务层的隧道末节点失效，则进行客户层隧道的恢复；如果所述判断结果是所述服务层的隧道末节点没有失效，则进行服务层隧道的恢复。

9. 如权利要求 8所述的装置，其特征在于，所述判断模块具体包括：上游节点判断单元和末节点可达性判断单元；

所述上游节点判断单元，用于确定告警端口是所述服务层的隧道末节点的上游节点的出端口，将确定结果发送给所述末节点可达性判断单元；确定所述告警端口不是所述服务层的隧道末节点的上游节点的出端口，确定所述 ^良务层的隧道末节点未失效；

所述末节点可达性判断单元，用于接收所述确定结果，触发判断所述服务层的隧道末节点是否可达；若所述服务层的隧道末节点不可达，则确定所述服务层的隧道末节点失效；若所述服务层的隧道末节点可达，则确定所述 ^良务层的隧道末节点未失效。

10. 如权利要求 8所述的装置，其特征在于，所述判断模块具体包括：上游节点判断单元、等待单元和末节点可达性判断单元；

所述等待单元，用于等待故障状态路由扩散完毕，并将已等待完毕的信号发送给所述末节点可达性判断单元；

所述末节点可达性判断单元，用于接收所述已等待完毕的信号，触发判断所述服务层的隧道末节点是否可达；若所述服务层的隧道末节点不可达，则确定所述服务层的隧道末节点失效；若所述服务层的隧道末节点可达，则确定所述服务层的隧道末节点未失效。

11. 如权利要求 9或 10所述的装置，其特征在于，所述末节点可达性判断单元包括：

路由计算判断单元，用于以所述服务层的隧道首节点和末节点作为源和宿，在流量工程数据库中进行路由计算，如果计算出路由，则确定所述服务层的隧道末节点可达，如果无法计算出路由，则确定所述服务层的隧道末节点不可达。

12. 如权利要求 9或 10所述的装置，其特征在于，所述末节点可达性判断单元包括：

定时查询单元，用于所述服务层的隧道首节点通过运行双向转发检测协议向所述服务层的隧道末节点定时发送握手消息，如果所述服务层的隧道首节点在设定时间内收不到所述服务层的隧道末节点反馈的握手响应消息，则确定所述服务层的隧道末节点不可达。