WO2010083764A1

WO2010083764A1 - 一种协调自动保护倒换操作与恢复操作的装置及方法

Info

Publication number: WO2010083764A1
Application number: PCT/CN2010/070303
Authority: WO
Inventors: 董均; 王振宇
Original assignee: 中兴通讯股份有限公司
Priority date: 2009-01-22
Filing date: 2010-01-21
Publication date: 2010-07-29
Also published as: US8775869B2; EP2391060A4; CN101790110B; US20110276825A1; CN101790110A; EP2391060B1; EP2391060A1

Abstract

本发明涉及一种协调自动保护倒换操作与恢复操作的装置及方法，所述装置包括工作通道检测单元、保护通道检测单元、保护协议单元以及恢复协议单元；所述方法为：当前业务的工作通道产生故障时，工作通道检测单元上报工作通道告警给本节点的保护协议单元以及恢复协议单元；恢复协议单元接收所述工作通道告警后启动定时器，所述保护协议单元接收所述工作通道告警后判断是否需要立即启动恢复操作，若是，则保护协议单元通知恢复协议单元立即启动恢复操作，恢复协议单元收到通知后立即启动恢复操作。本发明在自动保护倒换功能失效的情况下减少了业务的受损时间。

Description

一种协调自动保护倒换操作与恢复操作的装置及方法技术领域本发明涉及光网络，尤其涉及一种协调自动保护倒换 ( Automatic Protection Switching , APS ) 操作与恢复操作的装置及方法。背景技术随着网络规模的日益扩大与高质量业务的需要，目前，光网络对网络生存性的要求越来越高。网络生存性是指网络在失效情况下仍可维持可接受的业务质量等级。 APS 操作与恢复操作是提高光网络生存性、支持业务传输 QoS ( Quality of Service, 月艮务质量）需求的主要手段。 APS 操作的基本思想是为业务预先配置保护通道，工作通道出现故障时，相应节点的工作通道检测单元检测到告警，并将其上报给本节点的保护协议单元；该保护协议单元接收工作通道告警后启动 APS操作，即该保护协议单元运行设定的保护协议算法，并与保护通道中其它节点的保护协议单元进行信令交互；然后，保护通道中各个节点的保护协议单元分别向本节点的执行单元下发切换指令；最后，保护通道中各个节点的执行单元执行 APS操作，将业务切换到保护通道，保证业务的正常运行。 APS操作具有倒换时间快、业务中断时间短的优点，但是网络资源利用率相对较低。恢复操作并不为业务预先配置保护通道，工作通道出现故障时，相应节点的工作通道检测单元检测到告警，并将其上 ·ί艮给本节点的恢复协议单元；该恢复协议单元接收工作通道告警后启动恢复操作，即该恢复协议单元从当前网络的空闲资源中为业务重新计算出一条新通道，并与新通道中其它节点的恢复协议单元进行信令交互；然后，新通道中各个节点的恢复协议单元分别向本节点的执行单元下发切换指令；最后，新通道中各个节点的执行单元执行恢复操作，将业务切换到新通道，保证业务的正常运行。恢复操作具有较高的网络资源利用率，但是需要对业务通道进行实时计算，业务受损时间相对较长。对于较高 QoS要求的业务，往往同时为该业务配备 APS功能与恢复功能。参照图 1 , 装置包括工作通道检测单元、保护协议单元与恢复协议单元；工作通道检测单元检测到工作通道告警时，将其上 ·ί艮给保护协议单元与恢复协议单元；保护协议单元接收到工作通道告警后立即启动 APS操作，而恢复协议单元接收到工作通道告警后等待预设时长 holdoff之后，查看工作通道检测单元是否仍检测到告警，若是，启动恢复操作，否则，业务已正常运行，无需启动恢复操作。由于保护协议单元与恢复协议单元之间缺乏信令交互，在 APS功能失效的情况下，如业务的工作通道与保护通道均存在故障，恢复操作应立即启动时，恢复协议单元必须等待 holdoff之后才启动恢复操作，使得业务的受损时间增加了 holdoff, 拉长了业务中断时间。发明内容本发明要解决的技术问题是提供一种协调 APS操作与恢复操作的装置及方法，减少了 APS功能失效的情况下业务的受损时间。本发明解决其技术问题所釆用的技术方案是：一种协调 APS操作与恢复操作的装置，包括工作通道检测单元、保护协议单元以及恢复协议单元；所述工作通道检测单元用于对业务的工作通道进行故障监视，并在所述工作通道出现故障时上 4艮告警给所述保护协议单元和恢复协议单元；所述保护协议单元用于接收所述工作通道告警，并判断是否需要立即启动恢复操作，且需要时，通知所述恢复协议单元立即启动恢复操作，否则，启动 APS操作；所述恢复协议单元用于接收所述工作通道告警和所述立即启动恢复操作通知，当接收到所述立即启动恢复操作通知时，或者当接收到的所述工作通道告警超时依然存在时，启动恢复操作。所述装置还包括保护通道检测单元，用于对业务的保护通道进行故障监视，并在所述保护通道出现故障时上告警给所述保护协议单元；所述保护协议单元还用于接收所述保护通道告警。所述保护协议单元还用于判断接收到的告警的类型，并在接收到保护通道告警时记录所述告警信息并将所述保护通道的状态标记为有告警。一种协调 APS操作与恢复操作的方法，包括以下步骤：步骤 a: 当前业务的工作通道产生故障时，工作通道检测单元上 4艮工作通道告警给本节点的保护协议单元以及恢复协议单元；步骤 b: 所述恢复协议单元接收所述工作通道告警后启动定时器，所述保护协议单元接收所述工作通道告警后判断是否需要立即启动恢复操作，若是，进入步骤 c; 步骤 c: 所述保护协议单元通知所述恢复协议单元立即启动恢复操作，所述恢复协议单元收到通知后立即启动恢复操作，本次告警处理完毕。所述步骤 b中，若判断的结果为无需立即启动恢复操作，则所述保护协议单元启动 APS操作；所述恢复协议单元等待所述定时器超时后查看所述工作通道检测单元是否依然存在告警，若是，则启动恢复操作，之后本次告警处理完毕，否则，本次告警处理完毕。上述方法中，若当前业务的保护通道产生故障，则保护通道检测单元上艮保护通道告警给所述本节点的保护协议单元。所述保护协议单元接收到告警后，判断所述告警的类型，若为工作通道告警，则转入步骤 b执行；若为保护通道告警，则记录所述告警信息并将所述保护通道状态标记为有告警。所述步骤 b中，保护协议单元釆用如下方法判断是否需要立即启动恢复操作：步骤 A: 查看当前业务的保护通道状态是否为有告警，若是，需要立即启动恢复操作，否则，执行步骤 B; 步骤 B: 查看所述业务的保护组是否处于非使能状态，若是，需要立即启动恢复操作，否则，无需立即启动恢复操作。所述保护协议单元通过但不限于数据通信网络 ( Data Communication Network, DCN ), 高级数据链路控制（ High Level Data Link Control, HDLC ) 协议总线、中央处理器（ Central Processing Unit , 简称为 CPU ) 内部进程间通讯方式通知所述恢复协议单元立即启动恢复操作。所述保护通道检测单元通过但不限于 DCN、 HDLC协议总线方式将告警上 ~¾给所述保护协议单元。本发明的有益效果主要表现在：本发明所述协调 APS操作与恢复操作的方法可通过本发明所述协调 APS操作与恢复操作的装置实现；该装置中增加了保护通道检测单元，用于检测业务的保护通道，实现了对保护通道故障的监视，同时，增加了保护协议单元与恢复协议单元之间的通讯机制，实现了两者间信息的交互；该方法中，保护协议单元接收到业务的工作通道告警后，首先根据保护通道的状况确定是否需要立即启动恢复操作，在 APS功能失效的情况下，通知定时器超时等待过程中的恢复协议单元立即启动恢复操作，从而减少了业务的受损时间。附图说明图 1为目前协调 APS与业务恢复操作的装置结构示意图；图 2为本发明所述装置的结构示意图；图 3是本发明所述方法的流程图；图 4是保护协议单元处理告警的流程图；图 5是恢复协议单元处理告警的流程图；图 6是本发明实施例一的网络拓朴结构示意图；图 7是本发明实施例二的网络拓朴结构示意图。具体实施方式图 1 已在背景技术中加以描述，此处不再赞述，下面结合其它附图对本发明作进一步的描述。参照图 2, —种协调 APS操作与恢复操作的装置，用于光网络中每个节点，包括工作通道检测单元、保护通道检测单元、保护协议单元以及恢复协议单元；工作通道检测单元用于对业务的工作通道进行故障监视，并在工作通道出现故障时上 4艮告警给保护协议单元和恢复协议单元；保护通道检测单元用于对业务的保护通道进行故障监视，并在保护通道出现故障时上 4艮告警给保护协议单元；保护通道检测单元通过 DCN、 HDLC 协议总线方式将告警上报给保护协议单元；保护协议单元用于接收上报的告警，并用于判断接收到的告警的类型，在接收到保护通道告警时记录告警信息并将保护通道的状态标记为有告警；以及在接收到工作通道告警时判断是否需要立即启动恢复操作，需要时，通知恢复协议单元立即启动恢复操作，不需要时，启动 APS操作；保护协议单元通过 DCN、 HDLC协议总线、 CPU 内部进程间通讯方式通知恢复协议单元启动恢复操作。恢复协议单元用于接收工作通道告警并启动定时器，以及在接收到保护协议单元的立即启动恢复操作通知时，或者在定时器超时但工作通道检测单元依然存在告警时，启动恢复操作。也就是说，恢复协议单元用于接收工作通道告警和立即启动恢复操作通知，当接收到立即启动恢复操作通知时，或者当接收到的工作通道告警超时依然存在时，启动恢复操作。通过该实施例，在上述装置中增加了保护通道检测单元，用于检测业务的保护通道，实现了对保护通道故障的监视，同时，增加了保护协议单元与恢复协议单元之间的通讯机制，实现了两者间信息的交互。参照图 3 , 本发明所述协调 APS操作与恢复操作的方法，具体包括以下步骤：步骤 301：工作通道检测单元和保护通道检测单元分别监测当前业务的工作通道和保护通道的状态，若当前业务的工作通道发生故障，则工作通道检测单元上 ·ί艮工作通道告警给保护协议单元和恢复协议单元；若当前业务的保护通道发生故障，则保护通道检测单元上 ~¾保护通道告警给所述保护协议单元；步骤 302: 保护协议单元和恢复协议单元同时处理接收到的告警；并根据处理结果启动相应操作。通过该实施例，保护协议单元接收到业务的工作通道告警后，首先根据保护通道的状况确定是否需要立即启动恢复操作，在 APS 功能失效的情况下，通知定时器超时等待过程中的恢复协议单元立即启动恢复操作，从而减少了业务的受损时间。保护协议单元处理告警的具体步骤如图 4所示，包括：步骤 401 :保护协议单元判断接收到的告警的类型，若为保护通道告警，则执行步 4聚 402; 若为工作通道告警，则执行步 4聚 403; 步骤 402: 记录告警信息并将保护通道的状态标记为有告警，本次告警处理结束；步骤 403 : 判断是否需要立即启动恢复操作，若是，执行步骤 404; 否则，执行步 4聚 405; 本步骤通过查看当前业务保护通道的状态，若可用，则不需要立即启动恢复操作；若不可用，则需要立即启动恢复操作，保护通道不可用情况包括：

( 1 ) 存在故障告警时； ( 2 ) 保护通道处于 "非使能"状态时； ( 3 ) 保护通道已经不能保证业务的正常运行。步 4聚 404: 通知恢复协议单元启动恢复操作；步骤 405 : 启动 APS操作。通过该实施例，实现了保护协议单元处理告警的具体处理过程。恢复协议单元处理告警的具体步骤如图 5所示，包括：步骤 501 : 恢复协议单元启动定时时时长为 holdoff的定时器；步骤 502: 判断是否收到来自保护协议单元的通知，若是，则执行步骤

505; 否则，执行步 4聚 503; 步骤 503 : 判断定时器是否到时，若是，则执行步骤 504; 否则，执行步骤 502; 步骤 504;查看工作通道检测单元是否存在告警，若是，则执行步骤 505; 否则，本次告警处理结束；步骤 505 : 启动恢复操作，本次告警处理结束。通过该实施例，实现了恢复协议单元处理告警的具体处理过程。如图 6所示，是本发明在业务具有 1+1保护与恢复属性情况下的实施例网络拓朴结构示意图；图中，节点 A与节点 C之间存在一对业务 1 , 其工作路径为节点 A、节点 B与节点 C, 该业务具有 1+1保护属性，其保护路径为节点 A、节点 I与节点 C; 同时，该业务还具有恢复属性，当其工作路径与保护路径都出现故障时，需要对业务进行恢复操作。假设业务 1的保护路径中的跨段 9出现故障，则保护协议单元的处理流程为：步骤 6a: 节点 A与节点 C的保护协议单元接收到告警；步骤 6b: 保护协议单元对告警资源的类型进行判断，确定为保护通道告警；步骤 6c: 保护协议单元记录该告警信息，并将业务 1 的保护通道的状态标记为"有告警，，。设此时业务 1的工作路径的跨段 1也出现了故障，则保护协议单元的处理流程为：步骤 6a，：保护协议单元对告警资源的类型进行判断，确定为工作通道告警；步骤 6b，：保护协议单元查看业务 1的保护通道的状态，为有告警，因此需要立即启动恢复操作；步骤 6c，：保护协议单元向恢复协议单元发出"立即启动恢复操作，，的通知。跨段 1 出现故障后恢复协议单元的处理流程为：步骤 6A: 恢复协议单元接收到业务 1的工作通道告警；步骤 6B：启动定时时间为 holdoff的定时器，其中 holdoff的值设置为

50ms (因为 1+1保护的倒换时间一般都在 50ms以内）；步骤 6C: 等待定时器超时期间，接收到了来自于保护协议单元的通知；步骤 6D: 立即启动恢复操作，即启动 ASON的业务恢复机制，以尽快为业务 1进行重路由，减少业务受损时间。在步骤 6D中，通过 ASON的业务恢复机制，最终给业务 1重路由得到的恢复路径为节点 A、节点 G、节点 F、节点 E、节点 D到节点 C, 即图 6 中的细虚线所示路径。在本实施例中，当业务 1的工作通道与保护通道都出现故障告警时，因为没有等待 holdoff时间就利用 ASON对业务 1进行了恢复操作，因此减少了业务 1的中断时间。如图 7所示，是本发明在业务具有复用段共享保护与恢复属性情况下的实施例网络拓朴结构示意图；其中，节点 E与节点 G之间存在一对业务（记为业务 2 ), 其工作路径为节点 E、节点 F与节点 G; 业务 2具有复用段共享保护属性，当跨段 5 出现故障后，业务 2的保护路径为节点 E、节点 D、节点、节点 K、节点 J、节点 I、节点 G、节点 F、然后再到节点 G; 同时，业务 2还具有恢复属性，当其工作路径与保护路径都出现故障时，需要对业务进行恢复操作。具体地，本实施例涉及以下步骤：当业务 2的保护路径中的跨段 10出现故障后，保护协议单元的处理流程为：步骤 7a: 节点 I与节点 J的保护协议单元接收到告警；步骤 7b: 保护协议单元判断告警的类型，确定为保护通道告警；步骤 7c: 保护协议单元记录该告警信息，将业务 2的保护通道的状态标记为 "有告警"。当业务 2的工作路径的跨段 5出现故障后，保护协议单元的处理流程为：步骤 7a，：保护协议单元判断告警类型，确定为工作通道告警；步骤 7b，：保护协议单元查看业务 2的保护通道的状态，为有告警，由于业务 2的工作通道与保护通道都存在故障告警，所以需要立即启动恢复操作；步骤 7c，：保护协议单元向恢复协议单元发出"立即启动恢复操作，，的通知。当跨段 5出现故障后恢复协议单元的处理流程为: 步骤 7A: 恢复协议单元接收到业务 2的工作通道资源的告警；步骤 7B：启动定时时间为 holdoff的定时器，其中 holdoff的值设置为 50ms (因为复用段共享保护的倒换时间一般都在 50ms以内）；步骤 7C: 等待定时器超时期间，恢复协议单元接收到了来自于保护协议单元的立即启动恢复的通知；步骤 7D: 立即启动恢复操作，即启动 ASON的业务恢复机制，以尽快为业务 2进行重路由，减少业务受损时间。在步骤 7D中，通过 ASON的业务恢复机制，最终给业务 2重路由得到的恢复路径为节点 E、节点 H与节点 G, 如图 7中的细虚线所示路径。在本实施例中，当业务 2的工作通道与保护通道都出现故障告警时，因为没有等待 holdoff时间就利用 ASON对业务 2进行了恢复操作，因此减少了业务 2 的中断时间。以上所述仅为本发明的较佳实施例而已，并非用于限制本发明的保护范围。应当理解的是，对本发明技术所在领域的普通技术人员来说，可以根据本发明的技术方案及其构思进行相应的等同改变或替换，而所有这些改变或替换，都应属于本发明所附权利要求的保护范围。

Claims

权利要求书一种协调自动保护倒换操作与恢复操作的装置，包括工作通道检测单元、保护十办议单元以及恢复十办议单元；所述工作通道检测单元用于对业务的工作通道进行故障监视，并在所述工作通道出现故障时上 ^艮工作通道告警给所述保护协议单元和所述恢复协议单元；其特征在于：所述保护协议单元用于接收所述工作通道告警，并对所述工作通道告警判断是否需要立即启动恢复操作，且需要时，通知所述恢复协议单元立即启动恢复操作，否则，启动自动保护倒换操作；

所述恢复协议单元用于接收所述工作通道告警和所述立即启动恢复操作通知，当接收到所述立即启动恢复操作通知时，或者当接收到的所述工作通道告警超时依然存在时，启动恢复操作。如权利要求 1 所述的协调自动保护倒换操作与恢复操作的装置，其特征在于：所述装置还包括保护通道检测单元，用于对业务的保护通道进行故障监视，并在所述保护通道出现故障时上报保护通道告警给所述保护协议单元；所述保护协议单元还用于接收所述保护通道告警。如权利要求 2所述的协调自动保护倒换操作与恢复操作的装置，其特征在于：所述保护协议单元还用于判断接收到的告警的类型，并在接收到所述保护通道告警时记录所述保护通道告警的信息并将所述保护通道的状态标记为有告警。一种协调自动保护倒换操作与恢复操作的方法，其特征在于，包括以下步骤：

当前业务的工作通道产生故障时，工作通道检测单元上 4艮工作通道告警给本节点的保护协议单元以及恢复协议单元；

所述恢复协议单元接收所述工作通道告警后启动定时器，所述保护协议单元接收所述工作通道告警后判断是否需要立即启动恢复操作，若是，所述保护协议单元通知所述恢复协议单元立即启动恢复操作，所述恢复协议单元收到通知后立即启动恢复操作，本次告警处理完毕。

5. 如权利要求 4所述的协调自动保护倒换操作与恢复操作的方法，其特征在于：在所述保护协议单元接收所述工作通道告警后判断是否需要立即启动恢复操作之后，若判断的结果为无需立即启动恢复操作，则所述保护协议单元启动自动保护倒换操作；所述恢复协议单元等待所述定时器超时后查看所述工作通道检测单元是否依然存在告警，若是，则启动恢复操作，之后本次告警处理完毕，否则，本次告警处理完毕。

6. 如权利要求 4所述的协调自动保护倒换操作与恢复操作的方法，其特征在于：若当前业务的保护通道产生故障，则保护通道检测单元上 4艮保护通道告警给所述本节点的保护协议单元。

7. 如权利要求 4或 6所述的协调自动保护倒换操作与恢复操作的方法，其特征在于：所述保护协议单元接收到告警后，判断所述告警的类型，若为所述工作通道告警，则所述恢复协议单元接收所述工作通道告警后启动定时器，所述保护协议单元接收所述工作通道告警后判断是否需要立即启动恢复操作；若为所述保护通道告警，则记录所述保护通道告警的信息并将所述保护通道的状态标记为有告警。

8. 如权利要求 7所述的协调自动保护倒换操作与恢复操作的方法，其特征在于，所述保护协议单元釆用如下方法判断是否需要立即启动恢复操作：

查看当前业务的所述保护通道的状态是否为有告警，若是，需要立即启动恢复操作，否则，进一步查看所述业务的保护组是否处于非使能状态，若是，需要立即启动恢复操作，否则，无需立即启动恢复操作。

9. 如权利要求 4所述的协调自动保护倒换操作与恢复操作的方法，其特征在于，所述保护协议单元通过但不限于数据通信网络、高级数据链路控制协议总线、 CPU内部进程间通讯方式通知所述恢复协议单元立即启动恢复操作。

10. 如权利要求 6所述的协调自动保护倒换操作与恢复操作的方法，其特征在于，所述保护通道检测单元通过但不限于数据通信网络、高级数据链路控制协议总线方式将告警上报给所述保护协议单元。