WO2017219775A1

WO2017219775A1 - 一种配置状态回退方法、装置和计算机存储介质

Info

Publication number: WO2017219775A1
Application number: PCT/CN2017/083729
Authority: WO
Inventors: 梅俊; 李金�; 雷华; 朱常松; 于同泉
Original assignee: 中兴通讯股份有限公司
Priority date: 2016-06-22
Filing date: 2017-05-10
Publication date: 2017-12-28
Also published as: CN107528709A

Abstract

本发明实施例公开了一种任务回退方法、装置和计算机存储介质，所述方法包括：获取任务和所述任务对应的反向任务；所述任务用于对至少一台网络设备进行配置，所述反向任务用于将根据所述任务配置成功的网络设备进行回退，使所述网络设备回退到配置前状态；若所述任务未完全执行成功，则执行反向任务，使所述任务对应的所有网络设备回退到配置前的状态。

Description

一种配置状态回退方法、装置和计算机存储介质

相关申请的交叉引用

本申请基于申请号为201610457995.3、申请日为2016年06月22日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本发明涉及通信领域，尤其涉及一种配置状态回退方法、装置和计算机存储介质。

背景技术

随着通信技术的发展，网络中的设备越来越多，由于网络结构的复杂性，导致对网络设备的管理特别困难，实现业务的部署也特别困难。为了实现对网络设备的集中控制，在采用SDN(Software Defined Network，软件定义网络)控制器实现同时向多台网络设备下发配置时，为了保证对多台网络设备进行配置的原子性和一致性，若某个网络设备配置失败，那么所有的网络设备都应该恢复到原来状态，而为了将配置成功的网络设备恢复到配置前状态，需要运维人员逐个进行恢复配置，耗费人力、时间，运维效率很低。

发明内容

本发明实施例期望提供一种配置状态回退方法、装置和计算机存储介质，解决现有技术中，在实现同时对多台网络设备进行配置时，若某个网络设备配置失败，由运维人员逐个将配置成功的网络设备恢复到配置前状态，耗费人力、时间，运维效率低下的问题。

本发明实施例提供一种配置状态回退方法，包括：

获取任务和所述任务对应的反向任务；所述任务用于对至少一台网络设备进行配置，所述反向任务用于将根据任务配置成功的网络设备进行回退，使所述网络设备回退到配置前状态；

若任务未完全执行成功，则执行反向任务，使任务对应的所有网络设备回退到配置前的状态。

本发明实施例还提供一种配置状态回退装置，包括：

获取模块，配置为获取任务和所述任务对应的反向任务；所述任务用于对至少一台网络设备进行配置，所述反向任务用于将根据任务配置成功的网络设备进行回退，使所述网络设备回退到配置前状态；

处理模块，配置为若任务未完全执行成功，则执行反向任务，使任务对应的所有网络设备回退到配置前的状态。

本发明实施例还提供一种计算机存储介质，计算机存储介质中存储有计算机可执行指令，计算机可执行指令用于执行本发明实施例的配置状态回退方法。

本发明实施例提供的配置状态回退方法、装置和计算机存储介质，通过获取任务和所述任务对应的反向任务；所述任务用于对至少一台网络设备进行配置，所述反向任务用于将根据所述任务配置成功的网络设备进行回退，使所述网络设备回退到配置前状态；若所述任务未完全执行成功，则执行所述反向任务，使所述任务对应的所有网络设备回退到配置前的状态；采用上述方案，在根据任务对多台网络设备进行配置时，可能出现部分网络设备配置成功，部分网络设备配置失败的情况，反向任务用于将配置成功的网络设备进行回退，使其回退到配置前状态，由此保证所有的网络设备均处于配置之前的状态，保证了对至少一台网络设备配置的原子性和一致性，且反向任务是自动执行的，无需运维人员逐个对网络设备进行操作，提高了运维效率，保证了运维工作得到简化，提高业务部署的效率和灵活性。

附图说明

图1为本发明实施例一提供的一种配置状态回退方法的流程图；

图2为本发明实施例一提供的transaction(事务)的存储架构的结构示意图；

图3为本发明实施例一提供的任务各状态之间变更的示意图；

图4为本发明实施例一提供的一种配置状态回退方法的流程图；

图5为本发明实施例一提供的一种网络结构示意图；

图6为本发明实施例二提供的一种配置状态回退装置的结构示意图。

具体实施方式

下面通过具体实施方式结合附图对本发明实施例作进一步详细说明。

实施例一

为了保证对多台网络设备进行配置的原子性和一致性，且为了提高了运维效率，提高业务部署的效率和灵活性，本实施例提供一种配置状态回退方法，请参见图1，包括以下步骤：

S101：获取任务和所述任务对应的反向任务，所述任务用于对多台网络设备进行配置，所述反向任务用于将根据任务配置成功的网络设备进行回退，使所述网络设备回退到配置前状态。

为了实现对网络设备的集中控制，采用SDN控制器实现同时向至少一台网络设备下发配置，SDN控制器获取任务和所述任务对应的反向任务；所述任务用于对至少一台网络设备进行配置。SDN控制器在获取到由调度层下发的任务后，创建与该任务对应的反向任务，反向任务用于将根据任务配置成功的网络设备进行回退，使得配置的至少一台网络设备都处于配置前的状态，在根据所述任务对至少一台网络设备进行配置时，可能出现部分网络设备配置成功，部分网络设备配置失败的情况，反向任务用于将配置成功的网络设备进行回退，使其回退到配置前状态。

S102：若任务未完全执行成功，则执行反向任务，使所述任务对应的所有网络设备回退到配置前的状态。

在任务未完全执行成功的情况下，则执行反向任务，使任务对应的所有网络设备回退到配置前的状态，保证了对至少一台网络设备进行配置的原子性和一致性，且提高了运维效率，保证了运维工作得到简化，提高业务部署的效率和灵活性。

其中，任务包括至少一个子任务，每个子任务对应一个反向子任务；一个子任务用于配置一台网络设备，一个反向子任务用于将根据子任务配置成功的一台网络设备进行回退，使所述网络设备回退到配置前状态，例如当任务包括A、B、C这3个子任务，子任务A、B、C分别用于配置网络设备X、Y、Z，每个子任务对应一个反向子任务，子任务A、B、C的反向子任务分别为a、b、c，在根据子任务A对网络设备X进行配置时，可能出现网络设备X配置成功，也可能出现网络设备X配置失败的情况，若子任务B、C至少一个失败、且子任务A成功，反向子任务a用于将配置成功的网络设备X进行回退，使其回退到配置前状态。

若任务未完全执行成功，则执行反向任务包括：若所述至少一个子任务中存在子任务执行失败，确定所述子任务对应的反向子任务，执行除所述反向子任务外的其他反向子任务。

在确定所述子任务对应的反向子任务之前，还包括：执行所有子任务，并在接收所有子任务的执行结果后，判断是否存在子任务执行失败。

由于执行失败的子任务表明该子任务对应的网络设备未配置成功，为了保证对至少一台网络设备进行配置的原子性和一致性，所以配置未成功的网络设备则不用将其配置状态进行回退，也即不用执行其对应的反向子任务。所以只需将执行成功的子任务所对应的网络设备的配置状态进行回退即可，也即只需将配置成功的网络设备恢复到其配置前的状态即可。

当同时对至少一台网络设备进行配置时，为了保持原子性和一致性，若至少一台网络设备配置失败，则所有的网络设备的状态都需要恢复到配置前的状态，采用上述方案，为每台网络设备都设置一个子任务和一个对应的反向子任务，子任务用于对网络设备进行配置，反向子任务用于使一台配置成功的网络设备回退到其配置前的状态，若至少一个子任务执行失败，确定其分别对应的反向子任务，自动执行除对应的反向子任务外的所有反向子任务，使得配置成功的网络设备回退到其配置前的状态，若配置成功的网络设备有多台，则自动执行这多台网络设备对应的反向子任务，无需人工操作，提高了运维效率，保证了运维工作得到简化，提高业务部署的效率和灵活性。

其中，所述至少一个子任务中存在子任务执行失败包括：所述至少一个子任务中存在子任务的执行时间超过预设的执行时间阈值。在同时对至少一台网络设备进行配置时，每台网络设备对应的子任务同时开始执行，当存在子任务的执行时间超过预设的执行时间阈值时，则认为该子任务执行失败。

本实施例中，执行反向子任务的时间点为：待所有的子任务执行完成，则开始执行反向子任务；或者，待所述至少一个子任务中任一子任务的执行时间超过预设的执行时间阈值，则开始执行所述子任务对应的反向子任务。

任务包括至少一个子任务，如果某个子任务因为网络故障或其他原因长时间没有返回执行结果，这就会影响到整个任务的执行状态，所以为子任务的执行时长设置一个阈值是必要的，当达到预设的执行时间阈值仍然没有返回，就认为子任务执行失败。

任务包括至少一个子任务，子任务的状态可以决定出任务的状态。子任务的执行时间超过预设的执行时间阈值，该子任务也是执行失败。只要有一个子任务执行失败，则任务的状态为执行失败；若全部子任务执行成功，任务的状态才为执行成功。

当任务中出现第一个子任务执行失败，或者出现子任务执行时间超过预设的执行时间阈值时，则SDN控制器及时将任务执行失败的结果上报给调度层。

本实施例提供了一种同时对至少一台网络设备进行配置的transaction机制，也即提供一种同时对至少一台网络设备进行配置的一个任务。transaction包括两个属性：原子性和一致性。原子性是指一个transaction是一个不可分割的工作单位，transaction中包括的操作要么都做，要么都不做。一致性是指transaction必须是使数据库从一个一致性状态变到另一个一致性状态。一致性与原子性是密切相关的。本实施例提供的transaction机制可以保证这个transaction要么全部配置成功，要么全部配置失败。

为了实现对网络设备的集中控制，采用SDN控制器实现同时向至少一台网络设备下发配置，SDN控制器可以分为客户端和服务器端，transaction机制由调度层发起，调度层下发此次任务给客户端，任务中携带一个标识符，用来表示一次调度的任务，并通过该标识符监听该次任务的执行结果。客户端收到任务后，客户端先处理本次任务，并获取本次任务的执行结果，将任务执行结果以及标识符一起通告给调度层。调度层与客户端之间的调度是异步执行的，即调度层不需要等待客户端的结果，而是客户端主动将结果上报给调度层。调度层的请求需要客户端与服务器端协作共同完成。

客户端收到由调度层发来的任务后，先解析任务，计算要配置的网络设备数目，然后向服务器端发送申请分配对应数目的子标识符的请求。服务器端收到客户端发来的请求后，服务器端创建并存储如图2所示的transaction结构，并将各子标识符组成的字符串数组返回给客户端。transaction结构中，F表示客户端收到任务所携带的标识符，S1、S2、S3…Sn表示客户端向服务器端申请到的子标识符。服务器端将任务和反向任务进行存储，任务用于对多台网络设备进行配置，反向任务用于将根据任务配置成功的网络设备进行回退，使其回退到配置前状态。

申请到子标识符后，客户端为每一台网络设备构建一个进行配置的子任务，每个子任务用一个子标识符进行标识，并通过该子标识符跟踪并监听子任务的执行结果。在为每一台网络设备构建一个子任务时，还会同时构建一个与该子任务对应的反向子任务，反向子任务用于将根据子任务配置成功的一台网络设备进行回退，使其回退到配置前状态。

客户端获得子任务的执行结果后，将子任务的执行结果通告给服务器端，但是客户端并不知道整个任务的执行结果，客户端向服务器端发送申请查询整个任务的执行结果的请求，服务器端在收到子任务的执行结果后，先设置对应子任务的状态。服务器端遍历各子任务的状态，更新任务的状态，并将任务的状态返回给客户端。子任务执行后的状态分为SUCCESS(成功)和FAIL(失败)。服务器端返回给客户端的任务的状态包含WAIT(等待)、SUCCESS、FAIL和DISCARD(丢弃)。其中，WAIT表示部分子任务执行成功，其他子任务仍然在执行的状态，当服务器端返回的状态是等待状态，说明整个任务还没有完成，要继续等待。SUCCESS表示所有的子任务都已经执行成功，服务器端返回该状态说明整个任务执行成功。FAIL表示一旦发现其中的某一个子任务执行失败，则将整个任务的状态设置为失败，服务器端返回该状态说明整个任务执行失败。DISCARD表示在当前子任务执行结束前，已经有子任务执行失败，服务器端返回该状态说明整个任务执行失败，并且已经上报给调度层，客户端收到DISCARD不再做任何处理。

由于客户端是在获得子任务的执行结果后，才向服务器端发送申请查询整个任务的执行结果的请求，所以服务器端返回给客户端的任务的状态是WAIT、SUCCESS、FAIL和DISCARD这四种中的一种。而任务的状态还包括START(启动)，服务器端在创建并存储如图2所示的transaction结构后，将任务的状态置为START，并将子标识符返回给客户端。

参见图3，任务的各状态之间的变更具体如下：

START到WAIT：进入START后，服务器端就随时等着客户端通告子任务的执行结果，当服务器端收到的第一个子任务的执行结果是执行成功时，任务的状态就从START转化到WAIT。

WAIT到SUCCESS：若任务的状态是WAIT，说明已有部分子任务执行成功，尚未出现执行失败的子任务。当服务器端收到的通告是最后一个子任务的执行结果、且最后一个子任务执行成功时，任务的状态便从WAIT到SUCCESS。

WAIT到FAIL：若任务的状态是WAIT，说明已有部分子任务执行成功，尚未出现执行失败的子任务。当服务器端收到的子任务的执行结果是执行失败时，任务的状态便从WAIT到FAIL。

FAIL到DISCARD：若任务的状态是FAIL，说明已有一个子任务执行失败，整个任务已经失败，当前子任务的执行结果不会影响任务的状态，即一个子任务已经执行失败，不用管在这个子任务之后的一个子任务的执行结果是成功还是失败，此时任务的状态便从FAIL到DISCARD。

DISCARD到DISCARD：若任务的状态是DISCARD，整个任务已经失败，当前子任务的执行结果不会影响任务的状态，即不用管当前子任务的执行结果是成功还是失败，此时任务的状态便从DISCARD到DISCARD，即还是DISCARD状态。

客户端根据收到的任务状态进行处理，原则是：WAIT表示任务没有执行结束，不处理，不会上报给调度层；SUCCESS表示执行成功，上报给调度层；FAIL表示执行失败，上报给调度层；DISCARD表示任务已经执行失败，不再做任何处理。

当一个任务在服务器端存储时间超过预设的执行时间阈值，服务器端告诉客户端任务超时，客户端如果收到服务器端发来的任务超时的信息，则表示任务执行失败，上报给调度层同时释放相关资源。

其中，当由于某个子任务执行失败而导致整个任务执行失败时，为了保证任务的原子性和一致性，采用回退机制将执行成功的子任务进行回退，使得配置成功的网络设备回退到配置前状态。若至少一个子任务执行失败，则确定其分别对应的反向子任务，执行除对应的反向子任务外的所有反向子任务。由于执行失败的子任务表明该子任务对应的网络设备未配置成功，为了保证对多台网络设备进行配置的原子性和一致性，所以配置未成功的网络设备则不用将其状态进行回退，也即不用执行其对应的反向子任务。所以只需将执行成功的子任务进行回退即可，也即只需将配置成功的网络设备恢复到其配置前的状态即可。

在本实施例中，SDN控制器到网络设备的配置操作是最底层、最基础的操作，SDN控制器使用的南向通道需保证这个配置操作的原子性、是按transaction方式进行处理的。例如SDN控制器可使用NETCONF(Network Configuration Protocol，网络配置协议)作为南向通道，NETCONF本身可以保证一次NETCONF报文交互的原子性，所以对于最基础配置操作，如果产生错误，也不需要回退。故如果整个任务执行失败，需要回退的部分是整个任务中执行成功的那些子任务。

本实施例中要求客户端在构建正向的配置子任务的同时，构建与之对应的反向子任务，并将该反向子任务交由服务器端管理，该反向子任务将在需要回退时调用。回退的时机在所有子任务均执行完以后；或者在服务器端判断某个子任务的执行时间超过预设的执行时间阈值，这时认为该子任务执行失败，需要将已经执行成功的子任务进行回退，对于超时任务中还没有执行结束的子任务，默认为执行失败，不做回退处理。

由服务器端对反向子任务进行调度，服务器端判断出任务满足执行失败或超时，以及回退时机的条件后，服务器端可直接进行回退处理，客户端和调度层不需要感知回退处理流程。

参见图4，本实施例还例举一个具体的例子进行说明，具体如下：

本实施例使用NETCONF作为SDN控制器的南向通道。原因有下面几点：1、NETCONF使用XML(Extensible Markup Language，可扩展标记语言)作为配置数据和协议消息的编码方式，XML可以表达复杂的、具有内在逻辑关系的模型化的管理对象，大大提高了操作效率和对象标准化。根据XML的这一优势，配置之间的依赖关系可以利用XML表达出来，从而屏蔽掉NETCONF操作层面对依赖关系的感知。2、NETCONF设备只要实现了错误回退能力urn:ietf:params:netconf:capability:rollback-on-error:1.0，参见rfc6241，在构建配置报文时将配置报文的error-option(出错选项)设置为rollback-on-error(回退错误)，就能保证每一个NETCONF报文的配置操作的原子性。3、构建NETCONF报文的反向报文也很容易。

图5是一个使用SDN控制器进行集中控制的网络，假设调度层下发给SDN控制器一个任务：创建一条S1到S7的隧道。下面详细描述采用transaction机制是如何使这次配置作为一个任务配置到多台网络设备上的。

S201：调度层下发给SDN控制器的客户端一个任务：创建一条S1到S7的隧道。任务中携带一个标识符。

调度层下发给SDN控制器的客户端一个任务：创建一条S1到S7的隧道。任务中携带一个标识符create-tunnel-1(创建-隧道-1)和创建隧道的相关信息。调度层通过异步方式调用这个任务，然后将create-tunnel-1添加到监听执行结果的队列中，然后返回。

S202：客户端计算出配置该隧道需要同时配置S1、S2、S3、S7这四个节点，故向服务器端发送申请分配四个子标识符的请求。

SDN控制器的客户端收到标识符为create-tunnel-1的任务后，结合SDN控制器上的拓扑信息计算出配置该隧道需要同时配置S1、S2、S3、S7这四个节点，一共需要四个子任务来完成本次配置，故向服务器端发送申请分配四个子标识符的请求。

S203：服务器端分配四个子标识符，并返回给客户端。

服务器端收到标识符为create-tunnel-1和子标识符个数为4的请求后，服务器端创建存储架构，包含一个任务的标识符和四个子任务的子标识符，四个子任务分别分配到create-tunnel-1-s1、create-tunnel-1-s2、create-tunnel-1-s3、create-tunnel-1-s7作为子标识符，并将子标识符返回给客户端，同时将任务的状态设置为START。子标识符用来标记和跟踪对应的子任务。

S204：客户端构建四个子任务和四个对应的反向子任务，将构建出来的反向子任务托管到服务器端。每个子任务都携带一个子标识符。

客户端收到四个子标识符后，构建四个子任务和四个对应的反向子任务，构建的四个子任务均以报文形式构建，构建的四个反向子任务也以报文形式构建，将构建出来的反向子任务托管到服务器端。每个子任务都携带一个子标识符，按异步方式执行子任务，通过子标识符监听子任务的执行结果。

S205：客户端监听子任务的执行结果，将子任务的执行结果告知服务器端，并等待服务器端返回任务的状态，根据任务的状态进行相应处理。客户端一直重复S205的操作，直到所有子任务都返回执行结果。

若客户端收到服务器端返回的任务状态为WAIT，表示任务没有执行结束，客户端不处理，不会上报给调度层；若客户端收到服务器端返回的任务状态为SUCCESS，表示执行成功，客户端上报给调度层；若客户端收到服务器端返回的任务状态为FAIL，表示执行失败，客户端上报给调度层；若客户端收到服务器端返回的任务状态为DISCARD表示任务已经执行失败，客户端不再做任何处理。

S206：服务器端通过子标识符找到存储的对应的子任务，并设置其状态。然后遍历另外所有的子任务，根据状态转换机制计算出任务的状态，并将任务的该状态返回给客户端。同时服务器端判断所有的子任务是否全部执行结束，若是则进一步判断计算出任务的状态是SUCCESS、FAIL或DISCARD，根据任务的状态做相应处理。

服务器端收到客户端发送的子任务的执行结果，以及查询任务状态的请求后，通过子任务携带的子标识符找到存储的对应的子任务，并设置其状态。然后遍历另外所有的子任务，根据状态转换机制计算出任务的状态，并将任务的该状态返回给客户端。同时服务器端判断所有的子任务是否全部执行结束，若是则进一步判断计算出任务的状态是SUCCESS、FAIL或DISCARD，如果是SUCCESS，则删除任务及其包含的子任务，释放资源；如果是FAIL或DISCARD，则触发回退流程，调用已经执行成功的子任务对应的反向子任务，待反向子任务执行结束后，删除任务及其包含的子任务，释放资源。

S207：服务器端检查到子任务的执行时间超过预设的执行时间阈值，则通知客户端任务失败，并且触发回退流程，调用已经执行成功的子任务对应的反向子任务，待反向子任务执行结束后，删除任务及其包含的子任务，释放资源。

根据本实施例提供的配置状态回退方法，通过获取任务和对应的反向任务；任务用于对至少一台网络设备进行配置，反向任务用于将根据任务配置成功的网络设备进行回退，使网络设备回退到配置前状态；若任务未完全执行成功，则执行反向任务，使任务对应的所有网络设备回退到配置前的状态；采用上述方案，在根据任务对至少一台网络设备进行配置时，可能出现部分网络设备配置成功，部分网络设备配置失败的情况，反向任务用于将配置成功的网络设备进行回退，使其回退到配置前状态，由此保证所有的网络设备均处于配置之前的状态，保证了对多台网络设备配置的原子性和一致性，且反向任务是自动执行的，无需运维人员逐个对网络设备进行操作，提高了运维效率，保证了运维工作得到简化，提高业务部署的效率和灵活性。

实施例二

为了保证对多台网络设备进行配置的原子性和一致性，且为了提高了运维效率，提高业务部署的效率和灵活性，本实施例还提供一种配置状态回退装置，请参见图6，包括：

获取模块601，配置为获取任务和所述任务对应的反向任务，所述任务用于对至少一台网络设备进行配置，所述反向任务用于将根据任务配置成功的网络设备进行回退，使所述网络设备回退到配置前状态；

处理模块602，配置为若任务未完全执行成功，则执行反向任务，使任务对应的所有网络设备回退到配置前的状态。

为了实现对网络设备的集中控制，采用获取模块601获取任务和所述任务对应的反向任务；所述任务用于对至少一台网络设备进行配置，所述反向任务用于将根据任务配置成功的网络设备进行回退，使所述网络设备回退到配置前状态，在根据任务对至少一台网络设备进行配置时，可能出现部分网络设备配置成功，部分网络设备配置失败的情况，所述反向任务用于将配置成功的网络设备进行回退，使其回退到配置前状态。

所述获取模块601在获取到由调度层下发的任务后，由所述处理模块602创建与该任务对应的反向任务，所述反向任务用于将根据任务配置成功的网络设备进行回退，使所述网络设备回退到配置前状态。在所述任务未完全执行成功的情况下，所述处理模块602执行所述任务对应的反向任务，使所述任务对应的所有网络设备回退到配置前的状态，保证了对至少一台网络设备进行配置的原子性和一致性，且提高了运维效率，保证了运维工作得到简化，提高业务部署的效率和灵活性。

其中，任务包括至少一个子任务，每个子任务对应一个反向子任务；一个子任务用于配置一台网络设备，一个反向子任务用于将根据子任务配置成功的一台网络设备进行回退，使所述网络设备回退到配置前状态，例如当任务包括A、B、C这3个子任务，子任务A、B、C分别用于配置网络设备X、Y、Z，每个子任务对应一个反向子任务，子任务A、B、C的反向子任务分别为a、b、c，在根据子任务A对网络设备X进行配置时，可能出现网络设备X配置成功，也可能出现网络设备X配置失败的情况，若子任务B、C至少一个失败、且子任务A成功，反向子任务a用于将配置成功的网络设备X进行回退，使其回退到配置前状态。处理模块602用于：若至少一个子任务执行失败，确定其分别对应的反向子任务，执行除对应的反向子任务外的所有反向子任务。

所述处理模块602配置为：若所述至少一个子任务中存在子任务执行失败，确定所述子任务对应的反向子任务，执行除所述反向子任务外的其他反向子任务。

所述处理模块602还配置为若所述至少一个子任务中存在子任务执行失败，确定所述子任务对应的反向子任务之前，执行所有子任务，并在接收所有子任务的执行结果后，判断是否存在子任务执行失败。

由于执行失败的子任务表明该子任务对应的网络设备未配置成功，为了保证对至少一个网络设备进行配置的原子性和一致性，所以配置未成功的网络设备则不用将其配置状态进行回退，也即不用执行其对应的反向子任务。所以只需将执行成功的子任务进行回退即可，也即只需将配置成功的网络设备恢复到其配置前的状态即可。

当同时对至少一台网络设备进行配置时，为了保持原子性和一致性，若至少一台网络设备配置失败，则所有的网络设备的状态都需要恢复到配置前的状态，采用上述方案，为每台网络设备都设置一个子任务和一个对应的反向子任务，子任务用于对网络设备进行配置，反向子任务用于使一台配置成功的网络设备回退到其配置前的状态，若至少一个子任务执行失败，则所述处理模块602确定其分别对应的反向子任务，自动执行除对应的反向子任务外的所有反向子任务，使得配置成功的网络设备回退到其配置前的状态，若配置成功的网络设备有多台，则至少一处理模块602自动执行这多台网络设备对应的反向子任务，无需人工操作，提高了运维效率，保证了运维工作得到简化。

其中，所述处理模块配置为602：判断所述至少一个子任务中是否存在子任务的执行时间超过预设的执行时间阈值；当判定所述至少一个子任务中存在子任务的执行时间超过预设的执行时间阈值时，确定所述子任务对应的反向子任务，执行除所述反向子任务外的其他反向子任务。在同时对至少一台网络设备进行配置时，每台网络设备对应的子任务同时开始执行，当至少一个子任务的执行时间超过预设的执行时间阈值时，则认为至少一个子任务执行失败。

所述处理模块602配置为，待所有的子任务执行完成，开始执行反向子任务；或者，待所述至少一个子任务中任一子任务的执行时间超过预设的执行时间阈值时，开始执行所述子任务对应的反向子任务。

任务包括至少一个子任务，子任务的状态可以决定出任务的状态。子任务的执行时间超过预设的执行时间阈值，该子任务也是执行失败。只要有一个子任务执行失败，则任务的状态为执行失败；若全部子任务执行成功，则任务的状态才为执行成功。

当任务中出现第一个子任务执行失败，或者出现子任务执行时间超过预设的执行时间阈值时，则所述处理模块602及时将任务执行失败上报给调度层。

本实施例提供了一种同时对至少一台网络设备进行配置的transaction机制，也即提供一种同时对至少一台网络设备进行配置的一个任务。transaction包括两个属性：原子性和一致性。原子性是指一个transaction是一个不可分割的工作单位，transaction中包括的操作要么都做，要么都不做。一致性是指transaction必须是使数据库从一个一致性状态变到另一个一致性状态。一致性与原子性是密切相关的。

transaction机制由调度层发起，所述获取模块601获取任务调度层下发的此次任务，任务中携带一个标识符，用来表示一次调度的任务，并通过该标识符监听该次任务的执行结果。所述获取模块601收到任务后，先处理本次任务，并获取本次任务的执行结果，将任务执行结果以及标识符一起通告给调度层。调度层的请求需要所述获取模块601与所述处理模块602协作共同完成。

所述获取模块601收到由调度层发来的任务后，由所述处理模块602先解析任务，计算要配置的网络设备数目，然后分配对应数目的子标识符。所述处理模块602创建并存储如图2所示的transaction结构。transaction结构中，F表示所述获取模块601收到任务所携带的标识符，S1、S2、S3…Sn表示分配到的子标识符。所述处理模块602将任务和反向任务进行存储，任务用于对多台网络设备进行配置，反向任务用于将根据任务配置成功的网络设备进行回退，使其回退到配置前状态。

分配到子标识符后，所述处理模块602为每一台网络设备构建一个进行配置的子任务，每个子任务用一个子标识符进行标识，并通过该子标识符跟踪并监听子任务的执行结果。所述处理模块602在为每一台网络设备构建一个子任务时，还会同时构建一个与该子任务对应的反向子任务，反向子任务用于将根据子任务配置成功的一台网络设备进行回退，使其回退到配置前状态。

所述处理模块602获得子任务的执行结果后，先设置对应子任务的状态。所述处理模块602遍历各子任务的状态，更新任务的状态。子任务执行后的状态分为SUCCESS和FAIL。任务的状态包含WAIT、SUCCESS、FAIL和DISCARD。其中，WAIT表示部分子任务执行成功，其他子任务仍然在执行的状态，当任务的状态是等待状态，说明整个任务还没有完成，要继续等待。SUCCESS表示所有的子任务都已经执行成功，任务的状态为SUCCESS说明整个任务执行成功。FAIL表示一旦发现其中的某一个子任务执行失败，则将整个任务的状态设置为失败，任务的状态为FAIL说明整个任务执行失败。DISCARD表示在当前子任务执行结束前，已经有子任务执行失败，任务的状态为DISCARD说明整个任务执行失败，并且已经上报给调度层。

任务的状态除了WAIT、SUCCESS、FAIL和DISCARD这四种，还有一种状态是START，所述处理模块602在创建并存储如图2所示的transaction结构后，将任务的状态置为START。

参见图3，任务的各状态之间的变更具体如下：

START到WAIT：进入START后，当所述处理模块602收到的第一个子任务的执行结果是执行成功时，任务的状态就从START转化到WAIT。

WAIT到SUCCESS：若任务的状态是WAIT，说明已有部分子任务执行成功，尚未出现执行失败的子任务。当所述处理模块602收到的通告是最后一个子任务的执行结果、且最后一个子任务执行成功时，任务的状态便从WAIT到SUCCESS。

WAIT到FAIL：若任务的状态是WAIT，说明已有部分子任务执行成功，尚未出现执行失败的子任务。当所述处理模块602收到的子任务的执行结果是执行失败时，任务的状态便从WAIT到FAIL。

所述处理模块602根据收到的任务状态进行处理，原则是：WAIT表示任务没有执行结束，不处理，不会上报给调度层；SUCCESS表示执行成功，上报给调度层；FAIL表示执行失败，上报给调度层；DISCARD表示任务已经执行失败，不再做任何处理。

当一个任务在所述处理模块602存储时间超过预设的执行时间阈值，则表示任务执行失败，上报给调度层同时释放相关资源。

其中，当由于某个子任务执行失败而导致整个任务执行失败时，为了保证任务的原子性和一致性，采用回退机制将执行成功的子任务进行回退，使得配置成功的网络设备回退到配置前状态。若至少一个子任务执行失败，则确定其分别对应的反向子任务，执行除对应的反向子任务外的所有反向子任务。。由于执行失败的子任务表明该子任务对应的网络设备未配置成功，为了保证对多台网络设备进行配置的原子性和一致性，所以配置未成功的网络设备则不用将其状态进行回退，也即不用执行其对应的反向子任务。所以只需将执行成功的子任务进行回退即可，也即只需将配置成功的网络设备恢复到其配置前的状态即可。

在本实施例中，到网络设备的配置操作是最底层、最基础的操作，所使用的南向通道需保证这个配置操作的原子性、是按transaction方式进行处理的。例如可使用NETCONF作为南向通道，NETCONF本身可以保证一次NETCONF报文交互的原子性，所以对于最基础配置操作，如果产生错误，也不需要回退。故如果整个任务执行失败，需要回退的部分是整个任务中执行成功的那些子任务。

本实施例中要求在获取正向的配置子任务的同时，并获取与之对应的反向子任务，该反向子任务将在需要回退时调用。回退的时机在所有子任务均执行完以后；或者在所述处理模块602判断出某个子任务的执行时间超过预设的执行时间阈值，这时认为该子任务执行失败，需要将已经执行成功的子任务进行回退，对于超时任务中还没有执行结束的子任务，默认为执行失败，不做回退处理。

由所述处理模块602对反向子任务进行调度，所述处理模块602判断出任务满足执行失败或超时，以及回退时机的条件后，所述处理模块602可直接进行回退处理，调度层不需要感知回退处理流程。

本实施例还例举一个具体的例子进行说明，具体如下：

本实施例使用NETCONF作为南向通道。原因有下面几点：1、 NETCONF使用XML作为配置数据和协议消息的编码方式，XML可以表达复杂的、具有内在逻辑关系的模型化的管理对象，大大提高了操作效率和对象标准化。根据XML的这一优势，配置之间的依赖关系可以利用XML表达出来，从而屏蔽掉NETCONF操作层面对依赖关系的感知。2、NETCONF设备只要实现了错误回退能力urn:ietf:params:netconf:capability:rollback-on-error:1.0，参见rfc6241，在构建配置报文时将配置报文的error-option设置为rollback-on-error，就能保证每一个NETCONF报文的配置操作的原子性。3、构建NETCONF报文的反向报文也很容易。

假设所述获取模块601获取由调度层下发的一个任务：创建一条S1到S7的隧道。下面详细描述采用transaction机制是如何使这次配置作为一个任务配置到多台网络设备上的。

所述获取模块601获取由调度层下发的一个任务：创建一条S1到S7的隧道。任务中携带一个标识符。

所述获取模块601获取由调度层下发的一个任务：创建一条S1到S7的隧道。任务中携带一个标识符create-tunnel-1和创建隧道的相关信息。调度层通过异步方式调用这个任务，然后将create-tunnel-1添加到监听执行结果的队列中，然后返回。

所述处理模块602计算出配置该隧道需要同时配置S1、S2、S3、S7这四个节点，故给每个节点均分配一个子标识符。

所述获取模块601获取到标识符为create-tunnel-1的任务后，结合SDN控制器上的拓扑信息计算出配置该隧道需要同时配置S1、S2、S3、S7这四个节点，一共需要四个子任务来完成本次配置，故给每个节点均分配一个子标识符。并创建存储架构，包含一个任务的标识符和四个子任务的子标识符，四个子任务分别分配到create-tunnel-1-s1、create-tunnel-1-s2、 create-tunnel-1-s3、create-tunnel-1-s7作为子标识符，同时将任务的状态设置为START。子标识符用来标记和跟踪对应的子任务。

所述处理模块602构建四个子任务和四个对应的反向子任务，每个子任务都携带一个子标识符。构建的四个子任务均以报文形式构建，构建的四个反向子任务也以报文形式构建。每个子任务都携带一个子标识符，按异步方式执行子任务，通过子标识符监听子任务的执行结果。

所述处理模块602监听子任务的执行结果，并根据任务的状态进行相应处理。

若任务状态为WAIT，表示任务没有执行结束，处理模块602不处理，不会上报给调度层；若任务状态为SUCCESS，表示执行成功，处理模块602上报给调度层；若任务状态为FAIL，表示执行失败，处理模块602上报给调度层；若任务状态为DISCARD，表示任务已经执行失败，处理模块602不再做任何处理。

所述处理模块602通过子标识符找到存储的对应的子任务，并设置其状态。然后遍历另外所有的子任务，根据状态转换机制计算出任务的状态。同时所述处理模块602判断所有的子任务是否全部执行结束，若是则进一步判断计算出任务的状态是SUCCESS、FAIL或DISCARD，根据任务的状态做相应处理。

所述处理模块602通过子任务携带的子标识符找到存储的对应的子任务，并设置其状态。然后遍历另外所有的子任务，根据状态转换机制计算出任务的状态。同时所述处理模块602判断所有的子任务是否全部执行结束，若是则进一步判断计算出任务的状态是SUCCESS、FAIL或DISCARD，如果是SUCCESS，则删除任务及其包含的子任务，释放资源；如果是FAIL或DISCARD，则触发回退流程，调用已经执行成功的子任务对应的反向子任务，待反向子任务执行结束后，删除任务及其包含的子任务，释放资源。

所述处理模块602检查到子任务的执行时间超过预设的执行时间阈值，，整个任务执行失败，触发回退流程，调用已经执行成功的子任务对应的反向子任务，待反向子任务执行结束后，删除任务及其包含的子任务，释放资源。

本实施例中，所述装置中的获取模块601和处理模块602，在实际应用中均可由所述装置中的CPU(Central Processing Unit，中央处理器)、DSP(Digital Signal Processor，数字信号处理器)、MCU(Microcontroller Unit，微控制单元)或FPGA(Field－Programmable Gate Array，可编程门阵列)实现。

根据本实施例提供的配置状态回退装置，通过所述获取模块601获取任务和所述任务对应的反向任务；任务用于对至少一台网络设备进行配置，反向任务用于将根据任务配置成功的网络设备进行回退，使网络设备回退到配置前状态；所述处理模块602配置为若任务未完全执行成功，则执行反向任务，使任务对应的所有网络设备回退到配置前的状态；采用上述方案，在根据任务对至少一台网络设备进行配置时，可能出现部分网络设备配置成功，部分网络设备配置失败的情况，反向任务用于将配置成功的网络设备进行回退，使其回退到配置前状态，由此保证所有的网络设备均处于配置之前的状态，保证了对多台网络设备配置的原子性和一致性，且反向任务是自动执行的，无需运维人员逐个对网络设备进行操作，提高了运维效率，保证了运维工作得到简化，提高业务部署的效率和灵活性。

在另一实施例中还提供一种计算机存储介质，计算机存储介质中存储有计算机可执行指令，计算机可执行指令用于执行实施例一中任一项的配置状态回退方法。

在本发明所提供的几个实施例中，应该理解到，所揭露的方法及装置，可以通过其他的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个模块或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的通信连接可以是通过一些接口，设备或模块的间接耦合或通信连接，可以是电性的、机械的或其他形式的。

上述作为分离部件说明的模块可以是、或也可以不是物理上分开的，作为模块显示的部件可以是、或也可以不是物理模块，即可以位于一个地方，也可以分布到多个网络模块上；可以根据实际的需要选择其中的部分或全部模块来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能模块可以全部集成在一个处理模块中，也可以是各模块分别单独作为一个模块，也可以两个或两个以上模块集成在一个模块中；上述集成的模块既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、ROM(Read-Only Memory，只读存储器)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本发明实施例上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例中记载的存储器切换方法、装置只以上述实施例为例，但不仅限于此，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

工业实用性

本发明实施例的技术方案在根据任务对多台网络设备进行配置时，可能出现部分网络设备配置成功，部分网络设备配置失败的情况，反向任务用于将配置成功的网络设备进行回退，使其回退到配置前状态，由此保证所有的网络设备均处于配置之前的状态，保证了对多台网络设备配置的原子性和一致性，且反向任务是自动执行的，无需运维人员逐个对网络设备进行操作，提高了运维效率，保证了运维工作得到简化，提高业务部署的效率和灵活性。

Claims

一种配置状态回退方法，包括：

获取任务和所述任务对应的反向任务；所述任务用于对至少一台网络设备进行配置，所述反向任务用于将根据所述任务配置成功的所述网络设备进行回退，使所述网络设备回退到配置前状态；

若所述任务未完全执行成功，则执行所述反向任务，使所述任务对应的所有网络设备回退到配置前的状态。
如权利要求1所述的配置状态回退方法，其中，所述任务包括至少一个子任务，每个所述子任务对应一个反向子任务；一个所述子任务用于配置一台所述网络设备，一个所述反向子任务用于将根据所述子任务配置成功的一台所述网络设备进行回退，使所述网络设备回退到配置前状态；

所述若所述任务未完全执行成功，则执行所述反向任务包括：若所述至少一个子任务中存在子任务执行失败，确定所述子任务对应的反向子任务，执行除所述反向子任务外的其他反向子任务。
如权利要求2所述的配置状态回退方法，其中，所述至少一个子任务中存在子任务执行失败包括：所述至少一个子任务中存在子任务的执行时间超过预设的执行时间阈值。
如权利要求2或3所述的配置状态回退方法，其中，所述执行反向子任务包括：待所有的所述子任务执行完成，开始执行所述反向子任务；或者，待所述至少一个子任务中任一子任务的执行时间超过预设的执行时间阈值，开始执行所述子任务对应的反向子任务。
如权利要求2或3所述的配置状态回退方法，其中，若所述至少一个子任务中存在子任务执行失败，确定所述子任务对应的反向子任务之前，还包括：执行所述至少一个子任务中的所有子任务，并在接收到所有子任务的执行结果后，判断所述至少一个子任务中是否存在子任务执行失败。
一种配置状态回退装置，包括：

获取模块，配置为获取任务和所述任务对应的反向任务；所述任务用于对至少一台网络设备进行配置，所述反向任务用于将根据所述任务配置成功的所述网络设备进行回退，使所述网络设备回退到配置前状态；

处理模块，配置为若所述任务未完全执行成功，则执行所述反向任务，使所述任务对应的所有网络设备回退到配置前的状态。
如权利要求6所述的配置状态回退装置，其中，所述任务包括至少一个子任务，每个所述子任务对应一个反向子任务；一个所述子任务用于配置一台所述网络设备，一个所述反向子任务用于将根据所述子任务配置成功的一台所述网络设备进行回退，使所述网络设备回退到配置前状态；

所述处理模块配置为：若所述至少一个子任务中存在子任务执行失败，确定所述子任务对应的反向子任务，执行除所述反向子任务外的其他反向子任务。
如权利要求7所述的配置状态回退装置，其中，所述处理模块配置为：判断所述至少一个子任务中是否存在子任务的执行时间超过预设的执行时间阈值；当判定所述至少一个子任务中存在子任务的执行时间超过预设的执行时间阈值时，确定所述子任务对应的反向子任务，执行除所述反向子任务外的其他反向子任务。
如权利要求7或8所述的配置状态回退装置，其中，所述处理模块配置为：待所有的所述子任务执行完成，开始执行所述反向子任务；或者，待所述至少一个子任务中任一子任务的执行时间超过预设的执行时间阈值，开始执行所述子任务对应的反向子任务。
如权利要求7或8所述的配置状态回退装置，其中，所述处理模块还配置为：执行所述至少一个子任务中的所有子任务，并在接收到所有子任务的执行结果后，判断所述至少一个子任务中是否存在子任务执行失败；当判定所述至少一个子任务中存在子任务执行失败时，确定所述子任务对应的反向子任务。
一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求1至5任一项所述的配置状态回退方法。