WO2021121067A1

WO2021121067A1 - 一种任务执行的方法及装置

Info

Publication number: WO2021121067A1
Application number: PCT/CN2020/134356
Authority: WO
Inventors: 陈交交; 伦秉力
Original assignee: 深圳前海微众银行股份有限公司
Priority date: 2019-12-20
Filing date: 2020-12-07
Publication date: 2021-06-24
Also published as: CN111158980A

Abstract

一种任务执行的方法及装置，适用于包括监控中心、控制节点、代理节点和执行节点的远程执行系统；方法包括：监控中心获取待执行的第一命令，通过执行节点与管理节点的对照关系，确定第一命令的第一执行节点对应的第一管理节点，将待执行的命令发送给第一管理节点，以从第一管理节点获取执行结果。监控中心接收上层服务发送的命令后直接发送至第一管理节点，提高了任务执行的效率以及系统的可靠性，并对外提供了执行命令的接口，上层服务无需关心将命令交给哪个管理节点执行，只用调用监控中心的接口由监控中心来决定怎么执行，使得系统支持salt二层和三层多环境混合部署，也避免了三层架构中执行结果返回时发生错误。

Description

一种任务执行的方法及装置

相关申请的交叉引用

本申请要求在2019年12月20日提交中国专利局、申请号为201911329738.1、申请名称为“一种任务执行的方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及计算机领域，尤其涉及一种任务执行的方法及装置。

背景技术

早期运维人员会根据自己的生产环境来写特定脚本完成大量重复性工作，这些脚本复杂且难以维护。系统管理员面临的问题中有一个不容忽视就是远程执行命令，因此诞生了saltstack、ansible等系统。

目前，较为主流的远程执行系统为saltstack(简称salt)，首先，对salt系统中的部分用语进行解释说明，以便使本领域技术人员理解。

master：中心管理系统节点，运行salt-master守护进程，用于发送命令和配置到minion。

minion：管理系统(托管系统)节点，运行salt-minion守护进程，用于接收master发送的命令和配置。

syndic：(区域)管理系统节点，运行salt-syndic和salt-master两个守护进程，salt-syndic进程是一种特殊的salt-minion进程，它主要负责接收上层(master节点)的salt-master(又称为master of master)下发的命令并通过本地的salt-master二次下发到连接该salt-master(运行在syndic上的salt-master)的minions上。所以syndic节点上的salt-master是管理区域的minions(区域自治)，master节点上的salt-master可以管理所有的minions。

也就是说，master和syndic均可作为管理节点。下面将结合附图对现有技术作进一步地详细描述。

图1为现有技术中采用master-minion两层结构进行任务执行的示例图。如图1所示，当管理的执行节点数量不大时(不过万)，可以采用简单的master-minion两层结构，由master(控制节点)来管理所有的minion(执行节点)。

上述两层结构只适用于执行节点数量不大时，当执行节点数量达到一定规模后(过万)，简单的两层结构可能会使master的负载过大，这时会采用master-syndic-minion三层结构(如图2所示)，通过增加syndic节点(代理节点)来分解master的压力。当然不排除在某些必要的情况下(二层架构升级三层架构的过渡期)，存在二层和三层共存的混合结构。

具体的，salt系统是通过在master或syndic使用命令行或调用api(Application Programming Interface,应用程序编程接口)的方式来下发命令到指定minion，不管是二层还是三层的salt结构，最上层的任一台master都可以控制所有的minion，三层的syndic可以控制局部的属于该syndic管控的minion。

从上述可以看出，由于任一台master都可以控制所有的minion，直接从master上下发命令是比较合理的，但是在三层的master上直接下发命令时会存在问题，就是在三层结构的master上下发命令后有时无法正常返回结果，比如：返回一个报错“Minion did not return.[Not connected](执行节点无返回值，未连接上)”，而实际上minion是正常的且在syndic上是可以查询到结果的，但是在master上却不能得到正常的返回结果。

这是由于syndic采用区域自治，minion只会向连接的syndic发起认证，使得master并不知道syndic下面连接有多少minion，也不知道某个minion属于哪个syndic，所以在master上执行salt命令时，salt并不知道要多久才能等到所有minion返回的结果，甚至有的minion没有返回结果，它也是不知道的，一种可能的解决办法是加大等待时长，但这并不是根治的办法。

因此一方面，在三层架构所有任务都是通过master下发经过syndic最终到达minion执行，在二层架构中任务都是通过master下发到达minion执行，也就是说无论是在二层结构还是三层结构中，任务的最终执行是在minion，可是即便三层架构中与minion直接连接的是syndic，任务仍要经过master，由此可以看出这个效率是降低了的。

另一方面，当salt系统中二层和三层结构并存的时候，三层架构中minion将执行结果回复给master时会产生返回的执行结果错误的问题。

发明内容

本发明实施例提供一种任务执行的方法及装置，用于解决如何高效执行任务的问题。

第一方面，本发明实施例提供一种任务执行的方法，适用于包括监控中心monitor、控制节点master、代理节点syndic和执行节点minion的远程执行系统；其中，代理节点和控制节点为执行节点的管理节点；控制节点还用于管理代理节点；包括：

所述监控中心获取待执行的第一命令，所述第一命令包括第一执行节点的标识；所述第一执行节点为所述执行节点中的一个；

所述监控中心根据所述第一执行节点的标识，通过执行节点与管理节点的对照关系，确定所述第一执行节点对应的第一管理节点，所述第一管理节点为第一代理节点或第一控制节点；所述第一管理节点为所述管理节点中的一个；

所述监控中心将所述待执行的命令发送给所述第一管理节点；

所述监控中心从所述第一管理节点获取执行结果；所述执行结果是由所述第一执行节点执行所述第一命令后返回给所述第一管理节点的。

上述方案，监控中心接收上层服务发送的命令后直接将命令发送至第一管理节点，从而提高了任务执行的效率以及系统的可靠性，监控中心对外提供了执行命令的接口，上层服务(service)不需要关心应该将命令交给哪个管理节点执行，只用调用监控中心的接口，由监控中心来决定应该怎么执行，从而使得系统支持salt二层和三层多环境混合部署，同时三层架构中，任务直接由监控中心下发至第一管理节点，避免了三层架构中执行结果返回时发生错误的问题。

可选的，所述方法还包括：

所述监控中心接收第二管理节点发送的更新消息，所述更新消息用于指示更新所述第二管理节点下的执行节点；所述第二管理节点为第二代理节点或第二控制节点；所述第二管理节点为所述管理节点中的任一个；

所述监控中心根据所述更新消息，更新所述执行节点与管理节点的对照关系。

上述方案，执行节点或管理节点发生更新时，执行节点选择下一个管理节点进行连接，执行节点到管理节点的对照关系发生了改变，监控中心通过其部署的在各管理节点上的接口获取变更信息更新已有的对照关系表，实现了系统支持动态建立执行节点与管理节点的关系，从而命令得以快速执行。

可选的，在所述监控中心接收第二管理节点发送的更新消息之前，还包括：

所述第一执行节点确定所述第一管理节点异常；

所述第一执行节点从所述第一执行节点对应的管理节点中选取所述第二管理节点并与所述第二管理节点建立连接。

需要说明的是，当执行节点连接的管理节点异常时，执行节点选择下一个管理节点进行连接，连接成功后，管理节点上的数据接口获取该执行节点的数据并将其上报给监控中心，以使监控中心更改对照关系。

可选的，所述执行节点与管理节点的对照关系通过如下方式获得：

针对任一管理节点，所述管理节点运行第二命令，所述第二命令用于指示创建第二执行节点的数据文件；所述第二执行节点为所述管理节点从缓存中未获取到数据文件的执行节点；所述管理节点执行完所述第二命令后，运行第三命令，所述第三命令用于指示从所述缓存中确定具有数据文件的各执行节点；所述管理节点将具有数据文件的各执行节点上报至所述监控中心；

所述监控中心根据各管理节点上报的各自的具有数据文件的各执行节点，建立所述执行节点与管理节点的对照关系。

上述方案，通过在管理节点运行第二命令(在salt系统中比如salt-run manage.present方式)在由于数据文件不存在从而无法在缓存中被获取的执行节点上创建数据文件，使得数据接口直接读取管理节点的本地缓存即可获取到所有正常的执行节点。从而为监控中心建立执行节点到管理节点的关系打下了坚实的基础。提高任务执行效率的同时提高了系统的可靠性。

可选的，在所述管理节点将具有数据文件的各执行节点上报至所述监控中心之后，所述方法还包括：

所述管理节点接收第四执行节点的异常报警信息；所述异常报警信息是由于所述第四执行节点的数据文件过期造成的；

所述管理节点运行第四命令，所述第四命令用于刷新所述第四执行节点的数据文件；

所述管理节点确定所述第四执行节点未上报至所述监控中心后，将所述第四执行节点上报至所述监控中心，以使所述监控中心更新所述执行节点与管理节点的对照关系。

需要说明的是，上述为设定于任务执行过程中出现异常的场景，这是由于salt系统中除了部分执行节点由于不存在数据文件而无法正常被数据接口获取，还存在极少数执行节点存在数据文件，但数据文件过期了，数据接口依然无法正常获取。因此这些数据文件过期的执行节点会在任务执行过程中暴露出来，本申请实施例中通过管理节点执行第四命令(比如在salt系统中执行salt“xxx”saltutil.refresh_pillar)来刷新数据文件从而解决数据文件“过期”的问题。

可选的，通过如下方式确定所述管理节点从缓存中未获取到数据文件的执行节点，包括：

所述管理节点向所述管理节点下的各执行节点发送第五命令；所述第五命令用于获取执行节点的执行状态，所述执行状态包括已经连接、拒绝连接、等待命令；

所述管理节点通过遍历文件获取已经存在数据文件的执行节点；

所述管理节点根据各执行节点的执行状态和已经存在数据文件的执行节点，确定从缓存中未获取到数据文件的执行节点。

上述方案，部署在管理节点上的数据接口已经提供了执行第五命令的所有接口，监控中心可以通过这些接口定时的获取每个管理节点上执行节点的状态，定时的创建数据文件，由于获取执行节点状态是通过读取本地缓存方式，所以效率会很高，而且不会给系统带来太多压力。

第二方面，本发明实施例提供一种任务执行的装置，适用于包括监控中心、控制节点、代理节点和执行节点的远程执行系统；其中，代理节点和控制节点为执行节点的管理节点；控制节点还用于管理代理节点；包括：

获取模块，用于获取待执行的第一命令，所述第一命令包括第一执行节点的标识；所述第一执行节点为所述执行节点中的一个；

处理模块，用于根据所述第一执行节点的标识，通过执行节点与管理节点的对照关系，确定所述第一执行节点对应的第一管理节点，所述第一管理节点为第一代理节点或第一控制节点；所述第一管理节点为所述管理节点中的一个；

将所述待执行的命令发送给所述第一管理节点；

从所述第一管理节点获取执行结果；所述执行结果是由所述第一执行节点执行所述第一命令后返回给所述第一管理节点的。

可选的，所述处理模块还用于：

接收第二管理节点发送的更新消息，所述更新消息用于指示更新所述第二管理节点下的执行节点；所述第二管理节点为第二代理节点或第二控制节点；所述第二管理节点为所述管理节点中的任一个；

根据所述更新消息，更新所述执行节点与管理节点的对照关系。

可选的，所述处理模块还用于：

在所述监控中心接收第二管理节点发送的更新消息之前，确定所述第一管理节点异常；

从所述第一执行节点对应的管理节点中选取所述第二管理节点并与所述第二管理节点建立连接。

可选的，所述处理模块具体用于：所述执行节点与管理节点的对照关系通过如下方式获得：

针对任一管理节点，运行第二命令，所述第二命令用于指示创建第二执行节点的数据文件；为所述管理节点从缓存中未获取到数据文件的执行节点；所述管理节点执行完所述第二命令后，运行第三命令，所述第三命令用于指示从所述缓存中确定具有数据文件的各执行节点；将具有数据文件的各执行节点上报至所述监控中心；

根据各管理节点上报的各自的具有数据文件的各执行节点，建立所述执行节点与管理节点的对照关系。

可选的，所述处理模块还用于：

在所述管理节点将具有数据文件的各执行节点上报至所述监控中心之后，接收第四执行节点的异常报警信息；所述异常报警信息是由于所述第四执行节点的数据文件过期造成的；

运行第四命令，所述第四命令用于刷新所述第四执行节点的数据文件；

确定所述第四执行节点未上报至所述监控中心后，将所述第四执行节点上报至所述监控中心，以使所述监控中心更新所述执行节点与管理节点的对照关系。

可选的，所述处理模块具体用于：

通过如下方式确定所述管理节点从缓存中未获取到数据文件的执行节点，包括：

向所述管理节点下的各执行节点发送第五命令；所述第五命令用于获取执行节点的执行状态，所述执行状态包括已经连接、拒绝连接、等待命令；

通过遍历文件获取已经存在数据文件的执行节点；

根据各执行节点的执行状态和已经存在数据文件的执行节点，确定从缓存中未获取到数据文件的执行节点。

第三方面，本发明实施例提供一种计算机被控设备，包括：

存储器，用于存储程序指令；

处理器，用于调用所述存储器中存储的程序指令，按照获得的程序执行上述第一方面所述的方法。

第四方面，本发明实施例提供一种计算机可读非易失性存储介质，包括计算机可读指令，当计算机读取并执行所述计算机可读指令时，使得计算机执行上述第一方面所述的方法。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为现有技术提供的master-minion两层结构进行任务执行的示意图；

图2为现有技术提供的master-syndic-minion三层结构进行任务执行的示意图；

图3为本发明实施例提供的一种系统架构的示意图；

图4为本发明实施例提供的一种系统架构的示意图；

图5为本发明实施例提供的一种系统架构的示意图；

图6为本发明实施例提供的一种任务执行方法的流程示意图；

图7为本发明实施例提供的一种建立对照关系的流程示意图；

图8为本发明实施例提供的一种任务执行装置的结构示意图。

具体实施方式

为了更好的理解上述技术方案，下面将结合说明书附图及具体的实施方式对上述技术方案进行详细的说明，应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明，而不是对本发明技术方案的限定，在不冲突的情况下，本发明实施例以及实施例中的技术特征可以相互结合。

为解决现有技术的问题，本发明实施例提供一种解决方案，具体如下：

如图3所示，通过使用缓存来保存结果的方式，可解决salt三层结构中在master上直接下发命令无法正常获取结果的问题。一般的，salt系统在master上会部署一个分配模块来接收和执行命令，这里称这个分配模块为worker，当worker接收到上层服务service 传过来的任务task时，salt系统执行以下步骤：

步骤1：worker通过命令行方式或者调用api方式在master上下发相应的命令。

步骤2：master立即返回给worker一个任务标识jid。

步骤3：命令经过master-syndic-minion执行成功后，syndic会将结果写入数据库(如redis，remote dictionary server，远程字典服务)中，其中会标明结果对应的jid。

步骤4：上层服务service根据jid去数据库(如redis)查询结果。具体的，在master上下发相应的命令时，在命令执行过程中会产生jid，每个jid对应一个任务，minion并不会保存，minion执行完任务将结果返回给salt-master，salt-master会将这个结果和jid对应起来并保存在本地或其他存储介质，比如redis中。

进一步的，为了实现系统的易扩展性和分布式部署，可以在上层服务service与worker之间增加一个任务队列MQ，service不直接将任务下发给worker而是将任务先下发到MQ，然后各master上的worker去MQ中获取任务。

进一步的，图4为加入队列后系统架构的示意图。如图4所示，service将多个任务先下发到MQ(比如任务1、任务2、…、任务10)，然后各master上的worker去MQ中获取任务。比如，master1上的worker1去MQ中获取任务1，…，master10上的worker10去MQ中获取任务10(需要说明的是worker与任务可以不是一一对应的，比如上述举例中新来一个任务11时，master1可从MQ中继续获取任务11)。

然而，上述方案中所有任务都是通过master下发经过syndic最终到达minion执行，上层服务service异步的去redis查询结果，也就是说无论是在二层结构还是三层结构中，任务的最终执行是在minion，而二层结构中任务由master下发到minion，三层结构中任务由master下发经过syndic到达minion，由此可以看出这个效率是降低了的，同时当salt系统中二层和三层结构并存的时候，需要上层服务service维护一个minion到某个具体salt环境的关系，也就是说，二层结构中的minion和三层结构中的minion不能相提并论，这就给架构的扩展带来不便。进一步的，上述方案无法建立minion到master或syndic的动态连接关系，也就是说，当minion连接的master或syndic异常时，上层服务无法感知minion到某个具体salt环境的变化。

基于此，本发明实施例提供一种任务执行的方法，用于解决避免执行结果返回出现异常同时高效的执行任务的问题。

本发明实施例提供的任务执行方法，可以适用于如图5所示的salt系统架构中，该salt系统架构包括监控中心monitor、第一管理节点(master或syndic)、第一执行节点minion。

监控中心monitor用于获取第一执行节点minion的状态，建立第一执行节点minion与第一管理节点的关系，并将待执行的命令发送至与建立第一执行节点minion对应的第一管理节点。简而言之，监控中心monitor对外提供统一执行命令的接口。

举个例子，monitor建立的执行节点与管理节点的对照关系如表一所示，其中，salt_type指出第一执行节点对应的第一管理节点的类型，第一管理节点为第一代理节点syndic或第一控制节点master。minion_list为第一执行节点的标识的集合，一般为minion的IP地址(Internet Protocol，网络之间互联的协议)，第一执行节点的标识被包含在第一命令中。agent_url为部署在第一执行节点对应的第一管理节点上的agent服务地址。具体的，当monitor接受上层服务service发送的命令时，获取命令中第一执行节点的标识为"10.255.34.135"，根据表一的对照关系可确定第一执行节点对应的第一管理节点为第一代理节点，其网络地址为{https://10.255.36.10:9443/s26}，monitor直接将第一命令发送至第一代理节点上，第一代理节点再将第一命令发送给第一执行节点，执行完毕后第一代理节点将第一执行节点返回的结果发送至monitor。

表一

其中，salt_type指出第一执行节点对应的第一管理节点的类型，第一管理节点为第一代理节点syndic或第一控制节点master。minion_list为第一执行节点的标识的集合，一般为minion的IP地址(Internet Protocol，网络之间互联的协议)，第一执行节点的标识被包含在第一命令中。agent_url为部署在第一执行节点对应的第一管理节点上的agent服务地址。具体的，当monitor接受上层服务service发送的命令时，获取命令中第一执行节点的标识为"10.255.34.135"，根据表一的对照关系可确定第一执行节点对应的第一管理节点为第一代理节点，其网络地址为{https://10.255.36.10:9443/s26}，monitor直接将第一命令发送至第一代理节点上，第一代理节点再将第一命令发送给第一执行节点，执行完毕后第一代理节点将第一执行节点返回的结果发送至monitor。

具体的，如图5所示，监控中心monitor通过第一管理节点上的agent(相当于一个对外的数据接口)获取第一执行节点minion的状态。即本申请实施例中可以在master和syndic上都部署agent，通过agent实现与monitor的交互。

第一管理节点包括第一控制节点master和第一代理节点syndic，用于接收监控中心monitor下发的任务，并将任务发送给相应的第一执行节点minion。

基于图5所示意的系统架构，图6为本发明实施例提供的一种任务执行方法所对应的流程示意图，如图6所示，该方法包括：

步骤601，监控中心获取待执行的第一命令。

需要说明的是，第一命令包括第一执行节点的标识，第一执行节点为执行节点中的一个。

具体的，由于监控中心monitor通过在第一代理节点syndic以及第一控制节点master上部署了数据接口(即agent)，使得monitor能够快速高效的获取所有第一执行节点minion的数据，从而monitor对外提供了同一执行命令的接口。当上层服务service下发了一个任务时，service无需确定salt系统的内部结构，也即monitor的引入使得系统支持salt两层和三层多环境混合部署。

步骤602，监控中心根据第一执行节点的标识，通过执行节点与管理节点的对照关系，确定第一执行节点对应的第一管理节点。

需要说明的是，第一管理节点为第一代理节点syndic或第一控制节点master，第一管理节点为管理节点中的一个。

步骤603，监控中心将待执行的命令发送给第一管理节点。

需要说明的是，由于monitor在上述过程中通过agent获取minion的状态，从而建立从minion到管理节点的关系，当monitor接受上层服务service发送的命令时，monitor可快速查询执行节点与管理节点的对照关系，确定第一执行节点对应的第一管理节点。

步骤604，监控中心从第一管理节点获取执行结果。

需要说明的是，执行结果是由第一执行节点执行第一命令后返回给第一管理节点的。本申请实施例中，有了上述表一所示的执行节点与管理节点的对照关系后(管理节点到执行节点的关系)即可得到其反向关系(执行节点到管理节点的关系)，如表二所示：

表二

minion	agent_url_list
10.255.36.27	["master_https://10.255.36.10:9443/m131"]
10.255.36.31	["syndic_https://10.255.36.10:9443/s26"]
10.255.34.58	["syndic_https://10.255.36.10:9443/s12"]
10.255.36.17	["syndic_https://10.255.36.10:9443/s30"]
10.255.34.137	["syndic_https://10.255.36.10:9443/s26"]

从上述内容可以看出，有了上面的对应关系后，monitor就可以将要执行的命令下发到指定的syndic或master了，对于三层架构，命令直接下发到syndic执行效率会快一些。

根据上述内容可知，监控中心monitor首先确定哪些第一执行节点minion需要创建数据文件。monitor在创建数据文件完成后从缓存中获取正常的minion的数据，使得系统支持快速高效获取所有minion的状态，然后建立minion到第一管理节点(syndic或master)的关系，使得monitor接受上层服务service发送的命令后直接将命令发送至第一管理节点，从而提高了任务执行的效率以及系统的可靠性，同时由于monitor建立的关系不依赖minion本身所属的具体的环境(minion是在两层结构中还是在三层结构中)，只用在所有master和syndic上部署数据接口，monitor通过这些数据接口可以收集到syndic和master各自控制的minion，然后建立起一个minion与syndic/master的对应关系，monitor对外提供了执行命令的接口，上层服务service不需要关心应该将命令交给哪个master或syndic执行，只用调用monitor接口，由monitor来决定应该怎么执行，从而使得系统支持salt二层和三层多环境混合部署。

基于上述内容，进一步的，执行节点与管理节点的对照关系通过如下方式获得：

针对任一管理节点，管理节点运行第二命令，第二命令用于指示创建第二执行节点的数据文件；第二执行节点为管理节点从缓存中未获取到数据文件的执行节点；管理节点执行完第二命令后，运行第三命令，第三命令用于指示从缓存中确定具有数据文件的各执行节点；管理节点将具有数据文件的各执行节点上报至监控中心；

监控中心根据各管理节点上报的各自的具有数据文件的各执行节点，建立执行节点与管理节点的对照关系。

此处，需要说明的是，现有方案中使用salt“xxx”test.ping的方式来检测所有minion的状态，这种方式需要在master上下发命令到minion。本申请实施例中使用salt-run manage.present的方式来获取minion状态，这种方式直接读取master或syndic本地缓存，无需在master上下发命令到minion，提高效率的同时不会给master或syndic造成很大的压力。

然而，简单的使用salt-run manage.present方式是不可靠的，这种方式获取状态正常的minion的数量可能会少于实际正常的数量。经过分析发现造成这个现象的原因跟master/syndic管理的minion的数据文件具体为{cachedir}/{minionid}/data.p文件有关(需要说明的是，minionid为minion标识，一般用ip表示；这里意为cachedir目录下具体某一个minion的data.p文件)，即使在minion正常的情况下，如果data.p不存在，agent依然不能从缓存中获取这个minion。本申请实施例中，通过执行salt“xxx”pillar.items解决minion正常但是对应的data.p不存在的问题。进一步的，在解决data.p不存在的问题后可以通过manage.present方式获取到所有正常的minion了。

通过上述内容可知，通过在管理节点(master或syndic)运行第二命令(salt-run manage.present方式)在由于数据文件(data.p)不存在从而无法在缓存中被获取的minion上创建数据文件(data.p)，使得agent直接读取管理节点(master或syndic)的本地缓存即可获取到所有正常的minion。从而为monitor建立minion到管理节点(master或syndic)的关系打下了坚实的基础。提高任务执行效率的同时提高了系统的可靠性。

具体的，通过如下方式确定管理节点从缓存中未获取到数据文件的执行节点：

首先，管理节点向管理节点下的各执行节点发送第五命令。需要说明的是，第五命令用于获取执行节点的执行状态，执行状态包括已经连接、拒绝连接、等待命令。接着，管理节点通过遍历文件获取已经存在数据文件的执行节点。然后，管理节点根据各执行节点的执行状态和已经存在数据文件的执行节点，确定从缓存中未获取到数据文件的执行节点。

通过上述内容可知，有部分minion由于不存在数据文件而无法通过读取缓存获取，我们知道了如何创建数据文件以解决数据文件不存在的问题，但是，另一个问题也不容忽视，我们不可能在所有minion对应的syndic或master上创建数据文件以解决部分minion对应的syndic或master不存在数据文件的问题，这样反而舍本逐末。那么如何定位到应该创建数据文件的minion上就成为了解决问题的关键。本申请实施例确定了下面的计算方法：

need_to_create_datap_keys＝accepted_keys–denied_keys–unaccepted_keys-rejected_keys–conn_keys–already_has_datap_keys

其中：accepted_keys，denied_keys，unaccepted_keys，rejected_keys为管理节点执行salt-key命令后返回的结果。

需要说明的是，salt系统中minion在启动时会向master发起认证请求，并将自己的公钥发给master，master认证后会保存并将收到的公钥加密AES密钥并返回给minion，minion使用私钥解密。在管理节点上执行salt-key命令用于管理minion秘钥。比如执行salt-key-L命令来查询，返回结果为：

{Accepted Keys：slave1

Denied Keys：slave2，

Unaccepted Keys：slave3

Rejected Keys：slave4}

上述内容说明，此时slave1是已经与管理节点建立连接的minion，slave3已经出现在unaccepted keys中，说明slave3对应的minion已经和管理节点联系，并且管理节点已经获取了minion的公钥，等待下一步指令。slave2和slave4都是已经被管理节点拒绝的minion。其中，slave2是由于ID重复或者minion中新的秘钥生成但之前的秘钥没有删除而被管理节点自动拒绝，slave4是管理节点通过执行salt-key拒绝。

此外，本申请实施例中，conn_keys为正常的minionid即直接使用第二命令从缓存中获取的正常的minion，already_has_datap_keys为已经存在data.p的minionid，这是通过遍历文件获取到的。

进一步的，部署在master或syndic上的agent已经提供了上面操作的所有接口，monitor可以通过这些接口定时的获取每个master或syndic上minion的状态，定时的创建数据文件，由于获取minion状态是通过读取本地缓存方式，所以效率会很高，而且不会给系统带来太多压力。

为了更好的实现本方案实施例的效果，在管理节点将具有数据文件的各执行节点上报至监控中心之后，管理节点接收第四执行节点的异常报警信息。

需要说明的是，异常报警信息是由于第四执行节点的数据文件过期造成的。

接着，管理节点运行第四命令。需要说明的是，第四命令用于刷新所述第四执行节点的数据文件。

最后，管理节点确定第四执行节点未上报至监控中心后，将第四执行节点上报至监控中心，以使监控中心更新执行节点与管理节点的对照关系。

上述内容设定于任务执行过程中出现异常的场景，这是由于salt系统中除了部分minion由于不存在数据文件而无法正常被数据接口获取，还存在极少数minion存在数据文件，但数据文件过期了，数据接口依然无法正常获取。因此这些数据文件过期的minion会在任务执行过程中暴露出来，本申请实施例中通过管理节点执行第四命令(执行salt“xxx”saltutil.refresh_pillar)来刷新数据文件从而解决data.p“过期”的问题。

在其它可能的实现方式中，监控中心建立的从minion到syndic或master的关系还可以为将minion的IP地址或其他可以标识minion的信息根据预设的算法映射到syndic或master的网络地址或其他可以标识syndic或master的信息中。表格中显示根据同一算法计算的相对地址，具体不做限定。

在一种可能的方案中，如果没有特殊定制的需求，monitor可以不在各个管理节点上创建数据接口，而是用salt中的netapi模块。这是由于netapi模块里面包含了rest_cherrypy、rest_tornado以及rest_uwsgi，提供了操作salt的rest接口，这个接口相当于上述monitor在管理节点上部署的数据接口，覆盖了常用的salt操作。

基于上文的介绍，图7为本申请实施例提供的监控中心建立执行节点与管理节点方法的流程示意图。下面结合图7对本发明实施例监控中心动态建立执行节点与管理节点关系的整体实现过程进行描述。

如图7所示：

步骤701，监控中心接收第二管理节点发送的更新消息。

需要说明的是，更新消息用于指示更新第二管理节点下的执行节点，第二管理节点为第二代理节点或第二控制节点，第二管理节点为管理节点中的任一个。

具体的，在监控中心接收第二管理节点发送的更新消息之前，第一执行节点确定所述第一管理节点异常，第一执行节点从第一执行节点对应的管理节点中选取第二管理节点并与第二管理节点建立连接。

步骤702，监控中心根据更新消息，更新执行节点与管理节点的对照关系。

本申请实施例中，由于minion可以配置多master，当配置文件里的master_type为str

(可同时连接所有可用master，在minion的配置文件里可以指向多个master)时，所有master都是可用的，当master_type为failover(失效转移，实际上是一种备份操作模式)时，minion只会连接其中的一台master，当这台master异常后，minion会根据salt系统自身所带有的这台minion可以连接的所有master的集合中选择连接下一台master。一般在二层salt架构时，minion会配置master_type为str，但是三层salt架构时，minion会配置master_type为failover，因为如果配置成str，在master上下发一条命令会被执行多次，比如图2中master1控制syndic1和syndic2，syndic1控制minion1，minion2，minion3和minion4；syndic2控制minion1，minion2，minion3和minion4；当在master1上下发一条命令时，命令通过syndic1发送至minion1，命令又通过syndic2发送至minion1，这样一来minion1上执行了该命令两次，这个是不能接受的。

进一步的，当salt三层结构的minion配置master_type为failover时，minion可能会在多个master或syndic中发生切换，因此minion到master或syndic的连接关系可能是动态变化的，monitor要想将命令直接下发到syndic就需要维护一个从minion到syndic的关系，在下发命令前先从建立的对应的关系中查出执行对象(minion)对应的syndic，然后调用该syndic上的agent来下发命令。

进一步的，当minion连接的master或syndic异常时，minion选择下一个master或syndic进行连接，连接成功后，master或syndic上的agent获取该minion的数据并将其上报给monitor，以使monitor更改对照关系。

上述方案，当minion连接的master或syndic异常时，minion选择下一个master或syndic进行连接，minion到master或syndic的对照关系发生了改变，monitor通过其部署的agent获取变更信息更新已有的对照关系表，实现了系统支持动态建立minion与maste或syndic的关系，从而命令得以快速执行。

基于相同的技术构思，图8示例性的示出了本发明实施例提供任务执行的装置的结构，该装置可以执行任务执行的方法的流程。

如图8所示，该装置适用于包括监控中心、控制节点、代理节点和执行节点的远程执行系统；其中，代理节点和控制节点为执行节点的管理节点；控制节点还用于管理代理节点；包括：

获取模块801，用于获取待执行的第一命令，所述第一命令包括第一执行节点的标识；所述第一执行节点为所述执行节点中的一个；

处理模块802，用于根据所述第一执行节点的标识，通过执行节点与管理节点的对照关系，确定所述第一执行节点对应的第一管理节点，所述第一管理节点为第一代理节点或第一控制节点；所述第一管理节点为所述管理节点中的一个；所述监控中心将所述待执行的命令发送给所述第一管理节点；所述监控中心从所述第一管理节点获取执行结果；所述执行结果是由所述第一执行节点执行所述第一命令后返回给所述第一管理节点的。

可选的，所述处理模块802还用于：

在所述监控中心接收第二管理节点发送的更新消息之前，所述第一执行节点确定所述第一管理节点异常；

可选的，所述处理模块802具体用于：所述执行节点与管理节点的对照关系通过如下方式获得：

可选的，所述处理模块802还用于：

在所述管理节点将具有数据文件的各执行节点上报至所述监控中心之后，所述管理节点接收第四执行节点的异常报警信息；所述异常报警信息是由于所述第四执行节点的数据文件过期造成的；

可选的，所述处理模块802具体用于：

基于相同的技术构思，本发明实施例还提供了一种计算被控设备，包括：

存储器，用于存储程序指令；

处理器，用于调用所述存储器中存储的程序指令，按照获得的程序执行上述任务执行的方法。

基于相同的技术构思，本发明实施例还提供了一种计算机可读非易失性存储介质，包括计算机可读指令，当计算机读取并执行所述计算机可读指令时，使得计算机执行上述任务执行的方法。

最后应说明的是：本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明的方法、被控设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理被控设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理被控设备的处理器执行的指令产生用于实现在流程图一个流程或多个和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理被控设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

一种任务执行的方法，其特征在于，适用于包括监控中心、控制节点、代理节点和执行节点的远程执行系统；其中，代理节点和控制节点为执行节点的管理节点；控制节点还用于管理代理节点；所述方法包括：

所述监控中心获取待执行的第一命令，所述第一命令包括第一执行节点的标识；所述第一执行节点为所述执行节点中的一个；

所述监控中心根据所述第一执行节点的标识，通过执行节点与管理节点的对照关系，确定所述第一执行节点对应的第一管理节点，所述第一管理节点为第一代理节点或第一控制节点；所述第一管理节点为所述管理节点中的一个；

所述监控中心将所述待执行的命令发送给所述第一管理节点；

所述监控中心从所述第一管理节点获取执行结果；所述执行结果是由所述第一执行节点执行所述第一命令后返回给所述第一管理节点的。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

所述监控中心接收第二管理节点发送的更新消息，所述更新消息用于指示更新所述第二管理节点下的执行节点；所述第二管理节点为第二代理节点或第二控制节点；所述第二管理节点为所述管理节点中的任一个；

所述监控中心根据所述更新消息，更新所述执行节点与管理节点的对照关系。
根据权利要求2所述的方法，其特征在于，在所述监控中心接收第二管理节点发送的更新消息之前，还包括：

所述第一执行节点确定所述第一管理节点异常；

所述第一执行节点从所述第一执行节点对应的管理节点中选取所述第二管理节点并与所述第二管理节点建立连接。
根据权利要求1-3任一项所述的方法，其特征在于，所述执行节点与管理节点的对照关系通过如下方式获得：

针对任一管理节点，所述管理节点运行第二命令，所述第二命令用于指示创建第二执行节点的数据文件；所述第二执行节点为所述管理节点从缓存中未获取到数据文件的执行节点；所述管理节点执行完所述第二命令后，运行第三命令，所述第三命令用于指示从所述缓存中确定具有数据文件的各执行节点；所述管理节点将具有数据文件的各执行节点上报至所述监控中心；

所述监控中心根据各管理节点上报的各自的具有数据文件的各执行节点，建立所述执行节点与管理节点的对照关系。
根据权利要求4所述的方法，其特征在于，在所述管理节点将具有数据文件的各执行节点上报至所述监控中心之后，所述方法还包括：

所述管理节点接收第四执行节点的异常报警信息；所述异常报警信息是由于所述第四执行节点的数据文件过期造成的；

所述管理节点运行第四命令，所述第四命令用于刷新所述第四执行节点的数据文件；

所述管理节点确定所述第四执行节点未上报至所述监控中心后，将所述第四执行节点上报至所述监控中心，以使所述监控中心更新所述执行节点与管理节点的对照关系。
根据权利要求4所述的方法，其特征在于，通过如下方式确定所述管理节点从缓存中未获取到数据文件的执行节点，包括：

所述管理节点向所述管理节点下的各执行节点发送第五命令；所述第五命令用于获取执行节点的执行状态，所述执行状态包括已经连接、拒绝连接、等待命令；

所述管理节点通过遍历文件获取已经存在数据文件的执行节点；

所述管理节点根据各执行节点的执行状态和已经存在数据文件的执行节点，确定从缓存中未获取到数据文件的执行节点。
一种任务执行的装置，其特征在于，所述装置包括：

获取模块，用于获取待执行的第一命令，所述第一命令包括第一执行节点的标识；所述第一执行节点为所述执行节点中的一个；

处理模块，用于根据所述第一执行节点的标识，通过执行节点与管理节点的对照关系，确定所述第一执行节点对应的第一管理节点，所述第一管理节点为第一代理节点或第一控制节点；所述第一管理节点为所述管理节点中的一个；

发送模块，用于将所述待执行的命令发送给所述第一管理节点；

所述获取模块，还用于从所述第一管理节点获取执行结果；所述执行结果是由所述第一执行节点执行所述第一命令后返回给所述第一管理节点的。
根据权利要求7所述的装置，其特征在于，所述处理模块还用于：

接收第二管理节点发送的更新消息，所述更新消息用于指示更新所述第二管理节点下的执行节点；所述第二管理节点为第二代理节点或第二控制节点；所述第二管理节点为所述管理节点中的任一个；

根据所述更新消息，更新所述执行节点与管理节点的对照关系。
一种计算设备，其特征在于，包括：

存储器，用于存储程序指令；

处理器，用于调用所述存储器中存储的程序指令，按照获得的程序执行权利要求1至6任一项所述的方法。
一种计算机可读非易失性存储介质，其特征在于，包括计算机可读指令，当计算机读取并执行所述计算机可读指令时，使得计算机执行如权利要求1至6任一项所述的方法。