CN114564309B

CN114564309B - 基于灵活配置实现性能提优的复杂算力系统并行处理方法

Info

Publication number: CN114564309B
Application number: CN202210195273.0A
Authority: CN
Inventors: 宋子阳; 王�泓; 柳朝阳; 赵常; 付琦玮; 周丘实; 江光德; 武俊祥; 武润; 盛垲鈇
Original assignee: Aerospace Science And Engineering Intelligent Operation Research And Information Security Research Institute Wuhan Co ltd
Current assignee: Aerospace Science And Engineering Intelligent Operation Research And Information Security Research Institute Wuhan Co ltd
Priority date: 2022-03-01
Filing date: 2022-03-01
Publication date: 2024-04-09
Anticipated expiration: 2042-03-01
Also published as: CN114564309A

Abstract

本发明属于复杂算力系统技术领域，具体涉及一种基于灵活配置实现性能提优的复杂算力系统并行处理方法，包括：应用系统接收多条并行作业任务，完成对任务关联性配置文件的配置；主控节点机对各个并行节点机的空闲算力资源进行监控，获得空闲算力资源结果；主控节点机对并行作业任务分配并行节点机的空闲算力资源；主控节点机根据并行节点机的空闲算力资源的分配结果，生成对应每一个并行节点机的任务执行指令；并行节点机进行对应的作业处理，在作业处理过程中，根据任务关联性配置文件进行流程控制，直至作业完成或中止。本发明可以实现对不同任务类型下的多算法、可分组任务下的快速并行计算，大幅提升并行计算的执行效率。

Description

基于灵活配置实现性能提优的复杂算力系统并行处理方法

技术领域

本发明属于复杂算力系统技术领域，具体涉及一种基于灵活配置实现性能提优的复杂算力系统并行处理方法。

背景技术

伴随着应用系统对软件服务的不断提高，应用软件的执行效率已被越来越多的人关注，同时，软件开发模式的不断改进，系统中多个组件集成已经成为一种主流的开发模式。自90年代以来，并行计算得以空前的飞速发展，一方面，由于单处理机的计算速度不断提高，并行计算机的体系结构趋于成熟，数据传输网络的标准化和传输速率的大幅提升，为研制并行计算机系统创造了有利条件。另一方面，推动并行计算发展的主要动力来自于国际上的一些重要研究计划。在经历了现代计算机两个明显的发展历程：串行计算时代和并行计算时代。每一个计算时代都从体系结构发展开始，接着是系统软件(特别是编译器与操作系统)、应用软件，最后随着问题求解环境的发展而达到顶峰。为求解大规模问题和复杂系统，创建和使用并行计算机是其解决单处理器速度瓶颈的最好方法之一

传统的并行计算机是由一组处理单元组成的，这组处理单元通过相互之间的通信与协作，以更快的速度共同完成一项大规模的计算任务，但并行间缺少任务的沟通，计算效率没有发挥到最大。

传统的并行计算方法主要通过主控机将并行任务下发至并行节点机上，由并行节点机对最小执行单元任务进行解算，计算完成后向主控端发送请求，由主控根据需要确定是否安排下一个任务，在一定范围内实现了软件的加速效果，但是对于复杂算例情况下，尤其是任务间有一定交联时，即有些任务的完成或者信息直接可以为正在计算或者后续计算的并行计算任务进行指导、干预时，由于其传统的并行计算方法决定了它无法实现对任务的快速处理，从而也就无法实现更为快速的提优效果，这对于大规模复杂算例下的并行计算性能提优无疑是致命的缺陷。

发明内容

(一)要解决的技术问题

本发明要解决的技术问题是：如何提升复杂算力系统并行处理能力。

(二)技术方案

为解决上述技术问题，本发明提供一种基于灵活配置实现性能提优的复杂算力系统并行处理方法，所述方法基于复杂算力系统并行处理系统来实施，所述复杂算力系统并行处理系统包括：应用系统、主控节点机、多个并行节点机；

所述应用系统与主控节点机，以及主控节点机与各个并行节点机之间建立网络通信机制；

所述复杂算力系统并行处理方法包括如下步骤：

步骤1：所述应用系统接收多条并行作业任务，根据业务需求分解并行作业任务，根据每一条并行作业任务完成对任务关联性配置文件的配置，并将并行作业任务及任务关联性配置文件一并下发到主控节点机；

步骤2：所述主控节点机对各个并行节点机的空闲算力资源进行监控，获得空闲算力资源结果；

步骤3：所述主控节点机接收来自应用系统的多条并行作业任务，结合空闲算力资源结果，根据任务关联性配置文件，对并行作业任务分配并行节点机的空闲算力资源；

所述主控节点机根据并行节点机的空闲算力资源的分配结果，生成对应每一个并行节点机的任务执行指令；所述任务执行指令用于指示一个并行节点机向一个或多个并行作业任务提供其空闲算力资源；

步骤4：所述并行节点机接收到主控节点机分发的任务执行指令，进行对应的作业处理，在作业处理过程中，根据任务关联性配置文件进行流程控制，直至作业完成或中止。

其中，所述步骤1中，所述任务关联性配置文件包括：“优化开关标志”、“单任务多算法标志”、“单任务算法组合方案标志”、“分组管理标志”、“分组并行数量”、“任务并行单元处理方法标志”、“执行结果标志”；

所述根据每一条并行作业任务完成对任务关联性配置文件的配置，具体为：

步骤1-1：根据并行作业任务的类型，若并行作业任务之间为简单的“无关联”计算且单条并行作业任务内部算法为串联关系时，则将“优化开关标志”置为“0”；若并行作业任务之间存在“关联性”计算或单条并行作业任务内部算法不为串联关系时，则将“优化开关标志”置为“1”；

步骤1-2：根据并行作业任务的类型，若单条并行作业任务下无可并行计算的算法时，则将“单任务多算法标志”置为“0”，反正则置为“1”；

步骤1-3：当“单任务多算法标志”为“1”时，根据单条并行作业任务的算法类型进行分配，配置“单任务算法组合方案标志”；其中，在单条并行作业任务的算法类型包括识别算法时，配置“单任务算法组合方案标志”为“1”；在单条并行作业任务的算法类型包括跟踪算法时，配置“单任务算法组合方案标志”为“2”；在单条并行作业任务的算法类型包括通视算法时，配置“单任务算法组合方案标志”为“3”；在单条并行作业任务的算法类型包括雷达算法时，配置“单任务算法组合方案标志”为“4”；在单条并行作业任务的算法类型包括截获算法时，配置“单任务算法组合方案标志”为“5”；

步骤1-4：若并行作业任务之间存在“关联性”计算时，则将“分组管理标志”置为“1”；若并行作业任务之间为简单的“无关联”计算时，则将“分组管理标志”置为“0”；

步骤1-5：当“分组管理标志”为“1”时，根据并行作业任务之间的关联情况配置“分组并行数量”，具体为将“分组并行数量”配置为并行作业任务能够分配的最小分组数量；

步骤1-6：根据作业任务类型和客户作业目的，对“任务并行单元处理方法标志”进行配置，其中，将“任务并行单元处理方法标志”配置为“-1”，表示获得计算结果后进行人为判定；将“任务并行单元处理方法标志”配置为“0”，表示停止单条并行作业任务内的所有并行计算单元的作业动作；将“任务并行单元处理方法标志”配置为“1”，表示作业成功或服务异常导致作业失败时，分组内并行作业取消；将“任务并行单元处理方法标志”配置为“2”，表示所有并行作业任务全部取消；将“任务并行单元处理方法标志”配置为“3”，表示不干预当前作业动作，作业继续；

步骤1-7：对于“执行结果标志”，在初始配置时置空；

当单条并行作业任务执行后，将其任务执行结果反填到该“执行结果标志”上；其中，“执行结果标志”为“1”表示单台并行节点机作业完成，为“2”表示单条并行作业任务作业完成，为“-1”表示数据断开作业失败，为“-2”表示服务异常作业失败。

其中，所述步骤3中，根据任务关联性配置文件，对并行作业任务分配并行节点机的空闲算力资源的过程如下：

步骤3-1：判断任务关联性配置文件中的“优化开关标志”是否为“1”，则进入步骤3-2；若为“0”，则以单条并行作业任务为最小粒度，并根据并行节点机的空闲算力资源按比例进行并行作业任务分发，作业任务分发结束；

步骤3-2：读取任务关联性配置文件中的“单任务多算法标志”，若为“1”则进入步骤3-3；若为“0”则以单条并行作业任务为最小粒度，并根据并行节点机的空闲算力资源按比例进行并行作业任务分发，作业任务分发结束；

步骤3-3：读取任务关联性配置文件中的“单任务算法组合方案标志”，根据“单任务算法组合方案标志”对单条并行作业任务中的算法进行组合，以该并行作业任务所含的算力需求最小的算法组合为最小粒度，并根据并行节点机的空闲算力资源按比例进行并行作业任务分发。

其中，所述步骤3-3中，所述进行并行作业任务分发，即主控节点机生成任务执行指令并发送给并行节点机，该任务执行指令中明确了对于某一并行节点机，对应一个或多个并行作业任务需要其提供空闲算力资源，且明确了对于该一个或多个并行作业任务所需执行的算法组合，该并行节点机对应需提供的空闲算力资源量；

至此，作业任务分发结束。

其中，所述步骤4中，根据任务关联性配置文件进行流程控制的过程如下：

步骤4-1：读取任务关联性配置文件中的“分组管理标志”，若为“1”则进入步骤4-2；若为“0”则进入步骤4-3；

步骤4-2：读取任务相关性配置文件中的“分组并行数量”，根据读取到的分组数对并行作业任务进行分组，为同一组内的所有并行作业任务分配唯一的“组号”，进入步骤4-3；

步骤4-3：各个并行节点机根据所接收到的任务执行指令，以单条并行作业任务或其所包含的算法组合为最小粒度并行开展作业，每完成最小粒度的作业或作业失败时，则根据步骤1-7的规则填写“执行结果标志”，并根据任务相关性配置文件中的“任务并行单元处理方法标志”，对任务流程进行干预；

其中，若“任务并行单元处理方法标志”为“-1”，则根据执行结果进行人工干预；

若“任务并行单元处理方法标志”为“0”，则中止该单条并行作业任务中的所有作业，其余并行作业任务继续进行，重复执行步骤4-3；

若“任务并行单元处理方法标志”为“1”，则根据该单条并行作业任务的“组号”，中止相同分组内的所有并行作业任务，其余分组的作业任务继续进行，重复执行步骤4-3；

若“任务并行单元处理方法标志”为“2”，则中止所有并行作业任务，并行作业任务结束；

若“任务并行单元处理方法标志”为“3”，则不干预当前作业动作，剩余执行中的所有作业任务继续进行，重复执行步骤4-3；

若无剩余作业任务，则并行作业任务结束。

其中，所述步骤1-1中，所述“关联性”计算是指在作业处理过程中，并行作业任务之间产生数据交互。

其中，所述步骤1-3中，对于某一并行作业任务，其算法类型包括识别算法，跟踪算法和通视算法，其中，识别算法和跟踪算法之间为并行关系，通视算法与另外两算法之间为串行关系，则将“单任务算法组合方案标志”配置为“1,2；3”。

其中，所述应用系统与主控节点机，以及主控节点机与各个并行节点机之间所建立的网络通信机制，能够实现相互间数据的进程重启、数据传输、掉线重连以及空闲算力资源监控功能。

(三)有益效果

本发明通过对并行计算单元间的任务通信、分布式部署、网络通信、网络监控、任务进程、资源的充分利用以及对不同任务类型的灵活配置，形成一种通用的基于灵活配置实现性能提优的复杂算力系统并行处理方法，将任务间的耦合关系进行梳理并形成配置文件，通过对任务执行过程中返回的作业成果信息，指导当前及后续并行计算任务的状态，最终实现对整体并行计算任务的最优加速效果。

与现有技术相比较，本发明可以实现对不同任务类型下的多算法、可分组任务下的快速并行计算，大幅提升并行计算的执行效率，给主控与节点机安装了“大脑”，通过本发明，可在同等计算机资源的情况下，实现对不同任务的“灵活可配置”，尤其是对多算法、复杂“关联”算例有非常高的提升效果。

附图说明

图1为并行计算内部算法逻辑示意图。

具体实施方式

为使本发明的目的、内容、和优点更加清楚，下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。

所述复杂算力系统并行处理方法包括如下步骤：

步骤1-7：对于“执行结果标志”，在初始配置时置空；

至此，作业任务分发结束。

若无剩余作业任务，则并行作业任务结束。

实施效果验证

针对并行计算方法，根据应用软件中算法的不同，现举例分步说明：

第一步，通过对项目背景的算法进行梳理，得出单条任务下的不同算法间的计算时间如下表所示：

第二步，结合项目背景，任务间存在“关联性”，当一条任务完成时，同一方向下的不同高度层可以停止计算，即可将5条任务分为一组。

第三步，创建任务，设定任务总数为30条，并行机器数量为18台，则分别开展串行，传统并行计算时间。

串行时间：T串行＝30*(6+4+8+2+1+9)＝900秒

传统并行时间，算法间不能绑定，即算法间为串行，且任务间无“关联性”，则并行计算时间，使用最大并行量18台，时间为ceil(30/18)*(6+4+8+2+1+9)＝60秒

第四步，优化后并行算法时间统计，可以将单个任务根据算法分为三组，算法1、算法2作为节点机1，算法3、算法4作为节点机2，算法5、算法6作为节点机3，并将任务[1，5]分为组1，具体分配如下：

通过上表可进行计算，当使用“任务关联性配置文件”进行多算法、分组配置后，当出现计算异常时，最快可在1秒后根据异常情况(服务异常、数据断开等)，通过主控停止所有计算，并行计算时间约为2秒(1秒节点机计算+1秒节点机向主控发送中断消息及主控执行)；当单任务下各算法均完成计算时，并停止组内相应任务，30条任务最多可以分为6组，每组优先执行一条任务，其时间最多可以优化为T_优化后＝10*(3*6/18)＝10秒。

第五步，对比优化前后的试验效果，如下表所示：

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种基于灵活配置实现性能提优的复杂算力系统并行处理方法，其特征在于，所述方法基于复杂算力系统并行处理系统来实施，所述复杂算力系统并行处理系统包括：应用系统、主控节点机、多个并行节点机；

所述复杂算力系统并行处理方法包括如下步骤：

2.如权利要求1所述的基于灵活配置实现性能提优的复杂算力系统并行处理方法，其特征在于，所述步骤1中，所述任务关联性配置文件包括：“优化开关标志”、“单任务多算法标志”、“单任务算法组合方案标志”、“分组管理标志”、“分组并行数量”、“任务并行单元处理方法标志”、“执行结果标志”；

步骤1-7：对于“执行结果标志”，在初始配置时置空；

3.如权利要求2所述的基于灵活配置实现性能提优的复杂算力系统并行处理方法，其特征在于，所述步骤3中，根据任务关联性配置文件，对并行作业任务分配并行节点机的空闲算力资源的过程如下：

4.如权利要求3所述的基于灵活配置实现性能提优的复杂算力系统并行处理方法，其特征在于，所述步骤3-3中，所述进行并行作业任务分发，即主控节点机生成任务执行指令并发送给并行节点机，该任务执行指令中明确了对于某一并行节点机，对应一个或多个并行作业任务需要其提供空闲算力资源，且明确了对于该一个或多个并行作业任务所需执行的算法组合，该并行节点机对应需提供的空闲算力资源量；

至此，作业任务分发结束。

5.如权利要求4所述的基于灵活配置实现性能提优的复杂算力系统并行处理方法，其特征在于，所述步骤4中，根据任务关联性配置文件进行流程控制的过程如下：

若无剩余作业任务，则并行作业任务结束。

6.如权利要求2所述的基于灵活配置实现性能提优的复杂算力系统并行处理方法，其特征在于，所述步骤1-1中，所述“关联性”计算是指在作业处理过程中，并行作业任务之间产生数据交互。

7.如权利要求2所述的基于灵活配置实现性能提优的复杂算力系统并行处理方法，其特征在于，所述步骤1-3中，对于某一并行作业任务，其算法类型包括识别算法，跟踪算法和通视算法，其中，识别算法和跟踪算法之间为并行关系，通视算法与另外两算法之间为串行关系，则将“单任务算法组合方案标志”配置为“1,2；3”。

8.如权利要求1所述的基于灵活配置实现性能提优的复杂算力系统并行处理方法，其特征在于，所述应用系统与主控节点机，以及主控节点机与各个并行节点机之间所建立的网络通信机制，能够实现相互间数据的进程重启、数据传输、掉线重连以及空闲算力资源监控功能。

9.如权利要求3所述的基于灵活配置实现性能提优的复杂算力系统并行处理方法，其特征在于，所述步骤3-1中，若任务关联性配置文件中的“优化开关标志”为“0”，则以单条并行作业任务为最小粒度，并根据并行节点机的空闲算力资源按比例进行并行作业任务分发，作业任务分发结束。

10.如权利要求3所述的基于灵活配置实现性能提优的复杂算力系统并行处理方法，其特征在于，所述步骤3-2中，若任务关联性配置文件中的“单任务多算法标志”为“0”，则以单条并行作业任务为最小粒度，并根据并行节点机的空闲算力资源按比例进行并行作业任务分发，作业任务分发结束。