CN109254846B

CN109254846B - 基于两级调度的cpu与gpu协同计算的动态调度方法及系统

Info

Publication number: CN109254846B
Application number: CN201810861203.8A
Authority: CN
Inventors: 高原; 顾文杰; 李华东; 张磊; 陈泊宇; 张用; 顾雯轩; 陈素红; 丁雨恒
Original assignee: State Grid Corp of China SGCC; Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd; NARI Group Corp; Nari Technology Co Ltd; NARI Nanjing Control System Co Ltd
Current assignee: State Grid Corp of China SGCC; Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd; NARI Group Corp; Nari Technology Co Ltd; NARI Nanjing Control System Co Ltd
Priority date: 2018-08-01
Filing date: 2018-08-01
Publication date: 2022-06-03
Anticipated expiration: 2038-08-01
Also published as: CN109254846A

Abstract

本发明公开了一种基于两级调度的CPU与GPU协同计算的动态调度方法及系统，包括：预估系统中各个节点的处理能力；全局调度模块根据各节点中的节点调度模块的请求分批次按照预估的各节点的处理能力进行动态分发数据至各个节点；节点中的节点调度模块发现用于放置处理数据的数据队列为空时，则向全局调度模块请求下一批次待处理数据，并按照节点内的CPU和GPU处理能力进行动态任务调度。本发明考虑到了系统资源的异构性，让性能弱的节点分担较少的任务，性能强的节点处理更多的任务，能够提高CPU/GPU异构混合并行系统的整体并发度，减少任务完成时间。

Description

基于两级调度的CPU与GPU协同计算的动态调度方法及系统

技术领域

本发明属于分布式计算技术领域，具体涉及一种基于两级调度的CPU与GPU协同计算的动态调度方法。

背景技术

CPU/GPU异构混合并行系统以其强劲计算能力、高性价比和低能耗等特点成为新型高性能计算平台，但其复杂体系结构也为并行计算研究提出了巨大挑战。现有技术中在CPU/GPU异构混合并行系统进行任务调度的研究一般是采取对各种类型硬件的计算能力或者是任务在各类处理器上的运行时间进行预测，然后进行一次性任务分配。这种方法缺项明显，因此预测可能不够准确，会造成各个计算节点的结束时间不一致，造成有些节点有长尾现象，其他节点可能在最后阶段空闲，没有充分发挥集群的计算能力，任务完成时间没有达到最短。

发明内容

针对上述问题，本发明提出一种基于两级调度的CPU与GPU协同计算的动态调度方法，考虑到了系统资源的异构性，让性能弱的节点分担较少的任务，性能强的节点处理更多的任务，能够提高CPU/GPU异构混合并行系统的整体并发度，减少任务完成时间。

实现上述技术目的，达到上述技术效果，本发明通过以下技术方案实现：

第一方面，本发明提供一种基于两级调度的CPU与GPU协同计算的动态调度方法，该方法的执行过程就是各个计算节点从全局调度模块分多批次动态获取数据，并在节点内部的CPU与GPU之间动态调度数据的过程，包括以下步骤：

步骤(1)：预估系统中各个节点的处理能力；所述的节点为计算节点；

作为本发明的进一步改进，所述步骤(1)具体为：根据各个节点中CPU和GPU相关信息计算出系统范围内所有节点的处理能力权值。

优选地，所述步骤(1)具体包括以下子步骤：

(1.1)实时监视每个节点的中的CPU和GPU的型号和空闲状态以及其他相关参数信息，并将前述信息汇总到全局调度模块；所述其他相关参数信息包括：CPU的主频、核心数、平均空闲率等参数，以及GPU的型号、流处理器数量等参数；

(1.2)全局调度模块中的计算能力量化模型根据接收到的信息对各节点进行CPU和GPU处理能力总和进行预估；更优选地，所述步骤(1.2)具体包括以下子步骤：全局调度模块在各节点使用测试任务对各节点的CPU和GPU进行性能评估，然后再根据实时监视模块发来的各个节点的CPU和GPU处理器型号和空闲率等信息，确定整个系统范围内所有节点的处理能力权值；

(1.2.1)全局调度模块在调度任务前，先将任务在各节点的CPU和GPU上执行，处理设定段长度的数据；比较CPU和GPU所消耗的时间，得出各节点中CPU和GPU的处理能力比值；

(1.2.2)再根据接收到的信息计算出整个系统范围内所有节点的处理能力权值，作为动态调度的依据，具体为:计算时间比值的倒数就是权值的比值。

步骤(2)：全局调度模块根据各节点中的节点调度模块的请求分批次按照预估的各节点的处理能力进行动态分发数据至各个节点；

作为本发明的进一步改进，具体为：

(2.1)全局调度模块将当前计算任务的所有数据尽可能的进行细粒度拆分；

(2.2)在各个节点中的节点调度模块请求数据时，按照各个节点的计算能力的权值按比例分发与其计算能力相匹配的数据量到节点，权值越高的节点分得的数据越多，且每次只分发1MB至10MB左右的数据，等待先完成计算的节点再次进行请求，保证整个系统并发运行和负载均衡，避免一次性分发完毕造成的某些节点的长尾现象。

步骤(3)：当节点中的节点调度模块发现本节点中用于放置处理数据的数据队列为空时，则向全局调度模块请求下一批次待处理数据，并按照节点内的CPU和GPU处理能力进行动态任务调度，完成基于两级调度的CPU与GPU协同计算的动态调度；

作为本发明的进一步改进，为了提高本发明的数据处理效率，所述步骤(3)具体为：各个节点中均设置两条节点级数据存储队列，两条节点级数据存储队列在当前处理队列和数据缓存队列间进行角色轮换，当节点调度模块发现本节点中的数据缓存队列为空且网络空闲时，则向全局调度模块请求下一批次待处理数据，并按照节点内的CPU和GPU处理能力进行动态任务调度，完成基于两级调度的CPU与GPU协同计算的动态调度；

所述的两条节点级数据存储队列在当前处理队列和数据缓存队列间进行角色轮换，当节点调度模块发现本节点中的数据缓存队列为空且网络空闲时，则向全局调度模块请求下一批次待处理数据，具体为：

在节点内设置两条节点级数据存储队列；

在节点调度模块向全局调度模块第一次请求数据时，得到的数据随机存放在一个队列中，此时这个队列的角色变为当前处理队列，另一个队列角色变为数据缓存队列；当节点调度模块发现当前处理队列中有数据，本节点的网络空闲且数据缓存队列为空时，说明当前节点进入数据处理状态，此时可以并发的进行网络传输，开始请求数据并存入缓存队列；

当前处理队列中的数据变为空后(说明其中数据已被本节点中的CPU和GPU处理完毕)，两种队列的角色立刻对调，保证CPU和GPU连续不断得到数据进行处理，此时数据缓存队列为空，节点调度模块立刻向全局调度模块请求下一批数据，填充数据缓存队列，如果全局调度模块返回空数据集则说明全部数据已经分发完成，当前处理队列的数据全部处理完成后，当前计算任务即可退出。

所述的按照节点内的CPU和GPU处理能力进行动态任务调度，具体为：

在本节点的CPU从当前处理队列中获取数据开始处理时，选择一部分数据并根据本节点的CPU和GPU处理能力权值按比例分发到CPU和GPU进行处理；

当GPU空闲时继续迁移数据到GPU进行处理，对CPU的调度同理，优选地，在队列上进行加锁处理，避免两个处理器获得重复的数据，直至当前处理队列中的数据为空，实现了节点上的数据在CPU和GPU间动态调度，保证了一个节点的CPU和GPU的充分并发执行和负载均衡。

第二方面，本发明提供一种基于两级调度的CPU与GPU协同计算的动态调度系统，包括：

系统级的资源实时监视模块；所述资源实时监视模块实时监视每个节点中的CPU和GPU的相关参数；所述的相关参数包括CPU的型号、主频、核心数、平均空闲率等参数，以及GPU的型号、流处理器数量等参数；

全局调度模块；所述全局调度模块接收资源实时监视模块发送的信息，并预估系统中各个节点的处理能力，根据各节点中的节点调度模块的请求分批次按照预估的各节点的处理能力进行动态分发数据至各个节点；

设于各个节点中的节点调度模块；当节点调度模块发现本节点中用于放置处理数据的数据队列为空时，则向全局调度模块请求下一批次待处理数据，并按照节点内的CPU和GPU处理能力进行动态任务调度，完成基于两级调度的CPU与GPU协同计算的动态调度。

进一步地，所述基于两级调度的CPU与GPU协同计算的动态调度系统还包括：设于各个节点中的两条节点级数据存储队列；该两条节点级数据存储队列在当前处理队列和数据缓存队列间进行角色轮换。

进一步地，两条节点级数据存储队列在当前处理队列和数据缓存队列间进行角色轮换；当节点调度模块发现本节点中的缓存队列为空且网络空闲时，则向全局调度模块请求下一批次待处理数据，具体为：

在节点内设置两条节点级数据存储队列；

在节点调度模块向全局调度模块第一次请求数据时，得到的数据随机存放在一个队列中，此时这个队列的角色变为当前处理队列，另一个队列角色变为数据缓存队列；当节点调度模块发现当前处理队列中有数据，本节点的网络空闲且数据缓存队列为空时，说明当前节点进入数据处理状态，开始请求数据并存入缓存队列；

当前处理队列中的数据变为空后，两种队列的角色立刻对调，此时数据缓存队列为空，节点级调度模块立刻向全局调度模块请求下一批数据，填充数据缓存队列，如果全局调度模块返回空数据集则说明全部数据已经分发完成，当前处理队列的数据全部处理完成后，当前计算任务即可退出。

进一步地，所述全局调度模块预估系统中各个节点的处理能力，具体为：

全局调度模块在调度任务前，先将任务在各节点的CPU和GPU上执行，处理设定段长度的数据；比较CPU和GPU所消耗的时间，得出各节点中CPU和GPU的处理能力比值；

再根据接收到的信息计算出各个节点计算能力的权值，作为动态调度的依据。

进一步地，所述根据各节点中的节点调度模块的请求分批次按照预估的各节点的处理能力进行动态分发数据至各个节点，具体为：

(2.1)全局调度模块将当前计算任务的所有数据进行细粒度拆分；

(2.2)在各个节点中的节点调度模块请求数据时，按照各个节点的计算能力的权值按比例分发数据，权值越高的节点分得的数据越多，且每次只分发1MB至10MB左右的数据，等待先完成计算的节点再次进行请求。

进一步地，所述的按照节点内的CPU和GPU处理能力进行动态任务调度，具体为：

当GPU空闲时继续迁移数据到GPU进行处理，对CPU的调度同理，直至当前处理队列中的数据为空。

与现有技术相比，本发明的有益效果：

(1)本发明通过全局调度模块和计算能力量化方法，让CPU与GPU处理能力强的节点获得更的计算数据，处理更多的任务，使得系统更加负载均衡。

(2)本发明通过全局调度模块和动态数据调度方法，可对先处理完成的节点进行数据再分发，使得系统的计算节点实现能者多劳，各个节点计算任务趋近于同时完成，保证了系统整体的并发性，缩短了系统级的任务处理时间。

(3)本发明通过各个节点的两种数据存储队列，让各个节点在进行数据处理的同时能够继续进行数据传输，实现了节点级的流水线处理，保证了数据处理和数据传输不会相互等待，实现了数据处理的连续性，提高了单个节点的吞吐量。

(4)本发明通过节点调度模块，实现数据在CPU和GPU之间的动态调度，使得处理能力强的处理器获得更多的待处理数据，提高了节点级的并发度，提高了单个节点的处理能力。

(5)本发明通过纯软件实现，不需要额外安装第三方软件，且适用于Linux和Windows平台。

附图说明

图1是本发明一种实施例的动态调度方法的软件框架图；

图2是本发明一种实施例的全局调度模块数据分发示意图；

图3是本发明一种实施例的两种类型数据存储队列角色轮换意图；

图4是本发明一种实施例的节点级调度模块数据调度示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

为了解决现有技术中采取对各种类型硬件的计算能力或者是任务在各类处理器上的运行时间进行预测，然后进行一次性任务分配，而造成的预测可能不够准确，会造成各个计算节点的结束时间不一致，造成有些节点有长尾现象，其他节点可能在最后阶段空闲，没有充分发挥集群的计算能力，任务完成时间没有达到最短的问题，本发明提出了一种基于两级调度的CPU与GPU协同计算的动态调度方法，其主要发明构思为：

每个计算节点根据预估的计算能力获得首批计算数据，然后在节点内部的CPU和GPU间动态分配计算数据，完成一批数据处理的CPU或者GPU会立刻从队列中继续获取待处理数据，保证节点内各个处理器核心的充分运转。处理完成整条队列数据的节点会立刻向全局调度模块获取数据，以保证数据在全系统内动态分配。本发明考虑到了系统资源的异构性，让性能弱的节点分担较少的任务，性能强的节点处理更多的任务，能够提高CPU/GPU异构混合并行系统的整体并发度，减少任务完成时间。

下面结合附图对本发明的应用原理作详细的描述。

实施例1

如图1所示是本发明的动态调度方法的软件框架图，图1中的全局调度模块可部署在任意节点并且采取主备冗余保证可靠性；节点调度模块工作在每个节点；全局调度模块负责根据各个节点的计算能力在系统内分发数据块。每个节点有两个数据存储队列，分别是当前处理队列和数据缓存队列；所述当前处理队列中存放的是当前CPU和GPU正在处理的数据块；所述数据缓存队列中存放的是网络传输到本地的待处理数据块。

如图2所示是全局调度模块数据分发的示意图。图2中全局调度模块首先根据各个节点的处理器(包括CPU和GPU)型号等参数确定各个节点的计算能力权值。其中，节点1的显卡有1280个流处理单元，显卡核心频率为1600MHz；节点2的显卡有768个流处理单元，显卡核心频率为1400MHz；节点3的显卡有384个流处理单元，显卡核心频率为1300MHz；节点4的显卡与节点3的显卡相同。使用流处理单元数与显卡核心频率的乘积作为计算能力权值，得到4个节点的比值为4:2:1:1。另外，使用测试任务得到4个节点中的CPU的处理能力与GPU处理能力的比值分别为0.5:1，0.5:1，1:1，0.5:1，所述使用测试任务得到4个节点中的CPU的处理能力与GPU处理能力的比值的计算过程为现有技术，本发明中不做过多的赘述，最终得到每个节点的综合计算能力比值为12:6:4:3。因此，每次节点调度模块向全局调度模块请求数据时，全局调度模块单次下发的数据量的比值就为12:6:4:3。

如图3所示是两种类型数据存储队列角色轮换示意图。图3中左侧是节点调度模块正在从当前处理队列中调度数据块给本节点中的CPU和GPU进行处理，节点中的数据缓存队列为空。图3中间是节点调度模块发现本节点中的数据缓存队列为空，并且本节点中的网络带宽处于空闲状态，则开始向全局调度模块请求数据，存入数据缓存队列。图3右侧是当前处理队列中的数据处理完毕，则数据缓存队列的角色立刻转变为当前处理队列，开始向本节点中的CPU和GPU输送数据进行处理。同时，节点调度模块准备进行下一轮的网络传输。

如图4所示是节点调度模块数据调度示意图。图4中的计算节点上的CPU与GPU的计算能力比值为0.5:1。因此图4中左侧是当第一次调度时，节点调度模块调度1个数据块到CPU上，调度2个数据块到GPU上。图4中间表示GPU处理完两个数据块后，节点调度模块再次调度2个数据块到GPU上。图4右侧表示紧接着CPU处理完1个数据块后，节点调度模块再次调度1个数据块到CPU上。重复前述的步骤直到当前处理队列为空。

通过上述实施例可知：本发明通过全局调度模块，让CPU与GPU处理能力强的节点获得更的计算数据，使得系统能够实现更加负载均衡；并通过全局调度模块，对先处理完成的节点进行数据再分发，使各个节点计算任务趋近于同时完成，大大缩短了系统级的任务处理时间；通过节点级的两种数据存储队列，让各个节点在进行数据处理的同时能够继续进行数据传输，提高了单个节点的吞吐量；通过节点调度模块，实现数据在CPU和GPU之间的动态调度，从而实现了处理能力强的处理器获得更多的待处理数据，提高了节点级的并发度。

此外，本发明不需要额外的第三方软件支撑，兼容性强，支持跨平台，所有程序支持LINUX/WINDOWS平台。

实施例2

基于与实施例1相同的发明构思，本发明实施例中提供了一种基于两级调度的CPU与GPU协同计算的动态调度系统，包括：

设于各个节点中的两条节点级数据存储队列；该两条节点级数据存储队列在当前处理队列和数据缓存队列间进行角色轮换；在本发明的其他实施例中，可以不设置两条节点级数据存储队列，直接设置一条数据存储队列即可，只是这种方式的数据处理效率低于本实施例中的数据处理效率；

设于各个节点中的节点调度模块；当节点调度模块发现本节点中的缓存队列为空且网络空闲时，则向全局调度模块请求下一批次待处理数据，并按照节点内的CPU和GPU处理能力进行动态任务调度，完成基于两级调度的CPU与GPU协同计算的动态调度。

在本实施例的优选实施方式中，所述的两条节点级数据存储队列在当前处理队列和数据缓存队列间进行角色轮换；当节点调度模块发现本节点中的缓存队列为空且网络空闲时，则向全局调度模块请求下一批次待处理数据，具体为：

在节点内设置两条节点级数据存储队列；

在本实施例的优选实施方式中，所述全局调度模块根据各节点中的节点调度模块的请求分批次按照预估的各节点的处理能力进行动态分发数据至各个节点，具体为：

在本实施例的优选实施方式中，所述节点调度模块按照节点内的CPU和GPU处理能力进行动态任务调度，具体为：

综上所述：

本发明公开了一种基于两级调度的CPU与GPU协同计算的动态调度方法及系统，包括：预估系统中各个节点的处理能力；全局调度模块根据各节点中的节点调度模块的请求分批次按照预估的各节点的处理能力进行动态分发数据至各个节点；各个节点中的节点调度模块发现用于放置处理数据的数据队列为空时，则向全局调度模块请求下一批次待处理数据，并按照节点内的CPU和GPU处理能力进行动态任务调度。本发明考虑到了系统资源的异构性，让性能弱的节点分担较少的任务，性能强的节点处理更多的任务，能够提高CPU/GPU异构混合并行系统的整体并发度，减少任务完成时间。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种基于两级调度的CPU与GPU协同计算的动态调度方法，其特征在于，包括以下步骤：

(1)预估系统中各个节点的处理能力；

(2)全局调度模块根据各节点中的节点调度模块的请求分批次按照预估的各节点的处理能力进行动态分发数据至各个节点；

(3)节点中的节点调度模块发现用于放置处理数据的数据队列为空时，则向全局调度模块请求下一批次待处理数据，并按照节点内的CPU和GPU处理能力进行动态任务调度，完成基于两级调度的CPU与GPU协同计算的动态调度；

各个节点的处理能力的预估方法包括：

根据接收到的信息计算出各个节点计算能力的权值；

所述步骤(2)具体为：

(2.2)在各个节点中的节点调度模块请求数据时，按照各个节点的计算能力的权值按比例分发数据，权值越高的节点分得的数据越多，且每次只分1MB～10MB的数据，等待先完成计算的节点再次进行请求；

所述步骤(3)具体为：各个节点中均设置两条节点级数据存储队列，两条节点级数据存储队列在当前处理队列和数据缓存队列间进行角色轮换，当节点调度模块发现本节点中的数据缓存队列为空且网络空闲时，则向全局调度模块请求下一批次待处理数据，并按照节点内的CPU和GPU处理能力进行动态任务调度，完成基于两级调度的CPU与GPU协同计算的动态调度；

在节点内设置两条节点级数据存储队列；

当前处理队列中的数据变为空后，两种队列的角色立刻对调，此时数据缓存队列为空，节点调度模块立刻向全局调度模块请求下一批数据，填充数据缓存队列，如果全局调度模块返回空数据集则说明全部数据已经分发完成，当前处理队列的数据全部处理完成后，当前计算任务即可退出；

所述步骤(3)中的按照节点内的CPU和GPU处理能力进行动态任务调度，具体为：当本节点的当前处理队列有数据时，节点调度模块立刻选择一部分数据并根据本节点的CPU和GPU处理能力权值按比例分发到CPU和GPU进行处理；

2.根据权利要求1所述的一种基于两级调度的CPU与GPU协同计算的动态调度方法，其特征在于：所述步骤(1)包括以下子步骤：

(1.1)实时监视每个节点的中的CPU和GPU的型号和空闲状态以及其他相关参数信息，并将前述信息汇总到全局调度模块；

(1.2)全局调度模块根据接收到的信息对各节点进行CPU和GPU处理能力总和进行预估。

3.一种基于两级调度的CPU与GPU协同计算的动态调度系统，其特征在于，包括：

系统级的资源实时监视模块；所述资源实时监视模块实时监视每个节点中的CPU和GPU的相关参数；

设于各个节点中的节点调度模块；当节点调度模块发现本节点中用于放置处理数据的数据队列为空时，则向全局调度模块请求下一批次待处理数据，并按照节点内的CPU和GPU处理能力进行动态任务调度，完成基于两级调度的CPU与GPU协同计算的动态调度；

各个节点的处理能力的预估方法包括：

根据接收到的信息计算出各个节点计算能力的权值；

设于各个节点中的两条节点级数据存储队列；该两条节点级数据存储队列在当前处理队列和数据缓存队列间进行角色轮换；

两条节点级数据存储队列在当前处理队列和数据缓存队列间进行角色轮换；当节点调度模块发现本节点中的缓存队列为空且网络空闲时，则向全局调度模块请求下一批次待处理数据，具体为：

在节点内设置两条节点级数据存储队列；

当前处理队列中的数据变为空后，两种队列的角色立刻对调，此时数据缓存队列为空，节点级调度模块立刻向全局调度模块请求下一批数据，填充数据缓存队列，如果全局调度模块返回空数据集则说明全部数据已经分发完成，当前处理队列的数据全部处理完成后，当前计算任务即可退出；

所述按照节点内的CPU和GPU处理能力进行动态任务调度，具体为：

当本节点的当前处理队列有数据时，节点调度模块立刻选择一部分数据并根据本节点的CPU和GPU处理能力权值按比例分发到CPU和GPU进行处理；