CN110780991B

CN110780991B - 一种基于优先级的深度学习任务调度方法及装置

Info

Publication number: CN110780991B
Application number: CN201910866036.0A
Authority: CN
Inventors: 左聪越
Original assignee: Suzhou Inspur Intelligent Technology Co Ltd
Current assignee: Suzhou Inspur Intelligent Technology Co Ltd
Priority date: 2019-09-12
Filing date: 2019-09-12
Publication date: 2023-01-06
Anticipated expiration: 2039-09-12
Also published as: CN110780991A

Abstract

本发明为了解决现有技术中存在的问题，创新提出了一种基于优先级的深度学习任务调度方法，包括：根据用户的优先级确定job的优先级，job优先级高的优先被调度，其中用户优先级与其提交的job优先级对应相同；如果job的优先级相同，获取job的状态，处于ready状态的job优先被调度；如果job均处于ready状态，通过调用job的优先级函数计算job的share值并进行比较，share值最小的job优先被调度，本发明还提出了一种基于优先级的深度学习任务调度装置，通过对深度学习训练任务根据优先级进行排队，使高优先级的任务优先运行，合理利用计算资源，提高了深度学习训练任务的效率。

Description

一种基于优先级的深度学习任务调度方法及装置

技术领域

本发明涉及深度学习任务调度领域，尤其是涉及一种基于优先级的深度学习任务调度方法及装置。

背景技术

深度学习是机器学习的一种，而机器学习是实现人工智能的必经路径。深度学习的概念源于人工神经网络的研究，含多个隐藏层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。研究深度学习的动机在于建立模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本等。

而在深度学习领域，调度算法是深度学习系统的核心，对于深度学习任务是否可以快速高效完成，以及计算资源的是否合理利用起着决定性因素。

目前深度学习调度中，并没有统一的调度方法，调度比较混乱，缺乏根据任务优先级来确定统一的资源调度，计算资源的利用不够合理，深度学习训练任务效率较低。

发明内容

本发明为了解决现有技术中存在的问题，创新提出了一种基于优先级的深度学习任务调度方法及装置，有效解决由于缺乏根据任务优先级来确定统一的资源调度造成计算资源的利用不够合理的问题，有效的提高的深度学习训练任务效率。

本发明第一方面提供了一种基于优先级的深度学习任务调度方法，包括：

根据用户的优先级确定job的优先级，job优先级高的优先被调度，其中用户优先级与其提交的job优先级对应相同；

如果job的优先级相同，获取job的状态，处于ready状态的job优先被调度；

如果job均处于ready状态，通过调用job的优先级函数计算job的share值并进行比较，share值最小的job优先被调度。

结合第一方面，在第一方面第一种可能的实现方式中，还包括：如果job的share值相同，获取job的创建时间，创建时间早的job优先被调度。

结合第一方面，在第一方面第二种可能的实现方式中，job处于ready状态的判断方法具体是：

通过调用gang插件，统计job内处于allocated状态以及succeeded状态的task的数量之和，当job内处于allocated状态以及succeeded状态的task的数量之和大于等于第一阈值时，即为job处于ready状态。

进一步地，所述第一阈值为job的运行最小task数量。

结合第一方面，在第一方面第三种可能的实现方式中，所述通过调用job的优先级函数，计算job的share值并进行比较具体包括：

计算集群中所有主机的可分配资源，其公式如下：

其中，ClusterGPU_allocatable表示集群中GPU的可分配资源，

表示对集群中所有主机上GPU的可分配资源进行求和计算；ClusterMemory_allocatable表示集群中Memory的可分配资源，，

表示对集群中所有主机上Memory的可分配资源进行求和计算；ClusterCPU_allocatable表示集群中CPU的可分配资源，

表示对集群中所有主机上CPU的可分配资源进行求和计算；

计算每个job中的所有task请求的资源，其公式如下：

其中，jobGPU_request表示job中请求的GPU资源，

表示job中所有task请求的GPU资源进行求和；jobMemory_request表示job中请求的Memory资源，

表示job中所有task请求的Memory资源进行求和；jobCPU_request表示job中请求的CPU资源，

表示job中所有task请求的CPU资源进行求和；

分别计算GPU、Memory、CPU的share值，从中选取最大值作为job的share值，并对job的share值进行比较，其公式如下：

其中，GPU_share表示GPU的share值，具体是job中请求的GPU资源和集群中GPU的可分配资源的比值；Memory_share表示Memory的share值，具体是job中请求的Memory资源和集群中Memory的可分配资源的比值；CPU_share表示GPU的share值，具体是job中请求的CPU资源和集群中CPU的可分配资源的比值。

结合第一方面，在第一方面第四种可能的实现方式中，所述job的优先级函数具体是通过drf函数定义获得。

本发明第二方面提供了一种基于优先级的深度学习任务调度装置，包括：

job优先级确定模块，根据用户的优先级确定job的优先级，job优先级高的优先被调度，其中用户优先级与其提交的job优先级对应相同；

job状态获取模块，如果job的优先级相同，获取job的状态，处于ready状态的job优先被调度；

比较模块，如果job均处于ready状态，通过调用job的优先级函数计算job的share值并进行比较，share值最小的job优先被调度。

结合第二方面，在第二方面第一种可能的实现方式中，还包括：创建时间获取模块，如果job的share值相同，获取job的创建时间，创建时间早的job优先被调度。

本发明采用的技术方案包括以下技术效果：

本发明通过对深度学习训练任务根据优先级进行排队，使高优先级的任务优先运行，合理利用计算资源，提高了深度学习训练任务的效率。

应当理解的是以上的一般描述以及后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

为了更清楚说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单介绍，显而易见的，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明方案中实施例一方法的流程示意图；

图2为本发明方案中实施例一方法步骤S3的流程示意图；

图3为本发明方案中实施例二方法的流程示意图；

图4为本发明方案中实施例三装置的结构示意图；

图5为本发明方案中实施例四装置的结构示意图。

具体实施方式

为能清楚说明本方案的技术特点，下面通过具体实施方式，并结合其附图，对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开，下文中对特定例子的部件和设置进行描述。此外，本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的，其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意，在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。

实施例一

如图1所示，本发明提供了一种基于优先级的深度学习任务调度方法，包括：

S1，根据用户的优先级确定job(作业)的优先级，job优先级高的优先被调度，其中用户优先级与其提交的job优先级对应相同；

S2，如果job的优先级相同，获取job的状态，处于ready状态的job优先被调度；

S3，如果job均处于ready状态，通过调用job的优先级函数计算job的share(变量)值并进行比较，share值最小的job优先被调度。

在步骤S1中，根据用户的优先级来确定job的优先级，其中用户为提交job的用户，系统创建用户时，根据用户的优先级指定该用户创建job的优先级，优先级可以分为高、中、低三个级别。用户创建job后将job的优先级传递给调度器。优先级别高的用户提交的job能够优先被调度。其中，用户优先级具体是由系统管理员创建普通用户时定义，目前系统管理员在页面上创建普通用户时存在一设置选项，可以设置用户高、中、低优先级，可以根据用户的类型、级别等因素，进行设置优先级。

举例说明：指定用户A为高优先级的用户，用户C为低优先级用户，用户A提交jobA，用户C提交jobC，那么在同一个Queue(队列)中jobA排在jobC前面，优先被调度。

在步骤S2中，如果job的优先级相同，获取job的状态，job可以处于ready状态以及非ready状态，处于ready状态的job优先被调度，其中，job处于ready状态的判断方法具体是：

通过调用gang插件，统计job内处于allocated状态以及succeeded状态的task(任务进程)的数量之和，当job内处于allocated状态以及succeeded状态的task的数量之和大于等于第一阈值时，即为job处于ready状态。其中，succeeded状态是已经运行完成的，allocated状态是已经分配好资源的，因为一个job对应多个task，当已经分配了资源(allocated)和已经运行完(successed)，job是ready状态了。第一阈值为job的运行最小task数量，job的运行最小task数量是job能够正常运行的最小task数量(副本数量不计算在内，副本是用户提交任务时可以设置的值，可以理解为备用)，这个数量跟用户提交的训练任务有关，需要结合实际使用情况进行设定或调整，本发明在此不做限制。

举例说明：jobC和jobD都处于低优先级时，假设jobC为ready状态，jobD非ready状态，那么在同一个Queue中jobC排在jobD前面，优先被调度。

如图2所示，在步骤S3中，通过调用job的优先级函数，计算job的share值并进行比较具体包括：

S31，计算集群中所有主机的可分配资源，其公式如下：

其中，ClusterGPU_allocatable表示集群中GPU的可分配资源，

表示对集群中所有主机上CPU的可分配资源进行求和计算；

S32，计算每个job中的所有task请求的资源(训练任务运行需要使用计算资源)，其公式如下：

其中，jobGPU_request表示job中请求的GPU资源，

表示job中所有task请求的CPU资源进行求和；

S33，分别计算GPU、Memory、CPU的share值，从中选取最大值作为job的share值，并对job的share值进行比较，其公式如下：

其中job的优先级函数具体是通过drf函数定义获得。

举例说明：jobC和jobE都处于低优先级时，且都为ready状态，假设jobC的share值小于jobE的share值，那么在同一个Queue中jobC排在jobE前面，优先被调度。

实施例二

如图3所示，本发明技术方案还提供了一种一种基于优先级的深度学习任务调度方法，包括：

S1，根据用户的优先级确定job的优先级，job优先级高的优先被调度，其中用户优先级与其提交的job优先级对应相同；

S3，如果job均处于ready状态，通过调用job的优先级函数计算job的share值并进行比较，share值最小的job优先被调度。

S4，如果job的share值相同，获取job的创建时间，创建时间早的job优先被调度。

其中，在步骤S4中，当job的share值相同时，获取job的创建时间，创建时间早的job会优先被调度，其中job的创建时间获取方式可以为：用户提交一个深度学习任务后，系统会记录一个创建时间create_date。

jobE和jobF都处于低优先级，且都为ready状态，且share值相同。假设jobE创建时间早于jobF的创建时间，那么在同一个Queue中jobE排在jobF前面，优先被调度。

实施例三

如图4所示，本发明技术方案还提供了一种基于优先级的深度学习任务调度装置，包括：

job优先级确定模块101，根据用户的优先级确定job的优先级，job优先级高的优先被调度，其中用户优先级与其提交的job优先级对应相同；

job状态获取模块102，如果job的优先级相同，获取job的状态，处于ready状态的job优先被调度；

比较模块103，如果job均处于ready状态，通过调用job的优先级函数计算job的share值并进行比较，share值最小的job优先被调度。

实施例四

如图5所示，本发明技术方案还提供了一种基于优先级的深度学习任务调度装置，包括：

比较模块103，如果job均处于ready状态，通过调用job的优先级函数计算job的share值并进行比较，share值最小的job优先被调度；

创建时间获取模块，如果job的share值相同，获取job的创建时间，创建时间早的job优先被调度。

本发明技术方案主要是对单个Queue中job排序，对多个Queue中job排序也有一定的借鉴意义。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

1.一种基于优先级的深度学习任务调度方法，其特征是，包括：

如果job均处于ready状态，通过调用job的优先级函数计算job的share值并进行比较，share值最小的job优先被调度；其中，所述通过调用job的优先级函数，计算job的share值并进行比较具体包括：

计算集群中所有主机的可分配资源，其公式如下：

其中，

表示集群中GPU的可分配资源，

表示对集群中所有主机上GPU的可分配资源进行求和计算；

表示集群中Memory的可分配资源，

表示对集群中所有主机上Memory的可分配资源进行求和计算；

表示集群中CPU的可分配资源，

表示对集群中所有主机上CPU的可分配资源进行求和计算；

计算每个job中的所有task请求的资源，其公式如下：

其中，

表示job中请求的GPU资源，

表示job中所有task请求的GPU资源进行求和；

表示job中请求的Memory资源，

表示job中所有task请求的Memory资源进行求和；

表示job中请求的CPU资源，

表示job中所有task请求的CPU资源进行求和；

其中，

表示GPU 的share值，具体是job中请求的GPU资源和集群中GPU的可分配资源的比值；

表示Memory 的share值，具体是job中请求的Memory资源和集群中Memory的可分配资源的比值；

表示GPU 的share值，具体是job中请求的CPU资源和集群中CPU的可分配资源的比值。

2.根据权利要求1所述的基于优先级的深度学习任务调度方法，其特征是，还包括：如果job的share值相同，获取job的创建时间，创建时间早的job优先被调度。

3.根据权利要求1所述的基于优先级的深度学习任务调度方法，其特征是，job处于ready状态的判断方法具体是：

4.根据权利要求3所述的基于优先级的深度学习任务调度方法，其特征是，所述第一阈值为job的运行最小task数量。

5.根据权利要求1所述的基于优先级的深度学习任务调度方法，其特征是，所述job的优先级函数具体是通过drf函数定义获得。

6.一种基于优先级的深度学习任务调度装置，其特征是，包括：

比较模块，如果job均处于ready状态，通过调用job的优先级函数计算job的share值并进行比较，share值最小的job优先被调度；所述通过调用job的优先级函数，计算job的share值并进行比较具体包括：

计算集群中所有主机的可分配资源，其公式如下：

其中，

表示集群中GPU的可分配资源，

表示对集群中所有主机上GPU的可分配资源进行求和计算；

表示集群中Memory的可分配资源，

表示对集群中所有主机上Memory的可分配资源进行求和计算；

表示集群中CPU的可分配资源，

表示对集群中所有主机上CPU的可分配资源进行求和计算；

计算每个job中的所有task请求的资源，其公式如下：

其中，

表示job中请求的GPU资源，

表示job中所有task请求的GPU资源进行求和；

表示job中请求的Memory资源，

表示job中所有task请求的Memory资源进行求和；

表示job中请求的CPU资源，

表示job中所有task请求的CPU资源进行求和；

其中，

7.根据权利要求6所述的基于优先级的深度学习任务调度装置，其特征是，还包括：创建时间获取模块，如果job的share值相同，获取job的创建时间，创建时间早的job优先被调度。