CN114461386A

CN114461386A - 任务分配方法及任务分配装置

Info

Publication number: CN114461386A
Application number: CN202111663346.6A
Authority: CN
Inventors: 束柬; 徐生; 王金钖; 陈剑波; 况夫容
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2021-12-30
Filing date: 2021-12-30
Publication date: 2022-05-10

Abstract

本发明提供了一种任务分配方法和任务分配装置。该任务分配方法包括：对多个计算任务和多个计算资源单元进行定量化表征，得到定量表征结果；针对多个计算任务和多个计算资源单元，根据定量表征结果确定多个目标函数和对应的多个约束条件；基于多个约束条件，利用多目标优化算法对多个目标函数进行求解，获得非劣解集，其中，非劣解集中的每个非劣解对应一种任务分配策略；从非劣解集中选择最优解，并根据最优解将多个计算任务分配到多个计算资源单元上执行，能够实现计算资源的整合和合理分配。

Description

任务分配方法及任务分配装置

技术领域

本发明涉及计算机技术领域，具体涉及一种任务分配方法和任务分配装置。

背景技术

随着人工智能(Artificial Intelligence，AI)技术不断发展，其应用和数据类型不断丰富，用于AI生产的模型训练也变得日益复杂起来。计算任务的种类不断变多，其支持的计算资源也在不断发展丰富，例如，中央处理器(Central Processing Unit，CPU)，图形处理器(Graphics Processing Unit，GPU)，神经网络处理器(Neural Network ProcessingUnit，NPU)，现场可编程门阵列(Field-Programmable Gate Array，FPGA)等，其计算性能和计算属性也千差万别。

然而，传统方案异构计算资源往往是彼此割裂，各自独立计算的，需人工提交不同类型任务到对应计算资源上(比如针对图像类CNN网络的计算选取装有GPU的专门服务器来处理，针对矩阵类计算任务专门提交到NPU的计算设备上去)，缺乏统一的调度和分配平台，将多种类型的计算任务统一提交后分配给对应的计算资源处理。

发明内容

有鉴于此，本发明实施例提供了一种任务分配方法和任务分配装置，能够实现计算资源的整合和合理分配。

根据本发明实施例的第一方面，提供一种任务分配方法，包括：对多个计算任务和多个计算资源单元进行定量化表征，得到定量表征结果；针对多个计算任务和多个计算资源单元，根据定量表征结果确定多个目标函数和对应的多个约束条件；基于多个约束条件，利用多目标优化算法对多个目标函数进行求解，获得非劣解集，其中，非劣解集中的每个非劣解对应一种任务分配策略；从非劣解集中选择最优解，并根据最优解将多个计算任务分配到多个计算资源单元上执行。

在本发明的一个实施例中，上述多目标优化算法包括遗传算法，并且遗传算法在求解搜索过程中遗传算子针对的序列的长度是可变的。

在本发明的一个实施例中，遗传算法包括：

a、随机生成的N_p个可行解，作为初始化种群P；并生成一个外部存档集Q，并令Q为空；

b、为初始化种群分配适应度并执行环境选择过程；

c、判断是否满足终止条件；

d、当满足终止条件时，返回外部存档集Q中的解作为非劣解集；

e、当不满足终止条件时，执行配对选择操作，并且基于序列长度可变的遗传算子执行进化操作，获得新种群；

将新种群中的N_p个可行解作为初始化种群，迭代执行上述步骤b至步骤e。

在本发明的一个实施例中，遗传算子包括交叉算子，上述基于序列长度可变的遗传算子执行进化操作，获得新种群，包括：随机选取满足多个目标函数的任意两个待交叉可行解中的交叉起始点；从交叉起始点向左或向右逐项对任意两个待交叉可行解进行交叉操作；计算每次交叉操作生成的每个新可行解的多个目标函数值；当交叉操作生成的其中一个新可行解的多个目标函数值完全劣于交叉操作前的任一解的多个目标函数值时，交叉操作停止。

在本发明的一个实施例中，遗传算子包括变异算子，上述基于序列长度可变的遗传算子执行进化操作，获得新种群，包括：随机选取满足多个目标函数的待变异可行解中的变异点位置；从变异点位置向左或向右逐项对待变异可行解进行变异操作；计算每次变异操作生成的新解的多个目标函数值；当变异操作生成的新解的多个目标函数值非完全劣于变异操作前的任一解的多个目标函数值时，变异操作继续进行；当变异操作生成的新解的多个目标函数值完全劣于变异操作前的任一解的多个目标函数值时，变异操作停止。

在本发明的一个实施例中，上述任务分配方法还包括：对每次变异操作生成的新解进行资源约束判断，并丢弃产生的无效解。

在本发明的一个实施例中，上述目标函数包括时间函数、执行成本函数和/或服务质量函数。

在本发明的一个实施例中，时间函数满足：多个计算任务的总运行时间最短，其中，多个计算任务中的每个计算任务的运行时间用计算任务的任务计算量除以对应计算资源单元的计算效率来表征。

在本发明的一个实施例中，执行成本函数满足：多个计算任务的总执行成本最低，其中，多个计算任务中的每个计算任务的执行成本用计算任务的运行时间乘以对应计算资源单元的单位计算成本来表征。

在本发明的一个实施例中，服务质量函数满足：多个计算任务的总服务质量最高，其中，多个计算任务中的每个计算任务的服务质量用对应计算资源单元的服务质量来表征。

在本发明的一个实施例中，上述约束条件包括以下至少一个：多个计算任务中的第一计算任务被分配到第一计算资源单元上；第一计算资源单元的服务质量大于等于第一计算任务的服务质量需求；第一计算资源单元的硬件类型满足所述第一计算任务的资源约束类型。

在本发明的一个实施例中，多个计算任务包括特征提取任务、网络卷积任务、矩阵计算任务中的至少两个，多个计算资源单元包括中央处理器CPU、图形处理器GPU、神经网络处理器NPU和现场可编程门阵列FPGA中的至少两个。

在本发明的一个实施例中，多个计算任务中的每个计算任务由资源约束类型、任务计算量和服务质量需求中的至少一个来表征，多个计算资源单元中的每个计算资源单元由硬件类型、计算效率、单位计算成本、服务质量中的至少一个来表征。

根据本发明实施例的第二方面，提供一种任务分配装置，包括：定量化模块，用于对多个计算任务和多个计算资源单元进行定量化表征，得到定量表征结果；确定模块，用于针对多个计算任务和多个计算资源单元，根据定量表征结果确定多个目标函数和对应的多个约束条件；求解模块，用于基于多个约束条件，利用多目标优化算法对多个目标函数进行求解，获得非劣解集，其中，非劣解集中的每个非劣解对应一种任务分配策略；分配模块，用于从非劣解集中选择最优解，并根据最优解将多个计算任务分配到多个计算资源单元上执行。

根据本发明实施例的第三方面，提供一种计算机可读存储介质，其上存储有计算机可执行指令，其特征在于，所述可执行指令被处理器执行时实现上述任一项所述的任务分配方法。

根据本发明实施例的第四方面，提供一种电子设备，其特征在于，所述电子设备包括：处理器；用于存储所述处理器可执行指令的存储器；所述处理器，用于执行上述任一项所述的任务分配方法。

根据本发明实施例提供的技术方案，通过对多个计算任务和多个计算资源单元进行定量化表征，得到定量表征结果，针对多个计算任务和多个计算资源单元，根据定量表征结果确定多个目标函数和对应的多个约束条件，基于多个约束条件，利用多目标优化算法对多个目标函数进行求解，获得非劣解集，从非劣解集中选择最优解，并根据最优解将多个计算任务分配到多个计算资源单元上执行，能够实现计算资源的整合和合理分配。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1所示为本发明一实施例提供的任务分配方法的流程示意图。

图2所示为本发明一实施例提供的解空间和任务分配策略对应的映射关系图。

图3所示为本发明一实施例提供的遗传算法的流程图。

图4所示为本发明一实施例提供的交叉算子的原理图。

图5所示为本发明一实施例提供的变异算子的原理图。

图6所示为本发明一实施例提供的任务分配装置的框图。

图7所示为本发明一实施例提供的电子设备的框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1所示为本发明一实施例提供的任务分配方法的流程示意图。该方法可以由计算机设备(例如，服务器)执行。如图1所示，该方法包括如下内容。

S110：对多个计算任务和多个计算资源单元进行定量化表征，得到定量表征结果。

上述计算任务可以为深度学习任务，例如特征提取任务、网络卷积任务、矩阵计算任务等，应当理解，计算任务还可以为其他类型的计算任务，本发明对计算任务的类型不做具体限定。

上述多个计算资源单元可以是异构计算资源。例如，多个计算资源单元可以包括CPU、GPU、NPU和FPGA中的至少两个。应当理解，本发明对计算资源单元的类型也不做具体限定。

具体地，如表1所示，每个计算任务可以由资源约束类型、任务计算量和QoS(Quality of Service，服务质量)需求中的至少一个来表征，每个计算资源单元可以由硬件类型、计算效率、单位计算成本、服务质量中的至少一个来表征。

表1

需要说明的是，cr表示计算任务的资源约束类型，如CPU任务，GPU任务或FPGA任务等；ht表示对应的硬件类型；计算任务的运行时间为任务计算量CQ除以计算效率ce；运行成本为对应计算资源单元的单位计算成本c乘以时间；运行计算任务的计算资源单元的服务质量qos需要大于等于计算任务的QoS需求QR。

应当理解，计算任务和计算资源单元还可以采用其他属性进行表征，本发明对此不做具体限定。

S120：针对多个计算任务和多个计算资源单元，根据定量表征结果确定多个目标函数和对应的多个约束条件。

具体地，可以将异构计算资源单元的计算任务分配问题抽象为多目标优化问题。例如，某企业用户有n个计算任务{t₁,t₂,…,t_n}，并有m个异构计算资源单元{U₁,U₂,…,U_m}接入企业的深度学习服务系统中，则该多目标优化问题可以看成：企业如何分配N个任务到M个服务单元中，使得多个目标函数得到最优值，例如，时间函数f₁(t_i,U_j)尽可能短，执行成本函数f₂(t_i,U_j)尽可能低，服务质量函数f₃(t_i,U_j)尽可能高。

应当理解，上述多个目标函数可以包括时间函数、执行成本函数和/或服务质量函数等，目标函数数量及类型可以根据需要进行不同设置，本发明对此不做具体限定。

在本发明的一个实施例中，时间函数可以满足：多个计算任务的总运行时间最短，其中，多个计算任务中的每个计算任务的运行时间用计算任务的任务计算量除以对应计算资源单元的计算效率来表征。例如式(1)所示。

其中，t_i表示第i个计算任务，U_j表示第j个计算资源单元，D(t_i)表示第i个计算任务的计算时间，

表示第i个计算任务的任务计算量，

表示第j个计算资源单元的计算效率。

在本发明的一个实施例中，执行成本函数可以满足：多个计算任务的总执行成本最低，其中，多个计算任务中的每个计算任务的执行成本用计算任务的运行时间乘以对应计算资源单元的单位计算成本来表征。例如式(2)所示。

其中，t_i表示第i个计算任务，U_j表示第j个计算资源单元，C(t_i)表示第i个计算任务的计算成本，

表示第i个计算任务的任务计算量，

表示第j个计算资源单元的计算效率，

表示第j个计算资源单元的单位计算成本。

在本发明的一个实施例中，服务质量函数可以满足：多个计算任务的总服务质量最高，其中，多个计算任务中的每个计算任务的服务质量用对应计算资源单元的服务质量来表征。例如式(3)所示。

其中，t_i表示第i个计算任务，U_j表示第j个计算资源单元，QoS(t_i)表示第i个计算任务的服务质量，

表示第j个计算资源单元的服务质量。

通过设置时间函数、执行成本函数和服务质量函数，能够致力于提高计算效率，降低计算成本，提高服务质量。

应当理解，上述描述仅为示例性描述，本发明对时间函数、执行成本函数和服务质量函数的具体表示形式不做具体限定。

在本发明的一个实施例中，上述约束条件包括以下至少一个：计算任务t_i被分配到计算资源单元U_j上；计算资源单元的服务质量qos_j应大于等于计算任务的服务质量需求QR_i；计算资源单元的硬件类型ht_j应满足计算任务的资源约束类型cr_i，如GPU任务必须跑在GPU设备上，其中，计算设备的关联需求关系可用n×m维的矩阵CR和HT来表征。

例如，在本发明的一个实施例中，约束条件可以如式(4)所示。

其中，t_i表示第i个计算任务，U_j表示第j个计算资源单元，

表示第j个计算资源单元的服务质量，

表示第i个计算任务的服务质量需求，htj表示第j个计算资源单元的硬件类型，cr_i表示第i个计算任务的资源约束类型。应当理解，上述描述仅为示例性描述，本发明对约束条件的具体表示形式也不做具体限定。

S130：基于多个约束条件，利用多目标优化算法对多个目标函数进行求解，获得非劣解集，其中，非劣解集中的每个非劣解对应一种任务分配策略。

例如，在式(4)表示的约束条件下，利用多目标优化算法对上述式(1)至式(3)表示的时间函数、执行成本函数和服务质量函数进行求解，获得非劣解集。

上述多目标优化算法可以为SPEA2算法等，应当理解，本发明对多目标优化算法的具体类型不做限定。

在本发明实施例中，可以通过编码表征将不同任务分配策略映射到对应的解空间中。具体地，可以采用1维矩阵来表征多目标优化问题的解空间，其中，矩阵中元素的位置代表任务编码，矩阵中元素大小信息代表计算资源单元的编码，例如，该矩阵的第i列的值为j，代表计算任务t_i被分配计算资源单元u_j上。例如，如图2所示，解空间为ε_k＝[3 4 1 2 3 11 4 3]，其代表计算任务t₁被分配到计算资源单元u₃上，计算任务t₂被分配到计算资源单元u₄上，依次类推。对解空间ε_k来说，矩阵长|ε_k|表示计算任务的数量，矩阵中元素ε_k[x]∈计算任务集合{t_i}。

S140：从非劣解集中选择最优解，并根据最优解将多个计算任务分配到多个计算资源单元上执行。

具体地，可以通过目标选择的方法，在非劣解集中选出最符合当前目标的任务分配策略，并基于该任务分配策略将计算任务分发至对应异构硬件计算资源单元上执行，以在满足资源约束的基础上实现整体计算效率的优化。

例如，可以将每个非劣解的多个目标函数值加权求和，然后根据不同的需求从中选择最优解，例如，可以选择和最大或和最小对应的非劣解作为最优解，然后根据最优解对应的任务分配策略将多个计算任务分配到多个计算资源单元中。应当理解，上述描述仅为示例性描述，可以根据需要设置最优解选择方式，本发明对此不做具体限定。

例如，针对遗传算子中的交叉算子，可以实时根据新生成解的优劣选择继续交叉操作或结束交叉操作，即交叉长度是可变的。再例如，针对遗传算子中的变异算子，可以实时根据新生成解的优劣选择继续变异操作或结束变数操作，即，变异长度是可变的。

根据本发明实施例提供的技术方案，通过引入改进的变长序列遗传算子，可以平衡传统遗传算法在解空间中在不平滑不连续边界上的搜索能力和收敛能力，增强对局部最优边界的搜索效率。

在本发明的一个实施例中，如图3所示，该遗传算法可以包括：

S310：随机生成的N_p个可行解，作为初始化种群P；并生成一个外部存档集Q，并令Q为空。

具体地，可以先通过初始化函数生成N_p个可行解，以保障后续有足够多的初始样本供算法迭代搜索。

需要说明的是，为考虑解空间样本的丰富性和多样性，初始化函数应遵循随机性的基础要素，通过随机函数加约束条件的策略，保障每一个解包含的分配信息都满足多目标约束。

S320：为初始化种群分配适应度并执行环境选择过程。

在本发明实施例中，适应度分配策略同时考虑了个体的支配信息和被支配信息，具备较强的解空间定向寻优搜索能力。支配信息由个体的强度值获得，被支配信息由个体的准适应度获得r(i)，再结合密度d(i)最终生成适应度f(i)，如式(5)所示：

f(i)＝r(i)+d(i) (5)

式中各部分的组成如下所示：

S(i)＝|{j|j∈P+Q∧i＞j}| (6)

r(i)＝∑_{j∈P+Q,j＞i}S(i) (7)

其中，强度值S(i)表示被个体i支配的个体数量；准初始适应度r(i)表示支配i的个体数量；d(i)为密度函数，σ^k _i为个体i到第k个近邻个体的欧式距离，算法定义把到k点距离的倒数作为其密度估计，

环境选择过程是从群体P中生成新一代存档集Q的重要步骤。该过程首先复制所有适应度低于1的非支配个体，并放入外部存档集中，如式(9)所示：

Q_t+1＝{i|i∈P+Q∧F(i)<1} (9)

当所有适应度小于1的个体都放入外部存档集后，比较外部存档集中的个体数|Q_t+1|与规定的规模N_q。若|Q_t+1|<N_q，则执行添补操作，即按照适应度增序排列P_t和Q_t中剩余个体，选择前(N_q-|Q_t+1|)个适应值较小的个体添补进Q_t+1中。若|Q_t+1|>N_q，则执行修剪操作依次从Q_t+1中剔出个体i，修剪过程如下式(10)所示，其实质为依次删除归档集中与个体i距离最近的个体，直至|Q_t+1|＝N_q。

S330：判断是否满足终止条件。

例如，当目前迭代次数达到最大迭代次数时，则认为满足终止条件。应当理解，本发明对终止条件的设定不做具体限定，可以根据不同需要进行设定。

S340：当满足终止条件时，返回外部存档集Q中的解作为非劣解集。

S350：当不满足终止条件时，执行配对选择操作，并且基于序列长度可变的遗传算子执行进化操作，获得新种群。

进化操作可以包括交叉操作和变异操作等。通过执行配对选择操作和进化操作，获得新种群，可以使解的搜索范围扩大，有利于产生最优解。

本发明实施例基于序列长度可变的遗传算子执行进化操作，将改进的变长序列遗传算子融入SPEA2算法中。由于传统SPEA2算法是未经改进的强帕列托支配进化算法，其个体的支配信息和被支配信息由强度值体现，具备较强的解空间定向寻优搜索能力。但是，传统SPEA2算法强调全局搜索速度，而在不平滑不连续边界上的搜索能力和收敛能力较差，容易忽略局部最优解。整体计算效率较低，部分资源还可能由于资源约束等待超长时间导致整体任务失败等。本发明实施例提供的技术方案，通过将改进的变长序列遗传算子融入SPEA2算法中，可以在非支配解全局搜索能力的基础上，平衡算法在解空间中在不平滑不连续边界上的搜索能力和收敛能力，增强对局部最优边界的搜索效率。

例如，如图4所示，选取两个待交叉可行解[3,4,1,2,3,1,4,2]和[4,3,2,1,2,1,2,3]中的t₅为交叉起始点，向右逐项对两个解进行交叉操作并计算每个新解的帕累托支配情况，即每个解对应的多个目标函数值(例如，时间函数值、执行成本函数值、服务质量函数值)；当出现全劣解时，则交叉范围不再增长。例如，时间函数值、执行成本函数值、服务质量函数值均劣于交叉操作前的任意一个解的时间函数值、执行成本函数值、服务质量函数值时，则停止交叉操作。

需要说明的是，初始解生成策略通过添加资源类型约束使得生成的解空间都是有效解，因此，交叉操作不会生成无效解。

根据本发明实施例提供的技术方案，通过引入改进的变长交叉操作，可以平衡算法在解空中在不平滑不连续边界上的搜索能力和收敛能力，增强对局部最优边界的搜索效率。

具体地，本发明实施例中的变异算子采用多基因变异策略，基因变异的数量采用邻位基因逐次试探的方法，从变异点位置向左或向右随机逐项变异，并计算每次变异操作后的目标函数值，保留每个变异操作的解集合θ，直到生成的新解完全劣于θ中的任一解时，变异操作停止并保留所有θ。

例如，如图5所示，选取待变异可行解[2,3,1,4,2,3]中t₃为变异点位置，将t₃位置处的数值随机变异为2，即第一次变异操作生成新解[2,3,2,4,2,3]；计算新解[2,3,2,4,2,3]对应的多个目标函数值，即获得F(1)；向右继续进行变异操作，将t₄位置处的数值随机变异为3，即第二次变异操作生成新解[2,3,2,3,2,3]，计算新解[2,3,2,3,2,3]对应的多个目标函数值，即获得F(2)；F(2)非完全劣于F(1)，则继续进行第三次变异操作，当F(3)完全劣于F(2)时，则变异操作停止。

变异操作本身是为了防止解空间局部收敛，陷入局部最优的场景，其本身具备的随机性。原始遗传算法中变异操作是单点随机，对解搜索是单个基因片段的，本身具备较强收敛能力，当针对解空间边界不连续，不光滑时，割裂的最优边界严重制约该类算法的收敛能力。本发明实施例提供的技术方案中，通过引入改进的变长基因片段变异操作，可以平衡算法在解空中在不平滑不连续边界上的搜索能力和收敛能力，增强对局部最优边界的搜索效率。

在探索解空间过程中产生的无效解需舍弃，因此，可以对每次变异操作所生成的解执行资源约束判断，丢弃产生的无效解，保障每次种群中变异出新子代的基因是不含异常分配方案的，兼顾解空间搜索的合理性和开放性。因此，对于每次变异操作得到的解集合可以为式(11)所示。

上述所有可选技术方案，可以采用任意结合形成本发明的可选实施例，在此不再一一赘述。

下述为本发明装置实施例，可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节，请参照本发明方法实施例。

图6所示为本发明一实施例提供的任务分配装置的框图。如图6所示，该任务分配装置600包括：

定量化模块610，用于对多个计算任务和多个计算资源单元进行定量化表征，得到定量表征结果；

确定模块620，用于针对多个计算任务和多个计算资源单元，根据定量表征结果确定多个目标函数和对应的多个约束条件；

求解模块630，用于基于多个约束条件，利用多目标优化算法对多个目标函数进行求解，获得非劣解集，其中，非劣解集中的每个非劣解对应一种任务分配策略；

分配模块640，用于从非劣解集中选择最优解，并根据最优解将多个计算任务分配到多个计算资源单元上执行。

在本发明的一个实施例中，遗传算法包括：

b、为初始化种群分配适应度并执行环境选择过程；

c、判断是否满足终止条件；

在本发明的一个实施例中，上述任务分配装置还包括判断模块650，用于对每次变异操作生成的新解进行资源约束判断，并丢弃产生的无效解。

在本发明的一个实施例中，多个计算任务中的每个计算任务包括特征提取任务、网络卷积任务、矩阵计算任务中的至少两个，多个计算资源单元中的每个计算资源单元包括CPU、GPU、NPU和FPGA中的至少两个。

在本发明的一个实施例中，多个计算任务由资源约束类型、任务计算量和服务质量需求中的至少一个来表征，多个计算资源单元由硬件类型、计算效率、单位计算成本、服务质量中的至少一个来表征。

上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

图7所示为本发明一实施例提供的电子设备700的框图。

参照图7，电子设备700包括处理组件710，其进一步包括一个或多个处理器，以及由存储器720所代表的存储器资源，用于存储可由处理组件710的执行的指令，例如应用程序。存储器720中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件710被配置为执行指令，以执行上述任务分配方法。

电子设备700还可以包括一个电源组件被配置为执行电子设备700的电源管理，一个有线或无线网络接口被配置为将电子设备700连接到网络，和一个输入输出(I/O)接口。电子设备700可以操作基于存储在存储器720的操作系统，例如Windows Server^TM，Mac OSX^TM，Unix^TM，Linux^TM，FreeBSD^TM或类似。

一种非临时性计算机可读存储介质，当存储介质中的指令由上述电子设备700的处理器执行时，使得上述电子设备700能够执行一种任务分配方法，包括：对多个计算任务和多个计算资源单元进行定量化表征，得到定量表征结果；针对多个计算任务和多个计算资源单元，根据定量表征结果确定多个目标函数和对应的多个约束条件；基于多个约束条件，利用多目标优化算法对多个目标函数进行求解，获得非劣解集，其中，非劣解集中的每个非劣解对应一种任务分配策略；从非劣解集中选择最优解，并根据最优解将多个计算任务分配到多个计算资源单元上执行。。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序校验码的介质。

另外，还需要说明的是，本案中各技术特征的组合方式并不限本案权利要求中所记载的组合方式或是具体实施例所记载的组合方式，本案所记载的所有技术特征可以以任何方式进行自由组合或结合，除非相互之间产生矛盾。

需要注意的是，以上列举的仅为本发明的具体实施例，显然本发明不限于以上实施例，随之有着许多的类似变化。本领域的技术人员如果从本发明公开的内容直接导出或联想到的所有变形，均应属于本发明的保护范围。

应当理解，本发明实施例中提到的第一、第二等限定词，仅仅为了更清楚地描述本发明实施例的技术方案使用，并不能用以限制本发明的保护范围。

以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种任务分配方法，其特征在于，包括：

对多个计算任务和多个计算资源单元进行定量化表征，得到定量表征结果；

针对所述多个计算任务和所述多个计算资源单元，根据所述定量表征结果确定多个目标函数和对应的多个约束条件；

基于所述多个约束条件，利用多目标优化算法对所述多个目标函数进行求解，获得非劣解集，其中，所述非劣解集中的每个非劣解对应一种任务分配策略；

从所述非劣解集中选择最优解，并根据所述最优解将所述多个计算任务分配到所述多个计算资源单元上执行。

2.根据权利要求1所述的任务分配方法，其特征在于，所述多目标优化算法包括遗传算法，并且所述遗传算法在求解搜索过程中遗传算子针对的序列的长度是可变的。

3.根据权利要求2所述的任务分配方法，其特征在于，所述遗传算法包括：

b、为所述初始化种群分配适应度并执行环境选择过程；

c、判断是否满足终止条件；

d、当满足所述终止条件时，返回所述外部存档集Q中的解作为所述非劣解集；

e、当不满足所述终止条件时，执行配对选择操作，并且基于序列长度可变的遗传算子执行进化操作，获得新种群；

将所述新种群中的N_p个可行解作为所述初始化种群，迭代执行上述步骤b至步骤e。

4.根据权利要求3所述的任务分配方法，其特征在于，所述遗传算子包括交叉算子，所述基于序列长度可变的遗传算子执行进化操作，获得新种群，包括：

随机选取满足所述多个目标函数的任意两个待交叉可行解中的交叉起始点；

从所述交叉起始点向左或向右逐项对所述任意两个待交叉可行解进行交叉操作；

计算每次交叉操作生成的每个新可行解的多个目标函数值；

当所述交叉操作生成的其中一个新可行解的多个目标函数值完全劣于交叉操作前的任一解的多个目标函数值时，交叉操作停止。

5.根据权利要求3所述的任务分配方法，其特征在于，所述遗传算子包括变异算子，所述基于序列长度可变的遗传算子执行进化操作，获得新种群，包括：

随机选取满足所述多个目标函数的待变异可行解中的变异点位置；

从所述变异点位置向左或向右逐项对所述待变异可行解进行变异操作；

计算每次变异操作生成的新解的多个目标函数值；

当所述变异操作生成的新解的多个目标函数值非完全劣于变异操作前的任一解的多个目标函数值时，变异操作继续进行；

当所述变异操作生成的新解的多个目标函数值完全劣于变异操作前的任一解的多个目标函数值时，变异操作停止。

6.根据权利要求5所述的任务分配方法，其特征在于，还包括：

对每次变异操作生成的新解进行资源约束判断，并丢弃产生的无效解。

7.根据权利要求1至6中的任一项所述的任务分配方法，其特征在于，所述目标函数包括时间函数、执行成本函数和/或服务质量函数。

8.根据权利要求7所述的任务分配方法，其特征在于，所述时间函数满足：所述多个计算任务的总运行时间最短，其中，所述多个计算任务中的每个计算任务的运行时间用所述计算任务的任务计算量除以对应计算资源单元的计算效率来表征。

9.根据权利要求7所述的任务分配方法，其特征在于，所述执行成本函数满足：所述多个计算任务的总执行成本最低，其中，所述多个计算任务中的每个计算任务的执行成本用所述计算任务的运行时间乘以对应计算资源单元的单位计算成本来表征。

10.根据权利要求7所述的任务分配方法，其特征在于，所述服务质量函数满足：所述多个计算任务的总服务质量最高，其中，所述多个计算任务中的每个计算任务的服务质量用对应计算资源单元的服务质量来表征。

11.根据权利要求1至6中的任一项所述的任务分配方法，其特征在于，所述约束条件包括以下至少一个：

所述多个计算任务中的第一计算任务被分配到第一计算资源单元上；

所述第一计算资源单元的服务质量大于等于所述第一计算任务的服务质量需求；

所述第一计算资源单元的硬件类型满足所述第一计算任务的资源约束类型。

12.根据权利要求1至6中的任一项所述的任务分配方法，其特征在于，所述多个计算任务包括特征提取任务、网络卷积任务、矩阵计算任务中的至少两个，所述多个计算资源单元包括中央处理器CPU、图形处理器GPU、神经网络处理器NPU和现场可编程门阵列FPGA中的至少两个。

13.根据权利要求1至6中的任一项所述的任务分配方法，其特征在于，所述多个计算任务中的每个计算任务由资源约束类型、任务计算量和服务质量需求中的至少一个来表征，所述多个计算资源单元中的每个计算资源单元由硬件类型、计算效率、单位计算成本、服务质量中的至少一个来表征。

14.一种任务分配装置，其特征在于，包括：

定量化模块，用于对多个计算任务和多个计算资源单元进行定量化表征，得到定量表征结果；

确定模块，用于针对所述多个计算任务和所述多个计算资源单元，根据所述定量表征结果确定多个目标函数和对应的多个约束条件；

求解模块，用于基于所述多个约束条件，利用多目标优化算法对所述多个目标函数进行求解，获得非劣解集，其中，所述非劣解集中的每个非劣解对应一种任务分配策略；

分配模块，用于从所述非劣解集中选择最优解，并根据所述最优解将所述多个计算任务分配到所述多个计算资源单元上执行。

15.一种计算机可读存储介质，其上存储有计算机可执行指令，其特征在于，所述可执行指令被处理器执行时实现如权利要求1至13中任一项所述的任务分配方法。

16.一种电子设备，其特征在于，所述电子设备包括：

处理器；

用于存储所述处理器可执行指令的存储器；

所述处理器，用于执行上述权利要求1至13中任一项所述的任务分配方法。