CN107301500A

CN107301500A - 一种基于关键路径任务前瞻的工作流调度方法

Info

Publication number: CN107301500A
Application number: CN201710406234.XA
Authority: CN
Inventors: 张雅琴; 孙婷; 肖创柏
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2017-06-02
Filing date: 2017-06-02
Publication date: 2017-10-27
Anticipated expiration: 2037-06-02
Also published as: CN107301500B

Abstract

本发明涉及一种基于关键路径前瞻的工作流调度方法。包括：用户提交工作流；将工作流转换为有向无环任务模型图DAG；进行DAG任务节点的调度，输出工作流调度方案。本发明在任务确定优先级阶段考虑了入口任务到当前任务的最长路径，以及当前任务到出口任务的最长路径；在资源选择阶段考虑了关键路径任务和非关键路径任务对调度结果的影响。本方法与其他方法相比工作流调度的完成时间较小。

Description

一种基于关键路径任务前瞻的工作流调度方法

技术领域

本发明涉及云计算环境下的工作流调度技术领域，主要是涉及一种对于关键路径任务，分配资源时综合考虑任务本身和其子任务的工作流调度方法。

背景技术

近年来涌现出多种松散耦合类型的异构分布式计算新模式或新技术，如云计算。云计算的迅速崛起，使得越来越多的工作流应用开始基于云计算平台来提升计算速度。每个工作流包含一个任务集，如何将每个任务集中的任务更加高效快速的分配到合适的异构计算资源上就是工作流调度问题的研究重点。静态工作流调度问题一般在调度之前将每个任务集中的任务关系使用DAG(有向无环图)图表示出来，然后将DAG图中的任务按照一定的顺序一一映射到目标计算资源上，这种将工作流可视化的模型被称为 DAG任务调度模型。

调度问题在物流、航空航天、医疗、生物等各领域都有广泛的应用，在众多调度问题策略中，列表调度启发法最为实用。在列表调度启发式中，任务的排序依据每个任务被赋予优先级的大小，任务的选择依据它们的排序，每个被选择的任务将调度到能够满足预先定义的目标函数的处理器上。此外，列表调度算法又分为静态表调度和动态表调度。在静态表调度算法中，调度表在节点分配之前是静态构造的，表中的先后顺序在节点分配过程中不会修改；相反，动态表算法在每一次分配之后，会重新计算未调度节点的优先级，然后用新计算的优先级重新排列表中节点的先后顺序。比起其他类别的算法，这类算法的调度质量通常很高，而调度时间复杂度较低。

2002年H.Topcuoglu，S.Hariri和M.Y.Wu在IEEE上发表的文章中提出了HEFT 算法和CPOP算法。HEFT算法虽然在一般情况下给出的调度结果比较理想，但是该算法只考虑了待调度任务和其前驱的影响；CPOP算法主要思想是找到DAG图的关键路径，然后定义一个关键路径处理器，这个处理器需要满足关键路径上的所有任务在其上的计算时间总和最小，最后在调度中所有的关键路径任务都调度到这个关键路径处理器上，但CPOP算法的性能并不好。2010年L.F.Bittencount，R.Sakellariou和E.R.M. Madeira提出了Lookahead算法，该算法是一种针对HEFT算法的改进算法，它主要是在调度过程中考虑任务的资源分配决策对其子任务调度的影响，实验说明Lookahead算法的性能得到了提高，但同时也增加了时间复杂度。2014年H.Arabnejad和J.G. Barbosa针对Lookahead算法执行时间过长方面进行改进，提出PEFT算法，该算法主要思想是在调度前构建一个乐观时间花费表，预测任务在各个资源上调度时其子任务的调度结果，从而优化资源分配决策，虽然PEFT算法的时间复杂度降低了，但是调度效果不好。

发明内容

针对现有技术中存在的上述问题，本发明提出一种基于关键路径任务前瞻的方法，该方法主要是针对关键路径任务，分配资源时综合考虑任务本身和任务的子任务的工作流调度方法。对于给定的一个DAG任务调度模型，本发明提出的方法整体思路是，先确定任务的优先级构建动态任务队列，从动态任务队列中取出优先级最高的任务，然后判断该任务是否是关键路径任务，是的话在每个处理器上运行这个任务，选择这个任务的子任务中最早完成时间最小的处理器进行调度；如果不是关键路径任务，选择任务本身最早完成时间最小的处理器进行调度，最后更新任务队列，并重复这个过程直至任务队列中没有待调度的任务。

一种基于关键路径任务前瞻的工作流调度方法包括以下步骤：

步骤1，构建有向无环图DAG任务调度模型

当工作流进入调度系统时，先将工作流转换为能够被识别和处理的DAG任务调度模型，具体方法如下。

步骤1.1，DAG模型图表示为：G＝(N,E)。

(1)G＝(N,E)中N＝{n₁，n₂...n_v}是任务集，每一个n_i∈N表示任务集中一个具体的任务，i指的是任务n_i在DAG模型图中的编号，其中没有父节点的任务称为DAG入口任务，没有子节点的任务称为DAG出口任务。E是任务之间有向边的集合，有向边 e(i，j)∈E表示任务n_i与任务n_j之间的执行先后顺序和数据传递的依赖关系。任务n_i是有向边的起始节点，任务n_j是有向边的终止节点，i和j分别是任务n_i和任务n_j在DAG 模型图中的编号，且i<j。当任务n_i执行完成，并将任务n_j所需的数据传送到达后，任务n_j才可能进入准备开始执行的状态，即就绪状态。

(2)每条有向边都有一个权重值，用于表示与边相连的两个任务之间传递数据所需的平均时间。通信时间花费与处理器启动通信的时间、处理器之间数据传送的速度和任务间通信数据的大小有关。将处理器启动通信的时间花费存储在一个q维度的矢量L 中，其中q为处理器个数。处理器之间传送数据的速度使用一个q×q大小的矩阵B 来存储。任务之间通信数据的大小使用一个v×v大小的矩阵data来存储，其中v为任务总数，那么data_i,j表示任务n_i和任务n_j之间所需要通信的数据总和。这样通信时间花费使用一个v×v大小的矩阵A来存储，其中A_i,j定义为从任务n_i(假设在处理器p_m上调度)传递通信数据到任务n_j(假设在处理器p_n上调度)需要的总时间，公式表示为：

其中，m和n分别表示处理器p_m和处理器p_n在处理器集合P＝{p₁，p₂…p_q}中的编号，L_m表示处理器p_m启动通信的时间，B_m，n表示处理器p_m和处理器p_n之间传送数据的速度，当n_i和n_j在同一处理器上调度时，即m＝n时，处理机内部的通信时间花费忽略不计，A_i,j等于0。被定义为任务n_i与任务n_j之间传递数据的平均通信时间，公式表示为：

其中，表示所有处理器启动通信所需时间的平均值，表示在定义域内处理器间传输数据的平均速度。和都是计算环境中的已知参数。

(3)构建计算时间花费二维表，对DAG图中每个任务节点在处理器集中每个处理器上的执行时间进行预估，形成一个v×q大小的矩阵D，其中v表示任务节点数，q 表示用于执行计算的异构分布式计算资源数，表示任务n_i在各个计算资源上计算时间的平均值。

步骤2，从出口任务开始，向上遍历DAG图，递归计算出所有任务的向上排序值。

出口任务n_exit的向上排序值rank_u(n_exit)定义为任务n_exit的平均计算时间，也就是出口任务n_exit在各个处理器上的计算时间的平均值：对于DAG图中的其他任务，向上排序值定义为从这个任务到出口任务的多条路径中，平均计算时间和平均通信时间总和的最大值，其中也包括这个任务本身的计算时间的平均值。任务 n_i的向上排序值rank_u(n_i)用公式表示为：

其中，指的是任务n_i在各个处理器上的平均计算时间，succ(n_i)指的是任务n_i的直接后继任务的集合，指的是任务n_i与后继任务n_j之间的平均通信时间，rank_u(n_j) 是后继任务n_j的向上排序值，max括号内求的是后继任务中向上排序值和平均通信时间总和的最大值。

步骤3，从入口任务开始，向下遍历DAG图，递归计算出所有任务的向下排序值。

入口任务n_entry的向下排序值定义为零，即rank_d(n_entry)＝0。对于DAG图中的其他任务，向下排序值定义为从入口任务到这个任务的多条路径中，平均计算时间和平均通信时间总和的最大值，其中不包括这个任务本身的平均计算时间。任务n_i的向下排序值rank_d(n_i)用公式表示为：

其中，pred(n_i)指的是任务n_i的直接前驱任务的集合，rank_d(n_j)是前驱任务n_j的向下排序值，指的是任务n_j与任务n_i之间的平均通信时间，指的是前驱任务 n_j在各个处理器上的平均计算时间，max括号内求的是前驱任务中向下排序值、平均通信时间和平均计算时间总和的最大值。

步骤4，赋予任务优先级并初始化任务队列。

DAG任务调度图中的每个任务节点的优先级大小等于该任务的向上排序值和向下排序值之和，即rank_u+rank_d。从公式中看，某个任务的优先级大小是从入口任务到该任务再到出口任务的多条路径中平均计算时间和通信时间总和的最大值。本方法使用动态任务队列，每次只存放当前时刻的就绪任务，就绪任务指的是可以准备开始执行的任务，也就是前驱任务都已经调度完成的任务，由于入口任务没有前驱，所以使用入口任务初始化任务队列。

步骤5，求取关键路径长度和关键路径任务集。

入口任务的优先级大小等于从DAG入口任务到DAG出口任务的多条路径中的最大完成时间，对应的这条路径就是DAG任务调度图的关键路径，最大完成时间就是关键路径的长度，在关键路径上的任务称为关键路径任务。关键路径任务的优先级大小相等且优先级最高。

步骤6，为每个任务选择处理器资源。

首先从任务队列里选出优先级最高的任务作为待调度的任务。

(1)如果是非关键路径任务；

步骤6.1，计算任务的最早完成时间。

任务的完成时间与处理器开始执行任务的时间、任务的就绪时间和任务在各个处理器上计算时间有关。

处理器准备执行任务的时间，也就是处理器最早开始工作的时间，即每个处理器上到目前为止执行的最后一个任务的完成时间，使用一个q维度的数组avail来存储，q 为处理器个数。在调度最开始avail数组初始化为零，然后一旦有任务n_i被调度到处理器p_j上执行完成以后，而插入策略又没有找到插入位置或者插入后任务n_i的完成时间没有变短，avail(p_j)就变为n_i的完成时间，否则数值不变。

任务的就绪时间，也就是任务需要的所有数据传送到达处理器的时间，使用一个q维度的数组readyT来存储，q为处理器个数。在每次调度时readyT数组都初始化为零，然后任务n_i在选择处理器p_j时，readyT(p_j)等于任务n_i所需要的全部数据到达处理器p_j的最长时间，也就是n_i的直接前驱任务的实际完成时间加上前驱任务到n_i的通信费用的最大值。公示表示为：

其中，pred(n_i)表示任务n_i的直接前驱任务的集合，AFT(n_m)表示直接前驱任务 n_m的实际完成时间，表示直接前驱任务n_m与任务n_i的平均通信时间。入口任务由于没有前驱任务，所以在各个处理器上的就绪时间均等于0。

任务最早开始执行的时间EST(Earliest execution Start Time)，用一个q维度的数组来存储，q为处理器个数。任务n_i在处理器p_j上的最早开始执行时间EST(p_j)定义为处理器p_j的最早开始工作时间avail(p_j)和任务n_i在处理器p_j上的就绪时间readyT(p_j)中的最大值，公式表示为：

EST(p_j)＝max{avail(p_j)，readyT(p_j)} (6)

其中，对于单一入口任务的DAG图来说，入口任务在每个处理器上的最早开始执行时间等于0；在多入口任务图中，入口任务在处理器p_j上的最早开始执行时为： EST(p_j)＝avail(p_j)，avail(p_j)为处理器p_j的最早开始工作时间。

任务最早执行完成时间EFT(Earliest execution Finish Time)，在任务最早开始执行的时间EST的基础上考虑任务的计算时间，前提是任务的所有直接前驱任务都已经被调度并执行完成。任务n_i的最早执行完成时间EFT(n_i)定义为任务n_i在各个处理器上的最早开始执行时间与任务n_i在对应处理器上的计算时间的和的最小值，公式表示为：

其中，P＝{p₁，p₂…p_q}为处理器集合，EST(p_j)为任务n_i在处理器p_j上的最早开始执行时间，D_i,_j为任务n_i在处理器p_j上的计算时间。

步骤6.2，做出资源分配决策。

将任务分配到能够使任务最早执行完成的处理器上。

(2)如果是关键路径任务；

步骤6.3，计算任务在各个处理器上的完成时间。

任务n_i在处理器p_j上的执行完成时间FT(n_i,p_j)定义为任务n_i在处理器p_j上的最早开始执行时间与任务n_i在处理器p_j上的计算时间的和，公式表示为：

FT(n_i，p_j)＝EST(p_j)+D_i，j (8)

其中，EST(p_j)表示任务n_i在处理器p_j上的最早开始时间，D_i,j表示任务n_i在处理器p_j上的计算时间，并采用基于插入的策略查找任务n_i在各个处理器上的可插入的空闲位置。

步骤6.4，计算子任务的最早完成时间。

先假设任务n_i在处理器集合中的某个处理器p_j上执行，那么任务n_i实际完成时间就是FT(n_i,p_j)，如果找到可插入的空闲位置，则改变处理器p_j上的最早开始执行时间avail(p_j)，否则不变，然后任务n_i的子任务按照优先级大小非递增的顺序，按照公式(7) 依次求得所有子任务的最早完成时间。再假设任务n_i在另一个处理器上执行，重复上述过程，直至遍历整个处理器集合。

步骤6.5，做出最优资源分配决策。

假设任务在某个处理器上执行，计算出这个任务的所有子任务的最早完成时间，并记录任务在这个处理器上执行时所有子任务的最早完成时间的最大值，然后遍历整个处理器集合，比较在各个处理器上得到的子任务的最早完成时间的最大值，最大值中数值最小的说明任务在这个最小值对应的处理器上执行时，任务的子任务的整体完成时间最短，那么就将任务分配到这个处理器上执行。

(3)计算调度长度。

任务n_i按照选择规则被调度到处理器p_j上执行后，任务n_i在处理器p_j上的最早开始时间和最早完成时间分别等于任务n_i的实际开始时间AST(n_i)和实际完成时间 AFT(n_i)。当DAG任务图中所有任务都调度完成后，出口任务n_exit的实际完成时间 AFT(n_exit)等于调度长度，也称为完成时间。对于多个出口任务的DAG图，调度长度 makespan定义为出口任务中实际完成时间的最大值：

makespan＝max{AFT(n_exit)} (9)

步骤7，更新任务队列。

删除刚刚调度完成的任务，然后查找该任务的子任务是否成为就绪状态，即子任务的前驱任务是否都已经调度执行完成，最后将新的就绪任务存入任务队列。返回执行步骤6，直到任务队列中没有待调度的任务。

与现有技术相比，本发明具有以下优势：

(1)本发明充分考虑了DAG任务调度图结构中影响调度长度的因素，包括任务的前驱和后继和任务本身，与其他方法相比调度效果更好。

(2)本发明与其他方法相比算法的复杂度比较低。

附图说明

图1为DAG任务调度模型

图2为任务在处理器上计算时间

图3为本方法的调度结果

具体实施方式

下面将结合附图和实例对发明做进一步说明。

步骤1，将工作流转换为DAG任务调度模型，DAG图结构如图1所示，每条有向边的权值等于任务间的平均通信时间，比如图1中任务5与任务9之间的平均通信时间是13个时间单位。DAG图中每个任务节点在各个处理器上的计算时间参见图2，表中每行表示DAG图中的任务编号，每列指处理器的编号，例如表1中编号为4的任务在编号为3的处理器上的计算时间为17个时间单位。

步骤2，按照公式(3)计算DAG图中每个任务节点的向上排序值，结果见表1第 2列。

步骤3，按照公式(4)计算DAG图中每个任务节点的向下排序值，结果见表1第 3列。

步骤4，DAG图中每个任务节点的优先级等于向上排序值和向下排序值的和，结果见表1第3列。

表1

步骤5，关键路径的长度等于入口任务n₁的优先级，大小为108，n₁的后继任务有n₂,n₃,n₄,n₅,n₆，其中优先级大小等于108的任务有n₂，n₂的后继任务有n₈,n₉，其中优先级大小等于108的任务有n₉，n₉的后继任务是DAG出口任务n₁₀，其优先级大小等于 108，所以关键路径任务的集合为{n₁,n₂,n₉,n₁₀}，关键路径任务中必定包含一个入口任务和一个出口任务。

步骤6，从任务队列中选择优先级最高的任务作为待调度的任务，任务的调度顺序查看表2第3列。

(1)对于关键路径任务n₁、n₂、n₉、n₁₀，先假定在某个处理器上执行，然后继续调度它的子任务，按照公式(7)得到所有子任务的最早完成时间，记录下其中的最大值，相似地，一共有几个处理器资源，就会得到几个最大值，其中值最小对应的处理器将分配给该关键路径任务执行。例如，待调度任务n₁为关键路径任务，采用基于插入的策略得到n₁在处理器上p₁、p₂、p₃上的完成时间分别为14、16、9个时间单位，n₁的子任务有n₂,n₃,n₄,n₅,n₆，假定n₁在p₁上执行，子任务中最早完成时间中的最大值为 44，假定n₁在p₂上执行，子任务中最早完成时间中的最大值为47，假定n₁在p₃上执行，子任务中最早完成时间中的最大值为42，因为42<44<47，所以任务n₁将调度到处理器p₃上执行。

(2)对于非关键路径任务，按照公式(8)直接计算任务在各个处理器上的完成时间，然后将任务调度到完成时间最早的处理器上。例如，采用基于插入的策略后任务 n3在处理器上p₁、p₂、p₃上的完成时间分别为32、34、36个时间单位，而32<34<36，所以任务n₃将调度到处理器p₁上执行。

(3)该步骤在计算完成时间的过程中均采用了基于插入的策略，在这个实例中，只有任务n₆找到了合适的插入位置，任务n₆在处理器p₂上的完成时间原本是78个时间单位，但是插入到任务n₄和任务n₉之间后，完成时间只有42个时间单位，42比78 小很多，所以任务n₆将调度到处理器p₂上任务n₄和任务n₉之间的空闲时间段运行。

步骤7，以入口任务初始化任务队列，每次删除调度完成的任务，查找新的就绪任务加入队列，每一时刻的任务队列参见表2第2列。所有任务最终的调度顺序和结果参见图3。

表2

Claims

1.一种基于关键路径任务前瞻的工作流调度方法，其特征在于：针对关键路径任务，分配资源时综合考虑任务本身和任务的子任务的工作流调度方法；对于给定的一个DAG任务调度模型，先确定任务的优先级构建动态任务队列，从动态任务队列中取出优先级最高的任务，然后判断该任务是否是关键路径任务，是的话在每个处理器上运行这个任务，选择这个任务的子任务中最早完成时间最小的处理器进行调度；如果不是关键路径任务，选择任务本身最早完成时间最小的处理器进行调度，最后更新任务队列，并重复这个过程直至任务队列中没有待调度的任务。

2.根据权利要求1所述的一种基于关键路径任务前瞻的工作流调度方法，其特征在于，包括以下步骤：

步骤1，构建有向无环图DAG任务调度模型

当工作流进入调度系统时，先将工作流转换为能够被识别和处理的DAG任务调度模型，具体方法如下；

步骤1.1，DAG模型图表示为：G＝(N，E)；

(1)G＝(N，E)中N＝{n₁，n₂...n_v}是任务集，每一个n_i∈N表示任务集中一个具体的任务，i指的是任务n_i在DAG模型图中的编号，其中没有父节点的任务称为DAG入口任务，没有子节点的任务称为DAG出口任务；E是任务之间有向边的集合，有向边e(i，j)∈E表示任务n_i与任务n_j之间的执行先后顺序和数据传递的依赖关系；任务n_i是有向边的起始节点，任务n_j是有向边的终止节点，i和j分别是任务n_i和任务n_j在DAG模型图中的编号，且i<j；当任务n_i执行完成，并将任务n_j所需的数据传送到达后，任务n_j才可能进入准备开始执行的状态，即就绪状态；

(2)每条有向边都有一个权重值，用于表示与边相连的两个任务之间传递数据所需的平均时间；通信时间花费与处理器启动通信的时间、处理器之间数据传送的速度和任务间通信数据的大小有关；将处理器启动通信的时间花费存储在一个q维度的矢量L中，其中q为处理器个数；处理器之间传送数据的速度使用一个q×q大小的矩阵B来存储；任务之间通信数据的大小使用一个v×v大小的矩阵data来存储，其中v为任务总数，那么data_i,j表示任务n_i和任务n_j之间所需要通信的数据总和；这样通信时间花费使用一个v×v大小的矩阵A来存储，其中A_i,j定义为从任务n_i传递通信数据到任务n_j需要的总时间，任务n_i假设在处理器p_m上调度，任务n_j假设在处理器p_n上调度公式表示为：

其中，m和n分别表示处理器p_m和处理器p_n在处理器集合P＝{p₁，p₂…p_q}中的编号，L_m表示处理器p_m启动通信的时间，B_m，n表示处理器p_m和处理器p_n之间传送数据的速度，当n_i和n_j在同一处理器上调度时，即m＝n时，处理机内部的通信时间花费忽略不计，A_i,j等于0；被定义为任务n_i与任务n_j之间传递数据的平均通信时间，公式表示为：

其中，表示所有处理器启动通信所需时间的平均值，表示在定义域内处理器间传输数据的平均速度；和都是计算环境中的已知参数；

(3)构建计算时间花费二维表，对DAG图中每个任务节点在处理器集中每个处理器上的执行时间进行预估，形成一个v×q大小的矩阵D，其中v表示任务节点数，q表示用于执行计算的异构分布式计算资源数，表示任务n_i在各个计算资源上计算时间的平均值；

步骤2，从出口任务开始，向上遍历DAG图，递归计算出所有任务的向上排序值；

出口任务n_exit的向上排序值rank_u(n_exit)定义为任务n_exit的平均计算时间，也就是出口任务n_exit在各个处理器上的计算时间的平均值：对于DAG图中的其他任务，向上排序值定义为从这个任务到出口任务的多条路径中，平均计算时间和平均通信时间总和的最大值，其中也包括这个任务本身的计算时间的平均值；任务n_i的向上排序值rank_u(n_i)用公式表示为：

其中，指的是任务n_i在各个处理器上的平均计算时间，succ(n_i)指的是任务n_i的直接后继任务的集合，指的是任务n_i与后继任务n_j之间的平均通信时间，rank_u(n_j)是后继任务n_j的向上排序值，max括号内求的是后继任务中向上排序值和平均通信时间总和的最大值；

步骤3，从入口任务开始，向下遍历DAG图，递归计算出所有任务的向下排序值；

入口任务n_entry的向下排序值定义为零，即rank_d(n_entry)＝0；对于DAG图中的其他任务，向下排序值定义为从入口任务到这个任务的多条路径中，平均计算时间和平均通信时间总和的最大值，其中不包括这个任务本身的平均计算时间；任务n_i的向下排序值rank_d(n_i)用公式表示为：

其中，pred(n_i)指的是任务n_i的直接前驱任务的集合，rank_d(n_j)是前驱任务n_j的向下排序值，指的是任务n_j与任务n_i之间的平均通信时间，指的是前驱任务n_j在各个处理器上的平均计算时间，max括号内求的是前驱任务中向下排序值、平均通信时间和平均计算时间总和的最大值；

步骤4，赋予任务优先级并初始化任务队列；

DAG任务调度图中的每个任务节点的优先级大小等于该任务的向上排序值和向下排序值之和，即rank_u+rank_d；从公式中看，某个任务的优先级大小是从入口任务到该任务再到出口任务的多条路径中平均计算时间和通信时间总和的最大值；本方法使用动态任务队列，每次只存放当前时刻的就绪任务，就绪任务指的是可以准备开始执行的任务，也就是前驱任务都已经调度完成的任务，由于入口任务没有前驱，所以使用入口任务初始化任务队列；

步骤5，求取关键路径长度和关键路径任务集；

入口任务的优先级大小等于从DAG入口任务到DAG出口任务的多条路径中的最大完成时间，对应的这条路径就是DAG任务调度图的关键路径，最大完成时间就是关键路径的长度，在关键路径上的任务称为关键路径任务；关键路径任务的优先级大小相等且优先级最高；

步骤6，为每个任务选择处理器资源；

首先从任务队列里选出优先级最高的任务作为待调度的任务；

(1)如果是非关键路径任务；

步骤6.1，计算任务的最早完成时间；

任务的完成时间与处理器开始执行任务的时间、任务的就绪时间和任务在各个处理器上计算时间有关；

处理器准备执行任务的时间，也就是处理器最早开始工作的时间，即每个处理器上到目前为止执行的最后一个任务的完成时间，使用一个q维度的数组avail来存储，q为处理器个数；在调度最开始avail数组初始化为零，然后一旦有任务n_i被调度到处理器p_j上执行完成以后，而插入策略又没有找到插入位置或者插入后任务n_i的完成时间没有变短，avail(p_j)就变为n_i的完成时间，否则数值不变；

任务的就绪时间，也就是任务需要的所有数据传送到达处理器的时间，使用一个q维度的数组readyT来存储，q为处理器个数；在每次调度时readyT数组都初始化为零，然后任务n_i在选择处理器p_j时，readyT(p_j)等于任务n_i所需要的全部数据到达处理器p_j的最长时间，也就是n_i的直接前驱任务的实际完成时间加上前驱任务到n_i的通信费用的最大值；公示表示为：

其中，pred(n_i)表示任务n_i的直接前驱任务的集合，AFT(n_m)表示直接前驱任务n_m的实际完成时间，表示直接前驱任务n_m与任务n_i的平均通信时间；入口任务由于没有前驱任务，所以在各个处理器上的就绪时间均等于0；

任务最早开始执行的时间EST(Earliestexecution Start Time)，用一个q维度的数组来存储，q为处理器个数；任务n_i在处理器p_j上的最早开始执行时间EST(p_j)定义为处理器p_j的最早开始工作时间avail(p_j)和任务n_i在处理器p_j上的就绪时间readyT(p_j)中的最大值，公式表示为：

EST(P_j)＝max{avail(P_j)，readyT(p_j)} (6)

其中，对于单一入口任务的DAG图来说，入口任务在每个处理器上的最早开始执行时间等于0；在多入口任务图中，入口任务在处理器p_j上的最早开始执行时为：EST(p_j)＝avail(p_j)，avail(p_j)为处理器p_j的最早开始工作时间；

任务最早执行完成时间EFT(Earliest execution Finish Time)，在任务最早开始执行的时间EST的基础上考虑任务的计算时间，前提是任务的所有直接前驱任务都已经被调度并执行完成；任务n_i的最早执行完成时间EFT(n_i)定义为任务n_i在各个处理器上的最早开始执行时间与任务n_i在对应处理器上的计算时间的和的最小值，公式表示为：

其中，P＝{p₁，p₂…p_q}为处理器集合，EST(p_j)为任务n_i在处理器p_j上的最早开始执行时间，D_i,j为任务n_i在处理器p_j上的计算时间；

步骤6.2，做出资源分配决策；

将任务分配到能够使任务最早执行完成的处理器上；

(2)如果是关键路径任务；

步骤6.3，计算任务在各个处理器上的完成时间；

FT(n_i，P_j)＝EST(p_j)+D_ij (8)

其中，EST(p_j)表示任务n_i在处理器p_j上的最早开始时间，D_i,j表示任务n_i在处理器p_j上的计算时间，并采用基于插入的策略查找任务n_i在各个处理器上的可插入的空闲位置；

步骤6.4，计算子任务的最早完成时间；

先假设任务n_i在处理器集合中的某个处理器p_j上执行，那么任务n_i实际完成时间就是FT(n_i,p_j)，如果找到可插入的空闲位置，则改变处理器p_j上的最早开始执行时间avail(p_j)，否则不变，然后任务n_i的子任务按照优先级大小非递增的顺序，按照公式(7)依次求得所有子任务的最早完成时间；再假设任务n_i在另一个处理器上执行，重复上述过程，直至遍历整个处理器集合；

步骤6.5，做出最优资源分配决策；

假设任务在某个处理器上执行，计算出这个任务的所有子任务的最早完成时间，并记录任务在这个处理器上执行时所有子任务的最早完成时间的最大值，然后遍历整个处理器集合，比较在各个处理器上得到的子任务的最早完成时间的最大值，最大值中数值最小的说明任务在这个最小值对应的处理器上执行时，任务的子任务的整体完成时间最短，那么就将任务分配到这个处理器上执行；

(3)计算调度长度；

任务n_i按照选择规则被调度到处理器p_j上执行后，任务n_i在处理器p_j上的最早开始时间和最早完成时间分别等于任务n_i的实际开始时间AST(n_i)和实际完成时间AFT(n_i)；当DAG任务图中所有任务都调度完成后，出口任务n_exit的实际完成时间AFT(n_exit)等于调度长度，也称为完成时间；对于多个出口任务的DAG图，调度长度makespan定义为出口任务中实际完成时间的最大值：

makespan＝max{AFT(n_exit)} (9)

步骤7，更新任务队列；

删除刚刚调度完成的任务，然后查找该任务的子任务是否成为就绪状态，即子任务的前驱任务是否都已经调度执行完成，最后将新的就绪任务存入任务队列；返回执行步骤6，直到任务队列中没有待调度的任务。