CN107943561A

CN107943561A - 一种面向云计算平台的科学工作流任务调度方法

Info

Publication number: CN107943561A
Application number: CN201711342748.XA
Authority: CN
Inventors: 耿晓中; 潘欣; 毛应爽; 孙悦; 鲍杰; 于萍
Original assignee: Changchun Institute Technology
Current assignee: Changchun Institute of Applied Chemistry of CAS; Changchun Institute Technology
Priority date: 2017-12-14
Filing date: 2017-12-14
Publication date: 2018-04-20
Anticipated expiration: 2037-12-14
Also published as: CN107943561B

Abstract

本发明提供一种面向云计算平台的科学工作流任务调度方法，包括以下步骤：任务及任务间的约束关系模型化为DAG图；转换DAG图为in‑tree结构任务图；构造调度集合；调整结点任务E_n的调度集合P_n；调度集合P_n中的调度组合数量即为所需要的虚拟机数量，将调度集合P_n中的各个调度组合分配给对应的一个虚拟机执行。优点为：本发明通过任务复制技术减小了工作流任务间的通信开销，最小化了任务调度长度，有效地提高了任务调度的效率；通过任务分组技术，有效减少了虚拟机的使用个数；通过合理利用虚拟机的空闲时间，提高了虚拟资源的利用率。

Description

一种面向云计算平台的科学工作流任务调度方法

技术领域

本发明属于云计算系统中面向科学工作流的任务调度技术领域，具体涉及一种面向云计算平台的科学工作流任务调度方法。

背景技术

云计算作为近几年的一个热点问题，吸引了越来越多的学术界及工业界的研究人员。云计算技术是由分布式计算、并行计算和网格计算等发展而来的，利用虚拟化技术把计算资源、存储资源和带宽资源虚拟化为动态可伸缩的虚拟化资源池，以互联网为载体，以服务的方式按需提供给不同的用户使用。

科学工作流是指将一系列在科学研究中遇到的数据管理、计算、分析、展现等工作变成一个个独立的服务，再把这些服务通过数据链接组合在一起，满足研究人员科学实验和数据处理中的需要，从而实现相应的处理与科学计算。由于科学处理的复杂性，科学工作流逐渐变成计算密集型和数据密集型。

科学工作流的计算量和数据量往往非常庞大，常规的计算环境很难满足需要，云计算凭借强大的计算能力和海量的存储能力，成为执行科学工作流的首选计算环境。云计算作为一个商业平台，在既保障云服务提供商利益又要提高用户满意度的前提下，必须有效利用庞大的计算资源去执行科学工作流，因此，迫切需要一个合理有效的任务调度策略，使计算资源被充分利用，科学工作流被高效执行。

因为任务调度本身是NP完全问题，所以只能尝试得到近优解。当前，启发式调度算法被广泛使用，按照算法的思想不同，分为：基于任务复制的调度算法；基于任务分簇的调度算法；表调度算法；基于随机搜索的调度算法。因为任务复制技术能消除任务间的通信开销并保持有效并行性，所以通常情况下，基于任务复制的方法优于其他方法。任务复制典型算法主要包括TDS算法、OSA算法、CPTD算法、TDCS算法和CPFD算法。下面分析上述五种任务复制典型算法的优缺点。

(1)TDS算法是把DAG图中的join结点和它的友好前驱结点调度到同一个虚拟机上，以减少总任务的执行时间。但是该算法没有考虑虚拟机的使用数目。(2)OSA算法尽可能把父任务结点和子任务结点分配到同一个虚拟机上，使当前任务获得最早开始时间，但是该算法只限于局部，并没有从全局出发考虑其他祖先结点，这对于最小化全部任务的makespan是有限的。(3)CPTD算法首先把DAG任务图转化为相应的产品处理树，然后找出关键路径，通过最小化关键路径上的任务结点的完成时间来缩短全体任务结点的执行时间，但是该算法复杂度很高。(4)TDCS算法旨在最小化任务的完成时间，该算法的时间复杂度较低，限制条件较少，可行性很强。但是该算法没有考虑虚拟机的使用数目，也没有考虑虚拟机类型和执行花费。(5)CPFD算法使用探索策略把当前任务分到其父任务所在的虚拟机或者空闲虚拟机上，然后计算相应的最早开始时间，最后把该任务分配到使其具有最早开始时间的虚拟机上。该算法通过递归查找当前任务的最重要双亲(VIP)任务，然后复制该任务到使当前任务具有最早开始时间的虚拟机上，从而缩短任务的执行时间。但是CPFD算法没考虑虚拟机数目的优化，占用了较多的虚拟机资源。

因此，现有的各类任务调度方法，无法满足人们对最小化科学工作流的完成时间和最小化计算资源的使用数量方面的需求。

发明内容

针对现有技术存在的缺陷，本发明提供一种面向云计算平台的科学工作流任务调度方法，可有效解决上述问题。

本发明采用的技术方案如下：

本发明提供一种面向云计算平台的科学工作流任务调度方法，包括以下步骤：

步骤1：科学工作流由多个任务相互协作完成，任务及任务间的约束关系模型化为DAG图；其中，所述DAG图中的每个结点代表一个任务；对于结点任务T_i，其在虚拟机上的任务运行时间为R(T_i)；任务间的通信代价为W；当两个任务被分到同一个调度组合时，任务间的通信开销为0；

步骤2：转换DAG图为in-tree结构任务图，具体步骤为：

步骤2.1，对DAG图进行广度优先遍历，遇到出度为d的fork结点时，d≧2，进行如下操作：

(1)如果该fork结点的入度为0，则复制该fork结点d-1次，使该fork结点的每一个后继结点将该fork结点作为独立直接前驱结点；

(2)如果该fork结点的入度不为0，则将该fork结点连同其前驱路径一同复制d-1次，同样使该fork结点的每一个后继结点将该fork结点作为独立直接前驱结点；

步骤2.2，通过以上的结点复制操作，每个fork结点被其后继结点作为一个独立的直接前驱结点，由此得到in-tree结构任务图；

步骤3：构造调度集合，具体步骤为：

步骤3.1，按照层次递增的顺序，同一层次结点按照结点序号递增排序，依次遍历in-tree结构任务图中的所有结点任务，采取如下选择调度策略得到每个结点任务对应的调度集合以及该结点任务对应的调度集合的执行时间；其中，结点任务对应的调度集合由至少一个结点任务对应的调度组合形成；

(1)对于结点任务T_i，如果结点任务T_i的入度为0，即没有直接前驱结点，则结点任务T_i对应的调度集合P_i由一个结点任务T_i对应的调度组合E_i形成；该调度组合E_i中只有结点任务T_i一个成员；即：调度集合P_i＝{{调度组合E_i}}＝{{结点任务T_i}}；

该结点任务T_i对应的调度集合P_i的执行时间R(P_i)＝结点任务T_i对应的调度组合E_i的执行时间R(E_i)；其中，R(E_i)＝结点任务T_i的任务运行时间R(T_i)；

(2)如果结点任务T_i只有一个直接前驱结点，将直接前驱结点记为T_j，直接前驱结点T_j对应的调度集合为调度集合P_j，调度集合P_j的执行时间为R(P_j)；

则：直接合并结点任务T_i与其直接前驱结点对应的调度集合P_j，得到结点任务T_i对应的调度集合P_i，即：调度集合P_i＝{结点任务T_i∪{调度集合P_j}}；

结点任务T_i对应的调度集合P_i的执行时间R(P_i)＝调度集合P_j的执行时间R(P_j)+结点任务T_i的任务运行时间R(T_i)；

(3)如果结点任务T_i为join结点，其包含k个直接前驱结点，通过如下步骤产生结点任务T_i对应的调度集合P_i：

步骤1)：计算结点任务T_i的每个直接前驱结点所对应的调度集合的执行时间与结点任务T_i和该直接前驱结点之间通信代价之和，将和值记为Y；

按Y值由大到小顺序，将结点任务T_i的各个直接前驱结点排序；排序第1位的直接前驱结点为第1位直接前驱结点，记为T_i ^s(1)；排序第2位的直接前驱结点为第2位直接前驱结点，记为T_i ^s(2)；以此类推；假设共有x个直接前驱结点；排序第x位的直接前驱结点为第x位直接前驱结点，记为T_i ^s(x)；

合并结点任务T_i与第1位直接前驱结点T_i ^s(1)所对应的调度集合，形成结点任务T_i所对应的第1个调度组合E_i(1)，即：第1个调度组合E_i(1)＝{结点任务T_i∪{T_i ^s(1)所对应的调度集合}}；

如果同时有两个以上的直接前驱结点具有同样的Y值，则选择具有较大通信代价的直接前驱结点形成第1个调度组合E_i(1)；通过该步骤，将关键路径上的任务调度到同一个调度组合，有效提前结点任务T_i的开始时间；

步骤2)：令k＝2；

步骤3)：从结点任务T_i余下的直接前驱结点中选择第k位直接前驱结点T_i ^s(k)，计算得到第1个调度组合E_i(1)中除去结点任务T_i外其它结点的总执行时间Q；

分别计算以下两个值：

第一个值：如果合并T_i ^s(k)到第1个调度组合E_i(1)时，该结点任务T_i的开始运行时间B1，即：B1＝Q+R(T_i ^s(k))，R(T_i ^s(k))代表第k位直接前驱结点T_i ^s(k)的任务运行时间；

第二个值：如果不合并T_i ^s(k)到第1个调度组合E_i(1)时，该结点任务T_i的开始运行时间B2，其中，B2取以下两个值中的最大值，一个是Q；另一个是T_i ^s(k)对应的调度集合的执行时间与T_i ^s(k)到结点任务T_i的通信代价的和；

如果B1≤B2，则合并T_i ^s(k)到第1个调度组合E_i(1)中，形成新的第1个调度组合E_i(1)；如果B1>B2，形成第k个调度组合E_i(k)，第k个调度组合E_i(k)为T_i ^s(k)对应的调度集合；

步骤4)令k＝k+1；判断k是否大于x，如果不大于，返回步骤3)；如果大于，则表明结点任务T_i的所有直接前驱结点均被调度完，统计最终是否有E_i(k)，如果没有，结点任务T_i的调度集合P_i＝{{E_i(1)}}；结点任务T_i对应的调度集合P_i的执行时间R(P_i)＝第1个调度组合E_i(1)的执行时间＝第1个调度组合E_i(1)的各个结点任务的任务运行时间之和；

如果有E_i(k)，假设共有z个E_i(k)，分别为E_i(k1)、E_i(k2)…E_i(kz)，则结点任务T_i的调度集合P_i＝{{E_i(1)}，{E_i(k1)}，{E_i(k2)}，…，{E_i(kz)}}；结点任务T_i对应的调度集合P_i的执行时间R(P_i)＝E_i(1)中各个任务结点的运行时间之和；

因此，设共有n个结点任务，当遍历完成最后一个结点任务E_n时，结点任务E_n的调度集合P_n区分以下两种情况：

第一种：结点任务E_n的调度集合P_n＝{{E_n(1)}}；

第二种：结点任务E_n的调度集合P_n＝{{E_n(1)}，{E_n(k1)}，{E_n(k2)}，…，{E_n(ka)}}；其中，a为结点任务E_n的调度集合中除E_n(1)的调度组合数量；

步骤4：如果结点任务E_n的调度集合P_n属于上述第二种情况，则采用以下方法调整结点任务E_n的调度集合P_n：

步骤4.1，在调度集合P_n中统计只调度过一次的任务，形成单次调度任务集；然后，判断E_n(k1)，E_n(k2)，…，E_n(ka)中是否存在不包含任意一个属于单次调度任务集中的任务的调度组合，如果有，则表明该调度组合为冗余调度组合，删除该冗余调度组合；

步骤4.2，合并调度集合P_n中的调度组合，步骤为：

步骤4.2.1，令结点任务E_n的调度集合P_n＝{{E_n(1)}，{E_n(k1)}，{E_n(k2)}，…，{E_n(ka)}}＝{{C₀}，{C₁}，…,{C_a}}；即：E_n(1)＝C₀；E_n(k1)＝C₁；…；E_n(ka)＝C_a；

C_u,C_v∈C,并且v>u；

步骤4.2.2，令u＝0；

步骤4.2.3，在C_u中查找空闲时间即slot(C_u)；

步骤4.2.4，令v＝u+1；

步骤4.2.5，在C_v中搜索没有在C_u中出现的任务，构成一个新的任务组合，表示为Tset(C_v)，判断是否满足以下两个规则：

规则1：Tset(C_v)的执行时间小于等于slot(C_u)；

规则2：C_v的后继任务的开始时间不能延迟；

如果满足规则，则将Tset(C_v)插入到slot(C_u)；

步骤4.2.6，更新slot(C_u)，使slot(C_u)＝slot(C_u)-Tset(C_v)；

步骤4.2.7，令v＝v+1；判断v是否大于a，如果不大于，返回步骤4.2.5；如果大于，执行步骤4.2.8；

步骤4.2.8，令u＝u+1，判断u是否大于a-1，如果不大于，返回步骤4.2.3；如果大于，执行步骤4.2.9；

步骤4.2.9，得到新的调度集合P_n；

步骤5，调度集合P_n中的调度组合数量即为所需要的虚拟机数量，将调度集合P_n中的各个调度组合分配给对应的一个虚拟机执行。

优选的，步骤5具体为：

步骤5.1，根据任务的类型和用户的需求选择虚拟机；虚拟机的数量等于调度集合P_n中的调度组合数量；

步骤5.2，查找出每个虚拟机的可利用的空闲时间，并计算空闲时间长度，再按照空闲时间长度降序排列虚拟机；

步骤5.3，按照调度集合P_n中的各个调度组合的执行时间，降序排列调度集合P_n中的各个调度组合，得到新的调度集合P_n；

步骤5.4，从新的调度集合P_n中，依次取出各个调度组合，查找步骤5.2中排列的各虚拟机，选取空闲时间最合适的虚拟机，如果调度组合的执行时间小于等于虚拟机的空闲时间，则分配该调度组合到此虚拟机的空闲时间；否则分配该调度组合到使其具有最早完成时间的虚拟机上，更新虚拟机空闲时间。

本发明提供的一种面向云计算平台的科学工作流任务调度方法具有以下优点：

本发明通过任务复制技术减小了工作流任务间的通信开销，最小化了任务调度长度，有效地提高了任务调度的效率；通过任务分组技术，有效减少了虚拟机的使用个数；通过合理利用虚拟机的空闲时间，提高了虚拟资源的利用率。相比现有技术，本发明在减小科学工作流执行时间和降低用户执行费用，提高用户满意度等方面具有明显优势。

附图说明

图1为本发明提供的一种面向云计算平台的科学工作流任务调度方法的流程示意图；

图2为本发明提供的DAG图的示意图；

图3为本发明提供的in-tree结构任务图的示意图；

图4为调度集合P_n中的调度组合合并前的分组结果示意图；

图5为本发明算法的分组结果图；

图6为CPFD算法的分组结果图；

图7为PPA算法的分组结果图。

具体实施方式

为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

为方便对本发明进行理解，首先介绍基础知识：

云计算是将大量用网络连接的计算资源统一管理和调度，构成一个计算资源池向用户按需服务。是一种基于Intel网的超级计算模式，在远程的数据中心里，成千上万台电脑和服务器连接成一片电脑云。

科学工作流是指将一系列在科学研究中遇到的数据管理、计算、分析、展现等工作变成一个个独立的服务，再把这些服务通过数据链接组合在一起，满足研究人员科学实验和数据处理的需要，从而实现相应的处理与科学计算。

云计算的任务调度就是在一个特定的云环境中，根据一定的资源使用规则，将资源在不同的使用者之间进行调整的过程，该过程最终把所有任务分配到合适的计算资源上。因此，考虑如何合理地分配和利用云环境中的资源、有效地调度用户提交的海量任务成为云计算研究的重点之一。

本发明的主要技术构思为：本发明首先通过任务复制技术复制fork结点，转化DAG图为in-tree结构任务图；然后考察当前任务的所有直接前驱结点，而不仅仅考虑关键直接前驱结点，只要能提前当前任务的最早开始时间，就把该任务分到其直接前驱结点所在的任务调度集合中，该操作通过消除必要的通信开销，使当前任务具有最早开始时间；然后通过调整任务调度集合中的任务调度组合，减少了任务调度组合的个数，从而最小化了云环境中虚拟机的使用数量；最后通过合理选择虚拟机，恰当利用虚拟机的空闲时间，提高了计算资源的利用率。相比现有技术，本发明在最小化科学工作流的完成时间和最小化计算资源的使用数量方面具有明显优势。

参考图1，本发明提供一种面向云计算平台的科学工作流任务调度方法，包括以下步骤：

步骤1：科学工作流由多个任务相互协作完成，任务及任务间的约束关系模型化为DAG图；

其中，所述DAG图中的每个结点代表一个任务；对于结点任务T_i，其在虚拟机上的任务运行时间为R(T_i)；任务间的通信代价为W；当两个任务被分到同一个调度组合时，任务间的通信开销为0；

参考图2，为一种具体的DAG图示例，在图2中，共有10个结点任务，例如，对于T₄结点任务，其在虚拟机上的任务运行时间R(T₄)为4；结点任务T₄和结点任务T₉之间的通信代价W为8。

步骤2：转换DAG图为in-tree结构任务图，具体步骤为：

对于图2，转换为in-tree结构任务图的步骤为：

首先遍历到T₁结点，由于其入度为0，出度d为5，因此，复制T₁结点4次，再加上原T₁结点，由此共得到5个T₁结点；5个T₁结点分别对应T₂、T₃、T₄、T₅、T₆这五个后继结点；

然后遍历到T₂结点，由于其入度为1，出度d为2，因此，将T₂结点连同其前驱路径，即T₁结点一同复制1次，因此，T₁结点的数量增加1个，T₂结点的数量增加1个，由此共得到2个T₂结点，每个T₂结点均具有一个独立的直接前驱结点T₁，两个T₂结点分别对应T₇、T₈这两个后继结点；

以此类推，当遍历完成图2中的10个结点后，生成图3所示的in-tree结构任务图。

步骤3：构造调度集合，具体步骤为：

步骤2)：令k＝2；

分别计算以下两个值：

第一种：结点任务E_n的调度集合P_n＝{{E_n(1)}}；

为方便对步骤3进行理解，以图3所示的in-tree结构任务图为例，介绍调度集合的构建过程：

1)采用层次递增的顺序，同一层次结点按照结点序号递增排序，依次遍历in-tree结构任务图中的所有结点任务。

对于图3，共有10个结点，遍历的先后顺序为：T₁、T₂、T₃、T₄、T₅、T₆、T₇、T₈、T₉、T₁₀。

2)因此，首先遍历到T₁结点，其入度为0，即没有直接前驱结点，因此，调度集合P₁＝{{调度组合E₁}}＝{{结点任务T₁}}；

调度集合P₁的执行时间R(P₁)＝结点任务T₁对应的调度组合E₁的执行时间R(E₁)，而R(E₁)＝结点任务T₁的任务运行时间R(T₁)＝3；

3)然后，遍历到T₂结点，T₂结点只有一个直接前驱结点T₁，因此，直接合并结点任务T₂与其直接前驱结点对应的调度集合P₁，得到结点任务T₂对应的调度集合P₂，即：调度集合P₂＝{结点任务T₂∪{调度集合P₁}}＝{结点任务T₁，结点任务T₂}；

调度集合P₂的执行时间R(P₂)＝调度集合P₁的执行时间R(P₁)+结点任务T₂的任务运行时间R(T₂)＝3+4＝7；

4)然后，再依次遍历到T₃结点、T₄结点、T₅结点、T₆结点和T₇结点；T₃结点、T₄结点、T₅结点、T₆结点和T₇结点均为只有一个直接前驱结点的情况，因此，其计算原理与T₂结点的计算原理相同，在此不再赘述，仅给出遍历结果如下：

调度集合P₃＝{结点任务T₁，结点任务T₃}；执行时间R(P₃)＝6；

调度集合P₄＝{结点任务T₁，结点任务T₄}；执行时间R(P₄)＝7；

调度集合P₅＝{结点任务T₁，结点任务T₅}；执行时间R(P₅)＝7；

调度集合P₆＝{结点任务T₁，结点任务T₆}；执行时间R(P₆)＝5；

调度集合P₇＝{结点任务T₁，结点任务T₂，结点任务T₇}；执行时间R(P₇)＝10；

5)然后，再遍历到T₈结点，T₈结点为join结点，其包含3个直接前驱结点，分别为T₂结点、T₃结点和T₄结点，通过如下步骤产生结点任务T₈对应的调度集合P₈：

5.1)T₂结点所对应的调度集合P₂的执行时间R(P₂)为7，结点任务T₈和T₂结点之间通信代价为15，因此，T₂结点对应的Y值为22；

T₃结点所对应的调度集合P₃的执行时间R(P₃)为6，结点任务T₈和T₃结点之间通信代价为6，因此，T₃结点对应的Y值为12；

T₄结点所对应的调度集合P₄的执行时间R(P₄)为7，结点任务T₈和T₄结点之间通信代价为2，因此，T₄结点对应的Y值为9；

5.2)按Y值由大到小顺序，将结点任务T₈的各个直接前驱结点排序，分别为：T₂结点、T₃结点和T₄结点；即：T₂结点为第1位直接前驱结点；T₃结点为第2位直接前驱结点；T₄结点为第3位直接前驱结点；

5.3)合并结点任务T₈与第1位直接前驱结点T₂所对应的调度集合P₂，形成结点任务T₈所对应的第1个调度组合E₈(1)，即：第1个调度组合E₈(1)＝{结点任务T₈∪{调度集合P₂}}＝{结点任务T₁，结点任务T₂，结点任务T₈}；

5.4)计算得到第1个调度组合E₈(1)中除去结点任务T₈外其它结点的总执行时间Q，Q为7；

分别计算以下两个值：

第一个值：如果合并T₃结点到第1个调度组合E₈(1)时，该结点任务T₈的开始运行时间B1，即：B1＝Q+R(T₃))，R(T₃)代表T₃的任务运行时间，为3；因此，B1＝7+3＝10；

第二个值：如果不合并T₃结点到第1个调度组合E₈(1)时，该结点任务T₈的开始运行时间B2，其中，B2取以下两个值中的最大值，一个是Q，值为7；另一个是T₃结点对应的调度集合的执行时间与T₃结点到结点任务T₈的通信代价的和，为6+6＝12；因此，B2取12；

此时，B1≤B2，因此，合并T₃结点到第1个调度组合E₈(1)中，形成新的第1个调度组合E₈(1)＝{结点任务T₁，结点任务T₂，结点任务T₃，结点任务T₈}；第1个调度组合E₈(1)的执行时间为其包含的结点任务的运行时间之和，为15；

5.5)在得到新的第1个调度组合E₈(1)＝{结点任务T₁，结点任务T₂，结点任务T₃，结点任务T₈}后，用新的第1个调度组合E₈(1)＝{结点任务T₁，结点任务T₂，结点任务T₃，结点任务T₈}更新旧的E₈(1)＝{结点任务T₁，结点任务T₂，结点任务T₈}，然后，采用与5.4)的计算步骤相同构思，判断是否将结点任务T₄合并到新的第1个调度组合E₈(1)中，通过计算发现，如果结点任务T₄合并到第1个调度组合E₈(1)＝{结点任务T₁，结点任务T₂，结点任务T₃，结点任务T₈}中，此时B1＝14；如果不合并，B2＝10，B1>B2，因此，不合并结点任务T₄，此时，形成调度组合E₈(2)＝{结点任务T₁，结点任务T₄}。

因此，最终结点任务T₈的调度集合P₈＝{{E₈(1)}，{E₈(2)}}＝{{结点任务T₁，结点任务T₂，结点任务T₃，结点任务T₈)}，{结点任务T₁，结点任务T₄}}；结点任务T₈对应的调度集合P₈的执行时间R(P₈)＝E₈(1)中各个任务结点的运行时间之和＝15；

6)然后，再遍历到T₉结点，T₉结点为join结点，其计算原理和方法与T₈结点，在此不再赘述，结果为：

结点任务T₉的调度集合P₉＝{{结点任务T₁，结点任务T₄，结点任务T₅，结点任务T₉)}，{结点任务T₁，结点任务T₃}}；结点任务T₉对应的调度集合P₉的执行时间R(P₉)＝14；

7)然后，再遍历到T₁₀结点，T₁₀结点为join结点，其计算原理和方法与T₈结点，在此不再赘述，结果为：

结点任务T₁₀的调度集合P₁₀＝{{结点任务T₁，结点任务T₂，结点任务T₃，结点任务T₈，结点任务T₁₀)}，{结点任务T₁，结点任务T₄}，{结点任务T₁，结点任务T₄，结点任务T₅，结点任务T₉)}，{结点任务T₁，结点任务T₃}，{结点任务T₁，结点任务T₆}，{结点任务T₁，结点任务T₂，结点任务T₇}}；结点任务T₁₀对应的调度集合P₁₀的执行时间R(P₁₀)＝24。

各结点对应的调度集合Task groups以及调度集合的执行时间execution time见下表：

通过本步骤，主要目的即为得到调度集合P₁₀。

步骤4.2，合并调度集合P_n中的调度组合，步骤为：

C_u,C_v∈C,并且v>u；

步骤4.2.2，令u＝0；

步骤4.2.3，在C_u中查找空闲时间即slot(C_u)；

步骤4.2.4，令v＝u+1；

规则1：Tset(C_v)的执行时间小于等于slot(C_u)；

规则2：C_v的后继任务的开始时间不能延迟；

如果满足规则，则将Tset(C_v)插入到slot(C_u)；

步骤4.2.6，更新slot(C_u)，使slot(C_u)＝slot(C_u)-Tset(C_v)；

步骤4.2.9，得到新的调度集合P_n；

为方便对步骤4进行理解，以图3所示的in-tree结构任务图为例，介绍调度集合的调整过程：

1)对于结点任务T₁₀的调度集合P₁₀＝{{T₁，T₂，T₃，T₈，T₁₀}，{T₁，T₄}，{T₁，T₄，T₅，T₉}，{T₁，T₃}，{T₁，T₆}，{T₁，T₂，T₇}}；

统计只调度过一次的任务，形成单次调度任务集{T₅,T₆,T₇,T₈,T₉,T₁₀}；因此，调度集合P₁₀中的{T₁，T₄}和{T₁，T₃}不包含任意一个属于单次调度任务集中的任务的调度组合，需删除调度集合P₁₀中的{T₁，T₄}和{T₁，T₃}，由此得到新的调度集合P₁₀＝{{T₁，T₂，T₃，T₈，T₁₀}，{T₁，T₄，T₅，T₉}，{T₁，T₆}，{T₁，T₂，T₇}}。

2)调度集合P₁₀＝{{T₁，T₂，T₃，T₈，T₁₀}，{T₁，T₄，T₅，T₉}，{T₁，T₆}，{T₁，T₂，T₇}}。因此，C₀＝{T₁，T₂，T₃，T₈，T₁₀}；C₁＝{T₁，T₄，T₅，T₉}；C₂＝{T₁，T₆}；C₃＝{T₁，T₂，T₇}；

2.1)首先在C₀中查找空闲时间即slot(C₀)，发现slot(C₀),如图4所示，介于T₈和T₁₀之间，此时slot(C₀)＝22-15＝7；

本步骤中，调度组合C_z，z等于0，1…(a-1)，在调度组合C_z中查找空闲时间的方法为：

考察C_z中两个连续任务T_c和T_d之间是否有空闲时间的公式如下：

T_s∈pred(T_d)，表示T_s是T_d的直接前驱任务，ct(T_s)是任务T_s的完成时间，W(T_s，T_d)是任务T_s和任务T_d之间的通信代价。ct(T_c)是任务T_c的完成时间。

2.2)在C₁中搜索没有在C₀中出现的任务，构成一个新的任务组合，表示为Tset(C₁)＝{T₄，T₅，T₉}，Tset(C₁)的执行时间＝R(T₄)+R(T₅)+R(T₉)＝4+4+3＝11；

判断是否满足以下两个规则：

规则1：Tset(C₁)的执行时间小于等于slot(C₀)；

规则2：C_v的后继任务的开始时间不能延迟；

通过比较发现，不满足规则1，因此，Tset(C₁)不能插入到slot(C₀)；slot(C₀)仍然等于9；

2.3)采用与步骤2.2)同样的方法处理C₂，Tset(C₂)＝{T₆}，Tset(C₂)的执行时间＝R(T₂)＝2；Tset(C₂)的后继结点是T_10,T₁₀开始时间是22，满足规则1和规则2，因此，插入T₆到C₀中的slot(C₀)，C₀＝{T₁,T₂,T₃,T₈,T₆,T₁₀},更新slot(C₀)＝slot(C₀)-Tset(C₂)＝7-2＝5；

2.4)采用与步骤2.2)同样的方法处理C₃，Tset(C₃)＝{T₇},Tset(C₃)的执行时间＝3,满足规则1和规则2，因此，插入T₇到C₀中的slot(C₀)，C₀＝{T₁,T₂,T₃,T₇，T₈,T₆,T₁₀},更新slot(C₀)＝5-3＝2；

2.5)然后，由于C₂和C₃已插入到slot(C₀)中；因此，循环结束。

最终得到的调度集合P₁₀＝{{T₁,T₂,T₃,T₈,T₆,T₇,T₁₀}，{T₁，T₄，T₅，T₉}}。最小执行时间是24。

如图4所示，为调度集合P_n中的调度组合合并前的分组结果示意图。如图5所示，为调度集合P_n中的调度组合采用本发明算法进行合并后的分组结果示意图。

步骤5具体为：

由此可见，本发明中，通过步骤2采用任务复制技术，复制fork任务，使每一个任务结点都有其独立前驱结点，为科学工作流任务的合理分组做好前期准备；通过步骤3的任务分组技术，消除了关键任务与部分非关键任务之间的通信开销，最小化了工作流的执行时间；通过步骤4合理利用任务组的空闲时间，调整任务调度集合，去掉多余的调度组合，从而减少了虚拟机的使用数目，减少了云计算供应商的运行成本，降低了用户的执行费用；通过步骤5合理利用虚拟机的空闲时间，提高了虚拟机的资源利用率，为云计算供应商减少了计算资源的支出。本发明不仅考虑云计算提供商的利益，而且保障了用户的服务质量，使云计算用户和供应商均有受益。本发明的关键点是任务复制和任务分组技术的综合使用，减小了任务间的通信开销，最小化了工作流的执行时间，减小了虚拟机的使用个数，提高了虚拟资源的利用率。科学工作流任务调度的5个步骤，尤其是步骤3、4、5步骤是本发明的保护点。

模拟实验和结果分析：

因为任务复制和任务分组是本发明算法的关键技术，所以首先对比本发明算法和传统CPFD算法和PPA算法的分组策略，如图5、图6和图7所示，分别为本发明算法、CPFD算法和PPA算法的分组结果。

通过对比图5、图6和图7，可以看出，本发明算法共分为两组，需要使用两台虚拟机；CPFD算法共分为六组，需要使用六台虚拟机；PPA算法共分为四组，需要使用四台虚拟机；可见，本发明算法的分组数最小，所使用的虚拟机的数量最少。另外，对比图5、图6和图7，PPA算法的完成时间是26，CPFD算法的完成时间是24，本发明算法的完成时间是24，可见，本发明算法的完成时间小于PPA算法，不大于CPFD算法，保证了总任务完成时间最小。

对于面向云计算环境的科学工作流，本发明提出了一种基于任务复制和任务分组技术的启发式任务调度方法，本发明通过任务复制技术减小了工作流任务间的通信开销，最小化了任务调度长度，有效地提高了任务调度的效率；通过任务分组技术，有效减少了虚拟机的使用个数；通过合理利用虚拟机的空闲时间，提高了虚拟资源的利用率。相比现有技术，本发明在减小科学工作流执行时间和降低用户执行费用，提高用户满意度等方面具有明显优势。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视本发明的保护范围。

Claims

1.一种面向云计算平台的科学工作流任务调度方法，其特征在于，包括以下步骤：

步骤2：转换DAG图为in-tree结构任务图，具体步骤为：

步骤3：构造调度集合，具体步骤为：

步骤2)：令k＝2；

分别计算以下两个值：

第一种：结点任务E_n的调度集合P_n＝{{E_n(1)}}；

步骤4.2，合并调度集合P_n中的调度组合，步骤为：

C_u,C_v∈C,并且v>u；

步骤4.2.2，令u＝0；

步骤4.2.3，在C_u中查找空闲时间即slot(C_u)；

步骤4.2.4，令v＝u+1；

规则1：Tset(C_v)的执行时间小于等于slot(C_u)；

规则2：C_v的后继任务的开始时间不能延迟；

如果满足规则，则将Tset(C_v)插入到slot(C_u)；

步骤4.2.6，更新slot(C_u)，使slot(C_u)＝slot(C_u)-Tset(C_v)；

步骤4.2.9，得到新的调度集合P_n；

2.根据权利要求1所述的面向云计算平台的科学工作流任务调度方法，其特征在于，步骤5具体为：