CN110928648A

CN110928648A - 融合启发式和智能计算的云工作流分段在线调度优化方法

Info

Publication number: CN110928648A
Application number: CN201911261580.9A
Authority: CN
Inventors: 谢毅; 汪炜军; 余浩楠
Original assignee: Zhejiang Gongshang University
Current assignee: Tanxun Intelligent Technology Hangzhou Co ltd; Tongxiang Beite Technology Co ltd
Priority date: 2019-12-10
Filing date: 2019-12-10
Publication date: 2020-03-27
Anticipated expiration: 2039-12-10
Also published as: CN110928648B

Abstract

本发明公开了一种融合启发式和智能计算的云工作流分段在线调度优化方法，包括以下步骤：获取调度优化所需信息；计算任务的排序值和层次值；基于动态关键任务优先调度的启发式方法生成第一阶段的任务调度优化方案；基于遗传算法获得第二阶段的任务调度优化方案；输出调度优化方案。本发明采用融合启发式和智能计算的分段调度优化方法，求解时间等于启发式方法的求解时间，而解的质量则近似于用智能计算方法求解的质量，因此本发明在适应实时在线调度的前提下有效提高了解的质量。

Description

融合启发式和智能计算的云工作流分段在线调度优化方法

技术领域

本发明涉及计算机技术、信息技术和系统工程领域，具体涉及一种云工作流调度优化方法，更具体的说，尤其涉及一种融合启发式和智能计算的云工作流分段在线调度优化方法。

背景技术

云计算环境下的工作流，简称“云工作流”，是云计算与工作流相关技术的整合，在需要高效计算性能和大规模存储支撑的跨组织业务协作、科学计算等领域具有广泛的应用前景。在云工作流中，任务与任务之间存在着时序约束，执行时通常以虚拟机作为计算资源的最小分配单位负责接收并处理这些任务。云工作流调度是指在满足任务时序和用户需要约束下如何把云工作流中的任务分配到合适的虚拟机上，以及如何安排被分配到虚拟机上的任务的执行顺序，即要解决两个方面的问题：任务分配和任务执行顺序。云工作流调度直接决定了整个云工作流系统的性能，已成为云工作流系统的一个重要研究内容。

当前云工作流调度优化方法可以分为三类：

1)启发式方法，是指工作流任务分配和执行顺序都用启发式方法生成，如：Heterogeneous Earliest Finish Time即HEFT、Critical Path On a Processors即CPOP、Levelized Min Time即LMT、Dynamic Level Scheduling即DLS、Dynamic Critical Path即DCP、Longest Dynamic Critical Path即LDCP等方法；

2)智能计算方法，是指工作流任务分配和执行顺序都通过智能计算方法来搜索生成；如：遗传算法GA、粒子群优化算法PSO、模拟退火算法SA等方法；

3)结合启发式的半智能计算方法，是指工作流任务分配通过智能计算方法来搜索生成而任务执行顺序则根据智能计算方法搜索生成的任务分配方案采用基于优先级的启发式方法生成，或工作流任务执行顺序通过智能计算方法来搜索生成而任务分配则根据智能计算方法搜索生成的任务执行顺序通过基于任务最早完成时间的启发式方法来生成。

然而，现有的这些云工作流调度优化方法有着如下缺点：

1)启发式方法能在较短的时间获得一个调度优化方案，适用于在线实时调度，但其质量通常不是很高而且依赖于工作流的类型；

2)智能计算方法的算法效率依赖于编码与解码、进化迭代策略的设计及控制参数的选择等，其中，结合启发式的半智能计算方法搜索的解空间即调度方案是不完整的，因此其理论上存在搜索不到最优调度方案的可能性，同时在算法中需要不断调用启发式方法，其时间效率也不是很高；智能计算方法其理论上可以实现全域搜索，但采用全域搜索会导致搜索效率降低；总体来说智能计算方法的求解质量要优于启发式方法，但其求解时间要高于启发式方法，并不适用于在线实时调度优化；

因此，亟需设计一种更高效方法来解决云工作流在线实时调度优化问题。

发明内容

为了克服启发式方法解的质量通常不是很高而且依赖于工作流的类型，而智能计算方法时间效率不高并不适用于在线实时调度优化，本发明提供了一种既能适用于在线实时调度又能发现高质量解的云工作流调度优化方法。

本发明解决其技术问题所采用的技术方案如下：一种融合启发式和智能计算的云工作流分段在线调度优化方法，包括以下步骤：

步骤1：形式化调度问题，获取调度优化所需的信息；

获取任务集T＝{t₁,t₂,...,t_I}，其中I是任务的数量，t_i表示任务i，即编号为i的任务；

获取任务间的时序关系：任务i的父任务集PR_i，任务i的子任务集SC_i，其中i＝1,2…,I；

获取任务相关参数：任务i的长度t_i.length，即任务i被虚拟机处理时需要耗费的指令数量，处理任务i时需要的输入文件列表t_i.IFL，任务i被处理后产生的输出文件列表t_i.OFL，及文件列表中文件file的大小file.size，其中i＝1,2…,I；任务i是任务i⁺的父任务的充要条件为：存在一个文件file，file是任务i的输出文件同时又是任务i⁺的输入文件，即：

获取云计算环境下的虚拟机集VM＝{vm₁,vm₂,…,vm_J}，其中J是虚拟机的数量，vm_j表示虚拟机j，即编号为j的虚拟机；

获取虚拟机相关参数：虚拟机j的计算能力vm_j.ps，虚拟机j的带宽vm_j.bw，其中j＝1,2…,J；

获取任务与虚拟机之间的支持关系：虚拟机j可以处理的任务集T_j，其中j＝1,2…,J；可以处理任务i的虚拟机集VM_i，其中i＝1,2…,I；

步骤2：计算任务的排序值rank；

先计算t_i执行时的平均处理时间

需要从共享数据库获得输入文件的平均传输时间

需要从其它虚拟机获得输入文件的平均传输时间

t_i执行时的平均处理时间计算如下：

t_i执行时需要从共享数据库获得输入文件的平均传输时间为：

t_i执行时需要从其它虚拟机获得输入文件的平均传输时间为：

其中

为

和t_i间的文件平均传输时间，其计算如下：

然后自下而上计算任务的排序值rank，其计算过程如下：

对于没有子任务的结束任务i：

其它任务的排序值rank采用如下递归公式进行计算：

步骤3：计算任务的层次值；

对于没有父任务的开始任务i，其层次值为：

level_i＝1 (7)

其它任务的层次值采用如下递归公式进行计算：

步骤4：基于动态关键任务优先调度的启发式方法生成第一阶段的任务调度方案；

所述基于动态关键任务优先调度的启发式方法生成第一阶段的任务调度方案包括如下步骤：

步骤A1：系统状态初始化：令虚拟机可得时间段列表vatl′_j＝{[0,M]}，j＝1,2,…,J，其中M为一个接近无穷大的数；令任务的就绪时间rt′_i＝0、任务集P(t_i)＝PR_i，i＝1,…,I；令变量k＝1；令任务集

UT＝T；把UT中

的t_i移到RT中；

步骤A2：从RT中取出优先级

最大的t_i；如果t_i的就绪时间rt_i′小于ξ，那么转到步骤A3，否则转到步骤A7；

步骤A3：令t_i的可得虚拟机集AVM_i＝VM_i，计算把t_i分别分配给AVM_i中的每个虚拟机后t_i的完成时间：

步骤A3.1：从AVM_i中取出一个虚拟机，不妨设为vm_j；

步骤A3.2：计算t_i分配给vm_j处理后的执行时间

步骤A3.3：在vatl′_j中从早到晚找出一个空闲时段[ν_j,υ_j]，满足υ_j-ν_j≥et_i,j和υ_j-et_i,j≥rt′_i；

步骤A3.4：计算t_i分配给vm_j处理后的开始时间s_i,j＝max{ν_j,rt′_i}，完成时间f_i,j＝s_i,j+et_i,j；

步骤A3.5：若AVM_i不为空，则转到步骤A3.1，否则转到步骤A4；

步骤A4：若对于任意vm_j∈VM_i，s_i,j≥ξ，那么转到步骤A7；否则在满足s_i,j<ξ的虚拟机中按顺序找出能最早完成t_i的虚拟机，不妨设为vm_j，转到步骤A5；

步骤A5：把t_i分配给vm_j：

步骤A5.1：令ST＝ST∪t_i，g′_I+k＝i，g′_i＝j，k＝k+1；t_i的开始时间s_i＝s_i,j，t_i的完成时间f_i＝f_i,j；

步骤A5.2：在虚拟机可得时间段列表vatl′_j中删除[ν_j,υ_j]，插入区间长度大于0的[ν_j,s_i]和[f_i,υ_j]；

步骤A5.3：更新t_i的子任务的就绪时间

步骤A6：在所有

中删除t_i；把UT中

的

移到RT中；

步骤A7：如果RT不为空，则转到步骤A2，否则转到步骤A8；

步骤A8：完成第一阶段的调度，获得已调度的任务集ST，已调度任务的虚拟机分配g′_i、完成时间f_i，t_i∈ST，已调度任务的调度顺序g′_I+k，1≤k≤|ST|，及完成第一阶段任务调度后虚拟机的可得时间段列表vatl′_j和所有任务的就绪时间rt′_i；

其中：

是当t_i的父任务的虚拟机分配已确定的情况下t_i执行时需要从虚拟机获得输入文件的平均传输时间，

是处理

的虚拟机；

ξ：是第一阶段与第二阶段的临界点，即遗传算法获得一个优化调度方案所需的时间；

ω_i,j：是vm_j处理t_i的时间，

是把t_i分配给vm_j处理时需要从其它的虚拟机获得输入文件的文件传输时间，

是处理

的虚拟机；

τ_i,j：是把t_i分配给vm_j处理时需要从共享数据库获得输入文件的文件传输时间，

步骤5：基于遗传算法获得第二阶段任务的调度方案；

步骤5.1：采用基于层次的个体随机生成方法生成N个不同的个体形成当代种群；

所述个体采用2I位整数编码，I为任务数量，其方法如下：ch＝{g₁,…,g_I,g_I+1,…,g_2I}，基因g_i是一个非负整数，其中，{g₁,…,g_I}是虚拟机分配列表，g_i表示给任务i分配的虚拟机编号，即把任务i分配给虚拟机g_i，g_i∈VM_i，i＝1,…,I，例如：g₁＝2表示1号任务是分配给2号虚拟机的；{g_I+1,…,g_2I}是任务调度顺序列表，是1,…,I的一个排列，且满足任务的时序约束，即任何任务都不能排在其父任务的前面，g_I+i表示第i个被调度的任务的编号，即任务g_I+i是第i个被调度的，例如g_I+1＝3，表示第1个调度的任务是3号任务；由于t_i∈ST在第一阶段已调度，因此对于任何一个个体始终有：

g_i＝g′_i；

g_I+k＝g′_I+k；

所述采用基于层次的个体随机生成方法包括如下步骤：

步骤B1：令任务集UT＝T-ST；令所有任务的就绪时间rt″_i＝rt′_i，i＝1,…,I；初始化虚拟机的可得时间段列表vatl″_j＝vatl′_j，j＝1,2,…,J；令基因g_i＝g′_i，t_i∈ST；令基因g_I+k＝g′_I+k，1≤k≤|ST|；令变量δ＝|ST|+1；

步骤B2：从UT中随机取出一个层次值最小的任务，不妨设为t_i；

步骤B3：从VM_i中随机选择一个虚拟机，不妨设为vm_j，把t_i分配给vm_j：

步骤B3.1：令g_I+δ＝i，g_i＝j，δ＝δ+1；

步骤B3.2：计算t_i分配给vm_j处理后的执行时间

步骤B3.3：在vatl″_j中从早到晚找出一个可得时间段[ν_j,υ_j]，满足υ_j-ν_j≥et_i和υ_j-et_i≥rt″_i；

步骤B3.4：计算t_i分配给vm_j处理后的开始时间s_i＝max{ν_j,rt″_i}，完成时间f_i＝s_i+et_i；

步骤B3.5：在虚拟机可得时间段列表vatl″_j中删除[ν_j,υ_j]，插入区间长度大于0的[ν_j,s_i]和[f_i,υ_j]；

步骤B3.6：更新t_i的子任务的就绪时间

步骤B4：如果UT不为空，则转到步骤B2，否则转到步骤B5；

步骤B5：输出一个个体ch＝{g₁,…,g_I,g_I+1,…,g_2I}，计算其适应度值，操作结束；

步骤5.2：对当代种群进行N次基于偏好的参数化均匀交叉操作生成新种群，对新种群中的每个个体采用单点变异操作；

所述基于偏好的参数化均匀交叉操作包括如下步骤：

步骤C1：采用锦标赛法从当代种群中随机选择两个不同的个体作为父体，不妨设为ch^p1、ch^p2，且ch^p1优于ch^p2；令变量δ＝1、子体

步骤C2：如果δ≤I+|ST|，则转到步骤C3；如果I+|ST|<δ≤2I，则转到步骤C4；如果δ>2I则转到步骤C5；

步骤C3：生成一个随机数λ∈[0,1)，如果λ<p_b，那么从ch^p1中取出首元素放到ch^c的尾部，并从ch^p2中删除首元素，否则从ch^p2中取出首元素放到ch^c的尾部，并从ch^p1中删除首元素；δ＝δ+1，转到步骤C2；

步骤C4：生成一个随机数λ∈[0,1)，如果λ<p_b，那么从ch^p1中取出首元素放到ch^c的尾部，并从ch^p2中删除该元素，否则从ch^p2中取出首元素放到ch^c的尾部，并从ch^p1中删除该元素；δ＝δ+1，转到步骤C2；

步骤C5：输出子体

操作结束；

其中，p_b∈(0.5,1)为偏好概率；

所述单点变异操作包括如下步骤：

步骤D1：产生一个随机数λ₁∈[0,1)，如果λ₁<p_m，则转步骤D2，否则转步骤D5；

步骤D2：产生一个随机数λ₂∈[0,1)，如果λ₂<0.5，则从i≤I且

中随机选择一个基因g_i转到步骤D3，否则从i>I+|ST|中随机选择一个基因g_i转到步骤D4；

步骤D3：从可以处理任务i的VM_i中重新随机选择一个虚拟机vm_j，g_i＝j，转到步骤D5；

步骤D4：如果在T-ST中存在任务g_i的父任务，那么从g_i开始向前找到任务g_i的第一个父任务g_i′，令位置值pos₁＝i′+1，否则令pos₁＝I+|ST|+1；如果在T-ST中存在任务g_i的子任务，从g_i开始向后找到任务g_i的第一个子任务g_i″，令位置值pos₂＝i″-1，否则令pos₂＝2I，在[pos₁,pos₂]之间重新随机选择一个位置插入g_i；

步骤D5：变异操作结束；

其中：p_m∈[0,1)是变异率；

步骤5.3：对新种群中的每个个体采用基于插入模式的串行个体解码和LDI方法改进；

所述基于插入模式的串行个体解码包括如下步骤：

步骤E1：令所有任务的就绪时间rt″_i＝rt′_i，i＝1,…,I；初始化虚拟机的可得时间段列表vatl″_j＝vatl′_j，j＝1,2,…,J；令变量k＝|ST|+1；

步骤E2：选取编号为g_I+k的任务，不妨设i＝g_I+k；

步骤E3：基于插入模式把任务i分配给虚拟机g_i：

步骤E3.1：计算任务i的执行时间

步骤E3.2：在

中从早到晚找出一个空闲时段

满足

和

步骤E3.3：

f_i＝s_i+et_i，

步骤E3.4：在虚拟机可得时间段列表vatl″_j中删除

插入区间长度大于0的

和

步骤E4：令k＝k+1，如果k≤I则转到步骤E2，否则步骤E5；

步骤E5：获得所有任务的开始时间和完成时间：s_i、f_i，i＝1,…,I，计算适应度值；操作结束；

所述LDI方法包括如下步骤：

步骤F1：计算各虚拟机负载

步骤F2：找出负载最小的虚拟机j′；如果ld_j′>0，转到步骤F3，否则转到步骤F4；

步骤F3：令任务集

转到步骤F5；

步骤F4：令任务集DT_j′＝T_j′-ST，转到步骤F5；

步骤F5：如果DT_j′不为空，则从DT_j′中按顺序取出一个其所在虚拟机j″的负载是最高的任务i′，转到步骤F6；否则转到步骤F7；

步骤F6：令g_i′＝j′，形成新的个体

采用基于插入模式的串行个体解码方法对

进行解码，如果有改进则用此改进的个体替换原个体，转到步骤F7；否则转到步骤F5；

步骤F7：LDI操作结束；

步骤5.4：从当代种群和新种群中从优到劣选出N个不同的个体形成下一代种群；

步骤5.5：令下一代种群为当代种群；判断是否满足进化终止条件，如满足，则转到步骤6，否则，转到步骤5.2；

所述终止条件为运行到第一阶段与第二阶段的临界点ξ；

步骤6：输出当代种群中的最优个体，其对应的调度方案即为优化方案。

进一步的，所述适应度值为工作流响应时间rs，其计算方法如下：

其中：rf_i是任务i的响应时间，

SFL_i是任务i输出给共享数据库的输出文件集，即

适应度值越小，个体越优。

进一步的，所述步骤C1中采用锦标赛法从当代种群中随机选择一个个体的具体步骤如下：首先从当代种群中随机选择2个不同的个体，然后根据适应度值比较这两个个体的优劣，返回优的个体。

本发明的有益效果在于：

(1)本发明采用融合启发式和智能计算的分段调度优化方法，求解时间即响应时间等于启发式方法的求解时间，而解的质量则近似于用智能计算方法求解的质量，因此本发明提出的技术方案在能适应实时在线调度的情况下，有效提高了解的质量。

(2)在生成第一阶段的任务调度方案的过程中，相对传统的启发式调度方法，本发明设计采用的任务优先级会随着调度的进行而不断调整，能更好地反映当前未调度任务的紧急程度，因此通常其找到更好的调度方案。

(3)在用遗传算法获得第二阶段的调度方案中，相对于结合启发式的半智能计算方法及基于分层编码的智能计算方法，本发明设计采用的一维编码方法，任何一个调度方案都可以有一个个体与之对应，因此其搜索空间是完备的，可以实现全域搜索。

(4)在用遗传算法获得第二阶段的调度方案中，相对于基于非插入模式和并行的解码方法，本发明设计采用的基于插入模式的尽可能早地安排任务执行的串行解码方法通常能找到更好的调度方案。

(5)在用遗传算法获得第二阶段的调度方案中，相对于一般的基于优先级的编码方式，本发明设计采用的基于拓扑排序的任务调度顺序编码方法，考虑了任务之间的时序关系，这样解码方法就比较简单，能有效提高解码的效率，进而提高了算法的整体效率。

(6)在用遗传算法获得第二阶段的调度方案中，本发明设计采用了考虑传输时间的负载均衡策略LDI，增强了个体的邻域寻优能力，从而能提高整个算法的寻优能力和搜索效率。

(7)在用遗传算法获得第二阶段的调度方案中，相对于传统的随机初始化方法，本发明基于层次的随机个体生成方法，这样可以使算法可以在最优方案附近开始搜索，从而缩短算法的收敛时间。

(8)在用遗传算法获得第二阶段的调度方案中，针对提出的一维整数编码方法，本发明设计了一种新的简单而有效的交叉和变异方法，如果父体是有效合法的，那么用该方法能确保生成的子体也是有效的合法的。

附图说明

图1是本发明一种融合启发式和智能计算的云工作流分段在线调度优化方法的流程示意图。

图2是本发明实施例中Montage工作流任务间的时序关系图。

具体实施方式

下面结合图1、图2及实施例对本发明做进一步详细说明，但本发明并不仅限于以下的实施例。

假设一个云计算中心有编号为1至6的6台虚拟机可供使用，虚拟机vm₁，vm₂，…，vm₆的处理能力和带宽如表1所示；一个Montage工作流任务间的时序关系如图2所示，由编号为1至15的15个任务组成，任务t₁，t₂，…，t₁₅的执行长度，处理所需要的输入文件和处理后的输出文件的名称、长度以及可以被处理的虚拟机如表2所示。

虚拟机	处理能力(MI/s)	带宽(Mbit/s)	虚拟机	处理能力(MI/s)	带宽(Mbit/s)
						vm<sub>1</sub>	1000	200	vm<sub>4</sub>	2000	300
vm<sub>2</sub>	1000	200	vm<sub>5</sub>	3000	400
						vm<sub>3</sub>	2000	300	vm<sub>6</sub>	3000	400

表1

表2

针对上述案例，如图1所示，一种融合启发式和智能计算的云工作流分段在线调度优化方法，包括以下实施步骤：

执行步骤1：形式化调度问题，获取调度优化所需的信息；

获取任务集T＝{t₁,t₂,t₃,t₄,t₅,t₆,t₇,t₈,t₉,t₁₀,t₁₁,t₁₂,t₁₃,t₁₄,t₁₅}；

获取任务间的时序关系，即任务i的父任务集PR_i和子任务集SC_i：

PR₄＝{t₁}，PR₅＝{t₁,t₂}，PR₆＝{t₁,t₃}，PR₇＝{t₄,t₅,t₆}，PR₈＝{t₇}，PR₉＝{t₁,t₈}，PR₁₀＝{t₂,t₈}，PR₁₁＝{t₃,t₈}，PR₁₂＝{t₉,t₁₀,t₁₁}，PR₁₃＝{t₁₂}，PR₁₄＝{t₁₃}，PR₁₅＝{t₁₄}；SC₁＝{t₄,t₅,t₆,t₉}，SC₂＝{t₅,t₁₀}，SC₃＝{t₆,t₁₁}，SC₄＝{t₇}，SC₅＝{t₇}，SC₆＝{t₇}，SC₇＝{t₈}，SC₈＝{t₉,t₁₀,t₁₁}，SC₉＝{t₁₂}，SC₁₀＝{t₁₂}，SC₁₁＝{t₁₂}，SC₁₂＝{t₁₃}，SC₁₃＝{t₁₄}，SC₁₄＝{t₁₅}，

获取任务的相关参数：t₁.length＝126000MI，t₁.IFL＝{f_d1,f_d2}，t₁.OFL＝{f_1-1,f_1-2}；t₂.length＝138000MI，t₂.IFL＝{f_d1,f_d3}，t₂.OFL＝{f_2-1,f_2-2}；t₃.length＝132000MI，t₃.IFL＝{f_d1,f_d4}，t₃.OFL＝{f_3-1,f_3-2}；t₄.length＝102000MI，t₄.IFL＝{f_d1,f_1-1,f_1-2}，t₄.OFL＝{f_4-1,f_4-2}；……；t₁₅.length＝7800MI，t₁₅.IFL＝{f_14-1}，t₁₅.OFL＝{f_15-1}；f_d1.size＝36MB，f_d2.size＝4320MB，f_1-1.size＝3960MB，f_1-2.size＝3960MB，……，f_14-1.size＝1560MB，f_15-1.size＝420MB；

获取云计算环境下的虚拟机集：VM＝{vm₁,vm₂,vm₃,vm₄,vm₅,vm₆}；

获取虚拟机相关参数：vm₁.ps＝1000MI/s，vm₁.bw＝200Mbit/s；vm₂.ps＝1000MI/s，vm₂.bw＝200Mbit/s；vm₃.ps＝2000MI/s，vm₃.bw＝300Mbit/s；vm₄.ps＝2000MI/s，vm₄.bw＝300Mbit/s；vm₅.ps＝3000MI/s，vm₅.bw＝400Mbit/s；vm₆.ps＝3000MI/s，vm₆.bw＝400Mbit/s；

获取任务与虚拟机之间的支持关系：T₁＝{t₁,t₂,t₃,t₄,t₅,t₆,t₉,t₁₃,t₁₅}，T₂＝{t₃,t₅,t₇,t₉,t₁₀,t₁₁,t₁₄}，T₃＝{t₂,t₃,t₄,t₆,t₉,t₁₁,t₁₂}，T₄＝{t₁,t₂,t₄,t₆,t₇,t₈,t₉,t₁₀,t₁₁,t₁₂,t₁₄}，T₅＝{t₁,t₂,t₃,t₄,t₆,t₇,t₈,t₉,t₁₂,t₁₄}，T₆＝{t₁,t₄,t₅,t₈,t₁₁,t₁₃,t₁₄,t₁₅}；VM₁＝{vm₁,vm₄,vm₅,vm₆}，VM₂＝{vm₁,vm₃,vm₄,vm₅}，VM₃＝{vm₁,vm₂,vm₃,vm₅}，VM₄＝{vm₁,vm₃,vm₄,vm₅,vm₆}，VM₅＝{vm₁,vm₂,vm₆}，VM₆＝{vm₁,vm₃,vm₄,vm₅}，VM₇＝{vm₂,vm₄,vm₅}，VM₈＝{vm₄,vm₅,vm₆}，VM₉＝{vm₁,vm₂,vm₃,vm₄,vm₅}，VM₁₀＝{vm₂,vm₄}，VM₁₁＝{vm₂,vm₃,vm₄,vm₆}，VM₁₂＝{vm₃,vm₄,vm₅}，VM₁₃＝{vm₁,vm₆}，VM₁₄＝{vm₂,vm₄,vm₅,vm₆}，VM₁₅＝{vm₁,vm₆}。

执行步骤2：计算任务的排序值rank；

首先，计算t_i执行时的平均处理时间

同理可得

结果如表3所示：

表3

计算t_i执行时需要从共享数据库获得输入文件的平均传输时间

同理可得

结果如表4所示：

表4

计算

和t_i间的文件平均传输时间：

同理可得其它任务间的文件平均传输时间，结果如表5所示：

表5

计算t_i执行时需要从其它虚拟机获得输入文件的平均传输时间

同理可得

结果如表6所示：

表6

然后自下而上计算任务的排序值rank，其计算过程如下：

对于没有子任务的结束任务i：

其它任务的rank采用如下递归公式进行计算：

同理，可得rank₁₂，……，rank₁，结果如表7所示：

rank<sub>1</sub>	rank<sub>2</sub>	rank<sub>3</sub>	rank<sub>4</sub>	rank<sub>5</sub>	rank<sub>6</sub>	rank<sub>7</sub>	rank<sub>8</sub>
								4095.28	4114.79	4047.06	3371.56	3401.40	3383.72	3290.80	3287.52
rank<sub>9</sub>	rank<sub>10</sub>	rank<sub>11</sub>	rank<sub>12</sub>	rank<sub>13</sub>	rank<sub>14</sub>	rank<sub>15</sub>
								3011.03	3025.03	2998.03	2314.36	2302.63	69.55	5.20

表7

执行步骤3：计算任务的层次值；

任务1、任务2和任务3均没有父任务，则level₁＝level₂＝level₃＝1；

任务4只有一个父任务1，则

同理，可以获得其它任务的层次值：level₅＝level₆＝2；level₇＝3；level₈＝4；level₉＝level₁₀＝level₁₁＝5；level₁₂＝6；level₁₃＝7；level₁₄＝8；level₁₅＝9。

执行步骤4：基于动态关键任务优先调度的启发式方法生成第一阶段的任务调度方案；

取阈值ξ＝150；

执行步骤A1：系统状态初始化：令虚拟机可得时间段列表：vatl′₁＝{[0,M]}，vatl′₂＝{[0,M]}，…，vatl′₆＝{[0,M]}，其中M为一个接近无穷大的数；令所有任务的就绪时间rt′₁＝0，rt′₂＝0，…，rt′₁₅＝0，

P(t₄)＝{t₁}，P(t₅)＝{t₁,t₂}，P(t₆)＝{t₁,t₃}，P(t₇)＝{t₄,t₅,t₆}，P(t₈)＝{t₇}，P(t₉)＝{t₁,t₈}，P(t₁₀)＝{t₂,t₈}，P(t₁₁)＝{t₃,t₈}，P(t₁₂)＝{t₉,t₁₀,t₁₁}，P(t₁₃)＝{t₁₂}，P(t₁₄)＝{t₁₃}，P(t₁₅)＝{t₁₄}；k＝1；

UT＝T＝{t₁,t₂,t₃,t₄,t₅,t₆,t₇,t₈,t₉,t₁₀,t₁₁,t₁₂,t₁₃,t₁₄,t₁₅}；把UT中

的t₁，t₂，t₃移到RT中，则RT＝{t₁,t₂,t₃}，UT＝{t₄,t₅,t₆,t₇,t₈,t₉,t₁₀,t₁₁,t₁₂,t₁₃,t₁₄,t₁₅}；

执行步骤A2：在任务集RT＝{t₁,t₂,t₃}中，

pr₂＝4114.79，pr₃＝4047.06，由于pr₂最大，因此取出t₂，则RT＝{t₁,t₃}；由于t₂的就绪时间rt′₂＝0<ξ＝150，则转到步骤A3；

执行步骤A3：令AVM₂＝VM₂＝{vm₁,vm₃,vm₄,vm₅}，计算把t₂分别分配给AVM₂中的每个虚拟机后t₂的完成时间；即：执行步骤A3.1：从AVM₂中取出一个虚拟机，其为vm₁，则AVM₂＝{vm₃,vm₄,vm₅}；执行步骤A3.2：计算t₂分配给vm₁处理后的执行时间

执行步骤A3.3：在vatl′₁中从早到晚找出一个空闲时段[0,M]，满足M-0≥312.24和M-312.24≥0；执行步骤A3.4：计算t₂分配给vm₁处理后的开始时间s_2,1＝max{ν₁,rt′₂}＝max{0,0}＝0，完成时间f_2,1＝s_2,1+et_2,1＝312.24；执行步骤A3.5：由于AVM₂＝{vm₃,vm₄,vm₅}不为空，则转到步骤A3.1；……，这样重复执行步骤A3.1至步骤A3.5，直到AVM₂为空，得到s_2,3＝0，s_2,4＝0，s_2,5＝0，f_2,3＝185.16，f_2,4＝185.16，f_2,5＝133.12，则转到步骤A4；

执行步骤A4：由于s_2,1<ξ＝150，s_2,3<ξ＝150，s_2,4<ξ＝150，s_2,5<ξ＝150，因此在vm₁,vm₃,vm₄,vm₅中按顺序找出能最早完成t₂的虚拟机，其为vm₅，转到步骤A5；

执行步骤A5：把t₂分配给vm₅；即：执行步骤A5.1：令ST＝ST∪t₂＝{t₂}，g′_I+k＝g′₁₆＝2，g′₂＝5，k＝1+1＝2；t₂的开始时间s₂＝s_2,5＝0，t₂的完成时间f₂＝f_2,5＝133.12；执行步骤A5.2：在虚拟机可得时间段列表vatl′₅中删除[0,M]，由于[0,0]的区间长度为0，而[133.12,M]的区间长度大于0，因此插入[133.12,M]，则vatl′₅＝{[133.12,M]}；执行步骤A5.3：更新t₂的子任务的就绪时间：rt′₅＝max{rt′₅,f₂}＝max{0,133.12}＝133.12，rt′₁₀＝max{rt′₁₀,f₂}＝max{0,133.12}＝133.12；

执行步骤A6：在P(t₅)、P(t₁₀)中删除t₂，则P(t₅)＝{t₁}、P(t₁₀)＝{t₈}；由于UT中没有

的任务，则RT，UT均不变；

执行步骤A7：由于RT＝{t₁,t₃}不为空，则转到步骤A2；

执行步骤A2：在任务集RT＝{t₁,t₃}中，pr₁＝4095.28，pr₃＝4047.06，由于pr₁最大，因此取出t₁，则RT＝{t₃}；由于t₁的就绪时间rt′₁＝0<ξ＝150，则转到步骤A3；

执行步骤A3：令AVM₁＝VM₁＝{vm₁,vm₄,vm₅,vm₆}，计算把t₁分别分配给AVM₁中的每个虚拟机后t₁的完成时间；即：执行步骤A3.1：从AVM₁中取出一个虚拟机，其为vm₁；执行步骤A3.2：计算t₁分配给vm₁处理后的执行时间

执行步骤A3.3：在vatl₁′中从早到晚找出一个空闲时段[0,M]，满足M-0≥300.24和M-300.24≥0；执行步骤A3.4：计算t₁分配给vm₁处理后的开始时间s_1,1＝max{ν₁,rt₁′}＝max{0,0}＝0，完成时间f_1,1＝s_1,1+et_1,1＝0+300.24＝300.24；执行步骤A3.5：由于AVM₁＝{vm₄,vm₅,vm₆}不为空则转到步骤A3.1；……，这样重复执行步骤A3.1至A3.5，直到AVM₁为空，得到s_1,4＝0，s_1,5＝133.12，s_1,6＝0，f_1,4＝179.16，f_1,5＝262.24，f_1,6＝129.12，则转到步骤A4；

执行步骤A4：由于s_1,1<ξ＝150，s_1,4<ξ＝150，s_1,5<ξ＝150，s_1,6<ξ＝150，因此在vm₁,vm₄,vm₅,vm₆中按顺序找出能最早完成t₁的虚拟机，其为vm₆，转到步骤A5；

执行步骤A5：把t₁分配给vm₆；即：执行步骤A5.1：令ST＝ST∪t₁＝{t₁,t₂}，g′_I+k＝g′₁₇＝1，g′₁＝6，k＝2+1＝3；t₁的开始时间s₁＝s_1,6＝0，t₁的完成时间f₁＝f_1,6＝129.12；执行步骤A5.2：在虚拟机可得时间段列表vatl′₆中删除[0,M]，插入区间长度大于0的[129.12,M]，则vatl′₆＝{[129.12,M]}；执行步骤A5.3：更新t₁的子任务的就绪时间：rt′₄＝max{rt′₄,f₁}＝max{0,129.12}＝129.12，rt′₅＝max{rt′₅,f₁}＝max{133.12,129.12}＝133.12，rt′₆＝max{rt′₆,f₁}＝max{0,129.12}＝129.12，rt′₉＝max{rt′₉,f₁}＝max{0,129.12}＝129.12；

执行步骤A6：在P(t₄)、P(t₅)、P(t₆)、P(t₉)中删除t₁，则

P(t₆)＝{t₃}、P(t₉)＝{t₈}，把UT中

的t₄、t₅移到RT中，则UT＝{t₆,t₇,t₈,t₉,t₁₀,t₁₁,t₁₂,t₁₃,t₁₄,t₁₅}，RT＝{t₃,t₄,t₅}；

执行步骤A7：由于RT＝{t₃,t₄,t₅}不为空，则转到步骤A2；

执行步骤A2：在任务集RT＝{t₃,t₄,t₅}中，pr₃＝4047.06，

由于pr₃最大，因此取出t₃，则RT＝{t₄,t₅}；由于t₃的就绪时间rt′₃＝0<ξ＝150，则转到步骤A3；

执行步骤A3：令AVM₃＝VM₃＝{vm₁,vm₂,vm₃,vm₅}，计算把t₃分别分配给AVM₃中的每个虚拟机后t₃的完成时间；即：执行步骤A3.1：从AVM₃中取出一个虚拟机，其为vm₁；执行步骤A3.2：计算t₃分配给vm₁处理后的执行时间

执行步骤A3.3：在vatl′₁中从早到晚找出一个空闲时段[0,M]，满足M-0≥306.24和M-306.24≥0；执行步骤A3.4：计算t₃分配给vm₁处理后的开始时间s_3,1＝max{ν₁,rt′₃}＝max{0,0}＝0，完成时间f_3,1＝s_3,1+et_3,1＝0+306.24＝306.24；执行步骤A3.5：由于AVM₃＝{vm₂,vm₃,vm₅}不为空，则转到步骤A3.1；……，这样重复执行步骤A3.1至A3.5，直到AVM₁为空，得到s_3,2＝0，s_3,3＝0，s_3,5＝133.12，f_3,2＝306.24，f_3,3＝182.16，f_3,5＝264.24，则转到步骤A4；

执行步骤A4：由于s_3,1<ξ＝150，s_3,2<ξ＝150，s_3,3<ξ＝150，s_3,5<ξ＝150，因此在vm₁,vm₂,vm₃,vm₅中按顺序找出能最早完成t₃的虚拟机，其为vm₃，转到步骤A5；

执行步骤A5：把t₃分配给vm₃；即：执行步骤A5.1：令ST＝ST∪t₃＝{t₁,t₂,t₃}，g′_I+k＝g′₁₈＝3，g′₃＝3，k＝3+1＝4；t₃的开始时间s₃＝s_3,3＝0，t₃的完成时间f₃＝f_3,3＝182.16；执行步骤A5.2：在虚拟机可得时间段列表vatl′₃中删除[0,M]，插入区间长度大于0的[182.16,M]，则vatl′₃＝{[182.16,M]}；执行步骤A5.3：更新t₃的子任务的就绪时间：rt′₆＝max{rt′₆,f₃}＝max{129.12,182.16}＝182.16，rt′₁₁＝max{rt′₁₁,f₃}＝max{0,182.16}＝182.16；

执行步骤A6：在P(t₆)、P(t₁₁)中删除t₃，则

P(t₁₁)＝＝{t₈}；把UT中

的t₆移到RT中，则UT＝{t₇,t₈,t₉,t₁₀,t₁₁,t₁₂,t₁₃,t₁₄,t₁₅}，RT＝{t₄,t₅,t₆}；

执行步骤A7：由于RT＝{t₄,t₅,t₆}不为空，则转到步骤A2；

……

这样重复执行步骤A2至A7，直到RT为空，转到步骤A8；

执行步骤A8：完成第一阶段的调度，获得已调度的任务集ST＝{t₁,t₂.t₃,t₄,t₅}，已调度任务的虚拟机分配：g′₁＝6、g′₂＝5、g′₃＝3、g′₄＝5、g′₅＝6，完成时间：f₁＝129.12、f₂＝133.12，f₃＝182.16、f₄＝326.24、f₅＝333.04，已调度任务的调度顺序：g′₁₆＝2、g′₁₇＝1、g′₁₈＝3，g′₁₉＝5、g′₂₀＝4，及完成第一阶段任务调度后虚拟机的可得时间段列表：vatl′₁＝{[0,M]}，vatl′₂＝{[0,M]}，vatl′₃＝{[182.16,M]}，vatl′₄＝{[0,M]}，vatl′₅＝{[326.24,M]}，vatl′₆＝{[129.12,133.12],[333.04,M]}和各任务的就绪时间：rt′₁＝0，rt′₂＝0，rt′₃＝0，rt′₄＝129.12，rt′₅＝133.12，rt′₆＝182.16，rt′₇＝333.04，rt′₈＝0，rt′₉＝129.12，rt′₁₀＝133.12，rt′₁₁＝182.16，rt′₁₂＝0，rt′₁₃＝0，rt′₁₄＝0，rt′₁₅＝0；

执行步骤5：基于遗传算法获得第二阶段任务的调度方案；

执行步骤5.1：采用基于层次的个体随机生成方法生成N个不同的个体形成当代种群；

取种群规模N＝10；

基于层次的个体随机生成方法生成一个个体的具体实施过程如下：

执行步骤B1：UT＝T-ST＝{t₆,t₇,t₈,t₉,t₁₀,t₁₁,t₁₂,t₁₃,t₁₄,t₁₅}；令所有任务的就绪时间：rt″₁＝0，rt″₂＝0，rt″₃＝0，rt″₄＝129.12，rt″₅＝133.12，rt″₆＝182.16，rt″₇＝333.04，rt″₈＝0，rt″₉＝129.12，rt″₁₀＝133.12，rt″₁₁＝182.16，rt″₁₂＝0，rt″₁₃＝0，rt″₁₄＝0，rt″₁₅＝0；初始化虚拟机的可得时间段列表：vatl″₁＝vatl′₁＝{[0,M]}，vatl″₂＝vatl′₂＝{[0,M]}，vatl″₃＝vatl′₃＝{[182.16,M]}，vatl″₄＝vatl′₄＝{[0,M]}，vatl″₅＝vatl′₅＝{[326.24,M]}，vatl″₆＝vatl′₆＝{[129.12,133.12],[333.04,M]}，g₁＝g′₁＝6，g₂＝g′₂＝5，g₃＝g′₃＝3，g₄＝g′₄＝5，g₅＝g′₅＝6，g₁₆＝g′₁₆＝2，g₁₇＝g′₁₇＝1，g₁₈＝g′₁₈＝3，g₁₉＝g′₁₉＝5，g₂₀＝g′₂₀＝4；δ＝|ST|+1＝6；

执行步骤B2：从任务集UT＝{t₆,t₇,t₈,t₉,t₁₀,t₁₁,t₁₂,t₁₃,t₁₄,t₁₅}中随机取出一个层次值最小的任务，其为t₆；

执行步骤B3：从VM₆＝{vm₁,vm₃,vm₄,vm₅}中随机选择一个虚拟机，其为vm₁，把t₆分配给vm₁；即：执行步骤B3.1：令g_I+6＝g₂₁＝6，g₆＝1，δ＝δ+1＝6+1＝7；执行步骤B3.2：计算t₆分配给vm₁处理后的执行时间

执行步骤B3.3：在vatl″₁中从早到晚找出一个空闲时段[0,M]，满足M-0≥et₆＝739.44和M-739.44≥rt″₆＝182.16；执行步骤B3.4：计算t₆分配给vm₁处理后的开始时间s₆＝max{ν₁,rt″₆}＝max{0,182.16}＝182.16，完成时间f₆＝s₆+et₆＝921.60；执行步骤B3.5：在虚拟机可得时间段列表vatl″₁中删除[0,M]，插入区间长度不为0的[0,182.16]和[921.60,M]，则vatl″₁＝{[0,182.16],[921.60,M]}；执行步骤B3.6：更新t₆的子任务的就绪时间rt″₇＝max{rt″₇,f₆}＝max{333.04,921.60}＝921.60；

执行步骤B4：由于任务集UT＝{t₇,t₈,t₉,t₁₀,t₁₁,t₁₂,t₁₃,t₁₄,t₁₅}不为空，转到步骤B2；

执行步骤B2：从任务集UT＝{t₇,t₈,t₉,t₁₀,t₁₁,t₁₂,t₁₃,t₁₄,t₁₅}中随机取出一个层次值最小的任务，其为t₇；

执行步骤B3：从VM₇＝{vm₂,vm₄,vm₅}中随机选择一个虚拟机，其为vm₄，把t₇分配给vm₄；即：执行步骤B3.1：令g_I+7＝g₂₂＝7，g₇＝4，δ＝δ+1＝7+1＝8；执行步骤B3.2：计算t₇分配给vm₄处理后的执行时间

执行步骤B3.3：在vatl″₄中从早到晚找出一个空闲时段[0,M]，满足M-0≥26.96和M-26.96≥921.60；执行步骤B3.4：计算t₇分配给vm₄处理后的开始时间s₇＝max{ν₄,rt″₇}＝max{0,921.60}＝921.60，完成时间f₇＝s₇+et₇＝921.60+26.96＝948.56；执行步骤B3.5：在虚拟机可得时间段列表vatl″₄中删除[0,M]，插入区间长度不为0的[0,921.60]和[948.56,M]，则vatl″₄＝{[0,921.60],[948.56,M]}；执行步骤B3.6：更新t₇的子任务的就绪时间rt″₈＝max{rt″₈,f₇}＝max{0,948.56}＝948.56；

执行步骤B4：由于任务集UT＝{t₈,t₉,t₁₀,t₁₁,t₁₂,t₁₃,t₁₄,t₁₅}不为空，转到步骤B2；

……

这样不断重复执行步骤B2至步骤B4，直至UT为空集，转到步骤B5；

执行步骤B5：输出一个个体ch₁＝{6,5,3,5,6,1,4,5,4,2,2,3,1,5,6；2,1,3,5,4,6,7,8,9,11,10,12,13,14,15}，计算适应度值即工作流的响应时间rs₁，由于

而SFL₁₅＝{f_15-1}，故

操作结束；

同理，基于层次的个体随机生成方法生成种群中的剩余个体如下：

ch₂＝{6,5,3,5,6,3,2,5,4,4,4,3,6,6,1；2,1,3,5,4,6,7,8,11,9,10,12,13,14,15}；

ch₃＝{6,5,3,5,6,3,5,4,1,2,4,3,1,5,6；2,1,3,5,4,6,7,8,10,11,9,12,13,14,15}；

ch₄＝{6,5,3,5,6,3,4,4,4,4,4,4,6,2,6；2,1,3,5,4,6,7,8,11,9,10,12,13,14,15}；

ch₅＝{6,5,3,5,6,4,5,5,1,2,4,3,1,4,1；2,1,3,5,4,6,7,8,9,11,10,12,13,14,15}；

ch₆＝{6,5,3,5,6,3,4,4,3,2,6,4,6,2,1；2,1,3,5,4,6,7,8,11,9,10,12,13,14,15}；

ch₇＝{6,5,3,5,6,3,5,4,4,2,6,5,1,2,1；2,1,3,5,4,6,7,8,10,9,11,12,13,14,15}；

ch₈＝{6,5,3,5,6,4,5,5,2,4,4,5,6,6,6；2,1,3,5,4,6,7,8,9,11,10,12,13,14,15}；

ch₉＝{6,5,3,5,6,3,2,5,1,2,6,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch₁₀＝{6,5,3,5,6,5,2,5,2,2,4,5,6,6,1；2,1,3,5,4,6,7,8,10,11,9,12,13,14,15}；

其适应度值即工作流响应时间分别为：rs₂＝2030.52，rs₃＝4703.88，rs₄＝4286.80，rs₅＝4955.56，rs₆＝4669.56，rs₇＝4619.96，rs₈＝1955.12，rs₉＝1826.00，rs₁₀＝2584.20；

这样最终生成的初始当代种群为CP＝{ch₁,ch₂,ch₃,ch₄,ch₅,ch₆,ch₇,ch₈,ch₉,ch₁₀}。

执行步骤5.2：对当代种群进行N次基于偏好的参数化均匀交叉操作生成新种群，对新种群中的每个个体采用单点变异操作；

对当代种群进行基于偏好的参数化均匀交叉操作的具体实施过程如下：

取偏好概率p_b＝0.7；

执行步骤C1：采用锦标赛法从当代种群中随机选择两个不同的个体作为父体；即：从当代种群中随机选择两个不同个体，其为ch₉和ch₈，由于rs₉＝1826.00<rs₈＝1955.12，因此选择ch₉作为其中的一个父体；再从当代种群中随机选择两个不同个体，其为ch₁和ch₁₀，由于rs₁＝5607.40>rs₁₀＝2584.20，因此选择ch₁₀作为其中的另一个父体；又由于ch₉的适应度值小于ch₁₀的适应度值，故ch^p1＝ch₉＝{6,5,3,5,6,3,2,5,1,2,6,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}，ch^p2＝ch₁₀＝{6,5,3,5,6,5,2,5,2,2,4,5,6,6,1；2,1,3,5,4,6,7,8,10,11,9,12,13,14,15}；令δ＝1，

执行步骤C2：由于δ＝1≤I+|ST|＝20，则转到步骤C3；

执行步骤C3：生成一个随机数λ∈[0,1)，其为0.20，由于λ＝0.2<p_b＝0.7，那么从ch^p1中取出首元素放到ch^c的尾部，则ch^c＝{6}，ch^p1＝{5,3,5,6,3,2,5,1,2,6,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}，并从ch^p2中删除首元素，则ch^p2＝{5,3,5,6,5,2,5,2,2,4,5,6,6,1；2,1,3,5,4,6,7,8,10,11,9,12,13,14,15}；δ＝1+1＝2，转到步骤C2；

执行步骤C2：由于δ＝2≤I+|ST|＝20，则转到步骤C3；

执行步骤C3：生成一个随机数λ∈[0,1)，其为0.93，由于λ＝0.93>p_b＝0.7，那么从ch^p2中取出首元素放到ch^c的尾部，则ch^c＝{6,5}，ch^p2＝{3,5,6,5,2,5,2,2,4,5,6,6,1；2,1,3,5,4,6,7,8,10,11,9,12,13,14,15}，并从ch^p1中删除首元素，则ch^p1＝{3,5,6,3,2,5,1,2,6,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；δ＝2+1＝2，转到步骤C2；

……

这样不断重复执行步骤C2和步骤C3，直至δ＝21>I+|ST|＝20，此时ch^c＝{6,5,3,5,6,3,2,5,2,2,4,5,6,6,1；2,1,3,5,4}，ch^p1＝{6,7,8,9,10,11,12,13,14,15}，ch^p2＝{6,7,8,10,11,9,12,13,14,15}，转到步骤C2；

执行步骤C2：由于I+|ST|＝20<δ＝21≤2I＝30，则转到步骤C4；

执行步骤C4：生成一个随机数λ∈[0,1)，其为0.92，由于λ＝0.92>p_b＝0.7，那么从ch^p2中取出首元素放到ch^c的尾部，则ch^c＝{6,5,3,5,6,3,2,5,2,2,4,5,6,6,1；2,1,3,5,4,6}，ch^p2＝{7,8,10,11,9,12,13,14,15}，并从ch^p1中删除该元素，则ch^p1＝{7,8,9,10,11,12,13,14,15}；δ＝21+1＝22，转到步骤C2；

执行步骤C2：由于I+|ST|＝20<δ＝22≤2I＝30，则转到步骤C4；

执行步骤C4：生成一个随机数λ∈[0,1)，其为0.62，由于λ＝0.62<p_b＝0.7，那么从ch^p1中取出首元素放到ch^c的尾部，则ch^c＝{6,5,3,5,6,3,2,5,2,2,4,5,6,6,1；2,1,3,5,4,6,7}，ch^p1＝{8,9,10,11,12,13,14,15}，并从ch^p2中删除该元素，则ch^p2＝{8,10,11,9,12,13,14,15}；δ＝22+1＝23，转到步骤C2；

……

这样不断重复执行步骤C2和步骤C4，直至δ＝31>2I＝30，此时ch^c＝{6,5,3,5,6,3,2,5,2,2,4,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}，转到步骤C2；

执行步骤C2：由于δ＝31>2I＝30，则转到步骤C5；

执行步骤C5：输出子体ch′₁＝ch^c＝{6,5,3,5,6,3,2,5,2,2,4,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}，操作结束；

同理，经基于偏好的参数均匀交叉操作生成新种群中剩余的9个个体如下：

ch′₂＝{6,5,3,5,6,4,4,5,4,4,4,5,6,6,6；2,1,3,5,4,6,7,8,11,9,10,12,13,14,15}；

ch′₃＝{6,5,3,5,6,4,5,5,2,4,6,5,6,6,6；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch′₄＝{6,5,3,5,6,3,2,5,1,2,4,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch′₅＝{6,5,3,5,6,3,2,5,4,4,4,3,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch′₆＝{6,5,3,5,6,3,5,4,4,2,6,5,1,2,1；2,1,3,5,4,6,7,8,10,9,11,12,13,14,15}；

ch′₇＝{6,5,3,5,6,3,2,5,1,2,6,5,6,6,6；2,1,3,5,4,6,7,8,9,11,10,12,13,14,15}；

ch′₈＝{6,5,3,5,6,3,5,5,4,4,6,3,6,2,1；2,1,3,5,4,6,7,8,11,9,10,12,13,14,15}；

ch′₉＝{6,5,3,5,6,3,2,5,1,4,4,5,6,6,1；2,1,3,5,4,6,7,8,9,11,10,12,13,14,15}；

ch′₁₀＝{6,5,3,5,6,3,2,4,4,4,4,3,6,6,1；2,1,3,5,4,6,7,8,10,11,9,12,13,14,15}；

对新种群进行单点变异操作的具体实施过程如下：

取变异率p_m＝0.2；

对于ch′₁＝{6,5,3,5,6,3,2,5,2,2,4,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

执行步骤D1：产生一个随机数λ₁∈[0,1)，其为0.68，λ₁＝0.68>p_m＝0.2，则转步骤D5；

执行步骤D5：变异操作结束；

对于ch′₂＝{6,5,3,5,6,4,4,5,4,4,4,5,6,6,6；2,1,3,5,4,6,7,8,11,9,10,12,13,14,15}；

执行步骤D1：产生一个随机数λ₁∈[0,1)，其为0.15，λ₁＝0.15<p_m＝0.2，则转步骤D2；

执行步骤D2：产生一个随机数λ₂∈[0,1)，其为0.27，λ₂＝0.27<0.5，则从i≤I＝15且

中随机选择一个基因，其为g₁₁，转到步骤D3；

执行步骤D3：从可以处理任务11的虚拟机集VM₁₁＝{vm₂,vm₃,vm₄,vm₆}中重新随机选择一个虚拟机，其为vm₂，则g₁₁＝2，转到步骤D5；

执行步骤D5：变异操作结束；

ch′₂变为{6,5,3,5,6,4,4,5,4,4,2,5,6,6,6；2,1,3,5,4,6,7,8,11,9,10,12,13,14,15}；

……

对于ch′₉＝{6,5,3,5,6,3,2,5,1,4,4,5,6,6,1；2,1,3,5,4,6,7,8,9,11,10,12,13,14,15}；

执行步骤D1：产生一个随机数λ₁∈[0,1)，其为0.12，λ₁＝0.12<p_m＝0.2，则转步骤D2；

执行步骤D2：产生一个随机数λ₂∈[0,1)，其为0.74，λ₂＝0.74>0.5，则从i>I+|ST|＝20中随机选择一个基因g_i，其为g₂₅＝11，转到步骤D4；

执行步骤D4：在T-ST＝{t₆,t₇,t₈,t₉,t₁₀,t₁₁,t₁₂,t₁₃,t₁₄,t₁₅}中存在任务11的父任务，那么从g₂₅开始向前找到任务11的第一个父任务g₂₃＝8，pos₁＝i′+1＝23+1＝24；在T-ST中存在任务g₂₅的子任务，从g₂₅开始向后找到任务11的第一个子任务g₂₇＝12，pos₂＝i″-1＝27-1＝26，在[24,26]之间重新随机选择一个位置插入任务11，则g₂₆＝11；

执行步骤D5：变异操作结束；

ch′₉变为ch′₉＝{6,5,3,5,6,3,2,5,1,4,4,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11，12,13,14,15}；

……

这样新种群中的个体经变异后变为：

ch′₁＝{6,5,3,5,6,3,2,5,2,2,4,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch′₂＝{6,5,3,5,6,4,4,5,4,4,2,5,6,6,6；2,1,3,5,4,6,7,8,11,9,10,12,13,14,15}；

ch′₉＝{6,5,3,5,6,3,2,5,1,4,4,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

执行步骤5.3：对新种群中的每个个体采用基于插入模式的串行个体解码和LDI方法改进；

对新种群中的所有个体采用基于插入模式的串行个体解码，例如对新种群中的ch′₁＝{6,5,3,5,6,3,2,5,2,2,4,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}为例进行基于插入模式的串行个体解码的过程如下：

执行步骤E1：令所有任务的就绪时间：rt″₁＝0，rt″₂＝0，rt″₃＝0，rt″₄＝129.12，rt″₅＝133.12，rt″₆＝182.16，rt″₇＝333.04，rt″₈＝0，rt″₉＝129.12，rt″₁₀＝133.12，rt″₁₁＝182.16，rt″₁₂＝0，rt″₁₃＝0，rt″₁₄＝0，rt″₁₅＝0；初始化所有虚拟机的可得时间段列表：vatl″₁＝vatl′₁＝{[0,M]}，vatl″₂＝vatl′₂＝{[0,M]}，vatl″₃＝vatl′₃＝{[182.16,M]}，vatl″₄＝vatl′₄＝{[0,M]}，vatl″₅＝vatl′₅＝{[326.24,M]}，vatl″₆＝vatl′₆＝{[129.12,133.12],[333.04,M]}；k＝|ST|+1＝6，

执行步骤E2：选取编号为g_I+k＝g₂₁的任务，其为g₂₁＝6；

执行步骤E3：基于插入模式把任务6分配给虚拟机g₆＝3；即：执行步骤E3.1：计算任务6的执行时间

执行步骤E3.2：在vatl″₃中从早到晚找出一个空闲时段[182.16,M]，满足M-182.16≥et₆＝269.16和M-269.16≥rt″₆＝182.16；执行步骤E3.3：计算t₆分配给vm₃处理后的开始时间s₆＝max{ν₃,rt″₆}＝max{182.16,182.16}＝182.16，完成时间f₆＝s₆+et₆＝182.16+269.16＝451.32，更新t₆子任务的就绪时间rt″₇＝max{rt″₇,f₆}＝max{333.04,451.32}＝451.32；执行步骤E3.4：在虚拟机可得时间段列表vatl″₃＝{[182.16,M]}中删除[182.16,M]，插入区间长度大于0的[451.32,M]，则vatl″₃＝{[451.32,M]}；

执行步骤E4：k＝6+1＝7，由于k＝7≤I＝15，则转到步骤E2；

执行步骤E2：选取编号为g_I+k＝g₂₂的任务，其为g₂₂＝7；

执行步骤E3：基于插入模式把任务7分配给虚拟机g₇＝2；即：执行步骤E3.1：计算任务7的执行时间

执行步骤E3.2：在vatl″₂中从早到晚找出一个空闲时段[0,M]满足M-0≥36.96和M-36.96≥451.32；执行步骤E3.3：计算t₇分配给vm₂处理后的开始时间s₇＝max{ν₂,rt″₇}＝max{0,451.32}＝451.32，完成时间f₇＝s₇+et₇＝451.32+36.96＝488.28，更新t₇子任务的就绪时间rt″₈＝max{rt″₈,f₇}＝max{0,488.28}＝488.28；执行步骤E3.4：在虚拟机可得时间段列表vatl″₂中删除[0,M]，插入区间长度大于0的[0,451.32]和[488.28,M]，则vatl″₂＝{[0,451.32],[488.28,M]}；

执行步骤E4：k＝7+1＝8，由于k＝8≤I＝15，则转到步骤E2；

……

这样不断重复执行步骤E2至步骤E4，直至k＝16>I＝15，获得所有任务的开始时间和完成时间，则转到步骤E5；

执行步骤E5：获得所有任务的开始时间和完成时间：s₁＝0，s₂＝0，s₃＝0，s₄＝133.12，s₅＝133.12，s₆＝182.16，s₇＝451.32，s₈＝488.28，s₉＝493.64，s₁₀＝925.40，s₁₁＝493.64，s₁₂＝1372.76，s₁₃＝2201.72，s₁₄＝2210.36，s₁₅＝2220.36；f₁＝129.12，f₂＝133.12，f₃＝182.16，f₄＝326.24，f₅＝333.04，f₆＝451.32，f₇＝488.28，f₈＝493.64，f₉＝925.40，f₁₀＝1372.76，f₁₁＝753.08，f₁₂＝2201.72，f₁₃＝2210.36，f₁₄＝2220.36，f₁₅＝2290.56，计算适应度值即工作流响应时间rs₁′：由于

而SFL₁₅＝{f_15-1}，故

操作结束；

同理，新种群中的其它个体经基于插入模式的串行个体解码后可获得其工作流响应时间为：rs′₂＝1976.36，rs′₃＝1799.60，rs′₄＝1875.60，rs′₅＝2030.52，rs′₆＝4619.96，rs′₇＝1750.00，rs′₈＝4643.48，rs′₉＝1853.92，rs′₁₀＝2029.92；

对种群中的所有个体采用LDI方法改进，例如对新种群中的ch′₄＝{6,5,3,5,6,3,2,5,1,2,4,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}采用LDI方法进行改进的具体实施过程如下：

执行步骤F1：计算各虚拟机负载：

同理，ld₂＝122.40，ld₃＝123.00，ld₄＝54，ld₅＝87.6，ld₆＝94.00；

执行步骤F2：找出负载最小的虚拟机，其为vm₄，由于ld₄>0，故转到步骤F3；

执行步骤F3：

转到步骤F5；

执行步骤F5：由于DT₄＝{t₈,t₁₂}不为空，则从DT₄中按顺序取出一个其所在虚拟机负载是最高的任务，其为t₈，则DT₄＝{t₁₂}，转到步骤F6；

执行步骤F6：令g₈＝4，形成新的个体

采用基于插入模式的串行个体解码方法对

进行解码，工作流响应时间

即改进的个体

相对于原个体ch′₄没有改进，放弃改进的个体

转到步骤F5；

执行步骤F5：由于DT₄＝{t₁₂}不为空，则从DT₄中按顺序取出一个其所在虚拟机负载是最高的任务，其为t₁₂，转到步骤F6；

执行步骤F6：令g₁₂＝4，形成新的个体

采用基于插入模式的串行个体解码方法对

进行解码，工作流响应时间

即改进的个体

相对于原个体ch′₄有改进，因此用改进的个体

替换原个体ch′₄，则

转到步骤F7；

执行步骤F7：LDI操作结束；

同理，种群中的其它个体经LDI方法改进后变为：

ch′₂＝{6,5,3,5,6,4,4,5,1,4,2,5,6,6,6；2,1,3,5,4,6,7,8,11,9,10,12,13,14,15}；

ch′₃＝{6,5,3,5,6,4,5,5,1,4,6,5,6,6,6；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch′₇＝{6,5,3,5,6,3,4,5,1,2,6,5,6,6,6；2,1,3,5,4,6,7,8,9,11,10,12,13,14,15}；

其适应度值即工作流响应时间：rs′₁＝2307.36，rs′₂＝1957.04，rs′₃＝1799.60，rs′₅＝2030.52，rs′₆＝4619.96，rs′₇＝1736.48，rs′₈＝4643.48，rs′₉＝1853.92，rs′₁₀＝2029.92；

这样最终生成的新种群为NP＝{ch′₁,ch′₂,ch′₃,ch′₄,ch′₅,ch′₆,ch′₇,ch′₈,ch′₉,ch′₁₀}。

执行步骤5.4：从当代种群和新种群中从优到劣选出N个不同的个体形成下一代种群；

根据适应度值，选择当代种群的ch₂、ch₈、ch₉和新种群的ch′₂、ch′₃、ch′₄、ch′₅、ch′₇、ch′₉、ch′₁₀形成下一代种群，即GP＝{ch₂,ch₈,ch₉,ch′₂,ch′₃,ch′₄,ch′₅,ch′₇,ch′₉,ch′₁₀}；

执行步骤5.5：令下一代种群为当代种群；判断是否满足进化终止条件，如满足，则转到步骤6，否则，转到步骤5.2；

令CP＝GP，则当代种群的所有个体为：

ch₁＝{6,5,3,5,6,3,2,5,4,4,4,3,6,6,1；2,1,3,5,4,6,7,8,11,9,10,12,13,14,15}；

ch₂＝{6,5,3,5,6,4,5,5,2,4,4,5,6,6,6；2,1,3,5,4,6,7,8,9,11,10,12,13,14,15}；

ch₃＝{6,5,3,5,6,3,2,5,1,2,6,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch₄＝{6,5,3,5,6,4,4,5,1,4,2,5,6,6,6；2,1,3,5,4,6,7,8,11,9,10,12,13,14,15}；

ch₅＝{6,5,3,5,6,4,5,5,1,4,6,5,6,6,6；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch₆＝{6,5,3,5,6,3,2,5,1,2,4,4,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch₇＝{6,5,3,5,6,3,2,5,4,4,4,3,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch₈＝{6,5,3,5,6,3,4,5,1,2,6,5,6,6,6；2,1,3,5,4,6,7,8,9,11,10,12,13,14,15}；

ch₉＝{6,5,3,5,6,3,2,5,1,4,4,5,6,6,1；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch₁₀＝{6,5,3,5,6,3,2,4,4,4,4,3,6,6,1；2,1,3,5,4,6,7,8,10,11,9,12,13,14,15}；

其适应度值即工作流响应时间分别为：rs₁＝2030.52,rs₂＝1955.12,rs₃＝1826.00，rs₄＝1957.04，rs₅＝1799.60，rs₆＝1680.96,rs₇＝2030.52，rs₈＝1736.48,rs₉＝1853.92，rs₁₀＝2029.92；

所述终止条件为运行到第一阶段与第二阶段的临界点ξ，即程序运行时间为ξ＝150，没有满足进化终止条件，转到步骤5.2；

……

这样不断重复执行步骤5.2至步骤5.5，直到程序运行时间为150，当代种群变为：

ch₁＝{6,5,3,5,6,3,5,4,3,4,3,3,6,6,6；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch₂＝{6,5,3,5,6,3,5,5,3,4,3,3,6,6,6；2,1,3,5,4,6,7,8,10,11,9,12,13,14,15}；

ch₃＝{6,5,3,5,6,3,2,5,3,4,3,3,6,6,6；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch₄＝{6,5,3,5,6,3,5,5,3,4,3,3,6,6,6；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch₅＝{6,5,3,5,6,3,4,4,3,4,3,3,6,6,6；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch₆＝{6,5,3,5,6,3,4,5,3,4,3,3,6,6,6；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch₇＝{6,5,3,5,6,3,2,4,3,4,3,3,6,6,6；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch₈＝{6,5,3,5,6,3,5,6,3,4,3,3,6,6,6；2,1,3,5,4,6,7,8,9,10,11,12,13,14,15}；

ch₉＝{6,5,3,5,6,3,5,6,3,4,3,3,6,6,6；2,1,3,5,4,6,7,8,10,11,9,12,13,14,15}；

ch₁₀＝{6,5,3,5,6,3,4,4,3,4,3,3,6,6,6；2,1,3,5,4,6,7,8,10,11,9,12,13,14,15}；

其适应度值即工作流响应时间分别为：rs₁＝1056.40,rs₂＝1053.48,rs₃＝1081.08，rs₄＝1053.48，rs₅＝1067.28，rs₆＝1067.56,rs₇＝1082.40，rs₈＝1054.68,rs₉＝1054.68，rs₁₀＝1067.28；

执行步骤6：输出当代种群中的最优个体，其对应的调度方案即为优化方案；

当代种群中的最优个体为ch₂＝{6,5,3,5,6,3,5,5,3,4,3,3,6,6,6；2,1,3,5,4,6,7,8,10,11,9,12,13,14,15}，其适应度值即工作流响应时间rs＝1053.48，其调度方案如表8所示。

表8

上述实施例只是本发明的较佳实施例，并不是对本发明技术方案的限制，只要是不经过创造性劳动即可在上述实施例的基础上实现的技术方案，均应视为落入本发明专利的权利保护范围内。

Claims

1.一种融合启发式和智能计算的云工作流分段在线调度优化方法，其特征在于：包括以下步骤：

步骤1：形式化调度问题，获取调度优化所需的信息；

步骤2：计算任务的排序值rank；

先计算t_i执行时的平均处理时间

需要从共享数据库获得输入文件的平均传输时间

需要从其它虚拟机获得输入文件的平均传输时间

t_i执行时的平均处理时间计算如下：

其中

为

和t_i间的文件平均传输时间，其计算如下：

然后自下而上计算任务的排序值rank，其计算过程如下：

对于没有子任务的结束任务i：

其它任务的排序值rank采用如下递归公式进行计算：

步骤3：计算任务的层次值；

对于没有父任务的开始任务i，其层次值为：

level_i＝1 (7)

其它任务的层次值采用如下递归公式进行计算：

UT＝T；把UT中

的t_i移到RT中；

步骤A2：从RT中取出优先级

最大的t_i；如果t_i的就绪时间rt′_i小于ξ，那么转到步骤A3，否则转到步骤A7；

步骤A3.1：从AVM_i中取出一个虚拟机，不妨设为vm_j；

步骤A3.2：计算t_i分配给vm_j处理后的执行时间

步骤A3.5：若AVM_i不为空，则转到步骤A3.1，否则转到步骤A4；

步骤A5：把t_i分配给vm_j：

步骤A5.3：更新t_i的子任务的就绪时间

步骤A6：在所有

中删除t_i；把UT中

的

移到RT中；

步骤A7：如果RT不为空，则转到步骤A2，否则转到步骤A8；

其中：

是处理

的虚拟机；

ω_i,j：是vm_j处理t_i的时间，

是处理

的虚拟机；

步骤5：基于遗传算法获得第二阶段任务的调度方案；

所述个体采用2I位整数编码，I为任务数量，其方法如下：ch＝{g₁,…,g_I,g_I+1,…,g_2I}，基因g_i是一个非负整数，其中，{g₁,…,g_I}是虚拟机分配列表，g_i表示给任务i分配的虚拟机编号，即把任务i分配给虚拟机g_i，g_i∈VM_i，i＝1,…,I；{g_I+1,…,g_2I}是任务调度顺序列表，是1,…,I的一个排列，且满足任务的时序约束，即任何任务都不能排在其父任务的前面，g_I+i表示第i个被调度的任务的编号，即任务g_I+i是第i个被调度的；由于t_i∈ST在第一阶段已调度，因此对于任何一个个体始终有：