CN102591712B - 一种云计算中依赖任务的解耦并行调度方法 - Google Patents

一种云计算中依赖任务的解耦并行调度方法 Download PDF

Info

Publication number
CN102591712B
CN102591712B CN2011104541949A CN201110454194A CN102591712B CN 102591712 B CN102591712 B CN 102591712B CN 2011104541949 A CN2011104541949 A CN 2011104541949A CN 201110454194 A CN201110454194 A CN 201110454194A CN 102591712 B CN102591712 B CN 102591712B
Authority
CN
China
Prior art keywords
task
tasks
node
scheduling
dependence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2011104541949A
Other languages
English (en)
Other versions
CN102591712A (zh
Inventor
王占杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN2011104541949A priority Critical patent/CN102591712B/zh
Publication of CN102591712A publication Critical patent/CN102591712A/zh
Application granted granted Critical
Publication of CN102591712B publication Critical patent/CN102591712B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Multi Processors (AREA)

Abstract

本发明属于云计算应用领域,涉及到云服务中任务依赖关系描述、解耦合和并行调度等方法。本发明提出了依赖任务关系,并构建了依赖任务的解耦并行调度方法。该方法首先以入度为零对任务依赖关系进行解耦来构建就绪任务的集合,动态描述某个时刻可并行调度的任务。然后根据实时资源评价,对就绪任务的集合进行分布式多目标调度,有效地提高调度并行性。在任务分配时还考虑任务执行和任务间通信开销(E/C),来决定是否用任务复制来代替其依赖数据传输,以减少通信开销。整个调度方法可以对就绪任务集合中多个任务进行动态并行调度,较好地兼顾实时性和并行性、通信开销和负载均衡等性能指标,通过动态调度策略有效地提高系统的整体性能。

Description

一种云计算中依赖任务的解耦并行调度方法
技术领域
本发明属于云计算应用领域,涉及到云服务中任务依赖关系描述、解耦合和并行调度等方法。
背景技术
分布式计算技术已成为当前信息技术的主流,如移动计算和云计算等。云环境下的大型应用服务往往被分解成多个任务来调度和执行,并且分解后的若干任务之间往往存在着一定的约束和依赖关系,即具有较强的耦合性。任务间依赖关系的存在对任务调度提出了新的挑战。当前,分布式环境中的任务调度研究往往只是考虑任务间没有相互依赖关系即独立任务的简单情况,虽然一定程度上解决了系统资源异构性和可用性问题,但不适用于具有依赖关系的任务调度。而对于依赖任务调度问题的研究大多是基于某个特定环境或对称同构系统。在云计算中,由于资源的异构性和分布性使得资源之间不仅处理能力存在巨大差异,而且资源之间的网络连接状况也千差万别,因此云环境中的依赖任务调度问题所要考虑的因素远比同构系统要多,其调度算法也要远比同构系统复杂。虽然目前已有相当数量的异构系统依赖任务调度算法,但它们大多数是对同构系统算法的改进,通常以依赖关系构建依次调度任务队列,实现单一性能指标为目标的静态调度,难以根据系统资源的实时信息进行动态调度;忽略了依赖任务调度的并行性,即不能有效解决耦合问题,使得系统资源不能得到充分利用,降低了系统利用率;没有考虑通信开销代价和任务执行开销间的关系,使得系统资源存在部分空闲[①Cathy H.Xia,George Michailidis,Nicholas Bambos.Dynamic on-line task scheduling on parallel processors.Performance Evaluation Vol.46,2001,219-233.②Tei-Wei Kuo,Wang-Ru Yangand Kwei-Jay Lin.A class of rate-based real-time scheduling algorithms.IEEE Transaction on computers,Vol 51,No.6,June 2002,708-720.③何琨,赵勇,陈阳.分布式环境下多任务调度问题的分析与求解[J].系统工程理论与实践.2007,5:119-125.④石威,郑纬民.相关任务图的均衡动态关键路径调度算法[J].计算机学报.2001,24(9):991-997.⑤桂小林,钱德沛.元计算环境下的支持依赖任务的OGS算法研究[J].计算机学报.2002,25(6):582-586.⑥Topcuoglu H,Wu M Y.Performance-effective and low-complexity taskscheduling for heterogeneous computing.IEEE Transactions on Paralleland Distributed Systems.2002,13(3):260-274.]。因此在云计算中,如何提高强耦合的依赖任务调度的并行性、实时性和动态性,以及为提高系统利用率,对有依赖关系的任务请求进行合理的调度与部署,成为当前云计算要解决的热点问题之一。
发明内容
本发明解决的技术问题是根据云计算的异构性特征,提出了依赖任务关系描述图,并构建了依赖任务的解耦并行调度方法。该方法首先以入度为零对任务依赖关系进行解耦来构建就绪任务的集合,动态描述某个时刻可并行调度的任务。然后根据实时资源评价,对就绪任务的集合进行分布式多目标调度,有效地提高调度并行性。除了对资源评价外,在任务分配时还考虑任务执行和任务间通信开销(E/C),来决定是否用任务复制来代替其依赖数据传输,以减少通信开销。整个调度方法可以对就绪任务集合中多个任务进行动态并行调度,较好地兼顾实时性和并行性、通信开销和负载均衡等性能指标,通过动态调度策略有效地提高系统的整体性能。
本发明的技术方案如下:
(1)任务依赖关系的描述:通常用节点表示组成一个应用服务的各个任务、有向边表示任务间的依赖关系,用计算时间和通信时间作为任务属性。而在异构环境下,同一任务在不同处理机上执行时间不同,这种关系图不能很好地适应异构计算和云计算。根据云计算异构性的特点,本发明提出包括计算量、依赖数据传输量和存储资源需求量的依赖任务关系描述图,解决了异构环境下同一任务在不同节点上执行时间不同的时域动态性问题。该任务关系描述图具有图论中有向无环图(DirectedAcyclic Graph,DAG)的特征。
任务之间的依赖关系用一个五元组G=(T,E,W,A,D)来表示,其中包含了任务之间的关系及对系统存储资源的需求,本发明要求任务的存储资源需求量不可超过节点的最大可利用存储空间值。
图中元素代表的含义如下:T为应用服务的n个任务组成的集合T={T1,T2,......,Tn}。E是边的集合E=(eij|0<i,j≤n;i≠j)。应用服务中的任务的依赖关系定义为:如果Tj必须在Ti执行完毕后才能运行,则从Ti到Tj就存在一条有向边eij,并且Ti是Tj的前驱任务,Tj是Ti的后继任务。W为任务的计算量集合,W={Wi|0<i≤n}。A为任务的最低存储资源需求的集合A={Ai|0<i≤n},Ai为Ti的最低存储需求Ai={Rmem,Rstor},其中Rmem为内存空间需求量,Rstor为存储空间需求量。D为任务之间的依赖数据传输量矩阵,dij表示前驱任务Ti与后继任务Tj之间的数据传输量。
(2)解耦合方法:
本发明中的解耦合方法的核心是入度值为零,即任务可被调度的必要条件是在依赖关系图中某节点的入度值为零,也就是说其前驱任务均已执行完毕。
对任务依赖关系图根据图中节点入度值为零的条件来解耦合,并且建立一个就绪任务集合ReadyTaskSet={Ti|0<i≤n},来动态描述某个时刻可并行调度的任务。本发明的就绪集合定义为:某个时刻没有前驱任务或直接前驱任务都已经完成的任务组成的集体,即入度值为零。集合中的任务,其优先级是相同的,不分先后,任一成员只要所需的存储资源满足,即可被调度。初始时就绪任务集合中的元素都是入度值为0的任务,当集合中的某个任务执行完毕并把依赖数据传递给其后继任务后,就从就绪任务集合中删除该任务,并且隐藏(或逻辑删除)依赖关系图该任务节点和从该任务节点发出的所有有向边。然后从新的可见的(即不含隐藏的边和任务节点)图中选择所有入度为0的任务加入就绪任务集合,直至全部任务调度完毕(或任务依赖关系图完全不可见)。
本发明中以入度值为零解耦合,当任务依赖关系图中任务的入度值为零时就把该任务加入就绪任务集合,这样就可以描述某个时刻可被并行调度的多个任务。当前大多数静态调度策略是基于队列结构,某个任务必须在等待队列中其前面的任务都执行完毕且返回结果后才能被调度。即使两个任务之间没有依赖关系也必须等待,这样就会引起系统资源的浪费,降低了资源利用率。本设计根据任务依赖关系图动态生成入度为零的就绪任务集合,解决任务之间的强耦合,减少了任务等待时间和系统资源空闲,提高了系统利用率。
(3)并行调度方法:在本发明中的调度方法中,由于就绪任务集合中的任务没有依赖关系,任务相互独立可进行并行调度,因此就绪任务集合中的任务有极强的并行性。任务调度就可以根据就绪集合ReadyTaskSet中任务的存储资源需求和处理节点的实时空闲存储空间信息,对就绪任务集合中的各个任务并行发起分布式多目标协商调度请求,调度中要考虑的目标包括最早完成时间、通信开销和系统负载均衡等。然后根据资源评价的结果,任务调度为任务选择具有最早完成时间的节点,而不仅仅是选择具有最早开始时间的节点。对于有依赖关系的任务来说,整个调度长度是由最后一个任务的完成时间来计算的,因此采用最早开始时间并不能真正完全描述一个调度策略的整体性能。通过并行调度集合中的任务来提高系统的并行度,实现了对有依赖关系的多个任务请求的更合理的调度与部署。
在任务调度过程中用到的几个评价定义如下:
定义1C(m,i,n,j)表示两个耦合任务间的依赖数据通信开销,即分配到处理节点Pi的前驱任务Tm与分配到Pj的后继任务Tn之间的数据通信开销:
C ( m , i , n , j ) = 0 ; i = j band ij * d mn ; i ≠ j
其中,bandij表示异构节点间的通信速率,dmn表示任务间依赖数据的传输量。
定义2CT(m,i,j)表示要复制两个耦合任务中的前驱任务时,需要的任务传输开销,即把一个前驱任务Tm从处理节点Pi传输到Pj的通信开销:
CT ( m , i , j ) = 0 ; i = j band ij * | T m | ; i ≠ j
其中,|Tm|表示任务Tm的程序规模大小。
定义3任务Ti在处理节点Pj上的最早可能完成时间记为epft(Ti,Pj),计算公式为:
epft(Ti,Pj)=epst(Ti,Pj)+w(Ti,Pj)
epst(Ti,Pj)为任务Ti在Pj上的最早可能开始时间,w(Ti,Pj)为任务Ti在Pj上的执行时间,w(Ti,Pj)=Wi/FRj,即任务计算量/处理器的处理能力,处理器的处理能力FR用CPU主频与指令周期的乘积来计算,FR=FREQcpu*TIME。
当系统中只有一个节点Pj的全部存储资源才能满足某个任务Ti的存储需求Ai,并且当时该节点上已有任务在执行,则任务Ti就必须等待,直到为Pj分配的所有其他任务执行完毕并释放资源后,任务Ti才能被调度执行。在任务Ti等待的过程中,可能出现Pj的剩余资源再次分配给其他需求资源量小的任务的情况,即剩余资源不断地再分,这样Ti就会因为长时间得不到资源而引起“饿死”和死锁的现象。
为了避免上述可能出现的现象,给出相应的策略对任务调度进行控制。Pj上已分配的所有任务中最晚执行完成的任务的结束时间LAFT是Ti的最早可能执行时间。对于执行节点Pj,采用下面的策略进行调度:在就绪任务集合ReadyTaskSet中只选择能在Ti的LAFT时刻之前执行完成的任务分配到Pj中,这样当到达LAFT时刻时,任务Ti就可以调度到Pj上执行,而不会被“饿死”;对于系统中除了Pj以外的其他节点,即{P1,P2,...Pj-1,Pj+1,...Pp},仍然按照上面(定义1-定义3)的评价定义进行调度决策。通过以上策略对特殊情况下的任务进行调度控制,可以提高调度效率。
(4)通信开销的评价及控制方法:调度任务时要在系统中选择使其具有最早可能完成时间的节点,即任务Ti的执行节点PTi={Pj|min{epft(Ti,Pj)}}。在调度决策时为了减少不必要的数据传输,本发明还对任务执行开销和任务间通信开销(E/C)进行了综合衡量。设依赖任务Tu和Tk间依赖数据的传输时间为C(u,i,k,j),传输前驱任务的时间为CT(u,i,j),前驱任务在新节点上执行的时间为w(Tu,Pj),CT(u,i,j)与w(Tu,Pj)的和称为任务复制开销,即Ccopy(u,i,j)=CT(u,i,j)+w(Tu,Pj)。当C(u,i,k,j)>Ccopy(u,i,j)时,则复制前驱任务Tu到Pj节点上再执行一次,形成本地数据为其后继任务Tk服务,以减少任务间的通信开销。若某个任务有多个前驱,则选择传输数据与任务复制开销差距最大的任务,即Copytask={Tu|max{C(u,i,k,j)-Ccopy(u,i,j)}},Pi≠Pj进行任务复制
通过以上几个方面的决策,使调度满足并行性、通信开销和负载均衡等多方面的性能。
本发明的效果和益处是通过引入任务的计算量、依赖数据传输量和任务对存储资源的需求量解决异构环境中不同节点的性能差异,描述任务在各节点上执行性能的时域动态性,构造了云计算中异构环境下任务依赖关系图;利用依赖任务入度值为零的解耦方法,由入度值为零的任务组成了无优先次序的就绪任务集合,集合中任一任务只要存储资源的需求满足即可被调度;并行调度方法同时兼顾了实时性和负载均衡,减少了基于队列的调度方式引起的资源空闲。该解耦并行调度方法充分考虑了调度的整体性能,采用最早完成时间为评价条件,设计了防止饿死和死锁的调度策略,是一种调度依赖关系任务的有效和并行的方法。该方法适用于云计算等分布式异构系统环境,例如网格计算、普适计算等分布式计算环境,为未来计算机网络的应用与发展提供技术支持。
附图说明
图1是任务模型图。
图2是调度过程运行顺序图。
图3是图1所示的任务模型的调度示意图。图中箭头所示为任务间的数据传输。
具体实施方式
以下结合技术方案和附图详细叙述本发明的实施例。
1.任务依赖关系的描述:图1所示为一个含有10个依赖任务的服务中任务的依赖关系图(圆圈节点代表任务T;有向边E表示任务间的依赖关系;方框内数字表示任务的计算量W;边上数字代表任务之间的依赖数据传输量D;尖括号内表示任务的最低存储资源需求A,图中只给出了部分任务的最低存储资源需求)。
2.入度值为零解耦合方法:任务管理根据任务依赖关系图中任务入度值为零的条件来解耦合,并且建立就绪任务集合ReadyTaskSet来动态描述某个时刻可并行调度的任务。初始时就绪任务集合中的元素都是入度值为0的任务。以图1为例,初始时就绪任务集合ReadyTaskSet={T1},即此时只有T1可以被调度。只要某个节点的可用内存大于T1的最低内存需求量并且可用磁盘空间大于T1的最低磁盘需求量,即empty_mem>Rmem1&&empty_stor>Rsize1,且能最早完成等,T1即可执行。当T1执行完毕并把依赖数据传递给后继任务T2,T3,T4,T5,T6后,就从就绪任务集合中删除T1,并且在图中删除该任务节点和其发出的所有有向边。然后从新的关系图中选择所有入度为0的任务,即T2,T3,T4,T5,T6加入就绪任务集合,ReadyTaskSet={T2,T3,T4,T5,T6}。此时只要节点能最早完成且存储资源满足任务要求,这五个任务即可同时执行。同理若T3执行完毕,就把T7加入就绪任务集合,而不论其余任务节点T2,T4,T5,T6是否执行完毕。整个过程具有具有极强的并行性和较高的资源利用率。
3.调度方法:系统中每个节点的空闲内存容量、空闲磁盘容量称为该节点的实时存储资源信息,即RS=<empty_mem,empty_stor>。每当任务请求或释放资源后要实时更新节点存储资源:RS=RS+(-1)k*Ai,其中当有任务Ai申请Pj的可用存储资源即任务到达第j个节点时,k=1;当任务完成释放存储资源时,k=0。这样就很好地表现了节点资源的动态性变化,为调度过程提供了可靠、实时的资源信息。当就绪任务集合ReadyTaskSet不为空时,并行对就绪任务集合中的各个任务发起分布式多目标协商调度请求。调度方法根据任务的存储资源需求和处理节点的实时资源信息,首先选择可以满足某个任务Tk资源需求的若干节点P1,P2,...Pj,然后再计算Tk在P1,P2,...Pj中每个节点上的最早开始时间epst(Tk,Pj)和最早完成时间epft(Tk,Pj)。其中计算epst(Tk,Pj)时,要对依赖数据传输开销和任务复制开销的进行比较,即对其前驱任务Tu与该任务之间的通信时间C(u,i,k,j)和把前驱任务Tu的任务复制开销Ccopy(u,i,j)进行比较。当C(u,i,k,j)>Ccopy(u,i,j)时,就把Tu在Pj上重新执行一次,以形成本地数据为Tk服务,减少数据通信开销,降低网络负载。若Tk有多个前驱,则复制数据传输时间和任务复制开销的差距最大的任务,即Copytask={Tu|max{C(u,i,k,j)-Ccopy(u,i,j)}},Pi≠Pj。这样最早开始时间用公式epst(Tk,Pj)=max{epft(Tu,Pi)+min{C(u,i,k,j),Ccopy(u,i,j)}}来计算,公式中Tu为Tk的前驱任务,Pi是Tu的执行节点。然后计算最早完成时间epft(Tk,Pj)=epst(Tk,Pj)+w(Tk,Pj)。最后为任务Tk选择具有最小的最早完成时间的节点,即任务Tk的执行节点PTk={Pj|min{epft(Tk,Pj)}}。这样利用该调度方法可以实现任务的并行执行,提高了系统的并行度,实现了对有依赖关系的多个任务请求的更合理的调度与部署。
总体来说,整个解耦并行调度方法的具体调度过程如下:首先根据任务依赖关系图计算每个任务的入度值。建立一个就绪任务集合,初始时就绪任务集合中的元素为入度值为零的任务,即入口任务。集合中的成员为一组相互独立的任务可进行并行调度,然后提取就绪任务集合中任务的信息进行分布式多目标协商调度,根据系统资源的实时情况把任务分配到系统中使该任务具有最早可能完成时间的节点上。在选择任务的执行节点时,综合评价多个目标进行调度决策,包括通信代价、节点负载、任务执行时间等。当出现任务Ti需求的存储资源是系统中某个节点Pj所能提供的全部存储资源,并且Pj上已有任务在执行的特殊情况时,采用特殊的调度控制策略:对于执行节点Pj,在就绪任务集合中只能选择可以在当前时刻与Pj上已分配的任务中最晚执行结束的时间LAFT这段时间间隙中能执行完成的任务分配到Pj上,以使任务Ti在LAFT时刻可以被调度到Pj上执行,而不会被“饿死”;对于系统中除了Pj以外的其他节点,仍然按照上面(定义1-定义3)的评价定义进行调度决策。每实际执行完一个任务,就把该任务从就绪任务集合中移除,并在依赖关系图中删除该任务,并且删除从该任务节点发出的所有有向边(这里的删除是指从逻辑上删除,并不是真正地删除任务节点或边,而是利用标记来标识任务是否被调度或执行)。然后从新的图中选择所有入度为零的任务加入就绪任务集合,直至所有任务调度完毕。
具体调度方法的伪代码如下所示:
Figure BDA0000127244190000101
针对图1所示的任务依赖关系图,利用本文提出的解耦并行调度方法在三个异构节点组成的云环境中进行调度,调度结果如图3所示。此外,模拟调度实验表明,与典型的静态调度算法HEFT[Topcuoglu H,Wu M Y.Performance-effective and low-complexity task scheduling forheterogeneous computing.IEEE Transactions on Parallel and DistributedSystems.2002,13(3):260-274.]相比,应用本方法的调度长度减少了20%-30%。

Claims (1)

1.一种云计算中依赖任务的解耦并行调度方法,其特征包括以下步骤: 
(1)任务依赖关系的描述:提出包括计算量、依赖数据传输量和存储资源需求量的依赖任务关系,任务之间的依赖关系用一个五元组G=(T,E,W,A,D)来表示,其中包含了任务之间的关系及对系统存储资源的需求,要求任一任务的存储资源需求量不可超过节点的物理最大可利用存储空间值;元素代表的含义如下:T为应用服务的n个任务组成的集合T={T1,T2,……,Tn};E是边的集合E=(eij|0<i,j≤n;i≠j);应用服务中的任务的依赖关系定义为:如果Tj必须在Ti执行完毕后才能运行,则从Ti到Tj就存在一条有向边 eij,并且Ti是Tj的前驱任务,Tj是Ti的后继任务;W为任务的计算量集合,W={Wi|0<i≤n};A为任务的最低存储资源需求的集合A={Ai|0<i≤n},Ai为Ti的最低存储需求Ai={Rmem,Rstor},其中Rmem为内存空间需求量,Rstor为存储空间需求量;D为任务之间的依赖数据传输量矩阵, dij表示前驱任务Ti与后继任务Tj之间的数据传输量; 
(2)解耦合方法:解耦合方法的核心是入度值为零,即任务可被调度的必要条件是在依赖关系图中某节点的入度值为零; 
对任务依赖关系图根据图中节点入度值为零的条件来解耦合,并且建立一个就绪任务集合ReadyTaskSet={Ti|0<i≤n},来动态描述某个时刻可并行调度的任务;就绪集合定义为:某个时刻没有前驱任务或直接前驱任务都已经完成的任务组成的集体,即入度值为零;集合中的任务,其优先级是相同的,不分先后,任一成员只要所需的存储资源满足,即可被调度;初始时就绪任务集合中的元素都是入度值为0的任务,当集合中的某个任务执行完毕并把依赖数据传递给其后继任务后,就从就绪任务集合中删除该任务,并且隐藏或逻辑删除依赖关系图中该任务节点和从该任务节点发出的所有有向边;然后从新的可见的不含隐藏的边和任务节点的图中选择所有入度为0的任务加入就绪任务集合,直至 全部任务调度完毕或任务依赖关系完全不可见; 
(3)并行调度方法: 
定义1:C(m,i,n,j)表示两个耦合任务间的依赖数据通信开销,即分配到处理节点Pi的前驱任务Tm与分配到Pj的后继任务Tn之间的数据通信开销: 
Figure FDA00003190721700021
其中,bandij表示异构节点间的通信速率,dmn表示任务间依赖数据的传输量; 
定义2:CT(m,i,j)表示要复制两个耦合任务中的前驱任务时,需要的任务传输开销,即把一个前驱任务Tm从处理节点Pi传输到Pj的通信开销: 
Figure FDA00003190721700022
其中,|Tm|表示任务Tm的程序规模大小; 
定义3:任务Ti在处理节点Pj上的最早可能完成时间记为epft(Ti,Pj),计算公式为: 
epft(Ti,Pj)=epst(Ti,Pj)+w(Ti,Pj
epst(Ti,Pj)为任务Ti在Pj上的最早可能开始时间,w(Ti,Pj)为任务Ti在Pj上的执行时间,w(Ti,Pj)=Wi/FRj,即任务计算量/处理器的处理能力,处理器的处理能力FR用CPU主频与指令周期的乘积来计算,FR=FREQcpu*TIME; 
当系统中只有一个节点Pj的全部存储资源(RS)才能满足某个任务Ti的存储需求Ai,并且当时该节点上已有任务在执行,则任务Ti就必须等待,直到为Pj分配的所有其他任务执行完毕并释放资源后,任务Ti才能被调度执行;在任务Ti等待的过程中,可能出现Pj的剩余资源再次分配给其他需求资源量小的任务的情况,即剩余资源不断地再分,这样Ti就会因为长时间得不到资源而引起“饿 死”和死锁的现象; 
为了避免上述可能出现的现象,给出相应的策略对任务调度进行控制;Pj上已分配的所有任务中最晚执行完成的任务的结束时间LAFT是Ti的最早可能执行时间;对于执行节点Pj,采用下面的策略进行调度:在就绪任务集合ReadyTaskSet中只选择能在Ti的LAFT时刻之前执行完成的任务分配到Pj中,这样当到达LAFT时刻时,任务Ti就调度到Pj上执行,而不会被“饿死”;对于系统中除了Pj以外的其他节点,即{P1,P2,…Pj-1,Pj+1,…Pp},仍然按照上面定义1、定义2和定义3的评价定义进行调度; 
(4)通信开销的评价及控制方法:调度任务时要在系统中选择使其具有最早可能完成时间的节点,即任务Ti的执行节点PTi={Pj|min{epft(Ti,Pj)}};在调度决策时为了减少不必要的数据传输,对任务执行开销和任务间通信开销(E/C)进行了综合衡量;设依赖任务Tu和Tk间依赖数据的传输时间为C(u,i,k,j),传输前驱任务的时间为CT(u,i,j),前驱任务在新节点上执行的时间为w(Tu,Pj),CT(u,i,j)与w(Tu,Pj)的和称为任务复制开销,即Ccopy(u,i,j)=CT(u,i,j)+w(Tu,Pj);当C(u,i,k,j)>Ccopy(u,i,j)时,则复制前驱任务Tu到Pj节点上再执行一次,形成本地数据为其后继任务Tk服务,以减少任务间的通信开销;若某个任务有多个前驱,则选择传输数据与任务复制开销差距最大的任务,即 
Copytask={Tu|max{C(u,i,k,j)-Ccopy(u,i,j)}},Pi≠Pj进行任务复制。 
CN2011104541949A 2011-12-30 2011-12-30 一种云计算中依赖任务的解耦并行调度方法 Expired - Fee Related CN102591712B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011104541949A CN102591712B (zh) 2011-12-30 2011-12-30 一种云计算中依赖任务的解耦并行调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104541949A CN102591712B (zh) 2011-12-30 2011-12-30 一种云计算中依赖任务的解耦并行调度方法

Publications (2)

Publication Number Publication Date
CN102591712A CN102591712A (zh) 2012-07-18
CN102591712B true CN102591712B (zh) 2013-11-20

Family

ID=46480419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104541949A Expired - Fee Related CN102591712B (zh) 2011-12-30 2011-12-30 一种云计算中依赖任务的解耦并行调度方法

Country Status (1)

Country Link
CN (1) CN102591712B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105472014A (zh) * 2015-12-23 2016-04-06 浪潮(北京)电子信息产业有限公司 一种基于OSGi的存储管理软件性能扩展方法与系统

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102866924B (zh) * 2012-09-12 2014-11-12 北京航空航天大学 内容整合引擎调度方法及装置
CN103077086A (zh) * 2013-01-09 2013-05-01 苏州亿倍信息技术有限公司 一种任务分配控制的方法及系统
CN103064745B (zh) * 2013-01-09 2015-09-09 苏州亿倍信息技术有限公司 一种任务分配处理的方法及系统
CN103077085A (zh) * 2013-01-09 2013-05-01 苏州亿倍信息技术有限公司 一种任务分配的方法及系统
CN103077084A (zh) * 2013-01-09 2013-05-01 苏州亿倍信息技术有限公司 一种任务控制的方法及系统
CN104035747B (zh) * 2013-03-07 2017-12-19 伊姆西公司 用于并行计算的方法和装置
CN103279622A (zh) * 2013-06-07 2013-09-04 北京理工大学 一种飞行器仿真系统中的分布式仿真模型调度方法
CN104636200B (zh) * 2013-11-14 2019-03-29 上海计算机软件技术开发中心 一种计算机多进程公平调度的方法
CN103778001A (zh) * 2014-01-26 2014-05-07 北京仿真中心 一种基于dag图的仿真任务并行度分析方法
CN104123190B (zh) * 2014-07-23 2017-09-19 浪潮(北京)电子信息产业有限公司 异构集群系统的负载均衡方法和装置
CN104166593A (zh) * 2014-08-14 2014-11-26 国家超级计算深圳中心(深圳云计算中心) 一种计算多应用功能异步并发调度方法
CN105468452B (zh) * 2014-09-04 2019-04-12 中国联合网络通信集团有限公司 一种资源池的分配方法及资源调度器
CN104407848B (zh) * 2014-10-29 2018-11-06 中国建设银行股份有限公司 一种数据处理方法及装置
CN105656973B (zh) * 2014-11-25 2018-11-13 中国科学院声学研究所 一种分布式节点组内任务调度方法及系统
CN104917825A (zh) * 2015-05-20 2015-09-16 中国科学院信息工程研究所 一种面向实时流计算平台的负载均衡方法
CN104834571B (zh) * 2015-05-25 2018-05-25 南京大学 一种应用于云工作流调度的数据预取方法
CN105068863B (zh) * 2015-07-16 2018-08-17 福州大学 多云环境下带截止日期约束工作流的基于代价驱动调度方法
CN105045659B (zh) * 2015-07-17 2018-01-05 中国人民解放军国防科学技术大学 一种云中基于任务重叠与虚拟机迁移的容错任务调度方法
US20170109214A1 (en) * 2015-10-16 2017-04-20 Qualcomm Incorporated Accelerating Task Subgraphs By Remapping Synchronization
CN106293952B (zh) * 2016-07-11 2019-06-21 河南大学 一种基于任务需求与服务能力匹配的遥感任务调度方法
CN106814994B (zh) * 2017-01-20 2019-02-19 哈尔滨工业大学 一种面向大数据的并行系统优化方法
CN107168781A (zh) * 2017-04-07 2017-09-15 广东银禧科技股份有限公司 一种3d打印子任务调度方法和装置
CN107241281B (zh) * 2017-05-27 2020-01-14 上海东土远景工业科技有限公司 一种数据处理方法及其装置
CN109327490B (zh) * 2017-07-31 2021-01-15 华为技术有限公司 一种部署云服务组件的方法和服务器
CN107967175B (zh) * 2017-11-07 2021-11-09 中电科华云信息技术有限公司 一种基于多目标优化的资源调度系统及方法
WO2019140566A1 (zh) * 2018-01-17 2019-07-25 新联智慧信息技术(深圳)有限公司 云计算的资源分配方法及系统
CN108255613B (zh) * 2018-02-07 2021-01-01 北京航空航天大学 一种基于图着色的soa系统资源管理方法
CN110297699B (zh) 2018-03-23 2021-09-14 华为技术有限公司 调度方法、调度器、存储介质及系统
CN109324906A (zh) * 2018-10-22 2019-02-12 王瑞明 云计算平台中选择处理节点的方法
CN111221643B (zh) * 2018-11-23 2023-04-07 阿里巴巴集团控股有限公司 任务处理方法和任务处理装置
CN109788043A (zh) * 2018-12-28 2019-05-21 亚信科技(中国)有限公司 任务处理方法、装置、计算机设备和存储介质
CN111475278B (zh) * 2019-01-24 2023-04-28 阿里巴巴集团控股有限公司 一种基于意向链驱动的弹性调度方法、装置及电子设备
CN110109976B (zh) * 2019-05-15 2021-09-10 成都四方伟业软件股份有限公司 数据处理方法、装置、系统及存储介质
CN110321208B (zh) * 2019-06-27 2022-10-14 大连理工大学 一种求解云任务调度的进化计算方法
CN111338705B (zh) * 2020-02-13 2021-03-26 北京房江湖科技有限公司 一种数据处理的方法、装置和存储介质
CN111459669A (zh) * 2020-03-30 2020-07-28 中科边缘智慧信息科技(苏州)有限公司 高动态资源非均衡条件下的多节点任务调度方法
CN111782389A (zh) * 2020-06-22 2020-10-16 中科边缘智慧信息科技(苏州)有限公司 机动边缘信息服务网络下的任务调度系统及方法
CN112231078A (zh) * 2020-09-21 2021-01-15 上海容易网电子商务股份有限公司 一种自动化营销系统分布式任务调度的实现方法
CN112506991B (zh) * 2020-12-03 2023-04-07 杭州小电科技股份有限公司 并行处理的方法、系统、电子装置和存储介质
CN112463397B (zh) * 2020-12-10 2023-02-10 中国科学院深圳先进技术研究院 lock-free的分布式死锁避免方法及装置、计算机设备及可读存储介质
CN112905259A (zh) * 2021-02-05 2021-06-04 北京有竹居网络技术有限公司 数据处理方法、装置、设备及存储介质
CN113094260B (zh) * 2021-03-18 2024-04-05 西北工业大学 一种分布式系统时序关系建模与仿真分析方法
CN112801546A (zh) * 2021-03-18 2021-05-14 中国工商银行股份有限公司 一种任务调度方法、装置及存储介质
CN113806051B (zh) * 2021-09-22 2022-08-19 海通证券股份有限公司 计算设备的任务管理方法及装置、存储介质、计算设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6110220A (en) * 1997-02-24 2000-08-29 Lucent Technologies Inc. Concurrent hardware-software co-synthesis of hard real-time aperiodic and periodic specifications of embedded system architectures
CN101719842A (zh) * 2009-11-20 2010-06-02 中国科学院软件研究所 一种基于云计算环境的分布式网络安全预警方法
CN102158346A (zh) * 2010-11-23 2011-08-17 北京神州泰岳软件股份有限公司 基于云计算的信息采集系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8689231B2 (en) * 2009-06-30 2014-04-01 Sap Ag System and method for ordering tasks with complex interrelationships

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6110220A (en) * 1997-02-24 2000-08-29 Lucent Technologies Inc. Concurrent hardware-software co-synthesis of hard real-time aperiodic and periodic specifications of embedded system architectures
CN101719842A (zh) * 2009-11-20 2010-06-02 中国科学院软件研究所 一种基于云计算环境的分布式网络安全预警方法
CN102158346A (zh) * 2010-11-23 2011-08-17 北京神州泰岳软件股份有限公司 基于云计算的信息采集系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105472014A (zh) * 2015-12-23 2016-04-06 浪潮(北京)电子信息产业有限公司 一种基于OSGi的存储管理软件性能扩展方法与系统

Also Published As

Publication number Publication date
CN102591712A (zh) 2012-07-18

Similar Documents

Publication Publication Date Title
CN102591712B (zh) 一种云计算中依赖任务的解耦并行调度方法
Cheng et al. Cost-aware job scheduling for cloud instances using deep reinforcement learning
Xhafa et al. Computational models and heuristic methods for Grid scheduling problems
Salot A survey of various scheduling algorithm in cloud computing environment
CN103324525B (zh) 一种云计算环境下的任务调度方法
CN109714400A (zh) 一种面向容器集群的能耗优化资源调度系统及其方法
CN104657221A (zh) 一种云计算中基于任务分类的多队列错峰调度模型及方法
CN107168770B (zh) 一种低能耗的云数据中心工作流调度与资源供给方法
CN109254836A (zh) 面向云计算系统优先依赖任务的期限约束成本优化调度方法
Hao et al. An adaptive algorithm for scheduling parallel jobs in meteorological Cloud
CN104793993A (zh) 基于Levy飞行的人工蜂群粒子群算法的云计算任务调度方法
Shi et al. MapReduce short jobs optimization based on resource reuse
Singh et al. A comparative study of various scheduling algorithms in cloud computing
CN109298919B (zh) 面向高利用率任务集合的软实时系统的多核调度方法
CN111782627A (zh) 面向广域高性能计算环境的任务与数据协同调度方法
CN106802822A (zh) 一种基于飞蛾算法的云数据中心认知资源调度方法
Badr et al. Task consolidation based power consumption minimization in cloud computing environment
Barreiro et al. The future of distributed computing systems in atlas: boldly venturing beyond grids
Lemerre et al. Equivalence between schedule representations: Theory and applications
Wang et al. A survey of system scheduling for hpc and big data
Yu et al. Towards dynamic resource provisioning for traffic mining service cloud
Zhang et al. Optimization of cloud workflow scheduling based on balanced clustering
Shu et al. Energy-efficient Mapping of Big Data Workflows under Deadline Constraints.
Zhou et al. Resource allocation in cloud computing based on clustering method
Yan et al. Cloud computing workflow framework with resource scheduling mechanism

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131120

Termination date: 20171230

CF01 Termination of patent right due to non-payment of annual fee