CN104461748A - 一种基于MapReduce的最优本地化任务调度方法 - Google Patents

一种基于MapReduce的最优本地化任务调度方法 Download PDF

Info

Publication number
CN104461748A
CN104461748A CN201510002039.1A CN201510002039A CN104461748A CN 104461748 A CN104461748 A CN 104461748A CN 201510002039 A CN201510002039 A CN 201510002039A CN 104461748 A CN104461748 A CN 104461748A
Authority
CN
China
Prior art keywords
data block
computing node
task
time
physical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510002039.1A
Other languages
English (en)
Other versions
CN104461748B (zh
Inventor
高胜立
薛瑞尼
敖立翔
管仲洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201510002039.1A priority Critical patent/CN104461748B/zh
Publication of CN104461748A publication Critical patent/CN104461748A/zh
Application granted granted Critical
Publication of CN104461748B publication Critical patent/CN104461748B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种可以同时工作在同构和异构集群环境下MapReduce任务调度算法,属于计算机技术领域。该调度算法能综合考虑集群中各计算节点的处理性能,把计算节点和计算任务抽象为一个二分图,通过适当扩展该二分图并结合KM带权最优匹配算法形成最终的全局任务调度方案。实验数据表明,该调度算法能将Map阶段数据本地化程度提升到接近100%,MapReduce作业整体执行时间最优能减少67.1%。

Description

一种基于MapReduce的最优本地化任务调度方法
技术领域
本发明属于计算机技术领域,具体涉及一种基于MapReduce的最优本地化任务调度方法。
背景技术
MapReduce任务调度直接影响MapReduce计算作业的执行时间,高效的调度算法能有效提升作业执行效率。
数据本地化程度直接影响MapReduce作业的执行效率。MapReduce作业主要由Map阶段和Reduce阶段组成,Map阶段计算节点产生的中间输出数据需要经过网络传输到Reduce阶段的计算节点作为其输入数据,这个中间阶段称为Shuffle。Shuffle阶段的数据传输和Reduce阶段的数据持久化存储所带来的网络带宽的资源消耗是不可避免的,在有限的网络带宽资源条件下,如何减少Map阶段不必要的网络带宽占用,成为提升MapReduce作业执行效率的关键。而Map阶段的网络带宽占用和其数据本地化程度直接关联,所以提升数据本地化程度能有效提升MapReduce作业的执行效率。
提升Map阶段数据本地化程度的调度方法多种多样,但都存在一些实用性不高,适用范围不广等问题。Zaharia等人提出一种延迟调度的算法能有效提升数据本地化程度(“Delayscheduling:a simple technique for achieving locality and fairness in cluster scheduling,”inProceedings of the 5th European conference on Computer systems.ACM,2010,pp.265–278.),但这种延迟调度的方法是建立在损失局部作业的执行效率的基础上的,并且这种调度算法适用性不广,当只有一个或几个作业在运行时,并不能取得最优的数据本地化程度和作业整体执行时间。Xie等人提出一种根据计算节点性能来提前分布数据的方法(“Improving mapreduceperformance through data placement in heterogeneous hadoop clusters,”in Parallel & DistributedProcessing,Workshops and Phd Forum(IPDPSW),2010IEEE International Symposium on.IEEE,2010,pp.1–9.),这种方法需要预先测量各计算节点的性能,在可以通过调整参数而动态设置计算节点计算资源的MapReduce平台下,这种方法实用性不高。
发明内容
本发明提出一种可以同时工作在同构和异构集群环境下MapReduce任务调度方法,该方法综合考虑集群中各计算节点的处理性能,把计算节点和计算任务抽象为一个二分图,通过扩展该二分图并结合KM带权最优匹配算法形成最终的全局任务调度方案。
本发明具体采用如下技术方案:
一种基于MapReduce的最优本地化任务调度方法,其流程如图1所示,包括以下步骤:
步骤一.模型抽象:
将集群中的物理计算节点抽象为一类点的集合,将集群中准备处理的数据块抽象为另一类点的集合,并构建二分图:由于在任务调度过程中,每个数据块可能被调度到任意一个计算节点,故将每个数据块和每个计算节点连接,若某个物理计算节点上存储有某数据块,则该数据块与该计算节点间的连接线为一条实线,即这种实线连接的数据块所对应的任务为本地化任务,反之,非本地化的数据块与计算节点之间则用虚线连接;对所述连接线赋权值:定义三个权值α、β、γ,满足α<β<γ,本地化任务对应的是用实线连接的数据块和物理节点形成处理关系的一类任务,在所述二分图中这类任务对应的连线的权值为α,非本地化对应的是用虚线连接的数据块和物理节点形成处理关系的一类任务,在图中这类任务对应的连线的权值为β或γ,其中所连接的数据块的物理位置与计算节点的物理位置如果属于计算集群中的相同机架,则虚线权值为β,如果所连接的数据块的物理位置与计算节点的物理位置分别属于计算集群中的不同机架,则虚线权值为γ;由此得抽象后的二分图模型;
步骤二.计算节点初始化:
将集群中各个物理计算节点的计算性能初始化为相同值,即假定每个计算节点单位时间内均能处理相同数量的数据块;
步骤三.第一次模型扩展:
对步骤一所得的二分图模型进行扩展,通过虚拟增加数据块或者镜像计算节点,使扩展后的模型中计算节点数与数据块数相等,从而使扩展后的模型能使用KM带权最优匹配算法;
步骤四.生成第一次调度方案:
利用KM带权最优匹配算法对步骤三所得的经第一次扩展的模型进行匹配,得到一个全局权值最小的任务调度结果;若步骤三的模型扩展过程中通过虚拟增加了数据块,则将虚拟的数据块从调度结果的队列中剔除,若通过虚拟增加了镜像计算节点,则将调度结果中分配给每个镜像节点的任务分配至其相应的原始物理计算节点上,最终得第一次任务调度方案;
步骤五.物理计算节点实际性能评估:
执行第一次任务调度方案,待所有计算节点启动第一个任务后,通过各计算节点Map阶段处理的数据量和花费的时间计算各计算节点的实际计算性能,且各个计算节点继续执行当前正在处理的任务;
步骤六.物理计算节点性能判定:
若步骤五所得的每个物理计算节点的实际计算性能均相同,则继续执行第一次任务调度方案直至任务调度完成;若不完全相同,则执行步骤七;
步骤七.第二次模型扩展:
对步骤一所得的二分图模型进行扩展,使得扩展后的模型中计算节点数与整个集群中经第一次任务调度方案处理后剩余待处理的数据块数相等,从而使扩展后的模型能使用KM带权最优匹配算法;
步骤八.生成第二次调度方案:
利用KM带权最优匹配算法对步骤七所得的经第二次扩展的模型进行匹配,得到一个全局权值最小的任务调度结果;若步骤七通过虚拟增加了镜像计算节点,则将调度结果中分配给每个镜像节点的任务映射到其相应的原始物理计算节点上,最终得第二次任务调度方案;
步骤九.调度完成:
执行第二次调度任务方案对剩余的数据块进行任务分配,完成任务调度。
本发明的有益效果是:
本发明提出一种可以同时工作在同构和异构集群环境下的MapReduce任务调度方法,该方法无需预先测量各个计算节点的计算性能,实施起来灵活方便,且不会影像局部作业的执行效率,最终得到的调度任务方案的数据本地化程度解决100%,能在最大程度上降低Map阶段的网络带宽占用,从而使得集群作业并行度提高,于此同时各个作业的整体执行时间也得到明显缩短。
附图说明
图1为本发明提供的任务调度方法流程图;
图2为抽象后的二分图模型示意图;
图3为模型扩展示意图;
图4为实施例使用本发明提供的调度方法的本地化提升比例示意图;
图5为网络不拥塞时,实施例使用本发明提供的调度方法后,计算性能提升比例示意图;
图6为网络拥塞时,实施例使用本发明提供的调度方法后,计算性能提升比例示意图。
具体实施方式
一种基于MapReduce的最优本地化任务调度方法,其流程如图1所示,包括以下步骤:
步骤一.模型抽象:
如图2所示,将集群中的物理计算节点N1、N2、N3等抽象为一类点的集合,将集群中准备处理的数据块B1、B2、B3、B4等抽象为另一类点的集合并构建二分图:由于在任务调度过程中,每个数据块可能被调度到任意一个计算节点,故将每个数据块和每个计算节点连接,若某计算节点上存储有某数据块,则该数据块与该计算节点间的连接线为一条实线,即这种实线连接的数据块所对应的任务为本地化任务,反之,非本地的数据块与计算节点之间则用虚线连接;对所述连接线赋权值:定义三个权值α、β、γ,满足α<β<γ,本地化任务即图中实线连接的数据块对应的任务,其对应的连线的权值为α,非本地化的数据块即对应图中虚线连接的数据块对应的任务,其对应的连线的权值为β或γ,一般情况下,一个计算集群由若干机架构成,每个机架由若干物理计算节点组成,其中所连接的数据块与计算节点属于计算集群中的相同机架的虚线权值为β,所连接的数据块与计算节点分别属于计算集群中的不同机架的虚线权值为γ;由此得到抽象后的二分图模型;
步骤二.计算节点初始化:
将集群中各个物理计算节点的计算性能初始化为相同值,即假定每个物理计算节点单位时间内均能处理相同数量的数据块;
步骤三.第一次模型扩展:
设计算集群中的物理计算节点数为n,所需处理的数据块数为M,对步骤一所得的二分图模型进行扩展,使得扩展后的模型能使用KM带权最优匹配算法,即扩展后的模型中计算节点数与数据块数相等,扩展方式如下:
(1)若n≥M,则虚拟W1=n-M个数据块,把虚拟的数据块添加至步骤一所得的二分图模型中,每个虚拟的数据块与所有物理计算节点均用虚线相连,若计算集群有两个以上机架,则所述虚线赋权值γ;若计算集群只有一个机架,则所述虚线赋权值β;
(2)若n<M,则具体扩展方法如下:
理论上每个物理计算节点应处理的数据块数量Ti=M·Pi/(P1+…+Pn),其中Pi为第i个物理计算节点的计算性能,i=1,…,n;由于第一次模型扩展前假设所有计算节点的计算性能相同,即Ti=T=M/n。由于通常情况下T为非整数,故对T向下取整得整数D,即T=D+Si',0≤Si'<1,则有M=n·D+S',其中S'=n·Si'为剩余未划分的数据块数量;
由于每个计算节点的Pi是相等的,所以Si'也是相等的,又由于各计算节点的性能也相等,所以再划分一个任务后的计算节点的总执行时间都为(D+1)*t,其中t为各计算节点处理1个数据块所用时间,(D+1)*t也是该作业的最理想总执行时间。即,首先每个物理计算节点均分配D个数据块,而后在n个物理计算节点中随意选取S'个物理计算节点,将剩下的S'个数据块平均分配给所述S'个物理计算节点,完成任务划分;按照各计算节点划分的数据块数减一所得的值虚拟对应个数的镜像节点,例如计算节点Ni划分了D+1个待处理数据块,则计算节点Ni需要通过虚拟增加D个镜像节点,所有镜像计算节点的计算性能均与其对应的原始物理计算节点的计算性能相同;
把镜像计算节点添加至步骤一所得的二分图模型中,每个镜像计算节点同所有数据块的连接关系及相应权值与该镜像计算节点所对应的原始物理计算节点同所有数据块的连接关系及相应权值相同,由此完成第一次模型扩展;
步骤四.生成第一次调度方案:
利用KM带权最优匹配算法对步骤三所得的经第一次扩展的模型进行匹配,得到一个全局权值最小的任务调度结果;若步骤三的模型扩展过程中通过虚拟增加了数据块,则将虚拟的数据块从调度结果的队列中剔除,若通过虚拟增加了镜像计算节点,则将调度结果中分配给每个镜像节点的任务分配至其相应的原始物理计算节点上,最终得第一次任务调度方案;
步骤五.物理计算节点实际性能评估:
执行第一次任务调度方案,直至集群中每个物理计算节点至少完成一个数据块的处理时停止,根据每个计算节点处理相应数据块所需的时间,可得到每个计算节点的实际计算性能;
步骤六.物理计算节点性能判定:
若步骤五所得的每个物理计算节点的实际计算性能均相同,则继续执行第一次任务调度方案直至任务调度完成;若不完全相同,则执行步骤七,且各个计算节点继续执行当前正在处理的任务;
步骤七.第二次模型扩展:
设执行第一次任务调度方案后实际剩余的未处理数据块数为m,如果m=0,即n≥M,此时第一轮分配后没有任务(数据块)剩余,则不作处理。如果第一轮分配结果有拖后腿的任务则交给推测式任务(speculative task)处理;如果m>0,表示第二轮分配需要调整之前计算节点性能一致假设前提下的分配结果,则:
(1)若n≥M,不作处理,此时没有待处理的任务,拖后腿的任务交由推测式执行的任务
处理;
(2)若n>M,则具体扩展方法如下:
设Pi为第i个物理计算节点经步骤五所得的实际计算性能,i=1,…,n,对于剩余的m个数据块,理论上每个物理计算节点应处理的数据块数量Ti=m·Pi/(P1+…+Pn);通常情况下Ti为非整数,对Ti向下取整得整数Di,即Ti=Di+Si,0≤Si<1,则有m=(D1+…+Dn)+S,其中S=S1+…+Sn为剩余未分配数据块数量;
设Qr为集群中计算性能最高与最低的物理计算节点之间的实际计算性能值之比,对Qr向上取整得整数Q,即Qr≤Q<Qr+1,计算每个物理计算节点分别再处理Di+1,…,Di+Q个数据块所需要的时间加上该计算节点处理完正在处理的任务(开始执行第一次任务调度方案时,第一次分配后各节点都有待处理任务,第二次模型扩展不暂停这些正在处理的任务,只是将其剩余处理时间纳入调度考虑之中)的剩余时间之和ti,1,…,ti,Q,由此得到n×Q个时间数据t1,1,…,t1,Q,…,ti,1,…,ti,Q,…,tn,1,…,tn,Q,按由小到大顺序对所述n×Q个时间数据进行排列并构成一个映射列表,列表中的每一个时间均映射一个其相应的物理计算节点,此列表的意义表明,剩余未分配的S个任务按照映射列表由小到大的分配给各计算节点,能保证作业能在最小时间内完成;
选取映射列表中前S个时间所映射的S个物理计算节点,统计整个计算集群中第i个计算节点在这S个计算节点中出现的次数Li,且S=L1+…+Ln
故,对于剩余的m个数据块,集群中每个物理计算节点应处理的数据块数量为Ri=Di+Li;针对第i个物理计算节点,通过虚拟增加(Di+Li-1)个与其计算性能相同的镜像计算节点,总计虚拟W4=(D1+L1-1)+…+(Dn+Ln-1)个镜像计算节点;
把镜像计算节点添加至步骤一所得的二分图模型中,断开正在处理的数据块所同各计算节点的连线并从二分图中剔除这些数据块,因为这些数据块不需要在分配;每个镜像计算节点同所有数据块的连接关系及相应权值与该镜像计算节点所对应的原始物理计算节点同所有数据块的连接关系及相应权值均相同,由此完成第二次模型扩展,如图3所示,图3中节点N 3'是物理计算节点N3的虚拟镜像计算节点;
步骤八.生成第二次调度方案:
利用KM带权最优匹配算法对步骤七所得的经第二次扩展的模型进行匹配,得到一个全局权值最小的任务调度结果;若步骤七通过虚拟增加了镜像计算节点,则将调度结果中分配给每个镜像节点的任务映射到其相应的原始物理计算节点上,最终得第二次任务调度方案;
步骤九.调度完成:
执行第二次调度任务方案对剩余的m个数据块进行任务分配,完成任务调度。
下面结合实施例对本发明作进一步说明。
实施例
本实施例在搭建了11台物理计算节点(1个主节点,10个从节点)的Hadoop集群中实验,以128MB为一个数据块,分别运行测试用例wc16,wc22,wc38,wc60,wc98,其中wc16表示16个数据块大小的wordcount测试用例,得出的本地化提升比例如图4所示,本地化程度最高提升了17.9%。在网络不拥堵的情况下Map阶段和整个MapReduce阶段的性能提升图如图5所示,从图中看出Map阶段性能最高提升了19.7%,整个MapReduce阶段性能提升了17.8%;在网络堵塞的情况下(用linux的tc命令模拟网络拥塞控制各计算节点的上行和下行带宽)Map阶段和整个MapReduce阶段的性能提升图如图6所示,其中Map阶段性能最高提升了70.4%,整个MapReduce阶段性能最高提升了67.1%。

Claims (3)

1.一种基于MapReduce的最优本地化任务调度方法,包括以下步骤:
步骤一.模型抽象:
将集群中的物理计算节点抽象为一类点的集合,将集群中准备处理的数据块抽象为另一类点的集合并构建二分图;将抽象后的每个数据块对应的点和每个物理计算节点对应的点连接,若某个物理计算节点上存储有某数据块,则该数据块与该计算节点间的连接线为一条实线,即这种实线连接的数据块所对应的任务为本地化任务,反之,非本地化的数据块与计算节点之间则用虚线连接;对所述连接线赋权值:定义三个权值α、β、γ,满足α<β<γ,本地化任务对应的是用实线连接的数据块和物理节点形成处理关系的一类任务,在图中这类任务对应的连线的权值为α;非本地化任务对应的是用虚线连接的数据块和物理节点形成处理关系的一类任务,在所述二分图中这类任务对应的连线的权值为β或γ,其中所连接的数据块的物理位置与计算节点的物理位置若属于计算集群中的相同机架,则虚线权值为β,若所连接的数据块的物理位置与计算节点的物理位置分别属于计算集群中的不同机架,则虚线权值为γ;由此得抽象后的二分图模型;
步骤二.计算节点初始化:
将集群中各个物理计算节点的计算性能初始化为相同值,即假定每个物理计算节点在单位时间内均能处理相同数量的数据块;
步骤三.第一次模型扩展:
对步骤一所得的二分图模型进行扩展,通过虚拟增加数据块或者镜像计算节点,使扩展后的模型中计算节点数与数据块数相等,从而使扩展后的模型能使用KM带权最优匹配算法;
步骤四.生成第一次调度方案:
利用KM带权最优匹配算法对步骤三所得的经第一次扩展的模型进行匹配,得到一个全局权值最小的任务调度结果;若步骤三的模型扩展过程中通过虚拟增加了数据块,则将虚拟的数据块从调度结果的队列中剔除,若通过虚拟增加了镜像计算节点,则将调度结果中分配给每个镜像节点的任务分配至其相应的原始物理计算节点上,最终得第一次任务调度方案;
步骤五.物理计算节点实际性能评估:
执行第一次任务调度方案,待所有计算节点启动第一个任务后,通过各计算节点Map阶段处理的数据量和花费的时间计算各计算节点的实际计算性能。
步骤六.物理计算节点性能判定:
若步骤五所得的每个物理计算节点的实际计算性能均相同,则继续执行第一次任务调度方案直至任务调度完成;若不完全相同,则执行步骤七,且各个计算节点继续执行当前正在处理的任务;
步骤七.第二次模型扩展:
对步骤一所得的二分图模型进行扩展,使得扩展后的模型中计算节点数与整个集群中经第一次任务调度方案处理后剩余待处理的数据块数相等,从而使扩展后的模型能使用KM带权最优匹配算法;
步骤八.生成第二次调度方案:
利用KM带权最优匹配算法对步骤七所得的经第二次扩展的模型进行匹配,得到一个全局权值最小的任务调度结果;若步骤七通过虚拟增加了镜像计算节点,则将调度结果中分配给每个镜像节点的任务映射到其相应的原始物理计算节点上,最终得第二次任务调度方案;
步骤九.调度完成:
执行第二次调度任务方案对剩余的待处理数据块进行任务分配,完成任务调度。
2.根据权利要求1所述的基于MapReduce的最优本地化任务调度方法,其特征在于,步骤三所述的第一次模型扩展的具体扩展方式如下:
设计算集群中的物理计算节点数为n,所需处理的数据块数为M,则:
(1)若n≥M,则虚拟W1=n-M个数据块,把虚拟的数据块添加至步骤一所得的二分图模型中,每个虚拟的数据块与所有物理计算节点均用虚线相连,若计算集群有两个以上机架,则所述虚线赋权值γ;若计算集群只有一个机架,则所述虚线赋权值β;
(2)若n<M,则具体扩展方法如下:
理论上每个计算节点应处理的数据块数量T=M/n*Pi,其中Pi为对应计算节点的性能,由于第一次模型扩展前假设所有计算节点的计算性能相同,所以不妨设Pi都等于1,即T=M/n。由于通常情况下T为非整数,故对T向下取整得整数D,即T=D+Si',0≤Si'<1,则有M=n·D+S',其中=n·Si'为剩余未划分的数据块数量;
首先向每个物理计算节点分配D个数据块,而后在n个物理计算节点中随意选取S'个计算节点,将剩下的S'个数据块平均分配给所述S'个物理计算节点,完成任务划分;针对所述S'个物理计算节点,每个节点均通过虚拟增加D个镜像计算节点;剩余的每一个物理计算节点则通过虚拟增加D-1个镜像计算节点;所有镜像计算节点的计算性能均与其对应的原始物理计算节点的计算性能相同;
把镜像计算节点添加至步骤一所得的二分图模型中,每个镜像计算节点同所有数据块间的连接关系及相应权值与该镜像计算节点所对应的原始物理计算节点同所有数据块间的连接关系及相应权值相同,由此完成第一次模型扩展。
3.根据权利要求2所述的基于MapReduce的最优本地化任务调度方法,其特征在于,步骤七所述的第二次模型扩展的具体扩展方式如下:
设执行第一次任务调度方案后实际剩余的未处理数据块数为m,如果m=0,即n≥M,此时第一轮分配后没有任务即待处理数据块剩余,则不作处理。如果第一轮分配结果有拖后腿的任务则交给推测式任务(speculative task)处理;如果m>0,表示第二轮分配需要调整之前的计算节点性能一致假设前提下的分配结果,则:
(1)若n≥M,不作处理,此时没有待处理的任务,拖后腿的任务交由推测式执行的任务处理;
(2)若n>M,则具体扩展方法如下:
设Pi为第i个物理计算节点经步骤五所得的实际计算性能,i=1,…,n,对于剩余的m个数据块,理论上每个物理计算节点应处理的数据块数量Ti=m·Pi/(P1+…+Pn);通常情况下Ti为非整数,对Ti向下取整得整数Di,即Ti=Di+Si,0≤Si<1,则有m=(D1+…+Dn)+S,其中S=S1+…+Sn为剩余未分配数据块数量;
设Qr为集群中计算性能最高与最低的物理计算节点之间的实际计算性能值之比,对Qr向上取整得整数Q,即Qr≤Q<Qr+1,计算每个物理计算节点分别再处理Di+1,…,Di+Q个数据块所需要的时间加上该计算节点处理完正在处理的任务的剩余时间的和ti,1,…,ti,Q,由此得到n×Q个时间数据t1,1,…,t1,Q,…,ti,1,…,ti,Q,…,tn,1,…,tn,Q,按由小到大顺序对所述n×Q个时间数据进行排列并构成一个映射列表,列表中的每一个时间均映射一个其相应的物理计算节点;
选取映射列表中前S个时间所映射的S个物理计算节点,统计整个计算集群中第i个物理计算节点在这S个物理计算节点中出现的次数Li
针对第i个物理计算节点,通过虚拟增加(Di+Li-1)个与其计算性能相同的镜像计算节点,由此总计虚拟W4=(D1+L1-1)+…+(Dn+Ln-1)个镜像计算节点;
把镜像计算节点添加至步骤一所得的二分图模型中,断开正在处理的数据块所同各计算节点的连线并从二分图中剔除这些数据块;每个镜像计算节点同所有数据块的连接关系及相应权值与该镜像计算节点所对应的原始物理计算节点同所有数据块的连接关系及相应权值均相同,由此完成第二次模型扩展。
CN201510002039.1A 2015-01-04 2015-01-04 一种基于MapReduce的最优本地化任务调度方法 Expired - Fee Related CN104461748B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510002039.1A CN104461748B (zh) 2015-01-04 2015-01-04 一种基于MapReduce的最优本地化任务调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510002039.1A CN104461748B (zh) 2015-01-04 2015-01-04 一种基于MapReduce的最优本地化任务调度方法

Publications (2)

Publication Number Publication Date
CN104461748A true CN104461748A (zh) 2015-03-25
CN104461748B CN104461748B (zh) 2017-06-09

Family

ID=52907846

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510002039.1A Expired - Fee Related CN104461748B (zh) 2015-01-04 2015-01-04 一种基于MapReduce的最优本地化任务调度方法

Country Status (1)

Country Link
CN (1) CN104461748B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915250A (zh) * 2015-06-03 2015-09-16 电子科技大学 一种实现作业内的MapReduce数据本地化的方法
CN105357124A (zh) * 2015-11-22 2016-02-24 华中科技大学 一种MapReduce带宽优化方法
CN106250240A (zh) * 2016-08-02 2016-12-21 北京科技大学 一种任务优化调度方法
CN107241813A (zh) * 2017-05-22 2017-10-10 大连理工大学 一种基于Kuhn‑Munkres算法的收益率时间相关服务数据包的调度算法
CN107450855A (zh) * 2017-08-08 2017-12-08 山东浪潮云服务信息科技有限公司 一种用于分布式存储的模型可变的数据分布方法及系统
CN108769182A (zh) * 2018-05-24 2018-11-06 国网上海市电力公司 一种预测执行任务执行时间的组合优化调度方法
CN105224612B (zh) * 2015-09-14 2018-12-07 成都信息工程大学 基于动态标记优先值的MapReduce数据本地化方法
CN111556516A (zh) * 2020-05-25 2020-08-18 南京邮电大学 面向时延和能效敏感业务的分布式无线网络任务协同分配方法
CN112232711A (zh) * 2020-11-11 2021-01-15 北京理工大学 一种针对侦察任务的多同构无人车分布式任务分配方法
CN113014663A (zh) * 2021-03-12 2021-06-22 中南大学 支持跨节点计算任务抗毁接替的任务与资源匹配方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004670A (zh) * 2009-12-17 2011-04-06 华中科技大学 一种基于MapReduce的自适应作业调度方法
CN102012911A (zh) * 2010-11-19 2011-04-13 清华大学 基于约束优化的专家匹配方法及系统
US20130191843A1 (en) * 2011-08-23 2013-07-25 Infosys Limited System and method for job scheduling optimization

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004670A (zh) * 2009-12-17 2011-04-06 华中科技大学 一种基于MapReduce的自适应作业调度方法
CN102012911A (zh) * 2010-11-19 2011-04-13 清华大学 基于约束优化的专家匹配方法及系统
US20130191843A1 (en) * 2011-08-23 2013-07-25 Infosys Limited System and method for job scheduling optimization

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JIAHUI JIN等: "BAR:An Efficient Data Locality Driven Task Scheduling Algorithm for Cloud Computing", 《2011 11TH IEEE/ACM INTERNATIONAL SYMPOSIUM ON CLUSTER,CLOUD AND GRID COMPUTING》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915250A (zh) * 2015-06-03 2015-09-16 电子科技大学 一种实现作业内的MapReduce数据本地化的方法
CN104915250B (zh) * 2015-06-03 2018-04-06 电子科技大学 一种实现作业内的MapReduce数据本地化的方法
CN105224612B (zh) * 2015-09-14 2018-12-07 成都信息工程大学 基于动态标记优先值的MapReduce数据本地化方法
CN105357124A (zh) * 2015-11-22 2016-02-24 华中科技大学 一种MapReduce带宽优化方法
CN106250240B (zh) * 2016-08-02 2019-03-15 北京科技大学 一种任务优化调度方法
CN106250240A (zh) * 2016-08-02 2016-12-21 北京科技大学 一种任务优化调度方法
CN107241813A (zh) * 2017-05-22 2017-10-10 大连理工大学 一种基于Kuhn‑Munkres算法的收益率时间相关服务数据包的调度算法
CN107241813B (zh) * 2017-05-22 2020-04-07 大连理工大学 一种基于Kuhn-Munkres算法的收益率时间相关服务数据包的调度算法
CN107450855A (zh) * 2017-08-08 2017-12-08 山东浪潮云服务信息科技有限公司 一种用于分布式存储的模型可变的数据分布方法及系统
CN107450855B (zh) * 2017-08-08 2020-06-19 浪潮云信息技术有限公司 一种用于分布式存储的模型可变的数据分布方法及系统
WO2019223283A1 (zh) * 2018-05-24 2019-11-28 国网上海市电力公司 预测执行任务执行时间的组合优化调度方法
CN108769182A (zh) * 2018-05-24 2018-11-06 国网上海市电力公司 一种预测执行任务执行时间的组合优化调度方法
CN111556516A (zh) * 2020-05-25 2020-08-18 南京邮电大学 面向时延和能效敏感业务的分布式无线网络任务协同分配方法
CN111556516B (zh) * 2020-05-25 2022-08-16 南京邮电大学 面向时延和能效敏感业务的分布式无线网络任务协同分配方法
CN112232711A (zh) * 2020-11-11 2021-01-15 北京理工大学 一种针对侦察任务的多同构无人车分布式任务分配方法
CN112232711B (zh) * 2020-11-11 2022-10-21 北京理工大学 一种针对侦察任务的多同构无人车分布式任务分配方法
CN113014663A (zh) * 2021-03-12 2021-06-22 中南大学 支持跨节点计算任务抗毁接替的任务与资源匹配方法
CN113014663B (zh) * 2021-03-12 2022-03-18 中南大学 支持跨节点计算任务抗毁接替的任务与资源匹配方法

Also Published As

Publication number Publication date
CN104461748B (zh) 2017-06-09

Similar Documents

Publication Publication Date Title
CN104461748A (zh) 一种基于MapReduce的最优本地化任务调度方法
CN103235742B (zh) 多核集群服务器上基于依赖度的并行任务分组调度方法
CN103812949B (zh) 一种面向实时云平台的任务调度与资源分配方法及系统
CN109254842A (zh) 分布式流式系统的资源管理方法、装置及可读存储介质
Sarker et al. Performance-driven live migration of multiple virtual machines in datacenters
CN101551661B (zh) 一种面向多机器人系统的控制方法
CN111556516B (zh) 面向时延和能效敏感业务的分布式无线网络任务协同分配方法
Abdelhak et al. Energy-balancing task allocation on wireless sensor networks for extending the lifetime
CN102281290A (zh) 一种PaaS云平台的仿真系统及方法
CN102981890A (zh) 一种在虚拟化数据中心内的计算任务及虚拟机部署方法
CN104639466A (zh) 一种基于Storm实时流计算框架的应用网络带宽动态优先级保障方法
CN104615498A (zh) 一种基于任务迁移的集群系统动态负载均衡方法
CN104881322A (zh) 一种基于装箱模型的集群资源调度方法及装置
CN103399626A (zh) 面向混合计算环境的功耗感知的并行应用调度系统及方法
CN111159859B (zh) 一种云容器集群的部署方法及系统
CN103455375A (zh) Hadoop云平台下基于负载监控的混合调度方法
CN105335236B (zh) 一种分布式取证动态负载均衡调度方法和装置
Djebbar et al. Optimization of tasks scheduling by an efficacy data placement and replication in cloud computing
CN107370689B (zh) 一种1553b总线的消息负载均衡方法
CN105227616A (zh) 一种遥感卫星地面处理系统任务动态创建与分配的方法
CN105426247A (zh) 一种hla联邦成员规划调度方法
CN103176850A (zh) 一种基于负载均衡的电力系统网络集群任务分配方法
CN111049900B (zh) 一种物联网流计算调度方法、装置和电子设备
CN105430074A (zh) 基于数据依赖性和访问量云数据分配存储优化方法及系统
CN104852860A (zh) 一种基于队列的异构资源多目标调度策略

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170609

Termination date: 20200104

CF01 Termination of patent right due to non-payment of annual fee