CN105302647A - 一种MapReduce中备份任务推测执行策略的优化方案 - Google Patents

一种MapReduce中备份任务推测执行策略的优化方案 Download PDF

Info

Publication number
CN105302647A
CN105302647A CN201510752617.3A CN201510752617A CN105302647A CN 105302647 A CN105302647 A CN 105302647A CN 201510752617 A CN201510752617 A CN 201510752617A CN 105302647 A CN105302647 A CN 105302647A
Authority
CN
China
Prior art keywords
task
data
time
backup
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510752617.3A
Other languages
English (en)
Other versions
CN105302647B (zh
Inventor
刘琦
蔡卫东
肖博
沈剑
付章杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foresight (Wuxi) big data Technology Co.,Ltd.
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN201510752617.3A priority Critical patent/CN105302647B/zh
Publication of CN105302647A publication Critical patent/CN105302647A/zh
Application granted granted Critical
Publication of CN105302647B publication Critical patent/CN105302647B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种MapReduce中备份任务推测执行策略的优化方案,采用指数平滑算法,结合集群中节点实时性能,对任务运行各阶段的时间分别计算,达到对任务运行的剩余时间进行准确预测的目的。解决了默认情况下,推测执行准确率低,由于错误地启动备份任务的问题。本方案极大程度的提高推测执行的正确率,节省了任务运行的时间,有效地节约了集群中有限的资源。

Description

一种MapReduce中备份任务推测执行策略的优化方案
技术领域
本发明属于云计算领域,具体涉及一种MapReduce中备份任务推测执行策略的优化方案。
背景技术
MapReduce是一个流行的编程模型处理大型数据集的目的。MapReduce可以分为map和reduce两种任务,map任务包含map阶段,reduce任务包括shuffle、merge和reduce阶段。MapReduce任务执行时间通常是由那些性能较低的节点决定。推测执行策略被称为处理上述问题的一种方法;具体来说是通过将低性能的机器上运行这些任务备份到性能更高机器上的。
尽管多个推测执行策略被提出了,仍有很多缺陷存在于策略。传统的推测执行策略,推测执行的准确率低,错误的启动推测执行策略,将消耗更多的资源。极端情况下,会导致整个集群运行速度的快速下降。甚至陷入由于资源的反复竞争,使整个集群陷入死锁的状态,最终可能导致任务的失败。此外,在云环境中,出售资源,或者说服务就是收益的一种方式,介绍资源消耗,就相当与是增加某个集群所带来的经济效益,如:某用户购买了某公司云计算服务(按时间计费),当用户提交一个作业时,采用默认的策略可能需要消耗20分钟,采用优化的策略则可以节约时间5分钟,这样就为用户节约了费用;最坏情况下,由于不合理地启动备份任务,会导致任务的失败,造成资源的浪费,而优化过后的策略则可以避免上述情况,提高了用户的满意度,所以提高备份任务推测执行策略的准确率有其必要性。
基于上述问题,一种MapReduce中备份任务推测执行策略的优化方案,采用指数平滑算法,集合集群中节点实时性能,极大程度的克服了原有策略准确率低,错误地启动备份任务,导致过度消耗集群资源。本方案提高了推测执行的正确率,有效地节约了资源,大大提升了整个集群的运行速度,缩短了任务执行所需要消耗的时间。
发明内容
本发明的目的是提供一种MapReduce中备份任务推测执行策略的优化方案,采用指数平滑算法,集合集群中节点实时性能,对任务运行的剩余时间进行准确的预测。解决默认情况下,推测执行准确率低,由于错误地启动备份任务的问题。极大程度的提高了推测执行的正确率,有效地节约了集群中有限的资源。
本发明所提供的一种MapReduce中备份任务推测执行策略的优化方案主要包括4个步骤:预测当前各任务完成时间、预测新任务完成时间、选择需备份的任务和选择在哪个节点上备份执行。
具体步骤如下:
(5)预测当前各任务完成时间
具体来说需根据以下公式:
其中,Trem代表当前任务总的剩余时间,它由当前阶段剩余时间和剩余阶段总的剩余时间组成。进一步的化简公式中,p代表剩余阶段中的某一个,fp代表剩余所有的阶段,代表某阶段p的平均完成时间。factord是个参数,可以表示为当前数据处理量和平均每个任务数据处理量的比值,datainput代表当前处理数据量,dataavg代表平均每个节点的处理数据量。其次,我们根据平滑处理后的公式来计算当前阶段的剩余时间。
(6)预测新任务完成时间:新任务的完成时间依据以下公式
Tbf=TimeStamp+Tavg
其中,Tbf代表备份任务完成的时刻,TimeStamp代表当前时刻,Tavg代表已经完成的任务在该阶段所用的时间。
(7)选则需备份的任务
遍历所有任务,选择如果开启备份执行,最后可能是有效任务的任务,也就是说,剩余执行时间和假如开启备份任务完成时间差最大的任务
(8)选择在哪个节点上备份执行
根据节点的位置进行分类:分为Data-Local、Rack-Local以及Other-Local,优先选择Data-Local,其次再根据剩余资源选择当前最优节点,会更有可能成为有效的推测执行。
有益效果
本发明解决了传统的推测执行策略,推测执行的准确率低,市场会错误地启动推测执行策略等缺点。本方案极大程度的提高了推测执行的正确率,有效地节约了资源,大大提升了整个集群的运行速度,缩短了任务执行所需要消耗的时间。
附图说明
图1为一种MapReduce中备份任务推测执行策略的优化方案的流
程图;
图2为WordCount执行时间的比较;
图3为Grep执行时间的比较。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。以下结合实际部署情况为例来说明本发明。
本发明所提供的一种MapReduce中备份任务推测执行策略的优化方案主要包括4个步骤,如图1中所示,具体为:预测当前各任务完成时间、预测新任务完成时间、选择需备份的任务和选择在哪个节点上备份执行。
具体步骤如下:
(1)预测当前各任务完成时间
具体来说是根据以下公式:
其中,Trem代表当前任务总的剩余时间,它由当前阶段剩余时间和剩余阶段总的剩余时间组成。进一步的化简公式中,p代表剩余阶段中的某一个,fp代表剩余所有的阶段,代表某阶段p的平均完成时间。factord是个参数,可以表示为当前数据处理量和平均每个任务数据处理量的比值,datainput代表当前处理数据量,dataavg代表平均每个节点的处理数据量。当前阶段是shuffle阶段时,我们设置factord为1,因为shuffle未完成时难以估估计处理的数据量。
其次,我们根据平滑处理后的公式来计算当前阶段的剩余时间,平滑处理的公式如下:
vpt=a*vot+(1-a)*vpt-1,a=0.1,
vpt代表预测的速度,vot代表观测到的速度,vpt-1代表上一时刻的预测速度,a是其中一个参数,设置为0.1。则完成当前阶段剩余数据量需要时间可以表示为:
(2)预测新任务完成时间:新任务的完成时间依据以下公式
Tbf=TimeStamp+Tavg
其中,Tbf代表备份任务完成的时刻,TimeStamp代表当前时刻,Tavg代表已经完成的任务在该阶段所用的时间。
(3)选则需备份的任务
遍历所有任务,对每个任务计算Difference=Trem-Tbf
对于其中Difference小于0的任务直接舍弃,相互比较记录下Difference的最大值,对应的任务为需要开启备份任务的节点。
(4)选择在哪个节点上开启备份执行
根据节点的位置进行分类:分为Data-Local、Data-Rack以及Data-Other,优先选择Data-Local,其次再根据剩余资源选择当前最优节点,具体选择方式如下:
根据Ratio选择,选择出值最大的节点,代表着剩余资源相对丰富的点,将备份的任务交由这些节点执行,会更有可能成为有效的推测执行。
对提出的策略与原有策略进行课比较,分别运行了WordCount、Grep应用,WordCount和Grep的数据集为50GB。在不同策略下,每组实验进行了5次,了取平均值,MR-None代表在MapReduce里面禁用了推测执行策略;MR-Original代表在MapReduce里面采用了原始推测执行策略,MR-Optimized代表在MapReduce里面采用了本文提出的推测执行策略。
实验产生的结果如图2、图3所示,详细来说,我们的策略比原有策略减少了至少15%的执行时间;相对禁用该策略的情况,执行时间减少了了25%。

Claims (1)

1.一种MapReduce中备份任务推测执行策略的优化方案,其特征在于,包括4个步骤:预测当前各任务完成时间、预测新任务完成时间、选择需备份的任务和选择在哪个节点上备份执行;
具体步骤如下:
(1)预测当前各任务完成时间
具体来说需根据以下公式:
T r e m = T c p + T f p = T c p + Σ p inf p T avg p * factor d
factor d = data i n p u t data a v g
其中,Trem代表当前任务总的剩余时间,它由当前阶段剩余时间和剩余阶段总的剩余时间组成;进一步的化简公式中,p代表剩余阶段中的某一个,fp代表剩余所有的阶段,代表某阶段p的平均完成时间;factord是个参数,可以表示为当前数据处理量和平均每个任务数据处理量的比值,datainput代表当前处理数据量,dataavg代表平均每个节点的处理数据量;其次,我们根据平滑处理后的公式来计算当前阶段的剩余时间;
(2)预测新任务完成时间:新任务的完成时间依据以下公式
Tbf=TimeStamp+Tavg
其中,Tbf代表备份任务完成的时刻,TimeStamp代表当前时刻,Tavg代表已经完成的任务在该阶段所用的时间;
(3)选则需备份的任务
遍历所有任务,选择如果开启备份执行,最后可能是有效任务的任务,也就是说,剩余执行时间和假如开启备份任务完成时间差最大的任务;
(4)选择在哪个节点上备份执行
根据节点的位置进行分类:分为Data-Local、Rack-Local以及Other-Local,优先选择Data-Local,其次再根据剩余资源选择当前最优节点,会更有可能成为有效的推测执行。
CN201510752617.3A 2015-11-06 2015-11-06 一种MapReduce中备份任务推测执行策略的优化方案 Active CN105302647B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510752617.3A CN105302647B (zh) 2015-11-06 2015-11-06 一种MapReduce中备份任务推测执行策略的优化方案

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510752617.3A CN105302647B (zh) 2015-11-06 2015-11-06 一种MapReduce中备份任务推测执行策略的优化方案

Publications (2)

Publication Number Publication Date
CN105302647A true CN105302647A (zh) 2016-02-03
CN105302647B CN105302647B (zh) 2019-04-16

Family

ID=55199940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510752617.3A Active CN105302647B (zh) 2015-11-06 2015-11-06 一种MapReduce中备份任务推测执行策略的优化方案

Country Status (1)

Country Link
CN (1) CN105302647B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808334A (zh) * 2016-03-04 2016-07-27 山东大学 一种基于资源重用的MapReduce短作业优化系统及方法
CN110221909A (zh) * 2019-06-13 2019-09-10 东北大学 一种基于负载预测的Hadoop计算任务推测执行方法
CN112685224A (zh) * 2019-10-17 2021-04-20 伊姆西Ip控股有限责任公司 任务管理的方法、设备和计算机程序产品
WO2024041119A1 (zh) * 2022-08-23 2024-02-29 华为技术有限公司 数据备份方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065701A (ja) * 2005-08-29 2007-03-15 Matsushita Electric Ind Co Ltd システム動作モニタ装置
CN104102794A (zh) * 2014-08-06 2014-10-15 浪潮电子信息产业股份有限公司 一种hadoop调度法的优化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065701A (ja) * 2005-08-29 2007-03-15 Matsushita Electric Ind Co Ltd システム動作モニタ装置
CN104102794A (zh) * 2014-08-06 2014-10-15 浪潮电子信息产业股份有限公司 一种hadoop调度法的优化方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808334A (zh) * 2016-03-04 2016-07-27 山东大学 一种基于资源重用的MapReduce短作业优化系统及方法
CN110221909A (zh) * 2019-06-13 2019-09-10 东北大学 一种基于负载预测的Hadoop计算任务推测执行方法
CN110221909B (zh) * 2019-06-13 2023-01-17 东北大学 一种基于负载预测的Hadoop计算任务推测执行方法
CN112685224A (zh) * 2019-10-17 2021-04-20 伊姆西Ip控股有限责任公司 任务管理的方法、设备和计算机程序产品
WO2024041119A1 (zh) * 2022-08-23 2024-02-29 华为技术有限公司 数据备份方法和装置

Also Published As

Publication number Publication date
CN105302647B (zh) 2019-04-16

Similar Documents

Publication Publication Date Title
WO2024060789A1 (zh) 面向智能计算的分布式训练任务调度方法、系统和装置
CN105302647A (zh) 一种MapReduce中备份任务推测执行策略的优化方案
CN111079921A (zh) 一种基于异构分布式系统的高效神经网络训练调度方法
DE102020108374A1 (de) Verfahren und vorrichtung zur laufzeitmehrfachplanung von software, die in einem heterogenen system ausgeführt wird
CN106201718A (zh) 一种基于负载预测的云计算资源动态伸缩方法
CN107612886A (zh) 一种Spark平台Shuffle过程压缩算法决策方法
WO2019196427A1 (zh) 基于支撑故障事件约束机组组合的备用优化方法和装置
CN110209467B (zh) 一种基于机器学习的弹性资源扩展方法和系统
DE102020110655A1 (de) Verfahren und vorrichtung zum verbessern der verwendung eines heterogenen systems, das software ausführt
CN107728466A (zh) 一种适用于数控系统固定优先级可靠性感知能耗优化方法
CN110458326B (zh) 一种分布式阻塞型流水线调度的混合群智能优化方法
CN111061565B (zh) 一种Spark环境下的两段式流水线任务调度方法及系统
CN110221909A (zh) 一种基于负载预测的Hadoop计算任务推测执行方法
CN114327811A (zh) 一种任务调度方法、装置、设备及可读存储介质
CN117439066A (zh) 一种电网在线调度系统、方法和存储介质
Nair et al. Maple-edge: A runtime latency predictor for edge devices
CN103442087B (zh) 一种基于响应时间趋势分析的Web服务系统访问量控制装置和方法
Yang et al. Bi-level energy management strategy for power-split plug-in hybrid electric vehicles: A reinforcement learning approach for prediction and control
CN101751298A (zh) 一种基于能量和时间约束的移动网格任务调度方法
CN103870904A (zh) 一种PaaS平台健康状态管理方法和装置
CN116774657A (zh) 一种基于鲁棒优化的再制造车间动态调度方法
CN111597035A (zh) 基于多线程的仿真引擎时间推进方法及系统
Bilolikar et al. An annealed genetic algorithm for multi mode resource constrained project scheduling problem
US20140173340A1 (en) Incident handling
CN104239100A (zh) 一种通用数据处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 210000 No. 219 Ning six road, Jiangbei new district, Nanjing, Jiangsu

Patentee after: NANJING University OF INFORMATION SCIENCE & TECHNOLOGY

Address before: 210000 No. 69 Olympic Sports street, Jianye District, Jiangsu, Nanjing

Patentee before: NANJING University OF INFORMATION SCIENCE & TECHNOLOGY

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211118

Address after: 214199 203, floor 2, building 10, No. 50, Shanhe Road, anzhen street, Xishan District, Wuxi City, Jiangsu Province

Patentee after: Foresight (Wuxi) big data Technology Co.,Ltd.

Address before: No.219, ningliu Road, Jiangbei new district, Nanjing, Jiangsu Province, 210000

Patentee before: NANJING University OF INFORMATION SCIENCE & TECHNOLOGY