CN108108233B - 任务多副本执行的集群作业调度方法及系统 - Google Patents

任务多副本执行的集群作业调度方法及系统 Download PDF

Info

Publication number
CN108108233B
CN108108233B CN201711228523.1A CN201711228523A CN108108233B CN 108108233 B CN108108233 B CN 108108233B CN 201711228523 A CN201711228523 A CN 201711228523A CN 108108233 B CN108108233 B CN 108108233B
Authority
CN
China
Prior art keywords
task
optimization problem
copies
cluster
tasks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711228523.1A
Other languages
English (en)
Other versions
CN108108233A (zh
Inventor
薛广涛
曹燕华
钱诗友
俞嘉地
李明禄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201711228523.1A priority Critical patent/CN108108233B/zh
Publication of CN108108233A publication Critical patent/CN108108233A/zh
Application granted granted Critical
Publication of CN108108233B publication Critical patent/CN108108233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Feedback Control In General (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

本发明提供了一种任务多副本执行的集群作业调度方法及系统,包括:拖后腿机器寻找:运用机器学习的方法,找出当前运行任务的拖后腿机器;最优副本数计算:拖后腿机器上的任务副本和所有任务同时启动,并且建立以最小化任务执行时间和运行成本为目标的优化模型,然后运用交替方向方法求解优化模型得出启动副本的最优数量。本发明免去了检测过程和拖后腿任务在被发现之前的执行时间;建立了以同时最小化作业的流程时间和在集群中的计算成本为优化目标,以集群中所有执行的任务数不超过集群中可用的计算节点数和每个任务的副本数不超过给定的阈值为限制条件的最优化模型。

Description

任务多副本执行的集群作业调度方法及系统
技术领域
本发明涉及计算机技术领域,具体地,涉及一种基于机器学习的任务多副本执行的集群作业调度方法及系统。
背景技术
支持向量机(SVM)是90年代中期发展起来的基于统计学习理论的一种机器学习方法,通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。
交替方向乘子法(Alternating Direction Method of Multiplier-ADMM)是一种求解优化问题的计算框架,适用于求解分布式凸优化问题,特别是统计学习问题,该方法整合了对偶上升算法的可分解性与增广朗格朗日乘数法优秀的收敛性质,分解原函数和扩增函数,将大的全局问题分解为多个较小、较容易求解的局部子问题,以便在对目标函数更一般的假设条件下并行优化,引入新变量,然后交叉换方向来交替优化。
随着集群规模和复杂性的日益增长,如何保障集群性能的可测量性和可预测变得日趋重要,然而集群中拖后腿现象的普遍存在是影响集群性能可预测性的关键因素,它使得运行在某个集群中某个计算节点上的任务的执行时间大量的延长,导致对于任务完成时间无法估计,极大地影响了集群性能。针对这种拖后腿的现象最基本的做法是在其他机器上运行拖后腿的任务的若干副本,当任何一个副本最先执行完任务之后,即该任务执行完成,且终止和清除其他还在运行的副本及数据,其中最经典的算法就是推测执行方法,根据每个任务的执行情况推测哪些任务会成为拖后腿的任务,然后根据推测结果在其他机器上执行拖后腿任务的副本,这种只有在出现拖后腿现象才执行副本的被动方法在一些对延迟特别敏感的任务中性能表现并不是很好。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种任务多副本执行的集群作业调度方法及系统。
根据本发明提供的一种任务多副本执行的集群作业调度方法,包括:
拖后腿机器寻找步骤:运用机器学习的方法,找出当前运行任务的拖后腿机器;
最优副本数计算步骤:拖后腿机器上的任务副本和所有任务同时启动,并且建立以最小化任务执行时间和运行成本为目标的优化模型,然后运用交替方向方法求解优化模型得出启动副本的最优数量。
较佳的,所述拖后腿机器寻找步骤具体包括:
在计算节点的集群中分别运行不同类型的任务一定时间,得到多条训练样本,选定训练样本的特征使得分类函数线性可分,训练样本的特征分别是计算节点上运行任务的工作负载wi,之前发生拖后腿现象的次数ni,计算节点的cpu wc和内存wm负载,因此分类函数为:f(X)=wTX+b,其中X=[ws,ns,wc,wm],为求出参数wT与b,转化到下面的优化问题一:
Figure BDA0001487740630000021
s.t.,yi(wTxi+b)≥1,i=1,...,n
yi=1表示第i个任务运行在计算节点上不会拖后腿,yi=-1表示第i个任务运行在计算节点上会拖后腿,转化优化问题一得到优化问题二:
Figure BDA0001487740630000022
s.t.,yi(wTxi+b)≥1,i=1,...,n
求解优化问题二,采用增广朗格朗日乘数法,将约束条件融入到目标函数里,得到优化问题三:
Figure BDA0001487740630000023
利用拉格朗日对偶,将优化问题三转化为对偶问题:
Figure BDA0001487740630000024
根据对偶问题求得参数w与b。
较佳的,所述最优副本数计算步骤具体包括:
作业i由mi任务组成,每个任务不能被抢占,αi表示第i个作业到达的时间,
Figure BDA0001487740630000031
表示任务
Figure BDA0001487740630000032
的副本数,Ti j,k表示任务
Figure BDA0001487740630000033
的第k个副本运行的时间,假设Ti j,k是独立同分布的随机变量且
Figure BDA0001487740630000034
一旦一个副本最先完成,其他的副本被终止运行并且删除运行所需要和产生的所有数据,
Figure BDA0001487740630000035
表示任务
Figure BDA0001487740630000036
的完成时间,
Figure BDA0001487740630000037
Figure BDA0001487740630000038
因此作业i的流程时间:
Figure BDA0001487740630000039
考虑两个性能指标,作业流程时间Γi和计算成本,其中计算成本用集群运行作业i的所有时间来量化,因此作业i的计算成本为
Figure BDA00014877406300000310
ξ表示每个任务最大能生成的副本数,且
Figure BDA00014877406300000311
因此以最小化作业流程时间和作业的计算成本为目标得到如下优化问题五:
Figure BDA00014877406300000312
Figure BDA00014877406300000313
Figure BDA00014877406300000314
Figure BDA00014877406300000315
Figure BDA00014877406300000316
其中M表示集群中可用的计算节点的数量,β是调节参数,β设置的越小,则作业的流程时间在优化目标中占主导更大,反之则计算成本是优化问题五主要考虑的目标;
用交替方向法乘子法来求解优化问题五,引入变量cl,0≤cl≤M,使得优化问题五的第一个限制条件变成一个等式
Figure BDA00014877406300000317
且相应的目标函数是fl(cl)=0,
Figure BDA00014877406300000318
由此将优化问题五转化成优化问题六:
Figure BDA00014877406300000319
Figure BDA0001487740630000041
Figure BDA0001487740630000042
0≤cl≤M
Figure BDA0001487740630000043
Figure BDA0001487740630000044
将优化问题六转化成增广拉格朗日函数形式:
Figure BDA0001487740630000045
在第r次的迭代中,增广拉格朗日函数更新如下:
Figure BDA0001487740630000046
Figure BDA0001487740630000047
Figure BDA0001487740630000048
λr+1分别表示
Figure BDA0001487740630000049
和λ在第r次迭代之后的值,η>0,表示步长。
根据本发明提供的一种任务多副本执行的集群作业调度系统,包括:
拖后腿机器寻找模块:运用机器学习的方法,找出当前运行任务的拖后腿机器;
最优副本数计算模块:拖后腿机器上的任务副本和所有任务同时启动,并且建立以最小化任务执行时间和运行成本为目标的优化模型,然后运用交替方向方法求解优化模型得出启动副本的最优数量。
较佳的,所述拖后腿机器寻找模块具体包括:
在计算节点的集群中分别运行不同类型的任务一定时间,得到多条训练样本,选定训练样本的特征使得分类函数线性可分,训练样本的特征分别是计算节点上运行任务的工作负载wi,之前发生拖后腿现象的次数ni,计算节点的cpu wc和内存wm负载,因此分类函数为:f(X)=wTX+b,其中X=[ws,ns,wc,wm],为求出参数wT与b,转化到下面的优化问题一:
Figure BDA00014877406300000410
s.t.,yi(wTxi+b)≥1,i=1,...,n
yi=1表示第i个任务运行在计算节点上不会拖后腿,yi=-1表示第i个任务运行在计算节点上会拖后腿,转化优化问题一得到优化问题二:
Figure BDA0001487740630000051
s.t.,yi(wTxi+b)≥1,i=1,...,n
求解优化问题二,采用增广朗格朗日乘数法,将约束条件融入到目标函数里,得到优化问题三:
Figure BDA0001487740630000052
利用拉格朗日对偶,将优化问题三转化为对偶问题:
Figure BDA0001487740630000053
根据对偶问题求得参数w与b。
较佳的,所述最优副本数计算模块具体包括:
作业i由mi任务组成,每个任务不能被抢占,αi表示第i个作业到达的时间,
Figure BDA0001487740630000054
表示任务
Figure BDA0001487740630000055
的副本数,Ti j,k表示任务
Figure BDA0001487740630000056
的第k个副本运行的时间,假设Ti j,k是独立同分布的随机变量且Pr{Ti j,k≤x}=Fi(x),一旦一个副本最先完成,其他的副本被终止运行并且删除运行所需要和产生的所有数据,
Figure BDA0001487740630000057
表示任务
Figure BDA0001487740630000058
的完成时间,
Figure BDA0001487740630000059
Figure BDA00014877406300000510
因此作业i的流程时间:
Figure BDA00014877406300000511
考虑两个性能指标,作业流程时间Γi和计算成本,其中计算成本用集群运行作业i的所有时间来量化,因此作业i的计算成本为
Figure BDA00014877406300000512
ξ表示每个任务最大能生成的副本数,且
Figure BDA00014877406300000513
因此以最小化作业流程时间和作业的计算成本为目标得到如下优化问题五:
Figure BDA00014877406300000514
Figure BDA00014877406300000515
Figure BDA00014877406300000516
Figure BDA00014877406300000517
Figure BDA0001487740630000061
其中M表示集群中可用的计算节点的数量,β是调节参数,β设置的越小,则作业的流程时间在优化目标中占主导更大,反之则计算成本是优化问题五主要考虑的目标;
用交替方向法乘子法来求解优化问题五,引入变量cl,0≤cl≤M,使得优化问题五的第一个限制条件变成一个等式
Figure BDA0001487740630000062
且相应的目标函数是fl(cl)=0,
Figure BDA0001487740630000063
由此将优化问题五转化成优化问题六:
Figure BDA0001487740630000064
Figure BDA0001487740630000065
Figure BDA0001487740630000066
0≤cl≤M
Figure BDA0001487740630000067
Figure BDA0001487740630000068
将优化问题六转化成增广拉格朗日函数形式:
Figure BDA0001487740630000069
在第r次的迭代中,增广拉格朗日函数更新如下:
Figure BDA00014877406300000610
Figure BDA00014877406300000611
Figure BDA00014877406300000612
λr+1分别表示
Figure BDA00014877406300000613
和λ在第r次迭代之后的值,η>0,表示步长。
与现有技术相比,本发明具有如下的有益效果:
本发明在任务开始执行之前通过机器学习的方法找出会成为拖后腿的任务,然后启动拖后腿任务的副本,这是一种主动的处理集群中拖后腿的现象,相比于推测执行方法,免去了检测过程和拖后腿任务在被发现之前的执行时间;本发明建立了以同时最小化作业的流程时间和在集群中的计算成本为优化目标,以集群中所有执行的任务数不超过集群中可用的计算节点数和每个任务的副本数不超过给定的阈值为限制条件的最优化模型。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为任务多副本执行的集群作业调度框架图;
图2为集群中第i个作业的任务调度流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
在本发明中,提出了一种基于机器学习的任务多副本执行的集群作业调度策略,运用机器学习的方法,找出当前运行任务的拖后腿的计算节点(计算机器),使得拖后腿节点上的任务副本和所有任务同时启动,并且建立以最小化任务执行时间和运行成本为目标的优化模型,然后运用交替方向方法求解此优化问题得出启动副本的最优数量。
本发明提供的一种任务多副本执行的集群作业调度方法包括:
一、寻找拖后腿的计算节点(机器)
在拥有40台机器的集群规模中,分别运行wordcount,Top K这两类应用(这两类应用各处理了两个不同大小的数据集)的任务一个月,得到1000条训练样本,选定训练样本的特征使得分类函数线性可分的,其训练样本的特征分别是该机器上运行任务的工作负载wi,之前发生拖后腿现象的次数ni,该机器的cpu wc和内存wm负载,因此分类函数为:f(X)=wTX+b,其中X=[ws,ns,wc,wm],为求出参数wT与b,转化到下面优化目标:
Figure BDA0001487740630000071
s.t.,yi(wTxi+b)≥1,i=1,...,n
yi=1表示第i个任务运行在计算节点上不会拖后腿,yi=-1表示第i个任务运行在计算节点上会拖后腿。转化优化问题(1)得到:
Figure BDA0001487740630000081
s.t.,yi(wTxi+b)≥1,i=1,...,n
求解以上优化问题(2),我们采用增广朗格朗日乘数法,将约束条件融入到目标函数里,得到:
Figure BDA0001487740630000082
发现问题依然比较难解,利用拉格朗日对偶,将优化问题(3)转化为其对偶问题:
Figure BDA0001487740630000083
最后根据优化问题(4)求得参数w与b。
二、求得最优的副本数
由一发现某个任务运行在某个计算节点上会成为拖后腿的任务,在其他计算节点上启动若干副本同时运行,将此问题进行优化建模。
一个作业i由mi任务组成,每个任务是不可以被抢占的,αi表示第i个作业到达的时间,
Figure BDA0001487740630000084
表示任务
Figure BDA0001487740630000085
的副本数,Ti j,k表示任务
Figure BDA0001487740630000086
的第k个副本运行的时间,假设Ti j,k是独立同分布的随机变量且Pr{Ti j,k≤x}=Fi(x),一旦一个副本最先完成,其他的副本被终止运行并且删除运行所需要和产生的所有数据。
Figure BDA0001487740630000087
表示任务
Figure BDA0001487740630000088
的完成时间,
Figure BDA0001487740630000089
因此作业i的流程时间:
Figure BDA00014877406300000810
Figure BDA00014877406300000811
我们考虑两个性能指标,作业流程时间Γi和计算成本,其中计算成本用集群运行作业i的所有时间来量化,因此作业i的计算成本为
Figure BDA00014877406300000812
ξ表示每个任务最大能生成的副本数,且
Figure BDA00014877406300000813
因此以最小化作业流程时间和作业的计算成本为目标得到如下优化模型:
Figure BDA00014877406300000814
Figure BDA00014877406300000815
Figure BDA0001487740630000091
Figure BDA0001487740630000092
Figure BDA0001487740630000093
其中M表示集群中可用的计算节点的数量,β是调节参数,如果β设置的比较小,则作业的流程时间在优化目标中占主导,反之则计算成本是优化问题(5)主要考虑的目标。
由于优化问题(5)是一个凸优化问题,我们考虑用交替方向法乘子法来求解优化问题(5)。
由优化问题(5)可以看出,其优化目标是可分离的,但是限制条件不满足交替方向法的等式条件,因此我们引入变量cl,0≤cl≤M,使得问题(5)的第一个限制条件变成一个等式
Figure BDA0001487740630000094
且相应的目标函数是fl(cl)=0,
Figure BDA0001487740630000095
由此我们将优化问题(5)转化成如下形式:
Figure BDA0001487740630000096
Figure BDA0001487740630000097
Figure BDA0001487740630000098
0≤cl≤M
Figure BDA00014877406300000913
Figure BDA0001487740630000099
首先,将优化问题(6)转化成增广拉格朗日函数形式:
Figure BDA00014877406300000910
在第r次的迭代中,等式更新如下:
Figure BDA00014877406300000911
Figure BDA00014877406300000912
Figure BDA0001487740630000101
λr+1分别表示
Figure BDA0001487740630000102
和λ在第r次迭代之后的值,η>0,表示步长。
图1为集群任务调度的四个基本组成模块:作业管理器,调度系统,资源检测器和分类器。
图2展示了集群中第i个作业的mi个任务调度的基本流程。首先作业管理器将作业i分成mi个任务,每个任务分别运行在mi个不同的计算节点上,将每个任务的Xj输入到分类器,将分类器的结果输出到调度系统模块,从而得到每个任务的调度决策(即每个任务的副本数量)。
基于上述一种基于机器学习的任务多副本执行的集群作业调度方法,本发明还提供了一种任务多副本执行的集群作业调度系统,包括:
拖后腿机器寻找模块:运用机器学习的方法,找出当前运行任务的拖后腿机器;
最优副本数计算模块:拖后腿机器上的任务副本和所有任务同时启动,并且建立以最小化任务执行时间和运行成本为目标的优化模型,然后运用交替方向方法求解优化模型得出启动副本的最优数量。
拖后腿机器寻找模块具体包括:
在计算节点的集群中分别运行不同类型的任务一定时间,得到多条训练样本,选定训练样本的特征使得分类函数线性可分,训练样本的特征分别是计算节点上运行任务的工作负载wi,之前发生拖后腿现象的次数ni,计算节点的cpu wc和内存wm负载,因此分类函数为:f(X)=wTX+b,其中X=[ws,ns,wc,wm],为求出参数wT与b,转化到下面的优化问题一:
Figure BDA0001487740630000103
s.t.,yi(wTxi+b)≥1,i=1,...,n
yi=1表示第i个任务运行在计算节点上不会拖后腿,yi=-1表示第i个任务运行在计算节点上会拖后腿,转化优化问题一得到优化问题二:
Figure BDA0001487740630000104
s.t.,yi(wTxi+b)≥1,i=1,...,n
求解优化问题二,采用增广朗格朗日乘数法,将约束条件融入到目标函数里,得到优化问题三:
Figure BDA0001487740630000111
利用拉格朗日对偶,将优化问题三转化为对偶问题:
Figure BDA0001487740630000112
根据对偶问题求得参数w与b。
最优副本数计算模块具体包括:
作业i由mi任务组成,每个任务不能被抢占,αi表示第i个作业到达的时间,
Figure BDA0001487740630000113
表示任务
Figure BDA0001487740630000114
的副本数,Ti j,k表示任务
Figure BDA0001487740630000115
的第k个副本运行的时间,假设Ti j,k是独立同分布的随机变量且Pr{Ti j,k≤x}=Fi(x),一旦一个副本最先完成,其他的副本被终止运行并且删除运行所需要和产生的所有数据,
Figure BDA0001487740630000116
表示任务
Figure BDA0001487740630000117
的完成时间,
Figure BDA0001487740630000118
Figure BDA0001487740630000119
因此作业i的流程时间:
Figure BDA00014877406300001110
考虑两个性能指标,作业流程时间Γi和计算成本,其中计算成本用集群运行作业i的所有时间来量化,因此作业i的计算成本为
Figure BDA00014877406300001111
ξ表示每个任务最大能生成的副本数,且
Figure BDA00014877406300001112
因此以最小化作业流程时间和作业的计算成本为目标得到如下优化问题五:
Figure BDA00014877406300001113
Figure BDA00014877406300001114
Figure BDA00014877406300001115
Figure BDA00014877406300001116
Figure BDA00014877406300001117
其中M表示集群中可用的计算节点的数量,β是调节参数,β设置的越小,则作业的流程时间在优化目标中占主导更大,反之则计算成本是优化问题五主要考虑的目标;
用交替方向法乘子法来求解优化问题五,引入变量cl,0≤cl≤M,使得优化问题五的第一个限制条件变成一个等式
Figure BDA00014877406300001118
且相应的目标函数是fl(cl)=0,
Figure BDA0001487740630000121
由此将优化问题五转化成优化问题六:
Figure BDA0001487740630000122
Figure BDA0001487740630000123
Figure BDA0001487740630000124
0≤cl≤M
Figure BDA0001487740630000125
Figure BDA0001487740630000126
将优化问题六转化成增广拉格朗日函数形式:
Figure BDA0001487740630000127
在第r次的迭代中,增广拉格朗日函数更新如下:
Figure BDA0001487740630000128
Figure BDA0001487740630000129
Figure BDA00014877406300001210
λr+1分别表示
Figure BDA00014877406300001211
和λ在第r次迭代之后的值,η>0,表示步长。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (4)

1.一种任务多副本执行的集群作业调度方法,其特征在于,包括:
拖后腿机器寻找步骤:运用机器学习的方法,找出当前运行任务的拖后腿机器;
最优副本数计算步骤:拖后腿机器上的任务副本和所有任务同时启动,并且建立以最小化任务执行时间和运行成本为目标的优化模型,然后运用交替方向方法求解优化模型得出启动副本的最优数量;
所述拖后腿机器寻找步骤具体包括:
在计算节点的集群中分别运行不同类型的任务一定时间,得到多条训练样本,选定训练样本的特征使得分类函数线性可分,训练样本的特征分别是计算节点上运行任务的工作负载wi,之前发生拖后腿现象的次数ni,计算节点的cpu wc和内存wm负载,因此分类函数为:f(X)=wTX+b,其中X=[ws,ns,wc,wm],为求出参数wT与b,转化到下面的优化问题一:
Figure FDA0003131793540000011
s.t.,yi(wTxi+b)≥1,i=1,...,n
yi=1表示第i个任务运行在计算节点上不会拖后腿,yi=-1表示第i个任务运行在计算节点上会拖后腿,转化优化问题一得到优化问题二:
Figure FDA0003131793540000012
s.t.,yi(wTxi+b)≥1,i=1,...,n
求解优化问题二,采用增广朗格朗日乘数法,将约束条件融入到目标函数里,得到优化问题三:
Figure FDA0003131793540000013
利用拉格朗日对偶,将优化问题三转化为对偶问题:
Figure FDA0003131793540000014
根据对偶问题求得参数w与b。
2.根据权利要求1所述的任务多副本执行的集群作业调度方法,其特征在于,所述最优副本数计算步骤具体包括:
作业i由mi任务组成,每个任务不能被抢占,αi表示第i个作业到达的时间,
Figure FDA0003131793540000021
表示任务
Figure FDA0003131793540000022
的副本数,Ti j,k表示任务
Figure FDA0003131793540000023
的第k个副本运行的时间,假设Ti j,k是独立同分布的随机变量且Pr{Ti j,k≤x}=Fi(x),一旦一个副本最先完成,其他的副本被终止运行并且删除运行所需要和产生的所有数据,
Figure FDA0003131793540000024
表示任务
Figure FDA0003131793540000025
的完成时间,
Figure FDA0003131793540000026
Figure FDA0003131793540000027
因此作业i的流程时间:
Figure FDA0003131793540000028
考虑两个性能指标,作业流程时间Γi和计算成本,其中计算成本用集群运行作业i的所有时间来量化,因此作业i的计算成本为
Figure FDA0003131793540000029
ξ表示每个任务最大能生成的副本数,且
Figure FDA00031317935400000210
因此以最小化作业流程时间和作业的计算成本为目标得到如下优化问题五:
Figure FDA00031317935400000211
Figure FDA00031317935400000212
Figure FDA00031317935400000213
Figure FDA00031317935400000214
Figure FDA00031317935400000215
其中M表示集群中可用的计算节点的数量,β是调节参数,β设置的越小,则作业的流程时间在优化目标中占主导更大,反之则计算成本是优化问题五主要考虑的目标;
用交替方向法乘子法来求解优化问题五,引入变量cl,0≤cl≤M,使得优化问题五的第一个限制条件变成一个等式
Figure FDA00031317935400000216
且相应的目标函数是fl(cl)=0,
Figure FDA00031317935400000217
由此将优化问题五转化成优化问题六:
Figure FDA00031317935400000218
Figure FDA00031317935400000219
Figure FDA00031317935400000220
0≤cl≤M
Figure FDA0003131793540000031
Figure FDA0003131793540000032
将优化问题六转化成增广拉格朗日函数形式:
Figure FDA0003131793540000033
在第r次的迭代中,增广拉格朗日函数更新如下:
Figure FDA0003131793540000039
Figure FDA0003131793540000034
Figure FDA0003131793540000035
λr+1分别表示
Figure FDA0003131793540000036
和λ在第r次迭代之后的值,η>0,表示步长。
3.一种任务多副本执行的集群作业调度系统,其特征在于,包括:
拖后腿机器寻找模块:运用机器学习的方法,找出当前运行任务的拖后腿机器;
最优副本数计算模块:拖后腿机器上的任务副本和所有任务同时启动,并且建立以最小化任务执行时间和运行成本为目标的优化模型,然后运用交替方向方法求解优化模型得出启动副本的最优数量;
所述拖后腿机器寻找模块具体包括:
在计算节点的集群中分别运行不同类型的任务一定时间,得到多条训练样本,选定训练样本的特征使得分类函数线性可分,训练样本的特征分别是计算节点上运行任务的工作负载wi,之前发生拖后腿现象的次数ni,计算节点的cpu wc和内存wm负载,因此分类函数为:f(X)=wTX+b,其中X=[ws,ns,wc,wm],为求出参数wT与b,转化到下面的优化问题一:
Figure FDA0003131793540000037
s.t.,yi(wTxi+b)≥1,i=1,...,n
yi=1表示第i个任务运行在计算节点上不会拖后腿,yi=-1表示第i个任务运行在计算节点上会拖后腿,转化优化问题一得到优化问题二:
Figure FDA0003131793540000038
s.t.,yi(wTxi+b)≥1,i=1,...,n
求解优化问题二,采用增广朗格朗日乘数法,将约束条件融入到目标函数里,得到优化问题三:
Figure FDA0003131793540000041
利用拉格朗日对偶,将优化问题三转化为对偶问题:
Figure FDA0003131793540000042
根据对偶问题求得参数w与b。
4.根据权利要求3所述的任务多副本执行的集群作业调度系统,其特征在于,所述最优副本数计算模块具体包括:
作业i由mi任务组成,每个任务不能被抢占,αi表示第i个作业到达的时间,
Figure FDA0003131793540000043
表示任务
Figure FDA0003131793540000044
的副本数,Ti j,k表示任务
Figure FDA0003131793540000045
的第k个副本运行的时间,假设Ti j,k是独立同分布的随机变量且Pr{Ti j,k≤x}=Fi(x),一旦一个副本最先完成,其他的副本被终止运行并且删除运行所需要和产生的所有数据,
Figure FDA0003131793540000046
表示任务
Figure FDA0003131793540000047
的完成时间,
Figure FDA0003131793540000048
Figure FDA0003131793540000049
因此作业i的流程时间:
Figure FDA00031317935400000410
考虑两个性能指标,作业流程时间Γi和计算成本,其中计算成本用集群运行作业i的所有时间来量化,因此作业i的计算成本为
Figure FDA00031317935400000411
ξ表示每个任务最大能生成的副本数,且
Figure FDA00031317935400000412
因此以最小化作业流程时间和作业的计算成本为目标得到如下优化问题五:
Figure FDA00031317935400000413
Figure FDA00031317935400000414
Figure FDA00031317935400000415
Figure FDA00031317935400000416
Figure FDA00031317935400000417
其中M表示集群中可用的计算节点的数量,β是调节参数,β设置的越小,则作业的流程时间在优化目标中占主导更大,反之则计算成本是优化问题五主要考虑的目标;
用交替方向法乘子法来求解优化问题五,引入变量cl,0≤cl≤M,使得优化问题五的第一个限制条件变成一个等式
Figure FDA0003131793540000051
且相应的目标函数是fl(cl)=0,
Figure FDA0003131793540000052
由此将优化问题五转化成优化问题六:
Figure FDA0003131793540000053
Figure FDA0003131793540000054
Figure FDA0003131793540000055
0≤cl≤M
Figure FDA0003131793540000056
Figure FDA0003131793540000057
将优化问题六转化成增广拉格朗日函数形式:
Figure FDA0003131793540000058
在第r次的迭代中,增广拉格朗日函数更新如下:
Figure FDA0003131793540000059
Figure FDA00031317935400000510
Figure FDA00031317935400000511
λr+1分别表示
Figure FDA00031317935400000512
和λ在第r次迭代之后的值,η>0,表示步长。
CN201711228523.1A 2017-11-29 2017-11-29 任务多副本执行的集群作业调度方法及系统 Active CN108108233B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711228523.1A CN108108233B (zh) 2017-11-29 2017-11-29 任务多副本执行的集群作业调度方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711228523.1A CN108108233B (zh) 2017-11-29 2017-11-29 任务多副本执行的集群作业调度方法及系统

Publications (2)

Publication Number Publication Date
CN108108233A CN108108233A (zh) 2018-06-01
CN108108233B true CN108108233B (zh) 2021-10-01

Family

ID=62208754

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711228523.1A Active CN108108233B (zh) 2017-11-29 2017-11-29 任务多副本执行的集群作业调度方法及系统

Country Status (1)

Country Link
CN (1) CN108108233B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108897865A (zh) * 2018-06-29 2018-11-27 北京奇虎科技有限公司 分布式集群的索引副本数量评估方法及装置
CN109005052B (zh) * 2018-07-04 2021-12-31 中国人民解放军国防科技大学 网络任务预测方法和装置
CN109038532B (zh) * 2018-07-25 2022-07-26 深圳供电局有限公司 一种基于直流潮流等值的分布式输配协同机组组合方法
CN109711526B (zh) * 2018-12-20 2023-04-18 广东工业大学 基于svm和蚁群算法的服务器集群调度方法
CN109976890B (zh) * 2019-03-28 2023-05-30 东南大学 一种最小化异构私有云计算资源能耗的变频方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101695081A (zh) * 2009-09-30 2010-04-14 北京航空航天大学 一种网络服务的可信任务调度方法
CN102882981A (zh) * 2012-10-19 2013-01-16 南京邮电大学 一种对等结构云平台下节点任务的负载均衡方法
CN103970613A (zh) * 2014-05-21 2014-08-06 哈尔滨工程大学 一种异构分布式系统多副本任务容错调度方法
CN105786592A (zh) * 2014-12-15 2016-07-20 北大方正集团有限公司 一种分布式事务的处理方法及装置
CN105912399A (zh) * 2016-04-05 2016-08-31 杭州嘉楠耘智信息科技有限公司 一种任务处理方法、装置及系统
US9507631B2 (en) * 2013-12-03 2016-11-29 International Business Machines Corporation Migrating a running, preempted workload in a grid computing system
CN106168912A (zh) * 2016-07-28 2016-11-30 重庆邮电大学 一种Hadoop大数据平台中基于备份任务运行时间估计的调度方法
US9633315B2 (en) * 2012-04-27 2017-04-25 Excalibur Ip, Llc Method and system for distributed machine learning
CN107370802A (zh) * 2017-07-10 2017-11-21 中国人民解放军国防科学技术大学 一种基于交替方向乘子法的协同存储调度方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10380500B2 (en) * 2015-09-24 2019-08-13 Microsoft Technology Licensing, Llc Version control for asynchronous distributed machine learning

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101695081A (zh) * 2009-09-30 2010-04-14 北京航空航天大学 一种网络服务的可信任务调度方法
US9633315B2 (en) * 2012-04-27 2017-04-25 Excalibur Ip, Llc Method and system for distributed machine learning
CN102882981A (zh) * 2012-10-19 2013-01-16 南京邮电大学 一种对等结构云平台下节点任务的负载均衡方法
US9507631B2 (en) * 2013-12-03 2016-11-29 International Business Machines Corporation Migrating a running, preempted workload in a grid computing system
CN103970613A (zh) * 2014-05-21 2014-08-06 哈尔滨工程大学 一种异构分布式系统多副本任务容错调度方法
CN105786592A (zh) * 2014-12-15 2016-07-20 北大方正集团有限公司 一种分布式事务的处理方法及装置
CN105912399A (zh) * 2016-04-05 2016-08-31 杭州嘉楠耘智信息科技有限公司 一种任务处理方法、装置及系统
CN106168912A (zh) * 2016-07-28 2016-11-30 重庆邮电大学 一种Hadoop大数据平台中基于备份任务运行时间估计的调度方法
CN107370802A (zh) * 2017-07-10 2017-11-21 中国人民解放军国防科学技术大学 一种基于交替方向乘子法的协同存储调度方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《MapReduce集群环境下的数据放置策略》;荀亚玲 张继福 秦啸;《软件学报》;科学出版社;20150831;第26卷(第8期);全文 *
《云计算任务调度策略研究》;邓见光;《中国博士学位论文全文数据库 信息科技辑》;20141115(第11期);全文 *
《集群负载平衡的性能评测方法》;刘楠 翁楚良 李明禄;《计算机工程与设计》;20111016;第32卷(第10期);全文 *

Also Published As

Publication number Publication date
CN108108233A (zh) 2018-06-01

Similar Documents

Publication Publication Date Title
CN108108233B (zh) 任务多副本执行的集群作业调度方法及系统
CN105117286B (zh) MapReduce中任务的调度方法和流水化执行方法
CN114787824A (zh) 联合混合模型
Zhang et al. Parallel rough set based knowledge acquisition using MapReduce from big data
JP2012022558A (ja) 分散計算システム
Laanait et al. Exascale deep learning for scientific inverse problems
WO2018144534A1 (en) Hardware-based machine learning acceleration
CN109871270B (zh) 调度方案生成方法及装置
CN109032630B (zh) 一种参数服务器中全局参数的更新方法
Lee et al. Ensembles of Lasso screening rules
Kiamari et al. Gcnscheduler: Scheduling distributed computing applications using graph convolutional networks
Jeon et al. Intelligent resource scaling for container based digital twin simulation of consumer electronics
CN113222125A (zh) 卷积运算方法及芯片
Thomas et al. Survey on MapReduce scheduling algorithms
Ying et al. Towards fault tolerance optimization based on checkpoints of in-memory framework spark
CN113222099A (zh) 卷积运算方法及芯片
CN111258730A (zh) 一种基于竞态条件的任务调度方法
Tang et al. A network load perception based task scheduler for parallel distributed data processing systems
Ovalle et al. Distributed Cache Strategies for Machine Learning Classification Tasks over Cluster Computing Resources
Pan et al. An improved artificial chemical reaction optimization algorithm for job scheduling problem in grid computing environments
Liu et al. An optimized speculative execution strategy based on local data prediction in a heterogeneous hadoop environment
Du et al. OctopusKing: A TCT-aware task scheduling on spark platform
Czajkowski et al. Hybrid parallelization of evolutionary model tree induction
Savadi et al. Multi-DaC programming model: A variant of multi-BSP model for divide-and-conquer algorithms
US20240256901A1 (en) Information processing apparatus, information processing method and non-transitory computer-readable storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant