CN108733464A - 一种确定计算任务的调度方案的方法及装置 - Google Patents
一种确定计算任务的调度方案的方法及装置 Download PDFInfo
- Publication number
- CN108733464A CN108733464A CN201710252288.5A CN201710252288A CN108733464A CN 108733464 A CN108733464 A CN 108733464A CN 201710252288 A CN201710252288 A CN 201710252288A CN 108733464 A CN108733464 A CN 108733464A
- Authority
- CN
- China
- Prior art keywords
- calculating task
- target
- target calculating
- information
- task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请公开了一种确定计算任务的调度方案的方法及装置,用于解决现有计算任务的调度方案无法稳定计算任务的运行时长的问题。该方法包括:获取目标计算任务的历史执行信息;获取目标计算任务的预定义信息和目标计算任务的集群资源信息;根据目标计算任务的历史执行信息、目标计算任务的预定义信息以及目标计算任务的集群资源信息确定目标计算任务的第一模拟调度方案;实施第一模拟调度方案;若第一模拟调度方案的实施结果满足预设条件,则将第一模拟调度方案确定为目标计算任务的目标调度方案。
Description
技术领域
本申请涉及计算机领域,具体涉及一种确定计算任务的调度方案的方法及装置。
背景技术
在大规模集群上,运行着众多的计算任务。通过计算任务的调度方案以确定每个计算任务在某个时间被分配资源,例如,中央处理器(Central Processing Unit,CPU)、内存、网络带宽等。计算任务的调度方案直接影响集群资源的利用率,进而影响计算任务的进程。
假定每个计算任务的运行时长是预设的,同时简化计算任务的资源消耗。在这一假设下,计算任务的调度问题就可以抽象成约束最优化问题,即在满足计算任务依赖关系、计算任务运行时长、计算任务完成截止时间等约束的情况下最大化集群资源利用率,可利用优化求解引擎求解得到计算任务的调度方案。
但是,这个假设在实践中是不成立的。计算任务的运行时长是不稳定的并且受到众多因素的影响。另外,简化了计算任务的资源消耗,导致计算任务无法被合理分配资源,进而导致计算任务的运行时长更加难以稳定。
发明内容
本申请提供了一种确定计算任务的调度方案的方法及装置,用于解决现有计算任务的调度方案无法稳定计算任务的运行时长的问题。
第一方面提供一种确定计算任务调度方案的方法,该方法应用于集群系统,该集群系统中包括计算集群、资源调度引擎和任务调度与管理引擎。该计算集群中包括多个节点,每个节点执行不同的计算任务。资源调度引擎主要负责计算任务的分配、资源分配、运行情况监控以及向任务调度与管理引擎反馈计算任务的实施结果。任务调度与管理引擎主要负责确定计算任务的调度方案、将计算任务的调度方案发送给资源调度引擎以使得资源调度引擎按照计算任务的调度方案给不同的节点分配相应的计算任务和资源。其中,任务调度与管理引擎确定计算任务的调度方案的过程为:获取目标计算任务的历史执行信息,其中,该目标计算任务为从计算任务日志中进行过滤后的计算任务,该目标计算任务有多个,该目标计算任务的历史执行信息包括目标计算任务的运行时长信息和目标计算任务的资源消耗信息;获取目标计算任务的预定义信息和目标计算任务的集群资源信息;根据目标计算任务的历史执行信息、目标计算任务的预定义信息以及目标计算任务的集群资源信息确定该目标计算任务的第一模拟调度方案;实施该第一模拟调度方案;若该第一模拟调度方案的实施结果满足预设条件,则将该第一模拟调度方案确定为该目标计算任务的目标调度方案。
可见,将目标计算任务的资源消耗以及运行时长考虑在内,自动化地构建目标计算任务的第一模拟调度方案,并实施该第一模拟调度方案,若该第一模拟调度方案的实施结果满足预设条件,则将该第一模拟调度方案确定为该目标计算任务的目标调度方案,从而稳定计算任务的运行时长。
获取目标计算任务的历史执行信息有多种方式,下面介绍可能实现的一种方式:
从计算任务日志中过滤掉目标计算任务的异常数据以获取目标计算任务的历史执行信息,其中,该异常数据包括目标计算任务的异常运行时长信息和目标计算任务的异常资源消耗信息。通过过滤掉该目标计算任务的异常数据,有效提高该目标计算任务的历史执行信息的可靠性。
根据目标计算任务的历史执行信息、目标计算任务的预定义信息以及目标计算任务的集群资源信息确定目标计算任务的第一模拟调度方案的方式有很多种,下面介绍可能实现的一种方式:
根据目标计算任务的历史执行信息、目标计算任务的预定义信息以及目标计算任务的集群资源信息生成所述目标计算任务的调度优化模型,利用优化求解引擎求解该调度优化模型以确定该目标计算任务的第一模拟调度方案。可见,将目标计算任务的资源消耗以及运行时长考虑在内,从而稳定计算任务的运行时长。
第一模拟调度方案的实施结果满足预设条件包括以下至少一个内容:
该目标计算任务的完成截止时间在预设时间范围内;
实施所述第一模拟调度方案产生的该目标计算任务的新执行信息与该目标计算任务的历史执行信息的差值在预设差值范围内。
在一些可能的实现方式中,若该第一模拟调度方案的实施结果不满足预设条件,根据目标计算任务的新执行信息、目标计算任务的预定义信息以及目标计算任务的集群资源信息确定目标计算任务的第二模拟调度方案。并实施该第二模拟调度方案,若该第二模拟调度方案的实施结果满足预设条件,则将该第二模拟调度方案确定为该目标计算任务的目标调度方案,从而有效提高计算任务的运行时长的稳定性。
第二方面提供一种确定计算任务的调度方案的装置,该装置被配置实现上述第一方面或者第一方面的任意一种实现方式提供的方法的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现,该硬件或软件包括一个或多个与上述功能相对应的模块。
第三方面提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面或者第一方面的任意一种实现方式所述的方法。
附图说明
图1为本发明实施例中确定计算任务的调度方案的一个系统架构图;
图2为本发明实施例中确定计算任务的调度方案的装置的一个结构示意图;
图3为本发明实施例中确定计算任务的调度方案的一个实施例示意图;
图4为本发明实施例中确定计算任务的调度方案的装置的另一个结构示意图。
具体实施方式
在介绍本发明实施例之前,先介绍一下本发明涉及的系统架构,如图1所示,该系统架构中包括计算集群、资源调度引擎和任务调度与管理引擎。最底层是计算集群,该计算集群中包括多个节点:节点1、节点2…节点n等,其中,n为大于0的整数,每个节点执行不同的计算任务。该计算集群中包含了多种资源,例如:计算资源(包括CPU、内存)、存储资源(包括硬盘)、网络资源(包括网络带宽)等,不同的节点在执行计算任务的过程中被分配相应的资源。资源调度引擎主要负责计算任务的分配、资源分配、运行情况监控以及向任务调度与管理引擎反馈计算任务的实施结果。任务调度与管理引擎主要负责确定计算任务的调度方案、将计算任务的调度方案发送给资源调度引擎以使得资源调度引擎按照计算任务的调度方案给不同的节点分配相应的计算任务和资源。本申请主要用于任务调度与管理引擎确定计算任务的调度方案。
请参阅图2,本发明实施例中确定计算任务的调度方案的装置的一个结构示意图,该装置200包括:存储器201,处理器202以及总线203,该存储器201和处理器202通过总线203连接,其中,该存储器201存储有计算机指令,该处理器202通过计算机指令执行如下步骤:
获取目标计算任务的历史执行信息,其中,该目标计算任务为从计算任务日志中进行过滤后的计算任务,该目标计算任务的历史执行信息包括该目标计算任务的运行时长信息和该目标计算任务的资源消耗信息。
在一些可能的实现方式中,该处理器202获取目标计算任务的历史执行信息包括:
从计算任务日志中过滤掉所述目标计算任务的异常数据以获取所述目标计算任务的历史执行信息,其中,所述异常数据包括所述目标计算任务的异常运行时长信息和所述目标计算任务的异常资源消耗信息。
在实际应用中,该计算任务日志中包括大量的计算任务的历史执行信息、计算任务的启动时刻、计算任务的截止时刻、计算任务的资源使用情况等。对计算任务日志中的计算任务进行过滤主要包括:数据清洗和统计分析。
数据清洗:去除无关的数据,例如:调试的信息和错误的信息,执行计算任务失败的信息,文件保存的信息等。
统计分析:抽取各个计算任务的运行时长和资源使用情况,其中,计算任务的运行时长为计算任务的截止时刻减去计算任务的启动时刻,计算任务的资源使用情况如CPU和内存等资源的使用量峰值或者使用均值等,具体使用哪个度量可根据实际效果确定。由于不同时刻的CPU、内存等资源的使用量可能不同,可取CPU、内存等资源的使用量的最大值。统计各个计算任务在多次运行中的资源使用情况和运行时长的均值和标准差。
对于CPU资源而言:
均值:Avg(CPU)=(CPU1+CPU2+…+CPUn)/n
标准差:Std(CPU)2=((Avg(CPU)-CPU1)2+…+(Avg(CPU)-CPUn)2)/n
其中,n表示运行总次数,CPUn表示第n次运行的CPU资源的使用量峰值。
类似地,对于内存资源而言:
均值:Avg(Mem)=(Mem1+Mem2+…+Memn)/n
标准差:Std(Mem)2=((Avg(Mem)-Mem1)2+…+(Avg(Mem)-Memn)2)/n
其中,Memn表示第n次运行的内存资源使用量峰值。
对于运行时长而言:
均值:Avg(RT)=(RT1+RT2+…+RTn)/n
标准差:Std(RT)2=((Avg(RT)-RT1)2+…+(Avg(RT)-RTn)2)/n
其中,RTn表示第n次运行的运行时长。
然后,去除资源使用和运行时长异常的计算任务的运行数据。其中,异常可以是偏离均值1.5倍标准差,以运行时长为例,如果|RTi-Avg(RT)|>1.5Std(RT),就认为计算任务在第i次运行的运行时长是异常的,需要去除。在去除异常的运行数据后,再重新统计各个计算任务在多次运行中的资源使用情况和运行时长的均值和标准差,然后获取目标计算任务的历史执行信息,该目标计算任务的历史执行信息表1所示(为了描述实施例的直观与方便,运行时长与CPU使用取为整数)。
表1、目标计算任务的历史执行信息表
任务标号 | 运行时长/h | CPU使用 | 内存使用/MB |
0 | 3 | 30 | 3432 |
1 | 2 | 30 | 6256 |
2 | 2 | 20 | 5435 |
3 | 4 | 10 | 1343 |
4 | 4 | 20 | 4253 |
5 | 2 | 40 | 7862 |
6 | 1 | 40 | 12147 |
7 | 3 | 40 | 23564 |
8 | 5 | 40 | 21463 |
9 | 4 | 15 | 7432 |
10 | 1 | 20 | 1256 |
11 | 5 | 15 | 3287 |
12 | 2 | 10 | 7675 |
该处理器202还用于获取目标计算任务的预定义信息和目标计算任务的集群资源信息。其中,目标计算任务大部分是预先定义好的,也就是说,目标计算任务的输入数据是什么、输入数据存在哪里、运行在哪个集群上、依赖于哪些计算任务(例如,目标计算任务B依赖于目标计算任务A指的是目标计算任务A的输出是目标计算任务B的输入,在目标计算任务A未成功完成前目标计算任务B无法执行),被哪些目标计算任务依赖、对输入数据进行何种处理、输出结果是什么、输出结果存在何处、要求在什么时间前完成等都是明确的,如表2所示,其中,\表示没有任务依赖或者没有截止时间要求。
表2、目标计算任务预定义信息表
目标计算任务的集群资源信息包括CPU、内存等资源,以CPU和内存资源为例,如表3所示。
表3、集群资源信息表
集群标号 | CPU资源 | 内存/GB |
0 | 30 | 200GB |
1 | 20 | 150GB |
2 | 40 | 300GB |
该处理器202还用于根据目标计算任务的历史执行信息、目标计算任务的预定义信息以及目标计算任务的集群资源信息确定目标计算任务的第一模拟调度方案;实施所述第一模拟调度方案;若所述第一模拟调度方案的实施结果满足预设条件,则将所述第一模拟调度方案确定为所述目标计算任务的目标调度方案。
在一些可能的实现方式中,该处理器202根据所述目标计算任务的历史执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息确定所述目标计算任务的第一模拟调度方案包括:根据所述目标计算任务的历史执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息生成所述目标计算任务的调度优化模型;利用优化求解引擎求解所述调度优化模型以确定所述目标计算任务的第一模拟调度方案。
在实际应用中,假设一个目标计算任务在不同的周期执行具有不同的任务实例标号,其中,任务实例标号区别于任务标号,一个任务标号在不同执行周期对应不同任务实例标号,以下“任务i”均指任务实例标号。假设目标计算任务i的起始执行时间为截止执行时间为若目标计算任务i依赖于目标计算任务j,则有目标计算任务j的截止执行时间不早于目标计算任务i的起始执行时间,即目标计算任务的依赖关系来源于计目标算任务预定义信息表。目标计算任务i的起始执行时间不早于即截止执行时间不晚于即这两部分信息来源于目标计算任务预定义信息表。任务i的平均运行时长为li,CPU资源消耗为ci,内存资源消耗为mi,这三部分信息来源于计算任务的历史执行信息表。集群k具有的CPU资源为Ck,内存资源为Mk,这两部分信息来源于集群资源信息表。由于任务i的截止执行时间减去起始执行时间必定不小于任务i的运行完成时长,于是有设i∈Ωk(t)表示任务i在t时刻运行在集群k上,则所有在t时刻运行在集群k上的目标计算任务的资源需求不能超过集群的资源上限,即
因此,可以将目标计算任务的调度问题抽象成了约束最优化问题Minte-tb,使用优化求解引擎求解优化模型,即求出优化模型中的未知量,从而得到每个目标计算任务的起始执行时间,即第一模拟调度方案。其中,优化目标是最大化目标计算任务的完成进程,目标计算任务i的起始执行时间和截止执行时间是未知量,其他参数为已知量。
所谓最优化问题就是求解一个函数的最大值或最小值的问题。最优化问题可以分为两类,一类是无约束最优化问题,即寻找函数f的最大值或最小值而不限制自变量x的取值范围,数学表达式可以写成:
另一类是约束最优化问题,即将自变量x限定在某个范围内寻找函数f的最大值或最小值,数学表达式可以写为:
Minf(x)
其中,S.T.表示满足或者受限于。Ω就是自变量x的限定范围,一般是由一些等式或不等式组确定。业务定义的任务调度问题就可以抽象成约束最优化问题,即在满足任务依赖关系、任务完成截止时间等约束的情况下最大化计算任务完成进度。
解决最优化问题的开源或求解软件,通常称为优化求解引擎。优化求解引擎以无约束/约束最优化问题的数学表达式作为标准输入,通过优化求解引擎求解,得到函数f的最值和对应的自变量x。当将实际问题抽象成约束最优化问题的数学表达式时,就可以直接借助优化求解引擎来求解约束最优化问题。
在一些可能的实现方式中,该第一模拟调度方案的实施结果满足预设条件包括以下至少一个内容:
所述目标计算任务的完成截止时间在预设时间范围内;
实施所述第一模拟调度方案产生的所述目标计算任务的新执行信息与所述目标计算任务的历史执行信息的差值在预设差值范围内。
在一些可能的实现方式中,若所述第一模拟调度方案的实施结果不满足预设条件,该处理器202根据所述目标计算任务的新执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息确定所述目标计算任务的第二模拟调度方案。
在实际应用中,将目标计算任务的调度方案的实施结果会以任务执行日志的形式保存下来。经过数据清洗与统计分析得到计算任务的新执行信息表。需要注意的是,新执行信息表使用的任务执行日志是上次目标计算任务调度方案的实施结果,不包含历史执行信息。
在实施结果中目标计算任务的完成截止时间如果不在预设时间范围内,就判定目标计算任务的调度方案不合理。在目标计算任务的完成截止时间在预设时间范围内的前提下,检测新任务执行信息表与历史执行信息表差异是否很大。差异大的标准是新执行信息表的计算任务的运行时长、CPU消耗偏差超过历史执行信息表的计算任务的运行时长、CPU消耗均值的1.5倍标准差。如果差异很大,就判定计算任务的调度方案不合理。如果计算任务调度计划合理,则计算任务的调度方案即可确定,以后就按照这一计算任务的调度方案执行。如果计算任务的调度方案不合理,就采用新执行信息替代历史执行信息重新计算,直至计算任务的调度方案合理为止。
请参阅图3,本发明实施例中确定计算任务的调度方案的一个实施例示意图,该实施例的具体流程如下:
步骤301、获取目标计算任务的历史执行信息。
其中,所述目标计算任务为从计算任务日志中进行过滤后的计算任务,所述目标计算任务的历史执行信息包括所述目标计算任务的运行时长信息和所述目标计算任务的资源消耗信息。
在一些可能的实现方式中,所述获取目标计算任务的历史执行信息包括:
从计算任务日志中过滤掉所述目标计算任务的异常数据以获取所述目标计算任务的历史执行信息,其中,所述异常数据包括所述目标计算任务的异常运行时长信息和所述目标计算任务的异常资源消耗信息。
步骤302、获取目标计算任务的预定义信息和目标计算任务的集群资源信息。
步骤303、根据目标计算任务的历史执行信息、目标计算任务的预定义信息以及目标计算任务的集群资源信息确定目标计算任务的第一模拟调度方案。
在一些可能的实现方式中,根据所述目标计算任务的历史执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息确定所述目标计算任务的第一模拟调度方案包括:
根据所述目标计算任务的历史执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息生成所述目标计算任务的调度优化模型;利用优化求解引擎求解所述调度优化模型以确定所述目标计算任务的第一模拟调度方案。
步骤304、实施第一模拟调度方案。
步骤305、判断第一模拟调度方案是否满足预设条件,若是,执行步骤306,若否,执行步骤307。
步骤306、若第一模拟调度方案的实施结果满足预设条件,则将第一模拟调度方案确定为目标计算任务的目标调度方案。
在一些可能的实现方式中,第一模拟调度方案的实施结果满足预设条件包括以下至少一个内容:
所述目标计算任务的完成截止时间在预设时间范围内;
实施所述第一模拟调度方案产生的所述目标计算任务的新执行信息与所述目标计算任务的历史执行信息的差值在预设差值范围内。
步骤306、若第一模拟调度方案的实施结果不满足预设条件,根据目标计算任务的新执行信息、目标计算任务的预定义信息以及目标计算任务的集群资源信息确目标计算任务的第二模拟调度方案。
上述方法的具体工作过程,可以参考前述图2实施例中的对应过程,在此不再赘述。
请参阅图4,本发明实施例中确定计算任务的调度方案的装置的另一个结构示意图,该装置包括:获取模块401,确定模块402和实施模块403。
获取模块401,用于获取目标计算任务的历史执行信息,其中,所述目标计算任务为从计算任务日志中进行过滤后的计算任务,所述目标计算任务的历史执行信息包括所述目标计算任务的运行时长信息和所述目标计算任务的资源消耗信息;
所述获取模块401,还用于获取所述目标计算任务的预定义信息和所述目标计算任务的集群资源信息;
确定模块402,用于根据所述获取模块401获取的所述目标计算任务的历史执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息确定所述目标计算任务的第一模拟调度方案;
实施模块403,用于实施所述确定模块402确定的所述第一模拟调度方案;
所述确定模块402,还用于若所述第一模拟调度方案的实施结果满足预设条件,则将所述第一模拟调度方案确定为所述目标计算任务的目标调度方案。
在一些可能的实现方式中,所述获取模块401具体用于从计算任务日志中过滤掉所述目标计算任务的异常数据以获取所述目标计算任务的历史执行信息,其中,所述异常数据包括所述目标计算任务的异常运行时长信息和所述目标计算任务的异常资源消耗信息。
在一些可能的实现方式中,所述确定模块402具体用于根据所述目标计算任务的历史执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息生成所述目标计算任务的调度优化模型;利用优化求解引擎求解所述调度优化模型以确定所述目标计算任务的第一模拟调度方案。
在一些可能的实现方式中,所述第一模拟调度方案的实施结果满足预设条件包括以下至少一个内容:
所述目标计算任务的完成截止时间在预设时间范围内;
实施所述第一模拟调度方案产生的所述目标计算任务的新执行信息与所述目标计算任务的历史执行信息的差值在预设差值范围内。
在一些可能的实现方式中,所述确定模块402,还用于若所述第一模拟调度方案的实施结果不满足预设条件,根据所述目标计算任务的新执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息确定所述目标计算任务的第二模拟调度方案。
上述确定计算任务的调度方案的装置400的工作过程的细节,可以参考前述图2实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络设备上。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,但是本领域技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征以功能相同的特征进行替换;而这些修改或者替换,并不使相应技术方案脱离本发明权利要求的范围。
上述实施例可以全部或部分地通过软件、硬件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、双绞线或光纤)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如光盘)、或者半导体介质(例如固态硬盘)等。
Claims (10)
1.一种确定计算任务的调度方案的方法,其特征在于,包括:
获取目标计算任务的历史执行信息,其中,所述目标计算任务为从计算任务日志中进行过滤后的计算任务,所述目标计算任务的历史执行信息包括所述目标计算任务的运行时长信息和所述目标计算任务的资源消耗信息;
获取所述目标计算任务的预定义信息和所述目标计算任务的集群资源信息;
根据所述目标计算任务的历史执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息确定所述目标计算任务的第一模拟调度方案;
实施所述第一模拟调度方案;
若所述第一模拟调度方案的实施结果满足预设条件,则将所述第一模拟调度方案确定为所述目标计算任务的目标调度方案。
2.根据权利要求1所述的方法,其特征在于,所述获取目标计算任务的历史执行信息包括:
从计算任务日志中过滤掉所述目标计算任务的异常数据以获取所述目标计算任务的历史执行信息,其中,所述异常数据包括所述目标计算任务的异常运行时长信息和所述目标计算任务的异常资源消耗信息。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述目标计算任务的历史执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息确定所述目标计算任务的第一模拟调度方案包括:
根据所述目标计算任务的历史执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息生成所述目标计算任务的调度优化模型;
利用优化求解引擎求解所述调度优化模型以确定所述目标计算任务的第一模拟调度方案。
4.根据权利要求1所述的方法,其特征在于,所述第一模拟调度方案的实施结果满足预设条件包括以下至少一个内容:
所述目标计算任务的完成截止时间在预设时间范围内;
实施所述第一模拟调度方案产生的所述目标计算任务的新执行信息与所述目标计算任务的历史执行信息的差值在预设差值范围内。
5.根据权利要求4所述的方法,其特征在于,若所述第一模拟调度方案的实施结果不满足预设条件,根据所述目标计算任务的新执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息确定所述目标计算任务的第二模拟调度方案。
6.一种确定计算任务的调度方案的装置,其特征在于,包括:
获取模块,用于获取目标计算任务的历史执行信息,其中,所述目标计算任务为从计算任务日志中进行过滤后的计算任务,所述目标计算任务的历史执行信息包括所述目标计算任务的运行时长信息和所述目标计算任务的资源消耗信息;
所述获取模块,还用于获取所述目标计算任务的预定义信息和所述目标计算任务的集群资源信息;
确定模块,用于根据所述获取模块获取的所述目标计算任务的历史执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息确定所述目标计算任务的第一模拟调度方案;
实施模块,用于实施所述确定模块确定的所述第一模拟调度方案;
所述确定模块,还用于若所述第一模拟调度方案的实施结果满足预设条件,则将所述第一模拟调度方案确定为所述目标计算任务的目标调度方案。
7.根据权利要求6所述的装置,其特征在于,所述获取模块具体用于从计算任务日志中过滤掉所述目标计算任务的异常数据以获取所述目标计算任务的历史执行信息,其中,所述异常数据包括所述目标计算任务的异常运行时长信息和所述目标计算任务的异常资源消耗信息。
8.根据权利要求6或7所述的装置,其特征在于,所述确定模块具体用于根据所述目标计算任务的历史执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息生成所述目标计算任务的调度优化模型;利用优化求解引擎求解所述调度优化模型以确定所述目标计算任务的第一模拟调度方案。
9.根据权利要求6所述的装置,其特征在于,所述第一模拟调度方案的实施结果满足预设条件包括以下至少一个内容:
所述目标计算任务的完成截止时间在预设时间范围内;
实施所述第一模拟调度方案产生的所述目标计算任务的新执行信息与所述目标计算任务的历史执行信息的差值在预设差值范围内。
10.根据权利要求9所述的装置,其特征在于,所述确定模块,还用于若所述第一模拟调度方案的实施结果不满足预设条件,根据所述目标计算任务的新执行信息、所述目标计算任务的预定义信息以及所述目标计算任务的集群资源信息确定所述目标计算任务的第二模拟调度方案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710252288.5A CN108733464B (zh) | 2017-04-18 | 2017-04-18 | 一种确定计算任务的调度方案的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710252288.5A CN108733464B (zh) | 2017-04-18 | 2017-04-18 | 一种确定计算任务的调度方案的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108733464A true CN108733464A (zh) | 2018-11-02 |
CN108733464B CN108733464B (zh) | 2021-09-14 |
Family
ID=63924223
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710252288.5A Active CN108733464B (zh) | 2017-04-18 | 2017-04-18 | 一种确定计算任务的调度方案的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108733464B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109901926A (zh) * | 2019-01-25 | 2019-06-18 | 平安科技(深圳)有限公司 | 基于大数据行为调度应用任务的方法、服务器及存储介质 |
CN110008015A (zh) * | 2019-04-09 | 2019-07-12 | 中国科学技术大学 | 边缘计算系统中有带宽限制的在线任务分派调度方法 |
CN110287008A (zh) * | 2019-05-22 | 2019-09-27 | 百度(中国)有限公司 | 一种测试任务调度方法、装置及电子设备 |
CN110297701A (zh) * | 2019-05-16 | 2019-10-01 | 平安科技(深圳)有限公司 | 数据处理作业调度方法、装置、计算机设备及存储介质 |
CN111221629A (zh) * | 2020-01-09 | 2020-06-02 | 上海沄界信息科技有限公司 | 计算资源使用量量化方法及装置 |
CN111552569A (zh) * | 2020-04-28 | 2020-08-18 | 咪咕文化科技有限公司 | 系统资源调度方法、装置及存储介质 |
CN113377540A (zh) * | 2021-06-15 | 2021-09-10 | 上海商汤科技开发有限公司 | 集群资源调度方法及装置、电子设备和存储介质 |
CN113704076A (zh) * | 2021-10-27 | 2021-11-26 | 北京每日菜场科技有限公司 | 任务优化方法、装置、电子设备和计算机可读介质 |
WO2023015567A1 (zh) * | 2021-08-13 | 2023-02-16 | 华为技术有限公司 | 任务调度架构和方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006174175A (ja) * | 2004-12-16 | 2006-06-29 | Hitachi Kokusai Electric Inc | 移動端末管理方式 |
CN102495758A (zh) * | 2011-12-05 | 2012-06-13 | 中南大学 | 分布式高性能计算环境中实时任务的调度方法 |
CN104102544A (zh) * | 2014-06-30 | 2014-10-15 | 武汉理工大学 | 混合云环境下多QoS约束的并行任务调度成本优化方法 |
CN104239148A (zh) * | 2013-06-06 | 2014-12-24 | 腾讯科技(深圳)有限公司 | 一种分布式任务调度方法及装置 |
CN104834995A (zh) * | 2015-04-20 | 2015-08-12 | 安徽师范大学 | 基于云计算的工作流双向调度方法 |
CN104965755A (zh) * | 2015-05-04 | 2015-10-07 | 东南大学 | 基于预算约束的云服务工作流调度方法 |
-
2017
- 2017-04-18 CN CN201710252288.5A patent/CN108733464B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006174175A (ja) * | 2004-12-16 | 2006-06-29 | Hitachi Kokusai Electric Inc | 移動端末管理方式 |
CN102495758A (zh) * | 2011-12-05 | 2012-06-13 | 中南大学 | 分布式高性能计算环境中实时任务的调度方法 |
CN104239148A (zh) * | 2013-06-06 | 2014-12-24 | 腾讯科技(深圳)有限公司 | 一种分布式任务调度方法及装置 |
CN104102544A (zh) * | 2014-06-30 | 2014-10-15 | 武汉理工大学 | 混合云环境下多QoS约束的并行任务调度成本优化方法 |
CN104834995A (zh) * | 2015-04-20 | 2015-08-12 | 安徽师范大学 | 基于云计算的工作流双向调度方法 |
CN104965755A (zh) * | 2015-05-04 | 2015-10-07 | 东南大学 | 基于预算约束的云服务工作流调度方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109901926A (zh) * | 2019-01-25 | 2019-06-18 | 平安科技(深圳)有限公司 | 基于大数据行为调度应用任务的方法、服务器及存储介质 |
CN110008015A (zh) * | 2019-04-09 | 2019-07-12 | 中国科学技术大学 | 边缘计算系统中有带宽限制的在线任务分派调度方法 |
CN110008015B (zh) * | 2019-04-09 | 2022-09-30 | 中国科学技术大学 | 边缘计算系统中有带宽限制的在线任务分派调度方法 |
CN110297701A (zh) * | 2019-05-16 | 2019-10-01 | 平安科技(深圳)有限公司 | 数据处理作业调度方法、装置、计算机设备及存储介质 |
CN110297701B (zh) * | 2019-05-16 | 2023-08-01 | 平安科技(深圳)有限公司 | 数据处理作业调度方法、装置、计算机设备及存储介质 |
CN110287008A (zh) * | 2019-05-22 | 2019-09-27 | 百度(中国)有限公司 | 一种测试任务调度方法、装置及电子设备 |
CN110287008B (zh) * | 2019-05-22 | 2023-12-19 | 百度(中国)有限公司 | 一种测试任务调度方法、装置及电子设备 |
CN111221629B (zh) * | 2020-01-09 | 2023-09-05 | 上海沄界信息科技有限公司 | 计算资源使用量量化方法及装置 |
CN111221629A (zh) * | 2020-01-09 | 2020-06-02 | 上海沄界信息科技有限公司 | 计算资源使用量量化方法及装置 |
CN111552569A (zh) * | 2020-04-28 | 2020-08-18 | 咪咕文化科技有限公司 | 系统资源调度方法、装置及存储介质 |
CN111552569B (zh) * | 2020-04-28 | 2023-10-20 | 咪咕文化科技有限公司 | 系统资源调度方法、装置及存储介质 |
CN113377540A (zh) * | 2021-06-15 | 2021-09-10 | 上海商汤科技开发有限公司 | 集群资源调度方法及装置、电子设备和存储介质 |
WO2023015567A1 (zh) * | 2021-08-13 | 2023-02-16 | 华为技术有限公司 | 任务调度架构和方法 |
CN113704076A (zh) * | 2021-10-27 | 2021-11-26 | 北京每日菜场科技有限公司 | 任务优化方法、装置、电子设备和计算机可读介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108733464B (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108733464A (zh) | 一种确定计算任务的调度方案的方法及装置 | |
TWI426393B (zh) | 雲端計算資源排程方法與應用之系統 | |
CN108549583B (zh) | 大数据处理方法、装置、服务器及可读存储介质 | |
CN107025139A (zh) | 一种基于云计算的高性能计算调度框架 | |
US9396039B1 (en) | Scalable load testing using a queue | |
CN107526645B (zh) | 一种通信优化方法及系统 | |
CN103761146B (zh) | 一种MapReduce动态设定slots数量的方法 | |
CN106557497A (zh) | 一种数据同步方法和装置 | |
CN107239675A (zh) | 基于云平台的生物信息分析系统 | |
CN102902589B (zh) | 一种集群mic作业的管理及调度方法 | |
CN102521265B (zh) | 一种海量数据管理中动态一致性控制方法 | |
CN108255607A (zh) | 任务处理方法、装置、电子终端及可读存储介质 | |
CN110300188A (zh) | 数据传输系统、方法和设备 | |
CN108958942A (zh) | 一种分布式系统分配任务方法、调度器和计算机设备 | |
CN111418187A (zh) | 云网络中的可伸缩统计和分析机制 | |
CN115291806A (zh) | 一种处理方法、装置、电子设备及存储介质 | |
CN112860387A (zh) | 分布式任务调度方法、装置、计算机设备及存储介质 | |
CN106412088A (zh) | 一种数据同步方法及终端 | |
CN107729218A (zh) | 一种监控处理计算资源设备的系统及方法 | |
CN110868330B (zh) | 云平台可划分cpu资源的评估方法、装置及评估系统 | |
CN115617549A (zh) | 线程解耦方法、装置、电子设备及存储介质 | |
CN109885384A (zh) | 任务并行度优化方法、装置、计算机设备及存储介质 | |
CN107547270A (zh) | 一种智能分配任务分片的方法及装置 | |
CN106156069B (zh) | 日志系统和日志记录方法 | |
CN107526648A (zh) | 一种处理节点设备宕机的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200220 Address after: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Applicant after: HUAWEI TECHNOLOGIES Co.,Ltd. Address before: 210012 HUAWEI Nanjing base, 101 software Avenue, Yuhuatai District, Jiangsu, Nanjing Applicant before: Huawei Technologies Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |