CN106569887B

CN106569887B - 一种云环境下细粒度任务调度方法

Info

Publication number: CN106569887B
Application number: CN201610969793.7A
Authority: CN
Inventors: 李小平; 倪春泉; 朱夏; 胡苇; 陈龙
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2016-11-04
Filing date: 2016-11-04
Publication date: 2020-04-24
Anticipated expiration: 2036-11-04
Also published as: CN106569887A

Abstract

本发明公开了一种云环境下细粒度任务调度方法，包括如下步骤：(1)将作业按一定方式划分为细粒度任务，对细粒度的任务进行优先级和资源限制情况进行判断，根据优先级高低和资源是否有限制，将任务调度到不同的机器和机器中不同的队列上；(2)每个机器上预设有不同的架构执行器，机器接收到任务后，分配到相应与有任务一致架构的队列上排队等待执行器执行。本发明的有益效果为：提供细粒度任务去中心化调度方法，有效解决中心化方式调度对于细粒度任务的高延迟问题，并且不存在长尾现象，吞吐量也相应提高。

Description

一种云环境下细粒度任务调度方法

技术领域

本发明涉及云计算资源分配/调度领域，尤其是一种云环境下细粒度任务调度方法。

背景技术

大规模的数据分析框架越来越偏向任务更短的执行时间和更高的并行度来提供更低的延迟。一些高性能应用需要有内部高吞吐量服务来满足每秒数千次的用户请求，来优化用户体验，所以低延迟的响应这些请求非常重要。例如面向用户的服务能够运行更加复杂的并行计算，语言翻译、高度个性化搜索等。

已经有很多数据分析框架来分析大数据，比如Dremel、Impala和Spark等，它们都不断缩减响应时间，已经能达到秒级了。

有很多极短的次秒级的任务组成的作业，面临很大的调度困难。对这样一个集群，相当于一秒钟要做百万次调度决策，这些决策也需要很低的延迟。

目前应用广泛的中心化调度策略并不支持次秒级的并行任务，它需要处理的是两倍于现存最快的调度的吞吐量，改进中心化调度策略以支持次秒级并行任务存在瓶颈难以突破。

Spark是一个比较新的大数据并行计算框架，启用了内存分布数据集，除了能够提供交互式查询外，还可以优化迭代工作负载。作业的中间输出结果可以保存在内存上，不需要读取Hadoop分布式文件系统HDFS，因此更适合数据挖掘机器学习等需要频繁迭代的MapReduce的算法。

但是Spark使用的仍然是中心化调度方法，还是无法克服延迟问题。

发明内容

本发明所要解决的技术问题在于，提供一种云环境下细粒度任务调度方法，可以有效解决中心化方式调度对于细粒度任务的高延迟问题，提高吞吐量。

为解决上述技术问题，本发明提供一种云环境下细粒度任务调度方法，包括如下步骤：

(1)将作业按一定方式划分为细粒度任务，对细粒度的任务进行优先级和资源限制情况进行判断，根据优先级高低和资源是否有限制，将任务调度到不同的机器和机器中不同的队列上；

(2)每个机器上预设有不同的架构执行器，机器接收到任务后，分配到相应与有任务一致架构的队列上排队等待执行器执行。

优选的，步骤(1)中，对需要用户提交的作业，分配一个调度器，根据作业的架构类型，标记架构类型，并标记优先级。

优选的，步骤(1)中，分配任务到不同机器和不同队列包括如下步骤：

S1、调度器按顺序调度数量值为n的任务，判断任务的优先级，如果是高优先级进入S₂，如果是低优先级进入S₃；

S2、随机选取n*m个机器，m是一个大于2的数值，按照任务的架构，选取其中在预设架构下队列最短的n个机器，任务进入高优先级的队列，并根据自身的架构类型抢占式占取该预设架构的队列，执行步骤S₄；

S3、判断任务是否有资源限制，若有资源限制，调度器向符合资源限制的机器发送探测器，并在队列中预留一个任务的位置，机器一旦空闲，向调度器回馈信息；若没有资源限制，则随机选取n*m个机器发送探测器，并在队列中预留一个任务的位置，一旦有空闲机器就向调度器反馈信息，当有n个机器开始执行任务时，调度器向剩余n*(m-1)个机器发送终止请求信息；

S4、在队列上的任务要开始执行时，相应有预设架构的执行器，读取输入数据，并开始执行任务；

S5、判断该作业的所有任务是否已经全部完成，如果没有全部完成，则跳转至S₁；

S6、全部完成，作业执行结束。

优选的，步骤(2)中，预设的架构为Spark中的处理数据模型或MapReduce中的处理数据模型。

优选的，步骤(2)中，执行器真正开始执行任务，向调度器发送正在执行的信号。

优选的，步骤(2)中，若调度器中计数器达到分发的任务数，所有任务都已经执行，调度器向剩下的有预留位置的工作节点发送撤销预留位置的信号。

本发明的有益效果为：提供细粒度任务去中心化调度方法，有效解决中心化方式调度对于细粒度任务的高延迟问题，并且不存在长尾现象，吞吐量也相应提高。

附图说明

图1是本发明的基本原理示意图。

图2是本发明的调度方法的流程示意图。

图3是本发明的实施例中调度方法的流程示意图。

图4是本发明的RPC信息流动图。

图5是本发明的子流程的示意图。

具体实施方式

如图1和图2所示，一种云环境下细粒度任务调度方法，包括如下步骤：

(1)将作业按一定方式划分为细粒度任务，对细粒度的任务进行优先级和资源限制情况进行判断，根据优先级高低和资源是否有限制，将任务调度到不同的机器和机器中不同的队列上；需要用户提交的作业，分配一个调度器，根据作业的架构类型，标记架构类型，并标记优先级；将作业按照执行先后顺序划分阶段，进行有向无环图调度，划分出若干细粒度任务，每个阶段包含若干任务的任务集；

(2)每个机器上预设有不同的架构执行器，预设的架构为Spark中的处理数据模型或MapReduce中的处理数据模型；机器接收到任务后，分配到相应与有任务一致架构的队列上排队等待执行器执行，等待执行的任务实际为任务在工作节点上预留的位置；执行器真正开始执行任务，向调度器发送已执行的信号；若调度器中计数器达到分发的任务数，所有任务都已执行，调度器向剩下的有预留位置的工作节点发送撤销预留位置的信号。

步骤(1)中，分配任务到不同机器和不同队列包括如下步骤：

S1、调度器按顺序调度数量值为n的任务，判断任务的优先级，如果是高优先级进入S₂，如果是低优先级进入S₃；n的取值范围为5～8，步骤S2中，m的取值范围为2～3；

S6、全部完成，作业执行结束。

为了使公众更好的理解，下面以一个实施例来对本发明技术方案进行进一步详细说明。如图3、4和图5所示，本发明的方法实现流程具体如下：

步骤s101、用户提交一个查询作业，分配一个调度器，跟据作业的架构类型为Spark，标记为Spark架构，并标记优先级低；

步骤s102、按顺序分配3个任务，并执行接下来任务处理工作；

步骤s103、调度器开始判断任务的优先级，为低优先级，转入下步；部分为高优先级，转入s110；

步骤s104、判断是否有条件限制，这里为是否有本地化数据，结果是有条件限制转入步骤s105，无条件限制的转入步骤s107；

步骤s105、寻找发现，有该部分任务数据的机器节点为3台，并向这3台符合条件的机器发送探测器；

步骤s106、机器执行完毕以前的任务，已空闲，此时向调度器发送自己空闲状态的信息；

步骤s107、随机选取3*4台机器，发送请求的探测器；

步骤s108、陆续有3台机器回馈空闲状态，调度器一次分配任务给这些机器，在3台机器都反馈完信息后，调度器发送取消信息给剩余3*3台机器；

步骤s109、将任务发给这些机器，并排入预设有Spark架构的队列，从本地读取相应的输入数据，执行器运行任务，直至完成，跳转到步骤是s111；

步骤s110、随机选取3*4个机器选取预设架构为Spark队列长度短的3个机器，并进入机器的高优先级队列，然后等待该机器上Spark队列目前运行的task结束，抢占Spark队列。读取相应的数据，执行器运行任务，直至完成，跳转到步骤s109；

步骤s111、判断该Spark作业是否已经完成，若没有完成转至步骤s102。

本发明尤其适用于实时性较强，交互性较强的作业，能达到提高吞吐量，降低延迟性的有益效果。

尽管本发明就优选实施方式进行了示意和描述，但本领域的技术人员应当理解，只要不超出本发明的权利要求所限定的范围，可以对本发明进行各种变化和修改。

Claims

1.一种云环境下细粒度任务调度方法，其特征在于，包括如下步骤：

(1)将作业按一定方式划分为细粒度任务，对细粒度的任务进行优先级和资源限制情况进行判断，根据优先级高低和资源是否有限制，将任务调度到不同的机器和机器中不同的队列上；分配任务到不同机器和不同队列包括如下步骤：

S6、全部完成，作业执行结束；

2.如权利要求1所述的云环境下细粒度任务调度方法，其特征在于，步骤(1)中，对需要用户提交的作业，分配一个调度器，根据作业的架构类型，标记架构类型，并标记优先级。

3.如权利要求1所述的云环境下细粒度任务调度方法，其特征在于，步骤(2)中，预设的架构为Spark中的处理数据模型或MapReduce中的处理数据模型。

4.如权利要求1所述的云环境下细粒度任务调度方法，其特征在于，步骤(2)中，执行器真正开始执行任务，向调度器发送正在执行的信号。

5.如权利要求1所述的云环境下细粒度任务调度方法，其特征在于，步骤(2)中，若调度器中计数器达到分发的任务数，所有任务都已经执行，调度器向剩下的有预留位置的工作节点发送撤销预留位置的信号。