WO2016061935A1

WO2016061935A1 - 一种资源调度方法、装置及计算机存储介质

Info

Publication number: WO2016061935A1
Application number: PCT/CN2015/071475
Authority: WO
Inventors: 陈福忠; 刘新强; 梁平; 汪邵飞
Original assignee: 中兴通讯股份有限公司
Priority date: 2014-10-20
Filing date: 2015-01-23
Publication date: 2016-04-28
Also published as: CN105592110A; CN105592110B

Abstract

本发明实施例公开了一种资源调度方法、装置及计算机存储介质；其中，所述资源调度方法包括：预先配置队列属性信息；所述队列属性信息包括队列的专属服务器信息，以及所述队列的优先级信息；基于所述队列的专属服务器信息以及所述队列的优先级信息进行资源调度。

Description

一种资源调度方法、装置及计算机存储介质

技术领域

本发明涉及通信控制技术，具体涉及一种资源调度方法、装置及计算机存储介质。

背景技术

Hadoop技术是目前在大数据平台中应用率最高的技术。而目前，Hadoop技术采用基于优先级和时间的策略对资源进行调度；具体的，所有应用都提交到默认队列中，在该默认队列中，所有应用先按照优先级进行排队，相同优先级的按时间先后顺序进行排队，即优先级高且排队时间在先的应用优先分配资源。

但随着Hadoop技术的普及，单个Hadoop集群中的用户量和应用程序种类不断增加，采用上述的资源调度机制已不能很好的利用集群的资源，也不能够满足不同应用的服务质量要求，尤其在特定高优先级应用需要独占资源的场景下，上述资源调度机制已不能满足该特定场景的需求，因此亟待提出一种新的资源调度方案。

发明内容

为解决现有存在的技术问题，本发明实施例提供一种资源调度方法及装置，能够实现特定业务场景下的资源独占。

为达到上述目的，本发明实施例的技术方案是这样实现的：

本发明实施例提供了一种资源调度方法，所述方法包括：

预先配置队列属性信息；所述队列属性信息包括队列的专属服务器信息，以及所述队列的优先级信息；

基于所述队列的专属服务器信息以及所述队列的优先级信息进行资源调度。

在另一实施例中，所述基于所述队列的专属服务器信息以及所述队列的优先级信息对所有队列中的作业进行资源调度，包括：

按所述队列的优先级由高到低为所述队列分配所述队列对应的专属服务器的资源。

在另一实施例中，所述方法还包括：当所述队列的优先级相同时，按先入先出规则为所述队列分配所述队列对应的专属服务器的资源。

在另一实施例中，当所述队列属性信息中不包括所述队列的专属服务器信息，或者所述队列的专属服务器信息配置为空时，所述方法还包括：

按所述队列的优先级由高到低为所述队列分配所有服务器的资源。

在另一实施例中，所述方法还包括：当所述队列的优先级相同时，按先入先出规则为所述队列分配所有服务器的资源。

本发明实施例还提供了一种资源调度装置，所述装置包括：配置单元和调度单元；其中，

所述配置单元，配置为预先配置队列属性信息；所述队列属性信息包括队列的专属服务器信息，以及所述队列的优先级信息；

所述调度单元，配置为基于所述配置单元配置的所述队列的专属服务器信息以及所述队列的优先级信息进行资源调度。

在另一实施例中，所述调度单元，配置为按所述队列的优先级由高到低为所述队列分配所述队列对应的专属服务器的资源。

在另一实施例中，所述调度单元，还配置为当所述队列的优先级相同时，按先入先出规则为所述队列分配所述队列对应的专属服务器的资源。

在另一实施例中，所述调度单元，还配置为当所述配置单元配置的所述队列属性信息中不包括所述队列的专属服务器信息，或者所述队列的专属服务器信息配置为空时，按所述队列的优先级由高到低为所述队列分配所有服务器的资源。

在另一实施例中，所述调度单元，还配置为当所述队列的优先级相同时，按先入先出规则为所述队列分配所有服务器的资源。

本发明实施例还提供了一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行本发明实施例所述的资源调度方法。

本发明实施例提供的资源调度方法、装置及计算机存储介质，通过预先配置队列属性信息；所述队列属性信息包括队列的专属服务器信息，以及所述队列的优先级信息；基于所述队列的专属服务器信息以及所述队列的优先级信息进行资源调度。如此，实现了特定业务场景下的资源独占，避免了安全性和稳定性要求较高的特殊业务之间相互抢占资源所带来的不利影响。

附图说明

图1为本发明实施例一的资源调度方法的流程示意图；

图2为本发明实施例一的资源调度装置的组成结构示意图；

图3为本发明实施例二的资源调度方法的流程示意图；

图4为本发明实施例二中资源调度器对队列进行的遍历的示意图；

图5为本发明实施例二中资源调度器对队列进行资源调度的示意图。

具体实施方式

下面结合附图及具体实施例对本发明作进一步详细的说明。

本发明实施例提供了一种资源调度方法；图1为本发明实施例一的资源调度方法的流程示意图；如图1所示，所述方法包括：

步骤101：预先配置队列属性信息；所述队列属性信息包括队列的专属服务器信息，以及所述队列的优先级信息。

本实施例中，所述资源调度方法在实际应用中，可应用在分布式系统中的主节点中的调度器中。所述调度器在资源调度之前加载队列配置文件，所述队列配置文件中新增队列属性信息，所述队列属性信息可预先由用户配置。

其中，所述队列属性信息包括队列的专属服务器信息，所述队列的专属服务器信息具体可以如下所示：yarn.queueA1.hosts＝C1,C3；其中，C1和C3表示为队列配置的专属服务器标识，所述专属服务器标识可以是所述专属服务器的主机名或者主机的互联网协议(IP，Internet Protocol)地址；当所述队列的专属服务器信息中设置的专属服务器为两个或两个以上时，两个专属服务器标识之间用逗号分隔。若所述队列属性信息中无所述队列的专属服务器信息、或所述队列的专属服务器信息设置为空时，表明所述队列无配置的专属服务器，所有的服务器均可分配至所述队列进行作业处理。

其中，所述队列属性信息还包括队列的优先级信息，所述队列的优先级信息用于配置队列优先级；例如队列优先级分为5级；其中，队列优先级1级为最高级；当没有配置队列的优先级信息时，默认所述队列的优先级为最低级，即默认所述队列的优先级为5级。

步骤102：基于所述队列的专属服务器信息以及所述队列的优先级信息进行资源调度。

这里，所述基于所述队列的专属服务器信息以及所述队列的优先级信息对所有队列中的作业进行资源调度，包括：

具体的，以队列的优先级为5级为例，当队列A的优先级为3、队列B的优先级为5时，且所述队列A和所述队列B的队列属性信息中配置的专属服务器均为服务器C，则所述服务器C的资源优先为所述队列A的作业分配，再为所述队列B中的作业分配。

当所述队列的优先级相同时，按先入先出(FIFO，First Input First Output)规则为所述队列分配所述队列对应的专属服务器的资源。

具体的，以队列的优先级为5级为例，当队列A的优先级为3、队列B的优先级为3时，且所述队列A和所述队列B的队列属性信息中配置的专属服务器均为服务器C，则根据所述队列A和所述队列B中的作业的时间先后顺序，所述服务器C的资源优先为所述队列A和所述队列B中时间在先的作业分配资源。

采用本发明实施例的技术方案，实现了特定业务场景下的资源独占，避免了安全性和稳定性要求较高的特殊业务之间相互抢占资源所带来的不利影响。

依据本发明实施例的另一实施例，当所述队列属性信息中不包括所述队列的专属服务器信息，或者所述队列的专属服务器信息配置为空时，所述方法还包括：

具体的，所述按所述队列的优先级由高到低为所述队列分配所有服务器的资源，包括：按所述队列的优先级由高到低为所述队列分配所有服务器中的空闲资源。例如，以队列的优先级为5级为例，当队列A的优先级为3、队列B的优先级为5时，且所述队列A和所述队列B的队列属性信息中没有配置专属服务器信息；能够为所述队列A和所述队列B提供资源的服务器包括服务器C1、C2和C3，则在当前只有服务器C1处于空闲状态时，优先将所述服务器C1的资源分配给所述队列A，再分配至所述队列B。

依据本发明实施例的另一实施例，当所述队列的优先级相同时，按先入先出规则为所述队列分配所有服务器的资源。

具体的，以队列的优先级为5级为例，当队列A的优先级为3、队列B的优先级为3时，且所述队列A和所述队列B的队列属性信息中没有配置专属服务器信息，能够为所述队列A和所述队列B提供资源的服务器包括服务器C1、C2和C3，则在当前只有服务器C1处于空闲状态时，根据所述队列A和所述队列B中的作业的时间先后顺序，所述服务器C1的资源优先为所述队列A和所述队列B中时间在先的作业分配资源。

采用本实施例的技术方案，不仅实现了特定业务场景下的资源独占，避免了安全性和稳定性要求较高的特殊业务之间相互抢占资源所带来的不利影响。而且充分利用了资源，大大提高了资源利用率。

本发明实施例还提供了一种资源调度装置；图2为本发明实施例一的资源调度装置的组成结构示意图；如图2所示，所述装置包括：配置单元21和调度单元22；其中，

所述配置单元21，配置为预先配置队列属性信息；所述队列属性信息包括队列的专属服务器信息，以及所述队列的优先级信息；

所述调度单元22，配置为基于所述配置单元21配置的所述队列的专属服务器信息以及所述队列的优先级信息进行资源调度。

本实施例中，所述资源调度装置在实际应用中，可通过分布式文件系统中的主节点中的调度器实现。

依据本发明实施例的另一实施例，所述调度单元22，配置为按所述队列的优先级由高到低为所述队列分配所述队列对应的专属服务器的资源。

依据本发明实施例的另一实施例，所述调度单元22，还配置为当所述队列的优先级相同时，按先入先出规则为所述队列分配所述队列对应的专属服务器的资源。

依据本发明实施例的另一实施例，所述调度单元22，还配置为当所述配置单元21配置的所述队列属性信息中不包括所述队列的专属服务器信息，或者所述队列的专属服务器信息配置为空时，按所述队列的优先级由高到低为所述队列分配所有服务器的资源。

依据本发明实施例的另一实施例，所述调度单元22，还配置为当所述队列的优先级相同时，按先入先出规则为所述队列分配所有服务器的资源。

本领域技术人员应当理解，本发明实施例的资源调度装置中各处理单元的功能，可参照前述资源调度方法的相关描述而理解，本发明实施例的资源调度装置中各处理单元，可通过实现本发明实施例所述的功能的模拟电路而实现，也可以通过执行本发明实施例所述的功能的软件在智能终端上的运行而实现。

本实施例中，所述装置中的配置单元21和调度单元22，在实际应用中可由所述装置中的中央处理器(CPU，Central Processing Unit)、数字信号处理器(DSP，Digital Signal Processor)或可编程门阵列(FPGA，Field－Programmable Gate Array)实现。

本发明实施例还提供了一种资源调度方法；图3为本发明实施例二的资源调度方法的流程示意图；如图3所示，所述方法包括：

步骤301：资源管理节点(ResourceManager)向资源调度器(ResourceScheduler)发送初始化消息，以初始化所述资源调度器。

步骤302：所述资源调度器加载队列配置文件。所述队列配置文件中新增队列属性信息，所述队列属性信息包括配置项信息，所述配置项信息配置为为队列配置的服务器或服务器群；其中，所述配置项具体可以如下所示：yarn.queueA1.hosts＝C1,C3；其中，C1和C3表示为队列配置的专属服务器标识，所述专属服务器标识可以是所述专属服务器的主机名或者主机的IP地址，两个专属服务器标识之间用逗号分隔；若所述配置项中没有表示为队列配置的专属服务器标识，则说明为无队列配置的专属服务器。所述队列属性信息中还包括队列的优先级信息，所述队列的优先级信息配置为配置队列优先级；例如队列优先级分为5级，其中，队列优先级1级为最高级；当没有配置队列的优先级信息时，默认所述队列的优先级为最低级，即默认所述队列的优先级为5级；进一步的，将所述队列配置文件加载至对应的队列对象(Queue)中。

步骤303：所述资源调度器遍历队列对象，获取每个队列的队列属性信息。

这里，所述资源调度器从根队列开始，从根队列到叶子队列遍历整个层级队列，获取每个队列的队列属性信息，即获取队列的专属服务器相关信息和队列的优先级信息，将所述队列的专属服务器相关信息和所述队列的优先级信息保存在内存对象中。

具体的，图4为本发明实施例二中资源调度器对队列进行的遍历的示意图；如图4所示，假定系统中包括A1、A2和B三个叶子队列，处理作业的服务器包括C1、C2和C3三个服务器；则资源调度器从根队列(ROOT)开始，从根队列到叶子队列遍历层级队列；获得叶子队列A1、A2、B的队列属性信息；如图4所示。获得叶子队列A1的优先级为3，C1服务器和C3服务器是叶子队列A1的专属服务器；获得叶子队列A2的优先级为3，C1服务器和C2服务器是叶子队列A2的专属服务器；叶子队列B无配置项信息和优先级信息的设置，则表明叶子队列B的优先级为5，以及所有服务器均可处理所述叶子队列B中的作业，但是仅当所有服务器中任一服务器处于空闲状态时，才能够处理所述叶子队列B中的作业。

则每个服务器对应处理的队列信息如下所示：

C1服务器对应处理的队列为：A1(优先级为3)、A2(优先级为3)、B(优先级为5)；

C2服务器对应处理的队列为：A2(优先级为3)、B(优先级为5)；

C3服务器对应处理的队列为：A1(优先级为3)、B(优先级为5)。

步骤304：从HDFS的分布式计算引擎的临时目录获取作业切片信息，并根据所述作业切片信息生成内部作业(Task)对象。

步骤305：作业管理程序(AppMaster)根据所述Task对象获取Task的资源请求信息，所述Task的资源请求信息包括：任务优先级、期望资源所在主机(Host)、资源量(具体包括内存、中央处理器等)、容器(Container)数量、是否松弛本地性等属性信息。

步骤306：作业管理程序(AppMaster)向资源管理节点(ResourceManager)发送心跳消息以请求资源分配。

步骤307：资源管理节点(ResourceManager)触发资源调度器，并将作业管理程序(AppMaster)的资源分配请求保存到所述资源管理节点(ResourceManager)的内存中。

步骤308：计算节点(NodeManager)向资源管理节点(ResourceManager)上报心跳消息，并释放空闲Container，以便为所述资源管理节点(ResourceManager)准备新的资源分配。

步骤309：资源管理节点(ResourceManager)触发资源调度器进行资源分配。

步骤310：资源调度器清理内部Container。

步骤311：资源调度器从根队列开始遍历队列树；并通过二叉树算法查找到高优先级的叶子队列。图5为本发明实施例二中资源调度器对队列进行资源调度的示意图；如图5所示，资源调度器利用步骤303中保存的队列属性信息，当作业提交到某个特定队列时，所述特定队列配置专属服务器，所述专属服务器只处理所述特定队列中的作业。

其中，处于高优先级队列中的作业，优先分配到所述高优先级队列对应的专属服务器的资源；处于相同优先级队列中的作业，按FIFO算法分配资源。

如图5所示，当计算节点(NodeManager)中的C1服务器释放资源时，查找到叶子队列A1(优先级为3)、叶子队列A2(优先级为3)和叶子队列B(优先级为5)的数据；由于叶子队列A1和叶子队列A2的优先级相同，资源调度器在分配资源时，先在叶子队列A1和叶子队列A2的等待作业中按FIFO算法进行资源分配；如果叶子队列A1和叶子队列A2没有等待作业，则在叶子队列B中按FIFO算法进行资源分配。

步骤312：资源调度器通过二叉树算法，找到优先高的应用并进行资源分配；分配成功则结束此次资源分配，并保存资源分配结果。

这里，每个应用都携带有优先级信息，所述资源调度器可通过二叉树算法获取到所述每个应用的优先级信息，查找到优先级高的应用。

步骤313：作业管理程序(AppMaster)向资源管理节点(ResourceManager)发送心跳消息申请资源分配，所述资源管理节点(ResourceManager)向所述资源调度器发送请求消息，所述请求消息配置为请求资源分配结果；所述资源调度器返回所述请求消息的响应消息，所述请求消息的响应消息中携带有资源分配结果；所述资源管理节点(ResourceManager)向所述作业管理程序(AppMaster)发送心跳消息中携带有所述资源分配结果。

步骤314：作业管理程序(AppMaster)根据所述资源分配结果按如下顺序分配资源：优先级高的作业、源数据本地化、本机架、不在同一机架。

具体的，所述作业管理程序(AppMaster)首先按优先级顺序分配资源，优先将资源分配给高优先级的作业；在资源仍有剩余的情况下，优先分配资源给本地(即本服务器)的作业；在资源仍有剩余的情况下，优先分配资源给本机架中的其他服务器的作业；在资源仍有剩余的情况下，分配资源给其他机架中的服务器的作业。

步骤315：作业管理程序(AppMaster)向资源管理节点(ResourceManager)发送心跳消息，以通知所述资源管理节点(ResourceManager)释放所述Task的其他资源请求。

步骤316：作业管理程序(AppMaster)向计算节点(NodeManager)发送消息，请求启动Task。

步骤317：计算节点(NodeManager)启动task。

在本实施例中，所述资源管理节点(ResourceManager)和所述资源调度器(ResourceScheduler)均为分布式系统的主节点中的功能单元，所述资源管理节点(ResourceManager)主要配置为对所述资源调度器(ResourceScheduler)的控制及触发，所述资源调度器(ResourceScheduler)主要配置为对资源进行调度；所述计算节点(NodeManager)为所述分布式系统的从节点的功能单元；所述作业管理程序(AppMaster)为所述分布式系统的从节点中的功能单元。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

工业实用性

本发明实施例通过预先配置队列属性信息；所述队列属性信息包括队列的专属服务器信息，以及所述队列的优先级信息；基于所述队列的专属服务器信息以及所述队列的优先级信息进行资源调度。如此，实现了特定业务场景下的资源独占，避免了安全性和稳定性要求较高的特殊业务之间相互抢占资源所带来的不利影响。

Claims

一种资源调度方法，所述方法包括：

预先配置队列属性信息；所述队列属性信息包括队列的专属服务器信息，以及所述队列的优先级信息；

基于所述队列的专属服务器信息以及所述队列的优先级信息进行资源调度。
根据权利要求1所述的方法，其中，所述基于所述队列的专属服务器信息以及所述队列的优先级信息对所有队列中的作业进行资源调度，包括：

按所述队列的优先级由高到低为所述队列分配所述队列对应的专属服务器的资源。
根据权利要求2所述的方法，其中，所述方法还包括：当所述队列的优先级相同时，按先入先出规则为所述队列分配所述队列对应的专属服务器的资源。
根据权利要求1所述的方法，其中，当所述队列属性信息中不包括所述队列的专属服务器信息，或者所述队列的专属服务器信息配置为空时，所述方法还包括：

按所述队列的优先级由高到低为所述队列分配所有服务器的资源。
根据权利要求4所述的方法，其中，所述方法还包括：当所述队列的优先级相同时，按先入先出规则为所述队列分配所有服务器的资源。
一种资源调度装置，所述装置包括：配置单元和调度单元；其中，

所述配置单元，配置为预先配置队列属性信息；所述队列属性信息包括队列的专属服务器信息，以及所述队列的优先级信息；

所述调度单元，配置为基于所述配置单元配置的所述队列的专属服务器信息以及所述队列的优先级信息进行资源调度。
根据权利要求6所述的装置，其中，所述调度单元，配置为按所述队列的优先级由高到低为所述队列分配所述队列对应的专属服务器的资源。
根据权利要求7所述的装置，其中，所述调度单元，还配置为当所述队列的优先级相同时，按先入先出规则为所述队列分配所述队列对应的专属服务器的资源。
根据权利要求6所述的装置，其中，所述调度单元，还配置为当所述配置单元配置的所述队列属性信息中不包括所述队列的专属服务器信息，或者所述队列的专属服务器信息配置为空时，按所述队列的优先级由高到低为所述队列分配所有服务器的资源。
根据权利要求9所述的装置，其中，所述调度单元，还配置为当所述队列的优先级相同时，按先入先出规则为所述队列分配所有服务器的资源。
一种计算机存储介质，所述计算机存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求1至5任一项所述的资源调度方法。