CN113419838A - 资源调度方法、装置、电子设备及存储介质 - Google Patents

资源调度方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113419838A
CN113419838A CN202110806130.4A CN202110806130A CN113419838A CN 113419838 A CN113419838 A CN 113419838A CN 202110806130 A CN202110806130 A CN 202110806130A CN 113419838 A CN113419838 A CN 113419838A
Authority
CN
China
Prior art keywords
node
target
container
constraint condition
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110806130.4A
Other languages
English (en)
Inventor
李亚坤
张光辉
辛朝晖
邵凯阳
张一凡
师锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202110806130.4A priority Critical patent/CN113419838A/zh
Publication of CN113419838A publication Critical patent/CN113419838A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5038Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开实施例涉及一种资源调度方法、装置、电子设备及存储介质,该方法包括:作业的目标任务运行时,集群的资源管理器根据作业的约束条件和已存储的至少一个节点的监控信息,查找并记录运行目标任务的各节点中不符合约束条件的目标节点;资源管理器根据约束条件以及目标节点的监控信息,确定目标节点上需进行调度的目标容器,将目标容器的标识发送至作业对应的应用管理器;应用管理器基于目标容器的标识和预设调度策略对目标容器进行调度处理,以使运行目标任务的各节点符合约束条件。本公开方案能够保证在作业的任务运行过程中,对节点的资源进行持续调度处理以使运行目标任务的各节点基本一直符合约束条件,从而保证作业能够持续稳定地运行。

Description

资源调度方法、装置、电子设备及存储介质
技术领域
本公开涉及计算机技术领域,尤其涉及一种资源调度方法、资源调度装置,以及实现资源调度方法的电子设备及计算机可读存储介质。
背景技术
YARN(Yet Another Resource Negotiator,另一种资源协调器)是一种通用的资源管理系统,可以为MapReduce(一种编程模型)、Spark(一种为大规模数据处理而设计的快速通用的计算引擎)等多种计算框架提供资源管理和分配。YARN通常由资源管理器RM(Resource Manager)和多个节点的节点管理器NM(Node Manager)组成,RM为用户提交的作业创建应用管理器AM,基于AM的资源请求对各个节点上的资源进行管理和调度。Container(容器)是YARN中的资源抽象,封装了一个节点上的多维度资源,如内存、CPU(CentralProcessing Unit,中央处理单元)、磁盘、网络等。AM向RM发送资源请求来申请作业的任务运行所需的资源,RM响应资源请求选择合适的节点分配资源,将资源分配结果返回AM,AM再与相应节点的NM通信以启动相应的容器来执行相应的作业任务。
在申请资源的时候,用户往往会根据作业特性,个性化地设置资源请求的约束条件,例如,某一作业的任务运行时要求分配的资源所在节点的利用率不超过50%,基于这些约束条件构造资源请求并向RM提交相应的资源请求。
RM在进行资源分配时,分配给作业的任务的资源一般是可以满足约束条件的,然而,在作业的任务运行过程中,由于作业的任务运行和集群状态的高动态性和不可预估性,很容易出现分配的资源所在节点不再满足约束条件的情况,导致这些作业的任务运行受到严重影响,轻者产生较大延迟,重者导致作业运行失败,作业难以持续稳定地运行。
发明内容
为了至少部分或全部地解决上述技术问题,本公开实施例提供一种资源调度方法、资源调度装置、实现资源调度方法的电子设备和计算机可读存储介质。
第一方面,本公开提供了一种资源调度方法,所述方法包括:
作业的目标任务运行时,集群的资源管理器根据所述作业的约束条件和已存储的至少一个节点的监控信息,查找并记录运行所述目标任务的各节点中不符合所述约束条件的目标节点;
所述资源管理器根据所述约束条件以及所述目标节点的监控信息,确定所述目标节点上需进行调度的目标容器,并将所述目标容器的标识发送至所述作业对应的应用管理器;
所述应用管理器基于所述目标容器的标识以及预设调度策略,对所述目标容器进行调度处理,以使运行所述目标任务的各节点符合所述约束条件。
可选的,在公开的一些实施例中,所述方法还包括:
所述集群的各节点管理器对各自所在节点中运行的容器进行实时监控,并按照预设周期将各节点的所述监控信息发送至所述资源管理器;
所述资源管理器接收各节点的所述监控信息并存储。
可选的,在公开的一些实施例中,所述约束条件包括节点负载约束条件,所述监控信息包括容器的负载指标参数;
所述资源管理器根据所述约束条件以及所述目标节点的监控信息,确定所述目标节点上需进行调度的目标容器的步骤,包括:
在所述约束条件是节点负载约束条件时,获取所述目标节点的监控信息中记录的各容器的负载指标参数;
基于各所述容器的负载指标参数由大到小的顺序,确定目标容器,所述目标容器是被结束后使所述目标节点符合所述节点负载约束条件的一个或多个容器。
可选的,在公开的一些实施例中,所述应用管理器基于所述目标容器的标识以及预设调度策略,对所述目标容器进行调度处理的步骤,包括:
向所述目标节点的节点管理器发送容器结束指令,所述容器结束指令携带所述目标容器的标识;
所述目标节点的节点管理器响应所述容器结束指令,基于所述目标容器的标识查找到对应的目标容器,并将查找到的所述目标容器结束掉。
可选的,在公开的一些实施例中,所述负载指标参数至少包括容器中的目标进程的数量,所述目标进程包括处于运行状态的进程和/或处于不可中断状态的进程。
可选的,在公开的一些实施例中,所述约束条件包括节点无硬件故障约束条件,所述监控信息包括节点上的容器使用所述硬件的第一指示信息或者未使用所述硬件的第二指示信息;
所述资源管理器根据所述约束条件以及所述目标节点的监控信息,确定所述目标节点上需进行调度的目标容器的步骤,包括:
在所述目标节点存在硬件故障而不符合所述节点无硬件故障约束条件时,基于所述目标节点的监控信息确定具有所述第一指示信息的容器为目标容器。
可选的,在公开的一些实施例中,所述应用管理器基于所述目标容器的标识以及预设调度策略,对所述目标容器进行调度处理,以使运行所述目标任务的各节点符合所述约束条件的步骤,包括:
所述应用管理器基于所述目标容器的标识,向所述资源管理器发送资源申请请求;
所述资源管理器响应所述资源申请请求,在所述目标节点以外的节点上分配新的目标容器,以使运行所述目标任务的各节点符合所述约束条件。
第二方面,本公开实施例提供一种资源调度装置,所述装置包括:
节点确定模块,用于作业的目标任务运行时,使集群的资源管理器根据所述作业的约束条件和已存储的至少一个节点的监控信息,查找并记录运行所述目标任务的各节点中不符合所述约束条件的目标节点;
容器确定模块,用于使所述资源管理器根据所述约束条件以及所述目标节点的监控信息,确定所述目标节点上需进行调度的目标容器,并将所述目标容器的标识发送至所述作业对应的应用管理器;
容器调度模块,用于使所述应用管理器基于所述目标容器的标识以及预设调度策略,对所述目标容器进行调度处理,以使运行所述目标任务的各节点符合所述约束条件。
可选的,在公开的一些实施例中,所述装置还包括:
信息收集模块,用于使所述集群的各节点管理器对各自所在节点中运行的容器进行实时监控,并按照预设周期将各节点的所述监控信息发送至所述资源管理器;
信息存储模块,用于使所述资源管理器接收各节点的所述监控信息并存储。
可选的,在公开的一些实施例中,所述约束条件包括节点负载约束条件,所述监控信息包括容器的负载指标参数;
所述容器确定模块,包括:
参数获取模块,用于在所述约束条件是节点负载约束条件时,获取所述目标节点的监控信息中记录的各容器的负载指标参数;
选择确定模块,用于基于各所述容器的负载指标参数由大到小的顺序,确定目标容器,所述目标容器是被结束后使所述目标节点符合所述节点负载约束条件的一个或多个容器。
可选的,在公开的一些实施例中,所述容器调度模块,包括:
指令发送模块,用于向所述目标节点的节点管理器发送容器结束指令,所述容器结束指令携带所述目标容器的标识;
指令执行模块,用于使所述目标节点的节点管理器响应所述容器结束指令,基于所述目标容器的标识查找到对应的目标容器,并将查找到的所述目标容器结束掉。
可选的,在公开的一些实施例中,所述负载指标参数至少包括容器中的目标进程的数量,所述目标进程包括处于运行状态的进程和/或处于不可中断状态的进程。
可选的,在公开的一些实施例中,所述约束条件包括节点无硬件故障约束条件,所述监控信息包括节点上的容器使用所述硬件的第一指示信息或者未使用所述硬件的第二指示信息;
所述容器确定模块,具体用于在所述目标节点存在硬件故障而不符合所述节点无硬件故障约束条件时,基于所述目标节点的监控信息确定具有所述第一指示信息的容器为目标容器。
可选的,在公开的一些实施例中,所述容器调度模块,包括:
资源申请模块,用于使所述应用管理器基于所述目标容器的标识,向所述资源管理器发送资源申请请求;
资源分配模块,用于使所述资源管理器响应所述资源申请请求,在所述目标节点以外的节点上分配新的目标容器,以使运行所述目标任务的各节点符合所述约束条件。
第三方面,本公开实施例提供一种电子设备,包括处理器和存储介质,所述存储介质存储有能够被所述处理器执行的可执行指令,所述处理器执行所述可执行指令实现第一方面任一实施例所述的资源调度方法。
第四方面,本公开实施例提供一种计算机可读存储介质,所述存储介质存储有可执行指令,在被处理器调用和执行时实现第一方面任一实施例所述的资源调度方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
本公开实施例中,目标作业的任务运行时,集群的资源管理器根据所述目标作业的约束条件和已存储的至少一个节点的监控信息,查找并记录运行所述目标任务的各节点中不符合所述约束条件的目标节点;资源管理器根据所述约束条件以及所述目标节点的监控信息,确定所述目标节点上需进行调度的目标容器,并将所述目标容器的标识发送至所述目标作业对应的应用管理器;应用管理器基于所述目标容器的标识以及预设调度策略,对所述目标容器进行调度处理,以使运行所述目标任务的各节点符合所述约束条件。这样,本公开方案能够保证在作业的任务运行过程中,若出现初始为作业的任务分配的资源所在节点不满足作业的约束条件,则可对该节点的资源进行持续调度处理以使运行任务的各节点基本一直保持满足作业的约束条件,如此可降低约束条件对作业运行的影响,从而保证作业能够持续稳定地运行。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例的资源调度方法的流程示意图;
图2为本公开实施例资源调度方法的交互示意图;
图3为本公开实施例的资源调度装置的示意图;
图4为本公开实施例的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
在YARN的计算框架中,用户可以通过客户端Client提交作业至RM,RM为作业创建管理该作业运行的整个生命周期的应用程序管理器AM,AM为作业的任务向RM申请资源。用户提交作业时可配置作业的约束条件,以期在作业资源申请时获取作业运行的最合适资源,这些约束条件一般分为两种类型:强约束类型和弱约束类型。
强约束类型:必须要满足的约束条件。以高负载跳过强约束为例:分配的资源必须满足所在节点的负载小于配置阈值。
弱约束类型:尽力而为满足的约束条件。以高负载跳过弱约束为例:分配资源时优先从满足负载小于配置阈值的节点进行分配,若资源分配不足,则可以接受在部分高负载节点上分配资源。
AM申请资源时可在资源请求中同时配置一个或多个强约束类型和弱约束类型的约束条件,以获取合适资源,提高作业运行的效率。
随着数据业务对实时性、顺序性的更高要求,计算架构在不断演进,出现了以Flink(一种开源的流处理框架)为代表的计算架构,通过数据并行和流水线方式执行流数据程序。此类计算架构一个重要特点是,在作业运行的全生命周期中都对资源有很高的要求,作业通常会配置很多约束条件来保证资源质量,一旦约束条件不满足就会导致很大的延迟。例如:Flink任务对节点负载很敏感,当节点负载超过一定阈值后作业会出现非常明显的延迟,因此通常会配置高负载跳过强约束;Flink作业强依赖节点上的agent(代理服务),如果这些agent出现故障也会导致作业产出延迟甚至失败。
目前YARN中的RM在进行调度时受“时空”限制,“时”指的是做出调度决策的时刻,“空”指的是做出调度决策时的集群状态。虽然在资源调度分配时可以满足作业配置的约束条件,但是由于作业的任务运行和集群状态的高动态性,在作业的任务运行过程中就会出现约束条件不再满足的问题,导致这些作业的任务运行受到严重影响,轻者产生较大延迟,重者导致作业运行失败,作业难以持续稳定地运行。
为了至少部分或全部地解决上述技术问题,本公开实施例提供了一种资源调度方法、资源调度装置、电子设备及存储介质。下面,首先对本公开实施例所提供的资源调度方法进行介绍。如图1所示,本公开实施例提供了一种资源调度方法,可以包括如下步骤:
步骤S101:作业的目标任务运行时,集群的资源管理器根据所述作业的约束条件和已存储的至少一个节点的监控信息,查找并记录运行所述目标任务的各节点中不符合所述约束条件的目标节点。
示例性的,节点的监控信息可以包括但不限于节点负载信息、节点利用率、节点上的容器Container相关信息例如Container中运行的进程数量、Container的负载指标参数等资源监控信息。各节点的节点管理器NM通过心跳汇报各节点的实时资源监控信息到资源管理器RM。
具体的,作业提交至RM时,一并提交作业的约束条件,RM为作业创建对应的应用管理器AM,AM向RM发送运行作业的目标任务的资源请求,RM为作业的目标任务分配资源之后,将资源分配结果返回AM,资源分配结果可以包含分配的容器所在节点的节点信息如节点标识以及容器标识,AM基于资源分配结果中的节点标识与相应节点的NM通信,以通知这些NM启动相应节点中上述容器标识指示的容器来执行目标任务。在目标任务运行时,RM根据约束条件和已存储的各节点的监控信息,查找并记录运行目标任务的各节点中不符合所述约束条件的目标节点。
示例性的,约束条件例如可以是强约束类型的条件,例如为作业的目标任务分配的资源即容器必须满足容器所在节点的负载小于预设阈值,该预设阈值可以根据不同类型的业务等设置,对此不作限制。当然约束条件并不限于此,也可以是弱约束类型的条件,其可根据具体情况来设置,本实施例中对此也不作限制。
举例来说,例如作业的约束条件中要求分配的容器所在节点如节点1、节点2、节点3和节点4的负载均小于70%,而随着作业的目标任务A的运行,当前时刻运行目标任务A的部分节点如节点3的负载大于70%,即不满足约束条件,可确定该节点3为目标节点。
或者,约束条件中要求分配的容器所在节点如节点1、节点2、节点3和节点4的利用率均小于50%,而随着作业的目标任务B的运行,当前时刻运行目标任务B的部分节点如节点2的利用率大于50%,即不满足约束条件,可确定该节点2为目标节点。
在一些实施例中,会同时有多个不同的作业在运行,因此RM中可以配置约束集,该约束集中可以包含不同的作业对应的一个或多个约束条件,之后可以从约束集中获取约束条件。
步骤S102:所述资源管理器根据所述约束条件以及所述目标节点的监控信息,确定所述目标节点上需进行调度的目标容器,并将所述目标容器的标识发送至所述作业对应的应用管理器。
示例性的,监控信息可以包括节点上的容器的负载(load)指标参数和/或容器所使用的硬件如CPU、磁盘的指示信息等。由于目标节点是不满足约束条件的节点,因此RM可以根据约束条件和目标节点的监控信息如目标节点上运行的各容器的负载指标参数等确定目标节点上需进行调度的目标容器,目标容器是目标节点上运行的所有容器中的部分容器,例如目标容器可以是负载指标参数较大的容器。RM在确定目标容器之后,可将目标容器的标识发送至作业的AM。
步骤S103:所述应用管理器基于所述目标容器的标识以及预设调度策略,对所述目标容器进行调度处理,以使运行所述目标任务的各节点符合所述约束条件。
示例性的,预设调度策略可以指示对目标容器调度后使得运行目标任务的各节点符合所述约束条件。具体的,AM收到目标容器的标识后,基于预设调度策略对所述目标容器进行调度处理,例如目标节点如上述节点3负载过高不再满足约束条件,然后调度处理例如结束(kill)目标容器使得节点3的负载降低恢复到满足约束条件结束,此时运行目标任务A的各节点如节点1、节点2、节点3和节点4符合约束条件。
应用本公开实施例提供的上述方案,能够保证在作业的任务运行过程中,若出现初始为作业的任务分配的资源所在节点不满足作业的约束条件,则可对该节点的资源进行持续调度处理以使运行任务的各节点基本一直保持满足作业的约束条件,如此可降低约束条件对作业运行的影响,从而保证作业能够持续稳定地运行。
可选的,在本公开的一些实施例中,所述方法还可包括以下步骤:
步骤i):所述集群的各节点管理器对各自所在节点中运行的容器进行实时监控,并按照预设周期将各节点的所述监控信息发送至所述资源管理器。
示例性的,预设周期可以根据需要设置,或者是YARN中默认的心跳周期,对此不作限制。YARN集群中各节点的NM对各自所在节点中运行的容器进行实时监控,例如监控容器运行状态,容器的负载指标参数以及容器中运行的进程数量等,并按照预设周期如心跳周期将各节点的监控信息发送至RM。
步骤ii):所述资源管理器接收各节点的所述监控信息并存储。
具体的,RM接收到各NM汇报的各节点的监控信息时存储监控信息。
可选的,在本公开的一些实施例中,所述约束条件可包括但不限于节点负载约束条件,所述监控信息可包括但不限于容器的负载指标参数。相应的,步骤S102中资源管理器根据所述约束条件以及所述目标节点的监控信息,确定所述目标节点上需进行调度的目标容器的步骤,具体可以包括以下子步骤:
步骤1):在所述约束条件是节点负载约束条件时,获取所述目标节点的监控信息中记录的各容器的负载指标参数。
示例性的,在本公开的一些实施例中,所述负载指标参数至少可以包括但不限于容器中的目标进程的数量,所述目标进程包括处于运行状态的进程和/或处于不可中断状态的进程。进程状态反映进程执行过程的变化,这些状态随着进程的执行和外界条件的变化而转换。本实施例中该目标进程包括处于运行状态的进程和处于不可中断状态的进程。不可中断状态例如是进程处于睡眠状态,但是此刻是不可中断的,即进程不响应异步信号,表示内核的某些处理流程是不能被打断的,依然会占用一定的资源。本实施例中,负载指标参数可包括各容器中的处于运行状态的进程的数量X和处于不可中断状态的进程的数量Y之和即总进程数Z=(X+Y)。
具体的,RM基于节点负载约束条件和各节点的监控信息确定例如运行目标任务A的各节点中不符合节点负载约束条件的目标节点之后,获取该目标节点的监控信息中记录的各容器的负载指标参数,例如各容器中的处于运行状态的进程和处于不可中断状态的进程的总进程数Z。假设目标节点上运行的有20个容器,则会有相应的20个总进程数Z如Z1~Z20。
步骤2):基于各所述容器的负载指标参数由大到小的顺序,确定目标容器,所述目标容器是被结束后使所述目标节点符合所述节点负载约束条件的一个或多个容器。
可以理解的是,目标节点的总负载基本上等于目标节点上运行的各所述容器的负载之和。示例性的,例如节点负载约束条件中要求运行目标任务A的节点如节点1、节点2、节点3和节点4的负载均小于70%,而当前确定的目标节点如节点3的负载是90%大于70%。因此可以将节点3上的例如20个容器的负载指标参数如上述总进程数Z1~Z20排序,按照总进程数Z1~Z20由大到小的顺序依次选择对应的容器作为目标容器,当选择的目标容器被结束后,若目标节点如节点3的负载由90%降低至小于70%,则结束选择。
本实施例提供的上述实施方案,在作业的任务运行过程中,若出现初始为作业的任务分配的资源所在节点不满足作业的约束条件,则可对该节点的资源进行持续调度处理以使运行任务的各节点基本一直保持满足作业的约束条件,如此可降低约束条件对作业运行的影响,从而保证作业能够持续稳定地运行。
进一步可选的,在本公开的一些实施例中,步骤S103中所述应用管理器基于所述目标容器的标识以及预设调度策略,对所述目标容器进行调度处理,以使运行所述目标任务的各节点符合所述约束条件的步骤,具体可以包括以下子步骤:
步骤3):向所述目标节点的NM发送容器结束指令,所述容器结束指令携带所述目标容器的标识。
步骤4):所述目标节点的NM响应所述容器结束指令,基于所述目标容器的标识查找到对应的目标容器,并将查找到的所述目标容器结束掉。
具体的,例如AM向上述节点3的NM发送容器结束(kill)指令,所述容器结束指令携带所述目标容器的标识如容器IP地址、唯一ID等。节点3的NM响应容器结束指令,基于目标容器的标识查找到对应的目标容器,并将查找到的所述目标容器结束掉。
可选的,在本公开的另一些实施例中,所述约束条件可包括节点无硬件故障约束条件,例如无磁盘故障约束条件,但不限于此。所述监控信息可包括节点上的容器使用所述硬件如磁盘的第一指示信息如标识“1”或者未使用所述硬件如磁盘的第二指示信息如标识“0”。相应的,步骤S102中资源管理器根据所述约束条件以及所述目标节点的监控信息,确定所述目标节点上需进行调度的目标容器的步骤,具体可包括以下步骤:在所述目标节点存在硬件故障而不符合节点无硬件故障约束条件时,获取所述目标节点的监控信息确定具有所述第一指示信息的容器为目标容器。
具体的,在一个实施例中,例如目标节点存在磁盘故障,那么会将目标节点上所有使用故障磁盘的容器选择出来。当目标节点存在例如磁盘故障而不符合节点无硬件故障约束条件时,RM基于目标节点的监控信息,判断监控信息中记录的各容器的信息中是否包含第一指示信息如标识“1”,若包含该标识“1”,则说明该容器使用当前故障的磁盘。RM将所有具有第一指示信息的容器,也即所有使用当前故障的磁盘的容器确定为目标容器。
本实施例提供的上述实施方案,在作业的任务运行过程中,若出现初始为作业的任务分配的资源所在节点不满足作业的约束条件,则可对该节点的资源进行持续调度处理以使运行任务的各节点基本一直保持满足作业的约束条件,如此可降低约束条件对作业运行的影响,从而保证作业能够持续稳定地运行。
可选的,在上述实施例的基础上,本公开的一些实施例中,步骤S103中所述应用管理器基于所述目标容器的标识以及预设调度策略,对所述目标容器进行调度处理,以使运行所述目标任务的各节点符合所述约束条件的步骤,具体可以包括以下子步骤:
步骤i):AM基于所述目标容器的标识,向所述RM发送资源申请请求。
步骤ii):所述RM响应所述资源申请请求,在所述目标节点以外的节点上分配新的目标容器,以使运行所述目标任务的各节点符合所述约束条件。
具体的,由于目标节点存在硬件故障如磁盘故障,因此在确定目标节点上所有使用当前故障的磁盘的容器为目标容器之后,由AM向RM重新为目标任务A申请资源,RM在目标节点如节点3以外的节点上分配新的目标容器,例如在新的节点5上分配了与目标节点上所有使用当前故障的磁盘的容器相对应的新的容器,且节点5无磁盘故障问题,满足约束条件如节点无硬件故障约束条件,此时运行目标任务A的各节点如节点1、节点2、节点3和节点5满足约束条件。这样在目标节点如节点3故障不满足约束条件时,可以及时在新的满足约束条件的节点上分配相应资源,如此可降低约束条件对作业运行的影响,从而保证作业能够及时持续稳定地运行。
为了便于理解,下面结合具体的系统交互,对本公开的资源调度方法进行介绍。如图2所示,为本公开的YARN上的资源调度方法的时序示意图。主要包括如下步骤:
第一步,NM(节点上的代理服务)会实时监控统计Container和节点各个维度的节点资源监控信息,例如:Container运行线程数、Container依赖服务的健康状况、节点实时负载信息等,该类节点资源监控信息会附随心跳信息上报(由于心跳时间很短,可以认为是实时汇报)给RM,以供进行持续调度决策。RM收到来自NM的节点资源监控信息后,可以进行更新和存储。
第二步,RM会遍历约束集获取一个作业的约束条件,基于约束条件和存储的各节点的资源监控信息,筛选出运行一个作业的目标任务的各节点中不再满足约束条件的目标节点,并记录该目标节点不再满足的具体约束条件。
第三步,RM获取目标节点的资源监控信息即遍历不满足约束条件的节点的资源监控信息如Container的状态信息等,基于该资源监控信息和具体约束条件,选择目标节点上需要进行调度的目标容器Container。例如:若该目标节点不满足节点负载约束条件,会基于资源监控信息中记录的各Container的负载指标由大到小进行选择需要结束掉的目标容器,直到该目标节点满足节点负载约束条件结束选择;若目标节点存在磁盘故障即不满足节点无硬件故障约束条件,则会将资源监控信息如Container的状态信息中记录的所有使用故障磁盘的Container选择出来作为目标容器。
第四步,RM将选择好的需要调度的目标Container的标识附随心跳信息返回给作业对应的AM。
AM在收到需要调度的Container的标识后,若是目标节点存在磁盘故障不满足约束条件,则会按照资源申请的业务逻辑进行处理,通常会重新申请资源在新的节点上启动作业的任务。若是目标节点的负载不满足约束条件如节点负载约束条件,则结束掉部分Container,直到该目标节点满足节点负载约束条件。
通过该实施方案,可以达到在作业的任务运行过程中也能够一直持续调度使得运行作业的任务的各节点满足约束条件,保证作业能够持续稳定运行。
基于与上述资源调度方法实施例相同的发明构思,本公开实施例还提供了一种资源调度装置,如图3所示,该装置可以包括节点确定模块301、容器确定模块302和容器调度模块303。
其中,节点确定模块301,用于作业的目标任务运行时,使集群的资源管理器根据所述作业的约束条件和已存储的至少一个节点的监控信息,查找并记录运行所述目标任务的各节点中不符合所述约束条件的目标节点。
容器确定模块302,用于使所述资源管理器根据所述约束条件以及所述目标节点的监控信息,确定所述目标节点上需进行调度的目标容器,并将所述目标容器的标识发送至所述作业对应的应用管理器。
容器调度模块303,用于使所述应用管理器基于所述目标容器的标识以及预设调度策略,对所述目标容器进行调度处理,以使运行所述目标任务的各节点符合所述约束条件。
应用本公开实施例提供的上述方案,能够保证在作业的任务运行过程中,若出现初始为作业的任务分配的资源所在节点不满足作业的约束条件,则可对该节点的资源进行持续调度处理以使运行任务的各节点基本一直保持满足作业的约束条件,如此可降低约束条件对作业运行的影响,从而保证作业能够持续稳定地运行。
可选的,在公开的一些实施例中,所述装置还包括:信息收集模块,用于使所述集群的各节点管理器对各自所在节点中运行的容器进行实时监控,并按照预设周期将各节点的所述监控信息发送至所述资源管理器;信息存储模块,用于使所述资源管理器接收各节点的所述监控信息并存储。
可选的,在公开的一些实施例中,所述约束条件包括节点负载约束条件,所述监控信息包括容器的负载指标参数;所述容器确定模块302,包括:参数获取模块,用于在所述约束条件是节点负载约束条件时,获取所述目标节点的监控信息中记录的各容器的负载指标参数;选择确定模块,用于基于各所述容器的负载指标参数由大到小的顺序,确定目标容器,所述目标容器是被结束后使所述目标节点符合所述节点负载约束条件的一个或多个容器。
可选的,在公开的一些实施例中,所述容器调度模块301包括:指令发送模块,用于向所述目标节点的节点管理器发送容器结束指令,所述容器结束指令携带所述目标容器的标识;指令执行模块,用于使所述目标节点的节点管理器响应所述容器结束指令,基于所述目标容器的标识查找到对应的目标容器,并将查找到的所述目标容器结束掉。
可选的,在公开的一些实施例中,所述负载指标参数至少包括容器中的目标进程的数量,所述目标进程包括处于运行状态的进程和/或处于不可中断状态的进程。
可选的,在公开的一些实施例中,所述约束条件包括节点无硬件故障约束条件,所述监控信息包括节点上的容器使用所述硬件的第一指示信息或者未使用所述硬件的第二指示信息;所述容器确定模块302具体用于在所述目标节点存在硬件故障而不符合所述节点无硬件故障约束条件时,基于所述目标节点的监控信息确定具有所述第一指示信息的容器为目标容器。
可选的,在公开的一些实施例中,所述容器调度模块302包括:资源申请模块,用于使所述应用管理器基于所述目标容器的标识,向所述资源管理器发送资源申请请求;资源分配模块,用于使所述资源管理器响应所述资源申请请求,在所述目标节点以外的节点上分配新的目标容器,以使运行所述目标任务的各节点符合所述约束条件。
本公开实施例还提供了一种电子设备,如图4所示,包括处理器401和存储介质402,存储介质402存储有能够被处理器401执行的可执行指令,处理器401执行可执行指令实现如上述本公开各实施例所提供的资源调度方法。
应用本公开实施例提供的上述方案,能够保证在作业的任务运行过程中,若出现初始为作业的任务分配的资源所在节点不满足作业的约束条件,则可对该节点的资源进行持续调度处理以使运行任务的各节点基本一直保持满足作业的约束条件,如此可降低约束条件对作业运行的影响,从而保证作业能够持续稳定地运行。
上述存储介质可以包括RAM(Random Access Memory,随机存取存储器),也可以包括NVM(Non-volatile Memory,非易失性存储器),例如至少一个磁盘存储器。可选的,存储介质还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括CPU、NP(Network Processor,网络处理器)等;还可以是DSP(Digital Signal Processor,数字信号处理器)、ASIC(ApplicationSpecific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
存储介质402与处理器401之间可以通过有线连接或者无线连接的方式进行数据传输,并且电子设备与其他设备之间可以通过有线通信接口或者无线通信接口进行通信。图4所示的仅为通过总线进行数据传输的示例,不作为具体连接方式的限定。
另外,本公开提供了一种计算机可读存储介质,该存储介质存储有可执行指令,在被处理器调用和执行时实现如上述本公开各实施例所提供的资源调度方法。
在本公开实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行:如上述本公开各实施例所提供的资源调度方法。
对于资源调度装置、电子设备和存储介质实施例而言,由于其涉及的方法内容基本相似于前述的方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本公开实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、DSL(Digital Subscriber Line,数字用户线))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如DVD(DigitalVersatile Disc,数字多功能光盘))、或者半导体介质(例如SSD(Solid State Disk,固态硬盘))等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (16)

1.一种资源调度方法,其特征在于,所述方法包括:
作业的目标任务运行时,集群的资源管理器根据所述作业的约束条件和已存储的至少一个节点的监控信息,查找并记录运行所述目标任务的各节点中不符合所述约束条件的目标节点;
所述资源管理器根据所述约束条件以及所述目标节点的监控信息,确定所述目标节点上需进行调度的目标容器,并将所述目标容器的标识发送至所述作业对应的应用管理器;
所述应用管理器基于所述目标容器的标识以及预设调度策略,对所述目标容器进行调度处理,以使运行所述目标任务的各节点符合所述约束条件。
2.根据权利要求1所述的资源调度方法,其特征在于,所述方法还包括:
所述集群的各节点管理器对各自所在节点中运行的容器进行实时监控,并按照预设周期将各节点的所述监控信息发送至所述资源管理器;
所述资源管理器接收各节点的所述监控信息并存储。
3.根据权利要求1所述的资源调度方法,其特征在于,所述约束条件包括节点负载约束条件,所述监控信息包括容器的负载指标参数;
所述资源管理器根据所述约束条件以及所述目标节点的监控信息,确定所述目标节点上需进行调度的目标容器的步骤,包括:
在所述约束条件是节点负载约束条件时,获取所述目标节点的监控信息中记录的各容器的负载指标参数;
基于各所述容器的负载指标参数由大到小的顺序,确定目标容器,所述目标容器是被结束后使所述目标节点符合所述节点负载约束条件的一个或多个容器。
4.根据权利要求3所述的资源调度方法,其特征在于,所述应用管理器基于所述目标容器的标识以及预设调度策略,对所述目标容器进行调度处理的步骤,包括:
向所述目标节点的节点管理器发送容器结束指令,所述容器结束指令携带所述目标容器的标识;
所述目标节点的节点管理器响应所述容器结束指令,基于所述目标容器的标识查找到对应的目标容器,并将查找到的所述目标容器结束掉。
5.根据权利要求3或4所述的资源调度方法,其特征在于,所述负载指标参数至少包括容器中的目标进程的数量,所述目标进程包括处于运行状态的进程和/或处于不可中断状态的进程。
6.根据权利要求1所述的资源调度方法,其特征在于,所述约束条件包括节点无硬件故障约束条件,所述监控信息包括节点上的容器使用所述硬件的第一指示信息或者未使用所述硬件的第二指示信息;
所述资源管理器根据所述约束条件以及所述目标节点的监控信息,确定所述目标节点上需进行调度的目标容器的步骤,包括:
在所述目标节点存在硬件故障而不符合所述节点无硬件故障约束条件时,基于所述目标节点的监控信息确定具有所述第一指示信息的容器为目标容器。
7.根据权利要求6所述的资源调度方法,其特征在于,所述应用管理器基于所述目标容器的标识以及预设调度策略,对所述目标容器进行调度处理,以使运行所述目标任务的各节点符合所述约束条件的步骤,包括:
所述应用管理器基于所述目标容器的标识,向所述资源管理器发送资源申请请求;
所述资源管理器响应所述资源申请请求,在所述目标节点以外的节点上分配新的目标容器,以使运行所述目标任务的各节点符合所述约束条件。
8.一种资源调度装置,其特征在于,所述装置包括:
节点确定模块,用于作业的目标任务运行时,使集群的资源管理器根据所述作业的约束条件和已存储的至少一个节点的监控信息,查找并记录运行所述目标任务的各节点中不符合所述约束条件的目标节点;
容器确定模块,用于使所述资源管理器根据所述约束条件以及所述目标节点的监控信息,确定所述目标节点上需进行调度的目标容器,并将所述目标容器的标识发送至所述作业对应的应用管理器;
容器调度模块,用于使所述应用管理器基于所述目标容器的标识以及预设调度策略,对所述目标容器进行调度处理,以使运行所述目标任务的各节点符合所述约束条件。
9.根据权利要求8所述的资源调度装置,其特征在于,所述装置还包括:
信息收集模块,用于使所述集群的各节点管理器对各自所在节点中运行的容器进行实时监控,并按照预设周期将各节点的所述监控信息发送至所述资源管理器;
信息存储模块,用于使所述资源管理器接收各节点的所述监控信息并存储。
10.根据权利要求8所述的资源调度装置,其特征在于,所述约束条件包括节点负载约束条件,所述监控信息包括容器的负载指标参数;
所述容器确定模块,包括:
参数获取模块,用于在所述约束条件是节点负载约束条件时,获取所述目标节点的监控信息中记录的各容器的负载指标参数;
选择确定模块,用于基于各所述容器的负载指标参数由大到小的顺序,确定目标容器,所述目标容器是被结束后使所述目标节点符合所述节点负载约束条件的一个或多个容器。
11.根据权利要求10所述的资源调度装置,其特征在于,所述容器调度模块,包括:
指令发送模块,用于向所述目标节点的节点管理器发送容器结束指令,所述容器结束指令携带所述目标容器的标识;
指令执行模块,用于使所述目标节点的节点管理器响应所述容器结束指令,基于所述目标容器的标识查找到对应的目标容器,并将查找到的所述目标容器结束掉。
12.根据权利要求10或11所述的资源调度装置,其特征在于,所述负载指标参数至少包括容器中的目标进程的数量,所述目标进程包括处于运行状态的进程和/或处于不可中断状态的进程。
13.根据权利要求8所述的资源调度装置,其特征在于,所述约束条件包括节点无硬件故障约束条件,所述监控信息包括节点上的容器使用所述硬件的第一指示信息或者未使用所述硬件的第二指示信息;
所述容器确定模块,具体用于在所述目标节点存在硬件故障而不符合所述节点无硬件故障约束条件时,基于所述目标节点的监控信息确定具有所述第一指示信息的容器为目标容器。
14.根据权利要求13所述的资源调度装置,其特征在于,所述容器调度模块,包括:
资源申请模块,用于使所述应用管理器基于所述目标容器的标识,向所述资源管理器发送资源申请请求;
资源分配模块,用于使所述资源管理器响应所述资源申请请求,在所述目标节点以外的节点上分配新的目标容器,以使运行所述目标任务的各节点符合所述约束条件。
15.一种电子设备,其特征在于,包括处理器和存储介质,所述存储介质存储有能够被所述处理器执行的可执行指令,所述处理器执行所述可执行指令实现权利要求1-7中任一项所述的资源调度方法。
16.一种计算机可读存储介质,其特征在于,所述存储介质存储有可执行指令,在被处理器调用和执行时实现权利要求1-7中任一项所述的资源调度方法。
CN202110806130.4A 2021-07-16 2021-07-16 资源调度方法、装置、电子设备及存储介质 Pending CN113419838A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110806130.4A CN113419838A (zh) 2021-07-16 2021-07-16 资源调度方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110806130.4A CN113419838A (zh) 2021-07-16 2021-07-16 资源调度方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113419838A true CN113419838A (zh) 2021-09-21

Family

ID=77721096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110806130.4A Pending CN113419838A (zh) 2021-07-16 2021-07-16 资源调度方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113419838A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115454450A (zh) * 2022-09-15 2022-12-09 北京火山引擎科技有限公司 一种针对数据作业的资源管理的方法、装置、电子设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180074855A1 (en) * 2016-09-14 2018-03-15 Cloudera, Inc. Utilization-aware resource scheduling in a distributed computing cluster
US20200177590A1 (en) * 2018-12-03 2020-06-04 At&T Intellectual Property I, L.P. Network security management based on collection and cataloging of network-accessible device information
CN111880934A (zh) * 2020-07-29 2020-11-03 北京浪潮数据技术有限公司 一种资源管理方法、装置、设备及可读存储介质
CN112000113A (zh) * 2020-06-19 2020-11-27 南京理工大学 一种基于中药房的多agv仓储管理系统及方法
CN112559125A (zh) * 2020-12-07 2021-03-26 上海连尚网络科技有限公司 容器应用迁移方法、装置、电子设备和计算机可读介质
CN112613761A (zh) * 2020-12-27 2021-04-06 北京工业大学 一种基于动态博弈和自适应蚁群算法的服务调度方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180074855A1 (en) * 2016-09-14 2018-03-15 Cloudera, Inc. Utilization-aware resource scheduling in a distributed computing cluster
US20200177590A1 (en) * 2018-12-03 2020-06-04 At&T Intellectual Property I, L.P. Network security management based on collection and cataloging of network-accessible device information
CN112000113A (zh) * 2020-06-19 2020-11-27 南京理工大学 一种基于中药房的多agv仓储管理系统及方法
CN111880934A (zh) * 2020-07-29 2020-11-03 北京浪潮数据技术有限公司 一种资源管理方法、装置、设备及可读存储介质
CN112559125A (zh) * 2020-12-07 2021-03-26 上海连尚网络科技有限公司 容器应用迁移方法、装置、电子设备和计算机可读介质
CN112613761A (zh) * 2020-12-27 2021-04-06 北京工业大学 一种基于动态博弈和自适应蚁群算法的服务调度方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘红林;李英玉;杨震;王广钰;贺欢;: "基于能力分析的天基资源虚拟化方法的设计与实现", 上海航天(中英文), no. 04 *
彭商濂;李战怀;李强;陈群;刘海龙;: "RFID数据流上多目标复杂事件检测", 计算机研究与发展, no. 09 *
葛永琪;董云卫;顾斌;: "能量收集信息物理融合系统抢占阈值调度", 计算机研究与发展, no. 12 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115454450A (zh) * 2022-09-15 2022-12-09 北京火山引擎科技有限公司 一种针对数据作业的资源管理的方法、装置、电子设备和存储介质
CN115454450B (zh) * 2022-09-15 2024-04-30 北京火山引擎科技有限公司 一种针对数据作业的资源管理的方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN112162865B (zh) 服务器的调度方法、装置和服务器
CN110858161B (zh) 资源分配方法、装置、系统、设备和介质
CA3104806A1 (en) Method for scheduling a task, resource sharing use method and system based on preemptive scheduling, scheduler, device, and storage medium
WO2017166803A1 (zh) 一种资源调度方法及装置
TWI685226B (zh) 分散式環境下的服務定址方法及裝置
CN107832153B (zh) 一种Hadoop集群资源自适应分配方法
US8209701B1 (en) Task management using multiple processing threads
WO2021159638A1 (zh) 集群队列资源的调度方法、装置、设备及存储介质
CN107018091B (zh) 资源请求的调度方法和装置
US20150222525A1 (en) Dynamic Rerouting of Service Requests Between Service Endpoints for Web Services in a Composite Service
US20140282540A1 (en) Performant host selection for virtualization centers
JP5609730B2 (ja) 情報処理プログラム及び方法、転送処理装置
US11838384B2 (en) Intelligent scheduling apparatus and method
CN112799817A (zh) 一种微服务资源调度系统和方法
JP7079998B1 (ja) クラスタの容量拡張方法及び装置
Li et al. Adaptive QoS-aware service process reconfiguration
JP5666620B2 (ja) ネットワークシステム、及びそのサービス品質制御方法
CN110914805A (zh) 用于分层任务调度的计算系统
Han et al. EdgeTuner: Fast scheduling algorithm tuning for dynamic edge-cloud workloads and resources
KR20100118357A (ko) 분산 처리를 위한 시멘틱 컴퓨팅 기반의 동적 작업 스케줄링 시스템
US20220182851A1 (en) Communication Method and Apparatus for Plurality of Administrative Domains
CN113419838A (zh) 资源调度方法、装置、电子设备及存储介质
CN109614210B (zh) 基于能耗感知的Storm大数据节能调度方法
CN113535398B (zh) 资源分配调整方法、装置、电子设备和可读存储介质
US10783007B2 (en) Load distribution for integration scenarios

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination