CN111796933B - 资源调度方法、装置、存储介质和电子设备 - Google Patents

资源调度方法、装置、存储介质和电子设备 Download PDF

Info

Publication number
CN111796933B
CN111796933B CN202010600084.8A CN202010600084A CN111796933B CN 111796933 B CN111796933 B CN 111796933B CN 202010600084 A CN202010600084 A CN 202010600084A CN 111796933 B CN111796933 B CN 111796933B
Authority
CN
China
Prior art keywords
resource
node
amount
demand
allowance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010600084.8A
Other languages
English (en)
Other versions
CN111796933A (zh
Inventor
褚向阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Pinecone Electronic Co Ltd
Original Assignee
Beijing Xiaomi Pinecone Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Pinecone Electronic Co Ltd filed Critical Beijing Xiaomi Pinecone Electronic Co Ltd
Priority to CN202010600084.8A priority Critical patent/CN111796933B/zh
Publication of CN111796933A publication Critical patent/CN111796933A/zh
Application granted granted Critical
Publication of CN111796933B publication Critical patent/CN111796933B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues

Abstract

本公开是关于一种资源调度方法、装置、存储介质、电子设备,该方法包括:根据每个资源节点的资源余量、任务的资源需求量以及每个资源节点中第一资源和第二资源之间的预设资源配比,从资源平台中确定至少一个第一资源节点,该第一资源为GPU计算资源;根据每个资源节点的资源总量、资源余量、该资源需求量以及第一资源对应的第一权重和第二资源对应的第二权重,确定每个第一资源节点的得分,以从至少一个第一资源节点中确定第二资源节点;将目标任务调度至第二资源节点。能够在对资源量进行判断的过程中对GPU计算资源量以及GPU计算资源相关的配套资源量进行综合判断,在扩大资源调度的范围的同时,避免资源分配的碎片化,提高资源利用率。

Description

资源调度方法、装置、存储介质和电子设备
技术领域
本公开涉及计算资源管理领域,尤其涉及一种资源调度方法、装置、存储介质、电子设备。
背景技术
随着人工智能技术的发展,人工智能相关的开发和引用过程涉及的数据量和计算量也越来越大,而单一的资源设备无法满足人工智能计算所需的大计算量。因此,需要为人工智能计算搭建基于云计算平台的资源平台。该资源平台可以由大量互相连接的资源设备构成,将每个资源设备定义为一个资源节点,并通过调度系统对资源节点的调度进行管理。
发明内容
为克服相关技术中存在的问题,本公开提供一种资源调度方法、装置、存储介质、电子设备。
根据本公开实施例的第一方面,提供一种资源调度方法,应用于云计算平台,所述方法包括:
根据资源平台中的每个资源节点的资源余量、目标任务的资源需求量以及所述每个资源节点中第一资源和第二资源之间的预设资源配比,从所述资源平台中确定至少一个第一资源节点,所述资源余量包括:所述每个资源节点中第一资源的第一资源余量,以及,所述每个资源节点中第二资源的第二资源余量,所述资源需求量包括:所述目标任务针对于第一资源的第一资源需求量和所述目标任务针对于第二资源的第二资源需求量;
根据所述每个资源节点的资源总量、所述资源余量、所述资源需求量以及预设的所述第一资源对应的第一权重和所述第二资源对应的第二权重,确定每个所述第一资源节点对应的资源得分,以从所述至少一个第一资源节点中确定第二资源节点,所述资源总量包括:所述每个资源节点中第一资源的第一资源总量和所述每个资源节点中第二资源的第二资源总量;
将所述目标任务调度至所述第二资源节点。
可选的,所述根据资源平台中的每个资源节点的资源余量、目标任务的资源需求量以及所述每个资源节点中第一资源和第二资源之间的预设资源配比,从所述资源平台中确定至少一个第一资源节点,包括:
确定第三资源节点对应的第一资源余量是否大于或等于所述第一资源需求量,所述第三资源节点为所述资源平台中的任一资源节点;
确定所述第三资源节点对应的第二资源余量是否大于或等于所述第二资源需求量;
根据所述第三资源节点的资源余量、所述预设资源配比和所述资源需求量,确定所述第三资源节点的第一剩余资源量是否满足资源配比条件,所述第一剩余资源量包括:将所述目标任务调度至所述第三资源节点后所述第三资源节点中第一资源的第二剩余资源量和所述第三资源节点中第二资源的第三剩余资源量;
在所述第三资源节点对应的第一资源余量大于或等于所述第一资源需求量,并且,所述第三资源节点对应的第二资源余量大于或等于所述第二资源需求量,并且,所述第一剩余资源量满足资源配比条件的情况下,确定所述第三资源节点为所述第一资源节点。
可选的,所述根据所述第三资源节点的资源余量、所述预设资源配比和所述资源需求量,确定所述第三资源节点的第一剩余资源量是否满足资源配比条件,包括:
获取所述第三资源节点对应的第一资源余量与所述第一资源需求量之间的差值,作为所述第二剩余资源量;
获取所述第三资源节点对应的第二资源余量与所述第二资源需求量之间的差值,作为所述第三剩余资源量;
获取所述第二剩余资源量与所述预设资源配比的乘积;
在所述第三剩余资源量大于或等于所述乘积的情况下,确定所述第一剩余资源量满足所述资源配比条件。
可选的,所述根据所述每个资源节点的资源总量、所述资源余量、所述资源需求量以及预设的所述第一资源对应的第一权重和所述第二资源对应的第二权重,确定每个所述第一资源节点对应的资源得分,以从所述至少一个第一资源节点中确定第二资源节点,包括:
确定所述至少一个第一资源节点中包含的所述第一资源节点的目标数量;
在所述目标数量大于1的情况下,根据所述资源余量和所述资源需求量,确定每个所述第一资源节点的第四剩余资源量,所述第四剩余资源量包括:将所述目标任务调度至所述第一资源节点后所述第一资源节点中第一资源的第五剩余资源量和所述第一资源节点中第二资源的第六剩余资源量;
根据所述第四剩余资源量和所述资源总量确定所述每个资源节点中第一资源的第一资源空闲比例和所述每个资源节点中第二资源的第二资源空闲比例;
根据所述第一资源空闲比例、所述第二资源空闲比例、所述第一权重和所述第二权重,确定所述资源得分;
将具备最高资源得分的第一资源节点作为所述第二资源节点;或者,
在所述目标数量等于1的情况下,将所述第一资源节点作为所述第二资源节点;或者,
在所述目标数量等于0的情况下,将所述目标任务标记为不可调度任务。
可选的,所述根据所述第一资源空闲比例、所述第二资源空闲比例、所述第一权重和所述第二权重,确定所述资源得分,包括:
将所述第一资源空闲比例、所述第二资源空闲比例、所述第一权重和所述第二权重作为预设的资源得分计算公式的输入,以获取所述资源得分计算公式输出的所述资源得分;其中,
所述资源得分计算公式表示为:
D=a×(1-p)+b×(1-q),
其中,D用于表示所述资源得分,a用于表示所述第一权重,b用于表示所述第二权重,p用于表示所述第一资源空闲比例,q用于表示所述第二资源空闲比例。
根据本公开实施例的第二方面,提供一种资源调度装置,应用于云计算平台,所述装置包括:
节点过滤模块,被配置为根据资源平台中的每个资源节点的资源余量、目标任务的资源需求量以及所述每个资源节点中第一资源和第二资源之间的预设资源配比,从所述资源平台中确定至少一个第一资源节点,所述资源余量包括:所述每个资源节点中第一资源的第一资源余量,以及,所述每个资源节点中第二资源的第二资源余量,所述资源需求量包括:所述目标任务针对于第一资源的第一资源需求量和所述目标任务针对于第二资源的第二资源需求量;
节点确定模块,被配置为根据所述每个资源节点的资源总量、所述资源余量、所述资源需求量以及预设的所述第一资源对应的第一权重和所述第二资源对应的第二权重,确定每个所述第一资源节点对应的资源得分,以从所述至少一个第一资源节点中确定第二资源节点,所述资源总量包括:所述每个资源节点中第一资源的第一资源总量和所述每个资源节点中第二资源的第二资源总量;
任务调度模块,被配置为将所述目标任务调度至所述第二资源节点。
可选的,所述节点过滤模块,被配置为:
确定第三资源节点对应的第一资源余量是否大于或等于所述第一资源需求量,所述第三资源节点为所述资源平台中的任一资源节点;
确定所述第三资源节点对应的第二资源余量是否大于或等于所述第二资源需求量;
根据所述第三资源节点的资源余量、所述预设资源配比和所述资源需求量,确定所述第三资源节点的第一剩余资源量是否满足资源配比条件,所述第一剩余资源量包括:将所述目标任务调度至所述第三资源节点后所述第三资源节点中第一资源的第二剩余资源量和所述第三资源节点中第二资源的第三剩余资源量;
在所述第三资源节点对应的第一资源余量大于或等于所述第一资源需求量,并且,所述第三资源节点对应的第二资源余量大于或等于所述第二资源需求量,并且,所述第一剩余资源量满足资源配比条件的情况下,确定所述第三资源节点为所述第一资源节点。
可选的,所述节点过滤模块,被配置为:
获取所述第三资源节点对应的第一资源余量与所述第一资源需求量之间的差值,作为所述第二剩余资源量;
获取所述第三资源节点对应的第二资源余量与所述第二资源需求量之间的差值,作为所述第三剩余资源量;
获取所述第二剩余资源量与所述预设资源配比的乘积;
在所述第三剩余资源量大于或等于所述乘积的情况下,确定所述第一剩余资源量满足所述资源配比条件。
可选的,所述节点确定模块,被配置为:
确定所述至少一个第一资源节点中包含的所述第一资源节点的目标数量;
在所述目标数量大于1的情况下,根据所述资源余量和所述资源需求量,确定每个所述第一资源节点的第四剩余资源量,所述第四剩余资源量包括:将所述目标任务调度至所述第一资源节点后所述第一资源节点中第一资源的第五剩余资源量和所述第一资源节点中第二资源的第六剩余资源量;
根据所述第四剩余资源量和所述资源总量确定所述每个资源节点中第一资源的第一资源空闲比例和所述每个资源节点中第二资源的第二资源空闲比例;
根据所述第一资源空闲比例、所述第二资源空闲比例、所述第一权重和所述第二权重,确定所述资源得分;
将具备最高资源得分的第一资源节点作为所述第二资源节点;或者,
在所述目标数量等于1的情况下,将所述第一资源节点作为所述第二资源节点;或者,
在所述目标数量等于0的情况下,将所述目标任务标记为不可调度任务。
可选的,所述节点确定模块,被配置为:
将所述第一资源空闲比例、所述第二资源空闲比例、所述第一权重和所述第二权重作为预设的资源得分计算公式的输入,以获取所述资源得分计算公式输出的所述资源得分;其中,
所述资源得分计算公式表示为:
D=a×(1-p)+b×(1-q),
其中,D用于表示所述资源得分,a用于表示所述第一权重,b用于表示所述第二权重,p用于表示所述第一资源空闲比例,q用于表示所述第二资源空闲比例,所述第一资源为图形处理器GPU计算资源。
根据本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的资源调度方法的步骤。
根据本公开实施例的第四方面,提供一种电子设备,包括:本公开第二方面所提供的资源调度装置。
本公开的实施例所提供的技术方案,能够根据资源平台中的每个资源节点的资源余量、目标任务的资源需求量以及上述每个资源节点中第一资源和第二资源之间的预设资源配比,从该资源平台中确定至少一个第一资源节点,该资源余量包括:上述每个资源节点中第一资源的第一资源余量,以及,上述每个资源节点中第二资源的第二资源余量,该资源需求量包括:该目标任务针对于第一资源的第一资源需求量和该目标任务针对于第二资源的第二资源需求量;根据上述每个资源节点的资源总量、该资源余量、该资源需求量以及预设的该第一资源对应的第一权重和该第二资源对应的第二权重,确定每个该第一资源节点对应的资源得分,以从上述至少一个第一资源节点中确定第二资源节点,该资源总量包括:上述每个资源节点中第一资源的第一资源总量和上述每个资源节点中第二资源的第二资源总量;将该目标任务调度至该第二资源节点。能够在对资源量进行判断的过程中对计算资源量以及计算资源相关的配套资源量进行综合判断,在扩大资源调度的范围的同时,避免资源分配的碎片化,提高资源利用率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种资源调度方法的流程图;
图2是根据图1示出的一种资源节点的过滤方法的流程图;
图3是根据图1示出的一种资源节点确定方法的流程图;
图4是根据一示例性实施例示出的一种资源调度装置的框图;
图5是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在资源调度的相关技术中,通常由调度系统,以开源的kubernetes(简称K8s)容器编排引擎为例,通过调度算法将容器化的计算任务下发至满足资源需求的资源节点上进行运行。在判断资源节点是否满足资源需求时,通常仅针对资源节点的CPU(CentralProcessing Unit,中央处理器)计算资源和内存资源进行打分和判断,资源调度的范围较小。并且,在人工智能计算过程中,一种计算资源的使用通常还需要其他计算资源作为支撑,上述的资源调度方式也未考虑不同资源的资源量之间的配置关系,进而导致计算资源的碎片化,降低资源利用率。
对此,本公开提出了一种配送时长预测方法,具体如下:
在介绍本公开提供的资源调度方法之前,首先对本公开中各个实施例所涉及的目标应用场景进行介绍,该目标应用场景包括包含资源平台,该资源平台为云计算平台,该云计算平台包含至少一个设置有资源调度系统的调度器,以及,多个资源服务器,该资源服务器为具备GPU(Graphics Processing Unit,图形处理器)计算资源、CPU计算资源和内存资源并能够为接收到的计算任务提供云数据采集和云计算服务的云服务器。
图1是根据一示例性实施例示出的一种资源调度方法的流程图,如图1所示,应用于上述应用场景所述的云计算平台,该方法包括以下步骤:
在步骤101中,根据资源平台中的每个资源节点的资源余量、目标任务的资源需求量以及上述每个资源节点中第一资源和第二资源之间的预设资源配比,从该资源平台中确定至少一个第一资源节点。
其中,该资源余量包括:上述每个资源节点中第一资源的第一资源余量,以及,上述每个资源节点中第二资源的第二资源余量,该资源需求量包括:该目标任务针对于第一资源的第一资源需求量和该目标任务针对于第二资源的第二资源需求量,该第一资源为GPU计算资源。
示例地,上述的每个资源节点为上述应用场景所述的资源服务器,每个资源节点都包含第一资源和第二资源,该第二资源包括:内存资源和CPU计算资源中的至少一者,在本公开实施例中,第二资源包含内存资源和CPU计算资源两者为例,对上述的资源调度方法进行说明。
示例地,该目标任务为人工智能计算任务,例如,对图像识别模型或者语音识别模型所需的数据进行采集和处理的计算任务。需要说明的是,GPU用于图像数据的计算任务的处理,以及,支持对大量重复的相互之间没有逻辑关系的非图像数据计算任务进行并行处理。该目标任务可以为具备GPU计算资源需求和第二资源的计算资源需求的计算任务(可称为GPU计算任务),或者,具备第二资源的计算资源需求的计算任务(可称为非GPU计算任务)。在接收到该目标任务之后,调度器可以判断上述目标任务是GPU计算任务还是非GPU计算任务,上述两种计算任务都执行该步骤101和下列步骤102,所不同的是,针对于非GPU计算任务,该第一资源需求量为0,或者,可以针对于非GPU计算任务省略该步骤101和102中关于资源节点的第一资源余量是否大于或等于第一资源需求量的判断(即下列步骤1011)。
示例地,在该第二资源包括内存资源和CPU计算资源两者的情况下,可以在该步骤101和下列步骤102和103中将内存资源和CPU计算资源视为一体,即该预设资源配比针对于该内存资源和CPU资源是相同的。或者,可以在该步骤101中对第二资源中的内存资源和CPU计算资源分别计算,即,使该预设资源配比包括:上述每个资源节点中第一资源和内存资源之间的第一预设资源配比,以及,上述每个资源节点中第一资源和CPU计算资源之间的第二预设资源配比,并且该第一预设资源配比与该第二预设资源配比不同。
示例地,该步骤101可以理解为根据目标任务的资源需求量对资源平台中的多个资源节点进行筛选的步骤。具体来说,在确定目标任务对于上述三种资源的资源需求量后,首先需要确定资源节点中上述三种资源的资源余量是否能够满足目标任务的资源需求,其次需要确定在目标任务被调度至某个资源节点A后,该资源节点A上述三种资源的剩余资源量是否能够达到一定的配置比例(即预设资源配比)。该预设资源配比用于保证一种计算资源不被单独剩余,例如,若目标任务认为需要5个GPU计算资源、2个内存资源和1个CPU计算资源,而该资源节点A的资源余量包括:6个GPU计算资源、2个内存资源和1个CPU计算资源。如此,在将该目标任务调度至该资源节点A后,该资源节点A的剩余资源量为,1个GPU计算资源、0个内存资源和0个CPU计算资源。而由于人工智能计算任务对GPU计算资源的消耗通常也伴随着对CPU计算资源和内存资源的消耗,所以,虽然资源节点A的资源余量能够保证该目标任务的运行,但是,运行该目标任务剩余的资源量不足以支撑其他GPU计算任务的运行。换句话说,在目标任务结束之前,剩余的这1个计算资源很难被其他计算任务占用的,这会造成GPU计算资源的碎片化。在此情况下,不能将该资源节点A作为该目标任务的候选调度节点(即第一资源节点)。
另外,需要说明的是,本公开实施例中的“资源量”,以及与其相关的“资源总量”、“资源余量”、“资源需求量”和“剩余资源量”等表述,可以表示资源设备的数量,或者,资源设备的容量或计算能力。例如,该资源节点A的资源余量中的6个GPU计算资源实际表示该资源节点中设置有6块(具备相同计算能力的)显卡,或者,该资源节点A的资源余量中的2个内存资源实际表示该资源节点中设置的内存设备具备2个容量单位的存储容量,该容量单位可以为MB(Mbyte)、GB(Gigabyte)或更大的存储容量单位。
在步骤102中,根据上述每个资源节点的资源总量、该资源余量、该资源需求量以及预设的该第一资源对应的第一权重和该第二资源对应的第二权重,确定每个该第一资源节点对应的资源得分,以从上述至少一个第一资源节点中确定第二资源节点。
其中,该资源总量包括:上述每个资源节点中第一资源的第一资源总量和上述每个资源节点中第二资源的第二资源总量。
示例地,在步骤101中确定了至少一个候选调度节点后,可以该步骤102从GPU计算资源、内存资源和CPU计算资源这三个维度对每个候选调度节点进行评分,并选取得分最高的候选调度节点作为该目标任务对应的目标资源节点(即上述的第二资源节点)。并在下列步骤103中将该目标任务调度至该第二资源节点。同样地,可以在该步骤102中对第二资源中的内存资源和CPU计算资源分别计算,即该第二权重包括:内存资源对应的第三权重和CPU计算资源对应的第四权重。在本公开实施例中,可以通过上述每个资源节点的资源总量、该资源余量和该资源需求量确定在将目标任务调度至第一资源节点后每种资源的空闲比例和每个资源对应的权重计算得分。其中,第一权重可以被设置为第三权重和第四权重的x倍(x大于1),以确定包GPU计算资源在上中资源中的主导地位。可以在资源平台初始化过程中,或者,接收到该目标任务之后再步骤101开始执行之前,根据资源平台中的每个资源节点中的GPU计算资源设备、内存资源设备和CPU计算资源设备的型号和资源量或运算能力,对上述第一权重、第三权重和第四权重进行设置。
在步骤103中,将该目标任务调度至该第二资源节点。
综上所述,本公开的实施例所提供的技术方案,能够根据资源平台中的每个资源节点的资源余量、目标任务的资源需求量以及上述每个资源节点中第一资源和第二资源之间的预设资源配比,从该资源平台中确定至少一个第一资源节点,该资源余量包括:上述每个资源节点中第一资源的第一资源余量,以及,上述每个资源节点中第二资源的第二资源余量,该资源需求量包括:该目标任务针对于第一资源的第一资源需求量和该目标任务针对于第二资源的第二资源需求量,该第一资源为GPU计算资源;根据上述每个资源节点的资源总量、该资源余量、该资源需求量以及预设的该第一资源对应的第一权重和该第二资源对应的第二权重,确定每个该第一资源节点对应的资源得分,以从上述至少一个第一资源节点中确定第二资源节点,该资源总量包括:上述每个资源节点中第一资源的第一资源总量和上述每个资源节点中第二资源的第二资源总量;将该目标任务调度至该第二资源节点。能够在对资源量进行判断的过程中对GPU计算资源量以及GPU计算资源相关的配套资源量进行综合判断,在扩大资源调度的范围的同时,避免资源分配的碎片化,提高资源利用率。
图2是根据图1示出的一种资源节点的过滤方法的流程图,如图2所示,该步骤101可以包括:
在步骤1011中,确定第三资源节点对应的第一资源余量是否大于或等于该第一资源需求量。
其中,该第三资源节点为该资源平台中的任一资源节点。
在步骤1012中,确定该第三资源节点对应的第二资源余量是否大于或等于该第二资源需求量。
在步骤1013中,根据该第三资源节点的资源余量、该预设资源配比和该资源需求量,确定该第三资源节点的第一剩余资源量是否满足资源配比条件。
其中,该第一剩余资源量包括:将该目标任务调度至该第三资源节点后该第三资源节点中第一资源的第二剩余资源量和该第三资源节点中第二资源的第三剩余资源量。
示例地,该步骤1013可以包括:获取该第三资源节点对应的第一资源余量与该第一资源需求量之间的差值,作为该第二剩余资源量;获取该第三资源节点对应的第二资源余量与该第二资源需求量之间的差值,作为该第三剩余资源量;获取该第二剩余资源量与该预设资源配比的乘积;在该第三剩余资源量大于或等于该乘积的情况下,确定该第一剩余资源量满足该资源配比条件。
示例地,在本公开实施例中,可以在该步骤1013中对第二资源中的内存资源和CPU计算资源分别计算,即,使该预设资源配比包括:上述的第一预设资源配比n以及第二预设资源配比m,并且m与n不同。具体地,例如,若目标任务认为需要5个GPU计算资源、2个内存资源和1个CPU计算资源,而该资源节点B的资源余量包括:10个GPU计算资源、20个内存资源和5个CPU计算资源。如此,在将该目标任务调度至该资源节点B后,该资源节点B的第二剩余资源量为,5个GPU计算资源,第三剩余资源量为,18个内存资源和4个CPU计算资源。若m为2,n为0.4,则,该资源节点B剩余的内存资源需要大于或等于10个,该资源节点B剩余的CPU计算资源需要大于或等于2个。对比该资源节点B的第三剩余资源量为(18个内存资源和4个CPU计算资源),可以确定该第一剩余资源量满足该资源配比条件。上述的m和n为根据该资源平台处理过程的大多数(例如超过75%的)历史计算任务中GPU计算资源使用量和内存资源使用量以及CPU计算资源使用量之间的比例关系确定的资源配比。
在步骤1014中,在该第三资源节点对应的第一资源余量大于或等于该第一资源需求量,并且,该第三资源节点对应的第二资源余量大于或等于该第二资源需求量,并且,该第一剩余资源量满足资源配比条件的情况下,确定该第三资源节点为该第一资源节点。
示例地,上述的资源配比条件的判断可以称为以GPU计算资源作为目标资源的资源预留机制,相似的资源预留机制同样可以将CPU计算资源和内容资源作为目标资源,但在资源节点中没有目标资源或者目标资源已经没有剩余的情况下,其相对应的资源预留机制无效。
图3是根据图1示出的一种资源节点确定方法的流程图,如图3所示,该步骤102可以包括:步骤1021和1026,或者,步骤1021-1025,或者,步骤1021和步骤1027。
在步骤1021中,确定上述至少一个第一资源节点中包含的该第一资源节点的目标数量。
示例地,若经过上述步骤101后只筛选出一个候选调度节点(即目标数量为1),则不需要进行下列步骤1022-1025的得分计算和排序过程;若经过上述步骤101后未筛选出任何一个候选调度节点(即目标数量为0),则将该目标任务标记为不可调度任务,进而输出同于表征将该目标任务为不可调度任务的提示信息和用于表征该目标任务因何种计算资源的缺乏而不可调度的详细信息,优选地,该详细信息中还可以包括:导致该计算资源的缺乏的原因,例如,资源节点的损坏情况,或者,哪个任务占用了过多的该计算资源。若经过上述步骤101后筛选出多个候选调度节点(即目标数量大于1),可以通过该步骤1022和1025进行资源节点的得分计算和排序过程。
在步骤1022中,在该目标数量大于1的情况下,根据该资源余量和该资源需求量,确定每个该第一资源节点的第四剩余资源量。
其中,该第四剩余资源量包括:将该目标任务调度至该第一资源节点后该第一资源节点中第一资源的第五剩余资源量和该第一资源节点中第二资源的第六剩余资源量。
在步骤1023中,根据该第四剩余资源量和该资源总量确定上述每个资源节点中第一资源的第一资源空闲比例和上述每个资源节点中第二资源的第二资源空闲比例。
在步骤1024中,根据该第一资源空闲比例、该第二资源空闲比例、该第一权重和该第二权重,确定该资源得分。
示例地,该步骤1024可以包括:将该第一资源空闲比例、该第二资源空闲比例、该第一权重和该第二权重作为预设的资源得分计算公式的输入,以获取该资源得分计算公式输出的该资源得分。其中,该资源得分计算公式表示为下列公式(1):
D=a×(1-p)+b×(1-q) (1),
其中,D用于表示该资源得分,a用于表示该第一权重,b用于表示该第二权重,p用于表示该第一资源空闲比例,q用于表示该第二资源空闲比例。
示例地,在本公开实施例中,可以在该步骤1024中对第二资源中的内存资源和CPU计算资源分别计算,即,使该第二权重b包括:上述的第三权重和第四权重,该第二资源空闲比例包括:上述每个资源节点中内存资源的第三资源空闲比例和CPU计算资源的第四资源空闲比例。在此情况下,该步骤1024可以包括:将该第一资源空闲比例、该第三资源空闲比例、第四资源空闲比例、该第一权重和该第三权重和第四权重作为预设的资源得分计算公式的输入,以获取该资源得分计算公式输出的该资源得分。其中,该资源得分计算公式表示为下列公式(2):
D=a×(1-p)+c×(1-h)+d×(1-r) (2),
其中,D用于表示该资源得分,a用于表示该第一权重,c用于表示该第三权重,d用于表示该第四权重,p用于表示该第一资源空闲比例,h用于表示该第三资源空闲比例,r用于表示该第四资源空闲比例。
在步骤1025中,将具备最高资源得分的第一资源节点作为该第二资源节点。
示例地,在相关的资源调度评分过程中,通常通过资源分配最小已请求优先算法进行资源得分的计算,以使得各个资源节点上的负载尽可能的做到平均。但是这种资源分配方式并不适应人工智能领域下的以GPU为核心的计算任务,首先,GPU计算资源的平均分布容易造成可用的GPU计算资源的碎片化;其次,GPU计算资源的平均分布导致分布式计算的需求,而分布式计算通常涉及GPU设备间的通信和数据的输入输出,因此,GPU计算资源的平均分布增加了GPU设备间的数据通信量,不利于整体的计算效率;再次,在对资源平台进行算力的扩容和缩容时,由于GPU计算资源的平均分布,需要对计算任务进行频繁地迁移,不利于对资源平台的更新。基于上述原因,在本公开实施例采用最大请求优先策略,将GPU计算任务尽可能集中地进行分布,避免GPU计算资源的平均分布造成的上述问题。
在步骤1026中,在该目标数量等于1的情况下,将该第一资源节点作为该第二资源节点。
在步骤1027中,在该目标数量等于0的情况下,将该目标任务标记为不可调度任务。
综上所述,本公开的实施例所提供的技术方案,能够根据资源平台中的每个资源节点的资源余量、目标任务的资源需求量以及上述每个资源节点中第一资源和第二资源之间的预设资源配比,从该资源平台中确定至少一个第一资源节点,该资源余量包括:上述每个资源节点中第一资源的第一资源余量,以及,上述每个资源节点中第二资源的第二资源余量,该资源需求量包括:该目标任务针对于第一资源的第一资源需求量和该目标任务针对于第二资源的第二资源需求量,该第一资源为GPU计算资源;根据上述每个资源节点的资源总量、该资源余量、该资源需求量以及预设的该第一资源对应的第一权重和该第二资源对应的第二权重,确定每个该第一资源节点对应的资源得分,以从上述至少一个第一资源节点中确定第二资源节点,该资源总量包括:上述每个资源节点中第一资源的第一资源总量和上述每个资源节点中第二资源的第二资源总量;将该目标任务调度至该第二资源节点。能够在对资源量进行判断的过程中对GPU计算资源量以及GPU计算资源相关的配套资源量进行综合判断,在扩大资源调度的范围的同时,避免资源分配的碎片化,提高资源利用率。
图4是根据一示例性实施例示出的一种资源调度装置的框图,如图4所示,应用于上述应用场景所述的云计算平台,该装置400包括:
节点过滤模块410,被配置为根据资源平台中的每个资源节点的资源余量、目标任务的资源需求量以及上述每个资源节点中第一资源和第二资源之间的预设资源配比,从该资源平台中确定至少一个第一资源节点,该资源余量包括:上述每个资源节点中第一资源的第一资源余量,以及,上述每个资源节点中第二资源的第二资源余量,该资源需求量包括:该目标任务针对于第一资源的第一资源需求量和该目标任务针对于第二资源的第二资源需求量,该第一资源为GPU计算资源;
节点确定模块420,被配置为根据上述每个资源节点的资源总量、该资源余量、该资源需求量以及预设的该第一资源对应的第一权重和该第二资源对应的第二权重,确定每个该第一资源节点对应的资源得分,以从上述至少一个第一资源节点中确定第二资源节点,该资源总量包括:上述每个资源节点中第一资源的第一资源总量和上述每个资源节点中第二资源的第二资源总量;
任务调度模块430,被配置为将该目标任务调度至该第二资源节点。
可选的,该节点过滤模块410,被配置为:
确定第三资源节点对应的第一资源余量是否大于或等于该第一资源需求量,该第三资源节点为该资源平台中的任一资源节点;
确定该第三资源节点对应的第二资源余量是否大于或等于该第二资源需求量;
根据该第三资源节点的资源余量、该预设资源配比和该资源需求量,确定该第三资源节点的第一剩余资源量是否满足资源配比条件,该第一剩余资源量包括:将该目标任务调度至该第三资源节点后该第三资源节点中第一资源的第二剩余资源量和该第三资源节点中第二资源的第三剩余资源量;
在该第三资源节点对应的第一资源余量大于或等于该第一资源需求量,并且,该第三资源节点对应的第二资源余量大于或等于该第二资源需求量,并且,该第一剩余资源量满足资源配比条件的情况下,确定该第三资源节点为该第一资源节点。
可选的,该节点过滤模块410,被配置为:
获取该第三资源节点对应的第一资源余量与该第一资源需求量之间的差值,作为该第二剩余资源量;
获取该第三资源节点对应的第二资源余量与该第二资源需求量之间的差值,作为该第三剩余资源量;
获取该第二剩余资源量与该预设资源配比的乘积;
在该第三剩余资源量大于或等于该乘积的情况下,确定该第一剩余资源量满足该资源配比条件。
可选的,该节点确定模块420,被配置为:
确定上述至少一个第一资源节点中包含的该第一资源节点的目标数量;
在该目标数量大于1的情况下,根据该资源余量和该资源需求量,确定每个该第一资源节点的第四剩余资源量,该第四剩余资源量包括:将该目标任务调度至该第一资源节点后该第一资源节点中第一资源的第五剩余资源量和该第一资源节点中第二资源的第六剩余资源量;
根据该第四剩余资源量和该资源总量确定上述每个资源节点中第一资源的第一资源空闲比例和上述每个资源节点中第二资源的第二资源空闲比例;
根据该第一资源空闲比例、该第二资源空闲比例、该第一权重和该第二权重,确定该资源得分;
将具备最高资源得分的第一资源节点作为该第二资源节点;或者,
在该目标数量等于1的情况下,将该第一资源节点作为该第二资源节点;或者,
在该目标数量等于0的情况下,将该目标任务标记为不可调度任务。
可选的,该节点确定模块420,被配置为:
将该第一资源空闲比例、该第二资源空闲比例、该第一权重和该第二权重作为预设的资源得分计算公式的输入,以获取该资源得分计算公式输出的该资源得分;其中,
该资源得分计算公式表示为:
D=a×(1-p)+b×(1-q),
其中,D用于表示该资源得分,a用于表示该第一权重,b用于表示该第二权重,p用于表示该第一资源空闲比例,q用于表示该第二资源空闲比例。
可选的,该第二资源包括:内存资源和/或中央处理器CPU计算资源。
综上所述,本公开的实施例所提供的技术方案,能够根据资源平台中的每个资源节点的资源余量、目标任务的资源需求量以及上述每个资源节点中第一资源和第二资源之间的预设资源配比,从该资源平台中确定至少一个第一资源节点,该资源余量包括:上述每个资源节点中第一资源的第一资源余量,以及,上述每个资源节点中第二资源的第二资源余量,该资源需求量包括:该目标任务针对于第一资源的第一资源需求量和该目标任务针对于第二资源的第二资源需求量,该第一资源为GPU计算资源;根据上述每个资源节点的资源总量、该资源余量、该资源需求量以及预设的该第一资源对应的第一权重和该第二资源对应的第二权重,确定每个该第一资源节点对应的资源得分,以从上述至少一个第一资源节点中确定第二资源节点,该资源总量包括:上述每个资源节点中第一资源的第一资源总量和上述每个资源节点中第二资源的第二资源总量;将该目标任务调度至该第二资源节点。能够在对资源量进行判断的过程中对GPU计算资源量以及GPU计算资源相关的配套资源量进行综合判断,在扩大资源调度的范围的同时,避免资源分配的碎片化,提高资源利用率。
图5是根据一示例性实施例示出的一种电子设备的框图。例如,该电子设备500可以为云计算平台中的调度器或服务器。参照图5,电子设备500包括处理组件522,其进一步包括一个或多个处理器,以及由存储器532所代表的存储器资源,用于存储可由处理组件522的执行的指令,例如应用程序。存储器532中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件522被配置为执行指令,以执行图1至图3所示的资源调度方法。
电子设备500还可以包括一个电源组件526被配置为执行电子设备500的电源管理,一个有线或无线网络接口550被配置为将电子设备500连接到网络,和一个输入输出(I/O)接口558。电子设备500可以操作基于存储在存储器532的操作系统,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本公开的实施例所提供的电子设备,能够在对资源量进行判断的过程中对GPU计算资源量以及GPU计算资源相关的配套资源量进行综合判断,在扩大资源调度的范围的同时,避免资源分配的碎片化,提高资源利用率。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (12)

1.一种资源调度方法,应用于云计算平台,其特征在于,所述方法包括:
根据资源平台中的每个资源节点的资源余量、目标任务的资源需求量以及所述每个资源节点中第一资源和第二资源之间的预设资源配比,从所述资源平台中确定至少一个第一资源节点,所述资源余量包括:所述每个资源节点中第一资源的第一资源余量,以及,所述每个资源节点中第二资源的第二资源余量,所述资源需求量包括:所述目标任务针对于第一资源的第一资源需求量和所述目标任务针对于第二资源的第二资源需求量;
根据所述每个资源节点的资源总量、所述资源余量、所述资源需求量以及预设的所述第一资源对应的第一权重和所述第二资源对应的第二权重,确定每个所述第一资源节点对应的资源得分,以从所述至少一个第一资源节点中确定第二资源节点,所述资源总量包括:所述每个资源节点中第一资源的第一资源总量和所述每个资源节点中第二资源的第二资源总量;
将所述目标任务调度至所述第二资源节点。
2.根据权利要求1所述的方法,其特征在于,所述根据资源平台中的每个资源节点的资源余量、目标任务的资源需求量以及所述每个资源节点中第一资源和第二资源之间的预设资源配比,从所述资源平台中确定至少一个第一资源节点,包括:
确定第三资源节点对应的第一资源余量是否大于或等于所述第一资源需求量,所述第三资源节点为所述资源平台中的任一资源节点;
确定所述第三资源节点对应的第二资源余量是否大于或等于所述第二资源需求量;
根据所述第三资源节点的资源余量、所述预设资源配比和所述资源需求量,确定所述第三资源节点的第一剩余资源量是否满足资源配比条件,所述第一剩余资源量包括:将所述目标任务调度至所述第三资源节点后所述第三资源节点中第一资源的第二剩余资源量和所述第三资源节点中第二资源的第三剩余资源量;
在所述第三资源节点对应的第一资源余量大于或等于所述第一资源需求量,并且,所述第三资源节点对应的第二资源余量大于或等于所述第二资源需求量,并且,所述第一剩余资源量满足资源配比条件的情况下,确定所述第三资源节点为所述第一资源节点。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第三资源节点的资源余量、所述预设资源配比和所述资源需求量,确定所述第三资源节点的第一剩余资源量是否满足资源配比条件,包括:
获取所述第三资源节点对应的第一资源余量与所述第一资源需求量之间的差值,作为所述第二剩余资源量;
获取所述第三资源节点对应的第二资源余量与所述第二资源需求量之间的差值,作为所述第三剩余资源量;
获取所述第二剩余资源量与所述预设资源配比的乘积;
在所述第三剩余资源量大于或等于所述乘积的情况下,确定所述第一剩余资源量满足所述资源配比条件。
4.根据权利要求1所述的方法,其特征在于,所述根据所述每个资源节点的资源总量、所述资源余量、所述资源需求量以及预设的所述第一资源对应的第一权重和所述第二资源对应的第二权重,确定每个所述第一资源节点对应的资源得分,以从所述至少一个第一资源节点中确定第二资源节点,包括:
确定所述至少一个第一资源节点中包含的所述第一资源节点的目标数量;
在所述目标数量大于1的情况下,根据所述资源余量和所述资源需求量,确定每个所述第一资源节点的第四剩余资源量,所述第四剩余资源量包括:将所述目标任务调度至所述第一资源节点后所述第一资源节点中第一资源的第五剩余资源量和所述第一资源节点中第二资源的第六剩余资源量;
根据所述第四剩余资源量和所述资源总量确定所述每个资源节点中第一资源的第一资源空闲比例和所述每个资源节点中第二资源的第二资源空闲比例;
根据所述第一资源空闲比例、所述第二资源空闲比例、所述第一权重和所述第二权重,确定所述资源得分;
将具备最高资源得分的第一资源节点作为所述第二资源节点;或者,
在所述目标数量等于1的情况下,将所述第一资源节点作为所述第二资源节点;或者,
在所述目标数量等于0的情况下,将所述目标任务标记为不可调度任务。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一资源空闲比例、所述第二资源空闲比例、所述第一权重和所述第二权重,确定所述资源得分,包括:
将所述第一资源空闲比例、所述第二资源空闲比例、所述第一权重和所述第二权重作为预设的资源得分计算公式的输入,以获取所述资源得分计算公式输出的所述资源得分;其中,
所述资源得分计算公式表示为:
D=a×(1-p)+b×(1-q),
其中,D用于表示所述资源得分,a用于表示所述第一权重,b用于表示所述第二权重,p用于表示所述第一资源空闲比例,q用于表示所述第二资源空闲比例。
6.一种资源调度装置,应用于云计算平台,其特征在于,所述装置包括:
节点过滤模块,被配置为根据资源平台中的每个资源节点的资源余量、目标任务的资源需求量以及所述每个资源节点中第一资源和第二资源之间的预设资源配比,从所述资源平台中确定至少一个第一资源节点,所述资源余量包括:所述每个资源节点中第一资源的第一资源余量,以及,所述每个资源节点中第二资源的第二资源余量,所述资源需求量包括:所述目标任务针对于第一资源的第一资源需求量和所述目标任务针对于第二资源的第二资源需求量,所述第一资源为图形处理器GPU计算资源;
节点确定模块,被配置为根据所述每个资源节点的资源总量、所述资源余量、所述资源需求量以及预设的所述第一资源对应的第一权重和所述第二资源对应的第二权重,确定每个所述第一资源节点对应的资源得分,以从所述至少一个第一资源节点中确定第二资源节点,所述资源总量包括:所述每个资源节点中第一资源的第一资源总量和所述每个资源节点中第二资源的第二资源总量;
任务调度模块,被配置为将所述目标任务调度至所述第二资源节点。
7.根据权利要求6所述的装置,其特征在于,所述节点过滤模块,被配置为:
确定第三资源节点对应的第一资源余量是否大于或等于所述第一资源需求量,所述第三资源节点为所述资源平台中的任一资源节点;
确定所述第三资源节点对应的第二资源余量是否大于或等于所述第二资源需求量;
根据所述第三资源节点的资源余量、所述预设资源配比和所述资源需求量,确定所述第三资源节点的第一剩余资源量是否满足资源配比条件,所述第一剩余资源量包括:将所述目标任务调度至所述第三资源节点后所述第三资源节点中第一资源的第二剩余资源量和所述第三资源节点中第二资源的第三剩余资源量;
在所述第三资源节点对应的第一资源余量大于或等于所述第一资源需求量,并且,所述第三资源节点对应的第二资源余量大于或等于所述第二资源需求量,并且,所述第一剩余资源量满足资源配比条件的情况下,确定所述第三资源节点为所述第一资源节点。
8.根据权利要求7所述的装置,其特征在于,所述节点过滤模块,被配置为:
获取所述第三资源节点对应的第一资源余量与所述第一资源需求量之间的差值,作为所述第二剩余资源量;
获取所述第三资源节点对应的第二资源余量与所述第二资源需求量之间的差值,作为所述第三剩余资源量;
获取所述第二剩余资源量与所述预设资源配比的乘积;
在所述第三剩余资源量大于或等于所述乘积的情况下,确定所述第一剩余资源量满足所述资源配比条件。
9.根据权利要求6所述的装置,其特征在于,所述节点确定模块,被配置为:
确定所述至少一个第一资源节点中包含的所述第一资源节点的目标数量;
在所述目标数量大于1的情况下,根据所述资源余量和所述资源需求量,确定每个所述第一资源节点的第四剩余资源量,所述第四剩余资源量包括:将所述目标任务调度至所述第一资源节点后所述第一资源节点中第一资源的第五剩余资源量和所述第一资源节点中第二资源的第六剩余资源量;
根据所述第四剩余资源量和所述资源总量确定所述每个资源节点中第一资源的第一资源空闲比例和所述每个资源节点中第二资源的第二资源空闲比例;
根据所述第一资源空闲比例、所述第二资源空闲比例、所述第一权重和所述第二权重,确定所述资源得分;
将具备最高资源得分的第一资源节点作为所述第二资源节点;或者,
在所述目标数量等于1的情况下,将所述第一资源节点作为所述第二资源节点;或者,
在所述目标数量等于0的情况下,将所述目标任务标记为不可调度任务。
10.根据权利要求9所述的装置,其特征在于,所述节点确定模块,被配置为:
将所述第一资源空闲比例、所述第二资源空闲比例、所述第一权重和所述第二权重作为预设的资源得分计算公式的输入,以获取所述资源得分计算公式输出的所述资源得分;其中,
所述资源得分计算公式表示为:
D=a×(1-p)+b×(1-q),
其中,D用于表示所述资源得分,a用于表示所述第一权重,b用于表示所述第二权重,p用于表示所述第一资源空闲比例,q用于表示所述第二资源空闲比例。
11.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1-5中任一项所述方法的步骤。
12.一种电子设备,其特征在于,包括:权利要求6-10中任一项所述的资源调度装置。
CN202010600084.8A 2020-06-28 2020-06-28 资源调度方法、装置、存储介质和电子设备 Active CN111796933B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010600084.8A CN111796933B (zh) 2020-06-28 2020-06-28 资源调度方法、装置、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010600084.8A CN111796933B (zh) 2020-06-28 2020-06-28 资源调度方法、装置、存储介质和电子设备

Publications (2)

Publication Number Publication Date
CN111796933A CN111796933A (zh) 2020-10-20
CN111796933B true CN111796933B (zh) 2023-11-21

Family

ID=72804374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010600084.8A Active CN111796933B (zh) 2020-06-28 2020-06-28 资源调度方法、装置、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN111796933B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112905350A (zh) * 2021-03-22 2021-06-04 北京市商汤科技开发有限公司 任务调度方法及装置、电子设备和存储介质
CN114911618B (zh) * 2022-05-12 2024-04-26 中国电信股份有限公司 异构资源分配方法、装置、电子设备及存储介质
CN117112234B (zh) * 2023-10-19 2024-02-09 南京赛宁信息技术有限公司 一种网络靶场中可靠的资源预分配方法与系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791447A (zh) * 2016-05-20 2016-07-20 北京邮电大学 一种面向视频服务的云资源调度方法及装置
CN105872114A (zh) * 2016-06-22 2016-08-17 北京邮电大学 一种视频监控云平台资源调度方法及装置
CN109471705A (zh) * 2017-09-08 2019-03-15 杭州海康威视数字技术股份有限公司 任务调度的方法、设备及系统、计算机设备
CN109471727A (zh) * 2018-10-29 2019-03-15 北京金山云网络技术有限公司 一种任务处理方法、装置及系统
WO2020000944A1 (zh) * 2018-06-25 2020-01-02 星环信息科技(上海)有限公司 基于抢占式调度的资源共享使用方法、系统及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI470962B (zh) * 2011-12-26 2015-01-21 Ind Tech Res Inst 應用在分散式分時多工系統的資源分配方法與系統

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791447A (zh) * 2016-05-20 2016-07-20 北京邮电大学 一种面向视频服务的云资源调度方法及装置
CN105872114A (zh) * 2016-06-22 2016-08-17 北京邮电大学 一种视频监控云平台资源调度方法及装置
CN109471705A (zh) * 2017-09-08 2019-03-15 杭州海康威视数字技术股份有限公司 任务调度的方法、设备及系统、计算机设备
WO2020000944A1 (zh) * 2018-06-25 2020-01-02 星环信息科技(上海)有限公司 基于抢占式调度的资源共享使用方法、系统及设备
CN109471727A (zh) * 2018-10-29 2019-03-15 北京金山云网络技术有限公司 一种任务处理方法、装置及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
云计算环境下多GPU资源调度机制研究;吕相文;袁家斌;张玉洁;;小型微型计算机系统(第04期);全文 *
基于计算资源运行时剩余能力评估优化云平台;周墨颂;董小社;陈衡;张兴军;;计算机研究与发展(第11期);全文 *
数据中心上异构资源的细粒度分配算法研究;汤小春;符莹;樊雪枫;;西北工业大学学报(第03期);全文 *

Also Published As

Publication number Publication date
CN111796933A (zh) 2020-10-20

Similar Documents

Publication Publication Date Title
CN111796933B (zh) 资源调度方法、装置、存储介质和电子设备
CN106776005B (zh) 一种面向容器化应用的资源管理系统及方法
US8397239B2 (en) Virtual computer systems and computer virtualization programs
US10101798B2 (en) Reducing power consumption in a server cluster
CN111580954B (zh) 一种可扩展的分布式数据采集方法和系统
US20160316003A1 (en) Balancing resources in distributed computing environments
CN111798113A (zh) 资源分配方法、装置、存储介质和电子设备
CN114356587B (zh) 算力任务跨区域调度方法、系统及设备
CN116541134B (zh) 多架构集群中容器的部署方法及装置
CN112817728A (zh) 任务调度方法、网络设备和存储介质
CN116467082A (zh) 一种基于大数据的资源分配方法及系统
CN112948109B (zh) 一种ai计算集群的配额弹性调度方法、装置及介质
CN117311973A (zh) 计算设备调度方法、装置、非易失性存储介质及电子设备
CN112286623B (zh) 一种信息处理方法及装置、存储介质
CN112163734A (zh) 基于云平台整定计算资源动态调度方法及装置
CN116010051A (zh) 一种联邦学习多任务调度方法及装置
CN109408230A (zh) 基于能耗优化的Docker容器部署方法及系统
CN111796934B (zh) 任务下发方法、装置、存储介质和电子设备
CN114924888A (zh) 资源配置方法、数据处理方法、装置、设备和存储介质
WO2022171262A1 (en) Scheduling tasks for execution by a computer based on a reinforcement learning model
CN114489463A (zh) 动态调整存储卷qos的方法、装置及计算设备
CN115951988B (zh) 一种作业调度方法、计算设备及存储介质
CN115525425B (zh) 基于云原生技术的联邦学习计算引擎编排方法及其设备
CN114968493B (zh) 虚拟机调度方法、装置、计算机可读介质及电子设备
CN115686803B (zh) 一种调度策略动态加载的计算任务管理系统、方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant