CN111506423B - 一种资源的调度方法、装置、电子设备及存储介质 - Google Patents

一种资源的调度方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111506423B
CN111506423B CN202010275460.0A CN202010275460A CN111506423B CN 111506423 B CN111506423 B CN 111506423B CN 202010275460 A CN202010275460 A CN 202010275460A CN 111506423 B CN111506423 B CN 111506423B
Authority
CN
China
Prior art keywords
power consumption
candidate node
cabinet
task
scheduling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010275460.0A
Other languages
English (en)
Other versions
CN111506423A (zh
Inventor
李想成
胡武成
赵增
刘柏
胡志鹏
李仁杰
范长杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN202010275460.0A priority Critical patent/CN111506423B/zh
Publication of CN111506423A publication Critical patent/CN111506423A/zh
Application granted granted Critical
Publication of CN111506423B publication Critical patent/CN111506423B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/329Power saving characterised by the action undertaken by task scheduling
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请涉及一种资源的调度方法、装置、电子设备及存储介质,在获取到目标调度任务后,根据目标调度任务运行所需的资源条件,从计算节点中筛选出第一候选节点,进而,根据目标调度任务运行所需的预期功耗和第一候选节点所在机柜的功耗信息,从第一候选节点中筛选出第二候选节点,通过确定出的第二候选节点,处理目标调度任务。基于上述方式,通过将机柜的功耗信息和目标调度任务运行所需的预期功耗共同作为筛选处理目标调度任务的节点的条件,可以控制机柜的运行功耗满足该机柜的额定功耗限定,进而避免出现机柜功耗超负荷导致服务器宕机的情况发生,而且,无需调整机柜中服务器的放置,在节省大量人力成本的同时,实现了机柜空间利用率最大化。

Description

一种资源的调度方法、装置、电子设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种资源的调度方法、装置、电子设备及存储介质。
背景技术
Kubernetes,简称K8s,是一个开源的,用于管理云平台中多个主机上的容器化的应用,目标是让部署容器化的应用简单并且高效,自K8s推出后,基于K8s集群设计的底层架构更为普及,软件的部署更为容易,真正实现了“一次部署,直接运行”。
目前,在对K8s集群中的容器进行调度时,通常是选择空闲的计算节点处理调度任务。为避免机柜功耗超负荷,通常也会人为预估机柜的负载情况并提前做好服务器放置方案,在负载发生变化时,可以人为地调整服务器的放置。现有的容器调度方式存在以下不足:(1)在调度时只考虑了计算资源因素,而忽略了考虑机柜的功耗因素,导致机柜功耗超负荷而发生服务器宕机情况;(2)在现有计算节点无法满足调度条件时则停止调度,对于调度失败的任务的处理方式不够合理;(3)功耗预估需要花费较大的人力成本,且难以兼顾机柜空间利用率最大化以及服务器宕机风险最小化,一方面希望在机柜中尽可能存放更多的服务器,一旦人为预估功耗出现差错则可能引起服务器宕机,另一方面为了降低服务器宕机风险往往考虑减少一台机柜所能存放的服务器数量,这样一来又无法充分利用机柜。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本申请实施例至少提供一种资源的调度方法、装置、电子设备及存储介质,可以避免出现机柜功耗超负荷导致服务器宕机的情况发生,而且,无需调整机柜中服务器的放置,在节省大量人力成本的同时,可以充分利用机柜。
本申请主要包括以下几个方面:
第一方面,本申请实施例提供一种资源的调度方法,所述调度方法包括:
获取目标调度任务;
根据所述目标调度任务运行所需的资源条件,从计算节点中确定第一候选节点;
根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点;
通过所述第二候选节点,处理所述目标调度任务。
在一种可能的实施方式中,所述根据所述目标调度任务运行所需的资源条件,从计算节点中确定第一候选节点,包括:
将剩余资源量大于或等于所述目标调度任务的需求资源量的计算节点,确定为第一候选节点。
在一种可能的实施方式中,所述第一候选节点所在机柜的功耗信息包括:所述机柜的当前功耗和所述机柜的额定最大功耗;
所述根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点,包括:
判断是否存在满足功耗约束条件的第一候选节点,所述功耗约束条件包括:所述机柜的当前功耗和所述目标调度任务运行所需的预期功耗之和小于或等于所述机柜的额定最大功耗;
若存在满足所述功耗约束条件的第一候选节点,将所述满足功耗约束条件的第一候选节点确定为第二候选节点。
在一种可能的实施方式中,所述根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点,包括:
若不存在满足所述功耗约束条件的第一候选节点,则调度失败;
在所述调度失败后,延迟第一时长,重新根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定所述第二候选节点。
在一种可能的实施方式中,在所述根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点之前,所述调度方法包括:
根据所述目标调度任务运行所需的额定功耗以及动态调整系数,确定所述目标调度任务运行所需的预期功耗,其中,所述动态调整系数为所述目标调度任务对应的集群在第一时段内处理完成的调度任务的功耗与所述处理完成的调度任务的预期功耗之间的比值。
在一种可能的实施方式中,所述通过所述第二候选节点,处理所述目标调度任务,包括:
从所述第二候选节点中确定目标调度节点;
通过所述目标调度节点,处理所述目标调度任务。
在一种可能的实施方式中,所述从所述第二候选节点中确定目标调度节点,包括:
根据所述第二候选节点的资源饱和度,和/或,所述目标调度任务的需求资源的均衡度与第二候选节点的剩余资源的均衡度之间的差值,确定目标调度节点。
在一种可能的实施方式中,所述第二候选节点的资源饱和度为所述第二候选节点已用资源量与剩余资源量之间的比值。
在一种可能的实施方式中,所述第二候选节点的剩余资源的均衡度为所述第二候选节点中不同类型的剩余资源量之间的比值;
所述目标调度任务的需求资源的均衡度为所述目标调度任务中不同类型的需求资源量之间的比值。
在一种可能的实施方式中,所述在所述调度失败后,延长第一时长,重新根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定所述第二候选节点,包括:
若所述调度失败的次数未达到预设次数,延迟第一时长,重新根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定所述第二候选节点。
在一种可能的实施方式中,所述延迟第一时长,重新根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定所述第二候选节点,包括:
若所述调度失败的次数达到所述预设次数,从所述第一候选节点正在运行的调度任务中确定待迁移的调度任务;
将所述待迁移的调度任务从所述待迁移的调度任务当前所在的第一机柜的第一候选节点迁移至第二机柜的计算节点;
将迁移了所述待迁移的调度任务且满足所述功耗约束条件的第一候选节点确定为第二候选节点。
在一种可能的实施方式中,所述从所述第一候选节点正在运行的调度任务中确定待迁移的调度任务,包括:
对所述第一候选节点中正在运行的调度任务进行重处理评分,将重处理评分最高的调度任务确定为所述待迁移的调度任务。
在一种可能的实施方式中,所述对所述第一候选节点中正在运行的调度任务进行重处理评分,包括:
根据所述正在运行的调度任务已经运行的时长和所述正在运行的调度任务所需的功耗,确定所述正在运行的调度任务的重处理评分。
第二方面,本申请实施例还提供一种资源的调度装置,所述调度装置包括:
获取模块,用于获取目标调度任务;
第一确定模块,用于根据所述目标调度任务运行所需的资源条件,从计算节点中确定第一候选节点;
第二确定模块,用于根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点;
处理模块,用于通过所述第二候选节点,处理所述目标调度任务。
第三方面,本申请实施例还提供一种电子设备,包括:处理器和存储器,所述存储器存储有所述处理器可执行的计算机程序,所述计算机程序被所述处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的资源的调度方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的资源的调度方法。
在本申请实施例中,根据目标调度任务运行所需的资源条件,从计算节点中筛选出第一候选节点,进而,根据目标调度任务运行所需的预期功耗和第一候选节点所在机柜的功耗信息,从第一候选节点中筛选出第二候选节点,通过确定出的第二候选节点,处理目标调度任务。基于上述方式,通过将机柜的功耗信息和目标调度任务运行所需的预期功耗共同作为筛选处理目标调度任务的节点的条件,可以控制机柜的运行功耗满足该机柜的额定功耗限定,进而避免出现机柜功耗超负荷导致服务器宕机的情况发生,而且,无需调整机柜中服务器的放置,在节省大量人力成本的同时,实现了机柜空间利用率最大化。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种资源的调度方法的流程图;
图2示出了本申请实施例所提供的另一种资源的调度方法的流程图;
图3示出了本申请实施例所提供的一种资源的调度装置的功能模块图之一;
图4示出了图3中的第二确定模块的功能模块图;
图5示出了本申请实施例所提供的一种资源的调度装置的功能模块图之二;
图6示出了图5中的处理模块的功能模块图;
图7示出了图4中的第二确定单元的功能模块图;
图8示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中的附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“资源的调度”,给出以下实施方式,对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。
本申请实施例下述方法、装置、电子设备或计算机可读存储介质可以应用于任何需要进行资源的调度的场景,本申请实施例并不对具体的应用场景作限制,任何使用本申请实施例提供的资源的调度方法及装置的方案均在本申请保护范围内。
值得注意的是,在本申请提出之前,为避免机柜功耗超负荷,通常,人为预估机柜的负载情况并提前做好服务器放置方案,在负载发生变化时,人为地调整服务器的放置,采用这种方式,一方面需要花费较大的人力成本,另一方面往往为了降低服务器宕机风险而减少一台机柜所能存放的服务器数量,因此,无法充分利用机柜,而且一旦人为预估出现差错,服务器的宕机风险将大大增加。
针对上述问题,本申请实施例,在获取到待处理的目标调度任务后,确定处理目标调度任务所需消耗的预期功耗值,并从当前可调度的计算节点中,筛选出满足目标调度任务运行所需的资源条件的第一候选节点,从第一候选节点中,通过确定出的满足功耗约束条件的第二候选节点,处理目标调度任务,功耗约束条件为第二候选节点所在的目标机柜的当前功耗值和预期功耗值之和小于或等于目标机柜的最大功耗值。基于上述方式,通过将机柜的功耗作为筛选处理目标调度任务的节点的条件,可以有效控制同一机柜的服务器总功耗小于机柜限定功耗值,避免出现机柜功耗超负荷导致服务器宕机的情况发生。
为便于对本申请进行理解,下面结合具体实施例对本申请提供的技术方案进行详细说明。
图1为本申请实施例所提供的一种资源的调度方法的流程图。需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。如图1所示,本申请实施例提供的资源的调度方法,包括以下步骤:
S101:获取目标调度任务。
在具体实施中,从目标集群中的待调度队列中,获取当前待处理的目标调度任务。
需要说明的是,一个调度任务可以理解为是目标集群中的最小调度单位,是可以创建和管理目标集群计算的最小可部署单元,由一个或者多个容器组成,同时也是目标集群调度的基本粒度,即一个Pod,相当于在服务器中执行的一个任务;这里,一个计算节点可以为一台服务器,目标集群为处理目标调度任务的集群,目标集群可以为K8s集群。
这里,目标调度任务对应的资源包括CPU、GPU、内存。
S102:根据所述目标调度任务运行所需的资源条件,从计算节点中确定第一候选节点。
在具体实施中,从目标集群中当前可调度的计算节点中,先进行预选过程,筛选出满足目标调度任务运行所需的资源条件的第一候选节点,这里,可调度的计算节点可以为处于空闲状态的节点或没有完全被占用的节点。
这里,计算节点为目标集群中的工作主机,主要指物理机,也可以为服务器。
进一步地,步骤S102中根据所述目标调度任务运行所需的资源条件,从计算节点中确定第一候选节点,包括以下步骤:
将剩余资源量大于或等于所述目标调度任务的需求资源量的计算节点,确定为第一候选节点。
在具体实施中,可以从当前可调度的计算节点中,筛选出剩余资源量满足目标调度任务需求资源量的计算节点,作为第一候选节点,这里,满足目标调度任务运行所需的资源条件可以包括:第一候选节点中没有被占用的剩余资源足够处理目标调度任务。
S103:根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点。
在具体实施中,在从当前可调度的计算节点中,筛选出满足目标调度任务运行所需的资源条件的至少一个第一候选节点后,根据目标调度任务运行所需的预期功耗和各个第一候选节点所在机柜的功耗信息,从至少一个候选节点中,筛选出第二候选节点。这里,使用预期功耗值来衡量在第二候选节点中处理目标调度任务所占据的功耗大小。
这里,对目标调度任务运行所需的预期功耗的确定过程进行说明,也即,在步骤S103中根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点之前,还包括以下步骤:
根据所述目标调度任务运行所需的额定功耗以及动态调整系数,确定所述目标调度任务运行所需的预期功耗,其中,所述动态调整系数为所述目标调度任务对应的集群在第一时段内处理完成的调度任务的功耗与所述处理完成的调度任务的预期功耗之间的比值。
在具体实施中,确定目标调度任务运行所需的额定功耗,具体地,先获取目标调度任务运行所需资源的类型、每种类型资源的数量和每种类型资源的额定功耗,将各种类型的资源的数量与对应类型的资源的额定功耗相乘并累加,进而,得到目标调度任务运行所需的额定功耗。在实际处理目标调度任务时,由于额定功耗是满载情况下所能产生的功耗,故,目标调度任务所需消耗的额定功耗要大于目标调度任务对应的实际功耗,这里,将目标调度任务运行所需的额定功耗与动态调整系数相乘得到的数值,确定为预期功耗,将预期功耗当做实际功耗,其中,动态调整系数为大于零,小于1的常数。
一示例中,目标调度任务对应资源包括CPU、GPU、内存,CPU、GPU、内存为不同类型的资源,其中,目标调度任务所需4个CPU、1个GPU、2个16G内存,则CPU对应的额定功耗Wcpu额定=4×CPU的额定功耗,GPU对应的额定功耗WGPU额定=1×CPU的额定功耗,内存对应的额定功耗W内存额定=2×内存的额定功耗,目标调度任务对应的预期功耗值Wpod=λ*(Wcpu额定+W内存额定+WGPU额定),其中,λ为动态调整系数。
这里,动态调整系数为动态系数,可以每隔一段时间计算一次,并反馈到目标调度任务的预期功耗值的计算中,使其更加贴近目标调度任务实际产生的功耗值,这里,动态调整系数为目标调度任务对应的集群在第一时段内处理完成的调度任务的功耗与处理完成的调度任务的预期功耗之间的比值,第一时段可以根据实际需要进行设置,目标集群中会同时处理多个调度任务。
进一步地,第一候选节点所在机柜的功耗信息包括机柜的当前功耗和机柜的额定最大功耗,其中,机柜的当前功耗可以为在确定第二候选节点时,第一候选节点所在机柜的当前运行的功耗,也可以为机柜在之前一段时间内的平均功耗。
这里,对确定第二确定候选节点的具体过程展开说明,步骤S103根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点,包括以下步骤:
判断是否存在满足功耗约束条件的第一候选节点,所述功耗约束条件包括:所述机柜的当前功耗和所述目标调度任务运行所需的预期功耗之和小于或等于所述机柜的额定最大功耗。若存在满足所述功耗约束条件的第一候选节点,将所述满足功耗约束条件的第一候选节点确定为第二候选节点。
在具体实施中,选取所在机柜的当前功耗和预期功耗之和小于或等于该机柜的额定最大功耗的第一候选节点,确定第二候选节点,具体地,可以事先为每个计算节点添加所在机柜编号的标签,进而,对于每个第一候选节点,确定该第一候选节点所在的机柜,在确定出该机柜的当前功耗后,将目标调度任务所需的预期功耗与当前功耗相加得到和值,若该和值小于或等于该机柜的额定最大功耗,说明在此时将目标调度任务运行在该第一候选节点上,该第一候选节点所在的机柜不会超负荷,故,可以将该第一候选节点确定为第二候选节点;若该和值大于该机柜的额定最大功耗,说明在此时将目标调度任务运行在该第一候选节点上,会导致该第一候选节点所在的机柜超过负荷,故,该第一候选节点不能作为第二候选节点;
需要说明的是,通过合理的将目标任务调度运行在第二候选节点上,可以有效控制同一机柜的服务器总功耗大小不超过机柜额定功耗,可以避免出现机柜功耗超负荷导致服务器宕机的情况发生,而且,无需调整机柜中服务器的放置,降低对服务器放置方案设计的难度及管理人员对实时监控功耗负载情况的精力投入,可以节省大量人力成本。
其中,机柜是指装有服务器的机柜,机柜可以为服务器正常工作提供相适应的环境(包括电源等)和安全防护。
这里,功耗约束条件为Wavg+Wpod≤Wmax,其中,目标调度任务运行所需的预期功耗为Wpod,第二候选节点所在机柜的当前功耗为Wavg,第二候选节点所在的机柜的额定最大功耗为Wmax
S104:通过所述第二候选节点,处理所述目标调度任务。
在具体实施中,在确定出第二候选节点后,会将目标调度任务运行在该第二候选节点上,在该第二候选节点部署目标调度任务后,该第二候选节点所在的机柜功耗不会超负荷,因而,不会出现第二候选节点所在的机柜超负荷导致服务器宕机的情况发生。而且,本申请无需调整机柜中服务器的放置,就可以实现使运行目标调度任务的机柜中的服务器消耗的功耗小于该机柜的最大额定功耗,在节省大量人力成本的同时,可以充分利用机柜。
进一步地,从至少一个第一候选节点中,筛选出的第二候选节点可能为多个,在确定出的第二候选节点的数量为多个时,进行优选过程,即需要从多个第二候选节点中选取出一个目标调度节点来处理目标调度任务,也即,步骤S104中通过所述第二候选节点,处理所述目标调度任务,包括以下步骤:
从所述第二候选节点中确定目标调度节点;通过所述目标调度节点,处理所述目标调度任务。
这里,对从多个第二候选节点中选取目标调度节点的过程展开说明,也即,从所述第二候选节点中确定目标调度节点,包括:
根据所述第二候选节点的资源饱和度,和/或,所述目标调度任务的需求资源的均衡度与第二候选节点的剩余资源的均衡度之间的差值,确定目标调度节点。
在具体实施中,可以预先根据业务需要制定筛选条件,并通过筛选条件,从多个第二候选节点中,选取出目标调度节点,这里,可以根据第二候选节点的资源饱和度确定目标调度节点,具体地,选取资源饱和度最大的第二候选节点确定为目标调度节点;也可以根据目标调度任务的需求资源的均衡度与第二候选节点的剩余资源的均衡度之间的差值,确定目标调度节点,具体地,在确定目标调度任务时,选取目标调度任务的需求资源的均衡度小于第二候选节点的剩余资源的均衡度的第二候选节点,确定目标调度节点;还可以根据第二候选节点的资源饱和度,以及目标调度任务的需求资源的均衡度与第二候选节点的剩余资源的均衡度之间的差值,来共同确定目标调度节点。
这里,第二候选节点的资源饱和度为第二候选节点已用资源量与剩余资源量之间的比值,故,可以根据资源饱和度,优先填满已经被其他调度任务占用的第二候选节点。
这里,第二候选节点的剩余资源的均衡度为第二候选节点中不同类型的剩余资源量之间的比值;目标调度任务的需求资源的均衡度为目标调度任务中不同类型的需求资源量之间的比值。其中,在选取目标调度节点时,可以考虑到资源碎片因素,即,资源类型,而资源均衡度与加载目标调度任务后可能产生的资源碎片相关。
在本申请实施例中,根据目标调度任务运行所需的资源条件,从计算节点中筛选出第一候选节点,进而,根据目标调度任务运行所需的预期功耗和第一候选节点所在机柜的功耗信息,从第一候选节点中筛选出第二候选节点,通过确定出的第二候选节点,处理目标调度任务。基于上述方式,通过将机柜的功耗信息和目标调度任务运行所需的预期功耗共同作为筛选处理目标调度任务的节点的条件,可以控制机柜的运行功耗满足该机柜的额定功耗限定,进而避免出现机柜功耗超负荷导致服务器宕机的情况发生,而且,无需调整机柜中服务器的放置,在节省大量人力成本的同时,实现了机柜空间利用率最大化。
图2为本申请实施例所提供的另一种资源的调度方法的流程图。如图2所示,本申请实施例提供的资源的调度方法,包括以下步骤:
S201:获取目标调度任务。
S202:根据所述目标调度任务运行所需的资源条件,从计算节点中确定第一候选节点。
S203:判断是否存在满足功耗约束条件的第一候选节点,所述功耗约束条件包括:所述机柜的当前功耗和所述目标调度任务运行所需的预期功耗之和小于或等于所述机柜的额定最大功耗。
在具体实施中,可以通过功耗约束条件,从第一候选节点中确定第二候选节点。
S204:若不存在满足所述功耗约束条件的第一候选节点,则调度失败。
在具体实施中,若第一候选节点所在机柜的当前功耗和目标调度任务运行所需的预期功耗之和大于该机柜的额定最大功耗,说明在此时将目标调度任务运行在该第一候选节点上,会导致该第一候选节点所在的机柜超过负荷,故,该第一候选节点不能作为第二候选节点,则判定调度失败。
S205:在所述调度失败后,延迟第一时长,重新根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定所述第二候选节点。
在具体实施中,若从当前的至少一个第一候选节点中没有满足功耗约束条件的第二候选节点,则将目标调度任务添加至重试调度队列,在延迟第一时长后,轮询到目标调度任务时,重新从满足目标调度任务运行所需的资源条件的至少一个第一候选节点中,确定是否存在满足功耗约束条件的第二候选节点,这里,延迟第一时长后,可能有正在运行的调度任务执行完毕,从而使机柜的当前功耗值降低,故,可能存在满足要求的第二候选节点,若重新确定出第二候选节点,通过该第二候选节点处理目标调度任务。
需要说明的是,若至少一个第一候选节点中不存在第二候选节点,则为调度失败,本申请通过为调度失败的目标调度任务设计了延迟调度策略,可以重新确定出第二候选节点,进而,通过重新确定出的第二候选节点对目标调度任务进行处理。
进一步地,若重试多次仍没有满足约束条件的第二候选节点,则可以将正在运行的调度任务从第一候选节点中迁出至其他计算节点,以使该第一候选节点所在的机柜的当前功耗值有所降低,可以满足在该第一候选节点上运行目标调度任务后,该机柜的总功耗不超出其最大额定功耗,即,迁移出调度任务的该第一候选节点可以作为第二候选节点,这里,需要确定迁移哪一个第一候选节点上的哪一个调度任务,也即,若在延迟第一时长后,没有确定出第二候选节点,即调度失败后,还包括以下情况:
情况一:若所述调度失败的次数未达到预设次数,延迟第一时长,重新根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定所述第二候选节点。
在具体实施中,可以先统计调度失败的次数,若调度失败的次数未达到预设次数,则延迟第一时长,重新从第一候选节点中确定第二候选节点。
情况二:若所述调度失败的次数达到所述预设次数,从所述第一候选节点正在运行的调度任务中确定待迁移的调度任务;将所述待迁移的调度任务从所述待迁移的调度任务当前所在的第一机柜的第一候选节点迁移至第二机柜的计算节点;将迁移了所述待迁移的调度任务且满足所述功耗约束条件的第一候选节点确定为第二候选节点。
在具体实施中,可以预先设置预设次数,预设次数根据实际需要进行设置,优选可以设置在2-8次,若统计出处理目标调度任务的调度失败的次数达到预设次数,从第一候选节点正在运行的调度任务中确定待迁移的调度任务,将待迁移的调度任务从待迁移的调度任务当前所在的第一机柜的第一候选节点迁移至第二机柜的计算节点,将迁移了所述待迁移的调度任务且满足功耗约束条件的第一候选节点确定为第二候选节点。
通过本示例实施例,在任务调度失败时,可以进一步根据调度失败的次数与预设次数的关系调整调度策略。若调度失败次数未达到预设次数,则延迟第一时长,再重新根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从第一候选节点中确定第二候选节点;若调度失败次数达到预设次数,则从所述第一候选节点正在运行的调度任务中确定待迁移的调度任务,将所述待迁移的调度任务从所述待迁移的调度任务当前所在的第一机柜的第一候选节点迁移至第二机柜的计算节点,并将迁移了所述待迁移的调度任务且满足所述功耗约束条件的第一候选节点确定为第二候选节点,这样,对于调度失败后排队等待重调度的调度任务,可以根据调度失败的次数对应调整调度策略,对于多次调度失败的调度任务,即使当前没有合适的第一候选节点,也可以通过调整第一候选节点的运行任务来形成合适的第一候选节点,实现及时处理该多次调度失败的调度任务,使得任务的调度更为合理及时。
进一步地,针对情况二,从所述第一候选节点正在运行的调度任务中确定待迁移的调度任务,包括以下步骤:
对所述第一候选节点中正在运行的调度任务进行重处理评分,将重处理评分最高的调度任务确定为所述待迁移的调度任务。
在具体实施中,先对各个第一候选节点中正在运行的多个调度任务分别进行重处理评分,并将重处理评分最高的调度任务确定为待迁移的调度任务,进而,将多个调度任务中,重处理评分高于其他任务的调度任务,迁移待迁移的调度任务从待迁移的调度任务当前所在的第一机柜的第一候选节点迁移至第二机柜的计算节点,这样,可以在该第一候选节点的机柜中腾出空间,在该第一候选节点上运行目标调度任务,以保证该第一候选节点所在的机柜的功耗小于该机柜的额定最大功耗,进而,可以平衡目标集群中的各个节点的功耗水平,使得目标集群能够处理更多的调度任务。
其中,重处理评分表征重新在其他计算节点上处理调度任务所需花费的代价,这里,重处理评分的评分越高,重新处理的代价越小。
需要说明的是,这里迁移为将正在运行的调度任务删除,释放其原本占有资源和产生的功耗,使得其原本所在第一候选节点能够有更多资源容纳新的调度任务。
这里,在计算各个调度任务的重处理评分时,需要考虑利用其他计算节点重新处理调度任务所需花费的代价,即重处理评分表征重新在其他计算节点上处理调度任务所需花费的代价,这里,重处理评分主要根据调度任务已运行时长和其所需功耗两方面评价,重处理评分越高,则重新调度的代价越小,例如调度任务运行时长越长则相应的评分越低,可以减少出现某一个调度任务执行快结束了,却被重新调度的情况发送,也即,根据以下步骤确定任一个调度任务的重处理评分:
根据所述正在运行的调度任务已经运行的时长和所述正在运行的调度任务所需的功耗,确定所述正在运行的调度任务的重处理评分。
这里,重处理评分公式为:
Figure BDA0002444607660000181
其中,Score为调度任务对应的重处理评分,α、β为大于0的常数,T为该调度任务已经运行的时长,W为该调度任务所需的功耗。
S206:通过所述第二候选节点,处理所述目标调度任务。
其中,S201、S202、S206的描述可以参见S101、S102、S104的描述,并且能够达到同样的技术效果,对此,不再进行赘述。
需要说明的是,在K8s集群调度未考虑功耗的情况下,仅仅基于业务情况人为地调整服务器放置方案,容易产生以下问题:
(1)在调度时只考虑了计算资源因素,而忽略了考虑机柜的功耗因素,导致机柜功耗超负荷而发生服务器宕机情况。
(2)在现有计算节点无法满足调度条件时则停止调度,对于调度失败的任务的处理方式不够合理。
(3)功耗预估需要花费较大的人力成本,且难以兼顾机柜空间利用率最大化以及服务器宕机风险最小化,一方面希望在机柜中尽可能存放更多的服务器,一旦人为预估功耗出现差错则可能引起服务器宕机,另一方面为了降低服务器宕机风险往往考虑减少一台机柜所能存放的服务器数量,这样一来又无法充分利用机柜。
基于此,采用本申请的技术方案,能够有效地控制机柜的总功耗情况,避免机柜超负荷情况的发生,也由此大大降低了服务器放置方案设计的难度,每台机柜能够放置更多的服务器而不受宕机风险影响,进而节省机柜使用成本,与此同时,服务器管理人员也无须再因宕机风险去实时关注集群负载情况,节省了更多的人力,并且通过重调度方法能够根据调度失败的次数对应调整调度策略,使得任务的调度更加合理及时。
在本申请实施例中,根据目标调度任务运行所需的资源条件,从计算节点中筛选出第一候选节点,进而,根据目标调度任务运行所需的预期功耗和第一候选节点所在机柜的功耗信息,从第一候选节点中筛选出第二候选节点,通过确定出的第二候选节点,处理目标调度任务。基于上述方式,通过将机柜的功耗信息和目标调度任务运行所需的预期功耗共同作为筛选处理目标调度任务的节点的条件,可以控制机柜的运行功耗满足该机柜的额定功耗限定,进而避免出现机柜功耗超负荷导致服务器宕机的情况发生,而且,无需调整机柜中服务器的放置,在节省大量人力成本的同时,实现了机柜空间利用率最大化。
基于同一申请构思,本申请实施例中还提供了与上述实施例提供的资源的调度方法对应的资源的调度装置,由于本申请实施例中的装置解决问题的原理与本申请上述实施例的资源的调度方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
如图3至图7所示,图3示出了本申请实施例所提供的一种资源的调度装置300的功能模块图之一;图4示出了图3中的第二确定模块330的功能模块图;图5示出了本申请实施例所提供的一种资源的调度装置300的功能模块图之二;图6示出了图5中的处理模块340的功能模块图;图7示出了图4中的第二确定单元336的功能模块图。
如图3所示,所述资源的调度装置300包括:
获取模块310,用于获取目标调度任务;
第一确定模块320,用于根据所述目标调度任务运行所需的资源条件,从计算节点中确定第一候选节点;
第二确定模块330,用于根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点;
处理模块340,用于通过所述第二候选节点,处理所述目标调度任务。
在一种可能的实施方式中,如图3所示,所述第一确定模块320,用于根据以下步骤确定第一候选节点:
将剩余资源量大于或等于所述目标调度任务的需求资源量的计算节点,确定为第一候选节点。
在一种可能的实施方式中,所述第一候选节点所在机柜的功耗信息包括:所述机柜的当前功耗和所述机柜的额定最大功耗;如图4所示,所述第二确定模块330包括:
判断单元332,用于判断是否存在满足功耗约束条件的第一候选节点,所述功耗约束条件包括:所述机柜的当前功耗和所述目标调度任务运行所需的预期功耗之和小于或等于所述机柜的额定最大功耗;
第一确定单元334,用于若存在满足所述功耗约束条件的第一候选节点,将所述满足功耗约束条件的第一候选节点确定为第二候选节点。
在一种可能的实施方式中,如图4所示,所述第二确定模块330还包括第二确定单元336;所述第二确定单元336,用于根据以下步骤确定所述第二候选节点:
若不存在满足所述功耗约束条件的第一候选节点,则调度失败;
在所述调度失败后,延迟第一时长,重新根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定所述第二候选节点。
在一种可能的实施方式中,如图5所示,所述资源的调度装置300还包括第三确定模块350;所述第三确定模块350,用于:
根据所述目标调度任务运行所需的额定功耗以及动态调整系数,确定所述目标调度任务运行所需的预期功耗,其中,所述动态调整系数为所述目标调度任务对应的集群在第一时段内处理完成的调度任务的功耗与所述处理完成的调度任务的预期功耗之间的比值。
在一种可能的实施方式中,如图6所示,所述处理模块340包括:
第三确定单元342,用于从所述第二候选节点中确定目标调度节点;
处理单元344,用于通过所述目标调度节点,处理所述目标调度任务。
在一种可能的实施方式中,如图6所示,所述第三确定单元342,用于根据以下步骤确定目标调度节点:
根据所述第二候选节点的资源饱和度,和/或,所述目标调度任务的需求资源的均衡度与第二候选节点的剩余资源的均衡度之间的差值,确定目标调度节点。
在一种可能的实施方式中,所述第二候选节点的资源饱和度为所述第二候选节点已用资源量与剩余资源量之间的比值。
在一种可能的实施方式中,所述第二候选节点的剩余资源的均衡度为所述第二候选节点中不同类型的剩余资源量之间的比值;
所述目标调度任务的需求资源的均衡度为所述目标调度任务中不同类型的需求资源量之间的比值。
在一种可能的实施方式中,如图4所示,所述第二确定单元336,还用于根据以下步骤确定所述第二候选节点:
若所述调度失败的次数未达到预设次数,延迟第一时长,重新根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定所述第二候选节点。
在一种可能的实施方式中,如图7所示,所述第二确定单元336包括:
第一确定子单元3361,用于若所述调度失败的次数达到所述预设次数,从所述第一候选节点正在运行的调度任务中确定待迁移的调度任务;
迁移子单元3362,用于将所述待迁移的调度任务从所述待迁移的调度任务当前所在的第一机柜的第一候选节点迁移至第二机柜的计算节点;
第二确定子单元3363,用于将迁移了所述待迁移的调度任务且满足所述功耗约束条件的第一候选节点确定为第二候选节点。
在一种可能的实施方式中,如图7所示,所述第一确定子单元3361,用于根据以下步骤确定待迁移的调度任务:
对所述第一候选节点中正在运行的调度任务进行重处理评分,将重处理评分最高的调度任务确定为所述待迁移的调度任务。
在一种可能的实施方式中,如图7所示,所述第一确定子单元3361,用于根据以下步骤确定重处理评分:
根据所述正在运行的调度任务已经运行的时长和所述正在运行的调度任务所需的功耗,确定所述正在运行的调度任务的重处理评分。
在本申请的实施例中,根据目标调度任务运行所需的资源条件,从计算节点中筛选出第一候选节点,进而,根据目标调度任务运行所需的预期功耗和第一候选节点所在机柜的功耗信息,从第一候选节点中筛选出第二候选节点,通过确定出的第二候选节点,处理目标调度任务。基于上述方式,通过将机柜的功耗信息和目标调度任务运行所需的预期功耗共同作为筛选处理目标调度任务的节点的条件,可以控制机柜的运行功耗满足该机柜的额定功耗限定,进而避免出现机柜功耗超负荷导致服务器宕机的情况发生,而且,无需调整机柜中服务器的放置,在节省大量人力成本的同时,实现了机柜空间利用率最大化。
基于同一申请构思,参见图8所示,为本申请实施例提供的一种电子设备800的结构示意图,包括:处理器810和存储器820,所述存储器820存储有所述处理器810可执行的计算机程序,所述计算机程序被所述处理器810运行时执行如上述实施例中任一所述的资源的调度方法。
具体地,所述机器可读指令被所述处理器810执行时可以执行如下处理:
获取目标调度任务;
根据所述目标调度任务运行所需的资源条件,从计算节点中确定第一候选节点;
根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点;
通过所述第二候选节点,处理所述目标调度任务。
在本申请实施例中,根据目标调度任务运行所需的资源条件,从计算节点中筛选出第一候选节点,进而,根据目标调度任务运行所需的预期功耗和第一候选节点所在机柜的功耗信息,从第一候选节点中筛选出第二候选节点,通过确定出的第二候选节点,处理目标调度任务。基于上述方式,通过将机柜的功耗信息和目标调度任务运行所需的预期功耗共同作为筛选处理目标调度任务的节点的条件,可以控制机柜的运行功耗满足该机柜的额定功耗限定,进而避免出现机柜功耗超负荷导致服务器宕机的情况发生,而且,无需调整机柜中服务器的放置,在节省大量人力成本的同时,实现了机柜空间利用率最大化。
基于同一申请构思,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述实施例提供的资源的调度方法。
具体地,所述存储介质能够为通用的存储介质,如移动磁盘、硬盘等,所述存储介质上的计算机程序被运行时,能够执行上述资源的调度方法,通过将机柜的功耗信息和目标调度任务运行所需的预期功耗共同作为筛选处理目标调度任务的节点的条件,可以控制机柜的总功耗始终小于该机柜的额定功耗,可以避免出现机柜功耗超负荷导致服务器宕机的情况发生,而且,无需调整机柜中服务器的放置,在节省大量人力成本的同时,可以充分利用机柜。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应所述理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者所述技术方案的部分可以以软件产品的形式体现出来,所述计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (14)

1.一种资源的调度方法,其特征在于,所述调度方法包括:
获取目标调度任务;
根据所述目标调度任务运行所需的资源条件,从计算节点中确定第一候选节点;
根据所述目标调度任务运行所需的额定功耗以及动态调整系数,确定所述目标调度任务运行所需的预期功耗,其中,所述动态调整系数为所述目标调度任务对应的集群在第一时段内处理完成的调度任务的功耗与所述处理完成的调度任务的预期功耗之间的比值;
根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点;所述第一候选节点所在机柜的功耗信息包括:所述机柜的当前功耗和所述机柜的额定最大功耗;
通过所述第二候选节点,处理所述目标调度任务;
其中,所述根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点,包括:判断是否存在满足功耗约束条件的第一候选节点,所述功耗约束条件包括:所述机柜的当前功耗和所述目标调度任务运行所需的预期功耗之和小于或等于所述机柜的额定最大功耗;若存在满足所述功耗约束条件的第一候选节点,将所述满足功耗约束条件的第一候选节点确定为第二候选节点。
2.根据权利要求1所述的调度方法,其特征在于,所述根据所述目标调度任务运行所需的资源条件,从计算节点中确定第一候选节点,包括:
将剩余资源量大于或等于所述目标调度任务的需求资源量的计算节点,确定为第一候选节点。
3.根据权利要求1所述的调度方法,其特征在于,所述根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点,包括:
若不存在满足所述功耗约束条件的第一候选节点,则调度失败;
在所述调度失败后,延迟第一时长,重新根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定所述第二候选节点。
4.根据权利要求1所述的调度方法,其特征在于,所述通过所述第二候选节点,处理所述目标调度任务,包括:
从所述第二候选节点中确定目标调度节点;
通过所述目标调度节点,处理所述目标调度任务。
5.根据权利要求4所述的调度方法,其特征在于,所述从所述第二候选节点中确定目标调度节点,包括:
根据所述第二候选节点的资源饱和度,和/或,所述目标调度任务的需求资源的均衡度与第二候选节点的剩余资源的均衡度之间的差值,确定目标调度节点。
6.根据权利要求5所述的调度方法,其特征在于,所述第二候选节点的资源饱和度为所述第二候选节点已用资源量与剩余资源量之间的比值。
7.所根据权利要求5所述的调度方法,其特征在于,所述第二候选节点的剩余资源的均衡度为所述第二候选节点中不同类型的剩余资源量之间的比值;
所述目标调度任务的需求资源的均衡度为所述目标调度任务中不同类型的需求资源量之间的比值。
8.根据权利要求3所述的调度方法,其特征在于,所述在所述调度失败后,延长第一时长,重新根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定所述第二候选节点,包括:
若所述调度失败的次数未达到预设次数,延迟第一时长,重新根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定所述第二候选节点。
9.根据权利要求8所述的调度方法,其特征在于,所述延迟第一时长,重新根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定所述第二候选节点,包括:
若所述调度失败的次数达到所述预设次数,从所述第一候选节点正在运行的调度任务中确定待迁移的调度任务;
将所述待迁移的调度任务从所述待迁移的调度任务当前所在的第一机柜的第一候选节点迁移至第二机柜的计算节点;
将迁移了所述待迁移的调度任务且满足所述功耗约束条件的第一候选节点确定为第二候选节点。
10.根据权利要求9所述的调度方法,其特征在于,所述从所述第一候选节点正在运行的调度任务中确定待迁移的调度任务,包括:
对所述第一候选节点中正在运行的调度任务进行重处理评分,将重处理评分最高的调度任务确定为所述待迁移的调度任务。
11.根据权利要求10所述的调度方法,其特征在于,所述对所述第一候选节点中正在运行的调度任务进行重处理评分,包括:
根据所述正在运行的调度任务已经运行的时长和所述正在运行的调度任务所需的功耗,确定所述正在运行的调度任务的重处理评分。
12.一种资源的调度装置,其特征在于,所述调度装置包括:
获取模块,用于获取目标调度任务;
第一确定模块,用于根据所述目标调度任务运行所需的资源条件,从计算节点中确定第一候选节点;
第三确定模块,用于根据所述目标调度任务运行所需的额定功耗以及动态调整系数,确定所述目标调度任务运行所需的预期功耗,其中,所述动态调整系数为所述目标调度任务对应的集群在第一时段内处理完成的调度任务的功耗与所述处理完成的调度任务的预期功耗之间的比值;
第二确定模块,用于根据所述目标调度任务运行所需的预期功耗和所述第一候选节点所在机柜的功耗信息,从所述第一候选节点中确定第二候选节点;所述第一候选节点所在机柜的功耗信息包括:所述机柜的当前功耗和所述机柜的额定最大功耗;
处理模块,用于通过所述第二候选节点,处理所述目标调度任务;
其中,所述第二确定模块包括:
判断单元,用于判断是否存在满足功耗约束条件的第一候选节点,所述功耗约束条件包括:所述机柜的当前功耗和所述目标调度任务运行所需的预期功耗之和小于或等于所述机柜的额定最大功耗;
第一确定单元,用于若存在满足所述功耗约束条件的第一候选节点,将所述满足功耗约束条件的第一候选节点确定为第二候选节点。
13.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器存储有所述处理器可执行的计算机程序,所述计算机程序被所述处理器运行时执行如权利要求1至11任一所述的资源的调度方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至11任一所述的资源的调度方法。
CN202010275460.0A 2020-04-09 2020-04-09 一种资源的调度方法、装置、电子设备及存储介质 Active CN111506423B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010275460.0A CN111506423B (zh) 2020-04-09 2020-04-09 一种资源的调度方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010275460.0A CN111506423B (zh) 2020-04-09 2020-04-09 一种资源的调度方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111506423A CN111506423A (zh) 2020-08-07
CN111506423B true CN111506423B (zh) 2023-06-30

Family

ID=71878750

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010275460.0A Active CN111506423B (zh) 2020-04-09 2020-04-09 一种资源的调度方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111506423B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111966500B (zh) * 2020-09-07 2023-08-11 网易(杭州)网络有限公司 资源调度方法、装置、电子设备及存储介质
CN112256420B (zh) * 2020-10-30 2022-12-02 重庆紫光华山智安科技有限公司 任务分配方法、装置及电子设备
CN112328378B (zh) * 2020-11-05 2023-03-24 南京星环智能科技有限公司 任务调度方法、计算机设备及存储介质
CN112269641B (zh) * 2020-11-18 2023-09-15 网易(杭州)网络有限公司 一种调度方法、装置、电子设备及存储介质
CN113010590B (zh) * 2021-02-24 2023-07-07 光大兴陇信托有限责任公司 一种统一监管报送方法及系统
CN112948111B (zh) * 2021-02-26 2023-07-14 北京奇艺世纪科技有限公司 一种任务分配方法、装置、设备及计算机可读介质
CN115086334A (zh) * 2022-06-15 2022-09-20 北京奇艺世纪科技有限公司 一种服务器标记方法及相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102944740A (zh) * 2012-11-15 2013-02-27 浪潮电子信息产业股份有限公司 一种机柜内节点功耗测试方法
CN103984403A (zh) * 2014-05-28 2014-08-13 浪潮电子信息产业股份有限公司 一种优化rack机柜系统功耗的设计方法
CN104360893A (zh) * 2014-10-23 2015-02-18 西安未来国际信息股份有限公司 一种基于环境能耗的虚拟资源调度方法
CN104423531A (zh) * 2013-09-05 2015-03-18 中兴通讯股份有限公司 数据中心能耗调度处理方法及装置
CN110597664A (zh) * 2019-09-17 2019-12-20 深信服科技股份有限公司 一种高可用集群资源部署方法、装置及相关组件

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9632835B2 (en) * 2014-03-17 2017-04-25 Ca, Inc. Deployment of virtual machines to physical host machines based on infrastructure utilization decisions
US9448848B2 (en) * 2014-03-17 2016-09-20 Ca, Inc. Controlling placement of virtual machines on physical host machines and placement of physical host machines in cabinets

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102944740A (zh) * 2012-11-15 2013-02-27 浪潮电子信息产业股份有限公司 一种机柜内节点功耗测试方法
CN104423531A (zh) * 2013-09-05 2015-03-18 中兴通讯股份有限公司 数据中心能耗调度处理方法及装置
CN103984403A (zh) * 2014-05-28 2014-08-13 浪潮电子信息产业股份有限公司 一种优化rack机柜系统功耗的设计方法
CN104360893A (zh) * 2014-10-23 2015-02-18 西安未来国际信息股份有限公司 一种基于环境能耗的虚拟资源调度方法
CN110597664A (zh) * 2019-09-17 2019-12-20 深信服科技股份有限公司 一种高可用集群资源部署方法、装置及相关组件

Also Published As

Publication number Publication date
CN111506423A (zh) 2020-08-07

Similar Documents

Publication Publication Date Title
CN111506423B (zh) 一种资源的调度方法、装置、电子设备及存储介质
CN112269641B (zh) 一种调度方法、装置、电子设备及存储介质
CN111966500B (zh) 资源调度方法、装置、电子设备及存储介质
CN110515704B (zh) 基于Kubernetes系统的资源调度方法及装置
US9319281B2 (en) Resource management method, resource management device, and program product
EP3335119B1 (en) Multi-priority service instance allocation within cloud computing platforms
US20170017511A1 (en) Method for memory management in virtual machines, and corresponding system and computer program product
US9800519B2 (en) Equitable sharing of system resources in workflow execution
CN111104227B (zh) 一种K8s平台的资源控制方法、装置及相关组件
CN104426694B (zh) 一种调整虚拟机资源的方法和装置
US20140143777A1 (en) Resource Scheduling Method and Device
CN111880939A (zh) 容器动态迁移方法、装置及电子设备
US20210357269A1 (en) Quality of service scheduling with workload profiles
EP2996382A1 (en) Physical resource adjustment method, device and controller
CN113778650A (zh) 任务调度方法、装置、电子设备及存储介质
CN112231053B (zh) 一种负载均衡服务分配方法及装置
CN112860383A (zh) 集群资源调度方法、装置、设备及存储介质
EP4206915A1 (en) Container creation method and apparatus, electronic device, and storage medium
CN114489970A (zh) Kubernetes中利用Coscheduling插件实现队列排序的方法及系统
CN114936106A (zh) 一种主机故障的处理方法、装置及介质
CN115086324A (zh) 服务链分配方法和系统、计算机设备和存储介质
CN112612579A (zh) 虚拟机部署方法、存储介质及计算机设备
CN110413436A (zh) 一种故障处理方法及装置
CN113867919B (zh) Kubernetes集群调度方法、系统、设备及介质
CN111597037B (zh) 作业分配方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant