CN105808341A - 一种资源调度的方法、装置和系统 - Google Patents

一种资源调度的方法、装置和系统 Download PDF

Info

Publication number
CN105808341A
CN105808341A CN201410838302.6A CN201410838302A CN105808341A CN 105808341 A CN105808341 A CN 105808341A CN 201410838302 A CN201410838302 A CN 201410838302A CN 105808341 A CN105808341 A CN 105808341A
Authority
CN
China
Prior art keywords
physical machine
resource
application
resource information
loadtype
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410838302.6A
Other languages
English (en)
Other versions
CN105808341B (zh
Inventor
鄂海红
黄岩
宋美娜
常倩
付勋
姜海鸥
宋俊德
舒琴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Beijing University of Posts and Telecommunications
Original Assignee
China Mobile Communications Group Co Ltd
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, Beijing University of Posts and Telecommunications filed Critical China Mobile Communications Group Co Ltd
Priority to CN201410838302.6A priority Critical patent/CN105808341B/zh
Publication of CN105808341A publication Critical patent/CN105808341A/zh
Application granted granted Critical
Publication of CN105808341B publication Critical patent/CN105808341B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种资源调度的方法、装置和系统,能够针对云平台所承载的业务及业务类型实现资源有效调度;该方法可以包括:调度装置获取资源请求以及物理机的可调度资源信息与预留资源信息;所述调度装置按照所述应用对应的业务保障级别和负载类型,根据所述物理机的可调度资源信息与预留资源信息确定满足调度需求的目标物理机;所述调度装置根据所述资源请求将资源调度至所述目标物理机。

Description

一种资源调度的方法、装置和系统
技术领域
本发明涉及云计算资源管理技术,尤其涉及一种资源调度的方法、装置和系统。
背景技术
云计算的核心思想是将大量用网络连接的计算资源进行统一管理和调度,构成一个计算资源池,向用户提供按需服务。云计算平台承载不同业务的应用都有一个显著的特征:随着业务的发展和用户群的壮大,应用的资源需求会不断增加,并且根据应用承载的业务的不同,资源需求增加量也存在差异。
目前,国内外对云平台资源调度的研究主要目标集中在提升资源利用率、达到服务等级协议(SLA,Service-LevelAgreement)、负载均衡或者最大化云平台提供商利益等方面,并没有一种能够针对承载的业务及业务类型进行资源调度的方法;而且,为了适应资源需求的增长,目前通常采用对虚拟机进行迁移的方式,在对虚拟机进行迁移的过程中包括离线迁移和在线迁移两种方式,其中,离线迁移会暂停当前虚拟机的运行、暂存当前虚拟机暂停时的运行状态,并在另一台物理机重现当前虚拟机暂停时的运行状态;动态迁移会在源物理机和目标物理机之间不断进行状态同步,直到最后一次同步之后才短暂地暂停虚拟机运行。上述两种方式都不可避免的会出现暂停运行状态的现象,从而会也不可避免地会有宕机时间。
发明内容
为解决上述技术问题,本发明实施例期望提供一种资源调度的方法、装置和系统,能够针对云平台所承载的业务及业务类型实现资源有效调度,并减少资源调度之后出现虚拟机迁移的现象,从而减少由于虚拟机迁移而导致的暂停运行状态的现象发生。
本发明的技术方案是这样实现的:
第一方面,本发明实施例提供了一种资源调度的方法,所述方法包括:
调度装置获取资源请求以及物理机的可调度资源信息与预留资源信息;其中,所述资源请求包括需要进行资源调度的应用以及所述应用对应的业务保障级别和负载类型;所述物理机的可调度资源信息用于表示所述物理机能够为所述应用提供的资源大小;所述物理机的预留资源信息用于表示所述物理机能够为单个高级别保障应用在后续运行时提供的额外资源大小;
所述调度装置按照所述应用对应的业务保障级别和负载类型,根据所述物理机的可调度资源信息与预留资源信息确定满足调度需求的目标物理机;
所述调度装置根据所述资源请求将资源调度至所述目标物理机。
进一步地,所述调度装置按照所述应用对应的业务保障级别和负载类型,根据所述物理机的可调度资源信息与预留资源信息确定满足调度需求的目标物理机,包括:
所述调度装置根据预设的业务保障级别划分规则将所述应用确定为高保障级别应用;
所述调度装置根据所述应用对应的负载类型以及已承载该负载类型的物理机的可调度资源信息与预留资源信息确定满足该应用调度需求的待选物理机组;
所述调度装置从所述待选物理机组中为所述应用选择可调度资源最匹配的目标物理机。
进一步地,所述调度装置根据所述应用对应的负载类型以及已承载该负载类型的物理机信息确定满足该应用调度需求的待选物理机组,包括:
所述调度装置按照物理机承载所述应用对应的负载类型的高保障级别应用数目进行分组,得到至少一个物理机组;
所述调度装置将承载所述应用对应的负载类型的高保障级别应用数目最少的物理机组确定为待选物理机组。
进一步地,在所述调度装置将承载所述应用对应的负载类型的高保障级别应用数目最少的物理机组确定为待选物理机组之后,还包括:
所述调度装置根据物理机的可调度资源信息与预留资源信息从所述待选物理机组中删除不满足所述应用的请求资源的物理机。
进一步地,所述调度装置从所述待选物理机组中为所述应用选择可调度资源最匹配的目标物理机,包括:
所述调度装置根据所述待选物理机组中每一台物理机的可调度资源向量和所述应用的请求资源向量,获得每一台物理机对应的调整余弦相似度;
所述调度装置从所述待选物理机组中选择调整余弦相似度最大的物理机作为目标物理机。
第二方面,本发明实施例提供了一种调度装置,所述装置包括:获取单元、确定单元和调度单元,其中,
所述获取单元,用于获取资源请求以及物理机的可调度资源信息与预留资源信息;其中,所述资源请求包括需要进行资源调度的应用以及所述应用对应的业务保障级别和负载类型;所述物理机的可调度资源信息用于表示所述物理机能够为所述应用提供的资源大小;所述物理机的预留资源信息用于表示所述物理机能够为单个高级别保障应用在后续运行时提供的额外资源大小;
所述确定单元,用于按照所述应用对应的业务保障级别和负载类型,根据所述物理机的可调度资源信息与预留资源信息确定满足调度需求的目标物理机;
所述调度单元,用于根据所述资源请求将资源调度至所述目标物理机。
进一步地,所述确定单元,用于:
根据预设的业务保障级别划分规则将所述应用确定为高保障级别应用;
以及,根据所述应用对应的负载类型以及已承载该负载类型的物理机的可调度资源信息与预留资源信息确定满足该应用调度需求的待选物理机组;
以及,从所述待选物理机组中为所述应用选择可调度资源最匹配的目标物理机。
进一步地,所述确定单元,用于按照物理机承载所述应用对应的负载类型的高保障级别应用数目进行分组,得到至少一个物理机组;
以及,将承载所述应用对应的负载类型的高保障级别应用数目最少的物理机组确定为待选物理机组。
进一步地,所述确定单元,还用于根据物理机的可调度资源信息与预留资源信息从所述待选物理机组中删除不满足所述应用的请求资源的物理机。
进一步地,所述确定单元,用于根据所述待选物理机组中每一台物理机的可调度资源向量和所述应用的请求资源向量,获得每一台物理机对应的调整余弦相似度;
以及,从所述待选物理机组中选择调整余弦相似度最大的物理机作为目标物理机。
第三方面,本发明实施例提供了一种资源调度系统,所述系统包括:至少一台物理机、调度装置和资源请求管理器,其中,所述调度装置,用于:
通过所述资源请求管理器获取资源请求,以及获取所述至少一台物理机的可调度资源信息与预留资源信息;其中,所述资源请求包括需要进行资源调度的应用以及所述应用对应的业务保障级别和负载类型;所述物理机的可调度资源信息用于表示所述物理机能够为所述应用提供的资源大小;所述物理机的预留资源信息用于表示所述物理机能够为单个高级别保障应用在后续运行时提供的额外资源大小;
以及,按照所述应用对应的业务保障级别和负载类型,根据所述物理机的可调度资源信息与预留资源信息确定满足调度需求的目标物理机;
以及,根据所述资源请求将资源调度至所述目标物理机。
本发明实施例提供了一种资源调度的方法、装置和系统,通过获取资源请求和物理机信息,并根据资源请求和物理机信息按照预先设置的业务保障级别确定出满足要求的目标物理机,将资源请求调度至该目标物理机,实现了针对云平台所承载的业务及业务类型实现资源的有效调度,并减少资源调度之后出现虚拟机迁移的现象,从而减少由于虚拟机迁移而导致的暂停运行状态的现象发生。
附图说明
图1为本发明实施例提供的一种资源调度的方法流程示意图;
图2为本发明实施例提供了一种调度装置确定满足调度需求的目标物理机的流程示意图;
图3为本发明实施例提供了一种调度装置的结构示意图;
图4为本发明实施例提供的一种资源调度的系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明实施例的基本思想是:通过获取资源请求和物理机信息,并根据资源请求和物理机信息按照预先设置的业务保障级别确定出满足要求的目标物理机,随后将资源请求调度至该目标物理机,从而实现了针对云平台所承载的业务及业务类型实现资源的有效调度。
参见图1,其示出了本发明实施例提供的一种资源调度的方法流程,该方法可以应用于进行资源调度的调度装置,该方法可以包括:
S101:调度装置获取资源请求以及物理机的可调度资源信息与预留资源信息;
示例性地,资源请求可以由用户或系统在执行应用的过程中提交至调度装置,资源请求可以包括需要进行资源调度的应用以及该应用对应的业务保障级别和负载类型。需要说明的是,考虑到用户执行应用的设备或者执行应用的系统的厂商差异,调度装置所接收到的资源请求消息或报文通常按照各自厂商的规范,所以调度装置在获取到资源请求后,还可以对接收到的资源请求进行预处理,形成标准化的资源请求。
示例性地,物理机的可调度资源信息用于表示该物理机能够为所述应用提供的资源大小;物理机的预留资源信息用于表示该物理机能够为单个高级别保障应用在后续运行时提供的额外资源大小;
可以理解地,物理机的可调度资源信息与预留资源信息可以通过调度装置按照预设的时间周期所采集到的物理机的容量状态信息以及物理机当前部署的高保障业务应用信息进行统计得到。所述物理机的容量状态信息可以包括物理机当前的CPU信息、内存信息以及存储容量信息,所述物理机当前部署的高保障业务应用信息可以包括所述物理机当前部署的高保障业务应用的负载类型等。对物理机信息进行统计,主要可以包括针对物理机当前部署的同一负载类型的高保障业务应用的数目进行统计。
需要说明的是,资源请求以及物理机的可调度资源信息与预留资源信息是调度装置对资源进行调度的依据,通过分析资源请求以及物理机的可调度资源信息与预留资源信息,找出合适的目标物理机并将所述应用调度至目标物理机,既可以保证请求应用部署在合适的物理机上,又保证了物理机资源的有效利用,避免资源的浪费,实现资源的有效调度和配置;而且由于在调度时考虑到了物理界的预留资源信息,因此能够减少资源调度之后出现虚拟机迁移的现象发生。
S102:调度装置按照所述应用对应的业务保障级别和负载类型,根据所述物理机的可调度资源信息与预留资源信息确定满足调度需求的目标物理机;
在本发明实施例中,可以预先根据应用的并发用户数和应用发展的生命周期将应用的业务保障级别划分为高保障级别应用和低保障级别应用,而物理机的预留资源信息则是用于表示该物理机能够为单个高级别保障应用在后续运行时提供的额外资源大小,使得高保障级别的应用所部署的物理机上得到一定量的额外资源分配,能够减少资源调度之后出现虚拟机迁移的现象发生。
另外,负载类型是指应用在运行过程中主要承担负载的资源类型,也就是使用量较多,且对用户并发较敏感的资源类型。常见的负载类型有计算(CPU)密集型,内存(memory)密集型和存储IO密集型。计算密集型应用主要承担负载的资源是CPU,其他两种类同。因此,为了提高资源利用率,调度装置结合物理机为高保障级别应用预留一定的资源以及为所述应用提供的资源大小,需要根据应用的负载类型以及承载这些资源的物理机信息对资源调度选取匹配的物理机。例如,如果某应用是计算密集型的高保障级别应用,那么可以将为该应用提供最大CPU资源且最匹配的物理机确定为满足调度要求的目标物理机。
S103:调度装置根据资源请求将资源调度至所述目标物理机。
示例性地,调度装置根据资源请求将资源调度至所述目标物理机,可以包括:调度装置直接将所述资源调度至所述目标物理机上;或者,生成调度指令并发送至资源管理设备,从而使得资源管理设备通过响应该调度指令将所述资源调度至所述目标物理机上,以完成资源调度。
可以理解的,调度装置在通过步骤S102确定目标物理机的过程中,不仅考虑到了应用对应的业务保障级别和负载类型,还考虑到了物理机的可调度资源信息与预留资源信息,因此,步骤S103中调度装置将资源调度至所述目标物理机不仅能够根据应用的负载类型选择承载资源的目标物理机,从而提升资源利用率;而且由于目标物理机中为高业务保障级别的应用预留额外的资源保障,因此,减少应用资源之后发生虚拟机迁移的现象,能够减少跨物理机动态迁移所带来的开销。
进一步地针对图1所示的实施例中的步骤S102,优选地,本发明实施例提供了一种调度装置确定满足调度需求的目标物理机,也就是实现步骤S102的具体流程,如图2所示,该具体流程可以包括:
S201:调度装置根据预设的业务保障级别划分规则将应用确定为高保障级别应用;
示例性地,调度装置可以根据应用的并发用户数和应用发展的生命周期确定出应用是高保障级别还是低保障级别。例如,调度装置可以根据请求资源调度的应用的并发用户数和应用发展的生命周期,查找应用的并发用户数和应用发展的生命周期与业务保障级别之间的对应关系,确定请求资源调度的应用所对应的业务保障级别。
在确定了请求资源调度的应用为高保障级别应用后,就可以为该高保障级别应用确定匹配的目标物理机了。在本发明实施例中,目标物理机可以按照两阶段资源调度方法得到,具体过程可以包括S202和S203:
S202:调度装置根据应用对应的负载类型以及已承载该负载类型的物理机的可调度资源信息与预留资源信息确定满足该应用调度需求的待选物理机组;
需要说明的是,为了提高资源利用率,在为高保障级别应用提供资源时,还需要分析该应用对应的负载类型。根据应用对应的负载类型,可以理解的,待选物理机组中所包括的物理机应当是能够为应用提供最大的相应类型资源的物理机,例如,若请求资源调度的应用为计算密集型的高保障级别应用,那么待选物理机组中应当是能够包括计算密集型的高保障级别应用提供最大CPU资源的物理机组。
示例性地,调度装置根据所述应用对应的负载类型以及已承载该负载类型的物理机的可调度资源信息与预留资源信息确定满足该应用调度需求的待选物理机组,可以包括:
首先,调度装置按照物理机承载所述应用对应的负载类型的高保障级别应用数目进行分组,得到至少一个物理机组;
具体地,以请求资源调度的应用为计算密集型的高保障级别应用为例,调度装置可以根据物理机承载的计算密集型的高保障级别应用数目进行分组,将物理机分为m组物理机组:L0,L1…Lm-1,其中m-1表示物理机承载计算密集型高保障级别应用的最多数目。当某物理机上承载的计算密集型高保障级别应用数目为0时,调度装置将该物理机分在L0组;当某物理机上承载的计算密集型高保障级别应用数目为1时,将该物理机分在L1组,以此类推,一直到Lm-1组。
然后,调度装置将承载所述应用对应的负载类型的高保障级别应用数目最少的物理机组确定为待选物理机组。
具体地,仍然以前述的请求资源调度的应用为计算密集型的高保障级别应用为例,调度装置将物理机分为m组物理机组之后,首先可以判断L0组是否为空;
当L0组不为空时,表示存在承载计算密集型的高保障级别应用数目为0的物理机;
若L0为空,表示不存在承载计算密集型的高保障级别应用数目为0的物理机,随后调度装置接着判断L1组是否为空,以此类推,直到某一物理机组不为空,将该不为空的物理机组确定为待选物理机组。
需要说明的是,Lm-1组一定不为空,可以理解的,当前m-1组物理机组都为空时,Lm-1组中至少有一台物理机,故前m-1组物理机组都为空时,调度装置直接将Lm-1组确定为待选物理机组。
优选地,由于仅考虑到待选物理机组中物理机承载所述应用对应的高保障级别应用数目,并没有考虑到待选物理机组中物理机已承载所述应用对应的高保障级别应用的资源,因此,在调度装置将承载所述应用对应的负载类型的高保障级别应用数目最少的物理机组确定为待选物理机组之后,还可以包括:
调度装置根据物理机的可调度资源信息与预留资源信息从待选物理机组中删除不满足所述应用的请求资源的物理机;
具体地,调度装置可以将待选物理机组中每台物理机的可调度资源信息与所述应用的请求资源进行比较;本实施例中,物理机的可调度资源信息可以用可调度资源向量表示;所述应用的请求资源用请求资源向量表示;当所述可调度资源向量中的任意一个资源分量小于等于所述应用的请求资源向量中对应的资源分量时,调度装置将该物理机从待选物理机组中删除,
调度装置还可以将待选物理机组中没有预留资源信息的物理机进行删除;最终使得待选物理机组中的所有物理机均满足所述应用对应的负载类型的高保障级别应用资源要求。
在实际应用中,物理机的可调度资源向量按照负载类型可以包括以下资源分量:可调度CPU资源、可调度内存资源和可调度储存资源;相应的,所述应用的请求资源向量可以包括以下资源分量:CPU资源、内存资源和储存资源。当某个物理机的可调度向量中的任意一个资源分量小于等于请求资源向量中对应的资源分量时,如物理机的可调度内存资源小于等于请求应用的内存资源时,调度装置将该物理机从待选物理机组中删除。
S203:调度装置从待选物理机组中为所述应用选择可调度资源最匹配的目标物理机。
需要说明的是,为了实现负载类型的互补,提高资源的利用效率,调度装置需要尽可能地让不同负载类型的应用部署到同一台物理机,并且将负载类型相同的应用尽量部署在不同的物理机上,为了达到这一目的,调度装置需要从待选物理机组中为所述应用选择可调度资源最匹配的目标物理机,具体可以包括:
首先,调度装置根据所述待选物理机组中每一台物理机的可调度资源向量和所述应用的请求资源向量,获得每一台物理机对应的调整余弦相似度;
然后,调度装置从所述待选物理机组中选择调整余弦相似度最大的物理机作为目标物理机。
在本发明实施例中,调度装置通过调整余弦相似度来表征物理机的可调用资源与应用的请求资源的匹配程度,调整余弦相似度越高,表示物理机当前可调用的资源与应用的请求资源越匹配。
以下以实际例子来对步骤S202和S203所描述的两阶段资源调度方法这一技术方案进行详细描述,在详细描述之前,需要对过程中用到的参数进行定义:
定义Req=(V,scale,cycle,intersiveType)为一个应用的资源请求;其中,V=(Vcpu,Vmem,Vdisk)为该应用请求的资源向量,Vcpu、Vmem、Vdisk分别定义为该应用需要请求的CPU资源、内存资源、存储资源;scale为该应用的并发用户规模,0为小规模,1为大规模;cycle为该应用的生命周期,0为发展期,1为成熟期,2为衰退期;scale和cycle是确定该应用为高保障级别应用或低保障级别应用的依据;intersiveType为该应用的负载类型,0为CPU密集型,1为内存密集型,2为存储密集型。
定义PM=(HC,T,H,P)为一台物理机的资源向量;其中,HC=(HCcpu,HCmem,HCdisk)为该物理机当前承载的高保障级别的应用数目向量,HCcpu、HCmem、HCdisk分别代表该物理机当前承载的计算密集型、内存密集型、存储密集型高保障应用的数目;T=(Tcpu,Tmem,Tdisk)为该物理机的最大资源向量,Tcpu、Tmem、Tdisk分别表示该物理机所能够提供的最大CPU资源、最大内存资源和最大存储资源;H=(Hcpu,Hmem,Hdisk)为该物理机的已承载的资源向量,Hcpu、Hmem、Hdisk分别表示该物理机当前已承载的CPU资源,已承载的内存资源和已承载存储资源;P为该物理机必须为高保障级别应用预留的资源容量比例,P取值在0~1之间,1-P即为该物理机可用于调度的资源容量比例。
需要说明的是,物理机信息向量PM可以通过调度装置对物理机信息进行采集并统计后生成的。定义A为一台物理机当前可用资源向量,可以理解的,A=T-H。
定义HA=(HAcpu,HAmem,HAdisk)为一台物理机当前可用于调度的资源向量,其中,HAcpu、HAmem、HAdisk分别表示一台物理机当前可用于调度的CPU资源、内存资源和储存资源。需要说明的是,一台物理机当前可用于调度的资源向量HA可以由该物理机当前可用资源向量A与该物理机当前承载的高保障级别的应用数目向量HC以及该物理机必须为高保障级别应用预留的资源容量比例P通过HA=A(1-p)HC进行计算之后得到。举个例子,物理机当前可用于调度的CPU资源HAcpu=Acpu(1-p)HCcpu,比如,当物理机上当前部署有2个计算密集型的高保障级别应用时,物理机当前可用于调度的CPU资源HAcpu=Acpu(1-p)2;HAmem及HAdisk以此类推,在此不再赘述。
完成了对参数定义之后,接下来就可以按照定义的参数对步骤S202和S203所描述的两阶段资源调度方法这一技术方案进行详细描述:
首先,调度装置根据应用的资源请求Req=(V,scale,cycle,intersiveType)中的scale和cycle确定该应用为高保障级别应用或高保障级别应用,例如,当scale为1且cycle为0时,调度装置将该应用确定为高保障级别应用;
接着,调度装置根据intersiveType确定该应用的负载类型,例如,当intersiveType为0时,确定该应用为计算密集型应用;
随后,调度装置根据该应用请求的资源向量V=(Vcpu,Vmem,Vdisk),获得该应用需要请求的CPU资源Vcpu、内存资源Vmem和存储容量大小Vdisk
然后,调度装置接收由物理机管理器发送的n个物理机的资源向量:PM1,PM2……PMn;并根据各物理机的资源向量中与该应用对应的负载类型的高保障级别应用数目进行分组;例如,以PM1为例,PM1中当前承载的高保障级别的应用数目向量为HC,并根据HC获取物理机当前承载的计算密集型高保障级别应用数目HCcpu,当HCcpu为0时,将该物理机归入物理机组L0,当HCcpu为1时,将该物理机归入物理机组L1……以此类推,最后将全部n个物理机归入m个物理机组:L0,L1,……Lm-1
接着,调度装置将承载所述应用对应的负载类型的高保障级别应用数目最少的物理机组确定为待选物理机组,;具体地确定过程前述实施例已经有描述,在此不再赘述。
优选地,调度装置将承载所述应用对应的负载类型的高保障级别应用数目最少的物理机组确定为待选物理机组之后,还可以将待选物理机组中每台物理机的可调度资源向量HA与该应用请求的资源向量V进行比较,当某台物理机的HA中的任意一个分量小于等于V中对应的分量时,将该物理机从待选物理机组中删除,最终使得待选物理机组中的所有物理机均满足所述应用对应的负载类型的高保障级别应用资源要求。
最后,调度装置从待选物理机组中为所述应用选择可调度资源最匹配的目标物理机;具体过程为:定义VT=(VTcpu,VTmem,VTdisk)为所述应用资源申请的类型向量,其中,VTcpu、VTmem和VTdisk的默认值为0,当VTcpu为1时表示该应用为计算密集型,VTmem和VTdisk类推;
设定该应用作为虚拟机i,调度装置根据下式计算虚拟机i同物理机j之间的CPU资源均值可以理解的,虚拟机i同物理机j之间的内存资源均值和虚拟机i同物理机j之间的存储资源均值与此类同,在此不再赘述:
VH cpuavg ij = 1 2 ( HA cpu i + VT cpu j )
调度装置在获得了虚拟机i同物理机j之间的资源均值向量之后,根据下式获取物理机j对应的调整余弦相似度sim(i,j):
sim ( i , j ) = | ( V i - VH ij ) · ( H j - VH ij ) | | | V i - VH ij | | · | | H j - VH ij | |
可以理解的,当Vi向量等于Hj向量时,sim(i,j)=1。
调度装置在得到待选物理机组中所有物理机对应的调整余弦相似度之后,将调整余弦相似度最大值所对应的物理机选定为目标物理机。
需要说明的是,步骤S202至S203是为高保障级别应用确定匹配的目标物理机的具体过程,可以理解的,当S201确定请求资源调度的应用为低保障级别应用时,调度装置可以无需通过S202来确定待选物理机组,而是直接计算所有的物理机的调整余弦相似度,并进行目标物理机的选定,本发明实施例在此不再赘述。
本实施例通过调度装置依据高保障或低保障级别应用,以及应用的负载类型确定满足调度需求的目标物理机,从而根据应用的负载类型选择承载资源的目标物理机,从而提升资源利用率。
结合前述实施例相同的技术构思,参见图3,其示出了本发明实施例提供的一种调度装置30的结构,该装置30可以包括:获取单元301、确定单元302和调度单元303,其中,
所述获取单元301,用于获取资源请求以及物理机的可调度资源信息与预留资源信息;其中,所述资源请求包括需要进行资源调度的应用以及所述应用对应的业务保障级别和负载类型;所述物理机的可调度资源信息用于表示所述物理机能够为所述应用提供的资源大小;所述物理机的预留资源信息用于表示所述物理机能够为单个高级别保障应用在后续运行时提供的额外资源大小;
所述确定单元302,用于按照所述应用对应的业务保障级别和负载类型,根据所述物理机的可调度资源信息与预留资源信息确定满足调度需求的目标物理机;
所述调度单元303,用于根据所述资源请求将资源调度至所述目标物理机。
示例性地,所述确定单元302,用于:
根据预设的业务保障级别划分规则将所述应用确定为高保障级别应用;
以及,根据所述应用对应的负载类型以及已承载该负载类型的物理机的可调度资源信息与预留资源信息确定满足该应用调度需求的待选物理机组;
以及,从所述待选物理机组中为所述应用选择可调度资源最匹配的目标物理机。
进一步地,所述确定单元302,用于按照物理机承载所述应用对应的负载类型的高保障级别应用数目进行分组,得到至少一个物理机组;
以及,将承载所述应用对应的负载类型的高保障级别应用数目最少的物理机组确定为待选物理机组。
进一步地,所述确定单元302,还用于根据物理机的可调度资源信息与预留资源信息从所述待选物理机组中删除不满足所述应用的请求资源的物理机。
优选地,所述确定单元302,用于根据所述待选物理机组中每一台物理机的可调度资源向量和所述应用的请求资源向量,获得每一台物理机对应的调整余弦相似度;
以及,从所述待选物理机组中选择调整余弦相似度最大的物理机作为目标物理机。
本发明实施例提供的调度装置,通过在资源调度中为高业务保障级别的应用预留额外的资源保障,来减少应用资源跨物理机动态迁移所带来的开销,同时降低风险;而且根据应用的负载类型选择承载资源的目标物理机,从而提升资源利用率。
结合前述实施例相同的技术构思,参见图4,其示出了本发明实施例提供的一种资源调度系统40的结构,该系统40包括:至少一台物理机50、调度装置30和资源请求管理器60,其中,所述调度装置30,用于:
通过所述资源请求管理器60获取资源请求,以及获取所述至少一台物理机50的可调度资源信息与预留资源信息;其中,所述资源请求包括需要进行资源调度的应用以及所述应用对应的业务保障级别和负载类型;所述物理机的可调度资源信息用于表示所述物理机能够为所述应用提供的资源大小;所述物理机的预留资源信息用于表示所述物理机能够为单个高级别保障应用在后续运行时提供的额外资源大小;
以及,按照所述应用对应的业务保障级别和负载类型,根据所述物理机的可调度资源信息与预留资源信息确定满足调度需求的目标物理机;
以及,根据所述资源请求将资源调度至所述目标物理机。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (11)

1.一种资源调度的方法,其特征在于,所述方法包括:
调度装置获取资源请求以及物理机的可调度资源信息与预留资源信息;其中,所述资源请求包括需要进行资源调度的应用以及所述应用对应的业务保障级别和负载类型;所述物理机的可调度资源信息用于表示所述物理机能够为所述应用提供的资源大小;所述物理机的预留资源信息用于表示所述物理机能够为单个高级别保障应用在后续运行时提供的额外资源大小;
所述调度装置按照所述应用对应的业务保障级别和负载类型,根据所述物理机的可调度资源信息与预留资源信息确定满足调度需求的目标物理机;
所述调度装置根据所述资源请求将资源调度至所述目标物理机。
2.根据权利要求1所述的方法,其特征在于,所述调度装置按照所述应用对应的业务保障级别和负载类型,根据所述物理机的可调度资源信息与预留资源信息确定满足调度需求的目标物理机,包括:
所述调度装置根据预设的业务保障级别划分规则将所述应用确定为高保障级别应用;
所述调度装置根据所述应用对应的负载类型以及已承载该负载类型的物理机的可调度资源信息与预留资源信息确定满足该应用调度需求的待选物理机组;
所述调度装置从所述待选物理机组中为所述应用选择可调度资源最匹配的目标物理机。
3.根据权利要求2所述的方法,其特征在于,所述调度装置根据所述应用对应的负载类型以及已承载该负载类型的物理机信息确定满足该应用调度需求的待选物理机组,包括:
所述调度装置按照物理机承载所述应用对应的负载类型的高保障级别应用数目进行分组,得到至少一个物理机组;
所述调度装置将承载所述应用对应的负载类型的高保障级别应用数目最少的物理机组确定为待选物理机组。
4.根据权利要求3所述的方法,其特征在于,在所述调度装置将承载所述应用对应的负载类型的高保障级别应用数目最少的物理机组确定为待选物理机组之后,还包括:
所述调度装置根据物理机的可调度资源信息与预留资源信息从所述待选物理机组中删除不满足所述应用的请求资源的物理机。
5.根据权利要求2所述的方法,其特征在于,所述调度装置从所述待选物理机组中为所述应用选择可调度资源最匹配的目标物理机,包括:
所述调度装置根据所述待选物理机组中每一台物理机的可调度资源向量和所述应用的请求资源向量,获得每一台物理机对应的调整余弦相似度;
所述调度装置从所述待选物理机组中选择调整余弦相似度最大的物理机作为目标物理机。
6.一种调度装置,其特征在于,所述装置包括:获取单元、确定单元和调度单元,其中,
所述获取单元,用于获取资源请求以及物理机的可调度资源信息与预留资源信息;其中,所述资源请求包括需要进行资源调度的应用以及所述应用对应的业务保障级别和负载类型;所述物理机的可调度资源信息用于表示所述物理机能够为所述应用提供的资源大小;所述物理机的预留资源信息用于表示所述物理机能够为单个高级别保障应用在后续运行时提供的额外资源大小;
所述确定单元,用于按照所述应用对应的业务保障级别和负载类型,根据所述物理机的可调度资源信息与预留资源信息确定满足调度需求的目标物理机;
所述调度单元,用于根据所述资源请求将资源调度至所述目标物理机。
7.根据权利要求6所述的调度装置,其特征在于,所述确定单元,用于:
根据预设的业务保障级别划分规则将所述应用确定为高保障级别应用;
以及,根据所述应用对应的负载类型以及已承载该负载类型的物理机的可调度资源信息与预留资源信息确定满足该应用调度需求的待选物理机组;
以及,从所述待选物理机组中为所述应用选择可调度资源最匹配的目标物理机。
8.根据权利要求7所述的调度装置,其特征在于,所述确定单元,用于按照物理机承载所述应用对应的负载类型的高保障级别应用数目进行分组,得到至少一个物理机组;
以及,将承载所述应用对应的负载类型的高保障级别应用数目最少的物理机组确定为待选物理机组。
9.根据权利要求8所述的调度装置,其特征在于,所述确定单元,还用于根据物理机的可调度资源信息与预留资源信息从所述待选物理机组中删除不满足所述应用的请求资源的物理机。
10.根据权利要求7所述的调度装置,其特征在于,所述确定单元,用于根据所述待选物理机组中每一台物理机的可调度资源向量和所述应用的请求资源向量,获得每一台物理机对应的调整余弦相似度;
以及,从所述待选物理机组中选择调整余弦相似度最大的物理机作为目标物理机。
11.一种资源调度系统,其特征在于,所述系统包括:至少一台物理机、调度装置和资源请求管理器,其中,所述调度装置,用于:
通过所述资源请求管理器获取资源请求,以及获取所述至少一台物理机的可调度资源信息与预留资源信息;其中,所述资源请求包括需要进行资源调度的应用以及所述应用对应的业务保障级别和负载类型;所述物理机的可调度资源信息用于表示所述物理机能够为所述应用提供的资源大小;所述物理机的预留资源信息用于表示所述物理机能够为单个高级别保障应用在后续运行时提供的额外资源大小;
以及,按照所述应用对应的业务保障级别和负载类型,根据所述物理机的可调度资源信息与预留资源信息确定满足调度需求的目标物理机;
以及,根据所述资源请求将资源调度至所述目标物理机。
CN201410838302.6A 2014-12-29 2014-12-29 一种资源调度的方法、装置和系统 Active CN105808341B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410838302.6A CN105808341B (zh) 2014-12-29 2014-12-29 一种资源调度的方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410838302.6A CN105808341B (zh) 2014-12-29 2014-12-29 一种资源调度的方法、装置和系统

Publications (2)

Publication Number Publication Date
CN105808341A true CN105808341A (zh) 2016-07-27
CN105808341B CN105808341B (zh) 2019-05-28

Family

ID=56979895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410838302.6A Active CN105808341B (zh) 2014-12-29 2014-12-29 一种资源调度的方法、装置和系统

Country Status (1)

Country Link
CN (1) CN105808341B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107391260A (zh) * 2017-07-27 2017-11-24 郑州云海信息技术有限公司 一种交付裸机资源的方法和装置
CN107766343A (zh) * 2016-08-15 2018-03-06 华为软件技术有限公司 一种数据存储方法、装置及存储服务器
CN108833592A (zh) * 2018-07-13 2018-11-16 无锡华云数据技术服务有限公司 云主机调度器优化方法、装置、设备及存储介质
CN109426505A (zh) * 2017-08-16 2019-03-05 中国移动通信有限公司研究院 一种软件的安装方法、装置、电子设备及存储介质
CN109684074A (zh) * 2018-11-12 2019-04-26 平安科技(深圳)有限公司 物理机资源分配方法及终端设备
CN110032447A (zh) * 2019-04-11 2019-07-19 北京百度网讯科技有限公司 用于分配资源的方法和装置
CN111176792A (zh) * 2019-12-31 2020-05-19 华为技术有限公司 一种资源调度方法、装置及相关设备
CN112506650A (zh) * 2020-11-27 2021-03-16 中国建设银行股份有限公司 资源分配方法、系统、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090183168A1 (en) * 2008-01-16 2009-07-16 Satoshi Uchida Resource allocation system, resource allocation method and program
CN102571986A (zh) * 2012-02-27 2012-07-11 浙江大学 一种基于向量映射的负载均衡方法
CN102958166A (zh) * 2011-08-29 2013-03-06 华为技术有限公司 一种资源分配方法及资源管理平台
CN103077079A (zh) * 2012-12-28 2013-05-01 华为技术有限公司 虚拟机迁移控制方法和装置
CN103617076A (zh) * 2013-10-31 2014-03-05 中兴通讯股份有限公司 一种虚拟化资源的调度方法和系统及服务端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090183168A1 (en) * 2008-01-16 2009-07-16 Satoshi Uchida Resource allocation system, resource allocation method and program
CN102958166A (zh) * 2011-08-29 2013-03-06 华为技术有限公司 一种资源分配方法及资源管理平台
CN102571986A (zh) * 2012-02-27 2012-07-11 浙江大学 一种基于向量映射的负载均衡方法
CN103077079A (zh) * 2012-12-28 2013-05-01 华为技术有限公司 虚拟机迁移控制方法和装置
CN103617076A (zh) * 2013-10-31 2014-03-05 中兴通讯股份有限公司 一种虚拟化资源的调度方法和系统及服务端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SHUICHI OIKAWA ET AL.: "Portable RK: A Portable Resource Kernel", 《 PROCEEDINGS OF THE FIFTH IEEE》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766343A (zh) * 2016-08-15 2018-03-06 华为软件技术有限公司 一种数据存储方法、装置及存储服务器
CN107766343B (zh) * 2016-08-15 2022-02-25 华为技术有限公司 一种数据存储方法、装置及存储服务器
CN107391260A (zh) * 2017-07-27 2017-11-24 郑州云海信息技术有限公司 一种交付裸机资源的方法和装置
CN109426505A (zh) * 2017-08-16 2019-03-05 中国移动通信有限公司研究院 一种软件的安装方法、装置、电子设备及存储介质
CN109426505B (zh) * 2017-08-16 2022-03-29 中国移动通信有限公司研究院 一种软件的安装方法、装置、电子设备及存储介质
CN108833592A (zh) * 2018-07-13 2018-11-16 无锡华云数据技术服务有限公司 云主机调度器优化方法、装置、设备及存储介质
CN109684074A (zh) * 2018-11-12 2019-04-26 平安科技(深圳)有限公司 物理机资源分配方法及终端设备
US11146502B2 (en) 2019-04-11 2021-10-12 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for allocating resource
KR20200120476A (ko) * 2019-04-11 2020-10-21 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 자원 분배를 위한 방법 및 장치
KR102324987B1 (ko) * 2019-04-11 2021-11-10 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 자원 분배를 위한 방법 및 장치
CN110032447A (zh) * 2019-04-11 2019-07-19 北京百度网讯科技有限公司 用于分配资源的方法和装置
CN111176792A (zh) * 2019-12-31 2020-05-19 华为技术有限公司 一种资源调度方法、装置及相关设备
CN111176792B (zh) * 2019-12-31 2023-11-17 华为技术有限公司 一种资源调度方法、装置及相关设备
CN112506650A (zh) * 2020-11-27 2021-03-16 中国建设银行股份有限公司 资源分配方法、系统、计算机设备和存储介质

Also Published As

Publication number Publication date
CN105808341B (zh) 2019-05-28

Similar Documents

Publication Publication Date Title
CN105808341A (zh) 一种资源调度的方法、装置和系统
US10474504B2 (en) Distributed node intra-group task scheduling method and system
Liu et al. A reinforcement learning-based resource allocation scheme for cloud robotics
US10572285B2 (en) Method and apparatus for elastically scaling virtual machine cluster
EP2894827B1 (en) Method, apparatus, and system for managing migration of virtual machine
CN108023742A (zh) 一种应用的扩容方法、装置和系统
CN103309946B (zh) 多媒体文件处理方法、装置及系统
CN106534318B (zh) 一种基于流量亲和性的OpenStack云平台资源动态调度系统和方法
CN105700948A (zh) 一种用于在集群中调度计算任务的方法与设备
CN104657220A (zh) 混合云中基于截止时间和费用约束的调度模型及方法
CN104113576A (zh) 一种客户端的更新方法及装置
CN104050042A (zh) Etl作业的资源分配方法及装置
WO2018086467A1 (zh) 一种云环境下应用集群资源分配的方法、装置和系统
Belgaum et al. Cloud service ranking using checkpoint-based load balancing in real-time scheduling of cloud computing
JP2019518258A (ja) 時間ベース調節可能負荷バランシング
CN104407912A (zh) 一种虚拟机配置方法及装置
CN103873534A (zh) 一种应用集群迁移方法及装置
Mansour et al. Design of cultural emperor penguin optimizer for energy-efficient resource scheduling in green cloud computing environment
CN106021512A (zh) 一种页面刷新方法及装置
CN109960579B (zh) 一种调整业务容器的方法及装置
CN105933154A (zh) 一种云计算资源的管理方法
N. Toosi et al. GreenFog: A framework for sustainable fog computing
Patil et al. Memory and Resource Management for Mobile Platform in High Performance Computation Using Deep Learning
CN105592160B (zh) 一种云计算环境下面向服务消费者的资源配置方法
Deiab et al. Energy efficiency in cloud computing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant