CN106528266A - 一种云计算系统中的资源动态调整方法及装置 - Google Patents

一种云计算系统中的资源动态调整方法及装置 Download PDF

Info

Publication number
CN106528266A
CN106528266A CN201610961170.5A CN201610961170A CN106528266A CN 106528266 A CN106528266 A CN 106528266A CN 201610961170 A CN201610961170 A CN 201610961170A CN 106528266 A CN106528266 A CN 106528266A
Authority
CN
China
Prior art keywords
virtual machine
resource
response time
service response
subsequent time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610961170.5A
Other languages
English (en)
Other versions
CN106528266B (zh
Inventor
陈明雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bo Domain Information Technology (shanghai) Co Ltd
Original Assignee
Bo Domain Information Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bo Domain Information Technology (shanghai) Co Ltd filed Critical Bo Domain Information Technology (shanghai) Co Ltd
Priority to CN201610961170.5A priority Critical patent/CN106528266B/zh
Publication of CN106528266A publication Critical patent/CN106528266A/zh
Application granted granted Critical
Publication of CN106528266B publication Critical patent/CN106528266B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5019Workload prediction

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种云计算系统中的资源动态调整方法及装置。所述方法包括:根据虚拟机对应用请求的服务响应时间的历史数据按照预设方法确定下一时刻应用服务响应时间的预测值;根据所述下一时刻应用服务响应时间的预测值确定所述虚拟机的负载状态;当所述负载状态为低载状态时,计算并回收所述虚拟机的空闲资源;当所述负载状态为过载状态时,计算并增加所述虚拟机的瓶颈资源。通过本发明的技术方案,能够提高资源动态调整的准确性,缓解资源浪费或资源不足的现象,从而提高资源的利用率。

Description

一种云计算系统中的资源动态调整方法及装置
技术领域
本发明实施例涉及计算机处理技术,尤其涉及一种云计算系统中的资源动态调整方法及装置。
背景技术
随着云计算的不断发展,数据中心的规模也越来越大,但是运行大规模的数据中心会消耗大量的能量,研究表明目前的数据中心的利用率一般保持在5%到20%。
如何降低数据中心的能耗,提高资源的利用率成为了一个亟待解决的问题。要想降低能耗提高资源利用率,根据应用负载的需求分配适当的资源是一个可行的方法。但是由于云计算环境的复杂性和多变性,不可能在一开始的时候,就计算好所需要的资源量。因此在云计算中,经常会出现资源浪费的情况。目前,云计算使用以虚拟机为单位的粗粒度方式,根据应用负载动态地对资源进行增删。现有技术中主要采用如下两个方法来考虑虚拟机的负载的:1)根据虚拟机消耗的某一种或两种资源(如中央处理器或内存)来判定其负载情况;2)通过历史负载及资源记录或日志来预测当前虚拟机的负载及应分配的资源。而对资源的分配方式则是根据虚拟机的负载判定结果申请固定的资源配置。
对于云计算环境中的虚拟机而言,当虚拟机过载时,由于系统中某些资源成为瓶颈,因此会降低系统性能,降低应用的执行效率。当虚拟机空载或者低载时,系统的资源利用率低下,此时虽然系统性能良好,但是会浪费大量资源。由于传统的负载判定及资源分配方法无法准确地进行资源动态调整,使得各虚拟机的负载不均匀,从而造成虚拟机过载或者低载的现象,资源利用率低下。
发明内容
本发明实施例提供一种云计算系统中的资源动态调整方法及装置,以实现提高资源动态调整的准确性,缓解资源浪费或资源不足的现象,从而提高资源的利用率。
第一方面,本发明实施例提供了一种云计算系统中的资源动态调整方法,包括:
根据虚拟机对应用请求的服务响应时间的历史数据按照预设方法确定下一时刻应用服务响应时间的预测值;
根据所述下一时刻应用服务响应时间的预测值确定所述虚拟机的负载状态;
当所述负载状态为低载状态时,计算并回收所述虚拟机的空闲资源;
当所述负载状态为过载状态时,计算并增加所述虚拟机的瓶颈资源。
第二方面,本发明实施例还提供了一种云计算系统中的资源动态调整装置,该装置包括:
响应时间预测模块,用于根据虚拟机对应用请求的服务响应时间的历史数据按照预设方法确定下一时刻应用服务响应时间的预测值;
负载状态确定模块,用于根据所述下一时刻应用服务响应时间的预测值确定所述虚拟机的负载状态;
空闲资源回收模块,用于当所述负载状态为低载状态时,计算并回收所述虚拟机的空闲资源;
瓶颈资源增加模块,用于当所述负载状态为过载状态时,计算并增加所述虚拟机的瓶颈资源。
本发明实施例通过下一时刻的应用服务响应时间对负载状态进行分析预测,计算影响系统性能的空闲资源或瓶颈资源,并进行资源的适当伸缩,即低载状态时回收空闲资源,过载状态时增加瓶颈资源,从而解决了因负载判定及资源分配方式不准确而导致的资源利用率低下的问题,达到了提高资源动态调整准确性,缓解资源浪费或资源不足现象,进而提高云计算系统中的资源利用效率的效果。
附图说明
图1是本发明实施例一提供的一种云计算系统中的资源动态调整方法的流程示意图;
图2是本发明实施例二提供的一种云计算系统中的资源动态调整方法的流程示意图;
图3是本发明实施例三提供的一种云计算系统中的资源动态调整方法的流程示意图;
图4是本发明实施例四提供的一种云计算系统中的资源动态调整方法的流程示意图;
图5是本发明实施例五提供的一种云计算系统中的资源动态调整装置的结构示意图;
图6是本发明实施例一提供的负载较小时的应用服务响应时间对比图;
图7是本发明实施例一提供的负载逐渐增大时的应用服务响应时间对比图;
图8(a)是本发明实施例四提供的CPU资源利用率预测结果图;
图8(b)是本发明实施例四提供的磁盘读取速度预测结果图;
图8(c)是本发明实施例四提供的磁盘写入速度预测结果图;
图8(d)是本发明实施例四提供的内存使用值预测结果图;
图8(e)是本发明实施例四提供的网络接收速度预测结果图;
图8(f)是本发明实施例四提供的网络发送速度预测结果图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种云计算系统中的资源动态调整方法的流程示意图,该方法可适用于云计算资源调整的情况,该方法可以由资源调整装置来执行,该装置可由硬件和/或软件组成,并一般可集成在云计算系统以及所有包含资源动态调整功能的计算机系统中。具体包括如下步骤:
S110、根据虚拟机对应用请求的服务响应时间的历史数据按照预设方法确定下一时刻应用服务响应时间的预测值。
其中,虚拟机对应用请求的服务响应时间,即应用服务响应时间,指的是虚拟机从收到应用请求到响应应用请求所需要的时间。预设方法可以是基于历史数据的LPC法(Linear prediction coefficients,线性预测分析法)。
LPC法的基本原理是:通过已经获得的离散数据,进行数学回归,得到能够反映这些离散数据的函数,然后应用这些函数来预测在不同时刻函数的取值。例如针对的是应用服务响应时间进行预测,那么就可以根据应用服务响应时间的历史数据得到该应用服务响应时间在不同时刻的预测值。
S120、根据所述下一时刻应用服务响应时间的预测值确定所述虚拟机的负载状态。
虚拟机的资源主要有CPU(Central Processing Unit,中央处理器)、内存、网络(网络的发送和接受)和磁盘的读写资源。在虚拟机负载很大时,这些资源的使用率很高。相反的,当虚拟机负载很小时,这些资源的利用率相对较小。因此,这些资源的利用率在一定程度上可以表征虚拟机负载的大小。此外,也可以根据系统的应用服务响应时间来判断负载的大小,因此可以通过下一时刻系统的应用服务响应时间的预测值来判断负载的大小,进而判断虚拟机的负载状态。这样做的好处在于,可以更直观更方便更准确地判断下一时刻虚拟机的负载状态。
S130、当所述负载状态为低载状态时,计算并回收所述虚拟机的空闲资源。
其中,低载状态表示虚拟机负载较小、资源利用不充分的状态,此时回收虚拟机的空闲资源的好处在于可以节约空闲资源,降低云计算系统的能耗,回收后云计算系统可以重新对空闲的资源进行分配,从而提高资源的利用率。
示例性的,实验环境优选为基于CloudStack5.0云计算平台搭建的一个小型云计算系统,其中有1个管理服务器Management,2个主机节点Host,和1个存储节点Storage。主机节点Host的操作系统为Redhat server5.3,处理器Inter I53470@3.60GHz,内存8GBDDR3,硬盘容量1TB。主机节点Host上的虚拟机,操作系统为Ubuntu12.04版本,处理器为1GHz*2,内存为2GB,网络带宽为150Mbps,磁盘转速为7200/分钟。具体参数如下:
表1实验环境硬件参数
优选实验中示例性地使用httping工具来对系统进行请求,以方便得到系统服务响应时间,图6表示的是负载较小时,使用本发明实施例的方法和使用传统方法的应用服务响应时间对比图。从图6中可以看出,使用本发明实施例方法的应用服务响应时间比使用传统方法的应用服务响应时间略大,但是两种的值大致差不多,都在可接受的范围内。但是使用本发明实施例的方法可以在低载状态下回收一些资源,减少资源和能耗的浪费。
S140、当所述负载状态为过载状态时,计算并增加所述虚拟机的瓶颈资源。
其中,过载状态表示虚拟机负载较大、某一种或者多种资源不足的状态,此时可以通过调节,将云计算系统中的空闲资源动态调整给过载状态的虚拟机,增加过载状态虚拟机的瓶颈资源,这样做的好处在于可以缓解虚拟机的过载状态,从而提高资源的利用率。
示例性的,实验环境优选为基于CloudStack5.0云计算平台搭建的一个小型云计算系统,图7表示的是随着负载逐渐加大直到过载时,使用本发明实施例的方法和使用传统方法的应用服务响应时间对比图。从图7中可以看出,刚开始由于系统的负载较低,两种方法对应的响应时间基本相同。但是随着请求数量的不断增加,即系统负载的不断增加,使用传统方法的应用服务响应时间急剧增加,这会严重降低用户服务质量。使用本发明实施例的方法对应的应用服务响应时间则大致保持平稳。而且,从图7中可以看出,使用本发明实施例的方法所对应的虚拟机的应用服务响应时间,明显低于使用传统方法所对应的虚拟机的应用服务响应时间,这保证了用户的服务质量。
本实施例的技术方案,通过下一时刻的应用服务响应时间对负载状态进行分析预测,计算影响系统性能的空闲资源或瓶颈资源,并进行资源的适当伸缩。利用了动态调整影响系统性能的关键资源的优点,从而解决了现有技术中因负载判定及资源分配方式不准确而导致的资源利用率低下的问题,达到了提高资源动态调整准确性,缓解资源浪费或资源不足现象,进而提高云计算系统中的资源利用效率的效果。
实施例二
图2为本发明实施例二提供的一种云计算系统中的资源动态调整方法的流程示意图。本实施例以上述实施例为基础进行优化,提供了优选的资源动态调整的方法,具体是,根据虚拟机对应用请求的服务响应时间的历史数据按照预设方法确定下一时刻应用服务响应时间的预测值优选地可以进一步优化为:将虚拟机对应用请求的服务响应时间的历史数据进行回归分析,得到关于应用服务响应时间的预测函数;根据所述预测函数确定下一时刻应用服务响应时间的预测值。
S210、将虚拟机对应用请求的服务响应时间的历史数据进行回归分析,得到关于应用服务响应时间的预测函数。
其中,预测函数表示应用服务响应时间的预测值随时间变化的直线或曲线,根据预测函数可计算出任意时刻下应用服务响应时间的预测值。
回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,其基本原理是:通过规定因变量和自变量来确定变量之间的因果关系,建立回归模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测数据;如果能够很好的拟合,则可以根据自变量作进一步预测。
S220、根据所述预测函数确定下一时刻应用服务响应时间的预测值。
当得到关于应用服务响应时间的预测函数后,可以根据时间与应用服务相应时间值之间的函数关系,计算出下一时刻所对应的应用服务相应时间值,作为下一时刻应用服务响应时间的预测值。
S230、根据所述下一时刻应用服务响应时间的预测值确定所述虚拟机的负载状态。
S240、当所述负载状态为低载状态时,计算并回收所述虚拟机的空闲资源。
S250、当所述负载状态为过载状态时,计算并增加所述虚拟机的瓶颈资源。
本实施例的技术方案,通过计算应用服务响应时间的预测函数,从而确定下一时刻的应用服务响应时间的预测值,根据预测值对负载状态进行分析预测,使得对负载状态的判断更加准确,为资源的动态调整提供了可靠的依据,从而达到了缓解资源浪费或资源不足的效果,提高了云计算系统中的资源使用效率。
实施例三
图3为本发明实施例三提供的一种云计算系统中的资源动态调整方法的流程示意图。本实施例以上述各实施例为基础进行优化,提供了优选的资源动态调整方法,具体是,根据所述下一时刻应用服务响应时间的预测值确定所述虚拟机的负载状态优选地可以进一步优化为:当所述下一时刻应用服务响应时间的预测值小于正常状态下应用服务响应时间的预设最小阈值时,确定所述负载状态为低载状态;当所述下一时刻应用服务响应时间的预测值大于等于正常状态下应用服务响应时间的预设最小阈值且小于等于正常状态下应用服务响应时间的预设最大阈值时,确定所述负载状态为正常状态;当所述下一时刻应用服务响应时间的预测值大于所述正常状态下应用服务响应时间的预设最大阈值时,确定所述负载状态为过载状态。
S310、根据虚拟机对应用请求的服务响应时间的历史数据按照预设方法确定下一时刻应用服务响应时间的预测值。
S320、判断所述虚拟机的负载状态是否为正常状态,若是,则执行S360;若否,则执行S330。
当所述下一时刻应用服务响应时间的预测值大于等于正常状态下应用服务响应时间的预设最小阈值且小于等于正常状态下应用服务响应时间的预设最大阈值时,确定所述负载状态为正常状态。
也就是说,若虚拟机下一时刻应用服务响应时间的预测值满足上述条件,则虚拟机的负载状态为正常状态,执行S360;若虚拟机下一时刻应用服务响应时间的预测值不满足条件,则虚拟机的负载状态为低载状态或过载状态,执行S330;
具体的,正常状态下应用服务响应时间的预设最小阈值可以设置为,在能够保证用户服务质量的前提下,且虚拟机的空闲资源量高于一定阈值时所对应的应用服务响应时间的最小值;正常状态下应用服务响应时间的预设最大阈值可以设置为,在能够保证用户服务质量的前提下,虚拟机对应用请求的服务响应时间的最大值。在此不作限定。
例如,根据应用服务响应时间,虚拟机的负载状态C可以用公式表示为:
其中,各变量的含义如下:
Rpt:应用服务响应时间;
TlownormalMin:正常状态时,应用服务响应时间的最小值;
TnormalMax:正常状态时,应用服务响应时间的最大值。
当C=2时候,此时虚拟机的负载状态属于正常状态。此时虚拟机中的负载在虚拟机所拥有的资源的承受范围内,这时虚拟机中的资源可以得到充分利用,而且此时应用的服务响应时间在可接受范围内,用户服务质量也在可接受范围中。因此,为了兼顾应用服务响应时间和用户服务质量,推荐的是虚拟机的负载状态处于状态2,即正常状态。
S330、判断所述虚拟机的负载状态是否为低载状态,若是,则执行S340;若否,则执行S350。
当所述下一时刻应用服务响应时间的预测值小于正常状态下应用服务响应时间的预设最小阈值时,确定所述负载状态为低载状态。
当所述下一时刻应用服务响应时间的预测值大于所述正常状态下应用服务响应时间的预设最大阈值时,确定所述负载状态为过载状态。
也就是说,若虚拟机下一时刻应用服务响应时间的预测值小于正常状态下应用服务响应时间的预设最小阈值,则虚拟机的负载状态为低载状态,执行S340;若虚拟机下一时刻应用服务响应时间的预测值不满足上述条件,则虚拟机的负载状态为过载状态,执行S350。
例如,公式(1)中,当C=1的时候,表明虚拟机的负载状态处于低载状态,性能最优,但是此时虚拟机中负载过低,导致资源不能充分使用,会造成了严重的资源浪费。当C=3时,表明虚拟机的负载状态处于过载状态,此时资源虽然充分利用,但是由于虚拟机负载太大,已超出了虚拟机所能承受的范围,因此,此时会导致应用服务响应时间大大增加,用户服务质量显著下降。
S340、计算并回收所述虚拟机的空闲资源。
S350、计算并增加所述虚拟机的瓶颈资源。
S360、不做特殊处理,并退出。
本实施例的技术方案,通过下一时刻的应用服务响应时间的预测值对负载状态进行分类,使得对负载状态的判断更加方便、准确,为后续关键资源的计算提供了可靠的依据,从而达到了缓解资源浪费或资源不足,提高云计算系统中的资源使用效率的效果。
实施例四
图4为本发明实施例四提供的一种云计算系统中的资源动态调整方法的流程示意图。本实施例以上述各实施例为基础进行优化,提供了优选的资源动态调整方法,具体是,计算并回收所述虚拟机的空闲资源优选地可以进一步优化为:根据所述虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的空闲资源;回收所述虚拟机的空闲资源。计算并增加所述虚拟机的瓶颈资源优选地可以进一步优化为:根据所述虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的瓶颈资源;增加所述虚拟机的瓶颈资源。
S410、根据虚拟机对应用请求的服务响应时间的历史数据按照预设方法确定下一时刻应用服务响应时间的预测值。
S420、根据所述下一时刻应用服务响应时间的预测值确定所述虚拟机的负载状态。
S430、当所述负载状态为低载状态时,根据所述虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的空闲资源。
其中,系统资源参数为系统中各种资源类型的特征向量。通过对云计算中应用程序的各种系统资源参数进行监控可以发现,系统资源在使用过程中并不是所有特征参数对每个应用程序都很敏感,而是特征参数中一部分对于特定类型的应用,其对应的资源使用情况表现出较高的相关性,因此将这些能够有效区分不同应用及资源使用情况的特征参数单独列出来,作为特征向量,也就是系统资源参数,以用于能够区分应用的标准。
具体的,系统资源参数所对应的系统资源主要有CPU(Central Processing Unit,中央处理器)、内存、网络(网络的发送和接收)和磁盘的读写资源。在虚拟机负载很大时,这些资源的使用率很高。相反的,当虚拟机负载很小时,这些资源的利用率相对较小。因此,这些资源的利用率在一定程度上可以表征虚拟机负载的大小。
可选的,下一时刻的系统资源参数的取值可以通过LPC方法进行计算得到。
示例性的,实验环境优选为基于CloudStack5.0云计算平台搭建的一个小型云计算系统,为了验证本发明实施例中下一时刻系统资源使用情况预测的准确性,使用Linux监测工具dstat来监控系统运行过程中的资源使用情况,通过对比使用本发明实施例的预测方法和实际资源使用情况,来验证对下一时刻系统资源使用情况预测的准确性。从图8(a)至图8(f)中可以看出,对于CPU、磁盘读取、磁盘写入、内存、网络接收和网络发送这些系统资源,预测值和实际观察的资源使用值基本相同,从而验证了预测方法的有效性。
优选地,根据虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的空闲资源包括:根据所述虚拟机的系统资源参数的历史取值数据按照预设方法确定下一时刻所述系统资源参数的预测值;根据所述下一时刻所述系统资源参数的预测值,确定使得下一时刻所述虚拟机的负载状态为低载状态的贡献最大的系统资源参数所对应的系统资源,将该系统资源作为所述虚拟机的空闲资源。
例如,当预测到下一个时刻虚拟机的负载状态为低载状态时,根据公式(1)可知C=1,根据贝叶斯分类公式,此时有
P(C1|X)>P(C2|X) (2)
P(C1|X)>P(C3|X) (3)
其中,X=(xcpu,xread,xwrite,xmem,xrecv,xsend)为某个时刻虚拟机的特征向量,即系统资源参数,用该向量表征虚拟机的状态。C1表示C=1,同理C2表示C=2,C3表示是C=3。
各变量的含义如下:
Cpu:cpu资源的使用率;
Read:磁盘读取速度;
Write:磁盘写入速度;
Mem:内存的使用量;
Recv:网络接收速度;
Send:网络发送速度。
根据公式(2),假设xcpu,xread,xwrite,xmem,xrecv,xsend这些变量相互独立,可以得到:
注:此处n=6,(x1,x2,x3,x4,x5,x6)即为(xcpu,xread,xwrite,xmem,xrecv,xsend)。
由于P(X)>0,对公式(4)进行变换得:
对公式(5)两边lg运算得:
由于(x1,x2,x3,x4,x5,x6)即为(xcpu,xread,xwrite,xmem,xrecv,xsend),所以可得:
通过公式(7),可以看出要想虚拟机属于状态C=1,必须要求各项相加的和大于0,而对于特定的应用而言,计算虚拟机的值是常数,因此,其他的各项哪项的值最大,哪项就是让该虚拟机成为状态C=1贡献最大的因子,而C=1的状态是低载的状态,资源太过富余而造成了资源浪费,因此该因子对应的资源也就是富余的可以回收的资源。
至此,可以定义关键资源因子:
其中,i,j可以取值为1,2,3,m可以取值cpu,read,write,mem,recv,send。
将公式(8)带入公式(7)可得:
至此,可以得到让公式(2)成立的所有可能的关键因子,key1,2,cpu,key1,2,read,key1,2,write,key1,2,mem,key1,2,recv,key1,2,send
同理,根据公式(3),也可以得到:
至此,可以得到让公式(3)成立的所有可能的关键因子,key1,3,cpu,key1,3,read,key1,3,write,key1,3,mem,key1,3,recv,key1,3,send
根据公式(2)和(3)得到的所有可能关键因子为key1,2,cpu,key1,2,read,key1,2,write,key1,2,mem,key1,2,recv,key1,2,send和key1,3,cpu,key1,3,read,key1,3,write,key1,3,mem,key1,3,recv,key1,3,send,因此,这些所有的因子中其值最大的为关键的资源因子。
注:j的取值为2,3;m的取值为cpu,read,write,mem,recv,send。
即资源KeyResource是让该虚拟机成为状态C=1贡献最大的因子,也就是说该资源是富余的,因此可以回收适量该资源来减少资源的闲置和浪费。
S440、回收所述虚拟机的空闲资源。
S450、当所述负载状态为过载状态时,根据所述虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的瓶颈资源。
优选地,根据所述虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的瓶颈资源包括:根据所述虚拟机的系统资源参数的历史取值数据按照预设方法确定下一时刻所述系统资源参数的预测值;根据所述下一时刻所述系统资源参数的预测值,确定使得下一时刻所述虚拟机的负载状态为过载状态的贡献最大的系统资源参数所对应的系统资源,将该系统资源作为所述虚拟机的瓶颈资源。
例如,当预测到下一个时刻虚拟机的负载状态为过载状态时,根据公式(1)可知C=3,根据贝叶斯分类公式,此时有
P(C3|X)>P(C1|X) (12)
P(C3|X)>P(C2|X) (13)
公式(12)进行推导可得:
至此,可以得到让公式(12)成立的所有可能的关键因子,key3,1,cpu,key3,1,read,key3,1,write,key3,1,mem,key3,1,recv,key3,1,send
公式(13)进行推导可得:
至此,可以得到让公式(13)成立的所有可能的关键因子,key3,2,cpu,key3,2,read,key3,2,write,key3,2,mem,key3,2,recv,key3,2,send
根据公式(12)和(13)得到所有可能关键因子为key3,1,cpu,key3,1,read,key3,1,write,key3,1,mem,key3,1,recv,key3,1,send和key3,2,cpu,key3,2,read,key3,2,write,key3,2,mem,key3,2,recv,key3,2,send,因此,这些所有的因子中其值最大的为关键的资源因子。
注:j的取值为1,2;m的取值为cpu,read,write,mem,recv,send。
即资源KeyResource是让该虚拟机成为状态C=3贡献最大的因子,而C=3为虚拟机的过载状态,因此也就是说该资源是系统的瓶颈资源,即系统中该资源是不足的,因此可以增加该资源来提高系统性能,保证用户服务质量。
S460、增加所述虚拟机的瓶颈资源。
本实施例的技术方案,通过预测下一时刻的系统资源参数的取值及负载状态,计算虚拟机的空闲资源或瓶颈资源,从而回收空闲资源或增加瓶颈资源,达到了提高资源动态调整准确性,缓解资源浪费或资源不足现象,进而提高云计算系统中的资源利用效率的效果。
实施例五
图5为本发明实施例五提供的一种云计算系统中的资源动态调整装置的结构示意图。该装置可适用于云计算资源调整的情况,该装置可由硬件和/或软件组成,并一般可集成在云计算系统以及所有包含资源动态调整功能的计算机系统中。参考图5,所述资源动态调整装置包括:响应时间预测模块510、负载状态确定模块520、空闲资源回收模块530、瓶颈资源增加模块540,下面对各模块进行具体说明。
响应时间预测模块510,用于根据虚拟机对应用请求的服务响应时间的历史数据按照预设方法确定下一时刻应用服务响应时间的预测值;
负载状态确定模块520,用于根据所述下一时刻应用服务响应时间的预测值确定所述虚拟机的负载状态;
空闲资源回收模块530,用于当所述负载状态为低载状态时,计算并回收所述虚拟机的空闲资源;
瓶颈资源增加模块540,用于当所述负载状态为过载状态时,计算并增加所述虚拟机的瓶颈资源。
可选的,所述响应时间预测模块具体用于:
将虚拟机对应用请求的服务响应时间的历史数据进行数学回归,得到关于应用服务响应时间的预测函数;
根据所述预测函数确定下一时刻应用服务响应时间的预测值。
可选的,所述负载状态确定模块具体用于:
当所述下一时刻应用服务响应时间的预测值小于正常状态下应用服务响应时间的预设最小阈值时,确定所述负载状态为低载状态;
当所述下一时刻应用服务响应时间的预测值大于等于正常状态下应用服务响应时间的预设最小阈值且小于等于正常状态下应用服务响应时间的预设最大阈值时,确定所述负载状态为正常状态;
当所述下一时刻应用服务响应时间的预测值大于所述正常状态下应用服务响应时间的预设最大阈值时,确定所述负载状态为过载状态。
可选的,所述空闲资源回收模块包括:
空闲资源计算单元,用于根据所述虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的空闲资源;
资源回收单元,用于回收所述虚拟机的空闲资源。
可选的,所述空闲资源计算单元具体用于:
根据所述虚拟机的系统资源参数的历史取值数据按照预设方法确定下一时刻所述系统资源参数的预测值;
根据所述下一时刻所述系统资源参数的预测值,确定使得下一时刻所述虚拟机的负载状态为低载状态的贡献最大的系统资源参数所对应的系统资源,将该系统资源作为所述虚拟机的空闲资源。
可选的,所述瓶颈资源增加模块包括:
瓶颈资源计算单元,用于根据所述虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的瓶颈资源;
资源增加单元,用于增加所述虚拟机的瓶颈资源。
可选的,所述瓶颈资源计算单元具体用于:
根据所述虚拟机的系统资源参数的历史取值数据按照预设方法确定下一时刻所述系统资源参数的预测值;
根据所述下一时刻所述系统资源参数的预测值,确定使得下一时刻所述虚拟机的负载状态为过载状态的贡献最大的系统资源参数所对应的系统资源,将该系统资源作为所述虚拟机的瓶颈资源。
上述产品可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种云计算系统中的资源动态调整方法,其特征在于,包括:
根据虚拟机对应用请求的服务响应时间的历史数据按照预设方法确定下一时刻应用服务响应时间的预测值;
根据所述下一时刻应用服务响应时间的预测值确定所述虚拟机的负载状态;
当所述负载状态为低载状态时,计算并回收所述虚拟机的空闲资源;
当所述负载状态为过载状态时,计算并增加所述虚拟机的瓶颈资源。
2.根据权利要求1所述的方法,其特征在于,根据虚拟机对应用请求的服务响应时间的历史数据按照预设方法确定下一时刻应用服务响应时间的预测值包括:
将虚拟机对应用请求的服务响应时间的历史数据进行数学回归,得到关于应用服务响应时间的预测函数;
根据所述预测函数确定下一时刻应用服务响应时间的预测值。
3.根据权利要求1所述的方法,其特征在于,根据所述下一时刻应用服务响应时间的预测值确定所述虚拟机的负载状态包括:
当所述下一时刻应用服务响应时间的预测值小于正常状态下应用服务响应时间的预设最小阈值时,确定所述负载状态为低载状态;
当所述下一时刻应用服务响应时间的预测值大于等于正常状态下应用服务响应时间的预设最小阈值且小于等于正常状态下应用服务响应时间的预设最大阈值时,确定所述负载状态为正常状态;
当所述下一时刻应用服务响应时间的预测值大于所述正常状态下应用服务响应时间的预设最大阈值时,确定所述负载状态为过载状态。
4.根据权利要求1所述的方法,其特征在于,计算并回收所述虚拟机的空闲资源包括:
根据所述虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的空闲资源;
回收所述虚拟机的空闲资源。
5.根据权利要求4所述的方法,其特征在于,根据虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的空闲资源包括:
根据所述虚拟机的系统资源参数的历史取值数据按照预设方法确定下一时刻所述系统资源参数的预测值;
根据所述下一时刻所述系统资源参数的预测值,确定使得下一时刻所述虚拟机的负载状态为低载状态的贡献最大的系统资源参数所对应的系统资源,将该系统资源作为所述虚拟机的空闲资源。
6.根据权利要求1所述的方法,其特征在于,计算并增加所述虚拟机的瓶颈资源包括:
根据所述虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的瓶颈资源;
增加所述虚拟机的瓶颈资源。
7.根据权利要求6所述的方法,其特征在于,根据所述虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的瓶颈资源包括:
根据所述虚拟机的系统资源参数的历史取值数据按照预设方法确定下一时刻所述系统资源参数的预测值;
根据所述下一时刻所述系统资源参数的预测值,确定使得下一时刻所述虚拟机的负载状态为过载状态的贡献最大的系统资源参数所对应的系统资源,将该系统资源作为所述虚拟机的瓶颈资源。
8.一种云计算系统中的资源动态调整装置,其特征在于,包括:
响应时间预测模块,用于根据虚拟机对应用请求的服务响应时间的历史数据按照预设方法确定下一时刻应用服务响应时间的预测值;
负载状态确定模块,用于根据所述下一时刻应用服务响应时间的预测值确定所述虚拟机的负载状态;
空闲资源回收模块,用于当所述负载状态为低载状态时,计算并回收所述虚拟机的空闲资源;
瓶颈资源增加模块,用于当所述负载状态为过载状态时,计算并增加所述虚拟机的瓶颈资源。
9.根据权利要求8所述的装置,其特征在于,所述空闲资源回收模块包括:
空闲资源计算单元,用于根据所述虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的空闲资源;
资源回收单元,用于回收所述虚拟机的空闲资源。
10.根据权利要求8所述的装置,其特征在于,所述瓶颈资源增加模块包括:
瓶颈资源计算单元,用于根据所述虚拟机的下一时刻的系统资源参数的取值及负载状态计算所述虚拟机的瓶颈资源;
资源增加单元,用于增加所述虚拟机的瓶颈资源。
CN201610961170.5A 2016-10-28 2016-10-28 一种云计算系统中的资源动态调整方法及装置 Active CN106528266B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610961170.5A CN106528266B (zh) 2016-10-28 2016-10-28 一种云计算系统中的资源动态调整方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610961170.5A CN106528266B (zh) 2016-10-28 2016-10-28 一种云计算系统中的资源动态调整方法及装置

Publications (2)

Publication Number Publication Date
CN106528266A true CN106528266A (zh) 2017-03-22
CN106528266B CN106528266B (zh) 2020-01-14

Family

ID=58326176

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610961170.5A Active CN106528266B (zh) 2016-10-28 2016-10-28 一种云计算系统中的资源动态调整方法及装置

Country Status (1)

Country Link
CN (1) CN106528266B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273182A (zh) * 2017-06-06 2017-10-20 武汉智云方达信息科技有限公司 一种虚拟机资源动态扩充方法及系统
CN107579852A (zh) * 2017-09-15 2018-01-12 郑州云海信息技术有限公司 云服务器中基于历史模型的虚拟网络性能隔离系统和方法
CN107911399A (zh) * 2017-05-27 2018-04-13 广东网金控股股份有限公司 一种基于负载预测的弹性伸缩方法及系统
CN108319501A (zh) * 2017-12-26 2018-07-24 中山大学 一种基于微服务网关的弹性资源供给方法及系统
CN109040156A (zh) * 2017-06-08 2018-12-18 中国移动通信集团浙江有限公司 一种基于容器云的软负载资源处理方法及装置
CN109088747A (zh) * 2018-07-10 2018-12-25 郑州云海信息技术有限公司 云计算系统中资源的管理方法和装置
CN110275773A (zh) * 2018-10-30 2019-09-24 湖北省农村信用社联合社网络信息中心 基于真实数据模型拟合的Paas资源循环利用指标系统
CN110362388A (zh) * 2018-04-11 2019-10-22 中移(苏州)软件技术有限公司 一种资源调度方法及装置
CN111386516A (zh) * 2017-11-24 2020-07-07 亚马逊技术股份有限公司 自动缩放托管的机器学习模型以进行产生式推断
CN112156453A (zh) * 2020-10-21 2021-01-01 腾讯科技(深圳)有限公司 实例自适应调整方法、装置、计算机可读存储介质及设备
US10949542B2 (en) 2018-11-25 2021-03-16 International Business Machines Corporation Self-evolved adjustment framework for cloud-based large system based on machine learning
CN112751896A (zh) * 2019-10-31 2021-05-04 中国电信股份有限公司 资源部署方法、资源部署装置以及存储介质
WO2022001295A1 (zh) * 2020-06-30 2022-01-06 中兴通讯股份有限公司 云环境管理方法、云环境管理平台及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279771A (zh) * 2011-09-02 2011-12-14 北京航空航天大学 一种虚拟化环境中自适应按需资源分配的方法及系统
CN102904955A (zh) * 2012-10-16 2013-01-30 南京大学镇江高新技术研究院 云计算平台中Web应用的自适应伸缩控制系统及其方法
CN104077189A (zh) * 2013-03-29 2014-10-01 西门子公司 一种用于资源分配的方法和装置
CN104283946A (zh) * 2014-09-26 2015-01-14 东北大学 一种单物理机下多虚拟机的资源自适应调整系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279771A (zh) * 2011-09-02 2011-12-14 北京航空航天大学 一种虚拟化环境中自适应按需资源分配的方法及系统
CN102904955A (zh) * 2012-10-16 2013-01-30 南京大学镇江高新技术研究院 云计算平台中Web应用的自适应伸缩控制系统及其方法
CN104077189A (zh) * 2013-03-29 2014-10-01 西门子公司 一种用于资源分配的方法和装置
CN104283946A (zh) * 2014-09-26 2015-01-14 东北大学 一种单物理机下多虚拟机的资源自适应调整系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈文文: "基于BP神经网络的云服务响应时间的预测方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107911399A (zh) * 2017-05-27 2018-04-13 广东网金控股股份有限公司 一种基于负载预测的弹性伸缩方法及系统
CN107911399B (zh) * 2017-05-27 2020-10-16 广东网金控股股份有限公司 一种基于负载预测的弹性伸缩方法及系统
CN107273182A (zh) * 2017-06-06 2017-10-20 武汉智云方达信息科技有限公司 一种虚拟机资源动态扩充方法及系统
CN107273182B (zh) * 2017-06-06 2020-05-15 武汉纺织大学 一种虚拟机资源动态扩充方法及系统
CN109040156B (zh) * 2017-06-08 2021-06-22 中国移动通信集团浙江有限公司 一种基于容器云的软负载资源处理方法及装置
CN109040156A (zh) * 2017-06-08 2018-12-18 中国移动通信集团浙江有限公司 一种基于容器云的软负载资源处理方法及装置
CN107579852A (zh) * 2017-09-15 2018-01-12 郑州云海信息技术有限公司 云服务器中基于历史模型的虚拟网络性能隔离系统和方法
CN111386516B (zh) * 2017-11-24 2024-03-08 亚马逊技术股份有限公司 自动缩放托管的机器学习模型以进行产生式推断
CN111386516A (zh) * 2017-11-24 2020-07-07 亚马逊技术股份有限公司 自动缩放托管的机器学习模型以进行产生式推断
CN108319501A (zh) * 2017-12-26 2018-07-24 中山大学 一种基于微服务网关的弹性资源供给方法及系统
CN108319501B (zh) * 2017-12-26 2022-01-14 中山大学 一种基于微服务网关的弹性资源供给方法及系统
CN110362388A (zh) * 2018-04-11 2019-10-22 中移(苏州)软件技术有限公司 一种资源调度方法及装置
CN109088747A (zh) * 2018-07-10 2018-12-25 郑州云海信息技术有限公司 云计算系统中资源的管理方法和装置
CN110275773B (zh) * 2018-10-30 2020-08-28 湖北省农村信用社联合社网络信息中心 基于真实数据模型拟合的Paas资源循环利用指标系统
CN110275773A (zh) * 2018-10-30 2019-09-24 湖北省农村信用社联合社网络信息中心 基于真实数据模型拟合的Paas资源循环利用指标系统
US10949542B2 (en) 2018-11-25 2021-03-16 International Business Machines Corporation Self-evolved adjustment framework for cloud-based large system based on machine learning
CN112751896A (zh) * 2019-10-31 2021-05-04 中国电信股份有限公司 资源部署方法、资源部署装置以及存储介质
WO2022001295A1 (zh) * 2020-06-30 2022-01-06 中兴通讯股份有限公司 云环境管理方法、云环境管理平台及存储介质
CN112156453A (zh) * 2020-10-21 2021-01-01 腾讯科技(深圳)有限公司 实例自适应调整方法、装置、计算机可读存储介质及设备
CN112156453B (zh) * 2020-10-21 2022-06-03 腾讯科技(深圳)有限公司 实例自适应调整方法、装置、计算机可读存储介质及设备

Also Published As

Publication number Publication date
CN106528266B (zh) 2020-01-14

Similar Documents

Publication Publication Date Title
CN106528266A (zh) 一种云计算系统中的资源动态调整方法及装置
CN110096349B (zh) 一种基于集群节点负载状态预测的作业调度方法
US9235252B2 (en) Dynamic balancing of power across a plurality of processor domains according to power policy control bias
US8341441B2 (en) Reducing energy consumption in a cloud computing environment
US20100318827A1 (en) Energy use profiling for workload transfer
US20070180453A1 (en) On demand application scheduling in a heterogeneous workload environment
US8626902B2 (en) Modeling and reducing power consumption in large IT systems
CN104657215A (zh) 云计算中虚拟化节能系统
Jiang et al. Adaptive thresholds determination for saving cloud energy using three-way decisions
CN115878260A (zh) 一种低碳自适应云主机任务调度系统
CN108574600B (zh) 云计算服务器的功耗和资源竞争协同控制的服务质量保障方法
CN106844175B (zh) 一种基于机器学习的云平台容量规划方法
CN109582119B (zh) 基于动态电压频率调整的双层Spark节能调度方法
CN109376006B (zh) 一种云计算环境下基于用户需求时变特性的资源整合方法
CN108073449B (zh) 一种虚拟机动态放置方法
CN115952054A (zh) 一种仿真任务资源管理方法、装置、设备及介质
US10180712B2 (en) Apparatus and method for limiting power in symmetric multiprocessing system
CN114860449A (zh) 数据处理方法、装置、设备和存储介质
CN106227600B (zh) 一种基于能量感知的多维虚拟资源分配方法
Li et al. A strategy game system for QoS-efficient dynamic virtual machine consolidation in data centers
CN114741160A (zh) 一种基于平衡能耗与服务质量的动态虚拟机整合方法和系统
CN113282369A (zh) 一种虚拟机调度方法、装置、介质及设备
CN112346863A (zh) 一种计算资源动态调整数据处理方法及系统
EP3161586B1 (en) Method and system for regulating in real time the clock frequencies of at least one cluster of electronic machines
US9389919B2 (en) Managing workload distribution among computer systems based on intersection of throughput and latency models

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant