CN106648890A - 一种能耗感知的云计算服务器资源在线管理方法和系统 - Google Patents

一种能耗感知的云计算服务器资源在线管理方法和系统 Download PDF

Info

Publication number
CN106648890A
CN106648890A CN201611109067.4A CN201611109067A CN106648890A CN 106648890 A CN106648890 A CN 106648890A CN 201611109067 A CN201611109067 A CN 201611109067A CN 106648890 A CN106648890 A CN 106648890A
Authority
CN
China
Prior art keywords
energy consumption
cloud computing
resource
computing server
cpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201611109067.4A
Other languages
English (en)
Inventor
史晓雨
尚明生
田文洪
罗辛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Institute of Green and Intelligent Technology of CAS
Original Assignee
Chongqing Institute of Green and Intelligent Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Institute of Green and Intelligent Technology of CAS filed Critical Chongqing Institute of Green and Intelligent Technology of CAS
Priority to CN201611109067.4A priority Critical patent/CN106648890A/zh
Publication of CN106648890A publication Critical patent/CN106648890A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明提供一种能耗感知的云计算服务器资源在线管理方法和系统,属于计算机高性能计算领域。在该方法和系统中,主要通过负载均衡控制和能耗控制两部分的协同运作来达到对云计算服务器资源和能耗的管理,其中负载均衡控制通过自适应调整分配给不同虚拟机的资源量来维持各虚拟机之间的负载均衡,进而使所有虚拟机可以得到近似一致的响应时间;能耗控制通过动态改变物理CPU的频率来保持所有虚拟机的平均响应时间趋于理想水平,从而达到降低能耗的目的。通过实施所述方法和系统可以在保证虚拟机上Web应用性能的同时,有效降低物理服务器的耗电量,从而起到对云计算服务器能耗和性能在线控制的效果。

Description

一种能耗感知的云计算服务器资源在线管理方法和系统
技术领域
本发明涉及一种实现提高云计算服务器资源管理和节能效率的方法和系统,具体为一种能耗感知的云计算服务器资源在线管理方法和系统,属于计算机高性能计算领域。
背景技术
随着互联网经济的进一步繁荣,数据中心的规模以惊人的速度扩张,特别是云计算和大数据的提出,数据中心的规模得到了空前的发展,如何对数据中心的资源(特别是服务器)进行高效管理是一个具有挑战性的问题。同时,数据中心在消耗大量能源的同时,也带来了不容忽视的碳排放量。因此,设计高效合理的服务器资源控制方法和系统对整个数据中心的资源管理,以及降低数据中心的能耗、减少运营成本、减少能源消耗对环境的污染都具有十分重要的意义。
虚拟化技术(如VMware、Xen和Microsoft Virtual Servers)通过灵活的资源管理、在线迁移等技术,为高效地管理数据中心的服务器资源和能耗提供了一条可行路径。这些虚拟化技术允许在一台物理服务器上生成多台虚拟机(Virtual Machine,VM),在每台VM上面可以运行不同的操作系统和应用,同时所有的VM共享底层的硬件资源,以达到提高服务器资源利用率的目的,因此当前数据中心纷纷采用虚拟化技术来搭建云计算服务器。然而,虚拟化技术在给数据中心的管理带来好处的同时,也面临着诸多挑战。首先,由于硬件资源(如CPU、内存和I/O硬盘等)的有限性,使得共享资源的VM之间存在着性能干涉的问题。因此,云计算服务提供商的首要任务是保证应用的服务级别协议SLAs(如响应时间、吞吐量等)。其次,随着能源成本的增长,如何在不降低服务性能的同时减少云计算服务器的耗电量成为高性能计算研究的热点问题。最后,现代化数据中心规模和应用复杂度的不断增加给系统管理员提出了一个严峻的挑战,即如何在尽量减少人为对数据中心干涉的基础上,最大可能地实现数据中心的自主化管理。
目前,已经有部分针对云计算环境下的解决方案被提出,用来保证云环境下应用的性能和服务器的耗电量。相比于基于机器学习的资源管理方案,基于控制理论的方案可以从理论层面上保证控制系统的稳定性和控制器的收敛性,因此成为了一种流行的云计算服务器资源管理方法。但是基于控制理论的方案在设计各自控制器时,都不同程度存在依赖于所建立模型精度的问题。如果把虚拟Web服务器系统看作为一个时不变系统,那么可以用离线的系统辨识方法来建立系统模型,但是这种方法所建立的模型是基于特定负载的,并不适用于动态负载情况下的在线资源管理。并且,已有的控制方案大部分为确定性控制,其最大缺点就在于在建立系统模型时没有考虑系统噪音和未知扰动的存在。依赖于在线估计器可以稳定地提供精准的模型参数给控制器这一假设。但是,该假设往往并不成立,因为由于云计算服务器系统的复杂性,通常采用线性化方法进行建模,在建模过程中真实云计算服务器中的非线性因素往往被忽略(如计算机系统资源的有限性,并受限于硬件自身的制造工艺;突发性Web负载可以造成系统输出端的未知波动;计算机内部处理过程的随机性等等)。因此,当突发性的Web负载引起系统输出端的严重扰动时,在线估计器的性能会变得不准确,导致控制器做出错误的控制选择),在某些情况下,甚至导致应用的响应时间出现震荡现象。
发明内容
本发明针对现有技术中存在的上述问题,提供一种能耗感知的云计算服务器资源在线管理方法和系统,能够根据网络负载的动态变动,对虚拟机的资源分配量进行自适应调整,从而保证运行在虚拟机上Web应用性能的同时,也可以有效降低物理服务器的耗电量,从而起到对云计算服务器能耗和性能在线控制的效果。
本发明提供一种能耗感知的云计算服务器资源在线管理方法,该方法包括负载均衡控制和能耗控制两部分协同运作;
所述负载均衡控制通过自适应调整分配给不同虚拟机的资源量来维持各虚拟机之间的负载均衡,进而使所有虚拟机可以得到近似一致的响应时间,具体包括如下步骤:
步骤101:自动采集得到运行于云计算服务器各个虚拟机上的Web应用的响应时间信息和云计算服务器分配给每个虚拟机的实时资源量大小;
步骤102:计算得到每个虚拟机所需的响应时间信息;
步骤103:对负载均衡问题进行建模,采用系统辨识的方法对响应时间和资源分配量之间的复杂关系进行建模;
步骤104:采用在线训练方法对模型参数进行实时更新;
步骤105:将负载均衡控制问题转化为鲁棒性动态优化控制问题,以此来建立能够反映网络负载动态变化的在线系统模型;
步骤106:采用带有随机策略的自适应控制算法进行求解;
步骤107:计算最优的资源分配方案;
步骤108:根据最优资源分配方案改变每个虚拟机的资源分配量,以保证在动态负载情况下运行在每个虚拟机上面Web应用的性能,并将最优资源分配方案发送到步骤104,用于下一周期的模型更新;
所述能耗控制通过动态改变物理CPU的频率来保持所有虚拟机的平均响应时间趋于理想水平,具体包括如下步骤:
步骤201:自动采集得到每个虚拟机上Web应用的响应时间和云计算服务器的物理CPU频率信息;
步骤202:同样采用系统辨识的方法对响应时间和物理CPU频率之间的非线性关系进行建模;
步骤203:为了适应网络动态负载情况,在能耗控制当中采用同样的在线训练方法对模型参数进行实时更新;
步骤204:采用同样的带有随机策略的自适应控制算法进行求解;
步骤205:对满足所有虚拟机性能要求的物理CPU频率大小进行计算,得到最优的CPU物理频率的调整量;
步骤206:通过云计算服务器自带的动态电压频率调节技术,将计算得到的最优CPU物理频率调整量作用于云计算服务器,以达到降低能耗的作用。
所述在线训练方法可以为递归最小二乘法,所述自适应控制算法可以为线性二次型高斯控制算法。
本发明还提供一种能耗感知的云计算服务器资源在线管理系统,该系统包括两层结构:
第一层为负载均衡控制层,主要实现负载均衡控制算法,该层结构包括性能监控器、在线估计器A、负载均衡控制器、CPU资源分配器;该层结构可将内存、硬盘等其他资源作为额外的操控变量,通过建模不同类型的资源分配量和Web应用的性能指标来重新建立模型;
第二层为能耗控制层,主要实现节能控制算法,该层结构包括性能监控器、在线估计器B、能耗控制器、CPU频率调节器;当系统性能瓶颈转移为内存或者硬盘时,能耗控制器可以自动地把CPU的物理频率降低到最低档次,以达到节能的目标;
两层结构协同控制,共用同一性能监控器;由于多层Web应用负载模式的不同,系统的瓶颈可能在CPU、内存和硬盘等多种硬件资源之间转变,该系统可根据不同的负载变化进行灵活地扩展,最终在达到降低物理服务器耗电量的同时,也使运行在不同虚拟机上的web应用得到理想的响应时间。
所述性能监控器用于监测运行在每个虚拟机上各个Web应用在上个周期内的性能指标如响应时间或吞吐量等信息,并周期性地将数据发送到在线估计器A。
所述在线估计器A用于接收性能监控器监测到的性能指标以及上个周期CPU资源分配量信息,来构建资源—性能指标模型,然后使用系统辨识的方法来自适应地计算模型参数。
所述负载均衡控制器首先按照高斯分布概率生成一组资源—性能指标模型集合,其中,是估计参数的均值,是对应的协方差矩阵,这些参数均可以从在线估计器A的估计结果中得到,负载均衡控制器通过优化资源—性能指标模型集合的性能,来得到最优资源分配方案。
所述CPU资源分配器的工作原理类似于控制系统中的校正设备,按照负载均衡控制器计算得到的资源分配方案,强制把对应大小的CPU资源片分配给各个虚拟机,以使每个应用的性能指标接近于参考量。
所述在线估计器B同样接收来自于性能监控器监测得到的性能指标信息以及服务器的物理CPU频率大小,并构建频率-性能指标模型,然后使用系统辨识方法来计算出模型参数。
所述能耗控制器首先按照高斯分布概率生成一组频率-性能指标集合,其中,是估计参数的均值,是对应的协方差矩阵,这些参数均可以从在线估计器B的估计结果中得到,控制器通过优化频率-性能指标模型集合的性能,来得到最优CPU物理频率改变量。
所述CPU频率调节器的工作原理类似于控制系统中的校正设备,按照能耗控制器计算得到的资源分配方案,强制改变云计算服务器物理CPU频率的大小,使所有应用的性能指标接近于参考量,并达到降低能耗的作用。
本发明的有益效果在于:在云计算服务器资源管理方面,针对传统的管理方案存在严重依赖所建立模型精度的缺点,在本发明中,我们将通过改变传统控制器内部单一确定工作方式,将所要求解的成本函数进行离散化处理,把对最优资源分配方案的求解建立在适用于模型集合所有成本函数的平均性能上,从而增加了控制方法的鲁棒性,并且通过使用动态电压频率调整技术,使得控制系统在保证服务器性能的情况下,起到了降低服务器能耗的效果。
附图说明
图1为负载均衡控制的执行流程示意图;
图2为能耗控制的执行流程示意图;
图3为能耗感知的云计算服务器资源在线管理系统框架图;其中,301为性能监控器,302为在线估计器A,303为负载均衡控制器,304为CPU资源分配器,305为在线估计器B,306为能耗控制器,307为CPU频率调节器。
具体实施方式
为使本发明的目的和技术方案更加清晰明白,下面结合附图及实施例对本发明进行详细的描述。
实施例1
本实施例针对一个部署n个虚拟机的云计算服务器,提供一种能耗感知的云计算服务器资源在线管理方法,该方法包括负载均衡控制和能耗控制两部分协同运作,设T1为负载均衡控制周期,T2为能耗控制周期。
负载均衡控制在每个控制周期内的具体执行步骤如图1所示,具体为:
步骤101:通过部署在每个VM上的性能监控器,采集得到每个VMi在当前控制周期[(k-1)T1,kT1]内的平均响应时间信息rti
步骤102:计算得到每个VMi的相对响应时间ri(k)以及所有VM的平均响应时间计算公式如下所示:
步骤103:对于大部分的计算系统而言,由于内部的复杂性和非线性,往往得不到建立好的物理模型,因此,本实施例将云计算服务器看作一个黑盒问题来看待,采用系统辨识的方法进行建模。并且,由于任何一个VM资源分配量的变化都会影响其他VM的性能,所以系统被看作是耦合的多输入多输出系统。最后,鉴于用户访问负载变化的动态性和不可预知性,我们将系统描述为随机时变系统,形式化为ARMAX模型(Autoregressive moving-average model with exogenous inputs)。ARMAX模型最大的优点在于它带有额外的输入项,可以用来表示系统的内部扰动,给系统建模增添了灵活性。具体而言,采用虚拟技术Xen中credit scheduler中的weight作为系统的输入u(k),表示为u(k)=[u1(k),u2(k),...,un(k)],系统输入为每个VM的平均响应时间r(k)=[r1(k),r2(k),...,rn(k)]。同时为了避免直接使用u(k)和r(k)建模带来的复杂性,采用其差分形式来进行建模,即其中,表示weight参数的典型值。最终,系统可以表示为:
Δr(k+1)=A(k)Δr(k)+B(k)Δu(k)+C(k)ω(k) (3)
其中,ω(k)代表系统干扰项,典型的假设为其服从独立正态分布,ω(k)~N(0,I);
步骤104:由于Web应用负载的时变形,以及具有不可预知的特性,所以对模型(3)进行动态更新显得尤为重要。在本实施例当中,我们使用递归最小二乘法来对模型参数A(k),B(k),C(k)进行更新。首先将收集到的系统历史输入输出信息进行迭代计算,然后,将计算好的模型参数用于更新系统模型(3);
步骤105:针对传统的自适应控制存在严重依赖所建立模型精度的缺点,在本实施例中,我们将负载均衡控制看作是鲁棒性动态优化问题,通过改变传统控制器内部单一确定工作方式,将所要求解的损失函数进行离散化处理来进行最优化求解。具体而言,我们以采用线性二次型高斯控制器(LQG)作为负载均衡层的控制器为例进行说明。在LQG控制方法当中,最优增益F1是通过最小化以下成本函数得到的:
其中,Q1和R1为半正定加权矩阵,它们的大小决定了求解过程中控制误差和控制成本所占的比重;
步骤106:本发明当中的最优资源分配按照以下流程进行求解:首先对所建立的模型(3)按照Pk~N(μ(k),σ2(k))进行离散化处理,产生模型集合Ω,并对集合当中的每一个模型按照公式(4)求解出相对应的控制增益为模型集合的大小)。然后,计算出每个控制增益其相对应于其他模型的成本函数,并进行平均化处理作为该控制增益的评价值计算过程如公式(5)所示:
则最终的最优化控制增益Fopt 1(k)可以通过求解以下公式得到:
步骤107:最终的最优资源分配方案可以通过计算公式(7)得到:
Δu(k)=-Fopt 1(k)Δr(k) (7)
步骤108:将得到的最优资源分配方案分配给每个虚拟机,以保证每个虚拟机的性能,并把求解出的最优分配方案发送到步骤104,用于下一周期的模型更新。
能耗控制的具体执行步骤如图2所示,具体为:
步骤201:采集得到每个虚拟机在控制周期内的[(k-1)T2,kT2]内的响应时间信息;
步骤202:由于计算机内部结构的复杂性,使得响应时间和物理CPU频率之间的关系是非线性的,同样采取系统辨识的方法来建立所有VM平均响应时间-CPU物理频率模型。其中,用f(k)来表示物理服务器在控制周期[(k-1)T2,kT2]的相对CPU频率,比如f(k)=1表示CPU当前工作在最高频率级别上。频率的改变量可以表示为Δf(k)=f(k)-f,其中,f是CPU可用频率集合中的一个典型值。平均相对响应时间误差可以表示为同样,r是的典型值。根据系统辨识方法,所建立的模型可以表示为
其中,n(k)是白噪声,代表着模型当中的未知扰动;
步骤203:为了适应网络动态负载情况,在能耗控制当中同样采用在线训练方法(如最小二乘迭代算法),根据实时采集到的响应时间信息和物理CPU的频率信息对模型(8)的参数进行实时更新;
步骤204:在该步骤当中同样采用带有随机策略的自适应控制算法作为控制器,如同负载均衡控制算法一样,其最优控制增益可以通过最小化以下成本函数集合得到:
其中,J2的具体表达式如下所示:
公式中q2和r2代表权值参数。选择q2和r2的一个通用做法为:q2越大,表示系统对平均响应时间误差改变反应越快;r2的值越大,表示系统对噪声越不敏感。
步骤205:最终,最佳CPU物理频率的调整量可以通过以下公式得到:
步骤206:通过云计算服务器自带的动态电压频率调节(DVFS)技术,将公式(11)计算得到的最佳CPU物理频率调整量作用于物理服务器,以达到降低能耗的作用。
本实施例还提供一种能耗感知的云计算服务器资源在线管理系统,该系统的结构示意图如图3所示,具体包括两层结构:
第一层为负载均衡控制层,主要实现负载均衡控制算法,该层结构包括性能监控器301、在线估计器A 302、负载均衡控制器303、CPU资源分配器304;该层结构可将内存、硬盘等其他资源作为额外的操控变量,通过建模不同类型的资源分配量和Web应用的性能指标来重新建立模型;
第二层为能耗控制层,主要实现节能控制算法,该层结构包括性能监控器301、在线估计器B 305、能耗控制器306、CPU频率调节器307;当系统性能瓶颈转移为内存或者硬盘时,能耗控制器可以自动地把CPU的物理频率降低到最低档次,以达到节能的目标;
两层结构协同控制,共用同一性能监控器;由于多层Web应用负载模式的不同,系统的瓶颈可能在CPU、内存和硬盘等多种硬件资源之间转变,该系统可根据不同的负载变化进行灵活地扩展,最终在达到降低物理服务器耗电量的同时,也使运行在不同虚拟机上的web应用得到理想的响应时间。
其中各模块的具体实施策略如下所示:
1.性能监控器301:为了减少网络延迟的影响,在这里主要监控服务器端的响应时间;具体而言,在每个VM内部运行一个脚本程序作为响应时间监控器,它可以周期性地插入带有时间戳的请求到来自于客服端的请求队列当中;通过计算插入请求队列的时间和处理完请求的时间之间的差作为服务器端的响应时间;
2.在线估计器A 302和在线估计器B 305:本实验用到的所有在估计器都是运行在云计算服务器端的dom0中;在接受来自不同监控器传递来的响应时间后,分别在负载均衡层和能耗控制层运行所提出的系统辨识方法;其中,在负载均衡控制层,在线估计器A302的输入为测量得到的各Web应用的响应时间和上一周期计算得到的资源分配量,输出端为更新后的负载均衡模型系统;在能耗控制层中在线估计器B305的输入为所有Web应用的平均响应时间和上一周期计算得到的CPU频率,输出为更新后的能耗控制模型参数;所有的系统辨识均可以用C 语言编写完成,运行在脚本程序中;
3.CPU资源分配器304:Xen当中的Credit Schedule被用来分配可用的CPU资源;Credit Schedule通过分配参数weight和cap给VM,来实现对CPU资源的具体分配;参数cap可以限制VM允许使用的CPU资源上限,而参数weight用来设置分配给不同VM的CPU资源偏好;比如,一个weight值为512的VM得到的CPU资源数是weight值为256的VM的两倍;在这里,使用参数weight来控制CPU资源量分配,而把参数cap设置为0,即每个VM实例都可以利用物理服务器的全部4个CPU;在每个周期,负载均衡控制器计算出分配给每个VM的weight值,然后经过取整操作,传递给Xen hypervisor实现对VM的CPU资源分配;
4.CPU频率调节器307:采用Intel的SpeedStep技术来实现对CPU频率调节;DVFS技术已经内置在Xen 3.4及以上版本当中,因此,可以使用xenpm工具来修改CPU的频率,同时可以选择不同的scaling governor;Xen 3.4中总共有四种sacling governor可以选择:ondemand governor,powersave governor,performance governor和userspacegovernor;具体而言,ondemand governor可以在CPU的负载达到95%以上时,动态地调节CPU的频率,但其工作效率低;performance governor可以将CPU运行在最大频率上,以确保性能最佳;相反,powersave governor则是把CPU运行在最低频率,来保证节能;userpacegovernor允许用户根据需要自行调节CPU频率。在本章节实验当中选择userspacegovernor作为CPU频率调节器;
5.负载均衡控制器303和能耗控制器306:本实验用到的所有控制器都是运行在云计算服务器端的dom0中。在接受来自不同监控器传递来的响应时间后,分别运行所提出的负载均衡控制方法和能耗控制方法;其中,负载均衡控制器303的输入为测量得到的各Web应用的响应时间,输出端为分配给每个VM的CPU资源量(即CPU时间片的大小);能耗控制器306的输入为所有Web应用的平均响应时间,输出为需要调整的CPU频率大小;所有的控制算法均可以用C语言编写完成,运行在脚本程序中。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种能耗感知的云计算服务器资源在线管理方法,其特征在于,该方法包括负载均衡控制和能耗控制两部分协同运作;
所述负载均衡控制通过自适应调整分配给不同虚拟机的资源量来维持各虚拟机之间的负载均衡,进而使所有虚拟机可以得到近似一致的响应时间,具体包括如下步骤:
步骤101:自动采集得到运行于云计算服务器各个虚拟机上的Web应用的响应时间信息和云计算服务器分配给每个虚拟机的实时资源量大小;
步骤102:计算得到每个虚拟机所需的响应时间信息;
步骤103:对负载均衡问题进行建模,采用系统辨识的方法对响应时间和资源分配量之间的复杂关系进行建模;
步骤104:采用在线训练方法对模型参数进行实时更新;
步骤105:将负载均衡控制问题转化为鲁棒性动态优化控制问题,以此来建立能够反映网络负载动态变化的在线系统模型;
步骤106:采用带有随机策略的自适应控制算法进行求解;
步骤107:计算最优的资源分配方案;
步骤108:根据最优资源分配方案改变每个虚拟机的资源分配量,以保证在动态负载情况下运行在每个虚拟机上面Web应用的性能,并将最优资源分配方案发送到步骤104,用于下一周期的模型更新;
所述能耗控制通过动态改变物理CPU的频率来保持所有虚拟机的平均响应时间趋于理想水平,具体包括如下步骤:
步骤201:自动采集得到每个虚拟机上Web应用的响应时间和云计算服务器的物理CPU频率信息;
步骤202:同样采用系统辨识的方法对响应时间和物理CPU频率之间的非线性关系进行建模;
步骤203:为了适应网络动态负载情况,在能耗控制当中采用同样的在线训练方法对模型参数进行实时更新;
步骤204:采用同样的带有随机策略的自适应控制算法进行求解;
步骤205:对满足所有虚拟机性能要求的物理CPU频率大小进行计算,得到最优的CPU物理频率的调整量;
步骤206:通过云计算服务器自带的动态电压频率调节技术,将计算得到的最优CPU物理频率调整量作用于云计算服务器,以达到降低能耗的作用。
2.根据权利要求1所述的一种能耗感知的云计算服务器资源在线管理方法,其特征在于,所述在线训练方法可以为递归最小二乘法,所述自适应控制算法可以为线性二次型高斯控制算法。
3.一种能耗感知的云计算服务器资源在线管理系统,其特征在于,该系统包括两层结构:
第一层为负载均衡控制层,主要实现负载均衡控制算法,该层结构包括性能监控器、在线估计器A、负载均衡控制器、CPU资源分配器;该层结构可将内存、硬盘等其他资源作为额外的操控变量,通过建模不同类型的资源分配量和Web应用的性能指标来重新建立模型;
第二层为能耗控制层,主要实现节能控制算法,该层结构包括性能监控器、在线估计器B、能耗控制器、CPU频率调节器;当系统性能瓶颈转移为内存或者硬盘时,能耗控制器可以自动地把CPU的物理频率降低到最低档次,以达到节能的目标;
两层结构协同控制,共用同一性能监控器;由于多层Web应用负载模式的不同,系统的瓶颈可能在CPU、内存和硬盘等多种硬件资源之间转变,该系统可根据不同的负载变化进行灵活地扩展,最终在达到降低物理服务器耗电量的同时,也使运行在不同虚拟机上的web应用得到理想的响应时间。
4.根据权利要求3所述的一种能耗感知的云计算服务器资源在线管理系统,其特征在于,所述性能监控器用于监测运行在每个虚拟机上各个Web应用在上个周期内的性能指标如响应时间或吞吐量等信息,并周期性地将数据发送到在线估计器A。
5.根据权利要求3所述的一种能耗感知的云计算服务器资源在线管理系统,其特征在于,所述在线估计器A用于接收性能监控器监测到的性能指标以及上个周期CPU资源分配量信息,来构建资源—性能指标模型,然后使用系统辨识的方法来自适应地计算模型参数。
6.根据权利要求3所述的一种能耗感知的云计算服务器资源在线管理系统,其特征在于,所述负载均衡控制器首先按照高斯分布P~N(μ,σ2)概率生成一组资源—性能指标模型集合,其中,μ是估计参数的均值,σ2是对应的协方差矩阵,这些参数均可以从在线估计器A的估计结果中得到,负载均衡控制器通过优化资源—性能指标模型集合的性能,来得到最优资源分配方案。
7.根据权利要求3所述的一种能耗感知的云计算服务器资源在线管理系统,其特征在于,所述CPU资源分配器的工作原理类似于控制系统中的校正设备,按照负载均衡控制器计算得到的资源分配方案,强制把对应大小的CPU资源片分配给各个虚拟机,以使每个应用的响应时间接近于参考量。
8.根据权利要求3所述的一种能耗感知的云计算服务器资源在线管理系统,其特征在于,所述在线估计器B同样接收来自于性能监控器监测得到的性能指标信息以及服务器的物理CPU频率大小,并构建频率-性能指标模型,然后使用系统辨识方法来计算出模型参数。
9.根据权利要求3所述的一种能耗感知的云计算服务器资源在线管理系统,其特征在于,所述能耗控制器首先按照高斯分布P~N(μ,σ2)概率生成一组频率-性能指标集合,其中,μ是估计参数的均值,σ2是对应的协方差矩阵,这些参数均可以从在线估计器B的估计结果中得到,控制器通过优化频率-性能指标模型集合的性能,来得到最优CPU物理频率改变量。
10.根据权利要求3所述的一种能耗感知的云计算服务器资源在线管理系统,其特征在于,所述CPU频率调节器的工作原理类似于控制系统中的校正设备,按照能耗控制器计算得到的资源分配方案,强制改变云计算服务器物理CPU频率的大小,使所有应用的平均响应时间接近于参考量,并达到降低能耗的作用。
CN201611109067.4A 2016-12-06 2016-12-06 一种能耗感知的云计算服务器资源在线管理方法和系统 Withdrawn CN106648890A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611109067.4A CN106648890A (zh) 2016-12-06 2016-12-06 一种能耗感知的云计算服务器资源在线管理方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611109067.4A CN106648890A (zh) 2016-12-06 2016-12-06 一种能耗感知的云计算服务器资源在线管理方法和系统

Publications (1)

Publication Number Publication Date
CN106648890A true CN106648890A (zh) 2017-05-10

Family

ID=58818341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611109067.4A Withdrawn CN106648890A (zh) 2016-12-06 2016-12-06 一种能耗感知的云计算服务器资源在线管理方法和系统

Country Status (1)

Country Link
CN (1) CN106648890A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133106A (zh) * 2017-05-25 2017-09-05 深信服科技股份有限公司 一种numa系统优化方法及装置
CN107273181A (zh) * 2017-05-31 2017-10-20 西安电子科技大学 一种多层嵌套虚拟化结构及其任务分配方法
CN108021447A (zh) * 2017-11-28 2018-05-11 象翌微链科技发展有限公司 一种基于分布式数据确定最优资源策略的方法及系统
CN108845886A (zh) * 2018-07-27 2018-11-20 中南大学 基于相空间的云计算能耗优化方法和系统
CN109522129A (zh) * 2018-11-23 2019-03-26 快云信息科技有限公司 一种资源动态均衡方法、装置及相关设备
CN109783219A (zh) * 2017-11-10 2019-05-21 北京信息科技大学 一种云资源优化调度方法及装置
CN110290556A (zh) * 2019-05-15 2019-09-27 江苏大学 一种基于最优控制变分法的资源负载均衡调度方法
CN110288613A (zh) * 2019-06-12 2019-09-27 中国科学院重庆绿色智能技术研究院 一种超高像素的组织病理图像分割方法
CN110597619A (zh) * 2019-08-07 2019-12-20 山东中创软件商用中间件股份有限公司 一种负载均衡方法、负载均衡装置和负载均衡服务器
CN110610449A (zh) * 2018-06-15 2019-12-24 伊姆西Ip控股有限责任公司 处理计算任务的方法、设备和计算机程序产品
CN110743164A (zh) * 2019-10-21 2020-02-04 南开大学 一种用于降低云游戏中响应延迟的动态资源划分方法
CN112764879A (zh) * 2021-01-14 2021-05-07 深圳市科思科技股份有限公司 负载均衡方法、电子设备及计算机可读存储介质
CN113268130A (zh) * 2021-04-02 2021-08-17 北京比格大数据有限公司 服务器供电方法、存储介质、计算机设备
CN117076137A (zh) * 2023-10-16 2023-11-17 麒麟软件有限公司 虚拟化下的cpu动态调频方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156665A (zh) * 2011-04-13 2011-08-17 杭州电子科技大学 一种虚拟化系统竞争资源差异化服务方法
US8219359B2 (en) * 2008-06-25 2012-07-10 Nec Corporation Performance evaluating apparatus
CN103064744A (zh) * 2012-12-27 2013-04-24 北京仿真中心 一种基于SLA的面向多层Web应用的资源优化方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8219359B2 (en) * 2008-06-25 2012-07-10 Nec Corporation Performance evaluating apparatus
CN102156665A (zh) * 2011-04-13 2011-08-17 杭州电子科技大学 一种虚拟化系统竞争资源差异化服务方法
CN103064744A (zh) * 2012-12-27 2013-04-24 北京仿真中心 一种基于SLA的面向多层Web应用的资源优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
史晓雨: "数据中心中自适应绿色控制技术研究及其应用", 《中国博士学位论文全文数据库 信息科学辑》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133106A (zh) * 2017-05-25 2017-09-05 深信服科技股份有限公司 一种numa系统优化方法及装置
CN107273181A (zh) * 2017-05-31 2017-10-20 西安电子科技大学 一种多层嵌套虚拟化结构及其任务分配方法
CN109783219A (zh) * 2017-11-10 2019-05-21 北京信息科技大学 一种云资源优化调度方法及装置
CN108021447A (zh) * 2017-11-28 2018-05-11 象翌微链科技发展有限公司 一种基于分布式数据确定最优资源策略的方法及系统
CN108021447B (zh) * 2017-11-28 2021-08-03 象翌微链科技发展有限公司 一种基于分布式数据确定最优资源策略的方法及系统
CN110610449A (zh) * 2018-06-15 2019-12-24 伊姆西Ip控股有限责任公司 处理计算任务的方法、设备和计算机程序产品
CN110610449B (zh) * 2018-06-15 2023-09-22 伊姆西Ip控股有限责任公司 处理计算任务的方法、设备和计算机程序产品
CN108845886A (zh) * 2018-07-27 2018-11-20 中南大学 基于相空间的云计算能耗优化方法和系统
CN109522129A (zh) * 2018-11-23 2019-03-26 快云信息科技有限公司 一种资源动态均衡方法、装置及相关设备
CN110290556B (zh) * 2019-05-15 2022-10-25 江苏大学 一种基于最优控制变分法的资源负载均衡调度方法
CN110290556A (zh) * 2019-05-15 2019-09-27 江苏大学 一种基于最优控制变分法的资源负载均衡调度方法
CN110288613A (zh) * 2019-06-12 2019-09-27 中国科学院重庆绿色智能技术研究院 一种超高像素的组织病理图像分割方法
CN110288613B (zh) * 2019-06-12 2022-09-02 中国科学院重庆绿色智能技术研究院 一种超高像素的组织病理图像分割方法
CN110597619A (zh) * 2019-08-07 2019-12-20 山东中创软件商用中间件股份有限公司 一种负载均衡方法、负载均衡装置和负载均衡服务器
CN110743164A (zh) * 2019-10-21 2020-02-04 南开大学 一种用于降低云游戏中响应延迟的动态资源划分方法
CN112764879A (zh) * 2021-01-14 2021-05-07 深圳市科思科技股份有限公司 负载均衡方法、电子设备及计算机可读存储介质
CN113268130A (zh) * 2021-04-02 2021-08-17 北京比格大数据有限公司 服务器供电方法、存储介质、计算机设备
CN117076137A (zh) * 2023-10-16 2023-11-17 麒麟软件有限公司 虚拟化下的cpu动态调频方法
CN117076137B (zh) * 2023-10-16 2024-01-26 麒麟软件有限公司 虚拟化下的cpu动态调频方法

Similar Documents

Publication Publication Date Title
CN106648890A (zh) 一种能耗感知的云计算服务器资源在线管理方法和系统
Tang et al. Efficient auto-scaling approach in the telco cloud using self-learning algorithm
CN109491760B (zh) 一种高效能数据中心云服务器资源自主管理方法
Sun et al. MARVEL: Enabling controller load balancing in software-defined networks with multi-agent reinforcement learning
CN111064633B (zh) 一种云边协同电力信息通信设备自动化测试资源分配方法
CN104808770B (zh) 基于动态调频的数据中心能耗管理方法及系统
Duggan et al. A multitime‐steps‐ahead prediction approach for scheduling live migration in cloud data centers
WO2019014080A1 (en) SYSTEM AND METHOD FOR APPLYING AUTOMATIC LEARNING ALGORITHMS FOR CALCULATING HEALTH SCORES FOR WORKLOAD PLANNING
Zhang et al. Electricity bill capping for cloud-scale data centers that impact the power markets
Sui et al. Virtual machine scheduling strategy based on machine learning algorithms for load balancing
CN108664378A (zh) 一种微服务最短执行时间的优化方法
Rajabzadeh et al. Energy-aware framework with Markov chain-based parallel simulated annealing algorithm for dynamic management of virtual machines in cloud data centers
Moreno et al. Neural network-based overallocation for improved energy-efficiency in real-time cloud environments
CN108121312B (zh) 基于一体化水电管控平台的arv负载均衡系统及方法
Thonglek et al. Improving resource utilization in data centers using an LSTM-based prediction model
Kulshrestha et al. An efficient host overload detection algorithm for cloud data center based on exponential weighted moving average
Singh et al. Ensemble learning for large-scale workload prediction
Liumei et al. Towards energy efficient cloud: an optimized ant colony model for virtual machine placement
US10054997B2 (en) Multivariable control for power-latency management to support optimization of data centers or other systems
Song et al. A deep reinforcement learning-based task scheduling algorithm for energy efficiency in data centers
CN110191015A (zh) 基于cpi指标的云服务性能智能预测方法和装置
Zhang et al. A model based load-balancing method in IaaS cloud
Bogdan et al. Energy-efficient computing from systems-on-chip to micro-server and data centers
CN110399203A (zh) 一种基于弗雷歇距离的云计算虚拟机迁移方法
Mao et al. A self-adaptive prediction algorithm for cloud workloads

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20170510

WW01 Invention patent application withdrawn after publication