CN103425535A - 云环境下的敏捷弹性伸缩方法 - Google Patents

云环境下的敏捷弹性伸缩方法 Download PDF

Info

Publication number
CN103425535A
CN103425535A CN2013102246942A CN201310224694A CN103425535A CN 103425535 A CN103425535 A CN 103425535A CN 2013102246942 A CN2013102246942 A CN 2013102246942A CN 201310224694 A CN201310224694 A CN 201310224694A CN 103425535 A CN103425535 A CN 103425535A
Authority
CN
China
Prior art keywords
virtual machine
load
elastic telescopic
prediction
quick
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013102246942A
Other languages
English (en)
Other versions
CN103425535B (zh
Inventor
尹建伟
杨勇
吴朝晖
邓水光
李莹
吴健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201310224694.2A priority Critical patent/CN103425535B/zh
Publication of CN103425535A publication Critical patent/CN103425535A/zh
Application granted granted Critical
Publication of CN103425535B publication Critical patent/CN103425535B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及云计算的弹性计算领域,公开了一种云环境下的敏捷弹性伸缩方法,具体步骤如下:根据数据中心的历史负载数据对下个时间片进行负载预测,所述负载预则使用ARIMA模型和ARMA模型,以所述时间片为周期以实现负载预测;包括对虚拟机的保存操作和恢复操作,保存操作将虚拟机的内存状态进行保存以实现虚拟机的挂起,随后通过恢复操作恢复虚拟机的内存状态恢复虚拟机的使用;利用所述负载预测步骤得到的数据中心的负载预测,应用所述虚拟机快速供给步骤将一个或者多个应用就绪的虚拟机挂起或者快速投入使用,实现对数据中心应用集群的资源的动态调整。本发明的优点在于,根据应用集群当前状况实时地调整集群规模大小,减少数据中心的能耗。

Description

云环境下的敏捷弹性伸缩方法
技术领域
本发明涉及云计算的弹性计算领域,特别涉及一种云环境下的敏捷弹性伸缩方法。
背景技术
随着云计算时代的到来,数据中心的高能耗逐渐成为一个突出的问题。自2011年以来,全球数据中心的能源消耗已经接近100,000,000,00KWh,并产生了超过40,568,000吨的CO2,然而大部分数据中心的资源利用率只有20~30%。云计算将数据中心的资源以一种量入为出pay as you go)的方式租赁给用户,允许用户根据当前的需求定制适量的资源。弹性伸缩技术,使得应用集群的规模可以根据应用的实施负载进行动态调整,从而在保证服务质量的情况下最大程度低节省资源。结合服务器整合技术(采用虚拟机迁移技术,将资源利用率较低的服务器上的虚拟机整合到一起,从而关闭部分服务器),能极大地提高服务器的资源利用率,从而减少资源消耗。
然而当前大部分的应用需要在很多方面保证很高的服务质量,例如响应时间、可靠性、吞吐量等。不能保证服务质量,将意味着用户的流失,从而导致企业收入的下降。然而应用负载是很难准确预测的,虽然它会随着时间、星期、季节呈现一定的周期性变化,但同时具有很大的随机性。当前大部分精度较高的预测算法,时间开销都较高。同时分配部署资源也有一定的开销,虚拟机从特定的镜像启动,直至应用投入使用需要一定的时间(称为冷却时间,大约3到10分钟),在这段时间内服务质量很难得到保证。因此,在保证SLA的情况下最小化开销,很具挑战性。
尽管目前存在一些弹性伸缩的专利,然而大都根据资源负载进行资源调整,忽略了应用访问量和资源需求的直接关系。例如专利号为EP2570922A1的专利,提出了《一种管理弹性集群的方法和系统》。该方法根据虚拟机当前的负载进行弹性伸缩,当虚拟机负载高于某个阈值时则增加虚拟机;当虚拟机负载低于某个阈值时,移除一部分虚拟机。并且根据虚拟机进入集群的时间分配优先级,进入越晚的虚拟机,优先级越小。系统以优先级最小的虚拟机负载作为伸缩条件,以减少监控开销。然而基于资源负载驱动的弹性伸缩策略,存在一定的滞后性,在冷却时间内无法保证服务质量。
发明内容
本发明针对现有技术中弹性伸缩策略存在的滞后性,无法在冷却时间内保证服务质量的缺点,提供了一种新型的云环境下的敏捷弹性伸缩方法。
为实现上述目的,本发明可采取下述技术方案:
云环境下的敏捷弹性伸缩方法,具体步骤如下:
负载预测步骤:根据数据中心的历史负载数据对下个时间片进行负载预测,所述负载预则使用ARIMA模型和ARMA模型以所述时间片为周期以实现负载预测;
虚拟机快速供给步骤:包括对虚拟机的保存操作和恢复操作,保存操作将虚拟机的内存状态进行保存以实现虚拟机的挂起,随后通过恢复操作恢复虚拟机的内存状态恢复虚拟机的使用;
敏捷弹性伸缩步骤:利用所述负载预测步骤得到的数据中心的负载预测,应用所述虚拟机快速供给步骤将一个或者多个应用就绪的虚拟机挂起或者快速投入使用,实现对数据中心应用集群的资源的动态调整。
作为优选,所述负载预测步骤包括一级负载预测和二级负载预测,其中,一级负载预测以1h为周期,二级负载预测以1min为周期。
作为优选,所述一级负载预测具体包括以下步骤:
1-1)获取历史负载数据,历史负载数据从负载群衡器中直接获取或者通过分析日志文件得到;
1-2)计算样本值,对收集到的最近一个时间片的历史负载数据进行排序,将其分位数统计量作为新的负载样本并将新的负载样本放入历史负载数据中;
1-3)样本平稳化,即取出最近的多个时间片的负载样本作为序列w,对序列w进行周期性差分运算后,进行查封运算,直至得到的序列w为平稳序列;
1-4)将步骤3得到的平稳序列w作为训练数据,根据AIC准则进行ARMA定阶后,通过最大似然估计或者最小二乘法确定公式中的未知参数;
1-5)根据步骤4的公式得到预测样本wt
1-6)根据公式
Figure BDA00003307657700032
1≤k<t对上述预测样本wt进行复原操作得到▽Sxt后,得到预测值xt=xt-S+▽Sxt
作为优选,所述二级负载预测采用公式r(t+1)=βr(t)+λ(t-1)+(1-β-λ)r(t-2)计算预测值,其中β=0.8,λ=0.15。
作为优选,所述敏捷弹性伸缩步骤具体包括以下步骤:
一级弹性伸缩:
2-1)根据负载预测步骤得到的预测结果计算资源需求
Figure BDA00003307657700033
其中f为单个服务器的最大并发数;
2-2)如果R(T+1)>R(T),则扩大虚拟机队列,启动数量为ΔR=R(T+1)-R(T)的虚拟机并初始化虚拟机的应用,然后对虚拟机执行挂起操作,将挂起的虚拟机状态保存到文件,执行二级弹性伸缩步骤;
2-3)如果R(T+1)<αR(T),则缩小虚拟机队列,删除数量为ΔR=R(T+1)-R(T)的挂起的虚拟机执行二级弹性伸缩步骤;
二级弹性伸缩:
3-1)根据二级负载预测得到的预测负载Pw;
3-2)计算资源需求
Figure BDA00003307657700034
3-3)如果r(t+1)>r(t),则执行伸展操作,即从被挂起的虚拟机队列VM中恢复Δr=r(t+1)-r(t)个虚拟机,执行步骤2-5,其中若Δr>queueSize,则Δr=queueSize;
3-4)如果r(t+1)<βr(t),则执行收缩操作,即将数量为Δr=r(t)-r(t+1)的虚拟机退出应用集群,冷却一段时间后,对退出应用集群的虚拟机执行挂起操作,放入被挂起的虚拟机队列VM,执行步骤2-5;
3-5)如果二级负载预测的时间片尚未耗尽,继续执行步骤2-1;
3-6)如果收到终止信号,终止敏捷弹性伸缩步骤;否则执行负载预测步骤。
负载预测主要根据应用历史负载数据预测出下个时间片的负载,以便提前进行资源分配。一级预测以周期T=1h为单位,采用ARIMA模型,充分了利用应用负载的周期性和趋势性规律。二级预测以周期T=1min为单位,采用简单的AR(3)模型,实现快速的负载预测。
自回归滑动平均(Auto regression moving average)模型ARMA,具有如下结构:
Figure BDA00003307657700041
其中εt为零均值随机干扰序列,缺省默认条件,ARMA(p,q)可写为:
Figure BDA00003307657700042
引进延迟算子,ARMA(p,q)可简记为
Φ(B)xt=Θ(B)εt   (3)
其中
Figure BDA00003307657700043
为p阶自回归系数多项式
Θ(B)=1-θ1B-...-θpBp   (4)
采用最小二乘估计、最大似然估计可以确定公式(2)中的参数,根据AIC准则可以对ARMA进行定阶。
上述的ARMA模型要求时间序列式平稳的,然后实际中的时间序列往往有三个特性:趋势性、季节性与非平稳性。我们可以采用差分方法,使得变换后的序列为平稳序列,对ARIMA模型进行差分处理去周期化后即可将其转换为ARMA模型,然后用ARMA模型进行处理。
设Xt,t=0,±1,±2...是非平稳序列,若存在整数d,使得序列
dXt=Wt   (5)
而Wt,t=0,±1,±2...是ARMA(p,q)序列,则称Xt为ARIMA(p,d,q)。此时Xt满足
Φ(B)▽dXt=Θ(B)Et   (6)
若初值X1,X2,...Xd已知,由
Wt=▽dXt,t=d+1.d+2,...,n   (7)
可以复原Xt,下面分别给出常用的d=1时的复原公式及预测公式
X t = X 1 + &Sigma; j t - 1 W j + 1 = X k + &Sigma; j = 1 t - k W j + k , 1 &le; k < t - - - ( 8 )
X ^ k ( m ) = X ^ k ( m - 1 ) + W ^ k ( m ) = X k + &Sigma; j = 1 m W ^ k ( j ) - - - ( 9 )
大多数的Web用用负载具有明显的周期规律性,可以认为是季节性时间序列,其周期S=24h,应采用季节性模型进行处理。对于周期为S的序列,可进行差分运算
&dtri; x D X t = ( 1 - B s ) D X t - - - ( 10 )
则周期为S的序列Xt满足下列模型:
&Phi; ( B S ) &dtri; S D X t = &Theta; ( B S ) E t - - - ( 11 )
该模型是一种稀系数模型(其阶数可用(p,d,q)S表示),它反映了序列相邻时刻与相隔为周期S的时刻之间复杂变化的规律。
在二级预测中,为了提高预测效率,我们采用了简单的二AR(3)模型,负载预测公式如下所示(其中β=0.8,λ=0.15):
r(t+1)=βr(t)+λ(t-1)+(1-β-λ)r(t-2)   (12)
目前的大部分研究都集中在伸缩策略的制定上,然而延迟时间对云应用的服务质量有很大的影响。例如,获取一个Amazon EC2实例需要几分钟时间,后续还有虚拟机启动和应用初始化时间。对于复杂的应用,初始化时间会很长,这使得延迟时间可能高达十几分钟。然而目前的虚拟机保存(Save)操作会对将虚拟机的内存状态保存下来。随后通过恢复(Restore)操作可以读取内存文件,让应用直接投入使用,而不用进行操作系统和应用的初始化。而恢复操作的时间仅和虚拟机监控器读取内存文件的速度相关,通常只需几秒钟。
冷却时间TC,策略制定完毕至应用投入时间所需时间。针对启动和恢复虚拟机的计算公式分别如下:
TCS=Td+TS+TA   (13)
TCR=TR   (14)
延迟时间,从制定伸缩策略从指定伸缩策略,直至虚拟机部署并投入使用所需时间,计算公式如下:
TD=TM+TC   (15)
下表1为符号说明
Figure BDA00003307657700061
敏捷伸缩借助ARIMA在较大的时间间隔T(1小时)上进行一级预测,以利用负载数据的周期性,并调用Cloud API准备一些应用就绪的挂起虚拟机,以便在二级预测时快速投入使用。二级预测,我们以较小的时间间隔t(1分钟)对应用资源进行动态分配与释放。任意时刻的资源需求
Figure BDA00003307657700062
其中w为当前请求数,f为单个虚拟机能处理最大请求数(可以通过压力测试得到s)。然而资源低估将导致SLO违背,在企业应用中将造成很大的损失。在资源分配时,根据预测资源需求适当多分配一点资源,可以有效地减少资源低估。在收缩操作时,我们采用Lazy策略,引入迟滞因子h,以避免过度收缩。
本发明由于采用了以上技术方案,具有显著的技术效果:
引入虚拟机挂起机制,加快虚拟机的供给速度,减少虚拟机挂起后的恢复时间;基于ARMA算法设计的敏捷弹性伸缩算法,实现了细粒度的弹性伸缩;通过实现敏捷弹性伸缩算法节省数据中心服务器集群所消耗的资源,同时可以令数据中心的服务质量得到显著的提升。
附图说明
图1为一级负载预测的流程示意图。
图2为本发明所述敏捷弹性伸缩方法的流程示意图。
图3为周期为1h时的应用负载数据统计图。
图4为周期为5min时的应用负载数据统计图。
图5(a)为以95%分位数进行采样所得负载预测统计图。
图5(b)为以均值进行采样所得负载预测统计图。
图5(c)为不同采样方法所得数据的预测误差统计图。
图6(a)为采用公式(12)以95%分位数进行采样所得负载预测统计图。
图6(b)为采用公式(12)以均值进行采样所得负载预测统计图。
图6(c)为采用公式(12)的负载预测误差统计图。
图7为二级预测不同时间片统计的负载预测误差统计图。
图8为一级预测不同时间片的时间开销统计图。
图9为一级预测的资源分配结果统计图。
图10为增加不同额外资源时的SLA错误统计图。
图11(a)为二级预测的资源分配结果统计图。
图11(b)为二级预测的资源分配结果(3小时)统计图。
图12为不同的弹性伸缩方法的资源消耗对比。
图13为不同的弹性伸缩方法的SLA误差对比。
具体实施方式
下面结合实施例对本发明作进一步的详细描述。
实施例1
一、基于ARIMA模型的一级预测算法,它利用应用负载的周期性和趋势性预测下个时间片的负载,算法流程图如图1所示,具体操作步骤如下:
步骤1.1、获取应用负载数据。可以直接从负载均衡器中获取,或通过分析日志文件得到。
步骤1.2、计算样本值。对收集到的最近一个时间片的负载数据进行排序,将其分位数统计量作为新的样本,放入历史负载。
步骤1.3、样本平稳化。取出最近N个时间片的负载样本,按照公式(10)进行周期性差分运算。然后按照公式(5)进行差分运算,直至Wt为平稳序列。
步骤1.4、将Wt作为训练数据,根据AIC准则对ARMA定阶。然后通过最大似然估计,或最小二乘法确定公式(2)的未知参数。
步骤1.5、根据公式(2)得到预测样本wt
步骤1.6、根据公式(8)进行复原操作得到▽Sxt,xt=xt-S+▽Sxt,即预测值。
二、基于负载预测的敏捷弹性伸缩算法,它主要根据二级预测的结果对应用集群资源进行动态调整,算法流程图如图2所示,具体步骤如下:
步骤2:一级弹性伸缩
2.1:根据步骤1的预测结果计算资源需求
Figure BDA00003307657700081
其中f为单个Web服务器的最大并发数(可通过压力测试获得)。
2.2:如果R(T+1)>R(T),则扩大队列,启动ΔR=R(T+1)-R(T)的虚拟机,初始化应用,然后执行挂起操作,将虚拟机状态保到文件,以便快速恢复。然后转步骤3
2.3:如果R(T+1)<αR(T),则将队列缩小至R(T+1),删除多余挂起虚拟机,转步骤3;否则,直接转步骤3
步骤3、二级伸缩具体过程如下:
3.1:根据公式(12)进行二级预测,得到预测负载Pw;
3.2:计算资源需求
3.3:如果r(t+1)>r(t),则执行伸展操作,从VM队列恢复Δr=r(t+1)-r(t)的虚拟机(若Δr>queueSize,则Δr=queueSize),转步骤3.5
3.4:如果r(t+1)<βr(t),则执行收缩操作,将Δr=r(t)-r(t+1)退出应用集群冷却一段时间,然后执行挂起操作,放入VM队列,转步骤3.5;否则直接转步骤3.5;
3.5:如果二级预测时间片未用完,则转步骤3.1;否则执行步骤3.6;
3.6:如果收到终止信号,则终止该算法;否则转步骤1。
实验例1二级预测算法的效果验证
原始的应用负载数据记录了每秒的请求数,我们针对不同时间段进行平均值和分位数的统计。如图3所示,我们对每个小时进行了平均值、90%、95%、99%分位数统计。由统计图可以看出,分位数统计值在大部分时间比平均值高出许多,更能反映某个时间段应用的实际资源需求。
图4是上述应用负载中某三个小时的数据(以5分钟单位进行均值和分位数的统计)。可以看出,在1个小时内应用的负载也有较大的波动。若以小时为单位预测的负载值进行预测,将会给该时间段分配最大需求的资源量,导致资源浪费。细粒度的预测,将能更好地拟合负载曲线,有望进一步减少资源消耗。
利用前3天数据作为样本,采用季节性ARIMA模型对后4天进行负载预测结果如图5所示。其中,图5(a)是95%分数位时的负载预测,图5(b)为均值负载预测,5(c)是不同采样方法所得数据的预测误差,可以看出除了对99%分位数统计的应用负载预测误差较大外,其它方法预测误差都保持在10%以下,且预测误差随着分位数的增加而变大。由于样本数有限,过大的分位数统计会导致样本数据更容易受随机干扰数据影响,导致统计信息丢失,从而导致预测精度下降。而过低的分位数,则不能反映某段时间应用的真实资源需求,可以看出95%分位数在二者间做了很好的平衡。
图6是采用公式(12)进行负载预测的结果,图6(a)为95%分位数负载预测,图6(b)为均值负载预测,图6(c)为其均值误差统计图。对于95%分位数的负载预测,总体误差为4.9%,资源低估误差为2.1%,取得了较好的预测精度。图7是公式(12)对不同时间片的统计样本数据进行预测的均值误差,可以看出随着时间片的增大,其预测误差也迅速增长,对于1h时间片统计数据的预测误差高达20.16%。因此,该方法虽然效率高(μs级预测),但不适用于长时间片的预测。
图8给出了ARIMA在不同时间片下的预测时间开销,可以看出其时间开销随着时间片的缩短呈现指数级增长,在10分钟时间片的预测开销超过了10分钟,已经不能用于弹性伸缩系统。
实验例2敏捷弹性伸缩方法的验证效果
采用周期T=1h的一级预测(95%分位数),结合负载/资源模型得到的资源分配结果如图9,可以看出预测资源较好地拟合了负载曲线。然而为了减少资源低估导致的SLA错误,通常需要根据预测结果分配一些额外的资源。图10为增加不同比例的额外资源时,相应的SLA错误。可以看出,不采用额外资源时,仅能保证97.374%的服务质量,增加50%的额外资源可达99.5%的服务质量。
然而上述以周期T=1h的粗粒度资源分配,为了保证服务质量,会以该时间段的最大负载分配资源,会造成一定的资源浪费。引入挂起虚拟机以及二级预测,运用AAS算法(α1=50%,α2=20%,h=0.8)进行细粒度弹性伸缩,结果如图10所示。其中图11是针对某3小时负载的资源分配结果,可以看出敏捷弹性伸缩算法更好地拟合了负载曲线,进一步地节省了资源开销。
图12给出了在提供不同比例的额外资源情况下,常规弹性伸缩和敏捷弹性伸缩的资源消耗,可以看出敏捷弹性伸缩可以进一步节省资源。图13给出了两种方法的LSA违背对比结果,可以看出敏捷伸缩有效地提升了服务质量。为了达到99.5%的服务质量,常规弹性伸缩消耗了1030VM.h(α1=50%),而敏捷弹性伸缩仅消耗736VM.h(α1=α2=15%),754VM.h(α1=50%,α2=20%),节省了
Figure BDA00003307657700101
左右的资源。并且对于网易数据集,常规弹性伸缩未能达到99.9%的服务质量,而敏捷弹性伸缩仅需783.5VM.h(α1=50%,α2=20%)的资源消耗。
弹性伸缩能够帮助云服务提供商在保证用户QOS需求的情况下为最大限度的客户提供服务,同时为用户使用资源保持较低的开销。当前的弹性伸缩方法,由于受冷却时间的限制,大都采用粗粒度的资源调整方法,存在一定的资源浪费。为此专利提出敏捷弹性伸缩算法,采用挂起虚拟机,加速虚拟机的供给,并利用二级预测实现了细粒度的弹性伸缩。实验表明,敏捷弹性伸缩进一步节省了资源,服务质量也得到了一定的提升。
总之,以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所作的均等变化与修饰,皆应属本发明专利的涵盖范围。

Claims (5)

1.一种云环境下的敏捷弹性伸缩方法,具体步骤如下:
负载预测步骤:根据数据中心的历史负载数据对下个时间片进行负载预测,所述负载预则使用ARIMA模型和ARMA模型,以所述时间片为周期以实现负载预测;
虚拟机快速供给步骤:包括对虚拟机的保存操作和恢复操作,保存操作将虚拟机的内存状态进行保存以实现虚拟机的挂起,随后通过恢复操作恢复虚拟机的内存状态恢复虚拟机的使用;
敏捷弹性伸缩步骤:利用所述负载预测步骤得到的数据中心的负载预测,应用所述虚拟机快速供给步骤将一个或者多个应用就绪的虚拟机挂起或者快速投入使用,实现对数据中心应用集群的资源的动态调整。
2.根据权利要求1所述的敏捷弹性伸缩方法,其特征在于,所述负载预测步骤包括一级负载预测和二级负载预测,其中,一级负载预测以1h为周期,二级负载预测以1min为周期。
3.根据权利要求2所述的敏捷弹性伸缩方法,其特征在于,所述一级负载预测具体包括以下步骤:
1-1)获取历史负载数据,历史负载数据从负载群衡器中直接获取或者通过分析日志文件得到;
1-2)计算样本值,对收集到的最近一个时间片的历史负载数据进行排序,将其分位数统计量作为新的负载样本并将新的负载样本放入历史负载数据中;
1-3)样本平稳化,即取出最近的多个时间片的负载样本作为序列w,对序列w进行周期性差分运算后,进行查封运算,直至得到的序列w为平稳序列;
1-4)将步骤3得到的平稳序列w作为训练数据,根据AIC准则进行ARMA定阶后,通过最大似然估计或者最小二乘法确定公式
中的未知参数;
1-5)根据步骤4的公式得到预测样本wt
1-6)根据公式1≤k<t对上述预测样本wt进行复原操作得到▽Sxt后,得到预测值xt=xt-S+▽Sxt
4.根据权利要求2所述的敏捷弹性伸缩方法,其特征在于,所述二级负载预测采用公式r(t+1)=βr(t)+λ(t-1)+(1-β-λ)r(t-2)计算预测值,其中β=0.8,λ=0.15。
5.根据权利要求2所述的敏捷弹性伸缩方法,其特征在于,所述敏捷弹性伸缩步骤具体包括以下步骤:
一级弹性伸缩:
2-1)根据负载预测步骤得到的预测结果计算资源需求
Figure FDA00003307657600022
其中f为单个服务器的最大并发数;
2-2)如果R(T+1)>R(T),则扩大虚拟机队列,启动数量为ΔR=R(T+1)-R(T)的虚拟机并初始化虚拟机的应用,然后对虚拟机执行挂起操作,将挂起的虚拟机状态保存到文件,执行二级弹性伸缩步骤;
2-3)如果R(T+1)<αR(T),则缩小虚拟机队列,删除数量为ΔR=R(T+1)-R(T)的挂起的虚拟机执行二级弹性伸缩步骤;
二级弹性伸缩:
3-1)根据二级负载预测得到的预测负载Pw;
3-2)计算资源需求
Figure FDA00003307657600023
3-3)如果r(t+1)>r(t),则执行伸展操作,即从被挂起的虚拟机队列VM中恢复Δr=r(t+1)-r(t)个虚拟机,执行步骤3-5,其中若Δr>queueSize,则Δr=queueSize;
3-4)如果r(t+1)<βr(t),则执行收缩操作,即将数量为Δr=r(t)-r(t+1)的虚拟机退出应用集群,冷却一段时间后,对退出应用集群的虚拟机执行挂起操作,放入被挂起的虚拟机队列VM,执行步骤3-5;
3-5)如果二级负载预测的时间片尚未耗尽,继续执行步骤3-1;
3-6)如果收到终止信号,终止敏捷弹性伸缩步骤;否则执行负载预测步骤。
CN201310224694.2A 2013-06-05 2013-06-05 云环境下的敏捷弹性伸缩方法 Active CN103425535B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310224694.2A CN103425535B (zh) 2013-06-05 2013-06-05 云环境下的敏捷弹性伸缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310224694.2A CN103425535B (zh) 2013-06-05 2013-06-05 云环境下的敏捷弹性伸缩方法

Publications (2)

Publication Number Publication Date
CN103425535A true CN103425535A (zh) 2013-12-04
CN103425535B CN103425535B (zh) 2016-08-10

Family

ID=49650325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310224694.2A Active CN103425535B (zh) 2013-06-05 2013-06-05 云环境下的敏捷弹性伸缩方法

Country Status (1)

Country Link
CN (1) CN103425535B (zh)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984602A (zh) * 2014-05-20 2014-08-13 华为技术有限公司 一种vm资源调度方法、装置及系统
CN104135525A (zh) * 2014-07-31 2014-11-05 广州杰赛科技股份有限公司 云平台elb组件的资源扩展方法和装置
CN104639626A (zh) * 2015-01-28 2015-05-20 华侨大学 一种多级负载预测与云资源弹性配置方法与监控配置系统
CN104768022A (zh) * 2014-12-31 2015-07-08 安科智慧城市技术(中国)有限公司 一种视频转码系统的资源调度方法及装置
CN105100168A (zh) * 2014-05-21 2015-11-25 北京大学 一种基于应用执行单元的PaaS请求分发机制
CN105094979A (zh) * 2014-05-21 2015-11-25 北京大学 一种基于应用特征的PaaS弹性资源管理机制
CN105119952A (zh) * 2015-07-07 2015-12-02 北京京东尚科信息技术有限公司 云平台下自动弹性地分配资源的方法和系统
CN105450716A (zh) * 2014-09-25 2016-03-30 阿里巴巴集团控股有限公司 动态业务分发方法及系统
CN106161525A (zh) * 2015-04-03 2016-11-23 阿里巴巴集团控股有限公司 一种多集群管理方法与设备
CN106164864A (zh) * 2014-03-31 2016-11-23 微软技术许可有限责任公司 服务的预测负载伸缩
CN106161485A (zh) * 2015-03-23 2016-11-23 腾讯科技(深圳)有限公司 一种基础服务集群的资源调度方法、装置和系统
CN106201718A (zh) * 2016-07-05 2016-12-07 北京邮电大学 一种基于负载预测的云计算资源动态伸缩方法
CN106293868A (zh) * 2015-05-15 2017-01-04 苏宁云商集团股份有限公司 一种云计算环境中虚拟机扩缩容方法及扩缩容系统
CN106844180A (zh) * 2017-02-07 2017-06-13 山东浪潮云服务信息科技有限公司 一种OpenStack平台计算资源的监控预测方法
WO2017128980A1 (zh) * 2016-01-29 2017-08-03 华为技术有限公司 云平台中管理资源的方法和装置
CN107329797A (zh) * 2016-04-28 2017-11-07 华为技术有限公司 一种实例弹性伸缩方法、实例管理模块以及计算设备
CN107426026A (zh) * 2017-07-31 2017-12-01 山东省计算中心(国家超级计算济南中心) 一种基于eemd‑arima的云计算服务器负载短期预测方法
CN107451694A (zh) * 2017-08-03 2017-12-08 重庆大学 一种用于移动系统中上下文感知与自适应的应用预测方法
WO2017214986A1 (zh) * 2016-06-17 2017-12-21 华为技术有限公司 一种云应用伸缩方法及装置
CN107682409A (zh) * 2017-09-13 2018-02-09 厦门集微科技有限公司 一种集群资源预伸缩方法及装置
CN107911399A (zh) * 2017-05-27 2018-04-13 广东网金控股股份有限公司 一种基于负载预测的弹性伸缩方法及系统
CN108156212A (zh) * 2017-06-29 2018-06-12 广东网金控股股份有限公司 一种基于用户感知的弹性伸缩方法及系统
CN108632365A (zh) * 2018-04-13 2018-10-09 腾讯科技(深圳)有限公司 服务资源调整方法、相关装置和设备
CN108920153A (zh) * 2018-05-29 2018-11-30 华南理工大学 一种基于负载预测的Docker容器动态调度方法
CN109032914A (zh) * 2018-09-06 2018-12-18 掌阅科技股份有限公司 资源占用数据预测方法、电子设备、存储介质
CN109460301A (zh) * 2018-09-07 2019-03-12 中南大学 一种流数据负载的弹性资源配置方法及系统
CN109800075A (zh) * 2017-11-16 2019-05-24 航天信息股份有限公司 集群管理方法及装置
CN109992358A (zh) * 2019-04-10 2019-07-09 北京隆普智能科技有限公司 一种预加载虚拟机的方法及其系统
WO2019144777A1 (zh) * 2018-01-24 2019-08-01 北京金山云网络技术有限公司 报文转发方法、转发装置、服务器及存储介质
CN110209468A (zh) * 2019-05-24 2019-09-06 北京百度网讯科技有限公司 用于启动虚拟机的方法、装置、设备和介质
CN110825520A (zh) * 2019-10-18 2020-02-21 山东省计算中心(国家超级计算济南中心) 一种实现资源高效利用的集群极速弹性伸缩方法
CN110928634A (zh) * 2018-09-19 2020-03-27 阿里巴巴集团控股有限公司 数据处理方法、装置及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080033991A1 (en) * 2006-08-03 2008-02-07 Jayanta Basak Prediction of future performance of a dbms
CN102135914A (zh) * 2011-04-02 2011-07-27 北京大学 一种可自动调节参数的云计算系统负载预测方法
CN102236582A (zh) * 2011-07-15 2011-11-09 浙江大学 虚拟化集群负载在多台物理机中均衡分配的方法
CN102331949A (zh) * 2011-10-12 2012-01-25 华为技术有限公司 一种虚拟机内存快照生成和恢复方法、装置及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080033991A1 (en) * 2006-08-03 2008-02-07 Jayanta Basak Prediction of future performance of a dbms
CN102135914A (zh) * 2011-04-02 2011-07-27 北京大学 一种可自动调节参数的云计算系统负载预测方法
CN102236582A (zh) * 2011-07-15 2011-11-09 浙江大学 虚拟化集群负载在多台物理机中均衡分配的方法
CN102331949A (zh) * 2011-10-12 2012-01-25 华为技术有限公司 一种虚拟机内存快照生成和恢复方法、装置及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GONG Z ETC.: "Press:predictive elastic resource scaling for cloud systems", 《2010 INTERNATIONAL CONFERENCE ON NETWORK AND SERVICE MANAGEMENT(CNSM)》 *
NILABJA ROY ETC.: "Efficient Autoscaling in the Cloud using Predictive Models forWorkload Forecasting", 《2011 IEEE 4TH INTERNATIONAL CONFERENCE ON CLOUD COMPUTING》 *

Cited By (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106164864A (zh) * 2014-03-31 2016-11-23 微软技术许可有限责任公司 服务的预测负载伸缩
CN106164864B (zh) * 2014-03-31 2020-03-10 微软技术许可有限责任公司 服务的预测负载伸缩
WO2015176522A1 (zh) * 2014-05-20 2015-11-26 华为技术有限公司 一种vm资源调度方法、装置及系统
CN103984602A (zh) * 2014-05-20 2014-08-13 华为技术有限公司 一种vm资源调度方法、装置及系统
CN105100168A (zh) * 2014-05-21 2015-11-25 北京大学 一种基于应用执行单元的PaaS请求分发机制
CN105094979A (zh) * 2014-05-21 2015-11-25 北京大学 一种基于应用特征的PaaS弹性资源管理机制
CN104135525A (zh) * 2014-07-31 2014-11-05 广州杰赛科技股份有限公司 云平台elb组件的资源扩展方法和装置
CN104135525B (zh) * 2014-07-31 2017-12-01 广州杰赛科技股份有限公司 云平台elb组件的资源扩展方法和装置
CN105450716A (zh) * 2014-09-25 2016-03-30 阿里巴巴集团控股有限公司 动态业务分发方法及系统
CN104768022A (zh) * 2014-12-31 2015-07-08 安科智慧城市技术(中国)有限公司 一种视频转码系统的资源调度方法及装置
CN104639626B (zh) * 2015-01-28 2018-04-17 华侨大学 一种多级负载预测与云资源弹性配置方法与监控配置系统
CN104639626A (zh) * 2015-01-28 2015-05-20 华侨大学 一种多级负载预测与云资源弹性配置方法与监控配置系统
CN106161485B (zh) * 2015-03-23 2019-03-26 腾讯科技(深圳)有限公司 一种基础服务集群的资源调度方法、装置和系统
CN106161485A (zh) * 2015-03-23 2016-11-23 腾讯科技(深圳)有限公司 一种基础服务集群的资源调度方法、装置和系统
CN106161525B (zh) * 2015-04-03 2019-09-17 阿里巴巴集团控股有限公司 一种多集群管理方法与设备
CN106161525A (zh) * 2015-04-03 2016-11-23 阿里巴巴集团控股有限公司 一种多集群管理方法与设备
CN106293868A (zh) * 2015-05-15 2017-01-04 苏宁云商集团股份有限公司 一种云计算环境中虚拟机扩缩容方法及扩缩容系统
CN105119952B (zh) * 2015-07-07 2018-12-21 北京京东尚科信息技术有限公司 云平台下自动弹性地分配资源的方法和系统
CN105119952A (zh) * 2015-07-07 2015-12-02 北京京东尚科信息技术有限公司 云平台下自动弹性地分配资源的方法和系统
WO2017128980A1 (zh) * 2016-01-29 2017-08-03 华为技术有限公司 云平台中管理资源的方法和装置
CN107026877A (zh) * 2016-01-29 2017-08-08 华为技术有限公司 云平台中管理资源的方法和装置
CN107026877B (zh) * 2016-01-29 2020-07-07 华为技术有限公司 云平台中管理资源的方法和装置
US10805385B2 (en) 2016-01-29 2020-10-13 Huawei Technologies Co., Ltd. Method and apparatus for managing resource on cloud platform
CN107329797B (zh) * 2016-04-28 2020-09-18 华为技术有限公司 一种实例弹性伸缩方法、实例管理模块以及计算设备
CN107329797A (zh) * 2016-04-28 2017-11-07 华为技术有限公司 一种实例弹性伸缩方法、实例管理模块以及计算设备
WO2017214986A1 (zh) * 2016-06-17 2017-12-21 华为技术有限公司 一种云应用伸缩方法及装置
CN106201718A (zh) * 2016-07-05 2016-12-07 北京邮电大学 一种基于负载预测的云计算资源动态伸缩方法
CN106844180A (zh) * 2017-02-07 2017-06-13 山东浪潮云服务信息科技有限公司 一种OpenStack平台计算资源的监控预测方法
CN107911399A (zh) * 2017-05-27 2018-04-13 广东网金控股股份有限公司 一种基于负载预测的弹性伸缩方法及系统
CN107911399B (zh) * 2017-05-27 2020-10-16 广东网金控股股份有限公司 一种基于负载预测的弹性伸缩方法及系统
CN108156212A (zh) * 2017-06-29 2018-06-12 广东网金控股股份有限公司 一种基于用户感知的弹性伸缩方法及系统
CN108156212B (zh) * 2017-06-29 2020-12-22 广东网金控股股份有限公司 一种基于用户感知的弹性伸缩方法及系统
CN107426026B (zh) * 2017-07-31 2020-05-22 山东省计算中心(国家超级计算济南中心) 一种基于eemd-arima的云计算服务器负载短期预测方法
CN107426026A (zh) * 2017-07-31 2017-12-01 山东省计算中心(国家超级计算济南中心) 一种基于eemd‑arima的云计算服务器负载短期预测方法
CN107451694A (zh) * 2017-08-03 2017-12-08 重庆大学 一种用于移动系统中上下文感知与自适应的应用预测方法
CN107451694B (zh) * 2017-08-03 2020-10-02 重庆大学 一种用于移动系统中上下文感知与自适应的应用预测方法
CN107682409B (zh) * 2017-09-13 2020-07-31 厦门集微科技有限公司 一种集群资源预伸缩方法及装置
CN107682409A (zh) * 2017-09-13 2018-02-09 厦门集微科技有限公司 一种集群资源预伸缩方法及装置
CN109800075A (zh) * 2017-11-16 2019-05-24 航天信息股份有限公司 集群管理方法及装置
WO2019144777A1 (zh) * 2018-01-24 2019-08-01 北京金山云网络技术有限公司 报文转发方法、转发装置、服务器及存储介质
CN108632365A (zh) * 2018-04-13 2018-10-09 腾讯科技(深圳)有限公司 服务资源调整方法、相关装置和设备
CN108632365B (zh) * 2018-04-13 2020-11-27 腾讯科技(深圳)有限公司 服务资源调整方法、相关装置和设备
CN108920153A (zh) * 2018-05-29 2018-11-30 华南理工大学 一种基于负载预测的Docker容器动态调度方法
CN108920153B (zh) * 2018-05-29 2022-04-22 华南理工大学 一种基于负载预测的Docker容器动态调度方法
CN109032914A (zh) * 2018-09-06 2018-12-18 掌阅科技股份有限公司 资源占用数据预测方法、电子设备、存储介质
CN109460301A (zh) * 2018-09-07 2019-03-12 中南大学 一种流数据负载的弹性资源配置方法及系统
CN109460301B (zh) * 2018-09-07 2022-06-24 中南大学 一种流数据负载的弹性资源配置方法及系统
CN110928634A (zh) * 2018-09-19 2020-03-27 阿里巴巴集团控股有限公司 数据处理方法、装置及设备
CN110928634B (zh) * 2018-09-19 2023-04-07 阿里巴巴集团控股有限公司 数据处理方法、装置及设备
CN109992358A (zh) * 2019-04-10 2019-07-09 北京隆普智能科技有限公司 一种预加载虚拟机的方法及其系统
CN110209468A (zh) * 2019-05-24 2019-09-06 北京百度网讯科技有限公司 用于启动虚拟机的方法、装置、设备和介质
CN110825520A (zh) * 2019-10-18 2020-02-21 山东省计算中心(国家超级计算济南中心) 一种实现资源高效利用的集群极速弹性伸缩方法
CN110825520B (zh) * 2019-10-18 2023-08-29 山东省计算中心(国家超级计算济南中心) 一种实现资源高效利用的集群极速弹性伸缩方法

Also Published As

Publication number Publication date
CN103425535B (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
CN103425535A (zh) 云环境下的敏捷弹性伸缩方法
Zhang et al. Dynamic heterogeneity-aware resource provisioning in the cloud
CN110908795B (zh) 云计算集群混部作业调度方法、装置、服务器及存储装置
US10102025B2 (en) Virtual machine resource utilization in a data center
CN104639626B (zh) 一种多级负载预测与云资源弹性配置方法与监控配置系统
US9386086B2 (en) Dynamic scaling for multi-tiered distributed systems using payoff optimization of application classes
US8402140B2 (en) Methods and apparatus for coordinated energy management in virtualized data centers
CN110474852B (zh) 一种带宽调度方法及装置
US20140019966A1 (en) System and method for continuous optimization of computing systems with automated assignment of virtual machines and physical machines to hosts
KR101812583B1 (ko) 태스크 할당 장치, 태스크 할당 방법 및 컴퓨터로 읽을 수 있는 저장 매체
US20140189109A1 (en) System and method for dynamically expanding virtual cluster and recording medium on which program for executing the method is recorded
US20140019965A1 (en) System and method for automated assignment of virtual machines and physical machines to hosts with right-sizing
Huang et al. Prediction-based dynamic resource scheduling for virtualized cloud systems
CN109005130B (zh) 网络资源配置调度方法和装置
WO2018086467A1 (zh) 一种云环境下应用集群资源分配的方法、装置和系统
Bilal et al. Dynamic cloud resource scheduling in virtualized 5g mobile systems
CN105975047A (zh) 云数据中心功耗调节方法和系统
CN105740059B (zh) 一种面向可分割任务的粒子群调度方法
US20200233724A1 (en) Workload placement in a cluster computing environment using machine learning
CN103488538B (zh) 云计算系统中的应用扩展装置和应用扩展方法
CN107203256B (zh) 一种网络功能虚拟化场景下的节能分配方法与装置
Shi et al. Characterizing and orchestrating VM reservation in geo-distributed clouds to improve the resource efficiency
CN111858040A (zh) 一种资源调度方法和装置
CN114741160A (zh) 一种基于平衡能耗与服务质量的动态虚拟机整合方法和系统
Li et al. A network-aware scheduler in data-parallel clusters for high performance

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20131204

Assignee: Hundsun Technologies Inc.

Assignor: Zhejiang University

Contract record no.: 2018330000035

Denomination of invention: Agile elastic telescoping method in cloud environment

Granted publication date: 20160810

License type: Common License

Record date: 20180417