CN105045648A - IaaS云环境下物理主机资源状态预测方法 - Google Patents

IaaS云环境下物理主机资源状态预测方法 Download PDF

Info

Publication number
CN105045648A
CN105045648A CN201510350166.0A CN201510350166A CN105045648A CN 105045648 A CN105045648 A CN 105045648A CN 201510350166 A CN201510350166 A CN 201510350166A CN 105045648 A CN105045648 A CN 105045648A
Authority
CN
China
Prior art keywords
state
physical host
resource
iaas cloud
method under
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510350166.0A
Other languages
English (en)
Other versions
CN105045648B (zh
Inventor
兰雨晴
夏庆新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongbiao Huian Information Technology Co Ltd
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201510350166.0A priority Critical patent/CN105045648B/zh
Publication of CN105045648A publication Critical patent/CN105045648A/zh
Application granted granted Critical
Publication of CN105045648B publication Critical patent/CN105045648B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种IaaS云环境下物理主机资源状态预测方法,其包括以下步骤:步骤A:将IaaS云资源需求预测过程确立为隐式马尔可夫过程;步骤B:确定物理主机资源的观察状态集合和隐式状态集合;步骤C:构建IaaS云平台资源预测的隐式马尔可夫过程模型;步骤D:根据该IaaS云平台资源预测的隐式马尔可夫过程模型的预测状态,进行资源调度。本发明通过物理主机资源状态预测很好地解决了虚拟机迁移时机的选择问题,降低了SLA违反率节约了能耗成本;本发明将IaaS云资源需求预测过程确立为隐式马尔可夫过程其为正确,有效的,根据该预测过程可以很好的实现资源需求的可控以及绿色节能的目标。

Description

IaaS云环境下物理主机资源状态预测方法
技术领域
本发明涉及云平台应用技术领域,尤其是涉及IaaS云环境下物理主机资源状态预测方法。
背景技术
云环境下,提高资源利用率是能耗感知和负载均衡必须考虑的重要手段,而资源利用率由虚拟机通过迁移操作改变物理主机的资源状态来体现,因此,虚拟机迁移是IaaS云资源调度的尤为重要关键技术。
当前,IaaS云资源调度策略研究中,违反SLA时或者物理主机过载是虚拟机迁移的触发因素,这势必造成系统性能下降和额外的能耗成本,这是问题出现后处理造成的后果。这种“事后处理”的方式早已过时。
IaaS云平台服务商为用户提供高性能服务的同时,必须考虑如何在不违反SLA(ServiceLevelAgreement)的前提下,节约云平台的能耗成本。而虚拟机迁移技术是在物理服务器过载时,保证服务器性能的有效手段,也是考虑节能的关键技术之一。服务器的过载和欠载是物理主机的两个运行状态,过载会造成违反SLA的可能性,而欠载会造成物理主机资源利用率低,造成额外的能耗浪费。
由此可见,目前没有依据虚拟机迁移的能耗代价与物理主机与物理主机关机的电能收益关系,降低IaaS云平台的SLA违反率的目标的方法,亟待进一步改进。
发明内容
本发明的目的是提供一种IaaS云环境下物理主机资源状态预测方法,其具有依据虚拟机迁移的能耗代价与物理主机与物理主机关机的电能收益关系,降低IaaS云平台的SLA违反率,实现资源需求可控、绿色节能的效果。
为解决上述技术问题,本发明提供一种IaaS云环境下物理主机资源状态预测方法,其包括以下步骤:
步骤A:将IaaS云资源需求预测过程确立为隐式马尔可夫过程;
步骤B:确定物理主机资源的观察状态集合和隐式状态集合;
步骤C:构建IaaS云平台资源预测的隐式马尔可夫过程模型;
步骤D:根据该IaaS云平台资源预测的隐式马尔可夫过程模型的预测状态,进行资源调度。
本发明的一个实施例中,所述隐式马尔可夫过程模型中,其通过Viterbi算法给出一个场景的预测过程,以驱动构建该隐式马尔可夫过程模型。
本发明的一个实施例中,所述步骤A中的隐式马尔可夫过程模型通过一个五元组来描述:
λ=(N,M,A,B,π)
其中:N是物理主机状态的集合,M是观察值的集合,A是状态转移概率矩阵,B是观察值的概率分布矩阵,π是初始状态概率分布。
本发明的一个实施例中,所述物理主机状态的集合N为隐状态集,N={S1,S2,S3},其中,其中,S1为物理主机欠载状态;S2为物理主机正常状态;S3为物理主机过载状态;
所述观察值的集合M为明状态集,M={OUT,IN,NON},其中,OUT为虚拟机迁出状态;IN为虚拟机迁入状态;NON为虚拟机无迁出迁入状态;
其中,初始状态概率:π={π123};
隐状态转移概率:A=(aij)3×3,其中aij表示从状态i到状态j的转移概率;
观察值分布概率:B=b(M),其中b(M)为M中元素的分布概率。
本发明的一个实施例中,所述隐状态组成的状态序列为Q=(q1,q2,…,qt,…,qT),其中每个qt∈N中的一个状态,由初始状态概率π和状态转移概率A决定;
所述明状态组成的观察序列为O=(o1,o2,…,ot,…,oT),其中每个ot∈M中的一个状态,由状态序列Q和各状态的分布概率B决定。
本发明的一个实施例中,所述步骤D中,隐式马尔可夫过程模型的预测状态与系统的负载和资源状态实时相关,并在下一个稳定其到来之前对资源进行整合。
本发明的一个实施例中,所述步骤A中的隐式马尔可夫过程模型通过资源需求预测物理主机过载、安全和欠载状态,作为虚拟机迁移时机选择的基准。
本发明的一个实施例中,所述步骤A中的隐式马尔可夫过程模型通过Viterbi算法来驱动构建的。
本发明的一个实施例中,所述Viterbi算法有效选择最优状态序列,以实现物理主机资源需求预测。
本发明的有益效果为:
本发明通过物理主机资源状态预测很好地解决了虚拟机迁移时机的选择问题,降低了SLA违反率节约了能耗成本;本发明将IaaS云资源需求预测过程确立为隐式马尔可夫过程其为正确,有效的,根据该预测过程可以很好的实现资源需求的可控以及绿色节能的目标。
附图说明
图1为本发明的状态序列与观察序列关系图;
图2为本发明的低负载状态HMM模型状态转换图;
图3为本发明的低负载计算路径示意图;
图4为本发明的中度负载状态HMM模型状态转换图;
图5为本发明的PMi处于中度负载,下一时刻向低负载转化的计算路径示意图;
图6为本发明的PMi处于中度负载,下一时刻保持中度负载的计算路径示意图;
图7为本发明的PMi处于中度负载,下一时刻向高负载转化的计算路径示意图;
图8为本发明的高负载状态HMM模型状态转换图;
图9为本发明的高负载计算路径示意图;
图10为本发明的负载正态分布采样均值示意图;
图11为本发明的一个周期内物理主机状态转换与虚拟机迁移示意图。
具体实施方式
本发明IaaS云环境下物理主机资源状态预测方法,其IaaS云平台资源需求抽象,进行隐式马尔可夫过程建模,通过资源需求预测物理主机过载、安全和欠载状态,作为虚拟机迁移时机选择的基准。
本发明基于负载的异常特征预测,提出一种动态调整阈值的算法,作为物理主机欠载/过载状态下迁移的依据,最终实现两个目标:①依据虚拟机迁移的能耗代价与物理主机关机的电能收益的关系,达到降低能耗的目标;②通过动态调整阈值,使得系统具有违反SLA的风险预测能力,达到降低IaaS云平台的SLA违反率的目标。
建立IaaS云平台资源需求预测模型是本发明的核心,是实现资源需求可控、绿色节能目标的关键所在。
本发明的IaaS云环境下物理主机资源状态预测方法,具体包括以下步骤:
步骤一:分析IaaS云资源需求预测过程,将IaaS云资源需求预测过程确立为隐式马尔可夫过程;
步骤二:确定物理主机资源的观察状态集合和隐式状态集合;
步骤三:构建IaaS云平台资源预测的隐式马尔可夫过程模型并给出算法;
步骤四:根据该IaaS云平台资源预测的隐式马尔可夫过程模型的预测状态,进行资源调度。
IaaS云平台资源分为物理主机资源和虚拟机资源两部分,而关于能耗多少直接由物理主机资源消耗状态所反映,也就是说物理主机资源是虚拟机资源的容器。
本发明以IaaS云系统中物理主机的资源需求为研究对象。物理主机分为过载、欠载和正常三种状态,但是这三种状态不是可以观察到的明序列,是一个隐藏的状态序列,称为隐式状态集合。
下面来分析观察状态序列,物理主机作为虚拟机的资源容器,在云环境下,或因为性能,或因为能耗原因,虚拟机将在某一时刻在物理主机之间进行迁移操作,将会发生虚拟机的迁入、迁出和无迁入迁出三种状态,而这三种状态是根据IaaS云平台采用不同的虚拟机调度策略而出现不同的状态,也就是根据系统的运行状态存在一定的概率分布,继而成为本发明的观察序列。
其中,IaaS云资源需求预测模型是一个双重随机过程构成的模型,状态转移过程是隐式的,而可观察状态的随机过程是隐式状态转换过程的随机函数,即符合基于隐式马尔可夫过程构建资源需求预测模型。
该隐式马尔可夫过程模型的定义通过一个五元组来描述:λ=(N,M,A,B,π),其中:N是物理主机状态的集合,M是观察值的集合,A是状态转移概率矩阵,B是观察值的概率分布矩阵,π是初始状态概率分布。
已经依据IaaS云平台的物理主机和虚拟机资源构建了隐式马尔可夫过程模型,其目标是对资源需求进行预测,因此,本发明通过一种算法来驱动构建隐式马尔可夫过程模型。
本发明采用动态规划算法——Viterbi算法并给出一个场景的预测过程。
定义δ(t,i)为t时间步沿状态序列q1,...,qt且qt=Si产生出o1,...,ot的最大概率,即: δ ( t , i ) = m a x q 1 , ... , q t - 1 P ( q 1 , ... , q t - 1 , q t = S i , o 1 , ... o t | λ ) .
该算法可以有效选择“最优”状态序列,可以实现物理主机资源需求预测。“最优”即:概率最大状态Q*=argmaxP(Q|O,λ)
Viterbi变量: δ t ( i ) = m a x q 1 , ... , q t - 1 P ( q 1 , ... , q t - 1 , q t = S i , o 1 , ... o t | λ )
递归关系: δ t + 1 ( i ) = [ m a x j δ t ( j ) a i j ] b i ( O t + 1 )
记忆变量:记录概率最大路径上当前状态的前一个状态。
初始化:δ1(i)=πibi(O1),1≤i≤N
递归: δ t ( j ) = [ m a x 1 ≤ i ≤ N δ t - 1 ( i ) a i j ] b j ( O t ) , 2 ≤ t ≤ T , 1 ≤ j ≤ N
终结: P * = m a x [ δ T ( i ) ] 1 ≤ i ≤ N , q T * = arg m a x [ δ T ( i ) ] 1 ≤ i ≤ N
路径回溯:
此算法采用动态规划算法,时间复杂度为O(N2T)。
现在通过一个IaaS云平台资源需求预测的实际例子来说明基于隐式马尔可夫过程的资源需求预测模型实现资源需求预测的过程。
隐状态集:N={S1,S2,S3},其中,S1为物理主机“欠载”状态;S2为物理主机“正常”状态;S3为物理主机“过载”状态。
明状态集(观察状态集):M={OUT,IN,NON},其中,OUT为虚拟机“迁出”状态;IN为虚拟机“迁入”状态;NON为虚拟机“无迁出迁入”状态。
初始状态概率:π={π123}。
隐状态转移概率:A=(aij)3×3,其中aij表示从状态i到状态j的转移概率。
观察值分布概率:B=b(M),其中b(M)为M中元素的分布概率。
使用隐式马尔可夫过程将状态序列和观察序列联系起来,如图1所示。
1)由隐状态组成的状态序列(路径)Q=(q1,q2,…,qt,…,qT),其中每个qt∈N中的一个状态,由初始状态概率π和状态转移概率A决定。
2)由明状态组成的观察序列O=(o1,o2,…,ot,…,oT),其中每个ot∈M中的一个状态,由状态序列Q和各状态的分布概率B决定。
请配合参阅图1状态序列与观察序列关系图所示,第i台物理主机PMi。
状态1:PMi处于低负载状态。
已知:状态观察值集合O1={NON,OUT,OUT,NON}。初始状态概率π={1,0,0},状态转移矩阵A和观察集分布概率B如图2为低负载状态HMM模型状态转换图所示。
当t=1时,
δ1(1)=π1*b1(NON)=1×0.3=0.3,
当t=2时,
δ2(1)=δ1(1)*a11*b1(OUT)=0.3×0.8×0.5=0.12,
δ2(2)=δ1(1)*a12*b2(OUT)=0.3×0.2×0.7=0.042,
当t=3时,
δ3(1)=δ2(1)*a11*b1(OUT)=0.12×0.8×0.5=0.048,
δ3(2)=max{δ2(1)*a122(2)*a22}*b2(OUT)=max{0.12×0.2,0.042×0.3}×0.7=0.0168,
δ3(3)=δ2(2)*a23*b3(OUT)=0.042×0.3×0.9=0.01134,
当t=4时,
δ4(1)=δ3(1)*a11*b1(NON)=0.048×0.8×0.3=0.01152,
δ4(2)=max{δ3(1)*a123(2)*a22}*b2(NON)=max{0.048×0.2,0.0168×0.7}×0.2=0.002352,
δ4(3)=max{δ3(2)*a233(3)*a33}*b3(NON)=max{0.0168×0.3,0.01152×1}×0.1=0.001152,
其递推结果为:
P * = m a x 1 ≤ i ≤ 3 [ δ 4 ( i ) ] = m a x [ 0.01152 , 0.002352 , 0.001152 ] = 0.01152 ;
所以有:
q 4 * = argmax 1 ≤ i ≤ 3 [ δ 4 ( i ) ] = 1 ;
在此场景下,PMi处于低负载状态,q1,q2,q3,q4状态序列为:S1,S1,S1,S1,即当t=3时,下一时刻,物理主机将为“欠载”状态。
计算结构示意图如图3低负载计算路径示意图所示,粗线箭头指示概率最大的状态序列路径。在本发明的实施例中,将对另外更加复杂的情况进行详细分析,验证算法的有效性。
状态2:PMi处于中度负载状态。
PMi处于中度负载在下一时刻可能有三种状态变化:①向低负载转化,使PM变更为“欠载”状态;②保持中度负载,PM继续处于“安全”状态,系统运行平稳;③向高负载转化,使PM变更为“过载”状态。下面,分别进行以上三个方面的分析。
①已知:状态观察值集合初始状态概率π={0,1,0},状态转移矩阵A和观察集分布概率B图4的中度负载状态HMM模型状态转换图所示。
当t=1时,
δ1(1)=π2*b1(NON)=1×0.6=0.6,
当t=2时,
δ2(1)=δ1(1)*a22*b1(NON)=0.6×0.5×0.6=0.18,
δ2(2)=δ1(1)*a21*b2(NON)=0.6×0.2×0.4=0.048,
δ2(3)=δ1(1)*a23*b3(NON)=0.6×0.3×0.3=0.054,
当t=3时,
δ3(1)=δ2(1)*a22*b1(OUT)=0.18×0.5×0.2=0.018,
δ3(2)=max{δ2(1)*a212(2)*a11}*b2(OUT)=max{0.18×0.2,0.048×0.3}×0.6=0.0216,
δ3(3)=δ2(2)*a13*b3(OUT)=0.048×0.1×0.6=0.00288,
当t=4时,
δ4(1)=δ3(1)*a22*b1(OUT)=0.018×0.5×0.2=0.0018,
δ4(2)=max{δ3(1)*a123(2)*a11}*b2(OUT)=max{0.018×0.2,0.0216×0.9}×0.6=0.011664,
δ4(3)=max{δ3(2)*a133(3)*a33}*b3(OUT)=max{0.0216×0.1,0.00288×1}×0.6=0.001728,
其递推结果为:
P * = m a x [ δ 4 ( i ) ] 1 ≤ i ≤ 3 = m a x [ 0.0018 , 0.011664 , 0.001728 ] = 0.011664 ;
所以有:
q 4 * = argmax 1 ≤ i ≤ 3 [ δ 4 ( i ) ] = 1 ;
最后,得出结论:在此场景下,PMi处于中度负载状态,q1,q2,q3,q4状态序列为:S2,S2,S1,S1,即当t=3时,下一时刻,物理主机将为“欠载”状态。计算结构示意图图5的中度负载计算路径示意图所示。粗线箭头指示概率最大的状态序列路径。
②已知:状态观察值集合初始状态概率π={0,1,0},状态转移矩阵A和观察集分布概率B如图4所示。
当t=1时,
δ1(1)=π2*b1(NON)=1×0.6=0.6,
当t=2时,
δ2(1)=δ1(1)*a22*b1(IN)=0.6×0.5×0.3=0.09,
δ2(2)=δ1(1)*a21*b2(IN)=0.6×0.2×0.3=0.036,
δ2(3)=δ1(1)*a23*b3(IN)=0.6×0.3×0.4=0.072,
当t=3时,
δ3(1)=δ2(1)*a22*b1(NON)=0.09×0.5×0.6=0.027,
δ3(2)=max{δ2(1)*a212(2)*a11}*b2(NON)=max{0.09×0.2,0.036×0.9}×0.4=0.01296,
δ3(3)=δ2(2)*a13*b3(NON)=0.048×0.1×0.5=0.0024,
当t=4时,
δ4(1)=δ3(1)*a22*b1(IN)=0.027×0.5×0.3=0.00405,
δ4(2)=max{δ3(1)*a123(2)*a11}*b2(IN)=max{0.027×0.2,0.01296×0.9}×0.3=0.0034992,
δ4(3)=max{δ3(2)*a133(3)*a33}*b3(IN)=max{0.01296×0.1,0.0024×1}×0.4=0.00096,
其递推结果为:
P * = m a x 1 ≤ i ≤ 3 [ δ 4 ( i ) ] = m a x [ 0.00405 , 0.0034992 , 0.00096 ] = 0.00405 ;
所以有:
q 4 * = argmax 1 ≤ i ≤ 3 [ δ 4 ( i ) ] = 2 ;
在此场景下,PMi处于中度负载状态,q1,q2,q3,q4状态序列为:S2,S2,S2,S2,即当t=3时,下一时刻,物理主机将为“安全”状态。计算结构示意图图6的中度负载计算路径示意图,粗线箭头指示概率最大的状态序列路径。
②已知:状态观察值集合初始状态概率π={0,1,0},状态转移矩阵A和观察集分布概率B如图4所示。
当t=1时,
δ1(1)=π2*b1(IN)=1×0.6=0.6,
当t=2时,
δ2(1)=δ1(1)*a22*b1(NON)=0.6×0.5×0.2=0.06,
δ2(2)=δ1(1)*a21*b2(NON)=0.6×0.2×0.2=0.024,
δ2(3)=δ1(1)*a23*b3(NON)=0.6×0.3×0.4=0.072,
当t=3时,
δ3(1)=δ2(1)*a22*b1(NON)=0.06×0.5×0.2=0.006,
δ3(2)=max{δ2(1)*a212(2)*a11}*b2(NON)=max{0.06×0.2,0.024×0.9}×0.4=0.00432,
δ3(3)=δ2(3)*a23*b3(NON)=0.072×0.3×0.4=0.00864,
当t=4时,
δ4(1)=δ3(1)*a22*b1(IN)=0.006×0.5×0.6=0.0018,
δ4(2)=max{δ3(1)*a213(2)*a11}*b2(IN)=max{0.006×0.2,0.00432×0.9}×0.1=0.0003888,
δ4(3)=max{δ3(2)*a133(3)*a33}*b3(IN)=max{0.00432×0.3,0.00864×1}×0.4=0.003456,
其递推结果为:
P * = m a x 1 ≤ i ≤ 3 [ δ 4 ( i ) ] = m a x [ 0.0018 , 0.0003888 , 0.003456 ] = 0.003456 ;
所以有:
q 4 * = argmax 1 ≤ i ≤ 3 [ δ 4 ( i ) ] = 3 ;
在此场景下,PMi处于中度负载状态,q1,q2,q3,q4状态序列为:S2,S3,S3,S3,即当t=3时,下一时刻,物理主机将为“过载”状态。请配合参阅图7的中度负载计算路径示意图所示,粗线箭头指示概率最大的状态序列路径。
状态3:PMi处于高负载状态。
已知:状态观察值集合O3={NON,OUT,NON,OUT}。初始状态概率π={0,0,1},状态转移矩阵A和观察集分布概率B如图8的高负载状态HMM模型状态转换图所示。
当t=1时,
δ1(1)=π3*b1(NON)=1×0.3=0.3,
当t=2时,
δ2(1)=δ1(1)*a33*b1(OUT)=0.3×0.2×0.6=0.036,
δ2(2)=δ1(1)*a32*b2(OUT)=0.3×0.8×0.7=0.168,
当t=3时,
δ3(1)=δ2(1)*a33*b1(NON)=0.036×0.2×0.3=0.00216,
δ3(2)=max{δ2(1)*a212(2)*a22}*b2(NON)=max{0.036×0.2,0.168×0.8}×0.2=0.02688,
δ3(3)=δ2(2)*a21*b3(NON)=0.168×0.2×0.1=0.00336,
当t=4时,
δ4(1)=δ3(1)*a33*b1(OUT)=0.0216×0.2×0.9=0.003888,
δ4(2)=max{δ3(1)*a323(2)*a22}*b2(OUT)=max{0.00216×0.8,0.02688×0.8}×0.7=0.0150528,
δ4(3)=max{δ3(2)*a213(3)*a11}*b3(OUT)=max{0.02688×0.2,0.00336×1}×0.1=0.0005376,
其递推结果为:
P * = max 1 ≤ i ≤ 3 [ δ 4 ( i ) ] = max [ 0.003888 , 0.0150528 , 0.0005376 ] = 0.0150528 ;
所以有:
q 4 * = argmax 1 ≤ i ≤ 3 [ δ 4 ( i ) ] = 2 ;
在此场景下,PMi处于高负载状态,q1,q2,q3,q4状态序列为:S3,S2,S2,S2,即当t=3时,下一时刻,物理主机将为“安全”状态。如图9所示的计算结构示意图,粗线箭头指示概率最大的状态序列路径。
下面通过具体的实施例说明本发明的IaaS云环境下物理主机资源状态预测方法的有效性。
请配合参阅图9所示,高负载计算路径示意图物理主机资源状态验证实验平台,真实环境下的硬件平台为4台物理主机节点,其中2台配置为AMDOpteron2350四核(2.0GHz)处理器、4GB内存,另外2台配置为InterCorei7-5960处理器、16GB内存,具体配置如表1所示。
所有物理节点运行云平台软件OpenStackJUNO,一台磁盘阵列通过光纤与各节点相连,作为集群的共享存储。实施例中所用到的虚拟机均克隆自虚拟机镜像Windowsxp(sp3)和中标麒麟6.0。虚拟机的配置均为1个vCPU、1GB内存,1块虚拟网卡。
表1物理主机资源配置
负载生成程序主要包括随机调用一些常见的应用程序来产生不同类型的负载,例如Linux内核编译、数据压缩、网页浏览以及文件传输等。其中,负载分别在Linux和Windows两种操作系统环境下运行编译、应用、网络、分布式等负载。
本实施例为真实环境的验证的测试用例,该测试用例由100个虚拟机组成。这些虚拟机克隆自Windowsxp和中标麒麟6.0两种操作系统镜像,它们分别运行不同类型的负载。这些虚拟机的编号和所运行负载类型如表2所示,本实施例所采用的负载有一定的代表性,可用于测试本发明的方法对不同负载类型虚拟机的管理。它们具有相同或不同的系统镜像,相同、相似或不同的负载,以及虚拟机之间不同吞吐量的网络通信等特性,都对本发明的资源需求预测方法提供了较好的验证条件。
表2虚拟机负载测试用例列表
实验场景描述本发明在真实实验平台实施负载分类的多维向量BFD资源调度算法,在此过程中实现了基于隐式马尔可夫过程的资源需求预测模型的物理主机资源需求状态的预测。
本实施例将验证基于隐式马尔可夫过程的资源需求预测模型的准确性和有效性。
下面介绍具体实验过程,已经介绍了物理主机、虚拟机和负载等环境配置,在实验场景描述中,定义负载输入均值为如图10的负载正态分布采样均值所示的正态分布负载,以利于实验结果的观察,并且不影响结论的一般性。系统采样时间间隔为5分钟,实验长度为1天,分为288个采样时间间隔,与负载采样间隔一致。
采用负载特征分类的多维向量BFD算法时,阈值使用固定的初始阈值<0.4,0.9>。基于马尔可夫过程的资源需求预测模型预测物理主机负载状态时,按照负载强度的高低分为三种情况:①PMi处于低负载状态,负载区间为[0,40%);②PMi处于中度负载状态,负载区间为[40%,90%];③PMi处于高负载状态,负载区间为(90%,100%]。并且,设定实验中物理主机资源状态观察周期(时间间隔)为5分钟,此设定依据由系统负载采样时间间隔(采样时间间隔为5分钟)决定,并且符合算法时间负载度的要求。
在实验之前,首先对几点约定:
由于实验采用异构物理主机配置,但对于同构PM1与PM2之间,优先PM1进行资源部署;同理,同构PM3与PM4之间优先PM3进行资源部署。
为了方便计算,并不影响实验结论的前提下,对于实测IaaS平台CPU利用率采取向下取整的方法确定实验数据。
为了使结论清晰便于理解,本发明采用虚拟机负载均值符合正态分布输入,但是每一台虚拟机负载并不服从正态分布,只是保证IaaS平台总负载服从正态分布。
在物理主机资源状态预测过程中,已经约定为三种状态“S1,S2,S3”,但是在实际场景中,物理主机处于欠载状态并且资源需求为“零”的极限状态时,状态标记为N,即:N=S1
实验结果分析:实验共经历24小时,以5分钟为时间间隔,从t0时间开始,至t288时间结束。在这过程中,4台物理主机的CPU资源状态变化和100个虚拟机的迁移步骤全部显示。
请配合图11所示一个周期内物理主机状态转换与虚拟机迁移示意图的初始信息,PMi={PM1,PM2,PM3,PM4},ti={t0,t1,...,t288},<v,u>中v代表在相应PMi中虚拟机的个数,“位于每个表格右上方的数字”u代表相应PMi的当前CPU利用率。表格内的弧形箭头代表物理主机间迁移虚拟机的方向及时间点。而表格上方的10个带有数字的箭头代表相应10个关键场景。
实验结果分析流程如下:首先,分析PMi物理主机资源状态预测;其次,收集IaaS云平台实时资源使用情况,最后,验证预测结果。经过10个关键场景进行分析,最后给出本实施例结论。
场景①:t=t0时刻之前,IaaS云平台已经按照随机策略对每台物理主机平均部署了25台虚拟机,并没有对虚拟机类型作任何区分。t=t0时刻,应用算法完成对100台虚拟机的首次资源部署,其中PM3和PM4中部署了相同数目的虚拟机,但是PM3优先部署了负载更高的VM,因此有更高的CPU利用率,在t=t1时刻所示。下面进入t=t1时刻场景②。
结论1:当IaaS云平台处于低负载状态时,首次资源部署算法在资源分配方面不会给系统带来风险,而且有助于下一步实时资源调度。
场景②:t=t1时刻,PM资源需求状态分别为S1,S2,S1,S1,所以,t1时刻IaaS云平台处于低负载状态。但是,随着负载输入,势必要进行虚拟机迁移。针对物理主机的资源状态预测趋势为:PM1:S1→N→N→N,PM2:S2→N→N→N,PM3:S1→S2→S2→S2,PM4:S1→N→N→N。经过实时调度算法,虚拟机发生迁移。根据实时采集的结果t=t2时刻显示,PM3上包含了所有100台VM,而CPU利用率为42%,处于S2——“安全”状态。其他PM资源需求为“零”,所以处于关机状态。所以,经过上面对PM资源状态对比(关机状态N属于S1的极限状态),预测正确。
结论2:经过首次资源部署算法和基于负载特征分析的资源调度算法进行资源调度后,在一个时间单位(5分钟)内,IaaS平台达到第一种相对稳定期:Q1=[t2~t78]。
场景③:在t2~t78过程中,物理主机PM3经历着100台虚拟机负载逐渐增加的资源需求,但是绝大时间内都处于“安全”状态。直到t=t78时刻,PM3的资源需求已经接近上限阈值的临界点,这时,物理主机的状态预测趋势为:PM3:S3→S2→S3→S2,PM4:N→S1→S1→S1,PM1,PM2:N→N→N→N。t=t79时刻果然PM3资源需求超过了上限阈值,这时需要进行VM迁移,如表格内的弧形箭头所示,启动了PM4。这时,IaaS平台PM1和PM2关闭,PM3和PM4在工作,而且VM的迁移路径是PM3至PM4。根据t=t80时刻的PM状态,预测正确。
结论3:随着负载增加,Q1相对稳定期一定被打破,这时,IaaS云平台的资源需求增加,需要更多的物理资源。而基于隐式马尔可夫过程的资源需求状态预测模型是跟系统负载和资源状态实时相关的,在另外一个稳定期到来前,需要对资源进行整合,而这个整合过程是高效节能的,就是本发明调度算法所做到的。最终在一个时间单位(5分钟)内,IaaS云平台达到第二种相对稳定期:Q2=[t80~t113]。
场景④:在t80~t113过程中,随着PM3上VM不断的迁往PM4,PM4的资源需求不断增加,而PM3的资源需求并不是逐渐减少这么简单,因为负载在逐渐升高,所以PM3的资源需求趋势也是在缓慢上升,但是低于PM4的增加趋势。当PM4的负载接近上限阈值时,意味着PM3和PM4的资源总量已经不足以满足当前负载的资源需求,必须启用新的物理资源满足当前的资源需求。物理主机的状态预测趋势为:PM3:S2→S3→S2→S3,PM4:S3→S2→S3→S2,PM1:N→S1→S1→S1,PM2:N→N→N→N。而实际观察可以看出,在t=t113时刻,PM4资源使用达到上限阈值临界点,下一时刻发生迁移,并且表格内的弧形箭头显示VM迁移至PM1,同时PM3资源使用也超过了上限阈值,在t=t115时刻发生VM迁移,迁移至PM1。综上所述,本次物理主机状态预测正确。
结论4:在相对稳定期Q2中,VM发生了40次迁移,由资源调度算法决定这些迁移的VM都是负载比较高的VM。在整个虚拟机迁移过程中,由于考虑节能,虚拟机迁移到哪台PM上是由算法严格计算的,所以虚拟机按照PM的资源提供能力和节约能耗方面考虑,部署的优先级从高到低的顺序是PM3,PM4,PM1,PM2。当开启PM1后,IaaS平台进入了第三个相对稳定期Q3=[t115~t123]
场景⑤:当前PM1,PM3和PM4都处于开机状态(PM2处于关机状态),由于负载还在逐渐升高,致使PM1的VM资源需求逐渐增加,当PM1处于上限阈值的临界值时,意味着PM1,PM3和PM4的资源总量已经不足以满足当前负载的资源需求,必须启用新的物理资源满足当前的资源需求。物理主机的状态预测趋势为:PM3:S2→S2→S2→S2,PM4:S3→S2→S2→S2,PM1:S1→S1→S1→S1,PM2:N→S1→S1→S1。而实际观察,在t=t123时刻,PM1和PM4资源使用同时达到上限阈值临界点,下一时刻发生迁移,并且表格内的弧形箭头显示VM都迁移至PM2。综上所述,本场景物理主机状态预测正确,但是PM3在t=t127出现偏差。
结论5:在IaaS平台中,出现并发迁移是很平凡的,所以需要有及时的资源调度能力,资源需求预测就是很好的办法。另外,当负载到达一定高度时,需要全部物理资源参与分配,这时达到第四相对稳定期Q4=[t125~t184],这段时间很长,而且经历了负载峰值,这里包含了稳定期,即全部物理主机一直保持“安全”状态并持续比较长时间,在最后结论给出。
场景⑥:本实施例在t=t144时刻时,是负载平均值最大,达到负载峰值,这时物理主机资源需求最大。但是根据物理主机预测趋势为:PM3:S2→S2→S2→S2,PM4:S3→S2→S2→S2,PM1:S2→S2→S2→S2,PM2:S2→S2→S2→S2,属于绝对“安全”状态。根据实际观察,PM4中需要迁出VM至PM2,但是资源需求状态保持“安全”状态,所以本场景物理主机状态预测正确。
结论6:负载达到峰值时,物理主机资源需求最大。如果资源调度出现混乱等问题,此处是最容易出现违反SLA的情况,但是本实施例没有出现这种情况。
场景⑦~⑨:以场景⑦为例说明,经过了负载峰值,负载将逐渐减弱。这时,四台物理主机的资源需求都将降低,但是根据分析,下降最快的PM3。当t=t185时,PM3负载需求减弱降低至下限阈值临界点,此时进行物理主机状态预测趋势为:PM3:S2→S2→S2→S2,PM4:S3→S2→S2→S2,PM1:S2→S2→S2→S2,PM2:S2→S2→S2→S2。根据实际观察表格内的弧形箭头显示PM2中需要迁出VM至PM3,而不是PM1和PM4,原因是PM3是最优的物理资源。场景⑧和⑨与场景⑦一致,所以物理主机状态预测正确。
结论7:PM2,PM1和PM3上全部VM分别迁移到PM3上,这是“欠载”PM资源整合到最优的PM上,这是局部实时资源节能优化调度;而从IaaS平台总负载强度减弱趋势上,把“欠载”PM通过资源优化整合切换为关机状态N,这是全局资源节能优化调度。此时开始相对稳定期Q5=[t187~t198],Q6=[t200~t210],Q7=[t211~t218]。
场景⑩:此场景无需进行物理主机资源状态预测,从可以清楚地观察到,IaaS平台资源进行了节能优化整合,只有PM3处于工作状态,而且处于S2“安全”状态。
结论8:场景⑩其实是场景②的回归,证明这是一个全局性周期。
这也是负载输入的原因,本实施例证明了本发明的IaaS云环境下物理主机资源状态预测方法是资源节能优化调度的有效方法。
本发明将IaaS云资源需求预测过程确立为隐式马尔可夫过程,实验证明其为正确,有效的,根据该预测过程,可以很好的实现资源需求的可控,使得系统具有违反SLA的风险预测能力,达到降低IaaS云平台的SLA违反率的目标以及实现绿色节能的目标。
以上仅为本发明的较佳实施例,不得以此限定本发明实施的保护范围,因此凡参考本发明的说明书内容所作的简单等效变化与修饰,仍属本发明的保护范围。

Claims (9)

1.一种IaaS云环境下物理主机资源状态预测方法,其特征在于包括以下步骤:
步骤A:将IaaS云资源需求预测过程确立为隐式马尔可夫过程;
步骤B:确定物理主机资源的观察状态集合和隐式状态集合;
步骤C:构建IaaS云平台资源预测的隐式马尔可夫过程模型;
步骤D:根据该IaaS云平台资源预测的隐式马尔可夫过程模型的预测状态,进行资源调度。
2.根据权利要求1所述的IaaS云环境下物理主机资源状态预测方法,其特征在于,
所述隐式马尔可夫过程模型中,其通过Viterbi算法给出一个场景的预测过程,以驱动构建该隐式马尔可夫过程模型。
3.根据权利要求1所述的IaaS云环境下物理主机资源状态预测方法,其特征在于,
所述步骤A中的隐式马尔可夫过程模型通过一个五元组来描述:
λ=(N,M,A,B,π)
其中:N是物理主机状态的集合,M是观察值的集合,A是状态转移概率矩阵,B是观察值的概率分布矩阵,π是初始状态概率分布。
4.根据权利要求3所述的IaaS云环境下物理主机资源状态预测方法,其特征在于,
所述物理主机状态的集合N为隐状态集,N={S1,S2,S3},其中,其中,S1为物理主机欠载状态;S2为物理主机正常状态;S3为物理主机过载状态;
所述观察值的集合M为明状态集,M={OUT,IN,NON},其中,OUT为虚拟机迁出状态;IN为虚拟机迁入状态;NON为虚拟机无迁出迁入状态;
其中,初始状态概率:π={π123};
隐状态转移概率:A=(aij)3×3,其中aij表示从状态i到状态j的转移概率;
观察值分布概率:B=b(M),其中b(M)为M中元素的分布概率。
5.根据权利要求4所述的IaaS云环境下物理主机资源状态预测方法,其特征在于,
所述隐状态组成的状态序列为Q=(q1,q2,…,qt,…,qT),其中每个qt∈N中的一个状态,由初始状态概率π和状态转移概率A决定;
所述明状态组成的观察序列为O=(o1,o2,…,ot,…,oT),其中每个ot∈M中的一个状态,由状态序列Q和各状态的分布概率B决定。
6.根据权利要求1所述的IaaS云环境下物理主机资源状态预测方法,其特征在于,
所述步骤D中,隐式马尔可夫过程模型的预测状态与系统的负载和资源状态实时相关,并在下一个稳定其到来之前对资源进行整合。
7.根据权利要求1所述的IaaS云环境下物理主机资源状态预测方法,其特征在于,
所述步骤A中的隐式马尔可夫过程模型通过资源需求预测物理主机过载、安全和欠载状态,作为虚拟机迁移时机选择的基准。
8.根据权利要求1所述的IaaS云环境下物理主机资源状态预测方法,其特征在于,
所述步骤A中的隐式马尔可夫过程模型通过Viterbi算法来驱动构建的。
9.根据权利要求8所述的IaaS云环境下物理主机资源状态预测方法,其特征在于,
所述Viterbi算法有效选择最优状态序列,以实现物理主机资源需求预测。
CN201510350166.0A 2015-05-08 2015-06-23 IaaS云环境下物理主机资源状态预测方法 Active CN105045648B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510350166.0A CN105045648B (zh) 2015-05-08 2015-06-23 IaaS云环境下物理主机资源状态预测方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510230703 2015-05-08
CN2015102307038 2015-05-08
CN201510350166.0A CN105045648B (zh) 2015-05-08 2015-06-23 IaaS云环境下物理主机资源状态预测方法

Publications (2)

Publication Number Publication Date
CN105045648A true CN105045648A (zh) 2015-11-11
CN105045648B CN105045648B (zh) 2018-03-30

Family

ID=54452212

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510350166.0A Active CN105045648B (zh) 2015-05-08 2015-06-23 IaaS云环境下物理主机资源状态预测方法

Country Status (1)

Country Link
CN (1) CN105045648B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105511944A (zh) * 2016-01-07 2016-04-20 上海海事大学 一种云系统内部虚拟机的异常检测方法
CN106933650A (zh) * 2017-03-03 2017-07-07 北方工业大学 云应用系统的负载管理方法及系统
CN107040412A (zh) * 2017-03-31 2017-08-11 南京邮电大学 一种云服务器负载预测方法
CN108121638A (zh) * 2017-12-21 2018-06-05 曙光信息产业股份有限公司 服务器整平台功耗优化方法和装置
CN111597121A (zh) * 2020-07-24 2020-08-28 四川新网银行股份有限公司 一种基于历史测试用例挖掘的精准测试方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662764A (zh) * 2012-04-25 2012-09-12 梁宏斌 一种基于smdp的动态云计算资源优化分配方法
CN103036974A (zh) * 2012-12-13 2013-04-10 广东省电信规划设计院有限公司 基于隐马尔可夫模型的云计算资源调度方法和系统
CN103744977A (zh) * 2014-01-13 2014-04-23 浪潮(北京)电子信息产业有限公司 一种云计算系统平台中的监控方法及系统
CN103870341A (zh) * 2014-03-12 2014-06-18 汉柏科技有限公司 一种调整虚拟机资源的方法和系统
CN104461821A (zh) * 2014-11-03 2015-03-25 浪潮(北京)电子信息产业有限公司 一种虚拟机监控预警方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662764A (zh) * 2012-04-25 2012-09-12 梁宏斌 一种基于smdp的动态云计算资源优化分配方法
CN103036974A (zh) * 2012-12-13 2013-04-10 广东省电信规划设计院有限公司 基于隐马尔可夫模型的云计算资源调度方法和系统
CN103744977A (zh) * 2014-01-13 2014-04-23 浪潮(北京)电子信息产业有限公司 一种云计算系统平台中的监控方法及系统
CN103870341A (zh) * 2014-03-12 2014-06-18 汉柏科技有限公司 一种调整虚拟机资源的方法和系统
CN104461821A (zh) * 2014-11-03 2015-03-25 浪潮(北京)电子信息产业有限公司 一种虚拟机监控预警方法及系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105511944A (zh) * 2016-01-07 2016-04-20 上海海事大学 一种云系统内部虚拟机的异常检测方法
WO2017118133A1 (zh) * 2016-01-07 2017-07-13 上海海事大学 一种云系统内部虚拟机的异常检测方法
CN105511944B (zh) * 2016-01-07 2018-09-28 上海海事大学 一种云系统内部虚拟机的异常检测方法
CN106933650A (zh) * 2017-03-03 2017-07-07 北方工业大学 云应用系统的负载管理方法及系统
CN107040412A (zh) * 2017-03-31 2017-08-11 南京邮电大学 一种云服务器负载预测方法
CN108121638A (zh) * 2017-12-21 2018-06-05 曙光信息产业股份有限公司 服务器整平台功耗优化方法和装置
CN111597121A (zh) * 2020-07-24 2020-08-28 四川新网银行股份有限公司 一种基于历史测试用例挖掘的精准测试方法

Also Published As

Publication number Publication date
CN105045648B (zh) 2018-03-30

Similar Documents

Publication Publication Date Title
EP3089034B1 (en) System and method for optimizing energy consumption by processors
Shen et al. Cloudscale: elastic resource scaling for multi-tenant cloud systems
Beloglazov et al. Optimal online deterministic algorithms and adaptive heuristics for energy and performance efficient dynamic consolidation of virtual machines in cloud data centers
Aksanli et al. Utilizing green energy prediction to schedule mixed batch and service jobs in data centers
CN105045648A (zh) IaaS云环境下物理主机资源状态预测方法
CN102326134B (zh) 能量感知服务器管理
Duggan et al. A multitime‐steps‐ahead prediction approach for scheduling live migration in cloud data centers
CN102111337B (zh) 任务调度方法和系统
US8677361B2 (en) Scheduling threads based on an actual power consumption and a predicted new power consumption
CN103473139B (zh) 虚拟机集群资源分配调度方法
US20160370843A1 (en) Method and Apparatus for Customized Energy Policy based on Energy Demand Estimation for Client Systems
KR102585591B1 (ko) 이기종 프로세서 기반 엣지 시스템에서 slo 달성을 위한 인공지능 추론 스케쥴러
US20160077571A1 (en) Heuristic Processor Power Management in Operating Systems
CN104407688A (zh) 基于树回归的虚拟化云平台能耗测量方法及系统
Xu et al. VMSAGE: a virtual machine scheduling algorithm based on the gravitational effect for green cloud computing
Cheng et al. Elastic power-aware resource provisioning of heterogeneous workloads in self-sustainable datacenters
Padoin et al. Saving energy by exploiting residual imbalances on iterative applications
WO2019153188A1 (en) Gpu power modeling using system performance data
US10423201B2 (en) Method and apparatus for demand estimation for energy management of client systems
CN115269108A (zh) 一种数据处理方法、装置及设备
CN108574600B (zh) 云计算服务器的功耗和资源竞争协同控制的服务质量保障方法
CN104657198A (zh) Numa架构系统在虚拟机环境中的访存优化方法及系统
Jahanshahi et al. PowerMorph: QoS-aware server power reshaping for data center regulation service
Petrovska et al. Sequential Series-Based Prediction Model in Adaptive Cloud Resource Allocation for Data Processing and Security
Cheng et al. Behavior-aware integrated CPU-GPU power management for mobile games

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210409

Address after: No.217, 2nd floor, block a, No.51, Kunming Hunan Road, Haidian District, Beijing

Patentee after: CHINA STANDARD INTELLIGENT SECURITY INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 100191 No. 37, Haidian District, Beijing, Xueyuan Road

Patentee before: BEIHANG University

TR01 Transfer of patent right