CN115562940A - 负载能耗监控方法、装置、介质及电子设备 - Google Patents

负载能耗监控方法、装置、介质及电子设备 Download PDF

Info

Publication number
CN115562940A
CN115562940A CN202211213509.5A CN202211213509A CN115562940A CN 115562940 A CN115562940 A CN 115562940A CN 202211213509 A CN202211213509 A CN 202211213509A CN 115562940 A CN115562940 A CN 115562940A
Authority
CN
China
Prior art keywords
energy consumption
virtual machine
monitored
load
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211213509.5A
Other languages
English (en)
Inventor
陈步华
刘汉江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202211213509.5A priority Critical patent/CN115562940A/zh
Publication of CN115562940A publication Critical patent/CN115562940A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/301Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • G06F11/3062Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请提供一种负载能耗监控方法、装置、介质及设备,涉及计算机技术领域,该方法包括:将待监控虚拟机的虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到降维特征向量以及能耗类型标签;基于能耗类型标签匹配预训练的目标能耗预测模型;将降维特征向量输入到目标能耗预测模型中,确定待监控虚拟机的负载能耗值;进而根据负载能耗值对所述待监控虚拟机进行能耗控制。本公开提供的方法通过联合降维分类模型能够将虚拟机运行状态数据降维并分组,提升虚拟机运行状态数据的聚类分组的准确性,同时,针对不同业务负载应用不同的能耗预测模型,有效提升负载能耗监控的准确性,以实现负载能耗的精准控制。

Description

负载能耗监控方法、装置、介质及电子设备
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种负载能耗监控方法、负载能耗监控装置、计算机可读存储介质及电子设备。
背景技术
数据中心是指不间断运行的大型关键任务计算基础设施,用于推动互联网(Internet Technology,IT)产业的快速发展和经济的整体转型。然而,数据中心的能源消耗较高,对数据中心的能耗进行预测监控是非常有必要的。目前一般是基于数据中心中虚拟机丰富的资源运行状态参数进行能耗建模,用于监控数据中心的能耗。
一种相关技术中,通过主成分分析(Principal Components Analysis)、关联分析等方法对虚拟机资源运行参数降维时,特征维数或者相关度阈值是需要人为预先设置,但设置得过大或者过小会引起模型的过匹配或者欠匹配,从而导致能耗预测模型的准确度较低。
数据中心一般负责的不同业务类型,对每种业务负载占用的资源数和资源的使用情况及其数据规律是不一样的,因此需要针对不同业务类型分别建立能耗预测模型。而目前采用的方法一般是将虚拟机负载类型简单分为CPU密集型、内存密集型和IO密集型负载型,再分别建立不同负载类型的虚拟机能耗预测模型,忽略了具体业务类型间的差异性,例如,视频编解码和安全加解密都属于计算密集型(CPU密集型),但这两种具体业务不一定适用于同一个状态参数-能耗模型,并且,忽略了虚拟机运行参数间的潜在数据关系。
基于此,相关技术还提出一种通过聚类的方法对虚拟机业务类型进行划分,然而,通过无监督聚类方法(例如k-means聚类)对虚拟机业务类型进行划分,其中,聚类个数K需要人为预先设定并且具有一定盲目性,因此聚类个数设定难度较高,人力成本较高,并且划分得到的虚拟机业务类型准确度较低,导致最终的能耗预测结果的准确度也较低。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有方案的信息。
发明内容
本申请的目的在于提供一种负载能耗监控方法、负载能耗监控装置、计算机可读存储介质及电子设备,可以在实现对虚拟机运行状态数据进行特征降维的同时,提升不同业务类型的虚拟机的分类准确性,有效提高虚拟机的负载能耗监控预测结果的准确性,实现对虚拟机能耗的精准控制。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请的第一方面,提供一种负载能耗监控方法,该方法包括:
获取待监控虚拟机的虚拟机运行状态数据;
将所述虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到所述待监控虚拟机的降维特征向量以及能耗类型标签;
基于所述能耗类型标签匹配预训练的目标能耗预测模型;
将所述降维特征向量输入到所述目标能耗预测模型中,确定所述待监控虚拟机的负载能耗值;
根据所述负载能耗值对所述待监控虚拟机进行能耗控制。
在本申请的一种示例性实施例中,基于前述方案,所述根据所述负载能耗值对所述待监控虚拟机进行能耗控制,包括:
获取所述待监控虚拟机对应的业务优先级;
根据所述负载能耗值确定所述待监控虚拟机对应的能耗等级;
基于所述业务优先级以及所述能耗等级确定能耗控制指数;
通过所述能耗控制指数对所述待监控虚拟机进行能耗控制。
在本申请的一种示例性实施例中,基于前述方案,所述通过所述能耗控制指数对所述待监控虚拟机进行能耗控制,包括:
获取预设的能耗控制阈值;
若所述能耗控制指数大于或者等于所述能耗控制阈值,则对所述待监控虚拟机对应的业务负载进行资源限制处理;
若所述能耗控制指数小于所述能耗控制阈值,则对所述待监控虚拟机对应的业务负载进行资源优先提供处理。
在本申请的一种示例性实施例中,基于前述方案,所述方法还包括:
获取样本虚拟机运行状态数据;
将所述样本虚拟机运行状态数据输入到预构建的联合聚类分类模型中进行模型训练,以通过所述预构建的联合聚类分类模型自动学习所述样本虚拟机运行状态数据的特征空间以及特征维数,得到训练完成的联合聚类分类模型。
在本申请的一种示例性实施例中,基于前述方案,所述方法还包括:
获取在采集所述样本虚拟机运行状态数据时测量得到的样本负载能耗数据;
将所述样本虚拟机运行状态数据输入到训练完成的联合聚类分类模型中,得到样本降维特征向量以及样本能耗类型标签;
根据所述样本能耗类型标签,将所述样本降维特征向量以及所述样本降维特征向量对应的所述样本负载能耗数据划分为样本训练数据组;
基于所述样本训练数据组对预构建的能耗预测模型进行模型训练,得到各所述样本能耗类型标签下训练完成的能耗预测模型。
在本申请的一种示例性实施例中,基于前述方案,所述联合聚类分类模型通过以下关系式表示:
Figure BDA0003873099350000031
其中,xn表示P维的虚拟机运行状态数据参数,xn由一个K(K<P)维的隐含特征向量sn(即表示降维后的降维特征向量)经过线性变换并叠加高斯白噪声εn后得到;变换矩阵D=[d1,d2,…,dK]∈RP×K,符号°表示哈达玛积(Hadamard),zn=[zn1,zn2,…,znK]T,znK∈[0,1],zn用于说明dK是否被用于描述虚拟机运行状态数据参数xn;Ber(·)、β(·)和Γ(·)分别用于表示伯努利(Bernoulli)分布、贝塔(Beta)分布和伽马(Gamma)分布,a0~h0为预先设定的超参数;基分布G0采用威希特分布(Normal-Wishart)NW(μ,∑|μ0,W00,v0),其中μ0,W00,v0为预设的参数值。
Figure BDA0003873099350000041
为Delta函数,
Figure BDA0003873099350000042
Figure BDA0003873099350000043
α为vc的先验分布参数,on=c用于表示隐含特征向量sn属于第c个聚类分组,Mult(·)用于表示多项分布。
在本申请的一种示例性实施例中,基于前述方案,所述联合聚类分类模型的联合后验分布为
Figure BDA0003873099350000044
所述联合聚类分类模型采用Gibbs抽样进行迭代,以求解出模型参数和降维后的降维特征向量sn和相应的能耗类型标签on
降维特征向量sn的条件后验分布snk表示为:
Figure BDA0003873099350000045
其中,
Figure BDA0003873099350000046
聚类分布参数{μ,∑}的条件后验分布表示为:
p(μc,∑c|-)~NW(μc,∑c|μ,W,β,υ)
Figure BDA0003873099350000047
Figure BDA0003873099350000048
其中,β=β0+Nc,υ=υ0+Nc,Nc表示属于第c个聚类的样本个数,
Figure BDA0003873099350000049
分别为特征向量的均值和协方差的最大似然估计值;
能耗类型标签on的条件后验分布表示为:
κn=[κn1n,…,κnC]
κnc=p(on=c|μc,∑c)∝N(sn;μc,∑c)
on~Mult(κn)
其中,Mult(·)用于表示多项分布。
根据本申请的第二方面,提供一种负载能耗监控装置,包括:
数据采集模块,用于获取待监控虚拟机的虚拟机运行状态数据;
数据降维分类模块,用于将所述虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到所述待监控虚拟机的降维特征向量以及能耗类型标签;
能耗预测模型匹配模块,用于基于所述能耗类型标签匹配预训练的目标能耗预测模型;
负载能耗值预测模块,用于将所述降维特征向量输入到所述目标能耗预测模型中,确定所述待监控虚拟机的负载能耗值;
能耗控制模块,用于根据所述负载能耗值对所述待监控虚拟机进行能耗控制。
在本申请的一种示例性实施例中,能耗控制模块405可以用于:
获取所述待监控虚拟机对应的业务优先级;
根据所述负载能耗值确定所述待监控虚拟机对应的能耗等级;
基于所述业务优先级以及所述能耗等级确定能耗控制指数;
通过所述能耗控制指数对所述待监控虚拟机进行能耗控制。
在本申请的一种示例性实施例中,能耗控制模块405可以用于:
获取预设的能耗控制阈值;
若所述能耗控制指数大于或者等于所述能耗控制阈值,则对所述待监控虚拟机对应的业务负载进行资源限制处理;
若所述能耗控制指数小于所述能耗控制阈值,则对所述待监控虚拟机对应的业务负载进行资源优先提供处理。
在本申请的一种示例性实施例中,负载能耗监控装置400还可以包括联合聚类分类模型训练单元,该联合聚类分类模型训练单元可以用于:
获取样本虚拟机运行状态数据;
将所述样本虚拟机运行状态数据输入到预构建的联合聚类分类模型中进行模型训练,以通过所述预构建的联合聚类分类模型自动学习所述样本虚拟机运行状态数据的特征空间以及特征维数,得到训练完成的联合聚类分类模型。
在本申请的一种示例性实施例中,负载能耗监控装置400还可以包括能耗预测模型训练单元,该能耗预测模型训练单元可以用于:
获取在采集所述样本虚拟机运行状态数据时测量得到的样本负载能耗数据;
将所述样本虚拟机运行状态数据输入到训练完成的联合聚类分类模型中,得到样本降维特征向量以及样本能耗类型标签;
根据所述样本能耗类型标签,将所述样本降维特征向量以及所述样本降维特征向量对应的所述样本负载能耗数据划分为样本训练数据组;
基于所述样本训练数据组对预构建的能耗预测模型进行模型训练,得到各所述样本能耗类型标签下训练完成的能耗预测模型。
在本申请的一种示例性实施例中,联合聚类分类模型可以通过以下关系式表示:
Figure BDA0003873099350000061
其中,xn表示P维的虚拟机运行状态数据参数,xn由一个K(K<P)维的隐含特征向量sn(即表示降维后的降维特征向量)经过线性变换并叠加高斯白噪声εn后得到;变换矩阵D=[d1,d2,…,dK]∈RP×K,符号°表示哈达玛积(Hadamard),zn=[zn1,zn2,…,znK]T,znK∈[0,1],zn用于说明dK是否被用于描述虚拟机运行状态数据参数xn;Ber(·)、β(·)和Γ(·)分别用于表示伯努利(Bernoulli)分布、贝塔(Beta)分布和伽马(Gamma)分布,a0~h0为预先设定的超参数;基分布G0采用威希特分布(Normal-Wishart)NW(μ,∑|μ0,W000),其中μ0,W000为预设的参数值。
Figure BDA0003873099350000071
为Delta函数,
Figure BDA0003873099350000072
Figure BDA0003873099350000073
α为vc的先验分布参数,on=c用于表示隐含特征向量sn属于第c个聚类分组,Mult(·)用于表示多项分布。
在本申请的一种示例性实施例中,联合聚类分类模型的联合后验分布为
Figure BDA0003873099350000074
所述联合聚类分类模型采用Gibbs抽样进行迭代,以求解出模型参数和降维后的降维特征向量sn和相应的能耗类型标签on
降维特征向量sn的条件后验分布snk表示为:
Figure BDA0003873099350000075
Figure BDA0003873099350000076
Figure BDA0003873099350000077
其中,
Figure BDA0003873099350000078
聚类分布参数{μ,∑}的条件后验分布表示为:
p(μc,∑c|-)~NW(μc,∑c|μ,W,β,υ)
Figure BDA0003873099350000079
Figure BDA00038730993500000710
其中,β=β0+Nc,υ=υ0+Nc,Nc表示属于第c个聚类的样本个数,
Figure BDA00038730993500000711
分别为特征向量的均值和协方差的最大似然估计值;
能耗类型标签on的条件后验分布表示为:
κn=[κn1n,…,κnC]
κnc=p(on=c|μc,∑c)∝N(sn;μc,∑c)
on~Mult(κn)
其中,Mult(·)用于表示多项分布。
根据本申请的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一项的方法。
根据本申请的第四方面,提供一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的方法。
本申请示例性实施例可以具有以下部分或全部有益效果:
在本申请的一示例实施方式所提供的负载能耗监控方法中,可以将待监控虚拟机的虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到待监控虚拟机的降维特征向量以及能耗类型标签,然后可以基于能耗类型标签匹配预训练的目标能耗预测模型,并将降维特征向量输入到目标能耗预测模型中,确定待监控虚拟机的负载能耗值,进而可以根据预测的负载能耗值对待监控虚拟机进行能耗控制。一方面,通过联合降维分类模型能够有效将不同业务类型的虚拟机聚类为不同的能耗类型标签,能够挖掘虚拟机运行状态数据间的潜在数据关系,相比于相关技术中人为设置聚类标签,能够减少人为因素影响,提升设置的能耗类型标签的准确性以及有效性;另一方面,针对不同能耗类型标签下的虚拟机采用不同的能耗预测模型,有效提升负载能耗值的准确性,实现对虚拟机能耗的精准控制,保证数据中心中不同业务类型的虚拟机的高效率运行;再一方面,通过联合降维分类模型能够对虚拟机运行状态数据进行特征降维,可以保证降维特征向量的有效性的同时,降低虚拟机运行状态数据的特征向量的维度,减少计算量,提升负载能耗值的计算效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出了根据本申请的一个实施例的负载能耗监控方法的流程图;
图2示意性示出了根据本申请的另一个实施例的负载能耗监控方法的流程图;
图3示意性示出了根据本申请的一个实施例的负载能耗监控系统的架构图;
图4示意性示出了根据本申请的一个实施例中的负载能耗监控装置的结构框图;
图5示意性示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本申请的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本申请的各方面变得模糊。
此外,附图仅为本申请的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
数据中心的重要性主要由两个现象推动,首先,各种大规模云服务商、电信运营商、银行等对数据计算、处理和存储的需求不断增长,导致了拥有数千台服务器(有时有数百万台服务器)的大型数据中心的激增。第二,为承载各种各样的业务和应用,促进了大规模计算基础设施的构建。然而,大型数据中心的用电量通常是标准办公用电量的100-200倍,并且,为一个典型的数据中心供电的能源成本每5年翻一番,在某些情况下,能耗费用成本可能会超过购买设备的成本。同时,数据中心的能源消耗使用造成了一系列的环境问题。
近年来,云数据中心的高能耗问题愈发的严重,也有很多关于云平台环境下能耗模型测算的研究,第一类是基于CPU、内存和磁盘部件运行参数建立能耗模型,相关方案直接采用常见的CPU使用率、CPU频率、硬盘读写、内存读写总字节数等少量运行参数(参数个数<10)进行能耗建模,虽然这几个参数与虚拟机能耗相关度较高,但直接忽略掉大量潜在的特征参数,也会对能耗模型的准确度造成很大影响。第二类基于虚拟机丰富的资源运行状态参数(参数个数>100)进行能耗建模,相关方案通过PCA、关联分析等降维方法对虚拟机资源运行参数降维时,特征维数或者相关度阈值是需要人为预先设置,设置得过大或者过小会引起模型的过匹配或者欠匹配,从而影响能耗测算模型的准确度。
不同的业务类型,对每种负载占用的资源数和资源的使用情况及其数据规律是不一样的,因此需要针对不同业务类型分别建立能耗模型。现有研究根据虚拟机负载类型,简单分为CPU密集型、内存密集型和IO密集型负载型(业界尚无明确划分准则),再分别建立这3个虚拟机能耗模型,忽略了具体业务间的差异性,例如,视频编解码和安全加解密都属于计算密集型(CPU密集型),但这两种具体业务不一定适用于同一个状态参数-能耗模型,并且,忽略了虚拟机运行参数间的潜在数据关系。相关方案还通过无监督聚类方法(例如,k-means)对虚拟机业务类型进行划分,再分别建立能耗测算模型,其中,聚类个数K需要人为预先设定并且具有一定盲目性,因此聚类个数设定难度较高。
因此,目前相关技术中存在的问题主要在于:(1)对虚拟机资源运行参数选取及处理方式不合理,难以获得可靠的资源运行参数的潜在数据特征;(2)对虚拟机负载类型分组进行简单主观性划分,忽略了具体业务间的差异性,因此,虚拟机能耗测算准确度不高和能耗控制执行不合理。
基于相关技术中存在的一种或者多种问题,本申请实施例首先提供了一种负载能耗监控方法,可以由通用服务器执行,请参阅图1,图1示意性示出了根据本申请的一个实施例的负载能耗监控方法的流程图。如图1所示,该负载能耗监控方法可以包括:步骤S110~步骤S150。
步骤S110,获取待监控虚拟机的虚拟机运行状态数据。
步骤S120,将所述虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到所述待监控虚拟机的降维特征向量以及能耗类型标签。
步骤S130,基于所述能耗类型标签匹配预训练的目标能耗预测模型。
步骤S140,将所述降维特征向量输入到所述目标能耗预测模型中,确定所述待监控虚拟机的负载能耗值。
步骤S150,根据所述负载能耗值对所述待监控虚拟机进行能耗控制。
实施图1所示的方法,可以将待监控虚拟机的虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到待监控虚拟机的降维特征向量以及能耗类型标签,然后可以基于能耗类型标签匹配预训练的目标能耗预测模型,并将降维特征向量输入到目标能耗预测模型中,确定待监控虚拟机的负载能耗值,进而可以根据预测的负载能耗值对待监控虚拟机进行能耗控制。一方面,通过联合降维分类模型能够有效将不同业务类型的虚拟机聚类为不同的能耗类型标签,能够挖掘虚拟机运行状态数据间的潜在数据关系,相比于相关技术中人为设置聚类标签,能够减少人为因素影响,提升设置的能耗类型标签的准确性以及有效性;另一方面,针对不同能耗类型标签下的虚拟机采用不同的能耗预测模型,有效提升负载能耗值的准确性,实现对虚拟机能耗的精准控制,保证数据中心中不同业务类型的虚拟机的高效率运行;再一方面,通过联合降维分类模型能够对虚拟机运行状态数据进行特征降维,可以保证降维特征向量的有效性的同时,降低虚拟机运行状态数据的特征向量的维度,减少计算量,提升负载能耗值的计算效率。
下面,对于本示例实施方式的上述步骤进行更加详细的说明。
在步骤S110中,获取待监控虚拟机的虚拟机运行状态数据。
在本申请的一个示例实施例中,虚拟机(Virtual Machine)是指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。
待监控虚拟机是指在数据中心负载运行不同业务类型的虚拟机,例如,待监控虚拟机可以是负载运行人工智能(Artificial Intelligence,AI)识别业务、视频编解码业务、安全加密解密业务、内容分发网络(Content Delivery Network,CDN)业务、数据库读写业务、大数据处理业务、转发类网元UPF业务、vBRAS转发面业务的虚拟机,当然,待监控虚拟机还可以是负载运行其他任意业务类型的虚拟机,本示例实施例对此不做特殊限定。
具体地,虚拟机运行状态数据可以包括多个不同种类的运行状态参数,如,虚拟机运行状态数据至少可以包括中央处理器(Central Processing Unit,CPU)使用率、CPU频率、内存占用率、内存使用量、硬盘读写、内存读写总字节数、网络上行速率、网络下行速率等,当然,虚拟机运行状态数据还可以包括其他任意的与虚拟机的虚拟资源相关的参数,本实施例中的虚拟机运行状态数据的维度可以大于100个,此处不再对虚拟机运行状态数据进行一一说明。相关技术中一般仅采用少量的运行状态参数进行能耗建模,如仅通过CPU使用率、CPU频率、内存占用率、硬盘读写量、内存读写总字节数等主要参数进行能耗建模,但是该方式忽略了虚拟机运行状态数据之间潜在的特征参数,容易导致能耗预测结果不准确,而本申请可以通过预训练的联合聚类分类模型挖掘到多维度的虚拟机运行状态数据中的潜在特征,有效提升联合聚类分类模型聚类得到的能耗类型标签的准确性以及有效性。
此外,需要说明的是,上述的虚拟机运行状态数据可以为数据中心中的任一物理机运行的虚拟机运行状态数据,不同物理机运行的虚拟机可以是相同的也可以是不同的,同一物理机可以运行一个或多个虚拟机,本申请实施例以物理机运行一个虚拟机为例。
具体的,可以通过虚拟机监听器(Hypervisor)获取虚拟机运行状态数据。其中,虚拟机运行状态数据可以对应于多个数据点(如,每次数据采集间隔为3s,每次共采集16000个数据点),每个数据点对应一组虚拟机运行状态数据,虚拟机运行状态数据可以表示为一个多维的特征数据,例如,虚拟机运行状态数据可以表示为132维的特征数据。
在步骤S120中,将所述虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到所述待监控虚拟机的降维特征向量以及能耗类型标签。
在本申请的一个示例实施例中,联合降维分类模型(dpBPFA)是本申请提供的一种将数据降维(特征提取)和数据聚类分组统一在贝叶斯(Beyesian)概率框架下的联合学习模型。
本申请提供的联合降维分类模型能够合理的选取并处理虚拟机运行状态数据,充分挖掘与虚拟机能耗相关的资源运行参数及其潜在数据特征,并且通过引入Beta过程,自动确定运行状态数据降维的维数,去除冗余信息,克服了相关技术中仅考虑CPU、内存、磁盘的少量运行状态数据作为能耗测算指标依据时造成的能耗测算不准确问题。
本申请提供的联合降维分类模型能够充分考虑具体业务类型的差异性,通过引入DPM(Dirichlet Process Mixture)模型,在状态参数的特征空间进行负载类型的分组划分,充分挖掘负载类型的异构型规律,并且能够自动确定分组个数,使各个分组的中样本分布规律一致,克服了相关技术中只对虚拟机负载类型进行简单划分,并且避免相关集中必须预先通过人为设置分组个数的主观盲目性,而造成的能耗测算模型适应性和准确性较差的问题。
本申请提供的联合降维分类模型能够将虚拟机运行状态数据的数据降维处理过程(特征提取处理)和聚类分组处理过程统一在贝叶斯概率模型框架下联合学习,降低能耗测算的时间成本和存储成本,并使得相关联的多任务联合学习进一步提高模型泛化能力。
在步骤S130中,基于所述能耗类型标签匹配预训练的目标能耗预测模型。
在本申请的一个示例实施例中,能耗预测模型是指预先训练的用于根据不同能耗类型标签下的降维特征向量实现负载能耗值预测的人工智能模型,例如,能耗预测模型可以是卷积神经网络(Convolutional Neural Network,CNN),也可以是长短期记忆网络(Long short-term memory,LSTM)等深度学习模型,当然,能耗预测模型还可以是支持向量机(Support Vector Machine,SVM)等机器学习模型,本示例实施例对此不做特殊限定。
可以基于联合降维分类模型预先确定的不同的能耗类型标签,以及各能耗类型标签下的虚拟机运行状态数据分别训练得到多个能耗预测模型,一般情况下,一个能耗类型标签对应一个能耗预测模型。
在确定虚拟机运行状态数据的能耗类型标签之后,可以通过能耗类型标签在预训练的多个能耗预测模型进行匹配,确定目标能耗预测模型,并通过目标能耗预测模型进行能耗预测。
在步骤S140中,将所述降维特征向量输入到所述目标能耗预测模型中,确定所述待监控虚拟机的负载能耗值。
在本申请的一个示例实施例中,负载能耗值是指待监控虚拟机所需要消耗的能源。在根据能耗类型标签匹配到目标能耗预测模型后,可以通过目标能耗预测模型对该能耗类型标签对应的降维特征向量进行能耗预测,预测得到待监控虚拟机的负载能耗值。
在步骤S150中,根据所述负载能耗值对所述待监控虚拟机进行能耗控制。
在本申请的一个示例实施例中,可以根据负载能耗值对待监控虚拟机进行能耗控制,例如,可以预先设置一个负载能耗阈值,在负载能耗值大于或者等于负载能耗阈值时,可以认为当前业务负载较大,可以对该待监控虚拟机对应的业务类型进行控制,以降低该业务类型对应的业务负载,降低能耗,保证数据中心的正常运转。
可以将待监控虚拟机的虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到待监控虚拟机的降维特征向量以及能耗类型标签,然后可以基于能耗类型标签匹配预训练的目标能耗预测模型,并将降维特征向量输入到目标能耗预测模型中,确定待监控虚拟机的负载能耗值,进而可以根据预测的负载能耗值对待监控虚拟机进行能耗控制。一方面,通过联合降维分类模型能够有效将不同业务类型的虚拟机聚类为不同的能耗类型标签,能够挖掘虚拟机运行状态数据间的潜在数据关系,相比于相关技术中人为设置聚类标签,能够减少人为因素影响,提升设置的能耗类型标签的准确性以及有效性;另一方面,针对不同能耗类型标签下的虚拟机采用不同的能耗预测模型,有效提升负载能耗值的准确性,实现对虚拟机能耗的精准控制,保证数据中心中不同业务类型的虚拟机的高效率运行;再一方面,通过联合降维分类模型能够对虚拟机运行状态数据进行特征降维,可以保证降维特征向量的有效性的同时,降低虚拟机运行状态数据的特征向量的维度,减少计算量,提升负载能耗值的计算效率。
下面,对步骤S110至步骤S150进行详细说明。
在本申请的一个示例实施例中,可以通过以下步骤实现根据负载能耗值对待监控虚拟机进行能耗控制:
可以获取待监控虚拟机对应的业务优先级,然后可以根据负载能耗值确定待监控虚拟机对应的能耗等级,基于业务优先级以及能耗等级确定能耗控制指数;通过能耗控制指数对待监控虚拟机进行能耗控制。
其中,业务优先级是指预先设置的用于衡量待监控虚拟机执行的业务类型的重要程度的数据,例如,业务优先级可以分为优先级1、优先级2、优先级3、优先级4、优先级5、优先级6和优先级7,数字越大,表示优先级越高,业务重要程度越高;当然,业务优先级还可以分为非常重要、重要、普通、一般,具体可以根据实际使用情况进行自定义设置,本示例实施例对此不做特殊限定。
能耗等级是指预先设置的用于衡量待监控虚拟机的能耗高低程度的数据,例如,能耗等级可以分为1、2、3、4、5这五个级别,数字越大,表示能耗越高;当然,能耗等级也可以分为非常高、高、中、低,具体可以根据实际使用情况进行自定义设置,本示例实施例对此不做特殊限定。
举例而言,假设待监控虚拟机执行的是虚拟化转发面网元业务,虚拟化转发面网元业务预先设置的业务优先级为4,预测得到虚拟化转发面网元业务的负载能耗值属于能耗等级3,那么可以计算能耗控制指数=能耗等级/业务优先级,即虚拟化转发面网元业务的能耗控制指数为3/4=0.75。当然,此处仅是示意性举例说明,并不应对本示例实施例造成任何特殊限定。
可选的,可以通过以下步骤实现通过能耗控制指数对待监控虚拟机进行能耗控制:
可以获取预设的能耗控制阈值,若能耗控制指数大于或者等于能耗控制阈值,则可以对待监控虚拟机对应的业务负载进行资源限制处理;若能耗控制指数小于能耗控制阈值,则对待监控虚拟机对应的业务负载进行资源优先提供处理。
其中,资源限制处理是指控制待监控虚拟机对应的业务负载进行适当延迟传输或者处理的控制过程,例如,以待监控虚拟机执行虚拟化转发面网元业务为例,由于虚拟化转发面网元业务需要较高的网络吞吐能力和网络包转发能力,网络传输能力大小与虚拟机能耗呈正相关关系,因此可以通过降低网络吞吐能力和网络包转发速率,实现降低能耗。
资源优先提供处理是指控制待监控虚拟机对应的业务负载进行优先传输或者处理的控制过程,可以将待监控虚拟机所需要的负载资源优先提供,以保证待监控虚拟机执行的业务类型的高效运行,例如,以待监控虚拟机执行虚拟化转发面网元业务为例,由于虚拟化转发面网元业务需要较高的网络吞吐能力和网络包转发能力,因此可以通过将网络带宽资源优先提供给虚拟化转发面网元业务,实现优先处理。
举例而言,假设待监控虚拟机执行的是虚拟化转发面网元业务,可以设置能耗控制阈值为0.6,计算得到虚拟化转发面网元业务的能耗控制指数为0.75,此时能耗控制指数大于能耗控制阈值,说明此时运行虚拟化转发面网元业务的虚拟机的能耗较高,需要执行资源限制处理,可以降低虚拟化转发面网元业务的网络吞吐能力和网络包转发速率,实现降低能耗。
在本申请的一个示例实施例中,可以通过预训练过程实现联合聚类分类模型的预训练,预训练过程可以包括:
可以获取样本虚拟机运行状态数据,然后将样本虚拟机运行状态数据输入到预构建的联合聚类分类模型中进行模型训练,以通过预构建的联合聚类分类模型自动学习样本虚拟机运行状态数据的特征空间以及特征维数,并自动确定数据分组个数实现数据的分组,得到训练完成的联合聚类分类模型。
具体的,联合聚类分类模型(dpBPFA)可以通过关系式(1)表示:
Figure BDA0003873099350000171
其中,xn可以表示P维的虚拟机运行状态数据参数,xn可以由一个K(K<P)维的隐含特征向量sn(即表示降维后的降维特征向量)经过线性变换并叠加高斯白噪声εn后得到;变换矩阵D可以表示为D=[d1,d2,…,dK]∈RP×K;符号
Figure BDA0003873099350000177
可以表示哈达玛积(Hadamard),zn=[zn1,zn2,…,znK]T,znK∈[0,1],zn可以用于说明dK是否被用于描述虚拟机运行状态数据参数xn;Ber(·)、β(·)和Γ(·)可以分别用于表示伯努利(Bernoulli)分布、贝塔(Beta)分布和伽马(Gamma)分布,a0~h0可以表示为预先设定的超参数;基分布G0可以采用威希特分布(Normal-Wishart)NW(μ,∑|μ0,W000),其中μ0,W00,v0为预设的参数值。
Figure BDA0003873099350000172
为Delta函数,
Figure BDA0003873099350000173
Figure BDA0003873099350000174
α为vc的先验分布参数,on=c用于表示隐含特征向量sn属于第c个聚类分组,Mult(·)用于表示多项分布。
可选的,本实施例中的联合聚类分类模型的联合后验分布可以表示为
Figure BDA0003873099350000175
具体的,联合聚类分类模型可以采用吉布斯(Gibbs)采样进行迭代,以求解出联合聚类分类模型中的模型参数以及超参数,并求解出降维后的降维特征向量sn和相应的能耗类型标签on
可选的,降维特征向量sn的条件后验分布snk可以表示为以下关系式:
Figure BDA0003873099350000176
Figure BDA0003873099350000181
Figure BDA0003873099350000182
其中,
Figure BDA0003873099350000183
可选的,聚类分布参数{μ,∑}的条件后验分布可以表示为以下关系式:
p(μc,∑c|-)~NW(μc,∑c|μ,W,β,υ)
Figure BDA0003873099350000184
Figure BDA0003873099350000185
其中,β=β0+Nc,υ=υ0+Nc,Nc表示属于第c个聚类的样本个数,
Figure BDA0003873099350000186
分别为特征向量的均值和协方差的最大似然估计值;
可选的,能耗类型标签on的条件后验分布可以表示为以下关系式:
κn=[κn1n,…,κnC]
κnc=p(on=c|μc,∑c)∝N(sn;μc,∑c)
on~Mult(κn)
其中,Mult(·)用于表示多项分布。
本实施例中的联合聚类分类模型(dpBPFA)通过将FA(Factor Analysis,因子分析)模型引入Beta过程,可以根据数据自动确定运行状态数据的降维维数,同时引入DPM(Dirichlet Process Mixture)模型对运行状态参数特征向量进行分组聚类,且自动学习出分组聚类个数,使各个分组的中样本分布一致,保障了虚拟机负载类型分组的合理性,可以有效避免相关技术中通过认为设置聚类个数而导致聚类结果不准确的问题,有效提升虚拟机运行状态数据的能耗类型标签的准确性,进而保证预测的负载能耗值的准确性。
通过联合降维分类模型能够合理的选取并处理虚拟机运行状态数据,充分挖掘与虚拟机能耗相关的资源运行参数及其潜在数据特征,并且通过引入Beta过程,自动确定运行状态数据降维的维数,去除冗余信息,克服了相关技术中仅考虑CPU、内存、磁盘的少量运行状态数据作为能耗测算指标依据时造成的能耗测算不准确问题。
通过联合降维分类模型能够充分考虑具体业务类型的差异性,通过引入DPM(Dirichlet Process Mixture)模型,在状态参数的特征空间进行负载类型的分组划分,充分挖掘负载类型的异构型规律,并且能够自动确定分组个数,使各个分组的中样本分布规律一致,克服了相关技术中只对虚拟机负载类型进行简单划分,并且避免相关集中必须预先通过人为设置分组个数的主观盲目性,而造成的能耗测算模型适应性和准确性较差的问题。
通过联合降维分类模型能够将虚拟机运行状态数据的数据降维处理过程(特征提取处理)和聚类分组处理过程统一在贝叶斯概率模型框架下联合学习,降低能耗测算的时间成本和存储成本,并使得相关联的多任务联合学习进一步提高模型泛化能力。
进一步的,在训练得到联合降维分类模型之后,还可以通过以下与训练过程实现对能耗预测模型进行训练:
可以获取在采集样本虚拟机运行状态数据时测量得到的样本负载能耗数据,然后将样本虚拟机运行状态数据输入到训练完成的联合聚类分类模型中,得到样本降维特征向量以及样本能耗类型标签,并可以根据样本能耗类型标签,将样本降维特征向量以及样本降维特征向量对应的样本负载能耗数据划分为样本训练数据组;进而可以基于样本训练数据组对预构建的能耗预测模型进行模型训练,得到各样本能耗类型标签下训练完成的能耗预测模型。
其中,可以获取在采集样本虚拟机运行状态数据时测量得到的样本负载能耗数据,具体可以在采集样本虚拟机运行状态数据时,通过功耗仪测量运行虚拟机的物理机的功耗,即样本负载能耗数据。
作为一种可选的实施例,可以按照预设时间间隔获取样本虚拟机运行状态数据以及样本负载能耗数据。这样可以实现对于样本虚拟机运行状态数据以及样本负载能耗数据的周期性获取,进而有利于实现对于预测模型的周期性更新,提升模型精度。
具体地,预设时间间隔可以预先设置的时间参数,如,3s。按照预设时间间隔获取到的样本虚拟机运行状态数据和样本负载能耗数据为一组数据,每个时刻对应于一组样本虚拟机运行状态数据和样本负载能耗数据,表示为[样本虚拟机运行状态数据,样本负载能耗数据]。举例来说,T1时刻对应于[样本虚拟机运行状态数据1,样本负载能耗数据1]、T2时刻对应于[样本虚拟机运行状态数据2,样本负载能耗数据2]。
请参阅图2,图2示意性示出了根据本申请的另一个实施例的负载能耗监控方法的流程图。如图2所示,该负载能耗监控方法可以包括:步骤S210~步骤S280。
步骤S210:通过真实业务/负载模拟工具模拟真实业务环境下虚拟机的负载,以获取样本虚拟机运行状态数据和样本负载能耗数据。
步骤S220:将样本虚拟机运行状态数据输入到联合聚类分类模型中,以使联合聚类分类模型自动学习的样本虚拟机运行状态数据的特征空间超参数和聚类超参数,以得到样本虚拟机运行状态数据的特征空间和特征维数,以及得到对应于样本虚拟机运行状态数据的降维特征向量以及各降维特征向量的聚类个数和能耗类型标签。
步骤S230:基于能耗类型标签对降维特征向量进行分组,得到对应于不同能耗类型标签的降维特征向量组。
步骤S240:基于各能耗类型标签下的降维特征向量和该降维特征向量对应的样本负载能耗数据,训练得到对应于各能耗类型标签的能耗预测模型。
步骤S250:获取待监控虚拟机的虚拟机运行状态数据,并将虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到待监控虚拟机的降维特征向量以及能耗类型标签。
步骤S260:基于能耗类型标签匹配预训练的目标能耗预测模型;将降维特征向量输入到目标能耗预测模型中,确定待监控虚拟机的负载能耗值。
步骤S270:根据待监控虚拟机的业务优先级以及负载能耗值对应的能耗等级确定能耗控制指数。若能耗控制指数大于或者等于能耗控制阈值,则执行步骤S280;若能耗控制指数小于能耗控制阈值,则执行步骤S250。
步骤S280:对待监控虚拟机对应的业务负载进行资源限制处理,例如,调整虚拟化转发面网元业务的网络吞吐速率和/或网络包转发速率,以实现对虚拟化转发面网元业务的资源限制处理。
需要说明的是,步骤S210~步骤S280与图1所示的各步骤及其实施例相对应,针对步骤S210~步骤S280的具体实施方式,请参阅图1所示的各步骤及其实施例,此处不再赘述。
请参阅图3,图3示意性示出了根据本申请的一个实施例中的负载能耗监控系统的架构图。如图3所示,该负载能耗监控系统300可以包括:状态和能耗数据监控采集模块310、基于联合降维分类模型的状态数据降维和分组模块320、能耗模型分组生成模块330、自适应能耗分组测算模块340、能耗控制策略应用模块350。
具体地,状态和能耗数据监控采集模块310可以通过虚拟机监听器(Hypervisor)314获取虚拟机311、虚拟机312、……、虚拟机313的样本虚拟机运行状态数据,并通过功耗仪316调用硬件服务器315以获取样本负载能耗数据,并汇总统计样本虚拟机运行状态数据和样本负载能耗数据,以生成用于训练联合降维分类模型以及能耗预测模型的训练输入数据。基于联合降维分类模型的状态数据降维和分组模块320可以自动学习样本虚拟机运行状态数据的特征空间以及特征维数,并自动确定数据分组个数实现数据的分组,以得到对应于样本虚拟机运行状态数据的降维特征向量以及各降维特征向量的能耗类型标签(聚类标签),并基于能耗类型标签对降维特征向量进行分组,得到对应于不同能耗类型标签的降维特征向量组。能耗模型分组生成模块330可以基于各能耗类型标签下的降维特征向量和该降维特征向量对应的样本能耗数据,训练得到对应于各能耗类型标签的能耗预测模型。自适应能耗分组测算模块340可以获取待监控虚拟机的虚拟机运行状态数据,并将虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到待监控虚拟机的降维特征向量以及能耗类型标签,基于能耗类型标签匹配预训练的目标能耗预测模型;将降维特征向量输入到目标能耗预测模型中,确定待监控虚拟机的负载能耗值,以及,可以根据待监控虚拟机的业务优先级以及负载能耗值对应的能耗等级确定能耗控制指数。能耗控制策略应用模块350可以在能耗控制指数大于或者等于能耗控制阈值时,对待监控虚拟机对应的业务负载进行资源限制处理,例如,待监控虚拟机执行虚拟化转发面网元业务,资源限制处理可以是降低虚拟化转发面网元业务的网络吞吐速率和/或网络包转发速率;可以在能耗控制指数小于能耗控制阈值时,对待监控虚拟机对应的业务负载进行资源优先提供处理。
可选的,本申请提出的负载能耗监控系统可以适用于云平台环境,以在线测算虚拟机能耗,并且可以部署于通用服务器,降低了部署门槛,便于开发实现。
本申请提供的实施例中的技术方案,可以将待监控虚拟机的虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到待监控虚拟机的降维特征向量以及能耗类型标签,然后可以基于能耗类型标签匹配预训练的目标能耗预测模型,并将降维特征向量输入到目标能耗预测模型中,确定待监控虚拟机的负载能耗值,进而可以根据预测的负载能耗值对待监控虚拟机进行能耗控制。一方面,通过联合降维分类模型能够有效将不同业务类型的虚拟机聚类为不同的能耗类型标签,能够挖掘虚拟机运行状态数据间的潜在数据关系,相比于相关技术中人为设置聚类标签,能够减少人为因素影响,提升设置的能耗类型标签的准确性以及有效性;另一方面,针对不同能耗类型标签下的虚拟机采用不同的能耗预测模型,有效提升负载能耗值的准确性,实现对虚拟机能耗的精准控制,保证数据中心中不同业务类型的虚拟机的高效率运行;再一方面,通过联合降维分类模型能够对虚拟机运行状态数据进行特征降维,可以保证降维特征向量的有效性的同时,降低虚拟机运行状态数据的特征向量的维度,减少计算量,提升负载能耗值的计算效率。
本申请中提供的联合聚类分类模型(dpBPFA)通过将FA(Factor Analysis,因子分析)模型引入Beta过程,可以根据数据自动确定运行状态数据的降维维数,同时引入DPM(Dirichlet Process Mixture)模型对运行状态参数特征向量进行分组聚类,且自动学习出分组聚类个数,使各个分组的中样本分布一致,保障了虚拟机负载类型分组的合理性,可以有效避免相关技术中通过认为设置聚类个数而导致聚类结果不准确的问题,有效提升虚拟机运行状态数据的能耗类型标签的准确性,进而保证预测的负载能耗值的准确性。
通过联合降维分类模型能够合理的选取并处理虚拟机运行状态数据,充分挖掘与虚拟机能耗相关的资源运行参数及其潜在数据特征,并且通过引入Beta过程,自动确定运行状态数据降维的维数,去除冗余信息,克服了相关技术中仅考虑CPU、内存、磁盘的少量运行状态数据作为能耗测算指标依据时造成的能耗测算不准确问题。
通过联合降维分类模型能够充分考虑具体业务类型的差异性,通过引入DPM(Dirichlet Process Mixture)模型,在状态参数的特征空间进行负载类型的分组划分,充分挖掘负载类型的异构型规律,并且能够自动确定分组个数,使各个分组的中样本分布规律一致,克服了相关技术中只对虚拟机负载类型进行简单划分,并且避免相关集中必须预先通过人为设置分组个数的主观盲目性,而造成的能耗测算模型适应性和准确性较差的问题。
通过联合降维分类模型能够将虚拟机运行状态数据的数据降维处理过程(特征提取处理)和聚类分组处理过程统一在贝叶斯概率模型框架下联合学习,降低能耗测算的时间成本和存储成本,并使得相关联的多任务联合学习进一步提高模型泛化能力。
本申请实施例还提供一种负载能耗监控装置。请参阅图4,图4示意性示出了根据本申请的一个实施例中的负载能耗监控装置的结构框图。负载能耗监控装置400与图1所示的方法相对应,如图4所示,该负载能耗监控装置400包括:
数据采集模块401可以用于获取待监控虚拟机的虚拟机运行状态数据;
数据降维分类模块402可以用于将所述虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到所述待监控虚拟机的降维特征向量以及能耗类型标签;
能耗预测模型匹配模块403可以用于基于所述能耗类型标签匹配预训练的目标能耗预测模型;
负载能耗值预测模块404可以用于将所述降维特征向量输入到所述目标能耗预测模型中,确定所述待监控虚拟机的负载能耗值;
能耗控制模块405可以用于根据所述负载能耗值对所述待监控虚拟机进行能耗控制。
在本申请的一种示例性实施例中,能耗控制模块405可以用于:
获取所述待监控虚拟机对应的业务优先级;
根据所述负载能耗值确定所述待监控虚拟机对应的能耗等级;
基于所述业务优先级以及所述能耗等级确定能耗控制指数;
通过所述能耗控制指数对所述待监控虚拟机进行能耗控制。
在本申请的一种示例性实施例中,能耗控制模块405可以用于:
获取预设的能耗控制阈值;
若所述能耗控制指数大于或者等于所述能耗控制阈值,则对所述待监控虚拟机对应的业务负载进行资源限制处理;
若所述能耗控制指数小于所述能耗控制阈值,则对所述待监控虚拟机对应的业务负载进行资源优先提供处理。
在本申请的一种示例性实施例中,负载能耗监控装置400还可以包括联合聚类分类模型训练单元,该联合聚类分类模型训练单元可以用于:
获取样本虚拟机运行状态数据;
将所述样本虚拟机运行状态数据输入到预构建的联合聚类分类模型中进行模型训练,以通过所述预构建的联合聚类分类模型自动学习所述样本虚拟机运行状态数据的特征空间以及特征维数,得到训练完成的联合聚类分类模型。
在本申请的一种示例性实施例中,负载能耗监控装置400还可以包括能耗预测模型训练单元,该能耗预测模型训练单元可以用于:
获取在采集所述样本虚拟机运行状态数据时测量得到的样本负载能耗数据;
将所述样本虚拟机运行状态数据输入到训练完成的联合聚类分类模型中,得到样本降维特征向量以及样本能耗类型标签;
根据所述样本能耗类型标签,将所述样本降维特征向量以及所述样本降维特征向量对应的所述样本负载能耗数据划分为样本训练数据组;
基于所述样本训练数据组对预构建的能耗预测模型进行模型训练,得到各所述样本能耗类型标签下训练完成的能耗预测模型。
在本申请的一种示例性实施例中,联合聚类分类模型可以通过以下关系式表示:
Figure BDA0003873099350000251
其中,xn表示P维的虚拟机运行状态数据参数,xn由一个K(K<P)维的隐含特征向量sn(即表示降维后的降维特征向量)经过线性变换并叠加高斯白噪声εn后得到;变换矩阵D=[d1,d2,…,dK]∈RP×K,符号°表示哈达玛积(Hadamard),zn=[zn1,zn2,…,znK]T,znK∈[0,1],zn用于说明dK是否被用于描述虚拟机运行状态数据参数xn;Ber(·)、β(·)和Γ(·)分别用于表示伯努利(Bernoulli)分布、贝塔(Beta)分布和伽马(Gamma)分布,a0~h0为预先设定的超参数;基分布G0采用威希特分布(Normal-Wishart)NW(μ,∑|μ0,W000),其中μ0,W00,v0为预设的参数值。
Figure BDA0003873099350000252
为Delta函数,
Figure BDA0003873099350000253
Figure BDA0003873099350000254
α为vc的先验分布参数,on=c用于表示隐含特征向量sn属于第c个聚类分组,Mult(·)用于表示多项分布。
在本申请的一种示例性实施例中,联合聚类分类模型的联合后验分布为
Figure BDA0003873099350000255
所述联合聚类分类模型采用Gibbs抽样进行迭代,以求解出模型参数和降维后的降维特征向量sn和相应的能耗类型标签on
降维特征向量sn的条件后验分布snk表示为:
Figure BDA0003873099350000256
Figure BDA0003873099350000257
Figure BDA0003873099350000261
其中,
Figure BDA0003873099350000262
聚类分布参数{μ,∑}的条件后验分布表示为:
p(μc,∑c|-)~NW(μc,∑c|μ,W,β,υ)
Figure BDA0003873099350000263
Figure BDA0003873099350000264
其中,β=β0+Nc,υ=υ0+Nc,Nc表示属于第c个聚类的样本个数,
Figure BDA0003873099350000265
分别为特征向量的均值和协方差的最大似然估计值;
能耗类型标签on的条件后验分布表示为:
κn=[κnan,…,κnC]
κnc=p(on=c|μc,∑c)∝N(sn;μc,∑c)
on~Mult(κn)
其中,Mult(·)用于表示多项分布。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
由于本申请的示例实施例的负载能耗监控装置的各个功能模块与上述负载能耗监控方法的示例实施例的步骤对应,因此对于本申请装置实施例中未披露的细节,请参照本申请上述的负载能耗监控方法的实施例。
请参阅图5,图5示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图5示出的电子设备的计算机系统500仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从储存部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统操作所需的各种程序和数据。CPU501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的储存部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入储存部分508。
特别地,根据本申请的实施例,上述参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的方法和装置中限定的各种功能。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由前述的权利要求指出。

Claims (10)

1.一种负载能耗监控方法,其特征在于,包括:
获取待监控虚拟机的虚拟机运行状态数据;
将所述虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到所述待监控虚拟机的降维特征向量以及能耗类型标签;
基于所述能耗类型标签匹配预训练的目标能耗预测模型;
将所述降维特征向量输入到所述目标能耗预测模型中,确定所述待监控虚拟机的负载能耗值;
根据所述负载能耗值对所述待监控虚拟机进行能耗控制。
2.根据权利要求1所述的方法,其特征在于,所述根据所述负载能耗值对所述待监控虚拟机进行能耗控制,包括:
获取所述待监控虚拟机对应的业务优先级;
根据所述负载能耗值确定所述待监控虚拟机对应的能耗等级;
基于所述业务优先级以及所述能耗等级确定能耗控制指数;
通过所述能耗控制指数对所述待监控虚拟机进行能耗控制。
3.根据权利要求2所述的方法,其特征在于,所述通过所述能耗控制指数对所述待监控虚拟机进行能耗控制,包括:
获取预设的能耗控制阈值;
若所述能耗控制指数大于或者等于所述能耗控制阈值,则对所述待监控虚拟机对应的业务负载进行资源限制处理;
若所述能耗控制指数小于所述能耗控制阈值,则对所述待监控虚拟机对应的业务负载进行资源优先提供处理。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取样本虚拟机运行状态数据;
将所述样本虚拟机运行状态数据输入到预构建的联合聚类分类模型中进行模型训练,以通过所述预构建的联合聚类分类模型自动学习所述样本虚拟机运行状态数据的特征空间以及特征维数,得到训练完成的联合聚类分类模型。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
获取在采集所述样本虚拟机运行状态数据时测量得到的样本负载能耗数据;
将所述样本虚拟机运行状态数据输入到训练完成的联合聚类分类模型中,得到样本降维特征向量以及样本能耗类型标签;
根据所述样本能耗类型标签,将所述样本降维特征向量以及所述样本降维特征向量对应的所述样本负载能耗数据划分为样本训练数据组;
基于所述样本训练数据组对预构建的能耗预测模型进行模型训练,得到各所述样本能耗类型标签下训练完成的能耗预测模型。
6.根据权利要求1、4、5中任一项所述的方法,其特征在于,所述联合聚类分类模型通过以下关系式表示:
Figure FDA0003873099340000021
其中,xn表示P维的虚拟机运行状态数据参数,xn由一个K(K<P)维的隐含特征向量sn(即表示降维后的降维特征向量)经过线性变换并叠加高斯白噪声εn后得到;变换矩阵D=[d1,d2,...,dK]∈RP×K,符号
Figure FDA0003873099340000025
表示哈达玛积(Hadamard),zn=[zn1,zn2,...,znK]T,znK∈[0,1],zn用于说明dK是否被用于描述虚拟机运行状态数据参数xn;Ber(·)、β(·)和Γ(·)分别用于表示伯努利(Bernoulli)分布、贝塔(Beta)分布和伽马(Gamma)分布,a0~h0为预先设定的超参数;基分布G0采用威希特分布(Normal-Wishart)NW(μ,∑|μ0,W0,β0,v0),其中μ0,W0,β0,v0为预设的参数值;
Figure FDA0003873099340000022
Figure FDA0003873099340000023
为Delta函数,
Figure FDA0003873099340000024
Figure FDA0003873099340000031
α为vc的先验分布参数,on=c用于表示隐含特征向量sn属于第c个聚类分组,Mult(·)用于表示多项分布。
7.根据权利要求6所述的方法,其特征在于,所述联合聚类分类模型的联合后验分布为
Figure FDA0003873099340000032
所述联合聚类分类模型采用Gibbs抽样进行迭代,以求解出模型参数和降维后的降维特征向量sn和相应的能耗类型标签on
降维特征向量sn的条件后验分布snk表示为:
Figure FDA0003873099340000033
Figure FDA0003873099340000034
Figure FDA0003873099340000035
其中,
Figure FDA0003873099340000036
聚类分布参数{μ,∑}的条件后验分布表示为:
p(μc,∑c|-)~NW(μc,∑c|μ,W,β,υ)
Figure FDA0003873099340000037
Figure FDA0003873099340000038
其中,β=β0+Nc,u=υ0+Nc,Nc表示属于第c个聚类的样本个数,
Figure FDA0003873099340000039
分别为特征向量的均值和协方差的最大似然估计值;
能耗类型标签on的条件后验分布表示为:
κn=[κn1,κn,…,κnC]
κnc=p(on=c|μc,∑c)∝N(sn;μc,∑c)
on~Mult(κn)
其中,Mult(·)用于表示多项分布。
8.一种负载能耗监控装置,其特征在于,包括:
数据采集模块,用于获取待监控虚拟机的虚拟机运行状态数据;
数据降维分类模块,用于将所述虚拟机运行状态数据输入到预训练的联合降维分类模型中,得到所述待监控虚拟机的降维特征向量以及能耗类型标签;
能耗预测模型匹配模块,用于基于所述能耗类型标签匹配预训练的目标能耗预测模型;
负载能耗值预测模块,用于将所述降维特征向量输入到所述目标能耗预测模型中,确定所述待监控虚拟机的负载能耗值;
能耗控制模块,用于根据所述负载能耗值对所述待监控虚拟机进行能耗控制。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的方法。
CN202211213509.5A 2022-09-29 2022-09-29 负载能耗监控方法、装置、介质及电子设备 Pending CN115562940A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211213509.5A CN115562940A (zh) 2022-09-29 2022-09-29 负载能耗监控方法、装置、介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211213509.5A CN115562940A (zh) 2022-09-29 2022-09-29 负载能耗监控方法、装置、介质及电子设备

Publications (1)

Publication Number Publication Date
CN115562940A true CN115562940A (zh) 2023-01-03

Family

ID=84744459

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211213509.5A Pending CN115562940A (zh) 2022-09-29 2022-09-29 负载能耗监控方法、装置、介质及电子设备

Country Status (1)

Country Link
CN (1) CN115562940A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117436848A (zh) * 2023-12-21 2024-01-23 山东康吉诺技术有限公司 基于人工智能的电机能耗监测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117436848A (zh) * 2023-12-21 2024-01-23 山东康吉诺技术有限公司 基于人工智能的电机能耗监测方法
CN117436848B (zh) * 2023-12-21 2024-03-08 山东康吉诺技术有限公司 基于人工智能的电机能耗监测方法

Similar Documents

Publication Publication Date Title
CN108536650B (zh) 生成梯度提升树模型的方法和装置
CN111435463A (zh) 数据处理方法及相关设备、系统
CN107392259B (zh) 构建不均衡样本分类模型的方法和装置
WO2021035412A1 (zh) 一种自动机器学习AutoML系统、方法及设备
CN117041017B (zh) 数据中心的智能运维管理方法及系统
CN116451139B (zh) 一种基于人工智能的直播数据快速分析方法
CN112966701A (zh) 目标分类的方法和装置
CN115562940A (zh) 负载能耗监控方法、装置、介质及电子设备
CN115294397A (zh) 一种分类任务的后处理方法、装置、设备及存储介质
CN114925938A (zh) 一种基于自适应svm模型的电能表运行状态预测方法、装置
CN113569955A (zh) 一种模型训练方法、用户画像生成方法、装置及设备
CN114037059A (zh) 预训练模型、模型的生成方法、数据处理方法及装置
Akay et al. Predicting the performance measures of a 2-dimensional message passing multiprocessor architecture by using machine learning methods
CN113282433A (zh) 集群异常检测方法、装置和相关设备
CN110489435B (zh) 基于人工智能的数据处理方法、装置、及电子设备
CN114650321A (zh) 用于边缘计算的任务调度方法及边缘计算终端
US11651271B1 (en) Artificial intelligence system incorporating automatic model updates based on change point detection using likelihood ratios
US11636377B1 (en) Artificial intelligence system incorporating automatic model updates based on change point detection using time series decomposing and clustering
US20240028912A1 (en) Predictively robust model training
CN115577797A (zh) 一种基于本地噪声感知的联邦学习优化方法及系统
CN112860531B (zh) 基于深度异构图神经网络的区块链广泛共识性能评测方法
CN114610953A (zh) 一种数据分类方法、装置、设备及存储介质
CN112231299A (zh) 一种特征库动态调整的方法和装置
CN113627514A (zh) 知识图谱的数据处理方法、装置、电子设备和存储介质
Fan et al. Performance prediction of network-intensive systems in cloud environment: a Bayesian approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination