WO2016045489A1

WO2016045489A1 - 云环境下的虚拟机负载评估系统、方法以及服务节点

Info

Publication number: WO2016045489A1
Application number: PCT/CN2015/088868
Authority: WO
Inventors: 柴洪峰; 吴承荣; 华锦芝; 王振方; 杨阳; 张骏
Original assignee: 中国银联股份有限公司
Priority date: 2014-09-22
Filing date: 2015-09-02
Publication date: 2016-03-31
Also published as: CN105511953B; EP3200076A4; CN105511953A; US10528378B2; US20170286147A1; EP3200076A1

Abstract

公开了一种云环境下的虚拟机负载评估系统，包括：监控数据采集模块，其配置成从云数据中心内的一个或多个虚拟机处采集监控数据；以及监控数据处理模块，与所述监控数据采集模块耦合，并配置成：针对所述一个或多个虚拟机中的每一个，利用第一KMeans算法来将所述监控数据进行聚集分组，每一个组具有一中心点坐标，并根据所述分组和各组的中心点坐标计算所述一个或多个虚拟机中每个虚拟机的性能表征，即第一特征值；基于每个虚拟机的所述第一特征值，利用第二KMeans算法来将所述一个或多个虚拟机进行聚集分组，从而确定所述一个或多个虚拟机中每个虚拟机的特征类型以及性能负载值。还公开了云环境下对虚拟机进行负载评估的方法以及一种服务节点。

Description

云环境下的虚拟机负载评估系统、方法以及服务节点

技术领域

本发明涉及云监控技术，并且更具体来说，涉及云环境下虚拟机的负载评估。

背景技术

云计算中虚拟化技术，在某些方面对传统问题解决方案提供了一种新的思路，但虚拟化技术作为一门新兴的技术，它在虚拟机资源性能管理与检测等方面所做的工作仍然有许多的不足之处。11年的一篇论文《Toward an architecture for monitoring private clouds》中，作者同样指出云监控的重要性，尽管对云的管理部署的解决方案有许多，但是云监控的技术却没有跟上步伐。

一个系统的性能特征是由其本身特征以及运行在上面的应用服务的负载特征决定的，它定量描述了一个基本的系统特征。如何去判断应用服务的负载特征从而了解整个系统所处的环境具有重要意义。

目前在虚拟机负载评估方面，并没有精确的解决方案，大多基于人为或者虚拟机宏观运行状态表现判断负载情况(例如：通过用户数量预测一个负载今后运行的情况与大致性能需求)，负载状态评估相对单一、简略。

发明内容

传统机器负载评估通常采用机器本身的系统数据进行评分，通过预先设定的参数来对机器本身进行评估。这种方法在云环境下并不适用，因为云环境下存在大量虚拟机，用户与管理员真正需要了解的不仅是各个虚拟机性能上的差异性，更需要的是整体上的一个较为精确地宏观对比，从而了解具体应用对资源的占用情况。

为解决上述问题，本申请提供了一种云环境下的虚拟机负载评估系统，包括：监控数据采集模块，其配置成从云数据中心内的一个或多个虚拟机处采集监控数据；以及监控数据处理模块，与所述监控数据采集模块耦合，并配置成：针对所述一个或多个虚拟机中的每一个，利用第一KMeans算法来将所述监控数据进行聚集分组，每一个组具有一中心点坐标，并根据所述分组和各组的中心点坐标计算所述一个或多个虚拟机中每个虚拟机的性能表征，即第一特征值；基于每个虚拟机的所述第一特征值，利用第二KMeans算法来将所述一个或多个虚拟机进行聚集分组，从而确定所述一个或多个虚拟机中每个虚拟机的特征类型以及性能负载值；其中，所述第一KMeans算法中的类型参数K大于所述第二KMeans算法中的类型参数，并且所述第一KMeans算法的初始中心被选择为使得初始类别之间保持尽可能远的距离，而所述第二Kmeans算法的初始中心被选择为所述第一KMeans算法的初始中心的子集。

在上述虚拟机负载评估系统中，所述监控数据与一个或多个虚拟机的中央处理单元、存储器、硬盘输入或输出以及网络输入或输出关联。

在上述虚拟机负载评估系统中，所述虚拟机的特征类型包括CPU密集型、Network密集型以及Memory密集型。

在上述虚拟机负载评估系统中，所述第一KMeans算法中的类型参数K等于4，而所述第二KMeans算法中的类型参数等于3。

在上述虚拟机负载评估系统中，所述第一KMeans算法的初始中心被选择为P1(100,0,0)、P2(0,100,0)、P3(0,0,100)以及P4(0,0,0)。

在上述虚拟机负载评估系统中，每一组中样本的占比为A％、B％、C％、D％，而每一组的中心点坐标分别为(X1,Y1,Z1)，(X2,Y2,Z2)，(X3,Y3,Z3)以及(X4,Y4,Z4)，则所述第一特征值由下面的等式来表示：

在上述虚拟机负载评估系统中，所述监控数据处理模块进一步被配置成根据所述一个或多个虚拟机中的性能负载值来对虚拟机进行重新分布，实现资源的有效利用。

根据本申请的另一个方面，提供了一种云环境下对虚拟机进行负载评估的方法，包括：针对云数据中心内的一个或多个虚拟机中的每一个，利用第一KMeans算法来将从所述一个或多个虚拟机处获得的监控数据进行聚集分组，每一个组具有一中心点坐标，并根据所述分组和各组的中心点坐标计算所述一个或多个虚拟机中每个虚拟机的性能表征，即第一特征值；基于每个虚拟机的所述第一特征值，利用第二KMeans算法来将所述一个或多个虚拟机进行聚集分组，从而确定所述一个或多个虚拟机中每个虚拟机的特征类型以及性能负载值；其中，所述第一KMeans算法中的类型参数K大于所述第二KMeans算法中的类型参数，并且所述第一KMeans算法的初始中心被选择为使得初始类别之间保持尽可能远的距离，而所述第二Kmeans算法的初始中心被选择为所述第一KMeans算法的初始中心的子集。

在上述方法中，所述监控数据与一个或多个虚拟机的中央处理单元、存储器、硬盘输入或输出以及网络输入或输出关联。

在上述方法中，所述虚拟机的特征类型包括CPU密集型、Network密集型以及Memory密集型。

在上述方法中，所述第一KMeans算法中的类型参数K等于4，而所述第二KMeans算法中的类型参数等于3。

在上述方法中，所述第一KMeans算法的初始中心被选择为P1(100,0,0)、P2(0,100,0)、P3(0,0,100)以及P4(0,0,0)。

在上述方法中，每一组中样本的占比为A％、B％、C％、D％，每一组的中心点坐标分别为(X1,Y1,Z1)，(X2,Y2,Z2)，(X3,Y3,Z3)以及(X4,Y4,Z4)，则所述第一特征值由下面的等式来表示：

上述方法还可包括根据所述一个或多个虚拟机中的性能负载值来对虚拟机进行重新分布，实现资源的有效利用。

根据本申请的又一个方面，提供了一种包括前面所述的虚拟机负载评估系统的服务节点。

本申请通过采用KMeans聚类算法实现虚拟机负载宏观情况的评估监测，并且克服了传统的KMeans算法所存在的聚类结果的准确性受很多因素的影响(包括初始中心的选择，噪声、孤立点的处理与否)等缺陷。

附图说明

在参照附图阅读了本发明的具体实施方式以后，本领域技术人员将会更清楚地了解本发明的各个方面。本领域技术人员应当理解的是：这些附图仅仅用于配合具体实施方式说明本发明的技术方案，而并非意在对本发明的保护范围构成限制。

图1是根据本申请的实施例，包含虚拟机负载评估系统的云平台应用环境的示意图；

图2是根据本申请的实施例，虚拟机负载评估系统的结构示意图。

具体实施方式

下面介绍的是本发明的多个可能实施例中的一些，旨在提供对本发明的基本了解，并不旨在确认本发明的关键或决定性的要素或限定所要保护的范围。容易理解，根据本发明的技术方案，在不变更本发明的实质精神下，本领域的一般技术人员可以提出可相互替换的其它实现方式。因此，以下具体实施方式以及附图仅是对本发明的技术方案的示例性说明，而不应当视为本发明的全部或者视为对本发明技术方案的限定或限制。

图1是根据本申请的实施例，包含虚拟机负载评估系统的云平台应用环境的示意图。在图1中，用户在诸如Openstack等云数据中心140的一个或多个虚拟机实例上部署相关应用服务。应用服务的有关数据就是服务节点120中虚拟机负载评估系统130所要采集的对象，包括CPU、Memory、disk I/O以及network IO等数据源，然后就虚拟机负载评估系统130对采集的数据进行处理分析，并将分析结果返回到前端展示模块110。

图2是根据本申请的实施例，虚拟机负载评估系统的结构示意图。结合图1，虚拟机负载评估系统130中的监控数据采集模块210负责从云数据中心140采集数据并将采集数据提供给监控数据处理模块220。该监控数据处理模块按照下面所述的虚拟机性能数据处理的方案对数据进行处理分析，并将分析结果返回到前端展示模块110。

虚拟机性能数据处理主要分为两部分，第一部分是利用云环境下改进的KMeans算法来计算出虚拟机的特征值，通过性能负载评估算法得出虚拟机近期的性能表征(特征值)。第二部分是计算出所有虚拟机的特征表现，主要分为三类即CPU、Network和Memory限制型，并在此基础之上得出虚拟机性能负载值，从而依据聚类结果评估应用类型。

在一个具体的实施例中，改进的KMeans算法的类型参数K被选择为4。这主要考虑了算法对“噪声”和“孤立点”敏感，故在常见三种云环境平台虚拟机特征表现的基础上再加一簇，将噪声与孤立点等纳入该簇(大多数噪声与孤立点来自于某些情况下没有负载的虚拟机实例)，避免此类点对最终聚类结果的影响，从而提高聚类结果的准确性。改进的KMeans算法中初始的中心选择遵循的原则是：为保持聚类的明显性，必须选取的中心相互距离都较远。该方案能够很好地排除类边缘点和噪声点的影响，并且能够适应数据集中各个实际类别密度分布不平衡的情况，最终获得较好的聚类效果，从而准确得出虚拟机资源利用情况。

改进的KMeans算法是具体算法描述如下：

1)在所有的样本点数据集A中依据已知条件，有目的性的(传统Kmeans算法初始中心的选择具有随机性)选择K个样本点，将K个样本点的值分别赋给初始时的聚类中心

2)当第j次迭代时，对样本点A中所有样本点Pt(t＝1,2,3….,n),依次计算到各个聚类中心

的欧式距离d(t,i)

3)找出Pt关于

的最小的距离，将Pt划入到关于

距离的最小的簇中

4)更新各个簇的聚类中心点

5)计算数据集A中所有的点的平方误差Ei，并与前一次的误差E_i-1比较

若|E_i+1-E_i|<δ则算法结束，否则转入2)进行再一次迭代。

在一个实施例中，评估分为两个阶段。在第一阶段中，根据数据样本，对每台虚拟机进行改进后KMeans运算，这次运算需要确定两个变量，一个是特征值类型个数K(依照上述分析K＝4),一个是K个初始中心点的选取。初始中心选取采用最大最小距离选中心法，该方法的原则是使初始类别之间尽可能地保持到足够远的距离，在云环境下虚拟机特征值表现比较明显。所以类型中心选择P1(100,0,0)P2(0,100,0)P3(0,0,100)P4(0,0,0)。

最后可以把所有样本点分为4类：

每一类样本的占比	每一类的中心点坐标
A％	(X1,Y1,Z1)
B％	(X2,Y2,Z2)
C％	(X3,Y3,Z3)

D％	(X4,Y4,Z4)

根据这4类可以得出：其中有一类聚集了大量样本点，这个聚集点可以作为表征这台虚拟机近期的特征。

在第二阶段中，对第一阶段得到的所有虚拟机的特征向量再运用一次Kmeans算法，这一次的K＝3，因为所有虚拟机的特征向量是通过大量样本点得出的，所以基本可以忽略接近0的特征向量(噪声点)。此时就可以把虚拟机进行聚集分组。而且每组的聚集点还是像第一阶段时一样由初始的三个点聚集而来。并且三个聚集点表征出三种特性：CPU密集型，Network密集型，Memory密集型。根据每个虚拟机特征向量所属的类就能够从宏观上把握应用类型，从而实现资源利用策略的有效制定。

本技术方案对虚拟机的性能负载采用改进的KMeans算法进行量化处理，相对于目前仅依靠虚拟机运行宏观状态、单一阀值控制、欠缺量化处理的负载评估，本方案通过具体数据综合分析更为全面、精确的实现系统量化评估，能从具体数据上有效判定应用所属类型，量化、细化负载特征，负载评估准确率提升约近20％。

除却有效提升虚拟机性能评估的准确性之外，本技术方案通过聚类分析能够得出当前系统宏观应用类型(例如，CPU占用型应用集群、内存占用型应用集群、网络带宽占用型应用集群)，基于应用类型及虚拟机资源情况对虚拟机资源以及物理机资源做出配置优化。

本技术方案可实现虚拟机资源的充分利用。云环境下当不同的用户需要部署不一样的应用服务，应用服务在运行时会表现为不同的特征，用户事先或许并不能定量或定性描述应用服务的特征。通过该评估系统，能够具体量化每种应用的具体特征，依据应用特征值，为各种应用分配不同的虚拟机类型，这样保证了应用服务即不会因为虚拟机资源不足，导致虚拟机性能下降，降低服务的质量，又可以使应用服务可以充分利用虚拟机的资源来提供相应的服务，降低的申请时使用的费用，且使云资源得到充分的使用，避免了云资源的浪费。

本技术方案可实现物理机资源的充分利用。通过数据分析算出M种应用的特征值λ1，λ2......λ_M.通过这些应用服务标记出应用服务的具体特征后，就可以最后计算出相应的三种类型的虚拟机的性能负载。而在现有技术中，运行应用服务的虚拟机VM1VM2......VMM无规律地运行在N台物理机节点上。在这种情况下，就有可能同一种类型的虚拟机：如CPU密集型的都运行在同一物理节点上。导致该节点CPU资源占用很高，而Memory资源，Network资源确很少使用，造成资源的分配不均，导致浪费，更可能导致Nodei上的所有虚拟机因为资源的抢占，而使虚拟机的服务质量下降。而通过对虚拟机(应用服务)进行性能负载的量化，所有的虚拟机的性能负载值为:Load(V1)Load(V2)…..Load(Vm),并且虚拟机分为三种类型(例如CPU密集型、Network密集型以及Memory密集型)，就可以依据虚拟机的性能负载值来对虚拟机进行重新分布，即进行有效的虚拟机迁移，来解决上述所导致物理机资源浪费或不足的情况。

综上所述，本申请将聚类分析的方法应用到云环境下，用来表征面向应用服务的虚拟机的类型。这解决了传统的KMeans算法的聚类结果与初始中心的选择有关、经常以局部最优结束、所有的点在分配步骤中都未分到某个簇而得到空簇等缺点。本申请还设计改进了Kmeans算法，使之更适用于云环境。

需要指出的是，在上面的实施例中，虚拟机的特征类型包括CPU密集型、Network密集型以及Memory密集型这三种类型。但是，本领域技术人员可以根据实际需要增加或减少虚拟机的类型或可动态扩展虚拟机的类型。例如，在另外的实施例中，虚拟机的特征类型包括四种，即CPU密集型、Network密集型、Memory密集型以及硬盘密集型。

上文中，参照附图描述了本发明的具体实施方式。但是，本领域中的普通技术人员能够理解，在不偏离本发明的精神和范围的情况下，还可以对本发明的具体实施方式作各种变更和替换。这些变更和替换都落在本发明权利要求书所限定的范围内。

Claims

一种云环境下的虚拟机负载评估系统，包括：

监控数据采集模块，其配置成从云数据中心内的一个或多个虚拟机处采集监控数据；以及

监控数据处理模块，与所述监控数据采集模块耦合，并配置成：

针对所述一个或多个虚拟机中的每一个，利用第一KMeans算法来将所述监控数据进行聚集分组，每一个组具有一中心点坐标，并根据所述分组和各组的中心点坐标计算所述一个或多个虚拟机中每个虚拟机的性能表征，即第一特征值；

基于每个虚拟机的所述第一特征值，利用第二KMeans算法来将所述一个或多个虚拟机进行聚集分组，从而确定所述一个或多个虚拟机中每个虚拟机的特征类型以及性能负载值；

其中，所述第一KMeans算法中的类型参数K大于所述第二KMeans算法中的类型参数，并且所述第一KMeans算法的初始中心被选择为使得初始类别之间保持尽可能远的距离，而所述第二Kmeans算法的初始中心被选择为所述第一KMeans算法的初始中心的子集。
如权利要求1所述的虚拟机负载评估系统，其中，所述监控数据与一个或多个虚拟机的中央处理单元、存储器、硬盘输入或输出以及网络输入或输出关联。
如权利要求1所述的虚拟机负载评估系统，其中，所述虚拟机的特征类型包括CPU密集型、Network密集型以及Memory密集型。
如权利要求1所述的虚拟机负载评估系统，其中，所述第一KMeans算法中的类型参数K等于4，而所述第二KMeans算法中的类型参数等于3。
如权利要求4所述的虚拟机负载评估系统，其中，所述第一KMeans算法的初始中心被选择为P1(100,0,0)、P2(0,100,0)、P3(0,0,100)以及P4(0,0,0)。
如权利要求4所述的虚拟机负载评估系统，其中，每一组中样本的占比为A％、B％、C％、D％，而每一组的中心点坐标分别为(X1,Y1,Z1)，(X2,Y2,Z2)，(X3,Y3,Z3)以及(X4,Y4,Z4)，则所述第一特征值由下面的等式来表示：
如权利要求1所述的虚拟机负载评估系统，其中，所述监控数据处理模块进一步被配置成根据所述一个或多个虚拟机中的性能负载值来对虚拟机进行重新分布，实现资源的有效利用。
一种云环境下对虚拟机进行负载评估的方法，包括：

针对云数据中心内的一个或多个虚拟机中的每一个，利用第一KMeans算法来将从所述一个或多个虚拟机处获得的监控数据进行聚集分组，每一个组具有一中心点坐标，并根据所述分组和各组的中心点坐标计算所述一个或多个虚拟机中每个虚拟机的性能表征，即第一特征值；

基于每个虚拟机的所述第一特征值，利用第二KMeans算法来将所述一个或多个虚拟机进行聚集分组，从而确定所述一个或多个虚拟机中每个虚拟机的特征类型以及性能负载值；

其中，所述第一KMeans算法中的类型参数K大于所述第二KMeans算法中的类型参数，并且所述第一KMeans算法的初始中心被选择为使得初始类别之间保持尽可能远的距离，而所述第二Kmeans算法的初始中心被选择为所述第一KMeans算法的初始中心的子集。
如权利要求8所述的方法，其中，所述监控数据与一个或多个虚拟机的中央处理单元、存储器、硬盘输入或输出以及网络输入或输出关联。
如权利要求8所述的方法，其中，所述虚拟机的特征类型包括CPU 密集型、Network密集型以及Memory密集型。
如权利要求8所述的方法，其中，所述第一KMeans算法中的类型参数K等于4，而所述第二KMeans算法中的类型参数等于3。
如权利要求11所述的方法，其中，所述第一KMeans算法的初始中心被选择为P1(100,0,0)、P2(0,100,0)、P3(0,0,100)以及P4(0,0,0)。
如权利要求11所述的方法，其中，每一组中样本的占比为A％、B％、C％、D％，每一组的中心点坐标分别为(X1,Y1,Z1)，(X2,Y2,Z2)，(X3,Y3,Z3)以及(X4,Y4,Z4)，则所述第一特征值由下面的等式来表示：
如权利要求8所述的方法，还包括：根据所述一个或多个虚拟机中的性能负载值来对虚拟机进行重新分布，实现资源的有效利用。
一种服务节点，其包括如权利要求1至7所述的虚拟机负载评估系统。