WO2020220438A1

WO2020220438A1 - 一种针对虚拟机不同类型的业务并发量预测方法

Info

Publication number: WO2020220438A1
Application number: PCT/CN2019/090872
Authority: WO
Inventors: 郭军; 王馨悦; 张斌; 刘晨; 侯帅; 侯凯; 李薇; 柳波; 王嘉怡; 刘文凤; 张瀚铎; 张娅杰
Original assignee: 东北大学
Priority date: 2019-04-29
Filing date: 2019-06-12
Publication date: 2020-11-05
Also published as: CN110096335B; CN110096335A

Abstract

本发明提供一种针对虚拟机不同类型的业务并发量预测方法，涉及云计算技术领域。一种针对虚拟机不同类型的业务并发量预测方法，首先采集虚拟机的历史业务并发量，并进行预处理，；然后基于改进的1最近邻-动态时间调整方法1NN-DTW判断虚拟机业务并发量的类型；最后采用分类回归树拟合不具有周期变化的业务并发量；采用傅里叶级数FS和分类回归树CART拟合具有周期变化的业务并发量；本发明提供的针对虚拟机不同类型的业务并发量预测方法，对虚拟机各业务的并发量进行预测，可以为下一步虚拟机的增加或者减少提供依据，同时有助于准确估计虚拟机的软件老化状况，以达到提高工作虚拟机性能和可靠性的目的。

Description

一种针对虚拟机不同类型的业务并发量预测方法

技术领域

本发明涉及云计算技术领域，尤其涉及一种针对虚拟机不同类型的业务并发量预测方法。

背景技术

软件老化普遍存在于云服务系统中，在虚拟机处理业务并发请求的过程中，操作系统、应用软件等不断地积累错误，导致工作虚拟机的性能逐渐下降，进而影响到云服务系统的服务质量。云平台的高可伸缩、动态重构特性为确保不同并发条件下的云服务质量提供了技术基础，然而现有的虚拟资源动态调整方法仍存在很多缺陷。

一般来说，虚拟机上部署着各种各样的业务，而且不同时间各业务并发量的变化趋势不同，例如，有的业务并发量在白天某段时间持续增加，在晚上某段时间持续减少，有的业务并发量持续循环波动，而有的业务并发量一直保持平稳。通过对云平台各业务的并发量进行预测，可以为下一步虚拟机的增加或者减少提供依据，同时有助于准确估计虚拟机的软件老化状况，以达到提高工作虚拟机性能和可靠性的目的。

由于用户操作、虚拟机业务以及其他不确定性因素在时刻改变，所以业务的并发访问量不仅会随着时间平稳变化，往往还具有上升、下降以及循环波动等趋势，传统的负载模型比如指数平滑模型只能大致刻画出业务并发量的变化趋势，不能很好地捕获其中的非线性变化特征。

发明内容

本发明要解决的技术问题是针对上述现有技术的不足，提供一种针对虚拟机不同类型的业务并发量预测方法，实现对虚拟机中不同类型的业务并发量进行预测。

一种针对虚拟机不同类型的业务并发量预测方法，包括以下步骤：

步骤1：采集虚拟机的历史业务并发量，并进行预处理，具体方法为：

步骤1.1：扫描一段时间内虚拟机的业务并发量，发现业务并发量的缺失点；

步骤1.2：对扫描到的业务并发量缺失点进行处理；

步骤1.2.1：对于个别采样点缺失的情况，采用前一周期和后一周期业务并发量的平均值进行填补，虚拟机第t个时间段的业务并发量con(t)缺失的计算如下公式所示：

步骤1.2.2：对于样本缺失达到百分九十以上的情况，舍弃全部样本并且将该段时间内业务并发量的值置为零；

步骤1.3：对于采集到的业务并发量中存在异常波动的极大极小样本进行异常值调整；

步骤1.3.1：结合四分位数计算t时间内虚拟机业务并发量正常取值的上限H和下限L，如下公式所示：

H＝Q3+k*(Q3-Q1) (2)

L＝Q1-k*(Q3-Q1) (3)

其中，Q1表示下四分位数，即t时间内业务并发量升序数列的百分之二十五位点，Q3表示上四分位数，即t时间内业务并发量升序数列的百分之七十五位点，k用于描述不合理采样点的异常程度，一般取1.5和3，分别代表中度和极度；

步骤1.3.2：通过图基检验方法判定各采样点数据是否正常，并对异常值进行调整；

如果采样点数据值被判定为错误业务并发量样本，则先将错误值丢弃，再用均值填补法补充；

如果采样点数据值被判定为正常业务并发量样本，则不做任何调整；

步骤1.4：对从日志数据库或者打点日志中采集到的业务并发量和CPU利用率数据进行数据间隔调整，对采集的数据以秒、分钟或小时为单位进行合并；

步骤1.5：采用最大最小值归一法将步骤1.4处理后的数据进行归一化；

步骤2：基于改进的1最近邻-动态时间调整(1-NearestNeighbor-Dynamic Time Warping，即1NN-DTW)方法判断虚拟机业务并发量的类型，具体方法为：

步骤2.1：对虚拟机的各业务并发量进行分类，分为上升型、下降型、二次型、随机型、周期波动型、周期上升型和周期下降型；

步骤2.2：针对各种类型的业务并发量，提前选取带标签的业务并发量数列作为已知样本；

步骤2.3：对每一个待分类的业务并发量数列，依次扫描所有已知样本并通过临近算法计算出最相近的一条已知样本，则该已知样本的类型即为待分类业务并发量的类型；

步骤2.4：将所有业务并发量归为两大类以简化1最近邻模型；

将随机型、上升型、下降型和二次型业务并发量归为不具有周期变化类；

将周期波动型、周期上升型和周期下降型业务并发量归为具有周期变化类；

步骤2.5：构造n×m矩阵，使待分类的业务并发量数列{x ₁,x ₂,…,x _n}和一条已知的业务并发量数列{y ₁,y ₂,…,y _m}对齐，其中，n为待分类的业务并发量总数量，m为已知的业务并发量总数量；

步骤2.6：将待分类的第i个业务并发量x _i和已知的第j个业务并发量y _j两点偏差作为矩阵中(i，j)位置的值d _i,j，同时使用欧式距离和两点导数差的平方的方法，计算待分类的业务并发量数列{x ₁,x ₂,…,x _n}和已知的业务并发量数列{y ₁,y ₂,…,y _m}对齐后各点的偏差d _i,j，如下公式所示：

d _i,j＝(x _i-y _j) ²+(x′ _i-y′ _j) ² (4)

其中，x′ _i、y′ _j分别为x _i、y _j的导数，业务并发量x _i的导数x′ _i的估计如下公式所示：

步骤2.7：在矩阵中从位置(1,1)开始，根据除边界值外规定每个位置只能到达其上方、右方或者右上方的位置的约束条件迭代寻找出一条累积偏差最小的路径，直到位置(n,m)结束；

步骤3：预测虚拟机不同变化类型的业务并发量，具体方法为：

步骤3.1：采用分类回归树(Classification And Regression Tree，即CART)拟合不具有周期变化的业务并发量；

步骤3.1.1：遍历样本业务并发量数列的每个特征F的任意取值f，以(F,f)作为条件分割样本数据，确定平方误差最小的分割位置，从业务并发量数列中选择最好的切割点；

所述平方误差error的计算公式如下：

其中，

代表样本x中第i’个业务并发量的特征，y _i'代表分割前的第i’个序列样本，

代表分割后的第i’个子序列样本的拟合结果；

步骤3.1.2：保存作为切割点的业务并发量值，并对业务并发量数列执行切分；

步骤3.1.3：依次构建特征F大于f的子树和小于f的子树，进一步迭代对当前分割点左边和右边的业务并发量数列分割拟合，直到无法再分记为叶子节点；

步骤3.1.4：从下而上重新遍历样本数据，对所有业务并发量数列检查每个分割点，判断分割之前与分割之后并发量数列的拟合误差，

若分割之后并发量数列的拟合误差降低，则保留该分割点；

若分割之后并发量数列的拟合误差升高，则取消该分割点并合并左右数列；

步骤3.2：采用傅里叶级数FS和分类回归树CART拟合具有周期变化的业务并发量；

步骤3.2.1：利用分类回归树CART拟合{t ₁,t ₂,…,t _n’}时刻的业务并发量得到拟合值{y(0),…y(n’-1),y(n’)}，刻画出业务并发量的上升或者下降趋势；

步骤3.2.2：把步骤3.2.1中所得到的业务并发量与真实业务并发量比较得到残差序列{e(0),e(1),…,e(n)}；

步骤3.2.3：利用分类回归树CART预测{t _n+1,t _n+2,…,t _m’}时刻的业务并发量为{y(n+1),y(n+2),…,y(m’)；

步骤3.2.4：利用傅里叶级数FS拟合残差序列{e(0),e(1),…,e(n)}，刻画出业务并发量的周期趋势，求得{t _n’+1,t _n’+2,…,t _m’}时刻业务并发量的残差值{e(n’+1),e(n’+2),…,e(m’)}；

步骤3.2.4.1：使用函数w(t)拟合残差序列e(0),e(1),…,e(n’)，函数w(t)如不公式所示：

其中，a ₀、a _j’和b _j’均为变量，P＝n’，

表示向下取整，t＝1,2,…n’；

步骤3.2.4.2：通过最小二乘法计算变量a _j’和b _j’的值，如下公式所示：

其中，w _j’为第j’个用于拟合残差的函数；

步骤3.2.5：将{t _n’+1,t _n’+2,…,t _m’}时刻的业务并发量与其对应的残差值相加，得到{t _n’+1,t _n’+2,…,t _m’}时刻业务并发量的预测值，即{y(n’+1)+e(n’+1),y(n’+2)+e(n’+2),…,y(m’)+e(m’)}。

采用上述技术方案所产生的有益效果在于：本发明提供的一种针对虚拟机不同类型的业务并发量预测方法，将业务并发访问量分为周期型、上升型、下降型、二次型和随机型，不同类型的业务并发量所适用的预测方法不同，在预测之前对各业务并发量进行分类，不仅可以有针对性地训练业务并发量模型，而且在对相同类型的业务并发量建模时还可以实现参数的共享。通过本发明方法对虚拟机各业务的并发量进行预测，可以为下一步虚拟机的增加或者减少提供依据，同时有助于准确估计虚拟机的软件老化状况，以达到提高工作虚拟机性能和可靠性的目的。

附图说明

图1为本发明实施例提供的飞机票在线订购系统的实例拓扑图；

图2为本发明实施例提供的一种针对虚拟机不同类型的业务并发量预测方法的流程图；

图3为本发明实施例提供的二次型业务并发量预测结果的示意图；

图4为本发明实施例提供的周期上升型业务并发量预测结果的示意图。

图中，1、客户端；2、负载均衡Nginx；3、交换机；4、服务端；5、业务数据库MySQL。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

本实施例以飞机票在线订购系统模拟PC端用户应用，在曙光服务器上搭建该服务系统，通过对飞机票在线订购系统加压模拟真实的业务并发场景，并采集不同的业务并发量数据为例，使用本发明的一种针对虚拟机不同类型的业务并发量预测方法进行业务并发量的预测。实例拓扑图如图1所示，客户端1使用LoadRunner软件产生业务并发访问，它可以模拟大量的用户同时点击飞机票订购系统页面，LoadRunner发送页面请求后，由负载均衡Nginx2实现业务请求的接收和分配，最后服务端4安装Tomcat并部署飞机票在线预订系统，负责读写业务数据库MySQL5，处理LoadRunner发送的请求。

一种针对虚拟机不同类型的业务并发量预测方法，如图2所示，包括以下步骤：

步骤1.2：对扫描到的业务并发量缺失点进行处理；

步骤1.2.2：对于样本缺失达到百分九十以上舍弃全部样本并且将该段时间内业务并发量的值置为零；例如在20个连续采样周期中，只有2个周期采集到业务并发量值，甚至全部数据为空，那么可以认为这段时间采集到的业务并发量都是不可信的，不能纳入历史数列进行预测；

H＝Q3+k*(Q3-Q1) (2)

L＝Q1-k*(Q3-Q1) (3)

在业务并发访问量建模时，以1秒为时间间隔采样的业务并发量波动频繁，趋势变化不明显，无法挖掘变化的特征，而且过密采样使得模型计算量加大，训练更加迟缓；因此，在本实施例中以15秒为间隔取平均值进行整理数据都是，虚拟机的其他数据也是以15秒为间隔；

步骤2.4：将所有业务并发量归为两大类以简化1最近邻模型；

d _i,j＝(x _i-y _j) ²+(x′ _i-y′ _j) ² (4)

所述平方误差error的计算公式如下：

其中，

代表分割后的第i’个子序列样本的拟合结果；

若分割之后并发量数列的拟合误差降低，则保留该分割点；

步骤3.2.4：利用傅里叶络数FS拟合残差序列{e(0),e(1),…,e(n)}，刻画出业务并发量的周期趋势，求得{t _n’+1,t _n’+2,…,t _m’}时刻业务并发量的残差值{e(n’+1),e(n’+2),…,e(m’)}；

步骤3.2.4.1：使用函数w(t)拟合残差序列e(0),e(1),…,e(n’)，函数w(t)如下公式所示：

其中，a ₀、a _j’和b _j’均为变量，P＝n’，

表示向下取整，t＝1,2,…n’；

其中，w _j’为第j’个用于拟合残差的函数；

本实施例还提供了使用改进的1NN-DTW算法进行业务并发量的类型判断，并与改进前算法进行对比，验证改进后1NN-DTW的准确性，具体为：

首先使用LoadRunner对服务端应用的浏览、查询、退票等各类业务的访问行为进行记录。然后对服务端虚拟机持续加压一小时并采集业务并发量，按照预处理的方法处理缺失和异常的业务并发量值，并以15秒为间隔调整并发量数据。

利用改进的1NN-DTW算法判断业务并发访问量类型，并与1NN-DTW、1NN-DDTW对比，采用正确率Accuracy和F值F-measure来衡量各算法的好坏。将第一步得到的并发量分别按每80、120、160、200个采样点截取为一个子序列，并根据表1中列举的七种负载变化趋势打上类型标签作为一个样本序列，最后得到700个样本序列，选取其中420个作为类型判断的已知样本，剩下的280个作为测试样本。

表1不同类型的业务并发访问量

采用本发明的改进的1NN-DTW和现有的1NN-DTW、1NN-DDTW这三种方法对业务并发量类型判断的对比结果如表2所示。从表2可以看出，本发明方法的Accuracy、F-measure明显高于另外两种方法，说明在判断业务并发量类型时，从业务并发量的取值和变化趋势两方面考虑效果要优于只关注其中一个方面。另外，虽然本发明方法同时计算相似点的欧式距离和导数差，但是所用时间并未大幅度增加。

表2不同方法的业务并发量分类情况

方法	Accuracy	F-measure	Time(ms)
改进的1NN-DTW	0.942	0.867	1120
1NN-DTW	0.873	0.751	984
1NN-DDTW	0.916	0.834	1097

本实施例还提供了使用本发明方法预测业务并发量，并与传统的ARIMA等方法进行对比，具体为：

首先使用LoadRunner对服务端应用的浏览、查询、退票等各类业务的访问行为进行记录。然后对服务端虚拟机持续加压一小时并采集业务并发量，按照预处理叙述的方法处理缺失和异常的业务并发量值，并以15秒为间隔调整并发量数据。

选取二次型和周期上升型两类相对复杂的并发量进行预测。通过分析过去25分钟的业务并发量值，估计未来5分钟的业务并发量，并选取均方误差MSE、绝对误差MAE、用时Time三项评价标准，借助Python工具包将本方法与ARIMA、指数平滑Holt-Winters对比，验证本发明方法的准确性。

三种方法的业务并发量预测结果如表3所示，三种方法的业务并发量预测结果与真实并发量之间的对照结果如图3和图4所示。从图中来看，在设定的两种情况下本发明方法与ARIMA、Holt-Winters相比，对真实的业务并发量序列拟合更好，说明本发明方法在对各类并发量预测时较为有效。根据表3中结果进一步分析，本发明方法与ARIMA、Holt-Winters相比，在两种类型的并发量场景下MSE和MAE最低。在二次型并发量场景下三种方法的MSE和MAE较为接近，但是在周期上升型并发量场景下本方法明显更优，ARIMA、Holt-Winters对这类复杂的并发量学习能力较差，这些表明在各种场景下本发明方法都具有可观的准确度。

表3不同方法的业务并发量预测结果

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims

一种针对虚拟机不同类型的业务并发量预测方法，其特征在于：包括以下步骤：

步骤1：采集虚拟机的历史业务并发量，并进行预处理，具体方法为：

步骤1.1：扫描一段时间内虚拟机的业务并发量，发现业务并发量的缺失点；

步骤1.2：对扫描到的业务并发量缺失点进行处理；

步骤1.3：对于采集到的业务并发量中存在异常波动的极大极小样本进行异常值调整；

步骤1.4：对从日志数据库或者打点日志中采集到的业务并发量和CPU利用率数据进行数据间隔调整，对采集的数据以秒、分钟或小时为单位进行合并；

步骤1.5：采用最大最小值归一法将步骤1.4处理后的数据进行归一化；

步骤2：基于改进的1最近邻-动态时间调整方法1NN-DTW判断虚拟机业务并发量的类型，具体方法为：

步骤2.1：对虚拟机的各业务并发量进行分类，分为上升型、下降型、二次型、随机型、周期波动型、周期上升型和周期下降型；

步骤2.2：针对各种类型的业务并发量，提前选取带标签的业务并发量数列作为已知样本；

步骤2.3：对每一个待分类的业务并发量数列，依次扫描所有已知样本并通过临近算法计算出最相近的一条已知样本，则该已知样本的类型即为待分类业务并发量的类型；

步骤2.4：将所有业务并发量归为两大类以简化1最近邻模型；

将随机型、上升型、下降型和二次型业务并发量归为不具有周期变化类；

将周期波动型、周期上升型和周期下降型业务并发量归为具有周期变化类；

步骤2.5：构造n×m矩阵，使待分类的业务并发量数列{x ₁，x ₂，...，x _n}和一条已知的业务并发量数列{y ₁，y ₂，...，y _m}对齐，其中，n为待分类的业务并发量总数量，m为已知的业务并发量总数量；

步骤2.6：将待分类的第i个业务并发量x _i和已知的第j个业务并发量y _j两点偏差作为矩阵中(i，j)位置的值d _i，j，同时使用欧式距离和两点导数差的平方的方法，计算待分类的业务并发量数列{x ₁，x ₂，...，x _n}和已知的业务并发量数列{y ₁，y ₂，...，y _m}对齐后各点的偏差d _i，j，如下公式所示：

d _i，j＝(x _i-y _j) ²+(x′ _i-y′ _j) ² (1)

其中，x′ _i、y′ _j分别为x _i、y _j的导数，业务并发量x _i的导数x′ _i的估计如下公式所示：

步骤2.7：在矩阵中从位置(1，1)开始，根据除边界值外规定每个位置只能到达其上方、右方或者右上方的位置的约束条件迭代寻找出一条累积偏差最小的路径，直到位置(n，m)结束；

步骤3：预测虚拟机不同变化类型的业务并发量，具体方法为：

步骤3.1：采用分类回归树CART拟合不具有周期变化的业务并发量；

步骤3.2：采用傅里叶级数FS和分类回归树CART拟合具有周期变化的业务并发量。
根据权利要求1所述的一种针对虚拟机不同类型的业务并发量预测方法，其特征在于：所述步骤1.2的具体方法为：

步骤1.2.1：对于个别采样点缺失的情况，采用前一周期和后一周期业务并发量的平均值进行填补，虚拟机第t个时间段的业务并发量con(t)缺失的计算如下公式所示：

步骤1.2.2：对于样本缺失达到百分九十以上的情况，舍弃全部样本并且将该段时间内业务并发量的值置为零。
根据权利要求1所述的一种针对虚拟机不同类型的业务并发量预测方法，其特征在于：所述步骤1.3的具体方法为：

步骤1.3.1：结合四分位数计算t时间内虚拟机业务并发量正常取值的上限H和下限L，如下公式所示：

H＝Q3+k*(Q3-Q1) (4)

L＝Q1-k*(Q3-Q1) (5)

其中，Q1表示下四分位数，即t时间内业务并发量升序数列的百分之二十五位点，Q3表示上四分位数，即t时间内业务并发量升序数列的百分之七十五位点，k用于描述不合理采样点的异常程度，一股取1.5和3，分别代表中度和极度；

步骤1.3.2：通过图基检验方法判定各采样点数据是否正常，并对异常值进行调整；

如果采样点数据值被判定为错误业务并发量样本，则先将错误值丢弃，再用均值填补法补充；

如果采样点数据值被判定为正常业务并发量样本，则不做任何调整。
根据权利要求1所述的一种针对虚拟机不同类型的业务并发量预测方法，其特征在于：所述步骤3.1的具体方法为：

步骤3.1.1：遍历样本业务并发量数列的每个特征F的任意取值f，以(F，f)作为条件分割样本数据，确定平方误差最小的分割位置，从业务并发量数列中选择最好的切割点；

所述平方误差error的计算公式如下：

其中，
代表样本x中第i’个业务并发量的特征，y _i′代表分割前的第i’个序列样本，
代表分割后的第i’个子序列样本的拟合结果；

步骤3.1.2：保存作为切割点的业务并发量值，并对业务并发量数列执行切分；

步骤3.1.3：依次构建特征F大于f的子树和小于f的子树，进一步迭代对当前分割点左边和右边的业务并发量数列分割拟合，直到无法再分记为叶子节点；

步骤3.1.4：从下而上重新遍历样本数据，对所有业务并发量数列检查每个分割点，判断分割之前与分割之后并发量数列的拟合误差，

若分割之后并发量数列的拟合误差降低，则保留该分割点；

若分割之后并发量数列的拟合误差升高，则取消该分割点并合并左右数列。
根据权利要求4所述的一种针对虚拟机不同类型的业务并发量预测方法，其特征在于：所述步骤3.2的具体方法为：

步骤3.2.1：利用分类回归树CART拟合{t ₁，t ₂，...，t _n’}时刻的业务并发量得到拟合值{y(0)，...y(n’-1)，y(n’)}，刻画出业务并发量的上升或者下降趋势；

步骤3.2.2：把步骤3.2.1中所得到的业务并发量与真实业务并发量比较得到残差序列{e(0)，e(1)，...，e(n)}；

步骤3.2.3：利用分类回归树CART预测{t _n+1，t _n+2，...，t _m’}时刻的业务并发量为{y(n+1)，y(n+2)，...，y(m’)；

步骤3.2.4：利用傅里叶级数FS拟合残差序列{e(0)，e(1)，...，e(n)}，刻画出业务并发量的周期趋势，求得{t _n’+1，t _n’+2，...，t _m’}时刻业务并发量的残差值{e(n’+1)，e(n’+2)，...，e(m’)}；

步骤3.2.5：将{t _n’+1，t _n’+2，...，t _m’}时刻的业务并发量与其对应的残差值相加，得到{t _n’+1，t _n’+2，...，t _m’}时刻业务并发量的预测值，即{y(n’+1)+e(n’+1)，y(n’+2)+e(n’+2)，...，y(m’)+e(m’)}。
根据权利要求5所述的一种针对虚拟机不同类型的业务并发量预测方法，其特征在于：所述步骤3.2.4的具体方法为：

步骤3.2.4.1：使用函数w(t)拟合残差序列e(0)，e(1)，...，e(n’)，函数w(t)如下公式所示：

其中，a ₀、a _j’和b _j’均为变量，P＝n’，
表示向下取整，t＝1，2，...n’；

步骤3.2.4.2：通过最小二乘法计算变量a _j’和b _j’的值，如下公式所示：

其中，w _j’为第j’个用于拟合残差的函数。