CN113886454A

CN113886454A - 一种基于lstm-rbf的云资源预测方法

Info

Publication number: CN113886454A
Application number: CN202110930841.2A
Authority: CN
Inventors: 包晓安; 苏逸凡; 张娜; 吴彪; 涂小妹; 金瑜婷
Original assignee: Zhejiang Sci Tech University ZSTU
Current assignee: Zhejiang Sci Tech University ZSTU
Priority date: 2021-08-13
Filing date: 2021-08-13
Publication date: 2022-01-04

Abstract

本发明公开了一种基于LSTM‑RBF的云资源预测方法，属于云资源预测领域。S10，读入云计算平台资源负载情况数据，数据归一化处理，转化为有监督学习问题。S20，使用LSTM神经网络进行资源预测。S30，使用RBF神经网络进行资源预测。S40，使用BP神经网络对LSTM和RBF的预测值进行混合预测。S50，输出混合预测结果。本发明采用基于LSTM‑RBF混合模型进行云计算资源预测，弥补了RBF模型不够快速与精确的不足，避免了LSTM模型训练时间呈指数倍增的问题，在混合方法上采用了BP神经网络对预测结果进行训练，区别于传统的权重搜索方法，本发明所采用的方法有效提高了预测结果的精确性。

Description

一种基于LSTM-RBF的云资源预测方法

技术领域

本发明涉及云资源预测领域，具体涉及一种基于LSTM-RBF的云资源预测方法。

背景技术

云计算是一种计算方式，它是指基于互联网等网络，通过虚拟化方式共享IT资源的新型计算模式，用户完全不需要了解云资源的技术基础架构。云计算的核心思想是通过网络统一管理和调度计算、存储、网络等系统资源，实现资源配置的整合和优化，以服务的方式满足客户随时随地获取可扩展的资源、最大限度降低成本等各种需求。传统的云计算是以虚拟机作为基本单位来进行资源分配和调度的，存在资源利用率低、部署和重启软件应用时间长等问题。近年来，许多公有云服务商，如Amazon、阿里云等，利用容器技术解决资源利用率的问题，使得容器化云计算平台发展迅速。

与传统的云计算相比，虽然容器云有着额外资源开销少、启动时间短等优点，但是容器云的发展时间相对较短，在资源管理及调度等问题上还有待优化和完善。目前主要存在供应不足和过度供应等问题。若出现资源供应不足，则可能导致SLA违约、QoS降低等结果，最终甚至引起用户的强烈不满而使用户流失和经济损失。而出现资源供应过度时，虽然用户的使用不会受影响，但是会因为过量的资源而导致能源的浪费且会增加维护的成本。因此，资源的分配、回收等是非常重要的问题。

发明内容

为了使容器云平台能够有效地预测未来的资源使用情况，本发明提出了一种基于长短期记忆神经网络和径向基神经网络(LSTM-RBF,Long Short Term Memory-RadialBasis Function)的云资源预测方法，并使用反向传播(BP,back propagation)神经网络对参数进行训练，以找到最优的参数组合。通过预测模型对历史的资源使用情况数据进行处理，为容器云平台提供预测值，然后根据预测值动态、及时、准确地进行调度和分配资源。

本发明所采用的技术方案是：

A、读入云计算平台集群中每台主机的资源负载情况数据，对数据进行归一化处理，转化为有监督学习问题，得到时间序列样本训练集；

B、使用LSTM神经网络对每一个时间序列样本进行资源预测，对LSTM神经网络进行训练；

C、使用RBF神经网络对每一个时间序列样本进行资源预测，对RBF神经网络进行训练；

D、对LSTM神经网络和RBF神经网络最终输出向量按比例参数进行加权融合，利用BP神经网络对加权结果进行混合预测；

E、利用样本训练集中的标签对BP神经网络进行训练，得到BP神经网络参数和所述的加权融合比例；

F、获取待预测的主机历史时刻的资源使用率序列作为训练好的LSTM神经网络和RBF神经网络的输入，两个网络的隐藏层输出结果按照步骤E得到的加权融合比例进行融合，再作为训练好的BP神经网络的输入，预测得到当前时刻的资源使用率。

进一步的，步骤A中所述的转化为有监督学习问题，具体为对归一化后的时间序列样本标注标签，所述的时间序列为每台主机在每一时刻的资源使用率，将历史时刻的资源使用率作为输入，将后一时刻的资源使用率作为标签。

本发明的云资源预测方法产生以下几种良好的效果：

效果1：本发明采用基于LSTM-RBF混合模型进行云计算资源预测，能够很好的弥补RBF单一模型在处理线性关系时不够快速与精确、且难以挖掘出真是时间序列数据中存在的所有关系的不足，提高预测的准确性。

效果2：本发明采用基于LSTM-RBF混合模型进行云计算资源预测，能够有效的避免LSTM单一模型在随着数据集规模的增大时训练时间也呈指数倍增的问题，LSTM和RBF单一模型可以同时进行训练，训练后再进行混合预测，有效地节约了预测时间。

效果3：本发明采用基于LSTM-RBF混合模型进行云计算资源预测，在混合方法上采用了BP神经网络对LSTM和RBF单一模型的预测结果放入不同网络结构中进行训练以得到最终的BP神经网络结构和权重值，区别于过去传统的权重搜索方法，本发明所采用的方法有效提高了最终预测结果的精确性。

附图说明

图1是LSTM-RBF云资源预测方法的步骤图；

图2是LSTM-RBF混合预测模型预测结果折线图。

具体实施方式

以下结合附图和具体实施对本发明进行详细描述，但不作为对发明的限定。

如图1，本方法是实现步骤如下：

A读入云计算平台资源负载情况数据，数据归一化处理，转化为有监督学习问题。

本实施例中，从网上获取公开数据集，该数据集是对某一生产集群以10秒作为时间间隔采集得到的集群中每台主机的资源使用情况。对实验数据的预处理包括数据特征归一化和将数据集转化为有监督学习问题，使其能够实现通过前一时刻的资源使用率预测当前时刻的资源使用率。本发明采用Python中的scikit-learn库中的MinMaxScaler预处理类实现数据集的规范化，并定义相关函数采用单变量或多变量时间序列将数据集构建为有监督学习数据集。数据分为训练集和测试集，训练集与测试集的比例为3：1。

B使用LSTM神经网络进行资源预测。

将经过预处理的训练集作为LSTM神经网络的输入，经过隐含层的处理，得到最后的输出。

LSTM隐含层的每一个节点都需要通过输入门、遗忘门、输出门的处理，来形成一次完整的处理，本发明采用现有的LSTM网络结构实现资源预测。

具体的，通过由sigmod激活函数和按位乘操作构成的遗忘门来剔除不必要的信息，其计算公式如下：

f_t＝σ(W_f·[h_t-1,x_t]+b_f)

其中，x_t表示t时刻的时间序列样本，h_t-1表示t-1时刻LSTM的上一个输出信号，W_f表示遗忘门的权重矩阵，b_f表示遗忘门的偏置项，σ表示sigmod激活函数，f_t表示t时刻遗忘门的输出信号；

通过由tanh激活函数和按位乘操作构成的记忆门来保留必要的信息，其计算公式如下：

i_t＝σ(W_i·[h_t-1,x_t]+b_i)

其中，i_t表示记忆门的输出，值范围在0到1之间，决定哪些信息需要被更新，tan h表示tanh激活函数，W_i表示记忆门的权重矩阵，W_c表示单元状态的权重矩阵，b_i表示记忆门的偏置项，b_c表示单元状态的偏置项，

表示值范围在-1到1之间的新的状态候选向量，f_t表示遗忘门输出信号，C_t-1表示t-1时刻的细胞状态，C_t表示t时刻的细胞状态。

输出门与tanh激活函数以及按位乘操作共同作用将细胞状态(相当于信息传输的路径，让信息能在序列连中传递下去)和输入信号传递到输出端：

o_t＝σ(W_o·[h_t-1,x_t]+b_o)

h_t＝o_t*tan h(C_t)

其中，o_t表示控制单元状态的过滤程度，值范围在0到1之间，W_o表示单元状态的权重矩阵，b_o表示单元状态的偏置项，h_t表示t时刻LSTM的输出信号，·是向量的点乘，*是数值的相乘。

C使用RBF神经网络进行资源预测

首先需要确定RBF的中心向量，进而确定输入矢量到隐空间的映射关系。然后通过隐含层把向量从低维度映射到高维度，这样低维度线性不可分的情况到高维度就可以变得线性可分。最终可得到RBF网络的输出：

其中，y_j表示第j个输出，ω_ij表示第i个隐藏层节点针对第j个输出的权重，h表示隐含层节点数，σ表示sigmoid激活函数，x_t表示t时刻的时间序列样本，c_i表示第i个中心向量，n表示输出层的节点数，||.||²表示向量的距离平方。

D使用BP神经网络对LSTM和RBF的预测值进行混合预测

络隐藏层的节点数量确定在[2,5]的范围区间。将LSTM和RBF的单一预测结果作为BP神经网络的输入，进行混合预测；设置多组不同的BP神经网络中间层节点数；每组网络均对LSTM和RBF的单一预测结果的加权结果进行训练，得到两个权值以及最终的混合预测结果；对每组得到的混合预测结果进行分析，选取出预测效果最佳的一组，得到BP神经网络的中间层节点数作为最终BP神经网络的结构。如此可得到隐藏层节点数分别为2、3、4、5的混合预测模型预测值共4组数据。

将预测结果与真实值进行对比，计算其误差比值，最终得到该预测模型的平均误差比值，实验数据如表1所示。

表1不同隐藏层节点数的预测模型的平均误差比值

从表1可以看出，当混合预测模型的BP网络隐藏层节点数为3时，有最小的平均误差比值，此时预测模型拥有最好的预测性能，可使得预测值与真实值相差较小。因此，最终将LSTM－RBF混合预测模型的隐藏层节点数设置为3。

将确定好隐藏层节点数的混合预测模型与LSTM和RBF的单一预测模型进行实验对比。实验结果同样进行误差比值以及平均误差比值的换算，得到表2数据。从表2中可以看出，经由本发明提出的混合预测模型预测得到的预测值具有更低的误差，结果更为精确，由此可知本发明提出的LSTM-RBF混合预测模型的预测效果明显好于单一的预测模型。

表2单一预测模型与混合预测模型的平均误差比值

预测模型	平均误差比值
		LSTM单一预测模型	16.38％
RBF单一预测模型	19.36％
		LSTM-RBF混合预测模型	4.51％

E输出混合预测结果

将混合预测模型的预测结果绘制成折线图，如图2所示，其中横坐标为时间，纵坐标为CPU资源利用率，实线表示真实值，虚线表示BP网络隐藏层结点数为3的情况下的预测结果。从图中可见，混合预测模型的预测结果精确性很高。

以上列举的仅是本发明的具体实施例。显然，本发明不限于以上实施例，还可以有许多变形。本领域的普通技术人员能从本发明公开的内容直接导出或联想到的所有变形，均应认为是本发明的保护范围。

Claims

1.一种基于LSTM-RBF的云资源预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于LSTM-RBF的云资源预测方法，其特征在于：步骤A中所述的转化为有监督学习问题，具体为对归一化后的时间序列样本标注标签，所述的时间序列为每台主机在每一时刻的资源使用率，将历史时刻的资源使用率作为输入，将后一时刻的资源使用率作为标签。

3.根据权利要求2所述的一种基于LSTM-RBF的云资源预测方法，其特征在于：所述的步骤B包括：

B1、通过由sigmod激活函数和按位乘操作构成的遗忘门来剔除时间序列中不必要的信息，其计算公式如下：

f_t＝σ(W_f·[h_t-1，x_t]+b_f)

B2、通过由tanh激活函数和按位乘操作构成的记忆门来保留时间序列中必要的信息，其计算公式如下：

i_t＝σ(W_i·[h_t-1，x_t]+b_i)

表示值范围在-1到1之间的新的状态候选向量，f_t表示遗忘门输出信号，C_t-1表示t-1时刻的细胞状态，C_t表示t时刻的细胞状态；

B3、输出门计算最终的输出结果：

o_t＝σ(W_o·[h_t-1，x_t]+b_o)

h_t＝o_t*tan h(C_t)

4.根据权利要求2所述的一种基于LSTM-RBF的云资源预测方法，其特征在于：所述的步骤C包括：

C1、确定RBF的中心向量，得到输入的时间序列到隐空间的映射关系；

C2、通过隐含层把向量从低维度映射到高维度；

C3、计算最终输出，其公式为：

5.根据权利要求3或4所述的一种基于LSTM-RBF的云资源预测方法，其特征在于：所述的步骤D包括：

D1、将LSTM和RBF的单一预测结果作为BP神经网络的输入，进行混合预测；

D2、设置多组不同的BP神经网络中间层节点数；

D3、每组网络均对LSTM和RBF的单一预测结果的加权结果进行训练，得到两个权值以及最终的混合预测结果；

D4、对每组得到的混合预测结果进行分析，选取出预测效果最佳的一组，得到BP神经网络的中间层节点数作为最终BP神经网络的结构。