CN110717577A

CN110717577A - 一种注意区域信息相似性的时间序列预测模型构建方法

Info

Publication number: CN110717577A
Application number: CN201910849154.0A
Authority: CN
Inventors: 刘志伟; 王帮海
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2019-09-09
Filing date: 2019-09-09
Publication date: 2020-01-21

Abstract

本发明涉及数据挖掘领域，更具体地，涉及一种注意区域信息相似性的时间序列预测模型构建方法。本发明主要通过注意力机制关注先前时间步区域信息与当前时间步区域信息的相似度，并使用长短期神经网络中先前所有时间步的加权融合向量与当前时间步模型预测输出及当前时间步的LSTM状态向量作为模型下一个时间步时间序列预测操作的输入。本发明通过长短期神经网络LSTM结合注意区域信息的注意力机制进行时间序列值的预测，相比现有技术中的传统回归方法和一般LSTM神经网络方法，本发明的预测结果具有更高的准确性，模型也更具鲁棒性。

Description

一种注意区域信息相似性的时间序列预测模型构建方法

技术领域

本发明涉及数据挖掘领域，更具体地，涉及一种注意区域信息相似性的时间序列预测模型构建方法。

背景技术

随着大数据时代来临、机器学习算法进一步发展以及人工智能技术日渐成熟，对时间序列数据信息进行深入有效地挖掘，是企业运用数据信息的一个发展方向。如何利用公司所掌握的时间序列数据信息合理有效地为公司自身管理进行决策服务，逐渐成为了各公司关注的焦点。

从对现有的研究成果中分析发现，对于时间序列预测问题，大多数学者通常会选择传统的回归模型(如GM(1,1)，指数平滑等模型)或LSTM神经网络模型去解决实际问题。对于传统的回归模型，在处理高维数据时，很多时候需要通过增加特征数量的方法来实现提高模型拟合度的目的。与此同时，也导致了模型易过拟合的问题。并且，由于现实数据中会存在不少的噪声，传统的回归模型抗噪能力并不强。对于一般的LSTM神经网络模型，通常会把LSTM中的最后一步更新的状态(state)作为下一步时间序列的输入信息。虽然最后更新的状态可以被认为存储了前面步骤所获取的所有信息，但经过大量的实验分析显示，最后一步更新的state存储的信息是有限的。在使用LSTM神经网络进行下一个时间值的预测过程中，每一个预测过程都和之前的输入没有关系了，只与最后一个更新的state有关，但由于state中存储的信息有限，最终会导致模型预测的结果与实际结果值相比偏差较大。

发明内容

为了解决现有技术在时间序列预测领域中，一般的LSTM神经网络模型的预测结果与实际结果值相比偏差较大的不足，本发明提供了一种注意区域信息相似性的时间序列预测模型构建方法。

为解决上述技术问题，本发明的技术方案如下：

一种注意区域信息相似性的时间序列预测模型构建方法，包括以下步骤：

步骤S1：采集时间序列数据，将采集到的时间序列数据进行标准化处理；

步骤S2：将标准化处理后的时间序列数据按先后顺序输入到长短期神经网络LSTM中，获取并保存长短期神经网络LSTM每个时间步输入时间序列数据后更新的状态向量；

步骤S3：使用卷积神经网络CNN对长短期神经网络LSTM中每个时间步之前连续的多个状态向量进行卷积运算，得到与每一个时间步相对应的区域信息表征向量；

步骤S4：计算时间步之间所对应的区域信息表征向量的相似度，并根据相识度对区域信息表征向量赋予不同的权值；

步骤S5：将区域信息表征向量的权值映射为0～1之间的实数，并保证所有权值映射后的值的和为1；

步骤S6：将每个时间步的状态向量与对应时间步映射后的权值进行加权融合操作，得到最终的注意力表征向量，完成注意区域信息相似性的时间序列预测模型的构建；

步骤S7：使用损失函数以及优化器对权值进行优化，将注意区域信息相似性的时间序列预测模型运算过程中的损失降到最小。

优选的，在步骤S1中，进行标准化处理的方式为采用归一化处理，即：

其中，为归一化后的时间序列数据，x_i为原始的时间序列数据，x_max、x_min分别表示当前时间序列数据的最大值和最小值。

优选的，在步骤S2中，长短期神经网络LSTM每个时间步输入时间序列数据后更新的状态向量为：

h_t＝LSTM(h_t-1,x_t) (3)

其中，h_t为当前时间步输入更新状态，h_t-1为上一时间步输入更新状态，x_t为当前时间步输入数据特征值。

优选的，在步骤S3中进行卷积运算时，超出卷积神经网络运算输入的部分用0进行补齐，一个时间步的区域信息抽取公式表示如下：

Vector _t＝CNN(h_t-T,h_t-T+1,...,h_t) (4)

其中，T为自定义的一个时间跨步，h_t-T表示与当前时间步相差T个时间跨步的时间步，Vector t代表对一个时间跨步信息进行卷积计算后得到的区域信息表征向量。

优选的，在步骤S4中，通过注意力机制自动关注时间步t与上一个时间步t-1之间的区域信息表征向量，使用余弦相似度计算公式计算出时间步t区域信息表征向量与时间步t-1之间的区域信息表征向量相似度，对于相似度更高的区域信息表征向量，则该区域信息表征向量对应时间步LSTM状态向量自动赋予更大的权值，具体的公式表示为：

S_t＝cos(Vector_t,Vector_n) (5)

其中，cos(·)为余弦相似度计算函数，S_t为相似度，下标n表示当前时刻，即需要预测下一时刻信息的上一个当前时刻，下标t表示前面第t个时间跨步；

其中，α_t为长短期神经网络对应时间步t的状态向量权值，Sj代表每个时间步计算得到的相似度，St为t时间步的相似度。

优选的，在步骤S6中，进行加权融合操作的具体步骤如下：每个时间步的长短期神经网络状态向量与对应时间步的权值相乘，然后再对t时间步以t-1时间步之间所有加权后的状态向量进行向量加和，得出最终的注意力信息表征向量，该表征向量作为t+1时间步进行预测操作的输入信息，具体的状态向量加权融合操作的具体公式表示为：

C_t＝α_th_t (7)

优选的，步骤S7中，损失函数采用均方误差公式，具体表达公式为：

其中，MSE表示损失函数，x_predict,i为模型的输出的结果，x_label,i为模型的输出的结果对应的真实值。

优选的，在步骤S7中，优化器采用Rmsprop优化器。

与现有技术相比，本发明技术方案的有益效果是：

本发明主要通过注意力机制关注先前时间步区域信息与当前时间步区域信息的相似度，并使用长短期神经网络中先前所有时间步的加权融合向量与当前时间步模型预测输出及当前时间步的LSTM状态向量作为模型下一个时间步时间序列预测操作的输入。本发明通过长短期神经网络LSTM结合注意区域信息的注意力机制进行时间序列值的预测，相比现有技术中的传统回归方法和一般LSTM神经网络方法，本发明的预测结果具有更高的准确性，模型也更具鲁棒性。

附图说明

图1为本发明的方法流程图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

为了更好说明本实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；

对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1

如图1所示，一种注意区域信息相似性的时间序列预测模型构建方法，包括以下步骤：

作为一个优选的实施例，在步骤S1中，进行标准化处理的方式为采用归一化处理，即：

其中，

为归一化后的时间序列数据，x_i为原始的时间序列数据，x_max、x_min分别表示当前时间序列数据的最大值和最小值。

作为一个优选的实施例，在步骤S2中，长短期神经网络LSTM每个时间步输入时间序列数据后更新的状态向量为：

h_t＝LSTM(h_t-1,x_t) (3)

作为一个优选的实施例，在步骤S3中进行卷积运算时，超出卷积神经网络运算输入的部分用0进行补齐，一个时间步的区域信息抽取公式表示如下：

Vector _t＝CNN(h_t-T,h_t-T+1,...,h_t) (4)

作为一个优选的实施例，在步骤S4中，通过注意力机制自动关注时间步t与上一个时间步t-1之间的区域信息表征向量，使用余弦相似度计算公式计算出时间步t区域信息表征向量与时间步t-1之间的区域信息表征向量相似度，对于相似度更高的区域信息表征向量，则该区域信息表征向量对应时间步LSTM状态向量自动赋予更大的权值，具体的公式表示为：

S_t＝cos(Vector_t,Vector_n) (5)

作为一个优选的实施例，在步骤S6中，进行加权融合操作的具体步骤如下：每个时间步的长短期神经网络状态向量与对应时间步的权值相乘，然后再对t时间步以t-1时间步之间所有加权后的状态向量进行向量加和，得出最终的注意力信息表征向量，该表征向量作为t+1时间步进行预测操作的输入信息，具体的状态向量加权融合操作的具体公式表示为：

C_t＝α_th_t (7)

作为一个优选的实施例，步骤S7中，损失函数采用均方误差公式，具体表达公式为：

作为一个优选的实施例，在步骤S7中，优化器采用Rmsprop优化器。

相同或相似的标号对应相同或相似的部件；

附图中描述位置关系的用语仅用于示例性说明，不能理解为对本专利的限制；

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种注意区域信息相似性的时间序列预测模型构建方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种注意区域信息相似性的时间序列预测模型构建方法，其特征在于，在步骤S1中，进行标准化处理的方式为采用归一化处理，即：

其中，

3.根据权利要求2所述的一种注意区域信息相似性的时间序列预测模型构建方法，其特征在于，在步骤S2中，长短期神经网络LSTM每个时间步输入时间序列数据后更新的状态向量为：

h_t＝LSTM(h_t-1,x_t) (3)

4.根据权利要求3所述的一种注意区域信息相似性的时间序列预测模型构建方法，其特征在于，在步骤S3中进行卷积运算时，超出卷积神经网络运算输入的部分用0进行补齐，一个时间步的区域信息抽取公式表示如下：

Vector_t＝CNN(h_t-T,h_t-T+1,...,h_t) (4)

其中，T为自定义的一个时间跨步，h_t-T表示与当前时间步相差T个时间跨步的时间步，Vector_t代表对一个时间跨步信息进行卷积计算后得到的区域信息表征向量。

5.根据权利要求4所述的一种注意区域信息相似性的时间序列预测模型构建方法，其特征在于，在步骤S4中，通过注意力机制自动关注时间步t与上一个时间步t-1之间的区域信息表征向量，使用余弦相似度计算公式计算出时间步t区域信息表征向量与时间步t-1之间的区域信息表征向量相似度，对于相似度更高的区域信息表征向量，则该区域信息表征向量对应时间步LSTM状态向量自动赋予更大的权值，具体的公式表示为：

S_t＝cos(Vector_t,Vector_n) (5)

6.根据权利要求5所述的一种注意区域信息相似性的时间序列预测模型构建方法，其特征在于，在步骤S6中，进行加权融合操作的具体步骤如下：每个时间步的长短期神经网络状态向量与对应时间步的权值相乘，然后再对t时间步以t-1时间步之间所有加权后的状态向量进行向量加和，得出最终的注意力信息表征向量，该表征向量作为t+1时间步进行预测操作的输入信息，具体的状态向量加权融合操作的具体公式表示为：

C_t＝α_th_t (7)

7.根据权利要求6所述的一种注意区域信息相似性的时间序列预测模型构建方法，其特征在于，步骤S7中，损失函数采用均方误差公式，具体表达公式为：

8.根据权利要求1所述的一种注意区域信息相似性的时间序列预测模型构建方法，其特征在于，在步骤S7中，优化器采用Rmsprop优化器。