CN111860785A

CN111860785A - 基于注意力机制循环神经网络的时间序列预测方法及系统

Info

Publication number: CN111860785A
Application number: CN202010723438.8A
Authority: CN
Inventors: 吴雪敏; 潘炎; 刘冶
Original assignee: Flamingo Network Guangzhou Co ltd; Sun Yat Sen University
Current assignee: Flamingo Network Guangzhou Co ltd; Sun Yat Sen University
Priority date: 2020-07-24
Filing date: 2020-07-24
Publication date: 2020-10-30

Abstract

本发明涉及一种基于注意力机制循环神经网络的时间序列预测方法及系统，包括：构建一数据集，从所述数据集中确认驱动序列和目标序列；构建基于注意力机制的循环神经网络模型，所述网络模型在驱动序列之间、驱动序列与目标序列之间、时间三个维度中运用注意力机制；将所述数据集划分出训练集、验证集和测试集，对模型参数进行定义，对所述网络模型进行训练，通过以均方误差为目标函数的反向传播算法来对所述参数进行学习；以及将所述测试集输入到训练后的所述网络模型中进行预测。本发明有效解决了由于输入序列过长而出现的信息丢失导致性能瓶颈的问题，同时有效捕捉较长的时间内序列之间的相关性，从而实现对时间序列的更精确的预测。

Description

基于注意力机制循环神经网络的时间序列预测方法及系统

技术领域

本发明涉及时间序列预测领域，特别是涉及一种基于注意力机制循环神经网络的时间序列预测方法及系统。

背景技术

随着物联网和大数据技术的发展，在金融市场预测、天气预报、复杂动力系统分析等领域，数据采集工作通常从多个不同的特征维度来进行，由此而产生的时间序列数据大多以多元特征的形式呈现。时间序列数据是在不同时间上收集到的数据，用于描述现象随时间变化的情况。时间序列预测是指通过时间序列的过去一段时间窗口长度的值向量以及多个驱动序列的当前和过去值来预测时间序列的当前值，在上述领域中具有重要的应用价值。

循环神经网络(Recurrent Neural Network，RNN)是一种专门为处理时序数据而设计的深度神经网络，其神经元的更新依赖上一次的输入以捕捉时序数据特征。RNN在捕获非线性关系方面具有很大的灵活性，然而，传统的RNN存在梯度消失的问题，难以捕获长期依赖关系。改进的RNN模型如长短期记忆网络(Long Short-Term Memory，LSTM)已经克服这个缺点，在机器翻译、语音识别和图像处理方向应用比较成熟。

基于LSTM的编解码器网络得到广泛的应用，最初是在机器翻译方面应用并获得成功，其关键思想是将源语句编码为固定长度的向量，并使用译码器生成翻译。然而，随着输入序列长度的增加，其性能将出现瓶颈。在时间序列预测中，通常期望根据目标序列和输入的驱动序列的相对较长的片段来做出预测，因此，上述性能问题是不能容忍的。为了解决这个问题，基于注意力的编解码器网络被提出，其主要是使用了一种注意力机制来选择编码器的隐藏状态，使得在较长的距离上捕捉上下文联系。由于时间序列预测问题中通常驱动序列较多，如何选择合适的驱动序列以及如何捕捉驱动序列之间的关系来对时间序列的预测至关重要，如果没能正确捕捉到数据序列之间的关系，由此预测出的结果有可能跟实际结果南辕北辙。

发明内容

基于此，本发明的目的在于，提供一种基于注意力机制循环神经网络的时间序列预测方法，包括以下步骤：选择一数据源，所述数据源包含一定时期内的数据序列，从所述数据序列中挑选出部分或全部数据序列，并将这些数据序列分别定义为驱动序列或目标序列；

构建基于注意力机制的循环神经网络模型，包括：对输入的数据序列建立循环神经网络的自注意力机制，对于同时间点不同所述驱动序列之间的关系进行关联；对所述循环神经网络的编码器部分建立注意力机制，对同时间点不同所述驱动序列与所述目标序列的关系进行关联；对所述循环神经网络的解码器部分建立注意力机制，对不同时间点的所述驱动序列与所述目标序列的关系进行关联；

将所述数据集划分出训练集、验证集和测试集，对网络模型的参数进行定义，将所述训练集和验证集中的数据输入到经过所述参数定义后的网络模型进行训练，使用均方误差的方法来构建损失函数，通过以均方误差为目标函数的反向传播算法来对所述参数进行学习；以及通过所述经过训练的网络模型对数据进行预测。

本发明有效解决了由于输入序列过长而出现的信息丢失导致性能瓶颈的问题，从而实现对时间序列的更精确的预测。

进一步地，所述自注意力机制的构建方法具体为：

对于驱动序列向量aⁱ，对每一个驱动序列i，计算其查询向量qⁱ、键值向量kⁱ和值向量vⁱ，设xⁱ为输出向量，则

其中，

d为所述查询向量qⁱ或所述键值向量kⁱ的维度。

进一步地，所述编码器部分注意力机制的构建方法具体为：

对于时刻t的输入x_t，编码器将x_t映射为h_t：

h_t＝f₁(h_t-1,x_t)

其中，h_t为t时刻的隐藏层状态，f₁是一个采用LSTM结构的非线性集合函数，用h_t-1和LSTM的神经元状态s_t-1作为输入来构建注意力层，对于所述驱动序列xⁱ，其计算方式如下：

其中W_e、U_e、v_e均为参数，[h_t-1；s_t-1]是指两个向量的连接，

经过Softmax层后即得到对应的权重

经过这部分的注意力机制后得到的输出为

其中，t时刻的隐藏层状态更新为

进一步地，用解码器的隐藏层d_t-1和解码器部分的LSTM的神经元状态s′_t-1作为输入来构建注意力层，对于t时刻，计算方式如下

其中，W_d、U_d、v_d均为参数，[d_t-1；s′_t-1]是指两个向量的连接，

经过Softmax层后即得到对应的权重

表示编码器第k(1≤k≤T)个隐藏状态的重要性，中间的上下文向量c_t为：

将上下文向量与给定的已知目标序列进行连接：

隐藏层状态在t时刻的更新为

其中，f₂为为一个采用LSTM结构的非线性集合函数，最后模型的输出预测结果为

其中，[d_T；c_T]是指两个向量的连接。

进一步地，所述基于注意力机制循环神经网络的时间序列预测方法还包括对所述数据集中的数据进行预处理，所述预处理包括对缺失值的处理以及数据规范化处理。

进一步地，所述对缺失值的处理方法具体为：所述对缺失值的处理方法具体为：对于缺失值较少的数据序列，对其进行填充处理，包括线性插值、均值、相邻数据等填充方式；对于缺失值较多的数据序列，对其进行丢弃处理。

进一步地，所述数据规范化处理方法具体为：对序列i的数据序列xⁱ进行z-score标准化，其计算公式为：

其中μⁱ为对应序列i所有样本数据的均值，σⁱ为序列i所有样本数据的标准差，(xⁱ)′为对xⁱ进行z-score标准化后的结果。

进一步地，所述损失函数使用均方误差，其数学表达式为

其中，

为预测值，y_T为真实值。

基于上述基于注意力机制循环神经网络的时间序列预测方法，本发明还提供一种基于注意力机制循环神经网络的时间序列预测系统，所述系统包括数据构建单元、网络模型构建单元、损失函数构建单元、网络模型训练单元、以及预测单元；

所述数据构建单元构建出一数据集，所述数据集包含一定时期内的数据序列，所述数据集中，部分数据序列为驱动序列，部分序列为目标序列；

所述网络模型构建单元构建基于注意力机制的循环神经网络模型，包括：对输入的数据序列建立循环神经网络的自注意力机制，对于同时间点不同所述驱动序列之间的关系进行关联；对所述循环神经网络的编码器部分建立注意力机制，对同时间点不同所述驱动序列与所述目标序列的关系进行关联；对所述循环神经网络的解码器部分建立注意力机制，对不同时间点的所述驱动序列与所述目标序列的关系进行关联；

所述损失函数构建单元使用均方误差的方法来构建损失函数；

所述网络模型训练单元将所述数据集划分出训练集、验证集和测试集，对网络模型的参数进行定义，将所述训练集和验证集中的数据输入到经过所述参数定义后的网络模型进行训练，通过以所述损失函数为目标函数的反向传播算法来对所述参数进行学习；

所述预测单元通过所述经过训练的网络模型对数据进行预测。

进一步地，所述系统通过运用所述基于注意力机制循环神经网络的时间序列预测方法来对数据进行预测。

为了更好地理解和实施，下面结合附图详细说明本发明。

附图说明

图1为本发明一实施例提供的基于注意力机制循环神经网络的时间序列预测方法的流程示意图。

图2为本发明一实施例提供的基于注意力机制循环神经网络的时间序列预测方法的数据序列结构示意图。

具体实施方式

本发明提供一种基于注意力机制循环神经网络的时间序列预测方法，该方法在驱动序列之间、驱动序列与目标序列之间以及时间三个维度中运用注意力机制，通过构建适合的表示和学习时间序列中时空关系的注意力结构，捕捉较长时间内数据间的相关性，并选择相应的驱动序列来进行预测，以实现对数据的更精确的预测。

具体地，请参阅图1，本发明的基于注意力机制循环神经网络的时间序列预测方法包括5个阶段，分别是数据集的构建、网络模型的构建、损失函数的构建、网络模型的训练以及预测的执行。其中，损失函数的构建独立于数据集的构建及网络模型的构建，本发明对其执行的先后顺序没有要求。下面针对每个阶段进行详细说明。

S1：数据集的构建

S11：选择一数据源，该数据源包含一定时期内的数据序列，每一个数据序列均为在不同时间点的数据，即时间序列数据。从所述数据源中挑选出部分或全部数据序列，并将这些数据序列分别定义为驱动序列或目标序列，如图2所示。由所有所述驱动序列和目标序列组成的数据构建成数据集。

S12：对数据集中的数据序列进行预处理，包括对缺失值的处理以及数据规范化处理。

在S11中所获取的数据集中，实际可能会存在部分数据的缺失，数据的缺失可能会导致有用信息的丢失，同时，空值数据可能导致不可靠的模型输出等情况，对实验结果产生较大的影响。因此，在将数据导入模型之前有必要对缺失的数据进行处理。在实际应用中可根据不同的应用场景对缺失值进行不同的处理，例如，对于缺失值较少的数据序列，对其进行填充处理，包括线性插值、均值、相邻数据等填充方式；对于缺失值较多的数据序列，对其进行丢弃处理，即直接丢弃该列数据序列，以避免其可能带来的噪声及其对结果造成的不良影响。

另外，数据规范化处理是为了统一输入数据之间的量纲，从而提升数据模型的收敛速度和模型精度。可采用z-score标准化对数据规范化处理，具体地，对某一序列i的数据序列xⁱ进行z-score标准化，其计算公式为：

其中μⁱ为对应序列i所有样本数据的均值，σⁱ为序列i所有样本数据的标准差。

上述对缺失值的处理以及数据规范化处理在次序上没有先后之分。此外，步骤S12对数据集中的数据序列的预处理也可以在步骤S11之前执行；；若步骤S12在S11之前执行，则需对数据集中所有的数据序列进行预处理；若步骤S12在S11之后执行，则可仅对挑选出的数据序列进行预处理，以减少预处理的数据量。

S2：网络模型的构建

网络模型的构建主要指建立用于时间序列预测的基于注意力机制的循环神经网络模型G(以下简称G网络模型)，其中，G网络模型包括编码器、解码器和其他数据模块。本步骤S2对于同一时间点的不同驱动序列之间的关系、同一时间点的驱动序列与目标序列的关系以及不同时间点的驱动序列与目标序列关系的问题分别进行建模，主要包括以下3个步骤：

S21：对输入的数据序列建立G网络的自注意力机制网络，对于同一时间点的不同驱动序列之间的关系进行关联。

具体地，对于输入的n个驱动序列，可将其表示为A＝(a¹,a²,...aⁿ)^T＝(a₁,a₂,...,a_T)∈R^n*T，其中T是时间窗口的大小；对于第i个驱动序列以T为时间步长的向量，可将其表示为

对于t时刻由n个输入驱动序列的值所组成的向量，可以将其表示为

首先，对于每一个驱动序列向量aⁱ(1≤i≤n)，计算其查询向量qⁱ、键值向量kⁱ和值向量vⁱ；接着，对所述数据集内的任意2个驱动序列进行两两之间的关系建模。对驱动序列i和驱动序列j之间的关系进行建模的方法为：对每一个qⁱ与所有的k^j进行矩阵乘法后除以

d为查询向量和键值向量的维度，从而得到

经过Softmax层之后得到mⁱ，mⁱ再乘上每一个的v^j，即可得到β^ij。其中

的计算公式如下：

Softmax函数可以对输出结果进行归一化，其计算公式如下：

β^ij的计算公式如下：

β^ij＝mⁱ·v^j (4)

最后，将所有的β^ij相加即可得到输出向量xⁱ，其计算公式如下：

至此，驱动向量aⁱ经过自注意力机制后得到的输出向量xⁱ，本步骤使用自注意力机制网络对驱动序列之间的关系建模学习，能够捕捉到驱动序列之间的相关性。

S22：对G网络模型的编码器部分建立注意力机制网络，对于同时间点驱动序列与目标序列的关系进行关联。

具体地，对于时刻t的输入x_t，其中

代表时刻t驱动序列1到驱动序列n的数据向量，编码器将x_t映射为h_t：

h_t＝f₁(h_t-1,x_t) (6)

其中，h_t为t时刻的隐藏层状态，f₁是一个采用LSTM结构的非线性集合函数。用h_t-1和LSTM的神经元状态s_t-1作为输入来构建注意力层，那么，对于经由步骤S21获得的输入的驱动序列xⁱ，其中

其计算方式如下：

经过Softmax层后即得到对应的权重

经过这部分的注意力机制后得到的输出为

其中，t时刻的隐藏层状态更新为

本步骤使用注意力机制对驱动序列对目标序列的重要性进行建模，挖掘驱动序列的特征重要性，使得编码器能够选择相关性强的驱动序列输入到解码器中。

S23：对G网络模型的解码器部分建立注意力机制网络，对于不同时间点的驱动序列与目标序列关系的问题进行关联。

具体地，用解码器的隐藏层d_t-1和解码器部分的LSTM的神经元状态s′_t-1作为输入来构建注意力层，对于t时刻，计算方式如下：

经过Softmax层后即得到对应的权重

将上下文向量与给定的已知目标序列进行连接：

隐藏层状态在t时刻的更新为

其中，f₂为一个采用LSTM结构的非线性集合函数。最后模型的输出预测结果为

其中，[d_T；c_T]是指两个向量的连接。

本步骤使用注意力机制加入解码器中，有效解决了由于输入的驱动序列过长而出现的信息丢失导致性能瓶颈的问题。

至此，对于输入的驱动序列向量aⁱ，经过自注意力机制网络得到输出向量xⁱ，再输入到编码器网络，经过该网络得到输出向量

最后输入到解码器网络，经过该网络得到

S3：损失函数的构建

损失函数是用来评估模型的预测值与真实值的不一致程度，损失函数的值越小，代表模型的鲁棒性越好，损失函数用于指导模型的训练。由于本发明所构建的网络模型具有光滑可微的特点，可以通过以均方误差为目标函数的反向传播算法来对参数进行学习。损失函数使用均方误差，其数学表达式为

其中，

为预测值，y_T为真实值。

S4：网络模型的训练

首先，对于根据步骤S2获得的G网络模型，对其参数进行定义，其中，所述模型参数包括时间步长T、编码器的隐藏层的大小m、解码器隐藏层的大小p、批处理大小batch以及学习率大小。上述经过参数定义的G网络模型称为G′网络模型。同时，将步骤S1中所述数据集划分为训练集、验证集和测试集。其中，所述训练集、验证集及测试集各自均包含完整的驱动序列及目标序列，一般地，将时间点靠前的数据划分为训练集或验证集，将时间点靠后的数据划分为测试集。然后，将所述训练集和验证集中的数据输入到G′网络，对该网络进行训练，通过以公式(15)为目标函数的反向传播算法来对所述参数进行学习，并且对所述参数进行调优。

S5，预测的执行

至此，进入最后的预测执行阶段，将所述测试集输入到训练后的模型中进行预测，从而得到目标序列数据的预测值。

下面结合具体的应用场景，具体地，以对NASDAQ 100股票数据的预测为例，进一步说明本发明所提供的基于注意力机制循环神经网络的时间序列预测方法是如何实现的。

首先，对应于步骤S1，对数据集进行构建，具体如下：

对应于步骤S11，选择NASDAQ 100股票数据集，所述数据集包含从2016年7月26日到2016年12月22日105天的数据，其数据为每分钟采样一次。去除日期、时间等无关的序列，保留股票的收盘价和纳斯达克100指数的数据序列，以公司的股票价格作为驱动序列，以纳斯达克100指数的指标作为目标序列。

对应于步骤S12，对数据集的缺失值进行处理。具体地，在所选取的NASDAQ 100股票数据集中，有部分公司其股票数据的数据缺失比较严重，将该部分公司的股票数据进行丢弃处理，仅保留81家主要公司的股票数据作为驱动序列；在所述81家主要公司的股票数据中，对于缺失较少的股票数据，使用线性插值方式对缺失的数据进行填充。对数据进行缺失值处理后，采用z-score标准化对其进行规范化处理。

其次，对应于步骤S2，对网络模型进行构建。具体地，对于输入的驱动序列向量aⁱ，经过步骤S21所述的自注意力机制网络得到输出向量xⁱ，再输入到步骤S22所述的编码器网络，经过该网络得到输出向量

最后输入到步骤S23所述的解码器网络，经过该网络得到

再次，对应于步骤S3，采用算式(15)来构建损失函数。

再有，对应于步骤S4，对网络模型进行训练。具体地，在步骤1所述的数据序列中，选取时间靠前的35100个时间点的数据序列作为训练集，选取时间紧随其后的2730个时间点的数据序列作为验证集，选取最后的2730个时间点的数据序列作为测试集。对于模型的参数时间步长T、编码器的隐藏层大小m以及解码器隐藏层的大小p，使用网格搜索算法得到最优参数，分别为：T＝10，m＝p＝128，batch大小设为128，学习率设为0.001，并且在每10000个迭代后减少10％。采用步骤S3中的构建的损失函数来指导网络模型的训练。

最后，对应于步骤S5，将步骤S4中所述测试集输入到训练后的模型中进行预测，从而得到目标序列的预测值。

本实施例在NASDAQ 100股票数据集上进行的时间序列预测任务中与Encoder-Decoder模型、基于单个注意力机制的Attention RNN模型和Input-Attn-RNN模型以及双阶段模型DA-RNN相比，均取得最好的效果，实验效果使用RMSE、MAE、MAPE作为评价指标，具体数据如下：

其中RMSE、MAE、MAPE的计算公式如下：

其中，

为t时刻目标序列的真实值，

为t时刻目标序列的预测值。

本实施例所提供的基于注意力机制循环神经网络的时间序列预测方法，构建了适合的表示和学习时间序列之间关系的注意力结构，算法的第一部分使用自注意力机制网络对驱动序列之间的关系建模学习，能够捕捉到驱动序列之间的相关性；第二部分使用注意力机制对驱动序列对目标序列的重要性进行建模，挖掘驱动序列的特征重要性，从而增强预测准确率；第三部分使用注意力机制加入解码器中，有效解决了由于输入序列过长而出现的信息丢失导致性能瓶颈的问题，从而实现对时间序列的更加精确的预测。

基于上述基于注意力机制循环神经网络的时间序列预测方法，本发明还提供一种基于注意力机制循环神经网络的时间序列预测系统，其包括数据构建单元、网络模型构建单元、损失函数构建单元、网络模型训练单元以及预测单元。

所述数据构建单元用于构建一数据集，所述数据构建单元通过执行所述步骤S1及其分步骤S11、S12的功能来构建所述数据集。

所述网络模型构建单元用于构建一基于注意力机制的循环神经网络模型，所述网络模型构建单元通过执行所述步骤S2的功能，构建出所述基于注意力机制的循环神经网络模型。具体地，所述网络模型构建单元包括自注意力构建单元、编码器注意力构建单元和解码器注意力构建单元。其中，所述自注意力构建单元执行所述步骤S21的功能，对于同时间点不同驱动序列之间的关系进行关联，以捕捉驱动序列之间的相关性；所述编码器注意力构建单元执行所述步骤S22的功能，挖掘驱动序列的特征重要性，使得编码器能够选择相关性强的驱动序列输入到解码器中；所述解码器注意力构建单元执行所述步骤S23的功能，对于不同时间点的驱动序列与目标序列关系的问题进行关联，有效解决了由于输入的驱动序列过长而出现的信息丢失导致性能瓶颈的问题。

所述损失函数构建单元用于构建损失函数，所述损失函数构建单元通过执行所述步骤S3的功能来构建出合适的损失函数，所述损失函数用于指导模型的训练。

所述网络模型训练单元用于网络模型的训练，所述网络模型训练单元通过执行所述步骤S4的功能，采用所述损失函数来指导网络模型的训练。

所述预测单元用于对目标序列的数据进行预测，所述预测单元通过执行所述步骤S5的功能来实现对目标序列数据的预测。

本发明所提供的基于注意力机制循环神经网络的时间序列预测系统，构建了适合的表示和学习时间序列之间关系的注意力结构，使用自注意力机制网络对驱动序列之间的关系建模学习，能够捕捉到驱动序列之间的相关性；使用注意力机制对驱动序列对目标序列的重要性进行建模，挖掘驱动序列的特征重要性，从而增强预测准确率；使用注意力机制加入解码器中，有效解决了由于输入序列过长而出现的信息丢失导致性能瓶颈的问题，从而实现对时间序列的更加精确的预测。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

Claims

1.一种基于注意力机制循环神经网络的时间序列预测方法，其特征在于，包括以下步骤：

选择一数据源，所述数据源包含一定时期内的数据序列，从所述数据序列中挑选出部分或全部数据序列，并将这些数据序列分别定义为驱动序列或目标序列；

将所述数据集划分出训练集、验证集和测试集；

对所述循环神经网络模型的参数进行定义，将所述训练集和验证集中的数据输入到经过所述参数定义后的网络模型进行训练；

同时使用均方误差的方法来构建损失函数，通过以均方误差为目标函数的反向传播算法来对所述参数进行学习；以及

通过所述经过训练的网络模型对数据进行预测。

2.根据权利要求1所述的基于注意力机制循环神经网络的时间序列预测方法，其特征在于，所述自注意力机制的构建方法具体为：

其中，

d为所述查询向量qⁱ或所述键值向量kⁱ的维度。

3.根据权利要求2所述的基于注意力机制循环神经网络的时间序列预测方法，其特征在于，所述编码器部分注意力机制的构建方法具体为：

对于时刻t的输入x_t，编码器将x_t映射为h_t：

h_t＝f₁(h_t-1,x_t)

经过Softmax层后即得到对应的权重

经过这部分的注意力机制后得到的输出为

其中，t时刻的隐藏层状态更新为

4.根据权利要求3所述的基于注意力机制循环神经网络的时间序列预测方法，其特征在于，所述解码器部分注意力机制的构建方法具体为：

用解码器的隐藏层d_t-1和解码器部分的LSTM的神经元状态s′_t-1作为输入来构建注意力层，对于t时刻，计算方式如下

经过Softmax层后即得到对应的权重

将上下文向量与给定的已知目标序列进行连接：

隐藏层状态在t时刻的更新为

其中，[d_T；c_T]是指两个向量的连接。

5.根据权利要求1至4中任一权利要求所述的基于注意力机制循环神经网络的时间序列预测方法，其特征在于：还包括对所述数据集中的数据进行预处理，所述预处理包括对缺失值的处理以及数据规范化处理。

6.根据权利要求5所述的基于注意力机制循环神经网络的时间序列预测方法，其特征在于，所述对缺失值的处理方法具体为：对于缺失值较少的数据序列，对其进行填充处理，包括线性插值填充方式、均值填充方式以及相邻数据填充方式；对于缺失值较多的数据序列，对其进行丢弃处理。

7.根据权利要求6所述的基于注意力机制循环神经网络的时间序列预测方法，其特征在于，所述数据规范化处理方法具体为：对序列i的数据序列xⁱ进行z-score标准化，其计算公式为：

8.根据权利要求7所述的基于注意力机制循环神经网络的时间序列预测方法，其特征在于：所述损失函数使用均方误差，其数学表达式为

其中，

为预测值，y_T为真实值。

9.一种基于注意力机制循环神经网络的时间序列预测系统，其特征在于：包括数据构建单元、网络模型构建单元、损失函数构建单元、网络模型训练单元、以及预测单元；

所述数据构建单元用于构建出一数据集，所述数据集包含一定时期内的数据序列，所述数据集中，部分数据序列为驱动序列，部分序列为目标序列；

所述网络模型构建单元用于构建基于注意力机制的循环神经网络模型，包括：对输入的数据序列建立循环神经网络的自注意力机制，对于同时间点不同所述驱动序列之间的关系进行关联；对所述循环神经网络的编码器部分建立注意力机制，对同时间点不同所述驱动序列与所述目标序列的关系进行关联；对所述循环神经网络的解码器部分建立注意力机制，对不同时间点的所述驱动序列与所述目标序列的关系进行关联；

所述损失函数构建单元用于采取均方误差的方法来构建损失函数；

10.根据权利要求9所述的基于注意力机制循环神经网络的时间序列预测系统，其特征在于：所述自注意力机制的构建方法具体为：