CN114118373A

CN114118373A - 基于回声状态网络的多维时间序列缺失补全方法

Info

Publication number: CN114118373A
Application number: CN202111412506.XA
Authority: CN
Inventors: 黄昉菀; 郑伟楠; 李莉; 於志勇
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2021-11-25
Filing date: 2021-11-25
Publication date: 2022-03-01

Abstract

本发明涉及一种基于回声状态网络的多维时间序列缺失补全方法，包括：步骤S1：构建回声状态网络模型；步骤S2:按照时间顺序，向回声状态网络模型的输入层提供每个时刻的外生变量，向输出层提供对应时刻的多维时间序列的观测值，若缺失的观测值尚未预补，则利用基于方向的最近邻策略进行暂时性预补;步骤S3:分别构建具有双向反馈的前向或双向回声状态网络，并更新所有时刻的内部状态；步骤S4:根据无需预补时刻的输入、内部状态和真实输出训练出网络的输出权重；步骤S5:根据需要预补时刻的输入、内部状态和步骤S4得到的输出权重计算输出估计值，并用于对预补值进行更新；步骤S6:重复步骤S3‑S5，用最后的预补值填补原始序列的缺失值。本发明考虑更加全面的数据相关性来提升多维时间序列的补全精度。

Description

基于回声状态网络的多维时间序列缺失补全方法

技术领域

本发明涉及数据补全领域，具体涉及一种基于回声状态网络的多维时间序列缺失补全方法。

背景技术

随着物联网的不断普及，数十亿来自环境、建筑和智能设备的嵌入式传感器产生了大量的时间序列数据，为人类生活中的各种应用提供了强大的支持。然而，各种意外事故不可避免地会导致数据丢失，从而影响下游应用的决策能力。因此，对缺失值进行估计以提高数据质量往往是各种应用在数据预处理阶段中非常重要的一环。

缺失数据估计指的是使用统计或机器学习技术在缺失位置填充估计值的过程。根据考虑的数据相关性的不同，常用的方法大致可分为以下四类：插值法、归算法、基于矩阵的填充和基于深度学习的方法。第一类方法称为插值法，它利用时间序列中观测值之间的时间相关性来估计缺失值，最常见的有线性插值、三次样条插值、模糊插值和谱方法等。插值法的缺点是没有充分考虑影响时间序列的外生变量的跨域相关性。第二类方法称为归算法，它考虑了外生变量与观测值之间的相关性，并通过拟合两者的关系来生成估计值。常用的方法包括：基于距离的归算(K近邻或模糊聚类)，基于决策的归算(回归树或随机森林)，非线性归算(人工神经网络或支持向量机回归)，期望最大化归算和多重归算等。考虑到许多应用场景中的数据往往同时具有时间和跨域相关性，上述两种方法都存在丢失一些重要信息的风险。第三类方法是基于矩阵的填充，如低秩矩阵补全，矩阵分解等。此类方法把外生变量和观测值随时间变化的过程存储为一个矩阵再进行缺失值的填充。虽然此类方法可以充分利用矩阵中已有数据之间的相关性，但它需要满足一些很强的假设(如低秩性，时间平衡性，空间稳定性等)，而且它将时序数据视为静态数据，忽略了数据的时间成分。第四类方法则是基于目前流行的深度学习技术。其中擅长捕捉时序依赖关系的循环神经网络(Recurrent Neural Network，RNN)尤为受到关注。但是，目前在缺失数据补全领域所采用的RNN架构都是基于门控机制的，如长短期记忆网络(Long Short Term Memory，LSTM)和门控循环单元(Gated Recurrent Unit，GRU)。门的引入虽然可以缓解随时间反向传播(BackPropagation through Time,BPTT)的权重更新算法造成的梯度消失问题，但对训练数据量和计算成本都有很高的要求。这显然不适合具有大量缺失数据或实时性要求较高的应用。

发明内容

有鉴于此，本发明的目的在于提供一种基于回声状态网络的多维时间序列缺失补全方法，基于全面的数据相关性来提升多维时间序列的补全精度。

为实现上述目的，本发明采用如下技术方案：

一种基于回声状态网络的多维时间序列缺失补全方法，包括以下步骤：

步骤S1：构建一个包含输入层、隐藏层和输出层的回声状态网络模型，并初始化；

步骤S2:按照时间顺序，向回声状态网络模型的输入层提供每个时刻的外生变量，向输出层提供对应时刻的多维时间序列的观测值，若缺失的观测值尚未预补，则利用基于方向的最近邻策略进行暂时性预补；

步骤S3:根据使用的储备池个数的不同，分构建具有双向反馈的前向或双向回声状态网络，并利用不同的内部状态更新公式计算所有时刻的内部状态；

步骤S4:根据无需预补时刻的输入、内部状态和真实输出训练出网络的输出权重；

步骤S5:根据需要预补时刻的输入、内部状态和步骤S4得到的输出权重计算输出估计值，并用于对预补值进行更新；

步骤S6:重复步骤S3-S5直至,满足预设要求，迭代结束，用最后的预补值填补原始序列的缺失值。

进一步的，所述初始化，具体为：随机初始化网络的输入权重、反馈权重和循环权重，其中循环权重要求是稀疏的。

进一步的，所述步骤S1具体为：

步骤S11：构建一个包含输入层、隐藏层和输出层的回声状态网络，输入层神经元的个数n_i与影响时间序列的外生变量的个数相同，隐藏层包含前向储备池，反向储备池和融合储备池，它们的神经元个数均为n_r，输出层神经元的个数n_o与多维时间序列的维度相同；

步骤S12：利用[-1,1]的均匀分布随机生成输入层到前向储备池、反向储备池的输入全连接权重

和

前一时刻和后一时刻的输出层分别到当前时刻的前向储备池的反馈全连接权重

和

后一时刻的输出层到当前时刻的反向储备池的反馈全连接权重

前一时刻到当前时刻的前向储备池的循环稀疏连接权重

其非零元素的个数由稀疏率

决定；后一时刻到当前时刻的反向储备池的循环稀疏连接权重

其非零元素的个数由稀疏率

决定；

步骤S13：将权重矩阵W_i1，W_i2，W_f1，W_f2和W_f3按照各自的缩放因子s_i1，s_i2，s_f1，s_f2和s_f3进行缩放。将W_r1和W_r2按照各自的谱半径因子ρ_r1和ρ_r2根据公式(1)-(2)进行调整，其中λ_max(W_r1)和λ_max(W_r2)指的是W_r1和W_r2的最大特征值

进一步的，所述利用基于方向的最近邻策略进行暂时性预补，具体为：

步骤S21：已知原始时间序列Y＝{y₁，...，y_t，...，y_l}，l为时间序列的长度，其中

根据Y中的缺失情况，定义一个多维时间序列M＝{m₁，…，m_t，...，m_l}，其中

若时刻t的第j维的观测值

是缺失的，则

若

是未缺失的，则

步骤S22：在计算内部状态

之前，已知外生变置

但输出时间序列中y_t-1或

中某些维度的观测值出现缺失，利用基于方向的最近邻策略进行初始预补。

进一步的，所述基于方向的最近邻策略，具体为：

若

缺失，应该采用第j个观测值在历史时刻中最后一个未缺失的观测值对其进行预补，如公式(3)所示；若

缺失，应该采用第j个观测值在后续时刻中最新一个未缺失的观测值进行预补，如公式(3)所示：

其中，

表示时刻t之前第j个观测值的最后一个未丢失时刻，

表示时刻t之后第j个观测值的第一个未丢失时刻。

进一步的，所述具有双向反馈的前向回声状态网络，具体为：只需要用到隐藏层的前向储备池，无需使用反向储备池，具有双向反馈的前向回声状态网络的状态更新方程如公式(5)所示：

其中，

表示t时刻前向储备池的内部状态；f(.)为神经元的激活函数，通常是双曲正切函数tanh；[.；.]表示两个向量的上下联接；

将每个时刻的内部状态h_t，外生变量x_t，输出观测值y_t进行向量的上下拼接，得到扩展状态

然后将所有时刻的z_t按列存储成矩阵

进一步的，所述具有双向反馈的双向回声状态网络，具体为：需要用到隐藏层的前向储备池，反向储备池和融合储备池。该模型的状态更新方程如公式(6)-(8)所示：

其中，

表示t时刻反向储备池的内部状态；α∈[0，1]用于控制前向状态和反向状态之间的相对重要性。

然后将所有时刻的z_t按列存储成矩阵

进一步的，所述步骤S4具体为：

步骤S41：对于j∈{1，2，...，n_o}，从j＝1开始，重复执行步骤S42-S44，直至j＝n_o；

步骤S42：对于t∈{1，2，...，l}，将矩阵H中所有

对应时刻的行取出，得到矩阵

为时间序列的第j维中未缺失的观测个数；

步骤S43：取出

中对应时间序列的第j维观测值的列，得到向量

将剩余的部分命名为

步骤S44：利用岭回归法求解公式(9)的优化函数，得到

进一步的，所述步骤S5具体为：

步骤S51：对于j∈{1，2，...，n_o}，从j＝1开始，重复执行步骤S52-S55，直至j＝n_o；

步骤S52：对于t∈{1，2，...，l}，将矩阵H中所有

对应时刻的行取出，得到矩阵

步骤S53：取出

中对应时间序列的第j维观测值的列，得到向量

将剩余的部分命名为

步骤S54：利用步骤S44得到的

根据公式(10)更新

步骤S55、将

中的值按顺序填充到时间序列的第j维观测值的缺失位置。

本发明与现有技术相比具有以下有益效果：

本发明能够在有效降低模型训练复杂度的同时，实现对缺失数据的最佳填充。

附图说明

图1是本发明一实施例中具有双向反馈的前向回声状态网络；

图2是本发明一实施例中具有双向反馈的双向回声状态网络。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

请参照图1和图2，本发明提供一种基于回声状态网络的多维时间序列缺失补全方法，包括以下步骤：

步骤S1:构建一个包含输入层、隐藏层和输出层的回声状态网络模型，其中隐藏层包含前向储备池，反向储备池和融合储备池。随机初始化网络的输入权重、反馈权重和循环权重，其中循环权重要求是稀疏的；

步骤S3：根据使用的储备池个数的不同，分构建具有双向反馈的前向或双向回声状态网络，并利用不同的内部状态更新公式计算所有时刻的内部状态；

步骤S4：根据无需预补时刻的输入、内部状态和真实输出训练出网络的输出权重；

步骤S5：根据需要预补时刻的输入、内部状态和步骤S4得到的输出权重计算输出估计值，并用于对预补值进行更新；

步骤S6：重复步骤S3-S5直至，满足预设要求，迭代结束，用最后的预补值填补原始序列的缺失值。

在本实施例中，回声状态网络的构建过程如下：

步骤S12：利用[-1，1]的均匀分布随机生成输入层到前向储备池、反向储备池的输入全连接权重

和

和

前一时刻到当前时刻的前向储备池的循环稀疏连接权重

其非零元素的个数由稀疏率

其非零元素的个数由稀疏率

决定；

在本实施例中，利用基于方向的最近邻策略进行暂时性预补，具体为：

根据Y中的缺失情况，定义一个多维时间序列M＝{m₁，...，mt，...，m_l}，其中

若时刻t的第j维的观测值

是缺失的，则

若

是未缺失的，则

步骤S22：在计算内部状态

之前，已知外生变量

但输出时间序列中y_t-1或

在本实施例中，基于方向的最近邻策略，具体为：

若

其中，

表示时刻t之前第j个观测值的最后一个未丢失时刻，

表示时刻t之后第j个观测值的第一个未丢失时刻。

在本发明一实施例中，步骤S3中，两种不同的网络模型的内部状态的具体计算方法如下：

1)具有双向反馈的前向回声状态网络(ESN with Bidirectional Feedback，ESN-BF)

步骤S31、该模型只需要用到隐藏层的前向储备池，无需使用反向储备池，具有双向反馈的前向回声状态网络的状态更新方程如公式(5)所示：

其中，

步骤S32、将每个时刻的内部状态h_t，外生变量x_t，输出观测值y_t进行向量的上下拼接，得到扩展状态

然后将所有时刻的z_t按列存储成矩阵

2)具有双向反馈的双向回声状态网络(Bidirectional ESN with BidirectionalFeedback，BESN-BF)

步骤S31：该模型需要用到隐藏层的前向储备池，反向储备池和融合储备池。该模型的状态更新方程如公式(6)-(8)所示：

其中，

然后将所有时刻的z_t按列存储成矩阵

在本实施例中，步骤S4具体为：

步骤S42：对于t∈{1，2，...，l}，将矩阵H中所有

对应时刻的行取出，得到矩阵

为时间序列的第j维中未缺失的观测个数；

步骤S43：取出

中对应时间序列的第j维观测值的列，得到向量

将剩余的部分命名为

步骤S44：利用岭回归法求解公式(9)的优化函数，得到

在本实施例中，步骤S5具体为：

步骤S52：对于t∈{1，2，...，l}，将矩阵H中所有

对应时刻的行取出，得到矩阵

步骤S53：取出

中对应时间序列的第j维观测值的列，得到向量

将剩余的部分命名为

步骤S54：利用步骤S44得到的

根据公式(10)更新

步骤S55、将

中的值按顺序填充到时间序列的第j维观测值的缺失位置。

在本实施例中，步骤S6，还进一步计算补全性能指标，具体实现方法如下：

步骤S601、根据公式(11)-(13)计算标准均方根误差(Normalized Root MeanSquare Error，NRMSE)：

其中，

和

分别表示时间序列的第j维观测值在时刻t的估计值和真实值；

步骤S602、根据公式(14)计算确定系数R²：

步骤S603、记录模型的运行时间。

步骤S6054、评价模型的性能，其中NRMSE和运行时间均是越小越好；而R²是对估计的回归方程拟合优度的度量，其值越大越好。

以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围。

Claims

1.一种基于回声状态网络的多维时间序列缺失补全方法，其特征在于，包括以下步骤：

步骤S2：按照时间顺序，向回声状态网络模型的输入层提供每个时刻的外生变量，向输出层提供对应时刻的多维时间序列的观测值，若缺失的观测值尚未预补，则利用基于方向的最近邻策略进行暂时性预补；

步骤S3：根据使用的储备池个数的不同，分别构建具有双向反馈的前向或双向回声状态网络，并利用不同的内部状态更新公式计算所有时刻的内部状态；

2.根据权利要求1所述的基于回声状态网络的多维时间序列缺失补全方法，其特征在于，所述初始化，具体为：随机初始化网络的输入权重、反馈权重和循环权重，其中循环权重要求是稀疏的。

3.根据权利要求1所述的基于回声状态网络的多维时间序列缺失补全方法，其特征在于，所述步骤S1具体为：

和

和

前一时刻到当前时刻的前向储备池的循环稀疏连接权重

其非零元素的个数由稀疏率

其非零元素的个数由稀疏率

决定；

4.根据权利要求1所述的基于回声状态网络的多维时间序列缺失补全方法，其特征在于，所述利用基于方向的最近邻策略进行暂时性预补，具体为：

根据Y中的缺失情况，定义一个多维时间序列M＝{m₁，...，m_t，...，m_l}，其中

若时刻t的第j维的观测值

是缺失的，则

若

是未缺失的，则

步骤S22：在计算内部状态

之前，已知外生变量

但输出时间序列中y_t-1或

5.根据权利要求4所述的基于回声状态网络的多维时间序列缺失补全方法，其特征在于，所述基于方向的最近邻策略，具体为：

若

其中，

表示时刻t之前第j个观测值的最后一个未丢失时刻，

表示时刻t之后第j个观测值的第一个未丢失时刻。

6.根据权利要求1所述的基于回声状态网络的多维时间序列缺失补全方法，其特征在于，所述具有双向反馈的前向回声状态网络，具体为：只需要用到隐藏层的前向储备池，无需使用反向储备池，具有双向反馈的前向回声状态网络的状态更新方程如公式(5)所示：

其中，

然后将所有时刻的z_t按列存储成矩阵

7.根据权利要求1所述的基于回声状态网络的多维时间序列缺失补全方法，其特征在于，所述具有双向反馈的双向回声状态网络，具体为：需要用到隐藏层的前向储备池，反向储备池和融合储备池，该模型的状态更新方程如公式(6)-(8)所示：

其中，

表示t时刻反向储备池的内部状态；α∈[0，1]用于控制前向状态和反向状态之间的相对重要性；

然后将所有时刻的z_t按列存储成矩阵

8.根据权利要求1所述的基于回声状态网络的多维时间序列缺失补全方法，其特征在于，所述步骤S4具体为：

步骤S42：对于t∈{1，2，...，l}，将矩阵H中所有

对应时刻的行取出，得到矩阵

为时间序列的第j维中未缺失的观测个数；

步骤S43：取出

中对应时间序列的第j维观测值的列，得到向量

将剩余的部分命名为

步骤S44：利用岭回归法求解公式(9)的优化函数，得到

9.根据权利要求8所述的基于回声状态网络的多维时间序列缺失补全方法，其特征在于，所述步骤S5具体为：

步骤S52：对于t∈{1，2，...，l}，将矩阵H中所有

对应时刻的行取出，得到矩阵

步骤S53：取出

中对应时间序列的第j维观测值的列，得到向量

将剩余的部分命名为

步骤S54：利用步骤S44得到的

根据公式(10)更新

步骤S55、将

中的值按顺序填充到时间序列的第j维观测值的缺失位置。