CN114372526A

CN114372526A - 一种数据恢复方法、系统、计算机设备及存储介质

Info

Publication number: CN114372526A
Application number: CN202210018153.3A
Authority: CN
Inventors: 梁伟; 黎钰晖; 洪宇杰; 张大方
Original assignee: Hunan University
Current assignee: Hunan University
Priority date: 2022-01-07
Filing date: 2022-01-07
Publication date: 2022-04-19

Abstract

本发明公开的一种数据恢复方法、系统、计算机设备及存储介质包括构造已知传感器网络结构图和传感器采集数据集合；构建STAR模型，STAR模型包括空间特征提取模块和时间特征提取模块、由多个增强扩散卷积层构成的扩散卷积模块以及输出模块；对数据集合X和掩码M进行堆叠得到输入X；利用时间特征提取模块进行时间特征提取，利用空间特征提取模块进行空间特征提取；将时间特征矩阵和空间特征矩阵进行拼接，并利用注意力增强的扩散卷积模块同时进行空间依赖和语义依赖的学习，得到传感器节点的新特征；对新特征进行拼接，再经过线性化处理，输出得到补全后的传感器观测结果；该STAR模型是一个用于时空感知归纳数据填充的新框架，具有高性能、鲁棒性和灵活性。

Description

一种数据恢复方法、系统、计算机设备及存储介质

技术领域

本发明属于数据恢复技术领域，尤其涉及一种C-ITS中基于时空感知归纳式图神经网络的数据恢复方法、系统、计算机设备及存储介质。

背景技术

随着ITS(智能交通系统)的普及，大量传感器被部署在路边、车辆和基础设施上。为了满足数据科学在C-ITS(协作式智能交通系统)中应用的高要求，时空交通数据中的各种缺失数据问题是一大挑战。高精度的数据恢复对于ITS(智能交通系统)中的许多下游任务至关重要，例如交通流量监测和决策。

随着通信和信息安全技术的进步，智能城市正在迅速扩大传感器网络的范围，以便为城市管理(如交通系统、城市安全和天气预报)收集和分析数据。随着传感器的普及，产生了海量数据，从而使先进的数据科学技术有可能应用于智能城市应用中，其中一个成功的应用是ITS(智能交通系统)。通过使用数据分析算法，ITS(智能交通系统)可以帮助缓解交通拥堵，提高道路安全，增加道路通行能力，节省燃油消耗。近年来，C-ITS(协作式智能交通系统)的出现使多个孤立的ITS(智能交通系统)能够相互协作，从而通过利用独立代理之间的高级通信和协作进一步提高安全性、可持续性、效率和舒适性。

随着C-ITS(协作式智能交通系统)系统和无线通信网络规模的扩大，传感器故障、传输中断、数据丢失等情况成为不可避免的问题，并由此造成严重后果。例如，这种现象可能会导致错误的结论，因为缺失的值可能会扭曲统计特性，并导致模型输出意外的结果，从而导致错误的决策。此外，在城市地区部署传感器既昂贵又费力，更不用说不断增加的系统运行和维护成本了。事实上，只有有限数量的传感器可供C-ITS(协作式智能交通系统)获得该地区的概况。因此，数据恢复任务非常关键，因为许多应用程序可能依赖它。

从本质上讲，丢失模式或缺失模式可以归纳为三种类型，即随机丢失、段丢失和完全丢失。随机丢失可能是由意外丢包引起的，意外的传输错误可能会导致随机丢失，插值方法可以快速填充随机缺失值。段丢失可能表示故障，这可能是由停电、传感器故障和极端天气条件引起的；基于分解的方法和基于神经网络的模型可以填补这些段缺失值。节点级丢失(即完全丢失)是由于部署了新的传感器，填补此类情况的缺失值可能具有挑战性，因为没有可用的历史数据。在实际应用中，三种数据缺失模式在实际采集的传感器数据中并存，给数据科学带来了困难。数据补全任务的根本挑战是如何有效地利用采样数据，包括其内在的时空相关性。尽管近年来时空感知时间序列预测取得了很大的进展，但很少有文献关注时空填充问题。例如，时空填充结果可以产生细粒度和高分辨率的时空数据，这些数据可以用于自动驾驶、交通流量预测和部署虚拟传感器。

ITS(智能交通系统)集成了多种先进技术，包括传感器网络、通信、控制理论和人工智能。它专注于为系统提供智能的数字技术。这些系统和新兴网络技术，如5G和IoT(物联网)的普及使C-ITS(协作式智能交通系统)成为可能。配备C-ITS(协作式智能交通系统)的基础设施可以协同提高整个系统的效率、可靠性和可持续性。

尽管取得了巨大的成就，但仍然存在一些阻碍数据科学在C-ITS(协作式智能交通系统)中应用的开放问题。每个组件都收集流量数据，并使用无线通信来传播消息。随着通信系统容量的不断增加，数据传输错误和数据丢失变得不可忽视。此外，作为系统的关键组件，传感器在大规模网络中的部署仍然需要很高的成本。因此，迫切需要一种更好的模型来实现C-ITS(协作式智能交通系统)下的高精度数据恢复和估计。幸运的是，这个问题可以通过设计良好的时空感知克立格算法得到缓解。

交通流量预测问题是一项基础性而又具有挑战性的任务。早期试图将其视为孤立点的时间序列预测问题。这些方法在很大程度上依赖于当地的季节性特征，因此它们往往不能对站间相关性进行建模。最近的文献探索了GNN(图神经网络)在时空数据建模方面的能力。Ling Zhao等人在《T-GCN:A Temporal Graph Convolutional Network for TrafficPrediction》中提出使用RNN(循环神经网络)获取空间和时间相关性，但基于RNN(循环神经网络)的方法无法处理长序列，因为记忆可能会丢失；其次，还会受到梯度消失和梯度爆炸问题的困扰。另外，递归计算方式给并行训练和推理造成了较低的效率。Bing Yu等人和Zonghan Wu等人在《Spatio-Temporal Graph Convolutional Networks:A Deep LearningFramework for Traffic Forecasting》和《Graph WaveNet for Deep Spatial-TemporalGraph Modeling》中配备了基于堆叠CNN(卷积神经网络)的时间编码器和基于GCN(图卷积网络)的空间编码器，但在表示效果和训练速度的提升上有限。

Carl Edward Rasmussen等人在《Gaussian Processes for Machine Learning》中提到的GPR(高斯过程回归)是解决克立格问题的有效工具，它使用灵活的核来构建时空相关性，但主要缺点是计算量大，这限制了它的实时应用。

近年来，基于GNN(图神经网络)的克立格法应运而生。Gabriel Appleby等人在《Kriging Convolutional Networks》中使用的方法可以实现，在生成预测时，克服了强高斯假设，直接使用相邻观测数据。Yuankai Wu等人在《Inductive Graph Neural Networksfor Spatiotemporal Kriging》中应用扩散图卷积和利用训练技术来实现归纳推理。遗憾的是，前面提到的大多数模型都是传导性的，也就是说，当网络结构发生微小变化时，它们需要对整个模型进行重新训练。

Jonathan Strahl等人在《Scalable Probabilistic Matrix Factorizationwith Graph-Based Priors》中利用矩阵分解来填充数据。Ahmed Ben Said等人在《Spatiotemporal Tensor Completion for Improved Urban Traffic Imputation》中尝试通过张量分解来重建交通数据张量。但这些方法很难充分利用时间上的相关性，因此训练出来的模型很难应用于其它交通场景。

发明内容

本发明的目的在于提供一种数据恢复方法、系统、计算机设备及存储介质，针对时空交通数据中的数据缺失问题，采用基于模型的方法在网络结构发生微小变化时需对整个模型重新训练，以及通过张量分解来重建交通数据张量难以充分利用时间上的相关性，训练出来的模型难以应用于其他交通场景的问题。

本发明是通过如下的技术方案来解决上述技术问题的：一种数据恢复方法，包括如下步骤：

步骤1：构造智能交通系统中已知传感器网络的结构图G＝(N,E,A)，其中，N表示已知传感器节点的集合，E表示已知传感器节点之间链路的集合，A表示结构图G的邻接矩阵，邻接矩阵A中每个元素a_ij定义为：

其中，d_ij表示已知传感器节点i与已知传感器节点j之间的距离，σ表示距离d_ij对应的方差，ε表示设定阈值，ε＞0；

构造传感器采集数据的集合

其中，

表示实数空间，n表示已知传感器节点的数量，m表示目标传感器节点的数量，T表示采样间隔；在集合X中，m个目标传感器节点所对应位置的值为0；

步骤2：将m个目标传感器添加到所述结构图G中得到新的结构图G'，构造数据填充任务函数f，具体表示为：

X′＝f(X,M,G′)

s.t.X*M＝X′*M

其中，

表示对集合X进行恢复或补全后的结果，掩码M与数据集合X′对应，掩码M用于表示数据集合X中传感器采集的数据是否缺失，0表示缺失，1表示无缺失；

步骤3：构建STAR模型，所述STAR模型包括并行的空间特征提取模块和时间特征提取模块、由多个增强扩散卷积层构成的扩散卷积模块以及输出模块；

对数据集合X和掩码M进行堆叠，得到输入

其中1-M表示反掩码，即将掩码M中的0变换为1，1变换为0；

步骤4：利用所述时间特征提取模块对输入

进行时间特征提取，得到n+m个传感器节点的时间特征矩阵；

利用所述空间特征提取模块对输入

进行空间特征提取，得到n+m个传感器节点的空间特征矩阵；

步骤5：将所述步骤4中时间特征矩阵和空间特征矩阵进行拼接，并利用所述注意力增强扩散卷积模块对拼接后的矩阵同时进行空间依赖和语义依赖的学习，得到传感器节点的新特征；每输入一层注意力增强扩散卷积层均得到一个新特征；

步骤6：对所述步骤5中由每层注意力增强扩散卷积层得到的新特征进行拼接，再经过线性化处理，输出得到补全后的传感器观测结果。

进一步地，所述步骤1中，设定阈值ε为0.5。

进一步地，所述步骤4中，时间特征提取模块为RG-TCN模型(残差门控时间卷积网络模型)，所述RG-TCN模型包括线性层以及S个残差门控时间卷积层(即RG-TCN层)；每个残差门控时间卷积层是将时间卷积层的激活函数设置成门控线性单元而构成的。

进一步地，利用所述RG-TCN模型进行时间特征提取的具体实现过程为：

对所述输入

进行线性化处理；

由第一层残差门控时间卷积层对线性化处理后的结果进行计算，具体计算公式为：

H'_out＝tanh(W₁*H+b₁)⊙sigmoid(W₂*H+b₂) (a)

H_out＝H'_out+φ(H) (b)

其中，H表示线性化处理后的结果或当前残差门控时间卷积层输入量，H_out表示该残差门控时间卷积层的计算输出量，H'_out表示计算中间量，tanh(·)、sigmoid(·)均表示激活函数，φ()表示具有1×1核的一维卷积，W₁、W₂均表示权重参数，b₁、b₂均表示偏置参数；

以上一层残差门控时间卷积层的计算输出量作为当前残差门控时间卷积层输入量，采用公式(a)和(b)对该输入量进行计算，得到计算输出量，该计算输出量又作为下一层残差门控时间卷积层输入量，依次类推，最后得到n+m个传感器节点的时间特征矩阵。

进一步地，所述步骤4中，空间特征提取模块为基于注意力的空间模型，所述基于注意力的空间模型包括线性层、S个残差门控时间卷积层(即RG-TCN层)、扩散图卷积层以及注意力层；每个残差门控时间卷积层是将时间卷积层的激活函数设置成门控线性单元而构成的。

进一步地，利用所述基于注意力的空间模型进行空间特征提取的具体实现过程为：

对所述输入

进行线性化处理；

H'_out＝tanh(W₁*H+b₁)⊙sigmoid(W₂*H+b₂) (a)

H_out＝H'_out+φ(H) (b)

以上一层残差门控时间卷积层的计算输出量作为当前残差门控时间卷积层输入量，采用公式(a)和(b)对该输入量进行计算，得到计算输出量，该计算输出量又作为下一层残差门控时间卷积层输入量，依次类推，最后得到n+m个传感器节点的时间特征；

由所述扩散图卷积层对n+m个传感器节点的时间特征进行计算，具体计算公式为：

其中，

表示扩散图卷积层的输出，

表示扩散图卷积层的输入或n+m个传感器节点的时间特征，

表示第k扩散时的前向转移矩阵，

表示第k扩散时的后向转移矩阵，K表示扩散次数，W_k1、W_k2均表示可学习的参数矩阵；

由所述注意力层对所述扩散图卷积层的输出进行计算，得到n+m个传感器节点的空间特征矩阵，具体计算公式为：

其中，

表示注意力层的输出或n+m个传感器节点的空间特征，EA( )表示注意力层，M_k、M_v均表示可训练参数。

进一步地，所述步骤5中，传感器节点的新特征的具体计算公式为：

其中，

表示增强扩散卷积层的输出或传感器节点的新特征，α表示可学习参数，EA( )表示表示空间特征提取模块中的注意力层，

表示空间特征提取模块中扩散图卷积层的输出，

表示空间特征提取模块中扩散图卷积层的输入或n+m个传感器节点的时间特征，

表示第k扩散时的前向转移矩阵，

表示第k扩散时的后向转移矩阵，K表示扩散次数，W_k1、W_k2均表示可学习的参数矩阵；M_k、M_v均表示可训练参数。

本发明还提供一种数据恢复系统，包括：

第一构造单元，用于构造智能交通系统中已知传感器网络的结构图G＝(N,E,A)和传感器采集数据的集合

其中N表示已知传感器节点的集合，E表示已知传感器节点之间链路的集合，A表示结构图G的邻接矩阵，

表示实数空间，n表示已知传感器节点的数量，m表示目标传感器节点的数量，T表示采样间隔；在集合X中，m个目标传感器节点所对应位置的值为0；邻接矩阵A中每个元素a_ij定义为：

第二构造单元，用于将m个目标传感器添加到所述结构图G中得到新的结构图G'，构造数据填充任务函数f，具体表示为：

X′＝f(X,M,G′)

s.t.X*M＝X′*M

其中，

堆叠单元，用于对数据集合X和掩码M进行堆叠，得到输入

其中1-M表示反掩码，即将掩码M中的0变换为1，1变换为0；

模型构建单元，用于构建STAR模型，所述STAR模型包括并行的空间特征提取模块和时间特征提取模块、由多个注意力增强扩散卷积层构成的注意力增强扩散卷积模块以及输出模块；

所述时间特征提取模块，用于对输入

进行时间特征提取，得到n+m个传感器节点的时间特征矩阵；所述空间特征提取模块，用于对输入

进行空间特征提取，得到n+m个传感器节点的空间特征矩阵；每层所述增强扩散卷积层，用于对由时间特征矩阵和空间特征矩阵拼接后的矩阵同时进行空间依赖和语义依赖的学习，得到传感器节点的新特征；所述输出模块用于对每层增强扩散卷积层得到的新特征进行拼接，再经过多层感知机线性化处理，输出得到补全后的传感器观测结果。

本发明还提供一种计算机设备，包括：存储器，用于存储计算机程序；处理器，用于执行所述计算机程序时实现如上所述数据恢复方法的步骤。

本发明还提供一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述数据恢复方法的步骤。

有益效果

与现有技术相比，本发明的优点在于：

本发明所提供的一种数据恢复方法、系统、计算机设备及存储介质，包括构造智能交通系统中已知传感器网络的结构图和传感器采集数据的集合；将目标传感器添加到结构图中形成新的结构图；构建STAR模型，STAR模型包括并行的空间特征提取模块和时间特征提取模块、由多个增强扩散卷积层构成的扩散卷积模块以及输出模块；对数据集合X和掩码M进行堆叠得到输入

；利用时间特征提取模块对输入

进行时间特征提取，利用空间特征提取模块对输入

进行空间特征提取；将时间特征矩阵和空间特征矩阵进行拼接，并利用注意力增强的扩散卷积模块对拼接后的矩阵同时进行空间依赖和语义依赖的学习，得到传感器节点的新特征；对由每层增强扩散卷积层得到的新特征进行拼接，再经过线性化处理，输出得到补全后的传感器观测结果；本发明的STAR模型是一个用于时空感知归纳数据填充的新框架，利用基于注意力的空间模型来增强GNN，以获取远程空间相似性和基于膨胀卷积的时间特征提取；此外，STAR模型是归纳的，这意味着它可以通过重新训练推广到看不见的节点；试验表明STAR模型在三个真实交通传感器数据集上的性能始终优于其他基准线模型；试验结果证明STAR模型对预测长度不敏感；本发明数据恢复方法的灵活性便于将STAR模型应用于任何数据恢复任务和对时变系统进行建模，例如预测移动自动驾驶汽车的传感器数据。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一个实施例，对于本领域普通技术人员来说，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例1中数据恢复方法流程图；

图2是本发明实施例1中STAR模型架构图；

图3是本发明实施例1中RG-TCN模型架构图；

图4是本发明实施例1中基于注意力的空间模型架构图；

图5是本发明实施例1中注意力增强扩散卷积模块以及输出模块的架构图；

图6是本发明实施例2中时空感知恢复能力比较图；其中，图6(a)是不同时间步骤下(非)时间方法在RMSE上的比较，图6(b)是不同时间步骤下(非)空间方法在RMSE上的比较；后缀-S和-T表示启用了相应的特征提取模块；

图7是本发明实施例2中长期数据恢复能力比较图；其中，图7(a)是不同恢复期下STAR模型的MAE和RMSE变化，图7(b)STAR模型和其他基准线在不同恢复期下的RMSE误差。

具体实施方式

下面结合本发明实施例中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

实施例1

如图1所示，本实施例所提供的一种数据恢复方法，包括如下步骤：

步骤1：构造智能交通系统中已知传感器网络的结构图G＝(N,E,A)以及传感器采集数据的集合

C-ITS场景下的数据填充问题是指根据已知传感器采集的数据对目标传感器的缺失数据进行插值。将具有n+m个传感器节点和E条边的整个传感器网络表示为结构图G＝(N,E,A)，其中，N表示已知传感器节点的集合，E表示已知传感器节点之间链路的集合，A表示结构图G的邻接矩阵，邻接矩阵A中每个元素a_ij定义为：

其中，d_ij表示已知传感器节点i与已知传感器节点j之间的距离，σ表示距离d_ij对应的方差，ε表示设定阈值，ε＞0。本实施例中，设定阈值ε为0.5，设定阈值ε越大，d_ij为0的数量越多。

传感器采集数据的集合

其中，

表示实数空间，n表示已知传感器节点的数量，m表示目标传感器节点的数量，T表示采样间隔；在集合X中，m个目标传感器节点所对应位置的值为0，即缺失。

步骤2：将m个目标传感器添加到结构图G中得到新的结构图G'，构造数据填充任务函数f。

创建一个掩码M用于表示数据集合X中传感器采集的数据是否缺失(即指示数据集合X中的非零条目)，0表示缺失，1表示无缺失。需要注意的是只有e条边作为先验知识，需要根据G'和数据集合X估计出m个传感器节点的缺失历史数据来对X′插值，因此，将数据恢复或填充任务表示为函数f：

X′＝f(X,M,G′) (2)

s.t.X*M＝X′*M (3)

其中，

表示对集合X进行恢复或补全后的结果，掩码M与数据集合X′对应。

步骤3：构建STAR模型，STAR模型包括并行的空间特征提取模块和时间特征提取模块、由多个增强扩散卷积层构成的扩散卷积模块以及输出模块，如图2所示。

步骤4：对数据集合X和掩码M进行堆叠，得到输入

其中1-M表示反掩码，即将掩码M中的0变换为1，1变换为0。

步骤5：利用时间特征提取模块对输入

进行时间特征提取，得到n+m个传感器节点的时间特征矩阵。

缺失值的位置对于填充任务至关重要。如果在最小-最大缩放器之后将损坏的时间序列输入神经网络，则缺失值被设置为零，使得很难区分小值和缺失值。指示缺失值的掩码包含引导模型从其他时间片提取时间模式的位置信息。时间特征提取模块的架构如图3所示，时间特征提取模块为RG-TCN模型(残差门控时间卷积网络模型)，RG-TCN模型包括线性层以及S个残差门控时间卷积层(即RG-TCN层)；每个残差门控时间卷积层是将时间卷积层的激活函数设置成门控线性单元而构成的。

TCN不会改变时间序列数据的输入长度，但会改变隐藏层之间的通道深度。经过RG-TCN模型处理后，保持相同的数据长度。如图3所示，利用所述RG-TCN模型进行时间特征提取的具体实现过程为：

步骤5.1：对输入

进行线性化处理；

步骤5.2：由第一层残差门控时间卷积层对线性化处理后的结果进行计算，具体计算公式为：

H'_out＝tanh(W₁*H+b₁)⊙sigmoid(W₂*H+b₂) (4)

H_out＝H'_out+φ(H) (5)

步骤5.3：以上一层残差门控时间卷积层的计算输出量作为当前残差门控时间卷积层输入量，采用公式(4)和(5)对该输入量进行计算，得到计算输出量，该计算输出量又作为下一层残差门控时间卷积层输入量，依次类推，最后得到n+m个传感器节点的时间特征矩阵。

步骤6：利用空间特征提取模块对输入

进行空间特征提取，得到n+m个传感器节点的空间特征矩阵。

为了提取空间特征进行进一步融合，本实施例提出了一种基于注意力的空间模型作为空间特征提取模块，该模型将TCN、图卷积和注意力机制与线性时间复杂度和空间复杂度相结合，其架构图如图4所示，基于注意力的空间模型包括线性层、S个残差门控时间卷积层(即RG-TCN层)、扩散图卷积层以及注意力层；每个残差门控时间卷积层是将时间卷积层的激活函数设置成门控线性单元而构成的。利用基于注意力的空间模型进行空间特征提取的具体实现过程为：

步骤6.1：对输入

进行线性化处理；

步骤6.2：由第一层残差门控时间卷积层对线性化处理后的结果进行计算，具体计算公式如式(4)和(5)所示；

步骤6.3：以上一层残差门控时间卷积层的计算输出量作为当前残差门控时间卷积层输入量，采用公式(a)和(b)对该输入量进行计算，得到计算输出量，该计算输出量又作为下一层残差门控时间卷积层输入量，依次类推，最后得到n+m个传感器节点的时间特征；

步骤6.4：由扩散图卷积层对n+m个传感器节点的时间特征进行计算，具体计算公式为：

其中，

表示扩散图卷积层的输出，

表示扩散图卷积层的输入或n+m个传感器节点的时间特征，

表示第k扩散时的前向转移矩阵，

步骤6.5：由注意力层对扩散图卷积层的输出进行计算，得到n+m个传感器节点的空间特征矩阵，具体计算公式为：

其中，

表示注意力层的输出或n+m个传感器节点的空间特征，EA( )表示注意力层，M_k、M_v均表示可训练参数，Norm(·)是一个按顺序计算Softmax和L1范数的两阶段归一化函数。

在空间特征提取模块中，首先将按传感器节点的时间序列馈送到RG-TCN中提取其时间模式，然后利用图卷积得到节点嵌入。图卷积的目的是在聚合邻域信息以区分彼此的同时，获得新节点的嵌入。在计算节点级表示后，即使两个节点位于不同的连通部件中，也使用注意力层来获取全局相似度。

由于过度平滑的问题，不能多次堆叠图形卷积层来捕获长范围依赖关系。节点只能捕获来自局部子图的信号。此外，甚至没有路径可用于连接具有类似模式的传感器。因此，认为图卷积不足以彻底捕获空间相关性。采用自我注意力来解决此问题，但它的计算复杂度为O(n²)，并且只捕获给定节点内部的相关性。考虑到网络规模的迅速扩大和复杂的时空依赖，本实施例采用外部注意力，线性复杂度和全局采样存储极大地方便了实时数据填充，外部注意力层的计算公式如式(7)所示。

步骤7：将步骤5中的时间特征矩阵和步骤6中的空间特征矩阵进行拼接，并利用注意力增强扩散卷积模块对拼接后的矩阵同时进行空间依赖和语义依赖的学习，得到传感器节点的新特征；每输入一层注意力增强扩散卷积层均得到一个新特征。

时间特征提取模块和空间特征提取模块是时空特征提取的两个分支，将这两种表示连接起来作为节点级嵌入，以便在图中进一步传播。

现实世界中的传感器网络具有潜在的有向拓扑结构。例如，传感器部署在道路上，自然形成双向图。采用扩散图卷积网络(DGCN)作为传播层来处理这个有向图。DGCN将前向边和后向边分开处理，形成前向转移矩阵A_f和后向转移矩阵A_b两个矩阵。将扩散步骤表示为K，扩散图卷积层的计算公式如式(6)所示。

图神经网络高度依赖于预定义的邻接矩阵，这限制了神经网络捕捉大规模传感器网络内部的语义相似性的能力。此外，对语义相似性的需求取决于数据集本身，而不是网络结构；其他工作使用注意力机制和可训练的自适应邻接矩阵来获取语义相似度。前者计算量大，而后者不能推广到不可见节点。为了解决上述问题，本实施例设计了一种外部注意力增强扩散卷积层来自适应地学习语义相似度：

其中，α初始设置为零作为控制语义相似性学习的权重，并且在等式(7)中引入EA(·)，使用线性时间复杂度语义相似性学习的第二分支来增强扩散卷积。

步骤8：对步骤7中由每层注意力增强扩散卷积层得到的新特征进行拼接，再经过线性化处理，输出得到补全后的传感器观测结果。

为了更好地利用多尺度上的特征，加快训练过程，对每一注意力增强扩散卷积层产生的新特征进行拼接。在这种布局下，神经网络可以提取特定的S跳邻域信息用于数据恢复。此外，还增加了剩余连接，使信息和梯度能够在整个网络中流动，图5显示了扩散卷积模块以及输出模块的架构。

本实施例还提供一种数据恢复系统，包括第一构造单元、第二构造单元、堆叠单元以及模型构建单元。

表示实数空间，n表示已知传感器节点的数量，m表示目标传感器节点的数量，T表示采样间隔；在集合X中，m个目标传感器节点所对应位置的值为0；邻接矩阵A中每个元素a_ij定义如式(1)所示。

第二构造单元，用于将m个目标传感器添加到所述结构图G中得到新的结构图G'，构造数据填充任务函数f，具体表示如式(2)和(3)所示。

堆叠单元，用于对数据集合X和掩码M进行堆叠，得到输入

其中1-M表示反掩码，即将掩码M中的0变换为1，1变换为0。

模型构建单元，用于构建STAR模型，所述STAR模型包括并行的空间特征提取模块和时间特征提取模块、由多个注意力增强扩散卷积层构成的注意力增强扩散卷积模块以及输出模块。

其中，时间特征提取模块用于对输入

进行时间特征提取，得到n+m个＝传感器节点的时间特征矩阵，具体步骤如5.1～5.3所示；空间特征提取模块用于对输入

进行空间特征提取，得到n+m个传感器节点的空间特征矩阵，具体步骤如6.1～6.5所示；每层注意力增强扩散卷积层，用于对由时间特征矩阵和空间特征矩阵拼接后的矩阵同时进行空间依赖和语义依赖的学习，得到传感器节点的新特征，如式(8)所示；输出模块用于对每层注意力增强扩散卷积层得到的新特征进行拼接，再经过多层感知机线性化处理，输出得到补全后的传感器观测结果。

本实施例还提出了一种计算机设备，包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上所述数据恢复方法的步骤。

示例性的，所述计算机程序可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器中，并由所述处理器执行，以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序在所述计算机设备中的执行过程。例如，所述计算机程序可以被分割成第一构造单元、第二构造单元、堆叠单元以及模型构建单元，各单元具体功能如上所述。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可包括，但不仅限于，处理器、存储器。本领域技术人员可以理解，数据恢复系统仅仅是计算机设备的示例，并不构成对计算机设备的限定，可以包括比系统更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现所述数据恢复系统的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述计算机程序被处理器执行时实现所述数据恢复方法的步骤。

所述数据恢复系统集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

实施例2

通过实验来对本发明实施例1的STAR模型进行评估。

1、数据集

在两个公开的时空数据集上验证STAR模型。METR-LA通过207个传感器记录了洛杉矶高速公路上四个月的交通速度数据，PEMS-Bay收集了美国加利福尼亚州的交通速度数据。所有数据集都由最小-最大缩放器进行归一化。本实施例随机选择75％的传感器进行训练，其余25％的传感器作为测试数据。此外，按照时间顺序对数据集进行拆分，训练集和测试集的比例为7：3。表1列出了两个数据集的详细统计属性。

表1交通数据集的统计属性

2、基准线

将STAR模型与以下基准线进行比较：

(1)Average，直接取其邻近地区的平均值作为预测。

(2)2D-Krige，是由从https://github.com/GeoStat-Framework/PyKrige下载的用于地理统计模拟的Python框架提供的。只有在给定传感器位置的情况下，此方法才可用。

(3)GCN，与平均模型相比，引入了非线性。它在消息传递框架下聚合邻域信息。

(4)IGNNK，使用堆叠扩散图卷积层，并应用训练策略对空间克立格任务进行归纳。

(5)STAR，无论子模块是否启用，都有三个变体：STAR-T只启用时间特征提取模块；STAR-S只启用空间特征提取模块；STAR启用这两个模块用于时空特征提取。

还根据模型类别、空间依赖建模、时间依赖建模和多步骤填充对基准线进行分类，如表2所示。

表2实验中使用的模型总结

3、设置

使用Python 3.7在PyTorch 1.7.1中实现STAR模型，并将其部署在配备了Inteli9-9900KS进程、32GB内存和NVIDIA GTX 2080Ti GPU的服务器上。对于超参数，选择100作为线性映射的隐藏尺寸。为了学习远程时间模式，使用6层RG-TCN，其扩张因子为1，2，1，2，1，2，核大小为2，步长为1。激活层和归一化层分别为Leaky ReLU和层归一化。对于梯度下降算法，选择Adam优化器。批次大小设置为8，学习率固定为0.008。

4、指标

为了量化STAR模型性能并与其他基准线方法进行比较，选择以下三个指标：

(1)MAE(平均绝对误差)，通常用于评估回归任务的性能。

(2)RMSE(均方根误差)，用来表示样本的分散程度。对于非线性拟合，RMSE越小，回归精度越高。

(3)MAPE(中值绝对百分比误差)，用于估计相对绝对误差。

5.填充性能

在不同的数据缺失情况下将实施例1的STAR模型与其他基准线进行比较，因为用三种数据缺失掩码训练STAR模型，将随机缺失率设置为20％。对于训练集和测试集，在每个传感器中删除200个30分钟的片段，将25％的传感器保留为未采样。实验结果如表3所示：

表3不同填充任务下的模型性能

由表3可以得出以下结论：

高性能。将STAR模型与两个数学模型和两个GNN进行比较，在各种填充任务中，STAR模型始终比基准线方法有较大幅度的提高。

鲁棒性。在三种数据缺失并存的情况下，评估了填充高损坏数据的性能。STAR模型在PEMS-Bay和METR-LA中的MAE分别为2.63和4.74，比最佳的基准线模型分别提高44％和29％。在这种高度损坏的数据输入下的高填充性能表明STAR模型具有很强的鲁棒性。

灵活性。STAR模型利用随机缺失数据进行训练，并根据给定的掩码对缺失数据进行填充，从而可以在一个模型中支持三种类型的缺失数据填充。根据表3，了解到STAR模型在所有类型的填充任务中都取得了极具竞争力的性能。这一特性可以帮助ITS显著降低整个模型生命周期的成本。

6、窗口大小的影响

表4给出了在METR-LA和西雅图公路数据集上24步、36步、48步、60步(2小时到5小时，每步1小时)数据恢复任务的STAR模型和其他基准线方法的填充精度。STAR模型在除RMSE之外的几乎所有评价指标下，对于所有水平都获得了最好的恢复精度，从而为时空感知数据恢复任务提供了有效性。

表4不同时间步骤的性能比较

由表4可以总结出STAR模型的三个重要特征：

(1)高恢复精度。STAR模型提取了时间特征，总体上比IGNNK和Average等其他方法具有更好的预测性能。例如，对于24步恢复，STAR在METR-LA和PEMS-Bay上的性能分别比IGNNK高20.7％和11.7％。STAR的MAPE误差明显小于IGNNK的MAPE误差。造成这种现象的主要原因是对内部时间模式的忽视。

(2)时空恢复能力。为了证明STAR模型能够捕捉空间和时间依赖关系，将STAR模型的变体与IGNNK进行了比较。如图6(a)所示，具有时间特征提取的方法比基准线方法具有更好的恢复精度，这表明时间特征提取模块可以从交通数据中捕获时间模式。此外，根据图6(b)，通过启用空间注意力，RMSE误差会减少，这表明基于注意力的空间模型捕获了超出预定义图结构的远程空间相关性。最后，只有利用时空特征才能达到最佳性能，这表明存在时空依赖性。

7、远程恢复。

结果表明，无论预测长度如何变化，STAR模型总能获得最好的恢复性能。随着时间步长的增加，性能稳定。因此，STAR模型既适用于短期填充，也适用于长期填充。图7(a)显示了不同恢复长度时MAE和RMSE的变化。可知随着时间步长的大幅度增加，它的变化是缓慢的。图7(b)将STAR模型与基准线进行了比较，证明它仍然比所有其他方法执行得更好。

8、消融研究

为了检验影响STAR性能提升的关键因素的影响，在两个流量数据集上进行了实验。本实施例集中讨论了三种因素：空间阻塞、时间阻塞和外部注意力。对于每个因素，通过移除相应的块来建立新的模型，将STAR的变体命名如下：

w/o EA：没有自适应加权外部注意力模块来捕获语义相似性的STAR，将图卷积层替换为扩散卷积。

w/o T：在图卷积层之前没有时间特征提取分支的STAR。

w/o S：没有空间特征提取分支的STAR。

使用早停止策略来评估性能，以防止过度拟合，并在表5中给出了实验结果。外部注意力模块的引入显著提高了性能，因为它提供了可训练分数的全局样本注意力。对特征提取的消融研究，即仅空间特征(w/o T)和仅时间特征(w/o S)，会降低性能。可以看到语义特征提取的准确率急剧下降，这表明交通传感器数据序列具有很强的相关性和丰富的语义相似性。

表5不同模块的消融研究

9、时间序列预测

如果改变掩码，迫使模型在观测窗口的末尾填充缺失值，那么时间序列预测问题就可以适用于本发明的数据填充框架，时间序列预测结果如表6所示。

表6交通数据集的时间序列预测精度

结果表明，尽管STAR模型是为数据填充而设计的，但它在时间序列预测方面具备很有竞争力的性能。与其他基准线相比，STAR模型在长远预测任务中具有明显的优势。此外，由于在一次前向计算中对所有节点即将到来的传感器数据进行预测，因此STAR模型具有较低的RMSE和MAPE。结果表明，由于没有误差积累，直接多步预测具有较高的精度。

以上所揭露的仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或变型，都应涵盖在本发明的保护范围之内。

Claims

1.一种数据恢复方法，其特征在于，包括如下步骤：

构造传感器采集数据的集合

其中，

X′＝f(X,M,G′)

s.t.X*M＝X′*M

其中，X′表示对集合X进行恢复或补全后的结果，掩码M与数据集合X′对应，掩码M用于表示数据集合X中传感器采集的数据是否缺失，0表示缺失，1表示无缺失；

对数据集合X和掩码M进行堆叠，得到输入

其中1-M表示反掩码，即将掩码M中的0变换为1，1变换为0；

步骤4：利用所述时间特征提取模块对输入

进行时间特征提取，得到n+m个传感器节点的时间特征矩阵；

利用所述空间特征提取模块对输入

进行空间特征提取，得到n+m个传感器节点的空间特征矩阵；

步骤5：将所述步骤4中时间特征矩阵和空间特征矩阵进行拼接，利用注意力增强扩散卷积模块同时进行空间依赖和语义依赖的学习，得到传感器节点的新特征；每输入一层注意力增强扩散卷积层均得到一个新特征；

2.如权利要求1所述的数据恢复方法，其特征在于，所述步骤1中，设定阈值ε为0.5。

3.如权利要求1所述的数据恢复方法，其特征在于，所述步骤4中，时间特征提取模块为RG-TCN模型，所述RG-TCN模型包括线性层以及S个残差门控时间卷积层；每个残差门控时间卷积层是将时间卷积层的激活函数设置成门控线性单元而构成的。

4.如权利要求3所述的数据恢复方法，其特征在于，利用所述RG-TCN模型进行时间特征提取的具体实现过程为：

对所述输入

进行线性化处理；

H'_out＝tanh(W₁*H+b₁)⊙sigmoid(W₂*H+b₂) (a)

H_out＝H'_out+φ(H) (b)

5.如权利要求1所述的数据恢复方法，其特征在于，所述步骤4中，空间特征提取模块为基于注意力的空间模型，所述基于注意力的空间模型包括线性层、S个残差门控时间卷积层、扩散图卷积层以及注意力层；每个残差门控时间卷积层是将时间卷积层的激活函数设置成门控线性单元而构成的。

6.如权利要求5所述的数据恢复方法，其特征在于，利用所述基于注意力的空间模型进行空间特征提取的具体实现过程为：

对所述输入

进行线性化处理；

H'_out＝tanh(W₁*H+b₁)⊙sigmoid(W₂*H+b₂) (a)

H_out＝H'_out+φ(H) (b)

其中，

表示扩散图卷积层的输出，

表示扩散图卷积层的输入或n+m个传感器节点的时间特征，

表示第k扩散时的前向转移矩阵，

其中，

表示注意力层的输出或n+m个传感器节点的空间特征，EA()表示注意力层，M_k、M_v均表示可训练参数。

7.如权利要求1～6中任一项所述的数据恢复方法，其特征在于，所述步骤5中，传感器节点的新特征的具体计算公式为：

其中，

表示增强扩散卷积层的输出或传感器节点的新特征，α表示可学习参数，EA()表示表示空间特征提取模块中的注意力层，

表示空间特征提取模块中扩散图卷积层的输出，

表示第k扩散时的前向转移矩阵，

8.一种数据恢复系统，其特征在于，包括：

X′＝f(X,M,G′)

s.t.X*M＝X′*M

其中，

堆叠单元，用于对数据集合X和掩码M进行堆叠，得到输入

其中1-M表示反掩码，即将掩码M中的0变换为1，1变换为0；

所述时间特征提取模块，用于对输入

进行空间特征提取，得到n+m个传感器节点的空间特征矩阵；每层所述注意力增强扩散卷积层，用于对由时间特征矩阵和空间特征矩阵拼接后的矩阵同时进行空间依赖和语义依赖的学习，得到传感器节点的新特征；所述输出模块用于对每层注意力增强扩散卷积层得到的新特征进行拼接，再经过多层感知机线性化处理，输出得到补全后的传感器观测结果。

9.一种计算机设备，其特征在于，包括：存储器，用于存储计算机程序；处理器，用于执行所述计算机程序时实现如权利要求1～7中任一项所述数据恢复方法的步骤。

10.一种存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1～7中任一项所述数据恢复方法的步骤。