CN112988723A - 一种基于空间自注意力图卷积循环神经网络的交通数据修复方法 - Google Patents

一种基于空间自注意力图卷积循环神经网络的交通数据修复方法 Download PDF

Info

Publication number
CN112988723A
CN112988723A CN202110182167.4A CN202110182167A CN112988723A CN 112988723 A CN112988723 A CN 112988723A CN 202110182167 A CN202110182167 A CN 202110182167A CN 112988723 A CN112988723 A CN 112988723A
Authority
CN
China
Prior art keywords
data
model
missing
training
traffic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110182167.4A
Other languages
English (en)
Inventor
张勇
林锋
胡永利
尹宝才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202110182167.4A priority Critical patent/CN112988723A/zh
Publication of CN112988723A publication Critical patent/CN112988723A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于空间自注意力图卷积循环神经网络的交通数据修复方法,全连接层作为输入层将输入映射到一个高维空间提高模型的表达能力;双向图卷积门控循环单元是将门控循环单元中的全连接层替换为图卷积得到的,它能够同时建模局部空间相关性和时间相关性;多头空间自注意力模块用于捕获路网的隐含空间相关性,同时还能从全局聚合各个节点的信息;卷积层作为输出层用于对特征维度进行衰减。本发明利用图卷积建模局部空间相关性;利用门控循环单元学习交通数据的动态变化,捕获时间相关性;此外,考虑到交通状况受到许多潜在因素的影响,本发明采用多头空间自注意力机制从全局来建模交通数据的隐含空间相关性。

Description

一种基于空间自注意力图卷积循环神经网络的交通数据修复 方法
技术领域
本发明属于交通领域和深度学习领域,具体涉及缺失交通数据填充,尤其涉及一种基于空间自注意力图卷积循环神经网络的交通数据修复方法。
背景技术
近年来,由于传感器技术的进步,世界各国在路网中铺设了大量交通数据采集设备,例如地下感应线圈探测器、测速雷达等,经过长期的积累,已经拥有了海量的历史交通数据。交通数据的增加为智能交通系统提供了数据支撑。然而,由于传输噪声或设备故障等原因,交通数据经常会出现不同程度的缺失。感应线圈探测器是目前应用最广泛的交通传感器,其数据缺失率在5-10%之间,在某些情况下可能会达到25%,根据Tan等人的研究,在极端情况下,有可能出现90%的缺失率。交通数据的缺失不利于交通规划和管理。因此,如何设计一个合理的模型对这些缺失数据进行有效地填充是一个急需解决的问题。
在过去的十几年间,研究者们提出了各种模型对缺失的交通数据进行填充。早期的方法主要包括基于插值的方法、基于统计学的方法、基于机器学习的方法和基于矩阵和张量补全的方法。插值法利用同一传感器相邻天同一时间段或同一天相邻时段的数据来填补缺失数据。在大多数情况下,计算方法取已知数据的平均值。这种方法忽略了交通流数据的空间相关性,修复性能较差。统计学的方法侧重于从宏观角度分析数据的统计规律性,如马尔科夫链蒙特卡罗(MCMC)。统计学的方法首先需要建立概率分布模型,然后将历史数据作为模型的输入,在对模型参数进行训练的同时对缺失数据进行补全。这类方法的准确性高度依赖于概率分布模型,在不同的情况下,概率分布模型可能完全不同,很难确定最合适的分布模型。基于机器学习的方法中鲁棒性最强、应用最广泛的是k最近邻法,它利用整个数据集[15]中的k个最接近的数据点计算缺失值,这种方法不能够有效地建模交通数据的空间相关性,只适用于一些简单的交通数据缺失模式。另外一些具有代表性的机器学习方法有贝叶斯网络、支持向量回归等。这些方法只利用了缺失数据点之前那些时间点的数据,而且没有考虑空间相关性,在缺失率较高时填充效果较差。许多已有的研究表明,矩阵补全和张量补全能够提高填充性能。Qu等人提出了贝叶斯主成分分析(BPCA)方法来估计缺失交通数据,效果优于其他方法。Asif等人比较了许多估计缺失流量数据的矩阵补全算法的性能,如变分贝叶斯主成分分析(VBPCA)和函数主成分分析(FPCA)。相对于矩阵补全算法,张量补全算法在处理多维数据时表现出更好的性能,它可以通过高阶分解提取交通数据的时空特征。因此,常用张量补全方法来恢复缺失的交通数据。Bin 等人提出了一种低n秩张量补全算法来估计缺失的交通流数据,他们将交通数据重塑成四维张量,以充分利用其时空特征来估计交通数据中缺失的数据。Xie等人提出了一种动态顺序张量补全算法,利用以往的交通流数据来获得更准确的填充值。矩阵补全和张量补全虽然能够提取到交通数据的时空特征,但它们都需要根据原始数据预先指定核心张量的秩。实际上,要预先找到确切的秩是相当困难的。随着数据集的不同,秩也会发生变化。
最近几年,随着大量交通数据的积累,数据驱动的深度学习方法被广泛应用于交通领域。基于深度学习的交通数据填充方法主要是利用生成对抗网络(GAN) 来学习数据的分布。Wang等人提出基于生成对抗网络的路网交通流量数据补全方法,利用GAN网络实现对路网二维信息图缺失部分的补全。Yuan等人提出 ST-DCGAN模型,利用了DCGAN的思想,引入补全损失函数和判别损失函数作为模型新的目标函数,通过生成器和鉴别器相互博弈的原理学习区域流量数据之间的时空特征性,在常规的缺失数据补全的基础上利用数据生成思想进行了区域时序交通流数据的补全。Zhuang等人将AutoEncoder和GAN结合进行交通流缺失值的填充,他们将缺失值填充问题看作是图像修复问题。尽管这些方法与早期的方法相比性能有所提升,但它们都是采用卷积神经网络对交通数据的时空相关性进行建模时,而卷积神经网络只适用于欧式空间的数据,不能够有效地对路网复杂的拓扑空间关系进行建模。
交通数据复杂的时空特性给交通数据修复带来了巨大的挑战。目前交通数据修复中要解决的关键问题如何设计一个合理的模型在捕获时间相关性的同时能够有效地对路网的空间相关性进行建模。
发明内容
为了有效地对交通数据的时空相关性进行建模,本发明结合图卷积网络、循环神经网络和多头空间自注意力机制设计了一种空间自注意力图卷积循环网络用于填充缺失的交通数据。具体来说,该模型利用图卷积建模局部空间相关性;利用门控循环单元学习交通数据的动态变化,捕获时间相关性;此外,考虑到交通状况受到许多潜在因素(例如路段所属功能区)的影响,本发明采用多头空间自注意力机制从全局来建模交通数据的隐含空间相关性。
本发明提出一种空间自注意力图卷积循环神经网络SSAGCRN用于对缺失的交通数据进行填充。SSAGCRN的模型由全连接层FC,2层双向图卷积门控循环单元GCGRU,1个多头空间自注意力层MHSSA和2个1×1的卷积层构成。其中,全连接层作为输入层将输入映射到一个高维空间提高模型的表达能力;双向图卷积门控循环单元是将门控循环单元中的全连接层替换为图卷积得到的,它能够同时建模局部空间相关性和时间相关性;多头空间自注意力模块用于捕获路网的隐含空间相关性,同时还能从全局聚合各个节点的信息;2个1×1的卷积层作为输出层用于对特征维度进行衰减。
本发明所提出方法的具体步骤如下:
S1数据预处理
本发明在METR-LA数据集上进行实验。METR-LA数据集包含传感器的交通速度数据。原始数据包括两部分,一部分是交通速度数据,另一部分是各个传感器之间的距离。数据预处理包括训练、验证和测试样本的制作以及图的构建。
S1.1训练、验证和测试样本的制作
为了使训练过程更加稳定首先对原始交通速度数据进行归一化处理:
Figure RE-GDA0003032177730000031
其中m是原始数据X的平均值,σx是原始数据X的标准差,X'是归一化后的数据。然后将归一化后的数据按8:1:1的比例切分成训练集、验证集、测试集3部分。对切分后的3部分分别采用时间窗口滑动的方式切割得到训练样本、验证样本和测试样本。训练样本用于训练模型,验证样本是在训练过程中评估模型的性能是否在提升,如果不再提升就停止训练。测试样本是在训练完成对模型性能进行评估。
S1.2掩膜的生成
掩膜是一种二值矩阵或张量,它的元素为0或1,用于指示该位置是否缺失, 0表示缺失,1表示未缺失。将它与完整的交通数据作哈达玛乘积可以得到缺失数据。交通数据的缺失模式可以分为完全随机缺失(图2(a))、随机缺失(图2(b)和图2(c))、非随机缺失(图2(d))3种。它们都可以通过程序生成,伪代码如下:
Figure RE-GDA0003032177730000041
Figure RE-GDA0003032177730000051
Figure RE-GDA0003032177730000061
Figure RE-GDA0003032177730000071
S1.3图的构建
图的构建即邻接矩阵的构建,邻接矩阵在图卷积中会用到。原始数据是传感器之间的距离,本发明采用阈值高斯核函数进行处理得到邻接矩阵,即
Figure RE-GDA0003032177730000072
其中,di,j表示节点vi和vj之间的距离,σd表示各节点间距离的标准差,ε是设定的阈值。
S2 SSAGCRN模型构建
基于图卷积的交通流数据修复是利用各个路段(或站点)的相邻路段(或站点) 在各个时间段已知的交通数据对缺失的交通数据进行填充,从而得到完整的交通数据。它可以定义为:
Figure RE-GDA0003032177730000073
Figure RE-GDA0003032177730000074
其中,
Figure RE-GDA0003032177730000081
是缺失的交通数据;M是掩膜,用于指示哪些地方是缺失的(为0的地方表示缺失,为1的地方表示没有缺失);G是路网的拓扑图;f是交通数据修复模型;X'是模型的输出,X是修复后的完整交通数据,⊙表示哈达玛乘积。因此,交通数据修复问题可以描述为:给定缺失的交通数据
Figure RE-GDA0003032177730000082
掩膜M以及路网的拓扑图G,需要找到一个函数f(即交通数据修复模型)将它们映射为X',然后取出X'中对应于
Figure RE-GDA0003032177730000083
中缺失的部分并粘贴到
Figure RE-GDA0003032177730000086
中缺失的部分得到完整的交通数据X。交通数据修复的关键问题是对时空相关性进行建模,本发明提出的空间自注意力图卷积循环神经网络采用3个核心组件来建模时空相关性,分别是:图卷积(GCN)、多头空间自注意力机制(MHSSA)和门控循环单元(GRU)。其中GCN和MHSSA分别用于建模局部空间相关性和全局空间相关性,GRU用于建模时间相关性。下面对这些组件分别进行详细的描述。
S2.1时间相关性建模
交通数据是一种时间序列,目前,在处理时间序列数据方面应用最广泛的是循环神经网络(RNN)。然而,传统的循环神经网络由于存在梯度消失、梯度爆炸等缺陷,在长期预测方面存在局限性。LSTM模型和GRU模型是循环神经网络的变种,已经被证明可以解决上述问题。LSTM和GRU的基本原理大致相同。它们都使用门控机制来记忆尽可能多的长期信息,并且对各种任务都同样有效。但是,由于LSTM模型结构复杂,训练时间较长,而GRU模型的输入门和遗忘门采用一种联动机制,相比于LSTM减少了一个门,结构相对简单,参数较少,训练速度较快。因此,本发明采用GRU模型来获取交通数据的时间相关性。
如图3所示,ht-1为t-1时刻的隐含状态;xt为t时刻的输入;
Figure RE-GDA0003032177730000084
为t时刻存储的记忆内容;ht为t时刻的隐含状态;rt为复位门,用于控制需要保留多少之前的记忆;zt是更新门,用来控制需要从前一时刻的隐含状态ht-1中遗忘多少信息以及需要引入多少t时刻存储的记忆内容
Figure RE-GDA0003032177730000085
GRU以t-1时刻的隐藏状态和当前的交通信息作为输入,获得t时刻的交通信息,该模型在捕捉当前时刻交通信息的同时,仍然保留了历史交通信息的变化趋势,具有捕捉时间相关性的能力。 GRU的复位门和更新门的计算方式以及隐含状态的更新方式如下:
rt=σ(Wr[xt,ht-1]+br) (3)
zt=σ(Wz[xt,ht-1]+bz) (4)
Figure RE-GDA0003032177730000091
Figure RE-GDA0003032177730000092
其中,σ表示sigmoid激活函数,[]表示拼接操作,tanh表示双曲正切函数,⊙表示哈达玛乘积,Wr,br,Wz,bz,W,b是可学习的权重和偏置。
S2.2空间相关性建模:
近年来,图卷积被广泛应用于交通预测中来建模空间相关性,图卷积是基于路段的连通性来聚合节点信息,然而路网中各路段之间的空间相关性是非常复杂的。一个路段的交通状况不仅受到与其在空间上连通的路段的影响,同时还受其他因素(如路段所属功能区)的影响。另外,由于图卷积只能堆叠有限层,因此只能聚合有限范围内的邻居节点信息。考虑到这两点,本发明从两方面来建模空间相关性:利用GCN建模局部空间相关性,即根据路段之间的连通性从局部来聚合邻居节点信息。利用多头空间自注意力机制建模全局空间相关性,即根据不同路段交通状况的模式相似性从全局来聚合所有节点信息,能捕获到路网的隐含空间相关性。
(1)局部空间相关性建模
为了捕获局部空间相关性,本发明采用基于谱的图卷积(GCN)聚合邻居节点的信息。给定邻接矩阵和特征矩阵,基于谱的图卷积在傅里叶域中构造一个滤波器。作用于图节点上的滤波器通过聚合邻居节点间的空间特征来更新节点特征,它可以表示为:
Figure RE-GDA0003032177730000093
其中,
Figure RE-GDA0003032177730000094
表示邻接矩阵考虑自连接得到的矩阵,IN表示单位矩阵,
Figure RE-GDA0003032177730000095
是度矩阵,
Figure RE-GDA0003032177730000096
H(l)表示第l层的输出,θ(l)表示第l层的参数,σ表示sigmoid 激活函数。这种图卷积层可以聚合1跳邻居的信息。可以通过堆叠多个图卷积层来扩大感受野。
为了同时捕获时间相关性和局部空间相关性,本发明将GCN与GRU相结合,考虑到模型复杂度的问题,本发明并没有直接将GCN和GRU组合起来,而是用GCN替代GRU中的全连接层得到图卷积门控循环单元GCGRU,即用式 (7)替代式(3)-(5)中的全连接层,若用f表示式(7),则式(3)-(5)变为:
rt=σ(f1([xt,ht-1],A)) (8)
zt=σ(f2([xt,ht-1],A)) (9)
Figure RE-GDA0003032177730000101
式(8)-(10)中的f1,f2,f3表示3组独立的图卷积,在模型训练完成后它们的权重是不同的。考虑到某个时间点的交通数据与它前面那些时间点以及后面那些时间点都相关,因此本发明采用双向GCGRU分别在时间维以顺序和逆序,依次处理输入序列,并将每个时间步GCGRU cell的输出拼接后经过全连接层映射后得到最终的输出。这样每个时间步的输出都包含了输入序列中当前时刻完整的过去和未来的上下文信息。
(2)全局空间相关性
为了从全局建模空间相关性,同时考虑到路网中存在着隐含的空间相关性,本发明采用空间自注意力机制来聚合节点信息。空间自注意力机制示意图如图4 所示,它包括以下几个步骤:
1)对每个节点的特征向量用3个不同的矩阵WQ,WK,WV进行变换,得到3个向量Query,Key,Value
2)将每个节点的Query向量与所有节点的Key向量作内积,并经过softmax变换得到该节点与所有节点的Attention Score,为了使得训练时梯度更加稳定,在进行softmax变换之前先除以一个缩放因子
Figure RE-GDA0003032177730000102
避免进入softmax函数梯度较小的区域,其中dk表示Query和Key的维度。
3)根据该节点与所有节点的注意力分数(Attention Score)对各个节点的Value向量进行加权求和。
如果用X∈RN×d表示N个节点的特征向量构成的矩阵,那么自注意力机制可以简单的表示为矩阵相乘的形式:
Q=XWQ
(11)
K=XWK
(12)
V=XWV (13)
Figure RE-GDA0003032177730000111
值得注意的是,空间自注意力机制是在空间维度聚合节点信息,对于输入时间序列,不同时间步之间参数是共享的。
为了提高模型的的表达能力,本发明采用多头空间自注意力机制(MHSSA),它能够同时在多个不同的特征子空间聚合信息,不同的子空间表达了不同的隐含空间相关性。多头空间自注意力机制是通过将Query,Key,Value进行多次线性映射,得到多组不同的子空间表示,然后在每一组上执行注意力机制,然后将它们拼接起来再做一次线性映射得到最终结果,空间多头自注意力机制可以用下式表达:
Figure RE-GDA0003032177730000112
Multiheadi(Q,K,V)=Concat(head1,head2,…,headh)WO (16)
S2.3损失函数
损失函数即模型训练时需要优化的目标函数,为了使得模型专注于填充缺失值,避免模型学习已知区域不必要的恒等映射,本发明采用masked-MAE loss作为损失函数,定义如下:
L(θ)=||(Y-X)⊙(1-M)||1 (17)
其中,X表示模型补全结果,Y是真实值,M是掩膜,θ表示模型中所有可学习的参数。
S3训练和验证
模型的训练就是通过优化损失函数不断迭代更新模型的可学习参数。训练时首先在训练集中取一个批次(batchsize)的完整数据,然后随机生成一个批次的掩膜(缺失模式和缺失率都是随机的),将掩膜和完整数据作哈达玛乘积得到缺失数据,将缺失数据和邻接矩阵输入到模型中,利用掩膜将模型输出中对应于输入中缺失的那部分粘贴到输入数据中得到补全的数据。根据定义的损失函数计算补全的数据和真实值之间的误差,然后反向传播更新模型的可学习参数,这样就完成了一次迭代。当训练集中的数据取完后就完成了一轮训练过程。
每训练完一轮就在验证集上验证模型模型性能。即每次从验证集中取出一个批次的完整数据,然后随机生成一个批次的掩膜,将掩膜和完整数据作哈达玛乘积得到缺失数据,将缺失数据和邻接矩阵输入到模型中,利用掩膜将模型输出中对应于输入中缺失的那部分粘贴到输入数据中得到补全的数据,然后计算损失,当验证集中的数据取完后计算本轮的平均损失,然后与上一轮对比,如果平均损失没有下降则停止训练并保存训练好的模型,否则继续下一轮训练。
S4测试
模型训练完成后在测试集上对模型性能进行评估,加载训练过程中保存的模型,随机生成一批掩膜与测试数据作哈达玛乘积得到缺失数据并输入到模型,利用掩膜将模型输出中对应于输入中缺失的那部分粘贴到输入数据中得到补全的数据。然后对补全的数据进行反归一化:
Figure RE-GDA0003032177730000121
其中,
Figure RE-GDA0003032177730000122
是修复结果,σ和m分别表示样本标准差和平均值,
Figure RE-GDA0003032177730000123
表示反归一化后的结果。然后计算平均绝对误差MAE和均方根误差RMSE 2种性能指标。2种性能指标定义如下:
Figure RE-GDA0003032177730000124
Figure RE-GDA0003032177730000125
与现有技术相比,本发明具有以下优点:
(1)双向GRU能够在时间维度上提取上下文信息,对路网的时间相关性进行建模
(2)图卷积能够基于路网的拓扑结构聚合节点信息,从局部建模路网的空间相关性。
(3)空间多头自注意力机制能够根据输入数据中各个节点的特征学习到节点之间的隐含空间相关性,由于空间自注意力集中聚合了所有节点的信息,因此它也能够从全局建模空间相关性。
附图说明
图1 SSAGCRN模型结构。
图2交通数据的各种缺失模式。
图3 GRU内部结构。
图4空间自注意力机制。
图5完全随机缺失模式下MAE对比结果。
图6完全随机缺失模式下RMSE对比结果。
图7随机缺失模式(图2b)下MAE对比结果。
图8随机缺失模式(图2b)下RMSE对比结果。
图9随机缺失模式(图2c)下MAE对比结果。
图10随机缺失模式(图2c)下RMSE对比结果。
图11非随机缺失模式下MAE对比结果。
图12非随机缺失模式下RMSE对比结果。
具体实施方式
本发明所提出方法的具体步骤如下:
S1数据预处理
根据发明内容中S1.1所述方法对原始交通数据进行归一化,然后将归一化后的数据按8:1:1的比例切分成3部分。对切分后的3部分分别采用窗口滑动的方式沿着时间维度滑动得到训练集、验证集和测试集。其中,滑动窗的宽度取 12,对于训练集时间窗口滑动步长为1,对于验证集和测试集时间窗口滑动步长为12。根据发明内容中S1.2所述方法生成掩膜,根据发明内容中S1.3所述构建邻接矩阵。
S2构建模型
根据发明内容S2所述方法构建模型,模型中涉及到的超参数有batchsize、输入时间序列长度、节点数、GCGRU的输入特征维度和隐含状态维度、多头空间自注意力层的输入维度、key和value的维度以及head的数量。batchsize可根据GPU显存大小设置,本发明实验中设置为32;由于在制作样本时序列长度取 12,因此输入时间序列长度应该设置为12;节点数取决于数据集,由于METR-LA 数据集包含207个传感器的数据,因此节点数应该设置为207;GCGRU的输入特征维度和隐含状态维度、多头空间自注意力层的输入维度、key和value的维度以及head的数量可以根据实验效果调整,在本发明中,经过多次调整后确定的一组较好的参数为:GCGRU的输入特征维度和隐含状态维度分别取16、128,多头自注意力模块的输入维度、key和value的维度、head的数量分别取128、 400、400、8。
S3训练和验证
将S1中预处理得到的训练样本与掩膜作哈达玛乘积得到缺失的数据,将缺失数据和S1中构建的邻接矩阵输入到S2中构建好的模型中得到输出,然后根据发明内容中S2中的公式(3)得到补全后的结果。根据补全结果和真实值按发明内容S2.3中定义的损失函数计算损失,然后反向传播迭代更新模型的可学习参数。
每训练完一轮时,将S1中预处理得到的验证样本与掩膜作哈达玛乘积得到缺失的数据,将缺失数据和S1中构建的邻接矩阵输入到S2中构建好的模型中得到输出,然后根据发明内容中S2中的公式(3)得到补全后的结果,据补全结果和真实值按发明内容S2.3中定义的损失函数计算损失,将本轮在验证集上的损失与上一轮作比较,如果连续多次(验时设置为20)不下降就停止训练,并保存训练好的模型,否则继续下一轮训练。
训练时采用Adam优化器,初始学习率设置为0.001,并且每训练15轮衰减为原来的80%,训练轮数设置为300。
S2.4测试
模型训练完成后加载训练过程中保存的模型,将S1中预处理得到的测试样本和掩膜作哈达玛乘积得到缺失数据,将缺失数据和S1中构建的邻接矩阵输入到S2中构建好的模型中得到输出,然后根据发明内容中S2中的公式(3)得到补全后的结果,然后根据发明内容S4中的公式(18)对补全后的结果进行反归一化。最后根据发明内容S4中的公式(19)和公式(20)计算平均绝对误差MAE和均方根误差RMSE 2种性能指标。
对本发明所达到的技术效果给予描述,该技术效果至少应该解决上述发明目的中提出的技术问题。
本发明与TNN-DCT、LRTC-TNN、LATC-TNN、LATC-Tubal这4种方法在不失率(10%~60%)下进行了对比,在4种缺失模式下的实验结果如图5-图12所示。从实验结果可以看到,在不同缺失模式和不同缺失率下,本发明在平均绝对误差MAE和均方根误差RMSE两方面与其他方法相比都有极大的提升。

Claims (4)

1.一种基于空间自注意力图卷积循环神经网络的交通数据修复方法,其特征在于:该方法的具体步骤如下:
S1数据预处理
在METR-LA数据集上进行实验;METR-LA数据集包含传感器的交通速度数据;原始数据包括两部分,一部分是交通速度数据,另一部分是各个传感器之间的距离;数据预处理包括训练、验证和测试样本的制作以及图的构建;
S2 SSAGCRN模型构建
基于图卷积的交通流数据修复是利用各个路段或站点的相邻路段或站点,在各个时间段已知的交通数据对缺失的交通数据进行填充,从而得到完整的交通数据;定义为:
Figure FDA0002941732800000011
Figure FDA0002941732800000012
其中,
Figure FDA0002941732800000013
是缺失的交通数据;M是掩膜,用于指示哪些地方是缺失的;G是路网的拓扑图;f是交通数据修复模型;X′是模型的输出,X是修复后的完整交通数据,⊙表示哈达玛乘积;交通数据修复问题描述为:给定缺失的交通数据
Figure FDA0002941732800000014
掩膜M以及路网的拓扑图G,需要找到一个函数f即交通数据修复模型,映射为X′,然后取出X′中对应于
Figure FDA0002941732800000015
中缺失的部分并粘贴到
Figure FDA0002941732800000016
中缺失的部分得到交通数据X;交通数据修复的关键问题是对时空相关性进行建模,空间自注意力图卷积循环神经网络采用3个核心组件来建模时空相关性,分别是:图卷积GCN、多头空间自注意力机制MHSSA和门控循环单元GRU;其中GCN和MHSSA分别用于建模局部空间相关性和全局空间相关性,GRU用于建模时间相关性;
S3训练和验证
模型的训练就是通过优化损失函数不断迭代更新模型的可学习参数;训练时,在训练集中取一个批次的完整数据,然后随机生成一个批次的掩膜,将掩膜和完整数据作哈达玛乘积得到缺失数据,将缺失数据和邻接矩阵输入到模型中,利用掩膜将模型输出中对应于输入中缺失的那部分粘贴到输入数据中得到补全的数据;根据定义的损失函数计算补全的数据和真实值之间的误差,然后反向传播更新模型的可学习参数,这样就完成了一次迭代;当训练集中的数据取完后就完成了一轮训练过程;
每训练完一轮就在验证集上验证模型模型性能;即每次从验证集中取出一个批次的完整数据,然后随机生成一个批次的掩膜,将掩膜和完整数据作哈达玛乘积得到缺失数据,将缺失数据和邻接矩阵输入到模型中,利用掩膜将模型输出中对应于输入中缺失的那部分粘贴到输入数据中得到补全数据,然后计算损失,当验证集中的数据取完后计算本轮的平均损失,然后与上一轮对比,如果平均损失没有下降则停止训练并保存训练好的模型,否则继续下一轮训练;
S4测试
模型训练完成后在测试集上对模型性能进行评估,加载训练过程中保存的模型,随机生成一批掩膜与测试数据作哈达玛乘积得到缺失数据并输入到模型,利用掩膜将模型输出中对应于输入中缺失的那部分粘贴到输入数据中得到补全的数据;然后对补全的数据进行反归一化:
Figure FDA0002941732800000021
其中,
Figure FDA0002941732800000022
是修复结果,σ和m分别表示样本标准差和平均值,
Figure FDA0002941732800000023
表示反归一化后的结果,计算平均绝对误差MAE和均方根误差RMSE 2种性能指标。
2.根据权利要求1所述的一种基于空间自注意力图卷积循环神经网络的交通数据修复方法,其特征在于:数据预处理过程如下,S1.1训练、验证和测试样本的制作
对原始交通速度数据进行归一化处理:
Figure FDA0002941732800000024
其中m是原始数据X的平均值,σx是原始数据X的标准差,X′是归一化后的数据;然后将归一化后的数据按8:1:1的比例切分成训练集、验证集、测试集3部分;对切分后的3部分分别采用时间窗口滑动的方式切割得到训练样本、验证样本和测试样本;训练样本用于训练模型,验证样本是在训练过程中评估模型的性能是否在提升,如果不再提升就停止训练;测试样本是在训练完成对模型性能进行评估;
S1.2掩膜的生成
掩膜是一种二值矩阵或张量,它的元素为0或1,用于指示该位置是否缺失,0表示缺失,1表示未缺失,与完整的交通数据作哈达玛乘积得到缺失数据;交通数据的缺失模式分为完全随机缺失、随机缺失和非随机缺失3种;
S1.3图的构建
图的构建即邻接矩阵的构建,邻接矩阵在图卷积中会用到;原始数据是传感器之间的距离,采用阈值高斯核函数进行处理得到邻接矩阵,即
Figure FDA0002941732800000031
其中,di,j表示节点vi和vj之间的距离,σd表示各节点间距离的标准差,ε是设定的阈值。
3.根据权利要求1所述的一种基于空间自注意力图卷积循环神经网络的交通数据修复方法,其特征在于:S2的具体实施步骤如下,
S2.1时间相关性建模
采用GRU模型来获取交通数据的时间相关性;
ht-1为t-1时刻的隐含状态;xt为t时刻的输入;
Figure FDA0002941732800000032
为t时刻存储的记忆内容;ht为t时刻的隐含状态;rt为复位门;zt是更新门,用来控制需要从前一时刻的隐含状态ht-1中遗忘多少信息以及需要引入多少t时刻存储的记忆内容
Figure FDA0002941732800000033
GRU以t-1时刻的隐藏状态和当前的交通信息作为输入,获得t时刻的交通信息;GRU的复位门和更新门的计算方式以及隐含状态的更新方式如下:
rt=σ(Wr[xt,ht-1]+br) (3)
zt=σ(Wz[xt,ht-1]+bz) (4)
Figure FDA0002941732800000034
Figure FDA0002941732800000035
其中,σ表示sigmoid激活函数,[]表示拼接操作,tanh表示双曲正切函数,⊙表示哈达玛乘积,Wr,br,Wz,bz,W,b是可学习的权重和偏置;
S2.2空间相关性建模:
利用GCN建模局部空间相关性,即根据路段之间的连通性从局部来聚合邻居节点信息;利用多头空间自注意力机制建模全局空间相关性,即根据不同路段交通状况的模式相似性从全局来聚合所有节点信息,能捕获到路网的隐含空间相关性;
(1)局部空间相关性建模
为捕获局部空间相关性,采用基于谱的图卷积GCN聚合邻居节点的信息;给定邻接矩阵和特征矩阵,基于谱的图卷积在傅里叶域中构造一个滤波器;作用于图节点上的滤波器通过聚合邻居节点间的空间特征来更新节点特征,表示为:
Figure FDA0002941732800000041
其中,
Figure FDA0002941732800000042
表示邻接矩阵考虑自连接得到的矩阵,IN表示单位矩阵,
Figure FDA0002941732800000043
是度矩阵,
Figure FDA0002941732800000044
H(l)表示第l层的输出,θ(l)表示第l层的参数,σ表示sigmoid激活函数;这种图卷积层聚合1跳邻居的信息;通过堆叠多个图卷积层来扩大感受野;
为了捕获时间相关性和局部空间相关性,将GCN与GRU相结合,用GCN替代GRU中的全连接层得到图卷积门控循环单元GCGRU,即用式(7)替代式(3)-(5)中的全连接层,若用f表示式(7),则式(3)-(5)变为:
rt=σ(f1([xt,ht-1],A)) (8)
zt=σ(f2([xt,ht-1],A)) (9)
Figure FDA0002941732800000045
式(8)-(10)中的f1,f2,f3表示3组独立的图卷积;采用双向GCGRU分别在时间维以顺序和逆序,依次处理输入序列,并将每个时间步GCGRU cell的输出拼接后经过全连接层映射后得到最终的输出;这样每个时间步的输出都包含了输入序列中当前时刻完整的过去和未来的上下文信息;
(2)全局空间相关性
为了从全局建模空间相关性,同时考虑到路网中存在着隐含的空间相关性,采用空间自注意力机制来聚合节点信息;空间自注意力机制包括以下几个步骤:
1)对每个节点的特征向量用3个不同的矩阵WQ,WK,WV进行变换,得到3个向量Query,Key,Value;
2)将每个节点的Query向量与所有节点的Key向量作内积,并经过softmax变换得到该节点与所有节点的Attention Score,为了使得训练时梯度更加稳定,在进行softmax变换之前先除以一个缩放因子
Figure FDA0002941732800000051
避免进入softmax函数梯度较小的区域,其中dk表示Query和Key的维度;
3)根据该节点与所有节点的注意力分数Attention Score对各个节点的Value向量进行加权求和;
如果用X∈RN×d表示N个节点的特征向量构成的矩阵,那么自注意力机制表示为矩阵相乘的形式:
Q=XWQ (11)
K=XWK (12)
V=XWV (13)
Figure FDA0002941732800000052
4.根据权利要求3所述的一种基于空间自注意力图卷积循环神经网络的交通数据修复方法,其特征在于:采用多头空间自注意力机制MHSSA,能够同时在多个不同的特征子空间聚合信息,不同的子空间表达不同的隐含空间相关性;多头空间自注意力机制是通过将Query,Key,Value进行多次线性映射,得到多组不同的子空间表示,然后在每一组上执行注意力机制,然后拼接起来再做一次线性映射得到最终结果,空间多头自注意力机制用下式表达:
Figure FDA0002941732800000053
Multiheadi(Q,K,V)=Concat(head1,head2,…,headh)WO (16)
S2.3损失函数
损失函数即模型训练时需要优化的目标函数,为了使模型专注于填充缺失值,避免模型学习已知区域不必要的恒等映射,采用masked-MAE loss作为损失函数,定义如下:
L(θ)=||(Y-X)⊙(1-M)||1 (17)
其中,X表示模型补全结果,Y是真实值,M是掩膜,θ表示模型中所有可学习的参数。
CN202110182167.4A 2021-02-09 2021-02-09 一种基于空间自注意力图卷积循环神经网络的交通数据修复方法 Pending CN112988723A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110182167.4A CN112988723A (zh) 2021-02-09 2021-02-09 一种基于空间自注意力图卷积循环神经网络的交通数据修复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110182167.4A CN112988723A (zh) 2021-02-09 2021-02-09 一种基于空间自注意力图卷积循环神经网络的交通数据修复方法

Publications (1)

Publication Number Publication Date
CN112988723A true CN112988723A (zh) 2021-06-18

Family

ID=76392965

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110182167.4A Pending CN112988723A (zh) 2021-02-09 2021-02-09 一种基于空间自注意力图卷积循环神经网络的交通数据修复方法

Country Status (1)

Country Link
CN (1) CN112988723A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505536A (zh) * 2021-07-09 2021-10-15 兰州理工大学 一种优化的基于时空图卷积网络的交通流预测模型
CN113554105A (zh) * 2021-07-28 2021-10-26 桂林电子科技大学 一种基于时空融合的物联网缺失数据补全方法
CN113642319A (zh) * 2021-07-29 2021-11-12 北京百度网讯科技有限公司 文本处理方法、装置、电子设备及存储介质
CN113868313A (zh) * 2021-10-15 2021-12-31 天津大学 基于双向图卷积循环神经网络的不完整时空数据预测方法
CN114004421A (zh) * 2021-11-17 2022-02-01 湖南大学 一种基于时空集成学习的交通数据缺失值插补方法
CN114004330A (zh) * 2021-09-26 2022-02-01 苏州浪潮智能科技有限公司 一种基于特征值补全的推荐系统及方法
CN114743375A (zh) * 2022-04-08 2022-07-12 杭州电子科技大学 一种基于机器视觉融合路网时空信息的交通流预测方法
CN114764858A (zh) * 2022-06-15 2022-07-19 深圳大学 复制粘贴图像识别方法、装置、计算机设备及存储介质
CN114972082A (zh) * 2022-05-13 2022-08-30 天津大学 一种对高比例负荷缺失数据的恢复与评估方法
CN115376318A (zh) * 2022-08-22 2022-11-22 重庆邮电大学 一种基于多属性融合神经网络的交通数据补偿方法
CN115440029A (zh) * 2022-07-29 2022-12-06 重庆大学 一种考虑检测设备分布的车检器数据修复方法
CN116110588A (zh) * 2022-05-10 2023-05-12 北京理工大学 基于动态邻接矩阵和时空注意力的医学时间序列预测方法
CN116205383A (zh) * 2023-05-05 2023-06-02 杭州半云科技有限公司 一种基于元学习的静态动态协同图卷积交通预测方法
CN116244281A (zh) * 2022-09-28 2023-06-09 北京百度网讯科技有限公司 车道交通流量数据补全及其模型训练方法、装置
CN116451006A (zh) * 2023-06-12 2023-07-18 湖南大学 基于增强型时序模式注意力的pmu数据恢复方法及系统
CN117576918A (zh) * 2024-01-17 2024-02-20 四川国蓝中天环境科技集团有限公司 一种基于多源数据的城市道路流量全域预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109754605A (zh) * 2019-02-27 2019-05-14 中南大学 一种基于注意力时态图卷积网络的交通预测方法
US20190180612A1 (en) * 2016-08-15 2019-06-13 University Of Southern California Latent space model for road networks to predict time-varying traffic
CN112241814A (zh) * 2020-10-20 2021-01-19 河南大学 一种基于强化时空图神经网络的交通预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190180612A1 (en) * 2016-08-15 2019-06-13 University Of Southern California Latent space model for road networks to predict time-varying traffic
CN109754605A (zh) * 2019-02-27 2019-05-14 中南大学 一种基于注意力时态图卷积网络的交通预测方法
CN112241814A (zh) * 2020-10-20 2021-01-19 河南大学 一种基于强化时空图神经网络的交通预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LI YANG 等: "A Novel Satellite Network Traffic Prediction Method Based on GCN-GRU", THE 12TH INTERNATIONAL CONFERENCE ON WIRELESS COMMUNICATIONS AND SIGNAL PROCESSING, pages 718 - 723 *
冯宁 等: "面向交通流量预测的多组件时空图卷积网络", 软件学报, vol. 30, no. 3, pages 759 - 769 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505536A (zh) * 2021-07-09 2021-10-15 兰州理工大学 一种优化的基于时空图卷积网络的交通流预测模型
CN113554105B (zh) * 2021-07-28 2023-04-18 桂林电子科技大学 一种基于时空融合的物联网缺失数据补全方法
CN113554105A (zh) * 2021-07-28 2021-10-26 桂林电子科技大学 一种基于时空融合的物联网缺失数据补全方法
CN113642319A (zh) * 2021-07-29 2021-11-12 北京百度网讯科技有限公司 文本处理方法、装置、电子设备及存储介质
CN114004330A (zh) * 2021-09-26 2022-02-01 苏州浪潮智能科技有限公司 一种基于特征值补全的推荐系统及方法
CN114004330B (zh) * 2021-09-26 2023-11-14 苏州浪潮智能科技有限公司 一种基于特征值补全的推荐系统及方法
CN113868313A (zh) * 2021-10-15 2021-12-31 天津大学 基于双向图卷积循环神经网络的不完整时空数据预测方法
CN113868313B (zh) * 2021-10-15 2024-05-17 天津大学 基于双向图卷积循环神经网络的不完整时空数据预测方法
CN114004421A (zh) * 2021-11-17 2022-02-01 湖南大学 一种基于时空集成学习的交通数据缺失值插补方法
CN114004421B (zh) * 2021-11-17 2024-05-10 湖南大学 一种基于时空集成学习的交通数据缺失值插补方法
CN114743375B (zh) * 2022-04-08 2023-09-15 杭州电子科技大学 一种基于机器视觉融合路网时空信息的交通流预测方法
CN114743375A (zh) * 2022-04-08 2022-07-12 杭州电子科技大学 一种基于机器视觉融合路网时空信息的交通流预测方法
CN116110588B (zh) * 2022-05-10 2024-04-26 北京理工大学 基于动态邻接矩阵和时空注意力的医学时间序列预测方法
CN116110588A (zh) * 2022-05-10 2023-05-12 北京理工大学 基于动态邻接矩阵和时空注意力的医学时间序列预测方法
CN114972082A (zh) * 2022-05-13 2022-08-30 天津大学 一种对高比例负荷缺失数据的恢复与评估方法
CN114764858A (zh) * 2022-06-15 2022-07-19 深圳大学 复制粘贴图像识别方法、装置、计算机设备及存储介质
CN115440029A (zh) * 2022-07-29 2022-12-06 重庆大学 一种考虑检测设备分布的车检器数据修复方法
CN115440029B (zh) * 2022-07-29 2023-08-08 重庆大学 一种考虑检测设备分布的车检器数据修复方法
CN115376318A (zh) * 2022-08-22 2022-11-22 重庆邮电大学 一种基于多属性融合神经网络的交通数据补偿方法
CN115376318B (zh) * 2022-08-22 2023-12-29 中交投资(湖北)运营管理有限公司 一种基于多属性融合神经网络的交通数据补偿方法
CN116244281A (zh) * 2022-09-28 2023-06-09 北京百度网讯科技有限公司 车道交通流量数据补全及其模型训练方法、装置
CN116244281B (zh) * 2022-09-28 2023-11-21 北京百度网讯科技有限公司 车道交通流量数据补全及其模型训练方法、装置
CN116205383A (zh) * 2023-05-05 2023-06-02 杭州半云科技有限公司 一种基于元学习的静态动态协同图卷积交通预测方法
CN116451006A (zh) * 2023-06-12 2023-07-18 湖南大学 基于增强型时序模式注意力的pmu数据恢复方法及系统
CN116451006B (zh) * 2023-06-12 2023-08-25 湖南大学 基于增强型时序模式注意力的pmu数据恢复方法及系统
CN117576918B (zh) * 2024-01-17 2024-04-02 四川国蓝中天环境科技集团有限公司 一种基于多源数据的城市道路流量全域预测方法
CN117576918A (zh) * 2024-01-17 2024-02-20 四川国蓝中天环境科技集团有限公司 一种基于多源数据的城市道路流量全域预测方法

Similar Documents

Publication Publication Date Title
CN112988723A (zh) 一种基于空间自注意力图卷积循环神经网络的交通数据修复方法
CN109492822B (zh) 空气污染物浓度时空域关联预测方法
CN111666836B (zh) M-f-y型轻量化卷积神经网络的高分辨率遥感影像目标检测方法
CN108805188B (zh) 一种基于特征重标定生成对抗网络的图像分类方法
CN113053115B (zh) 一种基于多尺度图卷积网络模型的交通预测方法
Lipu et al. Artificial intelligence based hybrid forecasting approaches for wind power generation: Progress, challenges and prospects
CN111899510A (zh) 基于发散卷积和gat的智能交通系统流量短期预测方法及系统
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN113313947A (zh) 短期交通预测图卷积网络的路况评估方法
CN115618296A (zh) 一种基于图注意力网络的大坝监测时序数据异常检测方法
CN114944053B (zh) 一种基于时空超图神经网络的交通流预测方法
Zhang et al. Adaptive spatio-temporal graph convolutional neural network for remaining useful life estimation
CN112966853A (zh) 基于时空残差混合模型的城市路网短时交通流预测方法
CN113988263A (zh) 工业物联网边缘设备中基于知识蒸馏的空时预测方法
CN115376317B (zh) 一种基于动态图卷积和时序卷积网络的交通流预测方法
CN113947182A (zh) 基于双阶段堆叠图卷积网络的交通流预测模型构建方法
CN115935796A (zh) 一种基于时空异质的和同步的图卷积网络交通流预测方法
CN115660135A (zh) 基于贝叶斯方法和图卷积的交通流预测方法及系统
CN116248392A (zh) 一种基于多头注意力机制的网络恶意流量检测系统及方法
CN115828990A (zh) 融合自适应图扩散卷积网络的时空图节点属性预测方法
Chen et al. Short-term Wind Speed Forecasting Based on Singular Spectrum Analysis, Fuzzy C-Means Clustering, and Improved POABP
CN112651499A (zh) 一种基于蚁群优化算法和层间信息的结构化模型剪枝方法
CN117116045A (zh) 一种基于时空序列深度学习的交通流量预测方法及装置
CN115357862B (zh) 一种狭长空间中的定位方法
CN115564155A (zh) 一种分散式风电机组功率预测方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination