CN115512545A - 一种基于时空动态图卷积网络的交通速度预测方法 - Google Patents

一种基于时空动态图卷积网络的交通速度预测方法 Download PDF

Info

Publication number
CN115512545A
CN115512545A CN202211216552.7A CN202211216552A CN115512545A CN 115512545 A CN115512545 A CN 115512545A CN 202211216552 A CN202211216552 A CN 202211216552A CN 115512545 A CN115512545 A CN 115512545A
Authority
CN
China
Prior art keywords
convolution
dynamic
graph
time
spatio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211216552.7A
Other languages
English (en)
Other versions
CN115512545B (zh
Inventor
张文宇
尹祥
张帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Finance and Economics
Original Assignee
Zhejiang University of Finance and Economics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Finance and Economics filed Critical Zhejiang University of Finance and Economics
Priority to CN202211216552.7A priority Critical patent/CN115512545B/zh
Publication of CN115512545A publication Critical patent/CN115512545A/zh
Application granted granted Critical
Publication of CN115512545B publication Critical patent/CN115512545B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/052Detecting movement of traffic to be counted or controlled with provision for determining speed or overspeed

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于时空动态图卷积网络的交通速度预测方法,包括:采集交通网络图及交通网络图上各传感器节点多个时间点的交通状态,并将交通状态表示为图信号矩阵,图信号矩阵为对应于传感器节点和时间点的交通速度关系矩阵;基于交通网络图及其图信号矩阵,采用时空动态图卷积网络输出未来预设时段内交通速度的预测结果。本发明能够捕获传感器之间的深层依赖关系,提高交通速度预测的准确性。

Description

一种基于时空动态图卷积网络的交通速度预测方法
技术领域
本发明属于交通速度预测领域,具体涉及一种基于时空动态图卷积网络的交通速度预测方法。
背景技术
近年来,交通速度预测逐渐成为智能交通系统的一个重要组成部分。交通速度预测旨在通过分析交通网络中传感器的历史观测结果来预测未来一段时间内的交通速度。准确的交通速度预测可以帮助交通参与者合理规划路线以缓解交通拥堵。然而,由于交通数据中隐含了复杂的时空相关性,因此交通速度预测具有很大的挑战性:
(1)空间相关性。传感器部署在交通网络中,其观测不可避免地受到交通网络结构的限制。空间相关性受交通网络的拓扑结构和传感器之间的隐性依赖关系的影响(例如,区域功能相似性和交通模式相似性)。
(2)时间相关性。交通速度随时间动态变化,交通网络中当前时刻的交通速度与前一时刻的交通速度密切相关。同时,交通速度具有很强的周期性(例如,每天通常都有1到2个交通拥挤的高峰时段)。
(3)动态时空相关性。传感器之间的相关性不是固定的,其在不同的时间可能会有所不同。例如,偶发的交通事故和高峰时段的拥堵可能会导致相关性发生变化。同时,传感器之间的历史动态相关性对当前的交通网络也有很大的影响。例如,交通事故所造成的影响是一个拥堵传播过程。
为了应对上述挑战并提高交通预测的准确性,目前已经开展了很多研究,其中基于深度学习的研究方法受到了广泛关注。最近提出的一些基于图神经网络的时空模型证明了时空相关性建模的有效性。然而,以上模型立足静态视角来构建传感器之间的相关性,这与动态变化的时空依赖关系不一致。因此,为了适应交通数据高度动态的特性,一些研究通过生成动态图来反映动态变化的时空依赖关系。然而,现有的研究均忽略了动态图之间的时间依赖关系,不利于捕获到传感器之间的深层依赖关系(例如,交通事故的持续影响)。此外,传感器之间的相关性受到静态因素(例如,传感器之间的空间方位关系)和动态因素(例如,交通事故和恶劣天气)的影响。然而,现有的研究均未充分利用静态图和动态图,使得对空间依赖关系的提取不够充分,从而限制了目前针对交通速度预测的准确性。
发明内容
本发明的目的在于提供一种基于时空动态图卷积网络的交通速度预测方法,捕获传感器之间的深层依赖关系,提高交通速度预测的准确性。
为实现上述目的,本发明所采取的技术方案为:
一种基于时空动态图卷积网络的交通速度预测方法,所述基于时空动态图卷积网络的交通速度预测方法,包括:
采集交通网络图及交通网络图上各传感器节点多个时间点的交通状态,并将交通状态表示为图信号矩阵,所述图信号矩阵为对应于传感器节点和时间点的交通速度关系矩阵;
基于所述交通网络图及其图信号矩阵,采用时空动态图卷积网络输出未来预设时段内交通速度的预测结果;
其中,所述时空动态图卷积网络包括图生成器、时空动态图卷积模块组和输出模块,所述时空动态图卷积模块组包括顺序堆叠的L个时空动态图卷积模块和一个跳跃连接层,每个时空动态图卷积模块包含一个空间卷积层和一个时间门控卷积层,且上一个时空动态图卷积模块的输出作为下一个时空动态图卷积模块的输入,所述采用时空动态图卷积网络输出未来预设时段内交通速度的预测结果,包括:
所述图生成器根据上一时间段生成的历史动态图和图信号矩阵生成最新动态图;
所述时间门控卷积层根据图信号矩阵或上一层时空动态图卷积模块的输出得到时间特征,同时将所述时间特征输入至位于同一时空动态图卷积模块的空间卷积层;
所述空间卷积层基于时间门控卷积层输出的时间特征和所述图生成器输出的最新动态图,结合预定义的静态图得到空间特征,其中时间特征和空间特征的叠加作为时空动态图卷积模块的输出;
所述跳跃连接层聚合L个时空动态图卷积模块的时间特征和第L个时空动态图卷积模块的空间特征得到聚合特征,并将所述聚合特征输出至所述输出模块;
所述输出模块根据所述聚合特征得到未来预设时段内交通速度的预测结果。
以下还提供了若干可选方式,但并不作为对上述总体方案的额外限定,仅仅是进一步的增补或优选,在没有技术或逻辑矛盾的前提下,各可选方式可单独针对上述总体方案进行组合,还可以是多个可选方式之间进行组合。
作为优选,所述图生成器根据上一时间段生成的历史动态图和图信号矩阵生成最新动态图,包括:
将历史动态图和图信号矩阵输入扩散卷积,得到扩散卷积输出的向量;
取扩散卷积输出的向量在批量大小维度的平均张量,将平均张量与随机初始化的节点嵌入向量融合;
根据融合数据生成动态邻接矩阵,并对动态邻接矩阵执行稀疏化策略,得到最新动态图。
作为优选,所述根据融合数据生成动态邻接矩阵的计算公式如下:
Figure BDA0003875424870000031
其中,
Figure BDA0003875424870000032
表示添加了自环的动态邻接矩阵,ReLU(·)为激活函数,tanh(·)为双曲正切函数,α是控制激活函数饱和率的超参数,sigmoid(·)为sigmoid函数,Eh为融合后得到的包含历史动态图信息的节点嵌入向量,即融合数据,
Figure BDA0003875424870000033
为Eh的转置,IN是一个单位矩阵。
作为优选,所述时间门控卷积层根据图信号矩阵或上一层时空动态图卷积模块的输出得到时间特征,包括:
采用因果卷积将输入序列
Figure BDA0003875424870000034
映射至
Figure BDA0003875424870000035
其中N表示传感器节点的数量,M(l)是输入序列的长度,特别的,Y(1)为图信号矩阵,M(1)=T′,T′为图信号矩阵所包含交通状态的时间点数量,
Figure BDA0003875424870000036
Figure BDA0003875424870000037
分别为第l个时空动态图卷积模块的输入和输出通道数,Kt是因果卷积核的大小,
Figure BDA0003875424870000038
Figure BDA0003875424870000039
是第l个时空动态图卷积模块中因果卷积输出的二等分;
根据[A(l)B(l)]计算得到时间特征如下:
Figure BDA00038754248700000310
其中,
Figure BDA00038754248700000311
为第l个时空动态图卷积模块的时间门控卷积层输出的时间特征,σ(·)表示sigmoid函数,⊙表示哈达玛积,fr(·)表示残差函数,θ表示可学习的参数。
作为优选,所述空间卷积层基于时间门控卷积层输出的时间特征和所述图生成器输出的最新动态图,结合预定义的静态图得到空间特征,包括:
空间卷积层的静态分支将时间特征和预定义的静态图作为输入,应用扩散卷积提取交通网络中的静态特征;
空间卷积层的动态分支将时间特征和最新动态图作为输入,应用扩散卷积提取交通网络中的动态特征;
基于注意力机制融合所述静态特征和动态特征,得到空间卷积层输出的空间特征。
作为优选,所述空间卷积层的静态分支中包含两个扩散卷积,所述应用扩散卷积提取交通网络中的静态特征,包括:
Figure BDA0003875424870000041
Figure BDA0003875424870000042
其中,
Figure BDA0003875424870000043
表示第l个时空动态图卷积模块中空间卷积层的静态分支的第一个扩散卷积的输出,K表示扩散步数,
Figure BDA0003875424870000044
表示预定义的静态图的前向转移概率矩阵,
Figure BDA0003875424870000045
表示第l个时空动态图卷积模块的时间门控卷积层输出的时间特征,
Figure BDA0003875424870000046
表示预定义的静态图的后向转移概率矩阵,
Figure BDA0003875424870000047
表示第l个时空动态图卷积模块中空间卷积层的静态分支的第二个扩散卷积的输出,即提取的静态特征,
Figure BDA0003875424870000048
Figure BDA0003875424870000049
为可学习的参数。
作为优选,所述空间卷积层的动态分支中包含两个扩散卷积,所述应用扩散卷积提取交通网络中的动态特征,包括:
Figure BDA00038754248700000410
Figure BDA00038754248700000411
其中,
Figure BDA00038754248700000412
表示第l个时空动态图卷积模块中空间卷积层的动态分支的第一个扩散卷积的输出,
Figure BDA00038754248700000413
Figure BDA00038754248700000414
分别是最新动态图的前向转移概率矩阵和后向转移概率矩阵,
Figure BDA0003875424870000051
表示第l个时空动态图卷积模块中空间卷积层的动态分支的第二个扩散卷积的输出,即提取的动态特征,⊙表示哈达玛积,
Figure BDA0003875424870000052
Figure BDA0003875424870000053
Figure BDA0003875424870000054
为可学习的参数。
作为优选,所述基于注意力机制融合所述静态特征和动态特征,得到空间卷积层输出的空间特征,包括:
对于每个传感器节点vi,第l个时空动态图卷积模块中静态分支的注意力值可以表示为
Figure BDA0003875424870000055
Figure BDA0003875424870000056
其中,
Figure BDA0003875424870000057
是输出值
Figure BDA0003875424870000058
中传感器节点vi的展平化特征,tanh(·)为双曲正切函数,Ws1和Ws2是可学习的参数,bs表示偏差;
同理可以得到传感器节点vi在第l个时空动态图卷积模块中动态分支注意力值
Figure BDA0003875424870000059
Figure BDA00038754248700000510
其中,
Figure BDA00038754248700000511
是输出值
Figure BDA00038754248700000512
中传感器节点vi的展平化特征,Wd1和Wd2是可学习的参数,bd表示偏差;
然后通过softmax函数对注意力值
Figure BDA00038754248700000513
Figure BDA00038754248700000514
进行归一化,如公式所示:
Figure BDA00038754248700000515
Figure BDA00038754248700000516
其中,
Figure BDA00038754248700000517
表示传感器节点vi在第l个时空动态图卷积模块中静态分支注意力权重,
Figure BDA00038754248700000518
表示传感器节点vi在第l个时空动态图卷积模块中动态分支注意力权重;
则最终计算得到的空间特征如下:
Figure BDA00038754248700000519
其中,
Figure BDA00038754248700000520
为第l个时空动态图卷积模块的空间卷积层输出的空间特征,
Figure BDA00038754248700000521
Figure BDA00038754248700000522
分别代表所有传感器节点静态和动态分支注意权重的对角矩阵。
作为优选,所述跳跃连接层聚合L个时空动态图卷积模块的时间特征和第L个时空动态图卷积模块的空间特征得到聚合特征,包括:
Figure BDA0003875424870000061
其中,Hskip代表跳跃连接层输出的聚合特征,ReLU(·)表示激活函数,Γ(L)表示跳跃连接层中对应于第L个时空动态图卷积模块的卷积核,
Figure BDA0003875424870000062
为第L个时空动态图卷积模块的空间卷积层输出的空间特征,Γ(l)表示跳跃连接层中对应于第l个时空动态图卷积模块的卷积核,
Figure BDA0003875424870000063
为第l个时空动态图卷积模块的空间卷积层输出的时间特征。
作为优选,所述输出模块包括时间门控卷积层和全连接层,所述输出模块根据所述聚合特征得到未来预设时段内交通速度的预测结果,包括:
利用所述时间门控卷积层将聚合特征Hskip映射到
Figure BDA0003875424870000064
然后在全连接层为所有传感器节点生成T个时间点的交通速度的预测结果
Figure BDA0003875424870000065
N为传感器节点的数量,Cskip是跳跃连接层的输出通道数。
本发明提供的基于时空动态图卷积网络的交通速度预测方法,提出了一种新的图生成方法,与现有方法不同,该方法利用动态图的历史信息来捕获动态图之间的时间依赖关系,从而有效地获取传感器之间的深层动态依赖关系;还提出了一种新的融合策略来研究静态和动态图的混合交互模式,能够全面地捕捉和融合隐藏在静态和动态图中的关键信息,有利于充分提取空间依赖关系。
附图说明
图1为本发明的基于时空动态图卷积网络的交通速度预测方法的流程图;
图2为本发明时空动态图卷积网络的结构图;
图3为本发明实验中将一天内不同时间的预测结果进行可视化的示意图;
图4为本发明实验中针对数据集PeMSD4交通速度预测误差示意图;
图5为本发明实验中针对数据集PeMSD7交通速度预测误差示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是在于限制本发明。
为了克服现有技术中对传感器之间的深层依赖关系提取不充分,导致交通速度预测准确性不高的问题,本实施例提出一种基于时空动态图卷积网络的交通速度预测方法,能够捕获深层的时空依赖关系以实现准确的交通速度预测。
如图1所示,本实施例的基于时空动态图卷积网络的交通速度预测方法,包括以下步骤:
步骤1、采集交通网络图及交通网络图上各传感器节点多个时间点的交通状态,并将交通状态表示为图信号矩阵,所述图信号矩阵为对应于传感器节点和时间点的交通速度关系矩阵。
为了便于理解,本实施例定义了交通预测的关键概念并阐述了问题。
定义1:交通网络图。交通网络可以描述为一个加权图G=(V,E,A)。其中V代表一组有限的节点集合|V|=N,对应于交通网络中的不同传感器;E代表传感器之间的连通关系;
Figure BDA0003875424870000071
代表传感器之间相关程度的加权邻接矩阵。
定义2:图信号矩阵。在时间点t,G上所有节点的交通状态可以表示为一个图信号
Figure BDA0003875424870000072
其中D代表每个节点的特征维数(例如速度和流量),本实施例中D为2,即速度与时间。
问题:基于交通网络图G及其历史T′个时间步长的图信号,交通预测问题可以视为学习一个函数f,它能够将历史T′个时间步长的图信号映射到未来T个时间步长的图信号,如公式(1)所示:
Figure BDA0003875424870000073
步骤2、基于所述交通网络图及其图信号矩阵,采用时空动态图卷积网络输出未来预设时段内交通速度的预测结果。
如图2所示,本实施例的时空动态图卷积网络包括三个模块:图生成器、顺序堆叠的时空动态图卷积模块(即时空动态图卷积模块组,STDGCMs)和输出模块。在图生成器中将历史动态图信息融入到节点嵌入向量中,进而提出了一种图生成方法以捕获节点之间的深层动态依赖关系。在STDGCMs中利用时间门控卷积层来提取局部时间依赖关系,并构建了空间卷积层,其包含一种可以有效融合静态和动态图中隐藏信息的策略以捕获深度的空间依赖关系。同时在每个时间门控卷积层后都添加了跳跃连接,以传递局部依赖关系信息。在输出模块中,时间门控卷积层负责获取全局依赖关系,全连接层则负责获取最终的预测结果。
1)图生成器:根据上一时间段生成的历史动态图和图信号矩阵生成最新动态图。
由于传感器节点之间的相关性并不是固定的,所以仅从静态视角来生成图是不合适的。使用动态图是一个更好的选择,但是仅基于当前信息生成的动态图仍会忽略动态图之间的时间依赖关系。针对这一问题,本实施例提出了一种新的图生成方法,将隐藏在历史动态图中的信息与交通网络中的信息进行融合,进而生成新的动态图。
图生成器模块使用了扩散卷积,以有效地提取信息并基于历史动态图生成新的动态图。当历史动态图不可用时,图生成器会使用预定义的静态图作为原始输入图。将历史动态图和图信号矩阵输入扩散卷积,得到扩散卷积输出的向量,计算如公式(2)所示。
Figure BDA0003875424870000081
其中,
Figure BDA0003875424870000082
表示扩散卷积的输出,其包含了历史动态图中的关键信息,B是批量大小,N表示传感器节点的数量,K是扩散步数;
Figure BDA0003875424870000083
表示输入信号,即信号图矩阵;T′表示时间步长,Wk1和Wk2是可学习的参数;
Figure BDA0003875424870000084
表示历史动态图的前向转移概率矩阵,而
Figure BDA0003875424870000085
表示后向转移概率矩阵。
然后,取扩散卷积输出的向量在批量大小维度的平均张量,将平均张量与参数可学习且随机初始化的节点嵌入向量
Figure BDA0003875424870000086
融合,如公式(3)所示。
Figure BDA0003875424870000087
其中,
Figure BDA0003875424870000088
表示包含历史动态图信息的节点嵌入向量,而
Figure BDA0003875424870000089
则是Zh在批量大小维度的平均张量。
最后根据融合数据生成动态邻接矩阵,并对动态邻接矩阵执行稀疏化策略,得到最新动态图。本实施例提出的动态邻接矩阵如公式(4)所示。
Figure BDA0003875424870000091
其中,
Figure BDA0003875424870000092
表示添加了自环的动态邻接矩阵,ReLU(·)为激活函数,tanh(·)为双曲正切函数,α是控制激活函数饱和率的超参数,sigmoid(·)为sigmoid函数,Eh为融合后得到的包含历史动态图信息的节点嵌入向量,即融合数据,
Figure BDA0003875424870000093
为Eh的转置,IN是一个单位矩阵。
为了准确地描述真实交通网络结构中节点之间的相关性,本实施例采用了稀疏化策略,以控制动态邻接矩阵
Figure BDA0003875424870000094
的稀疏性。该矩阵由公式(5)表示。
Figure BDA0003875424870000095
其中,argtopk(·)是一个函数,用于返回张量中最大的k个值的索引;-idx表示idx的补集。稀疏性策略能有效控制动态邻接矩阵的稀疏性,帮助模型降低计算成本。
2)时空动态图卷积模块组
为了捕捉交通网络中的时空依赖关系,本实施例将时空动态图卷积模块(STDGCM)进行顺序堆叠,其中的每个模块都由一个时间门控卷积层和一个空间卷积层组成。由于交通数据的复杂性,本实施例顺序堆叠了L个STDGCM模块以对不同时段进行协同建模,将上一个时空动态图卷积模块的输出作为下一个时空动态图卷积模块的输入,而非使用单个STDGCM模块。STDGCMs模块的传播规则可以用公式(6)和(7)表示。
Figure BDA0003875424870000096
Figure BDA0003875424870000097
其中,
Figure BDA0003875424870000098
Figure BDA0003875424870000099
分别表示第l个STDGCM中时间门控卷积层和空间卷积层的输出,
Figure BDA00038754248700000910
Figure BDA00038754248700000911
分别表示第l-1个STDGCM中时间门控卷积层和空间卷积层的输出,l=1时的原始输入为图信号矩阵X,即
Figure BDA00038754248700000912
的原始输入为信号图矩阵X,Gstatic是预定义的静态图,Gdynamic是图生成器生成的动态图,而ft(·)和fs(·)分别表示时间和空间卷积操作。此外,归一化被应用于空间卷积层之后以减少过拟合。为了最大限度地利用各个时段捕获的局部依赖关系,本实施例在每个时间门控卷积层之后应用跳跃连接,将局部依赖关系信息传递至输出模块。
2.1)时间门控卷积层:根据图信号矩阵或上一层时空动态图卷积模块的输出得到时间特征,同时将时间特征输入至位于同一时空动态图卷积模块的空间卷积层。
基于递归神经网络的模型已被广泛用于序列信息处理;但是相比于卷积神经网络(CNN),它们的内部循环操作使模型耗时更长,且反应能力更差。本实施例在时间门控卷积层利用了门控CNN来获取局部的时间依赖。如第l个STDGCM所示,采用因果卷积将输入序列
Figure BDA0003875424870000101
映射至
Figure BDA0003875424870000102
其中N表示传感器节点的数量,M(l)是输入序列的长度,特别的,输入序列Y(1)为图信号矩阵,M(1)=T′,T′为图信号矩阵所包含交通状态的时间点数量,其余的输入序列即为上一层时空动态图卷积模块的输出,
Figure BDA0003875424870000103
Figure BDA0003875424870000104
分别为第l个时空动态图卷积模块的输入和输出通道数,Kt是因果卷积核的大小;
Figure BDA0003875424870000105
Figure BDA0003875424870000106
是第l个时空动态图卷积模块中因果卷积输出的二等分。
根据[A(l)B(l)]计算得到时间特征如下:
Figure BDA0003875424870000107
其中,
Figure BDA0003875424870000108
为第l个时空动态图卷积模块的时间门控卷积层输出的时间特征,σ(·)表示sigmoid函数,⊙表示哈达玛积,fr(·)表示残差函数,作用是将输入信号转化为所需的维度(本实施例中,其为"linear"或"padding"),θ表示可学习的参数。
在输入序列
Figure BDA0003875424870000109
的递推传递中,原始图信号矩阵的形状为N×T′×D,N为传感器节点数量,T′为输入模型的数据的时间点个数,即时间步长;D为特征维度,本实施例为2(即速度与时间)。使用L层时空动态图卷积模块,原始图信号矩阵经过第1层时空动态图卷积模块后形状变为
Figure BDA00038754248700001010
经过第2层后形状变为
Figure BDA00038754248700001011
其他层以此类推。
2.2)空间卷积层:基于时间门控卷积层输出的时间特征和图生成器输出的最新动态图,结合预定义的静态图得到空间特征,其中时间特征和空间特征的叠加作为时空动态图卷积模块的输出。
由于节点之间复杂的相关性能被抽象为一个特定的图结构,因此本实施例使用图卷积操作来捕获空间依赖关系。图卷积的主要思想是通过聚合相关节点的信息来描述目标节点的特征。相关节点可以是交通网络拓扑结构中与目标节点直接连接的节点,也可以是没有与目标节点直接连接但和目标节点相似的节点。此外,由于节点之间的相关性会随时间而变化,因此必须对节点之间的静态和动态相关性进行建模。所以本实施例所提出的空间卷积层构建了静态和动态图的混合交互模式。
a)静态视角:空间卷积层的静态分支将时间特征和预定义的静态图作为输入,应用扩散卷积提取交通网络中的静态特征,如公式(9)和(10)所示。
Figure BDA0003875424870000111
Figure BDA0003875424870000112
其中,
Figure BDA0003875424870000113
表示第l个时空动态图卷积模块中空间卷积层的静态分支的第一个扩散卷积的输出,N为传感器节点的数量,K表示扩散步数,
Figure BDA0003875424870000114
表示预定义的静态图的前向转移概率矩阵,
Figure BDA0003875424870000115
表示第l个时空动态图卷积模块的时间门控卷积层输出的时间特征,
Figure BDA0003875424870000116
表示预定义的静态图的后向转移概率矩阵,
Figure BDA0003875424870000117
表示第l个时空动态图卷积模块中空间卷积层的静态分支的第二个扩散卷积的输出,即提取的静态特征,
Figure BDA0003875424870000118
Figure BDA0003875424870000119
为可学习的参数。
b)动态视角:空间卷积层的动态分支将时间特征和最新动态图作为输入,应用扩散卷积提取交通网络中的动态特征,如公式(11)和(12)所示。
Figure BDA00038754248700001110
Figure BDA00038754248700001111
其中,
Figure BDA00038754248700001112
表示第l个时空动态图卷积模块中空间卷积层的动态分支的第一个扩散卷积的输出,
Figure BDA00038754248700001113
Figure BDA00038754248700001114
分别是最新动态图的前向转移概率矩阵和后向转移概率矩阵,
Figure BDA00038754248700001115
表示第l个时空动态图卷积模块中空间卷积层的动态分支的第二个扩散卷积的输出,即提取的动态特征,
Figure BDA00038754248700001116
Figure BDA00038754248700001117
为可学习的参数,而
Figure BDA00038754248700001118
表示交通网络中隐藏在静态和动态图中的信息的交互过程,是对动态视角的必要补充。
c)聚合机制:基于注意力机制融合所述静态特征和动态特征,得到空间卷积层输出的空间特征。
由于未来一段时间内的交通速度受到节点之间静态和动态相关性的影响,因此本实施例在空间卷积层中应用了注意力机制,以有效聚合隐藏在静态和动态图中的信息。对于每个传感器节点vi,第l个时空动态图卷积模块中静态分支的注意力值可以表示为
Figure BDA0003875424870000121
如公式(13)所示:
Figure BDA0003875424870000122
其中,
Figure BDA0003875424870000123
是输出值
Figure BDA0003875424870000124
中传感器节点vi的展平化特征,Ws1和Ws2是可学习的参数,bs表示偏差。
同理可以得到传感器节点vi在第l个时空动态图卷积模块中动态分支注意力值
Figure BDA0003875424870000125
如公式(14)所示:
Figure BDA0003875424870000126
其中,
Figure BDA0003875424870000127
是输出值
Figure BDA0003875424870000128
中传感器节点vi的展平化特征,Wd1和Wd2是可学习的参数,bd表示偏差。
然后通过softmax函数对注意力值
Figure BDA0003875424870000129
Figure BDA00038754248700001210
进行归一化,如公式(15)和(16)所示:
Figure BDA00038754248700001211
Figure BDA00038754248700001212
其中,
Figure BDA00038754248700001213
表示传感器节点vi在第l个时空动态图卷积模块中静态分支注意力权重,权重越大,静态信息对于节点vi上的预测越重要。
Figure BDA00038754248700001214
表示传感器节点vi在第l个时空动态图卷积模块中动态分支注意力权重。
则最终计算得到的空间特征如下:
Figure BDA00038754248700001215
其中,
Figure BDA00038754248700001216
为第l个时空动态图卷积模块的空间卷积层输出的空间特征,
Figure BDA00038754248700001217
Figure BDA00038754248700001218
分别代表所有传感器节点静态和动态分支注意权重的对角矩阵。
2.3)跳跃连接层:聚合L个时空动态图卷积模块的时间特征和第L个时空动态图卷积模块的空间特征得到聚合特征,并将聚合特征输出至所述输出模块。
STDGCMs获取了不同时段交通网络中的局部依赖关系,
Figure BDA0003875424870000131
其中L为STDGCM模块的总数。为了最大程度地利用STDGCM在各个时段中捕获的局部依赖关系,本实施例将跳跃连接层用于聚合并传递局部依赖关系信息至输出模块,如公式(18)所示。
Figure BDA0003875424870000132
其中,
Figure BDA0003875424870000133
代表跳跃连接层输出的聚合特征,其聚合了不同时段的局部依赖关系和深层空间依赖,ReLU(·)表示激活函数,Γ(L)表示跳跃连接层中对应于第L个时空动态图卷积模块的卷积核,第L个即为最后一个,也就是最顶层,
Figure BDA0003875424870000134
表示跳跃连接层中对应于第l个时空动态图卷积模块的卷积核,用于将局部依赖关系信息归一化,使其具有相同的序列长度M(L)-Kt+1,Cskip是跳跃连接层的输出通道数,
Figure BDA0003875424870000135
为第L个时空动态图卷积模块的空间卷积层输出的空间特征,
Figure BDA0003875424870000136
为第l个时空动态图卷积模块的空间卷积层输出的时间特征。
3)输出模块:根据聚合特征得到未来预设时段内交通速度的预测结果。
为了获取全局依赖关系,输出模块使用了一个额外的时间门控卷积层,利用时间门控卷积层将聚合特征Hskip映射到
Figure BDA0003875424870000137
然后在全连接层为所有传感器节点生成T个时间点的交通速度的预测结果
Figure BDA0003875424870000138
输出模块的时间门控卷积层和时空动态图卷积模块中的时间门控卷积层的结构和计算逻辑一致,两者仅参数不同。
为了验证本申请所提模型以及方法的性能,以下提供一个具体实验。
一、数据集:本实验使用两组真实交通数据集(PeMSD4和PeMSD7)来评估所提出模型的性能。
PeMSD4:这是一个由加利福尼亚运输机构性能测量系统(PeMS)收集的覆盖旧金山湾区的公共数据集。本实验随机选择了其中的170个传感器站点作为数据源构建了最终数据集。该数据的收集时间为2017年7月1日至2017年7月31日,数据的采样间隔为5分钟。最后,PeMSD4中的每个传感器均包含8928条记录。
PeMSD7:这是一个由PeMS在洛杉矶县收集的公共数据集。本实验随机选择了193个传感器站点作为数据源构建了最终数据集。该数据的收集时间为2017年6月1日至2017年6月30日,数据的采样间隔为5分钟。最后,PeMSD7中的每个传感器均包含8640条记录。
本实验预测的对象是交通速度。数据集按照时间间隔分为三部分:70%的数据作为训练集,10%作为验证集,20%作为测试集。本实验通过计算传感器之间的欧几里得距离来构建交通网络图的邻接矩阵。具体来说,预定义的静态图的邻接矩阵可以通过阈值化的高斯核来构建,如公式(19)所示。
Figure BDA0003875424870000141
其中,wij表示传感器vi和vj之间相关度的权重;dist(vi,vj)表示传感器vi和vj之间的欧几里得距离;σ是距离的标准差;而κ(两个数据集皆为0.1)是控制邻接矩阵稀疏度的阈值。
二、基线和基准:为了验证所提出的时空动态图卷积网络(简称STDGCN)的有效性,本实验使用以下基线模型进行比较:
·HA:历史平均模型以历史平均值作为预测值。通过对前7天同一时间的交通速度进行平均来预测下一个时间间隔的交通速度。
·SVR:支持向量回归是一种经典的时间序列分析模型,使用线性的支持向量机来预测交通流量。
·LSTM:长短期记忆(LSTM)网络是一个著名的可用于交通速度预测的递归神经网络。本实验使用了包含256个单元的单层LSTM。
·STGCN:时空图卷积网络,该网络将门控时间卷积与空间图卷积相结合以实现交通预测。
·DCRNN:扩散卷积循环神经网络,该网络使用扩散卷积和循环神经网络分别对空间相关性和时间相关性进行建模。
·GMAN:图多注意力网络,该网络由多个时空的自注意模块组成,可以模拟动态时空因素的影响。
·MTGNN:基于图神经网络的多变量时间序列预测,该网络结合了基于自适应图的混合跳跃传播层和扩张的inception层来捕捉时空相关性。
·Graph WaveNet:Graph WaveNet网络将基于自适应图的扩散卷积与扩张卷积相结合,以获取时空相关性。
本实验的所有基线模型均采用了其作者发布的源代码和超参数,并使用交通速度预测的三个常用指标来衡量不同模型的性能,即绝对平均误差(MAE)、平均绝对百分比误差(MAPE)和平均平方根误差(RMSE),其计算方法如公式(20)、(21)和(22)所示:
Figure BDA0003875424870000151
Figure BDA0003875424870000152
Figure BDA0003875424870000153
其中,Yi
Figure BDA0003875424870000154
和n分别表示真实值、预测值和测试样本大小。
三、实验设置
本实验旨在根据前一个小时输入的交通速度来预测下一个小时的交通速度;即为T′=T=12。时间信息(一天中的时间)作为一个外部因素被输入模型。在输入模型之前,通过使用Z-score方法对交通速度进行归一化处理。在评估期间,预测值被反归一化为正常值。输入序列中的缺失值使用平均值填补,在计算误差时忽略测试序列中值缺失的索引。
本申请所提出的STDGCN模型使用Python语言实现,所有的实验都在一台处理器为AMD Ryzen 7 5800X CPU@3.8GHz、显卡为NVIDIA GeForce RTX 3080GPU的计算服务器上运行。模型由四个STDGCM组成,输出通道分别为32、64、32和128,跳跃连接层的输出通道Cskip设置为256。所有扩散卷积的扩散步数K设置为2,并且所有时间门控卷积层中因果卷积的内核大小Kt设置为3,随机初始化的节点嵌入向量的维度设置为40。用于控制图生成器中激活函数的饱和率的超参数α设置为5。同时采用Adam优化器训练所提出的模型,初始学习率被设置为0.001,衰减率被设置为0.97。批量大小被设置为64,训练代数被设置为100,并应用了早停法。
四、实验结果
表1(包括表1-1和表1-2)展示了采用不同方法进行预测的比较结果,分别从12个时间步长的PeMSD4和PeMSD7数据集中选择15分钟(3个时间步长)、30分钟(6个时间步长)和60分钟(12个时间步长)的范围进行预测。每种方法都经过五次训练,得到平均结果,最佳结果以粗体标记。
表1-1不同方法在两个交通速度数据集上的性能比较(15分钟和30分钟)
Figure BDA0003875424870000161
表1-2不同方法在两个交通速度数据集上的性能比较(60分钟)
Figure BDA0003875424870000171
从性能比较中,可以观察到以下结果:
(1)与传统模型(包括HA和SVR)相比,深度学习模型具有更好的非线性表达能力,从而可以更好地预测交通速度。
(2)由于先验知识的限制,仅使用预定义邻接矩阵的STGCN和DCRNN,其预测结果不如使用自适应邻接矩阵的MTGNN和Graph WaveNet。
(3)GMAN对时空相关性进行动态建模,在两个数据集的长期(即提前60分钟)预测中表现良好。然而,其直接计算所有节点向量的注意力分数不足以表示复杂的局部依赖关系,导致其短期(即提前15分钟)预测效果不佳。
(4)所提出的STDGCN在两个数据集上的中期(即提前30分钟)和长期预测中展现了明显优于基线模型的性能,并且在短期预测中展现了最优的性能。需要注意的是,由于动态变化的时空依赖关系导致交通速度的预测产生高度的不确定性,所以长期预测比短期预测更有挑战性。同时,预测长期的交通速度可以为交通部门预留更多的响应时间,有助于交通拥堵的缓解。
五、消融实验
为了研究关键组件在STDGCN中的作用,本文还对STDGCN的四种变体进行了对比,具体如下:
·STDGCN(w/o DG):没有动态图的STDGCN,即移除了空间卷积层中的动态分支。
·STDGCN(w/o PG):没有预定义的静态图的STDGCN,即移除了空间卷积层中的静态分支。
·STDGCN(w/o IP):没有隐藏在静态和动态图中信息的交互过程的STDGCN,即将空间卷积层中的动态分支卷积方法替换为与静态分支相同的方法。
·STDGCN(w/o AM):没有注意机制的STDGCN,即用加法融合取代空间卷积层中的聚合机制。
实验共重复进行了5次,其中12个时间步长预测结果的平均MAE、MAPE和RMSE如表2所示,最佳结果以粗体标记。
表2模型变体的性能比较
Figure BDA0003875424870000181
由表2可以看出,首先,本申请所提出的STDGCN取得了最好的结果,而STDGCN(w/oDG)的结果最差,说明由图生成器生成的动态图包含了很重要的信息。其次,静态图也很重要,缺少静态图同样会降低STDGCN的性能。最后,提出的空间卷积方法(包括隐藏在静态和动态图中信息的交互过程和聚合机制)是有效的。把隐藏在静态和动态图中的信息进行简单融合,不是一个很好的方案(例如,STDGCN(w/o IP)和STDGCN(w/o AM)在两个数据集中的表现都比STDGCN差),有时甚至会起到反作用(例如,在PeMSD4数据集中,STDGCN(w/o IP)和STDGCN(w/o AM)的结果比STDGCN(w/o PG)要差)。
六、可视化分析
如图3所示,通过将一天内不同时间的预测结果进行可视化,可以直观地了解本文所提出的STDGCN的性能。本文绘制了STDGCN和Graph WaveNet的提前60分钟预测结果及其对应的真实值。图3(a)是2017年7月26日PeMSD4中传感器#400712预测结果的可视化,其中实线表示真实曲线,虚线表示STDGCN或Graph WaveNet的预测结果曲线,并且图3(a)左为真实曲线与STDGCN预测结果曲线对比结果,图3(a)右为真实曲线与Graph WaveNet预测结果曲线对比结果。图3(b)是2017年6月27日PeMSD7中传感器#767350预测结果的可视化,其中实线表示真实曲线,虚线表示STDGCN或Graph WaveNet的预测结果曲线,并且图3(b)左为真实曲线与STDGCN预测结果曲线对比结果,图3(b)右为真实曲线与Graph WaveNet预测结果曲线对比结果。可见本申请提出的STDGCN在预测一天内高峰时段的开始和结束时间方面比Graph WaveNet要更加准确。此外,当交通速度在高峰期发生剧烈变化时,本申请提出的STDGCN生成的预测值比Graph WaveNet更接近真实值。因此,本申请提出的STDGCN可以更有效地捕捉到动态变化的时空依赖关系。
为了进一步了解STDGCN的性能,本实验对两个数据集上一天内的预测误差进行了可视化处理。PeMSD4中2017年7月26日不同时间的交通速度预测误差如图4所示,图4中虚线连接的为Graph WaveNet预测误差曲线,实线连接的为STDGCN预测误差曲线。PeMSD7中2017年6月27日不同时间的交通速度预测误差如图5所示,图5中虚线连接的为Graph WaveNet预测误差曲线,实线连接的为STDGCN预测误差曲线。由此可见,本申请提出的STDGCN的结果误差要小于Graph WaveNet,尤其在高峰期(即6:00到9:00和14:00到20:00)。因此,本申请提出的STDGCN可以更有效地适应高峰期交通速度的变化模式。
本申请提出一种新的交通速度预测的图卷积网络—STDGCN,分别采用时间门控卷积方法和图卷积方法提取交通速度的时间和空间特征,然后将其集成到时空动态图卷积模块中。由于交通网络中节点之间的相关性并不是固定的,因此本文提出了一种新的图生成方法,用于构建动态且自适应的交通网络图。该方法将节点之间动态相关性的历史信息与当前信息相结合,能够更好地捕获节点之间的深层动态依赖关系。在此基础上,提出了一种融合策略来研究静态和动态图的混合交互模式,该策略是通过隐藏在静态和动态图中信息的交互过程和聚合机制来实现的。最后,本文提出了一种新型网络架构来捕获时空依赖关系,能够最大限度地利用所提出的图生成方法和融合策略,并生成最终的预测结果。通过在两个真实交通数据集上进行的大量实验,验证了本文所提出的STDGCN模型优于最先进的基线模型,尤其在长期预测方面更为显著。
以上所述实施例的各技术特征可以进行任意组合,为使描述简洁,未对上述实施例中的各技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于时空动态图卷积网络的交通速度预测方法,其特征在于,所述基于时空动态图卷积网络的交通速度预测方法,包括:
采集交通网络图及交通网络图上各传感器节点多个时间点的交通状态,并将交通状态表示为图信号矩阵,所述图信号矩阵为对应于传感器节点和时间点的交通速度关系矩阵;
基于所述交通网络图及其图信号矩阵,采用时空动态图卷积网络输出未来预设时段内交通速度的预测结果;
其中,所述时空动态图卷积网络包括图生成器、时空动态图卷积模块组和输出模块,所述时空动态图卷积模块组包括顺序堆叠的L个时空动态图卷积模块和一个跳跃连接层,每个时空动态图卷积模块包含一个空间卷积层和一个时间门控卷积层,且上一个时空动态图卷积模块的输出作为下一个时空动态图卷积模块的输入,所述采用时空动态图卷积网络输出未来预设时段内交通速度的预测结果,包括:
所述图生成器根据上一时间段生成的历史动态图和图信号矩阵生成最新动态图;
所述时间门控卷积层根据图信号矩阵或上一层时空动态图卷积模块的输出得到时间特征,同时将所述时间特征输入至位于同一时空动态图卷积模块的空间卷积层;
所述空间卷积层基于时间门控卷积层输出的时间特征和所述图生成器输出的最新动态图,结合预定义的静态图得到空间特征,其中时间特征和空间特征的叠加作为时空动态图卷积模块的输出;
所述跳跃连接层聚合L个时空动态图卷积模块的时间特征和第L个时空动态图卷积模块的空间特征得到聚合特征,并将所述聚合特征输出至所述输出模块;
所述输出模块根据所述聚合特征得到未来预设时段内交通速度的预测结果。
2.如权利要求1所述的基于时空动态图卷积网络的交通速度预测方法,其特征在于,所述图生成器根据上一时间段生成的历史动态图和图信号矩阵生成最新动态图,包括:
将历史动态图和图信号矩阵输入扩散卷积,得到扩散卷积输出的向量;
取扩散卷积输出的向量在批量大小维度的平均张量,将平均张量与随机初始化的节点嵌入向量融合;
根据融合数据生成动态邻接矩阵,并对动态邻接矩阵执行稀疏化策略,得到最新动态图。
3.如权利要求2所述的基于时空动态图卷积网络的交通速度预测方法,其特征在于,所述根据融合数据生成动态邻接矩阵的计算公式如下:
Figure FDA0003875424860000021
其中,
Figure FDA0003875424860000022
表示添加了自环的动态邻接矩阵,ReLU(·)为激活函数,tanh(·)为双曲正切函数,α是控制激活函数饱和率的超参数,sigmoid(·)为sigmoid函数,Eh为融合后得到的包含历史动态图信息的节点嵌入向量,即融合数据,
Figure FDA0003875424860000023
为Eh的转置,IN是一个单位矩阵。
4.如权利要求1所述的基于时空动态图卷积网络的交通速度预测方法,其特征在于,所述时间门控卷积层根据图信号矩阵或上一层时空动态图卷积模块的输出得到时间特征,包括:
采用因果卷积将输入序列
Figure FDA0003875424860000024
映射至
Figure FDA0003875424860000025
其中N表示传感器节点的数量,M(l)是输入序列的长度,特别的,Y(1)为图信号矩阵,M(1)=T′,T′为图信号矩阵所包含交通状态的时间点数量,
Figure FDA0003875424860000026
Figure FDA0003875424860000027
分别为第l个时空动态图卷积模块的输入和输出通道数,Kt是因果卷积核的大小,
Figure FDA0003875424860000028
Figure FDA0003875424860000029
是第l个时空动态图卷积模块中因果卷积输出的二等分;
根据[A(l)B(l)]计算得到时间特征如下:
Figure FDA00038754248600000210
其中,
Figure FDA00038754248600000211
为第l个时空动态图卷积模块的时间门控卷积层输出的时间特征,σ(·)表示sigmoid函数,⊙表示哈达玛积,fr(·)表示残差函数,θ表示可学习的参数。
5.如权利要求1所述的基于时空动态图卷积网络的交通速度预测方法,其特征在于,所述空间卷积层基于时间门控卷积层输出的时间特征和所述图生成器输出的最新动态图,结合预定义的静态图得到空间特征,包括:
空间卷积层的静态分支将时间特征和预定义的静态图作为输入,应用扩散卷积提取交通网络中的静态特征;
空间卷积层的动态分支将时间特征和最新动态图作为输入,应用扩散卷积提取交通网络中的动态特征;
基于注意力机制融合所述静态特征和动态特征,得到空间卷积层输出的空间特征。
6.如权利要求5所述的基于时空动态图卷积网络的交通速度预测方法,其特征在于,所述空间卷积层的静态分支中包含两个扩散卷积,所述应用扩散卷积提取交通网络中的静态特征,包括:
Figure FDA0003875424860000031
Figure FDA0003875424860000032
其中,
Figure FDA0003875424860000033
表示第l个时空动态图卷积模块中空间卷积层的静态分支的第一个扩散卷积的输出,K表示扩散步数,
Figure FDA0003875424860000034
表示预定义的静态图的前向转移概率矩阵,
Figure FDA0003875424860000035
表示第l个时空动态图卷积模块的时间门控卷积层输出的时间特征,
Figure FDA0003875424860000036
表示预定义的静态图的后向转移概率矩阵,
Figure FDA0003875424860000037
表示第l个时空动态图卷积模块中空间卷积层的静态分支的第二个扩散卷积的输出,即提取的静态特征,
Figure FDA0003875424860000038
Figure FDA0003875424860000039
为可学习的参数。
7.如权利要求6所述的基于时空动态图卷积网络的交通速度预测方法,其特征在于,所述空间卷积层的动态分支中包含两个扩散卷积,所述应用扩散卷积提取交通网络中的动态特征,包括:
Figure FDA00038754248600000310
Figure FDA00038754248600000311
其中,
Figure FDA00038754248600000312
表示第l个时空动态图卷积模块中空间卷积层的动态分支的第一个扩散卷积的输出,
Figure FDA00038754248600000313
Figure FDA00038754248600000314
分别是最新动态图的前向转移概率矩阵和后向转移概率矩阵,
Figure FDA00038754248600000315
表示第l个时空动态图卷积模块中空间卷积层的动态分支的第二个扩散卷积的输出,即提取的动态特征,⊙表示哈达玛积,
Figure FDA00038754248600000316
Figure FDA00038754248600000317
Figure FDA00038754248600000318
为可学习的参数。
8.如权利要求7所述的基于时空动态图卷积网络的交通速度预测方法,其特征在于,所述基于注意力机制融合所述静态特征和动态特征,得到空间卷积层输出的空间特征,包括:
对于每个传感器节点vi,第l个时空动态图卷积模块中静态分支的注意力值可以表示为
Figure FDA0003875424860000041
Figure FDA0003875424860000042
其中,
Figure FDA0003875424860000043
是输出值
Figure FDA0003875424860000044
中传感器节点vi的展平化特征,tanh(·)为双曲正切函数,Ws1和Ws2是可学习的参数,bs表示偏差;
同理可以得到传感器节点vi在第l个时空动态图卷积模块中动态分支注意力值
Figure FDA0003875424860000045
Figure FDA0003875424860000046
其中,
Figure FDA0003875424860000047
是输出值
Figure FDA0003875424860000048
中传感器节点vi的展平化特征,Wd1和Wd2是可学习的参数,bd表示偏差;
然后通过softmax函数对注意力值
Figure FDA0003875424860000049
Figure FDA00038754248600000410
进行归一化,如公式所示:
Figure FDA00038754248600000411
Figure FDA00038754248600000412
其中,
Figure FDA00038754248600000413
表示传感器节点vi在第l个时空动态图卷积模块中静态分支注意力权重,
Figure FDA00038754248600000414
表示传感器节点vi在第l个时空动态图卷积模块中动态分支注意力权重;
则最终计算得到的空间特征如下:
Figure FDA00038754248600000415
其中,
Figure FDA00038754248600000416
为第l个时空动态图卷积模块的空间卷积层输出的空间特征,
Figure FDA00038754248600000417
Figure FDA00038754248600000418
分别代表所有传感器节点静态和动态分支注意权重的对角矩阵。
9.如权利要求1所述的基于时空动态图卷积网络的交通速度预测方法,其特征在于,所述跳跃连接层聚合L个时空动态图卷积模块的时间特征和第L个时空动态图卷积模块的空间特征得到聚合特征,包括:
Figure FDA0003875424860000051
其中,Hskip代表跳跃连接层输出的聚合特征,ReLU(·)表示激活函数,Γ(L)表示跳跃连接层中对应于第L个时空动态图卷积模块的卷积核,
Figure FDA0003875424860000052
为第L个时空动态图卷积模块的空间卷积层输出的空间特征,Γ(l)表示跳跃连接层中对应于第l个时空动态图卷积模块的卷积核,
Figure FDA0003875424860000053
为第l个时空动态图卷积模块的空间卷积层输出的时间特征。
10.如权利要求1所述的基于时空动态图卷积网络的交通速度预测方法,其特征在于,所述输出模块包括时间门控卷积层和全连接层,所述输出模块根据所述聚合特征得到未来预设时段内交通速度的预测结果,包括:
利用所述时间门控卷积层将聚合特征Hskip映射到
Figure FDA0003875424860000054
然后在全连接层为所有传感器节点生成T个时间点的交通速度的预测结果
Figure FDA0003875424860000055
N为传感器节点的数量,Cskip是跳跃连接层的输出通道数。
CN202211216552.7A 2022-09-30 2022-09-30 一种基于时空动态图卷积网络的交通速度预测方法 Active CN115512545B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211216552.7A CN115512545B (zh) 2022-09-30 2022-09-30 一种基于时空动态图卷积网络的交通速度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211216552.7A CN115512545B (zh) 2022-09-30 2022-09-30 一种基于时空动态图卷积网络的交通速度预测方法

Publications (2)

Publication Number Publication Date
CN115512545A true CN115512545A (zh) 2022-12-23
CN115512545B CN115512545B (zh) 2023-06-27

Family

ID=84508032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211216552.7A Active CN115512545B (zh) 2022-09-30 2022-09-30 一种基于时空动态图卷积网络的交通速度预测方法

Country Status (1)

Country Link
CN (1) CN115512545B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116110232A (zh) * 2022-12-29 2023-05-12 浙江财经大学 一种基于分层动态残差图卷积网络的交通流量预测方法
CN116153089A (zh) * 2023-04-24 2023-05-23 云南大学 基于时空卷积与动态图的交通流量预测系统及方法
CN116205383A (zh) * 2023-05-05 2023-06-02 杭州半云科技有限公司 一种基于元学习的静态动态协同图卷积交通预测方法
CN116403409A (zh) * 2023-06-06 2023-07-07 中国科学院空天信息创新研究院 交通速度预测方法、装置、电子设备和存储介质
CN117236492A (zh) * 2023-09-06 2023-12-15 西南交通大学 基于动态多尺度图学习的交通需求预测方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111696355A (zh) * 2020-06-29 2020-09-22 中南大学 动态图卷积交通速度预测方法
CN112257934A (zh) * 2020-10-26 2021-01-22 辽宁工程技术大学 一种基于时空动态神经网络的城市人流预测方法
CN113313947A (zh) * 2021-05-31 2021-08-27 湖南大学 短期交通预测图卷积网络的路况评估方法
CN113379698A (zh) * 2021-06-08 2021-09-10 武汉大学 一种分步联合监督的光照估计方法
CN113487088A (zh) * 2021-07-06 2021-10-08 哈尔滨工业大学(深圳) 基于动态时空图卷积注意力模型的交通预测方法及装置
US20210383228A1 (en) * 2020-06-05 2021-12-09 Deepmind Technologies Limited Generating prediction outputs using dynamic graphs
CN113935548A (zh) * 2021-11-14 2022-01-14 北京工业大学 基于图变换的动态多图卷积网络交通流量预测方法
CN114169649A (zh) * 2021-09-14 2022-03-11 浙江财经大学 一种基于时空数据嵌入的交通流量预测方法
CN114220271A (zh) * 2021-12-21 2022-03-22 南京理工大学 基于动态时空图卷积循环网络的交通流预测方法、设备及存储介质
WO2022061170A1 (en) * 2020-09-18 2022-03-24 Visa International Service Association Dynamic graph node embedding via light convolution
CN114360254A (zh) * 2022-03-17 2022-04-15 湖南工商大学 一种基于时空的交通流量预测方法及相关设备
CN114572229A (zh) * 2022-02-28 2022-06-03 华南理工大学 一种基于图神经网络的车速预测方法、装置、介质及设备
CN115063972A (zh) * 2022-05-18 2022-09-16 浙江工业大学 基于图卷积和门控循环单元的交通速度预测方法和系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210383228A1 (en) * 2020-06-05 2021-12-09 Deepmind Technologies Limited Generating prediction outputs using dynamic graphs
CN111696355A (zh) * 2020-06-29 2020-09-22 中南大学 动态图卷积交通速度预测方法
WO2022061170A1 (en) * 2020-09-18 2022-03-24 Visa International Service Association Dynamic graph node embedding via light convolution
CN112257934A (zh) * 2020-10-26 2021-01-22 辽宁工程技术大学 一种基于时空动态神经网络的城市人流预测方法
CN113313947A (zh) * 2021-05-31 2021-08-27 湖南大学 短期交通预测图卷积网络的路况评估方法
CN113379698A (zh) * 2021-06-08 2021-09-10 武汉大学 一种分步联合监督的光照估计方法
CN113487088A (zh) * 2021-07-06 2021-10-08 哈尔滨工业大学(深圳) 基于动态时空图卷积注意力模型的交通预测方法及装置
CN114169649A (zh) * 2021-09-14 2022-03-11 浙江财经大学 一种基于时空数据嵌入的交通流量预测方法
CN113935548A (zh) * 2021-11-14 2022-01-14 北京工业大学 基于图变换的动态多图卷积网络交通流量预测方法
CN114220271A (zh) * 2021-12-21 2022-03-22 南京理工大学 基于动态时空图卷积循环网络的交通流预测方法、设备及存储介质
CN114572229A (zh) * 2022-02-28 2022-06-03 华南理工大学 一种基于图神经网络的车速预测方法、装置、介质及设备
CN114360254A (zh) * 2022-03-17 2022-04-15 湖南工商大学 一种基于时空的交通流量预测方法及相关设备
CN115063972A (zh) * 2022-05-18 2022-09-16 浙江工业大学 基于图卷积和门控循环单元的交通速度预测方法和系统

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
"Dynamic Global-Local Spatial-Temporal Network for Traffic Speed Prediction", 《IEEE ACCESS》, pages 209296 - 209307 *
GUOLIANG YANG等: "Spatial-Temporal Dilated and Graph Convolutional Network for traffic prediction", 《2020 CHINESE AUTOMATION CONGRESS (CAC)》, pages 802 - 806 *
ZHANG, S等: "Spatiotemporal fuzzy-graph convolutional network model with dynamic feature encoding for traffic forecasting", 《KNOWLEDGE-BASED SYSTEMS》, pages 1 - 14 *
ZHANG, WY等: "Dynamic graph convolutional networks based on spatiotemporal data embedding for traffic flow forecasting", 《KNOWLEDGE-BASED SYSTEMS》, pages 1 - 14 *
刁祖龙: "基于机器学习的智能交通系统时空数据分析与预测技术研究", 《中国博士学位论文全文数据库 工程科技Ⅱ辑》, no. 7, pages 034 - 40 *
薛声军: "基于时空图卷积网络的城市路网交通流预测研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》, no. 11, pages 034 - 31 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116110232A (zh) * 2022-12-29 2023-05-12 浙江财经大学 一种基于分层动态残差图卷积网络的交通流量预测方法
CN116110232B (zh) * 2022-12-29 2024-06-07 浙江财经大学 一种基于分层动态残差图卷积网络的交通流量预测方法
CN116153089A (zh) * 2023-04-24 2023-05-23 云南大学 基于时空卷积与动态图的交通流量预测系统及方法
CN116205383A (zh) * 2023-05-05 2023-06-02 杭州半云科技有限公司 一种基于元学习的静态动态协同图卷积交通预测方法
CN116205383B (zh) * 2023-05-05 2023-07-18 杭州半云科技有限公司 一种基于元学习的静态动态协同图卷积交通预测方法
CN116403409A (zh) * 2023-06-06 2023-07-07 中国科学院空天信息创新研究院 交通速度预测方法、装置、电子设备和存储介质
CN116403409B (zh) * 2023-06-06 2023-08-15 中国科学院空天信息创新研究院 交通速度预测方法、装置、电子设备和存储介质
CN117236492A (zh) * 2023-09-06 2023-12-15 西南交通大学 基于动态多尺度图学习的交通需求预测方法
CN117236492B (zh) * 2023-09-06 2024-03-12 西南交通大学 基于动态多尺度图学习的交通需求预测方法

Also Published As

Publication number Publication date
CN115512545B (zh) 2023-06-27

Similar Documents

Publication Publication Date Title
CN115512545A (zh) 一种基于时空动态图卷积网络的交通速度预测方法
CN110675623B (zh) 基于混合深度学习的短时交通流量预测方法、系统、装置
Zhang et al. Multistep speed prediction on traffic networks: A deep learning approach considering spatio-temporal dependencies
Borovykh et al. Conditional time series forecasting with convolutional neural networks
Ma et al. A hybrid attention-based deep learning approach for wind power prediction
Ta et al. Adaptive spatio-temporal graph neural network for traffic forecasting
CN114220271A (zh) 基于动态时空图卷积循环网络的交通流预测方法、设备及存储介质
Liang et al. Memory-augmented dynamic graph convolution networks for traffic data imputation with diverse missing patterns
CN111652903A (zh) 一种自动驾驶场景下基于卷积关联网络的行人目标跟踪方法
CN114519469A (zh) 一种基于Transformer框架的多变量长序列时间序列预测模型的构建方法
Luo et al. Directed hypergraph attention network for traffic forecasting
Liu et al. Pristi: A conditional diffusion framework for spatiotemporal imputation
CN114299728A (zh) 结合注意力机制与动态时空卷积模型的车辆流量预测方法
CN111047078A (zh) 交通特征预测方法、系统及存储介质
Pang et al. Predicting skeleton trajectories using a Skeleton-Transformer for video anomaly detection
CN114565187A (zh) 一种基于图时空自编码网络的交通路网数据预测方法
Zhu et al. TargetDrop: a targeted regularization method for convolutional neural networks
Bento et al. Ocean wave power forecasting using convolutional neural networks
Wang et al. ST-GIN: An uncertainty quantification approach in traffic data imputation with spatio-temporal graph attention and bidirectional recurrent united neural networks
CN112668711B (zh) 基于深度学习的洪水流量预测方法、装置和电子设备
Lin et al. Hybrid water quality prediction with graph attention and spatio-temporal fusion
Prabowo et al. Traffic forecasting on new roads unseen in the training data using spatial contrastive pre-training
Huang et al. Robust spatial temporal imputation based on spatio-temporal generative adversarial nets
Wu et al. Bionic-inspired oil price prediction: Auditory multi-feature collaboration network
CN117131991A (zh) 基于混合神经网络的城市降雨量预测方法及平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant