CN114495500B - 一种基于对偶动态时空图卷积的交通预测方法 - Google Patents

一种基于对偶动态时空图卷积的交通预测方法 Download PDF

Info

Publication number
CN114495500B
CN114495500B CN202210096933.XA CN202210096933A CN114495500B CN 114495500 B CN114495500 B CN 114495500B CN 202210096933 A CN202210096933 A CN 202210096933A CN 114495500 B CN114495500 B CN 114495500B
Authority
CN
China
Prior art keywords
dynamic
road network
space
time
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210096933.XA
Other languages
English (en)
Other versions
CN114495500A (zh
Inventor
孙艳丰
江相衡
胡永利
郭侃
尹宝才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202210096933.XA priority Critical patent/CN114495500B/zh
Publication of CN114495500A publication Critical patent/CN114495500A/zh
Application granted granted Critical
Publication of CN114495500B publication Critical patent/CN114495500B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本发明涉及一种基于对偶动态时空图卷积的交通预测方法,用于解决当前基于图网络的交通预测方法中存在缺少对边建模以及动态建模导致的预测精度不高的问题。首先输入历史交通数据,送到输入层进行处理,然后将输入层的输出送入动态时空层,经过动态时空层中多个堆叠的对偶动态时空块进行时空相关性特征抽取,再将这些特征输入到输出层,最后输出的即是最终的预测结果。其中,最核心和关键的对偶动态时空块包括动态图卷积模块、动态超图卷积模块,以及两个之间的动态交互模块。本发明能很好的挖掘交通数据中复杂的时空相关性,从而揭示动态交通系统潜在的时空关联,进而更加准确的对城市交通数据进行预测。

Description

一种基于对偶动态时空图卷积的交通预测方法
技术领域
本发明属于时空数据挖掘、智能交通系统领域,具体是一种基于图卷积的交通预测方法。
背景技术
交通预测是借助计算机信息技术、传感器技术、数据通信技术等建立智能交通系统,基于历史交通数据,预测未来路网的交通量,例如速度、车辆数、道路占有率等。由于交通预测在城市交通道路管理、导航规划、交通控制等任务中起到十分重要作用,为建立实时、准确及高效率的综合的大规模城市级交通管理系统起到基础支撑作用,因此是智能交通系统(Intelligent Transportation Systems,ITS)的重要研究任务之一,得到了广泛的研究。
对于交通预测任务,常用的方法是在已知城市道路的历史交通数据的情况下预测未来时刻道路的交通量,需要处理数据既存在时间上的前后相关性,也存在地理空间上的分布差异性,因此属于时空数据挖掘的研究。一般来说,对于这种问题由于数据量庞大,数据之间的时空密切的非线性关联,并且数据容易受到物理世界环境干扰和影响,很难挖掘数据潜在的规律使得预测未来的交通数据。因此,如何更好的对交通数据预测模型进行建模,如何在真实世界的复杂场景下的高精度和准确率的预测城市道路,这些问题使得交通预测领域的研究也更具有挑战性。
近年来,随着GPU算力的提升和大规模数据的收集,基于深度学习的模型在交通预测领域得到了广泛的应用。2017年,Zhang等人提出ST-ResNet模型,首次将人工智能中的深度卷积神经网络(Deep Convolution Neural Network,DCNN)和长短期记忆网络(LongShort-Term Memory,LSTM)与城市交通预测相结合,在交通预测领域取得突破性进展。2018年,Yu等人提出STGCN模型,首次提出利用深度学习中纯卷积形式来构成高效的网络模型,从而对交通数据进行建模,取得当时最好的交通预测性能。但是城市交通道路是随着时间和空间动态变化的,并且城市道路的路口和道路的交通状况是存在相互的动态影响,目前的交通时空模型很难挖掘到这些交通特性。为此本发明提出一种基于深度学习网络的、对偶动态时空图卷积的交通预测方法。
发明内容
为了解决当前基于图网络的交通预测方法中存在缺少对边建模以及动态建模的问题,本发明提出一种改进的基于对偶动态时空图卷积的交通预测方法,通过交通对偶图模型和动态交互模块来改进交通预测框架,提升了城市交通的预测精度。
本发明的创新点有两点:一、提出的对偶图框架,通过路网图和其对偶超图分别作为城市路网的道路和路口的图结构,并分别构建相应图结构的深度模型,用于完全和充分的挖掘城市交通信息。二、提出动态交互模块,在路网图和对偶超图上将路网的动态相关性进行捕获,用于进一步揭示动态交通系统更为复杂的潜在关系。
本发明通过构建交通对偶图对城市交通路网道路和路口进行建模,并通过动态交互模块捕获交通动态的相关性。本发明提出的模型如图1所示,整个框架由输入层、动态时空层和输出层三部分组成。各个层的主要成分由不同模块组成,其中输入层由线性转换层(Linear Transformation)组成,动态时空层由对偶动态时空块(Dual Spatial-TemporalBlocks)堆叠而成,输出层由非线性的Leaky ReLu层和Linear Transformation层构成。其中最核心和关键的对偶动态时空块由两个协作的时空卷积模块:动态图卷积(DynamicGraph Convolution)模块和动态超图卷积(Dynamic Hypergraph Convolution)模块,以及两个之间的动态交互模块(Dynamic Interaction Module)构成。
本发明通过以下技术方案实现:
首先输入历史交通数据,送到输入层进行处理,然后将输入层的输出送入动态时空层,经过动态时空层中多个堆叠的对偶动态时空块进行时空相关性特征抽取,再将这些特征输入到输出层,最后输出的即是最终的预测结果。其具体步骤如下:
一种基于对偶动态时空图卷积的交通预测方法,用于通过已知的历史交通数据来预测未知的未来交通数据,即已知t-T’+1时刻到t时刻的交通数据X(t-T′+1):t,从而预测t+1时刻到t+T时刻的交通数据X(t+1):(t+T),基于对偶动态时空图卷积网络,该网络包括输入层、动态时空层和输出层,所述的动态时空层由对偶动态时空块堆叠而成,其中,第k-1层对偶动态时空块的输出与第k层对偶动态时空块的输出相加,作为第k+1层对偶动态时空块的输入,对偶动态时空块由两个协作的时空卷积模块以及两个之间的动态交互模块构成,两个时空卷积模块分别为动态图卷积模块和动态超图卷积模块,路网图的节点特征送入动态图卷积模块,抽取路网图节点的时空特征,路网超图的超节点特征送入动态超图卷积模块,抽取超图超节点的时空特征,动态交互模块分别为动态图卷积模块和动态超图卷积模块提供动态边信息和超边信息,将路网图和超图的信息流进行双向交互流动,所述的路网图包括节点和有向边,其中,路网上的每一条道路视为一个节点,两条道路之间存在共同的路口,则这对应的两个节点之间存在有向边,边的方向用于刻画两个道路之间的车行方向,可以是双向的或者单向的,有向边两端分别为起始节点和目标节点,路网图的节点数据即道路数据,包括道路上的流量或车速;
具体包括以下步骤:
首先,将路网图的历史交通数据,送到输入层进行处理,得到路网图的节点特征;
进一步的,输入层为线性转换层,具体如下:
X=W0Xinput
其中,Xinput为低维的路网图历史交通数据,包括每条道路上的流量或车速。
然后,将输入层的输出送入动态时空层进行时空特征抽取;动态时空层由对偶动态时空块堆叠而成,其中,第k-1层对偶动态时空块的输出与第k层对偶动态时空块的输出相加,作为第k+1层对偶动态时空块的输入,对偶动态时空块由两个协作的时空卷积模块以及两个之间的动态交互模块构成,两个时空卷积模块分别为动态图卷积模块和动态超图卷积模块,路网图的节点特征送入动态图卷积模块,抽取路网图节点的时空特征,路网超图的超节点特征送入动态超图卷积模块,抽取超图超节点的时空特征,动态交互模块分别为动态图卷积模块和动态超图卷积模块提供动态边信息和超边信息。将动态图卷积模块得到的路网图节点的时空特征
Figure GDA0004111035500000051
和对动态超图卷积模块得到的路网超图超节点的时空特征
Figure GDA0004111035500000052
进行对偶变换后得到的节点特征,进行拼接融合得到对偶动态时空块的输出特征Xnew
进一步的,动态图卷积模块用于对路网图的节点进行时空特征抽取,其输入是路网图的节点特征,输出是抽取时空特性后的新的节点特征,动态图卷积模块分别包括先抽取时间特征的Gate-TCN网络,以及后抽取空间特征的动态图卷积网络,具体工作过程如下:
首先,利用Gate-TCN网络抽取路网图节点特征的时间特征;
接着,利用动态图卷积网络来抽取路网节点数据的空间特征
Figure GDA0004111035500000053
Figure GDA0004111035500000054
Figure GDA0004111035500000055
Figure GDA0004111035500000056
X←DGCN(X)
其中Θ是可学习参数,其中不同的上下标以区分学习到的不同参数模型,
Figure GDA0004111035500000057
是动态交互模块输出的路网图的动态边权值,Reshape是将向量重塑为稀疏邻接矩阵的操作,即将边的权值填回到邻接矩阵中,N是模型的超参数,我们一般设置为N=2,输出
Figure GDA0004111035500000058
即为抽取时空特征后的路网图的节点特征。
动态超图卷积模块用于对路网超图的超节点进行时空特征抽取,其输入是路网超图的超节点特征,输出是抽取时空特性后的新的超节点特征,动态超图卷积模块分别包括先抽取时间特征的Gate-TCN网络,以及后抽取空间特征的动态超图卷积网络,具体工作过程如下:首先是对输入的路网超图的超节点特征,进行跟上面动态图卷积模块一样的Gate-TCN网络来抽取数据的时间特征,然后将其送入动态超图卷积网络来抽取路网超图的超节点数据的空间特征
Figure GDA0004111035500000061
具体表示如下:
Dω=diag(GCNd(Xd))
Figure GDA0004111035500000062
Figure GDA0004111035500000063
Xh←DHGCN(Xh)
其中Θ′是模型可学习参数,GCNd(Xd)是动态交互模块输出的动态超边权值,H表示路网图的关联矩阵,Dhv表示路网超图超节点的度矩阵,Dhe表示路网超图超边的度矩阵,输出
Figure GDA0004111035500000064
即为抽取时空特征后的路网超图的超节点特征。
动态交互模块包含两条支路,分别是上方用于生成动态超图卷积的动态超边支路,和下方用于生成动态图卷积的动态边支路;
其中,
上方支路,用于生成动态超图卷积的动态超边权值GCNd(Xd),
具体如下:先对路网图的节点特征X在时间维度上进行平均池化操作:
Figure GDA0004111035500000071
对池化后的特征再进行图卷积建模空间变化:
Figure GDA0004111035500000072
其中A是邻接矩阵,Af=A/rowsum(A)和
Figure GDA0004111035500000073
是行规范化的邻接矩阵,右上角的n表示n次幂运算,Θf和Θb是可学习参数,其中右下角的n表示以区分不同的参数;
下方支路,用于生成动态图卷积的动态边权值
Figure GDA0004111035500000074
具体如下:
首先加权拼接路网图中每条有向边两端的节点特征作为边的初始特征:
Figure GDA0004111035500000075
其中W′1,W′2是可学习权重参数,indsrc和inddst是路网图中有向边的起始节点索引和目标节点索引,以索引出起始节点特征和目标节点特征,输出的Xh是路网图的有向边的初始特征;
然后,通过以下卷积进一步融合节点间的相关性:
Figure GDA0004111035500000076
其中Conv1×1(·)是卷积核为1×1的卷积操作,实现特征融合,获取更新后的边特征;
接下来对边进行超图卷积:
Wadp=diag(Ladp)
Figure GDA0004111035500000081
Figure GDA0004111035500000082
其中Θ是可学习参数,右下角的n表示以区分不同的参数,Ladp是可学习的权值向量,H表示路网图的关联矩阵,Dhv表示路网超图超节点的度矩阵,Dhe表示路网超图超边的度矩阵。
上文中涉及的路网图与路网超图的相互转换是通过对偶变换操作完成,路网图中的节点即为路网超图中的超边,路网图中的有向边即为路网超图中的超节点。
最后,将这些时空特征输入到输出层,最后输出的即是最终的预测结果。输出层的工作过程如下:首先对动态时空层中所有对偶动态时空块的输出进行跳接操作,用于融合不同层次不同粒度的时空特征,然后将这些融合后的时空特征依次送入Leaky ReLU和线性转换层中,得到最终的预测结果。
有益效果
本发明能很好的挖掘交通数据中复杂的时空相关性,从而揭示动态交通系统潜在的时空关联,进而更加准确的对城市交通数据进行预测。
附图说明
图1、该发明所提出模型网络结构
图2、对偶变换过程
具体实施方式
步骤一:将历史数据输入到输入层。
首先介绍交通数据,例如:道路上的流量或车速数据,关于交通数据的表示如下:
X(t+1):(t+T)=(Xt+1,Xt+2,…,Xt+R)T
Xt表示第t时刻的交通数据,X(t+1):(t+T)表示t+1时刻到t+T时刻的交通数据。本发明目的是通过已知的历史交通数据来预测未知的未来交通数据,即已知t-T’+1时刻到t时刻的交通数据X(t-T′+1):t,从而来预测t+1时刻到t+T时刻的交通数据X(t+1):(t+T)
我们模型的输入层由一个线性转换层组成,其输入是低维交通历史数据据Xinput,通过线性转换层将其变换映射到高维空间:
X=W0Xinput
得到输出的高维特征X,以提高网络模型的表达,并将其作为路网图的节点特征。
步骤二:将输入层的输出输入动态时空层。
动态时空层是由多个对偶动态时空块堆叠而成,数据流经过堆叠的多个对偶动态时空块抽取到不同粒度层次的时空特征,为了避免模型存在梯度弥散和爆炸,相邻对偶动态时空块之间通过残差连接来加强梯度反传,即将第k-1个对偶动态时空块的输出与第k个对偶动态时空块的输出相加,即可把数据流前向的时空特征融入到后面高粒度层次的时空特征中。
对偶动态时空块由三个模块组成,分别是动态图卷积模块、动态超图卷积模块和动态交互模块。
首先介绍下关于对偶动态时空块的一些预知识。我们把路网上的每一条道路视为节点从而构建图结构,而节点间的边则是对应路网中的路口,而构建的路网图的边是有向边,有向边不仅表示的是连接两条道路,还刻画了路口是存在方向性的,因为在现实世界中通过这两条道路的车流是存在单向或双向的流动,所以路口建模为有向边。路网超图的超节点则是对应路网图的边,超边则是对应路网图的节点。对偶动态时空块的输入是经过输入层处理输出的路网上每条道路节点的高维特征,首先将其进行对偶变换,根据路网图的边构建形成路网超图,并把路网图节点特征映射到路网图的边上,形成边特征,即构建的路网超图的超节点特征。到这里我们就有路网图的节点特征和路网超图的超节点特征。
我们将路网图的节点特征送入动态卷积模块,抽取路网图节点的时空相关性,而路网超图的超节点特征送入动态超图卷积模块,抽取超图超节点的时空相关性。且动态交互模块分别为动态图卷积模块和动态超图卷积模块提供动态边信息和超边信息,将路网图和超图的信息流进行双向交互流动。
最后到这里有动态卷积模块输出的路网图节点的时空特征
Figure GDA0004111035500000101
和动态超图卷积模块输出的路网超图超节点的时空特征
Figure GDA0004111035500000102
在对偶动态时空块最后我们要融合这两个特征,首先把动态超图模块输出的超节点特征
Figure GDA0004111035500000103
进行对偶变换回节点特征,与动态图模块输出的节点特征
Figure GDA0004111035500000104
进行融合,得到最终的输出,该输出包含了路网的节点和边的深度时空特征,能很好的表征交通数据。并且动态时空层包含多个堆叠的对偶动态时空块,从而获取到输入数据里面不同层次不同粒度的时空特征。
下面就先介绍本方法中的对偶变换操作,再对最重要的三个模型:动态交互模块、动态图卷积模块和动态超图卷积模块进行详细介绍。
(1)对偶变换操作:
在对偶动态时空块中,我们需要进行对偶变换操作对特征进行处理。路网图的节点即路网上的道路,路网图的边即对应衔接道路的路口,路网图的节点特征即道路特征,路网图的边是有向边,即连接边的两个节点是存在起始节点指向目标节点。对偶变换操作,即将路网图与路网超图的相互转换,在路网图中的节点即可视为路网超图中的超边,路网图中的边视为路网超图中的超节点,反之亦然,即路网超图中的超边可视为路网图中的节点,路网超图中的超节点视为路网图中的边。如图2所示,从左到右,图可以通过对偶变换为超图,超图也可以通过对偶变换为图。在对偶动态时空块中,我们需要将特征进行对偶变换操作,首先是需要将路网图的节点特征通过对偶变换操作转换为路网超图节点特征在超图层面进行处理,最后是需要将处理后的路网超图节点特征通过对偶变换操作转换为路网图节点特征,恢复到原始路网图的特征上,以方便进行路网图节点特征的拼接融合。
首先是将路网图的节点特征X变换为路网超图的超节点特征Xh
Figure GDA0004111035500000111
其中Hsrc和Hdst分别对应路网图的关联矩阵中的起始节点部分和目标节点部分,Xdis是起始节点和目标节点间的路网上的距离,W1和W2是可学习的参数,
Figure GDA0004111035500000121
是元素对应乘积,[]是拼接操作,将有向边的起始节点特征和目标节点特征先进行加权拼接,再拼接上有向边的两节点间的路网距离值。
上面说明了如何把路网图的节点特征X对偶变换为路网超图的超节点特征Xh,相反在模型中路网超图的超节点特征Xh亦要对偶变换为路网图的节点特征X’:
Figure GDA0004111035500000122
其中W3是可学习的参数,H是路网图的关联矩阵。我们最后是需要将动态超卷积模块得到的节点特征X,和对动态超图卷积模块的输出Xh对偶变换得到的节点特征X’,进行拼接融合得到新的节点特征Xnew
Figure GDA0004111035500000123
其中[]是拼接操作。
为了避免过多的路网图边在对偶变换过程中给超图带来大量的超节点,从而为模型增加过多的复杂性以及引入冗余的噪声信息。为此,采用Top-k采样方法选取每个节点权重最大的top k边进行对偶变换,保证将原始图的主要信息转换为其对偶超图。
(2)动态交互模块:
动态交互模块是让模型能捕获交通数据中更为复杂的动态特性,且在路网图和路网超图间进行信息交换。如图1所示,动态交互模块包含两条支路,分别是上方用于生成动态超图卷积的动态超边支路,和下方用于生成动态图卷积的动态边支路。
首先是讲解上方支路,用于生成动态超图卷积的动态超边权值,先对路网图的节点特征X在时间维度上进行平均池化操作:
Figure GDA0004111035500000131
得到池化后的特征再进行图卷积建模空间变化:
Figure GDA0004111035500000132
其中A是邻接矩阵,Af=A/rowsum(A)和
Figure GDA0004111035500000133
是行规范化的邻接矩阵,右上角的n表示n次幂运算。Θf和Θb是可学习参数,其中右下角的n表示以区分不同的参数。GCNd(Xd)是得到的路网超图的动态超边权值。
相应的,接下来是下方支路,用于生成动态图卷积的动态边权值,首先加权拼接路网图中每条有向边两端的节点特征作为边的初始特征:
Figure GDA0004111035500000134
其中W′1,W′2是可学习权重参数,indsrc和inddst是路网图中有向边的起始节点索引和目标节点索引,以索引出起始节点特征和目标节点特征,输出的Xh是路网图的有向边的初始特征。然后,通过以下卷积进一步融合节点间的相关性:
Figure GDA0004111035500000135
其中Conv1×1(·)是卷积核为1×1的卷积操作,实现特征融合,获取更新后的的边特征。接下来对边进行超图卷积:
Wadp=diag(Ladp)
Figure GDA0004111035500000141
Figure GDA0004111035500000142
其中Θ是可学习参数,右下角的n表示以区分不同的参数。Ladp是可学习的权值向量,H表示关联矩阵,Dhv表示路网超图超节点的度矩阵,Dhe表示路网超图超边的度矩阵。该部分的输出
Figure GDA0004111035500000143
是路网图的动态边权值。
(3)动态图卷积模块:
动态图卷积模块是对路网图的节点进行时空特征抽取,其输入是路网图的节点特征,输出是抽取时空特性后的新的节点特征,动态图卷积模块分别包括先抽取时间特征的Gate-TCN网络,以及后抽取空间特征的动态图卷积网络。
首先是对输入的路网图节点特征,进行Gate-TCN网络来抽取数据的时间特征,输出为GateTCN(X):
Figure GDA0004111035500000144
Figure GDA0004111035500000145
X←GateTCN(X)
其中Convg(·)是在时间维度进行空洞卷积操作,其卷积核为g,TCH不同下标Φ1和Φ2表示两个不同的参数模型,并将两个输出分别通过非线性激活函数tanh和sigmoid进行非线性变换后门控映射,其中⊙表示哈达玛乘积。
接着用动态图卷积网络来抽取路网节点数据的空间特征,输出为
Figure GDA0004111035500000146
Figure GDA0004111035500000151
Figure GDA0004111035500000152
Figure GDA0004111035500000153
X←DGCN(X)
其中θ是可学习参数,其中不同的上下标以区分学习到的不同参数模型。
Figure GDA0004111035500000154
是动态交互模块输出的路网图的动态边权值,Reshape是将向量重塑为稀疏邻接矩阵的操作,即将边的权值填回到邻接矩阵中。输出
Figure GDA0004111035500000155
即为抽取时空特征后的路网图的节点特征。
(4)动态超图卷积模块:
动态超图卷积模块是对路网超图的超节点进行时空特征抽取,其输入是路网超图的超节点特征,输出是抽取时空特性后的新的超节点特征。动态超图卷积模块分别包括先抽取时间特征的Gate-TCN网络,以及后抽取空间特征的动态超图卷积网络。
首先是对输入的路网超图的超节点特征,进行跟上面动态图卷积模块一样的Gate-TCN网络来抽取数据的时间特征,然后将其送入动态超图卷积网络来抽取路网超图的超节点数据的空间特征:
Dω=diag(GCNd(Xd))
Figure GDA0004111035500000156
Figure GDA0004111035500000157
Xh←DHCCN(Xh)
其中Θ′是模型可学习参数,GCNd(Xd)是动态交互模块输出的动态超边权值。输出
Figure GDA0004111035500000158
即为抽取时空特征后的路网超图的超节点特征。
步骤三、将动态时空层的输出输入到输出层。
输出层首先对动态时空层中所有对偶动态时空块的输出进行跳接操作,以融合不同层次不同粒度的时空特征,然后将这些融合后的时空特征送入到到Leaky ReLU和线性转换层中,得到最终的预测结果
Figure GDA0004111035500000161
预测结果用下面公式表示:
Figure GDA0004111035500000162
对于模型的预测目标真值用下面公式表示:
X(t+1):(t+T)=(Xt+1,Xt+2,…,Xt+T)T
则模型优化的训练损失由平均绝对值误差(MAE)度量,并通过Adam优化器进行优化。损失函数定义如下公式所示:
Figure GDA0004111035500000163
本发明对上述方法进行了实验验证,并取得了明显的效果。本发明使用美国洛杉矶高速路网收集的交通速度数据集METR-LA和美国旧金山港湾区的高速路网收集的交通速度数据集PEMS-BAY,以及美国加利福尼亚州的高速路网收集的四个交通流量数据集PEMS03、PEMS04、PEMS07和PEMS08。这些数据集的详细情况如表1所示。数据是在高速路网上每5分钟取一个样本的采样率,并采用Z-Score归一化。交通图邻接矩阵由带有阈值的路段距离通过高斯核函数构造。这六个数据集按时间顺序分为训练集、验证集和测试集,METR-LA和PEMS-BAY的划分量比值为7:1:2,PEMS03、PEMS04、PEMS07和PEMS08的划分量比值为6:2:2。
表1:六个数据集的基本信息
Figure GDA0004111035500000171
本发明遵循交通预测领域的评估标准协议,采用三个指标衡量:平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)。
本发明将提出模型于目前最先进的交通预测方法进行比较,表2分别表示在METR-LA和PEMS-BAY两个交通速度数据集上的实验结果,表3分别表示在PEMS03、PEMS04、PEMS07和PEMS08四个交通流量数据集上的实验结果,其中表3的“-”表示该方法由于实验内存不足而失败。
表2:METR-LA和PEMS-BAY交通速度数据集上的实验结果
Figure GDA0004111035500000181
表3:PEMS03、PEMS04、PEMS07和PEMS08交通流量数据集上的实验结果
Figure GDA0004111035500000182
从实验结果来看,我们提出的模型DDSTGCN(ours)在六个数据集上都优于其他模型。这说明了我们发明提出的模型的优越性能,能够更好的挖掘交通数据的时空特性。
在METR-LA和PEMS08数据集上做消融实验来测试发明所提出模型的不同组件的有效性和贡献,如表4所示。我们改变图卷积组件(GCN和DGCN)以及超图卷积组件(HGCN和DHGCN),来分别研究不同组件的贡献,以及他们构成的动态交互模块DIM的贡献。
表4:METR-LA和PEMS08数据集上的消融实验结果
Figure GDA0004111035500000191
从实验结果来看,我们发明所提出的各个组件都能很好的对模型预测产生贡献,能帮助交通预测任务实现更高精度的预测。
综上所述,我们提出的基于对偶动态图卷积的交通预测模型,能够很好的对城市交通数据进行预测,能很好的挖掘交通数据中复杂的时空相关性,从而揭示动态交通系统潜在的时空关联。

Claims (1)

1.一种基于对偶动态时空图卷积的交通预测方法,用于通过已知的历史交通数据来预测未知的未来交通数据,即已知t-T’+1时刻到t时刻的交通数据X(t-T′+1):t,从而预测t+1时刻到t+T时刻的交通数据X(t+1):(t+T),其特征在于:基于对偶动态时空图卷积网络,该网络包括输入层、动态时空层和输出层,所述的动态时空层由对偶动态时空块堆叠而成,其中,第k-1层对偶动态时空块的输出与第k层对偶动态时空块的输出相加,作为第k+1层对偶动态时空块的输入,对偶动态时空块由两个协作的时空卷积模块以及两个之间的动态交互模块构成,两个时空卷积模块分别为动态图卷积模块和动态超图卷积模块,路网图的节点特征送入动态图卷积模块,抽取路网图节点的时空特征,路网超图的超节点特征送入动态超图卷积模块,抽取超图超节点的时空特征,动态交互模块分别为动态图卷积模块和动态超图卷积模块提供动态边信息和超边信息,将路网图和超图的信息流进行双向交互流动,所述的路网图包括节点和有向边,其中,路网上的每一条道路视为一个节点,两条道路之间存在共同的路口,则这对应的两个节点之间存在有向边,边的方向用于刻画两个道路之间的车行方向,是双向的或者单向的,有向边两端分别为起始节点和目标节点,路网图的节点数据即道路数据,包括道路上的流量或车速;
具体包括以下步骤:
首先,将路网图的历史交通数据,送到输入层进行处理,得到路网图的节点特征;
然后,将输入层的输出送入动态时空层进行时空特征抽取;
最后,将这些时空特征输入到输出层,最后输出的即是最终的预测结果;
路网图与路网超图的相互转换通过对偶变换操作完成,路网图中的节点即为路网超图中的超边,路网图中的有向边即为路网超图中的超节点;
将路网图的节点特征X变换为路网超图的超节点特征Xh的具体过程为,将有向边的起始节点特征和目标节点特征先进行加权拼接,再拼接上有向边的两节点间的路网距离值,公式表示如下:
Figure FDA0004111035490000021
其中,X=W0Xinput是由路网图历史交通数据Xinput的线性变换W0计算的路网图的节点特征,历史交通数据包括道路上的流量或车速,Xh为变换后的路网超图的超节点特征,Hsrc是起始节点的关联矩阵,Hdst是目标节点的关联矩阵,Xdis是起始节点和目标节点间的路网上的距离,W1和W2是可学习的参数,
Figure FDA0004111035490000022
是元素对应乘积,[]是拼接操作;
路网超图的超节点特征Xh对偶变换为路网图的节点特征X’,具体公式如下:
Figure FDA0004111035490000023
其中W3是可学习的参数,H是路网图的关联矩阵;
动态图卷积模块用于对路网图的节点进行时空特征抽取,其输入是路网图的节点特征,输出是抽取时空特性后的新的节点特征,动态图卷积模块分别包括先抽取时间特征的Gate-TCN网络,以及后抽取空间特征的动态图卷积网络,具体工作过程如下:
首先,利用Gate-TCN网络抽取路网图节点特征的时间特征;
接着,利用动态图卷积网络来抽取路网节点数据的空间特征
Figure FDA0004111035490000031
Figure FDA0004111035490000032
Figure FDA0004111035490000033
Figure FDA0004111035490000034
X←DGCN(X)
其中Θ是可学习参数,其中不同的上下标以区分学习到的不同参数模型,
Figure FDA0004111035490000035
是动态交互模块输出的路网图的动态边权值,Reshape是将向量重塑为稀疏邻接矩阵的操作,即将边的权值填回到邻接矩阵中,N是模型的超参数,设置为N=2,输出
Figure FDA0004111035490000036
即为抽取时空特征后的路网图的节点特征;
动态超图卷积模块用于对路网超图的超节点进行时空特征抽取,其输入是路网超图的超节点特征,输出是抽取时空特性后的新的超节点特征,动态超图卷积模块分别包括先抽取时间特征的Gate-TCN网络,以及后抽取空间特征的动态超图卷积网络,具体工作过程如下:首先是对输入的路网超图的超节点特征,进行跟上面动态图卷积模块一样的Gate-TCN网络来抽取数据的时间特征,然后将其送入动态超图卷积网络来抽取路网超图的超节点数据的空间特征
Figure FDA0004111035490000037
具体表示如下:
Dw=diag(GCNd(Xd))
Figure FDA0004111035490000038
Figure FDA0004111035490000039
Xh←DHGCN(Xh)
其中Θ′是模型可学习参数,GCNd(Xd)是动态交互模块输出的动态超边权值向量,H表示路网图的关联矩阵,Dhv表示路网超图超节点的度矩阵,Dhe表示路网超图超边的度矩阵,输出
Figure FDA0004111035490000041
即为抽取时空特征后的路网超图的超节点特征;
动态交互模块包含两条支路,分别是上方用于生成动态超图卷积的动态超边支路,和下方用于生成动态图卷积的动态边支路;
其中,
上方支路,用于生成动态超图卷积的动态超边权值GCNd(Xd),
具体如下:先对路网图的节点特征X在时间维度上进行平均池化操作:
Figure FDA0004111035490000042
对池化后的特征再进行图卷积建模空间变化:
Figure FDA0004111035490000043
其中A是邻接矩阵,Af=A/rowsum(A)和
Figure FDA0004111035490000044
是行规范化的邻接矩阵,右上角的n表示n次幂运算,Θf和Θb是可学习参数,其中右下角的n表示以区分不同的参数;
下方支路,用于生成动态图卷积的动态边权值
Figure FDA0004111035490000045
具体如下:
首先加权拼接路网图中每条有向边两端的节点特征作为边的初始特征:
Figure FDA0004111035490000046
其中W′1,W′2是可学习权重参数,indsrc和inddst是路网图中有向边的起始节点索引和目标节点索引,以索引出起始节点特征和目标节点特征,输出的Xh是路网图的有向边的初始特征;
然后,通过以下卷积进一步融合节点间的相关性:
Figure FDA0004111035490000051
其中Conv1×1(·)是卷积核为1×1的卷积操作,实现特征融合,获取更新后的边特征;
接下来对边进行超图卷积:
Wadp=diag(Ladp)
Figure FDA0004111035490000052
Figure FDA0004111035490000053
其中Θ是可学习参数,右下角的n表示以区分不同的参数,Ladp是可学习的权值向量,H表示路网图的关联矩阵,Dhv表示路网超图超节点的度矩阵,Dhe表示路网超图超边的度矩阵;
将动态图卷积模块得到的路网图节点的时空特征
Figure FDA0004111035490000054
和对动态超图卷积模块得到的路网超图超节点的时空特征
Figure FDA0004111035490000055
进行对偶变换后得到的节点特征,进行拼接融合得到对偶动态时空块的输出特征Xnew
输出层的工作过程如下:首先对动态时空层中所有对偶动态时空块的输出进行跳接操作,用于融合不同层次不同粒度的时空特征,然后将这些融合后的时空特征依次送入LeakyReLU和线性转换层中,得到最终的预测结果。
CN202210096933.XA 2022-01-26 2022-01-26 一种基于对偶动态时空图卷积的交通预测方法 Active CN114495500B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210096933.XA CN114495500B (zh) 2022-01-26 2022-01-26 一种基于对偶动态时空图卷积的交通预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210096933.XA CN114495500B (zh) 2022-01-26 2022-01-26 一种基于对偶动态时空图卷积的交通预测方法

Publications (2)

Publication Number Publication Date
CN114495500A CN114495500A (zh) 2022-05-13
CN114495500B true CN114495500B (zh) 2023-04-18

Family

ID=81476834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210096933.XA Active CN114495500B (zh) 2022-01-26 2022-01-26 一种基于对偶动态时空图卷积的交通预测方法

Country Status (1)

Country Link
CN (1) CN114495500B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115482656B (zh) * 2022-05-23 2023-09-26 汕头大学 一种使用空间动态图卷积网络进行交通流预测方法
CN116363874B (zh) * 2023-03-20 2024-04-23 南京理工大学 融合多模式高阶语义相关性的城市交通超图卷积预测方法
CN116153089B (zh) * 2023-04-24 2023-06-27 云南大学 基于时空卷积与动态图的交通流量预测系统及方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111091712A (zh) * 2019-12-25 2020-05-01 浙江大学 一种基于循环注意力对偶图卷积网络的交通流量预测方法
CN112241814B (zh) * 2020-10-20 2022-12-02 河南大学 一种基于强化时空图神经网络的交通预测方法
CN112801404B (zh) * 2021-02-14 2024-03-22 北京工业大学 一种基于自适应空间自注意力图卷积的交通预测方法
CN113570859B (zh) * 2021-07-23 2022-07-22 江南大学 一种基于异步时空膨胀图卷积网络的交通流量预测方法
CN113935548A (zh) * 2021-11-14 2022-01-14 北京工业大学 基于图变换的动态多图卷积网络交通流量预测方法

Also Published As

Publication number Publication date
CN114495500A (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
CN114495500B (zh) 一种基于对偶动态时空图卷积的交通预测方法
US11270579B2 (en) Transportation network speed foreeasting method using deep capsule networks with nested LSTM models
CN106981198B (zh) 用于旅行时间预测的深度学习网络模型及其建立方法
CN112216108A (zh) 一种基于属性增强的时空图卷积模型的交通预测方法
Long et al. Unified spatial-temporal neighbor attention network for dynamic traffic prediction
CN112767682A (zh) 一种基于图卷积神经网络的多尺度交通流量预测方法
CN113313947A (zh) 短期交通预测图卷积网络的路况评估方法
CN114925836B (zh) 基于动态多视图图神经网络的城市交通车流量推理方法
CN113538910A (zh) 一种自适应的全链条城市区域网络信号控制优化方法
WO2022142418A1 (zh) 一种基于gis地图信息的交通拥堵指数预测方法及装置
CN115204478A (zh) 一种结合城市兴趣点和时空因果关系的公共交通流量预测方法
CN113762595A (zh) 通行时间预测模型训练方法、通行时间预测方法及设备
CN114944053A (zh) 一种基于时空超图神经网络的交通流预测方法
Wei et al. Dual graph for traffic forecasting
Zhang et al. Link speed prediction for signalized urban traffic network using a hybrid deep learning approach
CN112989539B (zh) 一种基于交叉路口转移计算的交通预测方法
CN114202120A (zh) 一种针对多源异构数据的城市交通行程时间预测方法
Zhang et al. Boosted trajectory calibration for traffic state estimation
CN117236492B (zh) 基于动态多尺度图学习的交通需求预测方法
CN117131979A (zh) 基于有向超图及注意力机制的交通流速度预测方法及系统
Liu et al. An adaptive traffic flow prediction model based on spatiotemporal graph neural network
CN114566048B (zh) 一种基于多视角自适应时空图网络的交通控制方法
CN116052427A (zh) 基于私家车出行轨迹数据的城市间跨区域移动性预测方法及装置
CN115905629A (zh) 一种基于时空门控超图卷积网络的交通预测系统及方法
Bhaumik et al. STLGRU: Spatio-Temporal Lightweight Graph GRU for Traffic Flow Prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant