CN114495500A - 一种基于对偶动态时空图卷积的交通预测方法 - Google Patents

一种基于对偶动态时空图卷积的交通预测方法 Download PDF

Info

Publication number
CN114495500A
CN114495500A CN202210096933.XA CN202210096933A CN114495500A CN 114495500 A CN114495500 A CN 114495500A CN 202210096933 A CN202210096933 A CN 202210096933A CN 114495500 A CN114495500 A CN 114495500A
Authority
CN
China
Prior art keywords
dynamic
road network
time
space
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210096933.XA
Other languages
English (en)
Other versions
CN114495500B (zh
Inventor
孙艳丰
江相衡
胡永利
郭侃
尹宝才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202210096933.XA priority Critical patent/CN114495500B/zh
Publication of CN114495500A publication Critical patent/CN114495500A/zh
Application granted granted Critical
Publication of CN114495500B publication Critical patent/CN114495500B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Remote Sensing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及一种基于对偶动态时空图卷积的交通预测方法,用于解决当前基于图网络的交通预测方法中存在缺少对边建模以及动态建模导致的预测精度不高的问题。首先输入历史交通数据,送到输入层进行处理,然后将输入层的输出送入动态时空层,经过动态时空层中多个堆叠的对偶动态时空块进行时空相关性特征抽取,再将这些特征输入到输出层,最后输出的即是最终的预测结果。其中,最核心和关键的对偶动态时空块包括动态图卷积模块、动态超图卷积模块,以及两个之间的动态交互模块。本发明能很好的挖掘交通数据中复杂的时空相关性,从而揭示动态交通系统潜在的时空关联,进而更加准确的对城市交通数据进行预测。

Description

一种基于对偶动态时空图卷积的交通预测方法
技术领域
本发明属于时空数据挖掘、智能交通系统领域,具体是一种基于图卷积的交通预测方法。
背景技术
交通预测是借助计算机信息技术、传感器技术、数据通信技术等建立智能交通系统,基于历史交通数据,预测未来路网的交通量,例如速度、车辆数、道路占有率等。由于交通预测在城市交通道路管理、导航规划、交通控制等任务中起到十分重要作用,为建立实时、准确及高效率的综合的大规模城市级交通管理系统起到基础支撑作用,因此是智能交通系统(Intelligent Transportation Systems,ITS)的重要研究任务之一,得到了广泛的研究。
对于交通预测任务,常用的方法是在已知城市道路的历史交通数据的情况下预测未来时刻道路的交通量,需要处理数据既存在时间上的前后相关性,也存在地理空间上的分布差异性,因此属于时空数据挖掘的研究。一般来说,对于这种问题由于数据量庞大,数据之间的时空密切的非线性关联,并且数据容易受到物理世界环境干扰和影响,很难挖掘数据潜在的规律使得预测未来的交通数据。因此,如何更好的对交通数据预测模型进行建模,如何在真实世界的复杂场景下的高精度和准确率的预测城市道路,这些问题使得交通预测领域的研究也更具有挑战性。
近年来,随着GPU算力的提升和大规模数据的收集,基于深度学习的模型在交通预测领域得到了广泛的应用。2017年,Zhang等人提出ST-ResNet模型,首次将人工智能中的深度卷积神经网络(Deep Convolution Neural Network,DCNN)和长短期记忆网络(LongShort-Term Memory,LSTM)与城市交通预测相结合,在交通预测领域取得突破性进展。2018年,Yu等人提出STGCN模型,首次提出利用深度学习中纯卷积形式来构成高效的网络模型,从而对交通数据进行建模,取得当时最好的交通预测性能。但是城市交通道路是随着时间和空间动态变化的,并且城市道路的路口和道路的交通状况是存在相互的动态影响,目前的交通时空模型很难挖掘到这些交通特性。为此本发明提出一种基于深度学习网络的、对偶动态时空图卷积的交通预测方法。
发明目的
为了解决当前基于图网络的交通预测方法中存在缺少对边建模以及动态建模的问题,本发明提出一种改进的基于对偶动态时空图卷积的交通预测方法,通过交通对偶图模型和动态交互模块来改进交通预测框架,提升了城市交通的预测精度。
本发明的创新点有两点:一、提出的对偶图框架,通过路网图和其对偶超图分别作为城市路网的道路和路口的图结构,并分别构建相应图结构的深度模型,用于完全和充分的挖掘城市交通信息。二、提出动态交互模块,在路网图和对偶超图上将路网的动态相关性进行捕获,用于进一步揭示动态交通系统更为复杂的潜在关系。
本发明通过构建交通对偶图对城市交通路网道路和路口进行建模,并通过动态交互模块捕获交通动态的相关性。本发明提出的模型如图1所示,整个框架由输入层、动态时空层和输出层三部分组成。各个层的主要成分由不同模块组成,其中输入层由线性转换层(Linear Transformation)组成,动态时空层由对偶动态时空块(Dual Spatial-TemporalBlocks)堆叠而成,输出层由非线性的Leaky ReLu层和Linear Transformation层构成。其中最核心和关键的对偶动态时空块由两个协作的时空卷积模块:动态图卷积(DynamicGraph Convolution)模块和动态超图卷积(Dynamic Hypergraph Convolution)模块,以及两个之间的动态交互模块(Dynamic Interaction Module)构成。
本发明通过以下技术方案实现:
首先输入历史交通数据,送到输入层进行处理,然后将输入层的输出送入动态时空层,经过动态时空层中多个堆叠的对偶动态时空块进行时空相关性特征抽取,再将这些特征输入到输出层,最后输出的即是最终的预测结果。其具体步骤如下:
一种基于对偶动态时空图卷积的交通预测方法,用于通过已知的历史交通数据来预测未知的未来交通数据,即已知t-T’+1时刻到t时刻的交通数据
Figure BDA0003489006980000032
从而预测t+1时刻到t+T时刻的交通数据
Figure BDA0003489006980000031
基于对偶动态时空图卷积网络,该网络包括输入层、动态时空层和输出层,所述的动态时空层由对偶动态时空块堆叠而成,其中,第k-1层对偶动态时空块的输出与第k层对偶动态时空块的输出相加,作为第k+1层对偶动态时空块的输入,对偶动态时空块由两个协作的时空卷积模块以及两个之间的动态交互模块构成,两个时空卷积模块分别为动态图卷积模块和动态超图卷积模块,路网图的节点特征送入动态图卷积模块,抽取路网图节点的时空特征,路网超图的超节点特征送入动态超图卷积模块,抽取超图超节点的时空特征,动态交互模块分别为动态图卷积模块和动态超图卷积模块提供动态边信息和超边信息,将路网图和超图的信息流进行双向交互流动,所述的路网图包括节点和有向边,其中,路网上的每一条道路视为一个节点,两条道路之间存在共同的路口,则这对应的两个节点之间存在有向边,边的方向用于刻画两个道路之间的车行方向,可以是双向的或者单向的,有向边两端分别为起始节点和目标节点,路网图的节点数据即道路数据,包括道路上的流量或车速;
具体包括以下步骤:
首先,将路网图的历史交通数据,送到输入层进行处理,得到路网图的节点特征;
进一步的,输入层为线性转换层,具体如下:
Figure BDA0003489006980000041
其中,Xinput为低维的路网图历史交通数据,包括每条道路上的流量或车速。
然后,将输入层的输出送入动态时空层进行时空特征抽取;动态时空层由对偶动态时空块堆叠而成,其中,第k-1层对偶动态时空块的输出与第k层对偶动态时空块的输出相加,作为第k+1层对偶动态时空块的输入,对偶动态时空块由两个协作的时空卷积模块以及两个之间的动态交互模块构成,两个时空卷积模块分别为动态图卷积模块和动态超图卷积模块,路网图的节点特征送入动态图卷积模块,抽取路网图节点的时空特征,路网超图的超节点特征送入动态超图卷积模块,抽取超图超节点的时空特征,动态交互模块分别为动态图卷积模块和动态超图卷积模块提供动态边信息和超边信息。将动态图卷积模块得到的路网图节点的时空特征
Figure BDA0003489006980000055
和对动态超图卷积模块得到的路网超图超节点的时空特征
Figure BDA0003489006980000056
进行对偶变换后得到的节点特征,进行拼接融合得到对偶动态时空块的输出特征
Figure BDA0003489006980000057
进一步的,动态图卷积模块用于对路网图的节点进行时空特征抽取,其输入是路网图的节点特征,输出是抽取时空特性后的新的节点特征,动态图卷积模块分别包括先抽取时间特征的Gate-TCN网络,以及后抽取空间特征的动态图卷积网络,具体工作过程如下:
首先,利用Gate-TCN网络抽取路网图节点特征的时间特征;
接着,利用动态图卷积网络来抽取路网节点数据的空间特征
Figure BDA00034890069800000510
Figure BDA0003489006980000051
Figure BDA0003489006980000052
Figure BDA0003489006980000053
Figure BDA0003489006980000059
其中Θ是可学习参数,其中不同的上下标以区分学习到的不同参数模型,
Figure BDA0003489006980000054
是动态交互模块输出的路网图的动态边权值,Reshape是将向量重塑为稀疏邻接矩阵的操作,即将边的权值填回到邻接矩阵中,N是模型的超参数,我们一般设置为N=2,输出
Figure BDA0003489006980000058
即为抽取时空特征后的路网图的节点特征。
动态超图卷积模块用于对路网超图的超节点进行时空特征抽取,其输入是路网超图的超节点特征,输出是抽取时空特性后的新的超节点特征,动态超图卷积模块分别包括先抽取时间特征的Gate-TCN网络,以及后抽取空间特征的动态超图卷积网络,具体工作过程如下:首先是对输入的路网超图的超节点特征,进行跟上面动态图卷积模块一样的Gate-TCN网络来抽取数据的时间特征,然后将其送入动态超图卷积网络来抽取路网超图的超节点数据的空间特征DHGCN(xh),具体表示如下:
Dw=diag(GCNd(Xd))
Figure BDA0003489006980000061
Figure BDA0003489006980000062
Figure BDA0003489006980000066
其中Θ′是模型可学习参数,
Figure BDA0003489006980000063
是动态交互模块输出的动态超边权值,H表示路网图的关联矩阵,Dhv表示路网超图超节点的度矩阵,Dhe表示路网超图超边的度矩阵,输出
Figure BDA0003489006980000067
即为抽取时空特征后的路网超图的超节点特征。
动态交互模块包含两条支路,分别是上方用于生成动态超图卷积的动态超边支路,和下方用于生成动态图卷积的动态边支路;
其中,
上方支路,用于生成动态超图卷积的动态超边权值GCNd(Xd),
具体如下:先对路网图的节点特征
Figure BDA0003489006980000064
在时间维度上进行平均池化操作:
Figure BDA0003489006980000065
对池化后的特征再进行图卷积建模空间变化:
Figure BDA0003489006980000071
其中A是邻接矩阵,Af=A/rowsum(A)和
Figure BDA0003489006980000072
是行规范化的邻接矩阵,右上角的n表示n次幂运算,Θf和Θb是可学习参数,其中右下角的n表示以区分不同的参数;
下方支路,用于生成动态图卷积的动态边权值
Figure BDA0003489006980000073
具体如下:
首先加权拼接路网图中每条有向边两端的节点特征作为边的初始特征:
Figure BDA0003489006980000077
其中W′1,W′2是可学习权重参数,indsrc和inddst是路网图中有向边的起始节点索引和目标节点索引,以索引出起始节点特征和目标节点特征,输出的Xh是路网图的有向边的初始特征;
然后,通过以下卷积进一步融合节点间的相关性:
Figure BDA0003489006980000074
其中Conv1×1(·)是卷积核为1×1的卷积操作,实现特征融合,获取更新后的边特征;
接下来对边进行超图卷积:
Wadp=diag(Ladp)
Figure BDA0003489006980000075
Figure BDA0003489006980000076
其中Θ是可学习参数,右下角的n表示以区分不同的参数,Ladp是可学习的权值向量,H表示路网图的关联矩阵,Dhv表示路网超图超节点的度矩阵,Dhe表示路网超图超边的度矩阵。
上文中涉及的路网图与路网超图的相互转换是通过对偶变换操作完成,路网图中的节点即为路网超图中的超边,路网图中的有向边即为路网超图中的超节点。
最后,将这些时空特征输入到输出层,最后输出的即是最终的预测结果。输出层的工作过程如下:首先对动态时空层中所有对偶动态时空块的输出进行跳接操作,用于融合不同层次不同粒度的时空特征,然后将这些融合后的时空特征依次送入Leaky ReLU和线性转换层中,得到最终的预测结果。
有益效果
本发明能很好的挖掘交通数据中复杂的时空相关性,从而揭示动态交通系统潜在的时空关联,进而更加准确的对城市交通数据进行预测。
附图说明
图1、该发明所提出模型网络结构
图2、对偶变换过程
具体实施方式
步骤一:将历史数据输入到输入层。
首先介绍交通数据,例如:道路上的流量或车速数据,关于交通数据的表示如下:
Figure BDA0003489006980000091
Xt表示第t时刻的交通数据,
Figure BDA0003489006980000092
表示t+1时刻到t+T时刻的交通数据。本发明目的是通过已知的历史交通数据来预测未知的未来交通数据,即已知t-T’+1时刻到t时刻的交通数据
Figure BDA0003489006980000093
从而来预测t+1时刻到t+T时刻的交通数据
Figure BDA0003489006980000094
我们模型的输入层由一个线性转换层组成,其输入是低维交通历史数据据
Figure BDA0003489006980000095
通过线性转换层将其变换映射到高维空间:
Figure BDA0003489006980000096
得到输出的高维特征
Figure BDA0003489006980000097
以提高网络模型的表达,并将其作为路网图的节点特征。
步骤二:将输入层的输出输入动态时空层。
动态时空层是由多个对偶动态时空块堆叠而成,数据流经过堆叠的多个对偶动态时空块抽取到不同粒度层次的时空特征,为了避免模型存在梯度弥散和爆炸,相邻对偶动态时空块之间通过残差连接来加强梯度反传,即将第k-1个对偶动态时空块的输出与第k个对偶动态时空块的输出相加,即可把数据流前向的时空特征融入到后面高粒度层次的时空特征中。
对偶动态时空块由三个模块组成,分别是动态图卷积模块、动态超图卷积模块和动态交互模块。
首先介绍下关于对偶动态时空块的一些预知识。我们把路网上的每一条道路视为节点从而构建图结构,而节点间的边则是对应路网中的路口,而构建的路网图的边是有向边,有向边不仅表示的是连接两条道路,还刻画了路口是存在方向性的,因为在现实世界中通过这两条道路的车流是存在单向或双向的流动,所以路口建模为有向边。路网超图的超节点则是对应路网图的边,超边则是对应路网图的节点。对偶动态时空块的输入是经过输入层处理输出的路网上每条道路节点的高维特征,首先将其进行对偶变换,根据路网图的边构建形成路网超图,并把路网图节点特征映射到路网图的边上,形成边特征,即构建的路网超图的超节点特征。到这里我们就有路网图的节点特征和路网超图的超节点特征。
我们将路网图的节点特征送入动态卷积模块,抽取路网图节点的时空相关性,而路网超图的超节点特征送入动态超图卷积模块,抽取超图超节点的时空相关性。且动态交互模块分别为动态图卷积模块和动态超图卷积模块提供动态边信息和超边信息,将路网图和超图的信息流进行双向交互流动。
最后到这里有动态卷积模块输出的路网图节点的时空特征
Figure BDA0003489006980000101
和动态超图卷积模块输出的路网超图超节点的时空特征
Figure BDA0003489006980000102
在对偶动态时空块最后我们要融合这两个特征,首先把动态超图模块输出的超节点特征
Figure BDA0003489006980000103
进行对偶变换回节点特征,与动态图模块输出的节点特征
Figure BDA0003489006980000104
进行融合,得到最终的输出,该输出包含了路网的节点和边的深度时空特征,能很好的表征交通数据。并且动态时空层包含多个堆叠的对偶动态时空块,从而获取到输入数据里面不同层次不同粒度的时空特征。
下面就先介绍本方法中的对偶变换操作,再对最重要的三个模型:动态交互模块、动态图卷积模块和动态超图卷积模块进行详细介绍。
(1)对偶变换操作:
在对偶动态时空块中,我们需要进行对偶变换操作对特征进行处理。路网图的节点即路网上的道路,路网图的边即对应衔接道路的路口,路网图的节点特征即道路特征,路网图的边是有向边,即连接边的两个节点是存在起始节点指向目标节点。对偶变换操作,即将路网图与路网超图的相互转换,在路网图中的节点即可视为路网超图中的超边,路网图中的边视为路网超图中的超节点,反之亦然,即路网超图中的超边可视为路网图中的节点,路网超图中的超节点视为路网图中的边。如图2所示,从左到右,图可以通过对偶变换为超图,超图也可以通过对偶变换为图。在对偶动态时空块中,我们需要将特征进行对偶变换操作,首先是需要将路网图的节点特征通过对偶变换操作转换为路网超图节点特征在超图层面进行处理,最后是需要将处理后的路网超图节点特征通过对偶变换操作转换为路网图节点特征,恢复到原始路网图的特征上,以方便进行路网图节点特征的拼接融合。
首先是将路网图的节点特征
Figure BDA0003489006980000115
变换为路网超图的超节点特征
Figure BDA0003489006980000116
Figure BDA0003489006980000111
其中
Figure BDA0003489006980000112
Figure BDA0003489006980000113
分别对应路网图的关联矩阵中的起始节点部分和目标节点部分,
Figure BDA0003489006980000117
是起始节点和目标节点间的路网上的距离,W1和W2是可学习的参数,
Figure BDA0003489006980000114
是元素对应乘积,[]是拼接操作,将有向边的起始节点特征和目标节点特征先进行加权拼接,再拼接上有向边的两节点间的路网距离值。
上面说明了如何把路网图的节点特征
Figure BDA0003489006980000123
对偶变换为路网超图的超节点特征
Figure BDA0003489006980000124
相反在模型中路网超图的超节点特征
Figure BDA0003489006980000126
亦要对偶变换为路网图的节点特征
Figure BDA0003489006980000125
Figure BDA0003489006980000121
其中W3是可学习的参数,
Figure BDA0003489006980000122
是路网图的关联矩阵。我们最后是需要将动态超卷积模块得到的节点特征
Figure BDA0003489006980000127
和对动态超图卷积模块的输出
Figure BDA0003489006980000128
对偶变换得到的节点特征
Figure BDA0003489006980000129
进行拼接融合得到新的节点特征
Figure BDA00034890069800001210
Figure BDA00034890069800001211
其中[]是拼接操作。
为了避免过多的路网图边在对偶变换过程中给超图带来大量的超节点,从而为模型增加过多的复杂性以及引入冗余的噪声信息。为此,采用Top-k采样方法选取每个节点权重最大的top k边进行对偶变换,保证将原始图的主要信息转换为其对偶超图。
(2)动态交互模块:
动态交互模块是让模型能捕获交通数据中更为复杂的动态特性,且在路网图和路网超图间进行信息交换。如图1所示,动态交互模块包含两条支路,分别是上方用于生成动态超图卷积的动态超边支路,和下方用于生成动态图卷积的动态边支路。
首先是讲解上方支路,用于生成动态超图卷积的动态超边权值,先对路网图的节点特征
Figure BDA00034890069800001212
在时间维度上进行平均池化操作:
Figure BDA00034890069800001213
得到池化后的特征再进行图卷积建模空间变化:
Figure BDA0003489006980000131
其中A是邻接矩阵,Af=A/rowsum(A)和
Figure BDA0003489006980000132
是行规范化的邻接矩阵,右上角的n表示n次幂运算。Θf和Θb是可学习参数,其中右下角的n表示以区分不同的参数。GCNd(Xd)是得到的路网超图的动态超边权值。
相应的,接下来是下方支路,用于生成动态图卷积的动态边权值,首先加权拼接路网图中每条有向边两端的节点特征作为边的初始特征:
Figure BDA0003489006980000137
其中W′1,W′2是可学习权重参数,indsrc和inddst是路网图中有向边的起始节点索引和目标节点索引,以索引出起始节点特征和目标节点特征,输出的Xh是路网图的有向边的初始特征。然后,通过以下卷积进一步融合节点间的相关性:
Figure BDA0003489006980000133
其中Conv1×1(·)是卷积核为1×1的卷积操作,实现特征融合,获取更新后的的边特征。接下来对边进行超图卷积:
Wadp=diag(Ladp)
Figure BDA0003489006980000134
Figure BDA0003489006980000135
其中Θ是可学习参数,右下角的n表示以区分不同的参数。Ladp是可学习的权值向量,H表示关联矩阵,Dhv表示路网超图超节点的度矩阵,Dhe表示路网超图超边的度矩阵。该部分的输出
Figure BDA0003489006980000136
是路网图的动态边权值。
(3)动态图卷积模块:
动态图卷积模块是对路网图的节点进行时空特征抽取,其输入是路网图的节点特征,输出是抽取时空特性后的新的节点特征,动态图卷积模块分别包括先抽取时间特征的Gate-TCN网络,以及后抽取空间特征的动态图卷积网络。
首先是对输入的路网图节点特征,进行Gate-TCN网络来抽取数据的时间特征,输出为GateTCN(X):
Figure BDA0003489006980000146
Figure BDA0003489006980000141
Figure BDA0003489006980000147
其中Convg(·)是在时间维度进行空洞卷积操作,其卷积核为g,TCH不同下标Φ1和Φ2表示两个不同的参数模型,并将两个输出分别通过非线性激活函数tanh和sigmoid进行非线性变换后门控映射,其中⊙表示哈达玛乘积。
接着用动态图卷积网络来抽取路网节点数据的空间特征,输出为
Figure BDA0003489006980000149
Figure BDA0003489006980000142
Figure BDA0003489006980000143
Figure BDA0003489006980000144
Figure BDA0003489006980000148
其中Θ是可学习参数,其中不同的上下标以区分学习到的不同参数模型。
Figure BDA0003489006980000145
是动态交互模块输出的路网图的动态边权值,Reshape是将向量重塑为稀疏邻接矩阵的操作,即将边的权值填回到邻接矩阵中。输出
Figure BDA0003489006980000155
即为抽取时空特征后的路网图的节点特征。
(4)动态超图卷积模块:
动态超图卷积模块是对路网超图的超节点进行时空特征抽取,其输入是路网超图的超节点特征,输出是抽取时空特性后的新的超节点特征。动态超图卷积模块分别包括先抽取时间特征的Gate-TCN网络,以及后抽取空间特征的动态超图卷积网络。
首先是对输入的路网超图的超节点特征,进行跟上面动态图卷积模块一样的Gate-TCN网络来抽取数据的时间特征,然后将其送入动态超图卷积网络来抽取路网超图的超节点数据的空间特征:
Dw=diag(GCNd(Xd))
Figure BDA0003489006980000151
Figure BDA0003489006980000152
Figure BDA0003489006980000156
其中Θ′是模型可学习参数,
Figure BDA0003489006980000153
是动态交互模块输出的动态超边权值。输出
Figure BDA0003489006980000157
即为抽取时空特征后的路网超图的超节点特征。
步骤三、将动态时空层的输出输入到输出层。
输出层首先对动态时空层中所有对偶动态时空块的输出进行跳接操作,以融合不同层次不同粒度的时空特征,然后将这些融合后的时空特征送入到到Leaky ReLU和线性转换层中,得到最终的预测结果
Figure BDA0003489006980000154
预测结果用下面公式表示:
Figure BDA0003489006980000161
对于模型的预测目标真值用下面公式表示:
Figure BDA0003489006980000163
则模型优化的训练损失由平均绝对值误差(MAE)度量,并通过Adam优化器进行优化。损失函数定义如下公式所示:
Figure BDA0003489006980000162
本发明对上述方法进行了实验验证,并取得了明显的效果。本发明使用美国洛杉矶高速路网收集的交通速度数据集METR-LA和美国旧金山港湾区的高速路网收集的交通速度数据集PEMS-BAY,以及美国加利福尼亚州的高速路网收集的四个交通流量数据集PEMS03、PEMS04、PEMS07和PEMS08。这些数据集的详细情况如表1所示。数据是在高速路网上每5分钟取一个样本的采样率,并采用Z-Score归一化。交通图邻接矩阵由带有阈值的路段距离通过高斯核函数构造。这六个数据集按时间顺序分为训练集、验证集和测试集,METR-LA和PEMS-BAY的划分量比值为7:1:2,PEMS03、PEMS04、PEMS07和PEMS08的划分量比值为6:2:2。
表1:六个数据集的基本信息
Figure BDA0003489006980000171
本发明遵循交通预测领域的评估标准协议,采用三个指标衡量:平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)。
本发明将提出模型于目前最先进的交通预测方法进行比较,表2分别表示在METR-LA和PEMS-BAY两个交通速度数据集上的实验结果,表3分别表示在PEMS03、PEMS04、PEMS07和PEMS08四个交通流量数据集上的实验结果,其中表3的“-”表示该方法由于实验内存不足而失败。
表2:METR-LA和PEMS-BAY交通速度数据集上的实验结果
Figure BDA0003489006980000172
表3:PEMS03、PEMS04、PEMS07和PEMS08交通流量数据集上的实验结果
Figure BDA0003489006980000181
从实验结果来看,我们提出的模型DDSTGCN(ours)在六个数据集上都优于其他模型。这说明了我们发明提出的模型的优越性能,能够更好的挖掘交通数据的时空特性。
在METR-LA和PEMS08数据集上做消融实验来测试发明所提出模型的不同组件的有效性和贡献,如表4所示。我们改变图卷积组件(GCN和DGCN)以及超图卷积组件(HGCN和DHGCN),来分别研究不同组件的贡献,以及他们构成的动态交互模块DIM的贡献。
表4:METR-LA和PEMS08数据集上的消融实验结果
Figure BDA0003489006980000191
从实验结果来看,我们发明所提出的各个组件都能很好的对模型预测产生贡献,能帮助交通预测任务实现更高精度的预测。
综上所述,我们提出的基于对偶动态图卷积的交通预测模型,能够很好的对城市交通数据进行预测,能很好的挖掘交通数据中复杂的时空相关性,从而揭示动态交通系统潜在的时空关联。

Claims (9)

1.一种基于对偶动态时空图卷积的交通预测方法,用于通过已知的历史交通数据来预测未知的未来交通数据,即已知t-T’+1时刻到t时刻的交通数据
Figure FDA0003489006970000011
从而预测t+1时刻到t+T时刻的交通数据
Figure FDA0003489006970000012
其特征在于:基于对偶动态时空图卷积网络,该网络包括输入层、动态时空层和输出层,所述的动态时空层由对偶动态时空块堆叠而成,其中,第k-1层对偶动态时空块的输出与第k层对偶动态时空块的输出相加,作为第k+1层对偶动态时空块的输入,对偶动态时空块由两个协作的时空卷积模块以及两个之间的动态交互模块构成,两个时空卷积模块分别为动态图卷积模块和动态超图卷积模块,路网图的节点特征送入动态图卷积模块,抽取路网图节点的时空特征,路网超图的超节点特征送入动态超图卷积模块,抽取超图超节点的时空特征,动态交互模块分别为动态图卷积模块和动态超图卷积模块提供动态边信息和超边信息,将路网图和超图的信息流进行双向交互流动,所述的路网图包括节点和有向边,其中,路网上的每一条道路视为一个节点,两条道路之间存在共同的路口,则这对应的两个节点之间存在有向边,边的方向用于刻画两个道路之间的车行方向,可以是双向的或者单向的,有向边两端分别为起始节点和目标节点,路网图的节点数据即道路数据,包括道路上的流量或车速;
具体包括以下步骤:
首先,将路网图的历史交通数据,送到输入层进行处理,得到路网图的节点特征;
然后,将输入层的输出送入动态时空层进行时空特征抽取;
最后,将这些时空特征输入到输出层,最后输出的即是最终的预测结果。
2.根据权利要求1所述的一种基于对偶动态时空图卷积的交通预测方法,其特征在于:路网图与路网超图的相互转换通过对偶变换操作完成,路网图中的节点即为路网超图中的超边,路网图中的有向边即为路网超图中的超节点。
3.根据权利要求2所述的一种基于对偶动态时空图卷积的交通预测方法,其特征在于:将路网图的节点特征
Figure FDA0003489006970000021
变换为路网超图的超节点特征
Figure FDA00034890069700000214
的具体过程为,将有向边的起始节点特征和目标节点特征先进行加权拼接,再拼接上有向边的两节点间的路网距离值,公式表示如下:
Figure FDA0003489006970000022
其中,
Figure FDA0003489006970000023
是由路网图历史交通数据
Figure FDA0003489006970000024
的线性变换W0计算的路网图的节点特征,历史交通数据包括道路上的流量或车速,
Figure FDA0003489006970000025
为变换后的路网超图的超节点特征,
Figure FDA0003489006970000026
是起始节点的关联矩阵,
Figure FDA0003489006970000027
是目标节点的关联矩阵,
Figure FDA0003489006970000028
是起始节点和目标节点间的路网上的距离,W1和W2是可学习的参数,
Figure FDA0003489006970000029
是元素对应乘积,[]是拼接操作。
4.根据权利要求2所述的一种基于对偶动态时空图卷积的交通预测方法,其特征在于:路网超图的超节点特征
Figure FDA00034890069700000210
对偶变换为路网图的节点特征
Figure FDA00034890069700000211
具体公式如下:
Figure FDA00034890069700000212
其中W3是可学习的参数,
Figure FDA00034890069700000213
是路网图的关联矩阵。
5.根据权利要求1所述的一种基于对偶动态时空图卷积的交通预测方法,其特征在于:动态图卷积模块用于对路网图的节点进行时空特征抽取,其输入是路网图的节点特征,输出是抽取时空特性后的新的节点特征,动态图卷积模块分别包括先抽取时间特征的Gate-TCN网络,以及后抽取空间特征的动态图卷积网络,具体工作过程如下:
首先,利用Gate-TCN网络抽取路网图节点特征的时间特征;
接着,利用动态图卷积网络来抽取路网节点数据的空间特征
Figure FDA0003489006970000031
Figure FDA0003489006970000032
Figure FDA0003489006970000033
Figure FDA0003489006970000034
Figure FDA0003489006970000035
其中Θ是可学习参数,其中不同的上下标以区分学习到的不同参数模型,
Figure FDA0003489006970000036
是动态交互模块输出的路网图的动态边权值,Reshape是将向量重塑为稀疏邻接矩阵的操作,即将边的权值填回到邻接矩阵中,N是模型的超参数,我们一般设置为N=2,输出
Figure FDA0003489006970000037
即为抽取时空特征后的路网图的节点特征。
6.根据权利要求5所述的一种基于对偶动态时空图卷积的交通预测方法,其特征在于:动态超图卷积模块用于对路网超图的超节点进行时空特征抽取,其输入是路网超图的超节点特征,输出是抽取时空特性后的新的超节点特征,动态超图卷积模块分别包括先抽取时间特征的Gate-TCN网络,以及后抽取空间特征的动态超图卷积网络,具体工作过程如下:首先是对输入的路网超图的超节点特征,进行跟上面动态图卷积模块一样的Gate-TCN网络来抽取数据的时间特征,然后将其送入动态超图卷积网络来抽取路网超图的超节点数据的空间特征
Figure FDA0003489006970000041
具体表示如下:
Figure FDA0003489006970000042
Figure FDA0003489006970000043
Figure FDA0003489006970000044
Figure FDA0003489006970000045
其中θ′是模型可学习参数,
Figure FDA0003489006970000046
是动态交互模块输出的动态超边权值,H表示路网图的关联矩阵,Dhv表示路网超图超节点的度矩阵,Dhe表示路网超图超边的度矩阵,输出
Figure FDA0003489006970000047
即为抽取时空特征后的路网超图的超节点特征。
7.根据权利要求6所述的一种基于对偶动态时空图卷积的交通预测方法,其特征在于:动态交互模块包含两条支路,分别是上方用于生成动态超图卷积的动态超边支路,和下方用于生成动态图卷积的动态边支路;
其中,
上方支路,用于生成动态超图卷积的动态超边权值GCNd(Xd),
具体如下:先对路网图的节点特征
Figure FDA0003489006970000048
在时间维度上进行平均池化操作:
Figure FDA0003489006970000049
对池化后的特征再进行图卷积建模空间变化:
Figure FDA00034890069700000410
其中A是邻接矩阵,Af=A/rowsum(A)和
Figure FDA0003489006970000051
是行规范化的邻接矩阵,右上角的n表示n次幂运算,Θf和Θb是可学习参数,其中右下角的n表示以区分不同的参数;
下方支路,用于生成动态图卷积的动态边权值
Figure FDA0003489006970000052
具体如下:
首先加权拼接路网图中每条有向边两端的节点特征作为边的初始特征:
Figure FDA0003489006970000053
其中W′1,W′2是可学习权重参数,indsrc和inddst是路网图中有向边的起始节点索引和目标节点索引,以索引出起始节点特征和目标节点特征,输出的Xh是路网图的有向边的初始特征;
然后,通过以下卷积进一步融合节点间的相关性:
Figure FDA0003489006970000054
其中Conv1×1(·)是卷积核为1×1的卷积操作,实现特征融合,获取更新后的边特征;
接下来对边进行超图卷积:
Wadp=diag(Ladp)
Figure FDA0003489006970000055
Figure FDA0003489006970000056
其中Θ是可学习参数,右下角的n表示以区分不同的参数,Ladp是可学习的权值向量,H表示路网图的关联矩阵,Dhv表示路网超图超节点的度矩阵,Dhe表示路网超图超边的度矩阵。
8.根据权利要求7所述的一种基于对偶动态时空图卷积的交通预测方法,其特征在于:将动态图卷积模块得到的路网图节点的时空特征
Figure FDA0003489006970000061
和对动态超图卷积模块得到的路网超图超节点的时空特征
Figure FDA0003489006970000062
进行对偶变换后得到的节点特征,进行拼接融合得到对偶动态时空块的输出特征
Figure FDA0003489006970000063
9.根据权利要求8所述的一种基于对偶动态时空图卷积的交通预测方法,其特征在于:输出层的工作过程如下:首先对动态时空层中所有对偶动态时空块的输出进行跳接操作,用于融合不同层次不同粒度的时空特征,然后将这些融合后的时空特征依次送入LeakyReLU和线性转换层中,得到最终的预测结果。
CN202210096933.XA 2022-01-26 2022-01-26 一种基于对偶动态时空图卷积的交通预测方法 Active CN114495500B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210096933.XA CN114495500B (zh) 2022-01-26 2022-01-26 一种基于对偶动态时空图卷积的交通预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210096933.XA CN114495500B (zh) 2022-01-26 2022-01-26 一种基于对偶动态时空图卷积的交通预测方法

Publications (2)

Publication Number Publication Date
CN114495500A true CN114495500A (zh) 2022-05-13
CN114495500B CN114495500B (zh) 2023-04-18

Family

ID=81476834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210096933.XA Active CN114495500B (zh) 2022-01-26 2022-01-26 一种基于对偶动态时空图卷积的交通预测方法

Country Status (1)

Country Link
CN (1) CN114495500B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115482656A (zh) * 2022-05-23 2022-12-16 汕头大学 一种使用空间动态图卷积网络进行交通流预测方法
CN116153089A (zh) * 2023-04-24 2023-05-23 云南大学 基于时空卷积与动态图的交通流量预测系统及方法
CN116246457A (zh) * 2022-12-16 2023-06-09 北京交通大学 基于路口联合建模的对偶图卷积网络的行程时间估计方法
CN116363874A (zh) * 2023-03-20 2023-06-30 南京理工大学 融合多模式高阶语义相关性的城市交通超图卷积预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111091712A (zh) * 2019-12-25 2020-05-01 浙江大学 一种基于循环注意力对偶图卷积网络的交通流量预测方法
CN112241814A (zh) * 2020-10-20 2021-01-19 河南大学 一种基于强化时空图神经网络的交通预测方法
CN112801404A (zh) * 2021-02-14 2021-05-14 北京工业大学 一种基于自适应空间自注意力图卷积的交通预测方法
CN113570859A (zh) * 2021-07-23 2021-10-29 江南大学 一种基于异步时空膨胀图卷积网络的交通流量预测方法
CN113935548A (zh) * 2021-11-14 2022-01-14 北京工业大学 基于图变换的动态多图卷积网络交通流量预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111091712A (zh) * 2019-12-25 2020-05-01 浙江大学 一种基于循环注意力对偶图卷积网络的交通流量预测方法
CN112241814A (zh) * 2020-10-20 2021-01-19 河南大学 一种基于强化时空图神经网络的交通预测方法
CN112801404A (zh) * 2021-02-14 2021-05-14 北京工业大学 一种基于自适应空间自注意力图卷积的交通预测方法
CN113570859A (zh) * 2021-07-23 2021-10-29 江南大学 一种基于异步时空膨胀图卷积网络的交通流量预测方法
CN113935548A (zh) * 2021-11-14 2022-01-14 北京工业大学 基于图变换的动态多图卷积网络交通流量预测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115482656A (zh) * 2022-05-23 2022-12-16 汕头大学 一种使用空间动态图卷积网络进行交通流预测方法
CN115482656B (zh) * 2022-05-23 2023-09-26 汕头大学 一种使用空间动态图卷积网络进行交通流预测方法
CN116246457A (zh) * 2022-12-16 2023-06-09 北京交通大学 基于路口联合建模的对偶图卷积网络的行程时间估计方法
CN116246457B (zh) * 2022-12-16 2024-10-08 北京交通大学 基于路口联合建模的对偶图卷积网络的行程时间估计方法
CN116363874A (zh) * 2023-03-20 2023-06-30 南京理工大学 融合多模式高阶语义相关性的城市交通超图卷积预测方法
CN116363874B (zh) * 2023-03-20 2024-04-23 南京理工大学 融合多模式高阶语义相关性的城市交通超图卷积预测方法
CN116153089A (zh) * 2023-04-24 2023-05-23 云南大学 基于时空卷积与动态图的交通流量预测系统及方法

Also Published As

Publication number Publication date
CN114495500B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
CN114495500A (zh) 一种基于对偶动态时空图卷积的交通预测方法
CN111161535B (zh) 基于注意力机制的图神经网络交通流量预测方法及系统
CN109508360B (zh) 一种基于元胞自动机的地理多元流数据时空自相关分析方法
CN114944053B (zh) 一种基于时空超图神经网络的交通流预测方法
CN113283095A (zh) 一种进化式数字孪生流域构建方法
CN113313947A (zh) 短期交通预测图卷积网络的路况评估方法
CN105279555A (zh) 一种基于进化算法的自适应学习神经网络实现方法
CN114092697B (zh) 注意力融合全局和局部深度特征的建筑立面语义分割方法
CN111583648B (zh) 融合gps数据和卡口流量数据的城市交通流量预测方法
CN113239897B (zh) 基于时空特征组合回归的人体动作评价方法
CN115829171B (zh) 一种联合时空信息和社交互动特征的行人轨迹预测方法
CN113762595A (zh) 通行时间预测模型训练方法、通行时间预测方法及设备
CN112633602B (zh) 一种基于gis地图信息的交通拥堵指数预测方法及装置
CN104850677A (zh) 基于地理信息系统的深度学习元胞自动机仿真分析方法
Calvette et al. Forecasting smart well production via deep learning and data driven optimization
CN115659275A (zh) 非结构化人机交互环境中的实时准确轨迹预测方法及系统
CN113568410A (zh) 一种异构智能体轨迹预测方法、系统、设备及介质
CN116596109A (zh) 一种基于门控时间卷积网络的交通流预测模型
Chen et al. Traffic flow prediction with parallel data
CN115862324A (zh) 一种智慧交通的时空同步图卷积神经网络及交通预测方法
CN117131979A (zh) 基于有向超图及注意力机制的交通流速度预测方法及系统
Bhaumik et al. STLGRU: Spatio-temporal lightweight graph GRU for traffic flow prediction
CN118038032A (zh) 基于超点嵌入和聚类的点云语义分割模型及其训练方法
Nie et al. Spatiotemporal Implicit Neural Representation as a Generalized Traffic Data Learner
Yang et al. A Knowledge Distillation-based Ground Feature Classification Network with Multiscale Feature Fusion in Remote Sensing Images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant