CN114692984B - 基于多步耦合图卷积网络的交通预测方法 - Google Patents

基于多步耦合图卷积网络的交通预测方法 Download PDF

Info

Publication number
CN114692984B
CN114692984B CN202210368645.5A CN202210368645A CN114692984B CN 114692984 B CN114692984 B CN 114692984B CN 202210368645 A CN202210368645 A CN 202210368645A CN 114692984 B CN114692984 B CN 114692984B
Authority
CN
China
Prior art keywords
graph
time
convolution
traffic
site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210368645.5A
Other languages
English (en)
Other versions
CN114692984A (zh
Inventor
黄晓辉
叶裕明
凌嘉壕
蓝缘春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Wisdom Dragon Machinery Design Co ltd
Original Assignee
East China Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Jiaotong University filed Critical East China Jiaotong University
Priority to CN202210368645.5A priority Critical patent/CN114692984B/zh
Publication of CN114692984A publication Critical patent/CN114692984A/zh
Application granted granted Critical
Publication of CN114692984B publication Critical patent/CN114692984B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0133Traffic data processing for classifying traffic situation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Computing Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)

Abstract

本发明涉及城市交通流量预测与管理技术,具体是一种基于多步耦合图卷积网络的交通预测方法。本发明包含以下步骤:(1)通过定位设备收集每次出行的起始、终止位置和时间等信息,构造出每个站点在每个时间段的流入和流出量,作为每个站点的特征表示;(2)通过每个站点的历史流量或者位置关系构建站点之间的关系图;(3)通过多步耦合图卷积学习站点的空间特征表示,捕捉站点不同层次的需求变化;(4)在不同时间段的空间特征表示基础上,利用门控循环图神经网络学习站点的时空特征,实现空间特征与时间特征的融合;(5)利用多步注意力机制从历史交通流量特征中提取有用的信息,结合编码‑解码器结构来预测未来时刻的交通流量。

Description

基于多步耦合图卷积网络的交通预测方法
技术领域
本发明涉及城市交通流量预测与管理技术领域,尤其是基于多步耦合图卷积网络的交通预测方法。
背景技术
随着城市交通网络越来越复杂,建立智能交通系统,发展智能规划和调度成为解决城市交通问题的必由之路。交通流量预测作为智能交通系统的重要组成部分,不仅可以通过提前感知道路交通的拥堵情况来做出合理的疏导措施,还可以为交通管理人员提供科学决策基础,从而为旅客的出行提供安全保障。尽管交通流量预测在实现智能交通中起着重要的作用,但交通流量预测往往受诸多因素影响,如复杂的时空流数据流,动态的时间依赖关系,以及交通路网结构中不规则的时空依赖关系,使得交通需求预测任务变得具有挑战性,其主要挑战有以下三方面:
1.空间依赖性:一个位置的交通流量往往受交通路网拓扑的影响,十字路口的位置,该位置的前后交通状况。
2.动态时间依赖性:对于路网中的大部分区域,某一时刻的交通流量通常随时间动态变化,但往往表现出一定的周期性和趋势。
3.外部环境因素:在一个交通系统中,不同的环境因素对交通流量的影响程度不同。例如,大雨可能会导致整个城市的交通拥堵,但某条道路的堵塞往往只会影响该道路附近的局部交通流量。
当前解决交通流预测问题的主流方法是利用卷积神经网络和循环神经网络来捕捉交通流量中的时间和空间关系。然而利用现有技术建立的交通流量预测模型很难捕捉复杂的动态空间依赖关系,特别是不同的意思对不同层面交通流量的影响。为了解决上述问题,本发明引入了具有时间注意机制的多步耦合图卷积神经网络。首先,设计了一种多步耦合映射机制,通过多个图卷积层动态学习全局和局部交通信息,以捕捉各种因素造成的不同程度的影响。然后,将多步耦合图卷积产生的图表示送入循环神经网络,实现交通网络信息和时间特征的融合。最后将多步注意力机制与编码器-解码器结构相结合,动态预测未来的交通流。
发明内容
本发明的目的是为了克服现有技术较难捕捉交通流量预测模型复杂的动态空间依赖关系,特别是不同的因素对不同层面交通流量的影响的不足,本发明提供了基于多步耦合图卷积网络的交通预测方法来同时捕捉交通道路网络结构中不同层次的空间特征和时间依赖性。
本发明的技术方案是提供一种基于多步耦合图卷积网络的交通预测方法,所述方法通过定位设备收集每次出行的起始、终止位置和时间等信息,构造出每个站点在每个时间段的流入和流出量,作为每个站点的特征表示;通过每个站点的历史流量或者位置关系构建站点之间的关系图,以邻接矩阵形式表示;通过多步耦合图卷积学习来捕捉站点不同层次的需求变化,获得站点的空间特征表示;利用门控循环图神经网络学习站点的时空特征,实现空间特征与时间特征的融合;最后利用多步注意力机制从历史交通流量特征中提取有用的信息,结合编码-解码器结构来预测未来时刻的交通流量。
本发明的技术方案:基于多步耦合图卷积网络的交通预测方法,包括步骤如下:
(1)交通出行记录收集和数据预处理:通过GPS和北斗等位置定位设备收集每次出行的起始、终止位置和时间等信息,对于有固定停车点的出行流量预测,则以停车点为站点;对于没有固定停车点的交通出行预测,则通过聚类算法聚类出行的起始和终止位置,构造出虚拟停车站点;然后进行站点流量预测;每个站点在每个时间段的特征可表示为Xt∈RNxd,其中N为站点数目,d为站点的特征数目;
(2)站点关系图构造:将整个城市的交通网络可以表示为一个图G=(V,E),其中V为站点集合,Xt为站点集合V在t时刻的特征表示,E为站点之间的连接边集合,站点之间流量相似度视为边的权重;对于站点与站点之间的联系,可以定义一个邻接矩阵A0来编码站点间的初始依赖关系,即
Figure GDA0003965338920000031
其中ta表示第一个时间步所有站点的特征,τ为时间步长,F1为映射函数;
(3)多步耦合图卷积站点空间特征提取:基于多步耦合图卷积站点空间特征学习,首先要学习每一步的空间特征Zm+1,其学习公式为
Figure GDA0003965338920000032
其中Zm+1表示第m+1步耦合图卷积学习后获得的站点特征矩阵,当m=0时,即Z0=Xt,即初始站点特征表示,
Figure GDA0003965338920000033
表示在第m步耦合图卷积后的特征表示Zm上以
Figure GDA0003965338920000034
为参数在图G上做图卷积;其具体计算方法为
Figure GDA0003965338920000035
其中k为卷积层数,Am为第m步耦合图卷积所用的图表示,即邻接矩阵,
Figure GDA0003965338920000036
为第m步耦合图卷积参数;然后,在获得每一个步的空间特征表示{Z1,Z2,...,ZM}后,通过多层次聚合获得在t时间段的特征表示ht,其公式表示为
Figure GDA0003965338920000037
Figure GDA0003965338920000038
其中αm为归一化参数,Wα和bα为需要学习的参数。
(4)基于门控循环图卷积网络时空特征融合学习:在不同时间段的空间特征表示基础上,利用门控循环图神经网络学习站点的时空特征,实现空间特征与时间特征的融合,其具体操作为
r(t)=σ(Θr*G[h(t),H(t-1)]+br)
u(t)=σ(Θu*G[h(t),H(t-1)]+bu)
c(t)=tanh(Θc*G[h(t),(r(t)⊙H(t-1))]+bc)
H(t)=u(t)⊙H(t-1)+(1-u(t))⊙c(t)
其中,*G[h(t),H(t-1)]表示在图G上进行卷积操作,h(t)和H(t-1)为卷积输入向量,h(t)表示第t个时间步的站点空间特征,H(t-1)为第t-1步输出的时空融合特征。e表示按元素做乘积,σ表示激活函数,r(t)为重置门,u(t)为更新门,c(t)为临时变量,Θr,Θu,Θc为门控循环图卷积网络需要学习的参数,br,bu和bc为偏置参数,也是需要随着网络一起学习得到。
(5)基于多步时间注意力交通流量预测:利用多步注意力机制从历史交通流量特征中提取有用的信息,结合编码-解码器结构来预测未来时刻的交通流量,其表示为
Figure GDA0003965338920000041
其中Ht为基于门控循环图卷积网络时空特征融合学习在第t个时间段的时空特征融合学习,Xt+1,Xt+2,...,XQ为需要预测的Q个时间段的交通流量,F2为基于多步时间注意力交通流量预测网络。
本发明提出的基于多步耦合图卷积网络的交通预测方法,以城市交通出行记录为数据基础,以停车站点或虚拟站点的流入和流出人群数量为预测对象。本发明首先通过设计多步耦合图卷积模块来提取站点在每个时间段的空间特征表示,然后把每个时间段的空间特征输入门控循环图卷积网络,实现交流流量模式的空间特征和时间特征的融合,最后设计了多步时间注意力模块来提取不同时间段特征,从而进行未来交通流量预测。
本发明与现有技术比较的有益效果是:设计了一种新的多步图卷积网络来捕捉站点的多个不同层次的特征和一种多步时间注意力机制来提取有效的时间步信息,从而提高交通流量预测的准确率。
附图说明
图1为本发明的交通流量预测流程图;
图2为本发明的出行记录格式;
图3为本发明的多步耦合图卷积站点空间特征提取流程图;
图4为本发明的基于门控循环图卷积网络时空特征融合学习结构图;
图5为本发明的基于多步时间注意力交通流量预测流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
基于多步耦合图卷积网络的交通预测方法主题思路是利用多步耦合图卷积层来动态地更新站点关系图的邻接矩阵表示,从而捕捉不同层次的需求变化。然后将多步耦合图卷积的特征表示融入门控循环图卷积网络中,实现空间特征与时间特征的融合,紧接利用多步注意力机制结合编码-解码器结构,从历史多个时刻提取交通流量特征表示来动态预测未来几个时间段的交通流量。
如图1所示,本发明的具体实施方式是,提供一种基于多步耦合图卷积网络的交通预测方法,包括如下步骤:
步骤01交通出行记录收集和数据预处理:通过GPS和北斗等位置定位设备收集每次出行的起始、终止位置和时间等信息,对于有固定停车点的出行流量预测,则以停车点为站点;对于没有固定停车点的交通出行预测,则通过聚类算法聚类出行的起始和终止位置,构造出虚拟停车站点;然后进行站点流量预测。
具体实施过程如下:在现实世界收集到的交通出行记录通常包含出行订单编号、车辆编号、用户编号、起点经纬度、终点经纬度、起始时间、终止时间等,如图2所示。对于有固定停车点的交通出行系统,本发明的目标是预测固定站点在某个时间段(例如10分钟、半小时或1小时)的流入和流出人群数量作为交通流量。对于没有固定停车点的交通出行系统,首先收集所有出行记录的经纬度信息组成一个数据集,然后采用聚类算法将出行记录的起始和终止点聚类一个多簇。本发明将每一个簇中的点形成的地理范围作为一个虚拟站点,然后预测每个虚拟站点的人群流入和流出量。站点表示为V={V1,V2,...,VN},所有站点在t时间段的交通流量可表示为Xt∈RNxd,如果预测的是流入和流出人群数量,则d=2。
步骤02站点关系图构造:将整个城市的交通网络可以表示为一个图G=(V,E),其中V为站点集合,Xt为站点集合V在t时刻的特征表示,E为站点之间的连接边集合,站点之间流量相似度视为边的权重。
具体实施过程如下:为了执行图卷积算法,先要建立站点之间的图结构。对于站点Vi,其历史出行记录可表示为
Figure GDA0003965338920000061
其中ta表示数据记录的起始时间,τ表示数据记录时间段数量,也就是收集数据的时长,则整个数据集τ时间段的流量表示为
Figure GDA0003965338920000062
为了捕捉不同站点间的内部相似性以及过滤掉冗余的信息,先将三维张量转换为二维矩阵,即
Figure GDA0003965338920000063
然后通过奇异值分解方法
Xt-τ+1:t=XtΣ(Xs)T
得到时间特征矩阵Xt∈RN×ξ,站点特征矩阵Xs∈RN×ξ,Σ∈Rξ×ξ为一个对角矩阵。Xs是站点的压缩表示,其中ξ为站点特征的维度。对于Xs,通过计算第i行和第j行的相似性来作为站点i和站点j边的权重:
Figure GDA0003965338920000071
接着使用高斯核函数的方法来归一化两个元素之间的相似性,其计算公式定义如下:
Figure GDA0003965338920000072
其中ε表示标准差。矩阵A0表示站点的图结构,其中的元素表示相应的边权重。
该步骤的任务可概括为
Figure GDA0003965338920000073
其中
Figure GDA0003965338920000074
为历史流量数据,F1代表整个变换过程,A0为站点之间的图结构。
步骤03多步耦合图卷积站点空间特征提取:在站点特征表示Xt∈RNxd和站点关系图表示A0基础上,通过多步耦合图卷积学习获得站点空间特征ht,其结构如图3所示。
具体实施过程如下:基于多步耦合图卷积站点空间特征学习,首先要学习每一步的空间特征Zm+1,其学习公式为
Figure GDA0003965338920000075
其中Zm+1表示第m步耦合图卷积学习后获得的站点特征矩阵,当m=0时,Z0=Xt,即初始站点特征表示;
Figure GDA0003965338920000076
表示在第m步耦合图卷积后的特征表示Zm上以
Figure GDA0003965338920000077
为参数在图G上做图卷积;其具体计算方法为
Figure GDA0003965338920000078
其中k为卷积层数,Am为第m步耦合图卷积所用的图表示,即邻接矩阵,
Figure GDA0003965338920000079
为第m步耦合图卷积参数。基于多步耦合图卷积的重要特点是在学习站点空间特征表示时,通过多步耦合来更新邻接矩阵Am,其更新公式为
Figure GDA00039653389200000710
即根据前面l步的邻接矩阵来更新当前的邻接矩阵表示,
Figure GDA0003965338920000081
同时为一个全连接神经网络。在为了降低空间特征表示学习的计算代价,我们把邻接矩阵Am进一步表示为两个低秩矩阵的乘积,即通过矩阵非负分解表示为
Figure GDA0003965338920000082
其中
Figure GDA0003965338920000083
Figure GDA0003965338920000084
为N×L的矩阵,L=N。因此,在多步耦合学习中,我们不直接学习邻接矩阵Am,而是通过学习
Figure GDA0003965338920000085
Figure GDA0003965338920000086
来间接获得Am
Figure GDA0003965338920000087
Figure GDA0003965338920000088
的更新过程如下:
Figure GDA0003965338920000089
Figure GDA00039653389200000810
其中W1 m-1
Figure GDA00039653389200000811
Figure GDA00039653389200000812
为要学习的参数。
在获得每一个步的空间特征表示{Z1,Z2,...,ZM}后,通过多层次聚类获得在t时间段的特征表示ht,其公式表示为
Figure GDA00039653389200000813
Figure GDA00039653389200000814
其中αm为归一化参数,Wα和bα为需要学习的参数。
步骤04基于门控循环图卷积网络时空特征融合学习:在执行门控循环图卷积网络时,利用步骤03中的多步耦合图卷积取代传统的线性特征变换来实现空间特征和时间特征的融合,其结构如图4所示。
具体实施过程如下:在不同时间段的空间特征表示基础上,利用门控循环图神经网络学习站点的时空特征,实现空间特征与时间特征的融合,其具体计算过程为
r(t)=σ(Θr*G[h(t),H(t-1)]+br)
u(t)=σ(Θu*G[h(t),H(t-1)]+bu)
c(t)=tanh(Θc*G[h(t),(r(t)⊙H(t-1))]+bc)
H(t)=u(t)⊙H(t-1)+(1-u(t))⊙c(t)
其中,*G[h(t),H(t-1)]表示在图G上进行卷积操作,h(t)和H(t-1)为卷积输入向量,h(t)表示第t个时间步的站点空间特征,H(t-1)为第t-1步输出的时空融合特征。e表示按元素做乘积,σ表示激活函数,r(t)为重置门,u(t)为更新门,c(t)为临时变量,Θr,Θu,Θc为门控循环图卷积网络需要学习的参数,br,bu和bc为偏置参数,也是需要随着网络一起学习得到。得到时空特征表示H(t)是融合了前几个时间段的时空特征表示。
步骤05基于多步时间注意力交通流量预测:利用多步注意力机制从历史交通流量特征中提取有用的信息,结合编码-解码器结构来预测未来时刻的交通流量,其表示结构如图5所示。
具体实施过程如下,为了从历史时间步中选择有用的信息来学习未来的交通流,在最终的解码输出中结合了多步时间注意机制,其表示为
Figure GDA0003965338920000091
其中Ht为基于门控循环图卷积网络时空特征融合学习在第t个时间段的时空特征融合学习,Xt+1,Xt+2,...,XQ为需要预测的Q个时间段的交通流量,F2为基于多步时间注意力交通流量预测网络。图5为F2网络的具体结构,其目标为通过学习编码器产生的隐藏状态H(t)来更新解码器以获得一组权重
Figure GDA0003965338920000092
首先把前P个时间步中得到的时空特征表示
Figure GDA0003965338920000093
和时间步t的解码器输出Ht作为模块当前预测的输入。然后,把Ht
Figure GDA0003965338920000094
展平成向量,计算Ht
Figure GDA0003965338920000101
的点积,获得注意力权重,其公式如下
Figure GDA0003965338920000102
接着,把αk归一化:
Figure GDA0003965338920000103
在此基础上,通过注意力计算获得特征表示Rt,其计算公式为
Figure GDA0003965338920000104
最后,通过全连接网络获得t时刻的交通流量预测:
Figure GDA0003965338920000105
下面以纽约市的两个真实数据集--NYCTaxi和NYCBike为例:
(1)实验数据集
NYCTaxi和NYCBike的数据详情如下表1所示,对两个数据集的描述如下:
表1数据集详细
数据集 NYCTaxi NYCBike
开始时间 4/1/2016 4/1/2016
结束时间 6/31/2016 6/31/2016
训练集 4/1/2016~6/2/2016 4/1/2016~6/2/2016
验证集 6/3/2016~6/16/2016 6/3/2016~6/16/2016
测试集 6/17/2016~6/30/2016 6/17/2016~6/30/2016
时间步 30(mins) 30(mins)
研究区域大小 8.42km×14.45km 8.42km×14.45km
站点个数 266 250
NYCTaxi:这个数据集包含纽约市约3500万条的出租车出行记录。时间跨度为2016年4月1日至2016年4月至6月30日。包含以下的信息:上车时间,送达时间,上车经度,上车纬度,下车经度,下车纬度,行程距离。在这些数据中,我们将2016年4月1日至2016年6月2日的数据作为训练集,2016年6月3日至2016年6月16日的数据作为验证集,2016年6月17日至2016年6月30日的数据集作为测试集。
NYCBike:该数据集包含纽约市人们每天使用的共享自行车订单记录。我们选择交易时间为2016年4月1日至2016年4月至6月30日共91天。数据集包含以下信息:自行车驱车点,自行车落车点,自行车取车时间,自行车落车时间,行程持续时间等。数据集的划分情况与NYCTaxi一致。
(2)数据集处理
我们对数据集进行了预处理,以生成图结构数据。数据集的研究区域为8.42km×14.45km的矩形区域,覆盖纽约西部、曼哈顿和部分布鲁克林地区。NYC Bike数据集是有站式的,每一个仓库都被视为一个车站。我们将点单较少的站点过滤了,最终留下订单最多的250个站点。基于无站式的NYCTaxi数据,这类交通运输往往没有固定的车站,旅客达到离开的地点是离散的。但他们通常聚集在特定的地方。例如,在学校门口有很多的出租车订单需求,这样就自然形成了一个虚拟车站。对于无站点式交通运输,发现潜在的交通车站有助于捕捉交通需求特征。本文采用文献【Clustering by fast search and find of densitypeaks】中基于密度峰值聚类(DPC)的方法,我们最终构造出266个虚拟车站。
两个数据集的时间戳均为0.5小时,所有站点的流量都是经过标准化处理的。每个站点的特征维数D为2,分别为上车需求和下车需求。历史时间步和预测时间步均为12,车站的特征ξ值为20。
(3)对比模型
为了检验模型的性能优越性,我们采用以下对比模型进行实验比较:
①HA;通过计算历史平均流量值来预测相应时隙的进出流量。例如,周三上午10:00-10:30的流量是上周三上午10:00-10:30时间段的流量平均值。
②Xgboost:一种梯度增强回归树技术。通过建立K个回归树进行交通流量预测。
③FC-LSTM:一种全连接网络和长短期记忆网络的组合方法。
④DCRNN:使用双向随机游走来捕获空间依赖性,并利用带有调度采样的编码器-解码器结构来提取交通流的时间依赖性方法。
⑤STGCN:一种处理结构化时间序列数据的通用框架,该框架不仅可以解决交通流预测问题,还可以应用于更一般的时空序列学习任务。
⑥STG2Seq:一种使用基于图卷积的编码器-解码器方法,该方法可以对城市范围内的多时间步乘车需求预测进行建模。
⑦GWNet:一种能同时有效获取时空依赖关系的框架。该框架的核心思想是将扩展因果卷积与图卷积融合,然后每个图卷积层可以处理扩展因果卷积提取的每个节点信息在不同粒度的空间依赖性。
⑧CCRNN:提供了一种分层耦合机制,通过将上层邻接矩阵与下层邻接矩阵关联起来,自适应地更新每一层的邻接矩阵。
(2)评价指标
在评估模型中,我们使用的评判标准为均方根差(root mean square error,缩写RMSE),平均绝对值误差(Mean Absolute Error,缩写MAE)和皮尔逊相关系数(PCC),他们的计算公式如下:
Figure GDA0003965338920000121
Figure GDA0003965338920000122
Figure GDA0003965338920000131
其中,yi
Figure GDA0003965338920000132
分别表示站点的真实需求值和预测需求值。n表示所有的预测值。
(4)实验结果比对
具体实验结果如表2所示:
表2本发明和对比方法在两个数据集上的结果
Figure GDA0003965338920000133
上表显示了在数据集NYCTaxi和NYCBike上不同对比模型下的比较结果。从表2可以看出,在NYCTaxi数据集上,本发明的RMSE、MAE和PCC比最好的模型分别提升了0.50%,0.29%和0.0046%。在NYCBike数据集中,本发明的RMSE、MAE和PCC比最好的模型分别提升了0.0696%,0.0264%和0.0105%。这一结果显示了多步耦合和时间注意力机制的有效性。
模型HA,XGBoost,FC-LSTM总体预测效果较差,原因可能在于这些模型仅使用了时间相关性进行建模,而没有捕捉到真实数据结构中的空间信息。在NYCTaxi数据集中,虽然STGCN比XGBoost的RMSE要高,但STGCN的两个相关性要比XGBoost要好,原因可能是STGCN能够自主学习时间和空间的关联性。GraphWaveNet和MCConvAtt模型都用到了自适应邻接矩阵,本发明各项指标均优于GraphWaveNet,原因在于本发明能够利用多步耦合策略获取更精确特征信息,能够从上几层的邻接矩阵中学习更新图的邻接矩阵,从而提高预测的效果。在解码器端的输出添加注意力机制,能够捕捉多步的时间依赖关系,因此本发明的结果表现要优于CCRNN。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的保护范围由所附权利要求及其等同物限定。

Claims (4)

1.基于多步耦合图卷积网络的交通预测方法,其特征在于,包括如下内容:
(1)交通出行记录收集和数据预处理:通过GPS和北斗定位设备收集到每次出行的起始、终止位置和时间信息,对于有固定停车点的出行流量预测,则以停车点为站点;对于没有固定停车点的交通出行预测,则通过聚类算法聚合出行的起始和终止位置,构造出虚拟停车站点;然后进行站点流量预测;每个站点在每个时间段的特征可表示为Xt∈RNxd,其中N为站点数目,d为站点的特征数目;
(2)站点关系图构造:将整个城市的交通网络表示为一个图G=(V,E),其中V为站点集合,Xt为站点集合V在t时刻的特征表示,E为站点之间的连接边集合,站点之间流量相似度视为边的权重;对于站点与站点之间的联系,可以定义一个邻接矩阵A0来编码站点间的初始依赖关系,即
Figure FDA0003965338910000011
其中ta表示第一个时间步所有站点的特征,τ为时间步长,F1为映射函数;
(3)多步耦合图卷积站点空间特征提取:基于多步耦合图卷积站点空间特征学习,首先要学习每一步的空间特征Zm+1,其学习公式为
Figure FDA0003965338910000012
其中Zm+1表示第m+1步耦合图卷积学习后获得的站点特征矩阵,当m=0时,即Z0=Xt,即初始站点特征表示,
Figure FDA0003965338910000013
表示在第m步耦合图卷积后的特征表示Zm上以
Figure FDA0003965338910000014
为参数在图G上做图卷积;其具体计算方法为
Figure FDA0003965338910000015
其中k为卷积层数,Am为第m步耦合图卷积所用的图表示,即邻接矩阵,
Figure FDA0003965338910000016
为第m 步耦合图卷积参数;然后,在获得每一个步的空间特征表示{Z1,Z2,...,ZM}后,通过多层次聚类获得在t时间段的特征表示ht,其公式表示为
Figure FDA0003965338910000021
Figure FDA0003965338910000022
其中αm为归一化参数,Wα和bα为需要学习的参数;(4)基于门控循环图卷积网络时空特征融合学习:在不同时间段的空间特征表示基础上,利用门控循环图神经网络学习站点的时空特征,实现空间特征与时间特征的融合,其具体操作为
r(t)=σ(Θr*G[h(t),H(t-1)]+br)
u(t)=σ(Θu*G[h(t),H(t-1)]+bu)
c(t)=tanh(Θc*G[h(t),(r(t)⊙H(t-1))]+bc)
H(t)=u(t)⊙H(t-1)+(1-u(t))⊙c(t)
其中,*G[h(t),H(t-1)]表示在图G上进行卷积操作,h(t)和H(t-1)为卷积输入向量,h(t)表示第t个时间步的站点空间特征,H(t-1)为第t-1步输出的时空融合特征,e表示按元素做乘积,σ表示激活函数,r(t)为重置门,u(t)为更新门,c(t)为临时变量,Θr,Θu,Θc为门控循环图卷积网络需要学习的参数,br,bu和bc为偏置参数,也是需要随着网络一起学习得到;
(5)基于多步时间注意力交通流量预测:利用多步注意力机制从历史交通流量特征中提取有用的信息,结合编码-解码器结构来预测未来时刻的交通流量,其表示为
Figure FDA0003965338910000023
其中Ht为基于门控循环图卷积网络时空特征融合学习在第t个时间段的时空特征融合学习,Xt+1,Xt+2,...,XQ为需要预测的Q个时间段的交通流量,F2为基于多步时间注意力交通流量预测网络。
2.根据权利要求1所述的基于多步耦合图卷积网络的交通预测方法,其特征在于,多步图卷积操作在更新关系图时需要集合前l步的关系图的信息进行当前关系图的更新,即
Figure FDA0003965338910000031
其中Am+1为新的关系图矩阵,
Figure FDA0003965338910000032
为更新函数,为一个神经网络,Am-l+1,...,Am为前l步的关系图。
3.根据权利要求1所述的基于多步耦合图卷积网络的交通预测方法,其特征在于,所述门控循环图卷积网络中的特征变换采用的是多步耦合图卷积变换。
4.根据权利要求1所述的基于多步耦合图卷积网络的交通预测方法,其特征在于,所述基于多步时间注意力交通流量预测采用多步时间注意力机制,即在编码器中的P个历史隐藏状态中选择有用的信息,来更新解码器的输出,并将其作为下一个解码器的输入,依次将前一个输出作为下一个解码器的输入来更新解码器的输出,最终得到所有预测输出。
CN202210368645.5A 2022-04-09 2022-04-09 基于多步耦合图卷积网络的交通预测方法 Active CN114692984B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210368645.5A CN114692984B (zh) 2022-04-09 2022-04-09 基于多步耦合图卷积网络的交通预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210368645.5A CN114692984B (zh) 2022-04-09 2022-04-09 基于多步耦合图卷积网络的交通预测方法

Publications (2)

Publication Number Publication Date
CN114692984A CN114692984A (zh) 2022-07-01
CN114692984B true CN114692984B (zh) 2023-02-07

Family

ID=82142208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210368645.5A Active CN114692984B (zh) 2022-04-09 2022-04-09 基于多步耦合图卷积网络的交通预测方法

Country Status (1)

Country Link
CN (1) CN114692984B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115578852B (zh) * 2022-07-14 2024-06-14 西北师范大学 一种基于dstgcn的交通预测方法
CN115410386B (zh) * 2022-09-05 2024-02-06 同盾科技有限公司 短时速度预测方法及装置、计算机存储介质、电子设备
CN115620524B (zh) * 2022-12-15 2023-03-28 中南大学 一种交通拥堵预测方法、系统、设备及存储介质
CN116050640B (zh) * 2023-02-01 2023-10-13 北京交通大学 基于自适应多图卷积的多模式交通系统短时客流预测方法
CN116153087A (zh) * 2023-04-23 2023-05-23 华东交通大学 基于时序依赖注意力稀疏卷积的交通流量预测方法及系统
CN118609373A (zh) * 2024-08-08 2024-09-06 华能信息技术有限公司 一种燃料调运车辆到达时间预测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112801355A (zh) * 2021-01-20 2021-05-14 南京航空航天大学 基于长短期时空数据多图融合时空注意力的数据预测方法
CN113688253A (zh) * 2021-08-12 2021-11-23 浙江大学 一种层次感知的时态知识图谱表示学习方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113487088B (zh) * 2021-07-06 2024-09-13 哈尔滨工业大学(深圳) 基于动态时空图卷积注意力模型的交通预测方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112801355A (zh) * 2021-01-20 2021-05-14 南京航空航天大学 基于长短期时空数据多图融合时空注意力的数据预测方法
CN113688253A (zh) * 2021-08-12 2021-11-23 浙江大学 一种层次感知的时态知识图谱表示学习方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Sparse Gating Convolutional Recurrent Network for Traffic;Xiaohui Huang等;《Mathematical Problems in Engineering》;20220222;第1-14页 *
松耦合图卷积文本分类网络;肖驰等;《小型微型计算机系统》;20210312;第42卷(第3期);第449-453页 *

Also Published As

Publication number Publication date
CN114692984A (zh) 2022-07-01

Similar Documents

Publication Publication Date Title
CN114692984B (zh) 基于多步耦合图卷积网络的交通预测方法
Liu et al. Contextualized spatial–temporal network for taxi origin-destination demand prediction
Du et al. Deep irregular convolutional residual LSTM for urban traffic passenger flows prediction
CN109697852B (zh) 基于时序交通事件的城市道路拥堵程度预测方法
Chu et al. Deep multi-scale convolutional LSTM network for travel demand and origin-destination predictions
Zheng et al. Parking availability prediction for sensor-enabled car parks in smart cities
He et al. Multi-graph convolutional-recurrent neural network (MGC-RNN) for short-term forecasting of transit passenger flow
CN112489426B (zh) 一种基于图卷积神经网络的城市交通流量时空预测方案
CN114330868A (zh) 基于自注意力的个性化增强图卷积网络的客流预测方法
CN115440032B (zh) 一种长短期公共交通流量预测方法
EP4016412A1 (en) Traffic prediction
CN111242395B (zh) 用于od数据的预测模型构建方法及装置
CN116895157A (zh) 一种基于趋势时空图卷积的交通流量预测方法、系统及介质
CN113762338A (zh) 一种基于多重图注意力机制的交通流预测方法、设备及介质
CN115565369A (zh) 一种基于超图的时空超图卷积交通流量预测方法及系统
CN112488185A (zh) 包含时空特性的车辆运行参数预测方法,系统,电子设备及可读存储介质
CN111815075B (zh) 一种重大公共卫生事件下交通出行需求的预测方法
Huang et al. A multi-mode traffic flow prediction method with clustering based attention convolution LSTM
Lee et al. A dual attention-based recurrent neural network for short-term bike sharing usage demand prediction
Bao et al. Forecasting network-wide multi-step metro ridership with an attention-weighted multi-view graph to sequence learning approach
Huang et al. Multistep coupled graph convolution with temporal-attention for traffic flow prediction
Wu et al. Learning spatial–temporal pairwise and high-order relationships for short-term passenger flow prediction in urban rail transit
CN116665448A (zh) 一种基于图卷积网络的交通速度实时预测方法及系统
Sun et al. Alleviating data sparsity problems in estimated time of arrival via auxiliary metric learning
CN115860798A (zh) 一种城市出租车需求预测系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240830

Address after: 230000 b-1018, Woye Garden commercial office building, 81 Ganquan Road, Shushan District, Hefei City, Anhui Province

Patentee after: HEFEI WISDOM DRAGON MACHINERY DESIGN Co.,Ltd.

Country or region after: China

Address before: No.808, Shuanggang East Street, Qingshanhu District, Nanchang City, Jiangxi Province

Patentee before: East China Jiaotong University

Country or region before: China

TR01 Transfer of patent right