CN114692984B - 基于多步耦合图卷积网络的交通预测方法 - Google Patents
基于多步耦合图卷积网络的交通预测方法 Download PDFInfo
- Publication number
- CN114692984B CN114692984B CN202210368645.5A CN202210368645A CN114692984B CN 114692984 B CN114692984 B CN 114692984B CN 202210368645 A CN202210368645 A CN 202210368645A CN 114692984 B CN114692984 B CN 114692984B
- Authority
- CN
- China
- Prior art keywords
- graph
- time
- convolution
- traffic
- site
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008878 coupling Effects 0.000 title claims abstract description 46
- 238000010168 coupling process Methods 0.000 title claims abstract description 46
- 238000005859 coupling reaction Methods 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000004927 fusion Effects 0.000 claims abstract description 21
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 17
- 230000007246 mechanism Effects 0.000 claims abstract description 15
- 238000013528 artificial neural network Methods 0.000 claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims description 26
- 238000010586 diagram Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000002123 temporal effect Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims 1
- 238000012512 characterization method Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000001364 causal effect Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012733 comparative method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0133—Traffic data processing for classifying traffic situation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Computing Systems (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
Abstract
本发明涉及城市交通流量预测与管理技术,具体是一种基于多步耦合图卷积网络的交通预测方法。本发明包含以下步骤:(1)通过定位设备收集每次出行的起始、终止位置和时间等信息,构造出每个站点在每个时间段的流入和流出量,作为每个站点的特征表示;(2)通过每个站点的历史流量或者位置关系构建站点之间的关系图;(3)通过多步耦合图卷积学习站点的空间特征表示,捕捉站点不同层次的需求变化;(4)在不同时间段的空间特征表示基础上,利用门控循环图神经网络学习站点的时空特征,实现空间特征与时间特征的融合;(5)利用多步注意力机制从历史交通流量特征中提取有用的信息,结合编码‑解码器结构来预测未来时刻的交通流量。
Description
技术领域
本发明涉及城市交通流量预测与管理技术领域,尤其是基于多步耦合图卷积网络的交通预测方法。
背景技术
随着城市交通网络越来越复杂,建立智能交通系统,发展智能规划和调度成为解决城市交通问题的必由之路。交通流量预测作为智能交通系统的重要组成部分,不仅可以通过提前感知道路交通的拥堵情况来做出合理的疏导措施,还可以为交通管理人员提供科学决策基础,从而为旅客的出行提供安全保障。尽管交通流量预测在实现智能交通中起着重要的作用,但交通流量预测往往受诸多因素影响,如复杂的时空流数据流,动态的时间依赖关系,以及交通路网结构中不规则的时空依赖关系,使得交通需求预测任务变得具有挑战性,其主要挑战有以下三方面:
1.空间依赖性:一个位置的交通流量往往受交通路网拓扑的影响,十字路口的位置,该位置的前后交通状况。
2.动态时间依赖性:对于路网中的大部分区域,某一时刻的交通流量通常随时间动态变化,但往往表现出一定的周期性和趋势。
3.外部环境因素:在一个交通系统中,不同的环境因素对交通流量的影响程度不同。例如,大雨可能会导致整个城市的交通拥堵,但某条道路的堵塞往往只会影响该道路附近的局部交通流量。
当前解决交通流预测问题的主流方法是利用卷积神经网络和循环神经网络来捕捉交通流量中的时间和空间关系。然而利用现有技术建立的交通流量预测模型很难捕捉复杂的动态空间依赖关系,特别是不同的意思对不同层面交通流量的影响。为了解决上述问题,本发明引入了具有时间注意机制的多步耦合图卷积神经网络。首先,设计了一种多步耦合映射机制,通过多个图卷积层动态学习全局和局部交通信息,以捕捉各种因素造成的不同程度的影响。然后,将多步耦合图卷积产生的图表示送入循环神经网络,实现交通网络信息和时间特征的融合。最后将多步注意力机制与编码器-解码器结构相结合,动态预测未来的交通流。
发明内容
本发明的目的是为了克服现有技术较难捕捉交通流量预测模型复杂的动态空间依赖关系,特别是不同的因素对不同层面交通流量的影响的不足,本发明提供了基于多步耦合图卷积网络的交通预测方法来同时捕捉交通道路网络结构中不同层次的空间特征和时间依赖性。
本发明的技术方案是提供一种基于多步耦合图卷积网络的交通预测方法,所述方法通过定位设备收集每次出行的起始、终止位置和时间等信息,构造出每个站点在每个时间段的流入和流出量,作为每个站点的特征表示;通过每个站点的历史流量或者位置关系构建站点之间的关系图,以邻接矩阵形式表示;通过多步耦合图卷积学习来捕捉站点不同层次的需求变化,获得站点的空间特征表示;利用门控循环图神经网络学习站点的时空特征,实现空间特征与时间特征的融合;最后利用多步注意力机制从历史交通流量特征中提取有用的信息,结合编码-解码器结构来预测未来时刻的交通流量。
本发明的技术方案:基于多步耦合图卷积网络的交通预测方法,包括步骤如下:
(1)交通出行记录收集和数据预处理:通过GPS和北斗等位置定位设备收集每次出行的起始、终止位置和时间等信息,对于有固定停车点的出行流量预测,则以停车点为站点;对于没有固定停车点的交通出行预测,则通过聚类算法聚类出行的起始和终止位置,构造出虚拟停车站点;然后进行站点流量预测;每个站点在每个时间段的特征可表示为Xt∈RNxd,其中N为站点数目,d为站点的特征数目;
(2)站点关系图构造:将整个城市的交通网络可以表示为一个图G=(V,E),其中V为站点集合,Xt为站点集合V在t时刻的特征表示,E为站点之间的连接边集合,站点之间流量相似度视为边的权重;对于站点与站点之间的联系,可以定义一个邻接矩阵A0来编码站点间的初始依赖关系,即其中ta表示第一个时间步所有站点的特征,τ为时间步长,F1为映射函数;
(3)多步耦合图卷积站点空间特征提取:基于多步耦合图卷积站点空间特征学习,首先要学习每一步的空间特征Zm+1,其学习公式为
其中Zm+1表示第m+1步耦合图卷积学习后获得的站点特征矩阵,当m=0时,即Z0=Xt,即初始站点特征表示,表示在第m步耦合图卷积后的特征表示Zm上以为参数在图G上做图卷积;其具体计算方法为其中k为卷积层数,Am为第m步耦合图卷积所用的图表示,即邻接矩阵,为第m步耦合图卷积参数;然后,在获得每一个步的空间特征表示{Z1,Z2,...,ZM}后,通过多层次聚合获得在t时间段的特征表示ht,其公式表示为
其中αm为归一化参数,Wα和bα为需要学习的参数。
(4)基于门控循环图卷积网络时空特征融合学习:在不同时间段的空间特征表示基础上,利用门控循环图神经网络学习站点的时空特征,实现空间特征与时间特征的融合,其具体操作为
r(t)=σ(Θr*G[h(t),H(t-1)]+br)
u(t)=σ(Θu*G[h(t),H(t-1)]+bu)
c(t)=tanh(Θc*G[h(t),(r(t)⊙H(t-1))]+bc)
H(t)=u(t)⊙H(t-1)+(1-u(t))⊙c(t)
其中,*G[h(t),H(t-1)]表示在图G上进行卷积操作,h(t)和H(t-1)为卷积输入向量,h(t)表示第t个时间步的站点空间特征,H(t-1)为第t-1步输出的时空融合特征。e表示按元素做乘积,σ表示激活函数,r(t)为重置门,u(t)为更新门,c(t)为临时变量,Θr,Θu,Θc为门控循环图卷积网络需要学习的参数,br,bu和bc为偏置参数,也是需要随着网络一起学习得到。
(5)基于多步时间注意力交通流量预测:利用多步注意力机制从历史交通流量特征中提取有用的信息,结合编码-解码器结构来预测未来时刻的交通流量,其表示为
其中Ht为基于门控循环图卷积网络时空特征融合学习在第t个时间段的时空特征融合学习,Xt+1,Xt+2,...,XQ为需要预测的Q个时间段的交通流量,F2为基于多步时间注意力交通流量预测网络。
本发明提出的基于多步耦合图卷积网络的交通预测方法,以城市交通出行记录为数据基础,以停车站点或虚拟站点的流入和流出人群数量为预测对象。本发明首先通过设计多步耦合图卷积模块来提取站点在每个时间段的空间特征表示,然后把每个时间段的空间特征输入门控循环图卷积网络,实现交流流量模式的空间特征和时间特征的融合,最后设计了多步时间注意力模块来提取不同时间段特征,从而进行未来交通流量预测。
本发明与现有技术比较的有益效果是:设计了一种新的多步图卷积网络来捕捉站点的多个不同层次的特征和一种多步时间注意力机制来提取有效的时间步信息,从而提高交通流量预测的准确率。
附图说明
图1为本发明的交通流量预测流程图;
图2为本发明的出行记录格式;
图3为本发明的多步耦合图卷积站点空间特征提取流程图;
图4为本发明的基于门控循环图卷积网络时空特征融合学习结构图;
图5为本发明的基于多步时间注意力交通流量预测流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
基于多步耦合图卷积网络的交通预测方法主题思路是利用多步耦合图卷积层来动态地更新站点关系图的邻接矩阵表示,从而捕捉不同层次的需求变化。然后将多步耦合图卷积的特征表示融入门控循环图卷积网络中,实现空间特征与时间特征的融合,紧接利用多步注意力机制结合编码-解码器结构,从历史多个时刻提取交通流量特征表示来动态预测未来几个时间段的交通流量。
如图1所示,本发明的具体实施方式是,提供一种基于多步耦合图卷积网络的交通预测方法,包括如下步骤:
步骤01交通出行记录收集和数据预处理:通过GPS和北斗等位置定位设备收集每次出行的起始、终止位置和时间等信息,对于有固定停车点的出行流量预测,则以停车点为站点;对于没有固定停车点的交通出行预测,则通过聚类算法聚类出行的起始和终止位置,构造出虚拟停车站点;然后进行站点流量预测。
具体实施过程如下:在现实世界收集到的交通出行记录通常包含出行订单编号、车辆编号、用户编号、起点经纬度、终点经纬度、起始时间、终止时间等,如图2所示。对于有固定停车点的交通出行系统,本发明的目标是预测固定站点在某个时间段(例如10分钟、半小时或1小时)的流入和流出人群数量作为交通流量。对于没有固定停车点的交通出行系统,首先收集所有出行记录的经纬度信息组成一个数据集,然后采用聚类算法将出行记录的起始和终止点聚类一个多簇。本发明将每一个簇中的点形成的地理范围作为一个虚拟站点,然后预测每个虚拟站点的人群流入和流出量。站点表示为V={V1,V2,...,VN},所有站点在t时间段的交通流量可表示为Xt∈RNxd,如果预测的是流入和流出人群数量,则d=2。
步骤02站点关系图构造:将整个城市的交通网络可以表示为一个图G=(V,E),其中V为站点集合,Xt为站点集合V在t时刻的特征表示,E为站点之间的连接边集合,站点之间流量相似度视为边的权重。
具体实施过程如下:为了执行图卷积算法,先要建立站点之间的图结构。对于站点Vi,其历史出行记录可表示为其中ta表示数据记录的起始时间,τ表示数据记录时间段数量,也就是收集数据的时长,则整个数据集τ时间段的流量表示为为了捕捉不同站点间的内部相似性以及过滤掉冗余的信息,先将三维张量转换为二维矩阵,即然后通过奇异值分解方法
Xt-τ+1:t=XtΣ(Xs)T
得到时间特征矩阵Xt∈RN×ξ,站点特征矩阵Xs∈RN×ξ,Σ∈Rξ×ξ为一个对角矩阵。Xs是站点的压缩表示,其中ξ为站点特征的维度。对于Xs,通过计算第i行和第j行的相似性来作为站点i和站点j边的权重:
接着使用高斯核函数的方法来归一化两个元素之间的相似性,其计算公式定义如下:
其中ε表示标准差。矩阵A0表示站点的图结构,其中的元素表示相应的边权重。
该步骤的任务可概括为
步骤03多步耦合图卷积站点空间特征提取:在站点特征表示Xt∈RNxd和站点关系图表示A0基础上,通过多步耦合图卷积学习获得站点空间特征ht,其结构如图3所示。
具体实施过程如下:基于多步耦合图卷积站点空间特征学习,首先要学习每一步的空间特征Zm+1,其学习公式为
其中Zm+1表示第m步耦合图卷积学习后获得的站点特征矩阵,当m=0时,Z0=Xt,即初始站点特征表示;表示在第m步耦合图卷积后的特征表示Zm上以为参数在图G上做图卷积;其具体计算方法为其中k为卷积层数,Am为第m步耦合图卷积所用的图表示,即邻接矩阵,为第m步耦合图卷积参数。基于多步耦合图卷积的重要特点是在学习站点空间特征表示时,通过多步耦合来更新邻接矩阵Am,其更新公式为
在获得每一个步的空间特征表示{Z1,Z2,...,ZM}后,通过多层次聚类获得在t时间段的特征表示ht,其公式表示为
其中αm为归一化参数,Wα和bα为需要学习的参数。
步骤04基于门控循环图卷积网络时空特征融合学习:在执行门控循环图卷积网络时,利用步骤03中的多步耦合图卷积取代传统的线性特征变换来实现空间特征和时间特征的融合,其结构如图4所示。
具体实施过程如下:在不同时间段的空间特征表示基础上,利用门控循环图神经网络学习站点的时空特征,实现空间特征与时间特征的融合,其具体计算过程为
r(t)=σ(Θr*G[h(t),H(t-1)]+br)
u(t)=σ(Θu*G[h(t),H(t-1)]+bu)
c(t)=tanh(Θc*G[h(t),(r(t)⊙H(t-1))]+bc)
H(t)=u(t)⊙H(t-1)+(1-u(t))⊙c(t)
其中,*G[h(t),H(t-1)]表示在图G上进行卷积操作,h(t)和H(t-1)为卷积输入向量,h(t)表示第t个时间步的站点空间特征,H(t-1)为第t-1步输出的时空融合特征。e表示按元素做乘积,σ表示激活函数,r(t)为重置门,u(t)为更新门,c(t)为临时变量,Θr,Θu,Θc为门控循环图卷积网络需要学习的参数,br,bu和bc为偏置参数,也是需要随着网络一起学习得到。得到时空特征表示H(t)是融合了前几个时间段的时空特征表示。
步骤05基于多步时间注意力交通流量预测:利用多步注意力机制从历史交通流量特征中提取有用的信息,结合编码-解码器结构来预测未来时刻的交通流量,其表示结构如图5所示。
具体实施过程如下,为了从历史时间步中选择有用的信息来学习未来的交通流,在最终的解码输出中结合了多步时间注意机制,其表示为
其中Ht为基于门控循环图卷积网络时空特征融合学习在第t个时间段的时空特征融合学习,Xt+1,Xt+2,...,XQ为需要预测的Q个时间段的交通流量,F2为基于多步时间注意力交通流量预测网络。图5为F2网络的具体结构,其目标为通过学习编码器产生的隐藏状态H(t)来更新解码器以获得一组权重首先把前P个时间步中得到的时空特征表示和时间步t的解码器输出Ht作为模块当前预测的输入。然后,把Ht和展平成向量,计算Ht与的点积,获得注意力权重,其公式如下
接着,把αk归一化:
在此基础上,通过注意力计算获得特征表示Rt,其计算公式为
最后,通过全连接网络获得t时刻的交通流量预测:
下面以纽约市的两个真实数据集--NYCTaxi和NYCBike为例:
(1)实验数据集
NYCTaxi和NYCBike的数据详情如下表1所示,对两个数据集的描述如下:
表1数据集详细
数据集 | NYCTaxi | NYCBike |
开始时间 | 4/1/2016 | 4/1/2016 |
结束时间 | 6/31/2016 | 6/31/2016 |
训练集 | 4/1/2016~6/2/2016 | 4/1/2016~6/2/2016 |
验证集 | 6/3/2016~6/16/2016 | 6/3/2016~6/16/2016 |
测试集 | 6/17/2016~6/30/2016 | 6/17/2016~6/30/2016 |
时间步 | 30(mins) | 30(mins) |
研究区域大小 | 8.42km×14.45km | 8.42km×14.45km |
站点个数 | 266 | 250 |
NYCTaxi:这个数据集包含纽约市约3500万条的出租车出行记录。时间跨度为2016年4月1日至2016年4月至6月30日。包含以下的信息:上车时间,送达时间,上车经度,上车纬度,下车经度,下车纬度,行程距离。在这些数据中,我们将2016年4月1日至2016年6月2日的数据作为训练集,2016年6月3日至2016年6月16日的数据作为验证集,2016年6月17日至2016年6月30日的数据集作为测试集。
NYCBike:该数据集包含纽约市人们每天使用的共享自行车订单记录。我们选择交易时间为2016年4月1日至2016年4月至6月30日共91天。数据集包含以下信息:自行车驱车点,自行车落车点,自行车取车时间,自行车落车时间,行程持续时间等。数据集的划分情况与NYCTaxi一致。
(2)数据集处理
我们对数据集进行了预处理,以生成图结构数据。数据集的研究区域为8.42km×14.45km的矩形区域,覆盖纽约西部、曼哈顿和部分布鲁克林地区。NYC Bike数据集是有站式的,每一个仓库都被视为一个车站。我们将点单较少的站点过滤了,最终留下订单最多的250个站点。基于无站式的NYCTaxi数据,这类交通运输往往没有固定的车站,旅客达到离开的地点是离散的。但他们通常聚集在特定的地方。例如,在学校门口有很多的出租车订单需求,这样就自然形成了一个虚拟车站。对于无站点式交通运输,发现潜在的交通车站有助于捕捉交通需求特征。本文采用文献【Clustering by fast search and find of densitypeaks】中基于密度峰值聚类(DPC)的方法,我们最终构造出266个虚拟车站。
两个数据集的时间戳均为0.5小时,所有站点的流量都是经过标准化处理的。每个站点的特征维数D为2,分别为上车需求和下车需求。历史时间步和预测时间步均为12,车站的特征ξ值为20。
(3)对比模型
为了检验模型的性能优越性,我们采用以下对比模型进行实验比较:
①HA;通过计算历史平均流量值来预测相应时隙的进出流量。例如,周三上午10:00-10:30的流量是上周三上午10:00-10:30时间段的流量平均值。
②Xgboost:一种梯度增强回归树技术。通过建立K个回归树进行交通流量预测。
③FC-LSTM:一种全连接网络和长短期记忆网络的组合方法。
④DCRNN:使用双向随机游走来捕获空间依赖性,并利用带有调度采样的编码器-解码器结构来提取交通流的时间依赖性方法。
⑤STGCN:一种处理结构化时间序列数据的通用框架,该框架不仅可以解决交通流预测问题,还可以应用于更一般的时空序列学习任务。
⑥STG2Seq:一种使用基于图卷积的编码器-解码器方法,该方法可以对城市范围内的多时间步乘车需求预测进行建模。
⑦GWNet:一种能同时有效获取时空依赖关系的框架。该框架的核心思想是将扩展因果卷积与图卷积融合,然后每个图卷积层可以处理扩展因果卷积提取的每个节点信息在不同粒度的空间依赖性。
⑧CCRNN:提供了一种分层耦合机制,通过将上层邻接矩阵与下层邻接矩阵关联起来,自适应地更新每一层的邻接矩阵。
(2)评价指标
在评估模型中,我们使用的评判标准为均方根差(root mean square error,缩写RMSE),平均绝对值误差(Mean Absolute Error,缩写MAE)和皮尔逊相关系数(PCC),他们的计算公式如下:
(4)实验结果比对
具体实验结果如表2所示:
表2本发明和对比方法在两个数据集上的结果
上表显示了在数据集NYCTaxi和NYCBike上不同对比模型下的比较结果。从表2可以看出,在NYCTaxi数据集上,本发明的RMSE、MAE和PCC比最好的模型分别提升了0.50%,0.29%和0.0046%。在NYCBike数据集中,本发明的RMSE、MAE和PCC比最好的模型分别提升了0.0696%,0.0264%和0.0105%。这一结果显示了多步耦合和时间注意力机制的有效性。
模型HA,XGBoost,FC-LSTM总体预测效果较差,原因可能在于这些模型仅使用了时间相关性进行建模,而没有捕捉到真实数据结构中的空间信息。在NYCTaxi数据集中,虽然STGCN比XGBoost的RMSE要高,但STGCN的两个相关性要比XGBoost要好,原因可能是STGCN能够自主学习时间和空间的关联性。GraphWaveNet和MCConvAtt模型都用到了自适应邻接矩阵,本发明各项指标均优于GraphWaveNet,原因在于本发明能够利用多步耦合策略获取更精确特征信息,能够从上几层的邻接矩阵中学习更新图的邻接矩阵,从而提高预测的效果。在解码器端的输出添加注意力机制,能够捕捉多步的时间依赖关系,因此本发明的结果表现要优于CCRNN。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的保护范围由所附权利要求及其等同物限定。
Claims (4)
1.基于多步耦合图卷积网络的交通预测方法,其特征在于,包括如下内容:
(1)交通出行记录收集和数据预处理:通过GPS和北斗定位设备收集到每次出行的起始、终止位置和时间信息,对于有固定停车点的出行流量预测,则以停车点为站点;对于没有固定停车点的交通出行预测,则通过聚类算法聚合出行的起始和终止位置,构造出虚拟停车站点;然后进行站点流量预测;每个站点在每个时间段的特征可表示为Xt∈RNxd,其中N为站点数目,d为站点的特征数目;
(2)站点关系图构造:将整个城市的交通网络表示为一个图G=(V,E),其中V为站点集合,Xt为站点集合V在t时刻的特征表示,E为站点之间的连接边集合,站点之间流量相似度视为边的权重;对于站点与站点之间的联系,可以定义一个邻接矩阵A0来编码站点间的初始依赖关系,即其中ta表示第一个时间步所有站点的特征,τ为时间步长,F1为映射函数;
(3)多步耦合图卷积站点空间特征提取:基于多步耦合图卷积站点空间特征学习,首先要学习每一步的空间特征Zm+1,其学习公式为
其中Zm+1表示第m+1步耦合图卷积学习后获得的站点特征矩阵,当m=0时,即Z0=Xt,即初始站点特征表示,表示在第m步耦合图卷积后的特征表示Zm上以为参数在图G上做图卷积;其具体计算方法为其中k为卷积层数,Am为第m步耦合图卷积所用的图表示,即邻接矩阵,为第m 步耦合图卷积参数;然后,在获得每一个步的空间特征表示{Z1,Z2,...,ZM}后,通过多层次聚类获得在t时间段的特征表示ht,其公式表示为
其中αm为归一化参数,Wα和bα为需要学习的参数;(4)基于门控循环图卷积网络时空特征融合学习:在不同时间段的空间特征表示基础上,利用门控循环图神经网络学习站点的时空特征,实现空间特征与时间特征的融合,其具体操作为
r(t)=σ(Θr*G[h(t),H(t-1)]+br)
u(t)=σ(Θu*G[h(t),H(t-1)]+bu)
c(t)=tanh(Θc*G[h(t),(r(t)⊙H(t-1))]+bc)
H(t)=u(t)⊙H(t-1)+(1-u(t))⊙c(t)
其中,*G[h(t),H(t-1)]表示在图G上进行卷积操作,h(t)和H(t-1)为卷积输入向量,h(t)表示第t个时间步的站点空间特征,H(t-1)为第t-1步输出的时空融合特征,e表示按元素做乘积,σ表示激活函数,r(t)为重置门,u(t)为更新门,c(t)为临时变量,Θr,Θu,Θc为门控循环图卷积网络需要学习的参数,br,bu和bc为偏置参数,也是需要随着网络一起学习得到;
(5)基于多步时间注意力交通流量预测:利用多步注意力机制从历史交通流量特征中提取有用的信息,结合编码-解码器结构来预测未来时刻的交通流量,其表示为
其中Ht为基于门控循环图卷积网络时空特征融合学习在第t个时间段的时空特征融合学习,Xt+1,Xt+2,...,XQ为需要预测的Q个时间段的交通流量,F2为基于多步时间注意力交通流量预测网络。
3.根据权利要求1所述的基于多步耦合图卷积网络的交通预测方法,其特征在于,所述门控循环图卷积网络中的特征变换采用的是多步耦合图卷积变换。
4.根据权利要求1所述的基于多步耦合图卷积网络的交通预测方法,其特征在于,所述基于多步时间注意力交通流量预测采用多步时间注意力机制,即在编码器中的P个历史隐藏状态中选择有用的信息,来更新解码器的输出,并将其作为下一个解码器的输入,依次将前一个输出作为下一个解码器的输入来更新解码器的输出,最终得到所有预测输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210368645.5A CN114692984B (zh) | 2022-04-09 | 2022-04-09 | 基于多步耦合图卷积网络的交通预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210368645.5A CN114692984B (zh) | 2022-04-09 | 2022-04-09 | 基于多步耦合图卷积网络的交通预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114692984A CN114692984A (zh) | 2022-07-01 |
CN114692984B true CN114692984B (zh) | 2023-02-07 |
Family
ID=82142208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210368645.5A Active CN114692984B (zh) | 2022-04-09 | 2022-04-09 | 基于多步耦合图卷积网络的交通预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114692984B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115578852B (zh) * | 2022-07-14 | 2024-06-14 | 西北师范大学 | 一种基于dstgcn的交通预测方法 |
CN115410386B (zh) * | 2022-09-05 | 2024-02-06 | 同盾科技有限公司 | 短时速度预测方法及装置、计算机存储介质、电子设备 |
CN115620524B (zh) * | 2022-12-15 | 2023-03-28 | 中南大学 | 一种交通拥堵预测方法、系统、设备及存储介质 |
CN116050640B (zh) * | 2023-02-01 | 2023-10-13 | 北京交通大学 | 基于自适应多图卷积的多模式交通系统短时客流预测方法 |
CN116153087A (zh) * | 2023-04-23 | 2023-05-23 | 华东交通大学 | 基于时序依赖注意力稀疏卷积的交通流量预测方法及系统 |
CN118609373A (zh) * | 2024-08-08 | 2024-09-06 | 华能信息技术有限公司 | 一种燃料调运车辆到达时间预测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801355A (zh) * | 2021-01-20 | 2021-05-14 | 南京航空航天大学 | 基于长短期时空数据多图融合时空注意力的数据预测方法 |
CN113688253A (zh) * | 2021-08-12 | 2021-11-23 | 浙江大学 | 一种层次感知的时态知识图谱表示学习方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113487088B (zh) * | 2021-07-06 | 2024-09-13 | 哈尔滨工业大学(深圳) | 基于动态时空图卷积注意力模型的交通预测方法及装置 |
-
2022
- 2022-04-09 CN CN202210368645.5A patent/CN114692984B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801355A (zh) * | 2021-01-20 | 2021-05-14 | 南京航空航天大学 | 基于长短期时空数据多图融合时空注意力的数据预测方法 |
CN113688253A (zh) * | 2021-08-12 | 2021-11-23 | 浙江大学 | 一种层次感知的时态知识图谱表示学习方法 |
Non-Patent Citations (2)
Title |
---|
A Sparse Gating Convolutional Recurrent Network for Traffic;Xiaohui Huang等;《Mathematical Problems in Engineering》;20220222;第1-14页 * |
松耦合图卷积文本分类网络;肖驰等;《小型微型计算机系统》;20210312;第42卷(第3期);第449-453页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114692984A (zh) | 2022-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114692984B (zh) | 基于多步耦合图卷积网络的交通预测方法 | |
Liu et al. | Contextualized spatial–temporal network for taxi origin-destination demand prediction | |
Du et al. | Deep irregular convolutional residual LSTM for urban traffic passenger flows prediction | |
CN109697852B (zh) | 基于时序交通事件的城市道路拥堵程度预测方法 | |
Chu et al. | Deep multi-scale convolutional LSTM network for travel demand and origin-destination predictions | |
Zheng et al. | Parking availability prediction for sensor-enabled car parks in smart cities | |
He et al. | Multi-graph convolutional-recurrent neural network (MGC-RNN) for short-term forecasting of transit passenger flow | |
CN112489426B (zh) | 一种基于图卷积神经网络的城市交通流量时空预测方案 | |
CN114330868A (zh) | 基于自注意力的个性化增强图卷积网络的客流预测方法 | |
CN115440032B (zh) | 一种长短期公共交通流量预测方法 | |
EP4016412A1 (en) | Traffic prediction | |
CN111242395B (zh) | 用于od数据的预测模型构建方法及装置 | |
CN116895157A (zh) | 一种基于趋势时空图卷积的交通流量预测方法、系统及介质 | |
CN113762338A (zh) | 一种基于多重图注意力机制的交通流预测方法、设备及介质 | |
CN115565369A (zh) | 一种基于超图的时空超图卷积交通流量预测方法及系统 | |
CN112488185A (zh) | 包含时空特性的车辆运行参数预测方法,系统,电子设备及可读存储介质 | |
CN111815075B (zh) | 一种重大公共卫生事件下交通出行需求的预测方法 | |
Huang et al. | A multi-mode traffic flow prediction method with clustering based attention convolution LSTM | |
Lee et al. | A dual attention-based recurrent neural network for short-term bike sharing usage demand prediction | |
Bao et al. | Forecasting network-wide multi-step metro ridership with an attention-weighted multi-view graph to sequence learning approach | |
Huang et al. | Multistep coupled graph convolution with temporal-attention for traffic flow prediction | |
Wu et al. | Learning spatial–temporal pairwise and high-order relationships for short-term passenger flow prediction in urban rail transit | |
CN116665448A (zh) | 一种基于图卷积网络的交通速度实时预测方法及系统 | |
Sun et al. | Alleviating data sparsity problems in estimated time of arrival via auxiliary metric learning | |
CN115860798A (zh) | 一种城市出租车需求预测系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240830 Address after: 230000 b-1018, Woye Garden commercial office building, 81 Ganquan Road, Shushan District, Hefei City, Anhui Province Patentee after: HEFEI WISDOM DRAGON MACHINERY DESIGN Co.,Ltd. Country or region after: China Address before: No.808, Shuanggang East Street, Qingshanhu District, Nanchang City, Jiangxi Province Patentee before: East China Jiaotong University Country or region before: China |
|
TR01 | Transfer of patent right |