CN114692984A

CN114692984A - 基于多步耦合图卷积网络的交通预测方法

Info

Publication number: CN114692984A
Application number: CN202210368645.5A
Authority: CN
Inventors: 黄晓辉; 叶裕明; 凌嘉壕; 蓝缘春
Original assignee: East China Jiaotong University
Current assignee: East China Jiaotong University
Priority date: 2022-04-09
Filing date: 2022-04-09
Publication date: 2022-07-01
Anticipated expiration: 2042-04-09
Also published as: CN114692984B

Abstract

本发明涉及城市交通流量预测与管理技术，具体是一种基于多步耦合图卷积网络的交通预测方法。本发明包含以下步骤：(1)通过定位设备收集每次出行的起始、终止位置和时间等信息，构造出每个站点在每个时间段的流入和流出量，作为每个站点的特征表示；(2)通过每个站点的历史流量或者位置关系构建站点之间的关系图；(3)通过多步耦合图卷积学习站点的空间特征表示，捕捉站点不同层次的需求变化；(4)在不同时间段的空间特征表示基础上，利用门控循环图神经网络学习站点的时空特征，实现空间特征与时间特征的融合；(5)利用多步注意力机制从历史交通流量特征中提取有用的信息，结合编码‑解码器结构来预测未来时刻的交通流量。

Description

基于多步耦合图卷积网络的交通预测方法

技术领域

本发明涉及城市交通流量预测与管理技术领域，尤其是基于多步耦合图卷积网络的交通预测方法。

背景技术

随着城市交通网络越来越复杂，建立智能交通系统，发展智能规划和调度成为解决城市交通问题的必由之路。交通流量预测作为智能交通系统的重要组成部分，不仅可以通过提前感知道路交通的拥堵情况来做出合理的疏导措施，还可以为交通管理人员提供科学决策基础，从而为旅客的出行提供安全保障。尽管交通流量预测在实现智能交通中起着重要的作用，但交通流量预测往往受诸多因素影响，如复杂的时空流数据流，动态的时间依赖关系，以及交通路网结构中不规则的时空依赖关系，使得交通需求预测任务变得具有挑战性，其主要挑战有以下三方面：

1.空间依赖性：一个位置的交通流量往往受交通路网拓扑的影响，十字路口的位置，该位置的前后交通状况。

2.动态时间依赖性：对于路网中的大部分区域，某一时刻的交通流量通常随时间动态变化，但往往表现出一定的周期性和趋势。

3.外部环境因素：在一个交通系统中，不同的环境因素对交通流量的影响程度不同。例如，大雨可能会导致整个城市的交通拥堵，但某条道路的堵塞往往只会影响该道路附近的局部交通流量。

当前解决交通流预测问题的主流方法是利用卷积神经网络和循环神经网络来捕捉交通流量中的时间和空间关系。然而利用现有技术建立的交通流量预测模型很难捕捉复杂的动态空间依赖关系，特别是不同的意思对不同层面交通流量的影响。为了解决上述问题，本发明引入了具有时间注意机制的多步耦合图卷积神经网络。首先，设计了一种多步耦合映射机制，通过多个图卷积层动态学习全局和局部交通信息，以捕捉各种因素造成的不同程度的影响。然后，将多步耦合图卷积产生的图表示送入循环神经网络，实现交通网络信息和时间特征的融合。最后将多步注意力机制与编码器-解码器结构相结合，动态预测未来的交通流。

发明内容

本发明的目的是为了克服现有技术较难捕捉交通流量预测模型复杂的动态空间依赖关系，特别是不同的因素对不同层面交通流量的影响的不足，本发明提供了基于多步耦合图卷积网络的交通预测方法来同时捕捉交通道路网络结构中不同层次的空间特征和时间依赖性。

本发明的技术方案是提供一种基于多步耦合图卷积网络的交通预测方法，所述方法通过定位设备收集每次出行的起始、终止位置和时间等信息，构造出每个站点在每个时间段的流入和流出量，作为每个站点的特征表示；通过每个站点的历史流量或者位置关系构建站点之间的关系图，以邻接矩阵形式表示；通过多步耦合图卷积学习来捕捉站点不同层次的需求变化，获得站点的空间特征表示；利用门控循环图神经网络学习站点的时空特征，实现空间特征与时间特征的融合；最后利用多步注意力机制从历史交通流量特征中提取有用的信息，结合编码-解码器结构来预测未来时刻的交通流量。

本发明的技术方案：基于多步耦合图卷积网络的交通预测方法，包括步骤如下：

(1)交通出行记录收集和数据预处理：通过GPS和北斗等位置定位设备收集每次出行的起始、终止位置和时间等信息，对于有固定停车点的出行流量预测，则以停车点为站点；对于没有固定停车点的交通出行预测，则通过聚类算法聚类出行的起始和终止位置，构造出虚拟停车站点；然后进行站点流量预测；每个站点在每个时间段的特征可表示为X_t∈R^Nxd，其中N为站点数目，d为站点的特征数目；

(2)站点关系图构造：将整个城市的交通网络可以表示为一个图G＝(V,E)，其中V为站点集合，X_t为站点集合V在t时刻的特征表示，E为站点之间的连接边集合，站点之间流量相似度视为边的权重；对于站点与站点之间的联系，可以定义一个邻接矩阵A⁰来编码站点间的初始依赖关系,即

其中t_a表示第一个时间步所有站点的特征，τ为时间步长，F₁为映射函数；

(3)多步耦合图卷积站点空间特征提取：基于多步耦合图卷积站点空间特征学习，首先要学习每一步的空间特征Z^m+1，其学习公式为

其中Z^m+1表示第m+1步耦合图卷积学习后获得的站点特征矩阵，当m＝0时，即Z⁰＝X_t，即初始站点特征表示，

表示在第m步耦合图卷积后的特征表示Z^m上以

为参数在图G上做图卷积；其具体计算方法为

其中k为卷积层数，A^m为第m步耦合图卷积所用的图表示，即邻接矩阵，

为第m步耦合图卷积参数；然后，在获得每一个步的空间特征表示{Z¹,Z²,...,Z^M}后，通过多层次聚合获得在t时间段的特征表示h^t，其公式表示为

其中α^m为归一化参数，W_α和b_α为需要学习的参数。

(4)基于门控循环图卷积网络时空特征融合学习：在不同时间段的空间特征表示基础上，利用门控循环图神经网络学习站点的时空特征，实现空间特征与时间特征的融合，其具体操作为

H^(t)＝u^(t)⊙H^(t-1)+(1-u^(t))⊙c^(t)

其中，

表示在图G上进行卷积操作，h^(t)和H^(t-1)为卷积输入向量，h^(t)表示第t个时间步的站点空间特征，H^(t-1)为第t-1步输出的时空融合特征。⊙表示按元素做乘积，σ表示激活函数，r^(t)为重置门，u^(t)为更新门，c^(t)为临时变量，Θ_r，Θ_u，Θ_c为门控循环图卷积网络需要学习的参数，b_r，b_u和b_c为偏置参数，也是需要随着网络一起学习得到。

(5)基于多步时间注意力交通流量预测：利用多步注意力机制从历史交通流量特征中提取有用的信息，结合编码-解码器结构来预测未来时刻的交通流量，其表示为

其中H^t为基于门控循环图卷积网络时空特征融合学习在第t个时间段的时空特征融合学习，X_t+1,X_t+2,...,X_Q为需要预测的Q个时间段的交通流量，F₂为基于多步时间注意力交通流量预测网络。

本发明提出的基于多步耦合图卷积网络的交通预测方法，以城市交通出行记录为数据基础，以停车站点或虚拟站点的流入和流出人群数量为预测对象。本发明首先通过设计多步耦合图卷积模块来提取站点在每个时间段的空间特征表示，然后把每个时间段的空间特征输入门控循环图卷积网络，实现交流流量模式的空间特征和时间特征的融合，最后设计了多步时间注意力模块来提取不同时间段特征，从而进行未来交通流量预测。

本发明与现有技术比较的有益效果是：设计了一种新的多步图卷积网络来捕捉站点的多个不同层次的特征和一种多步时间注意力机制来提取有效的时间步信息，从而提高交通流量预测的准确率。

附图说明

图1为本发明的交通流量预测流程图；

图2为本发明的出行记录格式；

图3为本发明的多步耦合图卷积站点空间特征提取流程图；

图4为本发明的基于门控循环图卷积网络时空特征融合学习结构图；

图5为本发明的基于多步时间注意力交通流量预测流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

基于多步耦合图卷积网络的交通预测方法主题思路是利用多步耦合图卷积层来动态地更新站点关系图的邻接矩阵表示，从而捕捉不同层次的需求变化。然后将多步耦合图卷积的特征表示融入门控循环图卷积网络中，实现空间特征与时间特征的融合，紧接利用多步注意力机制结合编码-解码器结构，从历史多个时刻提取交通流量特征表示来动态预测未来几个时间段的交通流量。

如图1所示，本发明的具体实施方式是，提供一种基于多步耦合图卷积网络的交通预测方法，包括如下步骤：

步骤01交通出行记录收集和数据预处理：通过GPS和北斗等位置定位设备收集每次出行的起始、终止位置和时间等信息，对于有固定停车点的出行流量预测，则以停车点为站点；对于没有固定停车点的交通出行预测，则通过聚类算法聚类出行的起始和终止位置，构造出虚拟停车站点；然后进行站点流量预测。

具体实施过程如下：在现实世界收集到的交通出行记录通常包含出行订单编号、车辆编号、用户编号、起点经纬度、终点经纬度、起始时间、终止时间等，如图2所示。对于有固定停车点的交通出行系统，本发明的目标是预测固定站点在某个时间段(例如10分钟、半小时或1小时)的流入和流出人群数量作为交通流量。对于没有固定停车点的交通出行系统，首先收集所有出行记录的经纬度信息组成一个数据集，然后采用聚类算法将出行记录的起始和终止点聚类一个多簇。本发明将每一个簇中的点形成的地理范围作为一个虚拟站点，然后预测每个虚拟站点的人群流入和流出量。站点表示为V＝{V₁，V₂，…,V_N}，所有站点在t时间段的交通流量可表示为X_t∈R^Nxd，如果预测的是流入和流出人群数量，则d＝2。

步骤02站点关系图构造：将整个城市的交通网络可以表示为一个图G＝(V,E)，其中V为站点集合，X_t为站点集合V在t时刻的特征表示，E为站点之间的连接边集合，站点之间流量相似度视为边的权重。

具体实施过程如下：为了执行图卷积算法，先要建立站点之间的图结构。对于站点V_i，其历史出行记录可表示为

其中t_a表示数据记录的起始时间，τ表示数据记录时间段数量，也就是收集数据的时长，则整个数据集τ时间段的流量表示为

为了捕捉不同站点间的内部相似性以及过滤掉冗余的信息，先将三维张量转换为二维矩阵，即

然后通过奇异值分解方法

X_t-τ+1:t＝X^tΣ(X^s)^T

得到时间特征矩阵X^t∈R^N×ξ，站点特征矩阵X^s∈R^N×ξ，Σ∈R^ξ×ξ为一个对角矩阵。X^s是站点的压缩表示，其中ξ为站点特征的维度。对于X^s，通过计算第i行和第j行的相似性来作为站点i和站点j边的权重：

接着使用高斯核函数的方法来归一化两个元素之间的相似性，其计算公式定义如下：

其中ε表示标准差。矩阵A⁰表示站点的图结构，其中的元素表示相应的边权重。

该步骤的任务可概括为

其中

为历史流量数据，F1代表整个变换过程，A⁰为站点之间的图结构。

步骤03多步耦合图卷积站点空间特征提取：在站点特征表示X_t∈R^Nxd和站点关系图表示A⁰基础上，通过多步耦合图卷积学习获得站点空间特征h^t，其结构如图3所示。

具体实施过程如下：基于多步耦合图卷积站点空间特征学习，首先要学习每一步的空间特征Z^m+1，其学习公式为

其中Z^m+1表示第m步耦合图卷积学习后获得的站点特征矩阵，当m＝0时，Z⁰＝X_t，即初始站点特征表示；

表示在第m步耦合图卷积后的特征表示Z^m上以

为参数在图G上做图卷积；其具体计算方法为

为第m步耦合图卷积参数。基于多步耦合图卷积的重要特点是在学习站点空间特征表示时，通过多步耦合来更新邻接矩阵A^m，其更新公式为

即根据前面l步的邻接矩阵来更新当前的邻接矩阵表示，

同时为一个全连接神经网络。在为了降低空间特征表示学习的计算代价，我们把邻接矩阵A^m进一步表示为两个低秩矩阵的乘积，即通过矩阵非负分解表示为

其中

和

为N×L的矩阵，L＜＜N。因此，在多步耦合学习中，我们不直接学习邻接矩阵A^m，而是通过学习

和

来间接获得A^m。

和

的更新过程如下：

其中

和

为要学习的参数。

在获得每一个步的空间特征表示{Z¹,Z²,...,Z^M}后，通过多层次聚类获得在t时间段的特征表示h^t，其公式表示为

其中α^m为归一化参数，W_α和b_α为需要学习的参数。

步骤04基于门控循环图卷积网络时空特征融合学习：在执行门控循环图卷积网络时，利用步骤03中的多步耦合图卷积取代传统的线性特征变换来实现空间特征和时间特征的融合，其结构如图4所示。

具体实施过程如下：在不同时间段的空间特征表示基础上，利用门控循环图神经网络学习站点的时空特征，实现空间特征与时间特征的融合，其具体计算过程为

H^(t)＝u^(t)⊙H^(t-1)+(1-u^(t))⊙c^(t)

其中，

表示在图G上进行卷积操作，h^(t)和H^(t-1)为卷积输入向量，h^(t)表示第t个时间步的站点空间特征，H^(t-1)为第t-1步输出的时空融合特征。⊙表示按元素做乘积，σ表示激活函数，r^(t)为重置门，u^(t)为更新门，c^(t)为临时变量，Θ_r，Θ_u，Θ_c为门控循环图卷积网络需要学习的参数，b_r，b_u和b_c为偏置参数，也是需要随着网络一起学习得到。得到时空特征表示H^(t)是融合了前几个时间段的时空特征表示。

步骤05基于多步时间注意力交通流量预测：利用多步注意力机制从历史交通流量特征中提取有用的信息，结合编码-解码器结构来预测未来时刻的交通流量，其表示结构如图5所示。

具体实施过程如下，为了从历史时间步中选择有用的信息来学习未来的交通流，在最终的解码输出中结合了多步时间注意机制，其表示为

其中H^t为基于门控循环图卷积网络时空特征融合学习在第t个时间段的时空特征融合学习，X_t+1,X_t+2,...,X_Q为需要预测的Q个时间段的交通流量，F₂为基于多步时间注意力交通流量预测网络。图5为F₂网络的具体结构，其目标为通过学习编码器产生的隐藏状态H^(t)来更新解码器以获得一组权重

首先把前P个时间步中得到的时空特征表示

和时间步t的解码器输出H_t作为模块当前预测的输入。然后，把H_t和

展平成向量，计算H_t与

的点积，获得注意力权重，其公式如下

接着，把α_k归一化:

在此基础上，通过注意力计算获得特征表示R_t，其计算公式为

最后，通过全连接网络获得t时刻的交通流量预测：

下面以纽约市的两个真实数据集--NYCTaxi和NYCBike为例：

(1)实验数据集

NYCTaxi和NYCBike的数据详情如下表1所示，对两个数据集的描述如下：

表1数据集详细

数据集	NYCTaxi	NYCBike
			开始时间	4/1/2016	4/1/2016
结束时间	6/31/2016	6/31/2016
			训练集	4/1/2016～6/2/2016	4/1/2016～6/2/2016
验证集	6/3/2016～6/16/2016	6/3/2016～6/16/2016
			测试集	6/17/2016～6/30/2016	6/17/2016～6/30/2016
时间步	30(mins)	30(mins)
			研究区域大小	8.42km×14.45km	8.42km×14.45km
站点个数	266	250

NYCTaxi：这个数据集包含纽约市约3500万条的出租车出行记录。时间跨度为2016年4月1日至2016年4月至6月30日。包含以下的信息：上车时间，送达时间，上车经度，上车纬度，下车经度，下车纬度，行程距离。在这些数据中，我们将2016年4月1日至2016年6月2日的数据作为训练集，2016年6月3日至2016年6月16日的数据作为验证集，2016年6月17日至2016年6月30日的数据集作为测试集。

NYCBike：该数据集包含纽约市人们每天使用的共享自行车订单记录。我们选择交易时间为2016年4月1日至2016年4月至6月30日共91天。数据集包含以下信息：自行车驱车点，自行车落车点，自行车取车时间，自行车落车时间，行程持续时间等。数据集的划分情况与NYCTaxi一致。

(2)数据集处理

我们对数据集进行了预处理，以生成图结构数据。数据集的研究区域为8.42km×14.45km的矩形区域，覆盖纽约西部、曼哈顿和部分布鲁克林地区。NYC Bike数据集是有站式的，每一个仓库都被视为一个车站。我们将点单较少的站点过滤了，最终留下订单最多的250个站点。基于无站式的NYCTaxi数据，这类交通运输往往没有固定的车站，旅客达到离开的地点是离散的。但他们通常聚集在特定的地方。例如，在学校门口有很多的出租车订单需求，这样就自然形成了一个虚拟车站。对于无站点式交通运输，发现潜在的交通车站有助于捕捉交通需求特征。本文采用文献【Clustering by fast search and find of densitypeaks】中基于密度峰值聚类(DPC)的方法，我们最终构造出266个虚拟车站。

两个数据集的时间戳均为0.5小时，所有站点的流量都是经过标准化处理的。每个站点的特征维数D为2，分别为上车需求和下车需求。历史时间步和预测时间步均为12，车站的特征ξ值为20。

(3)对比模型

为了检验模型的性能优越性，我们采用以下对比模型进行实验比较：

①HA；通过计算历史平均流量值来预测相应时隙的进出流量。例如，周三上午10:00-10:30的流量是上周三上午10:00-10:30时间段的流量平均值。

②Xgboost：一种梯度增强回归树技术。通过建立K个回归树进行交通流量预测。

③FC-LSTM：一种全连接网络和长短期记忆网络的组合方法。

④DCRNN：使用双向随机游走来捕获空间依赖性，并利用带有调度采样的编码器-解码器结构来提取交通流的时间依赖性方法。

⑤STGCN：一种处理结构化时间序列数据的通用框架，该框架不仅可以解决交通流预测问题，还可以应用于更一般的时空序列学习任务。

⑥STG2Seq：一种使用基于图卷积的编码器-解码器方法，该方法可以对城市范围内的多时间步乘车需求预测进行建模。

⑦GWNet：一种能同时有效获取时空依赖关系的框架。该框架的核心思想是将扩展因果卷积与图卷积融合，然后每个图卷积层可以处理扩展因果卷积提取的每个节点信息在不同粒度的空间依赖性。

⑧CCRNN：提供了一种分层耦合机制，通过将上层邻接矩阵与下层邻接矩阵关联起来，自适应地更新每一层的邻接矩阵。

(2)评价指标

在评估模型中，我们使用的评判标准为均方根差(root mean square error，缩写RMSE)，平均绝对值误差(Mean Absolute Error，缩写MAE)和皮尔逊相关系数(PCC)，他们的计算公式如下：

其中，y_i，

分别表示站点的真实需求值和预测需求值。n表示所有的预测值。

(4)实验结果比对

具体实验结果如表2所示：

表2本发明和对比方法在两个数据集上的结果

上表显示了在数据集NYCTaxi和NYCBike上不同对比模型下的比较结果。从表2可以看出，在NYCTaxi数据集上，本发明的RMSE、MAE和PCC比最好的模型分别提升了0.50％，0.29％和0.0046％。在NYCBike数据集中，本发明的RMSE、MAE和PCC比最好的模型分别提升了0.0696％，0.0264％和0.0105％。这一结果显示了多步耦合和时间注意力机制的有效性。

模型HA，XGBoost，FC-LSTM总体预测效果较差，原因可能在于这些模型仅使用了时间相关性进行建模，而没有捕捉到真实数据结构中的空间信息。在NYCTaxi数据集中，虽然STGCN比XGBoost的RMSE要高，但STGCN的两个相关性要比XGBoost要好，原因可能是STGCN能够自主学习时间和空间的关联性。GraphWaveNet和MCConvAtt模型都用到了自适应邻接矩阵，本发明各项指标均优于GraphWaveNet，原因在于本发明能够利用多步耦合策略获取更精确特征信息，能够从上几层的邻接矩阵中学习更新图的邻接矩阵，从而提高预测的效果。在解码器端的输出添加注意力机制，能够捕捉多步的时间依赖关系，因此本发明的结果表现要优于CCRNN。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的保护范围由所附权利要求及其等同物限定。

Claims

1.基于多步耦合图卷积网络的交通预测方法，其特征在于，包括如下内容：

(1)交通出行记录收集和数据预处理：通过GPS和北斗等定位设备收集到每次出行的起始、终止位置和时间等信息，对于有固定停车点的出行流量预测，则以停车点为站点；对于没有固定停车点的交通出行预测，则通过聚类算法聚合出行的起始和终止位置，构造出虚拟停车站点；然后进行站点流量预测；每个站点在每个时间段的特征可表示为X_t∈R^Nxd，其中N为站点数目，d为站点的特征数目；

(2)站点关系图构造：将整个城市的交通网络表示为一个图G＝(V,E)，其中V为站点集合，X_t为站点集合V在t时刻的特征表示，E为站点之间的连接边集合，站点之间流量相似度视为边的权重；对于站点与站点之间的联系，可以定义一个邻接矩阵A⁰来编码站点间的初始依赖关系,即

其中t_a表示第一个时间步所有站点的特征，为时间步长，F₁为映射函数；

表示在第m步耦合图卷积后的特征表示Z^m上以

为参数在图G上做图卷积；其具体计算方法为

为第m步耦合图卷积参数；然后，在获得每一个步的空间特征表示{Z¹,Z²,...,Z^M}后，通过多层次聚类获得在t时间段的特征表示h^t，其公式表示为

其中α^m为归一化参数，W_α和b_α为需要学习的参数；(4)基于门控循环图卷积网络时空特征融合学习：在不同时间段的空间特征表示基础上，利用门控循环图神经网络学习站点的时空特征，实现空间特征与时间特征的融合，其具体操作为

r^(t)＝σ(Q_r＊G[h^(t),H^(t-1)]+b_r)

u^(t)＝σ(Q_u＊G[h^(t),H^(t-1)]+b_u)

c^(t)＝tanh(Q_c＊G[h^(t),(r^(t)⊙H^(t-1))]+b_c)

H^(t)＝u^(t)⊙H^(t-1)+(1-u^(t))⊙c^(t)

其中，＊G[h^(t),H^(t-1)]表示在图G上进行卷积操作，h^(t)和H^(t-1)为卷积输入向量，h^(t)表示第t个时间步的站点空间特征，H^(t-1)为第t-1步输出的时空融合特征，⊙表示按元素做乘积，σ表示激活函数，r^(t)为重置门，u^(t)为更新门，c^(t)为临时变量，Q_r，Q_u，Θ_c为门控循环图卷积网络需要学习的参数，b_r，b_u和b_c为偏置参数，也是需要随着网络一起学习得到；

2.根据权利要求1所述的基于多步耦合图卷积网络的交通预测方法，其特征在于，多步图卷积操作在更新关系图时需要集合前l步的关系图的信息进行当前关系图的更新，即

其中A^m+1为新的关系图矩阵，

为更新函数，通常为一个神经网络，A^m-l+1,...,A^m为前l步的关系图。

3.根据权利要求1所述的基于多步耦合图卷积网络的交通预测方法，其特征在于，所述门控循环图卷积网络中的特征变换采用的是多步耦合图卷积变换。

4.根据权利要求1所述的基于多步耦合图卷积网络的交通预测方法，其特征在于，所述基于多步时间注意力交通流量预测采用多步时间注意力机制，即在编码器中的P个历史隐藏状态中选择有用的信息，来更新解码器的输出，并将其作为下一个解码器的输入，依次将前一个输出作为下一个解码器的输入来更新解码器的输出，最终得到所有预测输出。