CN113298319A

CN113298319A - 一种基于跳跃图注意力门控循环网络的交通速度预测方法

Info

Publication number: CN113298319A
Application number: CN202110691544.7A
Authority: CN
Inventors: 郭戈; 刘金沅; 高振宇
Original assignee: Northeastern University Qinhuangdao Branch
Current assignee: Northeastern University Qinhuangdao Branch
Priority date: 2021-06-22
Filing date: 2021-06-22
Publication date: 2021-08-24
Anticipated expiration: 2041-06-22
Also published as: CN113298319B

Abstract

本发明提供一种基于跳跃图注意力门控循环网络的交通速度预测方法，涉及大数据挖掘技术领域。本发明采用数据驱动的方式，设计跳跃图注意力门控循环网络，能够自适应调节模型空间路网高阶邻域路段的特征提取范围，融合图注意力神经网络和门控循环神经网络捕捉交通路网时空特征，提升目标路段交通速度预测精度。对交通路网中路段的精确的速度预测有利于减少交通拥堵情况，提升城市交通运行效率，降低交通管理部门管理成本，同时极大改善人们出行体验。

Description

一种基于跳跃图注意力门控循环网络的交通速度预测方法

技术领域

本发明涉及大数据挖掘技术领域，尤其涉及一种基于跳跃图注意力门控循环网络的交通速度预测方法。

背景技术

交通预测方法主要采用传统统计学方法和深度学习方法。传统统计学方法基于数学模型来捕获交通速度的动态特征，主要采用历史平均模型，差分整合移动平均自回归模型。但是，使用标准数学或统计方法很难对复杂系统(例如交通网络)的动态行为进行准确建模。深度学习的方式可以通过研究大量数据而无需依赖任何标准和固定的统计关系来了解几个影响因素之间的复杂功能关系。Y.Tian等和X.Ma等采用长短期记忆神经网络的方式对交通路网速度值进行预测。R.Fu等采用门控循环神经网络捕捉交通速度的时间信息。Y.Liu等和Y.Wu等用卷积神经网络捕捉交通速度空间信息，并与长短期记忆神经网络进行融合同时捕捉交通速度的时间空间信息特征。B.Yu等结合图卷积神经网络捕捉目标路段的临界路段信息，并结合门控循环神经网络，提升预测精度。

X.Ma等构建深度注意力神经网络预测短期交通流速度，但难以准确捕捉时域中交通信息。Y.Liu等提出了注意力长短期记忆网络用于同时捕获交通速度的时空特征预测道路交通速度，但是这种模型只能提取网格型的交通数据。但是传感器网络依托于路网并非标准网格结构，因此这种预测模型性能不佳。B.Yu等采用的图卷积神经网络对应路段只能选取固定阶数的领域路段范围，因此无法很好应对需要获取不同阶数领域特征的情况。在实际的交通预测场景中，由于数据量巨大，交通路网十分复杂，交通速度在时间空间上的动态变化规律难以捕捉，导致现有的交通速度预测性能不佳。

在实际的交通预测场景中，数据量巨大，交通路网十分复杂，模型训练缓慢以及交通状况在时间空间上的动态变化规律难以捕捉，导致交通速度预测性能不佳的问题。

发明内容

针对现有技术存在的问题，本发明提供一种基于跳跃图注意力门控循环网络的交通速度预测方法，采用数据驱动的方式，设计跳跃图注意力门控循环网络，能够自适应调节模型空间路网高阶邻域路段的特征提取范围，融合图注意力神经网络和门控循环神经网络捕捉交通路网时空特征，提升目标路段交通速度预测精度。

为了解决上述技术问题，本发明采用以下的技术方案：

一种基于跳跃图注意力门控循环网络的交通速度预测方法，包括以下步骤：

步骤1：获取交通数据源数据，制作交通速度数据集和传感器网络邻接矩阵数据；

步骤1.1：由安装在交通路网道路上的交通速度传感器获取交通速度数据，将所有的交通速度数据划分为训练数据集以及验证数据集；

步骤1.2：根据交通速度传感器在交通路网中的连接关系构建传感器网络的邻接矩阵；

所述邻接矩阵的表示如下：

若W_ij＝1，表示第i个传感器和第j个传感器在路网上是连接的，W_ij＝0表示第i个传感器和第j个传感器在路网上无连接关系；

步骤2：选取图注意力神经网络和门控循环神经网络分别捕获交通速度数据的空间和时间特征；

步骤2.1：使用图注意力神经网络获取交通速度数据的交通路网空间特征，图注意力神经网络获取非欧几里得空间中相邻点的空间结构，传感器之间的注意力相关性系数公式如下：

其中W是线性变换操作；e_ij是乘法注意力机制获得一对传感器之间的相关性系数，ATTENTION()是注意力机制，

和

为t时刻第i个传感器和第j个传感器的交通速度数据；

将路网所有传感器与第i个传感器注意力相关性系数通过softmax函数进行归一化处理，传感器之间归一化之后的相关性系数公式如下：

其中

是在所有传感器之间归一化之后的相关性系数，softmax为归一化指数函数，exp(·)为以自然常数e为底的指数函数，N为传感器数量；

采用多头注意力机制计算聚合后的交通速度数据，多头注意力函数如下所示:

F_i′^t为通过多头注意力机制聚合后的t时刻第i个传感器的交通速度数据,k为多头注意力头数，W^k为多头注意力每个头的线性变换。将多头注意力函数表示为GA(·)；

步骤2.2：使用门控循环神经网络获取交通速度数据的时间特征，下式为门控循环神经网络内部结构公式：

r_t＝σ(W_irx_t+W_hrh_(t-1)+b_r)

z_t＝σ(W_izx_t+W_hzh_(t-1)+b_z)

n_t＝tanh(W_inx_t+W_hn(r_t*h_(t-1))+b_n)

h_t＝(1-z_t)*n_t+z_t*h_(t-1)

其中，x_t为交通速度输入量，h_(t-1)为上一时刻隐藏状态，h_t为此时刻的隐藏状态，σ为sigmoid激活函数，tanh为tanh激活函数。r_t为门控循环神经网络重置门输出量，z_t为门控循环神经网络更新门输出量更新门输出量，n_t为隐藏状态候选集。W_ir为重置门输入线性变换，W_hr为重置门上一时刻隐藏状态线性变换，b_r为重置门偏置量。W_iz为更新门输入线性变换，W_hz为更新门上一时刻隐藏状态线性变换，b_z为更新门偏置量。W_in为隐藏状态候选集输入线性变换，W_hn为隐藏状态候选集上一时刻隐藏状态线性变换，b_n为隐藏状态候选集偏置量。

步骤3：设计图注意门控循环网络，融合图注意力神经网络和门控循环神经网络生成交通速度数据的时空特征，单层的图注意力门控循环网络层捕获一阶邻居传感器的时空关系，若干个堆叠的图注意力门控循环网络层提取高阶邻居传感器之间的时空关系；

融合图注意力神经网络和门控循环神经网络为图注意力门控循环神经网络层，同时捕捉交通路网上的交通速度信息的时间和空间特征；下式为图注意力门控循环神经网络内部结构公式：

r_t＝σ(W_irGA(x_t)+W_hrGA(h_(t-1))+b_r)

z_t＝σ(W_izGA(x_t)+W_hzGA(h_(t-1))+b_z)

n_t＝tanh(W_inGA(x_t)+W_hn(GA(r_t*h_(t-1)))+b_n)

h_t＝(1-z_t)*n_t+z_t*h_(t-1)

其中，GA(·)为多头图注意力函数，x_t为交通速度输入量，h_(t-1)为上一时刻隐藏状态，h_t为此时刻的隐藏状态。σ为sigmoid激活函数，tanh为tanh激活函数。r_t为门控循环神经网络重置门输出量，z_t为门控循环神经网络更新门输出量更新门输出量，n_t为隐藏状态候选集。W_ir为重置门输入线性变换，W_hr为重置门上一时刻隐藏状态线性变换，b_r为重置门偏置量。W_iz为更新门输入线性变换，W_hz为更新门上一时刻隐藏状态线性变换，b_z为更新门偏置量。W_in为隐藏状态候选集输入线性变换，W_hn为隐藏状态候选集上一时刻隐藏状态线性变换，b_n为隐藏状态候选集偏置量。

步骤4：聚合各图注意力神经网络层的隐藏层信息，将聚合的隐藏层信息输入到跳跃网络层，自适应的调节图注意神经网络的高阶邻居传感器聚合邻域特征的提取范围；

步骤4.1：采用基于注意力机制的双向门控卷积循环神经网络构建跳跃网络层，聚合各图注意力神经网络层的隐藏层信息；

所述基于注意力机制的聚合信息公式如下所示：

其中Sum为各图注意力神经网络层聚合后的信息，k为图注意力门控循环神经网络层的层数，

为各个隐藏层输出信息注意力系数，softmax为归一化指数函数，

为图注意力门控循环神经网络前向和后向传递的隐藏层信息；

步骤4.2：将聚合的信息输入到跳跃网络层，所述跳跃网络层采用基于注意力机制的门控循环网络；

步骤5：设计序列到序列神经网络结构，结合图注意力门控循环网络层合和跳跃网络层设计编码解码过程，解码过程的输出作为交通速度预测结果；

步骤5.1：采用序列到序列的结构，将由图注意力门控循环神经网络和跳跃层整合为编码过程；

步骤5.2：编码过程的隐藏层信息保存于承上启下隐藏层；所述承上启下隐藏层是固定长度的向量表达，承上启下隐藏层输出信息用于解码过程；

步骤5.3：采用图注意力门控循环神经网络和全连接神经网络构建解码过程，输出层的输出作为整个深度学习框架的交通速度预测结果；

步骤6：将训练集数据输入跳跃图注意力门控循环网络，计算损失函数，并采用Adam优化器对跳跃图注意力门控循环网络进行优化；

所述损失函数如下：

其中y表示标签值，

表示训练过程中网络输出的预测值，T表示整个验证数据集样本总和。y_i表示第i个样本；

步骤7：利用验证数据集对神经网络性能指标进行测试，将验证数据集数据输入到已经通过训练集数据训练的跳跃图注意力门控循环网络中，根据预测结果的误差指标判断网络性能指标，误差值越低，网络性能越好，输出交通速度预测结果。

本发明所产生的有益效果在于：

本发明提出一种基于跳跃图注意力门控循环网络的交通速度预测方法，结合交通路网结构与跳跃图注意力门控循环神经网络构建复杂交通路网交通速度预测方法。在当今社会中，许多大型城市将交通拥塞视为急需解决的问题之一。交通拥塞会浪费大量时间，同时车辆拥堵期间排放尾气会造成空气污染。因此，在智能交通系统中，对交通路网中路段的精确的速度预测有利于减少交通拥堵情况，提升城市交通运行效率，降低交通管理部门管理成本，同时极大改善人们出行体验。

附图说明

图1为本发明的交通速度预测方法流程图；

图2为本发明设计方法门控循环神经网络结构示意图；

图3为本发明设计方法图注意力门控循环神经网络结构示意图；

图4为本发明对一传感器实际的交通速度预测结果图；

图5为本发明捕获到的传感器之间相关性关系图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

一种基于跳跃图注意力门控循环网络的交通速度预测方法，如图1所示，包括以下步骤：

步骤1.1：由安装在交通路网道路上的交通速度传感器获取交通速度数据，将所有的交通速度数据划分为训练数据集以及验证数据集；本实施例中选取地点为某交通部门提供的该地区2017年1月到5月的交通数据集。在本实例中训练集的样本数目为36481，验证数据集的数目为15634；

将训练数据集中交通速度数据用于进行深度学习模型训练，验证数据集测试深度学习模型的训练效果；

步骤1.2：本实施例中根据325个交通速度传感器在交通路网中的连接关系构建传感器网络的邻接矩阵；

所述邻接矩阵的表示如下：

1≤i≤325，1≤j≤325

和

为t时刻第i个传感器和第j个传感器的交通速度数据；

其中

本实施例中为了解决每天动态变化传感器节点之间的相关性，嵌入多头注意力，多头注意力的数目选择为4；

步骤2.2：使用门控循环神经网络获取交通速度数据的时间特征，如图2所示，下式为门控循环神经网络内部结构公式：

r_t＝σ(W_irx_t+W_hrh_(t-1)+b_r)

z_t＝σ(W_izx_t+W_hzh_(t-1)+b_z)

n_t＝tanh(W_inx_t+W_hn(r_t*h_(t-1))+b_n)

h_t＝(1-z_t)*n_t+z_t*h_(t-1)

融合图注意力神经网络和门控循环神经网络为图注意力门控循环神经网络层，同时捕捉交通路网上的交通速度信息的时间和空间特征；如图3所示，下式为图注意力门控循环神经网络内部结构公式：

r_t＝σ(W_irGA(x_t)+W_hrGA(h_(t-1))+b_r)

z_t＝σ(W_izGA(x_t)+W_hzGA(h_(t-1))+b_z)

n_t＝tanh(W_inGA(x_t)+W_hn(GA(r_t*h_(t-1)))+b_n)

h_t＝(1-z_t)*n_t+z_t*h_(t-1)

所述基于注意力机制的聚合信息公式如下所示：

所述损失函数如下：

其中y表示标签值，

本实施例中选取预测时间为15分钟，利用验证数据集测试网络误差性能指标，并与其他基准交通速度预测网络做性能对比，性能对比结果见表1；

表1：性能指标对比

模型	MAE	MAPE(％)	RMSE
				ARIMA	5.55	12.92	9.00
全连接-长短期记忆网络	3.57	8.60	6.02
				跳跃图注意力门控循环网络	3.41	5.26	5.04

MAE为平均绝对误差，MAPE为平均百分比误差，RMSE为均方根误差；

其中误差指标公式定义如下：

本实施例对一传感器节点实际的交通速度预测结果进行展示，如图4，图5所示。交通速度(TravelSpeed)单位为km/h,时间戳(TimeStamp)单位为min，每个时间戳间隔5min。从实验性能对比结果可以看出，本发明提出的基于跳跃图注意力门控循环网络的交通速度预测方法能够降低交通速度预测误差，提升了交通速度预测精度。表明本发明能够很好的捕捉交通路网上的复杂时空速度信息，能够达到更好的预测效果，具有一定的优越性。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims

1.一种基于跳跃图注意力门控循环网络的交通速度预测方法，其特征在于，包括：

r_t＝σ(W_irGA(x_t)+W_hrGA(h_(t-1))+b_r)

z_t＝σ(W_izGA(x_t)+W_hzGA(h_(t-1))+b_z)

n_t＝tanh(W_inGA(x_t)+W_hn(GA(r_t*h_(t-1)))+b_n)

h_t＝(1-z_t)*n_t+z_t*h_(t-1)

其中，GA(·)为多头图注意力函数，x_t为交通速度输入量，h_(t-1)为上一时刻隐藏状态，h_t为此时刻的隐藏状态；σ为sigmoid激活函数，tanh为tanh激活函数；r_t为门控循环神经网络重置门输出量，z_t为门控循环神经网络更新门输出量更新门输出量，n_t为隐藏状态候选集；W_ir为重置门输入线性变换，W_hr为重置门上一时刻隐藏状态线性变换，b_r为重置门偏置量；W_iz为更新门输入线性变换，W_hz为更新门上一时刻隐藏状态线性变换，b_z为更新门偏置量；W_in为隐藏状态候选集输入线性变换，W_hn为隐藏状态候选集上一时刻隐藏状态线性变换，b_n为隐藏状态候选集偏置量；

2.根据权利要求1所述的一种基于跳跃图注意力门控循环网络的交通速度预测方法，其特征在于，所述步骤1具体包括以下步骤：

所述邻接矩阵的表示如下：

若W_ij＝1，表示第i个传感器和第j个传感器在路网上是连接的，W_ij＝0表示第i个传感器和第j个传感器在路网上无连接关系。

3.根据权利要求1所述的一种基于跳跃图注意力门控循环网络的交通速度预测方法，其特征在于，所述步骤2具体包括以下步骤：

其中W是线性变换操作；e_ij是乘法注意力机制获得一对传感器之间的相关性系数，ATTENTION()是注意力机制，F_i ^t和

为t时刻第i个传感器和第j个传感器的交通速度数据；

将路网所有传感器与第i个传感器注意力相关性系数通过soft max函数进行归一化处理，传感器之间归一化之后的相关性系数公式如下：

其中

是在所有传感器之间归一化之后的相关性系数，soft max为归一化指数函数，exp(·)为以自然常数e为底的指数函数，N为传感器数量；

F_i′^t为通过多头注意力机制聚合后的t时刻第i个传感器的交通速度数据,k为多头注意力头数，W^k为多头注意力每个头的线性变换；将多头注意力函数表示为GA(·)；

r_t＝σ(W_irx_t+W_hrh_(t-1)+b_r)

z_t＝σ(W_izx_t+W_hzh_(t-1)+b_z)

n_t＝tanh(W_inx_t+W_hn(r_t*h_(t-1))+b_n)

h_t＝(1-z_t)*n_t+z_t*h_(t-1)

其中，x_t为交通速度输入量，h_(t-1)为上一时刻隐藏状态，h_t为此时刻的隐藏状态，σ为sigmoid激活函数，tanh为tanh激活函数；r_t为门控循环神经网络重置门输出量，z_t为门控循环神经网络更新门输出量更新门输出量，n_t为隐藏状态候选集；W_ir为重置门输入线性变换，W_hr为重置门上一时刻隐藏状态线性变换，b_r为重置门偏置量；W_iz为更新门输入线性变换，W_hz为更新门上一时刻隐藏状态线性变换，b_z为更新门偏置量；W_in为隐藏状态候选集输入线性变换，W_hn为隐藏状态候选集上一时刻隐藏状态线性变换，b_n为隐藏状态候选集偏置量。

4.根据权利要求1所述的一种基于跳跃图注意力门控循环网络的交通速度预测方法，其特征在于，所述步骤4具体包括以下步骤：

所述基于注意力机制的聚合信息公式如下所示：

步骤4.2：将聚合的信息输入到跳跃网络层，所述跳跃网络层采用基于注意力机制的门控循环网络。

5.根据权利要求1所述的一种基于跳跃图注意力门控循环网络的交通速度预测方法，其特征在于，所述步骤5具体包括以下步骤：

步骤5.3：采用图注意力门控循环神经网络和全连接神经网络构建解码过程，输出层的输出作为整个深度学习框架的交通速度预测结果。

6.根据权利要求1所述的一种基于跳跃图注意力门控循环网络的交通速度预测方法，其特征在于，步骤6中所述损失函数如下：

其中y表示标签值，

表示训练过程中网络输出的预测值，T表示整个验证数据集样本总和，y_i表示第i个样本。