CN113762338A

CN113762338A - 一种基于多重图注意力机制的交通流预测方法、设备及介质

Info

Publication number: CN113762338A
Application number: CN202110868311.XA
Authority: CN
Inventors: 肖竹; 谢佳佳; 蒋洪波; 曾凡仔; 陈文婕; 王东
Original assignee: Hunan University
Current assignee: Hunan University
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2021-12-07
Anticipated expiration: 2041-07-30
Also published as: CN113762338B

Abstract

本发明公开了一种基于多重图注意力机制的交通流预测方法、设备及介质，方法为：获取训练样本；构建由若干交通流预测子模型构成的交通流预测生成组合模型GC‑GE和由编码器、注意力机制及全连接层构成的交通流预测优化模型GA‑OP；GC‑GE使用每个预测子模型进行初始预测；GA‑OP通过对历史交通流、初始预测交通流、交通流外部因素进行编码，利用注意力机制获取三者间的两两交互关系，并将这些张量拼接到全连接层上进行评分以对整个模型进行训练；最后根据评分确定GC‑GE中各子模型的权重，以此获得最终的预测交通流。本发明不仅考虑了交通流的时空相关性，还考虑交通流外部因素的影响，保证了预测结果的有效性。

Description

一种基于多重图注意力机制的交通流预测方法、设备及介质

技术领域

本发明属于智能交通技术领域，尤其涉及一种基于多重图注意力机制的交通流预测方法、设备及介质。

背景技术

随着经济的发展，我国城市规模不断扩大，城市人口也急剧上涨，人们对便捷交通出行需求的不断增加，汽车保有量持续快速的增长，这给有限的道路资源带来了巨大的压力。

国内外的实践经验已表明，仅依靠增加道路建设来缓解城市交通拥堵是很难实现的，城市交通系统的管控方式应该从被动式管控转变为主动式管控。近年来，智能交通系统(ITS)的概念被提出，期望在不用大量兴建新的城市道路和其他交通设施的前提下，通过大数据和各种智能算法技术把人、车、道路等信息综合起来考虑，规划出合理的交通路径提高车辆运行效率，从而减小道路通行压力。智能的交通系统成为一种缓解交通矛盾行之有效的策略。在智能交通系统的众多分支中，交通流预测是其中的一项基础性工作，也是一项具有挑战性的研究课题。准确的交通流量预测可以预估未来时间的交通状况，提前做好规划措施，引导驾驶员选择到达目的地的最佳路径，为城市规划道路建设提供参考意见等。因此，近几十年来的交通流量预测受到了许多研究者的关注。

国内外提出了很多用于交通流预测的方法，早期的一些方法是基于统计学的预测模型，如历史平均、时间序列、卡尔曼滤波、支持向量机、非参数回归、小波理论等，对于具有很强的随机性和不确定性的非线性交通数据而言，这类模型受时序波动影响较大，预测精准度较低。随着深度学习的发展，越来越多的深度学习方法被用来对交通流预测，不仅可以对更复杂的数据进行建模，而且取得了更高的精准度，如支持向量机和神经网络等。近几年，基于图卷积网络方法开始被研究者们广泛运用于交通流预测，充分考虑了交通流的时空相关性，预测精准度得到进一步提高，如时空图卷积神经网络(ST-GCN)，扩散卷积循环神经网络(DCRNN)等。

由于交通流的不确定性和非线性，传统的单一模型并不能对所有道路都具有很好的适用性，难以满足主动式管理的精度要求，同时，现有的研究主要利用的是直接数据融合的优点，在复杂路段上表现并不好，再者，大部分模型没有考虑交通流外部因素的影响，如天气、节假日、事件、事故等，其预测结果有效性不能得到保证。

发明内容

本发明提供一种基于多重图注意力机制的交通流预测方法，考虑交通流外部因素的影响，提高交通流预测的精准度。

为实现上述技术目的，本发明采用如下技术方案：

一种基于多重图注意力机制的交通流预测方法，包括：

获取若干训练样本：取T′+T个连续时刻的交通流数据作为一个训练样本，取前面的T′个连续时刻的交通流数据为历史交通流数据，记后面的T个连续时刻的交通流数据为真实交通流数据；

构建模型：将n个不同类型的交通流预测模型分别作为预测子模型，组合构建交通流预测生成组合模型；构建交通流预测优化模型，包括编码器、注意力机制模块、全连接层；

使用训练样本训练模型：使用每个预测子模型分别根据训练样本中的历史交通流数据进行交通流预测，得到对应的初始预测交通流数据；对历史交通流、初始预测交通流和交通流外部因素分别使用编码器进行编码，并利用注意力机制模块获取这三者的两两交互关系，再将得到的两两交互关系张量连接并由全连接层处理得到次级预测交通流；对全连接层输出的次级预测交通流进行第一次评分，以及根据训练样本中的真实交通流数据对初始预测交通流进行第二次评分，以通过两次评分的交叉熵对交通流预测生成组合模型和交通流预测优化模型进行整体训练；

交通流预测与优化：获取当前最近T′个连续时刻的交通流数据，输入至训练完毕的交通流预测生成组合模型中的每个预测子模型；训练完毕的交通流预测生成组合模型和交通流预测优化模型，分别输出当前之后T个连续时刻的初始预测交通流和次级预测交通流；对次级预测交通流进行第一次评分，并根据第一次评分结果计算每个预测子模型的预测概率，再利用预测概率对初始预测交通流进行加权计算，得到当前之后T个连续时刻的最终预测交通流。

在更优的技术方案中，训练交通流预测生成组合模型和交通流预测优化模型的训练样本中，每个时刻t的交通流数据包括路网中所有路段的所有特征，均表示为路网在时刻t的拓扑图信号

其中，N是路网包括的路段数量，P为每个路段的特征数量。

在更优的技术方案中，所述交通流外部因素包括：天气、节假日、事件和事故，路段的特征包括：速度、时间占有率、空间占有率。

在更优的技术方案中，n个不同类型的交通流预测模型，分别为：扩散卷积循环神经网络DCRNN、时空图卷积网络ST-GCN、图多注意网络GMAN和动态时空图卷积神经网络DGCNN。

在更优的技术方案中，交通流预测优化模型包括3个编码器，其中：

用于对历史交通流编码的编码器，采用1个时间卷积层和1个单向的长短期记忆层构成，将最后一个隐藏状态作为历史交通流的运动编码；

用于对初始预测交通流编码的编码器，采用1个时间卷积层和1个单向的长短期记忆层构成，将最后一个隐藏状态作为历史交通流的运动编码；

用于对交通流外部因素编码的编码器，采用1个时间卷积层和1个双向的长短期记忆层构成，将隐藏状态序列作为交通流外部因素的编码。

在更优的技术方案中，交通流预测优化模型包括3个注意力机制模块，每个注意力机制模块均利用缩放点积注意力，并采用的是键映射、查询映射和值映射的线性层；

第一个注意力机制模块，将每个编码后的交通流外部因素嵌入到编码后的历史交通流中，得到交通流外部因素与历史交通流之间的相互关系，记为历史交通流张量；

第二个注意力机制模块，将每个编码后的交通流外部因素嵌入到编码后的初始预测交通流中，得到交通流外部因素与初始预测交通流之间的相互关系，记为初始预测交通流张量；

第三个注意力机制模块，将所有编码后的初始预测交通流相互融合，得到不同初始预测交通流之间的相互关系，记为初始预测交通流相互张量。

在更优的技术方案中，对次级预测交通流进行第一次评分的计算式为：

式中，S₁为第一次评分值，U_i,j表示将注意力机制模块得到的两两交互关系张量连接得到的包含全部交通流信息的张量，f′()表示全连接层处理，i用于区分不同的交通流外部因素，l为交通流外部因素的个数，j用于区分不同的预测子模型，n表示预测子模型的个数；

对初始预测交通流进行第二次评分的计算式为：

式中，S₂为第二次评分值，F_GT表示训练样本中的真实交通流数据，F_j表示第j个预测子模型得到的初始预测交通流，Dist(·)表示累积的距离平方误差，τ表示温度因子；

两次评分的交叉熵可表示为：

λ＝CrossEntropy(S₁(F_i,j),S₂(F_j))

式中，λ为得到的交叉熵值，CrossEntropy()为交叉熵函数。

在更优的技术方案中，每个预测子模型的预测概率的计算式为：

式中，p_j为计算得到的第j个预测子模型的预测概率；

利用预测概率对初始预测交通流进行加权计算的计算式为：

式中，F′为最终预测交通流。

一种电子设备，包括存储器及处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器实现上述中任一项所述的交通流预测方法。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述中任一项所述的交通流预测方法。

有益效果

本发明不仅考虑了交通流的时空相关性，还考虑交通流外部因素的影响，如天气、节假日、事件、事故等，保证了预测结果的有效性。同时组合预测也充分发挥各单项预测模型优势，提高了模型的泛化能力，适用于不同的复杂道路环境中，进一步提高未来交通流预测的精准度。

附图说明

图1是本申请实施例所述方法的整体框架图，

图2是本申请实施例所述方法中的交通流预测优化模型的流程图。

具体实施方式

下面对本发明的实施例作详细说明，本实施例以本发明的技术方案为依据开展，给出了详细的实施方式和具体的操作过程，对本发明的技术方案作进一步解释说明。

本发明提供一种基于多重图注意力机制的交通流预测方法，如图1所示，包括以下步骤：

步骤1，获取若干训练样本：

取T′+T个连续时刻的交通流数据作为一个训练样本，取前面的T′个连续时刻的交通流数据为历史交通流数据，记后面的T个连续时刻的交通流数据为真实交通流数据。

本实施例中，每个时刻t的交通流数据包括路网中所有路段的所有特征，均表示为路网在时刻t的拓扑图信号

其中，N是路网包括的路段数量，P为每个路段的特征数量，路段的特征包括：速度、时间占有率、空间占有率等。

步骤2，构建模型：

将n个不同类型的交通流预测模型分别作为预测子模型，组合构建交通流预测生成组合模型；构建交通流预测优化模型，包括编码器、注意力机制模块、全连接层。如图2所示。

本实施例设有4个预测子模型，分别为：扩散卷积循环神经网络DCRNN、时空图卷积网络ST-GCN、图多注意网络GMAN和动态时空图卷积神经网络DGCNN。其中：

DCRNN是一种用于交通流预测的深度学习框架，在交通流中包含空间和时间依赖关系。DCRNN通过在图上使用双向随机游动捕获空间依赖性，使用带定时采样的编码器-解码器结构捕获时间依赖性。

ST-GCN没有使用常规的卷积和循环单元，而是在图上提出问题，并建立具有完全卷积结构的模型，这使得训练速度更快，参数更少，通过建模多尺度交通网络有效地捕获了综合时空相关性。

GMAN采用编码器-解码器架构，其中编码器和解码器均由多个时空注意块组成，以模拟时空因素对交通状况的影响。编码器对输入流量特征进行编码，解码器预测输出序列。在编码器和解码器之间，应用变换注意力层来转换编码的交通特征，以生成未来时间步长的序列表示作为解码器的输入。变换注意力机制对历史和未来时间步长之间的直接关系进行建模，这有助于缓解预测时间步长之间的错误传播问题。

DGCNN深度学习框架的核心是发现动态拉普拉斯矩阵估计的拉普拉斯矩阵变化。DGCNN将张量分解纳入到深度学习框架中，将实时交通数据分解为稳定且依赖于长期时空交通关系的全局分量和捕捉交通波动的局部分量吧，并设计一种新的估计具有上述两个分量图的动态拉普拉斯矩阵的方法。

步骤3，使用训练样本训练模型：

步骤3.1，使用每个预测子模型分别根据训练样本中的历史交通流数据进行交通流预测，得到对应的初始预测交通流数据。

步骤3.2，对历史交通流、初始预测交通流和交通流外部因素分别使用编码器进行编码，并利用注意力机制模块获取这三者的两两交互关系，再将得到的两两交互关系张量连接并由全连接层处理得到次级预测交通流。

交通流预测优化模型包括3个编码器，其中：

(1)用于对历史交通流编码的编码器，采用1个时间卷积层和1个单向的长短期记忆层构成，将最后一个隐藏状态作为历史交通流的运动编码；

(2)用于对初始预测交通流编码的编码器，采用1个时间卷积层和1个单向的长短期记忆层构成，将最后一个隐藏状态作为历史交通流的运动编码；

(3)用于对交通流外部因素编码的编码器，采用1个时间卷积层和1个双向的长短期记忆层构成，将隐藏状态序列作为交通流外部因素的编码。

交通流预测优化模型包括3个注意力机制模块，每个注意力机制模块均利用缩放点积注意力，并采用的是键映射、查询映射和值映射的线性层，其中：

第一个注意力机制模块(C2T)，将每个编码后的交通流外部因素嵌入到编码后的历史交通流中，得到交通流外部因素与历史交通流之间的相互关系，记为历史交通流张量X_i(T_i)；

第二个注意力机制模块(C2F)，将每个编码后的交通流外部因素嵌入到编码后的初始预测交通流中，得到交通流外部因素与初始预测交通流之间的相互关系，记为初始预测交通流张量Y_i(F_i,j)；

第三个注意力机制模块(F2F)，将所有编码后的初始预测交通流相互融合，得到不同初始预测交通流之间的相互关系，记为初始预测交通流相互张量Z(F_i,j)。

将上述得到的历史交通流张量X_i(T_i)、初始预测交通流张量Y_i(F_i,j)以及初始预测交通流相互张量Z(F_i,j)，连接在一起完整表示为：U_i,j＝Contat(X_i(T_i),Y_i(T_i),Z(F_i,j))。

步骤3.3，对全连接层输出的次级预测交通流进行第一次评分，以及根据训练样本中的真实交通流数据对初始预测交通流进行第二次评分，以通过两次评分的交叉熵对交通流预测生成组合模型和交通流预测优化模型进行整体训练。

其中，对全连接层输出的次级预测交通流进行第一次评分的计算式为：

对初始预测交通流进行第二次评分的计算式为：

式中，S₂为第二次评分值，F_GT表示训练样本中的真实交通流数据，F_j表示第j个预测子模型得到的初始预测交通流，Dist(·)表示累积的距离平方误差，τ表示温度因子。

两次评分的交叉熵可表示为：

λ＝CrossEntropy(S₁(F_i,j),S₂(F_j))

式中，λ为得到的交叉熵值，CrossEntropy()为交叉熵函数。

步骤4，交通流预测与优化：

步骤4.1，获取当前最近T′个连续时刻的交通流数据，输入至训练完毕的交通流预测生成组合模型中的每个预测子模型；

步骤4.2，训练完毕的交通流预测生成组合模型和交通流预测优化模型，分别输出当前之后T个连续时刻的初始预测交通流和次级预测交通流；

步骤4.3，对次级预测交通流进行第一次评分，并根据第一次评分结果计算每个预测子模型的预测概率，再利用预测概率对初始预测交通流进行加权计算，得到当前之后T个连续时刻的最终预测交通流；

其中，在该步骤4.3中对步骤4.2得到的次级预测交通流进行第一次评分，与步骤3.3的第一次评分的计算式相同。

根据第一次评分结果计算每个预测子模型的预测概率的计算式为：

式中，p_j为计算得到的第j个预测子模型的预测概率；

利用预测概率对初始预测交通流进行加权计算的计算式为：

式中，F′为最终预测交通流。

为验证本实施例方法对交通流预测的精准度，使用本实施例方法对若干测试样本进行交通流预测，然后计算最终预测结果的平均绝对百分误差MAPE、平均绝对误差MAE和均方根误差RMSE，以与未考虑交通流外部因素的各预测子模型进行比较，可得本实施例方法的平均绝对百分误差MAPE、平均绝对误差MAE和均方根误差RMSE相对更小，因此本实施例的交通流预测方法的精准度得到提高。

上述平均绝对百分误差MAPE、平均绝对误差MAE和均方根误差RMSE的计算式分别为：

实施例2

本实施例提供一种电子设备，包括存储器及处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器实现实施例1所述的交通流预测方法。

实施例3

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现实施例1所述的交通流预测方法。

以上实施例为本申请的优选实施例，本领域的普通技术人员还可以在此基础上进行各种变换或改进，在不脱离本申请总的构思的前提下，这些变换或改进都应当属于本申请要求保护的范围之内。