CN113435658B

CN113435658B - 一种基于时空融合相关性和注意力机制的交通流预测方法

Info

Publication number: CN113435658B
Application number: CN202110777603.2A
Authority: CN
Inventors: 李光辉; 薛延明
Original assignee: Jiangnan University
Current assignee: Jiangnan University
Priority date: 2021-07-09
Filing date: 2021-07-09
Publication date: 2024-04-30
Anticipated expiration: 2041-07-09
Also published as: CN113435658A

Abstract

本发明公开了一种基于时空融合相关性和注意力机制的交通流预测方法，属于智慧城市交通预测技术领域。所述方法通过小波变换对交通流数据进行卷积操作，通过尺度超参数s在不同交通图中进行调整适应，从而可以更好提取局部空间特征，避免了原来需要规定n跳邻居来实现特征信息的聚合表示，且由于图小波矩阵是一个稀疏矩阵，所以也降低了计算复杂度。同时通过时间信息融合机制，可以更好地对时间特征进行表示，提高了长期预测的准确度。

Description

一种基于时空融合相关性和注意力机制的交通流预测方法

技术领域

本发明涉及一种基于时空融合相关性和注意力机制的交通流预测方法，属于智慧城市交通预测技术领域。

背景技术

作为交通管理系统的一部分，准确的交通流预测已经受到了越来越多的关注。在交通预测场景中，城市道路结构相互联系性强，往往存在非线性的结构依赖，另外交通流数据往往存在时间依赖关系，会随着时间呈现动态变化，而图神经网络作为一种用于预测非欧几里得结构数据的重要方法，非常适用于交通流预测。

图神经网络具体可以分为频域方法和空域方法两种。频域方法是通过相关信号转换分析理论将图上的信号映射到频域中并定义卷积操作。空域的方法是直接在图中定义卷积操作，虽然没有严格理论公式的限制，但是难度很大。因此，图神经网络的本质是将复杂的高维交通数据映射为低维数据，并通过迭代不断聚合交通网络中各个节点与其邻居节点的特征信息，从而在图中进行学习预测。

近年来国内外有许多研究尝试利用图神经网络方法来提取交通流中复杂的结构特征来加强预测效果，比如Zhao等人提出了一种时间图卷积网络(T-gcn)，他们通过将图卷积神经网络与Gated Recurrent Unit(GRU)结合进行交通预测，Yu等人通过卷积网络以及门控机制分别对时间和空间特征进行了提取，并将其用与交通预测工作。然而，这些方法在提取局部特征表示过程中需要规定邻居结点跳数，通过n跳邻居来聚合邻接信息，无法很好地解决图卷积特征提取中缺乏灵活性和局部提取能力差地问题。另外，这些方法需要通过拉普拉斯矩阵的特征向量定义图中的卷积操作，而该这些特征向量是稠密的，因此在大型图中计算复杂度很大，而城市交通流预测往往需要面对的就是大型的图，因此这些方法在实际应用中还存在着计算时间久，算力要求大的缺点。

循环神经网络(RNN)是进行时间序列预测的主要方法之一。该网络具有记忆性，因此对序列的非线性特征进行学习时具有一定优势。近几年，国内外有许多学者对循环神经网络进行了相关的应用，但是随着时间序列的不断增加，它将逐渐遗忘过去的特征信息。总结来说，它善于提取局部时间特征信息，但是缺乏全局信息的提取能力，因此它的长期预测精度较低，而交通流预测中往往需要对长期的交通流数据进行预测来达到路线规划、城市管理的目的，所以如果简单将现有循环神经网络应用于交通流预测中，则无法进行准确预测。

综上，交通预测需要在空间维度和时间维度上面进行特征提取，而现有的方法没有很好地在空间上灵活且有效地提取特征信息，另外在实际应用中还存在计算复杂度大，计算时间长的缺点。在时间维度上则缺乏全局特征提取能力，导致长期预测准确性较差这一结果。

发明内容

为了提高交通流预测的精度，本发明提供了一种基于时空融合相关性和注意力机制的交通流预测方法，所述方法包括：

步骤S1：获取交通数据并进行预处理；所述交通数据包括交通图中各个路段之间的连通关系图对应的邻接矩阵和交通图中各个路段对应的传感器节点收集到的交通速度数据；

步骤S2：根据预处理后的交通数据，通过图小波层以及自适应矩阵获得各个路段对应的传感器节点的空间特征表示；

步骤S3：根据所述邻接矩阵计算出交通图中所有传感器节点之间的注意力权重矩阵，并根据注意力权重矩阵和步骤S2获得的各个路段对应的传感器节点的空间特征表示获得新的空间特征表示H_atten；

步骤S4：根据步骤S3获得的新的空间特征表示H_atten，分别通过改进了的循环神经网络MRNN和注意力网络层Transformer层得到各个路段对应的传感器节点的局部时间特征表示以及全局时间特征表示，然后通过时间信息融合机制将二者进行融合得到各个路段对应的传感器节点的时间特征表示；所述改进了的循环神经网络MRNN为添加了长期记忆单元的循环神经网络MRNN；

步骤S5：根据步骤S4得到的时间特征表示数据获得交通图中各个路段的交通流预测值。

可选的，所述步骤S2包括：

步骤S21通过预处理过的邻接矩阵计算出交通图的Laplace矩阵L；

步骤S22通过Laplace矩阵L计算图小波基，再对图小波基和预处理后的交通速度数据进行卷积操作得到各个路段对应的传感器节点的局部空间特征表示；

步骤S23计算自适应矩阵W_adp，获得各个路段对应的传感器节点的全局空间特征表示；

步骤S24根据步骤S22获得的局部空间特征表示和步骤S23获得的全局空间特征表示进行结合得到各个路段对应的传感器节点的空间特征表示。

可选的，所述步骤S21包括：

根据公式(3)计算出交通图的Laplace矩阵L：

其中，n表示传感器节点数，I_n表示单位矩阵；W表示预处理过的邻接矩阵，W_ij表示预处理过的邻接矩阵W中的各个元素，i＝1,2,……,n；j＝1,2,……,n。

可选的，所述步骤S22包括：

利用小波变换在谱域中对交通速度数据进行卷积操作，然后通过逆变换将谱域中的卷积结果映射回图域中，从而完成对交通图中每个传感器节点的局部特征表示，如公式(4)-(7)所示：

ψ_s＝UG_sU^T (4)

G_s＝diag(g(sλ₁),…,g(sλ_n)) (5)

其中，U表示Laplace矩阵的特征向量，G_s表示图小波的尺度矩阵，s用以控制图小波的尺度大小，λ_i是Laplace矩阵的特征值，表示频域中的交通速度数据，/>表示对交通速度数据x进行卷积操作，ψ_s表示图小波基，⊙表示矩阵元素对应相乘。

可选的，所述步骤S23中自适应矩阵计算公式为：

其中，E₁和E₂是两个自适应参数矩阵，T表示转置操作；

所述步骤S24包括：

根据公式(9)计算各个路段对应的传感器节点的空间特征表示：

其中，Λ表示图卷积操作中的卷积核，其初始化为单位矩阵；表示第l层的空间特征表示，ω₁、ω₂表示学习矩阵。

可选的，所述步骤S3包括：

根据公式(10)计算交通图中各个传感器节点的注意力权重矩阵：

根据公式(11)获得新的空间特征表示H_atten：

其中，d表示交通速度数据的空间特征表示的维度，ω^Q、ω^K、ω^V表示不同的学习矩阵。

可选的，所述步骤S4包括：

根据公式(12)和(13)计算得到各个路段对应的传感器节点的局部时间特征表示H_L：

H_L＝[z⁽¹⁾,...,z^(T)] (13)

其中，a表示H_atten的维度序号，c表示时间序号，h^(t)表示时刻t的短期记忆隐藏单元，m^(t)表示时刻t的长期记忆隐层单元，表示第a维在时刻t的差分记忆参数，z^(t)表示时间t的局部时间特征，1≤t≤T，H_L表示最终的局部时间特征表示，K表示长期记忆滤波长度；ω_zh、ω_zm、ω_hh、ω_hx、ω_d、ω_m、ω_c表示不同的学习权重矩阵；b_z、b_h、b_d、b_m表示不同的偏移向量；

根据公式(14)-(17)计算得到各个路段对应的传感器节点的全局时间特征表示H_G：

其中，d_model表示H_atten的维度，表示在时刻t维度f的时间嵌入表示，k表示注意力头个数，H_G表示全局时间特征矩阵；

根据公式(18)将局部时间特征和全局时间特征进行信息融合，得到传感器节点的时间特征表示：

O_T＝Conv(RELU(ω_lH_L×ω_GH_G)) (18)

其中，ω_l和ω_G分别为局部时间特征和全局时间特征的权重矩阵。

可选的，若交通图中各个路段之间的连通关系图对应的邻接矩阵由0和1构成，则无需进行预处理，其中0表示两路段之间不连接，1表示两路段之间连接；若交通图中各个路段之间的连通关系图对应的邻接矩阵由表示路段之间的距离数据构成，则将表示路段之间的距离数据转换为0至1之间的数值；所述预处理过的邻接矩阵W中的各个元素W_ij为：

其中，d_ij表示传感器节点i和传感器节点j之间的距离，σ²是方差系数，用于控制邻接矩阵的数值范围，∈是阈值，用于控制邻接权重分布矩阵的稀疏性。

可选的，所述步骤S1中对交通数据中的交通速度数据进行预处理，包括：

根据公式(2)对交通速度数据进行归一化处理，将其范围调整至区间[0,1]内：

其中，X为原始交通速度数据，min表示原始交通速度数据中的最小值，max表示原始交通速度数据中的最大值。

本发明有益效果是：

通过小波变换对交通流数据进行卷积操作，通过尺度超参数s在不同交通图中进行调整适应，从而可以更好提取局部空间特征，避免了原来需要规定n跳邻居来实现特征信息的聚合表示，且由于图小波矩阵是一个稀疏矩阵，所以也降低了计算复杂度。同时通过时间信息融合机制，可以更好地对时间特征进行表示，提高了长期预测的准确度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明方法中的所选取数据集拓扑结构图。

图2是本发明方法的网络结构图。

图3是本发明方法中的时间融合机制结构图。

图4是数据集中传感器采集数据示意图。

图5是本发明空间特征矩阵热力图。

图6是本发明在真实数据集上的预测效果图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

现有的交通监测系统中，会在各路段设有传感器以监测过往车辆的车速，本申请在对交通流进行预测时，需要获取交通图各个路段之间的连通关系图以及交通图中各个路段设置的传感器所收集到的实时交通速度数据。

实施例一：

本实施例提供一种基于时空融合相关性和注意力机制的交通流预测方法，所述方法在获取交通图各个路段之间的连通关系图以及交通图各个路段对应的传感器所收集到的实时交通速度数据后，采用下述步骤实现对于交通图中的交通流预测，包括：

S1对数据进行预处理；

实际应用中，如果要城市交通流进行预测，需要获取城市交通图，并将交通图各个路段之间的连通关系图以邻接矩阵方式存储，本申请后续以图1所示的交通图为例对本申请方法进行说明，该交通图为本申请选取的真实数据集的拓扑结构图。本申请所选择的真实数据集是美国华盛顿州西雅图地区高速公路上的车流数据Freeway traffic dataset，该数据覆盖了四条相连的高速公路：I-5、I-90、I-405和SR-520，参见图1。

本发明选取了数据清洗后2015年一整年的高质量交通数据信息，包括了323个传感器节点，采取了每隔5min的平均通行速度。

实例中的数据集中每个传感器节点代表一个路段，所选择的数据包括两个部分。第一个是所选择的交通图各个路段之间的连通关系图，以邻接矩阵的方式保存；第二个是每个路段对应的传感器所收集到的交通速度数据。

S11原始邻接矩阵可能是由0和1构成的，也可能由表示路段之间的距离数据构成。

若是由0和1构成，则0表示两路段之间不连接，1表示两路段之间连接。

若是由表示路段之间的距离数据构成，则根据公式(1)处理原始的邻接矩阵中的各元素，即将表示路段之间的距离数据转换为0至1之间的数值，得到预处理过的邻接矩阵W。

其中，预处理过的邻接矩阵W中的各元素为：

S12根据公式(2)对交通速度数据进行归一化处理，将其范围调整至区间[0,1]内。

S2经过归一化处理之后的交通速度数据分别通过图小波层以及自适应矩阵获得图中各个传感器节点的局部空间特征表示以及全局空间特征表示，然后将两种空间特征表示进行结合从而获得交通速度数据的空间特征表示。

S21通过预处理过的邻接矩阵以计算出交通图的Laplace矩阵L。

其中，n表示传感器节点数，I_n表示单位矩阵。

S22通过Laplace矩阵L计算图小波基，再对图小波基和交通速度数据进行卷积操作得到局部空间特征表示。

利用小波变换在谱域中对交通速度数据进行卷积操作，然后通过逆变换将谱域中的卷积结果映射回图域中，从而完成对交通图中每个传感器节点的局部特征表示，如公式(4)-(7)所示。

ψ_s＝UG_sU^T (4)

G_s＝diag(g(sλ₁),...,g(sλ_n)) (5)

S23计算自适应矩阵W_adp，如公式(8)所示。

其中，E₁和E₂是两个自适应参数矩阵，自适应矩阵可以让网络自主地学习到一些重要的隐藏特征信息，作为提取全局空间特征信息的方法，对图小波学习到的特征信息起到补充作用。最后得到最终的空间特征表示，如公式(9)所示，其中表示第l层的空间特征表示，ω₁、ω₂表示学习矩阵。

其中，Λ表示图卷积操作中的卷积核，初始化为单位矩阵。

S3根据邻接矩阵计算出交通图中所有传感器节点之间的注意力关系矩阵，通过注意力权重矩阵进行空间特征表示的自相关学习，从而能更好地挖掘潜在的空间特征关系。

通过注意力机制计算交通图中各个传感器节点的注意力权重矩阵，该注意力权重矩阵其实是各个传感器节点和与其连通的传感器节点之间的相关系数，通过该注意力权重矩阵可以更好地利用交通图中重要传感器节点的空间特征信息，如公式(10)和(11)所示，其中，d表示交通速度数据的空间特征表示的维度，/>表示注意力权重矩阵，H_atten表示通过注意力权重矩阵学习到的新的空间特征表示。

其中，ω^Q、ω^K、ω^V表示不同的学习矩阵，本实施例中，学习矩阵按正态分布进行随机初始化。

S4以交通速度数据的空间特征表示H_atten作为输入数据，分别通过MRNN和Transformer层得到交通速度数据的局部时间特征表示以及全局时间特征表示，然后通过时间信息融合机制将两部分特征表示进行融合得到交通速度数据的时间特征表示。

S41获取交通速度数据的局部时间特征表示；

由步骤S3的结果H_atten作为输入数据，通过MRNN得到交通流数据的局部时间特征表示，MRNN结构如公式(12)所示，最后可得到时间局部特征表示H_L，如公式(13)所示。

H_L＝[z⁽¹⁾,...,z^(T)] (13)

其中，a表示H_atten的维度序号，c表示时间序号，h^(t)表示时刻t的短期记忆隐藏单元，m^(t)表示时刻t的长期记忆隐层单元，表示第a维在时刻t的差分记忆参数，z^(t)表示时间t的局部时间特征，1≤t≤T，H_L表示最终的局部时间特征表示，K表示长期记忆滤波长度。

ω_zh、ω_zm、ω_hh、ω_hx、ω_d、ω_m、ω_c表示不同的学习权重矩阵；b_z、b_h、b_d、b_m表示不同的偏移向量。

S42获取交通速度数据的全局时间特征表示；

若要获取交通速度数据的全局时间特征表示，首先需要得到交通速度数据的的时间嵌入表示，然后与步骤S3的结果H_atten相加得到输入数据H_t′^p，然后通过Transformer层的得到交通流数据的全局时间特征表示，如公式(14)-(17)所示。其中d_model表示H_atten的维度，1≤a≤d_model，表示在时刻t维度f的时间嵌入表示，k表示注意力头个数，ω^Q、ω^K、ω^V表示不同的权重矩阵，H_G表示最终的全局时间特征矩阵，1≤f≤d_model。

H_G＝[attenion₁(H′_t ^p),...,attenionK(H′_t ^p)] (17)

S43将局部时间特征和全局时间特征进行信息融合，如公式(18)所示。Conv表示卷积操作，将n个时间步映射为一个时间步，ω_l、ω_G分别为局部时间特征和全局时间特征的权重矩阵，为按正态分布初始化的矩阵。

O_T＝Conv(RELU(ω_lH_L×ω_GH_G)) (18)

S5将步骤S4获得的传感器节点的时间特征矩阵O_T作为输入数据，通过预测层得到最终的输出值。

为验证本申请方法的预测性能，本申请选择真实的交通流数据进行仿真实验，图1为本发明选取的真实数据集的拓扑结构图。所选择的数据集是美国华盛顿州西雅图地区高速公路上的车流数据Freeway traffic dataset，该数据覆盖了四条相连的高速公路包括了I-5、I-90、I-405和SR-520。

图4展示了道路中传感器采集数据的示意图，传感器可以得到自身所处的地理位置信息以及通过此处的车辆的速度信息。图4中道路1和道路2属于邻接道路，传感器1和传感器2每30秒测得一组数据，然后计算5分钟的平均速度，作为最后的交通速度数据。通过全球定位系统轨迹与其对应的传感器地理位置信息进行匹配，可以得到邻接矩阵信息。

本发明提供的基于时空融合相关性和注意力机制的交通流预测模型结构框架如图2所示。通过图小波变化可以得到交通流数据的局部空间特征表示，通过自适应矩阵可以获得交通流数据的全局空间特征表示。其中，图小波矩阵是一个稀疏的矩阵，如图5所示。图5中展示了Freeway traffic dataset前50个节点的热力图，从图5中可以看到图小波矩阵相比于传统的傅里叶变换得到的Laplace矩阵的特征矩阵要稀疏很多，这方便在大型图中进行计算。将得到的输出值作为注意力层的输入，注意力层可以按照节点重要性程度进行权重的分配。

本发明的时间特征融合机制机构图如图3所示。将MRNN层得到的输出作为局部时间特征表示，将Transformer层的输出作为全局时间特征表示，然后通过相乘将两种特征表示进行融合，时间特征表示是呈现非线性关系的，所以通过Relu函数进行非线性表示，再通过卷积层将所有的历史时间进行权重加和。

本发明在Freeway traffic dataset这个真实数据集中进行了预测，其预测效果如图6所示。数据的分割策略为：数据前70％作为模型的训练集，剩下的数据中20％作为验证集，10％作为测试集。模型的批处理大小设置为32，采用Adam作为模型训练优化器。图6中通过前60分钟的历史数据来预测未来15分钟的交通速度，本申请选取了一天的预测数据，并与真实的数据进行了比较，从图6可以看出预测值与真实值的趋势一致，在突变点两者数值也基本一致，结果说明本发明有很好的拟合性。

本申请提供的预测方法，通过小波变换对交通速度数据进行卷积操作，进而获得各传感器节点的局部空间特征表示，而现有技术中，小波基通常用于数据的去噪处理，本申请创造性的提出使用小波变换提取数据的空间特征，从而使得对于交通流的预测更准确，而且由于图小波矩阵是一个稀疏矩阵，相对于现有技术中采用傅里叶变换的方法，所以也降低了计算复杂度。同时本申请方法通过时间信息融合机制，在循环神经网络的基础上增加了长期记忆单元，可以更好地对时间特征进行表示，提高了长期预测的准确度。

本发明实施例中的部分步骤，可以利用软件实现，相应的软件程序可以存储在可读取的存储介质中，如光盘或硬盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于时空融合相关性和注意力机制的交通流预测方法，其特征在于，所述方法包括：

步骤S5：根据步骤S4得到的时间特征表示数据获得交通图中各个路段的交通流预测值；

所述步骤S2包括：

步骤S24根据步骤S22获得的局部空间特征表示和步骤S23获得的全局空间特征表示进行结合得到各个路段对应的传感器节点的空间特征表示；

所述步骤S22包括：

ψ_s＝UG_sU^T (4)

G_s＝diag(g(sλ₁),…,g(sλ_n)) (5)

2.根据权利要求1所述的方法，其特征在于，所述步骤S21包括：

根据公式(3)计算出交通图的Laplace矩阵L：

3.根据权利要求2所述的方法，其特征在于，所述步骤S23中自适应矩阵计算公式为：

其中，E₁和E₂是两个自适应参数矩阵，T表示转置操作；

所述步骤S24包括：

4.根据权利要求3所述的方法，其特征在于，所述步骤S3包括：

根据公式(11)获得新的空间特征表示H_atten：

5.根据权利要求4所述的方法，其特征在于，所述步骤S4包括：

根据公式(12)和(13)计算得到各个路段对应的传感器节点的局部时间特征表示HL：

H_L＝[z⁽¹⁾,…,z^(T)] (13)

其中，a表示新的空间特征表示H_atten的维度序号，c表示时间序号，h^(t)表示时刻t的短期记忆隐藏单元，m^(t)表示时刻t的长期记忆隐层单元，表示第a维在时刻t的差分记忆参数，z^(t)表示时间t的局部时间特征，1≤t≤T，H_L表示最终的局部时间特征表示，K表示长期记忆滤波长度；

ω_zh、ω_zm、ω_hh、ω_hx、ω_d、ω_m、ω_c表示不同的学习权重矩阵；b_z、b_h、b_d、b_m表示不同的偏移向量；

H_G＝[attenion₁(H′_t ^p),…,attenion_K(H_t′^p)] (17)

O_T＝Conv(RELU(ω_lH_L×ω_GH_G)) (18)

6.根据权利要求5所述的方法，其特征在于，若交通图中各个路段之间的连通关系图对应的邻接矩阵由0和1构成，则无需进行预处理，其中0表示两路段之间不连接，1表示两路段之间连接；若交通图中各个路段之间的连通关系图对应的邻接矩阵由表示路段之间的距离数据构成，则将表示路段之间的距离数据转换为0至1之间的数值；所述预处理过的邻接矩阵W中的各个元素W_ij为：

7.根据权利要求6所述的方法，其特征在于，所述步骤S1中对交通数据中的交通速度数据进行预处理，包括：