CN117593877A

CN117593877A - 一种基于集成图卷积神经网络的短时交通流预测方法

Info

Publication number: CN117593877A
Application number: CN202311343890.1A
Authority: CN
Inventors: 刘路阳; 吕帅奇; 包旭
Original assignee: Nanjing Tech University
Current assignee: Nanjing Tech University
Priority date: 2023-10-16
Filing date: 2023-10-16
Publication date: 2024-02-23

Abstract

本发明提供了一种基于集成图卷积神经网络的短时交通流预测方法，属于智能交通领域，在处理图数据和交通图上结合集成图卷积神经网络和卷积神经网络，首先，由于交通图包括复杂的道路网络拓扑，故使用GCN通过当前节点与邻居节点的信息提取特征，增强了特征提取的效果，其次，对于交通图数据，CNN则可提取感兴趣区域的局部特征，提供更详细的交通流预测数据，采用多层线性层融合不同层级特征，可更好地处理复杂的交通数据关系，提高深层次特征提取，实现更精确的流量预测，为适应输出特征，设计了专门的损失函数，以更准确地评估模型输出结果，从而提高流量预测的精确性，这些创新点可提高预测准确性、鲁棒性，并应对交通数据的复杂性。

Description

一种基于集成图卷积神经网络的短时交通流预测方法

技术领域

本发明属于智能交通技术领域，具体涉及一种基于集成图卷积神经网络的短时交通流预测方法。

背景技术

智能交通系统(ITS)是一个复杂的大系统，具有非线性和时序模式。因此，如何准确地预测短时交通流是ITS研究的关键，该问题已成为国内外交通领域的研究热点。

由于交通流复杂的非线性关系和时序模式，单一模型的交通流预测难以完全捕捉交通流中的非线性因素及时空特征。鉴于以上情况，本文提出一种基于集成图卷积神经网络模型，结合了继承的图卷积神经网络和卷积神经网络能够更好地处理交通图和交通图数据，使用多层线性层能够更好地融合不同层级的特征，达到提高准确率的目的。

发明内容

为了解决背景技术中总结的问题，该方法通过构建基于集成的图卷积神经网络和卷积神经网络模型(GCN-CCN)对交通流进行预测。

技术方案：一种基于集成图卷积神经网络的短时交通流预测方法，包括如下步骤：

(1)确定新的交通流预测模型：构建基于GCN-CNN集成深度学习的交通流速预测模型：结合了图卷积神经网络和卷积神经网络能够更好地处理交通图和交通图数据，交通图中的道路网络往往呈现出复杂的拓扑结构，对于图卷积网络来说，结合当前节点与邻居节点的信息，能够更有效地提取特征，对于交通图数据，使用卷积神经网络能够提取感兴趣区域的局部特征，从而获得更加详细的交通流预测数据；

(2)采集数据样本，明确需要预测的交通流指标：建立交通流速数据集并对数据集进行预处理：根据获取的交通流数据建立交通流速数据集，对数据集进行预处理，构建数据集样本矩阵，将数据集分为训练集、测试集和验证集。

(3)训练模型并实现短时交通流的预测：使用GCN来提取特征，其中特征矩阵它描述了每条道路的车速，其中每行表示一条道路，每列为不同传感器记录的车速；另一个是大小为156×156的邻接矩阵，描述道路间的空间关系；接着将提取的具有空间特征的车速数据作为2DCNN的输入数据，经过2DCNN模型对车速的时间特征提取，实现交通流数据双层特征的挖掘，最后输入全连接层即达到了对所有目标观测点进行车速的目标，使用了三个全连接层来将平坦层的尺寸减小到采用的尺寸，全连接层的输出最终被重塑为最终预测结果；

进一步的，所述步骤(1)具体包括如下子步骤：

所述的新的交通流预测模型包括：2个图卷积的卷积神经网络、1个二维卷积神经网络层、3个全连接层；

(1.1)输入数据包含邻接矩阵和特征矩阵两部分组成，各观测点在拓扑图中的连接状态使用邻接矩阵表示，将节点特征与其邻居节点的特征进行聚合，特征矩阵为车速数据；

(1.2)集成GCN层处理学习节点间的关系和特征表示，提取空间特征；

(1.3)利用卷积神经网络来处理交通图数据，以提取感兴趣区域的局部特征，卷积层和池化层来减小图像的空间尺寸并增加特征抽象程度，在CNN模型中获得特征图可以被展平并连接到后续的层；

(1.4)全连接层也叫线性层，它将输入特征维数进行映射，输出最终交通流速预测值；

进一步的，所述步骤(2)具体为，在采集的样本中随机抽取80％作为集成深度学习网络的训练样本：

(2.1)为了消除数据特征之间的量纲影响，使用Min-Max归一化方法对数据进行归一化处理，将数据的取值范围缩放到[0，1]区间，以便更好地适应模型的训练，所述归一化公式表示如下：

式中，X是原始交通流数据，X_max是交通流数据最大值，X_min是交通流数据最小值；

(2.2)对数据进行切片，根据传入的时间间隔、时间滞后、预测天数等参数，将交通流数据划分为输入序列和预测序列。输入序列X包含历史数据，用于模型训练，而预测序列Y包含未来一段时间内的交通流数据，用于模型的验证或测试；

(2.3)分割数据，将数据集划分为训练集和验证集；如果是训练集，数据将被划分为用于训练的部分；如果是验证集，数据将被划分为用于验证的部分；

进一步的，步骤(3)具体包括如下子步骤：

(3.1)GCN网络的特征提取：模型的输入包括两个张量：speed和adj，GCN的函数定义为：

其中:A∈R^n×n为邻接矩阵，I为单位矩阵，D为A的对角节点度矩阵，W为第l层的权值矩阵，H∈R^n×m为特征矩阵，其中m为n个节点中每个节点的特征个数，H∈R^n×m为具有拓扑信息的特征矩阵，σ(·)为激活函数。

图卷积层用于处理图数据，输入数据x是节点的特征向量，adj是表示图结构的邻接矩阵，weight是图卷积层的可学习参数，图卷积层通过与权重矩阵的乘积来学习节点之间的关系和特征表示，还有一个可学习的偏置项bias，它用于调整输出特征，在前向传播的过程中，首先将输入特征x与权重矩阵相乘得support，然后将邻接矩阵adj与support相乘得到最终的输出output。如果有偏置项，则将其加到输出上。在模型训练过程中，权重和偏置项会被自动优化，以便模型学习节点之间的关系并完成图数据的任务。

(3.2)2DCNN时间特征提取网络：

针对交通图像数据，卷积神经网络提取感兴趣区域的局部特征，获得更加详细的交通流预测数据。由卷积运算可知，卷积层输出为三维向量，采用展开层将卷积层输出转变，将输入通道数从1维映射到8维，使用3x3的卷积核进行卷积操作，步长为1，并使用1像素的填充构建时间特征提取层。

(3.3)全连接层：

全连接层(Fully Connected Layer)，也称为密集层(Dense Layer)，是神经网络中常用的一种层类型。它是指将前一层的所有神经元都与当前层的每一个神经元相连，并将其作为输入，通过权重矩阵和偏置向量的线性变换，生成当前层的输出。因此，全连接层用于减少数据维度，以及捕获高级特征和输出之间的非线性相关性。整个过程可以用下式表示：

其中，X_i表示输入的神经元，参数W_i通过误差来调整，使网络的输出逐步接近期望：

选择均方误差(MSE)作为损失函数、均方根误差(RMSE)、平均绝对误差(MAE)、加权平均绝对误差百分比(WMAPE)和R2四个指标用于评估模型性能，如公式所示:

(3.4)Early Stopping

模型终止部分采用Early Stopping技术,该技术的主要作用有两个方面：一方面，它可以借助验证集损失来保存截至当前的最优模型，这样可以避免模型过拟合，保证模型的泛化性能；另一方面，当模型训练到一定标准后，如果继续训练可能会导致模型性能下降，此时Early Stopping技术可以终止模型训练，避免浪费时间和资源。

本发明的有益效果主要表现在：本发明结合了集成的图卷积神经网络和卷积神经网络能够更好的处理交通图和交通图数据；使用多层线性层更好地融合不同层次的特征，在交通流预测场景中，交通数据的关系往往十分复杂，使用多层线性层来融合图卷积和卷积的输出结果，能够更好的提取交通数据的深层特征，从而实现更加准确的交通流量预测。

附图说明

图1是本发明整体流程图；

图2是本发明实施例的基于集成图卷积神经网络的城市交通流预测方法流程示意图。

具体实施方式

下面结合附图对技术方案做进一步的详细描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

步骤1、获取历史交通流数据

(1.1)明确路段流量和路网速度；本文在Python环境下，使用Pytorch神经网络框架完成模型的搭建和训练。本文选取的数据集为深圳出租车数据集，数据是从深圳的罗湖区采集的出租车轨迹。我们选取了该区的156条主要道路作为研究区域，时间跨度为从2015年1月1日至1月31日。该数据集包含两部分，一个是大小为156×156的邻接矩阵，用于描述道路间的空间关系，其数值代表路径间的连通性。第二个是特征矩阵，它描述了每条道路的车速，其中每行表示一条道路，每一列为不同传感器记录的车速。每15分钟汇总一次每条路的交通速度，共2976个时间节点，因此特征矩阵的大小为156×2976。本实施车流量数据分为80％的训练集，10％的测试集，10％的验证集，测试集数据的时间线在训练集的时间线之后，训练集的数据用于预先训练好的交通流预测模型。

(1.2)根据建立好的数据集预测交通流量指标，采集交通数据，将采集到的交通数据进行处理，转化为适合模型的形式。其中，历史交通流数据包括两个部分，一个是大小为156×156的邻接矩阵，0表示不通，1表示通；第二是特征矩阵，描述了每条道路上采集到的交通数据。每15分钟汇总一次，共包含2976个时间节点，特征矩阵大小为156×2976。

步骤2、交通流数据预处理：

(2.1)读取交通流数据：通过传入流量参数指定交通流数据的文件路径，并利用Pandas库读取数据。

(2.2)数据预处理：对读取的交通流数据进行归一化处理，将数据的取值范围缩放到[0,1]之间，以便更好地适应深度学习模型的训练。

(2.2.1)数据切片：根据传入的时间间隔、时间滞后、预测天数等参数，将交通流数据划分为输入序列和预测序列。输入序列X包含历史数据，用于模型训练，而预测序列Y包含未来一段时间内的交通速度数据，用于模型的验证或测试。

(2.2.2)数据分割：根据传入的is_train和is_val参数，将数据集划分为训练集和验证集。如果是训练集，数据将被划分为用于训练的部分；如果是验证集，数据将被划分为用于验证的部分。验证集比例由val_rate参数指定。

(2.2.3)提供数据样本：通过__getitem__方法获取数据集中的具体样本，包括输入序列和预测序列。如果是训练集或验证集，还会提供原始未经归一化处理的预测序列。

(2.2.4)获取数据集大小：通过__len__方法获取数据集的样本数量。

步骤3、设计预测交通流的GCN-CNN集成深度学习模型。

所述GCN-CNN网络模型包括依次连接的图卷积层、卷积层、全连接层。

(3.1)数据处理阶段结合了图卷积神经网络和卷积神经网络，能够更有效地处理交通图和交通图像数据。交通图中的道路网络具有复杂的拓扑结构，图卷积网络能够基于当前节点和邻居节点的信息，提取更有效的特征；

(3.2)对于交通图像数据，卷积神经网络能够提取感兴趣区域的局部特征，从而获得更加详细的交通流预测数据；

(3.3)在交通流预测场景中，为了更准确地提取交通数据的深层次特征，我们可以使用多层线性层来融合图卷积和卷积的输出结果。这种方法能够更好地将不同层级的特征进行融合，从而提高预测的准确性。

特征映射的维数决定特征的丰富程度和表示能力。特征映射维数较低，导致特征表示不丰富；特征维数较高，导致模型过于复杂，难以优化。针对156维的输出特征设计了适合的损失函数能够提高交通流量预测精度。交通流量预测中，对于特征的抽取和处理需要更加细致和准确，而针对156维的输出特征的损失函数能够更好地评估模型输出结果的准确性，从而实现更高效准确的交通流量预测。

步骤4、配置模型

构建用于预测交通流的初始交通流预测模型，并在初始交通流预测模型构建完成之后，将交通流信息和节点矩阵作为输入并输入到初始交通流预测模型，以便初始交通流预测模型根据输入的交通流信息和节点矩阵输出交通流预测值。

其中，初始交通流预测模型的构建方式示例。

初始交通流预测模型包括图卷积层和卷积神经网络，其中图卷积层包括集成的GCN，结合了道路网络矩阵的信息，能够更加有效的提取特征，通过图卷积神经网络输出的交通流预测数据；然后，输出层在提取出特征后，继续在使用卷积神经网络提取感兴趣的局部特征，获得更加详细的交通流预测数据。

步骤5、训练模型

将交通流数据集分为训练集、验证集和测试集。其中训练集和验证集来训练模型，而测试集用来评估模型的性能。对初始交通流预测模型进行训练，以及根据训练结果确定最终的交通流预测模型。

将交通流预测值与交通流速真实值进行比较，计算两者之间的损失值，并根据计算得到的损失值进行调整。

获取待预测数据，并对待预测数据进行预处理，以生成待预测的交通流信息和待预测的数据矩阵。

在交通流预测模型获得之后，对待预测数据进行处理，利用图卷积神经网络和卷积神经网络对城市复杂路网进行表达，通过路网矩阵可以对复杂的城市交通路网的独特空间特征进行有效挖掘。

初始交通流预测模型包括图卷积和卷积，其中GCN的函数定义为：

作为一种示例，全连接层通过以下公式表述：

交通数据信息输入到图卷积神经网络，根据交通图数据对交通数据信息进行空间特征的提取。

将空间特征和路网矩阵输入到卷积神经网络，并将图卷积的输出作为卷积神经网络的输入，以便卷积神经网络输出交通流预测数据。

将交通流预测数据输入到输出层，以便输出层根据交通预测数据输出交通流预测值。

以此完成初始交通流模型根据交通流数据和路网矩阵输出交通流预测值的过程。

步骤6、模型优化

对模型进行调整优化，通过调整学习率、采用更好地网络结构、改变损失函数、调整输入特征

步骤7、模型应用

将训练好的模型应用到交通流预测中，得到预测结果。

所述GCN-CNN集成深度学习模型通过预测路段156个检测断面交通流量组成流量矩阵。

以均方误差(MSE)作为损失函数、均方根误差(RMSE)、平均绝对误差(MAE)、加权平均绝对误差百分比(WMAPE)和R2四个指标用于评估模型性能。为了验证GCN-CNN模型的有效性，将其与基准模型进行对比，包括图卷积神经网络(GCN)、长短时记忆(LSTM)模型。评估结果如表所示。总体上，GCN-CNN集成深度学习模型拟合效果优于基准模型。

模型结构	RMSE	MAE	WMAPE	R²
					GCN-CNN	0.038	0.026	0.19	0.89
GCN	0.24	0.16	0.93	0.82
					LSTM	0.28	0.21	1.01	0.76

实验结果表明，本发明提出的交通流时间序列预测模型，在评估RMSE、MSE、WMAPE、R²均能达到较好的的结果。预测的精度得到提升。

本发明的有益效果在于：

结合了图卷积神经网络和卷积神经网络能够跟好的处理交通图和交通图数据。交通图中的道路往往呈现出复杂的拓扑结构，对于图卷积网络来说，能够更加有效的提取特征；而对于交通图数据，使用卷积神经网络能够更加有效的提取特征；对于交通流图数据，使用卷积神经网络能够提取感兴趣区域的局部特征，从而获得更加详细的交通流预测数据。

使用多层线性层能够更好的融合不同层级的特征。交通流预测场景中，交通数据的关系往往十分复杂，使用多层线性层来融合图卷积和卷积的输出结果，能够更好地提取交通数据的深层次特征，从而实现更加准确的交通流量预测。

针对156维的输出特征设计了适合的损失函数能够提高交通流量预测精度。交通流量预测中，对于特征的抽取和处理需要更加准确，针对156维输出特征能够更好地评估模型的输出结果和准确性，从而实现更高效准确的交通流预测流量。

Claims

1.一种基于集成图卷积神经网络的短时交通流预测方法，其特征在于，所述方法包括如下步骤：

(1)对交通流数据进行预处理，剔除无关交通流数据和修复不全的数据，并进行归一化处理；

(2)初步设计集成图卷积神经架构，结合图卷积和卷积，采用集成学习方式将提取到的图卷积特征作为预测模型的输入前馈；

(3)初步选取训练参数，包括时间间隔、每天的时间片数、预测的天数等；

(4)设置好参数后在交通流数据集上进行时空特性的训练并测试；

(5)固定训练参数、微调网络架构、早停法，得到进度较高的网络架构参数，并进行交通流数据预测。

2.根据权利要求1所述的基于集成图卷积神经网络的短时交通流预测方法，其特征在于，所述步骤(1)具体为：

(1.1)为了消除数据特征之间的量纲影响，使用Min-Max归一化方法对数据进行归一化处理，将数据的取值范围缩放到[0，1]区间，以便更好地适应模型的训练，所述归一化公式表示如下：

式中，X是原始车速数据，X_max是交通流速数据最大值，X_min是交通流速数据最小值；

(1.2)对数据进行切片，将车速数据划分为输入序列和预测序列；输入序列X包含历史数据，用于模型训练，而预测序列Y包含未来一段时间内的车速数据，用于模型的验证或测试；

(1.3)分割数据，使用数据加载器将数据划分为小批量数据，并提供给深度学习进行训练验证和测试；通过创建训练集、验证集和测试集数据加载器实现数据的分割。

3.根据权利要求1所述的基于集成图卷积神经网络的短时交通流预测方法，其特征在于，所述步骤(2)具体包括如下子步骤：

(2.1)输入数据包含邻接矩阵和特征矩阵两部分组成，各观测点在拓扑图中的连接状态使用邻接矩阵表示，将节点特征与其邻居节点的特征进行聚合，特征矩阵为车速数据；

(2.2)使用GCN来提取特征，其中特征矩阵它描述了每条道路的车速，其中每行表示一条道路，每列为不同传感器记录的车速；另一个是大小为156×156的邻接矩阵，描述道路间的空间关系；

(2.3)接着将提取的具有空间特征的车速数据作为2DCNN的输入数据，经过2DCNN模型对车速的时间特征提取，实现交通流数据双层特征的挖掘；

(2.4)最后输入全连接层即达到了对所有目标观测点进行车速的目标，使用了三个全连接层来将平坦层的尺寸减小到采用的尺寸，全连接层的输出最终被重塑为最终预测结果。

4.根据权利要求1所述的基于基于集成图卷积神经网络的短时交通流预测方法，其特征在于，步骤(3)具体包括如下子步骤：

(3.1)timeinterval：时间间隔，表示数据采样的时间间隔；

(3.2)time lag：时间滞后，表示用于预测的历史数据长度，即之前的多少个时间间隔的数据；

(3.3)tgin oneday：每天的时间片数，表示一天内划分的时间片数量；

(3.4)forecast day number:预测的天数，表示要预测未来多少天的交通速度数据；

(3.5)speed data：交通速度数据文件的路径，数据以CSV格式存储；

(3.6)pre len：预测序列的长度，即预测未来多少个时间间隔的数据；

(3.7)is train：是否为训练数据集，如果是，则为True；否则为False；

(3.8)is val:：是否为验证数据集，如果是，则为True；否则为False；

(3.9)val rate：验证集比例，表示将数据划分为验证集的比例；

数据集类会自动处理输入的交通速度数据，进行归一化处理，然后根据参数进行数据切片，形成输入序列(X)和预测序列(Y)；

在数据集类中，getitem方法用于获取数据样本len方法用于获取数据集的样本数量；

在构造数据集类的对象后，可以通过调用getitem方法来获取具体的输入和标签样本数据，以供模型的训练和验证使用。

5.根据权利要求1所述的一种基于集成图卷积神经网络的短时交通流预测方法，其特征在于，步骤(4)具体包括如下子步骤：

(4.1)GCN网络的特征提取：模型的输入包括两个张量：speed和adj，GCN的函数定义为：

其中:A∈R^n×n为邻接矩阵，I为单位矩阵，D为A的对角节点度矩阵，W为第l层的权值矩阵，H∈R^n×m为特征矩阵，其中m为n个节点中每个节点的特征个数，H∈R^n×m为具有拓扑信息的特征矩阵，σ(·)为激活函数；

GCN层用于处理图数据，输入数据x是节点的特征向量，adj是表示图结构的邻接矩阵，weight是图卷积层的可学习参数，图卷积层通过与权重矩阵的乘积来学习节点之间的关系和特征表示，还有一个可学习的偏置项bias，在前向传播的过程中，首先将输入特征x权重矩阵相乘得到support，然后将邻接矩阵adj与support相乘得到最终的输出；如果有偏置项，则将其加到输出上；此外，reset prameters函数用于初始化权重和偏置项的数值；在模型训练过程中，权重和偏置项会被自动优化，以便模型学习节点之间的关系并完成图数据的任务；图卷积将切片后的交通流时间序列输入交通流预测模型，首先GCN对时间片段进行空间特征学习，将输入特征从10维映射到10维；

(4.2)2DCNN时间特征提取网络：

提取的具有空间特征的车速数据作为2DCNN的输入数据，经过2DCNN模型对交通流数据的时间特征提取，实现交通流数据双层特征的挖掘；

由卷积运算可知，卷积层输出为三维向量，采用展开层将卷积层输出转变，将输入通道数从1维映射到8维，使用3x3的卷积核进行卷积操作，步长为1，并使用1像素的填充构建时间特征提取层；

(4.3)全连接层：

全连接层(Fully Connected Layer)，也称为密集层(Dense Layer)，是神经网络中常用的一种层类型；它是指将前一层的所有神经元都与当前层的每一个神经元相连，并将其作为输入，通过权重矩阵和偏置向量的线性变换，生成当前层的输出；因此，全连接层用于减少数据维度，以及捕获高级特征和输出之间的非线性相关性；整个过程可以用下式表示：

(4.4)Early Stopping

模型终止部分采用Early Stopping技术,该技术的主要作用有两个方面：一方面，它可以借助验证集损失来保存截至当前的最优模型，这样可以避免模型过拟合，保证模型的泛化性能；另一方面，当模型训练到一定标准后，如果继续训练可能会导致模型性能下降，此时Early Stopping技术可以终止模型训练，避免浪费时间和资源；

获取交通流数据作为上述训练完成模型的输入，实现交通流速的实时预测。