CN113053123B

CN113053123B - 一种基于时空大数据的交通量预测方法及装置

Info

Publication number: CN113053123B
Application number: CN202110306163.2A
Authority: CN
Inventors: 李颖; 闫豆豆; 王伟
Original assignee: Changan University
Current assignee: Zhongke Shengshi Technology Co.,Ltd.
Priority date: 2021-03-23
Filing date: 2021-03-23
Publication date: 2022-10-28
Anticipated expiration: 2041-03-23
Also published as: CN113053123A

Abstract

本发明提供一种基于时空大数据的交通量预测方法，包括以下步骤：获取目标检测路段在一定时间间隔的交通流信息；对交通流信息按照网格图形式进行存储；对存储的交通流信息进行建模并提取空间异质性和时间异质性；利用CNN的输出经过参数重整作为LSTM的输入得到预测结果。本发明还提出基于时空大数据的交通量预测装置。本发明收集目标检测路段及其周围路段的检测器一定时间间隔内的流量信息；通过3DCNN卷积神经网络提取空间关系与部分时间，再将CNN的输出经过参数重整作为LSTM的输入，提取更高更完整的时间依赖性，该方法对预测交通量的准确程度较高，对硬件和工程量要求较低，方便实现。

Description

一种基于时空大数据的交通量预测方法及装置

技术领域

本发明涉及交通量预测技术领域，具体涉及一种基于时空大数据的交通量预测方法及装置。

背景技术

在大数据时代，数据可以为我们带来许多未知信息，尤其在交通领域，随着各种道路检测器以及车载GPS等一系列设施的普及，产生了越来越多的交通数据。这些交通数据具有很强的时间相关性和空间相关性。

随着近些年深度学习再度掀起热潮，可以将应用在计算机视觉的3DCNN卷积神经网络用于提取交通数据的空间和时间特征，但是3DCNN对时间上特征提取有限，而LSTM长短期记忆神经网络利用内部的门机制可以有效的提取较长序列的时间特征，对于我们所预测目标道路的交通量而言，它的交通量不但与上游或者下游的交通量都息息相关，也与自身的历史时间的交通量密不可分，因此我们将交通领域与深度学习领域相结合，提取数据的时间异质性以及空间异质性用于准确预测下一时刻的交通量。

在对交通量的预测方法的研究中，大多采用了模型驱动的方法，这类方法需要强有力的理论假设，很难用于实际预测，或者在采用数据驱动与深度学习相结合的方法时，将数据的时空相关性结合时考虑有所欠缺。

发明内容

为了克服上述现有技术存在的问题，本发明提供一种基于时空大数据的交通量预测方法及装置。

本发明的技术方案是：

一种基于时空大数据的交通量预测方法，包括以下步骤：

获取目标检测路段在一定时间间隔的交通流信息；

对交通流信息按照网格图形式进行存储；

对存储的交通流信息进行建模并提取空间异质性和时间异质性；

利用CNN的输出经过参数重整作为LSTM的输入得到预测结果。

作为本发明的进一步技术方案为，所述获取目标检测路段在一定时间间隔的交通流信息；具体包括：收集目标检测路段及其周围路段的道路检测器在一定时间间隔内检测的交通流信息。

作为本发明的进一步技术方案为，所述对交通流信息按照网格图形式进行存储；具体包括：

对城市道路按照经度和纬度转化成网格图；

将目标检测路段所在城市按照经度和纬度映射在一张网格图上，网格图中每一个小格子内的数值表示当前区域交通量；

按照一定的时间间隔检测获取需要预测路段以及该城市其他道路的交通量历史值并按照网格图的形式存储。

进一步地，所述对城市道路按照经度和纬度转化成网格图；具体包括：

将城市进行分割，按照各个道路所在经度和纬度映射在一个M×N的网格图中，网格图中的每一个格子表示固定道路位置在当前时刻的交通状况，称为交通栅格数据；

映射后的网格图中存在大量的空白格，表示这些区域没有道路；

通过压缩存储算法将原始的M×N网格图进行压缩得到密集的I×J网格图，其中I×J网格图与M×N网格图的道路空间拓扑关系相同。

进一步地，所述按照一定的时间间隔检测获取需要预测路段以及该城市其他道路的交通量历史值并按照网格图的形式存储；具体包括：

根据道路检测器设置总的时间间隔以及每张网格图所包含的信息的时间间隔；

将各个路段的道路检测器在每个时间间隔收集到的当前时间段交通量测量值并存储；

对存储的交通量测量值进行转化形成网格图形成交通栅格数据。

作为本发明的进一步技术方案为，所述对存储的交通流信息进行建模并提取空间异质性和时间异质性；具体包括：

将存储的多张网格图作为卷积神经网络3D CNN的输入，利用3D CNN对预测路段附近路网的空间依赖关系进行建模；

利用3DCNN提取预测路段关于空间和时间的依赖关系，提取空间异质性；

将3D CNN的输出经过参数重整作为长短期记忆神经网络LSTM的输入对预测路段固定间隔时间历史数据之间的时间依赖关系进行建模；

利用LSTM提取预测路段关于时间上的依赖关系，提取时间异质性。

进一步地，所述利用3DCNN提取预测路段关于空间和时间的依赖关系，提取空间异质性；具体包括：

利用CNN池化层池化机制中的max-pooling或mean-pooling方法在保留主要特征的基础上来减少下一层参数；

利用反向传播机制缩小误差进行参数优化；

不断进行参数更改，获取层数参数以及滤波器参数设置；

利用3D CNN卷积层提取目标道路的空间异质性。

进一步地，所述利用LSTM提取预测路段关于时间上的依赖关系，提取时间异质性，具体包括：

将预测路段一段时间间隔的历史数据作为LSTM的输入数据；

利用LSTM的框架，根据当前路段历史数据提取时间上异质性。

作为本发明的进一步技术方案为：所述利用CNN的输出经过参数重整作为LSTM的输入得到预测结果，包括：将CNN关于不同时间间隔空间异质性对当前路段所产生的影响作为LSTM的输入值，得到空间依赖与时间依赖相结合之后产生的未来时刻交通量作为预测结果。

本发明还提出基于时空大数据的交通量预测装置，包括：

数据收集模块，获取目标检测路段在一定时间间隔的交通流信息；

数据存储模块，对交通流信息按照网格图形式进行存储；

建模模块，对存储的交通流信息进行建模并提取空间异质性和时间异质性；

预测模块，利用CNN的输出经过参数重整作为LSTM的输入得到预测路段交通量。

本发明的有益技术效果为：

本发明收集目标检测路段及其周围路段的检测器一定时间间隔内的流量信息；将收集到的不同道路的同一时刻车流量数据按照网格图的形式存储，本发明首先将各个道路检测器存储的交通量的测量值提取出来，将数据按照一定时间间隔转换进行处理，将所在城市道路按照经纬度划分投射在一张大的网格图后，网格图内每个格子的数据则为该区域的交通量，按照时间排列的网格图经过压缩后作为3D CNN的输入，经过CNN的核心部分卷积层池化层提取交通特征后，最后的输出包含目标道路与周围道路的空间依赖关系以及自身的部分时间依赖性，再将CNN的输出经过参数重整作为LSTM的输入，提取更高更完整的时间依赖性。该方法对预测交通量的准确程度较高，对硬件和工程量要求较低，方便实现。

附图说明

图1为本发明提出的一种基于时空大数据的交通量预测方法流程图；

图2为本发明提出的对交通流信息转化网格图流程图；

图3为本发明提出的一种基于时空大数据的交通量预测装置结构图。

具体实施方式

以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整地描述，以充分地理解本发明的目的、特征和效果。显然，所描述的实施例只是本发明的一部分实施例，而不是全部实施例，基于本发明的实施例，本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例，均属于本发明保护的范围。

3DCNN卷积神经网络在计算机视觉领域应用非常广泛，可用来做图像识别等，将3DCNN应用在交通领域，可用来提取道路之间的异质性即附近道路在同一时刻对目标道路的影响有多少，对于目标道路下一时刻交通量的预测有着重要作用。LSTM长短期记忆神经网络在语音识别等领域应用广泛，若将LSTM应用在交通领域，可以用来提取目标道路的时间异质性即历史时刻的交通量对下一时刻交通量存在的关联。

参见图1，为本发明提出的一种基于时空大数据的交通量预测方法流程图；

如图1所示，一种基于时空大数据的交通量预测方法，包括以下步骤：

步骤101，获取目标检测路段在一定时间间隔的交通流信息；

步骤102，对交通流信息按照网格图形式进行存储；

步骤103，对存储的交通流信息进行建模并提取空间异质性和时间异质性；

步骤104，利用CNN的输出经过参数重整作为LSTM的输入得到预测路段交通量。

在步骤101中，获取目标检测路段在一定时间间隔的交通流信息；具体包括：收集目标检测路段及其周围路段的道路检测器在一定时间间隔内检测的交通流信息。

收集目标检测路段及其周围路段的检测器一定时间间隔内的交通流量信息；具体包括以目标检测路段为中心，通过道路上的检测器收集道路检测器上存储的交通流量信息，并将收到的数据实时上传收集。

本发明实施例中，选取一条目标道路检测路段及其周边路段一段时间例如一个月左右的交通流量信息，且道路上的检测器存在信息丢失或者数据异常情况要少于一定的百分比例如百分之三以下，在此情况下的数据才可以做出准确的预测。检测器在收集流量信息上传时间间隔取决于不同的检测器，在划分时间间隔时不能过短，因为太短的时间间隔对交通预测价值过小。

在步骤102中，对交通流信息按照网格图形式进行存储；具体包括：

对城市道路按照经度和纬度转化成网格图；

将目标检测路段所在城市按照经度和纬度映射在一张网格图上，网格图中每一个小格子表示特定区域，每一个小格子内的数值表示当前区域交通量；

其中，对城市道路按照经度和纬度转化成网格图；具体包括：

参见图2，为本发明提出的对交通流信息转化网格图流程图；

如图2所示，按照一定的时间间隔检测获取需要预测路段以及该城市其他道路的交通量历史值并按照网格图的形式存储；具体包括：

通过设置总的时间间隔以及每张网格图所包含的信息的时间间隔，道路检测在对交通量检测时所设置的时间间隔是由检测器所决定的，每张网格图所包含时间间隔不能过短，太短的时间间隔对于预测没有价值。各个路段的道路检测器在每一个时间间隔收集当前时间的交通量的测量值后存储起来，再转化不同道路在该段时间形成的网格图，图中各个栅格的数据含义即为这一时间段该区域的交通量。

将收集到的不同道路的同一时刻车流量数据按照网格图的形式存储，保留原有道路的拓扑关系，收集一定时长；具体包括需要将实时的不同道路交通数据在保持拓扑关系的基础上转化成原始的网格图即交通数据栅格图，再将网格图进行压缩作为CNN的输入；其中将不同道路的交通流量在保持原有拓扑关系的基础上转化为网格图，并且在原有网格图基础上进行压缩；具体包括首先选取目标道路所在城市，将城市中的各条道路按照经度和纬度进行划分，同时将一个网格图划分为M×N个小单元格，将城市道路节点进行分割后，按照经度和纬度映射在一个M×N的网格图中，转化后的网格图需要保持道路原有的空间拓扑结构，图中的每一个格子代表一个道路的固定区域，格子中的数值代表固定区域在当前时间间隔内交通量的值，在处理一些道路的交叉点的数值时需要取该交叉点所连接道路数值的平均值。

在一个网格图中，如果道路节点所占用的格子只覆盖了城市区域的一部分，则会使得网格图中留下大量数值为0的空白格子，我们的关注也不在这些没有道路节点的区域，为了解决数据稀疏问题和节省存储空间的问题，需要使用压缩存储算法将原始的M×N网格图进行压缩得到一个新的较为密集的I×J网格图，我们需要一个两个图之间进行转化的函数来实现转化，在图的压缩过程中继续保持道路原有的空间拓扑关系不变。

在步骤103中，所述对存储的交通流信息进行建模并提取空间异质性和时间异质性；具体包括：

本发明实施例中，将压缩后的多张网格图作为卷积神经网络3D CNN的输入，利用3D CNN对预测路段附近路网的空间依赖关系进行建模，提取空间异质性(不同地点的数据是相互影响的，且影响并不是一成不变的)和部分时间异质性，(同一地点不同时刻的检测数据之间相互影响，影响程度也不尽相同)，因为我们借助3DCNN主要来探测空间异质性，输入的数据中目标路段历史数据较少，提取的时间异质性不够充分；

将3D CNN的输出经过参数重整作为长短期记忆神经网络LSTM的输入对预测路段固定间隔时间历史数据之间的时间依赖关系进行建模，提取较长时段的时间异质性。

其中，利用3DCNN提取预测路段关于空间和时间的依赖关系，具体包括：

利用3D CNN卷积层提取目标道路的空间异质性即同一时刻目标道路周边道路对其的影响；

输入的数据集为图片形式使用CNN卷积在浅层用滤波器提取的特征信息过多导致参数太多，需利用CNN池化层池化机制中的max-pooling或mean-pooling方法在保留主要特征的基础上来减少下一层参数；

利用反向传播机制缩小误差不断优化参数；

不断进行参数更改，通过实验得到较优的层数参数以及滤波器参数设置；

作为本发明的进一步技术方案为：所述利用LSTM提取预测路段关于时间上的依赖关系，具体包括：

将预测路段一段时间间隔的历史数据作为LSTM的输入数据；

利用LSTM的框架，根据当前路段时间上异质性得到预测结果。

在步骤104中，利用CNN的输出经过参数重整作为LSTM的输入得到预测结果包括：将CNN关于不同时间间隔空间异质性对当前路段所产生的影响作为LSTM的输入值，最终得到空间依赖与时间依赖相结合之后产生一个未来时刻交通量较为准确的预测结果。

本发明实施例中，收集目标检测路段及其周围路段的检测器一定时间间隔内的流量信息；将收集到的不同道路的同一时刻车流量数据按照网格图的形式存储，将收集到的数据按照一定时间间隔进行划分，在每个时间间隔将道路的交通流量按照道路拓扑关系映射在网格图上成为交通栅格数据。保留原有道路的拓扑关系；将压缩后的一系列网格图作为CNN的输入；通过3DCNN卷积神经网络提取空间关系与部分时间关系后再通过LSTM提取较长时间序列时间上的关系后生成目标道路下一时刻交通量的预测结果。

通过将数据转化成交通栅格数据存储为网格图后，采用3DCNN与LSTM相结合的方法分别从时间空间上提取目标道路的异质性，可以准确的预测目标道路交通量。对传统的方法进行改进，从两个维度上考虑对预测值的影响，使其能够兼顾时间异质性和空间异质性。

将压缩后的网格图作为CNN的输入；具体包括，在得到了一张在某时段目标道路附近所有道路交通量的交通栅格图后，需要利用CNN卷积神经网络提取空间依赖关系对我们需要预测道路交通量的影响。模型的输入是一系列具有时空关系的交通量生成图，每一张图代表某段时间不同位置的各个路段的交通量，具体到每一张图时，图中每一个像素值表示交通量从0到最大值，3D CNN不同于2D CNN不但可以提取空间上的特征，通过三维滤波器可以提取相邻网格图之间的特征，因为输入的图片按照时间序列展开因此还可以提取部分时间上特征。

CNN模型核心部分主要为卷积层和池化层，也是通过核心部分来进行特征提取。模型的输入是由具有时空特征的交通栅格数据所构成的网格图。每层通过局部连接机制和池化机制可以大大减少输入的像素参数，卷积层有很多滤波器，每种滤波器可以提取一种特征，因此我们可以提取很多交通特征，这些特征融合在一起我们可以提取更高维更抽象的交通特征。再通过反向传播算法进行模型优化，不断减少损失。其中CNN模型的层数设置以及滤波器数目设置需要在具体实验中不断观察修改。

将CNN的输出作为LSTM的输入，得到最终预测结果；具体包括，LSTM的输入是一维，在CNN的最后一层全连接层我们需要进行参数重整，将CNN的输出调整为LSTM的输入。LSTM模型内部主要有三个阶段主要由不同的门机制来实现。忘记阶段主要作用是对上一个节点的输入进行选择性的忘记由忘记门控来实现；选择记忆阶段对输入进行选择性记忆；输出阶段选择将哪些作为当前输出。输入的时间序列数据通过这些阶段得到基于长时间序列上的依赖关系，模型的最终输出即为我们需要预测的目标路段下一时刻的交通量。

本发明首先将各个道路检测器存储的交通量的测量值提取出来，将数据按照一定时间间隔转换进行处理，将所在城市道路按照经纬度划分投射在一张大的网格图后，网格图内每个格子的数据则为该区域的交通量，按照时间排列的网格图经过压缩后作为3D CNN的输入，经过CNN的核心部分卷积层池化层提取交通特征后，最后的输出包含目标道路与周围道路的空间依赖关系以及自身的部分时间依赖性，再将CNN的输出经过参数重整作为LSTM的输入，提取更高更完整的时间依赖性。该方法对预测交通量的准确程度较高，对硬件和工程量要求较低，方便实现。

参见图2，2为本发明提出的一种基于时空大数据的交通量预测装置结构图。

如图2所示，本发明还提出基于时空大数据的交通量预测装置，包括：

数据收集模块201，获取目标检测路段在一定时间间隔的交通流信息；

数据存储模块202，对交通流信息按照网格图形式进行存储；

建模模块203，对存储的交通流信息进行建模并提取空间异质性和时间异质性；

预测模块204，利用CNN的输出经过参数重整作为LSTM的输入得到预测路段交通量。

本发明采用了基于时空大数据的交通量预测装置，整个过程是四个模块间的相互作用进而达到预测交通量的目的，数据收集模块，将原始各个道路检测器检测到的交通量的数据按照一定时间间隔映射在包含目标检测道路所在城市各个道路节点拓扑关系不变的网格图上，再将原始网格图在继续保留拓扑关系的基础上进行压缩变换；数据存储模块，将压缩成一系列按照时间节点的交通栅格图后作为3DCNN的输入；建模模块，将网格图作为CNN卷积神经网络的输入，经过参数设置实验，选取最优参数，利用CNN提取附近道路交通量对预测路段交通量的空间异质性；预测模块，将CNN的结果经过参数重整后作为LSTM神经网络的输入，利用LSTM网络提取目标路段历史交通量对当前交通量的时间异质性，最终LSTM神经网络的输出即为最终预测结果。

本发明实施例中的基于时空大数据的交通量预测方法的各种变化方式和具体实例同样适用于基于时空大数据的交通量预测装置，通过前述对基于时空大数据的交通量预测方法的详细描述，本领域技术人员可以清楚的知道本实施例中基于时空大数据的交通量预测方装置，所以为了说明书的简洁，在此不再详述

以上对本发明进行了详细介绍，但是本发明不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下做出各种变化。不脱离本发明的构思和范围可以做出许多其他改变和改型。应当理解，本发明不限于特定的实施方式，本发明的范围由所附权利要求限定。

Claims

1.一种基于时空大数据的交通量预测方法，其特征在于，包括以下步骤：

获取目标检测路段在一定时间间隔的交通流信息；

对交通流信息按照网格图形式进行存储；

利用CNN的输出经过参数重整作为LSTM的输入得到预测结果；

所述对交通流信息按照网格图形式进行存储；具体包括：

对城市道路按照经度和纬度转化成网格图；

按照一定的时间间隔检测获取需要预测路段以及该城市其他道路的交通量历史值并按照网格图的形式存储；

所述利用CNN的输出经过参数重整作为LSTM的输入得到预测结果，包括：将CNN关于不同时间间隔空间异质性对当前路段所产生的影响作为LSTM的输入值，得到空间依赖与时间依赖相结合之后产生的未来时刻交通量作为预测结果；

所述获取目标检测路段在一定时间间隔的交通流信息；具体包括：收集目标检测路段及其周围路段的道路检测器在一定时间间隔内检测的交通流信息；

所述对城市道路按照经度和纬度转化成网格图；具体包括：

通过压缩存储算法将原始的M×N网格图进行压缩得到密集的I×J网格图，其中I×J网格图与M×N网格图的道路空间拓扑关系相同；

所述对存储的交通流信息进行建模并提取空间异质性和时间异质性；具体包括：

将3D CNN的输出经过参数重整作为LSTM的输入对预测路段固定间隔时间历史数据之间的时间依赖关系进行建模；

2.根据权利要求1所述的一种基于时空大数据的交通量预测方法，其特征在于，所述按照一定的时间间隔检测获取需要预测路段以及该城市其他道路的交通量历史值并按照网格图的形式存储；具体包括：

3.根据权利要求1所述的一种基于时空大数据的交通量预测方法，其特征在于，所述利用3DCNN提取预测路段关于空间和时间的依赖关系，提取空间异质性；具体包括：

利用CNN池化层池化机制中的max-pooling方法在保留主要特征的基础上来减少下一层参数；

利用反向传播机制缩小误差进行参数优化；

不断进行参数更改，获取层数参数以及滤波器参数设置；

利用3D CNN卷积层提取目标道路的空间异质性。

4.根据权利要求1所述的一种基于时空大数据的交通量预测方法，其特征在于，所述利用LSTM提取预测路段关于时间上的依赖关系，提取时间异质性，具体包括：

将预测路段一段时间间隔的历史数据作为LSTM的输入数据；

利用LSTM的框架，根据当前路段历史数据提取时间上异质性。

5.根据权利要求1-4中任一所述的一种基于时空大数据的交通量预测方法提出一种基于时空大数据的交通量预测装置，其特征在于，包括：

数据存储模块，对交通流信息按照网格图形式进行存储；