CN113077090A

CN113077090A - 客流预测方法、系统及计算机可读存储介质

Info

Publication number: CN113077090A
Application number: CN202110380561.9A
Authority: CN
Inventors: 刘通; 杨家豪; 童维勤; 艾文伟; 赵时旻
Original assignee: University of Shanghai for Science and Technology
Current assignee: University of Shanghai for Science and Technology
Priority date: 2021-04-09
Filing date: 2021-04-09
Publication date: 2021-07-06
Anticipated expiration: 2041-04-09
Also published as: CN113077090B

Abstract

本发明提供了客流预测方法、系统及计算机可读存储介质，其中客流预测方法，包括以下步骤：S1、获取轨道交通客流数据和影响因素数据并进行预处理，得到客流信息；S2、根据轨道交通客流关系构造轨道网络图、站点属性图和客流趋势图，得到图的结构信息；S3、构建基于深度学习的混合神经网络模型，将客流信息和图的结构信息输入，得到客流预测结果。本客流预测方法、系统及计算机可读存储介质，考虑了包括实时天气条件，工作日状态等多种影响因素，在对轨道交通客流进行短时预测时能获得更高的精准度；考虑了轨道交通客流存在的多种时间依赖关系，通过三个并行的网络模型分别对临近时间客流，短时客流，长期客流进行建模，具有更好的预测性能。

Description

客流预测方法、系统及计算机可读存储介质

技术领域

本发明涉及客流预测技术领域，尤其涉及客流预测方法、系统及计算机可读存储介质。

背景技术

城市轨道交通凭借其运能大、经济高效、运行时间稳定等一系列优势，逐渐成为人们日常出行的最为重要的交通方式之一，城市居民提供了极大的便利。然而，随着城市化进程的快速推进，城市人口数量逐年增加，轨道交通客流压力不断增大，部分线路和车站经常发生客流拥堵，这些拥堵会对人们的日常出行产生不利的影响，甚至带来巨大的安全风险。因此，轨道交通客流的短时预测成为解决这一问题的重要方式。实时准确的客流预测信息不仅可以帮助乘客制定合适的出行计划，还可以帮助城市管理者进行调度资源，避免乘客拥挤，维护地铁系统的稳定运行。

然而，轨道交通短期客流预测是一项非常具有挑战性的任务。一方面，短时客流的不确定性强于日均客流，其客流变化受突发事件和气候因素等随机干扰因素的影响很大。另一方面，各个站点之间的客流也存在着复杂的时空关系，这使得建模变得困难。在过去的几十年里，人们提出了许多基于统计模型和机器学习算法的客流预测模型，如自回归综合移动平均(ARIMA)、支持向量机、卡尔曼滤波器等。这些模型虽然能一定程度上对客流进行预测，但是时效性较差，预测精度较低。主要原因在于它们大多只根据单个站点的客流中的时间依赖性进行建模，没有考虑到轨道交通网络中复杂的空间关系，忽略了站点与站点之间的客流相关性，通常也无法做到使用一个模型对所有地铁站点进行预测。

近年来发展火热的深度学习为解决这些问题提供了思路，循环神经网络中的长期短期记忆(LSTM)和门控递归单元(GRU)可以很好地捕捉序列任务中的时间依赖性，而卷积神经网络和图神经网络则被用来对轨道交通中的空间特征进行提取。其中，图卷积神经网络将地铁站点作为节点，站点之间的邻接关系作为边，有效地捕捉地铁站之间不规则时空依赖关系，提高了预测的准确性。然而，轨道交通的客流预测却不同于其他交通流量预测，地铁站间的距离相对较长，只通过轨道交通网络的拓扑关系可能无法提取出较强的空间依赖性。此外，虽然现有研究还存在一些缺陷，其忽略了外部影响因素对客流的影响，导致预测不够精准。

发明内容

有鉴于此，本发明要解决的技术问题是提供客流预测方法、系统及计算机可读存储介质，可以提高客流预测的精度。

本发明的技术方案是这样实现的：

一种客流预测方法，包括以下步骤：

S1、获取轨道交通客流数据和影响因素数据并进行预处理，得到客流信息；

S2、根据轨道交通客流关系构造轨道网络图、站点属性图和客流趋势图，得到图的结构信息；

S3、构建基于深度学习的混合神经网络模型，将客流信息和图的结构信息输入，得到客流预测结果。

优选的，所述客流数据包括邻近时间客流、短期客流和长期客流数据；

预处理包括：使用离差标准化对邻近时间客流、短期客流和长期客流进行处理，将客流值映射到[0-1]之间并作为模型的输入信息，表示为X_r，X_d和X_w。

优选的，所述影响因数数据包括：实时天气数据和工作节假日数据；

所述预处理包括：对于天气数据，以相同大小的间隔对时间进行离散化，将其映射到各个时间片，并与客流数据进行对齐，每个时间片下的天气情况用一维向量表示；对于工作节假日数据，采用one-hot方式对其进行编码，得到一维向量；将两个数据向量进行拼接，得到外部影响因素向量g。

优选的，所述轨道网络图、站点属性图和客流趋势图共享相同的节点，V代表节点的集合，每个节点代表轨道交通网络中的一个地铁站点；

轨道网络图表示为G_s＝(V，W_s)，边的权重W_s根据地铁站点是否邻接决定，其公式表示为：

站点属性图表示为G_p＝(V，W_p)，边的权重W_p根据两个地铁站之间的POI相似程度进行判断；

以地铁站为中心，构造POI向量P∈R^h×1；其中h表示POI类别的数量，每个类别下的数值表示该区域中该类POI的数量；POI相似程度的计算公式表示为：

其中，

和

分别表示站点v_i和站点v_j的POI向量；

客流趋势图表示为G_q＝(V,W_q)，边的权重W_q根据两个地铁站之间的长期客流趋势进行计算；

长期客流趋势通过平均工作日客流和平均周末客流进行表示，客流趋势相似程度通过动态时间归整算法进行计算，其公式表示为：

W_p，ij＝exp(-DWT(T_vi，T_vj))∈(0，1)

其中，

和

分别表示站点v_i和站点v_j的长期客流趋势。

优选的，构建基于深度学习的混合神经网络模型具体包括包括图卷积神经网络、循环神经网络和全连接神经网络；

图卷积神经网络用于在构造的三张功能图上提取轨道交通网络中站点之间的空间相关性；

循环神经网络用于捕捉客流在不同时间段内的时间依赖关系；

全连接神经网络用于将提取的时空特征以及各种外部影响因素进行整合，将高维特征映射到样本空间；

模型由三个结构相同的并行模块组成，分别对邻近时间段客流，短期客流和长期客流的时空关系进行建模。

优选的，将客流信息和图的结构信息输入，得到客流预测结果具体包括：

将客流信息X和图的结构信息输入到网络中，得到未来一个时间片内的客流预测结果：

X_τ+1＝f(X，G_s,G_p,G_q)

某时间段内的客流数据表示为一个二维的张量X∈R^N×T，其中N是地铁站点数量，T表示时间片数量，设置邻居节点的数目为k-1，进行规整化，图数据和客流数据集成到一个新的三维张量Z∈R^N×k×T，当前时间片客流信息为一个二维的张量Z_τ∈R^N×k；使用大小为1×k的卷积核进行特征提取，第l层的卷积运算的定义如下：

其中，*表示卷积运算，σ表示激活函数。W_l和b_l是第l层卷积核的权重和偏置在L个卷积层之后，使用一个1×1的卷积操作来减少特征的维数，得到图神经网络的输出，其定义为：

轨道网络图、站点属性图和客流趋势图通过图卷积操作之后，得到各自的高维隐藏特征，分别表示为

空间特征通过一个两层全连接神经网络进行融合，融合结果表示为h_τ；将外部特征向量与客流的隐藏特征相结合，其定义为：

其中

表示连接运算符；

模型通过LSTM网络对时间依赖性进行提取，并得到最终的预测结果：

邻近时间客流产生的预测结果为Y_r，短期客流产生的预测结果为Y_d，邻近时间客流产生的预测结果为Y_w；

通过两层全连接神经网络分配权重，并产生最终的预测结果，这个过程表示为：

其中，

是哈德曼乘积，W_r、W_d和W_w是全连接神经网络学习得到的权重参数。

本发明还提出了一种客流预测系统，包括：

获取模块，用于获取轨道交通客流数据和影响因素数据并进行预处理，得到客流信息；

构图模块，用于根据轨道交通客流关系构造轨道网络图、站点属性图和客流趋势图，得到图的结构信息；

预测模块，用于构建基于深度学习的混合神经网络模型，将客流信息和图的结构信息输入，得到客流预测结果。

本发明还提出了计算机可读存储介质，所述存储介质上存储有计算机程序，当所述计算机程序被处理器执行时，实现如上述任一项所述的客流预测方法。

本发明提出的客流预测方法、系统及计算机可读存储介质，通过在预测时获取客流信息轨道交通客流数据和影响因素数据并进行预处理，得到客流信息，构建模型后在模型中输入客流信息，从而可以考虑到外部影响因素对客流的影响，提高预测的精度。

附图说明

图1为本发明实施例提出的客流预测方法流程图；

图2是本发明实施例提出的客流预测方法中的混合神经网络模型的框架示意图；

图3是本发明实施例提出的客流预测方法中的混合神经网络模型的细节图。

图4是本发明中图卷积神经网络结构示意图。

图5为本发明实施例提出的客流预测系统的结构框图

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1-4所示，本发明实施例提出了一种客流预测方法，包括以下步骤：

S101、获取轨道交通客流数据和影响因素数据并进行预处理，得到客流信息；

S102、根据轨道交通客流关系构造轨道网络图、站点属性图和客流趋势图，得到图的结构信息；

S103、构建基于深度学习的混合神经网络模型，将客流信息和图的结构信息输入，得到客流预测结果。

可见，本发明提出的客流预测方法、系统及计算机可读存储介质，通过在预测时获取客流信息轨道交通客流数据和影响因素数据并进行预处理，得到客流信息，构建模型后在模型中输入客流信息，从而可以考虑到外部影响因素对客流的影响，提高预测的精度。

具体的，本申请中：

客流数据。AFC系统提供的乘客记录包括乘车站点、费用、进出站状态等信息，本文将地铁站的进出站客流用一定时间内的进出站乘客数量来近似，并设置一个固定大小的时间间隔，通过AFC数据统计所有站点在各个时间段的客流情况。为了考虑客流的周期性，将输入的客流信息分为三段，即邻近时间客流，短期客流和长期客流。邻近时间客流指当前时刻前一段时间的客流，短期客流指前几天相同时间段的客流，长期客流指前几周相同工作日中相同时段的客流，使用离差标准化对三段客流进行处理，将客流值映射到[0-1]之间并作为模型的输入信息，表示为X_r，X_d和X_w。

影响因素数据，即其他因素数据主要包括实时天气数据和工作节假日情况。对于天气数据，和客流数据一样，以相同大小的间隔对时间进行离散化，将温度、风速、降雨情况等信息映射到各个时间片，并与客流数据进行对齐，每个时间片下的天气情况用一个一维向量表示；对于工作节假日情况，采用one-hot方式对其进行编码，同样得到一个一维的向量。将两个数据向量进行拼接，得到一个外部影响因素向量g。

步骤S102主要是针对城市轨道交通中存在的一些客流关系进行建模，便于后续进行特征提取，主要是构造了三幅拓扑图：轨道网络图、站点属性图和客流趋势图。这三幅图共享相同的节点，V代表节点的集合，每个节点代表轨道交通网络中的一个地铁站点，它们的边根据各自图的功能进行设置。轨道网络图主要用来描述现实世界中地铁站的相邻关系，表示为G_s＝(V，W_s)，边的权重W_s根据地铁站点是否邻接决定，其公式可以表示为：

站点属性图主要捕捉功能属性相似的站点之间的客流特征，表示为G_p＝(V，W_p)，边的权重W_p根据两个地铁站之间的POI相似程度进行判断。POI又称为“兴趣点”，可以理解为地图上的任何具有特殊功能的建筑，如购物中心、公园、体育场等。POI中所包含的信息可以反映某一区域的功能，这与地铁客流密切相关。以地铁站为中心，统计1.5km半径内的POI数量，构造POI向量P∈R^h×1。其中h表示POI类别的数量，每个类别下的数值表示该区域中该类POI的数量。我们使用TF-IDF算法对不同类别的POI分配权重，并使用余弦相似度来度量节点之间的属性差异，POI相似程度的计算公式可以表示为：

其中，

和

分别表示站点v_i和站点v_j的POI向量。客流趋势图主要考虑长期客流中不同站点的空间关系，表示为G_q＝(V，W_q)，边的权重W_q根据两个地铁站之间的长期客流趋势进行计算。长期客流趋势通过平均工作日客流和平均周末客流进行表示。客流趋势相似程度通过动态时间归整算法进行计算，其公式表示为：

其中，

和

分别表示站点v_i和站点v_j的长期客流趋势。

构建基于深度学习的混合神经网络模型，该模型由三个结构相同的并行模块组成，分别对邻近时间段客流，短期客流和长期客流的时空关系进行建模。该模型将预处理得到的客流数据和图的结构信息作为输入，得到短时客流预测结果，这个过程可以表示为：

X_τ+1＝f(X，G_s，G_p，G_q)

图3主要展示了构建的基于深度学习的混合神经网络模型细节，模型主要由多图卷积层，特征融合层，循环神经网络层和全连接层组成，共包含三种神经网络结构。

多图卷积层由图卷积神经网络构成，主要用于在构造的三张功能图上提取轨道交通网络中的空间相关性。参见图4，多图卷积层中的图卷积神经网络是一种改进的基于空域的图卷积神经网络。它通过一定方式将图结构信息与客流数据进行整合，转换成结构规整的适用于卷积神经网络的数据进行特征提取。具体来说，对于轨道网络图，它采用广度优先算法选择固定数目的相邻节点，对于站点属性图和客流趋势图，则根据边缘的权重从大到小选择固定数量的节点来构造规则的数据结构。

某时间段内的客流数据表示为一个二维的张量X∈R^N×T，其中N是地铁站点数量，T表示时间片数量，设置邻居节点的数目为k-1，在进行规整化之后，图数据和客流数据集成到一个新的三维张量Z∈R^N×k×T，那么当前时间片客流信息为一个二维的张量Z_τ∈R^N×k。使用大小为1×k的卷积核进行特征提取，第l层的卷积运算的定义如下：

其中，*表示卷积运算，σ表示激活函数。W_l和b_l是第l层卷积核的权重和偏置。在L个卷积层之后，我们使用一个1×1的卷积操作来减少特征的维数，得到图神经网络的输出，其定义为：

特征融合层主要通过全连接层将提取的空间特征与外部影响因素结合，并将结果输入到循环神经网络层。构造的三张功能图通过图卷积操作之后，得到各自的高维隐藏特征，分别表示为

这些提取到的空间特征在特征融合层通过一个两层全连接神经网络进行融合，融合结果表示为h_τ。然后将外部特征向量与客流的隐藏特征相结合，其定义为：

其中

表示连接运算符。

循环神经网络主要用于捕捉客流在不同时间段内的时间依赖关系；最后一个全连接层则将高维特征映射到样本空间，产生预测结果。最后，三个并行的模块分别得出预测值，邻近时间客流产生的预测结果为Y_r，短期客流产生的预测结果为Y_d，邻近时间客流产生的预测结果为Y_w。由于三个模块在不同时段的预测准确性有所不同，因此通过一个两层全连接神经网络分配权重，并产生最终的预测结果，这个过程可以表示为：

其中

是哈德曼乘积。W_r、W_d和W_w是全连接神经网络学习得到的权重参数。

在模型训练的过程中，为了最小化实际客流值与预测值之间的误差，需要设置一个损失函数。本方法使用Y_τ+1和

分别表示实际值和预测值，并用均方误差作为损失函数来训练模型的参数，其定义为

其中θ是此模型中所有可学习参数的集合。

对于本实例中的数据集，上海地铁数据集是基于2015年4月1日至4月30日内上海地铁系统的刷卡数据构建的，在此期间，上海地铁每天大约有900万张刷卡记录，覆盖全市14条线路，共计313个车站。由于地铁线路不在夜间运营，本发明只考虑从6：00到24：00的乘客记录，并以15分钟为间隔统计每个车站的出站客流。杭州轨道交通网络由分布在5条线路上的共80个地铁站组成，而杭州地铁数据集是基于杭州地铁系统2019年1月1日至1月25日的刷卡数据构建。与上海轨道交通数据集一样，以15分钟的时间间隔统计每个地铁站点的客流量。本实例中以80％的数据作为训练集，剩余20％作为测试集，在两个不同的数据集中，预测整个轨道交通网络下一个时间片的地铁出站客流。

表1 模型性能评估结果

为验证所提出方法的预测效果的优越性，本发明将与历史求平均(HA)、整合移动平均自回归模型(ARIMA)等基于统计学的方法，以及包括LSTM、STGCN在内的一些基于深度学习的神经网络方法进行性能比较，并使用均方误差(MAE)和均方根误差(RMSE)作为评估指标。

模型的评估结果如表1所示，可以发现，本发明提出的方法在这两个数据集上都取得了最好的性能。具体来说，HA和ARIMA表现不佳，它们在上海数据集的RMSE分别为112.6和180.1，这主要是因为这些基于统计学的模型性能有限，难以对非线性的复杂的城市交通数据进行建模。基于深度学习的方法通常会比传统的时间序列分析方法更能得到更好的预测结果。例如，LSTM和GRU在上海数据集的测试中RMSE分别为43.7和42.9，与HA模型相比，误差指标下降了约61.1％和61.9％。

如图5所示，本发明实施例还提出了一种客流预测系统，包括：

获取模块1，用于获取轨道交通客流数据和影响因素数据并进行预处理，得到客流信息；

构图模块2，用于根据轨道交通客流关系构造轨道网络图、站点属性图和客流趋势图，得到图的结构信息；

预测模块3，用于构建基于深度学习的混合神经网络模型，将客流信息和图的结构信息输入，得到客流预测结果。

在本发明的一个优选实施例中，所述客流数据包括邻近时间客流、短期客流和长期客流数据；

在本发明的一个优选实施例中，所述影响因数数据包括：实时天气数据和工作节假日数据；

本发明还提出了一种计算机可读存储介质，所述存储介质上存储有计算机程序，当所述计算机程序被处理器执行时，实现上述所述的客流预测方法。

本发明的方法基于轨道交通站点的拓扑关系，属性相似性，以及长期的客流模式构建了三种功能图，对多种地铁网络中的多种客流相关性进行建模，并使用一种新颖的图卷积神经网络从多个角度捕捉客流的空间相关性。

本发明的方法考虑了包括实时天气条件，工作日状态等多种影响因素，在对轨道交通客流进行短时预测时能获得更高的精准度。

本发明充分考虑了轨道交通客流存在的多种时间依赖关系，通过三个并行的网络模型分别对临近时间客流，短时客流，长期客流进行建模，具有更好的预测性能。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例的方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(solidstatedisk，SSD))等。

最后需要说明的是：以上所述仅为本发明的较佳实施例，仅用于说明本发明的技术方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等，均包含在本发明的保护范围内。