CN112990555A

CN112990555A - 基于时空并行栅格神经网络的地铁人流量预测方法及系统

Info

Publication number: CN112990555A
Application number: CN202110205756.XA
Authority: CN
Inventors: 欧俊杰; 孙嘉徽; 朱一晨; 金海明; 刘艺娟; 黄建强; 王新兵
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2021-02-24
Filing date: 2021-02-24
Publication date: 2021-06-18

Abstract

本发明提供了一种基于时空并行栅格神经网络的地铁人流量预测方法及系统，包括：提出一种栅格神经网络来学习地铁人流量的时间关系，捕捉地铁人流量短期时间相关性；进一步捕捉地铁人流量的长期时间相关性；通过基于转移流量的指标来度量地铁站间的空间相关性，并基于这种指标将地铁系统建模成加权有向图；基于地铁加权有向图的构建，将传播图神经网络与栅格神经网络组合，学习地铁人流量的动态空间相关性；并行执行长短期时间相关性和动态空间相关性的学习过程，并融合两者的结果得到最终的地铁人流量预测结果。本发明采用了一种时空并行学习的框架，它能够有效地学习到地铁人流量的长短期时间相关性和动态空间相关性，并将所学知识应用于预测。

Description

基于时空并行栅格神经网络的地铁人流量预测方法及系统

技术领域

本发明涉及时空数据挖掘和城市计算领域，具体地，涉及一种基于时空并行栅格神经网络的地铁人流量预测方法及系统。

背景技术

目前，中国的地铁系统建设仍处在蓬勃发展的阶段。上海市在2018年至2023年期间计划新建9条地铁线路；广州市2018年开工建设6条地铁线路，总长110公里，车站73座。对于地铁站人流量的精准预测，可起到辅助规划建站规模、辅助排定地铁班次、合理安排地铁工作人员等关键作用，对满足国人日常出行需求具有重要的实际意义。

迄今为止，已有诸多工作针对车速、车流量、人流量等交通情况的预测展开研究。这些工作或使用传统的时间序列分析的方法(如ARIMA及其衍生方法)、或使用基于深度学习的方法(如RNN、CNN、GNN)。然而由于下文所述的两点原因，上述方法并不能直接用于解决地铁站人流量的预测问题。

首先，虽然RNN可以很好的捕捉时间序列数据的短期非线性时间相关性，其通常由于梯度消失等问题在学习长期时间相关性上性能不佳。即使LSTM和MResRGMM可以一定程度上解决传统RNN存在的上述问题，这些模型仍然存在着门机制复杂、训练耗时长等缺陷。

其次，绝大多数现有交通预测方面的工作使用地理特性(如距离、连通性等)来表征不同城市区域或路段之间的空间相关性。然而地理特性往往不能恰当刻画地铁站之间转移流量，两地铁站之间的转移流量往往不由其间的距离决定，距离远的两站之间的转移流量往往可大可小，因此仅仅依靠地理特性无法表达地铁站之间的空间相关性。另外，地铁站之间空间相关性的动态特性更使得其难以用静态的空间特性来表征。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种基于时空并行栅格神经网络的地铁人流量预测方法及系统。

根据本发明提供的一种基于时空并行栅格神经网络的地铁人流量预测方法，包括如下步骤：

步骤A：通过栅格神经网络来学习地铁人流量的时间关系，并基于短期历史地铁人流量和近邻栅格神经网络捕捉地铁人流量的短期时间相关性；

步骤B：基于长期历史地铁人流量和周期栅格神经网络进一步捕捉地铁人流量的长期时间相关性；

步骤C：通过一种基于转移流量的指标来度量地铁站间的空间相关性，并基于所述指标将地铁系统建模成加权有向图；

步骤D：基于地铁加权有向图的构建，将传播图神经网络与栅格神经网络组合，学习地铁人流量的动态空间相关性；

步骤E：并行执行长短期时间相关性和动态空间相关性的学习过程，并融合两者的结果得到最终的地铁人流量预测结果。

优选地，所述步骤A包括：

步骤A1：对于整个地铁系统，在时间间隔t内，通过n维向量

来表示n个站点的地铁出站流量，提取过去T个时间间隔的地铁人流量数据作为短期历史输入数据，即X_1：T＝(x_t-(T-1)，x_t-(T-2)，…x_t)；

步骤A2：定义栅格神经网络来学习时间关系，栅格神经网络的基本单元由一维卷积神经网络和非线性激活函数组成；

步骤A3：将所述基本单元扩展到所有的时间步骤和不同卷积层，并共享相同的权重矩阵W，从而构成栅格神经网络的整体结构；给定输入的地铁出站流量数据序列X_1：T，设定一个栅格神经网络在一个卷积层上的操作定义为：

其中*表示零填充的一维因果卷积运算，W表示在所有卷积层之间共享的内核权重矩阵参数；

表示第k-1层栅格神经网络的隐藏输出值。

步骤A4：搭建一个具备s层的近邻栅格神经网络Γ^(s)，并初始化

在堆叠s层卷积层之后，将第s层的隐藏层输出的最后一个单元作为近邻栅格神经网络的输出结果，即：

式中，Γ^(s)(·)表示具有s层的近邻栅格神经网络的整体运算操作。

优选地，所述步骤B包括：

步骤B1：基于地铁人流量的日周期特性，提取过去D天内与预测时段相同的时间间隔内的地铁人流量数据作为长期的日周期历史输入数据，即：

其中，m表示一天中的时间间隔数；

步骤B2：将日周期地铁历史人流量数据与近邻栅格神经网络的输出结果组合构成新的序列，并输入到另一个构建的周期栅格神经网络Γ^(p)来进一步学习地铁人流量的长期时间相关性，即：

优选地，所述步骤C包括：

步骤C1：提出一种基于转移流量的度量指标

来表示地铁站之间的空间相关性；

步骤C2：基于上述定义的空间相关性度量指标，将整个地铁系统建模为加权有向图G_t＝(V，ε_t，M_t)，其中V＝{1，2，…n}表示由所有地铁站组成的顶点集，ε_t表示边缘集，

表示以

作为边权重的邻接矩阵，即：

步骤C3：提出基于传播与空域分解的传播图卷积神经网络(DGCN)，为预测在时间间隔t+1处的地铁出站流量，将地铁有向图G_t的输入节点特征定义为：

其中(·)^tr表示转置操作，

表示第n个站在时间间隔t的入站流量，将地铁有向图输入DGCN来学习地铁人流量的空间相关性：

其中Ψ(·)表示DGCN的整体操作，

表示逐元素乘积，θ_w表示DGCN的模型参数。

优选地，所述步骤D包括：

步骤D1：在过去s个时间间隔内构造s个地铁有向图，并使用s个DGCN分别处理这些地铁有向图，将输出结果按时间先后组成一个新的序列，并进一步输入到另一个构建的动态栅格神经网络中来学习地铁空间相关性的动态变化特性；

式中

表示具有r层的动态一栅格神经网络的输出，也就是学习地铁人流量动态空间相关性后的输出结果。

优选地，所述步骤E包括：

融合时间相关性和空间相关性的学习结果，得到最终的地铁人流量预测值：

式中w_x和w_y是可训练的参数，用于衡量时间相关性学习和动态空间相关性学习的结果对最终地铁人流量预测结果影响的权重，tanh表示激活函数。

根据本发明提供的一种基于时空并行栅格神经网络的地铁人流量预测系统，包括如下模块：

模块A：通过栅格神经网络来学习地铁人流量的时间关系，并基于短期历史地铁人流量和近邻栅格神经网络捕捉地铁人流量的短期时间相关性；

模块B：基于长期历史地铁人流量和周期栅格神经网络进一步捕捉地铁人流量的长期时间相关性；

模块C：通过一种基于转移流量的指标来度量地铁站间的空间相关性，并基于所述指标将地铁系统建模成加权有向图；

模块D：基于地铁加权有向图的构建，将传播图神经网络与栅格神经网络组合，学习地铁人流量的动态空间相关性；

模块E：并行执行长短期时间相关性和动态空间相关性的学习过程，并融合两者的结果得到最终的地铁人流量预测结果。

优选地，所述模块A包括：

模块A1：对于整个地铁系统，在时间间隔t内，通过n维向量

模块A2：定义栅格神经网络来学习时间关系，栅格神经网络的基本单元由一维卷积神经网络和非线性激活函数组成；

模块A3：将所述基本单元扩展到所有的时间模块和不同卷积层，并共享相同的权重矩阵W，从而构成栅格神经网络的整体结构；给定输入的地铁出站流量数据序列X_1：T，设定一个栅格神经网络在一个卷积层上的操作定义为：

表示第k-1层栅格神经网络的隐藏输出值。

模块A4：搭建一个具备s层的近邻栅格神经网络Γ^(s)，并初始化

优选地，所述模块B包括：

模块B1：基于地铁人流量的日周期特性，提取过去D天内与预测时段相同的时间间隔内的地铁人流量数据作为长期的日周期历史输入数据，即：

其中，m表示一天中的时间间隔数；

模块B2：将日周期地铁历史人流量数据与近邻栅格神经网络的输出结果组合构成新的序列，并输入到另一个构建的周期栅格神经网络Γ^(p)来进一步学习地铁人流量的长期时间相关性，即：

优选地，所述模块C包括：

模块C1：提出一种基于转移流量的度量指标

来表示地铁站之间的空间相关性；

模块C2：基于上述定义的空间相关性度量指标，将整个地铁系统建模为加权有向图G_t＝(V，ε_t，M_t)，其中V＝{1，2，…n}表示由所有地铁站组成的顶点集，ε_t表示边缘集，

表示以

作为边权重的邻接矩阵，即：

模块C3：提出基于传播与空域分解的传播图卷积神经网络(DGCN)，为预测在时间间隔t+1处的地铁出站流量，将地铁有向图G_t的输入节点特征定义为：

其中(·)^tr表示转置操作，

其中Ψ(·)表示DGCN的整体操作，

表示逐元素乘积，θ_w表示DGCN的模型参数。

优选地，所述模块D包括：

模块D1：在过去s个时间间隔内构造s个地铁有向图，并使用s个DGCN分别处理这些地铁有向图，将输出结果按时间先后组成一个新的序列，并进一步输入到另一个构建的动态栅格神经网络中来学习地铁空间相关性的动态变化特性；

式中

表示具有r层的动态-栅格神经网络的输出，也就是学习地铁人流量动态空间相关性后的输出结果。

优选地，所述模块E包括：

与现有技术相比，本发明具有如下的有益效果：

1、本发明采用了一种时空并行学习的框架，能够有效地学习到地铁人流量的长短期时间相关性和动态空间相关性，并将所学知识应用于预测。

2、本发明可以直接应用于拥有复杂地铁网络的城市AFC数据集上。

3、本发明构造合理，使用方便，能够克服现有技术的缺陷。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明实施例中的地铁人流量预测方法的示例图。

图2为本发明实施例中的栅格神经网络的示例图。

图3为本发明实施例中的基于转移流量的度量指标的示例图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

如图1-3所示，本发明提供了一种基于时空并行栅格神经网络的地铁人流量预测方法及系统。具体地，本实施例包括如下步骤：

步骤A：提出一种新型的栅格神经网络来学习地铁人流量的时间关系，并基于短期历史地铁人流量和近邻栅格神经网络捕捉地铁人流量短期时间相关性；

步骤C：提出一种基于转移流量的新型指标来度量地铁站间的空间相关性，并基于这种指标将地铁系统建模成加权有向图；

所述步骤A包括如下内容：

步骤A1：对于整个地铁系统，在时间间隔t内，我们使用n维向量

来表示n个站点的地铁人流量。为了预测在下一个时间间隔t+1中的地铁出站流量，我们将过去T个时间间隔内的地铁出站流量用作短期的历史输入数据。从而，我们得到一个长度为T的地铁人流量数据序列X_1：T：X_1：T＝(x_t-(T-1)，x_t-(T-2)，…x_t)；

步骤A2：定义一种新型的栅格神经网络来学习时间关系，如图2右所示，栅格神经网络的基本单元由一维卷积神经网络和非线性激活函数组成，并通过在时间步长和网络层上堆叠其基本单元来构建一个类似于栅格形状的神经网络。具体来说，栅格神经网络的第k+1层中的第j个单元的输入由来自上一层k的隐藏输出

和

以及来自原始输入序列的X_j-1和X_j组成。第j个单位的变换表示为以下等式

其中

是激活前的输出，X_j和X_j-1对应于原始输入序列中的第(j-1)和第j个向量，||是级联运算符，w₁和w₂是内核权重，

表示第k层中第j个单元的输出，f是作用于

和

的非线性激活函数；

步骤A3：如图2左所示，基于步骤A2定义的基本单元，扩展到所有的时间步骤和所有深度的卷积层，并且共享相同的内核权重矩阵W，得到栅格神经网络结构。给定输入的地铁出站流量数据序列X_1：T，我们定义一个栅格神经网络在一个卷积层上的操作定义为

其中*表示零填充的一维因果卷积运算，它只对过去时间间隔中的数据进行卷积，从而保证特征学习的时间性，W表示在所有卷积层之间共享的内核权重矩阵参数；

步骤A4：构建一个具备s层的近邻栅格神经网络Γ^(s)，并初始化

在堆叠s层卷积层之后，将第s层的隐藏层输出的最后一个单元作为近邻栅格神经网络的输出结果，即

所述步骤B包括如下内容：

步骤B1：构造日周期的长期地铁历史人流量数据。显然，地铁人流量的值在日周期时间间隔(即过去几天中的相同时间间隔)之间彼此非常接近。这种现象表明地铁人流量具有近似长期的周期性。为了捕获地铁人流量中的这种长期周期性，我们将日周期数据定义为过去D天中与预测目标间隔t+1相同的时间间隔内的地铁出站流量，如下所示：

其中，m表示一天中的时间间隔数。

步骤B2：构造近邻-周期栅格神经网络组来捕获长期时间相关性。鉴于相邻两天之间的地铁流在时间上不连续的现象，综合考虑地铁人流量的长短期时间相关性和不连续性，在近邻栅格神经网络之后进一步使用了一个周期栅格神经网络Γ^(P)，将步骤B2中定义的日周期数据与近邻栅格神经网络的输出结果组合成一个新的序列，并将其作为周期栅格神经网络的输入。即

式中s和p分别是近邻栅格神经网络和周期栅格神经网络的卷积网络层数，

为近邻-周期栅格神经网络组的最终输出，包含了地铁人流量长短期时间相关性后的学习结果。

所述步骤C包括如下步骤：

步骤C1：通过步骤A、B能够很好的学习到地铁出站流量的时间相关性，但是，仅考虑时间相关性通常不足以准确预测地铁出站流量。例如，当城市里某个地方将要举行特殊活动时，附近地铁站的乘客出站流量可能会急剧增加，这很难仅从历史流量的时间相关性中学习。因此使用图卷积-栅格神经网络的模型来学习动态的空间相关性。

显然，在过去的几个时间间隔内，一个站点的出站流量受到附近和远处站点的入站流量的影响，并且这种影响与两个站点之间的转移流量呈正相关。因此，我们提出一种新的基于转移流量的度量指标来表示地铁站之间的空间相关性。

定义1(基于转移流量的度量指标)给定时间间隔t和始发站-目的地站对(i，j)，我们用

表示在时间间隔t进入第i站在第j站出站的乘客集合。在第i站入站的乘客所经过的时间窗口表示为[e_t，l_t]。基于以上表示，我们定义了基于转移流量的度量

其中，

表示

的势，而

表示在时间窗口[e_t，l_t]中进入i站的乘客数量。如图3所示给出了这种度量的一个示例图，在此示例中，

因此

步骤C2：基于步骤C1定义的空间相关性度量指标，将整个地铁系统建模为加权有向图G_t＝(V，ε_t，M_t)，其中V＝{1，2，…n}表示由所有地铁站组成的顶点集，ε_t表示边缘集，

表示以

作为边权重的邻接矩阵，即

步骤C3：基于步骤C2构建的地铁有向图，我们将其用作图卷积网络(GCN)的输入来捕获地铁人流量之间的空间相关性。GCN可以分为基于谱分解或基于空域分解的方法。由于拉普拉斯矩阵分解的对称性要求，基于谱分解的方法仅适用于无向图而无法用于这里的地铁有向图。因此，我们提出将传播过程集成到基于空间的图卷积中，并在地铁有向图上使用传播图卷积网络(DGCN)来捕获地铁流的空间相关性。为了预测在时间间隔t+1处的地铁出站流量，图卷积-栅格神经网络中的每个图神经网络都采用所有地铁站在时间间隔t内的地铁入站流量作为输入节点特征，给定如下

其中(·)^tr表示转置操作，

表示第n个站在时间间隔t的入站流量。然后，我们将DGCN中的传播图卷积定义为

其中Ψ(·)表示DGCN的整体操作，

表示逐元素乘积，θ_w表示DGCN的模型参数。

所述步骤D包括如下步骤：

步骤D1：为了捕捉动态的空间相关性，我们分别将过去几个时刻的邻接矩阵M_t-s，M_t-s+1，…，M_t输入到s+1个不同的传播神经网络，然后利用动态-栅格神经网络对各个传播神经网络的输出组成的序列进行时间学习，从而得到动态-栅格神经网络的输出结果，即

式中

所述步骤E包括如下步骤：

步骤E1：提出的时空并行神经网络框架将融合时间相关性和空间相关性信息输出最终的地铁人流量预测结果，如图1(c)部分所示，我们将模型中时间模块的输出与空间模块的输出融合，并将融合后的值用作预测的地铁人流量值，即

本实施例主要关注地铁人流量预测的实际问题，并从时空维度提出了一种基于时空并行栅格神经网络的方法来进行人流量预测。一方面引入栅格神经网络来学习地铁历史人流量复杂的长期周期性特征和短期近邻性特征，另一方面创造性地提出了一种基于转移流量的地铁人流量空间相关性度量指标，并且将栅格神经网络与图卷积神经网络结合来学习地铁人流量的动态空间相关性。在深圳和杭州两个城市的地铁自动计费系统所获取的地铁乘客流量数据集上的实验充分证明了本实施例的有效性。从均方根误差和平均绝对误差指标来看，本实例的性能要显著优于目前最好的交通流量预测方法。尽管本实施例设计用于地铁流量预测场景，但是其提出的时空特征学习的方法同样可以应用于解决其它各种各样的交通预测任务。

本发明还提供的一种基于时空并行栅格神经网络的地铁人流量预测系统，包括如下模块：

所述模块A包括：

模块A1：对于整个地铁系统，在时间间隔t内，通过n维向量

表示第k-1层栅格神经网络的隐藏输出值。

所述模块B包括：

其中，m表示一天中的时间间隔数；

所述模块C包括：

模块C1：提出一种基于转移流量的度量指标

来表示地铁站之间的空间相关性；

表示以

作为边权重的邻接矩阵，即：

其中(·)^tr表示转置操作，

其中ψ(·)表示DGCN的整体操作，

表示逐元素乘积，θ_w表示DGCN的模型参数。

所述模块D包括：

式中

所述模块E包括：

本领域技术人员知道，除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外，完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以，本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构；也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。