CN111667092B

CN111667092B - 基于图卷积神经网络的轨道交通短时客流预测方法和系统

Info

Publication number: CN111667092B
Application number: CN202010316862.0A
Authority: CN
Inventors: 陈�峰; 张金雷; 李小红; 朱亚迪; 胡舟
Original assignee: Beijing Jiaotong University
Current assignee: Beijing Jiaotong University
Priority date: 2020-04-21
Filing date: 2020-04-21
Publication date: 2023-06-23
Anticipated expiration: 2040-04-21
Also published as: CN111667092A

Abstract

本发明公开了一种基于图卷积神经网络的轨道交通短时客流预测方法和系统。该方法包括：以图结构G＝(V，E，A)表征城市轨道交通网络，并以t时刻的特征矩阵F＝(X_t，X_t‑1，X_t‑2，…X_t‑m+1)表示t时刻之前m个时间间隔的历史客流情况，其中V表示地铁车站的数目，车站与车站之间有E条边，A∈R^n×n是表征车站之间是否相邻的邻接矩阵，F的维度为n×m，n为车站数目；构建深度学习模型，学习t时刻的特征矩阵F和邻接矩阵A与预测的t+1时刻各车站客流情况之间的映射关系。本发明能够准确预测轨道交通的短时客流情况，对城市轨道交通运营管理部门进行全网水平的短时客流监测、实时管理和工程实践具有重要的指导意义。

Description

基于图卷积神经网络的轨道交通短时客流预测方法和系统

技术领域

本发明涉及轨道交通客流分析技术领域，更具体地，涉及基于图卷积神经网络的轨道交通短时客流预测方法和系统。

背景技术

随着城市轨道交通网络化的快速发展，乘客对城市轨道交通的运营管理和服务水平提出了更高的要求。要切实提高轨道交通运营管理的现代化智能化水平，准确把握全网客流发生前后的时空分布状态至关重要，因此全网水平的短时客流预测也成为智能交通系统的关键性基础工作。

纵观短时客流预测的发展历程，大致可分为三个阶段。第一个阶段是传统的基于数理统计的模型，第二个阶段是基于机器学习的模型，第三个阶段是基于深度学习的模型。

具体地，短时客流预测发展的第一个阶段是传统的基于数理统计的模型，例如历史平均模型HA、最小二乘法、时间序列模型、逻辑回归等。该阶段由于城市轨道交通并未迅速发展起来，所做的短时客流预测大多是针对道路交通的，因此，在城市轨道交通领域基本没有应用，而在道路交通领域，由于这些模型固有的一些弊端，例如“实时性”差，预测精度低，即不能满足短时客流预测的实时性要求和预测精度要求，因此该阶段发展起来的模型大多已不再应用。

短时客流预测发展的第二个阶段是基于机器学习的模型，例如利用决策树、随机森林、多层感知机、支持向量机模型等。在这个阶段，随着城市轨道交通的发展，其短时客流预测问题开始得到研究者的重视，因此基于机器学习的模型逐渐被应用到城市轨道交通领域，模型既包括单一模型，也包括一种或多种模型结合使用的混合模型。但是该阶段大多数模型没有考虑车站之间的时空相关性，只是针对一个或几个车站进行单独预测，因而预测精度也受到一定程度的限制。

随着近几年深度学习的快速发展，其良好的预测表现能力极大促进了交通预测领域的革新，短时客流预测也随之进入了第三个发展阶段，即以深度学习模型为代表的发展阶段，循环神经网络，卷积神经网络，图卷积神经网络等相继被挖掘应用到短时客流预测，大量深度学习框架也随即被开发出来。研究表明，深度学习框架比单一的RNN或CNN模型在多数情况下具有更好的模型表现能力。但现有模型不能有效地考虑网络的时空依赖以及网络的拓扑结构对预测精度的影响。

总之，目前所有的短时客流预测模型主要存在以下几个问题：传统的基于数理统计的模型存在实时性较差，预测精度较低等问题；基于机器学习的模型虽然一定程度上提高了短时客流预测精度，但是在预测过程中并没有考虑全网客流之间的时空特性对预测结果的影响，而且该类模型多数只针对一个或几个车站进行预测，无法做到使用一个模型对全网所有车站进行预测；基于深度学习的模型经历了长久的发展，能较好的考虑网络客流的时空特征，以及网络拓扑结构，但如何将进出站客流之间的时空依赖分布特征以及网络的拓扑结构有机结合起来进行短时客流预测，尚存在不足；现有的某些深度学习框架过于复杂，导致模型复杂度高、训练时间过长，因而如何简化模型，降低模型复杂度但不影响模型预测精度，仍是当前短时客流预测领域重要的研究方向。

发明内容

本发明的目的是克服上述现有技术的缺陷，提供基于图卷积神经网络的轨道交通短时客流预测方法和系统，利用基于图卷积神经网络和三维卷积神经网络的深度学习框架，能够有机地将全网客流的时空特性以及网络的拓扑结构结合考虑，进而提高模型的预测精度。

根据本发明的第一方面，提供一种基于图卷积神经网络的轨道交通短时客流预测方法。该方法包括以下步骤：

以图结构G＝(V,E,A)表征城市轨道交通网络，并以t时刻的特征矩阵F＝(X_t,X_t-1,X_t-2,…X_t-m+1)表示t时刻之前m个时间间隔的历史客流情况，其中V表示地铁车站的数目，车站与车站之间有E条边，A∈R^n×n是表征车站之间是否相邻的邻接矩阵，F的维度为n×m，n为车站数目；

构建深度学习模型，学习t时刻的特征矩阵F和邻接矩阵A与预测的t+1时刻各车站客流情况之间的映射关系，表示为：

X_t+1＝f(A；X_t,X_t-1,X_t-2,…X_t-m+1)。

在一个实施例中，所述深度学习模型包括依次连接的图卷积神经网络、三维卷积神经网络和全连接神经网络，所述图卷积神经网络用于捕捉城市轨道交通网络的拓扑结构信息以及进出站客流的时空特征信息，所述三维卷积神经网络用于将所述图卷积神经网络提取到的进站流和出站流信息进行深度融合，所述全连接神经网络用于降维并捕捉高维特征与客流预测结果之间的非线性关系。

在一个实施例中，所述图卷积神经网络包括分别处理进站流图和出站流图的第一图卷积神经网络层和第二图卷积神经网络层。

在一个实施例中，所述进站流图和所述出站流图分别包括邻近客流模式，日客流模式和周客流模式，所述邻近客流模式表示预测时段邻近的前多个时段的客流，所述日客流模式表示前一天同时段的客流，所述周客流模式表示上一周同时段的客流。

在一个实施例中，对于所述邻近客流模式、日客流模式和周客流模式的每一种模式，使用相同的时间步数目。

在一个实施例中，所述图卷积神经网络使用的滤波器是：

其中，A∈R^n×n为邻接矩阵，I∈R^n×n为单位矩阵，

为矩阵/>

的对角度矩阵，X^l∈R^n×m为第l层的特征矩阵，n代表车站数目，m代表时间步。W^l∈R^m×k为第l层的特征矩阵,其中k为卷积核的数目，b∈R^k×1为偏置向量，σ为激活函数。

在一个实施例中，将所述时间间隔设置为10分钟、15分钟或30分钟。

在一个实施例中，所述全连接神经网络是一层全连接层，所述三维卷积神经网络的输出经压平层展平后，输出至该全连接层中进行降维。

根据本发明的第二方面，提供一种基于图卷积神经网络的轨道交通短时客流预测系统。该系统包括：

图结构构建模块：用于以图结构G＝(V,E,A)表征城市轨道交通网络，并以t时刻的特征矩阵F＝(X_t,X_t-1,X_t-2,…X_t-m+1)表示t时刻之前m个时间间隔的历史客流情况，其中V表示地铁车站的数目，车站与车站之间有E条边，A∈R^n×n是表征车站之间是否相邻的邻接矩阵，F的维度为n×m，n为车站数目；

深度学习模块：用于构建深度学习模型，学习t时刻的特征矩阵F和邻接矩阵A与预测的t+1时刻各车站客流情况之间的映射关系，表示为：

X_t+1＝f(A；X_t,X_t-1,X_t-2,…X_t-m+1)。

与现有技术相比，本发明的优点在于，所构建的切实有效的深度学习框架，借助图卷积神经网络以及三维卷积神经网络，有机地将进站客流、出站客流、以及网络拓扑结构融合起来进行城市轨道交通短时客流预测，既能满足短时客流预测“实时性”的要求，又能提高预测精度，同时能够使用同一模型进行全网同步预测，模型中借助图卷积神经网络，能够降低模型训练时间，节省计算资源。

通过以下参照附图对本发明的示例性实施例的详细描述，本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例，并且连同其说明一起用于解释本发明的原理。

图1是根据本发明一个实施例的基于图卷积神经网络的轨道交通短时客流预测方法的流程图；

图2是根据本发明一个实施例的基于图卷积神经网络的深度学习模型框架示意图；

图3是根据本发明一个实施例的单条地铁线路上的图卷积的示意图；

图4是根据本发明一个实施例的地铁网络上的图卷积的示意图；

图5是根据本发明一个实施例的三维卷积神经网络和二维卷积神经网络的示意图；

图6是根据本发明一个实施例的全连接层示意图；

图7是根据本发明一个实施例的超参数微调结果的示意图；

图8是根据本发明一个实施例的不同时间粒度下的模型表现结果的示意图；

附图中，input-输入；GCN-图卷积神经网络；First GCN layer-第一图卷积神经网络层；Second GCN layer-第二图卷积神经网络层；Weekly-周；Daily-日；Recent-最近；Spatial and Topological Correlation-时空特征和网络拓扑结构相关性；Time Step-时间步；Batch Size-批大小；Filter number-滤波器数目；Kernel number-核数目；TimeInterval时间间隔；Flatten Layer-压平层；Fully Connection Layer-全连接层；OutputLayer-输出层；Inflow-进站流；Outflow-出站流。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它例子可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

参见图1所示，简言之，本发明实施例提供的基于图卷积神经网络的轨道交通预测方法包括以下步骤：

步骤S110，以图结构G＝(V,E,A)表征城市轨道交通网络，并以t时刻的特征矩阵F＝(X_t,X_t-1,X_t-2,…X_t-m+1)表示t时刻之前m个时间间隔的历史客流情况。

其中V表示地铁车站的数目，车站与车站之间有E条边，A∈R^n×n是表征车站之间是否相邻的邻接矩阵，F的维度为n×m，n为车站数目。

步骤S120，构建深度学习模型，学习t时刻的特征矩阵F和邻接矩阵A与预测的t+1时刻各车站客流情况之间的映射关系，表示为X_t+1＝f(A；X_t,X_t-1,X_t-2,…X_t-m+1)。

利用所学习到的映射关系，可以预测城市轨道交通网络中不同时间间隔的进出站客流情况。

为进一步理解，在下文将从本发明的技术方案出发，分别介绍：所要解决的科学问题的详细定义；所提出的深度学习模型的整体框架，以及整体框架所涉及的图卷积神经网络和三维卷积神经网络等。

1)、本发明所解决的问题定义

本发明的目的是同时预测城市轨道交通全网所有车站某一时段的进站客流量。将城市轨道交通网络定义为一张图G＝(V,E,A),图中有V个地铁车站，车站与车站之间有E条边，A∈R^n×n代表该网络的邻接矩阵，例如包括0，1两种元素，0代表两个车站不相邻，1代表两个车站相邻。本发明还定义特征矩阵F∈R^n×m＝(X_t,X_t-1,X_t-2,…X_t-m+1)，其维度为n×m，n为车站数目，根据地铁线路号进行排序，m代表时间间隔，即用过去m个时间间隔的客流去预测未来的客流，X∈R^n×1为每个特定时间间隔的客流向量，代表所有车站在该时段的进站客流。每一个时间间隔都有一个相同维度的特征矩阵，特征矩阵随着时间进行推移。本发明所要解决的问题是利用t时刻的特征矩阵F和邻接矩阵A预测未来t+1时刻所有车站的进站客流，例如，表示为：

X_t+1＝f(A；X_t,X_t-1,X_t-2,…X_t-m+1)(1)

其中，f是本发明提出的深度学习模型框架将要学习的映射函数。

2)、关于深度学习模型的整体框架结构

本发明基于图卷积神经网络构建深度学习模型，在下文中，将本发明所提出的模型框架称为Conv-GCN。

如图2所示，在一个实施例中，本发明提出的深度学习模型包括三部分，第一部分为多图卷积神经网络GCN部分，包括进站流(Inflow)图和出站流(Outflow)图，该部分能够有效捕捉网络的拓扑结构信息以及进出站客流各自的时空特征信息。每一个图可包含多种客流模式，例如包括邻近客流、日客流和周客流三种客流模式，分别代表所要预测时段邻近的前几个时段的客流，前一天同时段的客流以及上一周同时段的客流。第二部分和第三部分分别为三维卷积神经网络(Conv3D)部分和全连接神经网络(FC，Fully connectedlayer)部分。三维卷积神经网络用于将GCN层提取到的进站流和出站流信息进行深度融合，全连接神经网络层用于降维以及捕捉高维特征与预测结果之间的非线性关系。

3)、关于多图卷积神经网络

GCN层具有强大的提取时空特征和网络拓扑结构信息的能力，对于本发明提出的深度学习模型框架具有举足轻重的作用。本文以分别处理进站流和出站流两张图为例进行介绍。GCN可使用现有技术中的谱图卷积滤波器或切比雪夫多项式滤波器或一阶近似滤波器等。例如，本发明实施例使用的GCN滤波器表示为：

其中A∈R^n×n为邻接矩阵，I∈R^n×n为单位矩阵，

为矩阵/>

的对角度矩阵，X^l∈R^n×m为第l层的特征矩阵，n代表车站数目，m代表时间步。W^l∈R^m×k为第l层的特征矩阵,其中k为卷积核的数目，即每个节点输出的特征数，b∈R^k×1为偏置向量，σ为激活函数。

本发明实施例所使用的GCN层如图3和图4所示。以车站E为例，如果仅有单条地铁线路，图3示意了单条线路的所有车站，对于车站E的短时客流预测，第一个GCN层将会捕捉到邻接车站D和F对车站E的影响，在第一个GCN层的基础上再叠加一个GCN层，车站C和G的影响也将被应用到车站E的预测过程当中。同样地，在整个地铁网络中，如果车站E为两条地铁线路的换乘车站，第一层GCN将会捕捉4个邻接车站的影响，第二层GCN将会捕捉与4个邻接车站所连接的车站对E的预测的影响，依次类推。在本发明实施例中，将第一层GCN分别用到进站流图和出站流图。

进一步地，对于两张图，分别考虑多种客流模式的影响，例如邻近客流、日客流和周客流等三种模式。在每一种模式中，可应用相同的时间步数目。这种组织方式具有以下优势：首先，能够捕捉不同客流模式之间的时间依赖关系。其次，邻近车站和距离较远车站之间的空间依赖关系也能够被很好地提取出来。最后，相邻车站之间的网络拓扑信息能够被充分利用。模型框架包含的两张图分别处理进站流和出站流，输出结果再被连接起来输入到三维卷积神经网络当中，以深度融合从进站流和出站流中提取到的高维特征信息。

4)、关于三维卷积神经网络

优选地，本发明提出的深度学习模型框架使用三维卷积神经网络结构(3DCNN)而非普通的二维卷积神经网络结构(2DCNN)，如图5所示，其中上方是2DCNN，下方是3DCNN，二维卷积神经网络的卷积核是平面的，三维卷积神经网络的卷积核是立体的。三维卷积神经网络的优势在于，首先，三维的卷积核能够有效地将不同通道的信息有机整合起来。其次，三维卷积是在时间和空间两个维度上进行卷积，而二维卷积只能在空间维度上进行卷积，所以三维卷积具有更强的时空学习能力。因此，本发明实施例中使用3DCNN以深度融合进站流和出站流的信息，进而进出站客流不同模式的高维时空特征信息、以及远近车站之间的高维时空特征信息能够被有效提取出来。

三维卷积神经网络的输出进而被Flatten层展平，然后输出到全连接层中进行降维，全连接层用于对Flatten层进行降维，以逐渐降维到所需要的维度，如图6所示，以刻画高维时空特征信息和预测结果之间的非线性关系。经过反复试验，本发明使用了一层全连接层将展平后的高维时空特征信息降到所需要的维度。

相应地，本发明还提供一种基于图卷积神经网络的轨道交通短时客流预测系统，用于实现上述方法的一个方面或多个方面。例如，该系统包括：图结构构建模块，其用于以图结构G＝(V,E,A)表征城市轨道交通网络，并以t时刻的特征矩阵F＝(X_t,X_t-1,X_t-2,…X_t-m+1)表示t时刻之前m个时间间隔的历史客流情况，其中V表示地铁车站的数目，车站与车站之间有E条边，A∈R^n×n是表征车站之间是否相邻的邻接矩阵，F的维度为n×m，n为车站数目；深度学习模块，其用于构建深度学习模型，学习t时刻的特征矩阵F和邻接矩阵A与预测的t+1时刻各车站客流情况之间的映射关系，表示为X_t+1＝f(A；X_t,X_t-1,X_t-2,…X_t-m+1)。

为进一步验证本发明的效果和可行性，使用北京连续五周的地铁卡数据进行试验，并与现有的几个经典的短时客流预测模型进行对比，具体实验过程包括以下方面。

1)、数据集

本发明使用的数据集为2016年2月29日至2016年4月3日连续5周工作日的北京地铁刷卡数据，包括17条线路和276个车站(不包括机场线)，刷卡时间为05:00到23:00。每条数据记录包含卡号、进站时间、进站站点名称、出站时间、出站站点名称。预测的时间粒度为10分钟、15分钟和30分钟，前四周的数据用来训练模型，后一周的数据用来测试模型，数据集中包括276个车站，因此邻接矩阵A∈R^276×276的维度为276*276，特征矩阵F∈R^276×m的维度为276*m，m为时间步，其每一行代表一个车站，每一列代表所有车站在特定时间段的客流数据。所有的数据使用min-max scaler归一化到(0,1)，结果评估时再反归一化到数据原始的量级。

2)、评价指标与损失函数

本发明使用的损失函数(Loss)为均方误差Mean Square Error(MSE)，所使用的评价指标为均方根误差Root Mean Square Error(RMSE)、平均绝对误差Mean AbsoluteError(MAE)和加权平均绝对百分比误差weighted Mean Absolute Percentage Error(WMAPE)，如公式(3)到(6)所示。

其中，

为预测值，X_i为真实值，N为所有预测值的数目。

3)、模型对比

将本发明所提出的Conv-GCN模型与现有的几个模型进行对比，以证明本发明模型的有效性。所有的模型在一台带有i7-8700K处理器(12M缓存，频率最高4.7GHz)，8GB运行内存，以及NVIDIA GeForce GTX 1070 Ti显卡的台式机进行运算。

所对比的现有模型包括：

HA：历史平均模型，其使用三种客流模式中最后一个时间步的客流平均值作为历史平均模型预测结果。

ARIMA：自回归移动平均模型，其使用SPSS软件中的专家建模器进行建模得到预测结果。

LSTM：长短时记忆网络模型，其使用的LSTM模型带有两层隐藏层。

2DCNN：二维卷积神经网络模型，其使用的2DCNN模型带有两层隐藏层。

ConvLSTM：卷积循环神经网络模型，其使用的ConvLSTM模型带有两层隐藏层。

ST-ResNet：时空残差网络模型，其使用其中的三个分支，不包含天气数据分支。

ResLSTM：融合了GCN、ResNet和注意力机制的LSTM模型的深度学习框架。

4)、模型超参数设置

本发明使用Keras和TensorFlow搭建提出的深度学习模型框架。经过反复试验，该模型框架包含两个分支，每个分支包含一层GCNlayer，主干包含一层3DCNN layer，一层Flatten layer以及一层全连接层。模型中含有几个重要的超参数：time step，batchsize，GCN层的kernelnumber，Conv3D层的filternumber。为了探索最佳超参数配置，本发明将timestep设置为[3，17]，batch size设置为(4，8，16，32，64，128，256)，Conv3D层的filternumber设置为(1，2，4，8，16，32，64)，GCN层的kernel number设置为(6，9，12，15，18，21，24)。调参过程中使用控制变量法，调参结果如图7所示。根据不同超参数下的预测结果RMSE和MAE，time step，batch size，filter number和kernel number最终取值为10，64，16和15。对于超参数time step，在进行10分钟，15分钟和30分钟的预测过程中分别取值30，20和10。

5)、实验结果分析

实验结果如表1和图8所示。可以看出，本发明提出的Conv-GCN模型表现最好。传统的HA和ARIMA模型无论在哪个时间粒度下均表现较差，基于CNN和RNN的模型如LSTM和2DCNN，表现比传统模型提升很大。此外，ConvLSTM，ST-ResNet和ResLSTM混合模型比单一的LSTM模型和2DCNN模型表现较好。而本发明提出的Conv-GCN在所有情况下均表现最好(对应图8中各部分的最右侧的条形)，展现出模型良好的鲁棒性和模型表现能力。

表1不同时间粒度下的模型表现结果

从表1可以看出，无论是稍短时的10分钟预测，还是稍长时的30分钟预测，本发明在任何情况下均表现最好，下文以本发明提出的深度学习模型和现有的ResLSTM模型为例，对三个评价指标分别加以说明。

对于RMSE，10分钟时间粒度下从28.3661下降到25.6992，15分钟时间粒度下从36.0444下降到33.2488，30分钟时间粒度下从56.9649下降到51.6925，效果分别提升9.402％，7.756％，9.256％。

对于MAE，10分钟时间粒度下从16.6318下降到15.5188，15分钟时间粒度下从20.8783下降到19.8687，30分钟时间粒度下从32.5819下降到30.7568，效果分别提升6.692％，4.836％，5.602％。

对于WMAPE，10分钟时间粒度下从9.352％下降到8.983％，15分钟时间粒度下从7.805％下降到7.678％，30分钟时间粒度下从6.134％下降到5.962％，效果分别提升3.946％，1.627％，2.804％。

实验证明，本发明所提出的基于图卷积神经网络的深度学习模型，大幅提高了短时客流的预测精度，对城市轨道交通运营管理部门进行全网水平的短时客流监测、实时管理和工程实践具有重要的指导意义。

综上所述，针对既有的短时客流预测模型不能有效地考虑网络的时空依赖以及网络的拓扑结构对预测精度的影响，本发明提出了一种新的深度学习模型框架，该模型框架融合了图卷积神经网络以及3D卷积神经网络，同时考虑了进站量和出站量对短时客流预测精度的影响，相对于现有模型，本发明对于不同时间粒度的客流预测均提高了预测准确度。

需要说明的是，上述实施例仅是示意性，在不违背本发明精神的情况下，本领域的技术人员可做适当的改变或变型，例如，设置不同的时间粒度、不同的客流模式等。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本发明的各个方面。

这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是，通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

Claims

1.一种基于图卷积神经网络的轨道交通短时客流预测方法，包括以下步骤：

X_t+1＝f(A；X_t,X_t-1,X_t-2,…X_t-m+1)；

其中，所述深度学习模型包括依次连接的图卷积神经网络、三维卷积神经网络和全连接神经网络，所述图卷积神经网络用于捕捉城市轨道交通网络的拓扑结构信息以及进出站客流的时空特征信息，所述三维卷积神经网络用于将所述图卷积神经网络提取到的进站流和出站流信息进行深度融合，所述全连接神经网络用于降维并捕捉高维特征与客流预测结果之间的非线性关系。

2.根据权利要求1所述的方法，其中，所述图卷积神经网络包括分别处理进站流图和出站流图的第一图卷积神经网络层和第二图卷积神经网络层。

3.根据权利要求2所述的方法，其中，所述进站流图和所述出站流图分别包括邻近客流模式，日客流模式和周客流模式，所述邻近客流模式表示预测时段邻近的前多个时段的客流，所述日客流模式表示前一天同时段的客流，所述周客流模式表示上一周同时段的客流。

4.根据权利要求3所述的方法，其中，对于所述邻近客流模式、日客流模式和周客流模式的每一种模式，使用相同的时间步数目。

5.根据权利要求1所述的方法，其中，所述图卷积神经网络使用的滤波器是：

其中，A∈R^n×n为邻接矩阵，I∈R^n×n为单位矩阵，

为矩阵/>

的对角度矩阵，X^l∈R^n×m为第l层的特征矩阵，n代表车站数目，m代表时间步；W^l∈R^m×k为第l层的特征矩阵,其中k为卷积核的数目，b∈R^k×1为偏置向量，σ为激活函数。

6.根据权利要求1所述的方法，其中，将所述时间间隔设置为10分钟、15分钟或30分钟。

7.根据权利要求1所述的方法，其中，所述全连接神经网络是一层全连接层，所述三维卷积神经网络的输出经压平层展平后，输出至该全连接层中进行降维。

8.一种基于图卷积神经网络的轨道交通短时客流预测系统，包括：

X_t+1＝f(A；X_t,X_t-1,X_t-2,…X_t-m+1)；

9.一种计算机可读存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。