CN117272848B

CN117272848B - 基于时空影响的地铁客流预测方法及模型训练方法

Info

Publication number: CN117272848B
Application number: CN202311562748.6A
Authority: CN
Inventors: 陈敏; 刘宇航; 李曦; 孙虎; 李健
Original assignee: Shanghai Suishenhang Intelligent Transportation Technology Co ltd
Current assignee: Shanghai Suishenhang Intelligent Transportation Technology Co ltd
Priority date: 2023-11-22
Filing date: 2023-11-22
Publication date: 2024-02-02
Anticipated expiration: 2043-11-22
Also published as: CN117272848A

Abstract

本发明公开了一种基于时空影响的地铁客流预测方法及模型训练方法。所述训练方法包括：生成地铁可达网络，其中的边代表站点之间的可达关系，且边设置有权重，代表行程时间；选择目标站点作为终点，计算其余站点至目标站点的最短行程时间；进行排序筛选，获得最短行程时间较短的前多个关联站点；获取目标站点和关联站点的历史出行数据集，构建初始网络并进行训练，获得预测模型。本发明在进行空间特征提取时，形成了时间加权有向图；提取了站点两两之间最短行程时间，选择了在时间尺度上最接近的若干站点作为空间特征，进而进行了训练和预测；所提出的方法更具备可解释性，准确性更高，并且预测模型的复杂度更低，易于部署并应用。

Description

基于时空影响的地铁客流预测方法及模型训练方法

技术领域

本发明涉及公共交通数据分析预测技术领域，尤其涉及一种基于时空影响的地铁客流预测方法及模型训练方法。

背景技术

地铁出行是现代城市居民日常通勤的重要交通方式，具有速度快，效率高，运量大，准时性好的特点。预测地铁系统的短时客流是公共交通系统管控的重要内容，有助于更好理解城市居民的出行模式，监测和评估地铁状态，以及在出现紧急情况和特殊事件的情况下及时采取应对措施。

地铁系统在高峰期或节假日非常容易出现人员过度聚集的情况，具有一定的安全风险；为了解决这一问题应当合理安排班次，及时增开临时班次等等，这对地铁系统的现代化管理与运营提出了更高的要求。而想要实现现代化地、高效地、精准地地铁管理与运营，预测每一个地铁站点的客流量是非常关键的。

现有短期客流预测任务主要使用的预测模型可以分为三种类型：统计模型，机器学习模型和深度学习模型。自回归移动平均（ARIMA）模型和指数平滑（ES）模型等统计模型无法处理交通数据的复杂非线性问题，预测精度不佳。支持向量机（SVM）和人工神经网络（ANN）等机器学习模型需要从原始数据中提取有效的输入特征，难以处理事变特征，特征冗余和过拟合问题。卷积神经网络（CNN）和长短时记忆网络（LSTM）为代表的深度学习模型不依赖特征的选取，能够捕捉复杂的非线性关系。现有基于深度学习的地铁短时客流预测模型未能综合考虑客流的时间依赖性和空间相关性，导致模型预测精度较低。同时部分模型也存在结构过于复杂，计算资源浪费的问题。因此开发一种模型复杂度低，运行便捷且预测准确性高的地铁客流预测方法对于实现地铁精细化管控十分重要。

发明内容

针对现有技术的不足，本发明的目的在于提供一种基于时空影响的地铁客流预测方法及模型训练方法。

为实现前述发明目的，本发明采用的技术方案包括：

第一方面，本发明提供一种基于时空影响的地铁客流预测模型的训练方法，其包括：

生成地铁可达网络，所述地铁可达网络包括节点以及节点之间相连的边，所述节点代表地铁网络中的站点，所述边代表所述站点之间的可达关系，且所述边设置有权重，所述权重代表所述可达关系对应的行程时间；

选择所述地铁可达网络中的目标站点作为终点，累加相关的所述行程时间以计算全部的其余站点至所述目标站点的最短行程时间；

基于多个所述最短行程时间进行排序筛选，获得所述最短行程时间由短至长的前预设数目个所述其余站点作为所述目标站点的关联站点；

获取所述目标站点和关联站点的历史出行数据集，构建初始LSTM深度神经网络，并利用所述历史出行数据集对所述初始LSTM深度神经网络进行训练，获得地铁客流预测模型。

进一步地，所述训练方法具体包括：

遍历所述地铁可达网络中的所有站点，分别作为所述目标站点获取对应的历史出行数据集；

并利用所有站点对应的所述历史出行数据集进行所述训练。

进一步地，所述历史出行数据集包括所述目标站点和关联站点的历史进站数据和历史出站数据；所述地铁客流预测模型的训练目标包括所述目标站点的预测进站数据和预测出站数据。

进一步地，所述初始LSTM深度神经网络包括结构相同的出站客流子网络和进站客流子网络；

所述出站客流子网络对应的历史数据集包括所述关联站点的历史进站客流、所述目标站点的历史出站客流与历史进站客流，以及所有客流数据记录对应的时段信息；所述出站客流子网络对应的历史数据集包括所述目标站点的历史出站客流与历史进站客流，以及所有客流数据记录对应的时段信息。

进一步地，所述地铁可达网络的生成过程具体包括：

获取多个所述站点的地理坐标；

计算同一线路中的相邻站点之间的曼哈顿距离，并基于地铁平均开行速度计算相邻站点之间的地铁开行时间，形成同一线路中相邻站点之间的边的权重；

计算不同线路中的可换乘站点之间的曼哈顿距离，并基于平均步行速度和平均候车时长计算换乘时间，形成不同线路中的可换乘站点之间的边的权重。

进一步地，所述地铁可达网络的生成过程表示为：

；

式中，

；

以及，

+T ；

其中，代表所述地铁开行时间；D代表所述曼哈顿距离；/>代表所述换乘时间；/>代表所述地铁平均开行速度；/>代表所述平均步行速度；T代表所述平均候车时长；/>代表第i条线路的第j个站点；/>代表对应站点的经度值，/>代表对应站点的纬度值；i、j、x、y均为整数，且i、x表示不同的地铁线路，j、y表示不同的站点序号；r代表地球平均半径。

进一步地，所述最短行程时间的计算过程具体包括：

以目标地铁站为终点，计算从其他任意地铁站/>出发的最短行程时间，具体步骤为：

1）设置两个集合S与Q，S用于存储从起点出发，已经求出最短路径的中间站点，以及对应的行程时间；Q用于存储从起点/>出发，还未求出最短路径的中间站点，以及对应的行程时间，初始情况下，S为空集，Q包含所有站点，并且行程时间都是无穷大；

2）将起点从Q移入S并设置行程时间为0，并在所述地铁可达网络中寻找从/>经过一站开行或一次换乘直接可达的中间站点，并更新/>到这些中间站点的行程时间；

3）在行程时间不是无穷大的站点中，选择行程时间最短的站点，将其从Q转移至S，并更新S中的最短行程时间；

4）遍历Q中新增加站点的邻接站点，并计算从起点出发到达这些邻接站点的行程时间，更新Q中的最短行程时间；

5）重复3），4）循环直至目标站点从Q转移至S，其对应的从/>出发的行程时间即为最终的所述最短行程时间；

其中，m、n为整数，且m=i、n=j两者不同时满足。

进一步地，所述预设数目为5-20。

进一步地，所述历史出行数据集的获取过程具体包括：

获取原始出入站客流统计数据，所述原始出入站客流统计数据以原始时间尺度作为一个统计间隔；

将多个所述原始时间尺度的原始出入站客流统计数据以多倍于所述原始时间尺度的统计时间尺度进行集计，并在集计过程中对于部分原始时间尺度中缺失的统计数据在所述统计时间尺度上按照时间权重进行修复，获得所述历史出行数据集；

所述修复的过程表示为：

；

其中，表示修复后所述统计时间尺度对应的客流数据；/>表示所述统计时间尺度的时长；/>表示所述原始时间尺度对应的原始出入站客流统计数据；/>表示所述原始时间尺度的时长；/>表示所述统计时间尺度内的有效的所述原始出入站客流统计数据的数目；z为自然数，取值范围为(1/3-3/4)*a/b之间的整数集（含端值）。

进一步地，初始LSTM深度神经网络的运算过程表示为：

；

其中为遗忘门，读取上一步的输出/>以及当前时刻的输入/>确定遗忘和保留的相关信息；/>为输入门；/>为输出门；/>为单元状态，由输入门和遗忘门传递的信息进行更新；最终更新后的单元状态/>与输出门/>求哈达玛积，得到输出/>；/>，/>分别表示sigmoid激活函数和tanh激活函数；/>，/>分别依次为遗忘门、输入门、输出门、状态单元的权重矩阵；/>，/>分别依次为遗忘门、输入门、输出门、状态单元的偏置向量。

进一步地，训练所述初始LSTM深度神经网络的损失函数表示为：

；

其中，MAE代表所述损失函数；n代表一次迭代的批次大小；代表客流量实际值；/>代表客流量预测值。

作为上述训练方法的进一步应用，第二方面，本发明还提供一种基于时空影响的地铁客流预测方法，其包括：

采用上述训练方法训练获得地铁客流预测模型；

部署所述地铁客流预测模型，并基于获取得到的历史出行数据集预测所述目标站点的未来客流量数据。

对应地，第三方面，本发明还提供一种地铁客流预测系统，所述地铁客流预测系统运行时执行上述地铁客流预测方法的步骤。

第四方面，本发明还提供一种可读存储介质，其中存储有计算机程序，所述计算机程序被运行时执行上述训练方法或地铁客流预测方法的步骤；或，所述可读存储介质中存储有上述训练方法训练获得的地铁客流预测模型。

基于上述技术方案，与现有技术相比，本发明的有益效果至少包括：

本发明所提供的训练方法和地铁客流预测方法中，在进行空间特征提取时，计算了邻接站点间实际出行的用时，并且将其作为可达网络中每条边的权重，形成了加权有向图；进一步应用最短路径算法提取了站点两两之间最短行程时间，基于最短行程时间，选择了与目标站在时间尺度上最接近的若干个站点作为空间特征，使用这些站点的历史客流数据结合目标站点的客流数据，实现了模型的训练以及最终的客流量预测；所提出的方法更具备可解释性，准确性更高，并且预测模型的复杂度更低，易于部署并应用。

上述说明仅是本发明技术方案的概述，为了能够使本领域技术人员能够更清楚地了解本申请的技术手段，并可依照说明书的内容予以实施，以下以本发明的较佳实施例并配合详细附图说明如后。

附图说明

图1是本发明一典型实施案例提供的模型训练和地铁客流预测的方法的整体流程示意图；

图2a是本发明一典型实施案例提供的出站客流子网络的结构示意图；

图2b是本发明一典型实施案例提供的进站客流子网络的结构示意图；

图3是本发明一典型实施案例提供的初始LSTM深度神经网络的结构示意图；

图4a是本发明一典型实施案例提供的一代表性站点在工作日的出站客流预测结果与实际统计结果的对比图；

图4b是本发明一典型实施案例提供的一代表性站点在工作日的进站客流预测结果与实际统计结果的对比图；

图4c是本发明一典型实施案例提供的一代表性站点在节假日的出站客流预测结果与实际统计结果的对比图；

图4d是本发明一典型实施案例提供的一代表性站点在节假日的进站客流预测结果与实际统计结果的对比图；

图5a是本发明一典型实施案例和对比案例提供的一代表性站点在工作日的出站客流预测结果与实际统计结果的对比图；

图5b是本发明一典型实施案例和对比案例提供的一代表性站点在节假日的出站客流预测结果与实际统计结果的对比图。

具体实施方式

鉴于现有技术中的不足，本案发明人经长期研究和大量实践，得以提出本发明的技术方案。如下将对该技术方案、其实施过程及原理等作进一步的解释说明。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

参见图1、图2a、图2b以及图3，本发明实施例提供了一种基于时空影响的地铁客流预测模型的训练方法，其包括如下步骤：

生成地铁可达网络，所述地铁可达网络包括节点以及节点之间相连的边，所述节点代表地铁网络中的站点，所述边代表所述站点之间的可达关系，且所述边设置有权重，所述权重代表所述可达关系对应的行程时间。

选择所述地铁可达网络中的目标站点作为终点，累加相关的所述行程时间以计算全部的其余站点至所述目标站点的最短行程时间。

基于多个所述最短行程时间进行排序筛选，获得所述最短行程时间由短至长的前预设数目个所述其余站点作为所述目标站点的关联站点。

作为上述技术方案的进一步应用，本发明实施例还提供了一种基于时空影响的地铁客流预测方法，其包括如下的步骤：

采用上述实施方案所提供的训练方法训练获得地铁客流预测模型。

在公共交通预测的技术领域中，在时间序列预测问题中最常用的深度学习模型有循环神经网络（Recurrent Neural Network，RNN），长短期记忆网络（Long Short-TermMemory，LSTM）以及门控循环单元（Gate Recurrent Unit，GRU），一些现有技术提供了一种基于LSTM的公共交通预测方法，例如一种基于GCN_LSTM组合模型的公交车站点客流量预测方法，其中虽然涉及到了LSTM模型的训练以及在公交车客流量预测中的应用，并且本发明关注的地铁站点客流预测与这些现有技术中的公交车站点客流量预测同属于时间序列预测问题。但本发明提出的LSTM与现有技术中使用的LSTM在网络结构、训练过程、数据源头、数据处理方式，以及超参数设置等方面均存在较大差异。

具体表现在，本发明与这些现有技术最显著的区别在于空间特征的提取方式。本发明进行空间特征提取时，同样进行了地铁网络拓扑结构图G=(V,E)的构造，但与这些现有技术不同的是，本发明计算了邻接站点间实际出行的用时，并且将其作为G中每条边的权重，也即本发明使用的G为加权有向图，进一步应用最短路径算法提取了站点两两之间最短实际行程时间。

基于最短行程时间，本发明在选择了与目标站最接近的若干个站点作为空间特征，使用这些站点的历史客流数据结合目标站点的客流数据，相较于这些现有技术中使用GCN提取空间特征的实施方式，本发明提出的方法融合了时间因素来提取空间特征，更具备可解释性，并且通过时间筛选，所得到的预测模型复杂度更低，从而带来模型精简，同时预测准确性高的技术效果。

为了便于进一步理解本发明，以下通过若干实施例并结合附图进一步详细说明本发明的技术方案。然而，所选的实施例仅用于说明本发明，而不限制本发明的范围。

实施例1

作为上述实施方案的一些典型的应用示例，本发明所提供的模型训练方法以及地铁客流预测方法的完整过程可以如下所示：

本实施例采用的技术方案是一种基于时空影响的基于LSTM NN的地铁客流预测算法，LSTM NN为长短时记忆神经网络(Long Short-Term Memory Neural Network)。该方法主要包括六个步骤：

（1）将基础的地铁线路和站点空间位置信息处理为可达网络。将每个站点视为节点，存在多线换乘的站点每个站台视为不同的节点，例如（2号线-虹桥站）和（17号线-虹桥站）为两个不同节点（站点）。节点之间可达关系视为边，相邻节点之间的行程时间作为边的权重，边不仅表示同一线路中的可达关系，还表示不同线路可换乘站点间的换乘可达关系。

（2）计算最短行程时间。遍历整个地铁站点可达网络，使用Dijkstra最短路径算法，分别以每个站点为终点，计算其他所有站点出发的最短行程时间。

（3）确定关联站点。以目标站点为终点，将其他所有站点出发的最短路径按照出行时间升序排列，选择出行时间最短的10个站点作为目标站点的关联站点。

（4）处理历史客流数据。针对目标地铁站的出站客流预测，认为其与关联站点的历史进站客流，目标地铁站的历史出站与进站客流，以及客流数据记录的时段有关，将上述客流数据按照1小时的时间尺度进行集计。针对目标地铁站的进站客流预测，认为其仅与自身的历史出站与进站客流以及客流数据记录的时段有关，将上述客流数据按照1小时的时间尺度进行集计。

（5）构造与训练LSTM深度神经网络。使用多层LSTM与构造深度神经网络，将步骤（4）中客流数据处理为对应模型所需的时间序列。将多日的历史数据进行处理构造得到用于训练模型的数据集。

（6）预测目标地铁站短期出站与进站客流。针对目标地铁站，选定预测的目标时段并按照步骤（4）与步骤（5）中的同样方法将历史客流数据进行处理，分别输入出站客流预测模型与进站客流预测模型，可以得到最终预测结果。

而关于具体的实施细节，所述步骤（1）具体为：以表示第i条地铁线上第j个地铁站，/>，/>分别表示该站点对应线路上站台中心点坐标的经度和纬度。一条地铁线路上，地铁站点编号根据地铁开行方向递增，同一线路的两个开行方向分别进行处理。对于同一地铁线上相邻的两个地铁站/>与/>，使用曼哈顿距离作为两个地铁站间行程距离的近似值。首先通过公式(1)（正半矢公式）将两个经纬度坐标距离转化为空间距离，随后通过公式(2)计算得到两个站点间的曼哈顿距离；

；

（2）

其中，d为两个经纬度坐标()与(/>)间的空间距离，r为地球平均半径（6371000m），D为两个地铁站/>与/>间的曼哈顿距离。

对于同一线路上的地铁站，认为地铁平均运行速度 = 36km/h，由此可根据公式(3)计算相邻两个地铁站行程时间：

（3)

针对同一代表性站点不同线路之间（对应站台，/>）的换乘，假设认为步行速度=5km/h，站台平均候车时间T=180s，可根据公式(4)计算同站换乘行程时间：

（4）

将所有地铁站视为节点（存在多线换乘的站点不同站台视为不同节点），对同一线路上的相邻站点间，同一代表性站点内不同换乘站台间构造边，并将由公式(3)与公式(4)计算得到的行程时间赋为边的权重，得到有向的地铁站点所述地铁可达网络。

当然，除上述基于坐标和速度计算的方式外，通过统计调研的方式统计得到实际的地铁开行规律和换乘平均时间的方式亦可作为可实施的技术实现手段，以此获得时间加权有向的所述地铁可达网络。前者实施方式的优点在于避免了大量的统计分析的过程，节省了人力资源的消耗，尤其是对于新开行地铁的城市而言，初期难以获得稳定的统计数据；同时，基于地理坐标计算可以快速建立和更新模型，并进行实地应用，具有较好的时效性。后者的优势在于更加贴近实际情况，更有利于实现精准预测。

本发明中获取地铁可达网络需要进行同线路站点行程时间计算，不同线路同站点换乘时间计算以及基于行程时间获取最短路径，因此满足以下条件的地铁可达网络获取方式均属于本发明保护范围内：

1）基于地铁开行时刻表统计获取，基于地铁线路仿真模型，或基于实际站点坐标和运动学模型计算估计获取同线路上不同站点之间的行程时间。

2）基于地铁站内实际测量，基于地铁站内仿真模型，或基于行人运动学模型计算估计得到同站点不同线路换乘时间。

3）基于同线路上不同站点行程时间以及同站点不同线路换乘时间得到地铁线路站点间实际行程时间。

4）基于站点间实际行程时间遍历得到最短路径，或使用路径规划算法得到最短路径，进而形成可达网络。

所述步骤（2）为：以目标地铁站为终点，使用Dijkstra算法计算其他任意地铁站（m=i, n=j不同时满足，使得/>为不同站点）出发的最短行程时间/>，具体步骤如下：

1）设置两个集合S与Q，S用于存储从起点出发，已经求出最短路径的中间站点，以及对应的最短行程；Q用于存储从起点出发，还未求出最短路径的中间站点，以及对应的行程时间，初始情况下，S为空集，Q包含所有站点，并且行程时间都是无穷大。

2）将起点从Q移入S并设置行程时间为0，并在所述地铁可达网络中寻找从/>经过1步直接可达的站点，并更新/>到这些站点的行程时间。

3）在行程时间不是无穷大的站点中，选择行程时间最短的站点，将其从Q转移至S，并更新行程时间。

4）遍历Q中新增加站点的邻接站点，并计算从起点出发到达这些站点的行程时间，更新最短行程时间。

5）重复3），4）循环直至目标地铁站从Q转移至S，其对应的从/>出发的行程时间即为最短行程时间。

对全部M+1个地铁站按照上述方法计算最短行程时间。得到的最短行程时间矩阵。

所述步骤（3）为：以目标地铁站为终点，在步骤（2）得到的最短行程时间矩阵中寻找/>对应所有其他地铁站的最短行程时间C，并进行升序排列，得到集合。截取最短的10个行程时间/>，其对应的10个地铁站为目标地铁站/>的关联站点。按照上述步骤，可对全部M+1个地铁站搜索得到对应的关联站点。

所述步骤（4）为：以地铁站的一小时出站与进站客流为预测目标，首先需要将历史客流数据处理为同样的1小时的统计时间尺度客流数据。假设原始出站与进站客流数据统计的原始时间尺度为5min，需按照每日整点时段将客流集计为1小时数据。考虑部分时段客流数据可能存在缺失，在进行客流集计时，对缺失的部分时段数据在1小时尺度上进行修复。进站客流与出站客流均遵循公式(5)进行集计：

（5）

其中count表示1小时时段中有效的5分钟客流数据量。有效数据在6条及以上时，将客流求和，除以有效时段占一小时的比例，完成对数据的修复，否则认为无法修复，对应1小时客流量视为0。

当然，若采用其他时间尺度亦可实现近似的技术效果，例如以3min作为原始时间尺度，或以半小时或2小时作为统计时间尺度等等。

当存在多线换乘的站点作为关联站点时，其历史进站客流为所有站台客流之和。进行出站客流预测时，所需数据为10个关联站点的历史进站客流，目标站点的历史出站与进站客流，以及客流数据记录的时段。进行出站客流预测时，所需数据为目标站点的历史出站与进站客流，以及客流数据记录的时段。所有客流数据按照上述方法集计为1小时的时间尺度。

所述步骤（5）具体为：如图2a所示，使用LSTM为基础构造出站客流预测神经网络，该神经网络模型由3层LSTM层与3层全连接层拼接得到，ReLU为激活函数。模型所需输入数据为步骤（4）中处理得到的关联站点1小时进站客流历史数据，目标地铁站1小时出站与进站客流历史数据，以及数据对应时段，共计13个特征。对每个特征，提取预测时段前6个小时的数据组成时间序列，最终得到的特征矩阵作为模型的输入。进站客流预测模型架构如图2b所示，网络结构与出站客流预测模型一致，区别为进站客流仅使用目标地铁站1小时出站与进站客流历史数据，以及数据对应时段，共计3个特征。每个特征同样提取预测时段前6个小时的数据组成时间序列，最终得到/>的特征矩阵作为模型的输入。

LSTM的结构如图3所示，其能够将第t个时间片以及之前的所有输入映射到输出向量，具体步骤如公式(6)-(10)所示

（6)

(7)

(8)

(9)

(10)

其中为遗忘门，读取上一步的输出/>以及当前时刻的输入/>确定遗忘和保留哪些信息；/>为输入门；/>为输出门；/>为单元状态，由输入门和遗忘门传递的信息进行更新；最终更新后的单元状态/>与输出门/>求哈达玛积，得到输出/>。/>，/>分别表示sigmoid激活函数和tanh激活函数；/>，/>分别为遗忘门、输入门、输出门、状态单元的权重矩阵；/>，/> 分别为遗忘门、输入门、输出门、状态单元的偏置向量。

使用多日历史数据按照上述输入格式处理为用于训练模型的数据集。在模型训练时，超参数设置如下：

学习率learning_rate=0.0005。

批次大小batch_size=1024。

训练迭代次数epoch=100。

优化器使用Adam。

使用平均绝对误差（MAE）作为模型损失函数，如公式(11)所示：

(11)

所述步骤（6）具体为：将步骤（5）中预训练的模型进行部署，并选取目标地铁站，按照步骤（4）与步骤（5）中所述的数据处理方法进行数据预处理，分别输入两个模型，最终得到出站客流与进站客流的预测结果。最终预测结果可用平均绝对百分比误差（MAPE）进行评价，MAPE如式(12)所示。

(12)

本发明的上述实施案例中，按照出行时间最短为标准选择10个站点作为空间特征主要有以下优点：

1.提出的预测框架可以方便地迁移应用，适用于不同城市的地铁网络。本发明在获取空间特征时，仅需要构造地铁站点可达网络图G，随后使用最短路径算法自动化地针对每个站点提取其相关站点，进而处理成所需的数据格式，进行客流预测。

2.提出的预测框架更具解释性。本发明按照行程时间排序，选择的相关站点中90%能够将到达目标站点的行程时间控制在20分钟之内。因此目标时段前一小时内，这些关联站点上车的客流在目标时段内能够到达目标站点，而这些人群与目标站点在目标时段的出站客流有很高的潜在相关关系。

3.提出的预测框架能够使用一个模型解决多个站点的预测问题。目前的预测框架中根据最短行程时间选择10个站点作为空间相关关系，适用于整个地铁网络的所有站点。这些站点按照提出的规则进行特征提取，特征数据与预测目标的潜在相关关系是同质的。而若参考现有技术中的常见方法，专门针对热门站点单独分析客流构成，则无法设计适用于所有站点的统一模型，并且还需要大量先验知识作为支撑，反而无法广泛适应获取整体客流预测数据。

作为上述实施案例的应用示例，请参阅图4a-图4d所示，图中的预测与实际曲线以及所计算的MAPE值显示出了预测与实际的偏移情况。其中图4a和图4b分别展示了工作日时的人民广场站点的出入站客流量的预测曲线和实际曲线，可以看出，在工作日，本实施例所提供的预测模型和预测方法的准确性较佳；图4c和图4d分别展示了节假日时的人民广场站点的出入站客流量的预测曲线和实际曲线，可以看出，在节假日，本实施例所提供的预测模型和预测方法的准确性仍旧较佳，这说明本发明实施例所提供的技术方法不仅仅具有广泛的空间适应性，而且在时间尺度上还能够适应一年中的不同时期的客流规律变化。

对比例1

为说明本发明提出的基于最短行程时间提取邻接站点的空间相关特征的有效性，本发明设计了对比案例，不考虑站点换乘用时，仅基于站点间沿线路可达的最短路径距离作为权重，选择邻接站点，重新训练并测试出站客流预测模型。

参照实施例一，选择相同的地铁站点，仅使用最短路径距离代替最短行程时间得到目标地铁站的10个关联站点，将10个关联站点的历史客流作为空间相关特征。使用相同的输入特征结构，相同的预测模型结构以及相同的模型训练与测试流程，得到两种空间相关特征构成方式情况下人民广场站点工作日和节假日出站客流量实际曲线和预测曲线对比结果如图5a-图5b所示。图中的预测与实际曲线以及所计算的MAPE值显示出了预测与实际的偏移情况。

图5a展示了工作日时的人民广场站点的出站客流量的两种预测曲线和实际曲线，可以看出，在工作日时，使用最短行程时间提取空间特征得到的模型在高峰时段和全天的预测精度明显高于使用最短路径距离提取空间特征得到的模型，尤其体现在全天中的最高峰时段（例如早高峰）的预测准确性差异上；图5b展示了节假日时的人民广场站点的出站客流量的两种预测曲线和实际曲线，可以看出，在节假日时，使用最短行程时间提取空间特征得到的模型在高峰时段和全天的预测精度也明显较高。

需指出，人民广场站为上海市最具有代表性的站点，其可换乘线路多达3条，且均属于客流量极大的热门线路，此外该站点地处繁华市区的核心地段，客流复杂，预测难度极高，而本发明实施例所展现出的预测准确性充分满足了该站点的精细化管理需要。

并且，本发明实施例还应用于上海各大小站点，均取得了优异的预测准确性，应用前景广阔。且不限于上海地区，同样的实施手段可以推广应用于各城市的地铁线路中。

基于上述实施和对比案例，可以明确，本发明实施例所提供的训练方法和地铁客流预测方法中，在进行空间特征提取时，计算了邻接站点间实际出行的用时，并且将其作为可达网络中每条边的权重，形成了加权有向图；进一步应用最短路径算法提取了站点两两之间最短行程时间，基于最短行程时间，选择了与目标站在时间尺度上最接近的若干个站点作为空间特征，使用这些站点的历史客流数据结合目标站点的客流数据，实现了模型的训练以及最终的客流量预测；所提出的方法更具备可解释性，准确性更高，并且预测模型的复杂度更低，易于部署并应用。

应当理解，上述实施例仅为说明本发明的技术构思及特点，其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施，并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于时空影响的地铁客流预测模型的训练方法，其特征在于，包括：

选择所述地铁可达网络中的目标站点作为终点，累加相关的所述行程时间以计算其余站点至所述目标站点的最短行程时间；

获取所述目标站点和关联站点的历史出行数据集，构建初始LSTM深度神经网络，并利用所述历史出行数据集对所述初始LSTM深度神经网络进行训练，获得地铁客流预测模型；

其中，所述地铁可达网络的生成过程具体包括：

获取多个所述站点的地理坐标；

计算不同线路中的可换乘站点之间的曼哈顿距离，并基于平均步行速度和平均候车时长计算换乘时间，形成不同线路中的可换乘站点之间的边的权重；

所述地铁可达网络的生成过程表示为：

；

式中，

；

以及，

；

其中，t代表所述地铁开行时间；D代表所述曼哈顿距离；代表所述换乘时间；代表所述地铁平均开行速度；/>代表所述平均步行速度；T代表所述平均候车时长；/>代表第i条线路的第j个站点/>代表第i条线路的第j+1个站点；/>代表对应站点的经度值，/>代表对应站点的纬度值；/>代表该线路的第j个站点的经度值；/>代表该条线路的第j个站点的纬度值；/>代表该线路的第j+1个站点的纬度值；/>代表该线路的第j+1个站点的经度值；i、j、x、y均为整数，且i、x表示不同的地铁线路，j、y表示不同的站点序号；r代表地球平均半径；

所述最短行程时间的计算过程具体包括：

以目标地铁站为终点，计算从其他任意地铁站/>出发的最短行程时间/>，具体步骤包括：

其中，m、n为整数，且m=i、n=j两者不同时满足；

所述历史出行数据集的获取过程具体包括：

所述修复的过程表示为：

；

其中，表示修复后所述统计时间尺度对应的客流数据；/>表示所述统计时间尺度的时长；/>表示所述原始时间尺度对应的原始出入站客流统计数据；/>表示所述原始时间尺度的时长；/>表示所述统计时间尺度内的有效的所述原始出入站客流统计数据的数目；z为自然数，取值范围为1/3*a/b至3/4*a/b之间的整数集。

2.根据权利要求1所述的训练方法，其特征在于，具体包括：

并利用所有站点对应的所述历史出行数据集进行所述训练。

3.根据权利要求1所述的训练方法，其特征在于，所述历史出行数据集包括所述目标站点和关联站点的历史进站数据和历史出站数据；所述地铁客流预测模型的训练目标包括所述目标站点的预测进站数据和预测出站数据；

所述初始LSTM深度神经网络包括结构相同的出站客流子网络和进站客流子网络；

4.根据权利要求1所述的训练方法，其特征在于，初始LSTM深度神经网络的运算过程表示为：

；

5.根据权利要求4所述的训练方法，其特征在于，训练所述初始LSTM深度神经网络的损失函数表示为：

；

6.一种基于时空影响的地铁客流预测方法，其特征在于，包括：

采用权利要求1-5中任意一项所述的训练方法训练获得地铁客流预测模型；