CN117252311A

CN117252311A - 一种基于改进lstm网络的轨道交通客流预测方法

Info

Publication number: CN117252311A
Application number: CN202311522962.9A
Authority: CN
Inventors: 赵芝瑶
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2023-11-16
Filing date: 2023-11-16
Publication date: 2023-12-19
Anticipated expiration: 2043-11-16
Also published as: CN117252311B

Abstract

本发明公开了一种基于改进LSTM网络的轨道交通客流预测方法，包括：S1：获取AFC进出闸总客流原始数据与轨道交通相关的特征数据；S2：对车站AFC进出闸总客流原始数据预处理并使用特征中的气象预警计算气象预警指数；S3：对经过预处理后的特征和车站AFC进出闸总客流数据进行特征选择，并将每类数据都划分为训练集和测试集；S4：将训练集送入构建好的改进LSTM网络训练；S5：将测试集送入训练好的改进LSTM网络预测，得到轨道交通客流预测值；S6：对得到的轨道交通客流预测值运用事件修正法进行修正。本发明可以提高轨道交通客流预测的准确性，有助于地铁运营方合理调配资源，提高运营效率和乘客满意度。

Description

一种基于改进LSTM网络的轨道交通客流预测方法

技术领域

本发明涉及客流预测的技术领域，尤其是指一种基于改进LSTM网络的轨道交通客流预测方法。

背景技术

随着地铁线网规模越来越大，地铁客流预测在地铁运营系统的重要性也日益凸显，精准、高效的客流预测对于提高地铁运营系统的效率和稳定性、优化资源配置、提升服务质量方面具有重要作用。

目前客流预测的方法主要分为三类：一是基于统计学原理的预测模型，如自回归模型；二是基于传统机器学习和神经网络的预测模型，如支持向量机（SVM）；三是基于深度学习的预测模型以及组合模型，如卷积神经网络（CNN）、循环神经网络（RNN）、长短时记忆网络（LSTM）、门控神经网络（GRU）等。RNN具有循环结构，相比于CNN更适合处理时间序列数据，但传统的RNN存在梯度消失和梯度爆炸等问题，限制了处理长序列数据的能力。GRU是LSTM的简化结构，只使用隐藏状态来进行信息传递，在处理小型数据集或简单任务时优势明显。针对地铁客流这类复杂的序列数据，LSTM因引入了门控机制，能避免梯度消失和梯度爆炸等问题，能更好地处理长序列数据。

虽然基于LSTM网络的客流预测研究已取得重大进展，但因客流预测影响因素多且LSTM包含大量参数，随着序列长度的增加，网络的参数数量和计算复杂度增加，现存方法存在以下问题：

1、客流预测中除了基本的日属性和早晚高峰时段外，还需要考虑其它如区域属性、气象预警等对乘客的出行行为产生影响的因素，不充分利用所有输入特征，影响模型的预测准确性。

2、处理长序列数据时训练时间长，对网络提取和利用长序列数据中的信息和模式的能力有高要求。

3、客流预测原始输入数据序列包含大量信息，需要抑制不相关或冗余的信息，关注输入序列中更具代表性的部分，增强模型的特征利用率和对上下文信息的捕捉能力。

4、缺乏对预测客流进行修正的方法，当出现事件时，存在预测误差大的问题。

综合以上论述，发明一种能够增强对长序列数据的处理能力、提升特征提取质量、提高预测的准确性和泛化能力的客流预测方法具有较高的实际应用价值。

发明内容

本发明的目的在于克服现有技术的缺点与不足，提出了一种基于改进LSTM网络的轨道交通客流预测方法，能够增强对长序列数据的处理能力，提升特征提取质量，提高预测的准确性和泛化能力，从而在轨道交通客流预测中取得更好的性能。

为实现上述目的，本发明所提供的技术方案为：一种基于改进LSTM网络的轨道交通客流预测方法，包括以下步骤：

S1：获取地铁某条线某车站AFC进出闸总客流原始数据，包括进出站车站名、进出站日期和时间及进出站数量，获取与轨道交通相关的特征数据，包括气象预警、早晚高峰时段、区域属性和日属性，获取与轨道交通相关的修正数据，包括事件；

S2：对车站AFC进出闸总客流原始数据进行预处理，包括异常值处理和客流粒度选择，获得车站AFC进出闸总客流数据，并使用特征中的气象预警计算气象预警指数；

S3：对包含气象预警指数、早晚高峰时段、区域属性和日属性的特征数据与车站AFC进出闸总客流数据进行联合统计，设计互信息分数进行特征选择，选择得分前三高的三个特征作为最终的特征数据，选择的三个特征称为X ₁、X ₂和X ₃，将最终选择的特征数据和车站AFC进出闸总客流数据都进行训练集和测试集划分；

S4：将训练集的数据送入构建好的改进LSTM网络进行训练；其中，该改进LSTM网络是一个双层LSTM-注意力网络，其改进点在于采用双层LSTM网络架构，并使用一个注意力机制对第一层LSTM和第二层LSTM的隐藏状态序列进行加权合并得到加权隐藏状态序列，最后加上一个全连接层用以捕捉加权隐藏状态序列的关键信息并映射到最终轨道交通客流预测的空间；

S5：将测试集的数据送入训练好的改进LSTM网络进行预测，得到轨道交通客流预测值；

S6：对得到的轨道交通客流预测值进行修正：当站点发生事件时，运用事件修正法对轨道交通客流预测值进行修正，从而完成准确的轨道交通客流预测，输出客流预测结果。

进一步，所述步骤S2具体执行以下操作：

a、对客流数据进行异常值处理：在非运营时间出现的客流数据为地铁员工进行夜间检修或运维进出闸机产生的数据，该数据不是真正的客流数据，在客流预测中无意义，直接剔除掉；

b、对客流粒度进行选择：对AFC进出闸总客流数据进行统计分析获得不同时间粒度的客流值，时间粒度的选取会影响到客流预测的精确性，为了更好地反映设定时间内的客流变化情况而又不至于复杂繁琐，选择预设时间粒度的客流值进行统计；

c、计算气象预警指数：

气象预警类型包括台风预警、暴雨预警、暴雪预警、寒潮预警、大风预警、沙尘暴预警、高温预警、干旱预警、雷电预警、大雾预警和道路结冰预警，根据台风、暴雨、暴雪、寒潮、大风、沙尘暴、高温、干旱、雷电、大雾和道路结冰对城市轨道交通的影响程度依次给它们的权重m赋值为2、2、2、2、2、1、2、1、1、1、1，气象预警等级Grade分为蓝色、黄色、橙色、红色，依次给它赋值为1、2、3、4；

计算气象预警指数公式如下：

；

式中，代表气象预警指数，表示第种气象预警类型；如果未出现气象预警，则气象预警指数的值为0。

进一步，所述步骤S3具体执行以下操作：

S31：统计AFC进出闸总客流数据：

将AFC进出闸总客流数据与特征数据进行关联统计：将AFC进出闸总客流数据与日属性进行关联统计得到预设时间粒度的车站工作日客流、周末客流、节日客流以及普通假日客流，通过与步骤S2所得的气象预警指数进行关联统计得到预设时间粒度的参考天气因素的客流值，通过与早晚高峰时段进行关联统计得到预设时间粒度的早晚高峰客流值，通过与区域属性进行关联统计得到预设时间粒度的区域客流；

日属性包括工作日、周末、节日和普通假日；

早晚高峰时段的数据分为“是”和“否”，分别用1和0来表示；

区域属性包括居住类、办公类、其它类、交通类、对外交通枢纽类和旅游类；其中，居住类包括住宅区，办公类包括产业园区和写字楼，其它类包括商场、医院、学校、运动场馆和影剧院，交通类包括公交车站，对外交通枢纽类包括机场、火车站和长途汽车站，旅游类包括风景名胜；

特征数据包括日属性、气象预警指数、早晚高峰时段和区域属性；

S32：使用互信息方法进行特征提取，从上述特征数据中选择最终的特征数据，并以AFC进出闸总客流数据来评估特征的重要性，具体步骤如下：

S321：计算特征与目标变量的互信息分数，计算公式如下：

；

式中，是互信息分数，是联合分布概率，和是边缘分布概率，X为特征集合中的一个特征，Y为AFC进出闸总客流数据；

S322：根据互信息分数进行排序，选择得分前三高的三个特征作为最终的特征数据，选择的三个特征称为X ₁、X ₂和X ₃；

S33：获取最终选择的特征数据和车站AFC进出闸总客流数据，将每类数据都划分为训练集和测试集。

进一步，在步骤S4中，所述改进LSTM网络的具体结构和步骤如下：

a1、在第一层LSTM中，将步骤S3所得特征数据的训练集，包括X ₁、X ₂和X ₃，输入第一层LSTM，得到第一层LSTM的隐藏状态序列H ₁，，表示第一层LSTM第n个时间步的隐藏状态，n为隐藏状态序列的长度；

b1、在第二层LSTM中，将步骤S3所得车站AFC进出闸总客流数据的训练集作为额外输入信息，与第一层LSTM所得的隐藏状态序列H ₁，一起输入第二层LSTM中，得到第二层LSTM的隐藏状态序列H ₂，，表示第二层LSTM第n个时间步的隐藏状态；

c1、在注意力机制层中，使用注意力机制对第一层LSTM的隐藏状态序列H ₁和第二层LSTM的隐藏状态序列H ₂进行加权合并；

首先，计算两层LSTM的隐藏状态序列的注意力权重，包括计算加权能量和计算注意力权重两个步骤；

计算加权能量的公式如下：

；

式中，、分别为对应第一层LSTM和第二层LSTM的加权能量，表示第一层LSTM时间步的隐藏状态，表示第二层LSTM时间步的隐藏状态，、分别表示第一层LSTM和第二层LSTM的能量权重，、为偏置；

计算注意力权重的公式如下：

；

式中，和分别为对应第一层LSTM和第二层LSTM的注意力权重；

其次，是使用注意力权重加权融合两层LSTM的隐藏状态序列，并获得最终的加权隐藏状态序列，计算公式如下：

；

d1、在全连接层中，将加权隐藏状态序列输入到全连接层进行客流预测，并获得轨道交通客流预测值；

将步骤S3中的训练集输入改进LSTM网络进行训练，使用梯度下降算法最小化损失函数，具体步骤如下：

a2、初始化参数值向量，其中为模型参数，为模型参数个数；

b2、采用均方误差MSE计算损失函数；

c2、根据给定的训练集和模型参数值，计算损失函数对于每个参数的偏导数，得到梯度向量，公式如下：

；

式中，是损失函数对模型参数的偏导数；

d2、更新模型参数，利用梯度下降算法更新模型参数，公式如下：

；

式中，表示学习率；

e2、重复以上步骤b2至d2，当损失函数的变化幅度小于0.001的时候，认为模型已经收敛到一个相对好的状态，此时停止算法。

进一步，在步骤S6中，利用事件特征对预测结果进行修正，具体操作步骤如下：

S61：收集历史数据，包括当前发生事件站点历史选择乘坐轨道交通的人数和使用其它交通方式的人数；

收集当前发生事件数据的事件预估人数、事件时间、事件影响范围、事件重要程度和事件类型；

收集当前发生事件站点数据的站点容量、站点数、列车运行频率和平均乘客到达率；

S62：对收集的历史数据、当前发生事件数据和当前发生事件站点数据进行处理，具体如下：

a、根据历史数据中的历史选择乘坐轨道交通人数和使用其它交通方式人数，得到轨道交通选择比例，计算方式如下：

；

b、根据当前发生事件数据中的事件预估人数、事件影响范围、事件重要程度和事件类型，得到实际参与人数，计算方法如下：

；

c、根据当前发生事件站点数据，得到参与人员乘坐轨道交通的意愿，具体方法如下：

首先，计算服务率：

；

式中，是站点容量，是列车运行频率；

然后，计算稳态等待时间：

；

式中，是平均乘客到达率，为站点数；

最后，计算等待意愿：

；

式中，为等待意愿系数；

S63：根据事件对步骤S5中得到的轨道交通客流预测值进行修正，具体如下：

a、如果站点客流量达到客流管控值或者根据事件时间判断站点处于早晚高峰时段，则客流预测值修正方法如下：

；

式中，为原始轨道交通客流预测值，为客流管控或早晚高峰时段下的修正轨道交通客流预测值；

b、如果站点客流量未达到客流管控值，并且根据事件时间判断站点不处于早晚高峰时段，则客流预测值修正方法如下：

；

式中，为客流量未达到客流管控值且事件时间不处于早晚高峰时段下的修正客流预测值；

如果站点发生事件，则根据上述步骤S63对轨道交通客流预测值进行修正；如果未发生事件，那么步骤S5获得的轨道交通客流预测值则为最终的预测值。

本发明与现有技术相比，具有如下优点与有益效果：

1、本发明采用互信息分数进行特征选择。互信息分数能够衡量特征与目标变量之间的相关性，通过对互信息分数的计算，对特征的重要性进行量化，从而进行有效的特征选择。

2、本发明基于改进LSTM网络实现对轨道交通客流的准确预测，该改进LSTM网络从两个不同的层次上捕获时间依赖性和特征。这种结构有助于更有效地提取和利用序列数据中的信息和模式，能更好地处理长序列数据，具有更强的鲁棒性。

3、本发明引入注意力机制，在注意力机制层中，第一层LSTM和第二层LSTM的隐藏状态序列被加权合并，这有助于网络更好地理解输入数据中的重要信息。注意力机制能帮助网络关注输入序列中更具代表性的部分，同时抑制不相关或冗余的信息，从而增强网络的特征利用率和对上下文信息的捕捉能力，提高预测效率。

4、本发明设计全连接层，通过在最后增加一个全连接层，改进LSTM网络能够进一步捕捉加权隐藏状态序列中的关键信息，并将其映射到最终的预测空间，有助于改进网络对数据的理解，提高预测准确性。

5、本发明在客流预测修正方法上引入事件特征，不仅考虑了常规的历史数据和站点信息，还引入当前发生事件的多个特征，包括预估人数、时间、影响范围、重要程度和类型等，这些特征能够更全面地反映当前的情况，有助于提高预测的准确性。根据站点是否达到客流管控值或处于早晚高峰时段，采用不同的修正系数对原始轨道交通客流预测值进行修正，得到了更为准确的修正轨道交通客流预测值。

总之，本发明通过采用互信息分数进行特征选择，设计一个双层LSTM-注意力网络，引入注意力机制和全连接层，以及在修正方法上引入事件特征提高轨道交通客流预测的准确性，有助于地铁运营方合理调配资源，提高运营效率和乘客满意度。

附图说明

图1为本发明方法逻辑流程示意图。

图2为改进LSTM网络的结构图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

如图1所示，本实施例公开了一种基于改进LSTM网络的轨道交通客流预测方法，其具体情况如下：

1）数据采集：

以附近举办演唱会的某地铁站为例，先获取该地铁站AFC进出闸总客流数据，包括进出站日期、时间及进出站数量；气象预警依据中央气象台获取各种类型的气象预警及其对应的等级；早晚高峰时段为早上7点到9点和下午5点到7点；区域属性参照地图设置；日属性根据节假日查询接口获取工作日、周末和节日、普通假日；演唱会等事件针对站点周边场馆的日程安排进行设置。

表一AFC进出闸总客流数据示例

2）对车站AFC进出闸总客流原始数据和特征进行数据预处理：

对车站AFC进出闸总客流原始数据进行预处理，主要包含异常值处理和客流粒度选择，获得车站AFC进出闸总客流数据，具体如下：

a、对客流数据进行异常值处理。地铁运营时间为早上6点开始，在非运营时间出现的客流数据为地铁员工进行夜间检修或运维进出闸机产生的数据，该数据不是真正的客流数据，在客流预测中无意义，能直接剔除掉。

b、对客流粒度进行选择。AFC进出闸总客流数据包括进出站车站名、进出站日期和时间、进出站数量。经过对AFC进出闸总客流数据进行统计分析能获得不同时间粒度的客流值。时间粒度的选取会影响到客流预测的精确性，具体表现在时间粒度越小，虽然对于客流预测越强，但同时增加了模型训练的负担；同时，如果时间粒度选择过大，将直接降低客流预测的实用性，不利于分析客流变化。为了更好地反映一定时间内的客流变化情况而又不至于复杂繁琐，选择5分钟粒度的客流值进行统计。

c、计算气象预警指数。

气象预警类型包括台风预警、暴雨预警、暴雪预警、寒潮预警、大风预警、沙尘暴预警、高温预警、干旱预警、雷电预警、大雾预警、道路结冰预警。根据台风、暴雨、暴雪、寒潮、大风、沙尘暴、高温、干旱、雷电、大雾和道路结冰对城市轨道交通的影响程度依次给它们的权重m赋值为2、2、2、2、2、1、2、1、1、1、1。气象预警等级Grade分为蓝色、黄色、橙色、红色，依次给它赋值为1、2、3、4。

计算气象预警指数公式如下：

；

3）特征选择：

3.1）统计AFC进出闸总客流数据。

将AFC进出闸总客流数据与特征数据进行关联统计。将AFC进出闸总客流数据与日属性进行关联统计可得到粒度为5分钟的车站工作日客流、周末客流、节日客流以及普通假日客流。通过与步骤2）所得的气象预警指数进行关联统计得到粒度为5分钟的参考天气因素的客流值。通过与早晚高峰时段进行关联统计得到粒度为5分钟的早晚高峰客流值。通过与区域属性进行关联统计得到粒度为5分钟的区域客流。

日属性包括工作日、周末、节日和普通假日。

早晚高峰时段的数据分为“是”和“否”，分别用1和0来表示。

区域属性包括居住类、办公类、其它类、交通类、对外交通枢纽类、旅游类。其中居住类包括住宅区，办公类包括产业园区和写字楼，其它类包括商场、医院、学校、运动场馆、影剧院，交通类包括公交车站，对外交通枢纽类包括机场、火车站、长途汽车站，旅游类包括风景名胜。

特征数据包括日属性、气象预警指数、早晚高峰时段和区域属性组；

3.2）使用互信息方法进行，特征提取，从上述特征数据中选择最终的特征数据，并以AFC进出闸总客流数据来评估特征的重要性，具体步骤如下：

3.2.1）计算特征与目标变量的互信息分数，计算公式如下：

；

式中，是互信息分数，是联合分布概率，和是边缘分布概率，X为特征集合中的一个特征，Y为AFC进出闸总客流数据。

3.2.2）根据互信息分数进行排序，选择得分前三高的三个特征作为最终的特征数据，选择的三个特征称为X ₁、X ₂和X ₃。

3.3）获取最终选择的特征数据和车站AFC进出闸总客流数据，将每类数据都划分为训练集和测试集。

4）将训练集输入构建好的改进LSTM网络中进行训练，该改进LSTM网络是一个双层LSTM-注意力网络，其改进点在于采用双层LSTM网络架构，并使用一个注意力机制对第一层LSTM和第二层LSTM的隐藏状态序列进行加权合并得到加权隐藏状态序列，最后加上一个全连接层用以捕捉加权隐藏状态序列的关键信息并映射到最终轨道交通客流预测的空间。改进的优点在于，采用多层结构允许模型在不同层次上捕获时间依赖性和特征，使用动态权重分配以适应不同数据分布，聚焦于与预测目标相关的信息。

改进LSTM网络结构见附图2所示，其具体结构和步骤如下：

a1、在第一层LSTM中，将步骤3）所得特征数据的训练集，包括X ₁、X ₂和X ₃，输入第一层LSTM，得到第一层LSTM的隐藏状态序列H ₁，，表示第一层LSTM第n个时间步的隐藏状态，n为隐藏状态序列的长度；

b1、在第二层LSTM中，将步骤3）所得车站AFC进出闸总客流数据的训练集作为额外输入信息，与第一层LSTM所得的隐藏状态序列H ₁，一起输入第二层LSTM中，得到第二层LSTM的隐藏状态序列H ₂，，表示第二层LSTM第n个时间步的隐藏状态；

c1、在注意力机制层中，使用注意力机制对第一层LSTM的隐藏状态序列H ₁和第二层LSTM的隐藏状态序列H ₂进行加权合并。

首先计算两层LSTM的隐藏状态序列的注意力权重，包括计算加权能量和计算注意力权重两个步骤。

计算加权能量的公式如下：

；

式中，、分别为对应第一层LSTM和第二层LSTM的加权能量，表示第一层LSTM时间步的隐藏状态，表示第二层LSTM时间步的隐藏状态，、分别表示第一层LSTM和第二层LSTM的能量权重，、为偏置。

计算注意力权重的公式如下：

；

式中，和分别为对应第一层LSTM和第二层LSTM的注意力权重。

；

d1、在全连接层中，将加权隐藏状态序列输入到全连接层进行客流预测，并获得轨道交通客流预测值。

将上面步骤3）中的训练集输入改进LSTM网络中进行训练，使用梯度下降算法最小化损失函数，具体步骤如下：

b2、采用均方误差MSE计算损失函数；

；

式中，是损失函数对模型参数的偏导数；

；

式中，表示学习率；

5）获取预测数据：将步骤3）中得到的测试集输入改进LSTM网络中，获取轨道交通客流预测值；

6）利用事件特征对预测结果进行修正，具体操作步骤如下：

6.1）收集历史数据，包括当前发生事件站点历史选择乘坐轨道交通的人数和使用其它交通方式的人数。

收集当前发生事件数据的事件预估人数、事件时间、事件影响范围、事件重要程度、事件类型。

收集当前发生事件站点数据的站点容量、站点数、列车运行频率和平均乘客到达率。

6.2）对收集的历史数据、当前发生事件数据和当前发生事件站点数据进行处理。

；

首先，计算服务率：

；

式中，是站点容量，是列车运行频率；

然后，计算稳态等待时间：

；

式中，是平均乘客到达率，为站点数；

最后，计算等待意愿：

；

式中，为等待意愿系数。

6.3）根据事件对步骤5）中得到的轨道交通客流预测值进行修正。

；

式中，为客流量未达到客流管控值且事件时间不处于早晚高峰时段下的修正客流预测值。

如果站点发生事件，则根据上述步骤6.3）对轨道交通客流预测值进行修正；如果未发生事件，那么步骤5）获得的轨道交通客流预测值则为最终的预测值。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其它的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于改进LSTM网络的轨道交通客流预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于改进LSTM网络的轨道交通客流预测方法，其特征在于，所述步骤S2具体执行以下操作：

c、计算气象预警指数：

计算气象预警指数公式如下：

；

3.根据权利要求2所述的一种基于改进LSTM网络的轨道交通客流预测方法，其特征在于，所述步骤S3具体执行以下操作：

S31：统计AFC进出闸总客流数据：

日属性包括工作日、周末、节日和普通假日；

S321：计算特征与目标变量的互信息分数，计算公式如下：

；

4.根据权利要求3所述的一种基于改进LSTM网络的轨道交通客流预测方法，其特征在于，在步骤S4中，所述改进LSTM网络的具体结构和步骤如下：

计算加权能量的公式如下：

；

计算注意力权重的公式如下：

；

式中，和分别为对应第一层LSTM和第二层LSTM的注意力权重；

；

b2、采用均方误差MSE计算损失函数；

；

式中，是损失函数对模型参数的偏导数；

；

式中，表示学习率；

5.根据权利要求4所述的一种基于改进LSTM网络的轨道交通客流预测方法，其特征在于，在步骤S6中，利用事件特征对预测结果进行修正，具体操作步骤如下：

；

首先，计算服务率：

；

式中，是站点容量，是列车运行频率；

然后，计算稳态等待时间：

；

式中，是平均乘客到达率，为站点数；

最后，计算等待意愿：

；

式中，为等待意愿系数；

；