CN111027673B

CN111027673B - 一种地铁客流量预测方法

Info

Publication number: CN111027673B
Application number: CN201911115405.9A
Authority: CN
Inventors: 胡继华; 文梓豪; 袁均良
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2019-11-14
Filing date: 2019-11-14
Publication date: 2023-05-26
Anticipated expiration: 2039-11-14
Also published as: CN111027673A

Abstract

本发明涉及交通预测领域，更具体的，涉及一种地铁客流量预测方法。本发明基于门控循环单元GRU模型来对地铁人流量数据进行预测；然后通过随机搜索及贝叶斯优化方法，实现网络模型超参数自动调整，尽量逼近最佳参数，获得准确的人流量预测信息，本发明主要在软件平台实现，不需要高成本的投资建设费用，不需要耗费大量的人力。本发明适用于大规模城域网中的人流量的预测。本发明可为地铁当局提供参考，有效地将有限的资源分配给过度拥挤的区域，改善地铁的服务。

Description

一种地铁客流量预测方法

技术领域

本发明涉及交通预测领域，更具体地，涉及一种地铁客流量预测方法。

背景技术

地铁出行是一种高效且安全系数高的一种出行方式，是人们出行首选的交通方式之一。但随着客流量的增大，许多问题也体现了出来，在每日的早晚高峰以及节假日期间，许多地铁站点人满为患，地铁站点特别是换乘站点承受着十分大的压力，因此，如何对地铁班次进行合理的调度，成为公共交通运输的一个主要问题。在这个问题里，预测地铁站的人流量处于一个十分重要的地位，若能根据预测出来的地铁站人流量进行地铁班次合理的调度，那将使得公共交通变得更加的舒适以及安全。

大数据对公共交通有着十分重大的作用，现实世界中大数据的快速增长为研究人流量预测问题提供了一个很好的平台。近几年，大数据分析技术也在交通运输领域应用开来。而目前的大数据分析技术需要高成本的投资建设费用以及耗费大量的人力，并且预测效果差强人意，从而导致大数据的分析难以在日常生活中推广开来。

发明内容

为了解决现有技术中大数据分析技术需要高成本的投资建设费用以及耗费大量的人力，预测效果差的不足，本发明提供了一种地铁客流量预测方法。

为解决上述技术问题，本发明的技术方案如下：

一种地铁客流量预测方法，包括以下步骤：

步骤S1：获取地铁客流数据，对地铁客流数据进行特征分析，得到影响地铁客流数据的影响因素；

步骤S2：对影响因素进行数字化处理，得到影响因素数据；

步骤S3：基于影响因素数据得到最终的地铁客流数据，将最终的地铁客流数据划分为训练数据集、测试集以及验证集；

步骤S4：基于门控循环单元GRU构建自动调优循环神经网络；

步骤S5：将训练数据集输入到自动调优循环神经网络中对自动调优循环神经网络进行训练，得到训练好的自动调优循环神经网络；

步骤S6：将测试集输入到训练好的自动调优循环神经网络中，得到地铁客流数据的预测结果；

步骤S7：使用随机搜索及贝叶斯优化方法，对训练好的自动调优循环神经网络进行优化，得到优化后的自动调优循环神经网络；

步骤S8：通过均方根误差公式以及平均绝对百分比误差公式对优化后的自动调优循环神经网络进行评价，并使用验证集验证优化后的自动调优循环神经网络的准确性。

优选的，在步骤S1中，经过特征性分析，造成地铁客流量波动的影响因素包括：工作日带来的固定上下班客流、非工作日出游客流、节假日带来的工作日调整以及归乡返程客流、天气因素导致出行方式的改变所带来的客流。

优选的，在步骤S2中，对影响因素进行数字化处理的具体步骤如下：节假日的取值范围为0-1，其中，0代表非节假日，1代表节假日；星期的取值范围为1-7，其中1-7分别代表星期一到星期天；小时的取值范围为0-23，分别代表一天中的24小时；天气的取值范围为0-1，其中0代表不下雨，1为代表下雨；客流量平均值的取值范围为0-20000，代表每小时平均客流量，最终将所有影响因素数据拼接组合在一起，得到最终的输入数据，该输入数据的位数是变长的，并且随着小时数增加而增加，所增加的数据为下一小时的实时客流量。

优选的，将影响因素数据拼接的具体过程如下：

假设节假日为F₁、星期为F₂、小时为F₃、天气为F₄，R₁为第一个实时客流量，R₂为第二个实时客流量，R_n为第n个实时客流量，D为地铁客流数据；

D＝[F₁,F₂,F₃,F₄,R₁,R₂,...R_n]。

优选的，在所述的自动调优循环神经网络的工作原理如下：

所述的自动调优循环神经网络包括输入层，特征提取层以及输出层,

将训练数据集输入至自动调优循环神经网络的输入层后，输入层将训练数据集的数据发送到特征提取层中，在特征提取层中，输入层的数据被传送到由GRU单元连接而成的RNN网络中，在特征提取层中一共有n个GRU单元，在GRU单元中，RNN网络首先对训练数据集进行前向传播处理，之后再进行反向传播，更新RNN网络中每一层的参数，并输出最后的结果；

特征提取层的输出R为：

R＝GRU(D) (1)

同时在特征提取层中对GRU的输出做一次丢失处理防止过拟合：

R'＝dropout(R) (2)

输出层选取GRU最后一个节点作为输出：

Output＝Last(R') (3)

优选的，在特征提取层中的GRU单元中，对训练数据集进行前向传播的具体过程如下：

首先，对训练数据集进行前向传播，具体的计算过程如下：

r_t＝σ(W_r·[h_t-1,x_t]) (4)

z_t＝σ(W_z·[h_t-1,x_t]) (5)

y_t＝σ(W_o·h_t) (8)

其中，h_t为t时刻的输出，x_t为t时刻的输入，r代表重置门，z代表更新门，

代表候选信息，σ表示sigmod函数；

在遗忘门中，f_t为遗忘门的输出，W_f和b_f分别为遗忘门的权值和偏差；

在输入门中，i_t为输入门的输出，W_i和b_i分别为遗忘门的权值和偏差，

为t时刻备选的用来更新的内容；/>

在输出门中，o_t为输出门的输出，W_o和b_o分别为遗忘门的权值和偏差；

候选信息梯度：

更新门梯度:

重置门梯度：

往前面步反传时间轴上的误差信号：

优选的，在特征提取层中的GRU单元中，对训练数据集进行反向传播的具体过程如下：

候选信息相关：

更新门相关：

重置门相关：

/>

其中L为损失函数，W_hr，W_hz，

为W_r，W_z，/>

的h部分，W_xr，W_xz，/>

为W_r，W_z，/>

的x部分。

与现有技术相比，本发明技术方案的有益效果是：

本发明基于门控循环单元GRU模型来对地铁人流量数据进行预测；然后通过随机搜索及贝叶斯优化方法，实现网络模型超参数自动调整，尽量逼近最佳参数。并且本发明实验主要在软件平台实现，不需要高成本的投资建设费用，不需要耗费大量的人力。本发明适用于大规模城域网中的人流量的预测。本发明可为地铁当局提供参考，有效地将有限的资源分配给过度拥挤的区域，改善服务。

附图说明

图1为本发明的步骤流程图。

图2为自动调优循环神经网络的流程图。

图3为GRU的工作原理图。

图4为不同的超参数在不同方法下的搜索情况。

图5为GRU不同节点数最终的训练收敛情况。

图6为珠江新城地铁站出站模型超参数搜索结果。

图7为珠江新城地铁站出站模型超参数搜索结果的重点区间图。

图8为包含天气数据的超参数结果对比图。

图9为科韵路地铁站的出站客流量。

图10为科韵路地铁站的进站客流量。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

为了更好说明本实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；

对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1

如图1所示，一种地铁客流量预测方法，包括以下步骤：

步骤S2：对影响因素进行数字化处理，得到影响因素数据；

步骤S4：基于门控循环单元GRU构建自动调优循环神经网络；

本发明选择随机搜索而不是网格搜索的原因是，在实际中适合的参数往往在一个完整分布中的一小块部分，使用网络搜索并不能保证直接搜索到合适的超参数中，而随机搜索则大大提高了找到合适参数的可能性。

图4表明重要参数和不重要的参数在不同方法下的搜索情况：给定两个超参数，网格搜索只能在设定的一小组范围内进行，而随机搜索中的每个超参数是独立的。也就是说网格搜索时，由于设定，超参数之间是有些许联系的，并不是独一无二。研究表明随机搜索能够更快地减少验证集的误差。

贝叶斯优化通过基于过去对目标的评估结果建立一个代理函数(概率模型)找到使得目标函数最小的值。代理函数比目标函数更易于优化，因此下一个待评估的输入值是通过对代理函数应用某种标准(通常为预期提升)来选择的。

在本发明中，贝叶斯优化问题有四个组成部分：

1.目标函数：本发明要最小化的对象，这里指带超参数的机器学习模型的验证误差

2.域空间：待搜索的超参数值

3.优化算法：构造代理模型和选择接下来要评估的超参数值的方法

4.结果的历史数据：存储下来的目标函数评估结果，包含超参数和验证损失对于本发明用到的网络模型，如表1所示，一共有四个超参数需要调整。

表1需要调整的超参数

其中节点数和学习率因取值范围太大，不能遍历，且其较好取值分布情况也未知，故不能平均划分组合值尝试，只能设定尝试次数进行调优。其中网络类型和数据特征类型是对比分析不同网络不同数据优劣程度的重要因子，需要控制变量进行对比分析，故每种情况都需要尝试。

如果对所有超参数进行全部组合搜索尝试，总尝试次数将达到几百甚至一千次，开销无法接受。考虑到需要尝试不同的网络类型以确定不同模型效果，以及尝试不同数据特征类型以确定客流量的影响因素，故这两个超参数应当控制变量分析。

对于每种数据特征类型而言，本发明选择SAE系统架构演进和GRU网络，使用贝叶斯优化节点数和学习率两个参数。这样能得到不同数据特征在SAE和GRU两种不同网络中的较佳参数。

对于每种网络类型而言，选择上一步得到效果最好的数据特征类型，使用贝叶斯优化节点数和学习率两个参数。这样能在较少的尝试次数下得到影响因素最鲜明的数据特征类型的情况下，各个网络的较佳的参数。

优选的，将影响因素数据拼接的具体过程如下：

D＝[F₁,F₂,F₃,F₄,R₁,R₂,...R_n]。

优选的，在所述的自动调优循环神经网络的工作原理如下：

如图2所示，将训练数据集输入至自动调优循环神经网络的输入层后，输入层将训练数据集的数据发送到特征提取层中，在特征提取层中，输入层的数据被传送到由GRU单元连接而成的RNN网络中，在特征提取层中一共有n个GRU单元，在GRU单元中，RNN网络首先对训练数据集进行前向传播处理，之后再进行反向传播，更新RNN网络中每一层的参数，并输出最后的结果；

特征提取层的输出R为：

R＝GRU(D) (1)

R'＝dropout(R) (2)

输出层选取GRU最后一个节点作为输出：

Output＝Last(R') (3)

首先，对训练数据集进行前向传播，具体的计算过程如下：

r_t＝σ(W_r·[h_t-1,x_t]) (4)

z_t＝σ(W_z·[h_t-1,x_t]) (5)

y_t＝σ(W_o·h_t) (8)

代表候选信息，σ表示sigmod函数；

为t时刻备选的用来更新的内容；

候选信息梯度：

更新门梯度:

重置门梯度：

往前面步反传时间轴上的误差信号：

候选信息相关：

更新门相关：

重置门相关：

其中L为损失函数，W_hr，W_hz，

为W_r，W_z，/>

的h部分，W_xr，W_xz，/>

为W_r，W_z，/>

的x部分。

实施例2

在本实施例中，选取了具体的站点对本发明进行验证，具体实施过程如下：

本发明使用广州地铁客流量数据进行实验。选择广州地铁站点中具有代表性的几座车站：体育西路站、客村站、科韵路站、大学城北站，用其进出站客流量数据来验证本发明所提出的网络。选取上述车站2017年6到9月间共计112天的客流量数据，同时按照每小时设置间隔，统计每小时的客流总量。将其中91天2184小时的数据作为训练数据集，其中21天504小时的数据作为验证集。用于进行验证实验的广州地铁客流量数据数据量足够大且真实有效。

将地铁客流量客流量可视化，经过特征性分析，可以得出造成客流量波动的因素有：1.工作日带来的固定上下班客流；2.非工作日出游客流；3.节假日带来的工作日调整，归乡返程客流等；4.天气等偶然隐私导致出行方式的改变。对所有的影响因素数字化，得到数据格式如表2。

表2数据格式及说明

最终将所有数据拼接组合在一起，得到最终的输入数据，该输入数据是变长的，随着小时数增加而增加，为增加的数据后一小时的实时客流量。输出数据只有一个，即下一小时的客流量。

步骤一：模型训练

使用Microsoft Cognitive Toolkit框架实现SAE(系统架构演进)、RNN(循环神经网络)、LSTM(长短期记忆网络)、GRU网络，并按照上述的参数自动调优方法训练。图5是GRU模型不同节点数最终的loss训练收敛情况。

在超参数搜索中，以搜索查找珠江新城出站模型rnn维度为例，第一轮搜索结果如图6所示。图6中横坐标的1～14对应着RNN节点数的100～1400，当RNN的节点数在100到300之间时，训练出来的预测结果的RSME值最小，第二轮搜索将重点寻找100-300的区间，如图7所示；

表3是最后一轮搜索值以及最终结果。可见很快的找到较佳的维度超参数110。

表3最后一轮搜索值

步骤二：不同数据特征类型对比

此处对比客村站，得到表4。

表4与客村站对比

/>

图8所示，三角为带天气数据，圆点为不带天气数据。

步骤三：不同模型效果对比

分别训练两个模型来预测进站客流量和出站客流量。同时设置不同的神经元个数，以寻求更好的效果。对于大学城北站出站客流量，各组参数的效果如表5所示。其中可以看到，R-NET在各种参数下均取得明显优于SAE的效果。

表5

步骤四：不同站点对比

对于3个站点的进出站客流量预测结果，如表6所示。

表6

步骤五：模型预测结果分析

总的来说，使用循环神经网络的R-NET在各个站点都取得非常好的效果，其平均绝对百分比误差均在10％以内，甚至有的能取得5％以内的效果，同时均方根误差也控制在一个很低的范围，相比预测的客流量都是在千和万的数量级。

如图9、10所示，图9为科韵路地铁站的出站客流量，图10为科韵路地铁站的进站客流量。本发明实现的R-NET模型很好的预测客流信息，其预测客流量基本吻合真实客流情况。

本发明在使用多种神经网络对广州地铁客流量进行预测之后，对结果进行了比较，发现采用的循环神经网络的变式GRU模型效果最好，平均绝对百分比误差均在10％以内，甚至有的能取得5％以内的效果，这种结果对于其他方法来说，有着很大的提升。另外，经实验发现，加入诸如天气之类的其他影响因素并不能有效的提高客流量预测准确性，分析应对是天气数据并非实时且不准确，故难以对出行客流构成较大影响。

在训练模型方面，本发明采用基于选择搜索的贝叶斯优化调参方法，能够让模型取得更好的预测结果，同时减少训练带来的开销。

相同或相似的标号对应相同或相似的部件；

附图中描述位置关系的用语仅用于示例性说明，不能理解为对本专利的限制；

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种地铁客流量预测方法，其特征在于，包括以下步骤：

步骤S2：对影响因素进行数字化处理，得到影响因素数据；

步骤S4：基于门控循环单元GRU构建自动调优循环神经网络；所述的自动调优循环神经网络中包括输入层，特征提取层以及输出层；所述特征提取层中一共有n个GRU单元，在GRU单元中，首先对训练数据集进行前向传播处理，之后再进行反向传播，更新网络中每一层的参数，并输出最后的结果；对训练数据集进行前向传播的具体过程如下：

首先，对训练数据集进行前向传播，具体的计算过程如下：

r_t＝σ(W_r·[h_t-1,x_t]) (4)

z_t＝σ(W_z·[h_t-1,x_t]) (5)

y_t＝σ(W_o·h_t) (8)

代表候选信息，σ表示sigmod函数；

在重置门中，r_t为重置门的输出，W_r为重置门的权值；

在更新门中，z_t为更新门的输出，W_z为更新门的权值；

在候选信息中，

为候选信息的权值，W_o为输出的权值；

候选信息梯度：

更新门梯度:

重置门梯度：

往前面步反传时间轴上的误差信号：

其中，L为损失函数，W_hz和W_xz分别为更新门的参数矩阵，

为t时刻备选的用来更新的内容，/>

和/>

为候选信息的参数矩阵，上标T代表矩阵的转置操作；/>

对训练数据集进行反向传播的具体过程如下：

候选信息相关：

更新门相关：

重置门相关：

其中L为损失函数，W_hz和W_xz分别为更新门的参数矩阵，

和/>

分别为候选信息的参数矩阵，W_hr和W_xr为别为遗忘门的参数矩阵，上标T代表矩阵的转置操作；

2.根据权利要求1所述的一种地铁客流量预测方法，其特征在于，在步骤S1中，经过特征性分析，造成地铁客流量波动的影响因素包括：工作日带来的固定上下班客流、非工作日出游客流、节假日带来的工作日调整以及归乡返程客流、天气因素导致出行方式的改变所带来的客流。

3.根据权利要求1所述的一种地铁客流量预测方法，其特征在于，在步骤S2中，对影响因素进行数字化处理的具体步骤如下：节假日的取值范围为0-1，其中，0代表非节假日，1代表节假日；星期的取值范围为1-7，其中1-7分别代表星期一到星期天；小时的取值范围为0-23，分别代表一天中的24小时；天气的取值范围为0-1，其中0代表不下雨，1为代表下雨；客流量平均值的取值范围为0-20000，代表每小时平均客流量，最终将所有影响因素数据拼接组合在一起，得到最终的输入数据，该输入数据的位数是变长的，并且随着小时数增加而增加，所增加的数据为下一小时的实时客流量。

4.根据权利要求3所述的一种地铁客流量预测方法，其特征在于，将影响因素数据拼接的具体过程如下：

D＝[F₁,F₂,F₃,F₄,R₁,R₂,...R_n]。

5.根据权利要求4所述的一种地铁客流量预测方法，其特征在于，在所述的自动调优循环神经网络的工作原理如下：

将训练数据集输入至自动调优循环神经网络的输入层后，输入层将训练数据集的数据发送到特征提取层中，在特征提取层中，输入层的数据被传送到由GRU单元连接而成的循环神经网络，即RNN网络中，在特征提取层中一共有n个GRU单元，在GRU单元中，RNN网络首先对训练数据集进行前向传播处理，之后再进行反向传播，更新RNN网络中每一层的参数，并输出最后的结果；

特征提取层的输出R为：

R＝GRU(D) (1)

R'＝dropout(R) (2)

输出层选取GRU最后一个节点作为输出：

Output＝Last(R') (3)

6.根据权利要求5所述的一种地铁客流量预测方法，其特征在于，所述的RNN网络使用tanh作为激活函数，h_t＝tanh(W_c·[h_t-1,x_t]+b_c)，其中W_c和b_c分别为隐藏层的权值和偏差，h_t为t时刻的输出，x_t为t时刻的输入。