CN109034449A

CN109034449A - 基于深度学习和乘客行为模式的短期公交客流预测方法

Info

Publication number: CN109034449A
Application number: CN201810614511.0A
Authority: CN
Inventors: 巫威眺; 周伟; 靳文舟; 任婧璇
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2018-06-14
Filing date: 2018-06-14
Publication date: 2018-12-18

Abstract

本发明公开了一种基于深度学习和乘客行为模式的短期公交客流预测方法，包括以下步骤：1、对公交客流影响因素进行识别与特征提取；2、对公交客流数据结构进行重新构造，将输入样本细分小时客流x_t重新构造为细分小时客流矩阵X_t，使其能够适应CNN和ConvLSTM模型；3、以历史客流、影响公交客流的外部因素和内部因素作为输入数据，根据8种不同维度的数据输入方案，即考虑内部影响因素的7种组合数据输入方案和1种不考虑内部影响因素的数据输入方案，利用深度学习模型对公交客流进行预测，通过多次试验获取公交客流预测的平均相对误差和绝对误差。所述方法同时考虑公交客流的外部和内部因素，不仅可以预测公交客流总量，还可以预测公交客流组成结构。

Description

基于深度学习和乘客行为模式的短期公交客流预测方法

技术领域

本发明涉及公交运营管理中的客流预测领域，具体涉及一种基于深度学习和乘客行为模式识别的短期公交客流预测方法。

背景技术

实现运力与运量相匹配是公交规划与调度的目标，而客流信息获取是公交运力投放和组织的前提，其准确性将很大程度影响调度决策的有效性。公交客流需求是社会经济活动的产物，它具有一定的规律性，同时又具有很大的复杂性。在现代信息环境下，客流影响因素可以通过多源数据获取，这对提升公交客流预测的准确性带来了机遇，也提出了挑战。根据预测时间的跨度，客流预测可分为长期客流预测和短期客流预测。根据预测方法的不同，目前公交客流预测方法主要分为三类：参数化模型、非参化模型和混合模型。参数化模型以代数方程、微分方程等描述模型内部结构参数，包括移动平均法、ARIMA、卡尔曼滤波和灰色理论等算法；非参化模型是通过实际系统的实验分析中得到结果，包括支持向量回归(SVR)、人工神经网络(ANN)等机器学习算法；混合模型则运用两个或两个以上模型有机组合实现预测。

近年来，随着计算机技术的发展，深度学习算法尤其是卷积神经网络(CNN)在多个领域得到了应用，如图像识别。深度学习的实质是通过构建多隐层的机器学习模型，利用海量的样本数据训练，学习更精准的特征，从而提高分类或预测的准确性，其非常适用于发现高维数据中的复杂结构和特征。将深度学习技术引入交通工程的应用在最近几年初见端倪，部分研究开始利用深度学习对交通流量进行预测。然而，目前鲜有深度学习在公交客流预测方面的研究。公交客流需求往往在时间上呈现一定周期性波动性，现实生活中影响公交客流的因素众多且复杂，如日期的工作日性质，学时性质，节假日，天气等外部因素，以及乘客类别的内部因素，而不同的因素之间又存在相关性。公交乘客作为一种高度复杂的群体，各类型乘客的出行行为对不同影响因素变动的响应模式是不一样的，城市居民的公交出行行为通常具有较强的规律性，但是乘客群体的组成结构、以及各类乘客的出行目的在各个时段内均有较大的变动，而不同乘客类型和具有不同出行目的乘客的出行模式具有很大的不同，这种出行模式主要体现为环境因素对出行行为的影响和出行行为的周期性。通过研究不同类型乘客的出行模式及其规律性，掌握不同类型公交乘客出行的环境因素影响，能帮助公交管理机构进行更加准确的出行需求预估。例如，通过实际数据发现通勤出行者数量对工作日节假日敏感，老人出行者数量对工作日节假日不敏感；通勤出行者、学生出行者和老年出行者高峰时段的客流特征也有所不同。因此，如果充分考虑影响因素与不同类别的出行者之间的影响关系，可以有效提高公交客流量预测的准确率。另外，识别出行规律明显的通勤群体，有助于设计灵活型公交、大站快车等特殊调度手段进行服务创新，从而提高公共交通吸引力，这对预测客流组成结构提出了新的需求。

然而，传统客流预测方法将时段客流量作为一个整体进行预测，因而不能反映不同类型乘客对各影响因素的响应模式。深度学习模型能够在数据的时序特征和内部结构特征等更多维度上建立联系，大大提高模型的复杂度与关联度，通过海量数据的学习，能够更深入、更有效的挖掘并捕获数据的复杂特征。因此，如果能在甄别乘客行为模式的基础上，通过构建客流特征矩阵建立客流影响因素与深度学习结构之间的关联，则有可能提高公交客流预测的精度和可靠性。

综上，对公交客流预测的研究存在以下局限性：(1)很少文献考虑了影响公交客流的外部因素，且对客流内部因素的信息、及其与外部影响的相互作用机制尚未充分挖掘和利用；(2)由于线路客流类型组成复杂，各种类型乘客的出行模式及其对各类影响因素的相关关系有很大差别，若采用以往集计的预测方法可能会存在较大的误差；(3)对公交客流特征进行过单独研究，但缺少对客流组成结构的预测，而客流组成预测信息有助于运输市场细分和调度模式的创新。

发明内容

本发明的目的是针对上述现有技术的不足，利用公交客流数据，提供了一种基于深度学习和乘客行为模式的短期公交客流预测方法，与传统的短期公交客流预测方法相比，所述方法能够显著提高预测精度，同时可用于预测公交客流组成结构，对灵活型公交设计具有一定的参考价值。

本发明的目的可以通过如下技术方案实现：

一种基于深度学习和乘客行为模式的短期公交客流预测方法，所述方法包括以下步骤：

步骤1、对公交客流影响因素进行识别与特征提取：所述影响因素同时考虑外部因素和内部因素，选取出行时间、是否高峰时段、天气状况和工作日性质这4个指标作为影响公交客流的外部因素，并对其中的是否高峰时段、天气状况和工作日性质这3个离散型指标进行了量化，选取公交卡刷卡类型、乘客对公交线路依赖度和乘客出行行为模式这3个指标作为影响公交客流的内部因素，并分析影响公交客流内部因素和外部因素的相互作用机制及其对公交客流生成的影响，通过聚类对乘客类型进行划分；

步骤2、对公交客流数据结构进行重新构造，将输入样本细分小时客流x_t重新构造为细分小时客流矩阵X_t，使其能够适应CNN和ConvLSTM模型，充分利用卷积运算的特性和优势；

步骤3、以历史客流、影响公交客流的外部因素和内部因素作为输入数据，根据8种不同维度的数据输入方案，即考虑内部影响因素的7种组合数据输入方案和1种不考虑内部影响因素的数据输入方案，利用深度学习模型对公交客流进行预测，通过多次试验获取公交客流预测的平均相对误差和绝对误差。

进一步地，所述公交卡刷卡类型能够通过原始刷卡数据获取，通过原始刷卡数据对公交卡刷卡类型进行分类。

进一步地，所述乘客对公交线路依赖度通过统计乘客的周平均乘车次数和周乘车标准差，将乘客对公交线路依赖度进行分类。

进一步地，所述乘客出行行为模式通过统计乘客刷卡类型和刷卡时间，将乘客出行行为模式进行分类。

进一步地，所述深度学习模型为DNN、LSTM、CNN或ConvLSTM。

进一步地，所述深度学习模型中每一输入样本x_t为包括历史客流、外部因素和内部因素这三大特征的列向量，在卷积神经网络模型中，以每小时的客流量为划分依据，将输入样本细分小时客流x_t重新构造为细分小时客流矩阵X_t，如下式所示：

对于细分小时客流矩阵X_t，列x_i表示第t时段内客流在第i个维度上的特征，m为时段客流的细分个数，n为客流特征个数。

进一步地，通过改变深度学习模型中网络输出层的结构，能够对公交客流的组成成分进行预测，对于公交客流总量的预测模型，其输出层神经元个数为1；为了得到各类客流成分的预测结果，需要调整输出层神经元个数与客流成分类别数一致，重新进行训练实现。

本发明与现有技术相比，具有如下优点和有益效果：

1、本发明提供的基于深度学习和乘客行为模式的短期公交客流预测方法，同时考虑公交客流的外部因素和内部因素，不仅可以预测公交客流总量，还可以预测公交客流组成结构；实验结果表明，相比于只考虑公交客流外部影响因素，考虑外部与内部因素的相互作用能够显著提高预测的精确度。

2、本发明根据公交客流的特点，引入了DNN、LSTM、CNN和ConvLSTM共4种深度学习算法，其预测结果均优于传统算法，其中对于CNN和ConvLSTM模型，通过重构输入数据结构，并构造小时客流细分矩阵以适应网络中的卷积运算，可以进一步提高预测精度。

附图说明

图1为本实施例提供的公交客流在时间段上的分布图。

图2(a)为本实施例提供的在工作日中，天气状况分别为良好、一般和恶劣时公交客流量的变化图；图2(b)为在非工作日中，天气状况分别为良好、一般时公交客流量的变化图。

图3(a)为本实施例提供的工作日公交客流在时间段上的分布图；图3(b)为节假日公交客流在时间段上的分布图。

图4(a)-图4(c)分别为本实施例中第1类-第3类刷卡类型的公交客流时段分布图。

图5(a)-图5(d)分别为本实施例中第1类-第4类乘客依赖度公交客流的时段分布图。

图6为本实施例提供的不同行为模式的客流分布图。

图7为深度神经网络DNN的结构图。

图8为循环神经网络RNN的结构图。

图9为长短期记忆网络LSTM的结构图。

图10为卷积神经网络CNN的结构图。

图11为本实施例对公交客流数据处理与预测算法的流程图。

图12为本实施例中281路公交的刷卡数据图。

图13为本实施例中281路公交的运营路线图。

图14为本实施例中第t小时的客流细分矩阵结构图。

图15(a)为本实施例中采用DNN深度学习的客流量预测结果；图15(b)为采用LSTM深度学习的客流量预测结果；图15(c)为采用CNN深度学习的客流量预测结果；图15(d)为采用ConvLSTM深度学习的客流量预测结果。

图16(a)为本实施例中DNN、LSTM和CNN的模型训练时间图；图16(b)为ConvLSTM的模型训练时间图。

图17(a)为本实施例中采用DNN深度学习的预测误差结果；图17(b)为采用LSTM深度学习的预测误差结果；图17(c)为采用CNN深度学习的预测误差结果；图17(d)为采用ConvLSTM深度学习的预测误差结果。

图18(a)为本实施例中以8种方案作为数据输入维度，统计的公交客流预测结果MAPE对比图；图18(b)为公交客流预测结果RMSE对比图。

图19(a)为本实施例中DNN、LSTM、LR、KNN、CNN、ConvLSTM和SVR共7种预测模型的测试误差与训练误差之差对比图；图19(b)为本实施例中KNN模型的训练与测试误差对比图。

图20(a)为本实施例中在方案1的输入条件下ConvLSTM模型在各时间段的预测相对误差图；图20(b)为在方案1的输入条件下ConvLSTM模型在各时间段的预测绝对误差图。

图21(a)为本实施例中在方案1的输入条件下ConvLSTM模型在工作日和非工作日的预测相对误差对比图；图21(b)为在工作日和非工作日的预测绝对误差对比图。

图22(a)为本实施例中30次独立实验下CNN模型预测结果的MAPE对比图；图22(b)为本实施例中30次独立实验下CNN模型预测结果的RMSE对比图。

图23(a)为本实施例中30次独立实验下ConvLSTM模型预测结果的MAPE对比图；图23(b)为本实施例中30次独立实验下ConvLSTM模型预测结果的RMSE对比图。

图24(a)为本实施例中30次独立实验下CNN过滤器个数分别为6、12、18和24预测结果的MAPE对比图；图24(b)为对应预测结果的RMSE对比图。

图25(a)为本实施例中30次独立实验下ConvLSTM过滤器个数分别为6、12、18和24预测结果的MAPE对比图；图25(b)为为对应预测结果的RMSE对比图。

图26(a)为本实施例中原始结构的相关系数热力图；图26(b)-图26(d)分别为本实施例中结构1-结构3的相关系数热力图。

图27(a)为本实施例中ConvLSTM在4种客流细分矩阵结构的MAPE对比图；图27(b)为本实施例中ConvLSTM在4种客流细分矩阵结构的RMSE对比图。

图28(a)-图28(c)分别为本实施例中第1类-第3类刷卡类型的客流预测结果图。

图29(a)-图29(d)分别为本实施例中第1类-第4类依赖度的客流预测结果图。

图30(a)-图30(l)分别为本实施例中第1种-第12种乘客出行行为模式的客流预测结果图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例：

本实施例提供了一种基于深度学习和乘客行为模式的短期公交客流预测方法，所述方法包括以下几个部分：

1公交客流影响因素识别与特征提取

在公交客流预测的模型中，本发明在考虑出行时间、天气状况、工作日与非工作日出行、日高峰出行与非高峰出行等外部因素的基础上，增加设计了公交卡刷卡类型、乘客对公交线路依赖度和乘客出行行为这3个和公交客流内部组成成分有关的内部影响因素，以期通过内部与外部因素的相互作用进一步细分客流总量，并建立深度学习算法提取客流内部各类组成成分的特征，提高公交客流预测的准确度。

1.1影响公交客流的外部因素

下面结合广州市281路公交IC卡刷卡的统计数据，具体展示上述的4个外部因素对公交客流的影响，论证不同类型客流与各影响因素之间响应模式的差别，从而说明模式分类对提高预测精度的必要性。

(1)出行时间

乘客出行时间是影响公交客流的重要因素，在不同的时间段的公交客流总量有显著的差异。乘客出行目的决定了出行时间，反之，乘客的出行时间可以反映出行目的，例如，乘客通勤的时间集中在早上7点到8点和晚上17点到18点这两个早晚高峰时间段，那么可以推断在早晚高峰时段的客流主要成分为通勤客流。图1是基于广州市281路公交IC卡刷卡的统计数据，展示了一星期内(2014年8月25日-2014年8月31日)公交客流的时段分布情况。

从图1中可以看出，在周一到周五的时间段内，公交客流存在明显的早晚高峰，且早高峰客流多于晚高峰客流；还可以看出，在周六周日的周末时间段内，公交客流的并无显著的早晚高峰。这是因为在周一到周五基本上为工作日时间，早晚高峰时段的客流主要为通勤客流，乘客通勤出行集中在相同的时间段，且上班对到达时间准点性要求较高，但在周末时间乘客出行目的多为购物逛街等，对到达时间准点性要求不高。

(2)高峰与非高峰时段

从图1还可以看出，公交客流在早上7-8点和晚上17-18点这两个时段存在明显的高峰，这一特征在周一到周五的工作日日期尤为明显，高峰时段的客流量显著高于其他时段，且早高峰客流量高于晚高峰客流量。是否为高峰时段也是影响公交客流量的一个重要因素，因为在早晚高峰这两个时段的客流多以上下班通勤为主，乘客出行行为也与其他时段不同。因此，可将客流时段的性质划分为如表1所示的两类。

表1

(3)天气状况

天气状况也会在一定程度上影响乘客出行方式的选择，从而影响公交客流发生量。公交站台普遍为露天或简易遮阳棚搭建，对于雨天等气候恶劣的天气来说，乘客在为了避免在等车期间受到恶劣的天气侵袭，转而选择地铁或出租车等其他交通方式。本发明依据降雨情况，将天气状况评价为三类，如表2所示。

表2

图2展示了在不同的天气状况下公交客流量的变化，在工作日时段和非工作日时段中分别选取了不同天气状况下的公交客流量进行对比。图2(a)展示了在工作日中，天气状况分别为良好、一般和恶劣时公交客流量的变化；图2(b)则展示了在非工作日中，天气状况分别为良好、一般时公交客流量的变化，数据中暂无恶劣的天气状况。从图2中可以看出，当由晴天等良好的天气状况变为阴雨等恶劣的天气状况，公交客流量在一定的程度上会有所降低。

(4)工作日性质

本发明实验数据日期范围从2014年8月25日到2014年12月28日，横跨时长近4个多月，日期包括中秋节和国庆节两个国家法定节假日。工作日与非工作日并非完全由星期决定，还应该包括由于节假日的调休后的工作日和假期。本发明对日期的工作日性质考虑了这种调整，调休会对工作日性质产生的影响，从而影响公交客流量。在图3(a)中，2014年8月25日和2014年10月11日对应的星期分别为周日和周六，但因为国庆节放假而调整为工作日，该时段公交客流分布也符合工作日时段的客流分布情况，存在明显的早晚高峰。在图3(b)中，2014年8月30日和2014年10月1日-3日对应的星期分别为周一和周三到周五，但其为中秋节和国庆节节假日，该时段公交客流分布也符合非工作日时段的客流分布情况，早晚高峰流量不显著。由此可知，调休会改变日期的工作日性质，从而导致的公交客流量的变化。

1.2影响公交客流的内部因素

为了进一步提高预测精度和可靠性，本发明在考虑影响公交客流外部因素的基础上，进一步设计了公交卡刷卡类型、乘客对公交线路依赖度和乘客出行行为这3个和公交客流内部组成成分有关的内部影响因素，这些客流信息可通过多源数据获取。

(1)公交卡刷卡类型

影响公交客流的最基本的内部因素是公交卡刷卡类型，在外部因素相同的情况下，不同卡片类型的公交客流也不相同。本发明实验所用数据中卡片类型有普通卡、学生卡、老人卡、残疾卡、员工卡、治安监督卡、军属卡共7中卡片类型。但残疾卡、员工卡、治安监督卡统计数据明显低于其他几种卡片类型，本发明根据这7种类型刷卡乘客的年龄段，将其归为如表3所示的三类。

表3

图4(a)、图4(b)和图4(c)以2014年8月25日到31日这一星期为例，分别展示了上述3种不同刷卡类型的公交客流的时段分布。

通过刷卡类型，可以提取各类刷卡客流在时间段上的分布特征。图4表明公交客流的主要成分还是第1类客流，但第2类和第3类客流仍然占据一定的比例。对于第1类客流，其客流时段分布与总客流时段分布相近，这是因为第1类客流是总客流的主要成分，对总客流时段分布占据主导地位。在周一到周五工作日期间，第1类客流高峰时段分布在第7-9、17-19这6个时间段，早高峰客流量高于晚高峰客流量，且高峰时段与其他时段客流差异显著，在周六到周日非工作日期间，第1类客流没有出现明显的高峰时段。第1类客流的卡片类型主要为普通卡和员工卡等，这一类乘客的持卡人主要为通勤上班人员，早上时间短，上班时间集中在一个时间段，故集中在早高峰。晚上下班后时间充裕，除了回家出行乘客的之外，部分乘客会去在回家之前顺路处理其他事务，导致晚高峰流量的下降。第2类客流的卡片类型主要为学生卡，这一类乘客的持卡人主要为中小学生。在周一到周五上课期间，高峰客流时段也分布在第7、8、9、17、18和19这6个时间段。对于学生来说，上下课时间固定，因而早晚高峰客流基本持平。在周末期间，部分学生外出补课或出游，导致周末客流量的波动。第3类客流的卡片类型主要为老人卡和残疾卡，这一类乘客的持卡人主要为老年人。其时段客流只存在1个明显的早高峰，且滞后于总客流高峰时段1到2个小时。老年人自由时间多，会选在避开客流早高峰出行，且出行目的多为散步休闲等，因此下午时段客流的分布基本均衡，并且工作日与非工作日时段客流分布没有显著差异。

(2)乘客对公交线路依赖度

本发明以乘客的周平均乘车次数和周乘车次数标准差这两个指标评价乘客对某条公交线路的依赖性，周平均乘车次数反应了乘客使用此条公交线路的频次，周乘车次数标准差反映了乘客使用此条公交线路的连续性。借助这两个指标将乘客分为如表1所示的4类。

表1

首先根据刷卡数据的ID字段统计IC卡的各周刷卡次数，根据周平均乘车次数和周乘车次数标准差这两个维度，使用Kmeans聚类算法将乘客线路依赖度聚为上述4类，并提取4种相应的时间分布特征。图5(a)、图5(b)、图5(c)和图5(d)以2014年8月25日到31日这一个星期为例，分别展示了4类乘客依赖度公交客流的时段分布。

从图5中可以看出不同依赖度乘客在时间段上的分布有所不同，通过考虑4类依赖度将公交客流内部组成成分进一步细分，考虑各类客流之间相互影响，以及内部因素与外部因素相互之间作用对公交客流总量的影响，从而进一步细分客流，挖掘公交客流信息。

(3)乘客出行行为模式

乘客出行行为也是影响公交客流的一个重要内部因素。乘客出行行为可阐述为如：上下班工作出行，上下学学生出行，老人休闲出行等。本发明使用Kmeans算法根据IC卡类型和刷卡时间这两个维度对客流进行聚类，3类不同刷卡类型的乘客出行时间均可大致划分为早上、中午、下午和晚上4个时间段，所以将乘客出行行为模式聚类的簇数设定为12类。这12类客流在时间上的分布与客流量如图6所示。

根据乘客的刷卡时间和刷卡类型，推测这12类的客流主要出行行为模式特征如表5所示。3种刷卡类型的乘客的出行时段都被划分为4类，由于不同刷卡类型的乘客出行集中的时间段有所差异，不同类型刷卡客流时间段划分的界限也有所不同。普通卡和学生卡客流的出行目的多以上班和上学为主，出行行为特征根据出行时间容易推测。而老人卡客流空闲时间多，出行的随机性比较大，出行目的多样，不以某种出行行为特征为主。

表5

2深度学习网络模型的建立与运行

深度学习是基于神经网络建立的学习模型，本发明建立了4种基于深度学习的公交客流预测模型，分别为深度神经网络(DNN)、长短期记忆网络(LSTM)、卷积神经网络(CNN)和卷积长短期记忆网络(ConvLSTM)。

2.1深度学习网络模型的建立

(1)深度神经网络

深度神经网络英文全称Deep Neural Networks，简称DNN，它建立在传统的神经网络之上。传统神经网络是由输入层、隐含层和输出层构成。在传统的神经网络中，通常只有一层隐含层。最基本的DNN模型是通过增加隐含层的数量，构造出更加复杂的神经网络，层与层之间依然通过全连接的方式连接，神经元之间的连接权重和响应阈值等调节参数的数量大大增加，其基本结构如图7所示。

深度神经网络的基本单位是神经元，对于第i层第j个神经单元的输出信号为：

h_ij＝f(w_ijx_ij+b_ij) (1)

式中，h_ij表示隐含层第i层第j个神经单元的输出信号，向量w_ij表示与神经元ij连接的神经元的连接权重，向量x_ij表示神经元ij的输入数据，常数b_ij表示神经元ij的激活偏置，f为激活函数。在神经网络模型中，激活函数f一般为sigmoid函数或tanh函数，二者的函数形式如下：

深度学习模型中，神经单元和网络层数多，连接复杂，激活函数f通常会使用ReLU函数，可以加快收敛。ReLU函数形式如下：

式中，a为一很小的常数。

(2)长短期记忆网络

仅以全连接建立的神经网络不能捕获数据的时间序列特征，尤其像公交客流这类与时间序列紧密相关的数据。循环神经网络正是为了克服这一缺点而被提出，循环神经网络英文全称Recurrent Neural Network，简称为RNN，基本结构如图8所示。

在图8中，左侧为RNN的基本结构，右侧为RNN的展开结构，图中X＝(x₁,x₂,…,x_T)为输入向量，O＝(o₁,o₂,…,o_T)为输出向量。可以看出，相比于基本形式的深度学习网络，RNN的第n个单元中，同时输入第t时刻样本x_t和第t-1时刻的激活h_t-1。RNN的数学模型可以由式(5)-(8)表示：

a_t＝Wh_t-1+Ux_t+b (5)

h_t＝sigmoid(a_t) (6)

s_t＝Vh_t+c (7)

o_t＝tanh(s_t) (8)

式中，x_t为t时刻的输入变量，h_t-1为t-1时刻隐含层激活，h_t为t时刻隐含层激活，W、U和V为连接权重矩阵，b和c为激活偏置向量，o_t为t时刻的输出变量，激活函数sigmoid和tanh如式(2)、(3)所示。

RNN的隐藏层不仅与输入层连接，还与上一时期的隐含层连接。因此，通过序列数据的输入，RNN可以在历史数据中建立的连接，但是多层网络在训练的过程中，存在梯度消失和梯度爆炸现象，RNN只能在短期的数据中建立联系，当时间延长，远期的历史数据对最终的输出结果影响甚微。

为了克服RNN的缺点，Hochreiter等在1997年提出了长短期记忆网络。长短期记忆网络英文全称Long Short-Term Memory，简称为LSTM，是一种特殊形式的RNN，可以学习长期依赖信息。LSTM网络在RNN记忆单元的基础上增加了输入门、遗忘门和输出门，其基本结构如图9所示。

LSTM的数学模型可以由式(9)-(14)表示。

i_t＝sigmoid(W_ix_t+U_ih_t-1+b_i) (9)

f_t＝sigmoid(W_fx_t+U_fh_t-1+b_f) (10)

o_t＝sigmoid(W_ox_t+U_oh_t-1+b_o) (11)

式中，运算符为Hadamard乘积，x_t为t时刻的输入变量，O_t表示最终输出变量，i_t、f_t和o_t分别为输入门、遗忘门和输出门，为隐含层记忆单元t时刻更新后状态，h_t为隐含层记忆单元t时刻最终状态，W_i、W_f、W_o、W_c、U_i、U_f、U_o和U_c为连接权重，b_i、b_f、b_o和b_c为激活偏置，激活函数sigmoid和tanh如式(2)、(3)所示。

(3)卷积神经网络

卷积神经网络英文全称Convolutional Neural Networks，简称为CNN。CNN不同于传统意义上一维连接的神经网络，它是建立在二维矩阵上的神经网络，通过卷积运算可以识别矩阵的局部特征，捕获矩阵相邻元素之间的内在联系。CNN由卷积层、池化层和全连接层组成，其基本结构如图10所示。

在图10中，卷积神经网络各层数学模型可由式(15)-(18)表示。

H_k＝sigmoid((X*K)+b_k) (15)

H_p＝sigmoid(max(H_k)_m×n+b_p) (16)

o_f＝flatten(H_p) (17)

式中，H_k、H_p和o_f分别为卷积层、池化层、全连接输出层，X和分别为输入矩阵和输出向量，运算符*为卷积运算，K为卷积层核函数，max(H_k)_m×n为对矩阵H_k操作m×n池化，flatten函数将二维网络展开为一维全连接网络，W为全连接层连接权重，b_k、b_p和b_o为激活偏置，激活函数sigmoid和tanh如式(2)、(3)所示。

(4)卷积长短期记忆网络

CNN通过卷积运算可以捕获矩阵相邻元素之间的内在联系，但不能捕获数据的时间序列特征，LSTM网络对于长时间序列数据有很好的学习能力，但是LSTM网络不能够捕获矩阵相邻元素之间的内在联系。Shi等在2015年提出了一种集成CNN和LSTM优点的卷积长短期记忆网络模型。卷积长短期记忆网络英文全称Convolutional Long Short-TermMemory，简称为ConvLSTM。ConvLSTM通过门控单元可以学习到公交客流在时间上的长期依赖信息，通过对输入的客流细分矩阵X_t的卷积运算可以学习到公交客流数据内部之间的潜在联系，其数学模型如式(19)-(24)所示。

i_t＝sigmoid(W_i*X_t+U_i*H_t-1+b_i) (19)

f_t＝sigmoid(W_f*X_t+U_f*H_t-1+b_f) (20)

o_t＝sigmoid(W_o*X_t+U_o*H_t-1+b_o) (21)

式中，运算符*为卷积运算，运算符为Hadamard乘积，X_t为t时刻的输入变量，O_t表示最终输出变量，i_t、f_t和o_t分别为输入门、遗忘门和输出门，为隐含层记忆单元t时刻更新后状态，H_t为隐含层记忆单元t时刻最终状态，W_i、W_f、W_o、W_c、U_i、U_f、U_o和U_c为连接权重，b_i、b_f、b_o和b_c为激活偏置，激活函数sigmoid和tanh如式(2)、(3)所示。

2.2深度学习网络模型的运行

数据处理与算法流程

图11为本发明对公交客流数据处理与预测算法的流程图，具体步骤如下：

(1)获取影响公交客流的外部因素。本发明选取了出行时间、是否高峰时段、天气状况和工作日性质这4个指标作为影响公交客流的外部因素，并对其中的天气状况、是否高峰时段和是否工作日这3个离散型指标进行了量化。

(2)获取影响公交客流的内部因素。本发明将公交卡刷卡类型、乘客对公交线路依赖度和乘客出行行为这3个指标作为影响公交客流的内部因素。其中公交卡刷卡类型可以通过原始刷卡数据获取。线路依赖指标通过统计乘客的周平均乘车次数和周乘车标准差，将乘客乘坐公交线路依赖程度分为表3中的4类。行为模式指标是通过统计乘客刷卡类型和刷卡时间将乘客的出行行为模式分为表5中的12类。

(3)构造客流细分矩阵。CNN和ConvLSTM模型中卷积层通过输入数据与筛选器的卷积运算构造而成，卷积运算可以在同层之间的神经元建立联系，从而能够捕获到矩阵元素与元素之间的内在联系。为充分利用卷积运算的特性和优势，将细分小时客流重构为客流细分矩阵，使输入数据能够适应CNN和ConvLSTM模型。

(4)构造深度学习网络。以历史客流、影响公交客流的外部因素和内部因素作为输入数据，并据此根据上述4种深度学习模型对公交客流进行预测，通过多次试验获取平均相对误差和绝对误差。由于本发明考虑了公交客流内部因素，因此通过改变网络输出层的结构，还可以实现公交客流组成成分的预测，对于公交客流总量的预测模型，其输出层神经元个数为1；为了得到各类客流成分的预测结果，需要调整输出层神经元个数与客流成分类别数一致，重新进行训练实现。

3实验

3.1数据描述

本发明实验数据为广州281路公交的IC卡刷数据，数据来源于阿里天池大赛公开数据集。281路每日刷卡率平均95％以上，IC刷卡客流数据能够较完整有效的反应客流规律。数据为2014年8月25日到2014年12月28日，6点到23点的刷卡数据，有效数据的字段包括刷卡ID(Card_Id)，卡片类型(Card_type)，刷卡日期和时间(Deal_time)，部分数据如图12所示。另外，日期属性数据集，法定节假日，校历，历史天气等可通过相关部门网站和实地调研获取。

281路运营路线如图13所示，横跨广州佛山两市，终点站为广卫路总站和保利紫山国际花园总站，沿途经过居住区，商业区，重要交通枢纽，医院学校等城市功能区，乘客结构组成复杂，客流影响因素众多。

3.2数据量化与标准化

数据量化可以将非数字表示的离散变量转换成数字的形式。数据指标量化是为了方便后续算法的处理。需要量化的数据包括公交卡刷卡类型量化、天气指标量化、高峰时段与非高峰时段量化和工作日性质量化。

(1)公交卡类型量化。数据集中卡片类型有普通卡、学生卡、老人卡、残疾卡、员工卡、治安监督卡、军属卡共7中卡片类型。但残疾卡、员工卡、治安监督卡统计数据明显低于其他几种卡片类型，本发明根据这7种类型刷卡乘客的年龄段，将其归为三类：第1类包括普通卡、员工卡、治安监督卡和军属卡，量化值为1；第2类学生卡，量化值为2；第3类包括老人卡和残疾卡，量化值为3。

(2)高峰时段与非高峰时段量化。根据统计所得的小时公交客流总量将时段分为两类：早上7点到8点和晚上17点到18点这两个时段定义为客流高峰时段，记为1；除上述高峰时段外的其他时间段定义为非高峰时段，记为0。

(3)天气状况量化。根据降雨情况将天气分为三类：第1类包括晴天、阴天和晴转小雨等无或少降雨量的天气，量化值为1；第2类包括阴转小雨、雷阵雨和小到中雨等中等降雨量的天气，量化值为2；第3类包括中雨、大雨和大到暴雨等高降雨量的天气，量化值为3。

(4)工作日性质量化。本发明将工作日记为0，非工作日(节假日，包括周六、周日和国家法定节假日)记为1。非工作日由全国假日办公布的日期确定。

样本不同维度的特征数据可能会存在较大的量级差异，样本特征数据高量级的维度在模型优化的过程中可能会起主导作用，数据在较大范围的波动也会导致模型优化时优化收敛速度减慢。本发明在将客流样本输入到模型之前，对样本每个维度的数据分别做了标准化处理。本发明选用的是min-max标准化方法，其可以使样本数据值映射到[0-1]之间。

3.3客流细分矩阵构造

CNN和ConvLSTM通常用于在图像识别等计算机视觉领域，如图像等都是以矩阵形式的数据作为输入，通过卷积运算能够在矩阵相邻元素之间建立联系，池化运算可以降低卷积层输出向量的维度。本发明通过对公交客流数据结构重新构造，将输入样本细分小时客流x_t重新构造为细分小时客流矩阵X_t，使其能够适应CNN和ConvLSTM模型。

当数据以向量的形式输入时，数据内部之间的关系是以数据间隔这一个维度上反映；当数据以矩阵的形式输入时，数据内部之间的关系可以在行和列两个维度上反映，显然二维矩阵相对于一维向量包含了更多的数据之间内在信息。构造小时公交客流矩阵，并通过卷积运算，以更大的可能性挖掘输入数据之间的内在联系。在本发明模型中，每一输入样本x_t为包括历史客流、外部因素和内部因素这三大特征的列向量。在卷积神经网络模型中，以每小时的客流量为划分依据，将输入样本细分小时客流x_t重新构造为细分小时客流矩阵X_t，如式(25)所示。

对于细分小时客流矩阵X_t，列x_i表示第t时段内客流在第i个维度上的特征，m为时段客流的细分个数，n为客流特征个数。例如，第t小时的客流细分矩阵结构如图14所示：

对于t时段客流细分矩阵X_t，若使用DNN和LSTM网络进行训练时，输入二维矩阵X_t会被降维转化为一维向量x_t，丢失了矩阵维度信息，所以DNN和LSTM网络无法捕获矩阵相邻元素之间的内在联系。但CNN和ConvLSTM网络以二维矩阵X_t输入进行卷积运算，保留了矩阵X_t的二维信息，从而保留了时段客流细分矩阵X_t的更多信息，能够捕获矩阵相邻元素之间的内在联系，提高预测算法的准确度。

3.4实验环境

实验数据为2014年8月25日到2014年12月28日，6点到23点的刷卡数据，取2014年08月25日到2014年12月07日的客流数据作为训练样本，取2014年12月08日到2014年12月28日的数据作为测试样本。

本发明实验在Python3.6的Spyder中实施，并借助TensorFlow和Keras深度学习框架。计算机的主要硬件参数为：CPU型号为Inter(R)Core(TM)i5-4200 2.50GHz、GPU型号为NVIDIA GeForce GT 740M、内存为8GB。每个深度学习模型均进行了100次迭代学习训练，学习速率为0.001，批次大小为10，模型结果为30次独立实验的平均值。

3.5误差评价

实验结果由MAPE(Mean Absolute Percentage Error，平均相对误差)和RMSE(Root Mean Square Error，均方根误差)这两个指标评价。MAPE可以反映公交客流预测结果的相对误差，RMSE可以反映公交客流预测结果的绝对误差，计算公式如下：

式中，n为样本数量；为样本预测值；y_i为样本的期望值(真实值)。

3.6实验结果

为了对比同时考虑公交客流的内部与外部影响因素与只考虑外部的预测结果，本发明将以表6中的8种不同输入维度特征分别使用上述4种深度学习的模型完成预测。其中方案1的输入维度为历史客流、4种外部因素特征和全部3种内部因素特征；方案2-4的输入维度为历史客流、4种外部因素特征和1种内部因素特征；方案5-7的输入维度为历史客流、4种外部因素特征和2种内部因素特征；方案8的输入维度为只有历史客流和4种外部因素特征，作为对比的基准方案。使用MAPE和RMSE这两个指标来评价模型的预测准确度，预测结果经整理后如图15-图17所示。

表6

图15(a)-图15(d)以2014年12月8日到14日这一周的客流量为例，分别展示了4种深度学习的预测结果。可以看出，4种预测模型均能有效实现公交小时客流预测，且能够有效地适应高峰与非高峰、工作日与非工作日客流变化。

图16(a)、图16(b)分别表示4种深度学习模型在表6对应8种输入维度下的模型训练时间，其中ConvLSTM训练时间远高于DNN、CNN和LSTM这三种模型，因而将其单独在图16(b)中展示。在图16(a)、图16(b)的四种深度预测模型中，训练用时从低到高依次为：DNN、CNN、LSTM、ConvLSTM。相比于DNN，CNN通过卷积运算(H_k)与池化运算(H_p)捕获相邻数据之间关联，使网络结构更为复杂，参数增多，训练耗时增加。LSTM中的隐藏层神经元不仅与输入层连接，还通过门控单元(输入门i_t、遗忘门f_t、输出门o_t)与上一时期的隐藏层建立了联系，使网络具有时间记忆效应，增加了模型的复杂度，从而导致模型训练耗时增加。ConvLSTM模型集成了LSTM的门控单元和CNN的卷积与池化运算，进一步增加了模型的复杂化度，训练耗时最长，且均到达了200秒以上。

在DNN、CNN、LSTM和ConvLSTM的任意一个模型中，训练时间从低到高依次为：方案8，方案5、6和7，方案2、3和4，方案1。这是因为方案中输入数据的维度越小，网络的复杂度就会降低，训练模型时需要调整的参数就减少，从而降低训练用时。在上述8种方案中，输入维度都包括历史客流和外部因素，对于内部因素，方案8无内部因素输入；方案5、6和7包括1种内部因素输入；方案2、3和4包括2种内部因素输入；方案1包括全部3种内部因素输入，各方案模型具体输入维度的数据信息如表6所示。对于输入维度包括历史客流、外部因素和3个或2个内部因素的ConvLSTM深度学习模型训练耗时甚至达到了600秒以上。

图17(a)-图17(d)为4种深度学习模型对2014年12月8日到2014年12月28日测试集客流预测结果的误差统计图。对于DNN和LSTM来说，方案8预测结果的MAPE均高于11.4％，RMSE均高于270。在方案1-7的所有预测结果中，RMSE均低于260，DNN的MAPE最高为11.31％，最低为10.93％，LSTM的MAPE均低于11％，最低为9.64％。对于CNN和ConvLSTM，方案8预测结果的MAPE均高于11％，RMSE均高于250。方案1-7中，MAPE均低于10％，RMSE均低于230。其中在方案1下ConvLSTM具有最高精确度的预测结果，MAPE为9.05％，RMSE为212。

从图中的4种深度学习模型的预测误差中可以看出，四种预测模型的精确度从高到低依次为：ConvLSTM、CNN、LSTM、DNN。可以看出考虑网络时间记忆效应的LSTM模型和考虑相邻数据之间关联的CNN模型的预测结果优于一般的DNN模型，而同时考虑数据之间的关联性和网络的时间记忆效应的ConvLSTM具有最高的预测精确度，但预测精确度的提高带来的是模型训练时间的增加。

同时考虑公影响交客流的外部和内部因素(方案1-7)相对于只考虑公影响交客流的外部因素(方案8)均能够显著降低客流预测结果的MAPE和RMSE，这是因为考虑公交客流的内部影响因素，能够捕获到影响公交客流更多信息，从而提高模型预测的准确度。然而并非完全是输入数据的维度越大，考虑因素越多，模型预测结果就越精确。预测模型的精确度与模型的网络结构也有很大的关系。对于DNN和LSTM模型来说，预测误差最小方案为方案7(包括行为模式和线路依赖)，DNN预测结果的MAPE为10.45％，RMSE为231，LSTM预测结果的MAPE为9.64％，RMSE为229。然而CNN模型最小预测误差为方案5(卡片类型和行为模式)，MAPE为9.29％，RMSE为220；ConvLSTM模型最小预测误差为方案1(包括卡片类型、行为模式和线路依赖全部)，MAPE为9.05％，RMSE为212。

在不同模型下最小预测误差的方案也有所不同，模型的网络结构也有很大的关系。DNN和LSTM的网络结构与CNN和ConvLSTM有所不同：DNN神经元之间的连接方式为层与层之间的全连接，引入门控单元的LSTM模型也只是与上一时期的隐含层建立了连接，DNN和LSTM之间的连接关系只存在于层与层的神经元之间，同层之间的神经元并没有建立连接，所以在图17中可以看出DNN和LSTM网络模型的预测误差(y轴)与输入方案(x轴)的关系相似，而与CNN和ConvLSTM有所不同。CNN和ConvLSTM通过卷积与池化运算，在同层之间的神经元建立了联系，能够捕获到矩阵元素与元素之间的内在联系，元素之间的某种内在联系，相比于输入数据内部因素的数量对预测精度的影响更大，所以在图17中，只要输入数据包括内部因素(方案1-7)，其预测误差均低于无内部因素输入的模型(方案8)，但其预测结果误差的差距变化不大。CovLSTM模型保留了LSTM模型的门控单元结构并与上一时期的隐藏层建立联系，网络结构更为复杂，其预测结果的误差在各种方案之间的差别与CNN模型亦有所不同。

在DNN和LSTM模型中，对于只包含1种内部因素(方案2、3和4)的输入方案，方案3(只包括行为模式)预测结果的误差最小，方案4(只包括线路依赖)次之，方案2(只包括卡片类型)的误差最大，这表明本发明通过聚类方法确定的表5中12种乘客出行行为模式，以及表4中乘客对公交线路的4种依赖性能够有效提取公交客流的内部影响因素。在包含2种内部因素(方案5、6和7)的输入方案，方案7(包括行为模式和线路依赖)预测结果的误差最小，并且在8种方案中预测误差也达到了最小，证明了行为模式和线路依赖是影响公交客流的两个重要内部因素，考虑这两个因素能够提高公交客流预测的精确度。

4模型分析

4.1深度学习模型与传统模型预测精确度对比

本发明选取LR(Linear Regression，线性回归)以及两种传统的机器学习模型SVR(Support Vector Regression,支持向量回归)和KNN回归(k-Nearest NeighborRegression)预测结果与本发明4种深度学习的预测结果进行对比。同样以表6中8种方案作为数据输入维度，统计公交客流预测结果的MAPE和RMSE，结果如图18所示。

从图18(a)和图18(b)可以看出4种深度学习模型的预测结果在MAPE和RMSE上均优于LR和SVR模型。就MAPE而言，在不同输入的维度下，LR和SVR模型二者优劣有所不同，就RMSE而言，在不同输入的维度下，SVR模型的预测结果均优于LR模型。在这8种输入方案中，无论是4种深度学习模型还是另外3种模型，可以看出只考虑影响公交客流的内部因素(方案8)预测结果的误差高于同时考虑外部和内部因素的预测误差，这表明考虑公交客流内部组成成分的影响因素，可以进一步挖掘公交客流组成成分的信息，从而进一步提高预测结果的准确度。

在图18中，KNN回归模型的预测精确度接近4种深度学习模型，但KNN回归模型在拟合的过程中存在过拟合现象，如图19(b)所示。

测试误差与训练误差之差可以反映出模型的过拟合程度，这个差值越小，说明模型对训练集和测试集的学习能力一致，模型的泛化性越好，有利于模型的推广。这个差值越大，则说明模型对训练集的学习能力强，而对测试集的学习能力弱，模型的泛化性差，不利于模型的推广。图19(a)为在8输入维度下，7种预测模型的测试误差与训练误差之差，可以看出DNN、LSTM、CNN和ConvLSTM四种深度学习模型的误差差值在1％以下，SVR和LR的误差差值最高也在2％左右，而KNN模型的误差差值在4％-5％左右，显著高于其他6个模型。将KNN模型的训练误差与测试误差单独放在图19(b)中，可以看到KNN模型的训练误差在6％左右，而测试误差却在10％左右，在公交客流预测中，KNN模型在训练的过程中学习能力过强，很容易出现过拟合现象，从而导致测试误差偏大。

4.2客流预测结果在时间维度上的分布特征

为了分析出行时间、出行星期和出行工作日性质等时间维度上对深度学习预测结果的影响，本节以图17中预测误差最小的模型，即在方案1(内部因素包括卡片类型、行为模式和线路依赖)的输入条件下ConvLSTM模型为例，进一步统计预测误差在出行时间、出行星期和出行工作日性质这三个在时间维度上的均值与方差，分析预测模型的准确性与可靠性，结果如图20和图21所示。

图20和图21以箱线图的形式展示了预测模型在各时间段、星期和是否工作日上预测误差的分布情况，图20(a)和图20(b)分别为MAPE和RMSE。图中矩形盒上下两端边的位置分别表示误差的上下四分位数，矩形盒中的短线表示误差的中位数，可以反映整体预测误差波动的中心；三角表示误差的平均值。垂直线两端表示误差的范围，垂直线可以反映误差在各个时段上的波动情况，垂直线越长，表示误差的波动的范围越大；是异常值，表示预测模型对于个别时段的预测误差偏大，偏离整体的预测误差。

图20表明在靠近早晚时间段，相对误差越大，相对误差波动也越大，但绝对误差较小，绝对误差波动也较小。而在早晚高峰时段，客流量较大，相对误差越小，相对误差波动也越小，但绝对误差较大，绝对误差波动也较大。这是因为误差的大小与预测结果的数量级有关系，靠近早晚时间段的客流量，客流量远低于高峰时段客流量，绝对预测误差较小，但由于基数小导会致相对误差较大；对于早晚高峰时段的客流量，客流量显著较高，预测绝对误差较大，但由于基数大导会致相对误差较小。图21(a)和图21(b)表明该模型对非工作日的误差较工作日误差的大，这是因为在工作日，乘客多为通勤等有特定的目的出行，出行集中在特定的时间段内，客流变化呈现特定的规律，对于非工作日，乘客有自由的时间，出行目的更多样，客流成分复杂，客流变化规律更为复杂，模型对非工作日时段客流预测的误差偏大。

4.3工作日性质对客流预测精确度的影响

从图1-3可以看出工作日性质是影响公交客流量的一个重要因素，在工作日时段和非工作日时段客流在时间段上有明显不同的分布。对这一影响因素，上文在输入数据中通过引入0、1变量来表示工作日的性质对公交客流产生的影响。

为了确定工作日性质对预测结果的影响，本节设计了3组对比实验：(1)不考虑工作日性质，即在输入数据中去掉工作日性质这一列。(2)分工作日与非工作日时段单独预测，即首先将工作日与非工作日时段的数据分类，然后再单独完成训练与预测，输入数据中仍然没有工作日性质这一列。(3)考虑工作日性质整体预测，即上文的输入数据的方案，将工作日性质作为一项影响公交客流的外部因素，并用0、1变量表示。

以图17中预测误差最小的模型，即在方案1(内部因素包括卡片类型、行为模式和线路依赖)的输入条件下ConvLSTM模型为例，预测结果如图22和图23所示。

图22(a)、图22(b)和图23(a)、图23(b)以箱线图的形式统计了30次独立实验下的CNN和ConvLSTM模型预测结果的MAPE和RMSE，横坐标表示上述3种对工作日性质操作的方案。矩形盒中短线表示30次实验误差的中位数，三角表示30次实验误差的平均值。在CNN和ConvLSTM模型中，预测误差的总体特征一致，即不考虑工作日性质、分工作日和非工作日两个时段单独预测和考虑工作日性质整体预测3种方案的MAPE和RMSE依次降低。具体结果如下：

(1)不考虑工作日性质的情况下CNN模型预测结果的RMSE为13.69％，RMSE为418；ConvLSTM模型预测结果的MAPE为13.59％，RMSE为419。

(2)分工作日和非工作日两个时段单独预测的情况下CNN模型预测结果的RMSE为10.72％，RMSE为10.44％；ConvLSTM模型预测结果的MAPE为，绝对误差为231。

(3)考虑工作日性质整体预测的情况下的情况下CNN模型预测结果的MAPE为9.87％，RMSE为225；ConvLSTM模型预测结果的MAPE为9.05％，RMSE为212。

(4)考虑工作日性质整体预测相比于不考虑工作日性质CNN模型MAPE降低了3.83％，RMSE降低了193，ConvLSTM模型MAPE降低了4.54％，RMSE降低了207。相比于分工作日和非工作日两个时段单独预测CNN模型MAPE降低了0.85％，RMSE降低了3，ConvLSTM模型MAPE降低了1.39％，RMSE降低了19。

公交客流在工作日与非工作日时段的客流分布显著不同，工作日性质是影响公交客流的一个重要外部因素。分工作日和非工作日预测首先将客流按工作日性质分类，避免了工作日性质不同的客流之间干扰，从而提高了预测的精确度。然而分工作日和非工作日预测需要根据客流性质独立完成两个模型训练，使模型训练时间翻倍，并且破坏了客流在日期时段上的连续性。考虑工作日性质的深度学习模型则以0、1变量来区分工作日与非工作日客流，客流在日期时段仍然连续，这尤其可以有效利用通过门控单元与历史数据建立关联的ConvLSTM模型的优势，使其可以从历史数据周期性的变化学习到客流在日期上的波动规律，从而减小预测结果的误差，提高预测模型的精确度。4.4卷积运算中过滤器个数对预测精确度的影响

在CNN和ConvLSTM中，卷积运算中对输入矩阵X卷积操作的核函数K通常又被称作过滤器，用于提取输入矩阵中相邻元素的特征，使用越多的过滤器构造卷积层，能够获得越多的关于输入矩阵的细节信息。上文构造的CNN和ConvLSTM中过滤器的个数均为24，为了观测过滤器的个数对模型预测精确度的影响，本节以图17中方案1下的CNN和ConvLSTM为例，通过每次减少6个等距减少过滤器的个数，来观测公交客流预测的结果的变化。CNN和ConvLSTM在6、12、18和24个过滤器下公交客流预测结果的MAPE和RMSE如图24和图25所示。

图24(a)、图24(b)和图25(a)、图25(b)以箱线图的形式统计了30次独立实验下的CNN和ConvLSTM过滤器个数分别为6、12、18和24预测结果的MAPE和RMSE。矩形盒中黄色短线表示30次实验误差的中位数，绿色三角表示30次实验误差的平均值。从图中可以看出对于CNN和ConvLSTM模型均存在这一特征：当过滤器个数较少时，增加过滤器个数可以显著提高模型预测的精确度，当过滤器的个数达到一定程度时，通过增加过滤器个数不再能够显著提高模型预测的精确度。具体结果如下：

(1)当过滤器个数由6个增加到12个时，CNN模型预测结果的MAPE由11.11％减低到10.45％，降低了0.66％，ConvLSTM模型预测的MAPE由9.98％减低到9.55％，降低了0.43％。

(2)当过滤器增加到了18个时，CNN模型预测结果的MAPE减低到10.06％，降低了0.39％，ConvLSTM模型预测结果的MAPE减低到9.34％，降低了0.21％。

(3)当过滤器个数增加到了24个时，CNN模型预测结果的MAPE减低到9.87％，进一步降低了0.19％，ConvLSTM模型预测结果的MAPE减低到9.05％，降低了0.29％。

这是因为在CNN和ConvLSTM的卷积层是通过过滤器(核函数K)与输入层卷积运算得到，过滤器越多，能过从输入的客流细分矩阵中捕获更多细节信息，从而能够充分挖掘客流细分矩阵元素之间的内部关联，降低预测结果的误差，提高预测模型的精确度。当过滤器达到一定的数量后，已经能够充分捕获数据矩阵的细节信息，再增加过滤器的个数，预测结果误差降低的程度不明显，预测精确度也不会有明显的提升。此外，从图中也可以看出在过滤器数量相同的条件下，ConvLSTM和CNN，这也进一步证明了ConvLSTM模型对公交客流预测的精确度高于CNN模型。

4.5客流细分矩阵结构对预测精确度的影响

上文构造的客流细分矩阵是基于影响客流的外部与内部因素对小时客流的细分，矩阵的列表示客流的某一特征，列之间的排列顺序并无特定方式。CNN和ConvLSTM模型中的卷积运算可以捕获输入矩阵中相邻元素的特性，卷积层是通过过滤器(核函数K)与输入层(X)的卷积运算构造而成的，数据矩阵的结构的改变会导致卷积层也随之改变，从而影响预测结果。

客流细分矩阵的每一列为客流数据的某一特征，以图17为中方案1下的ConvLSTM模型为例，输入数据客流细分矩阵X_t＝[x₁,x₂,x₃,x₄,x₅,x₆,x₇,x₈]，各列的含义如表7所示。

表7

本节通过调整客流细分矩阵列之间的排列顺序来改变其结构，选择了3种结构进行实验，观测客流细分矩阵结构的变化对预测结果的影响。3种结构和上文实验共4种结构的输入客流细分矩阵的列排列顺序如表8所示。

表8

为了能够直观表现这4种客流细分矩阵列结构的区别，根据式(28)皮尔逊相关系数计算各结构列之间的相关系数，并绘制各列之间的相关系数热力图，如图26(a)-图26(d)所示。

图26展示了客流细分矩阵特征列之间的相关性，相关系数越大，相关性越高，如图中x₃和x₅列之间的相关系数最大。ConvLSTM在4种客流细分矩阵结构的MAPE和RMSE分别如图27(a)和图27(b)所示。

图27(a)和图27(b)分别以箱线图的形式统计了30次独立实验下的ConvLSTM模型在4种客流细分矩阵结构下预测结果的MAPE和RMSE。矩形盒中短线表示30次实验误差的中位数，三角表示30次实验误差的平均值。在4种客流细分矩阵结构下的预测结果中，原始结构MAPE和MAPE分别为9.05％和212；预测结果的误差最小的为结构2，MAPE和RMSE分别为8.93％和211，相对于原始结构；预测结果的误差最大的为结构1，MAPE和RMSE分别为9.21％和215。此外，在客流细分矩阵为结构2的30次实验中，误差最小的一次实验MAPE降低到了7.84％，相对于原始结构降低了1.20％，RMSE低至198，相对于原始结构降低了14。

可以看出，输入客流细分矩阵结构的改变能够影响最终预测结果，这是因为ConvLSTM模型中通过卷积运算捕获到客流细分矩阵相邻元素之间的内在联系，调整矩阵的结构必然会导致矩阵中相邻元素位置的改变，从而影响卷积层的构成，进而影响预测结果。根据客流细分矩阵特征列之间的相关性调整客流细分矩阵的结构，可以进一步降低预测误差，提高预测模型的精确度。

4.5分类客流预测

对于考虑公交客流内部因素输入方案的模型，通过改变网络输出层的结构，可以实现公交客流各类组成成分的预测，需要调整输出层神经元个数与客流成分类别数一致，并通过重新训练实现。以方案1下的ConvLSTM模型为例，对影响公交客流的3种内部因素(乘客刷卡类型、乘客对公交线路的依赖程度和乘客出行行为模式)实现分类预测，预测结果经过统计整理后如图28-30所示。

图28-图30以散点图的形式展示了ConvLSTM对3种内部因素(乘客刷卡类型、乘客对公交线路的依赖程度和乘客出行行为模式)的分类预测结果。其中，图28(a)为第Ⅰ类刷卡类型的客流预测结果图；图28(b)为第Ⅱ类刷卡类型的客流预测结果图；图28(c)为第Ⅲ类刷卡类型的客流预测结果图。图29(a)为第1类依赖度的客流预测结果图；图29(b)为第2类依赖度的客流预测结果图；图29(c)为第3类依赖度的客流预测结果图，图29(d)为第4类依赖度的客流预测结果图。图30(a)-图30(l)分别为第1种-第12种乘客出行行为模式的客流预测结果图。

图中横坐标表示实际值，纵坐标表示预测值，斜线表示零误差的理想拟合线。散点越靠近斜线，表示预测结果的精确度越高。图中纵坐标的取值范围根据数据数量级的进行了调整。可以看出，无论每一类别客流量的大小，预测结果均在理想拟合线附近小范围波动，并没有在某些类别出现较大的偏差，这表明ConvLSTM不仅可以准确预测公交客流总量，对于每一类别的客流也可以实现准确预测，这对运输市场细分和特殊调度手段设计具有参考意义。例如，在通勤出行者高峰时段可调整车型、开设高峰快线，对出行规模明显的群体推行需求导向型的定制公交服务；对老年出行者或学生出行者开设专线或包车，从而能够照顾特殊群体，提高公交系统服务质量。

综上，基于深度学习和乘客行为模式识别的短期客流预测方法首先在考虑出行时间、天气状况、工作日性质和高峰与非高峰出行共4种公交客流外部影响因素的基础上，引入了公交刷卡类型、乘客对公交线路的依赖度和乘客出行行为共3种影响公交客流内部因素，利用聚类划分乘客类型，进而构造适于深度学习卷积运算的客流细分矩阵，分析了内部因素对预测误差的影响，并与传统的KNN、SVR和LR模型进行对比。与传统预测模型相比，本发明方法考虑公交客流内部因素可以提高预测精度，同时考虑外部因素和内部因素的深度学习模型的预测精确度较高。在考虑公交客流内部因素输入方案的模型中，通过调整输出层神经元个数与客流成分类别数一致，并通过重新训练可以实现公交客流组成成分的预测，这对分析公交客流结构预测和灵活型公交、大站快车等特殊调度手段的设计具有参考价值。

以上所述，仅为本发明专利较佳的实施例，但本发明专利的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明专利所公开的范围内，根据本发明专利的技术方案及其发明专利构思加以等同替换或改变，都属于本发明专利的保护范围。

Claims

1.一种基于深度学习和乘客行为模式的短期公交客流预测方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的一种基于深度学习和乘客行为模式的短期公交客流预测方法，其特征在于：所述公交卡刷卡类型能够通过原始刷卡数据获取，通过原始刷卡数据对公交卡刷卡类型进行分类。

3.根据权利要求1所述的一种基于深度学习和乘客行为模式的短期公交客流预测方法，其特征在于：所述乘客对公交线路依赖度通过统计乘客的周平均乘车次数和周乘车标准差，将乘客对公交线路依赖度进行分类。

4.根据权利要求1所述的一种基于深度学习和乘客行为模式的短期公交客流预测方法，其特征在于：所述乘客出行行为模式通过统计乘客刷卡类型和刷卡时间，将乘客出行行为模式进行分类。

5.根据权利要求1所述的一种基于深度学习和乘客行为模式的短期公交客流预测方法，其特征在于：所述深度学习模型为DNN、LSTM、CNN或ConvLSTM。

6.根据权利要求1所述的一种基于深度学习和乘客行为模式的短期公交客流预测方法，其特征在于：所述深度学习模型中每一输入样本x_t为包括历史客流、外部因素和内部因素这三大特征的列向量，在卷积神经网络模型中，以每小时的客流量为划分依据，将输入样本细分小时客流x_t重新构造为细分小时客流矩阵X_t，如下式所示：

7.根据权利要求1所述的一种基于深度学习和乘客行为模式的短期公交客流预测方法，其特征在于：通过改变深度学习模型中网络输出层的结构，能够对公交客流的组成成分进行预测，对于公交客流总量的预测模型，其输出层神经元个数为1；为了得到各类客流成分的预测结果，需要调整输出层神经元个数与客流成分类别数一致，重新进行训练实现。