CN116050673A

CN116050673A - 基于CNN-BiLSTM的城市公交客流短时预测方法

Info

Publication number: CN116050673A
Application number: CN202310333060.4A
Authority: CN
Inventors: 吴超华; 奇兴族
Original assignee: Beijing Shenyan Smart Transportation Technology Co ltd; Shenzhen Urban Transport Planning Center Co Ltd
Current assignee: Beijing Shenyan Smart Transportation Technology Co ltd; Shenzhen Urban Transport Planning Center Co Ltd
Priority date: 2023-03-31
Filing date: 2023-03-31
Publication date: 2023-05-02
Anticipated expiration: 2043-03-31
Also published as: CN116050673B

Abstract

本发明提出基于CNN‑BiLSTM的城市公交客流短时预测方法，属于客流预测技术领域。包括：S1.分析影响公交客流出行的原因，构建影响公交客流出行的内部特征和外部特征；S2.根据影响公交客流出行的内部特征和外部特征构建客流特征矩阵；S3.对特征矩阵的排列结构进行耦合寻优，量化客流特征矩阵的内部特征和外部特征的耦合关系，选择最优排列结构的客流特征矩阵；S4.构建CNN‑BiLSTM公交客流预测模型；S5.将目标公交线路客流特征矩阵输入至训练后的CNN‑BiLSTM公交客流预测模型，输出目标公交线路的客流量；解决缺乏充分考虑公交客流的时空关联性、影响因素分析不够全面和特征矩阵排列方式并非最优的问题。

Description

基于CNN-BiLSTM的城市公交客流短时预测方法

技术领域

本申请涉及一种客流预测方法，尤其涉及基于CNN-BiLSTM的城市公交客流短时预测方法，属于客流预测技术领域。

背景技术

城市公交客流预测是优化城市公共交通资源的重要手段，准确的预测城市公交客流对于制定科学合理的线网方案、站点规划具有重要意义。目前，国内外针对城市公交客流预测领域研究成果较少，客流预测方法大多采用机器学习及统计学方法。传统机器学习主要通过单一历史客流进行分析，如卡尔曼滤波模型、经验模态分解及自适应增强等模型，此类模型难以很好地反映出不规律的公交客流状态。为了进一步挖掘影响客流的深层特征，近年来深度学习在公交客流短时预测方面取得了研究进展，深度学习模型通过对多维数据特征结构建立联系，挖掘出数据之间的复杂特征，并通过大量学习弥补了传统预测模型对特征值掌握不足的问题，提高了预测精度。

目前，针对城市公交客流预测模型存在以下缺点：

1、缺乏充分考虑公交客流的时空关联性；公交出行存在较强的时空关联性，难以基于单一模型进行预测，传统机器学习模型缺乏高维度非线性特征的识别分析能力，仅从单一的时间或空间维度进行预测，难以较好地反映出不规律的公交客流状态；

2、影响因素分析不够全面；公交客流预测受公交站点距离、天气情况、公交线路直线系数、乘客出行目的等多种影响因素，特别是受天气、节假日等因素影响时，传统机器学习及深度模型对特征值掌握不足将难以准确的预测公交客流，特别是当客流波动幅度较大的情况下，模型的抗干扰能力较差；

3、特征矩阵排列方式并非最优；深度学习模型的输入为特征矩阵，公交客流特征矩阵的结构对客流预测效果具有较大的影响，当前深度学习模型缺乏对特征矩阵结构进行高效优化，仍未挖掘出深度学习对公交客流预测的潜力。

发明内容

在下文中给出了关于本发明的简要概述，以便提供关于本发明的某些方面的基本理解。应当理解，这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分，也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念，以此作为稍后论述的更详细描述的前序。

鉴于此，为解决现有技术中存在的技术问题，本发明提供基于CNN-BiLSTM的城市公交客流短时预测方法。

方案一、基于CNN-BiLSTM的城市公交客流短时预测方法，包括以下步骤：

S1.分析影响公交客流出行的原因，构建影响公交客流出行的内部特征和外部特征；

S2.根据影响公交客流出行的内部特征和外部特征构建客流特征矩阵x(x₁,x₂,x₃,x₄，x₅，x₆,x₇,x₈），其中，x₁为天气状况,x₂为高峰/非高峰时期,x₃为节假日/工作日,x₄为站点周边吸引度，x₅为历史客流，x₆为刷卡时间,x₇为乘客刷卡类型,x₈为乘客依赖度；

S3.对特征矩阵的排列结构进行耦合寻优，量化客流特征矩阵的内部特征和外部特征之间的耦合关系，选择最优排列结构的客流特征矩阵；

S4.构建CNN-BiLSTM公交客流预测模型；

S5.将目标公交线路客流特征矩阵输入至训练后的CNN-BiLSTM公交客流预测模型，输出目标公交线路的客流量，完成短时公交客流预测。

优选的，S1具体是包括以下步骤：

S11.内部特征包括：乘客刷卡数据、历史客流、刷卡时间和乘客依赖度，构建方法如下：

刷卡数据分类为普通卡、老人卡和二维码；

历史客流，通过乘客刷卡数据分析目标公交线路的历史客流，构建历史客流特征向量；

刷卡时间，通过乘客刷卡数据分析目标公交线路乘客的刷卡时间，构建刷卡时间特征向量；

乘客依赖度，将乘客一周内乘车次数及一周内连续乘坐同一公交线路的天数作为评价指标，计算指标之间的支持度、置信度和提升度，将乘客对公交出行的依赖程度聚类为低、中、高3种程度；

支持度通过计算乘客一周内的乘车次数及一周内连续乘坐同一公交线路的比例，其计算公式为：

；

其中，support(A,B)表示A，B之间的支持度，count(A,B)表示同时包含特征A和B的次数；A表示乘客一周内的乘车次数，B表示乘客一周内连续乘坐同一公交线路的次数；

置信度是指在所有包含特征A的集合中，同时包含特征B的比例，其计算公式为：

；

其中，表示特征A与特征B的置信度，support(A)表示包含特征A的支持度；

提升度是指特征A的出现对特征B的出现概率提升的程度，其计算公式为：

；

其中，lift(A→B)表示特征A与特征B的提升度，confidence(A→B)表示特征A与特征B的置信度，support(B)表示特征B的支持度；提升度大于1表示特征A的出现对特征B的出现是正向作用，小于1表示负向作用，等于1表示特征A和特征B之间没有关联；

S12.外部特征包括：高峰/非高峰时期、天气情况、节假日及工作日和公交站点吸引度，构建方法如下；

高峰/非高峰时期，将城市交通出行的高峰时期定义为7:00-9:00和17:00-19:00，非高峰时期为6:00-7:00、9:00-17:00、17:00-24:00；将客流在高峰时期出行的特征值定义为1，非高峰时段出行的特征值定义为0；

天气情况，将降水量小于10mm特征值定义为1、降雨量在10-25mm特征值定义为2、降雨量在25-50mm特征值定义为3、降雨量大于50mm特征值定义为4；

节假日及工作日，将工作日特征值定义为1，节假日特征值定义为2；

公交站点吸引度，选取站点周边500米范围内居住设施、商业设施、教育设施及休闲场所的POI数据作为公交线路站点的吸引度。

优选的，S3具体是：包括以下步骤：

S31.通过对客流特征矩阵进行卷积操作提取出每个矩阵点的特征值进行预测；

S32.通过互信息量MI度量特征向量之间的相关性，筛选相关性最强的特征矩阵作为最优结构，作为模型预测阶段的特征矩阵排列结构，MI的计算方式如下所示：

；

式中，p(x,y)为X和Y的联合概率密度函数，I(X,Y)为互信息量，X,Y分别为特征矩阵x(x₁,x₂,x₃,x₄，x₅，x₆,x₇,x₈）中的特征向量。

优选的，S4具体是，CNN-BiLSTM公交客流预测模型包括输入层、CNN层、BiLSTM层、全连接层和输出层；

其中，输入层为输入特征矩阵，CNN层是由卷积层及最大池化层堆叠组成，将公交客流特征矩阵经过归一化处理输入至卷积层，经过卷积操作后保持特征矩阵的长度和宽度不变，得到新的特征矩阵，卷积层计算公式如下：

；

式中，表示卷积网络第i层特征矩阵，表示激活函数，表示卷积运算，表示第i层使用的卷积核的权重值，表示偏置项；

激活函数选用Relu函数，计算公式如下：

Relu=max(0,x)

式中，x表示输入的特征矩阵；

最大池化层，计算公式如下：

；

式中，h表示输入特征矩阵的长度，ｗ表示输入特征矩阵的宽度，表示池化后输出特征矩阵的长度，表示卷积后输出特征矩阵的宽度，卷积核大小为k,步长为s；

BiLSTM层由前向LSTM与后向LSTM组成，BiLSTM层输入为CNN层的输出数据，进入前向LSTM和后向LSTM，分别将正向输入序列和反向输入序列的输出结果相结合，得到最终的输出结果，计算公式如下：

；

式中，表示前向隐向量，表示后向隐向量，xt表示当前t时刻输入特征向量，表示t时刻输出向量，σ表示激活函数，表示前向权重矩阵，表示前向时间步，表示后向权重矩阵，表示后向时间步，表示偏置向量；

全连接层将输出的特征值按照权重进行加权重组，最后输出预测值，计算公式如下：

；

式中，表示预测值，表示BiLSTM模型的输出向量，表示权重矩阵，表示偏置矩阵。

方案二、一种电子设备，包括存储器和处理器，存储器存储有计算机程序，所述的处理器执行所述计算机程序时实现方案一所述的基于CNN-BiLSTM的城市公交客流短时预测方法的步骤。

方案三、一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现方案一所述的基于CNN-BiLSTM的城市公交客流短时预测方法。

本发明的有益效果如下：

1、本发明考虑了影响城市公交客流的时空关联性，分别分析了影响公交客流出行的时间特征及外部特征，能够较好地反映出不规律的公交客流状态；

2、本发明通过多源数据分析，引入了公交站点吸引度、节假日、天气情况等外部因素，同时引入了公交乘客依赖度、乘客刷卡类型等内部因素，构建了较为全面的多维公交客流出行特征矩阵，并基于CNN-BiLSTM的深度学习模型有效的应对复杂的时空特征矩阵，捕捉特征向量之间的信息，提高了公交客流的预测精度。

3、本发明通过优化公交客流特征矩阵，互信息量（MI）来度量特征向量之间的相关性，优化特征矩阵结构，通过改变特征矩阵结构的排列方式，对基于CNN-BiLSTM的深度学习的特征矩阵进行寻优，建立最优特征矩阵结构，进一步提高公交客流预测效果。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为基于CNN-BiLSTM的城市公交客流短时预测方法流程示意图；

图2为乘客依赖度分类结果示意图；

图3为公交客流预测模型结构示意图。

具体实施方式

为了使本申请实施例中的技术方案及优点更加清楚明白，以下结合附图对本申请的示例性实施例进行进一步详细的说明，显然，所描述的实施例仅是本申请的一部分实施例，而不是所有实施例的穷举。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

实施例1、参照图1-图3说明本实施方式，基于CNN-BiLSTM的城市公交客流短时预测方法，包括以下步骤：

不同公交客流的刷卡类型有着不同的出行特征，因此，通过分析公交刷卡数据将刷卡数据分类为普通卡、老人卡和二维码；

乘客依赖度，城市地面公交系统存在客流空间分布不均匀以及公交线网运力配置失衡等问题，因此乘客出行的线路选择性较多。而在重复系数较高的公交线路中仍存在较多的乘客固定选择某条线路，主要体现在日常通勤、上下学的情况。将这类特征定义为乘客对公交的依赖度，将乘客一周内乘车次数及一周内连续乘坐同一公交线路的天数作为评价指标，反应乘客对线路的依赖程度，并通过Apriori算法对两个维度特征进行关联分析。关联分析的过程是分别计算指标之间的支持度、置信度和提升度，并聚类为3类结果。

；

图2所示一周内公交乘客刷卡数据的关联分析结果，乘客对公交关联依赖度可分为3类，即将乘客对公交出行的依赖水平分为低、中、高3类。

因此，将乘客一周内乘车次数及一周内连续乘坐同一公交线路的天数作为评价指标，计算指标之间的支持度、置信度和提升度，将乘客对公交出行的依赖程度聚类为低、中、高3种程度；

天气情况，天气情况由降雨量等级反映，降雨量特征值分为4类，将降水量小于10mm特征值定义为1、降雨量在10~25mm特征值定义为2、降雨量在25~50mm特征值定义为3、降雨量大于50mm特征值定义为4；

公交站点吸引度，公交站点周围的公共设施对公交客流出行产生着一定的吸引作用，如住宅、商业区、办公楼等，选取站点周边500米范围内居住设施、商业设施、教育设施及休闲场所的POI数据作为公交线路站点的吸引度；

通过互信息量MI度量特征向量之间的相关性，筛选相关性最强的特征矩阵作为最优结构，作为模型预测阶段的特征矩阵排列结构，MI的计算方式如下所示：

；

S4.构建CNN-BiLSTM公交客流预测模型；

CNN-BiLSTM公交客流预测模型包括输入层、CNN层、BiLSTM层、全连接层和输出层；

；

激活函数选用Relu函数，可降低计算的复杂度，提高运算速度，可解决梯度消失问题，计算公式如下：

Relu=max(0,x)；

式中，x为输入的特征矩阵；

最大池化层用于降低采样池，减小数据空间的大小，在一定程度上控制过拟合，计算公式如下：

；

BiLSTM层是由前向LSTM（Long Short-Term Memory）与后向LSTM组合而成，通过对数据进行双向训练，既保留了LSTM能够处理长时间序列的特点，又考虑到前后数据之间的相互影响；输入层为CNN层的输出数据，进入前向LSTM和后向LSTM，分别将正向输入序列和反向输入序列的输出结果相结合，得到最终的输出结果，计算公式如下：

；

全连接层是将输出的特征值按照权重进行加权重组,最后输出预测值，计算公式如下：

；

具体的，本发明输出目标公交线路的客流量结果在10min-15min内的准确度最优。

CNN-BiLSTM公交客流预测模型预测过程为：

将CNN层kernel size设为2，激活函数为Relu，BiLSTM的隐藏状态向量维度设置为200，为防止过拟合，Dropout rate参数设置为0.1。模型的优化器使用Adam优化器，迭代次数为50次，批处理数量设为64，学习率设为0.001。在本实施例中，为验证CNN-BiLSTM模型的有效性，选取CNN、LSTM、CNN-LSTM作为对比模型，其中，设置预测结果的均方根误差（RootMean Square Error）、平均绝对误差（Mean Absolute Error）及平均绝对百分比误差（MeanAbsolute Percentage Error）作为准确率的评价指标；具体公式如下：

；

其中，y_i和分别为第i时刻的交通流观测值和预测值，n为公交客流的样本量，MAE、RMSE、MAPE越小，误差越小，预测效果越好。各模型的预测性能指标及预测结果如表1所示。

表1：不同模型预测结果比较

模型	MAE	RMSE	MAPE(%)
				CNN	10.29	12.65	21.35
LSTM	8.87	9.73	18.94
				CNN-LSTM	5.12	6.43	12.48
CNN-BiLSTM	3.98	5.87	11.91

由预测结果可知，深度学习模型CNN、LSTM预测精度均低于CNN-LSTM，这是由于CNN-LSTM结合了CNN提取局部特征的优势以及LSTM在捕捉上下文数据特征的优势，预测精度得以提高。由CNN-BiLSTM与CNN-LSTM算法结果对比可知：本发明提出的CNN-BiLSTM模型的RMSE、MAE、MAPE值均低于CNN-LSTM算法，表明本发明例提出的公交客流特征矩阵能够较好的反应公交客流出行情况，同时，特征矩阵通过耦合寻优确定了最佳矩阵结构，进一步提升了CNN-BiLSTM模型的预测能力。

本发明提出的CNN-BiLSTM公交客流短时预测方法，通过挖掘公交客流出行特征，并引入站点吸引度、乘客依赖度等多维影响因素，充分挖掘公交客流各个维度时空关联的基础上，能够有效提高CNN-BiLSTM的预测效果。模型预测的平均绝对百分比误差可降至3.98%，均方根误差为5.87,短时公交客流预测精度可达96%，预测结果可为城市公交客流分析以及公交线网优化等运营决策提供科学指导。

实施例2、本发明的计算机装置可以是包括有处理器以及存储器等装置，例如包含中央处理器的单片机等。并且，处理器用于执行存储器中存储的计算机程序时实现上述的一种通用化的神经网络前向训练方法的步骤。

所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列 (Field-Programmable Gate Array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如声音播放功能、图像播放功能等）等；存储数据区可存储根据手机的使用所创建的数据（比如音频数据、电话本等）等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡（Smart Media Card, SMC），安全数字（Secure Digital, SD）卡，闪存卡（Flash Card）、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

实施例3、计算机可读存储介质实施例

本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质，包括但不限于非易失性存储器、易失性存储器、铁电存储器等，计算机可读存储介质上存储有计算机程序，当计算机装置的处理器读取并执行存储器中所存储的计算机程序时，可以实现上述的一种通用化的神经网络前向训练方法的步骤。

所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

尽管根据有限数量的实施例描述了本发明，但是受益于上面的描述，本技术领域内的技术人员明白，在由此描述的本发明的范围内，可以设想其它实施例。此外，应当注意，本说明书中使用的语言主要是为了可读性和教导的目的而选择的，而不是为了解释或者限定本发明的主题而选择的。因此，在不偏离所附权利要求书的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围，对本发明所做的公开是说明性的，而非限制性的，本发明的范围由所附权利要求书限定。

Claims

1.基于CNN-BiLSTM的城市公交客流短时预测方法，其特征在于，包括以下步骤：

S4.构建CNN-BiLSTM公交客流预测模型；

2.根据权利要求1所述基于CNN-BiLSTM的城市公交客流短时预测方法，其特征在于，S1具体是包括以下步骤：

刷卡数据分类为普通卡、老人卡和二维码；

；

3.根据权利要求2所述基于CNN-BiLSTM的城市公交客流短时预测方法，其特征在于，S3具体是：通过互信息量MI度量特征向量之间的相关性，筛选相关性最强的特征矩阵作为最优结构，作为模型预测阶段的特征矩阵排列结构，MI的计算方式如下所示：

；

4.根据权利要求3所述基于CNN-BiLSTM的城市公交客流短时预测方法，其特征在于，S4具体是，CNN-BiLSTM公交客流预测模型包括输入层、CNN层、BiLSTM层、全连接层和输出层；

；

激活函数选用Relu函数，计算公式如下：

Relu=max(0,x)

式中，x表示输入的特征矩阵；

最大池化层，计算公式如下：

；

式中，表示预测值，表示BiLSTM模型的输出向量，WE_i为权重矩阵，bm_i为偏置矩阵。

5.一种电子设备，其特征在于，包括存储器和处理器，存储器存储有计算机程序，所述的处理器执行所述计算机程序时实现权利要求1-4任一项所述的基于CNN-BiLSTM的城市公交客流短时预测方法的步骤。

6.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-4任一项所述的基于CNN-BiLSTM的城市公交客流短时预测方法。