CN116050673A - 基于CNN-BiLSTM的城市公交客流短时预测方法 - Google Patents
基于CNN-BiLSTM的城市公交客流短时预测方法 Download PDFInfo
- Publication number
- CN116050673A CN116050673A CN202310333060.4A CN202310333060A CN116050673A CN 116050673 A CN116050673 A CN 116050673A CN 202310333060 A CN202310333060 A CN 202310333060A CN 116050673 A CN116050673 A CN 116050673A
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- feature
- bus
- bilstm
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 239000011159 matrix material Substances 0.000 claims abstract description 91
- 230000008878 coupling Effects 0.000 claims abstract description 9
- 238000010168 coupling process Methods 0.000 claims abstract description 9
- 238000005859 coupling reaction Methods 0.000 claims abstract description 9
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 33
- 238000004364 calculation method Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 16
- 230000015654 memory Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 230000006872 improvement Effects 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 3
- 238000005215 recombination Methods 0.000 claims description 3
- 230000006798 recombination Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 4
- 238000013527 convolutional neural network Methods 0.000 description 11
- 230000008901 benefit Effects 0.000 description 5
- 238000013136 deep learning model Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000001788 irregular Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000012098 association analyses Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Computational Linguistics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出基于CNN‑BiLSTM的城市公交客流短时预测方法,属于客流预测技术领域。包括:S1.分析影响公交客流出行的原因,构建影响公交客流出行的内部特征和外部特征;S2.根据影响公交客流出行的内部特征和外部特征构建客流特征矩阵;S3.对特征矩阵的排列结构进行耦合寻优,量化客流特征矩阵的内部特征和外部特征的耦合关系,选择最优排列结构的客流特征矩阵;S4.构建CNN‑BiLSTM公交客流预测模型;S5.将目标公交线路客流特征矩阵输入至训练后的CNN‑BiLSTM公交客流预测模型,输出目标公交线路的客流量;解决缺乏充分考虑公交客流的时空关联性、影响因素分析不够全面和特征矩阵排列方式并非最优的问题。
Description
技术领域
本申请涉及一种客流预测方法,尤其涉及基于CNN-BiLSTM的城市公交客流短时预测方法,属于客流预测技术领域。
背景技术
城市公交客流预测是优化城市公共交通资源的重要手段,准确的预测城市公交客流对于制定科学合理的线网方案、站点规划具有重要意义。目前,国内外针对城市公交客流预测领域研究成果较少,客流预测方法大多采用机器学习及统计学方法。传统机器学习主要通过单一历史客流进行分析,如卡尔曼滤波模型、经验模态分解及自适应增强等模型,此类模型难以很好地反映出不规律的公交客流状态。为了进一步挖掘影响客流的深层特征,近年来深度学习在公交客流短时预测方面取得了研究进展,深度学习模型通过对多维数据特征结构建立联系,挖掘出数据之间的复杂特征,并通过大量学习弥补了传统预测模型对特征值掌握不足的问题,提高了预测精度。
目前,针对城市公交客流预测模型存在以下缺点:
1、缺乏充分考虑公交客流的时空关联性;公交出行存在较强的时空关联性,难以基于单一模型进行预测,传统机器学习模型缺乏高维度非线性特征的识别分析能力,仅从单一的时间或空间维度进行预测,难以较好地反映出不规律的公交客流状态;
2、影响因素分析不够全面;公交客流预测受公交站点距离、天气情况、公交线路直线系数、乘客出行目的等多种影响因素,特别是受天气、节假日等因素影响时,传统机器学习及深度模型对特征值掌握不足将难以准确的预测公交客流,特别是当客流波动幅度较大的情况下,模型的抗干扰能力较差;
3、特征矩阵排列方式并非最优;深度学习模型的输入为特征矩阵,公交客流特征矩阵的结构对客流预测效果具有较大的影响,当前深度学习模型缺乏对特征矩阵结构进行高效优化,仍未挖掘出深度学习对公交客流预测的潜力。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于此,为解决现有技术中存在的技术问题,本发明提供基于CNN-BiLSTM的城市公交客流短时预测方法。
方案一、基于CNN-BiLSTM的城市公交客流短时预测方法,包括以下步骤:
S1.分析影响公交客流出行的原因,构建影响公交客流出行的内部特征和外部特征;
S2.根据影响公交客流出行的内部特征和外部特征构建客流特征矩阵x(x1,x2,x3,x4,x5,x6,x7,x8),其中,x1为天气状况,x2为高峰/非高峰时期,x3为节假日/工作日,x4为站点周边吸引度,x5为历史客流,x6为刷卡时间,x7为乘客刷卡类型,x8为乘客依赖度;
S3.对特征矩阵的排列结构进行耦合寻优,量化客流特征矩阵的内部特征和外部特征之间的耦合关系,选择最优排列结构的客流特征矩阵;
S4.构建CNN-BiLSTM公交客流预测模型;
S5.将目标公交线路客流特征矩阵输入至训练后的CNN-BiLSTM公交客流预测模型,输出目标公交线路的客流量,完成短时公交客流预测。
优选的,S1具体是包括以下步骤:
S11.内部特征包括:乘客刷卡数据、历史客流、刷卡时间和乘客依赖度,构建方法如下:
刷卡数据分类为普通卡、老人卡和二维码;
历史客流,通过乘客刷卡数据分析目标公交线路的历史客流,构建历史客流特征向量;
刷卡时间,通过乘客刷卡数据分析目标公交线路乘客的刷卡时间,构建刷卡时间特征向量;
乘客依赖度,将乘客一周内乘车次数及一周内连续乘坐同一公交线路的天数作为评价指标,计算指标之间的支持度、置信度和提升度,将乘客对公交出行的依赖程度聚类为低、中、高3种程度;
支持度通过计算乘客一周内的乘车次数及一周内连续乘坐同一公交线路的比例,其计算公式为:
;
其中,support(A,B)表示A,B之间的支持度,count(A,B)表示同时包含特征A和B的次数;A表示乘客一周内的乘车次数,B表示乘客一周内连续乘坐同一公交线路的次数;
置信度是指在所有包含特征A的集合中,同时包含特征B的比例,其计算公式为:
;
其中,表示特征A与特征B的置信度,support(A)表示包含特征A的支持度;
提升度是指特征A的出现对特征B的出现概率提升的程度,其计算公式为:
;
其中,lift(A→B)表示特征A与特征B的提升度,confidence(A→B)表示特征A与特征B的置信度,support(B)表示特征B的支持度;提升度大于1表示特征A的出现对特征B的出现是正向作用,小于1表示负向作用,等于1表示特征A和特征B之间没有关联;
S12.外部特征包括:高峰/非高峰时期、天气情况、节假日及工作日和公交站点吸引度,构建方法如下;
高峰/非高峰时期,将城市交通出行的高峰时期定义为7:00-9:00和17:00-19:00,非高峰时期为6:00-7:00、9:00-17:00、17:00-24:00;将客流在高峰时期出行的特征值定义为1,非高峰时段出行的特征值定义为0;
天气情况,将降水量小于10mm特征值定义为1、降雨量在10-25mm特征值定义为2、降雨量在25-50mm特征值定义为3、降雨量大于50mm特征值定义为4;
节假日及工作日,将工作日特征值定义为1,节假日特征值定义为2;
公交站点吸引度,选取站点周边500米范围内居住设施、商业设施、教育设施及休闲场所的POI数据作为公交线路站点的吸引度。
优选的,S3具体是:包括以下步骤:
S31.通过对客流特征矩阵进行卷积操作提取出每个矩阵点的特征值进行预测;
S32.通过互信息量MI度量特征向量之间的相关性,筛选相关性最强的特征矩阵作为最优结构,作为模型预测阶段的特征矩阵排列结构,MI的计算方式如下所示:
;
式中,p(x,y)为X和Y的联合概率密度函数,I(X,Y)为互信息量,X,Y分别为特征矩阵x(x1,x2,x3,x4,x5,x6,x7,x8)中的特征向量。
优选的,S4具体是,CNN-BiLSTM公交客流预测模型包括输入层、CNN层、BiLSTM层、全连接层和输出层;
其中,输入层为输入特征矩阵,CNN层是由卷积层及最大池化层堆叠组成,将公交客流特征矩阵经过归一化处理输入至卷积层,经过卷积操作后保持特征矩阵的长度和宽度不变,得到新的特征矩阵,卷积层计算公式如下:
;
式中,表示卷积网络第i层特征矩阵,表示激活函数,表示卷积运算,表示第i层使用的卷积核的权重值,表示偏置项;
激活函数选用Relu函数,计算公式如下:
Relu=max(0,x)
式中,x表示输入的特征矩阵;
最大池化层,计算公式如下:
;
;
式中,h表示输入特征矩阵的长度,w表示输入特征矩阵的宽度,表示池化后输出特征矩阵的长度,表示卷积后输出特征矩阵的宽度,卷积核大小为k,步长为s;
BiLSTM层由前向LSTM与后向LSTM组成,BiLSTM层输入为CNN层的输出数据,进入前向LSTM和后向LSTM,分别将正向输入序列和反向输入序列的输出结果相结合,得到最终的输出结果,计算公式如下:
;
;
;
式中,表示前向隐向量,表示后向隐向量,xt表示当前t时刻输入特征向量,表示t时刻输出向量,σ表示激活函数,表示前向权重矩阵,表示前向时间步,表示后向权重矩阵,表示后向时间步,表示偏置向量;
全连接层将输出的特征值按照权重进行加权重组,最后输出预测值,计算公式如下:
;
式中,表示预测值,表示BiLSTM模型的输出向量,表示权重矩阵,表示偏置矩阵。
方案二、一种电子设备,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现方案一所述的基于CNN-BiLSTM的城市公交客流短时预测方法的步骤。
方案三、一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现方案一所述的基于CNN-BiLSTM的城市公交客流短时预测方法。
本发明的有益效果如下:
1、本发明考虑了影响城市公交客流的时空关联性,分别分析了影响公交客流出行的时间特征及外部特征,能够较好地反映出不规律的公交客流状态;
2、本发明通过多源数据分析,引入了公交站点吸引度、节假日、天气情况等外部因素,同时引入了公交乘客依赖度、乘客刷卡类型等内部因素,构建了较为全面的多维公交客流出行特征矩阵,并基于CNN-BiLSTM的深度学习模型有效的应对复杂的时空特征矩阵,捕捉特征向量之间的信息,提高了公交客流的预测精度。
3、本发明通过优化公交客流特征矩阵,互信息量(MI)来度量特征向量之间的相关性,优化特征矩阵结构,通过改变特征矩阵结构的排列方式,对基于CNN-BiLSTM的深度学习的特征矩阵进行寻优,建立最优特征矩阵结构,进一步提高公交客流预测效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为基于CNN-BiLSTM的城市公交客流短时预测方法流程示意图;
图2为乘客依赖度分类结果示意图;
图3为公交客流预测模型结构示意图。
具体实施方式
为了使本申请实施例中的技术方案及优点更加清楚明白,以下结合附图对本申请的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本申请的一部分实施例,而不是所有实施例的穷举。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例1、参照图1-图3说明本实施方式,基于CNN-BiLSTM的城市公交客流短时预测方法,包括以下步骤:
S1.分析影响公交客流出行的原因,构建影响公交客流出行的内部特征和外部特征;
S11.内部特征包括:乘客刷卡数据、历史客流、刷卡时间和乘客依赖度,构建方法如下:
不同公交客流的刷卡类型有着不同的出行特征,因此,通过分析公交刷卡数据将刷卡数据分类为普通卡、老人卡和二维码;
历史客流,通过乘客刷卡数据分析目标公交线路的历史客流,构建历史客流特征向量;
刷卡时间,通过乘客刷卡数据分析目标公交线路乘客的刷卡时间,构建刷卡时间特征向量;
乘客依赖度,城市地面公交系统存在客流空间分布不均匀以及公交线网运力配置失衡等问题,因此乘客出行的线路选择性较多。而在重复系数较高的公交线路中仍存在较多的乘客固定选择某条线路,主要体现在日常通勤、上下学的情况。将这类特征定义为乘客对公交的依赖度,将乘客一周内乘车次数及一周内连续乘坐同一公交线路的天数作为评价指标,反应乘客对线路的依赖程度,并通过Apriori算法对两个维度特征进行关联分析。关联分析的过程是分别计算指标之间的支持度、置信度和提升度,并聚类为3类结果。
支持度通过计算乘客一周内的乘车次数及一周内连续乘坐同一公交线路的比例,其计算公式为:
;
其中,support(A,B)表示A,B之间的支持度,count(A,B)表示同时包含特征A和B的次数;A表示乘客一周内的乘车次数,B表示乘客一周内连续乘坐同一公交线路的次数;
置信度是指在所有包含特征A的集合中,同时包含特征B的比例,其计算公式为:
其中,表示特征A与特征B的置信度,support(A)表示包含特征A的支持度;
提升度是指特征A的出现对特征B的出现概率提升的程度,其计算公式为:
;
其中,lift(A→B)表示特征A与特征B的提升度,confidence(A→B)表示特征A与特征B的置信度,support(B)表示特征B的支持度;提升度大于1表示特征A的出现对特征B的出现是正向作用,小于1表示负向作用,等于1表示特征A和特征B之间没有关联;
图2所示一周内公交乘客刷卡数据的关联分析结果,乘客对公交关联依赖度可分为3类,即将乘客对公交出行的依赖水平分为低、中、高3类。
因此,将乘客一周内乘车次数及一周内连续乘坐同一公交线路的天数作为评价指标,计算指标之间的支持度、置信度和提升度,将乘客对公交出行的依赖程度聚类为低、中、高3种程度;
S12.外部特征包括:高峰/非高峰时期、天气情况、节假日及工作日和公交站点吸引度,构建方法如下;
高峰/非高峰时期,将城市交通出行的高峰时期定义为7:00-9:00和17:00-19:00,非高峰时期为6:00-7:00、9:00-17:00、17:00-24:00;将客流在高峰时期出行的特征值定义为1,非高峰时段出行的特征值定义为0;
天气情况,天气情况由降雨量等级反映,降雨量特征值分为4类,将降水量小于10mm特征值定义为1、降雨量在10~25mm特征值定义为2、降雨量在25~50mm特征值定义为3、降雨量大于50mm特征值定义为4;
节假日及工作日,将工作日特征值定义为1,节假日特征值定义为2;
公交站点吸引度,公交站点周围的公共设施对公交客流出行产生着一定的吸引作用,如住宅、商业区、办公楼等,选取站点周边500米范围内居住设施、商业设施、教育设施及休闲场所的POI数据作为公交线路站点的吸引度;
S2.根据影响公交客流出行的内部特征和外部特征构建客流特征矩阵x(x1,x2,x3,x4,x5,x6,x7,x8),其中,x1为天气状况,x2为高峰/非高峰时期,x3为节假日/工作日,x4为站点周边吸引度,x5为历史客流,x6为刷卡时间,x7为乘客刷卡类型,x8为乘客依赖度;
S3.对特征矩阵的排列结构进行耦合寻优,量化客流特征矩阵的内部特征和外部特征之间的耦合关系,选择最优排列结构的客流特征矩阵;
通过互信息量MI度量特征向量之间的相关性,筛选相关性最强的特征矩阵作为最优结构,作为模型预测阶段的特征矩阵排列结构,MI的计算方式如下所示:
;
式中,p(x,y)为X和Y的联合概率密度函数,I(X,Y)为互信息量,X,Y分别为特征矩阵x(x1,x2,x3,x4,x5,x6,x7,x8)中的特征向量。
S4.构建CNN-BiLSTM公交客流预测模型;
CNN-BiLSTM公交客流预测模型包括输入层、CNN层、BiLSTM层、全连接层和输出层;
其中,输入层为输入特征矩阵,CNN层是由卷积层及最大池化层堆叠组成,将公交客流特征矩阵经过归一化处理输入至卷积层,经过卷积操作后保持特征矩阵的长度和宽度不变,得到新的特征矩阵,卷积层计算公式如下:
;
式中,表示卷积网络第i层特征矩阵,表示激活函数,表示卷积运算,表示第i层使用的卷积核的权重值,表示偏置项;
激活函数选用Relu函数,可降低计算的复杂度,提高运算速度,可解决梯度消失问题,计算公式如下:
Relu=max(0,x);
式中,x为输入的特征矩阵;
最大池化层用于降低采样池,减小数据空间的大小,在一定程度上控制过拟合,计算公式如下:
;
;
式中,h表示输入特征矩阵的长度,w表示输入特征矩阵的宽度,表示池化后输出特征矩阵的长度,表示卷积后输出特征矩阵的宽度,卷积核大小为k,步长为s;
BiLSTM层是由前向LSTM(Long Short-Term Memory)与后向LSTM组合而成,通过对数据进行双向训练,既保留了LSTM能够处理长时间序列的特点,又考虑到前后数据之间的相互影响;输入层为CNN层的输出数据,进入前向LSTM和后向LSTM,分别将正向输入序列和反向输入序列的输出结果相结合,得到最终的输出结果,计算公式如下:
;
;
;
式中,表示前向隐向量,表示后向隐向量,xt表示当前t时刻输入特征向量,表示t时刻输出向量,σ表示激活函数,表示前向权重矩阵,表示前向时间步,表示后向权重矩阵,表示后向时间步,表示偏置向量;
全连接层是将输出的特征值按照权重进行加权重组,最后输出预测值,计算公式如下:
;
式中,表示预测值,表示BiLSTM模型的输出向量,表示权重矩阵,表示偏置矩阵。
S5.将目标公交线路客流特征矩阵输入至训练后的CNN-BiLSTM公交客流预测模型,输出目标公交线路的客流量,完成短时公交客流预测。
具体的,本发明输出目标公交线路的客流量结果在10min-15min内的准确度最优。
CNN-BiLSTM公交客流预测模型预测过程为:
将CNN层kernel size设为2,激活函数为Relu,BiLSTM的隐藏状态向量维度设置为200,为防止过拟合,Dropout rate参数设置为0.1。模型的优化器使用Adam优化器,迭代次数为50次,批处理数量设为64,学习率设为0.001。在本实施例中,为验证CNN-BiLSTM模型的有效性,选取CNN、LSTM、CNN-LSTM作为对比模型,其中,设置预测结果的均方根误差(RootMean Square Error)、平均绝对误差(Mean Absolute Error)及平均绝对百分比误差(MeanAbsolute Percentage Error)作为准确率的评价指标;具体公式如下:
;
;
;
其中,yi和分别为第i时刻的交通流观测值和预测值,n为公交客流的样本量,MAE、RMSE、MAPE越小,误差越小,预测效果越好。各模型的预测性能指标及预测结果如表1所示。
表1:不同模型预测结果比较
模型 | MAE | RMSE | MAPE(%) |
CNN | 10.29 | 12.65 | 21.35 |
LSTM | 8.87 | 9.73 | 18.94 |
CNN-LSTM | 5.12 | 6.43 | 12.48 |
CNN-BiLSTM | 3.98 | 5.87 | 11.91 |
由预测结果可知,深度学习模型CNN、LSTM预测精度均低于CNN-LSTM,这是由于CNN-LSTM结合了CNN提取局部特征的优势以及LSTM在捕捉上下文数据特征的优势,预测精度得以提高。由CNN-BiLSTM与CNN-LSTM算法结果对比可知:本发明提出的CNN-BiLSTM模型的RMSE、MAE、MAPE值均低于CNN-LSTM算法,表明本发明例提出的公交客流特征矩阵能够较好的反应公交客流出行情况,同时,特征矩阵通过耦合寻优确定了最佳矩阵结构,进一步提升了CNN-BiLSTM模型的预测能力。
本发明提出的CNN-BiLSTM公交客流短时预测方法,通过挖掘公交客流出行特征,并引入站点吸引度、乘客依赖度等多维影响因素,充分挖掘公交客流各个维度时空关联的基础上,能够有效提高CNN-BiLSTM的预测效果。模型预测的平均绝对百分比误差可降至3.98%,均方根误差为5.87,短时公交客流预测精度可达96%,预测结果可为城市公交客流分析以及公交线网优化等运营决策提供科学指导。
实施例2、本发明的计算机装置可以是包括有处理器以及存储器等装置,例如包含中央处理器的单片机等。并且,处理器用于执行存储器中存储的计算机程序时实现上述的一种通用化的神经网络前向训练方法的步骤。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
实施例3、计算机可读存储介质实施例
本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质,包括但不限于非易失性存储器、易失性存储器、铁电存储器等,计算机可读存储介质上存储有计算机程序,当计算机装置的处理器读取并执行存储器中所存储的计算机程序时,可以实现上述的一种通用化的神经网络前向训练方法的步骤。
所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
Claims (6)
1.基于CNN-BiLSTM的城市公交客流短时预测方法,其特征在于,包括以下步骤:
S1.分析影响公交客流出行的原因,构建影响公交客流出行的内部特征和外部特征;
S2.根据影响公交客流出行的内部特征和外部特征构建客流特征矩阵x(x1,x2,x3,x4,x5,x6,x7,x8),其中,x1为天气状况,x2为高峰/非高峰时期,x3为节假日/工作日,x4为站点周边吸引度,x5为历史客流,x6为刷卡时间,x7为乘客刷卡类型,x8为乘客依赖度;
S3.对特征矩阵的排列结构进行耦合寻优,量化客流特征矩阵的内部特征和外部特征之间的耦合关系,选择最优排列结构的客流特征矩阵;
S4.构建CNN-BiLSTM公交客流预测模型;
S5.将目标公交线路客流特征矩阵输入至训练后的CNN-BiLSTM公交客流预测模型,输出目标公交线路的客流量,完成短时公交客流预测。
2.根据权利要求1所述基于CNN-BiLSTM的城市公交客流短时预测方法,其特征在于,S1具体是包括以下步骤:
S11.内部特征包括:乘客刷卡数据、历史客流、刷卡时间和乘客依赖度,构建方法如下:
刷卡数据分类为普通卡、老人卡和二维码;
历史客流,通过乘客刷卡数据分析目标公交线路的历史客流,构建历史客流特征向量;
刷卡时间,通过乘客刷卡数据分析目标公交线路乘客的刷卡时间,构建刷卡时间特征向量;
乘客依赖度,将乘客一周内乘车次数及一周内连续乘坐同一公交线路的天数作为评价指标,计算指标之间的支持度、置信度和提升度,将乘客对公交出行的依赖程度聚类为低、中、高3种程度;
支持度通过计算乘客一周内的乘车次数及一周内连续乘坐同一公交线路的比例,其计算公式为:
;
其中,support(A,B)表示A,B之间的支持度,count(A,B)表示同时包含特征A和B的次数;A表示乘客一周内的乘车次数,B表示乘客一周内连续乘坐同一公交线路的次数;
置信度是指在所有包含特征A的集合中,同时包含特征B的比例,其计算公式为:
;
其中,表示特征A与特征B的置信度,support(A)表示包含特征A的支持度;
提升度是指特征A的出现对特征B的出现概率提升的程度,其计算公式为:
;
其中,lift(A→B)表示特征A与特征B的提升度,confidence(A→B)表示特征A与特征B的置信度,support(B)表示特征B的支持度;提升度大于1表示特征A的出现对特征B的出现是正向作用,小于1表示负向作用,等于1表示特征A和特征B之间没有关联;
S12.外部特征包括:高峰/非高峰时期、天气情况、节假日及工作日和公交站点吸引度,构建方法如下;
高峰/非高峰时期,将城市交通出行的高峰时期定义为7:00-9:00和17:00-19:00,非高峰时期为6:00-7:00、9:00-17:00、17:00-24:00;将客流在高峰时期出行的特征值定义为1,非高峰时段出行的特征值定义为0;
天气情况,将降水量小于10mm特征值定义为1、降雨量在10-25mm特征值定义为2、降雨量在25-50mm特征值定义为3、降雨量大于50mm特征值定义为4;
节假日及工作日,将工作日特征值定义为1,节假日特征值定义为2;
公交站点吸引度,选取站点周边500米范围内居住设施、商业设施、教育设施及休闲场所的POI数据作为公交线路站点的吸引度。
3.根据权利要求2所述基于CNN-BiLSTM的城市公交客流短时预测方法,其特征在于,S3具体是:通过互信息量MI度量特征向量之间的相关性,筛选相关性最强的特征矩阵作为最优结构,作为模型预测阶段的特征矩阵排列结构,MI的计算方式如下所示:
;
式中,p(x,y)为X和Y的联合概率密度函数,I(X,Y)为互信息量,X,Y分别为特征矩阵x(x1,x2,x3,x4,x5,x6,x7,x8)中的特征向量。
4.根据权利要求3所述基于CNN-BiLSTM的城市公交客流短时预测方法,其特征在于,S4具体是,CNN-BiLSTM公交客流预测模型包括输入层、CNN层、BiLSTM层、全连接层和输出层;
其中,输入层为输入特征矩阵,CNN层是由卷积层及最大池化层堆叠组成,将公交客流特征矩阵经过归一化处理输入至卷积层,经过卷积操作后保持特征矩阵的长度和宽度不变,得到新的特征矩阵,卷积层计算公式如下:
;
式中,表示卷积网络第i层特征矩阵,表示激活函数,表示卷积运算,表示第i层使用的卷积核的权重值,表示偏置项;
激活函数选用Relu函数,计算公式如下:
Relu=max(0,x)
式中,x表示输入的特征矩阵;
最大池化层,计算公式如下:
;
;
式中,h表示输入特征矩阵的长度,w表示输入特征矩阵的宽度,表示池化后输出特征矩阵的长度,表示卷积后输出特征矩阵的宽度,卷积核大小为k,步长为s;
BiLSTM层由前向LSTM与后向LSTM组成,BiLSTM层输入为CNN层的输出数据,进入前向LSTM和后向LSTM,分别将正向输入序列和反向输入序列的输出结果相结合,得到最终的输出结果,计算公式如下:
;
;
;
式中,表示前向隐向量,表示后向隐向量,xt表示当前t时刻输入特征向量,表示t时刻输出向量,σ表示激活函数,表示前向权重矩阵,表示前向时间步,表示后向权重矩阵,表示后向时间步,表示偏置向量;
全连接层将输出的特征值按照权重进行加权重组,最后输出预测值,计算公式如下:
;
式中,表示预测值,表示BiLSTM模型的输出向量,WEi为权重矩阵,bmi为偏置矩阵。
5.一种电子设备,其特征在于,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现权利要求1-4任一项所述的基于CNN-BiLSTM的城市公交客流短时预测方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-4任一项所述的基于CNN-BiLSTM的城市公交客流短时预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310333060.4A CN116050673B (zh) | 2023-03-31 | 2023-03-31 | 基于CNN-BiLSTM的城市公交客流短时预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310333060.4A CN116050673B (zh) | 2023-03-31 | 2023-03-31 | 基于CNN-BiLSTM的城市公交客流短时预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116050673A true CN116050673A (zh) | 2023-05-02 |
CN116050673B CN116050673B (zh) | 2023-08-01 |
Family
ID=86127642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310333060.4A Active CN116050673B (zh) | 2023-03-31 | 2023-03-31 | 基于CNN-BiLSTM的城市公交客流短时预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116050673B (zh) |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197739A (zh) * | 2017-12-29 | 2018-06-22 | 中车工业研究院有限公司 | 一种城市轨道交通乘客流量预测方法 |
CN109034449A (zh) * | 2018-06-14 | 2018-12-18 | 华南理工大学 | 基于深度学习和乘客行为模式的短期公交客流预测方法 |
CN110222873A (zh) * | 2019-05-14 | 2019-09-10 | 重庆邮电大学 | 一种基于大数据的地铁站客流量预测方法 |
US20190385738A1 (en) * | 2018-06-19 | 2019-12-19 | Siemens Healthcare Gmbh | Characterization of amount of training for an input to a machine-learned network |
CN112766597A (zh) * | 2021-01-29 | 2021-05-07 | 中国科学院自动化研究所 | 公交客流预测方法及系统 |
CN112966871A (zh) * | 2021-03-15 | 2021-06-15 | 上海交通大学 | 基于卷积长短期记忆神经网络的交通拥堵预测方法及系统 |
US20210200988A1 (en) * | 2019-12-31 | 2021-07-01 | Zhejiang University | Method and equipment for classifying hepatocellular carcinoma images by combining computer vision features and radiomics features |
US20210248399A1 (en) * | 2020-02-06 | 2021-08-12 | Honda Motor Co., Ltd. | Toward real-time estimation of driver situation awareness: an eye tracking approach based on moving objects of interest |
CN113408926A (zh) * | 2021-06-30 | 2021-09-17 | 北方工业大学 | 短时中断情况下城市轨道交通客流分配方法 |
CN113537569A (zh) * | 2021-06-18 | 2021-10-22 | 华南理工大学 | 一种基于权重堆叠决策树的短时公交客流预测方法及系统 |
CN114021441A (zh) * | 2021-10-28 | 2022-02-08 | 江苏科技大学 | 一种基于CNN-BiLSTM的船舶运动姿态预测方法 |
CN114241779A (zh) * | 2022-02-24 | 2022-03-25 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种城市快速路交通流短时预测方法、计算机及存储介质 |
CN114325450A (zh) * | 2022-01-11 | 2022-04-12 | 青岛科技大学 | 基于CNN-BiLSTM-AT混合模型的锂离子电池健康状态预测方法 |
CN114742209A (zh) * | 2022-04-24 | 2022-07-12 | 北京建筑大学 | 一种短时交通流预测方法及系统 |
CN114912666A (zh) * | 2022-04-24 | 2022-08-16 | 同济大学 | 一种基于ceemdan算法和注意力机制的短时客流量预测方法 |
CN115048754A (zh) * | 2022-08-17 | 2022-09-13 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于交通仿真的公交线网优化方法、电子设备及存储介质 |
CN115081717A (zh) * | 2022-06-27 | 2022-09-20 | 北京建筑大学 | 融合注意力机制和图神经网络的轨道交通客流预测方法 |
CN115392554A (zh) * | 2022-08-17 | 2022-11-25 | 北京建筑大学 | 基于深度图神经网络和环境融合的轨道客流预测方法 |
-
2023
- 2023-03-31 CN CN202310333060.4A patent/CN116050673B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197739A (zh) * | 2017-12-29 | 2018-06-22 | 中车工业研究院有限公司 | 一种城市轨道交通乘客流量预测方法 |
CN109034449A (zh) * | 2018-06-14 | 2018-12-18 | 华南理工大学 | 基于深度学习和乘客行为模式的短期公交客流预测方法 |
US20190385738A1 (en) * | 2018-06-19 | 2019-12-19 | Siemens Healthcare Gmbh | Characterization of amount of training for an input to a machine-learned network |
CN110222873A (zh) * | 2019-05-14 | 2019-09-10 | 重庆邮电大学 | 一种基于大数据的地铁站客流量预测方法 |
US20210200988A1 (en) * | 2019-12-31 | 2021-07-01 | Zhejiang University | Method and equipment for classifying hepatocellular carcinoma images by combining computer vision features and radiomics features |
US20210248399A1 (en) * | 2020-02-06 | 2021-08-12 | Honda Motor Co., Ltd. | Toward real-time estimation of driver situation awareness: an eye tracking approach based on moving objects of interest |
CN112766597A (zh) * | 2021-01-29 | 2021-05-07 | 中国科学院自动化研究所 | 公交客流预测方法及系统 |
CN112966871A (zh) * | 2021-03-15 | 2021-06-15 | 上海交通大学 | 基于卷积长短期记忆神经网络的交通拥堵预测方法及系统 |
CN113537569A (zh) * | 2021-06-18 | 2021-10-22 | 华南理工大学 | 一种基于权重堆叠决策树的短时公交客流预测方法及系统 |
CN113408926A (zh) * | 2021-06-30 | 2021-09-17 | 北方工业大学 | 短时中断情况下城市轨道交通客流分配方法 |
CN114021441A (zh) * | 2021-10-28 | 2022-02-08 | 江苏科技大学 | 一种基于CNN-BiLSTM的船舶运动姿态预测方法 |
CN114325450A (zh) * | 2022-01-11 | 2022-04-12 | 青岛科技大学 | 基于CNN-BiLSTM-AT混合模型的锂离子电池健康状态预测方法 |
CN114241779A (zh) * | 2022-02-24 | 2022-03-25 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种城市快速路交通流短时预测方法、计算机及存储介质 |
CN114742209A (zh) * | 2022-04-24 | 2022-07-12 | 北京建筑大学 | 一种短时交通流预测方法及系统 |
CN114912666A (zh) * | 2022-04-24 | 2022-08-16 | 同济大学 | 一种基于ceemdan算法和注意力机制的短时客流量预测方法 |
CN115081717A (zh) * | 2022-06-27 | 2022-09-20 | 北京建筑大学 | 融合注意力机制和图神经网络的轨道交通客流预测方法 |
CN115048754A (zh) * | 2022-08-17 | 2022-09-13 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于交通仿真的公交线网优化方法、电子设备及存储介质 |
CN115392554A (zh) * | 2022-08-17 | 2022-11-25 | 北京建筑大学 | 基于深度图神经网络和环境融合的轨道客流预测方法 |
Non-Patent Citations (3)
Title |
---|
姚志刚等: "CEEMDAN-PSO组合优化BiLSTM的公交站点短时客流预测方法", 《北京交通大学学报》, pages 74 - 80 * |
张敏情;时晨曦;: "基于互信息和特征融合的图像隐写分析", 武汉大学学报(理学版), no. 06, pages 551 - 557 * |
黄振盛;汪玉美;韩江洪;魏振春;: "基于MLS-SVM和时空特性的短时交通流量预测方法", 合肥工业大学学报(自然科学版), no. 01, pages 57 - 63 * |
Also Published As
Publication number | Publication date |
---|---|
CN116050673B (zh) | 2023-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112418547B (zh) | 一种基于gcn-lstm组合模型的公交车站点客流量预测方法 | |
CN113096388B (zh) | 一种基于梯度提升决策树的短时交通流量预测方法 | |
CN108986453A (zh) | 一种基于情境信息的交通状况预测方法、系统及装置 | |
CN106778826A (zh) | 基于自适应元胞遗传与优选模糊c‑均值的混合聚类算法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN115204035A (zh) | 基于多尺度时序数据融合模型的发电机组运行参数预测方法、装置及存储介质 | |
CN116933946A (zh) | 一种基于客流去向结构的轨道交通od客流预测方法及系统 | |
CN113627070A (zh) | 一种短期光伏功率预测方法 | |
Yu et al. | 3D CNN-based accurate prediction for large-scale traffic flow | |
CN116050673B (zh) | 基于CNN-BiLSTM的城市公交客流短时预测方法 | |
CN109214610A (zh) | 一种基于长短期记忆神经网络的饱和电力负荷预测方法 | |
CN113537596A (zh) | 一种城市轨道交通新线站点短时客流预测方法 | |
CN111310340B (zh) | 基于人类移动的城市区域交互异常关系识别方法及设备 | |
CN113240219A (zh) | 一种土地利用模拟及预测方法 | |
CN115394083B (zh) | 一种基于深度学习的高速公路交通拥堵预测方法 | |
CN116629686A (zh) | 一种评估企业能耗数据的方法及装置 | |
CN114978931B (zh) | 基于流形学习的网络流量预测方法、装置及存储介质 | |
CN113849976B (zh) | 规划用地的开发强度评估方法、装置及设备 | |
CN113011512A (zh) | 基于rbf神经网络模型的交通生成预测方法及系统 | |
CN112508303B (zh) | 一种od客流预测方法、装置、设备及可读存储介质 | |
ÇILGIN et al. | The Effect of Outlier Detection Methods in Real Estate Valuation with Machine Learning | |
Çılgın et al. | The Effect of Outlier Detection Methods in Real Estate Valuation with Machine Learning | |
CN116071661B (zh) | 一种基于激光点云的城市道路场景语义分割方法 | |
CN117292562B (zh) | 一种基于交叉口精准流向辨识的信号控制时段划分方法 | |
Blanzeisky et al. | On the Faithfulness of Conditional Probability Estimates: A Multi-objective Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |