CN114492967A - 基于ceemdan和blstm组合模型的城轨车站客流预测方法和介质 - Google Patents

基于ceemdan和blstm组合模型的城轨车站客流预测方法和介质 Download PDF

Info

Publication number
CN114492967A
CN114492967A CN202210047361.6A CN202210047361A CN114492967A CN 114492967 A CN114492967 A CN 114492967A CN 202210047361 A CN202210047361 A CN 202210047361A CN 114492967 A CN114492967 A CN 114492967A
Authority
CN
China
Prior art keywords
data
passenger flow
prediction
blstm
ceemdan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210047361.6A
Other languages
English (en)
Inventor
王敏
翟佑春
周涛
董小彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202210047361.6A priority Critical patent/CN114492967A/zh
Publication of CN114492967A publication Critical patent/CN114492967A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法和介质,该方法基于工作日与节假日客流变化特征不同的特点,为了避免其特征不同的影响,将工作日与节假日的客流数据分别进行预测建模,并采用Pearson相关系数分析历史客流数据与预测值的关联程度以确定合理的滑动时间窗口。客流数据短时波动量较大,直接对原始数据进行预测会存在较大误差,该方法首先采用CEEMDAN算法将客流数据进行分解处理,然后基于客流的时序性变化,选择由LSTM改进的BLSTM获取分解序列的时序特征,最后将各分量预测结果相加得到最终客流预测数据,本发明能够有效解决城轨交通车站客流波动导致的预测精度差的问题,具有切实可行的实用价值和广泛的应用前景。

Description

基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法和 介质
技术领域
本发明涉及城轨交通客流预测领域,特别是涉及一种基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法和介质。
背景技术
由于城市轨道交通载运量大、方便快速等特点,其在市内交通扮演的角色也变得越来越重要。精准预测未来时刻客流的变化对轨道运营部门合理安排营运计划以及提升服务水平具有重要意义,同时预测的客流数据还能够为管理部门在人员密集环境下的人流疏导以及安全防范提供支持。地铁车站内空调负荷受车站内客流量影响,预测得到客流数据能与温度湿度等相关特征一起作为车站内空调负荷预测的依据,在得到空调负荷预测数据后能够进一步对空调进行节能控制,对实现车站节约电能与营运成本具有重大意义。
客流预测是利用历史客流数据以及相关的影响因素对下一时刻甚至未来多个时刻的客流量进行预测,一般预测时间刻度为15分钟,即预测未来15分钟内的客流量。目前基于统计理论的客流预测方法主要有时间序列、线性回归模型,卡尔曼滤等。虽然传统的统计理论方法发展已经很成熟,但是鉴于客流数据的非线性以及波动性,上述方法已经不能够满足当下对于客流预测精度的要求。
随着科学技术的进步与大数据的发展,基于机器学习的预测模型被广泛使用,这也让客流预测方法有了更多可能。早在1994年有学者就将BP神经网络用于短期交通流预测,随后有学者将长短期记忆神经网络(LSTM)用于客流预测并与其他方法对比验证了LSTM的优越性,双向长短期记忆神经网络(BLSTM)由LSTM改进而来,在时序数据预测方面得到了广泛应用,它由正反方向传播的两层LSTM构成,能够学习数据正反两方向的时序特征,因而能够取得更高的预测精度。
由于乘客出行有一定的随机性,导致车站内进出站客流量变化也呈现一定的随机性和波动性,有学者尝试通过采用多种预测模型相融合的方法,希望能够获取更多客流历史数据的时序特征,从而达到更高的预测精度,但对于强波动的客流数据,这种改进效果并不乐观。为了削减客流数据的波动,可以对原始数据进行滤波使其变得平滑,但这会导致数据失真,最后预测值与实际值相差较大。采用数据分解将原始客流数据进行分解,得到若干子序列,分别对其预测便能很好的处理客流数据非线性、非平稳的特征,对实现高精度的客流预测有重要意义。
发明内容
发明目的:本发明的目的是提供一种高精度的客流预测方法,能够减少客流数据强非平稳性导致的预测误差,实现更准确的客流预测。
技术方案:一种基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法,包括:
步骤1:由城轨车站后台管理系统获取进出车站一段时间内的进出站历史客流数据;
步骤2:将历史客流数据进行预处理,对客流数据截取车站运营时间段内的时间点,剔除异常数据;
步骤3:将预处理后的历史客流数据按照工作日与节假日类型进行分类,分别得到工作日特征和节假日特征的客流数据;
步骤4:采用Pearson相关系数分别分析工作日与节假日客流历史数据间的相关性;
步骤5:分别将工作日与节假日客流数据采用CEEMDAN进行数据分解,得到若干IMF分量和一残余分量;
步骤6:将步骤5中得到的各个分量进行归一化处理,以步骤4中分析得到的呈现强正相关的前s个相邻历史数据建立滑动时间窗口,之后将其重构为三维数据;
步骤7:建立BLSTM预测模型;模型由输入层、隐藏层、输出层三部分组成,输入层和输出层采用全连接层即Dense层,隐藏层为BLSTM,通过多次实验确定输入层和隐藏层神经元个数,输出层神经元个数设置为1;
步骤8:将步骤6所得数据依次送入BLSTM模型进行预测,将每个分量的预测结果进行反归一化并保存,待所有分量预测结束之后将预测结果相加,得到最终的客流预测值。
进一步地,步骤1中,一段时间以十五分钟粒度进行划分。
进一步地,步骤2中,若运营初始时间段和末尾时间段客流数据少,则舍弃该部分数据;车站管理系统的客流数据中若存在异常数据,将异常数据以前后两时刻的客流量平均值或者以前一天同一时刻数据代替。
进一步地,步骤4中,Pearson相关系数公式如下:
Figure BDA0003472627090000021
式中,Yi,Xi分别为客流、影响因素第i个数据,
Figure BDA0003472627090000031
分别为客流数据、影响因素平均数,SY,SX分别为客流数据、影响因素的方差,r为相关系数,取值范围为[-1,1],r大于零且越接近1则正相关越强,反之则相反。
进一步地,步骤6中,归一化处理公式如下:
Figure BDA0003472627090000032
式中,x'为归一化后的客流数据,x为原始客流数据,xmax,xnin分别为x的最大值与最小值;将归一化处理后的客流数据以80%作为训练数据,以20%作为测试数据。
进一步地,步骤5的具体过程为:
步骤5.1:在客流数据中添加噪声;
x'(t)=x(t)+ε0n(t) (3)
其中,x′(t)为添加白噪声之后的客流数据,x(t)为原始客流数据,ε0为噪声标准差,n(t)为服从N(0,1)分布的高斯白噪声;
步骤5.2:使用EMD对x′(t)分解,得到第一个序分量imf11(t);
Figure BDA0003472627090000033
其中,T为采用EMD进行分解的次数;
步骤5.3:计算第一步分解得到的残余量;
r1(t)=x(t)-imf1(t) (5)
步骤5.4:计算第二个序分量imf2(t),Ej[]为对数据进行EMD分解的第j个序分量;
Figure BDA0003472627090000034
步骤5.5:重复步骤5.3和5.4,计算第k个序分量的残余量并以此来计算第k+1个分量;
rk(t)=rk-1(t)-imfk(t) (7)
Figure BDA0003472627090000035
步骤5.6:重复步骤5.5直至所得残余信号量极值点不超过两个并得到K个序分量,最终的残余量为:
Figure BDA0003472627090000041
步骤5.7:得到CEEMDAN分解结果为:
Figure BDA0003472627090000042
进一步地,步骤6的具体过程为:
以需要预测客流量的时间点为T0,该时刻前一时刻为T1,以此类推;在构建滑动窗口时,以步骤4得到的时间窗口s为时间步长,
以[Tn,Tn-1,Tn-2,...,Tn-s+1]历史分量数据作为输入数据,以Tn-s时刻的分量数据作为输出数据,以[Tn-1,Tn-2,Tn-3,...,Tn-s]历史分量数据作为输入数据,以Tn-s-1时刻的分量数据作为输出数据;通过时间窗口的滑动将训练数据与测试数据构建为对应的输入输出数据,以[Ts,Ts-1,Ts-2,...,T1]历史数据预测得到T0时刻分量数据,将T0时刻各分量数据相加即为最终的T0时刻客流预测数据。
进一步地,步骤7预测过程计算公式为:
遗忘门:
ft=σ(Wf·[st-1,xt]+bf) (11)
输入门:
it=σ(Wi·[st-1,xt]+bi) (12)
gt=tanh(Wg[st-1,xt]+bg) (13)
Figure BDA0003472627090000043
输出门:
ot=σ(Wo[st-1,xt]+bo) (15)
Figure BDA0003472627090000044
正向传播层:
st=f(w1·xt+w2·st-1) (17)
反向传播层:
s′t=f(w3·xt+w5·s′t-1) (18)
最终输出:
ot=g(w4·st+w6·s′t) (19)
式中,xt为输入数据,st为隐含层输出,ct为细胞状态,W,b分别权重和为偏执,σ和tanh分别代表sigmoid和tanh激活函数,二者的公式分别为:
Figure BDA0003472627090000051
Figure BDA0003472627090000052
进一步地,该方法预测得到的客流数据还能与温度湿度相关特征一起作为车站内空调负荷预测的依据,进一步对空调进行节能控制。
具体实施中,存在一种计算机可读存储介质,包括供一个或多个处理器执行的一个或多个程序,一个或多个程序包括用于执行如权利要求1-9任一方法的指令。
有益效果:与现有技术相比,本发明具有如下显著的优点:
(1)考虑了工作日与节假日不同的客流变化特征,将工作日与节假日的历史客流数据分开并分别进行预测,避免客流特征不同带来的干扰,采用Pearson相关系数确定了合理的滑动时间窗口,使预测模型能够获得更多的历史数据特征;
(2)采用CEEMDAN对原始客流数据进行分解,以分解得到的多个子序列分别进行预测,避免了原始数据非线性、非平稳性以及强波动性带来的预测困难问题;
(3)采用基于LSTM改进的BLSTM预测模型进行预测,该模型能够提取数据正反两个方向的时序特征,相比于其他模型有更好的预测精度。
附图说明
图1为本发明的流程示意图;
图2为LSTM内部结构图;
图3为BLSTM结构图;
图4为CEEMDAN工作日客流数据分解结果;
图5为CEEMDAN节假日客流数据分解结果;
图6为本方法工作日客流预测结果;
图7为本方法节假日客流预测结果。
具体实施方式
下面结合附图对本发明作进一步描述。
如图1至图3所示,基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法,采用数据分解算法和预测模型相结合,提高客流预测精度,具体包括以下步骤:
步骤1:由城轨车站后台管理系统获取进出车站的十五分钟时间刻度的进出站历史客流数据。
步骤2:将历史客流数据进行预处理。将得到的客流数据截取车站运营时间段内的时间点,若运营初始时间段和末尾时间段客流数据很少则舍弃该部分数据。车站管理系统得到的客流数据可能会有极个别错误数据,将明显异常数据以前后两时刻客流量平均值或者以前一天同一时刻数据代替。
步骤3:将预处理后的历史客流数据按照工作日与节假日类型进行分类,分别得到工作日特征和节假日特征的客流数据。
步骤4:采用如式(1)所示的Pearson相关系数分别分析工作日与节假日客流历史数据间的相关性。
Figure BDA0003472627090000061
式中Yi,Xi分别为客流、影响因素第i个数据,
Figure BDA0003472627090000062
分别为客流数据、影响因素平均数,SY,SX分别为客流数据、影响因素的方差,r为相关系数,取值范围为[-1,1],r大于零且越接近1则正相关越强,反之则相反。
步骤5:分别将工作日与节假日客流数据采用CEEMDAN进行数据分解,得到若干IMF分量和一残余分量,具体步骤如下:
1):在客流数据中添加噪声;
x'(t)=x(t)+ε0n(t) (2)
其中x′(t)为添加白噪声之后的客流数据,x(t)为原始客流数据,ε0为噪声标准差,n(t)为服从N(0,1)分布的高斯白噪声。
2)使用EMD对x′(t)分解,得到第一个序分量imf1(t);
Figure BDA0003472627090000063
其中,T为采用EMD进行分解的次数;
3)计算第一步分解得到的残余量;
r1(t)=x(t)-imf1(t) (4)
4)计算第二个序分量imf2(t),Ej[]为对数据进行EMD分解的第j个序分量;
Figure BDA0003472627090000071
5)重复第第三步和第四步,计算第k个序分量的残余量并以此来计算第k+1个分量;
rk(t)=rk-1(t)-imfk(t) (6)
Figure BDA0003472627090000072
6)重复第五步直至所得残余信号量极值点不超过两个并得到K个序分量,最终的残余量为:
Figure BDA0003472627090000073
7)得到CEEMDAN分解结果为:
Figure BDA0003472627090000074
步骤6:将步骤5中得到的各个分量采用式(10)进行归一化处理,并将归一化处理后的客流数据以80%作为训练数据,以20%作为测试数据,随后以步骤4中分析得到的呈现较强正相关的前s个相邻历史数据建立滑动时间窗口,之后将其重构为三维数据。
Figure BDA0003472627090000075
式中x’为归一化后的客流数据,x为原始客流数据,xmax,xmin分别为x的最大值与最小值。
其中构建滑动时间窗口的具体步骤如下:
以需要预测客流量的时间点为T0,该时刻前一时刻为T1,以此类推。在构建滑动窗口时以步骤4得到的时间窗口s为时间步长,
首先以[Tn,Tn-1,Tn-2,...,Tn-s+1]历史分量数据作为输入数据,以Tn-s时刻的分量数据作为输出数据,然后再以[Tn-1,Tn-2,Tn-3,...,Tn-s]历史分量数据作为输入数据,以Tn-s-1时刻的分量数据作为输出数据。通过时间窗口的滑动将训练数据与测试数据构建为对应的输入输出数据,最后以[Ts,Ts-1,Ts-2,...,T1]历史数据预测得到T0时刻分量数据,将T0时刻各分量数据相加即为最终的T0时刻客流预测数据。
步骤7:建立BLSTM预测模型。模型由输入层、隐藏层、输出层三部分组成,输入层和输出层采用全连接层即Dense层,隐藏层为BLSTM,通过多次实验来确定最佳输入层和隐藏层神经元个数,输出层神经元个数设置为1。预测过程具体计算公式如下:
1)遗忘门:
ft=σ(Wf·[st-1,xt]+bf) (11)
2)输入门:
it=σ(Wi·[st-1,xt]+bi) (12)
gt=tah(Wg[st-1,xt]+bg) (13)
Figure BDA0003472627090000081
3)输出门:
ot=σ(Wo[st-1,xt]+bo) (15)
Figure BDA0003472627090000082
4)正向传播层:
st=f(w1·xt+w2·st-1) (17)
5)反向传播层:
s′t=f(w3·xt+w5·s′t-1) (18)
6)最终输出:
ot=g(w4·st+w6·s′t) (19)
式中xt为输入数据,st为隐含层输出,ct为细胞状态,W,b分别权重和为偏执,σ和tanh分别代表sigmoid和tanh激活函数,二者的公式分别为:
Figure BDA0003472627090000083
Figure BDA0003472627090000084
步骤8:将步骤6所得数据依次送入BLSTM模型进行预测,将每个分量的预测结果进行反归一化并保存,待所有分量预测结束之后将预测结果相加,得到最终的客流预测值。
实施例
本实施例通过具体数据实施本发明的方法,结果显示,本发明相比于传统客流预测方法可以实现更高精度的客流预测效果,能够为地铁运营部门提供更高精度的未来时间的客流量预测值。本实施例的数据如下所示:
本实施例选择的地铁客流数据为广西南宁某车站2020年6月8日至7月22日共计44天的客流历史数据,其中工作日31天,节假日13天,选择每天早6点至晚11点15的客流数据,并以15分钟粒度进行划分,对客流数据中的缺失值以及不良数据及进行预处理,将处理后的数据采用Pearson相关系数进行分析,以滑动窗口分别对工作日和节假日客流预测模型创建时间步长为4和8的模型输入数据。
本实施例的预测模型参数设置为:
模型隐藏层为BLSTM,采用Dense层作为输入层和输出层,本实施例设定输入神经元为128,隐藏层神经元个数为64,输出步长为1,即输出层神经元个数为1,同时对隐藏层添加Dropout=0.3,防止模型过拟合,激活函数为tanh。优化器选用Adam,采用变学习率设定,初始学习率设定为0.01,每经过100次训练学习率变为原来的1/10,设置训练次数为300次,每次投入的样本数batch_size设置为50。
由图4和图5可知,CEEMDAN将节假日客流数据和工作日客流数据分别分解为10个分量和7个分量,并且每个分量的波动程度逐步递减,第一个分量波动最为剧烈,最后一个分量为分解之后得到的残差分量。
结合图6和图7可知,本发明提出的基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法可以在客流数据存在强烈波动的情况下准确的预测未来时间段内的客流量,预测值与实际值拟合效果好,工作日与节假日客流数据的预测平均百分比误差分别为9.79%和8.97%。与之相比,未分解客流数据而直接采用BLSTM预测模型和采用EMD与BLSTM组合预测模型二者工作日客流数据预测平均百分比误差分别为21.89%和11.72%,且EMD会存在模态混叠问题,由此能够证明本方法可以实现更高精度的地铁车站客流预测。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明的具体实施方式中,未涉及到的说明属于本领域的公知技术,可参考公知技术加以实施。

Claims (10)

1.一种基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法,其特征在于,包括:
步骤1:由城轨车站后台管理系统获取进出车站一段时间内的进出站历史客流数据;
步骤2:将历史客流数据进行预处理,对所述客流数据截取车站运营时间段内的时间点,剔除异常数据;
步骤3:将预处理后的历史客流数据按照工作日与节假日类型进行分类,分别得到工作日特征和节假日特征的客流数据;
步骤4:采用Pearson相关系数分别分析工作日与节假日客流历史数据间的相关性;
步骤5:分别将工作日与节假日客流数据采用CEEMDAN进行数据分解,得到若干IMF分量和一残余分量;
步骤6:将步骤5中得到的各个分量进行归一化处理,以步骤4中分析得到的呈现强正相关的前s个相邻历史数据建立滑动时间窗口,之后将其重构为三维数据;
步骤7:建立BLSTM预测模型;模型由输入层、隐藏层、输出层三部分组成,输入层和输出层采用全连接层即Dense层,隐藏层为BLSTM,通过多次实验确定输入层和隐藏层神经元个数,输出层神经元个数设置为1;
步骤8:将步骤6所得数据依次送入BLSTM模型进行预测,将每个分量的预测结果进行反归一化并保存,待所有分量预测结束之后将预测结果相加,得到最终的客流预测值。
2.根据权利要求1所述的基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法,其特征在于,所述步骤1中,一段时间以十五分钟粒度进行划分。
3.根据权利要求1所述的基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法,其特征在于,所述步骤2中,若运营初始时间段和末尾时间段客流数据少,则舍弃该部分数据;车站管理系统的客流数据中若存在异常数据,将异常数据以前后两时刻的客流量平均值或者以前一天同一时刻数据代替。
4.根据权利要求1所述的基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法,其特征在于,所述步骤4中,Pearson相关系数公式如下:
Figure FDA0003472627080000011
式中,Yi,Xi分别为客流、影响因素第i个数据,
Figure FDA0003472627080000012
分别为客流数据、影响因素平均数,SY,SX分别为客流数据、影响因素的方差,r为相关系数,取值范围为[-1,1],r大于零且越接近1则正相关越强,反之则相反。
5.根据权利要求1所述的基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法,其特征在于,所述步骤6中,归一化处理公式如下:
Figure FDA0003472627080000021
式中,x'为归一化后的客流数据,x为原始客流数据,xmax,xmin分别为x的最大值与最小值;将归一化处理后的客流数据以80%作为训练数据,以20%作为测试数据。
6.根据权利要求1所述的基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法,其特征在于,所述步骤5的具体过程为:
步骤5.1:在客流数据中添加噪声;
x'(t)=x(t)+ε0n(t) (3)
其中,x′(t)为添加白噪声之后的客流数据,x(t)为原始客流数据,ε0为噪声标准差,n(t)为服从N(0,1)分布的高斯白噪声;
步骤5.2:使用EMD对x′(t)分解,得到第一个序分量imf1(t);
Figure FDA0003472627080000022
其中,T为采用EMD进行分解的次数;
步骤5.3:计算第一步分解得到的残余量;
r1(t)=x(t)-imf1(t) (5)
步骤5.4:计算第二个序分量imf2(t),Ej[]为对数据进行EMD分解的第j个序分量;
Figure FDA0003472627080000023
步骤5.5:重复步骤5.3和5.4,计算第k个序分量的残余量并以此来计算第k+1个分量;
rk(t)=rk-1(t)-imfk(t) (7)
Figure FDA0003472627080000024
步骤5.6:重复步骤5.5直至所得残余信号量极值点不超过两个并得到K个序分量,最终的残余量为:
Figure FDA0003472627080000031
步骤5.7:得到CEEMDAN分解结果为:
Figure FDA0003472627080000032
7.根据权利要求1所述的基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法,其特征在于,所述步骤6的具体过程为:
以需要预测客流量的时间点为T0,该时刻前一时刻为T1,以此类推;在构建滑动窗口时,以步骤4得到的时间窗口s为时间步长,
以[Tn,Tn-1,Tn-2,...,Tn-s+1]历史分量数据作为输入数据,以Tn-s时刻的分量数据作为输出数据,以[Tn-1,Tn-2,Tn-3,...,Tn-s]历史分量数据作为输入数据,以Tn-s-1时刻的分量数据作为输出数据;通过时间窗口的滑动将训练数据与测试数据构建为对应的输入输出数据,以[Ts,Ts-1,Ts-2,...,T1]历史数据预测得到T0时刻分量数据,将T0时刻各分量数据相加即为最终的T0时刻客流预测数据。
8.根据权利要求1所述的基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法,其特征在于,所述步骤7预测过程计算公式为:
遗忘门:
ft=σ(Wf·[st-1,xt]+bf) (11)
输入门:
it=σ(Wi·[st-1,xt]+bi) (12)
gt=tanh(Wg[st-1,xt]+bg) (13)
Figure FDA0003472627080000033
输出门:
ot=σ(Wo[st-1,xt]+bo) (15)
Figure FDA0003472627080000034
正向传播层:
st=f(w1·xt+w2·st-1) (17)
反向传播层:
s't=f(w3·xt+w5·s't-1) (18)
最终输出:
ot=g(w4·st+w6·s't) (19)
式中,xt为输入数据,st为隐含层输出,ct为细胞状态,W,b分别权重和为偏执,σ和tanh分别代表sigmoid和tanh激活函数,二者的公式分别为:
Figure FDA0003472627080000041
Figure FDA0003472627080000042
9.根据权利要求1所述的基于CEEMDAN和BLSTM组合模型的城轨车站客流预测方法,其特征在于,该方法预测得到的客流数据还能与温度湿度相关特征一起作为车站内空调负荷预测的依据,进一步对空调进行节能控制。
10.一种计算机可读存储介质,其特征在于,包括供一个或多个处理器执行的一个或多个程序,所述一个或多个程序包括用于执行如权利要求1-9任一所述方法的指令。
CN202210047361.6A 2022-01-17 2022-01-17 基于ceemdan和blstm组合模型的城轨车站客流预测方法和介质 Pending CN114492967A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210047361.6A CN114492967A (zh) 2022-01-17 2022-01-17 基于ceemdan和blstm组合模型的城轨车站客流预测方法和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210047361.6A CN114492967A (zh) 2022-01-17 2022-01-17 基于ceemdan和blstm组合模型的城轨车站客流预测方法和介质

Publications (1)

Publication Number Publication Date
CN114492967A true CN114492967A (zh) 2022-05-13

Family

ID=81511193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210047361.6A Pending CN114492967A (zh) 2022-01-17 2022-01-17 基于ceemdan和blstm组合模型的城轨车站客流预测方法和介质

Country Status (1)

Country Link
CN (1) CN114492967A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115854501A (zh) * 2023-01-10 2023-03-28 大连理工大学 一种基于客流预测的机场航站楼室温大滞后预测控制方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115854501A (zh) * 2023-01-10 2023-03-28 大连理工大学 一种基于客流预测的机场航站楼室温大滞后预测控制方法
CN115854501B (zh) * 2023-01-10 2024-03-19 大连理工大学 一种基于客流预测的机场航站楼室温大滞后预测控制方法

Similar Documents

Publication Publication Date Title
CN113096388B (zh) 一种基于梯度提升决策树的短时交通流量预测方法
Zhang et al. Traffic Accident Prediction Based on LSTM‐GBRT Model
CN107978153B (zh) 一种基于空间向量自回归模型的多模式交通需求影响分析方法
CN111931978A (zh) 一种基于时空特性的城市轨道交通客流状态预测方法
CN111860989B (zh) 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法
CN111301426A (zh) 基于gru网络模型预测未来行驶过程能耗的方法
Lu et al. Short-term demand forecasting for online car-hailing using ConvLSTM networks
CN111861013B (zh) 一种电力负荷预测方法及装置
CN110348601A (zh) 一种基于双向长短期记忆网络的地铁短期客流量预测方法
CN112765894B (zh) 一种基于k-lstm的铝电解槽状态预测方法
CN114912666A (zh) 一种基于ceemdan算法和注意力机制的短时客流量预测方法
CN113205223A (zh) 一种电量预测系统及其预测方法
CN112668822A (zh) 科技成果转化平台共享系统、方法、存储介质、手机app
CN115496257A (zh) 基于时空融合的短时车速预测
CN115358491A (zh) 一种基于ceemdan-lstm的地铁客流预测方法及系统
CN115269758A (zh) 面向乘客诱导的路网客流状态推演方法及系统
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN116227180A (zh) 基于数据驱动的机组组合智能决策方法
CN116822652A (zh) 地铁故障预测方法、装置、电子设备、系统及存储介质
CN115730744A (zh) 基于用户模式与深度学习联合模型的用水量预测方法及系统
CN114492967A (zh) 基于ceemdan和blstm组合模型的城轨车站客流预测方法和介质
CN111277710A (zh) 话务量预测方法、系统、计算机设备及存储介质
CN116663742B (zh) 基于多因素和模型融合的区域运力预测方法
CN116128160B (zh) 一种铁路车站高峰客流预测方法、系统及设备和介质
CN115756922A (zh) 一种故障预测诊断方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination