CN115034457A - 一种基于ceemdan-lstm的城市轨道交通短时客流预测方法 - Google Patents
一种基于ceemdan-lstm的城市轨道交通短时客流预测方法 Download PDFInfo
- Publication number
- CN115034457A CN115034457A CN202210601928.XA CN202210601928A CN115034457A CN 115034457 A CN115034457 A CN 115034457A CN 202210601928 A CN202210601928 A CN 202210601928A CN 115034457 A CN115034457 A CN 115034457A
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- prediction
- data
- ceemdan
- lstm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000013528 artificial neural network Methods 0.000 claims abstract description 18
- 230000002159 abnormal effect Effects 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000000354 decomposition reaction Methods 0.000 claims description 49
- 230000008569 process Effects 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000002474 experimental method Methods 0.000 claims description 3
- 230000009471 action Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims 1
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 abstract description 7
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 abstract description 7
- 238000012549 training Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 241000728173 Sarima Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Educational Administration (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于CEEMDAN‑LSTM的城市轨道交通短时客流预测方法。该方法首先预处理城市轨道交通客流数据中的缺失值和异常值等;其次,运用CEEMDAN算法将客流数据分解为频率和复杂度均不同的个固有模态函数分量IMFs和唯一的残差Res,提前降低客流数据噪声对预测模型的干扰;然后,将分解出来的个平稳分量输入到LSTM神经网络中分别进行训练和预测,将所有分解分量的预测值叠加重构后得到最终的客流预测结果;最后,通过均方根误差RMSE和平均绝对百分比误差MAPE,验证CEEMDAN‑LSTM预测模型的有效性。本发明可解决城市轨道交通客流数据非线性和非平稳等特性对模型预测效果的影响,对短期客流预测具有良好的参考价值。
Description
技术领域
发明涉及一种基于CEEMDAN-LSTM的城市轨道交通短时客流预测方法,尤其涉及模态分解与深度学习结合的领域。
背景技术
由于城市轨道交通容量大、速度快以及能耗低等优点,已经成为缓解交通拥堵、满足大都市区城市居民出行需求的主要公共交通工具之一。客流预测是城市轨道交通运营管理的基础,其中,中长期客流预测结果是城市轨道交通规划建设阶段的重要依据,而短时客流预测结果可支撑城市轨道交通运行计划、客流诱导、应急管理等决策,对于调整旅客出行行为、减少旅客拥挤、提高城市轨道交通服务质量等具有重要指导意义。
通常来说,短时客流预测的时间粒度一般为5min、10min和15min。对于城市轨道交通来说,考虑到列车发车间隔较短等运输组织特性,时间粒度为15min的短时客流预测更具实际意义。但由于时间粒度的缩减,数据的波动程度以及携带的噪声往往更多,增加了预测的复杂度。而且城市轨道交通短时客流数据本身往往具有非线性、非平稳等特征,传统的预测方法难以获得较好的预测结果。同时,由于短时客流数据的动态特性,客流数据也可视为一段时间序列数据。因此,只有构建既能有效分析城市轨道交通客流数据非平稳性、非线性等特性,又能获取其时序信息的预测模型,才能最大程度地提高客流预测模型的精确度及鲁棒性。
虽然关于短时客流预测的研究在近几年来受到了广泛的关注,但大部分方法的研究重点仍在于优化模型结构和提高训练算法效率,未能充分把握短时客流数据具有的时序性、非线性和非平稳性等特征,忽略了客流数据噪声对预测模型性能的干扰。
目前,国内外针对城市轨道交通短时客流预测模型的研究主要分为三类:参数预测模型、非参数预测模型和组合预测模型。基于参数方法的预测模型包括历史平均法、ARIMA模型、SARIMA模型和MARIMA模型等。考虑到城市轨道交通短时客流的非线性和非平稳等特性,上述参数模型都具有一定的局限性:参数模型假定变量之间存在线性关系,无法获取变量之间的非线性关系,具有一定的局限性。
为了解决上述问题,部分学者提出了基于非参数方法的预测模型,如非参数回归法、卡尔曼滤波等传统的数学或统计学模型,贝叶斯网络、支持向量机、最邻近算法及其改进算法等机器学习模型。特别地,由于神经网络能较为理想地解决复杂的非线性问题,神经网络及其改进方法被广泛的应用于短时客流预测中。同时,随着人工智能的发展,越来越多的学者开始采用深度学习方法构建城市轨道交通短时客流预测模型,在众多深度学习方法中,LSTM(Long Short-Term Memory Neural Network,长短时记忆神经网络)被认为是目前最适合用于获取客流数据时间属性的深度学习的方法。
近几年来,越来越多的学者根据不同方法的优点构建组合模型从而进一步提高客流预测模型精度,如ARIMA-GARCH模型,GM-ARMA模型,Wavalet-SVM模型和SAE-DNN模型等。还有一些学者认为,先对城市轨道交通自动售检票系统采集的进(出)站客流数据进行预处理,提取数据中的有效特征,减少预测模型识别输入与输出信号时的数据噪声,提前降低客流数据噪声对预测模型的干扰,进一步提高输入变量的稳定性。EMD(Empirical ModelDecomposition,经验模态分解)是一种数据驱动的自适应信号分析方法,适用于分析和处理非线性、非平稳的数据。EMD可将输入数据分解为一系列频率由高到低依次排列的固有模态函数IMFs(Intrinsic Mode Functions,IMFs)和一项可表示数据总体变化趋势的余量Res。因此,EMD及其改进的分解算法EEMD(Ensemble Empirical Model Decomposition,集合经验模态分解)常被用于分析客流时序数据特征。基于此,部分学者采用数据处理模型与神经网络预测模型相结合的方式构建组合模型。有的学者将EMD模型分解后的数据作为BPNN(Back Propagation Neural Network,反向传播神经网络)的输入,提出了融合EMD与BPNN的组合预测模型;有的学者将EMD-SAE组合模型运用到交通流预测中;一些学者还提出了融合EEMD与GSVM的组合预测模型。在上述基于EMD与EEMD的组合模型中,EMD和EEMD在数据分解过程中分别容易出现模态混叠和残留噪声等问题。运用BPNN、GSVM及SAE等单一模型预测客流量,不能充分利用客流数据的时序特性,且上述单一模型不能有效区分高频和低频IMFs,并且不能在降维的同时保留完整的数据信息。
而现有研究如CEEMDAN(Complete Ensemble Empirical Model Decompositionwith Adaptive Noise,自适应噪声完备集合经验模态分解)的提出克服了EMD以及EEMD各自的缺点,通过自适应地添加高斯白噪声来避免模态混叠现象和残留噪声问题,并且分解结果具有完整性、无重构性误差等特性。同时,LSTM神经网络在具有时序特性的短时交通流预测中往往具有良好的表现,保持了LSTM的数据处理效果的同时又使神经网络结构更加简单,更适用于短时客流预测对实时操作的要求。
综上所述,国内外已有大量对城市轨道交通短时客流预测的研究,但是上述模型都未充分利用短时客流数据时序性、非线性以及非平稳性的特征,不利于提高城市轨道交通短时客流预测的精确度和鲁棒性。
发明内容
为了克服上述现有技术的缺点,本发明提出了一种融合CEEMDAN与LSTM的城市轨道交通短时客流预测模型。充分结合两个模型的优点,利用CEEMDAN将原始客流数据分解为有限个具有局部特征且不同频率的IMFs和一个残差Res,以获取数据非平稳、非线性的特征,利用CEEMDAN算法将非线性的城市轨道交通客流数据进行平稳化处理后,运用LSTM神经网络作为客流预测方法,提前弱化客流数据噪声对预测模型的干扰,减少预测误差,进一步提高城市轨道交通客流预测模型的精度。
本发明解决其技术问题所采用的技术方案是:一种基于模态分解与深度学习的城市轨道交通短时客流预测方法,包括客流数据预处理阶段、CEEMDAN分解阶段、LSTM预测阶段和预测误差分析阶段。其中:所述客流数据预处理阶段,通过剔除原始客流数据中的缺失值和异常值等,减少预测模型识别输入与输出信号时的数据噪声;所述CEEMDAN分解阶段,将预处理后的客流数据分解为n个具有局部特征且不同频率的固有模态函数分量IMFs和一个残差Res,提前降低客流数据噪声对预测模型的干扰,进一步提高输入数据的稳定性;所述LSTM预测阶段,将分解出来的n+1个平稳分量输入到LSTM神经网络中分别进行训练和预测,将所有分解分量的预测值叠加重构后得到最终的客流预测结果;所述预测误差分析阶段,通过分析CEEMDAN-LSTM预测模型的均方根误差RMSE和平均绝对百分比误差MAPE,验证CEEMDAN-LSTM预测模型的有效性,说明本方法可精确预测城市轨道交通短时客流量。具体采用如下技术方案:
基于CEEMDAN-LSTM的城市轨道交通短时客流预测方法包括如下步骤:
(1)客流数据预处理,通过剔除原始客流数据中的缺失值和异常值,减少预测模型识别输入与输出信号时的数据噪声;
(2)CEEMDAN分解,将预处理后的客流数据分解为n个具有局部特征且不同频率的固有模态函数分量IMFs和一个残差Res,提前降低客流数据噪声对预测模型的干扰;
(3)LSTM预测,将分解出来的n+1个平稳分量输入到LSTM神经网络中分别进行训练和预测,将所有分解分量的预测值叠加重构后得到最终的客流预测结果;
(4)预测误差分析,通过分析CEEMDAN-LSTM预测模型的均方根误差RMSE和平均绝对百分比误差MAPE,验证CEEMDAN-LSTM预测模型的有效性。
优选地,步骤(1)中所述客流数据预处理,通过剔除城市轨道交通自动售检票系统采集的进出站客流数据中存在的缺失、异常和冗余数据,将其转换为可输入模型的数据形式,减少预测模型识别输入与输出信号时的数据噪声,提前降低客流数据噪声对预测模型的干扰。
优选地,步骤(2)中所述CEEMDAN分解包括EMD分解过程和CEEMDAN分解过程,其中:
(一)EMD分解过程包括如下步骤:
STEP1、找出城市轨道交通原始客流时间序列数据x(t)中的所有局部极值点,采用插值法对极大值点形成上包络线u(t),对极小值点形成下包络线l(t);
STEP3、记原始客流时序数据x(t)与上、下包络线均值m(t)的差为h(t):h(t)=x(t)-m(t);
STEP4、判断h(t)是否满足IMF的两条性质:原始客流数据的极值点数目和过零点数目相等或最多相差一个;上线包络线的平均值为0;若满足,则m(t)为第一项IMF;h(t)为第一项Res;否则,重复STEP1~3,直至获得第一个IMF,并记为c1(t);
STEP5、记r1(t)=x(t)-c1(t)为新的待分解数据,重复STEP1~4,以得到第二项IMF,并记为c2(t),此时余量r2(t)=x(t)-c2(t);重复上述步骤,直到得到的余量cn(t)单调或满足阈值要求,到此分解结束,则原始客流时序数据x(t)最终被分解为:
(二)CEEMDAN分解过程包括如下步骤:
STEP1、向城市轨道交通客流原始时间序列数据x(t)中添加I次不同的白噪声,得到新序列xi(t)=x(t)+β0ωi(t)。其中,xi(t)为经过第i次分解的客流时间序列;β0为信噪比;ωi(t)为服从标准正态分布的高斯白噪声序列;
优选地,步骤(3)中所述LSTM预测阶段包括如下步骤:
STEP1、LSTM神经网络的输入记为x(t)=(x1,…,xt,…,xT),隐藏层输出记为h(t)=(h1,…,ht,…,hT),细胞状态记为c(t)=(c1,…,ct,…,cT),最终输出记为y(t)=(y1,…,yt,…,yT);
STEP3、在城市轨道交通短时客流预测中,xt各元素为预测t+1时刻客流的输入变量,包括客流量、站点空间位置和天气等;ht各元素为预测中间值,为进一步提取的xt时空特征;yt各元素为时刻t的客流预测值;N1为各时刻的输入长度;N2和N3分别为各时刻隐藏层和输出层的输出长度;
STEP4、遗忘门控制信息从上一时刻细胞状态中丢弃,输入门选择当前输入的有效信息,两者共同决定当前时刻内的细胞状态,输出门在的基础上进一步过滤,决定隐藏层的输出;通过3个门控单元的共同作用,输出选择性保留上一时刻和当前时刻的有效信息。
优选地,步骤(4)中所述预测误差分析阶段按如下公式进行计算:
与现有技术相比,本发明的有益效果是:
1、稳定性:本发明采用CEEMDAN算法作为城市轨道交通短时客流时序数据的分解方法,能有效获取短时客流数据非线性、非平稳的特性,并克服EMD和EEMD算法在分解过程中分别存在的模态混叠现象和残留噪声问题,有效提升了客流数据分析的稳定性。
2、优越性:本发明采用LSTM神经网络作为城市轨道交通短时客流的预测方法,该模型特有的链式结构具有保持信息持久性的特点,适用于处理时序数据。与传统RNN模型相比,LSTM模型在克服梯度爆炸缺陷的同时具有更易计算等优点。
3、精确性:本发明提出一种基于CEEMDAN-LSTM的组合模型预测城市轨道交通短时客流量。充分结合CEEMDAN分解算法和LSTM神经网络的优点,提前弱化原始客流时序数据噪声对预测模型精度的干扰,与单一模型相比,可显著提高客流预测模型的精度。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1为CEEMDAN-LSTM模型预测流程图;
图2为EMD分解算法流程图;
图3为CEEMDAN分解算法流程图;
图4为LSTM神经网络内部结构图。
具体实施方式
一种基于CEEMDAN-LSTM的城市轨道交通短时客流预测方法,如图1所示,主要由客流数据预处理阶段、CEEMDAN分解阶段、LSTM预测阶段和预测误差分析阶段组成,具体内容如下:
一、客流数据预处理阶段
城市轨道交通自动售检票系统采集的进(出)站客流数据中包括海量数据,其中存在缺失值、冗余值和异常值等。客流数据预处理的具体过程包括如下步骤:
STEP1、数据清洗
利用Python的numpy库和panndas库对缺失值和异常值进行分析和处理。缺失值主要由于刷卡数据较少导致,可采用多重插补的方法的进行插补。异常值主要包括明显与现实不符的值,需要去除或者进行降噪处理。
STEP2、时间间隔划分
目前,主要对城市轨道交通客流量进行短时预测,可将时间划分为很短的时间间隔,如5分钟、10分钟和15分钟等。
STEP3、数据归一化
在建立客流预测模型的过程中,为加快模型训练的收敛速度,当输入数据较大时,需要对预处理后的客流数据进行转换,将数据归一化。归一化是指将预处理后的客流数据进行区间缩放,对原始客流数据作线性变换,进而将数据映射到闭区间[0,1]上。在城市轨道交通短时客流量预测中,为了消除数据波动差异对预测模型结果的影响,应对数据进行归一化处理:其中,X表示所有预测样本数量,Xmax和Xmin分别表示城市轨道交通客流数据中的最大值和最小值。
二、CEEMDAN分解阶段
在这一阶段,将城市轨道交通客流数据视为一段由连续平滑信号和异常噪声组成的数据。利用CEEMDAN算法对原始客流数据进行分解处理。
EMD分解的具体过程如图2所示,包括如下步骤:
STEP1、找出城市轨道交通原始客流时间序列数据x(t)中的所有局部极值点,采用插值法对极大值点形成上包络线u(t),对极小值点形成下包络线l(t)。
STEP3、记原始客流时序数据x(t)与上、下包络线均值m(t)的差为h(t):h(t)=x(t)-m(t)。
STEP4、判断h(t)是否满足IMF的两条性质:原始数据的极值点数目和过零点数目相等或最多相差一个;上下包络线的平均值为0。若满足,则m(t)为第一项IMF,且h(t)为第一项Res;否则,重复STEP1~3,直至获得第一个IMF,并记为c1(t);
STEP5、记r1(t)=x(t)-c1(t)为新的待分解数据,重复STEP1~4,以得到第二项IMF,并记为c2(t)。此时,余量r2(t)=x(t)-c2(t)。重复上述步骤,直到得到的余量cn(t)单调或满足阈值要求。到此分解结束,则原始客流数据为:
将由EMD分解得到的第j阶模态分量IMFj(t)记为Ej(·)。ωi(t)为服从标准正态分布的白噪声。CEEMDAN分解过程如图3所示,包括如下步骤:
STEP1、向原始城市轨道交通客流时间序列x(t)中添加I次不同的白噪声,得到序列xi(t):
xi(t)=x(t)+β0ωi(t)
式中:xi(t)为经过第i次分解的客流时间序列;β0为信噪比;ωi(t)为服从标准正态分布的高斯白噪声序列。
式中:I为实验次数。
式中:E1(·)为EMD分解后的第1阶IMF分量的客流数据。
STEP5、当满足EMD的终止条件时,则分解结束;否则,继续分解。原始客流序列x(t)最终被分解为:
三、LSTM预测阶段
在CEEMDAN分解的基础上,构建多输入、单输出的单步预测LSTM神经网络。将第d天内与t时刻相邻的前历史p个观测值x(t-p,d)=(xt-p,d,xt-(p-1),d,…,xt-1,d)作为输入,t时刻后q个连续的观测值x(t,d)=(xt,d,xt+1,d,…,xt+q,d)作为输出,其中p为时间步长,q为预测步长,q=1时为单步预测,其实质为拟合输入空间Rp×n中的任意点至输出空间Rn×q中的任意点。输入层、隐藏层和输出层的神经元个数分别记为Ni、Nh和No。
STEP1、输入层
由于CEEMDAN-LSTM预测方法仅考虑时间维度下的客流流量特征,故各时间步长下的输入长度为1,时间步长取值为4,Ni取1,输入维度为(1,4,Nh1),其中Nh1为第一个隐藏层的神经元数。
STEP2、隐藏层
隐藏层数取2,隐藏层神经元个数一般采用经验值,为Nh=(Ni+No)β。其中,β为调节系数,避免模型欠拟合或过拟合,0.5≤β≤1.5。采用网格搜索确定Nh,分别取β的上、下限和中间值,即各隐藏层Nh分别取1、2、3,选择模型训练误差最小对应的Nh。
STEP3、输出层
添加一个全连接层作为输出层,本方法预测步长为1,故No取值为1。为防止预测模型过拟合,各层采用Dropout技术,随机断开神经元数目比例取0.1,批次训练样本数为2。训练样本数为待训练参数数量的5~10倍,故取中间值50。学习率取值过小,模型易陷入局部最优;学习率取值过大,模型则在某一点处来回震荡,甚至无法收敛。因此,采用指数衰减法动态调整学习率,即其中γ为初始学习率,取0.001;γ′为更新后的学习率;λ为衰减系数,取0.95;κ为当前迭代次数;μ为衰减速度,即进行μ轮迭代γ衰减一次,μ取值为150,损失函数为均方误差。
四、预测误差分析阶段
为了更好地评价CEEMDAN-LSTM模型的预测效果,选取均方根误差(Root MeanSquare Error,RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)作为CEEMDAN-LSTM模型的评价指标。在分析非线性拟合时,RMSE与MAPE表明样本的离散程度,值越小,说明预测值与观测值之间的线性相关程度越高。
STEP1、RMSE可直接体现预测值与观测值之间的绝对差异,且对特大或特小误差反映非常敏感。
STEP2、MAPE体现了预测值与观测值之间的相对偏差,常用于评价预测模型的优劣。
Claims (5)
1.一种基于CEEMDAN-LSTM的城市轨道交通短时客流预测方法,其特征在于,该方法包括如下步骤:
(1)客流数据预处理,通过剔除原始客流数据中的缺失值和异常值,减少预测模型识别输入与输出信号时的数据噪声;
(2)CEEMDAN分解,将预处理后的客流数据分解为n个具有局部特征且不同频率的固有模态函数分量IMFs和一个残差Res,提前降低客流数据噪声对预测模型的干扰;
(3)LSTM预测,将分解出来的n+1个平稳分量输入到LSTM神经网络中分别进行训练和预测,将所有分解分量的预测值叠加重构后得到最终的客流预测结果;
(4)预测误差分析,通过分析CEEMDAN-LSTM预测模型的均方根误差RMSE和平均绝对百分比误差MAPE,验证CEEMDAN-LSTM预测模型的有效性。
2.根据权利要求1所述的一种基于CEEMDAN-LSTM的城市轨道交通短时客流预测方法,其特征在于:步骤(1)中所述客流数据预处理,通过剔除城市轨道交通自动售检票系统采集的进出站客流数据中存在的缺失、异常和冗余数据,将其转换为可输入模型的数据形式,减少预测模型识别输入与输出信号时的数据噪声,提前降低客流数据噪声对预测模型的干扰。
3.根据权利要求1所述的一种基于CEEMDAN-LSTM的城市轨道交通短时客流预测方法,其特征在于:步骤(2)中所述CEEMDAN分解包括EMD分解过程和CEEMDAN分解过程,其中:
(一)EMD分解过程包括如下步骤:
STEP1、找出城市轨道交通原始客流时间序列数据x(t)中的所有局部极值点,采用插值法对极大值点形成上包络线u(t),对极小值点形成下包络线l(t);
STEP3、记原始客流时序数据x(t)与上、下包络线均值m(t)的差为h(t):h(t)=x(t)-m(t);
STEP4、判断h(t)是否满足IMF的两条性质:原始客流数据的极值点数目和过零点数目相等或最多相差一个;上线包络线的平均值为0;若满足,则m(t)为第一项IMF;h(t)为第一项Res;否则,重复STEP1~3,直至获得第一个IMF,并记为c1(t);
STEP5、记r1(t)=x(t)-c1(t)为新的待分解数据,重复STEP1~4,以得到第二项IMF,并记为c2(t),此时余量r2(t)=x(t)-c2(t);重复上述步骤,直到得到的余量cn(t)单调或满足阈值要求,到此分解结束,则原始客流时序数据x(t)最终被分解为:
(二)CEEMDAN分解过程包括如下步骤:
STEP1、向城市轨道交通客流原始时间序列数据x(t)中添加I次不同的白噪声,得到新序列xi(t)=x(t)+β0ωi(t)。其中,xi(t)为经过第i次分解的客流时间序列;β0为信噪比;ωi(t)为服从标准正态分布的高斯白噪声序列;
4.根据权利要求1所述的一种基于CEEMDAN-LSTM的城市轨道交通短时客流预测方法,其特征在于:步骤(3)中所述LSTM预测阶段包括如下步骤:
STEP1、LSTM神经网络的输入记为x(t)=(x1,…,xt,…,xT),隐藏层输出记为h(t)=(h1,…,ht,…,hT),细胞状态记为c(t)=(c1,…,ct,…,cT),最终输出记为y(t)=(y1,…,yt,…,yT);
STEP3、在城市轨道交通短时客流预测中,xt各元素为预测t+1时刻客流的输入变量,包括客流量、站点空间位置和天气等;ht各元素为预测中间值,为进一步提取的xt时空特征;yt各元素为时刻t的客流预测值;N1为各时刻的输入长度;N2和N3分别为各时刻隐藏层和输出层的输出长度;
STEP4、遗忘门控制信息从上一时刻细胞状态中丢弃,输入门选择当前输入的有效信息,两者共同决定当前时刻内的细胞状态,输出门在的基础上进一步过滤,决定隐藏层的输出;通过3个门控单元的共同作用,输出选择性保留上一时刻和当前时刻的有效信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210601928.XA CN115034457A (zh) | 2022-05-30 | 2022-05-30 | 一种基于ceemdan-lstm的城市轨道交通短时客流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210601928.XA CN115034457A (zh) | 2022-05-30 | 2022-05-30 | 一种基于ceemdan-lstm的城市轨道交通短时客流预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115034457A true CN115034457A (zh) | 2022-09-09 |
Family
ID=83120720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210601928.XA Pending CN115034457A (zh) | 2022-05-30 | 2022-05-30 | 一种基于ceemdan-lstm的城市轨道交通短时客流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115034457A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116128124A (zh) * | 2023-01-09 | 2023-05-16 | 北京建筑大学 | 一种基于异常用能值处理和时序分解的建筑能耗预测方法 |
CN116468324A (zh) * | 2023-04-25 | 2023-07-21 | 北京化工大学 | 一种数据驱动的交通枢纽到达客流量分解-集成预测方法 |
CN116682265A (zh) * | 2023-08-04 | 2023-09-01 | 南京隼眼电子科技有限公司 | 交通流量预测模型构建方法、使用方法及电子设备 |
CN116842444A (zh) * | 2023-07-03 | 2023-10-03 | 海南大学 | 一种基于eemd-ceemdan结合lstm的混合时间序列数据预测方法 |
-
2022
- 2022-05-30 CN CN202210601928.XA patent/CN115034457A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116128124A (zh) * | 2023-01-09 | 2023-05-16 | 北京建筑大学 | 一种基于异常用能值处理和时序分解的建筑能耗预测方法 |
CN116468324A (zh) * | 2023-04-25 | 2023-07-21 | 北京化工大学 | 一种数据驱动的交通枢纽到达客流量分解-集成预测方法 |
CN116468324B (zh) * | 2023-04-25 | 2024-01-05 | 北京化工大学 | 一种数据驱动的交通枢纽到达客流量分解-集成预测方法 |
CN116842444A (zh) * | 2023-07-03 | 2023-10-03 | 海南大学 | 一种基于eemd-ceemdan结合lstm的混合时间序列数据预测方法 |
CN116682265A (zh) * | 2023-08-04 | 2023-09-01 | 南京隼眼电子科技有限公司 | 交通流量预测模型构建方法、使用方法及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115034457A (zh) | 一种基于ceemdan-lstm的城市轨道交通短时客流预测方法 | |
CN109785618B (zh) | 一种基于组合逻辑的短时交通流预测方法 | |
CN110766212B (zh) | 用于历史数据缺失电场的超短期光伏功率预测方法 | |
CN109948861A (zh) | 一种基于模态分解及深度学习的城轨短时客流预测方法 | |
Vlahogianni et al. | Spatio‐temporal short‐term urban traffic volume forecasting using genetically optimized modular networks | |
CN110580543A (zh) | 一种基于深度信念网络的电力负荷预测方法及系统 | |
CN111063194A (zh) | 一种交通流预测方法 | |
CN102496284A (zh) | 一种道路交通流量采集及预测方法 | |
CN111931978A (zh) | 一种基于时空特性的城市轨道交通客流状态预测方法 | |
CN106022549A (zh) | 基于神经网络和思维演化搜索的短期负荷预测方法 | |
CN115410372B (zh) | 基于贝叶斯lstm的高速公路交通流量可靠预测方法 | |
Teng et al. | Use of group method of data handling for transport energy demand modeling | |
Mokarram et al. | Net-load forecasting of renewable energy systems using multi-input LSTM fuzzy and discrete wavelet transform | |
CN105825271A (zh) | 基于证据推理的卫星故障诊断与预测方法 | |
CN112651534B (zh) | 一种预测资源供应链需求量的方法、装置及存储介质 | |
CN115496257A (zh) | 基于时空融合的短时车速预测 | |
CN115619033A (zh) | 基于工业互联网的采购供应链一体化优化方法和设备 | |
CN116434531A (zh) | 一种基于Conv1D-LSTM模型的短时交通流预测方法 | |
CN113255963A (zh) | 基于路元拆分和深度学习模型lstm的路面使用性能预测方法 | |
CN117592593A (zh) | 基于改进二次模态分解和WOA优化BILSTM-attention的短期电力负荷预测方法 | |
CN114154583A (zh) | 一种小波分析耦合lstm神经网络的水质预测方法 | |
CN116933946A (zh) | 一种基于客流去向结构的轨道交通od客流预测方法及系统 | |
CN114973665A (zh) | 一种结合数据分解和深度学习的短时交通流预测方法 | |
Wang | Analysis of bank credit risk evaluation model based on BP neural network | |
Li et al. | Short-term traffic flow prediction based on recurrent neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |