CN115358491A - 一种基于ceemdan-lstm的地铁客流预测方法及系统 - Google Patents
一种基于ceemdan-lstm的地铁客流预测方法及系统 Download PDFInfo
- Publication number
- CN115358491A CN115358491A CN202211278952.0A CN202211278952A CN115358491A CN 115358491 A CN115358491 A CN 115358491A CN 202211278952 A CN202211278952 A CN 202211278952A CN 115358491 A CN115358491 A CN 115358491A
- Authority
- CN
- China
- Prior art keywords
- data
- passenger flow
- sequence
- lstm
- ceemdan
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012549 training Methods 0.000 claims abstract description 38
- 238000003062 neural network model Methods 0.000 claims abstract description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 30
- 238000001514 detection method Methods 0.000 claims description 25
- 238000012360 testing method Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 13
- 238000010219 correlation analysis Methods 0.000 claims description 10
- 238000005457 optimization Methods 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000011049 filling Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000013500 data storage Methods 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 239000004480 active ingredient Substances 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 17
- 210000004027 cell Anatomy 0.000 description 6
- 238000004140 cleaning Methods 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000764238 Isis Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于CEEMDAN‑LSTM的地铁客流预测方法及系统,根据采集到的历史数据,通过CEEMDAN算法将可分解数据集分解成K个IMF分量数据集,每个IMF分量数据集与关联数据融合成可训练数据集,通过可训练数据集训练构建的LSTM神经网络模型得到K个IMF分量的LSTM训练模型;通过Tensorflow serving将K个IMF分量的LSTM训练模型进行部署,通过将待预测的实时数据输入至LSTM完整模型得到预测结果。本发明采用CEEMDAN对关注数据进行分解提取更多数据特征,融合其它空间特征数据,从时空多维度、全方位对预测模型构建、优化、更新,提高了预测精度。
Description
技术领域
本发明涉及一种地铁客流预测方法,尤其涉及一种基于CEEMDAN-LSTM的地铁客流预测方法及系统。
背景技术
随着城市规模的发展以及人口增多,城市拥堵越来越突出,而城市轨道交通地铁具有载运量大、准时、方便快捷等特点,得到快速发展,目前众多城市轨道交通系统已经实现网络化运营,短时客流对居民出行、地铁运营、列车运行组织起到至关重要的影响。通过对未来一段时间的地铁客流精准预测,城市轨道交通可以为居民提供实时可靠的数据,居民根据系统提供的数据和自身情况,对出行计划和路线做出及时调整;还能为地铁运营人员组织优化运营以及提供客流疏导、合理安排人员、优化线网运力配置、制定车站客流组织与疏散方案、优化列车行车间隔等提供数据支撑,不断提高城市轨道交通运营水平。
地铁客流具有明显周期性、工作日的早晚高峰与平峰时差异大、客流受室外温度和室外天气影响较大、节假日特征明显等鲜明特点,它的非平稳性、随机性给单一预测手段带来极大挑战,单一算法很难覆盖地铁客流的所有特征,预测精度低则失去了客流指导其它工作的意义。
当前地铁短时客流预测主要集中于算法的选择与优化以及时域分析上,忽略了客流时间依赖性、空间关联性与外部随机噪声的影响,没能从客流信号和相关维度提取足够多的特征使得预测模型精度较低。然而客流预测模型输入属性的质量直接影响模型精度,输入属性过少或者不当,特征涵盖不完整,则预测精度偏低,输入属性太多,使得模型太复杂,出现梯度爆炸,训练时间太长,造成计算资源浪费或者出现无法求解等问题。
发明内容
发明目的:针对以上问题,本发明提出一种基于CEEMDAN-LSTM的地铁客流预测方法及系统,能够明显提高预测精度,并通过部署应用形成了一套完整客流预测系统。
技术方案:本发明所采用的技术方案是一种基于CEEMDAN-LSTM的地铁客流预测方法,CEEMDAN为完全自适应噪声辅助聚合经验模态分解(Complete Ensemble EmpiricalMode Decomposition with Adaptive Noise);LSTM为长短记忆神经网络(Long ShortTerm Memory);该方法包括:
(1)根据采集到的进站客流、出站客流、站厅温度、站厅湿度、站台温度、站台湿度、室外温度、室外湿度、站厅CO2浓度以及站台CO2浓度的历史数据,构建原始时间序列;对原始时间序列进行相关性分析,得到进站客流时间序列的相关特征序列;其中,所述的构建原始时间序列为:
其中df为构建的原始时间序列,I p 为进站客流,O p 为出站客流,T h 为站厅温度,H h 为站厅湿度,T p 为站台温度,H p 为站台湿度,C h 为站厅CO2浓度,C p 为站台CO2浓度,T o 为室外温度,H o 为室外湿度。
在对原始时间序列进行相关性分析之前,还包括数据预处理,所述数据预处理是对所述原始时间序列进行序列有效性检验、平稳性检测、异常值检测及填充。
进一步的,所述的序列有效性检验,包括数据类型检验、时间顺序检验、重复性检验和时间频率检验;通过检测了解数据特征,修正或删去无效数据;
所述的平稳性检验,是通过ADF检验算法,检测时间序列是否存在单位根;如果不存在单位根,则序列稳定;否则,序列不稳定,对于不稳定的序列需要通过取对数或差分运算以减少序列的不稳定性对模型的影响;通过检验删去不稳定的序列。进一步的,ADF检验算法包括:
a)无漂移项自回归过程:
b)带漂移项自回归过程:
c)带漂移项和趋势项自回归过程:
其中,为时刻的进站客流,为常量系数,为时刻的进站客流,为选择时间点之前的个时间点,为前后两个时刻进站客流偏差系数,为与的差分,为常数项,为时间趋势项,为随机扰动项。这三个过程是并列的,分别检测序列属于哪个过程。
所述的异常值检测及填充,包括:空值检测、箱线图异常点检测、孤立森林异常点检测、ARIMA自回归差分移动平均异常检测;所有检测出的异常点采用抽取的相同时间段正常数据随机填充;
所述相关性分析,是通过计算各数据与闸机进站客流的相关性,去除相关性小及负相关的分量。
(2)将所述进站客流时间序列作为可分解数据集,同时间的相关特征序列作为关联数据集,通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,每个IMF分量数据集与所述关联数据集融合成K个可训练数据集;其中,所述的每个IMF分量数据集与所述关联数据集融合成K个可训练数据集,是指将进站客流时间序列经过CEEMDAN分解得到IMF序列中的每个IMF分量数据集分别与所述关联数据集合并。
所述的通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,包括:
(21)将高斯白噪声加入到待分解信号,并进行EMD分解,得到一阶本征模态分量:
(23)计算去除第一个本征模态分量后的残差:
(25)计算去除第二个本征模态分量后的残差:
(3)通过所述可训练数据集训练LSTM神经网络模型,得到K个IMF分量对应的K个LSTM训练模型,包括以下步骤:
(31)将可训练数据集中每个序列进行归一化,采用的归一化算法如下:
(33)构建LSTM网络,LSTM网络由输入层、隐层、输出层组成;其中输入层的数据形状为,为样本个数,为输入数据维数,为输出数据维数;滑动窗口、神经元个数、激活函数、优化函数、隐层单元个数、LSTM层个数作为超参,自动优化模型,获取最优参数组合的模型;
(34)采用平均绝对误差进行模型评估以训练LSTM模型,所述平均绝对误差计算式为:
由可训练数据集训练后产生的模型记为:
(4)对采集得到的待预测数据进行处理,得到K个待预测的序列,分别输入至K个IMF分量对应的LSTM模型,然后将K个模型的预测结果合并得到最终预测结果;对采集得到的待预测数据进行处理包括:待预测进站客流数据通过CEEMDAN算法分解获得K个IMF分量,K个IMF分量分别与同一时间相关特征序列融合得到K个待预测的序列。
本发明还提出一种基于CEEMDAN-LSTM的地铁客流预测系统,该系统包括:数据存储模块,用于存储进站客流、出站客流、站厅温度、站厅湿度、站台温度、站台湿度、室外温度、室外湿度、站厅CO2浓度以及站台CO2浓度的历史数据;客流预测模块,用于根据历史数据的原始时间序列进行相关性分析,得到进站客流时间序列的相关特征序列;将所述进站客流时间序列作为可分解数据集,所述相关特征序列作为关联数据集,通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,每个IMF分量数据集与所述关联数据集融合成可训练数据集;通过所述可训练数据集训练LSTM神经网络模型,得到K个IMF分量对应的K个LSTM训练模型;对采集得到的待预测数据进行处理,得到K个待预测的序列,分别输入至K个IMF分量对应的LSTM模型,然后将K个模型的预测结果合并得到最终预测结果;所述对采集得到的待预测数据进行处理包括:待预测进站客流数据通过CEEMDAN算法分解获得K个IMF分量,K个IMF分量分别与同一时间相关特征序列融合得到K个待预测的序列。
所述客流预测模块通过Tensorflow Serving框架部署到服务器上,包括以下步骤:
(1)通过docker安装Tensorflow serving服务;
(2)配置部署模型及启动服务;
(3)通过http协议发送待预测数据,待预测数据经预测模型得到最终预测结果;
(4)根据实时数据和预测结果,通过评估函数定期自动更新预测模型。
有益效果:相比现有技术,本发明具有以下优点:采用CEEMDAN和LSTM结合的融合算法,CEEMDAN对进站客流进行模态分解有效提取数据信号特征,去除不同频率分量对原始信号的影响;同时采用多维度结合IMF分量分别建立LSTM训练模型,将每个IMF分量预测结果合成最终客流预测数据,使模型预测精度得到有效提升。同时,本发明还采用多种检测手段对原始数据进行预处理,提升了数据质量。本发明采用模型训练与模型部署分离方式,展现了系统的灵活性、扩展性与实时性。
附图说明
图1是本发明所述的基于CEEMDAN-LSTM的地铁客流预测方法的流程图;
图2是数据EMD流程图;
图3是本发明所述的基于CEEMDAN-LSTM的地铁客流预测方法中数据CEEMDAN流程图;
图4是本发明所述的基于CEEMDAN-LSTM的地铁客流预测方法中LSTM结构框图。
具体实施方式
下面结合附图对本发明作进一步描述。
实施例1
本发明所述的基于CEEMDAN-LSTM的地铁客流预测方法,主要针对轨道交通地铁短时客流进行建模、部署、预测,其流程如图1所示,包括以下步骤:
步骤1,根据采集到的闸机进出站客流、站厅温湿度、站台温湿度、室外温湿度、站厅CO2浓度、站台CO2浓度历史数据,分别分类成30分钟、60分钟、1小时的时间序列组;对时间序列进行数据预处理,下面以1小时时间序列为例叙述数据处理过程(即数据清洗)。
数据预处理是对所述原始时间序列进行序列有效性检验、平稳性检测、异常值检测及填充。
序列有效性检验,包括数据类型检验、时间顺序检验、重复性检验和时间频率检验;通过检测了解数据特征,修正或删去无效数据;
平稳性检验,是通过ADF检验算法,检测时间序列是否存在单位根;如果不存在单位根,则序列稳定;否则,序列不稳定,对于不稳定的序列需要通过取对数或差分运算以减少序列的不稳定性对模型的影响;通过检验删去不稳定的序列。ADF(Augmented Dickey-Fuller)检验算法包括以下几个内容:
a)无漂移项自回归过程:
b)带漂移项自回归过程:
c)带漂移项和趋势项自回归过程:
异常值检测及填充,包括:空值检测、箱线图异常点检测、孤立森林异常点检测、ARIMA自回归差分移动平均异常检测;所有检测出的异常点采用抽取的相同时间段正常数据随机填充;
通过对时间序列组进行序列有效性检验、平稳性检测、异常值检测及填充、相关性分析等数据清洗,得到高质量的数据集。
步骤2,将所述进站客流时间序列作为可分解数据集,所述相关特征序列作为关联数据集,通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,每个IMF分量数据集与所述关联数据集融合成K个可训练数据集。
下面详细说明本发明所述的CEEMDAN算法。
设为经过EMD分解后得到的第个本征模态分量,CEEMDAN分解得到的第个本征模态分量为为满足标准正态分布的高斯白噪声信号,为加入白噪声的次数,为白噪声的标准差表,为待分解信号。则CEEMDAN分解过程如图3所示,包括:
(2)对产生的N个模态分量进行总体平均得到CEEMDAN分解的第一个本征模态分量:
(3)计算去除第一个模态分量后的残差:
(5)计算去除第二个模态分量后的残差:
其中,EMD算法分解的目的是将一个信号分解为个固有模态函数(Intrinsic Mode Function, IMF)和一个残差。其中,每个IMF需要满足以下两个条件:(a)在整个数据范围内,局部极值点和过零点的数目必须相等或相差数目最多为1;(b)在任意时刻,局部最大值的包络和局部最小值的包络的平均值必须为零。
EMD的计算原理包括三个部分:
EMD分解流程如图2所示,包括以下步骤:
步骤3,根据闸机进站客流经过分解后的每个分量信号序列分别与同时间的相关特征序列合并形成LSTM模型训练的输入序列,单独的每个分量序列分别作为LSTM模型训练的输出,从而进行LSTM模型构建及训练,具体过程包括:
(3)构建LSTM网络,LSTM由输入层、隐层、输出层组成,它在隐含层中增加了记忆模块,从而可以使得LSTM可以记忆更多的历史信息。在记忆模块中包含由三个门:输入门、遗忘门、输出门。通过这些门,它可以决定哪些信息会被保存,哪些信息会被遗弃,保证了LSTM能更好记住历史信息中有用的部分,其结构如图4所示,包括:
遗忘门。遗忘门可以通过读取上一层隐含层的输出h t-1 以及当前时刻输入x t 来决定哪些信息会被保留,哪些信息会被遗忘。
滑动窗口、神经元个数、激活函数、优化函数、隐层单元个数、LSTM层个数作为超参,自动优化模型,最终获取最优参数组合的模型进行保存部署。
(4)训练评估LSTM模型。
(5)保存训练模型。
步骤4,对采集得到的待预测数据进行处理,得到K个待预测的序列,分别输入至K个IMF分量对应的LSTM模型,然后将K个模型的预测结果合并得到最终预测结果;对采集得到的待预测数据进行处理包括:待预测进站客流数据通过CEEMDAN算法分解获得K个IMF分量,K个IMF分量分别与同一时间相关特征序列融合得到K个待预测的序列。
本方法采用多种检测手段对原始数据进行预处理,提升了数据质量;采用CEEMDAN对进站客流进行模态分解有效提取数据信号特征,去除不同频率分量对原始信号的影响;同时采用多维度结合IMF分量分别建立LSTM训练模型,将每个IMF分量预测结果合成最终客流预测数据,模型预测精度得到有效提升。本发明采用模型训练与模型部署分离方式,展现了系统的灵活性、扩展性与实时性。模型可以根据历史数据的积累,定时自动训练模型,如果有更优模型则使用新模型进行预测,这就能做到自动学习,主动寻优,随着数据的积累预测会更精准高效。本预测系统能够根据历史数据的时间颗粒度提供15分钟、30分钟、60分钟预测模型,以满足不同运营场景需求;将模型训练与预测分开方便了系统部署,提高了系统的实时性、灵活性、实用性。
实施例2
本发明基于上述方法提出基于CEEMDAN-LSTM的地铁客流预测系统,包括数据存储模块和客流预测模块。具体的,数据存储模块包括城市轨道交通综合监控历史存储服务器,客流预测模块包括模型训练服务器和模型部署服务器,模型训练服务器通过数据库接口从存储服务器上获取数据进行清洗、建模训练,然后将训练好的模型部署到模型部署服务器上,通过模型部署服务器获取待预测的数据给出预测结果,同时将预测结果写入存储服务器。
(1)通过docker安装tensorflow serving服务。
(2)配置部署模型及启动服务。
(3)通过http协议发送需在线预测的数据,待预测数据经过数据清洗、数据归一化、进站数据CEEMDAN分解、分解数据与相关特征序列融合成待预测序列、分别输入IMF分量预测模型、合并各个IMF分量模型的预测结果得到、通过反归一化运算到实时获取预测结果。
(4)根据实时数据和预测结果的积累,可根据评估函数或定期自动更新模型,不断优化以提高预测精度,为地铁组织运营提供强有力的支撑。
Claims (9)
1.一种基于CEEMDAN-LSTM的地铁客流预测方法,其特征在于,包括以下步骤:
(1)根据进站客流、出站客流、站厅温度、站厅湿度、站台温度、站台湿度、室外温度、室外湿度、站厅CO2浓度以及站台CO2浓度的历史数据,构建原始时间序列;对原始时间序列进行相关性分析,得到进站客流时间序列的相关特征序列;
(2)将所述进站客流时间序列作为可分解数据集,同时间的相关特征序列作为关联数据集,通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,每个IMF分量数据集与所述关联数据集融合成K个可训练数据集;
(3)通过所述可训练数据集训练LSTM神经网络模型,得到K个IMF分量对应的K个LSTM训练模型;
(4)对采集得到的待预测数据进行处理,得到K个待预测的序列,分别输入至K个IMF分量对应的LSTM模型,然后将K个模型的预测结果合并得到最终预测结果;所述对采集得到的待预测数据进行处理包括:待预测进站客流数据通过CEEMDAN算法分解获得K个IMF分量,K个IMF分量分别与同一时间相关特征序列融合得到K个待预测的序列。
3.根据权利要求2所述的基于CEEMDAN-LSTM的地铁客流预测方法,其特征在于,所述的序列有效性检验,包括数据类型检验、时间顺序检验、重复性检验和时间频率检验,通过检测修正或删除无效数据;
所述的平稳性检验,是通过ADF检验算法,检测时间序列是否存在单位根;如果不存在单位根,则序列稳定;否则,序列不稳定,对于不稳定的序列通过对数据取对数或差分运算;通过检验删去无法修正的不稳定的序列;
所述的异常值检测及填充,包括:空值检测、箱线图异常点检测、孤立森林异常点检测、ARIMA自回归差分移动平均异常检测;所有检测出的异常点采用抽取的相同时间段正常数据随机填充;
所述相关性分析,是通过计算各数据类型与进站客流的相关性,去除相关性小及负相关的数据类型。
5.根据权利要求1所述的基于CEEMDAN-LSTM的地铁客流预测方法,其特征在于,所述的通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,包括:
(21)将高斯白噪声加入到待分解信号,并进行EMD分解,得到一阶本征模态分量:
(23)计算去除第一个本征模态分量后的残差:
(25)计算去除第二个本征模态分量后的残差:
(26)重复上述步骤(24)~(25),直到获得的残差信号为单调函数,不能继续分解,算法结束;则进站客流时间序列经过CEEMDAN分解得到IMF序列记为:
6.根据权利要求1所述的基于CEEMDAN-LSTM的地铁客流预测方法,其特征在于,所述的每个IMF分量数据集与所述关联数据集融合成K个可训练数据集,是指将进站客流时间序列经过CEEMDAN分解得到IMF序列中的每个IMF分量数据集分别与所述关联数据集合并。
7.根据权利要求1所述的基于CEEMDAN-LSTM的地铁客流预测方法,其特征在于,所述步骤(3)包括以下步骤:
(31)将每个可训练数据集中的序列进行归一化,采用的归一化算法如下:
(32)将归一化后的序列按滑动窗口算法切分成训练集、验证集、测试集;
(33)构建LSTM网络,LSTM网络包括输入层、隐层、输出层;其中输入层的数据包括样本个数、输入数据维数和输出数据维数;滑动窗口、神经元个数、激活函数、优化函数、隐层单元个数、LSTM层个数作为超参,通过优化获取最优参数组合的模型;
(34)采用平均绝对误差进行LSTM模型评估,所述平均绝对误差计算式为:
8.一种基于CEEMDAN-LSTM的地铁客流预测系统,其特征在于,该系统包括:
数据存储模块,用于存储进站客流、出站客流、站厅温度、站厅湿度、站台温度、站台湿度、室外温度、室外湿度、站厅CO2浓度以及站台CO2浓度的历史数据;
客流预测模块,用于根据历史数据的原始时间序列进行相关性分析,得到进站客流时间序列的相关特征序列;将所述进站客流时间序列作为可分解数据集,所述相关特征序列作为关联数据集,通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,每个IMF分量数据集与所述关联数据集融合成可训练数据集;通过所述可训练数据集训练LSTM神经网络模型,得到K个IMF分量对应的K个LSTM训练模型;对采集得到的待预测数据进行处理,得到K个待预测的序列,分别输入至K个IMF分量对应的LSTM模型,然后将K个模型的预测结果合并得到最终预测结果;所述对采集得到的待预测数据进行处理包括:待预测进站客流数据通过CEEMDAN算法分解获得K个IMF分量,K个IMF分量分别与同一时间相关特征序列融合得到K个待预测的序列。
9.根据权利要求8所述的基于CEEMDAN-LSTM的地铁客流预测系统,其特征在于,所述客流预测模块通过Tensorflow Serving框架部署到服务器上,包括以下步骤:
(1)通过docker安装tensorflow serving服务;
(2)配置部署模型及启动服务;
(3)通过http协议发送待预测数据,待预测数据经预测模型得到最终预测结果;
(4)根据实时数据和预测结果,通过评估函数定期自动更新预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211278952.0A CN115358491A (zh) | 2022-10-19 | 2022-10-19 | 一种基于ceemdan-lstm的地铁客流预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211278952.0A CN115358491A (zh) | 2022-10-19 | 2022-10-19 | 一种基于ceemdan-lstm的地铁客流预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115358491A true CN115358491A (zh) | 2022-11-18 |
Family
ID=84009018
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211278952.0A Pending CN115358491A (zh) | 2022-10-19 | 2022-10-19 | 一种基于ceemdan-lstm的地铁客流预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115358491A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115774861A (zh) * | 2022-12-22 | 2023-03-10 | 广东五度空间科技有限公司 | 一种自然资源多源异构数据汇聚融合服务系统 |
CN116468324A (zh) * | 2023-04-25 | 2023-07-21 | 北京化工大学 | 一种数据驱动的交通枢纽到达客流量分解-集成预测方法 |
CN117455553A (zh) * | 2023-12-08 | 2024-01-26 | 青岛理工大学 | 一种地铁站客流量预测的方法 |
CN118485186A (zh) * | 2024-07-16 | 2024-08-13 | 安徽省(水利部淮河水利委员会)水利科学研究院(安徽省水利工程质量检测中心站) | 城市用水量数据分析方法 |
CN118503808A (zh) * | 2024-07-18 | 2024-08-16 | 齐鲁工业大学(山东省科学院) | 一种海洋传感器监测数据漂移检测方法 |
CN118503808B (zh) * | 2024-07-18 | 2024-09-24 | 齐鲁工业大学(山东省科学院) | 一种海洋传感器监测数据漂移检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109886444A (zh) * | 2018-12-03 | 2019-06-14 | 深圳市北斗智能科技有限公司 | 一种交通短时客流预测方法、装置、设备和存储介质 |
CN109948861A (zh) * | 2019-03-26 | 2019-06-28 | 西南交通大学 | 一种基于模态分解及深度学习的城轨短时客流预测方法 |
CN111695722A (zh) * | 2020-05-13 | 2020-09-22 | 南京理工大学 | 一种城市轨道交通车站节假日短时客流预测方法 |
-
2022
- 2022-10-19 CN CN202211278952.0A patent/CN115358491A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109886444A (zh) * | 2018-12-03 | 2019-06-14 | 深圳市北斗智能科技有限公司 | 一种交通短时客流预测方法、装置、设备和存储介质 |
CN109948861A (zh) * | 2019-03-26 | 2019-06-28 | 西南交通大学 | 一种基于模态分解及深度学习的城轨短时客流预测方法 |
CN111695722A (zh) * | 2020-05-13 | 2020-09-22 | 南京理工大学 | 一种城市轨道交通车站节假日短时客流预测方法 |
Non-Patent Citations (3)
Title |
---|
MIN WANG等: "Short-time Passenger Flow Forecast of Urban Rail Transit Based on the CEEMDAN-BLSTM Model", 《2021 IEEE 5TH CONFERENCE ON ENERGY INTERNET AND ENERGY SYSTEM INTEGRATION (EI2)》 * |
张维等: "基于多元因素的Bi-LSTM 高速公路交通流预测", 《计算机系统应用》 * |
郑艳霞等: "《数学实验》", 30 September 2019, 中国经济出版社 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115774861A (zh) * | 2022-12-22 | 2023-03-10 | 广东五度空间科技有限公司 | 一种自然资源多源异构数据汇聚融合服务系统 |
CN116468324A (zh) * | 2023-04-25 | 2023-07-21 | 北京化工大学 | 一种数据驱动的交通枢纽到达客流量分解-集成预测方法 |
CN116468324B (zh) * | 2023-04-25 | 2024-01-05 | 北京化工大学 | 一种数据驱动的交通枢纽到达客流量分解-集成预测方法 |
CN117455553A (zh) * | 2023-12-08 | 2024-01-26 | 青岛理工大学 | 一种地铁站客流量预测的方法 |
CN117455553B (zh) * | 2023-12-08 | 2024-04-30 | 青岛理工大学 | 一种地铁站客流量预测的方法 |
CN118485186A (zh) * | 2024-07-16 | 2024-08-13 | 安徽省(水利部淮河水利委员会)水利科学研究院(安徽省水利工程质量检测中心站) | 城市用水量数据分析方法 |
CN118503808A (zh) * | 2024-07-18 | 2024-08-16 | 齐鲁工业大学(山东省科学院) | 一种海洋传感器监测数据漂移检测方法 |
CN118503808B (zh) * | 2024-07-18 | 2024-09-24 | 齐鲁工业大学(山东省科学院) | 一种海洋传感器监测数据漂移检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492830B (zh) | 一种基于时空深度学习的移动污染源排放浓度预测方法 | |
CN115358491A (zh) | 一种基于ceemdan-lstm的地铁客流预测方法及系统 | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN109117883B (zh) | 基于长短时记忆网络的sar影像海冰分类方法及系统 | |
CN111723929A (zh) | 一种基于神经网络的数值预报产品订正方法、装置和系统 | |
Patwary et al. | Metamodel-based calibration of large-scale multimodal microscopic traffic simulation | |
CN114495507B (zh) | 融合时空注意力神经网络和交通模型的交通流预测方法 | |
CN110348601A (zh) | 一种基于双向长短期记忆网络的地铁短期客流量预测方法 | |
CN111178628A (zh) | 一种行李到达时间预测方法及装置 | |
CN108415885A (zh) | 基于近邻回归的实时公交客流预测方法 | |
CN110990718A (zh) | 一种公司形象提升系统的社会网络模型构建模块 | |
CN110796315A (zh) | 基于时效信息和深度学习的离港航班延误预测方法 | |
CN111784022A (zh) | 一种基于Wrapper方法与SVM方法结合的短时邻近大雾预测方法 | |
CN110459056A (zh) | 一种基于lstm神经网络的公交到站时间预测方法 | |
CN117494034A (zh) | 基于交通拥堵指数和多源数据融合的空气质量预测方法 | |
CN114781704B (zh) | 一种基于过站航班保障流程的航班延误预测方法 | |
CN116957331A (zh) | 风险旅客流量范围预测方法和装置 | |
CN112365037A (zh) | 基于长短期数据预测模型的机场空域流量预测方法 | |
Wambura et al. | Robust anomaly detection in feature-evolving time series | |
CN116797274A (zh) | 一种基于Attention-LSTM-LightGBM的共享单车需求量预测方法 | |
CN111141879A (zh) | 一种深度学习的空气质量监测方法以及装置、设备 | |
CN113221472B (zh) | 一种基于lstm的客流预测方法 | |
Rasaizadi et al. | Short‐Term Prediction of Traffic State for a Rural Road Applying Ensemble Learning Process | |
CN117436653A (zh) | 一种网约车出行需求的预测模型构建方法和预测方法 | |
Nivitha et al. | An Ensemble Approach for Flight Delay Prediction Through Spatiotemporal Parameters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20221118 |
|
RJ01 | Rejection of invention patent application after publication |