CN115358491A - 一种基于ceemdan-lstm的地铁客流预测方法及系统 - Google Patents

一种基于ceemdan-lstm的地铁客流预测方法及系统 Download PDF

Info

Publication number
CN115358491A
CN115358491A CN202211278952.0A CN202211278952A CN115358491A CN 115358491 A CN115358491 A CN 115358491A CN 202211278952 A CN202211278952 A CN 202211278952A CN 115358491 A CN115358491 A CN 115358491A
Authority
CN
China
Prior art keywords
data
passenger flow
sequence
lstm
ceemdan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211278952.0A
Other languages
English (en)
Inventor
徐宏伟
梁奕
费洋
丁志燕
刘鹏宇
陆艮峰
林晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nari Rail Transit Technology Co ltd
Original Assignee
Nari Rail Transit Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nari Rail Transit Technology Co ltd filed Critical Nari Rail Transit Technology Co ltd
Priority to CN202211278952.0A priority Critical patent/CN115358491A/zh
Publication of CN115358491A publication Critical patent/CN115358491A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于CEEMDAN‑LSTM的地铁客流预测方法及系统,根据采集到的历史数据,通过CEEMDAN算法将可分解数据集分解成K个IMF分量数据集,每个IMF分量数据集与关联数据融合成可训练数据集,通过可训练数据集训练构建的LSTM神经网络模型得到K个IMF分量的LSTM训练模型;通过Tensorflow serving将K个IMF分量的LSTM训练模型进行部署,通过将待预测的实时数据输入至LSTM完整模型得到预测结果。本发明采用CEEMDAN对关注数据进行分解提取更多数据特征,融合其它空间特征数据,从时空多维度、全方位对预测模型构建、优化、更新,提高了预测精度。

Description

一种基于CEEMDAN-LSTM的地铁客流预测方法及系统
技术领域
本发明涉及一种地铁客流预测方法,尤其涉及一种基于CEEMDAN-LSTM的地铁客流预测方法及系统。
背景技术
随着城市规模的发展以及人口增多,城市拥堵越来越突出,而城市轨道交通地铁具有载运量大、准时、方便快捷等特点,得到快速发展,目前众多城市轨道交通系统已经实现网络化运营,短时客流对居民出行、地铁运营、列车运行组织起到至关重要的影响。通过对未来一段时间的地铁客流精准预测,城市轨道交通可以为居民提供实时可靠的数据,居民根据系统提供的数据和自身情况,对出行计划和路线做出及时调整;还能为地铁运营人员组织优化运营以及提供客流疏导、合理安排人员、优化线网运力配置、制定车站客流组织与疏散方案、优化列车行车间隔等提供数据支撑,不断提高城市轨道交通运营水平。
地铁客流具有明显周期性、工作日的早晚高峰与平峰时差异大、客流受室外温度和室外天气影响较大、节假日特征明显等鲜明特点,它的非平稳性、随机性给单一预测手段带来极大挑战,单一算法很难覆盖地铁客流的所有特征,预测精度低则失去了客流指导其它工作的意义。
当前地铁短时客流预测主要集中于算法的选择与优化以及时域分析上,忽略了客流时间依赖性、空间关联性与外部随机噪声的影响,没能从客流信号和相关维度提取足够多的特征使得预测模型精度较低。然而客流预测模型输入属性的质量直接影响模型精度,输入属性过少或者不当,特征涵盖不完整,则预测精度偏低,输入属性太多,使得模型太复杂,出现梯度爆炸,训练时间太长,造成计算资源浪费或者出现无法求解等问题。
发明内容
发明目的:针对以上问题,本发明提出一种基于CEEMDAN-LSTM的地铁客流预测方法及系统,能够明显提高预测精度,并通过部署应用形成了一套完整客流预测系统。
技术方案:本发明所采用的技术方案是一种基于CEEMDAN-LSTM的地铁客流预测方法,CEEMDAN为完全自适应噪声辅助聚合经验模态分解(Complete Ensemble EmpiricalMode Decomposition with Adaptive Noise);LSTM为长短记忆神经网络(Long ShortTerm Memory);该方法包括:
(1)根据采集到的进站客流、出站客流、站厅温度、站厅湿度、站台温度、站台湿度、室外温度、室外湿度、站厅CO2浓度以及站台CO2浓度的历史数据,构建原始时间序列;对原始时间序列进行相关性分析,得到进站客流时间序列的相关特征序列;其中,所述的构建原始时间序列为:
Figure 825105DEST_PATH_IMAGE001
其中df为构建的原始时间序列,I p 为进站客流,O p 为出站客流,T h 为站厅温度,H h 为站厅湿度,T p 为站台温度,H p 为站台湿度,C h 为站厅CO2浓度,C p 为站台CO2浓度,T o 为室外温度,H o 为室外湿度。
在对原始时间序列进行相关性分析之前,还包括数据预处理,所述数据预处理是对所述原始时间序列进行序列有效性检验、平稳性检测、异常值检测及填充。
进一步的,所述的序列有效性检验,包括数据类型检验、时间顺序检验、重复性检验和时间频率检验;通过检测了解数据特征,修正或删去无效数据;
所述的平稳性检验,是通过ADF检验算法,检测时间序列是否存在单位根;如果不存在单位根,则序列稳定;否则,序列不稳定,对于不稳定的序列需要通过取对数或差分运算以减少序列的不稳定性对模型的影响;通过检验删去不稳定的序列。进一步的,ADF检验算法包括:
a)无漂移项自回归过程:
Figure 69267DEST_PATH_IMAGE002
b)带漂移项自回归过程:
Figure 729924DEST_PATH_IMAGE003
c)带漂移项和趋势项自回归过程:
Figure 371121DEST_PATH_IMAGE004
其中,
Figure 260580DEST_PATH_IMAGE005
Figure 153056DEST_PATH_IMAGE006
时刻的进站客流,
Figure 469768DEST_PATH_IMAGE007
为常量系数,
Figure 316370DEST_PATH_IMAGE008
Figure 556990DEST_PATH_IMAGE009
时刻的进站客流,
Figure 265093DEST_PATH_IMAGE010
为选择时间点之前的
Figure 221548DEST_PATH_IMAGE010
个时间点,
Figure 86604DEST_PATH_IMAGE011
为前后两个时刻进站客流偏差系数,
Figure 52286DEST_PATH_IMAGE012
Figure 702711DEST_PATH_IMAGE013
Figure 111957DEST_PATH_IMAGE014
的差分,
Figure 683884DEST_PATH_IMAGE015
为常数项,
Figure 171366DEST_PATH_IMAGE016
为时间趋势项,
Figure 676297DEST_PATH_IMAGE017
为随机扰动项。这三个过程是并列的,分别检测序列属于哪个过程。
所述的异常值检测及填充,包括:空值检测、箱线图异常点检测、孤立森林异常点检测、ARIMA自回归差分移动平均异常检测;所有检测出的异常点采用抽取的相同时间段正常数据随机填充;
所述相关性分析,是通过计算各数据与闸机进站客流的相关性,去除相关性小及负相关的分量。
(2)将所述进站客流时间序列作为可分解数据集,同时间的相关特征序列作为关联数据集,通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,每个IMF分量数据集与所述关联数据集融合成K个可训练数据集;其中,所述的每个IMF分量数据集与所述关联数据集融合成K个可训练数据集,是指将进站客流时间序列
Figure 519095DEST_PATH_IMAGE018
经过CEEMDAN分解得到IMF序列中的每个IMF分量数据集分别与所述关联数据集合并。
所述的通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,包括:
(21)将高斯白噪声加入到待分解信号,并进行EMD分解,得到一阶本征模态分量:
Figure 843897DEST_PATH_IMAGE019
式中,
Figure 416960DEST_PATH_IMAGE020
代表EMD分解,
Figure 25665DEST_PATH_IMAGE021
为随时间变化的进站客流,
Figure 25982DEST_PATH_IMAGE022
为自然数,
Figure 103660DEST_PATH_IMAGE023
为满足标准正态分布的高斯白噪声信号,
Figure 231147DEST_PATH_IMAGE024
为加入白噪声的次数,
Figure 445090DEST_PATH_IMAGE025
为白噪声的标准差;
Figure 616309DEST_PATH_IMAGE026
为第一阶本征模态分量,
Figure 164971DEST_PATH_IMAGE027
为原始序列加入白噪声后上下包络的平均值;
(22)对产生的
Figure 79837DEST_PATH_IMAGE028
个模态分量进行总体平均得到CEEMDAN分解的第一个本征模态分量:
Figure 630511DEST_PATH_IMAGE029
式中,
Figure 972630DEST_PATH_IMAGE030
为CEEMDAN分解得到的第一个本征模态分量;
(23)计算去除第一个本征模态分量后的残差:
Figure 477430DEST_PATH_IMAGE031
式中,
Figure 930408DEST_PATH_IMAGE032
为第一个残差;
(24)在
Figure 807359DEST_PATH_IMAGE032
中加入正负成对高斯白噪声,并进行EMD分解,得到一阶模态分量,由此得到CEEMDAN分解的第二个本征模态分量:
Figure 320380DEST_PATH_IMAGE033
式中,
Figure 578055DEST_PATH_IMAGE034
为经过两次EMD分解的模态分量;
(25)计算去除第二个本征模态分量后的残差:
Figure 569145DEST_PATH_IMAGE035
(26)重复上述步骤(24)~(55),直到获得的残差信号为单调函数,不能继续分解,算法结束;得到的本征模态分量数量为
Figure 359990DEST_PATH_IMAGE036
,则原始信号
Figure 43912DEST_PATH_IMAGE018
被分解为:
Figure 70774DEST_PATH_IMAGE037
原始信号
Figure 114822DEST_PATH_IMAGE018
经过CEEMDAN分解得到IMF序列记为:
Figure 12371DEST_PATH_IMAGE038
式中,
Figure 132774DEST_PATH_IMAGE039
为IMF序列,
Figure 866506DEST_PATH_IMAGE040
表示K个分量。
(3)通过所述可训练数据集训练LSTM神经网络模型,得到K个IMF分量对应的K个LSTM训练模型,包括以下步骤:
(31)将可训练数据集中每个序列进行归一化,采用的归一化算法如下:
Figure 730557DEST_PATH_IMAGE041
Figure 482612DEST_PATH_IMAGE042
式中
Figure 757604DEST_PATH_IMAGE043
为需要归一化的序列;
Figure 227900DEST_PATH_IMAGE044
Figure 895642DEST_PATH_IMAGE045
Figure 515586DEST_PATH_IMAGE043
的最小值与最大值;
Figure 712212DEST_PATH_IMAGE046
Figure 935383DEST_PATH_IMAGE043
的标准差;
Figure 124924DEST_PATH_IMAGE047
Figure 117151DEST_PATH_IMAGE043
的归一化后的序列;
Figure 750258DEST_PATH_IMAGE048
Figure 211457DEST_PATH_IMAGE049
为归一化范围;
(32)将归一化后的可训练数据集中序列按滑动窗口
Figure 955422DEST_PATH_IMAGE050
切分成训练集、验证集、测试集;
(33)构建LSTM网络,LSTM网络由输入层、隐层、输出层组成;其中输入层的数据形状为
Figure 536576DEST_PATH_IMAGE051
Figure 589852DEST_PATH_IMAGE052
为样本个数,
Figure 787615DEST_PATH_IMAGE053
为输入数据维数,
Figure 335271DEST_PATH_IMAGE054
为输出数据维数;滑动窗口、神经元个数、激活函数、优化函数、隐层单元个数、LSTM层个数作为超参,自动优化模型,获取最优参数组合的模型;
(34)采用平均绝对误差进行模型评估以训练LSTM模型,所述平均绝对误差计算式为:
Figure 518734DEST_PATH_IMAGE055
式中,MAE为平均绝对误差,
Figure 493644DEST_PATH_IMAGE056
为实际值即进站客流,
Figure 647544DEST_PATH_IMAGE057
为进站客流的预测值,
Figure 248159DEST_PATH_IMAGE052
为预测进站客流的个数;
由可训练数据集训练后产生的模型记为:
Figure 803905DEST_PATH_IMAGE058
式中,
Figure 949716DEST_PATH_IMAGE059
表示进站客流经过CEEMDAN分解后K个IMF分量序列分别与相关序列形成的K个训练序列通过LSTM序列训练的K个模型。
(4)对采集得到的待预测数据进行处理,得到K个待预测的序列,分别输入至K个IMF分量对应的LSTM模型,然后将K个模型的预测结果合并得到最终预测结果;对采集得到的待预测数据进行处理包括:待预测进站客流数据通过CEEMDAN算法分解获得K个IMF分量,K个IMF分量分别与同一时间相关特征序列融合得到K个待预测的序列。
本发明还提出一种基于CEEMDAN-LSTM的地铁客流预测系统,该系统包括:数据存储模块,用于存储进站客流、出站客流、站厅温度、站厅湿度、站台温度、站台湿度、室外温度、室外湿度、站厅CO2浓度以及站台CO2浓度的历史数据;客流预测模块,用于根据历史数据的原始时间序列进行相关性分析,得到进站客流时间序列的相关特征序列;将所述进站客流时间序列作为可分解数据集,所述相关特征序列作为关联数据集,通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,每个IMF分量数据集与所述关联数据集融合成可训练数据集;通过所述可训练数据集训练LSTM神经网络模型,得到K个IMF分量对应的K个LSTM训练模型;对采集得到的待预测数据进行处理,得到K个待预测的序列,分别输入至K个IMF分量对应的LSTM模型,然后将K个模型的预测结果合并得到最终预测结果;所述对采集得到的待预测数据进行处理包括:待预测进站客流数据通过CEEMDAN算法分解获得K个IMF分量,K个IMF分量分别与同一时间相关特征序列融合得到K个待预测的序列。
所述客流预测模块通过Tensorflow Serving框架部署到服务器上,包括以下步骤:
(1)通过docker安装Tensorflow serving服务;
(2)配置部署模型及启动服务;
(3)通过http协议发送待预测数据,待预测数据经预测模型得到最终预测结果;
(4)根据实时数据和预测结果,通过评估函数定期自动更新预测模型。
有益效果:相比现有技术,本发明具有以下优点:采用CEEMDAN和LSTM结合的融合算法,CEEMDAN对进站客流进行模态分解有效提取数据信号特征,去除不同频率分量对原始信号的影响;同时采用多维度结合IMF分量分别建立LSTM训练模型,将每个IMF分量预测结果合成最终客流预测数据,使模型预测精度得到有效提升。同时,本发明还采用多种检测手段对原始数据进行预处理,提升了数据质量。本发明采用模型训练与模型部署分离方式,展现了系统的灵活性、扩展性与实时性。
附图说明
图1是本发明所述的基于CEEMDAN-LSTM的地铁客流预测方法的流程图;
图2是数据EMD流程图;
图3是本发明所述的基于CEEMDAN-LSTM的地铁客流预测方法中数据CEEMDAN流程图;
图4是本发明所述的基于CEEMDAN-LSTM的地铁客流预测方法中LSTM结构框图。
具体实施方式
下面结合附图对本发明作进一步描述。
实施例1
本发明所述的基于CEEMDAN-LSTM的地铁客流预测方法,主要针对轨道交通地铁短时客流进行建模、部署、预测,其流程如图1所示,包括以下步骤:
步骤1,根据采集到的闸机进出站客流、站厅温湿度、站台温湿度、室外温湿度、站厅CO2浓度、站台CO2浓度历史数据,分别分类成30分钟、60分钟、1小时的时间序列组;对时间序列进行数据预处理,下面以1小时时间序列为例叙述数据处理过程(即数据清洗)。
数据预处理是对所述原始时间序列进行序列有效性检验、平稳性检测、异常值检测及填充。
序列有效性检验,包括数据类型检验、时间顺序检验、重复性检验和时间频率检验;通过检测了解数据特征,修正或删去无效数据;
平稳性检验,是通过ADF检验算法,检测时间序列是否存在单位根;如果不存在单位根,则序列稳定;否则,序列不稳定,对于不稳定的序列需要通过取对数或差分运算以减少序列的不稳定性对模型的影响;通过检验删去不稳定的序列。ADF(Augmented Dickey-Fuller)检验算法包括以下几个内容:
a)无漂移项自回归过程:
Figure 76066DEST_PATH_IMAGE060
b)带漂移项自回归过程:
Figure 152475DEST_PATH_IMAGE061
c)带漂移项和趋势项自回归过程:
Figure 828307DEST_PATH_IMAGE062
其中,
Figure 751876DEST_PATH_IMAGE005
Figure 349211DEST_PATH_IMAGE006
时刻的进站客流,
Figure 261934DEST_PATH_IMAGE007
为常量系数,
Figure 526694DEST_PATH_IMAGE008
Figure 997995DEST_PATH_IMAGE009
时刻的进站客流,
Figure 613784DEST_PATH_IMAGE010
为选择时间点之前的
Figure 110625DEST_PATH_IMAGE010
个时间点,
Figure 243272DEST_PATH_IMAGE011
为前后两个时刻进站客流偏差系数,
Figure 901787DEST_PATH_IMAGE012
Figure 270451DEST_PATH_IMAGE013
Figure 305403DEST_PATH_IMAGE014
的差分,
Figure 325181DEST_PATH_IMAGE015
为常数项,
Figure 154596DEST_PATH_IMAGE016
为时间趋势项,
Figure 744978DEST_PATH_IMAGE017
为随机扰动项。
异常值检测及填充,包括:空值检测、箱线图异常点检测、孤立森林异常点检测、ARIMA自回归差分移动平均异常检测;所有检测出的异常点采用抽取的相同时间段正常数据随机填充;
通过对时间序列组进行序列有效性检验、平稳性检测、异常值检测及填充、相关性分析等数据清洗,得到高质量的数据集。
对原始时间序列的每个类型进行清洗后得到的时间序列记为:
Figure 272036DEST_PATH_IMAGE063
,对
Figure 100315DEST_PATH_IMAGE063
进行相关性分析,去除相关性小或负相关的分量:经分析得到进站客流对站厅与站台温湿度,站厅CO2影响很小,即去除
Figure 349900DEST_PATH_IMAGE064
Figure 427577DEST_PATH_IMAGE065
Figure 804332DEST_PATH_IMAGE066
Figure 55095DEST_PATH_IMAGE067
Figure 429576DEST_PATH_IMAGE068
后赋值给
Figure 243817DEST_PATH_IMAGE063
Figure 424262DEST_PATH_IMAGE069
在预测过程中,除
Figure 492712DEST_PATH_IMAGE070
以外的序列为同一时间相关特征序列,即
Figure 319985DEST_PATH_IMAGE071
步骤2,将所述进站客流时间序列作为可分解数据集,所述相关特征序列作为关联数据集,通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,每个IMF分量数据集与所述关联数据集融合成K个可训练数据集。
Figure 841096DEST_PATH_IMAGE063
分成
Figure 215446DEST_PATH_IMAGE072
可分解和
Figure 214101DEST_PATH_IMAGE073
不可分解序列,可分解序列作为可分解数据集,不可分解序列作为关联数据集,对
Figure 618800DEST_PATH_IMAGE072
进行CEEMDAN分解。
Figure 610896DEST_PATH_IMAGE074
Figure 867565DEST_PATH_IMAGE075
式中,
Figure 658410DEST_PATH_IMAGE070
为进站客流,待分解的目标序列,预测的目标即为闸机进站客流。
下面详细说明本发明所述的CEEMDAN算法。
Figure 607911DEST_PATH_IMAGE076
为经过EMD分解后得到的第
Figure 103615DEST_PATH_IMAGE077
个本征模态分量,CEEMDAN分解得到的第
Figure 678822DEST_PATH_IMAGE077
个本征模态分量为
Figure 576370DEST_PATH_IMAGE078
为满足标准正态分布的高斯白噪声信号,
Figure 696773DEST_PATH_IMAGE024
为加入白噪声的次数,
Figure 696084DEST_PATH_IMAGE025
为白噪声的标准差表,
Figure 560135DEST_PATH_IMAGE021
为待分解信号。则CEEMDAN分解过程如图3所示,包括:
(1)将高斯白噪声加入到待分解信号
Figure 577770DEST_PATH_IMAGE021
得到新信号
Figure 118341DEST_PATH_IMAGE079
,其中
Figure 854216DEST_PATH_IMAGE080
,对新信号进行EMD分解,得到第一阶本征模态分量
Figure 521958DEST_PATH_IMAGE081
Figure 394099DEST_PATH_IMAGE019
(2)对产生的N个模态分量进行总体平均得到CEEMDAN分解的第一个本征模态分量:
Figure 338528DEST_PATH_IMAGE029
(3)计算去除第一个模态分量后的残差:
Figure 30540DEST_PATH_IMAGE082
(4)在
Figure 423344DEST_PATH_IMAGE032
中加入正负成对高斯白噪声得到新信号,以新信号为载体进行EMD分解,得到第一阶模态分量
Figure 415571DEST_PATH_IMAGE083
,由此可以得到CEEMDAN分解的第二个本征模态分量:
Figure 799410DEST_PATH_IMAGE084
(5)计算去除第二个模态分量后的残差:
Figure 978719DEST_PATH_IMAGE035
(6)重复上述步骤,直到获得的残差信号为单调函数,不能继续分解,算法结束。此时得到的本征模态分量数量为
Figure 722684DEST_PATH_IMAGE036
,则原始信号
Figure 818685DEST_PATH_IMAGE018
被分解为:
Figure 622693DEST_PATH_IMAGE037
其中,EMD算法分解的目的是将一个信号
Figure 820456DEST_PATH_IMAGE085
分解为
Figure 850335DEST_PATH_IMAGE028
个固有模态函数(Intrinsic Mode Function, IMF)和一个残差。其中,每个IMF需要满足以下两个条件:(a)在整个数据范围内,局部极值点和过零点的数目必须相等或相差数目最多为1;(b)在任意时刻,局部最大值的包络和局部最小值的包络的平均值必须为零。
EMD的计算原理包括三个部分:
(1)找到原始信号
Figure 551575DEST_PATH_IMAGE085
的所有极大值点,通过三次样条函数拟合出极大值包络线
Figure 526484DEST_PATH_IMAGE086
;同理,找到原始信号
Figure 460811DEST_PATH_IMAGE085
的所有极小值点,通过三次样条函数拟合出信号的极小值包络线
Figure 812158DEST_PATH_IMAGE087
(2)计算上、下包络的平均值
Figure 367904DEST_PATH_IMAGE088
Figure 779294DEST_PATH_IMAGE089
(3)将原始信号序列减去
Figure 436803DEST_PATH_IMAGE090
就得到一个去掉低频的新信号
Figure 60682DEST_PATH_IMAGE091
Figure 736514DEST_PATH_IMAGE092
一般
Figure 36914DEST_PATH_IMAGE091
不是一个平稳信号,不满足IMF定义的两个条件,重复上述过程,假定经过
Figure 165407DEST_PATH_IMAGE010
次之后
Figure 858557DEST_PATH_IMAGE093
满足IMF的定义,则原始信号
Figure 402277DEST_PATH_IMAGE085
的一阶IMF分量为:
Figure 889890DEST_PATH_IMAGE094
用原始信号
Figure 771259DEST_PATH_IMAGE085
减去
Figure 251787DEST_PATH_IMAGE095
,得到一个去掉高频成分的新信号
Figure 636632DEST_PATH_IMAGE032
Figure 560726DEST_PATH_IMAGE096
Figure 929390DEST_PATH_IMAGE032
重复得到
Figure 449496DEST_PATH_IMAGE095
的过程,得到第二个IMF分量
Figure 954426DEST_PATH_IMAGE097
,如此重复这一过程直到第
Figure 783842DEST_PATH_IMAGE052
阶IMF分量
Figure 889070DEST_PATH_IMAGE098
或其余量
Figure 665396DEST_PATH_IMAGE099
小于预设值;或当残余分量
Figure 241478DEST_PATH_IMAGE099
是单调函数或常量时,EMD分解过程停止。
EMD分解流程如图2所示,包括以下步骤:
(1)初始化:
Figure 241795DEST_PATH_IMAGE100
(2)得到第
Figure 37582DEST_PATH_IMAGE077
个IMF:
(a)初始化:
Figure 148757DEST_PATH_IMAGE101
(b)找出
Figure 113433DEST_PATH_IMAGE102
的局部极值点;
(c)对
Figure 19072DEST_PATH_IMAGE102
的极大和极小值点分别进行三次样条函数插值,形成上下包络线;
(d)计算上下包络线的平均值
Figure 567734DEST_PATH_IMAGE103
(e)
Figure 217021DEST_PATH_IMAGE104
(f)若
Figure 816630DEST_PATH_IMAGE105
是IMF函数,则
Figure 906552DEST_PATH_IMAGE106
;否则,
Figure 693243DEST_PATH_IMAGE107
,转到(b);
(3)
Figure 864330DEST_PATH_IMAGE108
(4)如果
Figure 318445DEST_PATH_IMAGE109
极值点数仍多于2个,则
Figure 565887DEST_PATH_IMAGE110
,转到(2);否则,分解结束,
Figure 856185DEST_PATH_IMAGE109
是残余分量。算法最后可得:
Figure 378433DEST_PATH_IMAGE111
根据CEEMDAN算法处理过程对原始闸机进站客流进行分解处理,原始信号
Figure 421475DEST_PATH_IMAGE018
经过CEEMDAN分解得到IMF序列记为:
Figure 370977DEST_PATH_IMAGE112
Figure 115948DEST_PATH_IMAGE039
每个分量序列分别与
Figure 441887DEST_PATH_IMAGE073
进行合并形成可训练的序列记为
Figure 605015DEST_PATH_IMAGE113
Figure 231079DEST_PATH_IMAGE114
步骤3,根据闸机进站客流经过分解后的每个分量信号序列分别与同时间的相关特征序列合并形成LSTM模型训练的输入序列,单独的每个分量序列分别作为LSTM模型训练的输出,从而进行LSTM模型构建及训练,具体过程包括:
(1)将
Figure 745237DEST_PATH_IMAGE113
中每个序列进行归一化,以减少数据波动对训练模型的影响。采用的归一化算法如下:
Figure 609288DEST_PATH_IMAGE115
Figure 626922DEST_PATH_IMAGE116
式中,
Figure 433073DEST_PATH_IMAGE043
为需要归一化的序列;
Figure 903369DEST_PATH_IMAGE044
Figure 305531DEST_PATH_IMAGE045
Figure 928405DEST_PATH_IMAGE043
的最小值与最大值;
Figure 656189DEST_PATH_IMAGE046
Figure 613781DEST_PATH_IMAGE043
的标准差;
Figure 85213DEST_PATH_IMAGE047
Figure 326708DEST_PATH_IMAGE043
的归一化后的序列;
Figure 694235DEST_PATH_IMAGE048
Figure 404702DEST_PATH_IMAGE049
为归一化范围,这里取0和1。
Figure 630891DEST_PATH_IMAGE113
归一化后记为:
Figure 946466DEST_PATH_IMAGE117
(2)将
Figure 468583DEST_PATH_IMAGE118
按滑动窗口
Figure 354761DEST_PATH_IMAGE050
切分成训练集、验证集、测试集分别记为:
Figure 902417DEST_PATH_IMAGE119
Figure 790608DEST_PATH_IMAGE120
Figure 499938DEST_PATH_IMAGE121
。滑动窗口
Figure 184997DEST_PATH_IMAGE050
为以
Figure 18568DEST_PATH_IMAGE050
长度依次在时间序列上移动获取训练样本的方法即每
Figure 308735DEST_PATH_IMAGE050
个时间序列预测一个输出。
(3)构建LSTM网络,LSTM由输入层、隐层、输出层组成,它在隐含层中增加了记忆模块,从而可以使得LSTM可以记忆更多的历史信息。在记忆模块中包含由三个门:输入门、遗忘门、输出门。通过这些门,它可以决定哪些信息会被保存,哪些信息会被遗弃,保证了LSTM能更好记住历史信息中有用的部分,其结构如图4所示,包括:
遗忘门。遗忘门可以通过读取上一层隐含层的输出h t-1 以及当前时刻输入x t 来决定哪些信息会被保留,哪些信息会被遗忘。
Figure 703813DEST_PATH_IMAGE122
)
输入门。输入门确定将哪些信息保存到细胞状态Cell中,它通过
Figure 345010DEST_PATH_IMAGE123
函数确定输入量并通过
Figure 234468DEST_PATH_IMAGE124
函数确定输入到新Cell状态c t 中的向量。
Figure 395453DEST_PATH_IMAGE125
Figure 977744DEST_PATH_IMAGE126
Figure 106237DEST_PATH_IMAGE127
输出门。输出门通过
Figure 783075DEST_PATH_IMAGE123
函数确定输出部分,并由
Figure 313414DEST_PATH_IMAGE124
函数对细胞状态c t 处理后与其相乘确定输出。
Figure 66606DEST_PATH_IMAGE128
Figure 164619DEST_PATH_IMAGE129
其中f、i、g、c、o分别代表遗忘门、输入门、备选的用来更新的细胞状态、更新后的细胞状态和输出门的特征变量,W代表对用权重,b为偏执,σ和
Figure 395880DEST_PATH_IMAGE124
分别代表
Figure 46304DEST_PATH_IMAGE123
Figure 954086DEST_PATH_IMAGE124
激活函数。
输入层的数据形状为
Figure 322751DEST_PATH_IMAGE051
Figure 357703DEST_PATH_IMAGE052
为样本个数,
Figure 862633DEST_PATH_IMAGE053
为输入数据维数,
Figure 911623DEST_PATH_IMAGE054
输出数据维数;
滑动窗口、神经元个数、激活函数、优化函数、隐层单元个数、LSTM层个数作为超参,自动优化模型,最终获取最优参数组合的模型进行保存部署。
Figure 236425DEST_PATH_IMAGE130
Figure 58757DEST_PATH_IMAGE131
Figure 418194DEST_PATH_IMAGE132
Figure 684090DEST_PATH_IMAGE133
Figure 243991DEST_PATH_IMAGE134
Figure 355166DEST_PATH_IMAGE135
模型学习率最小为
Figure 834689DEST_PATH_IMAGE136
,根据模型训练过程自动调整学习率以便达到收敛速度和学习效果的平衡。
批次大小
Figure 255175DEST_PATH_IMAGE137
,这个根据训练机器性能适当调整。
训练次数
Figure 554570DEST_PATH_IMAGE138
,模型根据样本数据量自动计算实际
Figure 735015DEST_PATH_IMAGE139
大小,最大不超过上限值。
(4)训练评估LSTM模型。
采用
Figure 85356DEST_PATH_IMAGE140
平均绝对误差进行模型评估:
Figure 693055DEST_PATH_IMAGE141
式中,MAE为平均绝对误差,
Figure 948587DEST_PATH_IMAGE056
为实际值即进站客流,
Figure 916412DEST_PATH_IMAGE057
为进站客流的预测值,
Figure 104948DEST_PATH_IMAGE052
为预测进站客流的个数;
(5)保存训练模型。
根据
Figure 883548DEST_PATH_IMAGE113
数据特征训练后产生的模型记为:
Figure 639758DEST_PATH_IMAGE058
步骤4,对采集得到的待预测数据进行处理,得到K个待预测的序列,分别输入至K个IMF分量对应的LSTM模型,然后将K个模型的预测结果合并得到最终预测结果;对采集得到的待预测数据进行处理包括:待预测进站客流数据通过CEEMDAN算法分解获得K个IMF分量,K个IMF分量分别与同一时间相关特征序列融合得到K个待预测的序列。
本方法采用多种检测手段对原始数据进行预处理,提升了数据质量;采用CEEMDAN对进站客流进行模态分解有效提取数据信号特征,去除不同频率分量对原始信号的影响;同时采用多维度结合IMF分量分别建立LSTM训练模型,将每个IMF分量预测结果合成最终客流预测数据,模型预测精度得到有效提升。本发明采用模型训练与模型部署分离方式,展现了系统的灵活性、扩展性与实时性。模型可以根据历史数据的积累,定时自动训练模型,如果有更优模型则使用新模型进行预测,这就能做到自动学习,主动寻优,随着数据的积累预测会更精准高效。本预测系统能够根据历史数据的时间颗粒度提供15分钟、30分钟、60分钟预测模型,以满足不同运营场景需求;将模型训练与预测分开方便了系统部署,提高了系统的实时性、灵活性、实用性。
实施例2
本发明基于上述方法提出基于CEEMDAN-LSTM的地铁客流预测系统,包括数据存储模块和客流预测模块。具体的,数据存储模块包括城市轨道交通综合监控历史存储服务器,客流预测模块包括模型训练服务器和模型部署服务器,模型训练服务器通过数据库接口从存储服务器上获取数据进行清洗、建模训练,然后将训练好的模型部署到模型部署服务器上,通过模型部署服务器获取待预测的数据给出预测结果,同时将预测结果写入存储服务器。
将训练好的模型
Figure 162006DEST_PATH_IMAGE142
通过Tensorflow Serving框架进行部署包含:
(1)通过docker安装tensorflow serving服务。
(2)配置部署模型及启动服务。
(3)通过http协议发送需在线预测的数据,待预测数据经过数据清洗、数据归一化、进站数据CEEMDAN分解、分解数据与相关特征序列融合成待预测序列、分别输入IMF分量预测模型、合并各个IMF分量模型的预测结果得到
Figure 205049DEST_PATH_IMAGE143
Figure 138238DEST_PATH_IMAGE143
通过反归一化运算到实时获取预测结果
Figure 899521DEST_PATH_IMAGE144
Figure 959881DEST_PATH_IMAGE145
其中,
Figure 608162DEST_PATH_IMAGE036
为IMF模型个数,
Figure 462986DEST_PATH_IMAGE146
为每个IMF模型预测输出,
Figure 429673DEST_PATH_IMAGE143
为IMF模型预测输出融合结果;
Figure 28145DEST_PATH_IMAGE147
其中,
Figure 793582DEST_PATH_IMAGE045
为模型训练时最大进站客流,
Figure 288149DEST_PATH_IMAGE044
为模型训练是最小进站客流,
Figure 945395DEST_PATH_IMAGE143
为IMF模型预测输出融合结果,
Figure 347558DEST_PATH_IMAGE148
为最终预测输出结果。
(4)根据实时数据和预测结果的积累,可根据评估函数或定期自动更新模型,不断优化以提高预测精度,为地铁组织运营提供强有力的支撑。

Claims (9)

1.一种基于CEEMDAN-LSTM的地铁客流预测方法,其特征在于,包括以下步骤:
(1)根据进站客流、出站客流、站厅温度、站厅湿度、站台温度、站台湿度、室外温度、室外湿度、站厅CO2浓度以及站台CO2浓度的历史数据,构建原始时间序列;对原始时间序列进行相关性分析,得到进站客流时间序列的相关特征序列;
(2)将所述进站客流时间序列作为可分解数据集,同时间的相关特征序列作为关联数据集,通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,每个IMF分量数据集与所述关联数据集融合成K个可训练数据集;
(3)通过所述可训练数据集训练LSTM神经网络模型,得到K个IMF分量对应的K个LSTM训练模型;
(4)对采集得到的待预测数据进行处理,得到K个待预测的序列,分别输入至K个IMF分量对应的LSTM模型,然后将K个模型的预测结果合并得到最终预测结果;所述对采集得到的待预测数据进行处理包括:待预测进站客流数据通过CEEMDAN算法分解获得K个IMF分量,K个IMF分量分别与同一时间相关特征序列融合得到K个待预测的序列。
2.根据权利要求1所述的基于CEEMDAN-LSTM的地铁客流预测方法,其特征在于,所述的构建原始时间序列为:
Figure 283681DEST_PATH_IMAGE001
其中
Figure 275907DEST_PATH_IMAGE002
为构建的原始时间序列,I p 为进站客流,O p 为出站客流,T h 为站厅温度,H h 为站厅湿度,T p 为站台温度,H p 为站台湿度,C h 为站厅CO2浓度,C p 为站台CO2浓度,T o 为室外温度,H o 为室外湿度;
在对原始时间序列进行相关性分析之前,还包括数据预处理,所述数据预处理是对所述原始时间序列进行序列有效性检验、平稳性检测、异常值检测及填充。
3.根据权利要求2所述的基于CEEMDAN-LSTM的地铁客流预测方法,其特征在于,所述的序列有效性检验,包括数据类型检验、时间顺序检验、重复性检验和时间频率检验,通过检测修正或删除无效数据;
所述的平稳性检验,是通过ADF检验算法,检测时间序列是否存在单位根;如果不存在单位根,则序列稳定;否则,序列不稳定,对于不稳定的序列通过对数据取对数或差分运算;通过检验删去无法修正的不稳定的序列;
所述的异常值检测及填充,包括:空值检测、箱线图异常点检测、孤立森林异常点检测、ARIMA自回归差分移动平均异常检测;所有检测出的异常点采用抽取的相同时间段正常数据随机填充;
所述相关性分析,是通过计算各数据类型与进站客流的相关性,去除相关性小及负相关的数据类型。
4.根据权利要求3所述的基于CEEMDAN-LSTM的地铁客流预测方法,其特征在于,所述ADF检验算法包括以下内容:
无漂移项自回归过程:
Figure 440173DEST_PATH_IMAGE003
带漂移项自回归过程:
Figure 356832DEST_PATH_IMAGE004
带漂移项和趋势项自回归过程:
Figure 38480DEST_PATH_IMAGE005
其中,
Figure 150792DEST_PATH_IMAGE006
Figure 220379DEST_PATH_IMAGE007
时刻的进站客流,
Figure 559088DEST_PATH_IMAGE008
为常量系数,
Figure 841165DEST_PATH_IMAGE009
Figure 11246DEST_PATH_IMAGE010
时刻的进站客流,
Figure 986155DEST_PATH_IMAGE011
为选择时间点之前的
Figure 936794DEST_PATH_IMAGE011
个时间点,
Figure 754053DEST_PATH_IMAGE012
为前后两个时刻进站客流偏差系数,
Figure 778640DEST_PATH_IMAGE013
Figure 455609DEST_PATH_IMAGE014
Figure 972173DEST_PATH_IMAGE015
的差分,
Figure 330473DEST_PATH_IMAGE016
为常数项,
Figure 6305DEST_PATH_IMAGE017
为时间趋势项,
Figure 791858DEST_PATH_IMAGE018
为随机扰动项。
5.根据权利要求1所述的基于CEEMDAN-LSTM的地铁客流预测方法,其特征在于,所述的通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,包括:
(21)将高斯白噪声加入到待分解信号,并进行EMD分解,得到一阶本征模态分量:
Figure 177141DEST_PATH_IMAGE019
式中,
Figure 339132DEST_PATH_IMAGE020
代表EMD分解,
Figure 603892DEST_PATH_IMAGE021
为随时间变化的进站客流,
Figure 825925DEST_PATH_IMAGE022
为自然数,
Figure 707294DEST_PATH_IMAGE023
为满足标准正态分布的高斯白噪声信号,
Figure 610659DEST_PATH_IMAGE024
Figure 995504DEST_PATH_IMAGE025
为模态分量个数,
Figure 122860DEST_PATH_IMAGE026
为白噪声的标准差;
Figure 491524DEST_PATH_IMAGE027
为一阶本征模态分量,
Figure 726809DEST_PATH_IMAGE028
为原始序列加入白噪声后上下包络的平均值;
(22)对产生的
Figure 435002DEST_PATH_IMAGE025
个模态分量进行总体平均得到CEEMDAN分解的第一个本征模态分量:
Figure 529997DEST_PATH_IMAGE029
式中,
Figure 651537DEST_PATH_IMAGE030
为CEEMDAN分解得到的第一个本征模态分量;
(23)计算去除第一个本征模态分量后的残差:
Figure 427863DEST_PATH_IMAGE031
式中,
Figure 521721DEST_PATH_IMAGE032
为第一个残差;
(24)在
Figure 990879DEST_PATH_IMAGE032
中加入正负成对高斯白噪声,并进行EMD分解,得到CEEMDAN分解的第二个本征模态分量:
Figure 271819DEST_PATH_IMAGE033
式中,
Figure 182662DEST_PATH_IMAGE034
为经过两次EMD分解的模态分量;
(25)计算去除第二个本征模态分量后的残差:
Figure 662185DEST_PATH_IMAGE035
(26)重复上述步骤(24)~(25),直到获得的残差信号为单调函数,不能继续分解,算法结束;则进站客流时间序列经过CEEMDAN分解得到IMF序列记为:
Figure 567824DEST_PATH_IMAGE036
式中,
Figure 132798DEST_PATH_IMAGE037
Figure 250926DEST_PATH_IMAGE038
序列,
Figure 850535DEST_PATH_IMAGE039
表示K个分量。
6.根据权利要求1所述的基于CEEMDAN-LSTM的地铁客流预测方法,其特征在于,所述的每个IMF分量数据集与所述关联数据集融合成K个可训练数据集,是指将进站客流时间序列经过CEEMDAN分解得到IMF序列中的每个IMF分量数据集分别与所述关联数据集合并。
7.根据权利要求1所述的基于CEEMDAN-LSTM的地铁客流预测方法,其特征在于,所述步骤(3)包括以下步骤:
(31)将每个可训练数据集中的序列进行归一化,采用的归一化算法如下:
Figure 458234DEST_PATH_IMAGE040
Figure 776083DEST_PATH_IMAGE041
式中
Figure 494640DEST_PATH_IMAGE042
为归一化前的序列;
Figure 152017DEST_PATH_IMAGE043
Figure 930617DEST_PATH_IMAGE044
Figure 735762DEST_PATH_IMAGE042
的最小值与最大值;
Figure 258011DEST_PATH_IMAGE045
Figure 563703DEST_PATH_IMAGE042
的标准差;
Figure 716466DEST_PATH_IMAGE046
为归一化后的序列;
Figure 743328DEST_PATH_IMAGE047
Figure 538109DEST_PATH_IMAGE048
为归一化范围;
(32)将归一化后的序列按滑动窗口算法切分成训练集、验证集、测试集;
(33)构建LSTM网络,LSTM网络包括输入层、隐层、输出层;其中输入层的数据包括样本个数、输入数据维数和输出数据维数;滑动窗口、神经元个数、激活函数、优化函数、隐层单元个数、LSTM层个数作为超参,通过优化获取最优参数组合的模型;
(34)采用平均绝对误差进行LSTM模型评估,所述平均绝对误差计算式为:
Figure 904499DEST_PATH_IMAGE049
式中,MAE为平均绝对误差,
Figure 759323DEST_PATH_IMAGE050
为进站客流实际值,
Figure 945585DEST_PATH_IMAGE051
为进站客流的预测值,
Figure 75215DEST_PATH_IMAGE052
为预测进站客流的个数。
8.一种基于CEEMDAN-LSTM的地铁客流预测系统,其特征在于,该系统包括:
数据存储模块,用于存储进站客流、出站客流、站厅温度、站厅湿度、站台温度、站台湿度、室外温度、室外湿度、站厅CO2浓度以及站台CO2浓度的历史数据;
客流预测模块,用于根据历史数据的原始时间序列进行相关性分析,得到进站客流时间序列的相关特征序列;将所述进站客流时间序列作为可分解数据集,所述相关特征序列作为关联数据集,通过CEEMDAN算法将所述可分解数据集分解成K个IMF分量数据集,每个IMF分量数据集与所述关联数据集融合成可训练数据集;通过所述可训练数据集训练LSTM神经网络模型,得到K个IMF分量对应的K个LSTM训练模型;对采集得到的待预测数据进行处理,得到K个待预测的序列,分别输入至K个IMF分量对应的LSTM模型,然后将K个模型的预测结果合并得到最终预测结果;所述对采集得到的待预测数据进行处理包括:待预测进站客流数据通过CEEMDAN算法分解获得K个IMF分量,K个IMF分量分别与同一时间相关特征序列融合得到K个待预测的序列。
9.根据权利要求8所述的基于CEEMDAN-LSTM的地铁客流预测系统,其特征在于,所述客流预测模块通过Tensorflow Serving框架部署到服务器上,包括以下步骤:
(1)通过docker安装tensorflow serving服务;
(2)配置部署模型及启动服务;
(3)通过http协议发送待预测数据,待预测数据经预测模型得到最终预测结果;
(4)根据实时数据和预测结果,通过评估函数定期自动更新预测模型。
CN202211278952.0A 2022-10-19 2022-10-19 一种基于ceemdan-lstm的地铁客流预测方法及系统 Pending CN115358491A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211278952.0A CN115358491A (zh) 2022-10-19 2022-10-19 一种基于ceemdan-lstm的地铁客流预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211278952.0A CN115358491A (zh) 2022-10-19 2022-10-19 一种基于ceemdan-lstm的地铁客流预测方法及系统

Publications (1)

Publication Number Publication Date
CN115358491A true CN115358491A (zh) 2022-11-18

Family

ID=84009018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211278952.0A Pending CN115358491A (zh) 2022-10-19 2022-10-19 一种基于ceemdan-lstm的地铁客流预测方法及系统

Country Status (1)

Country Link
CN (1) CN115358491A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115774861A (zh) * 2022-12-22 2023-03-10 广东五度空间科技有限公司 一种自然资源多源异构数据汇聚融合服务系统
CN116468324A (zh) * 2023-04-25 2023-07-21 北京化工大学 一种数据驱动的交通枢纽到达客流量分解-集成预测方法
CN117455553A (zh) * 2023-12-08 2024-01-26 青岛理工大学 一种地铁站客流量预测的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886444A (zh) * 2018-12-03 2019-06-14 深圳市北斗智能科技有限公司 一种交通短时客流预测方法、装置、设备和存储介质
CN109948861A (zh) * 2019-03-26 2019-06-28 西南交通大学 一种基于模态分解及深度学习的城轨短时客流预测方法
CN111695722A (zh) * 2020-05-13 2020-09-22 南京理工大学 一种城市轨道交通车站节假日短时客流预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886444A (zh) * 2018-12-03 2019-06-14 深圳市北斗智能科技有限公司 一种交通短时客流预测方法、装置、设备和存储介质
CN109948861A (zh) * 2019-03-26 2019-06-28 西南交通大学 一种基于模态分解及深度学习的城轨短时客流预测方法
CN111695722A (zh) * 2020-05-13 2020-09-22 南京理工大学 一种城市轨道交通车站节假日短时客流预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MIN WANG等: "Short-time Passenger Flow Forecast of Urban Rail Transit Based on the CEEMDAN-BLSTM Model", 《2021 IEEE 5TH CONFERENCE ON ENERGY INTERNET AND ENERGY SYSTEM INTEGRATION (EI2)》 *
张维等: "基于多元因素的Bi-LSTM 高速公路交通流预测", 《计算机系统应用》 *
郑艳霞等: "《数学实验》", 30 September 2019, 中国经济出版社 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115774861A (zh) * 2022-12-22 2023-03-10 广东五度空间科技有限公司 一种自然资源多源异构数据汇聚融合服务系统
CN116468324A (zh) * 2023-04-25 2023-07-21 北京化工大学 一种数据驱动的交通枢纽到达客流量分解-集成预测方法
CN116468324B (zh) * 2023-04-25 2024-01-05 北京化工大学 一种数据驱动的交通枢纽到达客流量分解-集成预测方法
CN117455553A (zh) * 2023-12-08 2024-01-26 青岛理工大学 一种地铁站客流量预测的方法
CN117455553B (zh) * 2023-12-08 2024-04-30 青岛理工大学 一种地铁站客流量预测的方法

Similar Documents

Publication Publication Date Title
CN109492830B (zh) 一种基于时空深度学习的移动污染源排放浓度预测方法
Yu et al. Prediction of bus travel time using random forests based on near neighbors
CN115358491A (zh) 一种基于ceemdan-lstm的地铁客流预测方法及系统
Zhang et al. A feature selection and multi-model fusion-based approach of predicting air quality
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
CN109117883B (zh) 基于长短时记忆网络的sar影像海冰分类方法及系统
CN111723929A (zh) 一种基于神经网络的数值预报产品订正方法、装置和系统
Patwary et al. Metamodel-based calibration of large-scale multimodal microscopic traffic simulation
Zou et al. Passenger flow prediction using smart card data from connected bus system based on interpretable xgboost
CN111178628A (zh) 一种行李到达时间预测方法及装置
CN110990718A (zh) 一种公司形象提升系统的社会网络模型构建模块
CN111784022A (zh) 一种基于Wrapper方法与SVM方法结合的短时邻近大雾预测方法
CN110796315A (zh) 基于时效信息和深度学习的离港航班延误预测方法
CN117494034A (zh) 基于交通拥堵指数和多源数据融合的空气质量预测方法
CN116957331A (zh) 风险旅客流量范围预测方法和装置
CN116797274A (zh) 一种基于Attention-LSTM-LightGBM的共享单车需求量预测方法
Wambura et al. Robust anomaly detection in feature-evolving time series
CN113221472B (zh) 一种基于lstm的客流预测方法
CN117436653A (zh) 一种网约车出行需求的预测模型构建方法和预测方法
CN112365037A (zh) 基于长短期数据预测模型的机场空域流量预测方法
CN117370813A (zh) 一种基于k线模式匹配算法的大气污染深度学习预测方法
CN115936242A (zh) 空气质量与交通状况的溯源关系数据获取方法及装置
CN116434531A (zh) 一种基于Conv1D-LSTM模型的短时交通流预测方法
CN114492967A (zh) 基于ceemdan和blstm组合模型的城轨车站客流预测方法和介质
Tan et al. Automatic Model Generation and Data Assimilation Framework for Cyber-Physical Production Systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20221118

RJ01 Rejection of invention patent application after publication