CN116468469A - 一种基于改进emd-lstm的网约车需求预测方法 - Google Patents
一种基于改进emd-lstm的网约车需求预测方法 Download PDFInfo
- Publication number
- CN116468469A CN116468469A CN202310448243.0A CN202310448243A CN116468469A CN 116468469 A CN116468469 A CN 116468469A CN 202310448243 A CN202310448243 A CN 202310448243A CN 116468469 A CN116468469 A CN 116468469A
- Authority
- CN
- China
- Prior art keywords
- time
- data
- lstm
- network
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000012549 training Methods 0.000 claims abstract description 62
- 238000012545 processing Methods 0.000 claims abstract description 39
- 238000012360 testing method Methods 0.000 claims abstract description 20
- 230000002159 abnormal effect Effects 0.000 claims abstract description 10
- 230000000694 effects Effects 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 230000002776 aggregation Effects 0.000 claims abstract description 6
- 238000004220 aggregation Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 50
- 238000003064 k means clustering Methods 0.000 claims description 27
- 230000015654 memory Effects 0.000 claims description 27
- 210000000349 chromosome Anatomy 0.000 claims description 24
- 210000004027 cell Anatomy 0.000 claims description 22
- 238000000354 decomposition reaction Methods 0.000 claims description 21
- 230000002068 genetic effect Effects 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 8
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 6
- 230000035772 mutation Effects 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 3
- 210000005036 nerve Anatomy 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000011478 gradient descent method Methods 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000012733 comparative method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0645—Rental transactions; Leasing transactions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Finance (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于改进EMD‑LSTM的网约车需求预测方法,包括:S1,数据预处理:对原始网约车订单数据集中的缺失值、异常值、重复值进行处理;S2,时间、空间划分处理:根据网约车订单数据集中的经纬度信息进行空间划分,得到一个需求热点区域,并按照具体的时间切片对网约车需求量进行聚合统计;S3,网约车需求预测:按照设定训练集与测试集划分比率将数据集划分为训练集和测试集,使用训练集对改进的EMD‑LSTM模型参数进行训练,建立网约车需求预测模型,并利用测试集对模型结果进行验证。改进EMD‑LSTM的网约车需求预测方法,解决了子时间序列时序特征不突出的问题;弥补了采用单一LSTM模型进行预测而导致预测精度和预测效果不理想的问题。
Description
技术领域
本发明涉及网约车需求预测,具体涉及一种基于改进EMD-LSTM的网约车需求预测方法。
背景技术
网约车服务作为一种新兴的交通出行方式,通过“非巡游”的方式连接司机与乘客,打破了传统出租车“巡游”揽客的模式,为居民的出行带来了极大便利。然而,在网约车运营过程中,由于无法准确估计区域所需网约车数量,导致供需不平衡问题时有发生。网约车需求预测,可以帮助网约车平台合理调配车辆资源、避免空置车辆资源浪费,达到优化供需平衡的目的。
目前的网约车需求预测方法可分为基于线性理论的预测方法和基于机器学习的预测方法。由于网约车需求时间序列为非线性性质,基于线性理论的预测方法不能满足实际预测需求;而对于单一机器学习预测方法来说,预测精度也不够高,离实际预测需求还有差距,对网约车平台的指导意义不足。
因此,目前迫切需要一种预测精度较高,具有实际指导意义的网约车需求预测新方法,新方法应满足以下技术需求:1)具有较高的预测精度,能够符合实际网约车需求;2)具有良好的模型泛化能力,是一种有效的网约车需求预测方法。
发明内容
本发明技术解决问题:提供一种基于改进EMD-LSTM的网约车需求预测方法,以弥补目前网约车需求预测精度不高或不满足实际预测需求等问题。
本发明采用的技术方案:
本发明提供了一种基于改进EMD-LSTM的网约车需求预测方法,包括以下步骤:
步骤1)数据预处理:对原始网约车订单数据集的特征数据进行缺失值处理、异常值处理、重复值处理;
步骤2)时间、空间划分处理:使用步骤1)数据集,根据数据集中的经纬度信息进行空间划分,得到一个需求热点区域,并按照具体的时间切片对网约车需求量进行聚合统计;
步骤3)数据集划分:按照所设定的训练集与测试集划分比率,对步骤2)所述已处理数据集进行随机抽样划分,得到训练集与测试集;
步骤4)经验模态分解处理:使用步骤3)所属训练数据集,采用经验模态分解法(EMD)对其进行处理,得到若干本征模态函数和一个残余项作为子时间序列;
步骤5)改进的K-Means聚类处理:使用步骤4)所得到的子时间序列,通过基于遗传算法改进的K-Means聚类算法进行聚类;
步骤6)LSTM模型预测:使用步骤5)聚类后的时间序列,输入到长短期记忆神经网络(LSTM)进行训练,结束后将时间序列进行叠加求和,得到网约车需求预测模型。
进一步地,在所述步骤1)中:
所述缺失值处理步骤的具体实现为,剔除含有空值的数据行,其中包括订单ID、出发地与终点的预估路面距离、出发时间、到达时间、花费时长、起点经纬度等字段中缺失信息的行;
所述异常值处理步骤的具体实现为,剔除样本数据中超出研究时间范围的数据行以及剔除超出研究区域经度范围和纬度范围的数据行;
所述重复值处理步骤的具体实现为,剔除样本数据中订单ID重复的数据信息行;
进一步地,在所述步骤2)中:
所述时间、空间划分处理步骤的具体实现为,空间划分以经纬度范围数据为依据,按照其经纬度范围将其划分为5×5不重叠的方格区域,并标记订单数据行所在的方格区域信息;经一步将所含数据信息最多的方格区域作为需求热点区域进行时间切片划分,以20分钟为一个时间片段进行时间片段内的网约车订单需求量统计。
进一步地,在所述步骤3)中,所述设定训练集和测试集划分比例为80:20、70:30以及60:40。
进一步地,在所述步骤4)中,经验模态分解法进行时间序列分解的主要思路是将非平稳非线性的信号分解为相对平稳的、互相独立的本征模态函数,降低原始时间序列中的不平稳性便于后续对时间序列的分析与预测;
所述采用经验模态分解法(EMD)对时间序列进行处理,得到符合条件的本征模态函数(IMF),具体实现为:
通过对原数据序列x(t)微分一次或多次求得所有的极大值点,并用三次样条插值函数拟合形成原数据的上包络线;同样,找出所有的极小值点,并将所有的极小值点通过三次样条插值函数拟合形成数据的下包络线。将上包络线和下包络线的均值记作m1,得到一个新的数据序列h1,即:
h1=x(t)-m1,
其中,x(t)为原始数据序列,m1为原始数据序列经三次样条差值函数拟合形成的上、下包络线的均值序列;
判断新序列h1是否满足本征模态函数(IMF)的两个条件,如下:
1)在整个数据段内,极值点的个数和过零点的数目必须相等,或最多差一个;
2)在任意时刻点,由局部极大值点形成的上包络线和由局部极小值点形成的下包络线的平均值为零,即上、下包络线相对于时间轴局部对称;
若满足上述两个条件,即看作第一阶IMF,记作C1,将C1从x(t)中分离出来,得到差值信号r1(t),即:
r1=x(t)-C1,
其中,C1为符合IMF两个条件的IMF序列;若不满足,将h1看作新的x(t),重复上述步骤,直到满足IMF的两个条件;
把r1作为新数据,重复上述筛选步骤,直到第n阶的残余数据成为单调函数,不能筛选出IMF分量为止,即:
rn=rn-1-Cn,
其中,rn-1为第n-1个差值信号,Cn为第n个符合IMF两个条件的IMF序列;
x(t)最终可以表示为n个IMF分量和一个残余项的和,即:
其中,rn(t)为残量,代表信号的平均趋势;各IMF分量Ci(t)则代表从高到低不同频率段的成分,每一频率段所包含的频率成分是不同的。
进一步地,在所述步骤5)中,所述改进的K-Means聚类算法,可以将时序特征相似的序列进行聚合,突出时间序列特征,并减少后续模型计算复杂度,提高模型整体效率;改进的K-Means聚类算法,对K-Means聚类算法的初始中心点以及簇个数进行改进,保证K-Means聚类算法的合理性。最初的K-Means聚类算法,一般是随机确定初始中心,以及凭主观判断确定簇个数K值,导致最后聚类效果不理想、科学性较差;改进的K-Means算法,引入遗传算法自适应的确定初始中心点以及簇个数,增加了模型的科学性以及合理性,提高后续预测精度。
根据聚类效果设定K-Means算法的参数,聚类数目K为2~n,初始种群大小M为20~100,交叉概率Pc为0.25~0.75,变异概率Pm为0.001~0.1,最大迭代次数max_iter依经验设定;
所述步骤5)采用基于遗产算法改进的K-Means聚类算法进行聚类,进而提高各本征模态函数的时序特征的具体实现为:
根据步骤4)中得到的n+1个子时间序列,设定K的范围为2~n,随后利用随机函数选取K个IMF作为初始聚类中心,形成一条染色体,总共选取M条染色体为一组种群,最终形成n-1组种群;紧接着对初始种群中每一组聚类中心进行K-Means操作并计算适应度,实施最优保护策略,将最高适应度的染色体保留下来防止在遗传操作中被破坏;再根据每条染色体的适应度进行操作,选择高适应度染色体进行交叉、变异操作,淘汰低适应度染色体,最终形成下一代群体。经过一代又一代的选择、交叉、变异操作后,当达到最大迭代次数后,选取每组具有最高适应度的染色体中的聚类中心,画出所有组最高适应度染色体对应的评估指标sse值曲线,并以拐点处K值作为最终K值,对应的聚类中心作为最终初始聚类中心,再次进行K-Means聚类操作;最终输出对应K个不同的簇,并且每个簇中包含具有相同时序特征的分量序列,并进一步将每个簇中包含的分量序列相加得到新的K个子时间序列。
进一步地,在所述步骤6)中,所述长短期记忆神经网络:
根据模型训练效果设定模型输入时间步长、隐藏层神经单元个数、一次训练所选取的样本数、迭代次数、全连接层、优化器、训练损失函数等参数;
具体的,步骤6)的实现为,将步骤5)得到的K个训练集的子时间序列进一步输入到LSTM模型中,以第一个子时间序列为例,设当前训练集的时间序列含N个时间片段节点,即T=(T0,T1,T2,...,TN),模型输入步长设置为100,则第一组时间序列输入值为T1=(T0,T1,T2,...,T100),以此类推,依据训练集与测试集比例形成不同数量组的含100个时间片段的时间序列;
具体的,步骤6)中模型训练过程为,每次选择1组时间序列输入到含有LSTM层和隐藏单元的模型中进行训练,输出为每组时间序列中的下一个值;
其中每个隐藏单元内含有三种门控制机制和一个记忆细胞提供记忆能力,其中门控制机制包括遗忘门、输入门、输出门,记忆单元贯穿门输出的信息传递。遗忘门通过sigmoid函数决定当前时刻数据和上一时刻数据需要保留多少,公式表现为:
Γf=σ(Wf[ht-1,xt]+bf),
其中,Γf代表遗忘门,σ()为sigmoid函数,Wf、bf为遗忘门的权重参数和偏置矩阵,ht-1为上一隐藏单元的输出,xt为当前组的时间序列输入值;
输入门同样通过sigmoid函数决定当前时刻数据和上一时刻数据保存到单元状态中,公式表现为:
Γu=σ(Wu[ht-1,xt]+bu),
其中,Γu代表遗忘门,Wu、bu为输入门的权重参数和偏置矩阵,为候选值细胞,tanh()为激活函数,Wc、bc为候选值细胞的权重及偏置矩阵;
当前时刻记忆细胞的状态为:
其中,Ct为记忆细胞,Ct-1为上一时刻记忆细胞的值,为Hadamard乘积;
输出门通过sigmoid函数决定当前隐藏层的输出值,以及传送到下一隐藏层的输出值,公式表现为:
Γo=σ(Wo[ht-1,xt]+bo),
其中,Γo代表遗忘门,Wo、bo为输出门的权重参数和偏置矩阵,ht为当前隐藏单元的输出,ht接下来会传给下一个隐藏单元作为输入;
具体的,步骤6)模型训练过程中通过反向传播算法更新LSTM模型中的参数,包括各个门的权重参数和偏置,使用Adam优化器自动更新计算梯度和模型参数,以最小化误差使预测结果更加准确。其中,根据模型的预测输出值和真实值计算损失函数均方误差(MSE)的值,然后通过反向传播算法计算损失函数对于模型参数的偏导数,并使用梯度下降法来更新模型的各个参数,同时Adam优化器自适应地调整学习率和梯度的动量大小,加快模型的训练速度,所涉及的参数全体更新一次为一次迭代;重复上述步骤,直至迭代次数满足设置的迭代次数,则迭代停止,将K个预测得到的时间序列进行叠加求和,得到已训练的所述需求预测模型。
与现有技术相比,本发明的优点为:
本发明提出了一种新的网约车需求预测方法,采用经验模态分解法(EMD)、基于遗传算法改进的K-Means聚类算法和长短期记忆神经网络(LSTM)的组合模型对网约车需求时间序列进行处理和预测;采用经验模态分解法解决了原始特征集存在波动性及不稳定性的问题,并且采用了改进的K-Means聚类算法对分解后的子时间序列进行聚类,引入遗传算法自适应的确定聚类的初始中心点以及簇个数,解决了子时间序列时序特征不突出的问题;还采用了EMD、K-Means、LSTM三种模型方法组合的方式,弥补了采用单一LSTM模型进行预测而导致预测精度和预测效果不理想的问题。
实验结果表明,相对于其他机器学习方法,本发明的方法在网约车需求预测综合评判指标上具有更优秀的预测能力。
附图说明
图1是原始网约车需求量时间序列图;
图2是本发明的网约车需求预测方法的流程图。
具体实施方式
本发明主要针对网约车平台以及相关政府部门,为合理调配车辆,减少空置资源浪费,提升用户体验;本发明提出一种基于改进EMD-LSTM的网约车需求预测方法,用于对网约车需求量时间序列进行预测,包括以下步骤:S1,数据预处理:对原始网约车订单数据集中的缺失值、异常值、重复值进行处理;S2,时间、空间划分处理:根据网约车订单数据集中的经纬度信息进行空间划分,得到一个需求热点区域,并按照具体的时间切片对网约车需求量进行聚合统计;S3,网约车需求预测:按照设定训练集与测试集划分比率将数据集划分为训练集和测试集,使用训练集对改进的EMD-LSTM模型参数进行训练,建立网约车需求预测模型,并利用测试集对模型结果进行验证。改进EMD-LSTM的网约车需求预测方法,首先通过经验模态分解法对整体网约车需求量时间序列进行分解处理,以降低时间序列的不稳定性,得到多个子时间序列;然后,采用基于遗传算法改进的K-Means聚类算法对子时间序列进行聚类,提高子时间序列的时序特征,降低模型的复杂度;最后,采用长短时记忆神经网络进行预测,将得到的时间序列后进行叠加求和获得预测的网约车需求量。实验结果表明,本发明具有相对优越的网约车需求预测性能,预测效果稳健。
本发明方法的流程主要包括以下步骤:
步骤1)数据预处理:对数据量为1400万条的网约车订单数据的特征数据进行缺失值、异常值、重复值处理;
其中缺失值处理步骤的具体实现为:剔除原始网约车订单数据集中含有空值的数据行,其中包括订单ID、出发地与终点的预估路面距离、出发时间、到达时间、花费时长、起点经度、起点纬度字段中中缺失信息的行;
异常值处理步骤的具体实现为:剔除原始网约车订单数据集中超出研究时间范围2017-05-0100:00:00~2017-10-3123:59:59的数据行,以及剔除超出研究区域经度范围东经110.127175~110.713297和纬度范围北纬19.523932~20.078894的数据行;
重复值处理步骤的具体实现为:剔除原始网约车订单数据集中订单ID重复的数据信息行;
步骤2)时间、空间划分处理:空间划分以经纬度范围数据为依据,按照其经纬度范围将其划分为5×5不重叠的方格区域,其中每小格横向经度值为0.11724,纬度值为0.11100,并标记订单数据行所在的方格区域信息;经一步将所含数据集信息最多的方格区域作为需求热点区域进行时间切片划分,以20分钟为一个时间片段进行时间片段内的网约车订单需求量统计。经步骤2)处理后,按照时间片段顺序统计的网约车需求量,即为原始网约车时间序列,以前30个时间片段的统计数据为例,具体形式如图1所示;
步骤3)数据集划分:按照训练集与测试集划分比率80:20、70:30、60:40,对步骤2)所述已处理数据集进行随机抽样划分,得到训练集的大小为10598、9273、7948,测试集的大小为2650、3975、5300;
步骤4)使用步骤3)所属训练数据集,采用经验模态分解法(EMD)对其进行分解处理,得到11个本征模态函数和1个残余项,即12个子时间序列;
进一步地,在所述步骤4)中,经验模态分解法进行时间序列分解的主要思路是将非平稳非线性的信号分解为相对平稳的、互相独立的本征模态函数,降低原始时间序列中的不平稳性便于后续对时间序列的分析与预测;
所述采用经验模态分解法(EMD)对时间序列进行处理,得到符合条件的本征模态函数(IMF),具体实现为:
通过对原数据序列x(t)微分一次或多次求得所有的极大值点,并用三次样条插值函数拟合形成原数据的上包络线;同样,找出所有的极小值点,并将所有的极小值点通过三次样条插值函数拟合形成数据的下包络线。将上包络线和下包络线的均值记作m1,得到一个新的数据序列h1,即:
h1=x(t)-m1,
其中,x(t)为原始数据序列,m1为原始数据序列经三次样条差值函数拟合形成的上、下包络线的均值序列;
判断新序列h1是否满足本征模态函数(IMF)的两个条件,如下:
1)在整个数据段内,极值点的个数和过零点的数目必须相等,或最多差一个;
2)在任意时刻点,由局部极大值点形成的上包络线和由局部极小值点形成的下包络线的平均值为零,即上、下包络线相对于时间轴局部对称;
若满足上述两个条件,即看作第一阶IMF,记作C1,将C1从x(t)中分离出来,得到差值信号r1(t),即:
r1=x(t)-C1,
其中,C1为符合IMF两个条件的IMF序列;若不满足,将h1看作新的x(t),重复上述步骤,直到满足IMF的两个条件;
把r1作为新数据,重复上述筛选步骤,直到第n阶的残余数据成为单调函数,不能筛选出IMF分量为止,即:
rn=rn-1-Cn,
其中,rn-1为第n-1个差值信号,Cn为第n个符合IMF两个条件的IMF序列;
x(t)最终可以表示为n个IMF分量和一个残余项的和,即:
其中,rn(t)为残量,代表信号的平均趋势;各IMF分量Ci(t)则代表从高到低不同频率段的成分,每一频率段所包含的频率成分是不同的。
进一步地,在所述步骤5)中,所述改进的K-Means聚类算法,可以将时序特征相似的序列进行聚合,突出时间序列特征,并减少后续模型计算复杂度,提高模型整体效率;改进的K-Means聚类算法,对K-Means聚类算法的初始中心点以及簇个数进行改进,保证K-Means聚类算法的合理性。最初的K-Means聚类算法,一般是随机确定初始中心,以及凭主观判断确定簇个数K值,导致最后聚类效果不理想、科学性较差;改进的K-Means算法,引入遗传算法自适应的确定初始中心点以及簇个数,增加了模型的科学性以及合理性,提高后续预测精度。
根据聚类效果设定K-Means算法的参数,聚类数目K为2~n,初始种群大小M为20~100,交叉概率Pc为0.25~0.75,变异概率Pm为0.001~0.1,最大迭代次数max_iter依经验设定;
步骤5)使用步骤4)中得到的12个子时间序列,设定基于遗传算法改进的K-Means算法的具体参数为:聚类数目K为2~11,初始种群大小M为50,交叉概率Pc为0.7,变异概率Pm为0.02,最大迭代次数max_iter=100;
具体的,步骤5)的过程为,利用随机函数选取K个IMF作为初始聚类中心,形成一条染色体,总共选取50条染色体为一组种群,最终形成10组初始种群;紧接着对初始种群中每一组聚类中心进行K-Means操作并计算适应度,实施最优保护策略,将最高适应度的染色体保留下来防止在遗传操作中被破坏;再根据每条染色体的适应度进行操作,选择高适应度染色体进行交叉、变异操作,淘汰低适应度染色体,最终形成下一代群体。经过一代又一代的选择、交叉、变异操作后,当达到最大迭代次数后,选取每组具有最高适应度的染色体中的聚类中心,画出所有组最高适应度染色体对应的评估指标sse值曲线,并以拐点处K=9作为最终K值,对应的聚类中心作为最终初始聚类中心,再次进行K-Means聚类操作;最终输出对应9个不同的簇,并且每个簇中包含具有相同时序特征的分量序列,并进一步将每个簇中包含的分量序列相加得到新的9个子时间序列。
步骤6)使用步骤5)聚类后的9个子时间序列,输入到长短期记忆网络(LSTM)进行训练,模型输入步长设置为100,隐藏层神经单元个数为4、一次训练所选取的样本数为1,迭代次数为100次,全连接层为1个,优化器为“Adam”,训练损失函数为“MSE”;
具体的,步骤6)中模型训练过程为,依次对9个子时间序列进行训练,每次选择子时间序列中的一组时间序列作为输入值,例如:第一组T1=(T0,T1,T2,...,T100),根据80∶20、70∶30、60∶40的训练集、测试集划分比例分别对应10498组、9173组、7848组含100个时间片段的时间序列;顺序选择每一组时间序列输入到含有1个LSTM层和每层4个隐藏单元的模型中进行训练,输出为每组时间序列中的下一个值。结束后形成9个预测的网约车需求量时间序列,将其加和到一起,得到网约车需求预测模型。
具体的,步骤6)中模型训练过程为,每次选择1组时间序列输入到含有LSTM层和隐藏单元的模型中进行训练,输出为每组时间序列中的下一个值;
其中每个隐藏单元内含有三种门控制机制和一个记忆细胞提供记忆能力,其中门控制机制包括遗忘门、输入门、输出门,记忆单元贯穿门输出的信息传递。遗忘门通过sigmoid函数决定当前时刻数据和上一时刻数据需要保留多少,公式表现为:
Γf=σ(Wf[ht-1,xt]+bf),
其中,Γf代表遗忘门,σ()为sigmoid函数,Wf、bf为遗忘门的权重参数和偏置矩阵,ht-1为上一隐藏单元的输出,xt为当前组的时间序列输入值;
输入门同样通过sigmoid函数决定当前时刻数据和上一时刻数据保存到单元状态中,公式表现为:
Γu=σ(Wu[ht-1,xt]+bu),
其中,Γu代表遗忘门,Wu、bu为输入门的权重参数和偏置矩阵,为候选值细胞,tanh()为激活函数,Wc、bc为候选值细胞的权重及偏置矩阵;
当前时刻记忆细胞的状态为:
其中,Ct为记忆细胞,Ct-1为上一时刻记忆细胞的值,为Hadamard乘积;
输出门通过sigmoid函数决定当前隐藏层的输出值,以及传送到下一隐藏层的输出值,公式表现为:
Γo=σ(Wo[ht-1,xt]+bo),
其中,Γo代表遗忘门,Wo、bo为输出门的权重参数和偏置矩阵,ht为当前隐藏单元的输出,ht接下来会传给下一个隐藏单元作为输入;
具体的,步骤6)模型训练过程中通过反向传播算法更新LSTM模型中的参数,包括各个门的权重参数和偏置,使用Adam优化器自动更新计算梯度和模型参数,以最小化误差使预测结果更加准确。其中,根据模型的预测输出值和真实值计算损失函数均方误差(MSE)的值,然后通过反向传播算法计算损失函数对于模型参数的偏导数,并使用梯度下降法来更新模型的各个参数,同时Adam优化器自适应地调整学习率和梯度的动量大小,加快模型的训练速度,所涉及的参数全体更新一次为一次迭代;重复上述步骤,直至迭代次数满足设置的迭代次数,则迭代停止,将K个预测得到的时间序列进行叠加求和,得到已训练的所述需求预测模型。
所述网约车预测模型,以一定时间步长的网约车需求时间序列为输入,经过EMD分解处理、经遗传算法改进的K-Means聚类、LSTM神经网络后,最终输出下一个时间步长的网约车需求数量。
本发明的一种基于改进EMD-LSTM的网约车需求预测系统包括:
数据预处理模块:对网约车订单样本数据集中特征数据进行缺失值处理、异常值处理、重复值处理;
时间、空间划分模块:对预处理后的数据集,根据数据集中的经纬度信息进行空间划分,得到一个需求热点区域,并按照具体的时间切片对网约车需求量进行聚合统计,随后将处理后的网约车订单样本数据集发送至改进EMD-LSTM的网约车需求预测模型;
改进EMD-LSTM的网约车需求预测模型,为基于经验模态分解法(EMD)、基于遗传算法改进的K-Means聚类算法、长短期记忆神经网络(LSTM)的组合预测模型,接受所述数据集预处理模块发送的一定时间片段长度网约车需求时间序列,预测输出订单样本下一时间片段的网约车需求量信息。
为实证性能,选取长短期记忆网络模型(LSTM)、未经改进的EMD-LSTM模型和本发明提出的方法进行比较,采用的模型评价指标为RMSE(均方根误差)、MAE(平均绝对误差)、MAPE(平均绝对百分比误差)。实验流程如图2所示:
为了对网约车订单数据集有较为直观的认识,采用的数据样本如表1所示。
表1网约车订单数据集样本
在表1中,x1…x6对应网约车订单数据的7个特征分别为:订单ID、出发地与终点的预估路面距离、到达时间、出发时间、花费时长、起点经度、起点纬度。
为了避免由于一次实验可能造成的随机性,通过随机采样的方式进行了50次的实验,其中测试样本和训练样本划分的比例分别是20%:80%、30%:70%、40%:60%,最后取50次实验的平均结果来评判该方法性能的优良。本发明提出的方法结果和对比方法的结果分别列于:
表2网约车预测模型评估结果
表2列出了所有情况各个模型的网约车预测评估指标结果,在每种情形下的最优结果用粗体显示。从表2中模型评估指标中可以看出,三种训练集、测试集划分比例下,本发明的方法均取得了最好的网约车预测结果。其中,在训练集和测试集划分比例为70:30的情况下,本发明的方法性能最为优秀,评估指标结果为RMSE为48.01,MAE为27.43,MAPE为5%,相比其它两种预测方法取得了更有效的预测结果,说明本发明的方法在网约车需求预测中的性能稳健,是一个可实行的网约车需求预测方法。
总之,本发明的一种基于改进EMD-LSTM的网约车需求预测方法,对原始网约车订单数据集进行缺失值、异常值、重复值等预处理操作后,进一步的,经过时间、空间划分处理,得到原始网约车需求量时间序列,通过经验模态分解方法对网约车时间序列进行分解处理,降低原始网约车时间序列的不平稳性,随后采用基于遗传算法改进的K-Means聚类算法对分解得到的序列进行聚类,提高子时间序列的时序特征,最后,采用长短时记忆神经网络进行预测,将得到的时间序列后进行叠加求和获得预测的网约车需求量。实验结果表明,本发明具有相对优越的网约车需求预测性能,预测效果稳健。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种基于改进EMD-LSTM的网约车需求预测方法,其特征在于,包括以下步骤:
步骤1)数据预处理:对原始网约车订单数据集的特征数据进行缺失值处理、异常值处理、重复值处理;
步骤2)时间、空间划分处理:使用步骤1)数据集,根据数据集中的经纬度信息进行空间划分,得到一个需求热点区域,并按照具体的时间切片对网约车需求量进行聚合统计;
步骤3)数据集划分:按照所设定的训练集与测试集划分比率,对步骤2)所述已处理数据集进行随机抽样划分,得到训练集与测试集;
步骤4)经验模态分解处理:使用步骤3)所属训练数据集,采用经验模态分解法EMD对其进行处理,得到若干本征模态函数和一个残余项作为子时间序列;
步骤5)改进的K-Means聚类处理:使用步骤4)所得到的子时间序列,通过基于遗传算法改进的K-Means聚类算法进行聚类;
步骤6)LSTM模型预测:使用步骤5)聚类后的时间序列,输入到长短期记忆神经网络LSTM进行训练,结束后将时间序列进行叠加求和,得到网约车需求预测模型。
2.如权利要求1所述的一种基于改进EMD-LSTM的网约车需求预测方法,其特征在于,在所述步骤1)中:
所述缺失值处理的具体为,剔除含有空值的数据行,其中包括订单ID,出发地与终点的预估路面距离,到达时间,出发时间,花费时长,起点经度,起点纬度七个列字段中缺失信息的行;
所述异常值处理的具体为,剔除样本数据中超出研究时间范围的数据行以及剔除超出研究区域经度范围和纬度范围的数据行;
所述重复值处理的具体为,剔除样本数据中订单ID重复的数据信息行。
3.如权利要求1所述的一种基于改进EMD-LSTM的网约车需求预测方法,其特征在于,在所述步骤2)中:
所述时间、空间划分处理步骤的具体实现为,空间划分以经纬度范围数据为依据,按照其经纬度范围将其划分为5×5不重叠的方格区域,并标记订单数据行所在的方格区域信息;进一步将所含数据信息最多的方格区域作为需求热点区域进行时间切片划分,以20分钟为一个时间片段进行时间片段内的网约车订单需求量统计。
4.如权利要求1所述的一种基于改进EMD-LSTM的网约车需求预测方法,其特征在于,在所述步骤3)中:
所述设定训练集和测试集划分比例为80∶20、70∶30、60∶40。
5.如权利要求1所述的一种基于改进EMD-LSTM的网约车需求预测方法,其特征在于,在所述步骤4)中,所述采用经验模态分解法EMD对时间序列进行处理,得到符合条件的本征模态函数IMF,具体实现为:
通过对原数据序列x(t)微分一次或多次求得所有的极大值点,并用三次样条插值函数拟合形成原数据的上包络线;同样,找出所有的极小值点,并将所有的极小值点通过三次样条插值函数拟合形成数据的下包络线,上包络线和下包络线的均值记作m1,得到一个新的数据序列h1,即:
h1=x(t)-m1,
其中,x(t)为原始数据序列,m1为原始数据序列经三次样条差值函数拟合形成的上、下包络线的均值序列;
判断新序列h1是否满足本征模态函数IMF的两个条件,如下:
1)在整个数据段内,极值点的个数和过零点的数目必须相等,或最多差一个;
2)在任意时刻点,由局部极大值点形成的上包络线和由局部极小值点形成的下包络线的平均值为零,即上、下包络线相对于时间轴局部对称;
若满足上述两个条件,即看作第一阶IMF,记作C1,将C1从x(t)中分离出来,得到差值信号r1(t),即:
r1=x(t)-C1,
其中,C1为符合IMF两个条件的IMF序列;若不满足,将h1看作新的x(t),重复上述步骤,直到满足IMF的两个条件;
把r1作为新数据,重复上述筛选步骤,直到第n阶的残余数据成为单调函数,不能筛选出IMF分量为止,即:
rn=rn-1-Cn,
其中,rn-1为第n-1个差值信号,Cn为第n个符合IMF两个条件的IMF序列;
x(t)最终可以表示为n个IMF分量和一个残余项的和,即:
其中,rn(t)为残量,代表信号的平均趋势;各IMF分量Ci(t)则代表从高到低不同频率段的成分,每一频率段所包含的频率成分是不同的。
6.如权利要求1所述的一种基于改进EMD-LSTM的网约车需求预测方法,其特征在于,在所述步骤5)中,所述基于遗产算法改进的K-Means聚类算法:
聚类数目K为2~n,初始种群大小M为20~100,交叉概率Pc为0.25~0.75,变异概率Pm为0.001~0.1,最大迭代次数max_iter依经验设定;
所述步骤5)的具体实现为:
根据步骤4)中得到的n+1个时间序列,设定K的范围为2~n,随后利用随机函数选取K个IMF作为初始聚类中心,形成一条染色体,总共选取M条染色体为一组种群,最终形成n-1组种群;
紧接着对初始种群中每一组聚类中心进行K-Means操作并计算适应度,实施最优保护策略,将最高适应度的染色体保留下来防止在遗传操作中被破坏;
再根据每条染色体的适应度进行操作,选择高适应度染色体进行交叉、变异操作,淘汰低适应度染色体,最终形成下一代群体;
经过一代又一代的选择、交叉、变异操作后,当达到最大迭代次数后,选取每组具有最高适应度的染色体中的聚类中心,画出所有组最高适应度染色体对应的评估指标sse值曲线,并以拐点处K值作为最终K值,对应的聚类中心作为最终初始聚类中心,再次进行K-Means聚类操作;
最终输出对应K个不同的簇,并且每个簇中包含具有相同时序特征的分量序列,并进一步将每个簇中包含的分量序列相加得到新的K个子时间序列。
7.如权利要求1所述的一种基于改进EMD-LSTM的网约车需求预测方法,其特征在于,在所述步骤6)中,所述长短期记忆神经网络:
根据模型训练效果设定模型输入时间步长、隐藏层神经单元个数、一次训练所选取的样本数、迭代次数、全连接层、优化器、训练损失函数参数;
所述步骤6)的具体实现为:
步骤5)得到的K个训练集的子时间序列进一步输入到LSTM模型中,以第一个子时间序列为例,设当前训练集的时间序列含N个时间片段节点,即T=(T0,T1,T2,...,TN),模型输入步长设置为100,则第一组时间序列输入值为T1=(T0,T1,T2,...,T100),以此类推,依据训练集与测试集比例生成不同数量组的含100个时间片段的时间序列;
具体的,步骤6)中模型训练过程为,每次选择1组时间序列输入到含有LSTM层和隐藏单元的模型中进行训练,输出为每组时间序列中的下一个值;
训练过程中通过反向传播算法更新LSTM模型中的参数,包括各个门的权重参数和偏置,并使用Adam优化器自动更新计算梯度和模型参数,以最小化误差使预测结果更加准确;所有的时间序列组顺序经过一次训练后为一次迭代完成;
重复上述步骤,直至迭代次数满足设置的迭代次数,则迭代停止,将K个预测得到的时间序列进行叠加求和,得到已训练的所述需求预测模型。
8.如权利要求1所述的一种基于改进EMD-LSTM的网约车需求预测方法,其特征在于,步骤6)中模型训练过程为,每次选择1组时间序列输入到含有LSTM层和隐藏单元的模型中进行训练,输出为每组时间序列中的下一个值;
其中每个隐藏单元内含有三种门控制机制和一个记忆细胞提供记忆能力,其中门控制机制包括遗忘门、输入门、输出门,记忆单元贯穿门输出的信息传递。
9.如权利要求8所述的一种基于改进EMD-LSTM的网约车需求预测方法,其特征在于,遗忘门通过sigmoid函数决定当前时刻数据和上一时刻数据需要保留多少,公式表现为:
Γf=σ(Wf[ht-1,xt]+bf),
其中,Tf代表遗忘门,σ()为sigmoid函数,Wf、bf为遗忘门的权重参数和偏置矩阵,ht-1为上一隐藏单元的输出,xt为当前组的时间序列输入值;
输入门同样通过sigmoid函数决定当前时刻数据和上一时刻数据保存到单元状态中,公式表现为:
Γu=σ(Wu[ht-1,xt]+bu),
其中,Γu代表遗忘门,Wu、bu为输入门的权重参数和偏置矩阵,为候选值细胞,tanh()为激活函数,Wc、bc为候选值细胞的权重及偏置矩阵;
当前时刻记忆细胞的状态为:
其中,Ct为记忆细胞,Ct-1为上一时刻记忆细胞的值,为Hadamard乘积;
输出门通过sigmoid函数决定当前隐藏层的输出值,以及传送到下一隐藏层的输出值,公式表现为:
Γo=σ(Wo[ht-1,xt]+bo),
其中,Γo代表遗忘门,Wo、bo为输出门的权重参数和偏置矩阵,ht为当前隐藏单元的输出,ht接下来会传给下一个隐藏单元作为输入。
10.如权利要求1所述的一种基于改进EMD-LSTM的网约车需求预测方法,其特征在于,所述网约车预测模型,以一定时间步长的网约车需求时间序列为输入,经过EMD分解处理、经遗传算法改进的K-Means聚类、LSTM神经网络后,最终输出下一个时间步长的网约车需求数量。
11.一种基于改进EMD-LSTM的网约车需求预测系统,其特征在于,所述系统包括:
数据预处理模块:对网约车订单样本数据集中特征数据进行缺失值处理、异常值处理、重复值处理;
时间、空间划分模块:对预处理后的数据集,根据数据集中的经纬度信息进行空间划分,得到一个需求热点区域,并按照具体的时间切片对网约车需求量进行聚合统计,随后将处理后的网约车订单样本数据集发送至改进EMD-LSTM的网约车需求预测模型;
改进EMD-LSTM的网约车需求预测模型,采用经验模态分解法EMD对其输入进行处理,得到若干本征模态函数和一个残余项作为子时间序列;基于遗传算法改进的K-Means聚类算法进行聚类;输入到长短期记忆神经网络LSTM进行训练,结束后将时间序列进行叠加求和,预测输出订单样本下一时间片段的网约车需求量信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310448243.0A CN116468469A (zh) | 2023-04-24 | 2023-04-24 | 一种基于改进emd-lstm的网约车需求预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310448243.0A CN116468469A (zh) | 2023-04-24 | 2023-04-24 | 一种基于改进emd-lstm的网约车需求预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116468469A true CN116468469A (zh) | 2023-07-21 |
Family
ID=87175091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310448243.0A Pending CN116468469A (zh) | 2023-04-24 | 2023-04-24 | 一种基于改进emd-lstm的网约车需求预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116468469A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116862573A (zh) * | 2023-09-05 | 2023-10-10 | 华侨大学 | 基于增量训练的城际网约车短期出行需求预测方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985475A (zh) * | 2018-06-13 | 2018-12-11 | 厦门大学 | 基于深度神经网络的网约车召车需求预测方法 |
CN110188785A (zh) * | 2019-03-28 | 2019-08-30 | 山东浪潮云信息技术有限公司 | 一种基于遗传算法的数据聚类分析方法 |
CN110458336A (zh) * | 2019-07-23 | 2019-11-15 | 内蒙古工业大学 | 一种基于深度学习的网约车供需预测方法 |
CN112668611A (zh) * | 2020-12-08 | 2021-04-16 | 湖南工业大学 | 一种基于Kmeans和CEEMD-PE-LSTM的短期光伏发电功率预测方法 |
CN113935530A (zh) * | 2021-10-15 | 2022-01-14 | 辽宁工程技术大学 | 基于深度聚合神经网络的网约车需求时空热度预测方法 |
CN114881138A (zh) * | 2022-04-29 | 2022-08-09 | 南京邮电大学 | 一种基于遗传算法与K-Means结合的异常流量检测方法 |
CN115953186A (zh) * | 2023-02-24 | 2023-04-11 | 北京化工大学 | 一种网约车需求模式识别与短时需求预测方法 |
-
2023
- 2023-04-24 CN CN202310448243.0A patent/CN116468469A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985475A (zh) * | 2018-06-13 | 2018-12-11 | 厦门大学 | 基于深度神经网络的网约车召车需求预测方法 |
CN110188785A (zh) * | 2019-03-28 | 2019-08-30 | 山东浪潮云信息技术有限公司 | 一种基于遗传算法的数据聚类分析方法 |
CN110458336A (zh) * | 2019-07-23 | 2019-11-15 | 内蒙古工业大学 | 一种基于深度学习的网约车供需预测方法 |
CN112668611A (zh) * | 2020-12-08 | 2021-04-16 | 湖南工业大学 | 一种基于Kmeans和CEEMD-PE-LSTM的短期光伏发电功率预测方法 |
CN113935530A (zh) * | 2021-10-15 | 2022-01-14 | 辽宁工程技术大学 | 基于深度聚合神经网络的网约车需求时空热度预测方法 |
CN114881138A (zh) * | 2022-04-29 | 2022-08-09 | 南京邮电大学 | 一种基于遗传算法与K-Means结合的异常流量检测方法 |
CN115953186A (zh) * | 2023-02-24 | 2023-04-11 | 北京化工大学 | 一种网约车需求模式识别与短时需求预测方法 |
Non-Patent Citations (2)
Title |
---|
刘慧婷等: "基于EMD与K-means算法的时间序列聚类", 模式识别与人工智能, vol. 22, no. 5, 31 October 2009 (2009-10-31), pages 803 - 808 * |
蒲松: "基于EMD-LSTM的血小板需求预测研究", 成都工业学院学报, vol. 25, no. 4, 31 December 2022 (2022-12-31), pages 74 - 78 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116862573A (zh) * | 2023-09-05 | 2023-10-10 | 华侨大学 | 基于增量训练的城际网约车短期出行需求预测方法及系统 |
CN116862573B (zh) * | 2023-09-05 | 2023-12-05 | 华侨大学 | 基于增量训练的城际网约车短期出行需求预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108564391B (zh) | 一种考虑主客观信息的共享电动汽车需求预测方法及系统 | |
CN109920248B (zh) | 一种基于gru神经网络的公交到站时间预测方法 | |
CN110751314A (zh) | 考虑用户充电行为特征数据驱动的电动汽车负荷预测方法 | |
CN116468469A (zh) | 一种基于改进emd-lstm的网约车需求预测方法 | |
CN105471647A (zh) | 一种电力通信网故障定位方法 | |
CN111950910A (zh) | 基于dbscan-ga的机场保障车辆任务调度方法 | |
CN111985719A (zh) | 一种基于改进的长短期记忆网络的电力负荷预测方法 | |
CN115166534A (zh) | 一种锂离子电池剩余使用寿命预测方法和系统 | |
CN111898867A (zh) | 一种基于深度神经网络的飞机总装生产线产能预测方法 | |
CN113657678A (zh) | 一种基于信息新鲜度的电网电力数据预测方法 | |
CN114037138A (zh) | 基于双层分解和深度学习的地铁短时进站客流预测系统及实施方法 | |
CN115952418A (zh) | 一种基于模型超参数的机器学习模型优化的方法及装置 | |
Zuo et al. | Artificial Intelligence Prediction and Decision Evaluation Model Based on Deep Learning | |
CN116401037A (zh) | 一种基于遗传算法的多任务调度方法和系统 | |
CN114331019A (zh) | 一种基于致险因素的城市交通安全风险实时评估方法及装置 | |
CN116227738B (zh) | 一种电网客服话务量区间预测方法及系统 | |
CN115333957A (zh) | 基于用户行为和企业业务特征的业务流量预测方法及系统 | |
CN115794880A (zh) | 一种面向近似查询处理的和积网络与残差神经网络混合模型 | |
CN115630979A (zh) | 日前电价的预测方法、装置、存储介质及计算机设备 | |
Zhao et al. | Selective maintenance modeling for a multi-state system considering human reliability | |
CN114492967A (zh) | 基于ceemdan和blstm组合模型的城轨车站客流预测方法和介质 | |
CN115409170A (zh) | 样本数据生成、出行需求预测模型训练和预测方法及装置 | |
CN117151257A (zh) | 一种预测航班飞行误差的方法及系统 | |
Zhongda et al. | Approach for time series prediction based on empirical mode decomposition and extreme learning machine | |
CN112561186A (zh) | 一种短期电力负荷的预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |