CN116894522A - 一种基于深度学习模型的网约车短时需求预测方法 - Google Patents
一种基于深度学习模型的网约车短时需求预测方法 Download PDFInfo
- Publication number
- CN116894522A CN116894522A CN202310930943.3A CN202310930943A CN116894522A CN 116894522 A CN116894522 A CN 116894522A CN 202310930943 A CN202310930943 A CN 202310930943A CN 116894522 A CN116894522 A CN 116894522A
- Authority
- CN
- China
- Prior art keywords
- sequence
- prediction
- data
- model
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000013136 deep learning model Methods 0.000 title claims abstract description 30
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 22
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims abstract description 18
- 230000006870 function Effects 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 230000010354 integration Effects 0.000 claims abstract description 7
- 230000008569 process Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000013112 stability test Methods 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 abstract description 9
- 238000012937 correction Methods 0.000 abstract description 8
- 238000010801 machine learning Methods 0.000 abstract description 2
- 230000008901 benefit Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000009131 signaling function Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于深度学习模型的网约车短时需求预测方法,涉及网约车需求预测与机器学习领域,包括以下步骤:S1:收集大型交通枢纽的网约车需求数据,并对原始数据进行预处理形成数据集;S2:时间序列分解,采用变分模态分解VMD方法对步骤S1处理后的时间序列数据进行分解,得到确定数目的本征模态函数;S3:通过深度学习模型Transformer对分解后的模型进行预测;S4:子序列集成,对步骤S3的预测结果进行累加,得到集成后的预测结果;S5:预测误差修正,通过时间序列预测模型ARIMA对预测误差进行修正。本发明采用上述结构,对城市交通枢纽的网约车需求进行预测,并增加误差修正机制,以提升预测模型的精度,为城市交通枢纽的网约车调度提供决策依据。
Description
技术领域
本发明涉及网约车需求预测与机器学习领域,尤其是涉及一种基于深度学习模型的网约车短时需求预测方法。
背景技术
随着移动互联网和智能交通系统的发展,网约车作为一种通过在线平台与移动终端将乘客和司机连接起来的新兴出行方式,已经成为居民出行的主要方式之一。在网约车出现之前,居民主要的出行方式包括私家车、巡游出租车、公交车、地铁等,但存在诸如限号、价格高昂、拥堵、供需匹配不及时、出行体验差等缺陷。网约车的出现,弥补了传统出行方式的不足,得益于其实时匹配需求、舒适便捷、价格适中等优势,网约车出行在居民出行方式中的比例逐年攀升。网约车的服务流程是由手持移动终端的乘客在APP平台进行下单,平台方收到订单信息进而为乘客匹配合适的车辆,将其送往目的地。在这个过程中,网约车需求的预测是至关重要的,否则会出现供需失衡的问题,供过于求会导致车辆空驶成本增大,供不应求则会导致乘客需求得不到满足。
发明内容
本发明的目的是提供一种基于深度学习模型的网约车短时需求预测方法,通过增加分解集成及误差修正环节,提升网约车短期需求预测模型的预测性能,为城市交通枢纽的网约车调度及运营提供可靠的决策依据。
为实现上述目的,本发明提供了一种基于深度学习模型的网约车短时需求预测方法,包括以下步骤:
S1:数据收集与预处理,收集大型交通枢纽的网约车需求数据,并对原始数据进行预处理,形成数据集;
S2:时间序列分解,采用变分模态分解VMD方法对步骤S1处理后的时间序列数据进行分解,得到确定数目的本征模态函数,将非平稳序列的原始序列分解成多个平稳的子序列;
S3:网约车需求预测,通过深度学习模型Transformer对分解后的模型进行预测;
S4:子序列集成,对步骤S3的预测结果进行累加,得到集成后的预测结果;
S5:预测误差修正,通过时间序列预测模型ARIMA对预测误差进行修正。
优选的,在步骤S1中,对缺失数据进行均值插补,对异常值进行平滑处理,得到进行分析的完整数据集。
优选的,在步骤S2中,变分模态分解方法的实现方法,包括具体步骤如下:
S21:初始化分别表示第k个模态分量和中心频率,/>为拉格朗日算子,右上角数字1表示第一次迭代;
S22:对每一子序列,不断更新得到和/>
式中,为当前剩余分量的维纳滤波,/>为与之对应模态分量的频率中心,ω为频率值;/>分别表示原始序列f(t)和/>的傅里叶变换,α为二次惩罚因子;
S23:ω≥0,更新
τ表示噪声容忍度,K表示模态的总个数;
S24:判断迭代终止条件;
满足上述条件迭代终止,得到分解后的K个子序列;ε代表相似系数;不满足上述条件重复步骤S21-S24。
优选的,在步骤S3中,深度学习模型Transformer对分解后的模型进行预测,包括以下步骤:
S31:对输入信息进行编码,Transformer模型的输入采用词嵌入和位置嵌入相加得到,位置编码获取位置信息,位置编码公式为:
其中,PE表示Position Embedding,pos表示单个数据的位置,dmodel表示编码维度,2i表示偶数维度,2i+1表示奇数维度;
S32:进入Encoder编码器模块,编码块由Lenc个独立的编码层堆叠而成,每一个编码层里包含多头注意力层、全连接层和正则化层,解码层的多头注意力可以表示为:
Multihead(H)=concat(head1,...,headu)WO
其计算过程为,将u个注意力表示进行拼接,然后与WO作矩阵乘法,结合公式单个注意力块为Q、K、V的函数:
式中:Q、K、V由输入数据进行编码之后再次作线性映射得到:
式中:WQ、WK、WV是可学习的参数;是输入数据与位置编码相结合得到的特征矩阵,/>定义为:
其中,n个输入数据,每个输入项Xt∈R1×d为d维向量。
S33:解码层包括两个多头注意力层,第一个注意力层与解码层的注意力层相同;第二个注意力层的K和V是解码块的输出,Q是正则化层的输出;
normcur=Normalization(z,normpre)
z是注意力层或者全连接层的输出;Transformer中正则化层结构均一致,由残差连接和正则化操作构成。
优选的,在步骤S5中,预测结果进行误差修正,包括以下步骤:
S51:对深度学习模型输出的网约车订单需求预测结果与原始数据的差值序列,进行平稳性检验;非平稳数据,对其进行差分处理,作为ARIMA模型的原始输入序列;
S52:对数据进行白噪声检验,判断序列是否为随机序列;
S53:针对差分后的平稳序列,确定差分阶数d,计算自相关系数ACF和偏自相关系数PACF,ACF函数计算公式如下:
绘制图像进行观测,通过AIC准则和BIC准则确定ARIMA模型的参数p,d,q;
S54:对序列进行平稳性检验和差分处理后,确定模型的最优参数,得到ARIMA模型的误差预测结果;
S55:将ARIMA模型的误差预测结果与深度学习模型预测结构相加得到最终的网约车需求预测数值。
因此,本发明采用上述一种基于深度学习模型的网约车短时需求预测方法,具备以下有益效果:通过增加分解集成及误差修正环节,提升网约车短期需求预测模型的预测性能,为城市交通枢纽的网约车调度及运营提供可靠的决策依据。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1是本发明一种基于深度学习模型的网约车短时需求预测方法的流程图;
图2是本发明中深度学习模型Transformer的原理图;
图3是本发明中误差修正模型ARIMA流程图;
图4是本发明中网约车需求预测结果示例图。
具体实施方式
以下通过附图和实施例对本发明的技术方案作进一步说明。
除非另外定义,本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。
本发明中使用的“包括”或者“包含”等类似的词语意指在该词前的要素涵盖在该词后列举的要素,并不排除也涵盖其它要素的可能。术语“内”、“外”、“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。在本发明中,除非另有明确的规定和限定,术语“附着”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
实施例一
如图1所示,本发明提供了一种基于深度学习模型的网约车短时需求预测方法,并增加了分解-集成和误差修正机制,包括以下步骤:
S1:数据收集与预处理,收集大型交通枢纽的网约车需求数据,并对原始数据进行预处理,形成数据集;在步骤S1中,数据处理包括缺失值处理和异常值处理;
数据的时间间隔为15min,因此对于缺失值的处理采用均值插补的方法,取前一个时段和后一个时间的需求数量的均值进行填充;针对连续缺失数据为两个以上的情况,采用线性插值方法对数据缺失值进行填补;
在连续时间段内检测到缺失值,x0表示在时间段i=0时记录的数据值,xI+1表示在时间段i=I+1时记录的数据值,线性插值方法填补缺失值的公式如下:
对于异常值的处理,采用Hampel识别器,Hampel识别过程以滑动窗的形式进行,逐个求出窗内的中位值并计算中位值绝对偏差MAD,把所有超出3倍MAD×κ上下限的序列元素标记为离群值。
S2:时间序列分解,采用变分模态分解VMD方法对步骤S1处理后的时间序列数据进行分解,得到确定数目的本征模态函数,将非平稳序列的原始序列分解成多个平稳的子序列;在步骤S2中,变分模态分解方法的实现方法,包括具体步骤如下:
S21:初始化分别表示第k个模态分量和中心频率,/>为拉格朗日算子,右上角数字1表示第一次迭代;
S22:对每一子序列,不断更新得到和/>
式中,为当前剩余分量的维纳滤波,/>为与之对应模态分量的频率中心,ω为频率值;/>分别表示原始序列f(t)和/>的傅里叶变换,α为二次惩罚因子;
S23:ω≥0,更新
τ表示噪声容忍度,K表示模态的总个数;
S24:判断迭代终止条件;
满足上述条件迭代终止,得到分解后的K个子序列;ε代表相似系数;不满足上述条件重复步骤S21-S24。
VMD分解的前提为构造一个变分问题假设每个‘模态’都是具有中心频率的有限带宽,变分问题就可以被描述为寻求K个IMF分量uk(t),使每个模态的估计带宽之和最小,约束条件为每个模态相加之和为原始输入信号,变分问题构造过程如下:
(1)通过Hilbert变换,得到每个模态函数的解析信号,目的是得到它的单边频谱,具体变换如下:
其中δ(t)为脉冲信号函数,uk(t)为IMF分量,*为卷积计算符号,j表示虚数单位。
(2)各个模态的解析信号加入一个预估中心频率公式如下其中ωk为中心频率,可将每个模态的频谱调制到相应的基频带。
(3)计算上述解调信号梯度的平方L2范数,估计出各个模态信号带宽,构造使总模态信号带宽最小的变分问题,变分问题表示如下,
其中f为原始信号f(t),表示对时间进行求导,t为时间。
变分模态分解的算法通过引入惩罚因子α和拉格朗日乘法算子λ(t)得到扩展的拉格朗日表达式如下,
其中f(t)为原始信号。
S3:网约车需求预测,通过深度学习模型Transformer对分解后的模型进行预测;Transformer多变量时序预测模型基于原始的Transformer架构,主体结构基于编码器-解码器(Encoder-Decoder)架构,编码器(Encoder)将输入序列(x1,···,xn)转换为连续表达(z1,···,zn),最后解码器生成输出序列(y1,···,ym)编码和解码部分分别由6个Encoder和Decoder模块堆叠而成,每层结构相同。
在编码器中,每一层均包括多头注意力机制层和全连接前馈神经网络层,每个子层后都衔接残差连接及归一化过程,每个子层的输出为LayerNorm(x+Sublayer(x))。解码器的结构与编码器相似,解码器增加了Masked Multi-head self-attention结构,目的是按顺序进行解码,当前输出只能基于已输出的部分。
在步骤S3中,深度学习模型Transformer对分解后的模型进行预测,包括以下步骤:
S31:对输入信息进行编码,Transformer模型的输入采用词嵌入和位置嵌入相加得到,位置编码获取位置信息,位置编码公式为:
其中,PE表示PositionEmbedding,pos表示单个数据的位置,dmodel表示编码维度,2i表示偶数维度,2i+1表示奇数维度;
S32:进入Encoder编码器模块,编码块由Lenc个独立的编码层堆叠而成,每一个编码层里包含多头注意力层、全连接层和正则化层,解码层的多头注意力可以表示为:
Multihead(H)=concat(head1,...,headu)WO
其计算过程为,将u个注意力表示进行拼接,然后与WO作矩阵乘法,结合公式单个注意力块为Q、K、V的函数,Transformer模型使用多头注意力机制,多头注意力机制由多个Scaled Dot-Product Attention组成,该模块的输入包括三个向量,分别是Query,Key和Value,分别由Q,K,V表示,三个向量均基于输入向量计算得出,Query和Key的维度为dk,Value的维度为dv,计算公式如下:
其中,Q、K、V分别代表Query,Key和Value三个向量,三个向量均基于输入向量计算得出,先计算Q和K向量的点积,除以通过softmax函数得到对应的权重,再与V向量进行点积加权。
式中:Q、K、V由输入数据进行编码之后再次作线性映射得到:
式中:WQ、WK、WV是可学习的参数;是输入数据与位置编码相结合得到的特征矩阵,/>定义为:
其中,n个输入数据,每个输入项Xt∈R1×d为d维向量。
S33:解码层包括两个多头注意力层,第一个注意力层与解码层的注意力层相同;第二个注意力层的K和V是解码块的输出,Q是正则化层的输出;
normcur=Normalization(z,normpre)
其中,z是注意力层或者全连接层的输出;Transformer中正则化层结构均一致,由残差连接和正则化操作构成。
S4:子序列集成,对步骤S3的预测结果进行累加,得到集成后的预测结果;
S5:预测误差修正,通过时间序列预测模型ARIMA对预测误差进行修正。
在步骤S5中,预测结果进行误差修正,包括以下步骤:
S51:对深度学习模型输出的网约车订单需求预测结果与原始数据的差值序列,进行平稳性检验;针对非平稳数据,进行差分处理,作为ARIMA模型的原始输入序列;
S52:对数据进行白噪声检验,判断序列是否为随机序列;
S53:针对差分后的平稳序列,确定差分阶数d,计算自相关系数ACF和偏自相关系数PACF,ACF函数计算公式如下:
绘制图像进行观测,通过AIC准则和BIC准则确定ARIMA模型的参数p,d,q;
S54:对序列进行平稳性检验和差分处理后,确定模型的最优参数,得到ARIMA模型的误差预测结果;
S55:将ARIMA模型的误差预测结果与深度学习模型预测结构相加得到最终的网约车需求预测数值。
因此,本发明采用上述一种增加分解-集成和误差修正机制的网约车需求深度学习预测模型,可以精确的预测未来15min城市大型交通枢纽的网约车短时需求数量,为网约车的调度提供可靠的决策依据。
实施例二
北京西站,时间跨度为2022年4月1日到2022年7月31日,时间间隔为15min,共11712条数据。经过预处理后的数据示例如表1所示:
表1预处理后的网约车需求数据
针对表1数据集,验证我们提出的增加分解-集成和误差修正机制的深度学习预测模型。
具体操作步骤如下:
在步骤S1中,包括缺失值处理及异常值处理:由于数据的时间间隔为15min,时间间隔较短,因此对于缺失值为一个的处理采用均值插补的方法,取前一个时段和后一个时间的需求数量的均值进行填充;针对连续缺失数据为两个以上的情况,采用线性插值方法对数据缺失值进行填补;假设在连续时间段内检测到缺失值,x0表示在时间段i=0时记录的数据值,xI+1表示在时间段i=I+1时记录的数据值,线性插值方法填补缺失值的公式如下:
对于异常值的处理,采用Hampel识别器。Hampel识别过程以滑动窗的形式进行,逐个求出窗内的中位值并计算中位值绝对偏差MAD,把所有超出3倍MAD×κ上下限的序列元素标记为离群值。
步骤S2主要是序列分解的过程。VMD分解预处理之后的时间序列为多个IMF,如图2所示。VMD分解是一种自适应、完全非递归的模态变分和信号处理方法,具有可以确定模态分解个数的优点,其自适应性表现在根据实际情况确定所给序列的模态分解个数,随后的搜索和求解的过程中可以自适应地匹配每种模态的中心频率和有限带宽,并且可以实现IMF的有效分离、信号的频域划分,进而得到给定信号的有效分解成分,最终获得变分问题的最优解。
在变分模态分解的过程中,由于分解个数需要自定义,因此采用如下步骤确定VMD分解个数,首先分解为两个IMF,进而判断趋势项,即第一个IMF是否只有极值点,如果是则停止分解,如果不是则继续分解为3个IMF,以此类推,直到趋势项满足要求为止。
在步骤S3中,通过深度学习Transformer对S2分解后的序列进行预测。Transformer是一类由编码器Encoder和解码器Decoder组成的模型。首先对输入序列进行词嵌入和位置编码,将编码叠加后得到模型的输入,经由多头注意力机制及前馈神经网络等机制进行计算,最后通过Softmax函数对预测结果进行输出。
在步骤S4中,对S3的预测结果进行累加集成,得到深度学习模型的预测结果。
最后,在步骤S5中,使用ARIMA模型对误差序列进行修正,与原预测结果叠加得到最终的需求预测结果。
因此,本发明采用上述一种基于深度学习模型的网约车短时需求预测方法,通过增加分解集成及误差修正环节,提升网约车短期需求预测模型的预测性能,为城市交通枢纽的网约车调度及运营提供可靠的决策依据。
最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。
Claims (5)
1.一种基于深度学习模型的网约车短时需求预测方法,其特征在于:包括以下步骤:
S1:数据收集与预处理,收集大型交通枢纽的网约车需求数据,并对原始数据进行预处理,形成数据集;
S2:时间序列分解,采用变分模态分解VMD方法对步骤S1处理后的时间序列数据进行分解,得到确定数目的本征模态函数,将非平稳序列的原始序列分解成多个平稳的子序列;
S3:网约车需求预测,通过深度学习模型Transformer对分解后的模型进行预测;
S4:子序列集成,对步骤S3的预测结果进行累加,得到集成后的预测结果;
S5:预测误差修正,通过时间序列预测模型ARIMA对预测误差进行修正。
2.根据权利要求1所述的一种基于深度学习模型的网约车短时需求预测方法,其特征在于:在步骤S1中,对缺失数据进行均值插补,对异常值进行平滑处理,得到进行分析的完整数据集。
3.根据权利要求2所述的一种基于深度学习模型的网约车短时需求预测方法,其特征在于:在步骤S2中,变分模态分解方法的实现方法,包括具体步骤如下:
S21:初始化分别表示第k个模态分量和中心频率,/>为拉格朗日算子,右上角数字1表示第一次迭代;
S22:对每一子序列,不断更新得到和/>
式中,为当前剩余分量的维纳滤波,/>为与之对应模态分量的频率中心,ω为频率值;/>分别表示原始序列f(t)和/>的傅里叶变换,α为二次惩罚因子;
S23:ω≥0,更新
τ表示噪声容忍度,K表示模态的总个数;
S24:判断迭代终止条件;
满足上述条件迭代终止,得到分解后的K个子序列;ε代表相似系数;不满足上述条件重复步骤S21-S24。
4.根据权利要求3所述的一种基于深度学习模型的网约车短时需求预测方法,其特征在于:在步骤S3中,深度学习模型Transformer对分解后的模型进行预测,包括以下步骤:
S31:对输入信息进行编码,Transformer模型的输入采用词嵌入和位置嵌入相加得到,位置编码获取位置信息,位置编码公式为:
其中,PE表示PositionEmbedding,pos表示单个数据的位置,dmodel表示编码维度,2i表示偶数维度,2i+1表示奇数维度;
S32:进入Encoder编码器模块,编码块由Lenc个独立的编码层堆叠而成,每一个编码层里包含多头注意力层、全连接层和正则化层,解码层的多头注意力可以表示为:
Multihead(H)=concat(head1,...,headu)WO
其计算过程为,将u个注意力表示进行拼接,然后与WO作矩阵乘法,结合公式单个注意力块为Q、K、V的函数:
式中:Q、K、V由输入数据进行编码之后再次作线性映射得到:
式中:WQ、WK、WV是可学习的参数;是输入数据与位置编码相结合得到的特征矩阵,/>定义为:
其中,n个输入数据,每个输入项Xt∈R1×d为d维向量。
S33:解码层包括两个多头注意力层,第一个注意力层与解码层的注意力层相同;第二个注意力层的K和V是解码块的输出,Q是正则化层的输出;
normcur=Normalization(z,normpre)
z是注意力层或者全连接层的输出,Transformer中正则化层结构均一致,由残差连接和正则化操作构成。
5.根据权利要求4所述的一种基于深度学习模型的网约车短时需求预测方法,其特征在于:在步骤S5中,预测结果进行误差修正,包括以下步骤:
S51:对深度学习模型输出的网约车订单需求预测结果与原始数据的差值序列,进行平稳性检验;非平稳数据,对其进行差分处理,作为ARIMA模型的原始输入序列;
S52:对数据进行白噪声检验,判断序列是否为随机序列;
S53:针对差分后的平稳序列,确定差分阶数d,计算自相关系数ACF和偏自相关系数PACF,ACF函数计算公式如下:
绘制图像进行观测,通过AIC准则和BIC准则确定ARIMA模型的参数p,d,q;
S54:对序列进行平稳性检验和差分处理后,确定模型的最优参数,得到ARIMA模型的误差预测结果;
S55:将ARIMA模型的误差预测结果与深度学习模型预测结构相加得到最终的网约车需求预测数值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310930943.3A CN116894522A (zh) | 2023-07-27 | 2023-07-27 | 一种基于深度学习模型的网约车短时需求预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310930943.3A CN116894522A (zh) | 2023-07-27 | 2023-07-27 | 一种基于深度学习模型的网约车短时需求预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116894522A true CN116894522A (zh) | 2023-10-17 |
Family
ID=88310686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310930943.3A Pending CN116894522A (zh) | 2023-07-27 | 2023-07-27 | 一种基于深度学习模型的网约车短时需求预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116894522A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110782008A (zh) * | 2019-10-16 | 2020-02-11 | 北京百分点信息科技有限公司 | 深度学习模型的训练方法、预测方法和装置 |
CN111523728A (zh) * | 2020-04-23 | 2020-08-11 | 东北电力大学 | 一种四阶段混合短时风向预测方法 |
CN112528643A (zh) * | 2020-12-14 | 2021-03-19 | 上海栖盟科技有限公司 | 一种基于神经网络的文本信息提取方法及装置 |
US20220067763A1 (en) * | 2020-09-02 | 2022-03-03 | Hyun Jung Lee | Method for predicting demand using visual schema of product, device therefor and computer program therefor |
CN114358389A (zh) * | 2021-12-13 | 2022-04-15 | 重庆邮电大学 | 结合vmd分解和时间卷积网络的短期电力负荷预测方法 |
CN115392289A (zh) * | 2022-07-22 | 2022-11-25 | 山东科技大学 | 一种基于深度学习的微震信号时序数据预测方法 |
CN115953186A (zh) * | 2023-02-24 | 2023-04-11 | 北京化工大学 | 一种网约车需求模式识别与短时需求预测方法 |
-
2023
- 2023-07-27 CN CN202310930943.3A patent/CN116894522A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110782008A (zh) * | 2019-10-16 | 2020-02-11 | 北京百分点信息科技有限公司 | 深度学习模型的训练方法、预测方法和装置 |
CN111523728A (zh) * | 2020-04-23 | 2020-08-11 | 东北电力大学 | 一种四阶段混合短时风向预测方法 |
US20220067763A1 (en) * | 2020-09-02 | 2022-03-03 | Hyun Jung Lee | Method for predicting demand using visual schema of product, device therefor and computer program therefor |
CN112528643A (zh) * | 2020-12-14 | 2021-03-19 | 上海栖盟科技有限公司 | 一种基于神经网络的文本信息提取方法及装置 |
CN114358389A (zh) * | 2021-12-13 | 2022-04-15 | 重庆邮电大学 | 结合vmd分解和时间卷积网络的短期电力负荷预测方法 |
CN115392289A (zh) * | 2022-07-22 | 2022-11-25 | 山东科技大学 | 一种基于深度学习的微震信号时序数据预测方法 |
CN115953186A (zh) * | 2023-02-24 | 2023-04-11 | 北京化工大学 | 一种网约车需求模式识别与短时需求预测方法 |
Non-Patent Citations (2)
Title |
---|
周建中等: "水电机组故障诊断及状态趋势预测理论与方法", 30 November 2020, 华中科技大学出版社, pages: 26 - 29 * |
孙冬梅;陈玲;朱靳;: "基于ARIMA模型误差修正的小波神经网络风速短期预测", 计算机与应用化学, no. 03, pages 4 - 5 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lin et al. | Pattern sensitive prediction of traffic flow based on generative adversarial framework | |
CN103049792B (zh) | 深层神经网络的辨别预训练 | |
CN111223488B (zh) | 语音唤醒方法、装置、设备及存储介质 | |
CN109710953B (zh) | 一种翻译方法及装置、计算设备、存储介质和芯片 | |
CN112417753B (zh) | 一种基于城市公共交通资源联合调度方法 | |
CN109767043B (zh) | 一种电力负荷时间序列大数据智能建模与预测方法 | |
CN111275244A (zh) | 一种车速时间序列分频预测方法 | |
CN114358389A (zh) | 结合vmd分解和时间卷积网络的短期电力负荷预测方法 | |
CN115278777A (zh) | 一种车载净化器数据传输方法 | |
KR102061300B1 (ko) | 선형 예측 부호화 장치, 선형 예측 복호 장치, 이들의 방법, 프로그램 및 기록 매체 | |
CN114912666A (zh) | 一种基于ceemdan算法和注意力机制的短时客流量预测方法 | |
CN116894522A (zh) | 一种基于深度学习模型的网约车短时需求预测方法 | |
CN113223502B (zh) | 语音识别系统优化方法、装置、设备及可读存储介质 | |
CN110852522A (zh) | 一种短期电力负荷预测方法及系统 | |
CN114358283A (zh) | 气体识别神经网络模型的优化方法及相关设备 | |
CN116681373B (zh) | 一种物流供应链管理方法 | |
CN117251705A (zh) | 一种每日天然气负荷预测方法 | |
CN117171582A (zh) | 基于时空注意力机制的车辆轨迹预测方法及系统 | |
CN117094426A (zh) | 一种台区分布式光伏电站群功率预测方法 | |
CN116405139A (zh) | 一种基于Informer的频谱预测模型和方法 | |
CN116502745A (zh) | 电力负荷预测方法、系统、电子设备以及存储介质 | |
CN116070768A (zh) | 一种基于数据重构和TCN-BiLSTM的短期风电功率预测方法 | |
CN115018134A (zh) | 一种基于三尺度时空信息的行人轨迹预测方法 | |
Merz et al. | A credibility approach to the Munich chain-ladder method | |
Li et al. | XRMDN: A Recurrent Mixture Density Networks-based Architecture for Short-Term Probabilistic Demand Forecasting in Mobility-on-Demand Systems with High Volatility |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |