CN116894522A

CN116894522A - 一种基于深度学习模型的网约车短时需求预测方法

Info

Publication number: CN116894522A
Application number: CN202310930943.3A
Authority: CN
Inventors: 李想; 李静怡; 金坤; 马红光
Original assignee: Beijing University of Chemical Technology
Current assignee: Beijing University of Chemical Technology
Priority date: 2023-07-27
Filing date: 2023-07-27
Publication date: 2023-10-17

Abstract

本发明公开了一种基于深度学习模型的网约车短时需求预测方法，涉及网约车需求预测与机器学习领域，包括以下步骤：S1：收集大型交通枢纽的网约车需求数据，并对原始数据进行预处理形成数据集；S2：时间序列分解，采用变分模态分解VMD方法对步骤S1处理后的时间序列数据进行分解，得到确定数目的本征模态函数；S3：通过深度学习模型Transformer对分解后的模型进行预测；S4：子序列集成，对步骤S3的预测结果进行累加，得到集成后的预测结果；S5：预测误差修正，通过时间序列预测模型ARIMA对预测误差进行修正。本发明采用上述结构，对城市交通枢纽的网约车需求进行预测，并增加误差修正机制，以提升预测模型的精度，为城市交通枢纽的网约车调度提供决策依据。

Description

一种基于深度学习模型的网约车短时需求预测方法

技术领域

本发明涉及网约车需求预测与机器学习领域，尤其是涉及一种基于深度学习模型的网约车短时需求预测方法。

背景技术

随着移动互联网和智能交通系统的发展，网约车作为一种通过在线平台与移动终端将乘客和司机连接起来的新兴出行方式，已经成为居民出行的主要方式之一。在网约车出现之前，居民主要的出行方式包括私家车、巡游出租车、公交车、地铁等，但存在诸如限号、价格高昂、拥堵、供需匹配不及时、出行体验差等缺陷。网约车的出现，弥补了传统出行方式的不足，得益于其实时匹配需求、舒适便捷、价格适中等优势，网约车出行在居民出行方式中的比例逐年攀升。网约车的服务流程是由手持移动终端的乘客在APP平台进行下单，平台方收到订单信息进而为乘客匹配合适的车辆，将其送往目的地。在这个过程中，网约车需求的预测是至关重要的，否则会出现供需失衡的问题，供过于求会导致车辆空驶成本增大，供不应求则会导致乘客需求得不到满足。

发明内容

本发明的目的是提供一种基于深度学习模型的网约车短时需求预测方法，通过增加分解集成及误差修正环节，提升网约车短期需求预测模型的预测性能，为城市交通枢纽的网约车调度及运营提供可靠的决策依据。

为实现上述目的，本发明提供了一种基于深度学习模型的网约车短时需求预测方法，包括以下步骤：

S1：数据收集与预处理，收集大型交通枢纽的网约车需求数据，并对原始数据进行预处理，形成数据集；

S2：时间序列分解，采用变分模态分解VMD方法对步骤S1处理后的时间序列数据进行分解，得到确定数目的本征模态函数，将非平稳序列的原始序列分解成多个平稳的子序列；

S3：网约车需求预测，通过深度学习模型Transformer对分解后的模型进行预测；

S4：子序列集成，对步骤S3的预测结果进行累加，得到集成后的预测结果；

S5：预测误差修正，通过时间序列预测模型ARIMA对预测误差进行修正。

优选的，在步骤S1中，对缺失数据进行均值插补，对异常值进行平滑处理，得到进行分析的完整数据集。

优选的，在步骤S2中，变分模态分解方法的实现方法，包括具体步骤如下：

S21：初始化分别表示第k个模态分量和中心频率，/>为拉格朗日算子，右上角数字1表示第一次迭代；

S22：对每一子序列，不断更新得到和/>

式中，为当前剩余分量的维纳滤波，/>为与之对应模态分量的频率中心，ω为频率值；/>分别表示原始序列f(t)和/>的傅里叶变换，α为二次惩罚因子；

S23：ω≥0，更新

τ表示噪声容忍度，K表示模态的总个数；

S24：判断迭代终止条件；

满足上述条件迭代终止，得到分解后的K个子序列；ε代表相似系数；不满足上述条件重复步骤S21-S24。

优选的，在步骤S3中，深度学习模型Transformer对分解后的模型进行预测，包括以下步骤：

S31：对输入信息进行编码，Transformer模型的输入采用词嵌入和位置嵌入相加得到，位置编码获取位置信息，位置编码公式为：

其中，PE表示Position Embedding，pos表示单个数据的位置，d_model表示编码维度，2i表示偶数维度，2i+1表示奇数维度；

S32：进入Encoder编码器模块，编码块由L_enc个独立的编码层堆叠而成，每一个编码层里包含多头注意力层、全连接层和正则化层，解码层的多头注意力可以表示为：

Multihead(H)＝concat(head₁,...,head_u)W^O

其计算过程为，将u个注意力表示进行拼接，然后与W^O作矩阵乘法，结合公式单个注意力块为Q、K、V的函数：

式中：Q、K、V由输入数据进行编码之后再次作线性映射得到：

式中：W^Q、W^K、W^V是可学习的参数；是输入数据与位置编码相结合得到的特征矩阵，/>定义为：

其中，n个输入数据，每个输入项X_t∈R^1×d为d维向量。

S33：解码层包括两个多头注意力层，第一个注意力层与解码层的注意力层相同；第二个注意力层的K和V是解码块的输出，Q是正则化层的输出；

norm_cur＝Normalization(z,norm_pre)

z是注意力层或者全连接层的输出；Transformer中正则化层结构均一致，由残差连接和正则化操作构成。

优选的，在步骤S5中，预测结果进行误差修正，包括以下步骤：

S51：对深度学习模型输出的网约车订单需求预测结果与原始数据的差值序列，进行平稳性检验；非平稳数据，对其进行差分处理，作为ARIMA模型的原始输入序列；

S52：对数据进行白噪声检验，判断序列是否为随机序列；

S53：针对差分后的平稳序列，确定差分阶数d，计算自相关系数ACF和偏自相关系数PACF，ACF函数计算公式如下：

绘制图像进行观测，通过AIC准则和BIC准则确定ARIMA模型的参数p，d，q；

S54：对序列进行平稳性检验和差分处理后，确定模型的最优参数，得到ARIMA模型的误差预测结果；

S55：将ARIMA模型的误差预测结果与深度学习模型预测结构相加得到最终的网约车需求预测数值。

因此，本发明采用上述一种基于深度学习模型的网约车短时需求预测方法，具备以下有益效果：通过增加分解集成及误差修正环节，提升网约车短期需求预测模型的预测性能，为城市交通枢纽的网约车调度及运营提供可靠的决策依据。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1是本发明一种基于深度学习模型的网约车短时需求预测方法的流程图；

图2是本发明中深度学习模型Transformer的原理图；

图3是本发明中误差修正模型ARIMA流程图；

图4是本发明中网约车需求预测结果示例图。

具体实施方式

以下通过附图和实施例对本发明的技术方案作进一步说明。

除非另外定义，本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。

本发明中使用的“包括”或者“包含”等类似的词语意指在该词前的要素涵盖在该词后列举的要素，并不排除也涵盖其它要素的可能。术语“内”、“外”、“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制，当被描述对象的绝对位置改变后，则该相对位置关系也可能相应地改变。在本发明中，除非另有明确的规定和限定，术语“附着”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

实施例一

如图1所示，本发明提供了一种基于深度学习模型的网约车短时需求预测方法，并增加了分解-集成和误差修正机制，包括以下步骤：

S1：数据收集与预处理，收集大型交通枢纽的网约车需求数据，并对原始数据进行预处理，形成数据集；在步骤S1中，数据处理包括缺失值处理和异常值处理；

数据的时间间隔为15min，因此对于缺失值的处理采用均值插补的方法，取前一个时段和后一个时间的需求数量的均值进行填充；针对连续缺失数据为两个以上的情况，采用线性插值方法对数据缺失值进行填补；

在连续时间段内检测到缺失值，x₀表示在时间段i＝0时记录的数据值，x_I+1表示在时间段i＝I+1时记录的数据值，线性插值方法填补缺失值的公式如下：

对于异常值的处理，采用Hampel识别器，Hampel识别过程以滑动窗的形式进行，逐个求出窗内的中位值并计算中位值绝对偏差MAD，把所有超出3倍MAD×κ上下限的序列元素标记为离群值。

S2：时间序列分解，采用变分模态分解VMD方法对步骤S1处理后的时间序列数据进行分解，得到确定数目的本征模态函数，将非平稳序列的原始序列分解成多个平稳的子序列；在步骤S2中，变分模态分解方法的实现方法，包括具体步骤如下：

S22：对每一子序列，不断更新得到和/>

S23：ω≥0，更新

τ表示噪声容忍度，K表示模态的总个数；

S24：判断迭代终止条件；

VMD分解的前提为构造一个变分问题假设每个‘模态’都是具有中心频率的有限带宽，变分问题就可以被描述为寻求K个IMF分量u_k(t)，使每个模态的估计带宽之和最小，约束条件为每个模态相加之和为原始输入信号，变分问题构造过程如下：

(1)通过Hilbert变换，得到每个模态函数的解析信号，目的是得到它的单边频谱，具体变换如下:

其中δ(t)为脉冲信号函数，u_k(t)为IMF分量，*为卷积计算符号，j表示虚数单位。

(2)各个模态的解析信号加入一个预估中心频率公式如下其中ω_k为中心频率，可将每个模态的频谱调制到相应的基频带。

(3)计算上述解调信号梯度的平方L2范数，估计出各个模态信号带宽，构造使总模态信号带宽最小的变分问题，变分问题表示如下，

其中f为原始信号f(t)，表示对时间进行求导，t为时间。

变分模态分解的算法通过引入惩罚因子α和拉格朗日乘法算子λ(t)得到扩展的拉格朗日表达式如下，

其中f(t)为原始信号。

S3：网约车需求预测，通过深度学习模型Transformer对分解后的模型进行预测；Transformer多变量时序预测模型基于原始的Transformer架构，主体结构基于编码器-解码器(Encoder-Decoder)架构，编码器(Encoder)将输入序列(x₁,···,x_n)转换为连续表达(z₁,···,z_n)，最后解码器生成输出序列(y₁,···,y_m)编码和解码部分分别由6个Encoder和Decoder模块堆叠而成，每层结构相同。

在编码器中，每一层均包括多头注意力机制层和全连接前馈神经网络层，每个子层后都衔接残差连接及归一化过程，每个子层的输出为LayerNorm(x+Sublayer(x))。解码器的结构与编码器相似，解码器增加了Masked Multi-head self-attention结构，目的是按顺序进行解码，当前输出只能基于已输出的部分。

在步骤S3中，深度学习模型Transformer对分解后的模型进行预测，包括以下步骤：

其中，PE表示PositionEmbedding，pos表示单个数据的位置，d_model表示编码维度，2i表示偶数维度，2i+1表示奇数维度；

Multihead(H)＝concat(head₁,...,head_u)W^O

其计算过程为，将u个注意力表示进行拼接，然后与W^O作矩阵乘法，结合公式单个注意力块为Q、K、V的函数，Transformer模型使用多头注意力机制，多头注意力机制由多个Scaled Dot-Product Attention组成，该模块的输入包括三个向量，分别是Query，Key和Value，分别由Q，K，V表示，三个向量均基于输入向量计算得出，Query和Key的维度为d_k，Value的维度为d_v，计算公式如下：

其中，Q、K、V分别代表Query，Key和Value三个向量，三个向量均基于输入向量计算得出，先计算Q和K向量的点积，除以通过softmax函数得到对应的权重，再与V向量进行点积加权。

其中，n个输入数据，每个输入项X_t∈R^1×d为d维向量。

norm_cur＝Normalization(z,norm_pre)

其中，z是注意力层或者全连接层的输出；Transformer中正则化层结构均一致，由残差连接和正则化操作构成。

在步骤S5中，预测结果进行误差修正，包括以下步骤：

S51：对深度学习模型输出的网约车订单需求预测结果与原始数据的差值序列，进行平稳性检验；针对非平稳数据，进行差分处理，作为ARIMA模型的原始输入序列；

S52：对数据进行白噪声检验，判断序列是否为随机序列；

因此，本发明采用上述一种增加分解-集成和误差修正机制的网约车需求深度学习预测模型，可以精确的预测未来15min城市大型交通枢纽的网约车短时需求数量，为网约车的调度提供可靠的决策依据。

实施例二

北京西站，时间跨度为2022年4月1日到2022年7月31日，时间间隔为15min，共11712条数据。经过预处理后的数据示例如表1所示：

表1预处理后的网约车需求数据

针对表1数据集，验证我们提出的增加分解-集成和误差修正机制的深度学习预测模型。

具体操作步骤如下：

在步骤S1中，包括缺失值处理及异常值处理：由于数据的时间间隔为15min，时间间隔较短，因此对于缺失值为一个的处理采用均值插补的方法，取前一个时段和后一个时间的需求数量的均值进行填充；针对连续缺失数据为两个以上的情况，采用线性插值方法对数据缺失值进行填补；假设在连续时间段内检测到缺失值，x₀表示在时间段i＝0时记录的数据值，x_I+1表示在时间段i＝I+1时记录的数据值，线性插值方法填补缺失值的公式如下：

对于异常值的处理，采用Hampel识别器。Hampel识别过程以滑动窗的形式进行，逐个求出窗内的中位值并计算中位值绝对偏差MAD，把所有超出3倍MAD×κ上下限的序列元素标记为离群值。

步骤S2主要是序列分解的过程。VMD分解预处理之后的时间序列为多个IMF，如图2所示。VMD分解是一种自适应、完全非递归的模态变分和信号处理方法，具有可以确定模态分解个数的优点，其自适应性表现在根据实际情况确定所给序列的模态分解个数，随后的搜索和求解的过程中可以自适应地匹配每种模态的中心频率和有限带宽，并且可以实现IMF的有效分离、信号的频域划分，进而得到给定信号的有效分解成分，最终获得变分问题的最优解。

在变分模态分解的过程中，由于分解个数需要自定义，因此采用如下步骤确定VMD分解个数，首先分解为两个IMF，进而判断趋势项，即第一个IMF是否只有极值点，如果是则停止分解，如果不是则继续分解为3个IMF，以此类推，直到趋势项满足要求为止。

在步骤S3中，通过深度学习Transformer对S2分解后的序列进行预测。Transformer是一类由编码器Encoder和解码器Decoder组成的模型。首先对输入序列进行词嵌入和位置编码，将编码叠加后得到模型的输入，经由多头注意力机制及前馈神经网络等机制进行计算，最后通过Softmax函数对预测结果进行输出。

在步骤S4中，对S3的预测结果进行累加集成，得到深度学习模型的预测结果。

最后，在步骤S5中，使用ARIMA模型对误差序列进行修正，与原预测结果叠加得到最终的需求预测结果。

因此，本发明采用上述一种基于深度学习模型的网约车短时需求预测方法，通过增加分解集成及误差修正环节，提升网约车短期需求预测模型的预测性能，为城市交通枢纽的网约车调度及运营提供可靠的决策依据。

最后应说明的是：以上实施例仅用以说明本发明的技术方案而非对其进行限制，尽管参照较佳实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对本发明的技术方案进行修改或者等同替换，而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。

Claims

1.一种基于深度学习模型的网约车短时需求预测方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于深度学习模型的网约车短时需求预测方法，其特征在于：在步骤S1中，对缺失数据进行均值插补，对异常值进行平滑处理，得到进行分析的完整数据集。

3.根据权利要求2所述的一种基于深度学习模型的网约车短时需求预测方法，其特征在于：在步骤S2中，变分模态分解方法的实现方法，包括具体步骤如下：

S22：对每一子序列，不断更新得到和/>

S23：ω≥0，更新

τ表示噪声容忍度，K表示模态的总个数；

S24：判断迭代终止条件；

4.根据权利要求3所述的一种基于深度学习模型的网约车短时需求预测方法，其特征在于：在步骤S3中，深度学习模型Transformer对分解后的模型进行预测，包括以下步骤：

Multihead(H)＝concat(head₁,...,head_u)W^O

其中，n个输入数据，每个输入项X_t∈R^1×d为d维向量。

norm_cur＝Normalization(z,norm_pre)

z是注意力层或者全连接层的输出，Transformer中正则化层结构均一致，由残差连接和正则化操作构成。

5.根据权利要求4所述的一种基于深度学习模型的网约车短时需求预测方法，其特征在于：在步骤S5中，预测结果进行误差修正，包括以下步骤：

S52：对数据进行白噪声检验，判断序列是否为随机序列；