CN110458337B

CN110458337B - 一种基于c-gru的网约车供需预测方法

Info

Publication number: CN110458337B
Application number: CN201910667491.8A
Authority: CN
Inventors: 田永红; 吴琪; 张悦; 张晴晴; 张鹏
Original assignee: Inner Mongolia University of Technology
Current assignee: Inner Mongolia University of Technology
Priority date: 2019-07-23
Filing date: 2019-07-23
Publication date: 2020-12-22
Anticipated expiration: 2039-07-23
Also published as: CN110458337A

Abstract

一种神经网络的网约车供需预测方法，通过采集各类网约车出行数据，并利用卷积神经网络来提取特征和降维，再将提取到的特征图谱输入到门控循环神经网络中来进行网约车供需预测，在训练过程中对模型进行调整，最后通过调整后的模型对网约车供需差额进行预测。本发明的方法可以对网约车供需差额数据进行更深入的挖掘分析，因此在对网约车供需预测时更为精确，性能更好。

Description

一种基于C-GRU的网约车供需预测方法

技术领域

本发明属于网约车供需预测技术领域，特别涉及一种基于C-GRU(ConvolutionalGated Recurrent Unit，简称C-GRU)的网约车供需预测方法。

背景技术

近几年，随着网约车平台的迅猛发展，会产生大量的数据以及与日俱增的数据处理需求，面对如此庞大的数据，通过选用合适的深度学习模型，使网约车相关的运行更加高效，缓解城市区域内交通出行压力，给客户提供方便和快捷。为了使网约车出行更高效，网约车的供需预测就是一个待解决的问题。

对于网约车的供需预测问题，预测算法是整个预测过程中最重要的，在很大程度上决定了预测系统的性能。预测系统不仅需要很高的预测精度，还需要预测的实时性。基于深度学习模型来设计预测模型，来实现实时性的网约车供需预测。为网约车平台进行实时运力调度提供参考依据，使网约车平台运行更加顺畅，给客户的出行带来便利，实现将打车由被动服务变为主动服务的模式。

传统的网约车供需预测方法有随机森林，支持向量机，BP神经网络，循环神经网络等，这些供需预测方法大部分只提取了部分特征，而忽略了影响预测的其他特征，比如天气特征、温度特征、交通拥堵特征等，从而无法获得更加准确的预测。

发明内容

为了克服上述现有技术的缺点，本发明的目的在于提供一种基于C-GRU的网约车供需预测方法，建立并加入了影响供需预测的潜在特征，可以对网约车供需预测数据进行更加深入的挖掘，预测出来的效果更好。

为了实现上述目的，本发明采用的技术方案是：

一种基于C-GRU的网约车供需预测方法，首先对网约车出行数据预处理，然后利用卷积神经网络对数据进行训练，从而提取特征并实现降维得到低维特征图谱，将所述低维特征图谱输入到门限循环(GRU)神经网络模型中进行网约车供需预测。

所述网约车出行数据的预处理方法如下：

将一个城市划分为n个互不重叠的正方形区域D＝{d₁,d₂,…,d_i,…,d_n}，将每一天的24小时划分为144个10分钟长的时间片t₁,t₂,…,t_j,…,t₁₄₄，对于区域d_i，在时间片t_j，有r_ij个乘客发单，有a_ij个司机成功应答了a_ij次发单，则对于区域d_i，在时间片t_j，定义需求demand_ij＝r_ij，供给supply_ij＝a_ij，有供需缺口gap_ij＝r_ij-a_ij，将影响供需预测的数据按每十分钟时间段进行划分，最终得到影响供需预测的特征：区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征。

所述区域特征为区域的编号，所述温度特征是将温度划分成五个级别T1、T2、T3、T4、T5，分别对应温度为0～5℃、5～10℃、10～15℃、15～20℃、20～25℃；所述天气特征是将天气划分成三类W1、W2、W3，分别对应晴或者多云、雨、雾；所述时间特征是将工作日记为W，将节假日记为H，工作日的工作时间记为WWT，工作日的上下班高峰时间记为WGT，工作日的早高峰前、晚高峰后时间记为WQT，其余时间记为WDT；节假日的日间时间记为HFT，其余时间记为HRT；所述交通拥堵特征是将拥堵情况分成五个级别TCI1、TCI2、TCI3、TCI4、TCI5，分别对应畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵；所述PM2.5特征是将PM2.5划分成五类PM1、PM2、PM3、PM4、PM5，分别对应优(0～35)、良(35～75)、轻度污染(75～150)、中度污染(150～250)、重度污染(>250)，所述上一时刻的供需差额特征是将前30分钟内每10分钟的供需差额进行分片处理，对于每10分钟内的供需差额划分为6个级别LG1、LG2、LG3、LG4、LG5、LG6，分别对应0～5、5～10、10～20、20～30、30～50、>50。

所述拥堵情况的分类方法，是将第一等级拥堵情况的路段数量乘以1，第二等级拥堵情况的路段数量乘以2，第三等级拥堵情况的路段数量乘以3，第四等级拥堵情况的路段数量乘以4，之后将乘数求和，根据求和结果进行线性变换，将拥堵情况分成五个级别，所述畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵分别对应(0～2)、(2～4)、(4～6)、(6～8)、(8～10)。

所述利用卷积神经网络对数据进行训练是将特征数据以矩阵形式输入到卷积神经网络中，经过特征提取器和池化层的处理后，形成包含历史gap值数据、区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征的低维特征图谱。

所述低维特征图谱输入到门限循环神经网络模型中，模型中的重置门和更新门在大量训练中不断调整自身参数，使得能够从卷积神经网络中提取的信息依从时间关系，之后通过交叉熵代价函数计算输出层的梯度，从隐层到输出层利用Adam算法优化梯度值，最后经过softmax函数的处理，得到分类的结果。

在t时刻，所述门限循环神经网络模型中，重置门激活信息r_t＝σ(W_r*[h_t-1,x_t])，更新门激活信息z_t＝σ(W_Z*[h_t-1,x_t])，候选激活值

激活值

其中x_t为时刻t的输入，W_r,W_Z,W分别为重置门、更新门、候选激活值的权值参数，σ为激活函数，取sigmoid函数，*表示点乘，即两个向量对应维度的数据的乘积。

所述交叉熵代价函数公式为

所述经过softmax函数的处理后，输出层会输出一个k维的向量，向量的每一维的值为样本b_t分别在设定的k类预测值的概率，设样本b_t落入每一个类别m的概率为P(y＝m|b_t)，最终的预测结果为T(B_t)＝MAX(P(y＝m|b_t))，将供需差额值分为六类，分别为G1、G2、G3、G4、G5、G6，分别对应0～5、5～10、10～20、20～30、30～50、>50，同时分别对应输出层的6个维度，公式体现为选取最大的概率为模型的预测范围，也就是落入6类概率的最大值。

与现有技术相比，本发明通过卷积神经网络对数据进行特征提取和降维，将提取出的特征图谱输入到GRU中进行预测，本发明所提出的模型可以实现对数据更加深入的挖掘，提取出人工无法提取出来的本质特征，比传统的机器学习模型和循环神经网络预测出来的准确率更好。

在“互联网+”的发展背景下，网约车模式不仅司机可以在线感知服务地点，也可以高效即时的满足乘客的需求，提升了网约车服务的效率，网约车供需预测有良好的发展和应用前景。网约车供需预测系统为网约车平台进行实时运力调度提供依据，有助于缓解城市交通出行的供需矛盾。而本发明的预测模型可以根据改变因素去实时改变预测结果，提升了预测的准确性和及时性。

附图说明

图1是本发明预测方法流程图。

图2是卷积神经网络提取得到低维特征图谱的原理示意图。

图3是本发明实施例中从一维时间序列得到低维特征图谱的原理示意图。

图4是本发明实施例中GRU模型结构更新示意图。

具体实施方式

下面结合附图和实施例详细说明本发明的实施方式。

本发明一种基于C-GRU的网约车供需预测方法，如图1所示，步骤如下：

1、对网约车出行数据预处理，得到影响供需预测的特征；

2、然后利用卷积神经网络(CNN)对数据进行训练，从而提取特征并实现降维得到低维特征图谱；

3、将该低维特征图谱输入到门限循环(GRU)神经网络模型中进行网约车供需预测。

具体地，步骤1中，对网约车出行数据的预处理方法如下：

将一个城市划分为n个互不重叠的正方形区域D＝{d₁,d₂,…,d_i,…,d_n}，将每一天的24小时划分为144个10分钟长的时间片t₁,t₂,…,t_j,…,t₁₄₄，对于区域d_i，在时间片t_j，有r_ij个乘客发单，有a_ij个司机成功应答了a_ij次发单，则对于区域d_i，在时间片t_j，定义需求demand_ij＝r_ij，供给supply_ij＝a_ij，有供需缺口gap_ij＝r_ij-a_ij，即在区域d_i，在时间片t_j内所需要的网约车数量为gap_ij。

实际生活中影响网约车供需的因素是非常复杂的，本发明将影响供需预测的数据按每十分钟时间段进行划分，最终得到影响供需预测的特征：区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征。

其中，区域特征为区域的编号，查询所有地区每10分钟的温度情况，之后对温度进行分类，鉴于数据来源是南方某市2～3月份数据，所以将温度划分成五个级别，分别为微寒(0～5)、凉(5～10)、温凉(10～15)、温和(15～20)、热(20～25)，对应级别T1、T2、T3、T4、T5。

天气特征主要考虑天气状况，根据气象局天气状况划分标准将天气状况划分为3类，分别为为晴或者多云，雨，雾，用W1、W2、W3表示。

据经验来考虑，工作日、节假日以及工作日里的工作时间、上下班高峰时间和节假日里用餐、娱乐出行时间为主要影响因子。根据数据集统计，将工作日记为W，将节假日记为H。工作日里的工作时间(9:00～17:00)记为WWT，工作日里的上下班高峰时间(7:00～9:00，17:00～20:00)记为WGT，工作日的早高峰前，晚高峰后时间(6：00～7：00，20：00～22：00)记为WQT，其余时间记为WDT；节假日的日间时间(10:00～21:00)记为HFT，其余时间记为HRT。

PM2.5也会对交通出行有一些影响，所以将PM2.5进行分类。共分成5个级别，分别为优(0～35)、良(35～75)、轻度污染(75～150)、中度污染(150～250)、重度污染(>250)，用PM1、PM2、PM3、PM4、PM5表示。

之前时刻的供需差额对未来时刻供需差额的预测也有重要的影响，对前30分钟内每10分钟的供需差额进行分片处理，对于每10分钟内的供需差额划分为6个级别，分别是LG1(0～5)、LG2(5～10)、LG3(10～20)、LG4(20～30)、LG5(30～50)、LG6(>50)。

交通拥堵对网约车供需预测有很大的影响，所以对拥堵情况进行分类，将第一等级拥堵情况的路段数量乘以1，第二等级拥堵情况的路段数量乘以2，第三等级拥堵情况的路段数量乘以3，第四等级拥堵情况的路段数量乘以4，之后将乘数求和，根据求和结果进行线性变换，将拥堵情况分成五个级别，分别为畅通(0～2)、基本畅通(2～4)、轻度拥堵(4～6)、中度拥堵(6～8)、严重拥堵(8～10)，用TCI1、TCI2、TCI3、TCI4、TCI5表示。

卷积神经网络属于一种前馈神经网络，卷积神经网络的各层神经元之间进行局部连接实现对输入的分层特征提取和转换，将拥有相同连接权重的神经元连接到上一层神经网络的不同区域，进而得到一种具有平移不变性质的神经网络结构。卷积神经网络通常由一个或多个卷积层、池化层和全连接层等构成。

步骤2中，将特征数据以矩阵形式输入到卷积神经网络中，经过特征提取器和池化层的处理后，形成包含历史gap值数据、区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征的低维特征图谱，形式如下：

[1,T1,W1,WWT,TCI1,PM1,LG3,LG2,LG2]

[3,T3,W1,WWT,TCI1,PM1,LG2,LG5,LG1]

[27,T1,W1,WWT,TCI1,PM1,LG3,LG2,LG2]

……

参考图2，显然经过卷积之后特征的维度会下降。

在卷积神经网络中的具体处理方式如下：

(1)卷积层

在卷积神经网络的卷积层中，通过不同的卷积滤波器进行卷积运算会得到若干个不同的特征图(Feature Map)，每个特征图有若干个矩阵排列的神经元组成，每个神经元只与其部分相邻神经元连接，同一特征图的神经元之间共享一个卷积核，这里的卷积核即为权重。卷积神经网络的权值共享策略减少了网络各层之间的连接，同时又降低了过拟合的风险。其实就是进行卷积运算，实际上就是使用卷积核进行了一次滤波。在卷积神经网络中，假设第l层为卷积层，第l+1层为下采样层，第l层的第j个特征映射(feature map)的卷积计算过程如公式(1)所示。

其中，

表示的是第l层的第j个特征图，等式右边是对l-1层所有的特征图

和第l层的第j个卷积核

做卷积运算并求和，然后再加上偏置参数

最后加入激活函数f(·)。

(2)池化层

卷积神经网络的另一个重要过程是池化过程，通过池化过程对特征图进行降维，从而达到减小卷积层的计算复杂度的目的，同时也可以对数据进行进一步的过滤。池化层也叫做子采样层，通常分为均值采样(mean pooling)和最大子采样(max pooling)两种。定义l层为池化层，l-1为卷积层，则池化层的计算公式如(2)所示。

其中，

表示的是第l层的第j个特征图，等式右边down(·)为下采样函数，

表示的是权重，

为偏置参数，f(·)为激活函数。

本发明的输入为时间序列向量，因此将一维的卷积神经网络设置在整个模型的顶部，使之对输入的原始gap值和温度等时间序列进行处理。如图3所示，x1-x7为输入的一维时间序列，F与T分别为2层一维卷积层中的特征捕捉器，max表示最大值池化层，经过池化层后模型的参数将会减少，计算速度会提升，最终得到特征图谱。特征图谱在向量维度上有了一定的减小，并且带着更加明显的数据特征，这样就可以更好地被之后的网络利用。

步骤3将低维特征图谱输入到门限循环神经网络(GRU)模型中，模型中的重置门和更新门在大量训练中不断调整自身参数，使得能够从卷积神经网络中提取的信息依从时间关系，之后通过交叉熵代价函数计算输出层的梯度，从隐层到输出层利用Adam算法优化梯度值，最后经过softmax函数的处理，得到分类的结果。

GRU与LSTM相比，去掉了细胞状态，使用隐藏状态来进行信息的传递。它只包含两个门更新门和重置门，更新门的作用类似于LSTM中的遗忘门和输入门，更新门用于控制前一时刻的状态信息被带入到当前状态中的程度，更新门的值越大说明前一时刻的状态信息带入越多。重置门用于控制忽略前一时刻的状态信息的程度，重置门越小说明忽略的越多。本质上来说一个GRU网络模型形式上和普通的LSTM基本一致，隐藏层可以接入不同类型的输出层，这取决于具体任务的需要。

下面介绍一下GRU模型的相关公式，设x_t为时刻t的输入，W_r,W_Z,W分别为重置门、更新门、候选激活值的权值参数。在t时刻，GRU网络重置门激活信息r_t、更新门激活信息z_t、候选激活值

以及激活值h_t，通过以下方法更新，GRU模型结构如图4所示。

r_t是重置门，在t时刻，输入值决定是否忘记前一时间步的激活值。计算方法如公式(3)所示。

r_t＝σ(W_r*[h_t-1,x_t]) (3)

其中z_t控制单元更新激活值，作用类似于LSTM中的遗忘门和输入门，用于控制前一个时刻的状态对当前状态的影响。计算方法如公式(4)所示。

z_t＝σ(W_Z*[h_t-1,x_t]) (4)

候选激活值

用于表示当前状态的隐含值，该值受两个方面影响，一个是加权后的上一步隐含状态r_t*h_t-1，另一个是当前状态。计算方法如公式(5)所示。

每个GRU在t时刻状态输出是激活值h_t和候选激活值

两者的线性内插,计算方法如公式(6)所示。

σ为激活函数，取sigmoid函数，*表示点乘，即两个向量对应维度的数据的乘积。

h_t与LSTM中的存储单元类似，但没有控制其输出的输出门，因此每个GRU的保存信息都作为输出的一部分公开。上述公式描述的方法，可实现对GRU网络模型中神经元在时刻t的状态的更新。

交叉熵代价函数，如公式(7)所示。

函数值表示模型预测值与其真实的拟合度，值越小表示预测结果越准确。

最后经过softmax函数的处理，输出层会输出一个k维的向量，向量的每一维的值为样本b_t分别在设定的k类预测值的概率，且经过softmax函数归一化处理后，k个类的概率之和为1。设样本b_t落入每一个类别m的概率为P(y＝m|b_t)，最终的预测结果为公式(8)。

T(B_t)＝MAX(P(y＝m|b_t)) (8)

将供需差额值分为六类，分别为G1(0～5)、G2(5～10)、G3(10～20)、G4(20～30)、G5(30～50)、G6(>50)分别对应输出层的6个维度。公式体现为选取最大的概率为模型的预测范围，也就是落入6类概率的最大值。

在本发明的优选方式中，对于整个C-GRU预测模型的训练，采用Adam算法作为模型的优化算法，相比与传统的梯度下降算法SGD法，该算法利用梯度的一阶矩估计和二阶矩估计为不同的参数设计独立的自适应性学习率。Adam算法有很高的计算效率和较低的内存需求，并且参数的值比较稳定。

下面介绍一下Adam算法公式：

m_t＝μ_t*m_t-1+(1-μ_t)*g_t (9)

n_t＝v*n_t-1+(1-v)*g_t ² (10)

其中，m_t和n_t分别是对梯度的一阶矩估计和二阶矩估计，可以看作对期望E|g_t|和E|g_t ²|的估计；

和

是对m_t和n_t的校正，这样可以近似为对期望的无偏估计。g_t为梯度，η为学习率，μ为动量因子，∈用来保证分母非0。Adam优化算法首先对参数向量、一阶矩向量和二阶矩向量进行初始化。然后循环迭代地更新各个部分，使参数θ收敛。即时间步t加1，更新偏差的一阶矩估计和二阶矩估计，接着计算一阶矩估计的偏差修正和二阶矩估计的偏差参数，再更新目标函数在该时间步上对参数θ所求的梯度，最后再用以上计算出来的值更新模型的参数θ。

通过对本发明中的数据进行处理后得到20万条数据，选取75％为训练集，25％为测试集。将处理后的数据输入模型进行对比实验。

表1

	Acc	precision	recall	f1-score
					SVM	78.42％	77％	78％	77％
随机森林	86.73％	85％	87％	85％
					GRU	87.83％	86％	88％	86％
C-GRU	88.91％	87％	89％	88％

从表1中可以看出，C-GRU的准确率(Acc)、精确率(precision)和召回率(recall)指标都要高于其他预测模型，展现了基于C-GRU的网约车供需预测模型预测效果更加出色，同时发现深度学习网络模型的准确率(Acc)、精确率(precision)和召回率(recall)指标都高于于随机森林和SVM，预测性能强于传统的机器学习预测模型，随机森林的准确率、精确率和召回率值均高于SVM，在预测性能上强于SVM。通过以上分析可以得出C-GRU网络模型的预测能力总体表现出色，该模型非常适合网约车供需预测。

Claims

1.一种基于C-GRU的网约车供需预测方法，首先对网约车出行数据预处理，然后利用卷积神经网络对数据进行训练，从而提取特征并实现降维得到低维特征图谱，将所述低维特征图谱输入到门限循环(GRU)神经网络模型中进行网约车供需预测，其特征在于：

所述网约车出行数据的预处理方法如下：

将一个城市划分为n个互不重叠的正方形区域D＝{d₁，d₂，...，d_i，...，d_n}，将每一天的24小时划分为144个10分钟长的时间片t₁，t₂，...，t_j，...，t₁₄₄，对于区域d_i，在时间片t_j，有r_ij个乘客发单，有a_ij个司机成功应答了a_ij次发单，则对于区域d_i，在时间片t_j，定义需求demand_ij＝r_ij，供给sup ply_ij＝a_ij，有供需缺口gap_ij＝r_ij-a_ij，将影响供需预测的数据按每十分钟时间段进行划分，最终得到影响供需预测的特征：区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征；

所述门限循环神经网络模型中的重置门和更新门在大量训练中不断调整自身参数，使得能够从卷积神经网络中提取的信息依从时间关系，之后通过交叉熵代价函数计算输出层的梯度，从隐层到输出层利用Adam算法优化梯度值，最后经过softmax函数的处理，得到分类的结果；

在t时刻，所述门限循环神经网络模型中，重置门激活信息r_t＝σ(W_r*[h_t-1，x_t])，更新门激活信息z_t＝σ(W_Z*[h_t-1，x_t])，候选激活值

激活值

其中x_t为时刻t的输入，W_r，W_Z，W分别为重置门、更新门、候选激活值的权值参数，σ为激活函数，取sigmoid函数，*表示点乘，即两个向量对应维度的数据的乘积；

所述经过softmax函数的处理后，输出层会输出一个k维的向量，向量的每一维的值为样本b_t分别在设定的k类预测值的概率，设样本b_t落入每一个类别m的概率为P(y＝m|b_t)，最终的预测结果为T(B_t)＝MAX(P(y＝m|b_t))，将供需差额值分为六类，分别为G1、G2、G3、G4、G5、G6，分别对应0～5、5～10、10～20、20～30、30～50、>50，同时分别对应输出层的6个维度，公式体现为选取最大的概率为模型的预测范围，也就是落入6类概率的最大值；

所述区域特征为区域的编号，所述温度特征是将温度划分成五个级别T1、T2、T3、T4、T5，分别对应温度为0～5℃、5～10℃、10～15℃、15～20℃、20～25℃；所述天气特征是将天气划分成三类W1、W2、W3，分别对应晴或者多云、雨、雾；所述时间特征是将工作日记为W，将节假日记为H，工作日的工作时间记为WWT，工作日的上下班高峰时间记为WGT，工作日的早高峰前、晚高峰后时间记为WQT，其余时间记为WDT；节假日的日间时间记为HFT，其余时间记为HRT；所述交通拥堵特征是将拥堵情况分成五个级别TCI1、TCI2、TCI3、TCI4、TCI5，分别对应畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵；所述PM2.5特征是将PM2.5划分成五类PM1、PM2、PM3、PM4、PM5，分别对应优、良、轻度污染、中度污染、重度污染，所述上一时刻的供需差额特征是将前30分钟内每10分钟的供需差额进行分片处理，对于每10分钟内的供需差额划分为6个级别LG1、LG2、LG3、LG4、LG5、LG6，分别对应0～5、5～10、10～20、20～30、30～50、>50。

2.根据权利要求1所述基于C-GRU的网约车供需预测方法，其特征在于，所述拥堵情况的分类方法，是将第一等级拥堵情况的路段数量乘以1，第二等级拥堵情况的路段数量乘以2，第三等级拥堵情况的路段数量乘以3，第四等级拥堵情况的路段数量乘以4，之后将乘数求和，根据求和结果进行线性变换，将拥堵情况分成五个级别，所述畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵分别对应(0～2)、(2～4)、(4～6)、(6～8)、(8～10)。

3.根据权利要求1所述基于C-GRU的网约车供需预测方法，其特征在于，所述利用卷积神经网络对数据进行训练是将特征数据以矩阵形式输入到卷积神经网络中，经过特征提取器和池化层的处理后，形成包含历史gap值数据、区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征的低维特征图谱。

4.根据权利要求1所述基于C-GRU的网约车供需预测方法，其特征在于，所述交叉熵代价函数公式为