CN110458337B - 一种基于c-gru的网约车供需预测方法 - Google Patents
一种基于c-gru的网约车供需预测方法 Download PDFInfo
- Publication number
- CN110458337B CN110458337B CN201910667491.8A CN201910667491A CN110458337B CN 110458337 B CN110458337 B CN 110458337B CN 201910667491 A CN201910667491 A CN 201910667491A CN 110458337 B CN110458337 B CN 110458337B
- Authority
- CN
- China
- Prior art keywords
- supply
- time
- demand
- neural network
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 11
- 230000009467 reduction Effects 0.000 claims abstract description 7
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 4
- 230000004913 activation Effects 0.000 claims description 23
- 239000013598 vector Substances 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 13
- 238000011176 pooling Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 7
- YVPYQUNUQOZFHG-UHFFFAOYSA-N amidotrizoic acid Chemical compound CC(=O)NC1=C(I)C(NC(C)=O)=C(I)C(C(O)=O)=C1I YVPYQUNUQOZFHG-UHFFFAOYSA-N 0.000 claims description 7
- 238000003062 neural network model Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 4
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 abstract description 9
- 230000008569 process Effects 0.000 abstract description 6
- 238000004458 analytical method Methods 0.000 abstract description 2
- 238000005065 mining Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 19
- 210000002569 neuron Anatomy 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 238000007637 random forest analysis Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 241000288105 Grus Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种神经网络的网约车供需预测方法,通过采集各类网约车出行数据,并利用卷积神经网络来提取特征和降维,再将提取到的特征图谱输入到门控循环神经网络中来进行网约车供需预测,在训练过程中对模型进行调整,最后通过调整后的模型对网约车供需差额进行预测。本发明的方法可以对网约车供需差额数据进行更深入的挖掘分析,因此在对网约车供需预测时更为精确,性能更好。
Description
技术领域
本发明属于网约车供需预测技术领域,特别涉及一种基于C-GRU(ConvolutionalGated Recurrent Unit,简称C-GRU)的网约车供需预测方法。
背景技术
近几年,随着网约车平台的迅猛发展,会产生大量的数据以及与日俱增的数据处理需求,面对如此庞大的数据,通过选用合适的深度学习模型,使网约车相关的运行更加高效,缓解城市区域内交通出行压力,给客户提供方便和快捷。为了使网约车出行更高效,网约车的供需预测就是一个待解决的问题。
对于网约车的供需预测问题,预测算法是整个预测过程中最重要的,在很大程度上决定了预测系统的性能。预测系统不仅需要很高的预测精度,还需要预测的实时性。基于深度学习模型来设计预测模型,来实现实时性的网约车供需预测。为网约车平台进行实时运力调度提供参考依据,使网约车平台运行更加顺畅,给客户的出行带来便利,实现将打车由被动服务变为主动服务的模式。
传统的网约车供需预测方法有随机森林,支持向量机,BP神经网络,循环神经网络等,这些供需预测方法大部分只提取了部分特征,而忽略了影响预测的其他特征,比如天气特征、温度特征、交通拥堵特征等,从而无法获得更加准确的预测。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于C-GRU的网约车供需预测方法,建立并加入了影响供需预测的潜在特征,可以对网约车供需预测数据进行更加深入的挖掘,预测出来的效果更好。
为了实现上述目的,本发明采用的技术方案是:
一种基于C-GRU的网约车供需预测方法,首先对网约车出行数据预处理,然后利用卷积神经网络对数据进行训练,从而提取特征并实现降维得到低维特征图谱,将所述低维特征图谱输入到门限循环(GRU)神经网络模型中进行网约车供需预测。
所述网约车出行数据的预处理方法如下:
将一个城市划分为n个互不重叠的正方形区域D={d1,d2,…,di,…,dn},将每一天的24小时划分为144个10分钟长的时间片t1,t2,…,tj,…,t144,对于区域di,在时间片tj,有rij个乘客发单,有aij个司机成功应答了aij次发单,则对于区域di,在时间片tj,定义需求demandij=rij,供给supplyij=aij,有供需缺口gapij=rij-aij,将影响供需预测的数据按每十分钟时间段进行划分,最终得到影响供需预测的特征:区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征。
所述区域特征为区域的编号,所述温度特征是将温度划分成五个级别T1、T2、T3、T4、T5,分别对应温度为0~5℃、5~10℃、10~15℃、15~20℃、20~25℃;所述天气特征是将天气划分成三类W1、W2、W3,分别对应晴或者多云、雨、雾;所述时间特征是将工作日记为W,将节假日记为H,工作日的工作时间记为WWT,工作日的上下班高峰时间记为WGT,工作日的早高峰前、晚高峰后时间记为WQT,其余时间记为WDT;节假日的日间时间记为HFT,其余时间记为HRT;所述交通拥堵特征是将拥堵情况分成五个级别TCI1、TCI2、TCI3、TCI4、TCI5,分别对应畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵;所述PM2.5特征是将PM2.5划分成五类PM1、PM2、PM3、PM4、PM5,分别对应优(0~35)、良(35~75)、轻度污染(75~150)、中度污染(150~250)、重度污染(>250),所述上一时刻的供需差额特征是将前30分钟内每10分钟的供需差额进行分片处理,对于每10分钟内的供需差额划分为6个级别LG1、LG2、LG3、LG4、LG5、LG6,分别对应0~5、5~10、10~20、20~30、30~50、>50。
所述拥堵情况的分类方法,是将第一等级拥堵情况的路段数量乘以1,第二等级拥堵情况的路段数量乘以2,第三等级拥堵情况的路段数量乘以3,第四等级拥堵情况的路段数量乘以4,之后将乘数求和,根据求和结果进行线性变换,将拥堵情况分成五个级别,所述畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵分别对应(0~2)、(2~4)、(4~6)、(6~8)、(8~10)。
所述利用卷积神经网络对数据进行训练是将特征数据以矩阵形式输入到卷积神经网络中,经过特征提取器和池化层的处理后,形成包含历史gap值数据、区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征的低维特征图谱。
所述低维特征图谱输入到门限循环神经网络模型中,模型中的重置门和更新门在大量训练中不断调整自身参数,使得能够从卷积神经网络中提取的信息依从时间关系,之后通过交叉熵代价函数计算输出层的梯度,从隐层到输出层利用Adam算法优化梯度值,最后经过softmax函数的处理,得到分类的结果。
在t时刻,所述门限循环神经网络模型中,重置门激活信息rt=σ(Wr*[ht-1,xt]),更新门激活信息zt=σ(WZ*[ht-1,xt]),候选激活值激活值其中xt为时刻t的输入,Wr,WZ,W分别为重置门、更新门、候选激活值的权值参数,σ为激活函数,取sigmoid函数,*表示点乘,即两个向量对应维度的数据的乘积。
所述经过softmax函数的处理后,输出层会输出一个k维的向量,向量的每一维的值为样本bt分别在设定的k类预测值的概率,设样本bt落入每一个类别m的概率为P(y=m|bt),最终的预测结果为T(Bt)=MAX(P(y=m|bt)),将供需差额值分为六类,分别为G1、G2、G3、G4、G5、G6,分别对应0~5、5~10、10~20、20~30、30~50、>50,同时分别对应输出层的6个维度,公式体现为选取最大的概率为模型的预测范围,也就是落入6类概率的最大值。
与现有技术相比,本发明通过卷积神经网络对数据进行特征提取和降维,将提取出的特征图谱输入到GRU中进行预测,本发明所提出的模型可以实现对数据更加深入的挖掘,提取出人工无法提取出来的本质特征,比传统的机器学习模型和循环神经网络预测出来的准确率更好。
在“互联网+”的发展背景下,网约车模式不仅司机可以在线感知服务地点,也可以高效即时的满足乘客的需求,提升了网约车服务的效率,网约车供需预测有良好的发展和应用前景。网约车供需预测系统为网约车平台进行实时运力调度提供依据,有助于缓解城市交通出行的供需矛盾。而本发明的预测模型可以根据改变因素去实时改变预测结果,提升了预测的准确性和及时性。
附图说明
图1是本发明预测方法流程图。
图2是卷积神经网络提取得到低维特征图谱的原理示意图。
图3是本发明实施例中从一维时间序列得到低维特征图谱的原理示意图。
图4是本发明实施例中GRU模型结构更新示意图。
具体实施方式
下面结合附图和实施例详细说明本发明的实施方式。
本发明一种基于C-GRU的网约车供需预测方法,如图1所示,步骤如下:
1、对网约车出行数据预处理,得到影响供需预测的特征;
2、然后利用卷积神经网络(CNN)对数据进行训练,从而提取特征并实现降维得到低维特征图谱;
3、将该低维特征图谱输入到门限循环(GRU)神经网络模型中进行网约车供需预测。
具体地,步骤1中,对网约车出行数据的预处理方法如下:
将一个城市划分为n个互不重叠的正方形区域D={d1,d2,…,di,…,dn},将每一天的24小时划分为144个10分钟长的时间片t1,t2,…,tj,…,t144,对于区域di,在时间片tj,有rij个乘客发单,有aij个司机成功应答了aij次发单,则对于区域di,在时间片tj,定义需求demandij=rij,供给supplyij=aij,有供需缺口gapij=rij-aij,即在区域di,在时间片tj内所需要的网约车数量为gapij。
实际生活中影响网约车供需的因素是非常复杂的,本发明将影响供需预测的数据按每十分钟时间段进行划分,最终得到影响供需预测的特征:区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征。
其中,区域特征为区域的编号,查询所有地区每10分钟的温度情况,之后对温度进行分类,鉴于数据来源是南方某市2~3月份数据,所以将温度划分成五个级别,分别为微寒(0~5)、凉(5~10)、温凉(10~15)、温和(15~20)、热(20~25),对应级别T1、T2、T3、T4、T5。
天气特征主要考虑天气状况,根据气象局天气状况划分标准将天气状况划分为3类,分别为为晴或者多云,雨,雾,用W1、W2、W3表示。
据经验来考虑,工作日、节假日以及工作日里的工作时间、上下班高峰时间和节假日里用餐、娱乐出行时间为主要影响因子。根据数据集统计,将工作日记为W,将节假日记为H。工作日里的工作时间(9:00~17:00)记为WWT,工作日里的上下班高峰时间(7:00~9:00,17:00~20:00)记为WGT,工作日的早高峰前,晚高峰后时间(6:00~7:00,20:00~22:00)记为WQT,其余时间记为WDT;节假日的日间时间(10:00~21:00)记为HFT,其余时间记为HRT。
PM2.5也会对交通出行有一些影响,所以将PM2.5进行分类。共分成5个级别,分别为优(0~35)、良(35~75)、轻度污染(75~150)、中度污染(150~250)、重度污染(>250),用PM1、PM2、PM3、PM4、PM5表示。
之前时刻的供需差额对未来时刻供需差额的预测也有重要的影响,对前30分钟内每10分钟的供需差额进行分片处理,对于每10分钟内的供需差额划分为6个级别,分别是LG1(0~5)、LG2(5~10)、LG3(10~20)、LG4(20~30)、LG5(30~50)、LG6(>50)。
交通拥堵对网约车供需预测有很大的影响,所以对拥堵情况进行分类,将第一等级拥堵情况的路段数量乘以1,第二等级拥堵情况的路段数量乘以2,第三等级拥堵情况的路段数量乘以3,第四等级拥堵情况的路段数量乘以4,之后将乘数求和,根据求和结果进行线性变换,将拥堵情况分成五个级别,分别为畅通(0~2)、基本畅通(2~4)、轻度拥堵(4~6)、中度拥堵(6~8)、严重拥堵(8~10),用TCI1、TCI2、TCI3、TCI4、TCI5表示。
卷积神经网络属于一种前馈神经网络,卷积神经网络的各层神经元之间进行局部连接实现对输入的分层特征提取和转换,将拥有相同连接权重的神经元连接到上一层神经网络的不同区域,进而得到一种具有平移不变性质的神经网络结构。卷积神经网络通常由一个或多个卷积层、池化层和全连接层等构成。
步骤2中,将特征数据以矩阵形式输入到卷积神经网络中,经过特征提取器和池化层的处理后,形成包含历史gap值数据、区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征的低维特征图谱,形式如下:
[1,T1,W1,WWT,TCI1,PM1,LG3,LG2,LG2]
[3,T3,W1,WWT,TCI1,PM1,LG2,LG5,LG1]
[27,T1,W1,WWT,TCI1,PM1,LG3,LG2,LG2]
……
参考图2,显然经过卷积之后特征的维度会下降。
在卷积神经网络中的具体处理方式如下:
(1)卷积层
在卷积神经网络的卷积层中,通过不同的卷积滤波器进行卷积运算会得到若干个不同的特征图(Feature Map),每个特征图有若干个矩阵排列的神经元组成,每个神经元只与其部分相邻神经元连接,同一特征图的神经元之间共享一个卷积核,这里的卷积核即为权重。卷积神经网络的权值共享策略减少了网络各层之间的连接,同时又降低了过拟合的风险。其实就是进行卷积运算,实际上就是使用卷积核进行了一次滤波。在卷积神经网络中,假设第l层为卷积层,第l+1层为下采样层,第l层的第j个特征映射(feature map)的卷积计算过程如公式(1)所示。
(2)池化层
卷积神经网络的另一个重要过程是池化过程,通过池化过程对特征图进行降维,从而达到减小卷积层的计算复杂度的目的,同时也可以对数据进行进一步的过滤。池化层也叫做子采样层,通常分为均值采样(mean pooling)和最大子采样(max pooling)两种。定义l层为池化层,l-1为卷积层,则池化层的计算公式如(2)所示。
本发明的输入为时间序列向量,因此将一维的卷积神经网络设置在整个模型的顶部,使之对输入的原始gap值和温度等时间序列进行处理。如图3所示,x1-x7为输入的一维时间序列,F与T分别为2层一维卷积层中的特征捕捉器,max表示最大值池化层,经过池化层后模型的参数将会减少,计算速度会提升,最终得到特征图谱。特征图谱在向量维度上有了一定的减小,并且带着更加明显的数据特征,这样就可以更好地被之后的网络利用。
步骤3将低维特征图谱输入到门限循环神经网络(GRU)模型中,模型中的重置门和更新门在大量训练中不断调整自身参数,使得能够从卷积神经网络中提取的信息依从时间关系,之后通过交叉熵代价函数计算输出层的梯度,从隐层到输出层利用Adam算法优化梯度值,最后经过softmax函数的处理,得到分类的结果。
GRU与LSTM相比,去掉了细胞状态,使用隐藏状态来进行信息的传递。它只包含两个门更新门和重置门,更新门的作用类似于LSTM中的遗忘门和输入门,更新门用于控制前一时刻的状态信息被带入到当前状态中的程度,更新门的值越大说明前一时刻的状态信息带入越多。重置门用于控制忽略前一时刻的状态信息的程度,重置门越小说明忽略的越多。本质上来说一个GRU网络模型形式上和普通的LSTM基本一致,隐藏层可以接入不同类型的输出层,这取决于具体任务的需要。
下面介绍一下GRU模型的相关公式,设xt为时刻t的输入,Wr,WZ,W分别为重置门、更新门、候选激活值的权值参数。在t时刻,GRU网络重置门激活信息rt、更新门激活信息zt、候选激活值以及激活值ht,通过以下方法更新,GRU模型结构如图4所示。
rt是重置门,在t时刻,输入值决定是否忘记前一时间步的激活值。计算方法如公式(3)所示。
rt=σ(Wr*[ht-1,xt]) (3)
其中zt控制单元更新激活值,作用类似于LSTM中的遗忘门和输入门,用于控制前一个时刻的状态对当前状态的影响。计算方法如公式(4)所示。
zt=σ(WZ*[ht-1,xt]) (4)
σ为激活函数,取sigmoid函数,*表示点乘,即两个向量对应维度的数据的乘积。
ht与LSTM中的存储单元类似,但没有控制其输出的输出门,因此每个GRU的保存信息都作为输出的一部分公开。上述公式描述的方法,可实现对GRU网络模型中神经元在时刻t的状态的更新。
交叉熵代价函数,如公式(7)所示。
函数值表示模型预测值与其真实的拟合度,值越小表示预测结果越准确。
最后经过softmax函数的处理,输出层会输出一个k维的向量,向量的每一维的值为样本bt分别在设定的k类预测值的概率,且经过softmax函数归一化处理后,k个类的概率之和为1。设样本bt落入每一个类别m的概率为P(y=m|bt),最终的预测结果为公式(8)。
T(Bt)=MAX(P(y=m|bt)) (8)
将供需差额值分为六类,分别为G1(0~5)、G2(5~10)、G3(10~20)、G4(20~30)、G5(30~50)、G6(>50)分别对应输出层的6个维度。公式体现为选取最大的概率为模型的预测范围,也就是落入6类概率的最大值。
在本发明的优选方式中,对于整个C-GRU预测模型的训练,采用Adam算法作为模型的优化算法,相比与传统的梯度下降算法SGD法,该算法利用梯度的一阶矩估计和二阶矩估计为不同的参数设计独立的自适应性学习率。Adam算法有很高的计算效率和较低的内存需求,并且参数的值比较稳定。
下面介绍一下Adam算法公式:
mt=μt*mt-1+(1-μt)*gt (9)
nt=v*nt-1+(1-v)*gt 2 (10)
其中,mt和nt分别是对梯度的一阶矩估计和二阶矩估计,可以看作对期望E|gt|和E|gt 2|的估计;和是对mt和nt的校正,这样可以近似为对期望的无偏估计。gt为梯度,η为学习率,μ为动量因子,∈用来保证分母非0。Adam优化算法首先对参数向量、一阶矩向量和二阶矩向量进行初始化。然后循环迭代地更新各个部分,使参数θ收敛。即时间步t加1,更新偏差的一阶矩估计和二阶矩估计,接着计算一阶矩估计的偏差修正和二阶矩估计的偏差参数,再更新目标函数在该时间步上对参数θ所求的梯度,最后再用以上计算出来的值更新模型的参数θ。
通过对本发明中的数据进行处理后得到20万条数据,选取75%为训练集,25%为测试集。将处理后的数据输入模型进行对比实验。
表1
Acc | precision | recall | f1-score | |
SVM | 78.42% | 77% | 78% | 77% |
随机森林 | 86.73% | 85% | 87% | 85% |
GRU | 87.83% | 86% | 88% | 86% |
C-GRU | 88.91% | 87% | 89% | 88% |
从表1中可以看出,C-GRU的准确率(Acc)、精确率(precision)和召回率(recall)指标都要高于其他预测模型,展现了基于C-GRU的网约车供需预测模型预测效果更加出色,同时发现深度学习网络模型的准确率(Acc)、精确率(precision)和召回率(recall)指标都高于于随机森林和SVM,预测性能强于传统的机器学习预测模型,随机森林的准确率、精确率和召回率值均高于SVM,在预测性能上强于SVM。通过以上分析可以得出C-GRU网络模型的预测能力总体表现出色,该模型非常适合网约车供需预测。
Claims (4)
1.一种基于C-GRU的网约车供需预测方法,首先对网约车出行数据预处理,然后利用卷积神经网络对数据进行训练,从而提取特征并实现降维得到低维特征图谱,将所述低维特征图谱输入到门限循环(GRU)神经网络模型中进行网约车供需预测,其特征在于:
所述网约车出行数据的预处理方法如下:
将一个城市划分为n个互不重叠的正方形区域D={d1,d2,...,di,...,dn},将每一天的24小时划分为144个10分钟长的时间片t1,t2,...,tj,...,t144,对于区域di,在时间片tj,有rij个乘客发单,有aij个司机成功应答了aij次发单,则对于区域di,在时间片tj,定义需求demandij=rij,供给sup plyij=aij,有供需缺口gapij=rij-aij,将影响供需预测的数据按每十分钟时间段进行划分,最终得到影响供需预测的特征:区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征;
所述门限循环神经网络模型中的重置门和更新门在大量训练中不断调整自身参数,使得能够从卷积神经网络中提取的信息依从时间关系,之后通过交叉熵代价函数计算输出层的梯度,从隐层到输出层利用Adam算法优化梯度值,最后经过softmax函数的处理,得到分类的结果;
在t时刻,所述门限循环神经网络模型中,重置门激活信息rt=σ(Wr*[ht-1,xt]),更新门激活信息zt=σ(WZ*[ht-1,xt]),候选激活值激活值其中xt为时刻t的输入,Wr,WZ,W分别为重置门、更新门、候选激活值的权值参数,σ为激活函数,取sigmoid函数,*表示点乘,即两个向量对应维度的数据的乘积;
所述经过softmax函数的处理后,输出层会输出一个k维的向量,向量的每一维的值为样本bt分别在设定的k类预测值的概率,设样本bt落入每一个类别m的概率为P(y=m|bt),最终的预测结果为T(Bt)=MAX(P(y=m|bt)),将供需差额值分为六类,分别为G1、G2、G3、G4、G5、G6,分别对应0~5、5~10、10~20、20~30、30~50、>50,同时分别对应输出层的6个维度,公式体现为选取最大的概率为模型的预测范围,也就是落入6类概率的最大值;
所述区域特征为区域的编号,所述温度特征是将温度划分成五个级别T1、T2、T3、T4、T5,分别对应温度为0~5℃、5~10℃、10~15℃、15~20℃、20~25℃;所述天气特征是将天气划分成三类W1、W2、W3,分别对应晴或者多云、雨、雾;所述时间特征是将工作日记为W,将节假日记为H,工作日的工作时间记为WWT,工作日的上下班高峰时间记为WGT,工作日的早高峰前、晚高峰后时间记为WQT,其余时间记为WDT;节假日的日间时间记为HFT,其余时间记为HRT;所述交通拥堵特征是将拥堵情况分成五个级别TCI1、TCI2、TCI3、TCI4、TCI5,分别对应畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵;所述PM2.5特征是将PM2.5划分成五类PM1、PM2、PM3、PM4、PM5,分别对应优、良、轻度污染、中度污染、重度污染,所述上一时刻的供需差额特征是将前30分钟内每10分钟的供需差额进行分片处理,对于每10分钟内的供需差额划分为6个级别LG1、LG2、LG3、LG4、LG5、LG6,分别对应0~5、5~10、10~20、20~30、30~50、>50。
2.根据权利要求1所述基于C-GRU的网约车供需预测方法,其特征在于,所述拥堵情况的分类方法,是将第一等级拥堵情况的路段数量乘以1,第二等级拥堵情况的路段数量乘以2,第三等级拥堵情况的路段数量乘以3,第四等级拥堵情况的路段数量乘以4,之后将乘数求和,根据求和结果进行线性变换,将拥堵情况分成五个级别,所述畅通、基本畅通、轻度拥堵、中度拥堵、严重拥堵分别对应(0~2)、(2~4)、(4~6)、(6~8)、(8~10)。
3.根据权利要求1所述基于C-GRU的网约车供需预测方法,其特征在于,所述利用卷积神经网络对数据进行训练是将特征数据以矩阵形式输入到卷积神经网络中,经过特征提取器和池化层的处理后,形成包含历史gap值数据、区域特征、温度特征、天气特征、时间特征、交通拥堵特征、PM2.5特征以及上一时刻的供需差额特征的低维特征图谱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910667491.8A CN110458337B (zh) | 2019-07-23 | 2019-07-23 | 一种基于c-gru的网约车供需预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910667491.8A CN110458337B (zh) | 2019-07-23 | 2019-07-23 | 一种基于c-gru的网约车供需预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110458337A CN110458337A (zh) | 2019-11-15 |
CN110458337B true CN110458337B (zh) | 2020-12-22 |
Family
ID=68483249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910667491.8A Active CN110458337B (zh) | 2019-07-23 | 2019-07-23 | 一种基于c-gru的网约车供需预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110458337B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111862579B (zh) * | 2020-06-10 | 2021-07-13 | 深圳大学 | 一种基于深度强化学习的出租车调度方法及系统 |
CN111582251B (zh) * | 2020-06-15 | 2021-04-02 | 江苏航天大为科技股份有限公司 | 基于卷积神经网络的城市轨道交通乘客拥挤程度检测方法 |
CN111950698A (zh) * | 2020-07-01 | 2020-11-17 | 燕山大学 | 基于卷积-门控循环神经网络的水泥回转窑电耗预测方法 |
CN112487939A (zh) * | 2020-11-26 | 2021-03-12 | 深圳市热丽泰和生命科技有限公司 | 一种基于深度学习的纯视觉轻量手语识别系统 |
CN113034195B (zh) * | 2021-04-07 | 2023-05-02 | 西北工业大学 | 一种基于卷积网络和非局部网络的网约车需求预测方法 |
CN113222645A (zh) * | 2021-04-23 | 2021-08-06 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于多源数据融合的城市热点区域高峰出行需求预测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107610469A (zh) * | 2017-10-13 | 2018-01-19 | 北京工业大学 | 一种考虑多因素影响的日维度区域交通指数预测方法 |
CN108448610A (zh) * | 2018-03-12 | 2018-08-24 | 华南理工大学 | 一种基于深度学习的短期风功率预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106033555A (zh) * | 2015-03-13 | 2016-10-19 | 中国科学院声学研究所 | 基于满足k度稀疏约束的深度学习模型的大数据处理方法 |
-
2019
- 2019-07-23 CN CN201910667491.8A patent/CN110458337B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107610469A (zh) * | 2017-10-13 | 2018-01-19 | 北京工业大学 | 一种考虑多因素影响的日维度区域交通指数预测方法 |
CN108448610A (zh) * | 2018-03-12 | 2018-08-24 | 华南理工大学 | 一种基于深度学习的短期风功率预测方法 |
Non-Patent Citations (1)
Title |
---|
基于Recurrent Neutral Network的网约车供需预测方法;安磊;《中国优秀硕士学位论文全文数据库(经济与管理科学辑)》;20180715(第7期);第2章第2.4节,第3章3.1-3.2节 * |
Also Published As
Publication number | Publication date |
---|---|
CN110458337A (zh) | 2019-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110458337B (zh) | 一种基于c-gru的网约车供需预测方法 | |
CN110503104B (zh) | 一种基于卷积神经网络的短时剩余车位数量预测方法 | |
CN112418547A (zh) | 一种基于gcn-lstm组合模型的公交车站点客流量预测方法 | |
CN112216108A (zh) | 一种基于属性增强的时空图卷积模型的交通预测方法 | |
CN110348624B (zh) | 一种基于Stacking集成策略的沙尘暴等级预测方法 | |
CN113268916A (zh) | 一种基于时空图卷积网络的交通事故预测方法 | |
Ai et al. | Short-term road speed forecasting based on hybrid RBF neural network with the aid of fuzzy system-based techniques in urban traffic flow | |
CN110390349A (zh) | 基于XGBoost模型的公交车客流量预测建模方法 | |
CN107194491A (zh) | 一种基于公交客流和站间行程时间预测的动态调度方法 | |
CN110599236A (zh) | 一种基于gru模型的短时停车需求预测方法 | |
CN111860989B (zh) | 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法 | |
CN112270355A (zh) | 基于大数据技术与sae-gru的主动安全预测方法 | |
CN113096388A (zh) | 一种基于梯度提升决策树的短时交通流量预测方法 | |
CN113191918B (zh) | 基于时序生成对抗网络的月度风光发电功率场景分析方法 | |
CN112906948B (zh) | 一种基于私家车轨迹大数据的城市区域吸引力预测方法、设备及介质 | |
CN115099519B (zh) | 一种基于多机器学习模型融合的油井产量预测方法 | |
CN113988426A (zh) | 一种基于fcm聚类和lstm的电动汽车充电负荷预测方法及系统 | |
CN112046489A (zh) | 一种基于因子分析和机器学习的驾驶风格辨识算法 | |
CN115376317B (zh) | 一种基于动态图卷积和时序卷积网络的交通流预测方法 | |
Zhang et al. | A hybrid spatiotemporal deep learning model for short‐term metro passenger flow prediction | |
CN110490365B (zh) | 一种基于多源数据融合预测网约车订单量的方法 | |
CN111907523A (zh) | 一种基于模糊推理的车辆跟驰寻优控制方法 | |
CN114418213A (zh) | 一种基于深度强化学习的城市电动车辆调度方法和系统 | |
CN113537569A (zh) | 一种基于权重堆叠决策树的短时公交客流预测方法及系统 | |
CN114596726A (zh) | 基于可解释时空注意力机制的停车泊位预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |