CN109886387A - 一种基于门控网络和梯度提升回归的交通时序预测方法 - Google Patents
一种基于门控网络和梯度提升回归的交通时序预测方法 Download PDFInfo
- Publication number
- CN109886387A CN109886387A CN201910013775.5A CN201910013775A CN109886387A CN 109886387 A CN109886387 A CN 109886387A CN 201910013775 A CN201910013775 A CN 201910013775A CN 109886387 A CN109886387 A CN 109886387A
- Authority
- CN
- China
- Prior art keywords
- data
- traffic
- time
- prediction
- gru
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013277 forecasting method Methods 0.000 title 1
- 238000000034 method Methods 0.000 claims abstract description 48
- 238000013528 artificial neural network Methods 0.000 claims abstract description 17
- 230000008569 process Effects 0.000 claims abstract description 8
- 238000005096 rolling process Methods 0.000 claims abstract description 7
- 238000013075 data extraction Methods 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 63
- 238000012360 testing method Methods 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 21
- 238000012417 linear regression Methods 0.000 claims description 16
- 210000002569 neuron Anatomy 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 7
- 238000005065 mining Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims 1
- 230000007774 longterm Effects 0.000 abstract description 5
- 238000009412 basement excavation Methods 0.000 abstract 1
- 230000001684 chronic effect Effects 0.000 abstract 1
- 230000001737 promoting effect Effects 0.000 abstract 1
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公布了一种基于门控神经网络GRU和梯度提升回归模型GBR预测交通时序的方法,包括多时间维度数据提取、模式挖掘、时序数据预测和滚动预测过程;通过多时间维度的数据提取,使用GRU对时间序列数据进行短期和长期模式挖掘,利用GBR结合交通趋势和相关道路数据进行初步预测,再将初步预测结果进行融合,获取最终的交通时序数据预测值。本发明方法能够发掘时间序列的潜在长期和短期模式,并根据实时数据进行微调,能够适应当前交通状况,对交通时间序列的预测精度高,可扩展性强,且具有可解释性。
Description
技术领域
本发明属于智能交通技术领域,涉及交通时间序列预测方法,具体涉及一种基于门控神经网络和梯度提升回归的交通时间序列预测方法。
背景技术
随着经济的飞速发展,人们的生活水平逐渐提高。越来越多的私家车对交通路网造成了很大压力,交通拥堵随处可见。智能交通系统的出现减轻了交通压力,给人们的生活提供了便利。交通预测是智能交通系统中必不可少的一部分。交通时间序列预测一般通过对历史和实时的数据进行模式挖掘,从而对未来一段时间内的交通数据进行预测。
现有的交通时序数据预测方法主要有线性回归,卡尔曼滤波、神经网络、最近邻、支持向量回归、随机森林和梯度提升回归模型。这些模型有各自的优缺点,然而随着交通数据的增多,这些方法逐渐难以实时适应交通的变换状况,难以准确进行预测。因为交通时序数据通常在不同的时期和一天内不同的时间段发生波动,上下游或周围道路的交通状况也会对预测道路的交通状况造成很大影响。王飞跃等人(专利号CN 106096767)提出了一种基于长短期记忆网络(Long short-Term Memory,LSTM)的路段行程时间预测方法。该方法使用历史交通行程时间数据训练LSTM网络,并通过实时数据对未来的行程时间数据进行预测。然而此方法难以利用先验的交通知识和目标道路的上下游和周围相关道路的数据,这对准确预测交通时序数据造成了一定的影响。
门控循环单元(Gated Recurrent Unit,GRU)是LSTM的一种变体,它的优势在于相比LSTM结构更加简单并且参数更加少,然而性能和LSTM相当。GRU 能够学习和记忆时序数据的短期和长期模式。而梯度提升回归(Gradient Boosting Regression,GBR)方法能够快速并且较准确地对时序数据进行预测。但是,目前尚未出现能够将GRU网络和GBR相结合应用于智能交通技术领域,通过利用大规模的交通时序数据和相关道路的数据,实现捕获交通潜在趋势的交通时序数据预测的方法。
发明内容
本发明的目的是要提供一种新的交通时序数据预测方法,根据对交通数据进行多个时间维度的数据提取来结合先验交通知识,使用门控神经网络和梯度提升回归进行交通时间序列预测,用于解决现有智能交通采用神经网络无法结合人类先验知识和周围相关道路数据进行的交通时间序列预测的不足,更准确地预测未来的交通时序数据(如出行时间、速度和流量等)。
本发明利用大规模的交通时序数据和相关道路的数据,研究能够捕获交通潜在趋势的交通时序数据预测方法。针对交通时序数据的预测需求,提出了一种基于GRU网络和GBR的交通预测方法。根据先验知识,交通数据在一天内和不同的日期会呈现不同的趋势,且上下游和周围道路会影响目标道路的交通数据。该方法能够结合该先验知识,通过多时间维度的数据提取,使用GRU 对时间序列数据进行短期和长期模式挖掘,利用GBR结合一些交通趋势和相关道路的数据进行初步预测,然后将初步预测结果进行融合,获取最终的交通时序数据预测值。
本发明提供的技术方案是:
一种基于门控神经网络GRU和梯度提升回归GBR进行交通时间序列预测的方法,包括多时间维度数据提取、模式挖掘、时序数据预测和滚动预测过程;通过多时间维度的数据提取,使用GRU对时间序列数据进行短期和长期模式挖掘,利用GBR结合交通趋势和相关道路数据进行初步预测,再将初步预测结果进行融合,获取最终的交通时序数据预测值;具体包括如下步骤:
A多时间维度数据提取:
A1:将指定道路和其相关道路的原始时序数据进行数据归一化处理;
相关道路即指定道路的上下游道路和周边与指定道路直接相连的道路。
A2:将步骤A1处理后得到的归一化数据,根据指定的比例划分为训练集和测试集(如训练集样本数:测试集样本数=7:3或4:1等);
A3:将步骤A2处理后的训练集和测试集分别进行数据提取,设置小时窗口、天窗口和周窗口的大小,根据这些窗口的大小分别提取出小时数据、天数据和周数据,并提取出相关道路在当前时间的交通数据;即根据指定道路的数据和当前时间,提取出上下游道路和周边直接相连道路在当前时间的交通数据;
B模式挖掘:
B1:使用步骤A3训练集的小时数据对GRU网络进行训练;
B2:使用步骤A3训练集的天数据、周数据和相关道路数据分别训练三个 GBR模型;
步骤B1和B2中,GRU网络和GBR模型对于训练集中的每一个训练样本均产生预测结果;
B3:使用步骤B1和B2中产生的预测数据对线性回归模型进行训练;
C时间序列数据预测,时间序列数据包括出行时间、速度和流量等:
C1:根据步骤B1训练好的GRU对A3测试集的小时数据进行初步交通预测,得到时序数据初步预测值x1;
C2:根据步骤B2训练好的三个GBR模型分别对A3测试集的天数据、周数据和相关道路数据进行初步预测,得到时序数据初步预测值x2、x3和x4;
C3:将步骤C1和C2产生的初步预测值进行融合,通过线性回归方法获取最终的交通时序数据预测结果。
D滚动预测:
D1:在时刻t,根据预测框架的步骤A1-C3可以获取(t+1)时刻的交通预测值;
D2:当(t+1)时刻还未到来时,可以将D1中的预测值作为真实数据,对 (t+2)时刻的交通数据进行预测,以此类推,可以获得{(t+3),(t+4),…}时刻的交通预测值;
D3:当(t+1)时刻到来时,将通过交通设备收集到的实际交通数据观测值添加到交通历史数据集中,对预测方法(即GRU网络、GBR模型以及线性回归模型)进行微调,然后使用微调后的预测方法进行新一轮的预测。
新一轮的预测包括步骤A~D,其中,步骤B在第一次训练时使用的训练数据是交通数据库中的全部历史数据,而在之后的微调过程中,仅使用新收集的少量交通数据对模型参数进行微小的调整。
通过上述步骤,实现基于门控神经网络GRU和梯度提升回归GBR的交通时间序列预测,得到包括出行时间、速度和流量等的交通时序数据。
作为一个优选方案,步骤A1中的数据归一化处理详细步骤如下:
A11:获取指定道路和相关道路的原始时序数据X的最大值xmax和最小值xmin;
A12使用min-max规范化方法对每一个原始时序数据进行处理,规范化交通时序数据X在[0,1]之间;
作为一个优选方案,步骤A3包含如下步骤:
A31:根据实际情况设置小时窗口H,天窗口D,周窗口W;
A32:根据步骤A2获得的训练集和测试集和步骤A31设置的小时窗口H,获取时刻t的最近H个小时的时序数据;
A33:根据步骤A2获得的训练集和测试集和步骤A31设置的天窗口D,获取最近D天时刻t的时序数据;
A34:根据步骤A2获得的训练集和测试集和步骤A31设置的周窗口W,获取最近W周时刻t的时序数据;
A35:根据步骤A2获得的训练集和测试集,提取出时刻t的相关道路数据(不包含预测的目标道路数据);
作为一个优选方案,步骤B1包含如下步骤:
B11:设置GRU网络的输入为步骤A32获取的小时数据(GRU网络整体接收的就是小时数据,在训练阶段,GRU接收的是训练集的小时数据,在测试阶段,GRU的输入为测试集的小时数据),输出维度为1,该GRU网络包含一个隐藏层和一个全连接层,其中全连接层的隐层神经元数目为隐藏层的一半,全连接层的激活函数为tanh函数,优化器使用adam(Adaptive Moment Estimation);
B12:设置隐藏层的神经元数目2,4,6,…,nmax,nmax是预设的隐藏层神经元的最大值;
B13:对步骤B12中含有不同神经元数目的多个的GRU网络使用步骤A32 获取的训练集的小时数据进行迭代训练,损失函数为平均平方误差MSE;
B14:对步骤B13中的多个GRU网络,选择性能相对最优(即多种评价指标如平均绝对误差(MAE),均方根误差(RMSE)以及平均绝对百分比误差 (MAPE)等总体最优,误差最小)的网络作为预测方法的一个模块。评价指标的公式如下:
其中,n是样本的个数,Xi是真实值,是预测值。
作为一个优选方案,步骤B2包含如下步骤:
B21:设置GBR的树的数量为50,60,70,…,Tmax,Tmax是设置的树的最大数量,树的最大深度为3,4,5,…,Dmax,Dmax是用户设置的树的最大深度的上限值。
B22:分别使用步骤A3(A33,A34,A35)获取的训练集的天数据、周数据和相关道路数据对步骤B21的多个GBR模型进行训练;
B23:分别选择B22中性能最优(即多种评价指标如平均绝对误差(MAE),均方根误差(RMSE)以及平均绝对百分比误差(MAPE)等总体最优,误差最小)的三个GBR模型作为天数据、周数据和相关道路数据的预测模型。
作为一个优选方案,步骤C3的详细步骤如下:
C31:通过步骤C1和C2获取时刻t的小时预测值Ht+1,天预测值Dt+1,周预测值Wt+1和相关道路预测值Rt+1;
C32:将步骤C31中的四个预测值通过线性回归函数进行最终的预测,获取(t+ 1)时刻的交通时序数据预测值。
与现有技术相比,本发明的有益效果是:
本发明所提供的基于GRU和GBR的交通时间序列预测方法能够发掘时间序列的潜在长期和短期模式,并根据实时数据进行微调,能够适应当前交通状况,对交通时间序列的预测精度高,可扩展性强,且具有可解释性。
附图说明
图1是本发明提供的交通时序数据预测方法的流程框图。
图2是本发明具体实施采用的GRU网络的结构示意图;
其中,xt为第t个时间步的输入,ht保存的是隐层t时刻的记忆,yt为第 t个时间步的输出,W、U和V分别是输入层和隐层、隐层和隐层以及隐层和输出层的权重矩阵,GRU表示门控网络的GRU单元。
图3是本发明具体实施采用的GRU的单元结构示意图;
其中,xt为第t个时间步的输入,ht-1保存的是隐层(t-1)时刻的记忆,rt表示重置门的值,zt表示更新门的值,表示隐层的当前记忆,ht为第t个时间步隐层的最终输出,σ表示Sigmoid函数,t表示双曲正切函数,*和+分别表示向量的点积和加法运算。
具体实施方式
下面结合附图,通过实施例进一步描述本发明,但不以任何方式限制本发明的范围。
本发明给出一种基于门控网络和梯度提升回归的交通时序数据预测框架。如图1所示,该模型包括数据提取、模式挖掘、时序预测和滚动预测四个部分。本文以交通行程时间预测为例进行说明:
A数据提取:
A1:将指定道路和其相关道路(上下游道路和周边与指定道路直接相连的道路)的原始行程时间时序数据进行数据归一化处理;
详细过程如下:
A11:获取指定道路和相关道路的原始行程时间时序数据X的最大值xmax和最小值xmin;
A12:使用min-max规范化方法对每一个原始行程时间时序数据x进行处理,规范化交通行程时间数据Xs在[0,1]之间,min-max规范化方法定义如下式4所示:
其中,xs为min-max规范化后的行程时间数据,x是原始行程时间数据, xmax和xmin分别是行程时间数据的最大值和最小值;
A2:将步骤A1处理后的行程时间数据根据指定的比例划分为训练集和测试集;
A3:将步骤A2处理后的训练集和测试集分别进行数据提取,设置小时窗口、天窗口和周窗口的大小,根据这些窗口的大小分别提取出行程时间的小时数据、天数据和周数据,并提取出相关道路的行程数据;
主要包括以下步骤:
A31:根据实际情况设置小时窗口H,天窗口D,周窗口W;
A32:根据步骤A22获得的训练集和测试集和步骤A31设置的小时窗口H,获取交通行程时间在时刻t的最近小时数据例如H=3小时,则时刻t的小时数据为最近3个小时的时序数据;
A33:根据步骤A22获得的训练集和测试集和步骤A31设置的天窗口D,获取最近D天时刻t的数据例如D=3天,则行程时间在时刻t 的天数据为最近3天t时刻的时序数据。请注意,我们把周末和工作日看做不同的天数据,即周一的天数据只可能包含历史周一至周五的数据,周六的天数据只可能包含历史周六和周日的数据。
A34:根据步骤A22获得的训练集和测试集和步骤A31设置的周窗口W,获取行程时间最近W周时刻t的数据例如W=3天,则时刻t 的周数据为最近3周t时刻的时序数据。请注意,我们把一周的七天看做不同的天数据,即周一的周数据只可能包含历史周一的数据,周六的周数据只可能包含历史周六的数据。
A35:根据步骤A22获得的训练集和测试集,提取出时刻t的相关道路的行程时间数据(不包含预测的目标道路数据);
B模式挖掘:
B1:使用步骤A3训练集的小时数据对GRU网络进行训练;
GRU网络的结构如图2所示,其中隐层由GRU模块组成,GRU模块的结构如图3所示。该GRU网络在t时刻的输入为xt,输出为(t+1)时刻的预测值其中隐层的输出为ht。GRU模块包含两个门,即更新门(update gate)和重置门(reset gate)。两个门的输入都是当前时刻的输入xt和上一个时刻隐层的输出 ht-1,输出分别是zt和rt,计算公式如下(式5-式10):
更新门:zt=σ(Wzxt+Uzht-1) (式5)
重置门:rt=σ(Wrxt+Urht-1) (式6)
当前记忆:
最终记忆:
GRU模块的输出:gt+1=σ(Wght+b) (式9)
GRU网络的最终输出:其中,W和U是权重参数,b是偏置参数,⊙是逐元素乘法,σ是Sigmoid函数tanh为双曲正切函数
GRU网络的训练目标是使网络的预测结果和实际的观测值尽可能接近。给定训练集{x1,x2,…,xnum-1,xnum},其中,num是训练样本的数量;定义网络的损失函数为平均平方误差MSE(Mean Square Error):
通过梯度下降法最小化MSE值可以对网络中的权重和偏置参数进行调整,从而达到训练网络的目的。
具体的训练步骤如下:
B11:设置GRU网络的输入为步骤A31设置的行程时间的小时数据,输出维度为1,该GRU网络还包含一个隐藏层和一个全连接层,其中全连接层的隐层神经元数目为隐藏层的一半,激活函数为tanh函数,优化器使用adam;
B12:设置隐藏层的神经元数目2,4,6,…,nmax,nmax是预设的隐藏层神经元的最大值;
B13:对步骤B12中含有不同神经元数目的多个的GRU网络使用步骤A32 获取的行程时间训练集的小时数据进行迭代训练,直到达到设置的最大迭代次数或者损失函数的值不再变化;
B14:对步骤B13中的多个GRU网络,选择性能相对最优(即多种评价指标如平均绝对误差(MAE),均方根误差(RMSE)以及平均绝对百分比误差 (MAPE)等总体最优,误差最小)的网络作为预测框架的一个模块。
B2:使用步骤A3训练集的天数据、周数据和相关道路数据分别训练三个梯度提升回归树;
梯度提升回归方法是一种集成学习方法,思想是通过将多个弱预测器进行结合从而获得一个强预测器。具体的训练过程如下:
B21:设置GBR的树的数量为50,60,70,…,Tmax,Tmax是设置的树的最大数量,树的最大深度为3,4,5,…,Dmax,Dmax是用户设置的树的最大深度的上限值。
B22:分别使用步骤A33,A34,A35获取的交通行程时间训练集的天数据、周数据和相关道路数据对步骤B21的多个GBR模型进行训练;
B23:分别选择B22中性能最优(即多种评价指标如平均绝对误差 (MAE),均方根误差(RMSE)以及平均绝对百分比误差(MAPE)等总体最优,误差最小)的GBR模型作为预测框架的天数据、周数据和相关道路数据的预测模型。
B3:使用步骤B1和B2针对训练集产生的预测数据对线性回归模型进行训练;步骤B1和B2产生的小时数据、天数据、周数据和相关道路数据分别为 XH,XD,XW,XR,线性回归预测可表示为方程(式12):
其中,为训练的线性回归模型输出的最终预测值,αi(i=0,1,2,3,4)是模型参数。模型参数通过最小二乘估计,即使预测值和实际值的方差(即MSE)总和达到最小。
C时序数据预测:
C1:根据步骤B1训练好的GRU对A3行程时间测试集的小时数据进行初步交通预测,获取时刻t的小时预测值Ht+1;
C2:根据步骤B2训练好的三个GBR分别对A3行程时间测试集的天数据、周数据和相关道路数据进行初步预测,获取时刻t的天预测值Dt+1和周预测值Wt+1;
C3:将步骤C1和C2产生的初步行程时间预测值进行融合,通过线性回归方法获取最终的交通行程时间数据预测结果。
C31:通过步骤C1和C2获取时刻t的行程时间小时预测值Ht+1,天预测值 Dt+1,周预测值Wt+1和相关道路行程时间预测值Rt+1;
C32:将步骤C31中的Ht+1,Dt+1,Wt+1和Rt+1通过训练好的线性回归函数进行最终的预测,获取(t+1)时刻的交通时序数据预测值公式如下;
D滚动预测:
D1:在时刻t,根据预测框架通过步骤C3可以获取(t+1)时刻的交通行程时间预测值
D2:当(t+1)时刻还未到来时,可以将行程时间预测值作为真实数据,对(t+2)时刻的交通行程时间数据进行预测,以此类推,可以获得 {(t+3),(t+4),…}时刻的交通行程时间预测值
D3:当(t+1)时刻到来时,将行程时间观测值xt+1添加到交通行程时间历史数据集中,使用新的行程时间数据xt+1对预测方法中的多个模型(GRU、GBR和线性回归模型)进行训练,即参数微调,然后使用微调后的预测框架进行新一轮的预测。
以上所述,仅为本发明中的具体实现方法,但本发明的保护范围并不局限于此,任何类似方法的替换或者函数变换,都应在本发明的包含范围之内。
Claims (9)
1.一种基于门控神经网络GRU和梯度提升回归模型GBR预测交通时序的方法,包括多时间维度数据提取、模式挖掘、时序数据预测和滚动预测过程;具体包括如下步骤:
A.多时间维度数据提取,执行如下操作:
A1.将指定道路和相关道路的原始时序数据进行数据归一化处理,得到归一化数据;
A2.将归一化数据划分为训练集和测试集;
A3.将训练集和测试集分别进行数据提取,设置小时窗口、天窗口和周窗口的大小,根据不同窗口的大小分别提取出小时数据、天数据和周数据,并提取出相关道路在当前时间的交通数据;
B.模式挖掘,执行如下操作:
B1.使用步骤A3得到的训练集的小时数据对GRU网络进行训练;
B2.使用步骤A3得到的训练集的天数据、周数据和相关道路数据分别训练三个GBR模型;
B3.使用步骤B1和B2产生的预测数据对线性回归模型进行训练;
C.时序数据预测,时序数据包括出行时间、速度和流量;执行如下操作:
C1.根据步骤B1训练好的GRU网络,对步骤A3的测试集的小时数据进行初步交通预测,得到时序数据初步预测值;
C2.根据步骤B2训练好的三个GBR模型,分别对步骤A3的测试集的天数据、周数据和相关道路数据进行初步预测,分别得到时序数据初步预测值;
C3.将步骤C1和C2产生的初步预测值进行融合,通过线性回归方法获取最终的交通时序数据预测结果;
D.滚动预测,执行如下操作:
D1.在时刻t,根据步骤A1~C3获取(t+1)时刻的交通预测值;
D2.当(t+1)时刻还未到来时,将步骤D1得到的(t+1)时刻的交通预测值作为真实数据,对(t+2)时刻的交通数据进行预测,得到(t+3)时刻的交通预测值;
相应地获得{(t+3),(t+4),…}时刻的交通预测值;
D3.当(t+1)时刻到来时,将通过交通设备收集到的实际交通数据观测值添加到数据集中,对预测模型进行微调,然后使用微调后的预测模型再进行新一轮的预测;
通过上述步骤,实现基于门控神经网络GRU和梯度提升回归GBR的交通时间序列预测,得到包括出行时间、速度和流量等的交通时序数据。
2.如权利要求1所述的基于门控神经网络GRU和梯度提升回归模型GBR预测交通时序的方法,其特征是,步骤A1中的数据归一化处理具体包括如下步骤:
A11.获取指定道路和相关道路的原始时序数据X的最大值xmax和最小值xmin;
A12.使用min-max规范化方法对每一个原始时序数据进行处理,规范化交通时序数据X在[0,1]之间。
3.如权利要求2所述的基于门控神经网络GRU和梯度提升回归模型GBR预测交通时序的方法,其特征是,min-max规范化方法表示为式4:
其中,xs为min-max规范化后的行程时间数据,x是原始行程时间数据,xmax和xmin分别是行程时间数据的最大值和最小值。
4.如权利要求1所述的基于门控神经网络GRU和梯度提升回归模型GBR预测交通时序的方法,其特征是,步骤A3具体包括如下步骤:
A31.根据实际情况设置小时窗口H、天窗口D、周窗口W;
A32.根据步骤A2获得的训练集、测试集和步骤A31设置的小时窗口H,获取时刻t的最近H个小时的时序数据;
A33.根据步骤A2获得的训练集、测试集和步骤A31设置的天窗口D,获取最近D天时刻t的时序数据;
A34.根据步骤A2获得的训练集、测试集和步骤A31设置的周窗口W,获取最近W周时刻t的时序数据;
A35.根据步骤A2获得的训练集和测试集,提取出时刻t的相关道路数据。
5.如权利要求1所述的基于门控神经网络GRU和梯度提升回归模型GBR预测交通时序的方法,其特征是,步骤B1具体包括如下步骤:
B11.设置GRU网络的输入为步骤A3获取的训练集的小时数据,输出维度为1;GRU网络包含一个隐藏层和一个全连接层,其中全连接层的隐层神经元数目为隐藏层的一半,全连接层的激活函数为tanh函数,优化器使用adam;
B12.设置隐藏层的神经元数目2,4,6,…,nmax,nmax是预设的隐藏层神经元的最大值;
B13.对步骤B12中含有不同神经元数目的多个GRU网络,使用步骤A3获取的训练集的小时数据进行迭代训练,损失函数为平均平方误差MSE;
B14.对步骤B13中的多个GRU网络,选择性能相对最优的GRU网络。
6.如权利要求5所述的基于门控神经网络GRU和梯度提升回归模型GBR预测交通时序的方法,其特征是,GRU网络在t时刻的输入为xt,输出为(t+1)时刻的预测值隐层的输出为ht;GRU模块包括更新门和重置门;两个门的输入均为当前时刻的输入xt和上一个时刻隐层的输出ht-1,输出分别是zt和rt;具体通过式5~式10进行计算:
更新门:zt=σ(Wzxt+Uzht-1) (式5)
重置门:rt=σ(Wrxt+Urht-1) (式6)
当前记忆:
最终记忆:
GRU模块的输出:gt+1=σ(Wght+b) (式9)
GRU网络的最终输出:
其中,W和U是权重参数,b是偏置参数,⊙是逐元素乘法,σ是Sigmoid函数tanh为双曲正切函数
7.如权利要求6所述的基于门控神经网络GRU和梯度提升回归模型GBR预测交通时序的方法,其特征是,具体地,给定训练集{x1,x2,…,xnum-1,xnum},其中,num是训练样本的数量;定义网络的损失函数为平均平方误差MSE(Mean Square Error),表示为式11:
以损失函数MSE为目标函数训练GRU网络,使得网络的预测结果尽可能接近实际的观测值。
8.如权利要求1所述的基于门控神经网络GRU和梯度提升回归模型GBR预测交通时序的方法,其特征是,步骤B2包括如下步骤:
B21.设置GBR模型的树的数量为50,60,70,…,Tmax;Tmax是树的最大数量;树的最大深度为3,4,5,…,Dmax;Dmax是用户设置的树的最大深度的上限值;
B22.使用步骤A3获取的训练集的天数据、周数据和相关道路数据对步骤B21的多个GBR模型进行训练;
B23:分别选择B22中性能最优的三个GBR模型作为天数据、周数据和相关道路数据的预测模型。
9.如权利要求1所述的基于门控神经网络GRU和梯度提升回归模型GBR预测交通时序的方法,其特征是,步骤C3的步骤如下:
C31.通过步骤C1和C2获取时刻t的小时预测值Ht+1,天预测值Dt+1,周预测值Wt+1和相关道路预测值Rt+1;
C32.将步骤C31中的四个预测值通过线性回归预测函数进行最终的预测,获取(t+1)时刻的交通时序数据预测值;
所述线性回归预测函数表示为式12:
式9中,为训练的线性回归模型输出的最终预测值;αi(i=0,1,2,3,4)是模型参数;XH,XD,XW,XR分别为小时数据、天数据、周数据和相关道路数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910013775.5A CN109886387B (zh) | 2019-01-07 | 2019-01-07 | 一种基于门控网络和梯度提升回归的交通时序预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910013775.5A CN109886387B (zh) | 2019-01-07 | 2019-01-07 | 一种基于门控网络和梯度提升回归的交通时序预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109886387A true CN109886387A (zh) | 2019-06-14 |
CN109886387B CN109886387B (zh) | 2021-02-26 |
Family
ID=66925649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910013775.5A Active CN109886387B (zh) | 2019-01-07 | 2019-01-07 | 一种基于门控网络和梯度提升回归的交通时序预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109886387B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110322695A (zh) * | 2019-07-23 | 2019-10-11 | 内蒙古工业大学 | 一种基于深度学习的短时交通流预测方法 |
CN110580548A (zh) * | 2019-08-30 | 2019-12-17 | 天津大学 | 一种基于类集成学习的多步交通速度预测方法 |
CN110766942A (zh) * | 2019-10-18 | 2020-02-07 | 北京大学 | 一种基于卷积长短期记忆网络的交通路网拥堵预测方法 |
CN110879921A (zh) * | 2019-11-25 | 2020-03-13 | 大连大学 | 一种基于时空相关性的卫星网络流量预测方法 |
CN111062476A (zh) * | 2019-12-06 | 2020-04-24 | 重庆大学 | 基于门控循环单元网络集成的水质预测方法 |
CN111145541A (zh) * | 2019-12-18 | 2020-05-12 | 深圳先进技术研究院 | 交通流量数据预测方法、存储介质和计算机设备 |
CN113222645A (zh) * | 2021-04-23 | 2021-08-06 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于多源数据融合的城市热点区域高峰出行需求预测方法 |
CN114266200A (zh) * | 2022-02-24 | 2022-04-01 | 山东大学 | 二氧化氮浓度预测方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101438334A (zh) * | 2006-03-03 | 2009-05-20 | 因瑞克斯有限公司 | 未来交通状况的动态时序预测 |
CN106295874A (zh) * | 2016-08-08 | 2017-01-04 | 上海交通大学 | 基于深信度网络的交通流参数预测方法 |
CN106446209A (zh) * | 2016-09-30 | 2017-02-22 | 浙江大学 | 一种海洋环境监测要素短期预测方法 |
CN106897388A (zh) * | 2017-01-24 | 2017-06-27 | 北京航空航天大学 | 预测微博事件热度的方法及装置 |
CN108335487A (zh) * | 2018-03-20 | 2018-07-27 | 北方工业大学 | 一种基于交通状态时序性的道路交通状态预测系统 |
CN108615096A (zh) * | 2018-05-10 | 2018-10-02 | 平安科技(深圳)有限公司 | 服务器、金融时序数据的处理方法及存储介质 |
CN108877223A (zh) * | 2018-07-13 | 2018-11-23 | 南京理工大学 | 一种基于时空相关性的短时交通流预测方法 |
-
2019
- 2019-01-07 CN CN201910013775.5A patent/CN109886387B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101438334A (zh) * | 2006-03-03 | 2009-05-20 | 因瑞克斯有限公司 | 未来交通状况的动态时序预测 |
CN106295874A (zh) * | 2016-08-08 | 2017-01-04 | 上海交通大学 | 基于深信度网络的交通流参数预测方法 |
CN106446209A (zh) * | 2016-09-30 | 2017-02-22 | 浙江大学 | 一种海洋环境监测要素短期预测方法 |
CN106897388A (zh) * | 2017-01-24 | 2017-06-27 | 北京航空航天大学 | 预测微博事件热度的方法及装置 |
CN108335487A (zh) * | 2018-03-20 | 2018-07-27 | 北方工业大学 | 一种基于交通状态时序性的道路交通状态预测系统 |
CN108615096A (zh) * | 2018-05-10 | 2018-10-02 | 平安科技(深圳)有限公司 | 服务器、金融时序数据的处理方法及存储介质 |
CN108877223A (zh) * | 2018-07-13 | 2018-11-23 | 南京理工大学 | 一种基于时空相关性的短时交通流预测方法 |
Non-Patent Citations (3)
Title |
---|
LIPTON Z C: "A Critical Review of Recurrent Neural Networks for Sequence Learning", 《COMPUTER SCIENCE》 * |
MENGTING BAI: "Travel-Time Prediction Methods: A Review", 《SPRINGER NATURE SWITZERLAND AG 2018》 * |
文峰: "基于SVR的短时交通流量预测", 《科技创新导报》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110322695A (zh) * | 2019-07-23 | 2019-10-11 | 内蒙古工业大学 | 一种基于深度学习的短时交通流预测方法 |
CN110580548A (zh) * | 2019-08-30 | 2019-12-17 | 天津大学 | 一种基于类集成学习的多步交通速度预测方法 |
CN110766942A (zh) * | 2019-10-18 | 2020-02-07 | 北京大学 | 一种基于卷积长短期记忆网络的交通路网拥堵预测方法 |
CN110766942B (zh) * | 2019-10-18 | 2020-12-22 | 北京大学 | 一种基于卷积长短期记忆网络的交通路网拥堵预测方法 |
CN110879921A (zh) * | 2019-11-25 | 2020-03-13 | 大连大学 | 一种基于时空相关性的卫星网络流量预测方法 |
CN110879921B (zh) * | 2019-11-25 | 2023-05-05 | 大连大学 | 一种基于时空相关性的卫星网络流量预测方法 |
CN111062476A (zh) * | 2019-12-06 | 2020-04-24 | 重庆大学 | 基于门控循环单元网络集成的水质预测方法 |
CN111145541A (zh) * | 2019-12-18 | 2020-05-12 | 深圳先进技术研究院 | 交通流量数据预测方法、存储介质和计算机设备 |
CN111145541B (zh) * | 2019-12-18 | 2021-10-22 | 深圳先进技术研究院 | 交通流量数据预测方法、存储介质和计算机设备 |
CN113222645A (zh) * | 2021-04-23 | 2021-08-06 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于多源数据融合的城市热点区域高峰出行需求预测方法 |
CN114266200A (zh) * | 2022-02-24 | 2022-04-01 | 山东大学 | 二氧化氮浓度预测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109886387B (zh) | 2021-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109886387B (zh) | 一种基于门控网络和梯度提升回归的交通时序预测方法 | |
CN110070713B (zh) | 一种基于双向嵌套lstm神经网络的交通流预测方法 | |
CN112350899B (zh) | 一种基于图卷积网络融合多特征输入的网络流量预测方法 | |
CN110491146B (zh) | 一种基于深度学习的交通信号控制方案实时推荐方法 | |
CN107180530B (zh) | 一种基于深度时空卷积循环网络的路网状态预测方法 | |
CN108629144B (zh) | 一种桥梁健康评估方法 | |
CN107909206B (zh) | 一种基于深层结构循环神经网络的pm2.5预测方法 | |
CN110502806B (zh) | 一种基于lstm网络的无线频谱占用度预测方法 | |
CN110738349B (zh) | 基于多模型融合的电网故障抢修时长预测方法 | |
CN107544904B (zh) | 一种基于深度cg-lstm神经网络的软件可靠性预测方法 | |
CN109902880A (zh) | 一种基于Seq2Seq生成对抗网络的城市人流预测方法 | |
CN112232604B (zh) | 基于Prophet模型提取网络流量的预测方法 | |
CN110570035B (zh) | 同时建模时空依赖性和每日流量相关性的人流量预测系统 | |
CN110443448B (zh) | 一种基于双向lstm的飞机机位分类预测方法和系统 | |
CN111027673B (zh) | 一种地铁客流量预测方法 | |
CN111862592B (zh) | 一种基于rgcn的交通流预测方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN112381320A (zh) | 一种社区人员流量预测方法、系统、存储介质及设备 | |
Massaoudi et al. | Performance evaluation of deep recurrent neural networks architectures: Application to PV power forecasting | |
CN114648097A (zh) | 基于深度学习的电梯困人特征解析与时间序列预测模型构建方法、所得模型及预测方法 | |
CN112541615A (zh) | 基于卷积神经网络的水位预测方法 | |
CN115689008A (zh) | 基于集合经验模态分解的CNN-BiLSTM短期光伏功率预测方法及其系统 | |
CN111860787A (zh) | 一种含有缺失数据的耦合有向图结构流量数据的短期预测方法及装置 | |
CN112766603A (zh) | 一种交通流量预测方法、系统、计算机设备及存储介质 | |
CN114912666A (zh) | 一种基于ceemdan算法和注意力机制的短时客流量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |