CN110322695B - 一种基于深度学习的短时交通流预测方法 - Google Patents
一种基于深度学习的短时交通流预测方法 Download PDFInfo
- Publication number
- CN110322695B CN110322695B CN201910667478.2A CN201910667478A CN110322695B CN 110322695 B CN110322695 B CN 110322695B CN 201910667478 A CN201910667478 A CN 201910667478A CN 110322695 B CN110322695 B CN 110322695B
- Authority
- CN
- China
- Prior art keywords
- time
- traffic flow
- short
- neural network
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 31
- 238000013135 deep learning Methods 0.000 title claims description 10
- 238000013528 artificial neural network Methods 0.000 claims abstract description 25
- 230000000306 recurrent effect Effects 0.000 claims abstract description 22
- 238000003066 decision tree Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 27
- 230000004913 activation Effects 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 18
- 230000009466 transformation Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 8
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 150000007524 organic acids Chemical class 0.000 claims description 3
- 230000002238 attenuated effect Effects 0.000 claims 1
- 239000004973 liquid crystal related substance Substances 0.000 claims 1
- 238000005065 mining Methods 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 abstract description 2
- 238000011161 development Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
- G08G1/0145—Measuring and analyzing of parameters relative to traffic conditions for specific applications for active traffic flow control
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- Chemical & Material Sciences (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Analytical Chemistry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Traffic Control Systems (AREA)
Abstract
首先对天气数据和交通路口过车数据进行分析和预处理,输入到门限循环神经网络(GRU)中提取到交通流的高阶特征,之后将所述高阶特征输入到梯度提升决策树回归模型(GBDT)中进行短时交通流预测。本发明可以对交通流数据进行更加深入的挖掘分析,而且把输出层改为GBDT后,可以有效的提高短时交通流预测的准确率。
Description
技术领域
本发明属于交通预测技术领域,特别涉及一种基于深度学习的短时交通流预测方法。
背景技术
随着社会各界与日俱增的交通运输需求,交通运输在经济发展中的作用越来越明显,交通拥堵问题成为制约社会发展的一个瓶颈,因而,如何有效地解决交通拥堵问题已成为世界各国政府最棘手的也是最急需解决的难题之一。
短时交通流预测是交通管理和控制部门采取交通诱导措施的主要依据,为了更好的实时性反映交通状态,基于短时交通流量预测模型的研究成为近几十年来流量预测研究的重点。随着新技术的不断发展,智能化系统的广泛应用,对于大数据的处理和交通预测模型的精度提出了更高的要求。实时、准确的交通流预测,可以有效的提高交通的通行效率和安全性,并且方便管理部门主动的进行交通规划,并采取合理的交通诱导措施。
传统的交通流预测方法有支持向量机,决策树,卷积神经网络,循环神经网络等,这些交通流预测方法大部分都是只提取交通流的时空特征,而忽略了影响交通流的潜在特征,比如天气特征,速度特征,节假日时间特征等,而且没有对交通流数据进行深入的分析,从而无法获得更加准确的预测。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于深度学习的短时交通流预测方法,加入了影响交通流的潜在特征,可以对交通流数据进行更加深入的挖掘,使得预测出来的效果更加精准。
为了实现上述目的,本发明采用的技术方案是:
一种基于深度学习的短时交通流预测方法,首先对交通流数据进行预处理,然后将预处理的数据输入到门限循环神经网络(GRU)中进行训练,提取得到交通流数据的高阶特征,最后将所述高阶特征输入到梯度提升决策树回归模型(GBDT)中进行短时交通流预测。
所述交通流数据包括天气数据和交通路口过车数据,以车辆速度特征、前一时刻的交通流量特征、节假日时间特征和天气特征作为交通流特征,所述交通路口过车数据包括车辆速度、车辆id、监测点id和车辆行驶时间,所述预处理方法是:假设一个城市某个区域有n个路口,路口集合R={r1,r2,...,ri,...,rn},将一天的24个小时划分为288个5分钟长的时间片t1,t2,...,tj,...,t288,第i个路口ri在第j个时间片tj的交通流量为numij。
所述车辆速度特征是路口每5分钟的车辆速度平均值;所述前一时刻的交通流量特征是按照时间序列排列的某一时刻前4个时间片的交通流量,所述天气特征包括天气状况和风力两个因素,所述天气状况划分为3类,分别为晴或者多云,雨,雾,用W1,W2,W3表示,所述风力划分为4个级别,分别为微风,大风,暴风,台风,用A1,A2,A3,A4表示;所述节假日时间特征中,将工作日记为W,将节假日记为H,工作日里的工作时间记为WWT,工作日里的上下班高峰时间记为WGT,工作日的早高峰前和晚高峰后时间记为WQT,其余时间记为WDT;节假日的日间时间记为HFT,其余时间记为HRT。
所述将预处理的数据输入到门限循环神经网络(GRU)中进行训练的过程是:
1)将交通流数据集输入到GRU中;
2)计算各层的更新门、重置门、当前记忆内容和最终记忆内容的值;
3)使用AdaMax优化算法训练网络模型;
4)将训练好的GRU模型中隐含层最后一层的特征提取出来输入到GBDT回归算法对短时交通流进行预测。
所述2)中,在时间片t,更新门zt=σ(wz·[ht-1,xt]),其中σ为Sigmoid激活函数,xt为输入的交通流特征向量,ht-1保存的是前一个时间片t-1的信息,xt和ht-1均经过一个与权重矩阵wz相乘的线性变换,之后相加投入Sigmoid激活函数以输出激活值;
重置门rt=σ(wr·[ht-1,xt]),xt和ht-1均经过一个与权重矩阵wr相乘的线性变换,之后相加投入Sigmoid激活函数以输出激活值;
当前记忆内容其中tanh为双曲正切激活函数,为当前记忆内容的权重,ht-1为前一时间片隐藏层的值,xt为输入的交通流特征向量,为当前记忆内容的偏置,输入xt先与ht-1经过一个与权重矩阵相乘的线性变换,计算重置门rt与ht-1的乘积,即rt与ht-1的对应元素乘积,然后再投入tanh;
所述2)中,所述使用AdaMax优化算法训练网络模型的方法如下:
AdaMax是Adam的一种变体,它是随机梯度下降的扩展式。此方法对学习率的上限提供了一个更简单的范围。令,其中Wt为t时刻的门限循环神经网络权重,Wt-1为t-1时刻门限循环神经网络的权重,α为学习率,ε为非常小的数,以防止在实现中除以零,bt为t时刻的门限循环神经网络偏置,bt-1为t-1时刻门限循环神经网络的偏置,vt指的是梯度的指数移动均值在时间t的更新,为mt的纠正;
mt=β1·mt-1+(1-β1)·gt
mt是梯度的指数移动均值,通过梯度的一阶矩求得,gt为目标函数的t时刻一阶偏导,gt-1为目标函数的t-1时刻的一阶偏导,i为迭代时间,β1,β2是常数,控制指数衰减,表示β1的t次方,表示β2的p次方,|gt|p为gt绝对值的p次方;
令p→∞并定义
vt=limp→∞(vt)1/p
然后将计算出来的vt,带入Wt,bt公式中对权重和偏置进行更新,利用上述描述的AdaMax优化算法更新网络权重w和偏置b,直到模型收敛,最终模型训练完成后提取出GRU隐层最后一层的特征h作为交通流的高阶特征,h={(h1,y1),(h2,y2),...,(hm,ym)}。
所述将高阶特征输入到梯度提升决策树回归模型(GBDT)中进行短时交通流预测的过程如下:
其中,L为损失函数,yi为交通流量标签,c为使损失函数极小化的常数值,m为训练样本数;
当迭代次数n=1,2,...,N(其中N为最大迭代次数)有:
1.对于样本i=1,2,...,m,计算负梯度
利用(hi,rnj)拟合一颗CART回归树,得到第n棵回归树,其对应的叶子节点区域为Rnj,j=1,2,...,J,其中J为第n棵回归树的叶子节点的个数;
2.对于叶子节点区域j=1,2,...,J,计算最佳拟合值
更新强学习器
其中:
得到强学习器f(h)
式中fN(h)为达到最大迭代次数N时更新的强学习器,f(h)即最终的短时交通流预测结果。
本发明通过GRU模型对交通流数据进行训练,本发明使用深圳交警提供的数据,数据量约为60GB,包括20天的交通数据和天气信息。通过深度学习模型提取出交通流数据的本质特征,并且输入到GBDT回归算法中进行预测。与传统的交通流预测模型相比,本发明所提出的模型可以实现对交通流数据更加深入的挖掘,提取出人工无法提取出来的交通流的本质特征,并且输出层改为GBDT回归算法进行预测,比传统的sigmoid函数预测出来的结果精确值提高了12%,从而有效地缓解交通拥堵、提高道路的通行效率。
附图说明
图1是本发明预测流程示意图。
图2是本发明GRU模型的结构示意图。
图3是本发明采用AdaMax算法优化GRU模型时的预测流程示意图。
具体实施方式
下面结合附图和实施例详细说明本发明的实施方式。
本发明为一种基于深度学习的短时交通流预测方法,交通流信息的实时性和可靠性直接关系到交通控制与管理的效果,因而实现对道路交通流的实时掌握和准确预测就成为运用智能交通技术解决交通问题的一个重要基础。由于短时交通流的预测与前几个时刻的交通流量息息相关,因此本发明采用了适用于时间序列方面预测的门限循环神经网络(GRU),并结合梯度提升决策树回归模型(GBDT)实现了较为精准的短时交通流预测。
具体地,本发明的一个实施例如图1所示,步骤如下:
1、对交通流数据进行预处理;
2、然后将预处理的数据输入到门限循环神经网络(GRU)中进行训练,提取得到交通流数据的高阶特征;
3、将该高阶特征输入到梯度提升决策树回归模型(GBDT)中进行短时交通流预测。
本发明可以对交通流数据进行更加深入的挖掘分析,而且把输出层改为GBDT后,可以有效提高短时交通流预测的准确率。
实际生活中影响城市交通状态的因素是非常复杂的,它受不同城市的发展情况和人口数量等影响。同时不同时间段人们的出行状况对交通流也有很大的影响,例如在上班高峰期,节假日外出旅行,高速免费通行容易发生交通拥堵。另外天气状况对交通状况也有直接的影响,例如在大雨天,大雪天更容易发生交通拥堵,而同一车道的交通速度对交通状态也有一定的影响。因此,本发明以车辆速度特征、前一时刻的交通流量特征、节假日时间特征和天气特征作为交通流特征。
具体而言,步骤1中所提到的交通流数据包括:天气数据和交通路口过车数据,交通路口过车数据包括车辆速度,车辆id,监测点id和车辆行驶时间等。交通流数据预处理的具体方法是,假设一个城市某个区域有n个路口,路口集合R={r1,r2,...,ri,...,rn},将一天的24个小时划分为288个5分钟长的时间片t1,t2,...,tj,...,t288,即将影响交通流量的数据按每五分钟时间段进行划分,第i个路口ri在第j个时间片tj的交通流量为numij。
天气特征主要包括天气状况和风力两个因素,依据现有的研究,天气状况和风力大小的值会影响交通流量的大小。根据气象局天气状况划分标准将天气状况划分为3类,分别为晴或者多云,雨,雾,用W1,W2,W3表示,根据气象局风力等级划分标准,将风力划分为4个级别,分别为微风(0-5)、大风(6-8)、暴风(9-11)、台风(>11),用A1,A2,A3,A4表示。据经验来考虑,工作日、节假日以及工作日里的工作时间、上下班高峰时间和节假日里用餐、娱乐出行时间为主要影响因子。根据数据统计,节假日时间特征中,将工作日记为W,将节假日记为H,工作日里的工作时间(9:00~17:00)记为WWT,工作日里的上下班高峰时间(7:00~9:00,17:00~20:00)记为WGT,工作日的早高峰前和晚高峰后时间(6:00~7:00,20:00~22:00)记为WQT,其余时间记为WDT;节假日的日间时间(10:00~21:00)记为HFT,其余时间记为HRT。
车辆速度特征对交通流预测也有很大的影响,将路口每5分钟的车辆速度平均值作为车辆速度特征;前几个时间段的交通流量对未来时刻交通流量的预测也有重要的影响,将按照时间序列排列的某一时刻前4个时间片的交通流量作为前一时刻的交通流量特征,例如ri在tj的前4个时间片的交通流量为numij-1,numij-2,numij-3,numij-4,排列作为前一时刻的交通流量特征。
在步骤2中,需要利用门限循环神经网络(GRU)从预处理的数据训练提取得到交通流数据的高阶特征,其具体方法主要是将交通流特征输入到GRU中,然后计算各层的更新门、重置门、当前记忆内容和最终记忆内容的值,GRU模型中隐含层最后一层的特征提取出来即得该高阶特征。
GRU是LSTM网络的一种变体,它较LSTM网络的结构更加简单,而且效果也很好,在LSTM中引入了三个门函数:输入门、遗忘门和输出门来控制输入值、记忆值和输出值。而在GRU模型中只有两个门:分别是更新门和重置门,具体结构如图2所示。
(1)更新门
在时间片t,首先需要使用以下公式计算更新门zt:
zt=σ(wz·[ht-1,xt])
其中σ为Sigmoid激活函数,xt为输入的交通流特征向量,ht-1保存的是前一个时间片t-1的信息,xt和ht-1均经过一个与权重矩阵wz相乘的线性变换,之后相加投入Sigmoid激活函数以输出激活值,因此将激活结果压缩到0到1之间。更新门帮助模型决定到底要将多少过去的信息传递到未来,或到底前一时间片和当前时间片的信息有多少是需要继续传递的。这一点非常强大,因为模型能决定从过去复制所有的信息以减少梯度消失的风险。
(2)重置门
本质上来说,重置门主要决定了到底有多少过去的信息需要遗忘,可以使用以下表达式计算:
rt=σ(wr·[ht-1,xt])
该表达式与更新门的表达式是一样的,只是线性变换的参数和用处不一样。如前面更新门所述,xt和ht-1均经过一个与权重矩阵wr相乘的线性变换,之后相加投入Sigmoid激活函数以输出激活值。
(3)当前记忆内容
在重置门的使用中,新的记忆内容将使用重置门储存过去相关的信息,它的计算表达式为:
其中tanh为双曲正切激活函数,为当前记忆内容的权重,ht-1为前一时间片隐藏层的值,xt为输入的交通流特征向量,为当前记忆内容的偏置,输入xt先与ht-1经过一个与权重矩阵相乘的线性变换,计算重置门rt与ht-1的乘积,即rt与ht-1的对应元素乘积,因为前面计算的重置门是一个由0到1组成的向量,它会衡量门控开启的大小,然后再投入tanh。
(4)当前时间片的最终记忆
在最后一步,网络需要计算ht,该向量将保留当前单元的信息并传递到下一个单元中。在这个过程中,需要使用更新门,它决定了当前记忆内容ht和前一时间片ht-1中需要收集的信息是什么。这一过程可以表示为:
zt为更新门的激活结果,它同样以门控的形式控制了信息的流入。zt与ht-1的Hadamard乘积表示前一时间片保留到最终记忆的信息,该信息加上当前记忆保留至最终记忆的信息就等于最终门控循环单元输出的内容。
门控循环单元不会随时间而清除以前的信息,它会保留相关的信息并传递到下一个单元,因此它利用全部信息而避免了梯度消失问题。
在步骤3中,将步骤2输出的高阶特征输入到梯度提升决策树回归模型(GBDT)中进行短时交通流预测,过程如下:
其中,L为损失函数,yi为交通流量标签,c为使损失函数极小化的常数值,m为训练样本数;
当迭代次数n=1,2,...,N(其中N为最大迭代次数)有:
1.对于样本i=1,2,...,m,计算负梯度
利用(hi,rnj)拟合一颗CART回归树,得到第n棵回归树,其对应的叶子节点区域为Rnj,j=1,2,...,J,其中J为第n棵回归树的叶子节点的个数;
2.对于叶子节点区域j=1,2,...,J,计算最佳拟合值
更新强学习器
其中:
得到强学习器f(h)
式中fN(h)为达到最大迭代次数N时更新的强学习器,f(h)即最终的短时交通流预测结果。
参考图3,在本发明的另一个实施例中,门限循环神经网络(GRU)的训练使用AdaMax优化算法,AdaMax是Adam的一种变体,它是随机梯度下降的扩展式。此方法对学习率的上限提供了一个更简单的范围,训练方法如下:
令,其中Wt为t时刻的门限循环神经网络权重,Wt-1为t-1时刻门限循环神经网络的权重,α为学习率,ε为非常小的数,以防止在实现中除以零,bt为t时刻的门限循环神经网络偏置,bt-1为t-1时刻门限循环神经网络的偏置,vt指的是梯度的指数移动均值在时间t的更新,为mt的纠正;
mt=β1·mt-1+(1-β1)·gt
mt是梯度的指数移动均值,通过梯度的一阶矩求得,gt为目标函数的t时刻一阶偏导,gt-1为目标函数的t-1时刻的一阶偏导,i为迭代时间,β1,β2是常数,控制指数衰减,表示β1的t次方,表示β2的p次方,|gt|p为gt绝对值的p次方;
令p→∞并定义
vt=limp→∞(vt)1/p
然后将计算出来的vt,带入Wt,bt公式中对权重和偏置进行更新,利用上述描述的AdaMax优化算法更新网络权重w和偏置b,直到模型收敛,最终模型训练完成后提取出GRU隐层最后一层的特征h作为交通流的高阶特征,h={(h1,y1),(h2,y2),...,(hm,ym)}。
利用上述方法,本发明使用深圳交警提供的数据,数据量约为60GB,包括20天的交通数据和天气信息,处理好的交通流数据为:{(x1,y1),(x2,y2),...,(xm,ym)},其中xi表示i时间片的交通流流量特征,ym表示其对应的交通流量预测标签,m表示样本个数,通过GRU提取出交通流数据的本质特征{(h1,y1),(h2,y2),...,(hm,ym)},其中hi为GRU隐藏层最后一层提取出来的特征,之后将其输入到GBDT回归算法中进行预测。我们使用平均绝对误差(MeanAbsolute Deviation,MAE)和均方根误差(Root Mean Squard Error,RMSE)作为评价指标。公式如下所示:
下表给出传统GRU预测结果和GRU-GBDT的预测结果。
表1不同模型的预测结果
从上表可以看出GRU-GBDT预测出来的MAE值和RMSE值都比GRU中sigmoid预测层预测出来的值要小很多,预测效果更好。
Claims (4)
1.一种基于深度学习的短时交通流预测方法,其特征在于,首先对交通流数据进行预处理,然后将预处理的数据输入到门限循环神经网络(GRU)中进行训练,提取得到交通流数据的高阶特征,最后将所述高阶特征输入到梯度提升决策树回归模型(GBDT)中进行短时交通流预测;其中,所述交通流数据包括天气数据和交通路口过车数据,以车辆速度特征、前一时刻的交通流量特征、节假日时间特征和天气特征作为交通流特征,所述交通路口过车数据包括车辆速度、车辆id、监测点id和车辆行驶时间,所述预处理方法是:假设一个城市某个区域有n个路口,路口集合R={r1,r2,...,ri,...,rn},将一天的24个小时划分为288个5分钟长的时间片t1,t2,...,tj,...,t288,第i个路口ri在第j个时间片tj的交通流量为numij;所述车辆速度特征是路口每5分钟的车辆速度平均值;所述前一时刻的交通流量特征是按照时间序列排列的某一时刻前4个时间片的交通流量,所述天气特征包括天气状况和风力两个因素,所述天气状况划分为3类,分别为晴或者多云,雨,雾,用W1,W2,W3表示,所述风力划分为4个级别,分别为微风,大风,暴风,台风,用A1,A2,A3,A4表示;所述节假日时间特征中,将工作日记为W,将节假日记为H,工作日里的工作时间记为WWT,工作日里的上下班高峰时间记为WGT,工作日的早高峰前和晚高峰后时间记为WQT,其余时间记为WDT;节假日的日间时间记为HFT,其余时间记为HRT;所述将预处理的数据输入到门限循环神经网络(GRU)中进行训练的过程是:
1)将交通流数据集输入到门限循环神经网络(GRU)中;
2)计算各层的更新门、重置门、当前记忆内容和最终记忆内容的值;
3)使用AdaMax优化算法训练网络模型;
4)将训练好的门限循环神经网络(GRU)模型的输出层改为梯度提升决策树回归算法,将训练好的门限循环神经网络(GRU)模型中隐含层最后一层的特征提取出来输入到梯度提升决策树回归算法对短时交通流进行预测。
2.根据权利要求1所述基于深度学习的短时交通流预测方法,其特征在于,所述2)中,在时间片t,更新门zt=σ(wz·[ht-1,xt]),其中σ为Sigmoid激活函数,xt为输入的交通流特征向量,ht-1保存的是前一个时间片t-1的信息,xt和ht-1均经过一个与权重矩阵wz相乘的线性变换,之后相加投入Sigmoid激活函数以输出激活值;
重置门rt=σ(wr·[ht-1,xt]),xt和ht-1均经过一个与权重矩阵wr相乘的线性变换,之后相加投入Sigmoid激活函数以输出激活值;
当前记忆内容其中tanh为双曲正切激活函数,为当前记忆内容的权重,ht-1为前一时间片隐藏层的值,xt为输入的交通流特征向量,为当前记忆内容的偏置,输入xt先与ht-1经过一个与权重矩阵相乘的线性变换,计算重置门rt与ht-1的乘积,即rt与ht-1的对应元素乘积,然后再投入tanh;
3.根据权利要求1所述基于深度学习的短时交通流预测方法,其特征在于,所述2)中,所述使用AdaMax优化算法训练网络模型的方法如下:
AdaMax是Adam的一种变体,它是随机梯度下降的扩展式,此方法对学习率的上限提供了一个更简单的范围;令,其中Wt为t时刻的门限循环神经网络权重,Wt-1为t-1时刻门限循环神经网络的权重,α为学习率,ε为非常小的数,以防止在实现中除以零,bt为t时刻的门限循环神经网络偏置,bt-1为t-1时刻门限循环神经网络的偏置,vt指的是指数移动均值在时间t的更新,为mt的纠正;
mt=β1·mt-1+(1-β1)·gt
mt是梯度的指数移动均值,通过梯度的一阶矩求得,gt为目标函数的t时刻一阶偏导,gt-1为目标函数的t-1时刻的一阶偏导,i为迭代时间,β1,β2是常数,控制指数衰减,表示β1的t次方,表示β2的p次方,|gt|p为gt绝对值的p次方;
令p→∞并定义
vt=limp→∞(vt)1/p
4.根据权利要求1所述基于深度学习的短时交通流预测方法,其特征在于,所述将高阶特征输入到梯度提升决策树回归模型(GBDT)中进行短时交通流预测的过程如下:
其中,L为损失函数,yi为第i个交通流量标签,c为使损失函数极小化的常数值,m为训练样本数;
当迭代次数n=1,2,…,N,N是最大迭代次数:
(1)、对于样本i=1,2,…,m,计算负梯度
利用(hi,rnj)拟合一颗CART回归树,得到第n棵回归树,其对应的叶子节点区域为Rnj,j=1,2,…,J,其中J为第n棵回归树的叶子节点的个数;
(2)、对于叶子节点区域j=1,2,…,J,计算最佳拟合值
更新强学习器
其中:
得到强学习器f(h)
式中fN(h)为达到最大迭代次数N时更新的强学习器,f(h)即最终的短时交通流预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910667478.2A CN110322695B (zh) | 2019-07-23 | 2019-07-23 | 一种基于深度学习的短时交通流预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910667478.2A CN110322695B (zh) | 2019-07-23 | 2019-07-23 | 一种基于深度学习的短时交通流预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110322695A CN110322695A (zh) | 2019-10-11 |
CN110322695B true CN110322695B (zh) | 2020-10-09 |
Family
ID=68124207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910667478.2A Active CN110322695B (zh) | 2019-07-23 | 2019-07-23 | 一种基于深度学习的短时交通流预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110322695B (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827544B (zh) * | 2019-11-11 | 2022-09-02 | 重庆邮电大学 | 一种基于图卷积循环神经网络的短时交通流控制方法 |
CN110827543B (zh) * | 2019-11-11 | 2022-02-18 | 重庆邮电大学 | 一种基于深度学习和时空数据融合的短时交通流控制方法 |
CN110837888A (zh) * | 2019-11-13 | 2020-02-25 | 大连理工大学 | 一种基于双向循环神经网络的交通缺失数据补全方法 |
CN111027673B (zh) * | 2019-11-14 | 2023-05-26 | 中山大学 | 一种地铁客流量预测方法 |
CN110889546B (zh) * | 2019-11-20 | 2020-08-18 | 浙江省交通规划设计研究院有限公司 | 一种基于注意力机制的交通流量模型训练方法 |
CN110827546B (zh) * | 2019-11-21 | 2021-02-26 | 银江股份有限公司 | 一种信号交叉口路段短期速度预测方法 |
CN110879921B (zh) * | 2019-11-25 | 2023-05-05 | 大连大学 | 一种基于时空相关性的卫星网络流量预测方法 |
CN111179596B (zh) * | 2020-01-06 | 2021-09-21 | 南京邮电大学 | 基于组归一化和网格化协同的交通流预测方法 |
CN111768622A (zh) * | 2020-06-23 | 2020-10-13 | 南通大学 | 一种基于改进灰狼算法的短时交通量预测方法 |
CN111724596B (zh) * | 2020-06-23 | 2022-11-11 | 上海电科智能系统股份有限公司 | 一种智能精确自动识别预判快速路瓶颈区方法 |
CN111860989B (zh) * | 2020-07-08 | 2024-04-19 | 南通大学 | 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法 |
CN111784084B (zh) * | 2020-08-17 | 2021-12-28 | 北京市城市规划设计研究院 | 基于梯度提升决策树的出行生成预测方法、系统及装置 |
CN111950805B (zh) * | 2020-08-25 | 2022-09-20 | 华润数字科技有限公司 | 中长期电力负荷预测方法、装置、计算机设备及存储介质 |
CN112801386A (zh) * | 2021-02-04 | 2021-05-14 | 北京工业大学 | 一种基于三阶段模型的短时交通流预测方法 |
CN112992353A (zh) * | 2021-03-11 | 2021-06-18 | 杭州和乐科技有限公司 | 预产期精准预测方法、装置、计算机设备及存储介质 |
CN113096388B (zh) * | 2021-03-22 | 2022-09-09 | 北京工业大学 | 一种基于梯度提升决策树的短时交通流量预测方法 |
CN113921142A (zh) * | 2021-09-07 | 2022-01-11 | 杭州和乐科技有限公司 | 早产风险预测方法、装置、计算机设备及存储介质 |
CN113888862A (zh) * | 2021-09-15 | 2022-01-04 | 成都四方伟业软件股份有限公司 | 一种单个路口的车流量预测方法及装置 |
CN113971479A (zh) * | 2021-10-01 | 2022-01-25 | 浙江省机电设计研究院有限公司 | 一种融合节假日影响的日交通流参数预测方法 |
CN116050672B (zh) * | 2023-03-31 | 2023-06-20 | 山东银河建筑科技有限公司 | 基于人工智能的城市管理方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10636293B2 (en) * | 2017-06-07 | 2020-04-28 | International Business Machines Corporation | Uncertainty modeling in traffic demand prediction |
CN109272157A (zh) * | 2018-09-12 | 2019-01-25 | 中交信息技术国家工程实验室有限公司 | 一种基于门控神经网络的高速公路交通流参数预测方法及系统 |
CN109658695B (zh) * | 2019-01-02 | 2020-09-22 | 华南理工大学 | 一种多因素的短时交通流预测方法 |
CN109886387B (zh) * | 2019-01-07 | 2021-02-26 | 北京大学 | 一种基于门控网络和梯度提升回归的交通时序预测方法 |
CN109993970B (zh) * | 2019-03-15 | 2020-09-29 | 西南交通大学 | 一种城市区域交通事故风险预测方法 |
-
2019
- 2019-07-23 CN CN201910667478.2A patent/CN110322695B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110322695A (zh) | 2019-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110322695B (zh) | 一种基于深度学习的短时交通流预测方法 | |
CN106997669B (zh) | 一种基于特征重要性的判断交通拥堵成因的方法 | |
CN109859469A (zh) | 一种基于集成lstm神经网络的车流量预测方法 | |
CN109785618B (zh) | 一种基于组合逻辑的短时交通流预测方法 | |
CN111860989B (zh) | 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法 | |
CN106205156A (zh) | 一种针对部分车道车流突变的交叉口自愈合控制方法 | |
CN110555989B (zh) | 一种基于Xgboost算法的交通量预测方法 | |
CN111915059A (zh) | 基于注意力机制的Seq2seq泊位占有率预测方法 | |
Fu et al. | Multi-stations’ weather prediction based on hybrid model using 1D CNN and Bi-LSTM | |
CN109345832B (zh) | 一种基于深度递归神经网络的城市道路超车预测方法 | |
CN114565187B (zh) | 一种基于图时空自编码网络的交通路网数据预测方法 | |
CN106355905A (zh) | 一种基于卡口数据的高架信号控制方法 | |
CN111768622A (zh) | 一种基于改进灰狼算法的短时交通量预测方法 | |
Mi et al. | A dynamic ensemble deep deterministic policy gradient recursive network for spatiotemporal traffic speed forecasting in an urban road network | |
Alam et al. | Intellegent traffic light control system for isolated intersection using fuzzy logic | |
CN117238126A (zh) | 一种连续流道路场景下的交通事故风险评估方法 | |
CN114973665A (zh) | 一种结合数据分解和深度学习的短时交通流预测方法 | |
Zhang et al. | Short-term Traffic Flow Prediction With Residual Graph Attention Network. | |
CN114037122A (zh) | 基于大数据挖掘处理分析的航班延误预测方法 | |
CN117275238A (zh) | 一种动态图结构注意力机制短时交通流预测方法 | |
CN112201036A (zh) | 一种基于Inception-CNN的城市快速路行程速度短时预测方法 | |
Wang et al. | A deep prediction model of traffic flow considering precipitation impact | |
Peng et al. | Short-term traffic flow prediction based on weather factors analysis and neural network | |
Jiao et al. | Multi-step traffic flow prediction method based on the Conv1D+ LSTM | |
CN115796030A (zh) | 一种基于图卷积的交通流量预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |