CN103871246B - 基于路网空间关系约束Lasso的短时交通流预测方法 - Google Patents

基于路网空间关系约束Lasso的短时交通流预测方法 Download PDF

Info

Publication number
CN103871246B
CN103871246B CN201410046250.9A CN201410046250A CN103871246B CN 103871246 B CN103871246 B CN 103871246B CN 201410046250 A CN201410046250 A CN 201410046250A CN 103871246 B CN103871246 B CN 103871246B
Authority
CN
China
Prior art keywords
road network
beta
traffic flow
lasso
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410046250.9A
Other languages
English (en)
Other versions
CN103871246A (zh
Inventor
蒋士正
阮雅端
许榕
吴聪
陈湘军
廖娟
陈启美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201410046250.9A priority Critical patent/CN103871246B/zh
Publication of CN103871246A publication Critical patent/CN103871246A/zh
Application granted granted Critical
Publication of CN103871246B publication Critical patent/CN103871246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Traffic Control Systems (AREA)

Abstract

基于路网空间关系约束Lasso的短时交通流预测方法,通过最小绝对收缩和选择算子Lasso实现路网约束,对路网短时交通流进行预测,分为路网分析、模型训练和实时预测三个部分。本发明提出了基于路网空间关系约束Lasso的短时交通流预测方法,结合高速公路实测交通流数据,利用Lasso算法对短时交通流进行预测,给出路网相关性分析和变量选择方法,能比较准确和快速地预测高速公路短时交通流。

Description

基于路网空间关系约束Lasso的短时交通流预测方法
技术领域
本发明属于机器学习、数据挖掘领域,主要用于高速公路交通管理系统中,具体为一种基于路网空间关系约束Lasso的短时交通流预测方法。
背景技术
近年来,交通系统在全球范围内面临了前所未有的挑战。随着经济的发展,交通需求迅速增加,交通拥挤现象屡见不鲜,并且日趋严峻,车辆缓行、拥堵时间增长,交通网络变得十分脆弱。同时,因延误带来的旅行时间增加导致经济损耗和环境污染增大,美国全国每年因交通堵车造成的经济方面的损失高达631亿美元,我国百万人口以上的大城市由于交通堵塞给社会所造成的直接经济损失约合人民币1000亿元,并逐年上升。北京也陷入了“拥有最宽阔的马路,也拥有最宽阔的‘停车场’”的困境,严重影响了城市的运转效率,阻碍了社会、经济的快速发展。
在我国改革开放的三十多年间,城市机动车保有量的增长速度是道路增长速度的80倍,近几年更是迅速增加。交通供需矛盾的长期性和城市空间、建设资金的有限性决定了不是仅仅通过增加交通基础设施就能解决这个难题。
多年来,世界各国的城市交通专家提出各种不同的方法,试图通过先进的交通管理系统(AdvancedTrafficManageSystem,ATMS)、先进的交通信息系统(AdvancedTrafficInformationSystem,ATIS)、动态路径引导系统(DynamicRouteGuideSystem,DRGS)等各种先进的智能交通手段来为出行者提供实时有效的道路信息,实现动态路径诱导,达到节约出行者旅行时间,环节道路拥挤,减少污染、节省能源等目的[1]。智能交通系统中的各个应用系统都依赖于对交通流等信息资源的分析和处理,交通流预测是交通信息处理方法中最直接和有效的一种。如何利用智能交通系统所采集的交通流信息进行实时、高效的交通流预测,支持交通管理人员对将来交通状况的准确把握,制定有效的策略实现对当前交通状况的动态控制和交通诱导,从而达到交通状况优化的目的,成为交通领域研究人员面临的关键课题[2]
ITS综合使用了先进的信息技术、通讯传输技术、电子控制技术和计算机处理技术等技术,有效地对交通信息进行采集、加工、处理,能够实时、精确地反映当前及未来的交通状态,最终实现对交通进行科学的组织和控制。
最近的交通运输研究成果表明:交通流预测在各种交通控制系统中有相当重要的作用。主要体现在(1)在城市集成交通控制系统中的信号控制子系统和动态导引子系统的前提是准确的交通参数的预测。(2)递阶分层控制(分层递阶是人们分析和组织复杂系统的一种常用方法)中的战略控制层和决策层也要各种交通参数。(3)智能交通系统中的营运车辆调度管理系统,先进的驾驶员信息系统,先进的交通管理系统等子系统以及自动高速公路系统的网络层和连接层对流量等集总参数进行控制也需要对数据进行预测[3]
短期交通流预测服务于变化较快的交通控制和诱导,预测周期明显缩短,交通流的变化规律愈加模糊,受到干扰的影响也更加强烈,短时交通流的不确定性越来越明显,预测难度增加。同时,在系统无法直接测量未来路况及流量分布的情况下,实时准确的短期交通流预测无法避免地成为ITS实现高效管理的基础和前提,并且预测结果的好坏优劣直接影响这交通控制与诱导的效果。因此,交通流信息的实时性和可靠性直接关系到交通控制与管理的效果,实现对道路交通流的实时掌握和准确预测就成为运用智能交通技术解决交通问题的一个重要基础,因此研究实时动态的交通流预测模型对社会经济和道路交通事业的发展都有着非常重要的研究价值和意义。
参考文献:
[1]王进,史其信.短时交通流预测模型综述[J].中国公共安全·学术卷,2005,1(6):94-95.
[2]刘智勇.智能交通控制理论及其应用[M].北京:科学出版社,2003.
[3]杨兆升.城市交通流诱导系统.北京:中国铁道出版社,2004.
[4]CHUNGFRK.Spectralgraphtheory[J].Vol.92ofCBMSReginalConferencesSeries.AmericanMathematicalSociety,Providence,1997.
[5]TibshiraniR.Regressionshrinkageandselectionviathelasso[J].JournaloftheRoyalStatisticalSociety.SeriesB(Methodological),1996:267-288.
[6]EfronB,HastieT,JohnstoneI,etal.Leastangleregression[J].TheAnnalsofstatistics,2004,32(2):407-499.
[7]ZouH,HastieT,TibshiraniR.Sparseprincipalcomponentanalysis[J].Journalofcomputationalandgraphicalstatistics,2006,15(2):265-286.
[8]TrendafilovNT,JolliffeIT.DALASS:VariableselectionindiscriminantanalysisviatheLASSO[J].Computationalstatistics&dataanalysis,2007,51(8):3718-3736.
[9]KamarianakisY,ShenW,WynterL.Real‐timeroadtrafficforecastingusingregime‐switchingspace‐timemodelsandadaptiveLASSO[J].AppliedStochasticModelsinBusinessandIndustry,2012,28(4):297-315.
[10]SunS,HuangR,GaoY.Network-ScaleTrafficModelingandForecastingwithGraphicalLassoandNeuralNetworks[J].JournalofTransportationEngineering,2012,138(11):1358-1367.
[11]LiC,LiH.Network-constrainedregularizationandvariableselectionforanalysisofgenomicdata[J].Bioinformatics,2008,24(9):1175-1182.
发明内容
本发明要解决的问题是:通过对传统道路单断面交通流预测模型的学习和分析可知,单断面交通流预测时,并没有充分利用路网中其他断面所提供的交通流信息。而实际上,交通路网是一个网状结构,各断面是相互联系相互作用的,使得道路网中多个断面的交通流数据还具有相关性、周期性和延迟性等特征。比如某一时刻,一条道路上交通流量过大,则下一时刻与其相连的几条道路的交通流量也都会有所增大,因为交通网络系统是一个各链路之间有流量传输的完整系统。各断面的交通流数据与相互之间的距离、在路网中所处的位置以及路网的拓扑结构等因素存在着相互联系。
本发明的技术方案为:基于路网空间关系约束Lasso的短时交通流预测方法,通过最小绝对收缩和选择算子Lasso实现路网约束,对路网短时交通流进行预测,包括以下步骤:
1)对路网相关性进行分析:在图论中,拉普拉斯矩阵是图的一种矩阵表示,通过对路网之间数据采集点的分布,得到路网的拉普拉斯矩阵,并对其进行归一化处理,得到路网空间关系归一化约束矩阵L;
2)建立预测模型:从路网中所有检测断面的历史交通流数据中选取特征值以及其对应的未来时刻值所述特征值为流量、车速或占有率其中之一,结合路网空间关系归一化约束矩阵L,采用Lasso进行预测,通过对各检测断面最小化Lasso的误差函数J(λ12,β),获得最优估计即获得每个检测断面的下个时刻交通流与路网上所有检测断面的之前时刻数据之间的关系,所述最小化采用最小角回归方法LAR,不同检测断面的最优估计也相应不同,由所有检测断面的最优估计构成预测模型;
3)对短时交通流进行实时预测:从路网上所有检测断面实时的交通流数据中获取实时特征值通过预测模型,预测所有检测断面未来时刻的交通流数据X(t+mT),实现对路网短时交通流的预测。
步骤1)具体为:
将路网通过有权重的图G来表示,G=(V,E,W),V代表数据采集点的集合,即需要预测的各检测断面,E={u~v}表示边集,即数据采集点u和v是连接的,并存在有权重的边,W为边的权重的集合,其中w(u,v)表示边e=(u~v)的权重,边的权重表示不同数据采集点之间连接的不确定性,数据采集点为图的顶点,顶点v的度dv=∑u~vw(u,v),即所有包含点v的边的权重的和,根据所述有权重的图得到一个拉普拉斯矩阵,归一化后得到得到路网空间关系归一化约束矩阵L,矩阵L中元素(u,v)如式(5)所示:
步骤2)中采用Lasso建立预测模型,通过对各检测断面最小化Lasso的误差函数J(λ12,β),获得最优估计具体为:
时刻p个检测断面的历史交通流数据作为Lasso输入的设计矩阵,j=1,…,p,表示第j个检测断面之间的交通流数据,包含n个交通数据流的观测值,再取时刻p个检测断面的历史交通流数据作为Lasso输入的响应矩阵,j=1,…,p,表示第j个检测断面之间的交通流数据,包含n个交通数据流的观测值,从而通过最小化Lasso的误差函数J(λ12,β),获得最优估计
对于任意非负数λ1和λ2,根据Lasso定义路网空间关系约束的惩罚函数如式(6)所示:
J(λ12,β)=(y-Xβ)T(y-Xβ)+λ11|+λ2βTLβ(6)
式中,是l1范数,βTLβ引入一个β在网络上的平滑项,因为拉普拉斯矩阵L是半正定的,写为L=Sp*mSp*m T,其中Sp*m的行向量表示每个顶点和其他点的关系,每一列对应顶点的边,边e={u,v}对应列的第u行项为对应第v行项为其他为0,则βTLβ变换为如(7)所示:
β T Lβ = Σ u ~ v ( β u d u - β v d v ) 2 w ( u , v ) - - - ( 7 )
式中代表所有近邻无序对{u,v}的总和,则式(6)变换为如(8)所示:
J ( λ 1 , λ 2 , β ) = ( y - Xβ ) T ( y - Xβ ) + λ 1 | β | 1 + λ 2 Σ u ~ v ( β u d u - β v d v ) 2 w ( u , v ) - - - ( 8 )
则路网空间关系约束下的最优估计即最小化式(8),如式(9)所示:
β ^ = arg min β ( J ( λ 1 , λ 2 , β ) ) - - - ( 9 )
令α=λ1/(λ12),则式(9)中的相当于最优式(10)的解,即如式(10)和(11)所示:
β ^ = arg min β { | y - Xβ | 2 } - - - ( 10 )
( 1 - α ) Σ j = 1 p | β j | + α Σ u ~ v { ( β u / d u - β v / d v ) 2 w ( u , v ) } ≤ c - - - ( 11 )
式中为路网空间关系约束惩罚项,c为进行LAR求解Lasso时设定的参数。
作为优选方式,对预测模型的最优估计,设置时间间隔重新计算进行更新。
进一步的,步骤3)中,各检测断面预测并行进行。
本发明提出了基于路网空间关系约束Lasso的短时交通流预测方法,结合高速公路实测交通流数据,利用Lasso算法对短时交通流进行预测,给出路网相关性分析和变量选择方法,能比较准确和快速地预测高速公路短时交通流。
附图说明
图1为本发明基于路网约束Lasso的预测方法流程。
图2为本发明实施例的路网结构与数据检测点。
图3为本发明实施例中预测值x8(t+3T)和输入值X(t)相关性。
图4为本发明实施例中预测值x78(t+3T)和输入值X(t)相关性。
图5为本发明实施例中预测值x17(t+3T)和输入值X(t)相关性。
具体实施方式
为使发明的目的、特征更明显易懂,下面结合附图与具体实施方式对本技术方案作进一步说明。基于路网空间关系约束Lasso的短时交通流预测方法流程如图1所示,分为路网分析、模型训练和实时预测三个部分。
1、对路网相关性进行分析。路网中断面交通流之间的联系受到各种因素的影响,从定性分析的角度来看,当两个道路断面是上下游关系而且距离比较近时,相关性比较强,随着距离的增大或受其他交通流的交汇等因素影响时,相关性会相对减弱。通过对路网之间数据采集点的分布,可以得到路网的拉普拉斯矩阵,并对其进行归一化处理。
路网中断面交通流之间的联系受到各种因素的影响,从定性分析的角度来看,当两个道路断面是上下游关系而且距离比较近时,相关性比较强,随着距离的增大或受其他交通流的交汇等因素影响时,相关性会相对减弱。在进行道路网短时交通流预测时,尤其是对较大规模的道路网,如果把所有断面的交通流数据都当成一个整体进行预测,而不事先考虑其相关性,则计算复杂性比较高,可能满足不了短时交通流预测的实时性的要求。
在图论中,拉普拉斯矩阵(LaplacianMatrix),也称为导纳矩阵(AdmittanceMatrix)或基尔霍夫矩阵(KirchohoffMatrix),是图的一种矩阵表示。
举例来说,设G=(E,V)为一个包含p个顶点的简单图,其拉普拉斯矩阵定义[4]如(1)所示。
L=D-A(1)
式中,D为图G的度矩阵,A为图G的邻接矩阵。度矩阵在有向图中,出度和入度都要计算。拉普拉斯矩阵L:=(li,j)p*p经过计算如(2)所示。
deg(vi)为顶点vi的度。
归一化的拉普拉斯矩阵定义为如(3)所示。
对于图G和其拉普拉斯矩阵L,且矩阵的特征值定义为λ0≤λ1≤…≤λn-1,其性质如下:L是半正定的,λ0=0;拉普拉斯矩阵的特征值中0的数目是图的连通分量的个数;其中λ0=0,因为每一个拉普拉斯矩阵有一个特征向量[1,1,…,1],对每一行,加上相应的结点度到-1的邻结点,由矩阵定义从而得到特征值0;其中λ1也被称为代数连通度(AlgebraicConnectivity);最小的非0特征值称作谱间隔(SpectralGap)或费德勒值(FiedlerValue)。
2、对预测模型进行训练。从所有检测断面历史的交通流数据中选取特征和未来时刻值T为选取交通数据流的采样周期,m表示采样数,结合路网空间关系约束矩阵L,对各断面最小化误差函数J(λ12,β),即可获得最优估计即获得每个断面下个时刻交通流与路网上所有断面历史数据的关系。需指出,不同断面的参数也相应不同。
1)基于Lasso的变量选择
路网短时交通流预测指以路网上获取的多个断面交通流数据为研究对象,数据形式是多组时间序列。在模型建立之初,为了尽量减小因缺少重要自变量而出现的模型偏差,通常会选择尽可能多的自变量。但实际建模过程中通常需要寻找对响应变量最具有解释性的自变量子集,即变量选择(或称特征选择),以提高模型的解释性和预测精度。所以变量选择建模过程中是极其重要的问题,在交通流预测时可对相关输入进行筛选和提取,使得对未来时刻交通流量进行预测时所给予的输入信息更为准确和有效。
最小绝对收缩和选择算子(Leastabsoluteshrinkageandselectionoperator,Lasso)方法[5]是一种压缩估计。它通过构造一个罚函数得到一个较为精炼的模型,使得它压缩一些系数,同时设定一些系数为零。因此保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。将Lasso应用于回归,可以在参数估计的同时实现变量的选择,较好的解决回归分析中的多重共线性问题,并且能够很好的解释结果。
Lasso的基本思想是在回归系数的绝对值之和小于一个常数的约束条件下,使残差平方和最小化,从而能够产生某些严格等于0的回归系数,得到可以解释的模型。选择标准使罚函数最小,如式(4)所示。
β ^ = arg min β { 1 p Σ i = 1 p ( y i - x i β i ) 2 + Σ j = 1 p λ | β j | } - - - ( 4 )
可利用AIC(AkaikeInformationCriterion)准则和BIC(BayesianInformationCriterion)准则给统计模型的变量做一个截断,进而达到降维目的。
与传统的变量选择方法相比,Lasso方法很好的克服了传统方法在选择变量上的不足,因此该方法在统计领域受到了极大的重视。文献[6]提出的最小角回归(LeastAngleRegression)算法很好地解决Lasso的计算问题。该方法的计算复杂度与最小二乘回归的相当,有效算法的提出使Lasso方法广为流行。
模型选择本质上是寻求模型稀疏表达的过程,而这种过程可以通过优化一个“损失”加“惩罚”的函数问题来完成。将Lasso应用于回归,可以在参数估计的同时实现变量的选择,较好的解决回归分析中的多重共线性问题,并且能够很好的解释结果。Lasso及其相关方法在多元分析领域也得到了广泛的运用[7][8]
目前采用Lasso及其相关方法进行交通流预测的相关研究较少。文献[9]通过Lasso进行变量选择和参数估计,加入近邻对交通流的影响,实现短时交通流预测,但并没有考虑路网的拓扑结构对交通流预测的影响。文献[10]通过GraphicalLasso对输入变量选择,然后采用神经网络模型对多链路多任务交通流进行预测,较为复杂。
2)路网约束的Lasso方法改进
本发明将路网通过有权重的图来表示,G=(E,V,W),V代表数据采集点,即需要预测的各断面,E={u~v}为边集,代表数据采集点u和v是连接的,并存在有权重的边,W为边的权重,其中w(u,v)表示点u和v的边e=(u~v)的权重,在应用中,边的权重表示不同采集点之间连接不确定性。本部分的推导类似于文献[4],顶点v的度dv=∑u~vw(u,v),表示所有包含点v的边的权重之和。如上所述,归一化的拉普拉斯矩阵L中的(u,v)元素如式(5)所示。
拉普拉斯矩阵L是半正定的,其特征值的反应了图的很多特性。对于某一检测断面,设其未来时刻值包含当前断面的n个观察值,特征值包含p个预报器,p为路网检测断面总数,也就是p个数据采集点,则u=1,…p,v=1,…p。在建立预测模型时,利用历史数据进行训练,作为设计矩阵,作为响应矩阵,构建预测模型。具体为:取时刻p个检测断面的历史交通流数据作为Lasso输入的设计矩阵,表示第j个检测断面之间的交通流数据,包含n个交通数据流的观测值,再取时刻p个检测断面的历史交通流数据作为Lasso输入的响应矩阵,表示第j个检测断面之间的交通流数据,包含n个交通数据流的观测值,从而通过最小化Lasso的误差函数J(λ12,β),获得最优估计将表示路网空间关系的拉普拉斯矩阵L也作为惩罚项加入式(4),对于任意非负数λ1和λ2,定义路网空间关系约束的惩罚函数如式(6)所示[11]
J(λ12,β)=(y-Xβ)T(y-Xβ)+λ1|β|12βTLβ(6)
式中,是l1范数,引入稀疏项[4],l1范数表示||x||为x向量各个元素绝对值之和,第二项βTLβ引入一个β在网络上的平滑项。因为L是半正定的,可被写为L=Sp*mSp*m T,其中Sp*m的行向量表示每个顶点和其他点的关系,每一列对应边,边e={u,v}对应列的第u行项为对应第v行项为其他为0,则βTLβ可变换为如(7)所示。
β T Lβ = Σ u ~ v ( β u d u - β v d v ) 2 w ( u , v ) - - - ( 7 )
式中∑u~v代表所有近邻对{u,v}的总和,β=(β1,…,βp),βu、βv是指的β中第u个和第v个值,则式(6)可以变换为如(8)所示。
J ( λ 1 , λ 2 , β ) = ( y - Xβ ) T ( y - Xβ ) + λ 1 | β | 1 + λ 2 Σ u ~ v ( β u d u - β v d v ) 2 w ( u , v ) - - - ( 8 )
则路网空间关系约束下的最优估计即最小化式(8),如式(9)所示。
β ^ = arg min β ( J ( λ 1 , λ 2 , β ) ) - - - ( 9 )
令α=λ1/(λ12),则式(9)中的相当于最优式(10)的解,即如式(10)和(11)所示。
β ^ = arg min β { | y - Xβ | 2 } - - - ( 10 )
( 1 - α ) Σ j = 1 p | β j | + α Σ u ~ v { ( β u / d u - β v / d v ) 2 w ( u , v ) } ≤ c - - - ( 11 )
式中为路网空间关系约束惩罚项,c为进行LAR求解Lasso时设定的参数。
图1所示的预测流程中,可选择不同的观测值总数n,从而选取不同的历史数据进行训练和预测,设置不同的值m,可预测未来m周期时刻后的交通流数据。
因模型参数训练一般都计算量较大,计算时间较长,如果每次预测时都进行训练,不利于在实时系统中的应用。上述预测方法中,将模型参数训练与实时预测分为两个部分,模型参数的更新可设置一定时间间隔,比如每天或者每周更新一次,并不需要每次预测时都进行训练,可兼顾实时性和准确率。
3、方法实现与测试结果分析
1)路网数据源描述
数据来源于美国加州公路局的PeMS系统,选取地点为美国加州洛杉矶市周围的高速公路,共包含78个数据检测器,包含靠近交叉口和不靠近交叉口的断面,对应位置如图2。
时间从2013年3月4日至2013年3月17日(共两周),实时采集的30s时间间隔的环形线圈检测数据经过PeMS系统整合得到的间隔为5分钟的连续数据,包含流量、车速、占有率等,每个采集点共4032条数据记录,包含车流高峰与空闲时刻,以及工作日与周末。
以下实验均采用路网上78个数据检测器5分钟周期的车均速数据,第一周数据进行训练(1990组数据),第二周数据进行预测(1990组数据)。采用平均绝对百分误差(MeanAbsolutePercentError,MAPE)来衡量预测的准确率,如(12)所示,这个指标数值越小,说明预测精度越高。
MAPE = 1 n Σ i = 1 n | y ^ i - y i y i | × 100 % - - - ( 12 )
其中n表示观测值总数,yi指交通流数据的实际值,指对交通流数据的预测值。
2)未来15分钟车速预测的实验对比
输入变量为X(t),采用路网约束Lasso方法和最小二乘法预测未来15分钟的车均速数据X(t+3T),即设置n=1和m=3,选取不靠近道路交叉口和靠近道路交叉口的15个断面进行对比,结果如表1和表2所示。
从表1和表2中可以看出,在实时预测中,路网约束Lasso方法预测MAPE均小于最小二乘法,最大差别为10%,平均低5.5%和3.2%。不靠近交叉口的断面,其车均速预测值与自身交通流变化的相关性较强,路网约束Lasso方法和最小二乘法的预测MAPE相对较低,为6.4%和9.6%;靠近交叉口的断面,其预测值受交叉口附近其他点交通流变化的影响也较大,路网约束Lasso方法获得较好效果,MAPE为9.1%,高于最小二乘法的14.6%。另外,最小二乘法所需变量数目均值为76,远大于路网约束Lasso方法所需变量数目均值22.9和16.3。
表1靠近交叉口断面15分钟预测值
表2不靠近交叉口断面15分钟预测值
3)未来5~60分钟车速预测的实验对比
输入变量为X(t),采用路网约束Lasso方法和最小二乘法预测未来5~60分钟的车均速数据X(t+mT),即设置n=1和m=1,2,3,4,6,12。路网上78个断面预测结果如表3所示。
表3路网78个断面未来5~60分钟车速预测
从表3可以看出,随着预测时间的变长,最小二乘法和路网约束Lasso方法的MAPE变大,路网约束Lasso方法均比最小二乘法低了1.4~4.6%。最小二乘法预测未来5~15分钟车均速值时平均准确率高于90%,路网约束Lasso方法预测未来5~30分钟车均速值时平均准确率高于90%。另外,随着预测时间的变长,路网约束Lasso方法所需变量数目迅速增加。
由于不靠近交叉口的断面预测准确率大于不靠近交叉口的断面,选取如表1中的15个靠近交叉口的断面,其未来5~60分钟的车均速预测数据MAPE均值如表4所示。
表4靠近交叉口断面未来5~60分钟车速预测
从表4可以看出,靠近交叉口的15个断面路网约束Lasso方法MAPE均值比路网78个断面MAPE均值高了1.4~8.6%。若使最小二乘法预测准确率高于90%,其预测时间不大于5分钟;若使路网约束Lasso方法预测准确率高于90%,其预测时间不大于15分钟。
根据表3和表4,路网约束Lasso方法预测路网上78个数据断面未来15分钟以内的车均速数值,正确率均高于90%,平均正确率为94.3%。
4)不同输入变量的预测实验对比
输入变量为X(t),X(t-T)和X(t-2T),采用路网约束Lasso方法和最小二乘法预测未来15分钟的车均速数据X(t+3T),即设置m=3和n=1,2,3。路网上78个断面预测结果如表5所示。选取如表1中的15个靠近交叉口的断面,其预测结果如表6。
表5路网78个断面不同输入变量车速预测
表6靠近交叉口断面不同输入变量车速预测
从表5和表6可以看出,增加输入变量X(t-T)和X(t-2T)对最小二乘法和路网约束Lasso方法预测准确度影响不大,即对于预测X(t+3T),X(t-T)和X(t-2T)的重要性远远小于X(t)。由于输入变量维数的增加,训练时间成倍增加,两种方法所需变量数目都大大增加。
综上所述,设置输入变量为X(t),采用路网约束Lasso方法预测未来15分钟的车均速数据X(t+3T),即设置n=1和m=3,准确率均高于90%,所需变量和训练时间较少。
5)实时输入和预测数据关系以及数据弥补
输入变量为X(t),采用路网约束Lasso方法预测未来15分钟的车均速数据X(t+3T),设置n=1和m=3。靠近交叉口的断面8#、78#和不靠近交叉口的17#,其预测值x(t+3T)与路网上78个断面输入量X(t)的关系如图3和图4所示。
由图3、图4和图5可以看出,路网中断面预测值xi(t+3T)和该检测断面实时值xi(t)相关性最大。其中,不靠近交叉口的断面,预测值与自身交通流变化的相关性较强;靠近交叉口的断面,预测值受交叉口附近其他点交通流变化的影响也较大。
在预测xi(t+3T)时,当作为某输入变量的xj(t)缺失时,可根据xj(t)与X(t-T)关系,用相应的X(t-T)来弥补,就是用X(t-T)先预测X(T)然后用其中相应的j点预测值来替换掉这里的xj(t)。

Claims (5)

1.基于路网空间关系约束Lasso的短时交通流预测方法,其特征是通过最小绝对收缩和选择算子Lasso实现路网约束,对路网短时交通流进行预测,包括以下步骤:
1)对路网相关性进行分析:在图论中,拉普拉斯矩阵是图的一种矩阵表示,通过对路网之间数据采集点的分布,得到路网的拉普拉斯矩阵,并对其进行归一化处理,得到路网空间关系归一化约束矩阵L;
2)建立预测模型:从路网中所有检测断面的历史交通流数据中选取特征值以及其对应的未来时刻值 表示时刻,所述特征值为流量、车速或占有率其中之一,结合路网空间关系归一化约束矩阵L,采用Lasso进行预测,通过对各检测断面最小化Lasso的误差函数J(λ12,β),获得最优估计即获得每个检测断面的下个时刻交通流与路网上所有检测断面的之前时刻数据之间的关系,其中λ1和λ2为任意非负数,β表示误差函数的估计值,所述最小化采用最小角回归方法LAR,不同检测断面的最优估计也相应不同,由所有检测断面的最优估计构成预测模型;
3)对短时交通流进行实时预测:从路网上所有检测断面实时的交通流数据中获取实时特征值通过预测模型,预测所有检测断面未来时刻的交通流数据X(t+mT),实现对路网短时交通流的预测。
2.根据权利要求1所述的基于路网空间关系约束Lasso的短时交通流预测方法,其特征是步骤1)具体为:
将路网通过有权重的图G来表示,G=(V,E,W),V代表数据采集点的集合,即需要预测的各检测断面,E={u~v}表示边集,即数据采集点u和v是连接的,并存在有权重的边,W为边的权重的集合,其中w(u,v)表示边e=(u~v)的权重,边的权重表示不同数据采集点之间连接的不确定性,数据采集点为图的顶点,顶点v的度dv=∑u~vw(u,v),即所有包含点v的边的权重的和,顶点u的度du为所有包含点u的边的权重的和,根据所述有权重的图得到一个拉普拉斯矩阵,归一化后得到路网空间关系归一化约束矩阵L,矩阵L中元素(u,v)如式(5)所示:
3.根据权利要求2所述的基于路网空间关系约束Lasso的短时交通流预测方法,其特征是步骤2)中采用Lasso建立预测模型,通过对各检测断面最小化Lasso的误差函数J(λ12,β),获得最优估计具体为:
时刻p个检测断面的历史交通流数据作为Lasso输入的设计矩阵,表示第j个检测断面之间的交通流数据,包含n个交通数据流的观测值,再取时刻p个检测断面的历史交通流数据作为Lasso输入的响应矩阵,表示第j个检测断面之间的交通流数据,包含n个交通数据流的观测值,从而通过最小化Lasso的误差函数J(λ12,β),获得最优估计
对于任意非负数λ1和λ2,根据Lasso定义路网空间关系约束的惩罚函数如式(6)所示:
J(λ12,β)=(y-Xβ)T(y-Xβ)+λ1|β|12βTLβ(6)
式中,是l1范数,βTLβ引入一个β在网络上的平滑项,因为拉普拉斯矩阵L是半正定的,写为其中的行向量表示每个顶点和其他点的关系,每一列对应顶点的边,边e={u,v}对应列的第u行项为对应第v行项为其他为0,则βTLβ变换为如(7)所示:
β T L β = Σ u ~ v ( β u d u - β v d v ) 2 w ( u , v ) - - - ( 7 )
式中代表所有近邻无序对{u,v}的总和,则式(6)变换为如(8)所示:
J ( λ 1 , λ 2 , β ) = ( y - X β ) T ( y - X β ) + λ 1 | β | 1 + λ 2 Σ u ~ v ( β u d u - β v d v ) 2 w ( u , v ) - - - ( 8 )
则路网空间关系约束下的最优估计即最小化式(7),如式(9)所示:
β ^ = arg min β ( J ( λ 1 , λ 2 , β ) ) - - - ( 9 )
令α=λ1/(λ12),则式(9)中的相当于最优式(10)的解,即如式(10)和(11)所示:
β ^ = arg min β { | y - X β | 2 } - - - ( 10 )
( 1 - α ) Σ j = 1 p | β j | + α Σ u ~ v { ( β u / d u - β v / d v ) 2 w ( u , v ) } ≤ c - - - ( 11 )
式中 ( 1 - α ) Σ j = 1 p | β j | + α Σ u ~ v { ( β u / d u - β v / d v ) 2 w ( u , v ) } 为路网空间关系约束惩罚项,c为进行LAR求解Lasso时设定的参数。
4.根据权利要求1-3任一项所述的基于路网空间关系约束Lasso的短时交通流预测方法,其特征是对预测模型的最优估计,设置时间间隔重新计算进行更新。
5.根据权利要求1所述的基于路网空间关系约束Lasso的短时交通流预测方法,其特征是步骤3)中,各检测断面预测并行进行。
CN201410046250.9A 2014-02-10 2014-02-10 基于路网空间关系约束Lasso的短时交通流预测方法 Active CN103871246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410046250.9A CN103871246B (zh) 2014-02-10 2014-02-10 基于路网空间关系约束Lasso的短时交通流预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410046250.9A CN103871246B (zh) 2014-02-10 2014-02-10 基于路网空间关系约束Lasso的短时交通流预测方法

Publications (2)

Publication Number Publication Date
CN103871246A CN103871246A (zh) 2014-06-18
CN103871246B true CN103871246B (zh) 2016-05-04

Family

ID=50909740

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410046250.9A Active CN103871246B (zh) 2014-02-10 2014-02-10 基于路网空间关系约束Lasso的短时交通流预测方法

Country Status (1)

Country Link
CN (1) CN103871246B (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408913B (zh) * 2014-11-03 2016-03-16 东南大学 一种考虑时空相关性的交通流三参数实时预测方法
CN104933858B (zh) * 2015-05-14 2017-05-31 浙江工业大学 一种基于空间交通特性Kernel‑KNN匹配的道路交通状态获取方法
CN105243841A (zh) * 2015-10-10 2016-01-13 苏州派瑞雷尔智能科技有限公司 基于网页地图的实时路况采集与预测方法
CN105741554B (zh) * 2016-04-29 2018-11-02 肖峰 一种基于手机运动传感器数据的交通流拥挤判断方法及装置
CN105825677B (zh) * 2016-05-31 2018-10-09 武汉大学 一种基于改进bml模型的城市交通拥堵预测方法
CN106128100B (zh) * 2016-06-30 2019-01-15 华南理工大学 一种基于Spark平台的短时交通流量预测方法
CN106355879A (zh) * 2016-09-30 2017-01-25 西安翔迅科技有限责任公司 一种基于时空关联的城市交通流量预测方法
CN109040969A (zh) * 2018-08-10 2018-12-18 武汉科技大学 室内环境下的智能机器人小车最佳采集点位置选择方法
CN109766642A (zh) * 2019-01-15 2019-05-17 电子科技大学 一种自演化交通路网拓扑建模方法
CN109816983A (zh) * 2019-02-26 2019-05-28 昆明理工大学 一种基于深度残差网络的短时交通流量预测方法
CN109903557A (zh) * 2019-03-04 2019-06-18 南京邮电大学 基于改进独立循环神经网络的高速公路交通流预测方法
CN109920248B (zh) * 2019-03-05 2021-09-17 南通大学 一种基于gru神经网络的公交到站时间预测方法
CN110969857B (zh) * 2019-12-27 2021-11-19 华为技术有限公司 一种交通信息处理方法及装置
CN111397607B (zh) * 2020-03-19 2022-11-18 哈尔滨工程大学 一种采用并行融合机制的信息滤波方法
CN111523706B (zh) * 2020-04-06 2022-07-08 武汉理工大学 一种基于深度学习组合模型的断面车道级短时交通流预测方法
CN111654413B (zh) * 2020-05-18 2022-07-26 长沙理工大学 一种网络流量有效测量点的选取方法、设备及存储介质
CN111898800A (zh) * 2020-06-28 2020-11-06 中国建设银行股份有限公司 公积金缴存数据预测方法、装置及电子设备
CN112215520B (zh) * 2020-10-28 2021-06-08 润联软件系统(深圳)有限公司 一种多目标融合通行方法、装置、计算机设备及存储介质
CN112818028B (zh) * 2021-01-12 2021-09-17 平安科技(深圳)有限公司 数据指标筛选方法、装置、计算机设备及存储介质
CN113222206B (zh) * 2021-01-29 2022-05-13 太原理工大学 一种基于ResLS-C深度学习组合的交通状态预测方法
CN113255979B (zh) * 2021-05-17 2022-04-15 上海旷途科技有限公司 城市公交线网脆弱点识别方法、装置、计算机设备及存储介质
CN114639241B (zh) * 2022-03-15 2023-04-07 北京交通大学 路段中断状态判断方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593424A (zh) * 2009-07-10 2009-12-02 浙江大学 一种短时交通流智能组合预测方法
CN101783075A (zh) * 2010-02-05 2010-07-21 北京科技大学 一种城市环形道路交通流预测系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102110365B (zh) * 2009-12-28 2013-11-06 日电(中国)有限公司 基于时空关系的路况预测方法和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593424A (zh) * 2009-07-10 2009-12-02 浙江大学 一种短时交通流智能组合预测方法
CN101783075A (zh) * 2010-02-05 2010-07-21 北京科技大学 一种城市环形道路交通流预测系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于K-邻域非参数回归短时交通流预测方法;张晓利等;《系统工程学报》;20090430;第24卷(第2期);正文第178-182段 *
混合状态下城市快速路交通流短时预测;董春娇等;《物理学报》;20111115;第61卷(第1期);正文第010501-1-到010501-4页 *

Also Published As

Publication number Publication date
CN103871246A (zh) 2014-06-18

Similar Documents

Publication Publication Date Title
CN103871246B (zh) 基于路网空间关系约束Lasso的短时交通流预测方法
Wang et al. Traffic flow prediction via spatial temporal graph neural network
Kim et al. Urban traffic flow prediction system using a multifactor pattern recognition model
CN102693633B (zh) 一种短时交通流加权组合预测方法
Yan et al. Spatial-temporal chebyshev graph neural network for traffic flow prediction in iot-based its
CN108417032B (zh) 一种城市中心区路边停车需求分析预测方法
CN111815046B (zh) 基于深度学习的交通流量预测方法
CN110299011A (zh) 一种基于收费数据的高速公路任意断面的交通流预测方法
Chan et al. Traffic flow forecasting neural networks based on exponential smoothing method
Chen et al. A multiscale-grid-based stacked bidirectional GRU neural network model for predicting traffic speeds of urban expressways
CN105551250A (zh) 一种基于区间聚类的城市道路交叉口运行状态判别方法
Gao et al. Short-term traffic speed forecasting using a deep learning method based on multitemporal traffic flow volume
CN103456163A (zh) 城市快速路互通立交通行能力和运行状态判别方法与系统
Chen et al. Adaptive ramp metering control for urban freeway using large-scale data
Elhenawy et al. Spatiotemporal traffic state prediction based on discriminatively pre-trained deep neural networks
Wu et al. ES-CTC: A deep neuroevolution model for cooperative intelligent freeway traffic control
Ruan et al. Expressway exit station short-term traffic flow prediction with split traffic flows according originating entry stations
Moridpour et al. A genetic algorithm-based support vector machine for bus travel time prediction
Ma et al. Short-term subway passenger flow prediction based on gcn-bilstm
Du et al. Highway travel time prediction of segments based on ANPR data considering traffic diversion
Pan et al. Traffic speed prediction based on time classification in combination with spatial graph convolutional network
Ye et al. Demand forecasting of online car‐hailing by exhaustively capturing the temporal dependency with TCN and Attention approaches
Qin et al. Spatiotemporal K-Nearest Neighbors Algorithm and Bayesian Approach for Estimating Urban Link Travel Time Distribution From Sparse GPS Trajectories
Jiao et al. Multi-step traffic flow prediction method based on the Conv1D+ LSTM
Zhu et al. Probabilistic data fusion for short-term traffic prediction with semiparametric density ratio model

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant