CN113591380A - 基于图高斯过程的交通流预测方法、介质及设备 - Google Patents
基于图高斯过程的交通流预测方法、介质及设备 Download PDFInfo
- Publication number
- CN113591380A CN113591380A CN202110854976.5A CN202110854976A CN113591380A CN 113591380 A CN113591380 A CN 113591380A CN 202110854976 A CN202110854976 A CN 202110854976A CN 113591380 A CN113591380 A CN 113591380A
- Authority
- CN
- China
- Prior art keywords
- traffic flow
- gaussian process
- model
- data
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 165
- 230000008569 process Effects 0.000 title claims abstract description 107
- 238000012937 correction Methods 0.000 claims abstract description 28
- 238000012549 training Methods 0.000 claims abstract description 25
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 13
- 230000002776 aggregation Effects 0.000 claims abstract description 12
- 238000004220 aggregation Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 55
- 238000009826 distribution Methods 0.000 claims description 32
- 238000010586 diagram Methods 0.000 claims description 20
- 238000013507 mapping Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 7
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 238000003860 storage Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 208000025174 PANDAS Diseases 0.000 claims description 3
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 claims description 3
- 235000016496 Panda oleosa Nutrition 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000001172 regenerating effect Effects 0.000 claims description 2
- 240000000220 Panda oleosa Species 0.000 claims 1
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 240000004718 Panda Species 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241001123248 Arma Species 0.000 description 1
- 241000512668 Eunectes Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G06Q50/40—
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
Abstract
本发明公开了一种基于图高斯过程的交通流预测方法、介质及设备,其通过对流量数据进行流量统计,并根据设计的预测算法对交通流的均值和方差进行预测。本发明方法综合考虑交通流的时间和空间特征,通过图聚合高斯过程表征空间特征,使用深度卷积高斯过程对多个图聚合高斯过程进行时间特征表征,从而构建完整的交通流模型,通过训练即可得到道路交通流量预测模型;当模型因外界扰动而引起预测精度不足时,可使用所发明模型校正方法对模型进行后校正处理。结果表明本发明所构建模型能精确预测交通流数据,并能同时预测误差上下置信界,所提校正方法可以使模型具有在线校正的能力,提高了预测算法的适应性。
Description
技术领域
本发明属于数字化智慧交通领域,具体涉及一种基于图高斯过程的交通流预测方法、介质及设备。
背景技术
在过去数十年中,我国的汽车保有量连年增长,预计在2022年,该数字将达到3亿辆以上。与此同时,交通需求也与日俱增,使得当前道路交通的负荷日益增加,带来了拥堵、事故等一系列问题。尽管交管部门一定程度上采取措施来缓解交通拥堵,如道路建设,车辆限号等,但交通拥堵状态仍未得到良好改善。
交通流预测与控制,是解决交通效率的核心问题,根据预测结果提前做出合理的决策,能够有效的提高交通效率,防止交通拥堵和事故的发生。然而交通流数据既有时间序列特征,又有空间相关特征,对这一类时空耦合数据进行建模具有相当大的挑战性。更进一步的,部份地区因条件有限,布设感知设备困难,因而交通数据的采集相对稀疏匮乏,这更进一步的增加了高效预测算法的设计难度。
传统的交通流预测算法将交通流数据视作时间序列数据,并使用相关模型进行拟合。比如,使用Auto-Regressive Integrated Moving Average(ARIMA)模型、以及卡尔曼滤波算法进行交通流量预测,取得了一定的效果,但其预测精度不能让人满意。近年来随着深度学习技术的发展,基于深度学习技术的交通流预测算法解决方案异彩纷呈,诸如基于深度置信网络、自动编码器、深度卷积神经网络、循环神经网络等方案的交通流预测解决方案都取得了不错的效果,但其空间耦合特性仍然没有得到有效的关注和利用。
图结构对于空间结构的有效表达性,启发人们设计图神经网络对时空耦合数据进行建模。基于时空图模型的研究成果在交通流建模预测方面取得了突破进展,其中以文献Yu B,Yin H,Zhu Z.Spatio-Temporal Graph Convolutional Networks:ADeep LearningFramework for Traffic Forecasting[C]//IJCAI.2018所提出的时空图卷积网络方法、文献Li Y,Yu R,Shahabi C,et al.Diffusion Convolutional Recurrent Neural Network:Data-Driven Traffic Forecasting[C]//International Conference on LearningRepresentations.2018.所提出的DCRNN方法、文献Wu Z,Pan S,Long G,et al.GraphWaveNet for Deep Spatial-Temporal Graph Modeling[C]//IJCAI.2019所提出的GraphWaveNet方法以及文献Zhang Q,Chang J,Meng G,et al.Spatio-temporal graphstructure learning for traffic forecasting[C]//Proceedings of the AAAIConference on Artificial Intelligence.2020,34(01):1177-1185所提出的SLCNN方法最为典型,其结合图结构、散播过程、卷积神经网络、循环神经网络等方法提取时空特征,在交通流预测问题上取得了相对更好的效果。相近的,授权公告号为CN 110264709 B,名称为“基于图卷积网络的道路的交通流量的预测方法”的发明专利,通过利用GCN网络和LSTM网络综合道路的交通流量数据的空间特征和时间特征得到下一时间段的道路的交通流量数据的预测值。授权公告号为CN 110503826 B,名称为“一种基于高速流量监测及预测的智能诱导”的发明专利,将道路交通流视为时间序列,通过利用ACTI_ARMA算法进行拟合,从而实现交通流预测,并结合道路相关设计及管理方案,按照高速诱导信息发布流程进行发布。授权公告号为CN 111540199 B,名称为“基于多模态融合和图注意力机制的高速交通流预测方法”的发明专利,构建时序卷积注意力网络和图注意力机制网络,从而实现对高速公路交通流的预测。然而,这些现存先进交通流预测模型对于图结构的利用较为有限,对时间序列的特征提取也对数据的丰富度、质量要求都比较高,这使得其在数据采集稀疏匮乏区域的应用受到限制,没有预测不确定度输出,没有模型校正方法,因而在现实场景应用中适应能力差。
发明内容
本发明的目的在于解决现有技术中存在的问题,并提供一种基于图高斯过程的交通流预测方法、介质及设备,该方法具有数据利用率高,具备预测不确定度输出,且具备模型校正方法,使得其具备相当鲁棒的现实场景应用能力。
第一方面,本发明提供了一种基于图高斯过程的道路交通流预测方法,其包括以下步骤:
S1、获取待预测的道路上不同位置传感器采集的与车辆流量相关的结构化交通流数据,并将其按照设定间隔步长进行分组形成,每一组数据中包含该分组对应的间隔时段内经过各传感器的车辆信息,最终得到按时间排序的流量统计数据;
S2、针对待预测的道路构建道路图网络结构,以每个传感器部署的点位作为图网络结构的节点,各节点之间通过边相互连接,将节点之间在道路上的实际距离做归一化处理后作为图中节点之间连接的边的权重;
S3、基于图高斯过程对道路的交通流数据进行建模,建模时首先使用高斯过程对单个节点的特征进行建模,再结合图网络结构的传播特性构建聚合图高斯过程模型,以刻画区域路网的空间特征关系,然后基于深度卷积高斯过程模型对交通流数据的时间特征进行建模,将多层聚合图高斯过程模型进行串联,前一个聚合图高斯过程模型的输出成为后一个聚合图高斯过程模型的输入,以刻画交通流数据的时间序列特征,最终形成时空图高斯过程模型;
S4、利用S1中得到的流量统计数据对所述的时空图高斯过程模型进行训练,得到道路流量预测模型,用于进行实际的交通流预测;
S5、利用后续获取的实际交通流数据对道路流量预测模型的预测精度进行验证,若未达到设定的精度指标,则使用模型校正方法对模型进行后校正处理,并以校正后的道路流量预测模型继续进行实际的交通流预测。
作为优选,所述S1中,传感器采集的结构化交通流数据包括传感器的位置信息、车辆经过时间、车牌号和车辆驾驶方向。
作为优选,所述S1中,传感器采集的结构化交通流数据通过pandas工具进行统计处理。
作为优选,所述S1中,若结构化交通流数据存在多个车辆驾驶方向的数据,则先以车辆驾驶方向为维度对数据进行提取,然后将每一种车辆驾驶方向的数据分别进行分组和排序,形成的流量统计数据仅用于训练该车辆驾驶方向的时空图高斯过程模型。
作为优选,所述S3中,时空图高斯过程模型的骨架结构是一个T层深度卷积高斯过程,代表对于T个连续时间序列的建模,每一层都是一个聚合图高斯过程模型,代表对于地理空间的信息流传播的建模;
在聚合图高斯过程模型中,交通流数据的空间特征被构建为一个图网络其中表示图网络中所有N个节点的集合,每个节点代表一个捕获道路交通流信息的传感器,ε表示节点之间相连的边的集合,表示不同传感器之间欧几里得距离归一化处理后构建的邻接矩阵;图网络中,具有M个维度的T步时长的数据流数据表示为xl和yl分表表示第l个时间步的历史交通流数据和当前交通流数据;模型训练的目标是学习一个映射函数以历史交通流数据D*和图网络为输入,预测未来T步时长的交通流数据,即:
所述聚合图高斯过程模型中,单个节点的信息流采用如下的似然隐参表示:
其中表示节点i和节点j之间连边的信息流权重,表示节点i的自环信息流权重;表示将一个节点的空间特征建模为高斯过程,其中μψ(x)为零均值函数,核函数kψ(x,x′)为自动相关确定函数;为对角度矩阵中的对角元素,Ne(i)代表图网络上节点i的一度邻居节点;
所述聚合图高斯过程模型中,任意两个不同节点m和节点n之间的协方差表示为:
所述T层深度卷积高斯过程中,第l层节点i的时序卷积模型表示为,
其中l∈[0,T-1],wt表示t时刻的卷积权重,g(·)表示卷积函数。
综合面向空间特征的聚合图高斯过程和面向时间特征的深度卷积高斯过程,最终得到面向时空特征的图高斯过程的模型表示为以下联合概率密度函数,
其中ul=f(Zl)代表第l层的引诱点(inducing point)输出结果,Zl={Z1,…,ZN}l表示第l层的引诱点集合,表示图在第l个时间步的时空特征;表示预测结果和所有T层时空特征及引诱点输出结果的联合概率,表示预测结果相对于最后一层时空特征的条件概率,表示第l层时空特征相对于引诱点输出结果的条件概率,表示引诱点输出结果的概率;
所述时空图高斯过程模型的证据下界优化目标函数为:
其中:表示第i个节点对数似然的期望值,yi表示第i个节点的交通流真实值,表示第T个预测时间步中第i个节点对应的预测函数。表示分布和分布之间的Kullback-Leibler散度;表示均值为ml方差为Sl的正态分布,其中ml和Sl均属于待训练的模型参数;表示ul和Zl-1的联合概率密度。
作为优选,所述S5中,所采用的模型校正方法为基于极大均值差异(Maximum MeanDiscrepancy,MMD)的分布匹配法,具体做法如下:
对于时空图高斯过程模型,交通流预测结果服从预测分布交通流真实数据服从真实分布将真实分布和预测分布分别通过核均值映射的方法映射至再生核希尔伯特空间的单位球上,得到各自其特征函数和然后针对两个特征函数分别进行M'次抽样和N'次抽样,通过二者做差来区分差异性,极大均值差异的损失函数以公式表示为:
优化下式的目标函数,通过极小化所述损失函数继续更新模型参数集ψ,完成对道路流量预测模型的校正:
第二方面,本发明提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,能实现如第一方面任一所述的基于图高斯过程的道路交通流预测方法。
第三方面,本发明提供一种基于图高斯过程的道路交通流预测设备,其包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于当执行所述计算机程序时,实现如第一方面任一所述的基于图高斯过程的道路交通流预测方法。
相对于现有技术而言,本发明的有益效果包括以下几方面:
1)本发明基于高斯过程进行设计,故而具备无过拟合,数据利用率高、具备预测不确定度输出等优点;
2)本发明集合聚合图高斯过程和深度高斯过程在数据丰富度不均匀的区域路网上,表现具有一致性,解决了数据匮乏区域现存现金模型性能衰退的问题;
3)本发明使用基于MMD的分布匹配法对所得模型进行调优,可以在线使用,使得模型对现实环境应用具备相当强的适应能力。
附图说明
图1为一种基于图高斯过程的交通流预测方法流程图;
图2为时空图高斯过程模型的骨架结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步阐述和说明。
如图1所示,在本发明的一个较佳实施例中,提供了一种基于图高斯过程的道路交通流预测方法,其包括以下步骤:
S1、获取待预测的道路上不同位置传感器采集的与车辆流量相关的结构化交通流数据,并将其按照设定间隔步长进行分组形成,每一组数据中包含该分组对应的间隔时段内经过各传感器的车辆信息,最终得到按时间排序的流量统计数据。
在该步骤中,传感器可以是道路上任意能够感知车辆的传感器,例如龙门架卡口、ETC收费站门架、毫米波雷达、地埋线圈或者监控摄像机,为了能够实现交通流预测,传感器采集的结构化交通流数据应当包括传感器的位置信息、车辆经过时间、车牌号和车辆驾驶方向。这些信息的具体来源需要根据传感器数据特点而定,例如传感器的位置信息可以是桩号、经纬度坐标、ID等,车辆经过时间在ETC门架中可以通过交易时间确定。若存在多源数据,那么道路的龙门架卡口流量数据、收费站流量数据、路侧杆件的毫米波雷达流量数据、地埋线圈感知到的流量数据等多源、多时空粒度的数据可以先进行融合,再作为本发明中的流量统计数据。
该步骤最终得到的按时间排序的流量统计数据可以作为后续预测模型的训练数据,因此需要通过上述分组使其构建为相应的样本数据。在本实施例中,结构化采集数据(包括桩号、经纬度坐标、ID、车辆经过时间、车牌号、车辆驾驶方向等)可使用统计处理工具进行分组处理,将结构化交通流数据按间隔步长分为多组流量数据,得到流量统计数据文件,具体过程可参照以下步骤实现:
S11.使用pandas工具导入结构化交通流数据文件;
S12.若结构化交通流数据存在多个车辆驾驶方向的数据,则先以车辆驾驶方向为维度对数据进行提取,然后将每一种车辆驾驶方向的数据分别进行分组和排序,若仅有1个车辆驾驶方向则直接进行分组和排序。分组和排序的做法如下:将数据以预设的间隔步长由数组转换为列表,重新构造索引,使得其无重复,并按照提取日期,对数据进行排序形成列表;根据每辆车被传感器感应到的车辆经过时间对数据进行分组,每一组数据记录该分组对应的间隔时段内经过各传感器的车辆信息,并将列表重新拼接为一个完整的数据文件,最终形成时间段左开右闭的数据统计结果。
每一个车辆驾驶方向维度形成的流量统计数据,在后续仅用于训练该车辆驾驶方向的时空图高斯过程模型。
S2、针对待预测的道路构建道路图网络结构,以每个传感器部署的点位作为图网络结构的节点,各节点之间通过边相互连接,将节点之间在道路上的实际距离做归一化处理后作为图中节点之间连接的边的权重。图网络中所有边的权重构成了邻接矩阵。
S3、基于图高斯过程对道路的交通流数据进行建模,建模时首先使用高斯过程对单个节点的特征进行建模,再结合图网络结构的传播特性构建聚合图高斯过程(Aggregated Graph Gaussian Process,AGGP)模型,以刻画区域路网的空间特征关系,然后基于深度卷积高斯过程模型对交通流数据的时间特征进行建模,将多层AGGP模型进行串联,前一个AGGP模型的输出成为后一个AGGP模型的输入,以刻画交通流数据的时间序列特征,最终形成时空图高斯过程模型。
如图2所示,上述时空图高斯过程模型的骨架结构是一个T层深度卷积高斯过程(Deep Convolutional Gaussian Process,DCGP),代表对于T个连续时间序列的建模,每一层都是一个AGGP模型,代表对于地理空间的信息流传播的建模。
在AGGP模型中,交通流数据的空间特征被构建为一个图网络其中表示图网络中所有N个节点的集合,每个节点代表一个捕获道路交通流信息的传感器,ε表示节点之间相连的边的集合,表示不同传感器之间欧几里得距离归一化处理后构建的邻接矩阵;图网络中,具有M个维度的T步时长的数据流数据表示为xl和yl分表表示第l个时间步的历史交通流数据和当前交通流数据。上述维度M的取值为1或2,取值为1时仅具有1个维度的交通流预测结果,代表道路中的车辆流量,取值为2时具有2个维度的交通流预测结果,代表道路中的车辆流量流量以及车辆的区间速度。
该AGGP模型中,单个节点的信息流采用如下的似然隐参表示:
其中表示节点i和节点j之间连边的信息流权重,特别的,表示节点i的自环信息流权重。表示将一个节点的空间特征建模为高斯过程,其中μψ(x)为零均值函数,核函数kψ(x,x′)为自动相关确定(Automatic RelevanceDetermination,ARD)函数;为对角度矩阵中的对角元素,代表该时刻图网络上节点i的一度邻居节点。
另外AGGP模型中,任意两个不同节点m和节点n之间的协方差表示为:
其中:φ(xi)表示核函数kψ(·,·)在重生核希尔伯特空间(Reproducing KernelHilbert Space,RKHS)上的映射;表示重生核希尔伯特空间中的数值内积计算。上述公式可以看作是围绕节点m和节点n的两个子图之间特征集通过核均值嵌入(KernelMean Embedding)方法,进行的数值内积。
所述T层深度卷积高斯过程中,第l层节点i的时序卷积模型表示为,
其中l∈[0,T-1],wt表示t时刻的卷积权重,g(·)表示卷积函数。
综合面向空间特征的聚合图高斯过程和面向时间特征的深度卷积高斯过程,最终得到面向时空特征的图高斯过程的模型表示为以下联合概率密度函数,
其中ul=f(Zl)代表第l层的引诱点(inducing point)输出结果,Zl={Z1,…,ZN}l表示第l层的引诱点集合,表示图在第l个时间步的时空特征,concat为拼接函数;表示预测结果和所有T层时空特征及引诱点输出结果的联合概率,表示预测结果相对于最后一层时空特征的条件概率,表示第l层时空特征相对于引诱点输出结果的条件概率,表示引诱点输出结果的概率。需注意的是,上述公式中,由于时序上的时刻和深度卷积高斯过程的层数从设计上来说是一一对应的,因此层数l也对应于时间步l。
该模型的每一层图高斯过程的后验分布是难以计算的,因而无法处理。为了解决上述公式所述模型的后验分布计算问题,本发明需要采用近似推断的方法对其进行逼近,从而实现模型训练。
本发明对上式使用杰森不等式,得出所述时空图高斯过程模型的证据下界优化目标函数为:
其中:表示第i个节点对数似然的期望值,yi表示第i个节点的交通流真实值,表示第T个预测时间步中第i个节点对应的预测函数。表示分布和分布之间的Kullback-Leibler散度;表示均值为ml方差为Sl的正态分布,其中ml和Sl均属于待训练的模型参数;表示ul和Zl-1的联合概率密度。
S4、利用S1中得到的流量统计数据对所述的时空图高斯过程模型进行训练,得到道路流量预测模型,用于进行实际的交通流预测。
在训练过程中,前述S3中的目标函数即可作为模型训练的损失函数,将S1中得到的流量统计数据作为训练数据输入时空图高斯过程模型中,以最小化目标函数为优化目标,通过梯度下降算法对时空图高斯过程模型进行参数更新,最终训练得到道路流量预测模型。
S5、利用后续获取的实际交通流数据对道路流量预测模型的预测精度进行验证,若未达到设定的精度指标,则使用模型校正方法对模型进行后校正处理,并以校正后的道路流量预测模型继续进行实际的交通流预测。
在本发明中,所采用的模型校正方法为基于极大均值差异(Maximum MeanDiscrepancy,MMD)的分布匹配法,具体做法如下:
对于时空图高斯过程模型,交通流预测结果服从预测分布交通流真实数据服从真实分布将真实分布和预测分布分别通过核均值映射(Kernel meanembedding)的方法映射至再生核希尔伯特空间的单位球上,得到各自其特征函数和然后针对两个特征函数分别进行M'次抽样和N'次抽样,通过二者做差来区分差异性,MMD的损失函数以公式表示为:
因此,优化下式的目标函数,通过极小化所述损失函数继续更新模型参数集ψ,完成对道路流量预测模型的校正:
上述S5的模型校正步骤可以在道路流量预测模型使用过程中不断进行,每当累积一定的实际数据后,即可对其预测精度进行判断,若精度不满足要求,则可以通过上述S5对模型进行校正。
下面基于上述S1~S5所示的基于图高斯过程的交通流预测方法,将其应用于具体实例中对其具体实现过程和技术效果进行展示,以便本领域技术人员更好地理解本发明的实质。
实施例
数据集准备:本实例在某地的一段道路收集了10个点位的交通流数据,使用包含收费站、枢纽互通、门架相机三种不同类型的感知数据采集通道。各个采集点的编号为1-10号,采集起止时间为2019年9月1日至2019年9月15日。原始数据除了包含采集点位置信息以外,还有到达车辆的时间、车牌号、行驶方向区分标识。以5分钟为间隔步长对数据进行分组处理,实现同一地点的到达时间在5分钟时间间隔内的车流量统计,最终一共得到9216条流量统计数据。
本实例将数据集按照60%:30%:10%的比例划分为训练集、测试集、验证集,用来进行模型效果验证。
实验环境的硬件配置为:一台服务器,CPU为英特尔i9-10900K,内存为DDR4~16GB,并行计算资源包含一张NVIDIA GeForce RTX 3080TI显卡,显存为12GB。
实验环境的软件配置为:操作系统为Ubuntu 20.04LTS,部署了cuda 11.1,cudnn8.2.1。使用anaconda进行环境管理,所部署python版本为3.8.5。所建立conda环境为TensorFlow 2.4,GpFlow 2.2.1。
模型训练配置为:Epoch数量设置为150,基础核函数设置为Squared ExponentialARD核:
其中σψ代表核函数方差,ψ为对角阵,集合了各个维度数据的相关度超参数。每一层卷积高斯过程的引诱点的个数均设置为20。采用Adam作为训练优化算法,其学习率设置为0.0005。
本实例的性能评价指标包含平均绝对百分比误差(Maximum AbsolutePercentage Error,MAPE)、平均绝对误差(Maximum Absolute Error,MAE)和均方根误差(Root Mean Square Error,RMSE)的预测方法的性能:
最终预测误差指标对比如表1所示:
表1算法误差性能对比表
受实际部署环境的制约,本实例仅使用验证集的数据对基于MMD进行分布匹配的模型校正方法进行验证:设定阈值为α=0.05,取六个高斯核,带宽参数分别设置为0.5,1,2,4,8,16作为预测分布抽样的核函数,然后将多个核函数的抽样和均值作为预测样本,和真实数据通过MMD算式进行匹配,通过随机梯度下降法调优模型的参数集,直到满足收敛条件。
选定RMSE为精度指标,基于MMD的校正算法对RMSE精度的校正效果使用以下指标进行评估:
最终,本实例获得的评估指标值为ECPE=0.02±0.002,表明经过经过校正的模型在期望置信区间附近误差范围仅为0.02±0.002。
另外,在其他实施例中,还可以提供一种基于图高斯过程的道路交通流预测装置,其包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于当执行所述计算机程序时,实现如上述S1~S5所述的基于图高斯过程的道路交通流预测方法。
另外,在其他实施例中,还可以提供一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,能实现如上述S1~S5所述的基于图高斯过程的道路交通流预测方法。
需要注意的是,上述的存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、神经网络处理器(Neural Processor Unit,NPU)等;还可以是数字信号处理器(DigitalSignal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。当然,还装置中还应当具有实现程序运行的必要组件,例如电源、通信总线等等。
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
Claims (10)
1.一种基于图高斯过程的交通流预测方法,其特征在于,包括以下步骤:
S1、获取待预测的道路上不同位置传感器采集的与车辆流量相关的结构化交通流数据,并将其按照设定间隔步长进行分组形成,每一组数据中包含该分组对应的间隔时段内经过各传感器的车辆信息,最终得到按时间排序的流量统计数据;
S2、针对待预测的道路构建道路图网络结构,以每个传感器部署的点位作为图网络结构的节点,各节点之间通过边相互连接,将节点之间在道路上的实际距离做归一化处理后作为图中节点之间连接的边的权重;
S3、基于图高斯过程对道路的交通流数据进行建模,建模时首先使用高斯过程对单个节点的特征进行建模,再结合图网络结构的传播特性构建聚合图高斯过程模型,以刻画区域路网的空间特征关系,然后基于深度卷积高斯过程模型对交通流数据的时间特征进行建模,将多层聚合图高斯过程模型进行串联,前一个聚合图高斯过程模型的输出成为后一个聚合图高斯过程模型的输入,以刻画交通流数据的时间序列特征,最终形成时空图高斯过程模型;
S4、利用S1中得到的流量统计数据对所述的时空图高斯过程模型进行训练,得到道路流量预测模型,用于进行实际的交通流预测;
S5、利用后续获取的实际交通流数据对道路流量预测模型的预测精度进行验证,若未达到设定的精度指标,则使用模型校正方法对模型进行后校正处理,并以校正后的道路流量预测模型继续进行实际的交通流预测。
2.如权利要求1所述的基于图高斯过程的交通流预测方法,其特征在于,所述S1中,传感器采集的结构化交通流数据包括传感器的位置信息、车辆经过时间、车牌号和车辆驾驶方向。
3.如权利要求1所述的基于图高斯过程的交通流预测方法,其特征在于,所述S1中,传感器采集的结构化交通流数据通过pandas工具进行统计处理。
4.如权利要求2所述的基于图高斯过程的交通流预测方法,其特征在于,所述S1中,若结构化交通流数据存在多个车辆驾驶方向的数据,则先以车辆驾驶方向为维度对数据进行提取,然后将每一种车辆驾驶方向的数据分别进行分组和排序,形成的流量统计数据仅用于训练该车辆驾驶方向的时空图高斯过程模型。
5.如权利要求1所述的基于图高斯过程的交通流预测方法,其特征在于,所述S3中,时空图高斯过程模型的骨架结构是一个T层深度卷积高斯过程,代表对于T个连续时间序列的建模,每一层都是一个聚合图高斯过程模型,代表对于地理空间的信息流传播的建模;
在聚合图高斯过程模型中,交通流数据的空间特征被构建为一个图网络其中表示图网络中所有N个节点的集合,每个节点代表一个捕获道路交通流信息的传感器,ε表示节点之间相连的边的集合,表示不同传感器之间欧几里得距离归一化处理后构建的邻接矩阵;图网络中,具有M个维度的T步时长的数据流数据表示为xl和yl分表表示第l个时间步的历史交通流数据和当前交通流数据;模型训练的目标是学习一个映射函数以历史交通流数据D*和图网络为输入,预测未来T步时长的交通流数据,即:
所述聚合图高斯过程模型中,单个节点的信息流采用如下的似然隐参表示:
其中表示节点i和节点j之间连边的信息流权重,表示节点i的自环信息流权重;表示将一个节点的空间特征建模为高斯过程,其中μψ(x)为零均值函数,核函数kψ(x,x′)为自动相关确定函数;为对角度矩阵中的对角元素,Ne(i)代表图网络上节点i的一度邻居节点;
所述聚合图高斯过程模型中,任意两个不同节点m和节点n之间的协方差表示为:
所述T层深度卷积高斯过程中,第l层节点i的时序卷积模型表示为,
其中l∈[0,T-1],wt表示t时刻的卷积权重,g(·)表示卷积函数;
综合面向空间特征的聚合图高斯过程和面向时间特征的深度卷积高斯过程,最终得到面向时空特征的图高斯过程的模型表示为以下联合概率密度函数:
其中ul=f(Zl)代表第l层的引诱点(inducing point)输出结果,Zl={Z1,…,ZN}l表示第l层的引诱点集合,表示图在第l个时间步的时空特征;表示预测结果和所有T层时空特征及引诱点输出结果的联合概率,表示预测结果相对于最后一层时空特征的条件概率,表示第l层时空特征相对于引诱点输出结果的条件概率,表示引诱点输出结果的概率;
所述时空图高斯过程模型的证据下界优化目标函数为:
7.如权利要求5所述的基于图高斯过程的交通流预测方法,其特征在于,所述S5中,所采用的模型校正方法为基于极大均值差异(Maximum Mean Discrepancy,MMD)的分布匹配法,具体做法如下:
对于时空图高斯过程模型,交通流预测结果服从预测分布交通流真实数据服从真实分布将真实分布和预测分布分别通过核均值映射的方法映射至再生核希尔伯特空间的单位球上,得到各自其特征函数和然后针对两个特征函数分别进行M'次抽样和N'次抽样,通过二者做差来区分差异性,极大均值差异的损失函数以公式表示为:
优化下式的目标函数,通过极小化所述损失函数继续更新模型参数集ψ,完成对道路流量预测模型的校正:
9.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,能实现如权利要求1~8任一所述的基于图高斯过程的道路交通流预测方法。
10.一种基于图高斯过程的道路交通流预测设备,其特征在于,包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于当执行所述计算机程序时,实现如权利要求1~8任一所述的基于图高斯过程的道路交通流预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110854976.5A CN113591380B (zh) | 2021-07-28 | 2021-07-28 | 基于图高斯过程的交通流预测方法、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110854976.5A CN113591380B (zh) | 2021-07-28 | 2021-07-28 | 基于图高斯过程的交通流预测方法、介质及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113591380A true CN113591380A (zh) | 2021-11-02 |
CN113591380B CN113591380B (zh) | 2022-03-22 |
Family
ID=78250950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110854976.5A Active CN113591380B (zh) | 2021-07-28 | 2021-07-28 | 基于图高斯过程的交通流预测方法、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113591380B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114582128A (zh) * | 2022-03-10 | 2022-06-03 | 浙江大学 | 基于图离散注意力网络的交通流预测方法、介质及设备 |
CN115017990A (zh) * | 2022-06-01 | 2022-09-06 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 一种交通流量预测方法、装置、设备及存储介质 |
CN115376308A (zh) * | 2022-05-26 | 2022-11-22 | 南京工程学院 | 一种汽车行驶时间的预测方法 |
CN115544309A (zh) * | 2022-09-22 | 2022-12-30 | 中国人民解放军海军航空大学 | 基于gcn的改进最近邻数据互联方法 |
CN115907181A (zh) * | 2022-12-01 | 2023-04-04 | 郑州铁路职业技术学院 | 一种城市轨道交通乘客流量预测方法及系统 |
CN116580564A (zh) * | 2023-07-12 | 2023-08-11 | 北京赛目科技股份有限公司 | 一种交通流预测方法及装置 |
CN117423238A (zh) * | 2023-12-19 | 2024-01-19 | 北京华录高诚科技有限公司 | 基于卷积交换网络的交通流量一体式预测装置及预测方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292804A (zh) * | 2017-06-01 | 2017-10-24 | 西安电子科技大学 | 基于OpenCL的直接多曝光融合并行加速方法 |
CN110352432A (zh) * | 2017-04-07 | 2019-10-18 | 英特尔公司 | 使用用于深度神经网络的改进的训练和学习的方法和系统 |
CN110705344A (zh) * | 2019-08-21 | 2020-01-17 | 中山大学 | 一种基于深度学习的人群计数模型及其实现方法 |
WO2020063686A1 (zh) * | 2018-09-25 | 2020-04-02 | 新智数字科技有限公司 | 一种热负荷预测方法、装置、可读介质及电子设备 |
CN111192453A (zh) * | 2019-12-30 | 2020-05-22 | 深圳市麦谷科技有限公司 | 一种基于贝叶斯优化的短时交通流预测方法及系统 |
CN111639791A (zh) * | 2020-05-11 | 2020-09-08 | 同济大学 | 交通流预测方法、系统、存储介质及终端 |
CN111899510A (zh) * | 2020-07-28 | 2020-11-06 | 南京工程学院 | 基于发散卷积和gat的智能交通系统流量短期预测方法及系统 |
CN112991721A (zh) * | 2021-02-04 | 2021-06-18 | 南通大学 | 基于图卷积网络节点关联度的城市路网交通速度预测方法 |
-
2021
- 2021-07-28 CN CN202110854976.5A patent/CN113591380B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110352432A (zh) * | 2017-04-07 | 2019-10-18 | 英特尔公司 | 使用用于深度神经网络的改进的训练和学习的方法和系统 |
CN107292804A (zh) * | 2017-06-01 | 2017-10-24 | 西安电子科技大学 | 基于OpenCL的直接多曝光融合并行加速方法 |
WO2020063686A1 (zh) * | 2018-09-25 | 2020-04-02 | 新智数字科技有限公司 | 一种热负荷预测方法、装置、可读介质及电子设备 |
CN110705344A (zh) * | 2019-08-21 | 2020-01-17 | 中山大学 | 一种基于深度学习的人群计数模型及其实现方法 |
CN111192453A (zh) * | 2019-12-30 | 2020-05-22 | 深圳市麦谷科技有限公司 | 一种基于贝叶斯优化的短时交通流预测方法及系统 |
CN111639791A (zh) * | 2020-05-11 | 2020-09-08 | 同济大学 | 交通流预测方法、系统、存储介质及终端 |
CN111899510A (zh) * | 2020-07-28 | 2020-11-06 | 南京工程学院 | 基于发散卷积和gat的智能交通系统流量短期预测方法及系统 |
CN112991721A (zh) * | 2021-02-04 | 2021-06-18 | 南通大学 | 基于图卷积网络节点关联度的城市路网交通速度预测方法 |
Non-Patent Citations (3)
Title |
---|
秦超等: "深度卷积记忆网络时空数据模型", 《自动化学报》 * |
胡志刚等: "基于小波支持向量机的电梯交通流预测模型", 《系统仿真学报》 * |
雷少梅等: "基于高斯核函数的短时交通流量预测", 《中央民族大学学报(自然科学版)》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114582128A (zh) * | 2022-03-10 | 2022-06-03 | 浙江大学 | 基于图离散注意力网络的交通流预测方法、介质及设备 |
CN115376308A (zh) * | 2022-05-26 | 2022-11-22 | 南京工程学院 | 一种汽车行驶时间的预测方法 |
CN115017990A (zh) * | 2022-06-01 | 2022-09-06 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 一种交通流量预测方法、装置、设备及存储介质 |
CN115544309A (zh) * | 2022-09-22 | 2022-12-30 | 中国人民解放军海军航空大学 | 基于gcn的改进最近邻数据互联方法 |
CN115544309B (zh) * | 2022-09-22 | 2024-03-19 | 中国人民解放军海军航空大学 | 基于gcn的改进最近邻数据互联方法 |
CN115907181A (zh) * | 2022-12-01 | 2023-04-04 | 郑州铁路职业技术学院 | 一种城市轨道交通乘客流量预测方法及系统 |
CN116580564A (zh) * | 2023-07-12 | 2023-08-11 | 北京赛目科技股份有限公司 | 一种交通流预测方法及装置 |
CN116580564B (zh) * | 2023-07-12 | 2023-09-15 | 北京赛目科技股份有限公司 | 一种交通流预测方法及装置 |
CN117423238A (zh) * | 2023-12-19 | 2024-01-19 | 北京华录高诚科技有限公司 | 基于卷积交换网络的交通流量一体式预测装置及预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113591380B (zh) | 2022-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113591380B (zh) | 基于图高斯过程的交通流预测方法、介质及设备 | |
Zhang et al. | A novel generative adversarial network for estimation of trip travel time distribution with trajectory data | |
CN110827544B (zh) | 一种基于图卷积循环神经网络的短时交通流控制方法 | |
CN110164128B (zh) | 一种城市级智能交通仿真系统 | |
Yu et al. | Real-time traffic speed estimation with graph convolutional generative autoencoder | |
Kim et al. | Urban traffic flow prediction system using a multifactor pattern recognition model | |
CN108986453A (zh) | 一种基于情境信息的交通状况预测方法、系统及装置 | |
CN111047078B (zh) | 交通特征预测方法、系统及存储介质 | |
CN110164129B (zh) | 基于gernn的单交叉口多车道交通流量预测方法 | |
US20230140289A1 (en) | Traffic accident prediction systems and methods | |
CN108596664B (zh) | 一种电子车票的单边交易费用确定方法、系统及装置 | |
James | Citywide estimation of travel time distributions with Bayesian deep graph learning | |
CN116011684A (zh) | 一种基于时空图卷积网络的交通流量预测方法 | |
CN116859985A (zh) | 一种四旋翼自动追踪功能实现方法 | |
CN113327417B (zh) | 基于3d动态时空残差卷积关联网络的交通流预测方法 | |
CN111985731B (zh) | 城市公共交通站点人数的预测方法及系统 | |
CN112101132B (zh) | 一种基于图嵌入模型和度量学习的交通状况预测方法 | |
CN117131991A (zh) | 基于混合神经网络的城市降雨量预测方法及平台 | |
CN114582128B (zh) | 基于图离散注意力网络的交通流预测方法、介质及设备 | |
Chen et al. | Dynamic path flow estimation using automatic vehicle identification and probe vehicle trajectory data: A 3D convolutional neural network model | |
Ge et al. | Traffic speed prediction with missing data based on TGCN | |
Shao et al. | Estimation of urban travel time with sparse traffic surveillance data | |
Althobaiti et al. | Intelligent deep data analytics-based remote sensing scene classification model | |
Li et al. | Comparison of short-term traffic demand prediction methods for transport services | |
Chen et al. | A bidirectional context-aware and multi-scale fusion hybrid network for short-term traffic flow prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |