CN109191849B - 一种基于多源数据特征提取的交通拥堵持续时间预测方法 - Google Patents

一种基于多源数据特征提取的交通拥堵持续时间预测方法 Download PDF

Info

Publication number
CN109191849B
CN109191849B CN201811227002.9A CN201811227002A CN109191849B CN 109191849 B CN109191849 B CN 109191849B CN 201811227002 A CN201811227002 A CN 201811227002A CN 109191849 B CN109191849 B CN 109191849B
Authority
CN
China
Prior art keywords
road
data
traffic jam
vehicle
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201811227002.9A
Other languages
English (en)
Other versions
CN109191849A (zh
Inventor
王云鹏
张力
于海洋
任毅龙
王子睿
王飞
杨阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201811227002.9A priority Critical patent/CN109191849B/zh
Publication of CN109191849A publication Critical patent/CN109191849A/zh
Application granted granted Critical
Publication of CN109191849B publication Critical patent/CN109191849B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • G08G1/0112Measuring and analyzing of parameters relative to traffic conditions based on the source of data from the vehicle, e.g. floating car data [FCD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

本专利公开了一种基于多源数据特征提取的交通拥堵持续时间预测方法包含三个步骤:(一)基于多源数据的特征提取;(二)基于道路特征的交通拥堵状态预测;(三)基于多源数据特征提取的交通拥堵持续时间预测。本专利考虑了交通拥堵状态预测过程中使用的道路交通特征,同时将交通拥堵状态预测方法的输出,即预测的交通拥堵状态作为拥堵时间预测的依据之一,提高了方法对交通拥堵消散时间度量的准确性。

Description

一种基于多源数据特征提取的交通拥堵持续时间预测方法
技术领域
本发明涉及智能交通管理领域,具体涉及一种基于多源数据特征提取的交通拥堵持续时间预测方法。
背景技术
随着今年来我国机动车保有量的逐年增长,交通需求与现有交通基础设施的交通供给能力之间的矛盾越来越严重,而交通拥堵正是交通需求与交通供给之间矛盾的最主要体现。在交通管理部门对道路交通状态进行管理的过程中,不能当交通拥堵已经发生且已经构成经济损失时才采取措施,需要预测交通拥堵发生的位置,时间等信息并及时采取相应措施以减少交通拥堵对道路网络带来的不良影响。因此,开发一类能够准确预测交通拥堵发生及持续时间的交通预测方法对于有效组织交通,缓解道路交通拥堵具有重要意义。
目前国内专利对于交通拥堵的研究主要针对于交通拥堵现象是否发生,并未考虑交通拥堵现象的持续时间。而在实际交通控制的过程中,交通拥堵现象的规模不同,其持续时间也不尽相同,对于不同规模的交通拥堵现象需要采取不同的交通控制策略。因此,在预测交通拥堵发生与否的同时预测预测交通拥堵的持续时间十分必要。同时,在目前国内的专利中,交通拥堵状态预测过程中使用的数据均是采用浮动车或道路固定检测器的数据这类单一数据源,这就导致对于交通状态的预测过程中使用的预测模型获得的数据结构过于单一,可能会导致模型不能良好地反应实际条件下复杂的交通状态特点。
基于此,本发明提出使用包括固定检测器获取的数据,浮动车实时传递的GPS数据,道路特征数据及天气环境数据在内的多源数据集,使用考虑了道路特征的深度学习的方法,在预测交通拥堵事件状态的基础上对交通拥堵事件的持续时间进行预测的方法。
发明内容
为解决上述问题,本发明提出一种基于多源数据特征提取的交通拥堵持续时间预测方法,该方法通过对包括道路上设置的固定检测器,浮动车获得的交通流数据及道路特征数据,天气数据在内的多源数据进行交通特征,道路特征及天气特征的提取,并使用基于多源数据特征提取的深度学习的方法对交通拥堵发生状态以及交通拥堵的持续时间进行预测。
本发明数据来源包括道路上固定检测器获得数据,浮动车上传的GPS数据,道路特征数据及天气数据。其中:固定检测器获得的数据包括车辆牌号,位置及通过时间数据;浮动车GPS数据包括动态的车辆牌号,位置及时间数据;道路特征数据包括道路网络上各路段位置车道数及瓶颈存在情况;天气数据包含与固定检测器及浮动车获取数据相同时刻下的降雨量数据。
本发明提出的基于多源数据特征提取的交通拥堵持续时间预测方法包含三个步骤:(一)基于多源数据的特征提取;(二)基于道路特征的交通拥堵状态预测;(三)基于多源数据特征提取的交通拥堵持续时间预测。
(一)基于多源数据的特征提取
本发明使用包括道路上固定检测器获得数据,浮动车上传的GPS数据,道路特征数据及天气数据在内的多个数据来源的数据,这些数据来源提供的数据在结构及含义上可能不尽相同,因此在使用获取到的多源数据进行交通拥堵状态及持续时间的预测之前,需要对多源数据进行特征提取,使模型输入数据结构统一,含义明确。其具体步骤如下:
步骤1:获取固定检测器数据,浮动车数据,并将其分别存入固定检测器数据集和浮动车数据集。
步骤2:提取浮动车数据集中车辆数据,根据其中车辆牌号,车辆位置信息数据,将其与固定检测器获取的车辆数据进行匹配,并存入数据集中。
步骤3:将固定检测器获取的数据与浮动车上传的GPS数据结合进行交通特征提取,其具体方法为:提取固定检测器检测到车辆通过的时间,将其按照时间先后顺序插入浮动车上传的GPS数据中,得到更加精确的车辆轨迹数据。
步骤4:根据车辆行驶的轨迹
Figure GDA0002624546990000021
以及车辆通过轨迹上各点的具体时间
Figure GDA0002624546990000022
其中i=1,2,3,...为车辆编号,j=1,2,3,...为车辆轨迹点的编号,可以得到车辆在道路上任意两个轨迹点之间的行驶速度
Figure GDA0002624546990000023
代表车辆i在轨迹点j与j+1之间的车辆平均行驶速度,即
Figure GDA0002624546990000024
可表示为:
Figure GDA0002624546990000031
步骤5:根据道路特征数据中车道数数据,将车道数发生改变的位置作为路段划分的节点,并按照固定距离为依据划分道路路段,其具体做法为:将道路上车道数发生改变或存在道路交叉的地点作为道路路段划分边界,并将道路长度过长的路段沿固定距离划分为小段。
步骤6:以固定时间长度Δt为时间间隔,将车辆通过路段的时间划分为Δt的时间段,并根据车辆通过轨迹点时间
Figure GDA0002624546990000032
将车辆轨迹时间划分至不同时间段内,并结合步骤5划分的路段将车辆轨迹划分至不同路段,由此可以将车辆在任意轨迹点处的行驶状态归入固定路段固定时间段中。
步骤7:对步骤4获得的车辆在任意两个连续的轨迹点j和j+1之间的行驶速度
Figure GDA0002624546990000033
在时间及空间维度取平均得到任一时间段内路段平均速度,即将其按照步骤5划分的路段分隔开,并计算路段上的平均速度
Figure GDA0002624546990000034
其中k表示步骤5划分得到的路段编号,上标t表示平均速度
Figure GDA0002624546990000035
属标号为t的时间段内,则路段平均速度
Figure GDA0002624546990000036
为;
Figure GDA0002624546990000037
其中,m为时间段t内路段k上通过的车辆总数,n为时间段t内路段k上通过的车辆的轨迹点数,N表示时间段t内路段k上所有通过车辆的轨迹点总数。
步骤8:从道路特征数据集及天气数据集中获取每一时间段内每一路段上的道路及天气特征数据,其中包括路段车道数目nl,与上下游车道是否存在瓶颈0/1,其中0表示不存在交通瓶颈,1表示存在交通瓶颈,降雨量p,并结合步骤7获得的路段平均速度数据
Figure GDA0002624546990000038
构建深度神经网络的输入。
(二)基于道路特征的交通拥堵状态预测
对于道路上发生的交通拥堵现象的持续时间预测的前提及基础是对交通拥堵是否发生的预测,即对交通拥堵状态的预测。本发明中使用考虑道路特征的长短期记忆网络LSTM的深度学习对交通拥堵状态进行预测。
本发明中使用的考虑道路特征的LSTM的深度神经网络,其网络输入包括一个包括路段平均速度数据
Figure GDA0002624546990000041
时间段编号t,路段车道数目nl,是否存在瓶颈0/1及降雨量p的向量,即向量(t,
Figure GDA0002624546990000042
nl,bottleneck,p),其中bottleneck为0或1的量,表示是否存在瓶颈,当bottleneck为0时,表示不存在瓶颈,当bottleneck为1时表示存在瓶颈。本发明通过对道路特征的提取,并将其加入神经网络的输入,以考虑道路特征对交通拥堵状态的影响,从而获得更加准确的预测精度。使用考虑道路特征的深度神经网络可以通过记忆在时间维度上的传递,实现数据的输入在时间维度的联系,即模型可以学习交通数据的时间上的延续关系,从而得到相较于传统交通预测算法更为精确的预测结果。
本发明中深度学习算法的输入为向量(t,
Figure GDA0002624546990000043
nl,bottleneck,p)。在神经网络的训练过程中,需要提供模型有标签的训练数据,本发明中将交通拥堵分为5个状态,并以数字0,1,2,3,4表示,其中0表示道路畅通不存在拥堵现象,4表示道路严重堵塞,车辆无法通过。本发明中对于交通拥堵状态划分的依据采用路段平均速度作为划分依据,具体根据道路实际条件确定划分不同交通拥堵状态的界限。通过对数据增加标签,可以得到训练过程中模型的输入
Figure GDA0002624546990000044
及模型标签y。在训练过程中将输入加入模型中计算得到当前参数下的预测输出
Figure GDA0002624546990000045
并结合损失函数计算损失值,其中损失函数为交叉熵
Figure GDA0002624546990000046
由于考虑道路特征的LSTM的深度学习模型在时间维度上存在大量计算,因此模型深度不宜过大,本发明中采用三层LSTM神经层作为模型的输出结构,层间LSTM单元使用tanh函数作为激活函数。同时,为了增强神经网络的泛化能力,减少其在训练过程中出现的过拟合现象,在LSTM神经层间增加Dropout层作为模型正则化的方法。进一步的,由于LSTM模型在时间维度上需要大量计算代价,传统的随机梯度下降法的训练效果一般较差,因此采用Adam梯度下降算法对模型进行训练。进一步的,本发明中对交通拥堵状态的预测为多分类问题,因此在模型输出层增加sigmoid函数作为模型输出层激活函数。
(三)基于多源数据特征提取的交通拥堵持续时间预测
本发明提出的基于多源数据特征提取的交通拥堵持续时间预测方法对于交通拥堵持续时间的预测需要基于本发明步骤(二)中对于交通拥堵状态的预测输出进行。
首先对步骤(二)中预测得到的交通拥堵状态进行判断,当预测得到的交通拥堵状态为0时,可认为不存在任何形式的交通拥堵,车辆在道路上自由行驶,因此不对其交通拥堵持续时间进行预测。当交通拥堵状态为1,2,3,4时,说明道路上发生了不同程度的交通拥堵现象,此时需要对其交通拥堵持续时间进行预测,由于交通拥堵程度不同,其拥堵持续的时间也不完全相同,即交通拥堵程度是影响交通拥堵持续时间的一项重要因素。基于此,使用基于多源数据特征提取的深度学习方法对交通拥堵持续时间预测时,需要在步骤(二)中模型的输入的基础上增加交通拥堵状态,即基于多源数据特征提取的交通拥堵持续时间预测方法的输入为
Figure GDA0002624546990000051
其中state表示交通拥堵的状态,其值可取为1,2,3,4。模型的输出调整为交通拥堵持续的时间tc,即y=tc。在训练过程中仍需要为数据增加标签,则使用道路上发生交通拥堵时实际测得的交通拥堵时间作为交通拥堵预测模型的输出标签。
由于交通拥堵持续时间与交通流参数在时间的延续上存在联系,因此对于交通拥堵持续时间的预测仍使用可以良好学习数据间时间关系的LSTM神经网络作为深度学习方法的基本框架。对于交通拥堵持续时间的预测模型使用3层LSTM神经网络,层间LSTM单元使用tanh函数作为模型激活函数。在训练过程中将输入加入模型中计算得到当前神经网络参数条件下的预测输出
Figure GDA0002624546990000052
并结合损失函数计算损失值,损失函数为交叉熵
Figure GDA0002624546990000053
同时,与步骤(二)中LSTM神经网络类似的,为了增强神经网络的泛化能力,使用在LSTM神经层间增加Dropout层作为模型正则化的方法减少其在训练过程中出现的过拟合现象。进一步的,由于LSTM模型在时间维度上存在大量计算,传统的随机梯度下降法的训练效果一般较差,因此采用Adam梯度下降算法对模型进行训练。
本发明的优点在于:
(1)使用包括道路上设置的固定检测器,浮动车获得的交通流数据及道路特征数据,天气数据在内的多源数据进行特征提取,并将提取后的特征作为交通拥堵状态及持续时间预测方法的输入,通过特征的提取,可以获得较高精度的交通及道路特征。
(2)使用考虑道路特征的LSTM深度学习方法,将道路上固有的瓶颈信息加入交通拥堵状态的预测中,可以实现结合实际道路条件对交通拥堵状态的精准预测,提高了结果可信度。
(3)本发明提出的基于多源数据特征提取的交通拥堵持续时间预测方法中,不仅考虑了交通拥堵状态预测过程中使用的道路交通特征,同时将交通拥堵状态预测方法的输出,即预测的交通拥堵状态作为拥堵时间预测的依据之一,提高了方法对交通拥堵消散时间度量的准确性,使本方法可以良好适应实际道路条件下复杂的交通情况。
附图说明
图1为本发明的基于多源数据特征提出的交通拥堵持续时间预测方法流程图
具体实施方式
下面结合具体事例和附图对本发明作进一步说明
本发明提出一种基于多源数据特征提取的交通拥堵持续时间预测方法,该方法通过对包括道路上设置的固定检测器,浮动车获得的交通流数据及道路特征数据,天气数据在内的多源数据进行交通特征,道路特征及天气特征的提取,并使用基于多源数据特征提取的深度学习的方法对交通拥堵发生状态以及交通拥堵的持续时间进行预测。
本发明数据来源包括道路上固定检测器获得数据,浮动车上传的GPS数据,道路特征数据及天气数据。其中:固定检测器获得的数据包括车辆牌号,位置及通过时间数据;浮动车GPS数据包括动态的车辆牌号,位置及时间数据;道路特征数据包括道路网络上各路段位置车道数及瓶颈存在情况;天气数据包含与固定检测器及浮动车获取数据相同时刻下的降雨量数据。
本发明提出的基于多源数据特征提取的交通拥堵持续时间预测方法包含三个步骤:(一)基于多源数据的特征提取;(二)基于道路特征的交通拥堵状态预测;(三)基于多源数据特征提取的交通拥堵持续时间预测。
(一)基于多源数据的特征提取
本发明使用包括道路上固定检测器获得数据,浮动车上传的GPS数据,道路特征数据及天气数据在内的多个数据来源的数据,这些数据来源提供的数据在结构及含义上可能不尽相同,因此在使用获取到的多源数据进行交通拥堵状态及持续时间的预测之前,需要对多源数据进行特征提取,使模型输入数据结构统一,含义明确。其具体步骤如下:
步骤1:获取固定检测器数据,浮动车数据,并将其分别存入固定检测器数据集和浮动车数据集。
步骤2:提取浮动车数据集中车辆数据,根据其中车辆牌号,车辆位置信息数据,将其与固定检测器获取的车辆数据进行匹配,并存入数据集中。
步骤3:将固定检测器获取的数据与浮动车上传的GPS数据结合进行交通特征提取,其具体方法为:提取固定检测器检测到车辆通过的时间,将其按照时间先后顺序插入浮动车上传的GPS数据中,得到更加精确的车辆轨迹数据。
步骤4:根据车辆行驶的轨迹
Figure GDA0002624546990000071
以及车辆通过轨迹上各点的具体时间
Figure GDA0002624546990000072
其中i=1,2,3,...为车辆编号,j=1,2,3,...为车辆轨迹点的编号,可以得到车辆在道路上任意两个轨迹点之间的行驶速度
Figure GDA0002624546990000073
代表车辆i在轨迹点j与j+1之间的车辆平均行驶速度,即
Figure GDA0002624546990000074
可表示为:
Figure GDA0002624546990000075
步骤5:根据道路特征数据中车道数数据,将车道数发生改变的位置作为路段划分的节点,并按照固定距离为依据划分道路路段,其具体做法为:将道路上车道数发生改变或存在道路交叉的地点作为道路路段划分边界,并将道路长度过长的路段沿固定距离划分为小段。
步骤6:以固定时间长度5min为时间间隔,即Δt=5min,将车辆通过路段的时间划分为5min的时间段,并根据车辆通过轨迹点时间
Figure GDA0002624546990000076
将车辆轨迹时间划分至不同时间段内,并结合步骤5划分的路段将车辆轨迹划分至不同路段,由此可以将车辆在任意轨迹点处的行驶状态归入固定路段固定时间段中。
步骤7:对步骤4获得的车辆在任意两个连续的轨迹点j和j+1之间的行驶速度
Figure GDA0002624546990000081
在时间及空间维度取平均得到任一时间段内路段平均速度,即将其按照步骤5划分的路段分隔开,并计算路段上的平均速度
Figure GDA0002624546990000082
其中k表示步骤5划分得到的路段编号,上标t表示平均速度
Figure GDA0002624546990000083
属标号为t的时间段内,则路段平均速度
Figure GDA0002624546990000084
为:
Figure GDA0002624546990000085
其中,m为时间段t内路段k上通过的车辆总数,n为时间段t内路段k上通过的车辆的轨迹点数,N表示时间段t内路段k上所有通过车辆的轨迹点总数,例如在某个5min的时间间隔内,通过路段上的车辆共有3辆,其在路段上轨迹点间的行驶速度分别为第一辆车
Figure GDA0002624546990000086
第二辆车
Figure GDA0002624546990000087
第三辆车
Figure GDA0002624546990000088
Figure GDA0002624546990000089
则N=3+3,
Figure GDA00026245469900000810
即在此5min时间间隔内,此路段上平均速度为20.2m/s。
步骤8:从道路特征数据集及天气数据集中获取每一时间段内每一路段上的道路及天气特征数据,其中包括路段车道数目nl,与上下游车道是否存在瓶颈0/1,其中0表示不存在交通瓶颈,1表示存在交通瓶颈,降雨量p,并结合步骤7获得的路段平均速度数据
Figure GDA00026245469900000811
构建深度神经网络的输入。
(二)基于道路特征的交通拥堵状态预测
对于道路上发生的交通拥堵现象的持续时间预测的前提及基础是对交通拥堵是否发生的预测,即对交通拥堵状态的预测。本发明中使用考虑道路特征的长短期记忆网络LSTM的深度学习对交通拥堵状态进行预测。
本发明中使用的考虑道路特征的LSTM的深度神经网络,其网络输入包括一个包括路段平均速度数据
Figure GDA0002624546990000091
时间段编号t,路段车道数目nl,是否存在瓶颈0/1及降雨量p的向量,即向量(t,
Figure GDA0002624546990000092
nl,bottleneck,p),其中bottleneck为0或1的量,表示是否存在瓶颈,当bottleneck为0时,表示不存在瓶颈,当bottleneck为1时表示存在瓶颈。本发明通过对道路特征的提取,并将其加入神经网络的输入,以考虑道路特征对交通拥堵状态的影响,从而获得更加准确的预测精度。使用考虑道路特征的深度神经网络可以通过记忆在时间维度上的传递,实现数据的输入在时间维度的联系,即模型可以学习交通数据的时间上的延续关系,从而得到相较于传统交通预测算法更为精确的预测结果。
本发明中深度学习算法的输入为向量(t,
Figure GDA0002624546990000093
nl,bottleneck,p)。在神经网络的训练过程中,需要提供模型有标签的训练数据,本发明中将交通拥堵分为5个状态,并以数字0,1,2,3,4表示,其中0表示道路畅通不存在拥堵现象,4表示道路严重堵塞,车辆无法通过。本发明中对于交通拥堵状态划分的依据采用路段平均速度作为划分依据,具体根据道路实际条件确定划分不同交通拥堵状态的界限。本例中使用北京市地方标准《城市道路交通拥堵评价指标体系》中对交通拥堵状态的划分标准确定,如表1所示。
等级 1 2 3 4 5
快速路 >65 (50,65] (35,50] (20,35] ≤20
主干路 >45 (35,45] (25,35] (15,25] ≤15
次干路 >35 (25,35] (15,25] (10,15] ≤10
支路 >35 (25,35] (15,25] (10,15] ≤10
表1
通过对数据增加标签,可以得到模型的输入
Figure GDA0002624546990000094
及模型标签y。在训练过程中将输入加入模型中计算得到当前参数下的预测输出
Figure GDA0002624546990000095
并结合损失函数计算损失值,其中损失函数为交叉熵
Figure GDA0002624546990000101
由于考虑道路特征的LSTM的深度学习模型在时间维度上存在大量计算,因此模型深度不宜过大,本发明中采用三层LSTM神经层作为模型的输出结构,层间LSTM单元使用tanh函数作为激活函数。同时,为了增强神经网络的泛化能力,减少其在训练过程中出现的过拟合现象,在LSTM神经层间增加Dropout层作为模型正则化的方法。进一步的,由于LSTM模型在时间维度上需要大量计算代价,传统的随机梯度下降法的训练效果一般较差,因此采用Adam梯度下降算法对模型进行训练。进一步的,本发明中对交通拥堵状态的预测为多分类问题,因此在模型输出层增加sigmoid函数作为模型输出层激活函数。
(三)基于多源数据特征提取的交通拥堵持续时间预测
本发明提出的基于多源数据特征提取的交通拥堵持续时间预测方法对于交通拥堵持续时间的预测需要基于本发明步骤(二)中对于交通拥堵状态的预测输出进行。
首先对步骤(二)中预测得到的交通拥堵状态进行判断,当预测得到的交通拥堵状态为0时,可认为不存在任何形式的交通拥堵,车辆在道路上自由行驶,因此不对其交通拥堵持续时间进行预测。当交通拥堵状态为1,2,3,4时,说明道路上发生了不同程度的交通拥堵现象,此时需要对其交通拥堵持续时间进行预测,由于交通拥堵程度不同,其拥堵持续的时间也不完全相同,即交通拥堵程度是影响交通拥堵持续时间的一项重要因素。基于此,使用基于多源数据特征提取的深度学习方法对交通拥堵持续时间预测时,需要在步骤(二)中模型的输入的基础上增加交通拥堵状态,即基于多源数据特征提取的交通拥堵持续时间预测方法的输入为x=(t,
Figure GDA0002624546990000102
nl,bottleneck,p,state),其中state表示交通拥堵的状态,其值可取为1,2,3,4。模型的输出调整为交通拥堵持续的时间tc,即y=tc。在训练过程中仍需要为数据增加标签,则使用道路上发生交通拥堵时实际测得的交通拥堵时间作为交通拥堵预测模型的输出标签。
由于交通拥堵持续时间与交通流参数在时间的延续上存在联系,因此对于交通拥堵持续时间的预测仍使用可以良好学习数据间时间关系的LSTM神经网络作为深度学习方法的基本框架。对于交通拥堵持续时间的预测模型使用3层LSTM神经网络,层间LSTM单元使用tanh函数作为模型激活函数。在训练过程中将输入加入模型中计算得到当前神经网络参数条件下的预测输出
Figure GDA0002624546990000111
并结合损失函数计算损失值,损失函数为交叉熵
Figure GDA0002624546990000112
同时,与步骤(二)中LSTM神经网络类似的,为了增强神经网络的泛化能力,使用在LSTM神经层间增加Dropout层作为模型正则化的方法减少其在训练过程中出现的过拟合现象。进一步的,由于LSTM模型在时间维度上存在大量计算,传统的随机梯度下降法的训练效果一般较差,因此采用Adam梯度下降算法对模型进行训练。

Claims (4)

1.一种基于多源数据特征提取的交通拥堵持续时间预测方法,其特征在于,所述方法包括如下步骤:
步骤一、基于多源数据的特征提取,其包括如下子步骤;
S101:获取固定检测器数据,浮动车数据,并将其分别存入固定检测器数据集和浮动车数据集;S102:提取浮动车数据集中车辆数据,根据其中车辆牌号,车辆位置信息数据,将其与固定检测器获取的车辆数据进行匹配,并存入数据集中;S103:将固定检测器获取的数据与浮动车上传的GPS数据结合进行交通特征提取,其具体方法为:提取固定检测器检测到车辆通过的时间,将其按照时间先后顺序插入浮动车上传的GPS数据中,得到车辆轨迹数据;S104:根据车辆行驶的轨迹
Figure FDA0002624546980000011
以及车辆通过轨迹上各点的具体时间
Figure FDA0002624546980000012
其中i为车辆编号,j为车辆轨迹点的编号;i=1,2,3,...,j=1,2,3,...;得到车辆在道路上任意两个轨迹点之间的行驶速度
Figure FDA0002624546980000013
代表车辆i在轨迹点j与j+1之间的车辆平均行驶速度,
Figure FDA0002624546980000014
表示为:
Figure FDA0002624546980000015
S105:根据道路特征数据中车道数数据,将车道数发生改变的位置作为路段划分的节点,并按照固定距离为依据划分道路路段,其具体做法为:将道路上车道数发生改变或存在道路交叉的地点作为道路路段划分边界,并将道路长度过长的路段沿固定距离划分为小段;S106:以固定时间长度Δt为时间间隔,将车辆通过路段的时间划分为Δt的时间段,并根据车辆通过轨迹点时间
Figure FDA0002624546980000016
将车辆轨迹时间划分至不同时间段内,并结合S105划分的路段将车辆轨迹划分至不同路段,由此可以将车辆在任意轨迹点处的行驶状态归入固定路段固定时间段中;S107:对S104获得的车辆在任意两个连续的轨迹点j和j+1之间的行驶速度
Figure FDA0002624546980000017
在时间及空间维度取平均得到任一时间段内路段平均速度,即将其按照S105划分的路段分隔开,并计算路段上的平均速度
Figure FDA0002624546980000018
其中k表示S105划分得到的路段编号,上标t表示平均速度
Figure FDA0002624546980000019
属标号为t的时间段内,则路段平均速度
Figure FDA00026245469800000110
其中,m为时间段t内路段k上通过的车辆总数,n为时间段t内路段k上通过的车辆的轨迹点数,N表示时间段t内路段k上所有通过车辆的轨迹点总数,S108:从道路特征数据集及天气数据集中获取每一时间段内每一路段上的道路及天气特征数据,其中包括路段车道数目nl,与上下游车道是否存在瓶颈0/1,其中0表示不存在交通瓶颈,1表示存在交通瓶颈,降雨量p,并结合S107获得的路段平均速度数据
Figure FDA0002624546980000021
构建深度神经网络的输入;
步骤二、基于道路特征的交通拥堵状态预测
使用考虑道路特征的长短期记忆网络LSTM的深度学习对交通拥堵状态进行预测,其网络输入包括一个包括路段平均速度数据
Figure FDA0002624546980000022
时间段编号t,路段车道数目nl,是否存在瓶颈0/1及降雨量p的向量,即向量
Figure FDA0002624546980000023
其中bottleneck为0或1的量,表示是否存在瓶颈,当bottleneck为0时,表示不存在瓶颈,当bottleneck为1时表示存在瓶颈;记忆网络LSTM的有标签的训练数据中,将交通拥堵分为5个状态,并以数字0,1,2,3,4表示,其中0表示道路畅通不存在拥堵现象,4表示道路严重堵塞,车辆无法通过;在训练过程中将输入加入模型中计算得到当前参数下的预测输出
Figure FDA0002624546980000024
并结合损失函数计算损失值;
步骤三、基于多源数据特征提取的交通拥堵持续时间预测
首先对步骤二中预测得到的交通拥堵状态进行判断,当预测得到的交通拥堵状态为0时,不对其交通拥堵持续时间进行预测;当交通拥堵状态为1,2,3,4时,对其交通拥堵持续时间进行预测;所述交通拥堵持续时间预测采用的预测模型为在步骤二中模型的输入的基础上增加交通拥堵状态,即基于多源数据特征提取的交通拥堵持续时间预测方法的输入为
Figure FDA0002624546980000025
其中state表示交通拥堵的状态,其值取为1,2,3,4;模型的输出为交通拥堵持续的时间tc,即y=tc;在模型训练过程中使用道路上发生交通拥堵时实际测得的交通拥堵时间作为交通拥堵预测模型的输出标签。
2.根据权利要求1所述的一种基于多源数据特征提取的交通拥堵持续时间预测方法,其特征在于,在长短期记忆网络LSTM中,损失函数为交叉熵
Figure FDA0002624546980000026
采用三层LSTM神经层作为模型的输出结构,层间LSTM单元使用tanh函数作为激活函数;在LSTM神经层间增加Dropout层作为模型正则化的方法。
3.根据权利要求1所述的一种基于多源数据特征提取的交通拥堵持续时间预测方法,其特征在于,在长短期记忆网络LSTM中,采用Adam梯度下降算法对模型进行训练。
4.根据权利要求1所述的一种基于多源数据特征提取的交通拥堵持续时间预测方法,其特征在于,在长短期记忆网络LSTM中,在模型输出层增加sigmoid函数作为模型输出层激活函数。
CN201811227002.9A 2018-10-22 2018-10-22 一种基于多源数据特征提取的交通拥堵持续时间预测方法 Expired - Fee Related CN109191849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811227002.9A CN109191849B (zh) 2018-10-22 2018-10-22 一种基于多源数据特征提取的交通拥堵持续时间预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811227002.9A CN109191849B (zh) 2018-10-22 2018-10-22 一种基于多源数据特征提取的交通拥堵持续时间预测方法

Publications (2)

Publication Number Publication Date
CN109191849A CN109191849A (zh) 2019-01-11
CN109191849B true CN109191849B (zh) 2020-10-09

Family

ID=64945987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811227002.9A Expired - Fee Related CN109191849B (zh) 2018-10-22 2018-10-22 一种基于多源数据特征提取的交通拥堵持续时间预测方法

Country Status (1)

Country Link
CN (1) CN109191849B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109993356A (zh) * 2019-03-25 2019-07-09 广东工业大学 一种基于xgboost的交通优化系统及方法
CN110335465A (zh) * 2019-07-10 2019-10-15 北京维联众诚科技有限公司 基于ai深度学习的监控视频中交通拥堵检测方法和系统
CN110889427B (zh) * 2019-10-15 2023-07-07 同济大学 一种拥堵交通流溯源分析方法
CN110827540B (zh) * 2019-11-04 2021-03-12 黄传明 一种多模态数据融合的机动车移动模式识别方法及系统
CN110942642B (zh) * 2019-11-20 2021-01-19 中科视元科技(杭州)有限公司 一种基于视频的交通缓驶检测方法及系统
CN111462485A (zh) * 2020-03-31 2020-07-28 电子科技大学 一种基于机器学习的交通路口拥堵的预测方法
CN111680745B (zh) * 2020-06-08 2021-03-16 青岛大学 一种基于多源交通大数据融合的突发拥堵判别方法及系统
CN112598907B (zh) * 2020-12-17 2021-12-07 东风商用车有限公司 拥堵预测方法、装置、设备及可读存储介质
CN113160570A (zh) * 2021-05-27 2021-07-23 长春理工大学 一种交通拥堵预测方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200090B (zh) * 2014-08-27 2017-07-14 百度在线网络技术(北京)有限公司 基于多源异构数据的预测方法和装置
CN105702041A (zh) * 2016-04-21 2016-06-22 东南大学 基于神经网络的高速公路多源数据融合状态估计系统及方法
CN106971536A (zh) * 2017-04-17 2017-07-21 武汉云砥信息科技有限公司 一种融合浮动车与路侧视频的高速公路拥堵状态检测方法
CN107967803A (zh) * 2017-11-17 2018-04-27 东南大学 基于多源数据及变权重组合预测模型的交通拥堵预测方法
CN108629973A (zh) * 2018-05-11 2018-10-09 四川九洲视讯科技有限责任公司 基于固定检测设备的路段交通拥堵指数计算方法

Also Published As

Publication number Publication date
CN109191849A (zh) 2019-01-11

Similar Documents

Publication Publication Date Title
CN109191849B (zh) 一种基于多源数据特征提取的交通拥堵持续时间预测方法
CN104778834B (zh) 一种基于车辆gps数据的城市道路交通拥堵判别方法
CN103839409B (zh) 基于多断面视觉传感聚类分析的交通流状态判别方法
CN104157139B (zh) 一种交通拥堵预测方法及可视化方法
Liu et al. Bus arrival time prediction based on LSTM and spatial-temporal feature vector
CN103177570B (zh) 一种早晚高峰交通拥堵指数的预测方法
CN107742193A (zh) 一种基于时变状态转移概率马尔可夫链的行车风险预测方法
CN104778835B (zh) 一种高等级道路多瓶颈点拥堵演化时空范围识别方法
CN107085943B (zh) 一种道路旅行时间短期预测方法和系统
CN101706996A (zh) 一种基于信息融合的高速公路交通状态识别方法
CN107845260B (zh) 一种用户公交出行方式的识别方法
CN111145544B (zh) 一种基于拥堵蔓延消散模型的行程时间及路径预测方法
CN105469602A (zh) 一种基于ic卡数据的公交乘客候车时间范围的预测方法
CN108765940A (zh) 基于高阶马尔科夫模型的道路拥塞发现方法
CN106297296B (zh) 一种基于稀疏轨迹点数据的细粒度旅行时间分配方法
CN110182217A (zh) 一种面向复杂超车场景的行驶任务复杂度量化评估方法
CN108648445A (zh) 基于交通大数据的动态交通态势预测方法
CN109489679B (zh) 一种导航路径中的到达时间计算方法
CN106683442A (zh) 基于多指标的交叉口信号配时方案评价方法
CN112926768A (zh) 基于时空注意力机制的地面道路车道级交通流预测方法
CN109887279A (zh) 一种交通拥堵预测方法及系统
CN109493449A (zh) 一种基于货车gps轨迹数据和高速交易数据的货车载货状态估计方法
Wang et al. ARIMA model and few-shot learning for vehicle speed time series analysis and prediction
CN105575120A (zh) 面向道路实时速度计算的浮动车数据停车行为模式清洗方法
Prontri et al. Traffic signal control using fuzzy logic

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201009

Termination date: 20211022