CN111583628B - 基于数据质量控制的道路网重型货车交通流量预测方法 - Google Patents

基于数据质量控制的道路网重型货车交通流量预测方法 Download PDF

Info

Publication number
CN111583628B
CN111583628B CN202010227998.4A CN202010227998A CN111583628B CN 111583628 B CN111583628 B CN 111583628B CN 202010227998 A CN202010227998 A CN 202010227998A CN 111583628 B CN111583628 B CN 111583628B
Authority
CN
China
Prior art keywords
data
road
flow
traffic flow
gps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN202010227998.4A
Other languages
English (en)
Other versions
CN111583628A (zh
Inventor
王晟由
诸葛承祥
董春娇
邵春福
赵晋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CN202010227998.4A priority Critical patent/CN111583628B/zh
Publication of CN111583628A publication Critical patent/CN111583628A/zh
Application granted granted Critical
Publication of CN111583628B publication Critical patent/CN111583628B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • G08G1/012Measuring and analyzing of parameters relative to traffic conditions based on the source of data from other sources than vehicle or roadside beacons, e.g. mobile networks
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • G08G1/0145Measuring and analyzing of parameters relative to traffic conditions for specific applications for active traffic flow control

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于数据质量控制的道路网重型货车交通流量预测方法,针对GPS流量数据及收费站监测数据两种数据源划分三类数据路段,分别采取不同的预测方法。针对有GPS流量数据的路段,由于GPS数据存在获取不够全样问题,采用先分段常系数法扩样再长短时循环神经网络预测的方法。针对无GPS数据的无数据路段,采用K最近邻算法预测流量。针对收费站监测数据路段,由于数据样本全面,直接采取长短时循环神经网络算法进行预测。本发明从流量预测面对的实际工程问题出发,分析多种数据来源特征来提高数据质量,进而建立路网重型货车流量测算方法,最终形成基于数据质量控制的道路网重型货车流量。

Description

基于数据质量控制的道路网重型货车交通流量预测方法
技术领域
本发明涉及智能交通领域,具体涉及一种基于数据质量控制的道路网重型货车交通流量预测方法。
背景技术
近年来,重型货车增比逐年上升。基于现有的道路资源,重型货车的增加会导致车辆拥堵现象并影响居民的日常出行,货车与客车的交通矛盾十分突出。管理部门常常采取特殊时段限行等政策来进行调控,但往往由于数据缺失和理论支撑不足等问题导致政策效果不佳。充分利用多种数据,采取科学的理论方法,对重型货车交通流进行准确的预测,可以为解决全路网重型货车拥堵等问题提供理论支持。
目前,多源化的数据给精准的交通流量预测带来可能的同时也对交通流量预测方法提出了更高要求。重型货车由于政策要求必须安装GPS定位仪,因此可以实时监测车辆的运动轨迹,实现对有GPS数据路段的预测。但是现实中常常存在定位仪安装覆盖面不全、仪器损坏、通讯干扰、线路故障、采集频率混乱、环境影响等原因导致原始数据缺失,需要对无数据路段和有GPS交通流量数据路段进行交通流量预测。此外,收费站数据收集的便利性,可以对监测数据路段的重型货车交通流量进行预测,进而获得全路网货车交通流量。
上述三类路段数据具有质量不同和类型不同的特点,为了提高预测效果,需要分别挖掘数据特征,采用不同的方法进行针对性的预测。已有研究往往仅针对某一种路段进行分析和预测,研究不够全面,普适性不强。本方法更加全面的考虑实际工程问题,更具有实际应用价值,在整体路网的交通流预测中,重型货车的交通流量与实际流量更为接近,便于重型货车管控策略为规划人员和管理人员及时制定可靠的措施提供了理论参考依据,进而更有效的减少车祸和交通拥堵。
发明内容
为克服上述的问题,本发明目的在于提供一种基于数据质量控制的道路网重型货车交通流量预测方法。
本发明通过以下方法达到目的:
一种基于数据质量控制的道路网重型货车交通流量预测方法,包括如下步骤:
步骤1:通过重型货车的车载卫星定位装置,获得重型货车的GPS轨迹数据;
步骤2:将GPS轨迹数据根据经纬度定位到所属的路网路段上,按照指定时间间隔进行合并,得到城市路网上每个路段的小时重型货车交通流量,筛选出有GPS交通流量数据路段和无数据路段;
步骤3:收集收费站每小时所监测的重型货车出、入口流量及断面流量,形成监测数据路段;
步骤4:对步骤2筛选出的有GPS交通流量数据路段采用分段常系数法扩样及长短时循环神经网络方法进行流量预测;
步骤5:对步骤2筛选出的无数据路段采用构建K最近邻方法进行流量预测;
步骤6:对步骤3形成的监测数据路段采用长短时循环神经网络方法进行流量预测。
步骤7:汇总步骤4、步骤5、步骤6的流量预测结果,得到全路网预测流量。
在上述方案的基础上,步骤1所述GPS轨迹数据包括:记录时间、经度、纬度以及车牌号;
在上述方案的基础上,所述步骤2具体包括:将城市路网进行编号形成路段ID,将每个路段ID按照1h的时间间隔将GPS数据进行合计,形成带有路段属性和时间间隔属性的交通流量数据,筛选出有GPS交通流量数据路段和无数据路段,所述有GPS交通流量数据路段为:有GPS数据的路段;所述无数据路段为:无GPS数据的路段。
在上述方案的基础上,步骤3所述断面流量为出、入口流量之和。
在上述方案的基础上,步骤4具体包括如下步骤:
步骤41:对步骤2筛选出的有GPS交通流量数据路段按照道路等级和流量范围采用分段常系数法进行扩样。
步骤42:对扩样后的数据进行标准化处理。
步骤43:利用长短时循环神经网络方法进行交通流量预测。
步骤44:将预测后的交通流量进行反标准化处理。
步骤45:将反标准化后的数据与交通调查数据进行对比。
步骤46:采用总量控制法进行重型货车交通流量调整。
在上述方案的基础上,步骤41所述道路等级包括公路等级和城市道路等级,从公路等级和城市道路等级两方面细分10个等级;
所述公路等级包括:高速公路、一级公路、二级公路、三级公路、四级公路;
所述城市道路等级包括:快速路、主干路、次干路、支路、其他,所述其他代表不属于上述城市道路等级的其余路段。
在上述方案的基础上,步骤41具体包括如下步骤:
步骤411:将所有路段交通流量按照时间间隔进行合计;
步骤412:选择合计后最大流量的时段作为排序依据,将所有路段ID的交通流量进行降序排序;
步骤413:将排序后交通流量所呈现的分布函数进行参数估计,
yi=ke-ax+b (1)
其中,yi代表路段i的流量,x代表降序后的路段序列,k、a、b代表分布函数的估计参数;
步骤414:将所有路段按照流量进行区间分段,根据概率密度函数计算该区间下的扩样系数。
Figure BDA0002428348740000031
其中,mi,j为路段序号[i,j]区间的扩样系数。xi,xj代表序列为i,j的路段序列编号。
在上述方案的基础上,步骤42具体为:将路段ID所有流量进行筛选,选出最大交通流量,将每个交通流量与该最大交通流量的比值归一化到[0,1]区间中。
在上述方案的基础上,步骤43具体包括如下步骤:
步骤431:将所有交通流量数据分为训练集和测试集。
步骤432:设定参数。
步骤433:模型训练和调参,将模型训练到最佳状态。
步骤434:重型货车交通流量预测,将训练好的模型对测试集数据进行预测,并采用平均绝对误差(MAE)、百分比误差(MAPE)、均方根误差(RMSE)、解释方差分数(EVS)进行模型效果评估。
解释方差分数(EVS)计算公式为:
Figure BDA0002428348740000041
其中,Yt为t时刻的交通流量,
Figure BDA0002428348740000042
为t时刻的预测交通流量。
在上述方案的基础上,步骤432所述参数包括:隐藏层units大小,时间步长timesteps,每次输入样本数batch_size,激活函数,损失函数,循环步数epotch。
在上述方案的基础上,步骤5具体包括如下步骤:
步骤51:选取道路等级、车道数与宽度作为自变量,路段的交通流量作为因变量,形成数据集;
步骤52:计算目标路段与其他有流量数据路段之间的欧式距离;
步骤53:按照欧式距离进行降序排序;
步骤54:选取欧式距离最小的K组数据,将K组数据的因变量值,取平均值即可表示目标路段重型货车流量值,所述因变量值为路段货车流量。
步骤55:最后对预测结果进行评估,将均方差作为误差评估指标,当误差仍较大时,可采取更改K值的方式,使预测结果更加接近于真实情况。
在上述方案的基础上,步骤6所述对监测数据路段采用长短时循环神经网络方法的具体步骤与步骤43相同。
本发明的有益效果:
本发明所述一种基于数据质量控制的道路网重型货车交通流量预测方法,从多角度考虑多种数据类型和质量情况下的流量预测,从工程实践出发,以GPS交通流量数据和监测交通流数据的为依托,结合实际情况分析数据特点,提出针对性预测方法可以更加准确地刻画未来重型货车交通流量实际数量。为缓解重型货车交通拥堵、改善道路运行条件提供技术支持和理论参考。
附图说明
本发明有如下附图:
图1是郑州市路段分布图;
图2是高速公路交通流量排序后指数分布图;
图3是有GPS交通流量数据路段预测方法流程图;
图4是长短时循环神经网络LSTM预测效果图;
图5是原始GPS数据、扩样数据、扩样后预测数据、交通调查数据的对比示意图;
图6是K最近邻算法流程图;
图7是采用K最近邻算法得到预测与原流量对比图;
图8是采用长短时循环神经网络得到监测数据路段预测流量与原流量对比图;
图9是本发明所述基于数据质量控制的道路网重型货车交通流量预测方法流程图。
具体实施方式
以下结合附图1-9具体实施案例对本发明作进一步详细说明。
本发明所述的一种基于数据质量控制的道路网重型货车交通流量预测方法,主要包括如下步骤:
步骤1:基于车载卫星定位装置,获取郑州市重型货车GPS数据,内容包括车牌号、时间及经纬度;
步骤2:将GPS数据根据经纬度定位到郑州市路网上,并将路网划分按照道路等级和长度划分成路段,形成路段编号ID,按照1小时时间间隔将GPS数据进行合并形成交通流量数据。筛选出有GPS交通流量数据路段和无数据路段;
有GPS交通流量数据样本案例如表1所示:
表1整合GPS交通流量数据样例
Figure BDA0002428348740000061
步骤3:收集收费站每小时所监测的重型货车出、入口流量及断面流量,形成监测数据路段;监测数据路段包含位置、方向、日期、时段及流量。
收费站监测数据流量数据样本案例如表2所示:
表2收费站监测数据流量样例
Figure BDA0002428348740000062
利用Arcgis软件表示出郑州市有GPS交通流量数据路段、无数据路段、监测数据路段分布和各路段编号如附图1所示。
步骤4:对有GPS交通流量数据路段,首先采用分段常系数法扩样;
步骤4中分段常系数法是指对交通流量按照道路等级和流量范围进行系数扩样。
道路等级包括公路等级和城市道路等级,从公路等级和城市道路等级两方面细分10个等级。
所述公路的等级包括:高速公路、一级公路、二级公路、三级公路、四级公路;
所述城市道路的等级包括:快速路、主干路、次干路、支路、其他,所述其他代表不属于上述城市道路等级的其余路段。
步骤4具体包括如下步骤:
步骤41:将所有路段交通流量按照时间间隔进行合计;
以高速为例,该等级下共有存在有GPS交通流量数据路段共计379条,将该379个路段的交通流按照每个时段进行合计,合计样本案例如表3所示。
表3高速公路合计有GPS交通流量数据样例
Figure BDA0002428348740000071
从表3可以看出“hour_17”的交通流量17887的数值最大。
步骤42:将所有路段ID的交通流量以时刻“hour_17”作为排序依据进行降序排序。排序后高速公路等级下各路段的流量分布,如附图2所示;
步骤43:附图2表示将排序后高速公路等级下交通流量所呈现的指数分布函数进行参数估计,
yi=ke-ax+b (1)
其中,yi代表路段i的流量,x代表降序后的路段序列,k、a、b代表参数,附图2所估计的参数k=555.17、a=0.013、b=0。
步骤44:将图2中所有路段按照流量进行区间分段。按照降序排列后的编号,区间分别为(1,100],(100,200],(200,300],(300,417]。
步骤45:根据概率密度函数计算各区间下的扩样系数。
Figure BDA0002428348740000081
其中,mi,j为路段序号[i,j]区间的扩样系数。
附图2所示每个货车流量区间的概率密度为
Figure BDA0002428348740000082
该四个区间的货车流量占比为:
Figure BDA0002428348740000083
得到四个区间的扩样系数,分别为:72.68%,19.72%,5.39%,2.21%。
步骤5:对扩样后的有GPS交通流量数据路段采用长短时循环神经网络方法进行流量预测;流程如附图3所示。
步骤5具体包括如下步骤:
步骤51:对扩样后的数据进行标准化处理。将路段ID所有流量进行筛选,选出最大交通流量,将每个交通流量与该最大交通流量的比值归一化到[0,1]区间中;
步骤52:将标准化后的数据分为训练集和测试集。本案例中将郑州市重型货车2018年11月28号数据作为训练集,2018年12月01号数据作为测试集;
步骤53:长短时循环神经网络的存储单元与常规的神经元不同,它的每个存储单元均由输入门、输出门和遗忘门构成。LSTM输入门、输出门和遗忘门的计算公式分为:
输入门:it=σ(ωmimthiht-1cict-1+bi) (3)
遗忘门:ft=σ(ωmfmthfht-1cfct-1+bi) (4)
输出门:ot=σ(ωmoxthoht-1coct+bo) (5)
其中,it、ft、ot分别代表输入门输出、遗忘门输出、输出门输出,mt表示t时刻的输入;ht-1表示t前一时刻隐藏层的输出值;ct-1表示t前一时刻的隐藏层中间状态的输出值;ct表示隐藏层中间状态的输出值;ωmi、ωhi、ωci分别为输入门与mt的权值、输入门与ht-1权值、输入门与ct-1的权值;ωmf、ωhf、ωcf分别为遗忘门与mt的权值、遗忘门与ht-1的权值、遗忘门与ct-1的权值;ωmo、ωho、ωco分别为输出门与mt的权值、输出门与ht-1的权值、输出门与ct-1的权值;bi、bo均表示偏置项;
步骤54:设定参数;
设定包括:隐藏层units大小,时间步长timesteps,每次输入样本数batch_size,激活函数,损失函数,循环步数epotch;
步骤55:模型训练和调参,将模型训练到最佳状态。针对此次训练数据,模型最佳参数为隐藏层units为5,时间步长timesteps为5,batch_size为1,损失函数loss选择为MAE,循环步数epotch为100,激活函数为tanh。
步骤56:重型货车交通流量预测,将训练好的模型对测试集数据进行预测,并采用平均绝对误差(MAE)、百分比误差(MAPE)、均方根误差(RMSE)、解释方差分数(EVS)进行模型效果评估;
所述EVS计算公式为:
Figure BDA0002428348740000091
其中,Yt为t时刻的交通流量,
Figure BDA0002428348740000092
为t时刻的预测交通流量;
步骤57:将预测后的交通流量进行反标准化处理,得到预测交通流量数据;
步骤58:本案例获得的高速公路等级下,以路段LinkID 3423864为样例,评估该路段的的预测效果。
将该路段扩样后的交通流量与预测后的交通流量进行对比评估,两者的流量数值如附图4所示。经过统计得到,该路段扩样后的交通流量平均值为883.39/h,而预测后的交通流量平均值为889.85/h。该路段的评估参数RMSE,MAE,EVS及MAPE,如表4所示。
表4 LinkID 3423864预测后评估参数
Figure BDA0002428348740000101
解释方差分数(EVS)越接近于1,模型的拟合效果越好,而MAPE则越小代表模型效果越好。LinkID 3423864的预测效果看出EVS为0.81接近1,而且MAPE小于10,代表模型拟合效果较好。为了更好的评估预测值与真实交通流量之间的差异,将预测后的交通流量与交通调查流量进行对比;
为了验证预测后的交通流量与真实流量之间的差别,将路段LinkID 3803632的原始GPS交通流量数据、扩样数据、扩样后预测数据、交通调查流量数据进行对比,如附图5所示。
根据附图5分析出,经过扩样后预测的交通流量数据更加接近交通调查数据。
步骤59:评估有GPS交通流量数据路段的总体预测效果。
有GPS交通流量数据路段共包含10个道路等级,各路段分布如附图1所示,对各个道路等级分别进行扩样与预测的结果进行汇总。经过数据统计得知,每条路段的平均交通流量为21.32/h,扩样后流量为29.91/h,预测后的流量为31.53/h。具体如表5所示。将预测数值与扩样数值进行对比,得到评估参数RMSE,MAE,EVS及MAPE,如表5所示。
表5有GPS交通流量数据路段总体预测效果评估
Figure BDA0002428348740000102
从表5可以看出,有GPS交通流量数据路段,总体预测表示EVS为0.94,接近于1,模型拟合效果好;而且MAPE为0.32,说明模型的预测准确率高。
步骤6:对于无数据路段,采用K最近邻算法进行流量预测。K最近邻算法流程图如附图6所示。为了验证模型的有效性,选定一条LinkID为3236169且有流量的路段,假定为零流量数据路段。目的在于将预测结果可以与原流量进行对比,进而评估模型的预测效果。
步骤6具体包括如下步骤:
步骤61:根据道路路段对应表,选取道路等级、车道数与宽度作为自变量,路段的交通流量作为因变量,形成数据集。
以路段LinkID 3236169为样例进行求解,该路段的流量数据类型为GPS流量数据,由于步骤4已经对GPS流量数据进行了扩样处理,因此该路段所采用的流量数据为扩样后的GPS流量数据,同时步骤6中应用的GPS流量数据均为步骤4扩样后的GPS流量数据。该路段的道路等级为二级公路,车道数为单向两车道,车道宽度为5.5米。该路段前6个小时的交通流量,如表6所示。
表6路段ID 3236169的有流量数据
Figure BDA0002428348740000111
步骤62:计算目标路段与各个有流量数据路段之间的欧式距离;欧氏距离的公式为:
Figure BDA0002428348740000112
其中,l代表路等级、车道数与宽度,p代表零数据的目标路段,q代表有数据的路段,D代表欧式距离。有流量数据路段包括扩样后的GPS流量路段和收费站监测流量路段。
步骤63:按照欧式距离进行降序排序;
步骤64:选取欧式距离最小的50组数据,将50组数据的交通流量取平均值即可表示测试数据的路段重型货车流量值。路段ID3236169的预测结果如表7所示。该路段每个小时的GPS流量数据及预测后的流量数据如附图7所示。
表7路段ID 3236169的预测结果
Figure BDA0002428348740000121
通过对比KNN算法测算出的流量与实际流量,得出50个路段的均方误差(MSE)、平均绝对误差(MAE)与均方根误差(RMSE)。如表8所示。
表8路段ID 3236169的预测评估效果
Figure BDA0002428348740000122
从表8可以看出,模型的平均绝对百分比误差MAPE为12.91,预测准确率为87.09%,模型预测效果较好,同时模型预测效果符合预期,不再做K值调整。
步骤64:对无数据路段的总体进行预测。
由于步骤63验证了KNN模型预测效果的可行性,因此对郑州市路网内无数据路段的总体进行流量预测。无数据路段共有32594个,路段分布如附图1所示。预测后得到郑州市路网无数据路段的流量平均值为29.57/h/路段。
步骤7:对监测数据路段采用长短时循环神经网络方法进行流量预测。
对收费站交通流量进行预测,模型最佳参数为隐藏层units为9,时间步长timesteps为3,batch_size为1,损失函数loss选择为MAE,循环步数epotch为500,激活函数为tanh。
以郑州南收费站出口为样例评估预测效果。该收费站下原始监测流量数据及预测后的流量数据对比如附图8所示,该收费站的原始监测流量平均值为10.70/h,预测后平均流量为11.69/h。该收费站监测路段的评估结果如表9所示。
表9郑州南收费站出口预测评估结果
Figure BDA0002428348740000131
从表9可以看出,郑州南收费站出口的的评估参数中,平均绝对百分比误差MAPE为6.84,预测精度R2为93.54%,表示该预测模型具有很好的预测效果。
对于郑州市全路网的监测数据路段总体进行预测。郑州市共有54个收费站监测数据路段,分布如附图1所示。将每个路段的预测结果进行汇总,得到监测数据路段总体预测参数评估值如表10所示。
表10监测数据路段总体预测效果评估
Figure BDA0002428348740000132
从表10中可以看出,监测数据路段总体预测的评估参数中,平均绝对百分比误差MAPE为8.32,预测精度R2为92.80%,以上评估参数表明该模型具有较高的预测精度。
步骤8:针对有GPS交通流量数据路段,无数据路段及监测数据路段共三类数据分别采用三种交通流预测方法对全路网进行流量预测,对全路网预测结果进行汇总并评估。
汇总得到郑州市的全路网预测流量评估结果如表11所示。由于无数据路段没有流量数据,无法计算MAPE和RMSE,因此,全路网的评估参数MAPE、RMSE由有GPS交通流量数据路段和监测数据路段汇总后获得。从表11中可以看出,无数据路段预测后得到了平均29.57/h的流量值,填补了流量数据的空白,可以为未来流量的监控和政策管控提供参考。此外由表11可知,本发明提出的方法可实现全路网范围内重型货车交通流量预测精度为93.46%。
表11全路网预测结果
Figure BDA0002428348740000133
Figure BDA0002428348740000141
以上详细描述了本发明的实施方式,同时不限于说明书实施方案中细节,在本发明的构思范围内,可以进行多种等同变换,这些等同变换都属于在本发明的保护范围之内。
本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (8)

1.一种基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,包括如下步骤:
步骤1:通过重型货车的车载卫星定位装置,获得重型货车的GPS轨迹数据;
步骤2:将GPS轨迹数据根据经纬度定位到所属的路网路段上,按照指定时间间隔进行合并,得到城市路网上每个路段的小时重型货车交通流量,筛选出有GPS交通流量数据路段和无数据路段;
步骤3:收集收费站每小时所监测的重型货车出、入口流量及断面流量,形成监测数据路段;
步骤4:对步骤2筛选出的有GPS交通流量数据路段采用分段常系数法扩样及长短时循环神经网络方法进行流量预测;
步骤5:对步骤2筛选出的无数据路段采用构建K最近邻方法进行流量预测;
步骤6:对步骤3形成的监测数据路段采用长短时循环神经网络方法进行流量预测;
步骤7:汇总步骤4、步骤5、步骤6的流量预测结果,得到全路网预测流量;
步骤4具体包括如下步骤:
步骤41:对步骤2筛选出的有GPS交通流量数据路段按照道路等级和流量范围采用分段常系数法进行扩样;
步骤42:对扩样后的数据进行标准化处理;
步骤43:利用长短时循环神经网络方法进行交通流量预测;
步骤44:将预测后的交通流量进行反标准化处理;
步骤45:将反标准化后的数据与交通调查数据进行对比;
步骤46:采用总量控制法进行重型货车交通流量调整;
步骤41具体包括如下步骤:
步骤411:将所有路段交通流量按照时间间隔进行合计;
步骤412:选择合计后最大流量的时段作为排序依据,将所有路段ID的交通流量进行降序排序;
步骤413:将排序后交通流量所呈现的分布函数进行参数估计,yi=ke-ax+b (1)
其中,yi代表路段i的流量,x代表降序后的路段序列,k、a、b代表分布函数的估计参数;
步骤414:将所有路段按照流量进行区间分段,根据概率密度函数计算该区间下的扩样系数;
Figure FDA0002965970660000021
其中,mi,j为路段序号[i,j]区间的扩样系数;xi,xj代表序列为i,j的路段序列编号。
2.如权利要求1所述的基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,步骤1所述GPS轨迹数据包括:记录时间、经度、纬度以及车牌号。
3.如权利要求1所述的基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,所述步骤2具体包括:将城市路网进行编号形成路段ID,将每个路段ID按照1h的时间间隔将GPS数据进行合计,形成带有路段属性和时间间隔属性的交通流量数据,筛选出有GPS交通流量数据路段和无数据路段,所述有GPS交通流量数据路段为:有GPS数据的路段;所述无数据路段为:无GPS数据的路段。
4.如权利要求1所述的基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,步骤3所述断面流量为出、入口流量之和。
5.如权利要求1所述的基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,步骤41所述道路等级包括公路等级和城市道路等级,从公路等级和城市道路等级两方面细分10个等级;
所述公路等级包括:高速公路、一级公路、二级公路、三级公路、四级公路;
所述城市道路等级包括:快速路、主干路、次干路、支路、其他,所述其他代表不属于上述城市道路等级的其余路段。
6.如权利要求1所述的基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,步骤42具体为:将路段ID所有流量进行筛选,选出最大交通流量,将每个交通流量与该最大交通流量的比值归一化到[0,1]区间中。
7.如权利要求6所述的基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,步骤43具体包括如下步骤:
步骤431:将所有交通流量数据分为训练集和测试集;
步骤432:设定参数;
步骤433:模型训练和调参,将模型训练到最佳状态;
步骤434:重型货车交通流量预测,使用训练好的模型对测试集数据进行预测,并采用平均绝对误差、百分比误差、均方根误差、解释方差分数进行模型效果评估;
解释方差分数计算公式为:
Figure FDA0002965970660000031
其中,Yt为t时刻的交通流量,
Figure FDA0002965970660000032
为t时刻的预测交通流量;
步骤432所述参数包括:隐藏层大小,时间步长,每次输入样本数,激活函数,损失函数,循环步数。
8.如权利要求1所述的基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,步骤5具体包括如下步骤:
步骤51:选取道路等级、车道数与宽度作为自变量,路段的交通流量作为因变量,形成数据集;
步骤52:计算目标路段与其他有流量数据路段之间的欧式距离;
步骤53:按照欧式距离进行降序排序;
步骤54:选取欧式距离最小的K组数据,将K组数据的因变量值,取平均值即可表示目标路段重型货车流量值,所述因变量值为路段货车流量;
步骤55:最后对预测结果进行评估,将均方差作为误差评估指标,当平均绝对百分误差MAPE大于12.91时,可采取更改K值的方式,使预测结果更加接近于真实情况。
CN202010227998.4A 2020-03-27 2020-03-27 基于数据质量控制的道路网重型货车交通流量预测方法 Expired - Fee Related CN111583628B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010227998.4A CN111583628B (zh) 2020-03-27 2020-03-27 基于数据质量控制的道路网重型货车交通流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010227998.4A CN111583628B (zh) 2020-03-27 2020-03-27 基于数据质量控制的道路网重型货车交通流量预测方法

Publications (2)

Publication Number Publication Date
CN111583628A CN111583628A (zh) 2020-08-25
CN111583628B true CN111583628B (zh) 2021-05-11

Family

ID=72126098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010227998.4A Expired - Fee Related CN111583628B (zh) 2020-03-27 2020-03-27 基于数据质量控制的道路网重型货车交通流量预测方法

Country Status (1)

Country Link
CN (1) CN111583628B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112396837A (zh) * 2020-11-13 2021-02-23 重庆中信科信息技术有限公司 基于交通大数据的拥堵区域车辆来源路径分析方法和系统
CN112785841B (zh) * 2020-12-25 2022-05-06 北京中交兴路信息科技有限公司 判断货车行驶路线拥堵状态的方法及装置
CN112767690B (zh) * 2020-12-27 2022-03-29 交通运输部规划研究院 一种基于断面调查数据的区域路网重型货车流量估算方法
CN115311846B (zh) * 2022-06-24 2023-08-11 华东师范大学 一种结合货车任务状态的厂区道路拥堵预测方法及预测系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104658252B (zh) * 2015-02-10 2017-05-17 交通运输部科学研究院 基于多源数据融合的高速公路交通运行状态的评估方法
CN105590346B (zh) * 2016-02-18 2018-01-16 华南理工大学 基于路径识别系统的收费公路网交通信息采集与诱导系统
CN108062561B (zh) * 2017-12-05 2020-01-14 华南理工大学 一种基于长短时记忆网络模型的短时数据流预测方法
CN109544932B (zh) * 2018-12-19 2021-03-19 东南大学 一种基于出租车gps数据与卡口数据融合的城市路网流量估计方法
CN109800916B (zh) * 2019-01-23 2021-04-23 山东省交通规划设计院有限公司 一种高速公路服务区驶入车流量的建模方法
CN110264709B (zh) * 2019-05-06 2021-02-12 北京交通大学 基于图卷积网络的道路的交通流量的预测方法

Also Published As

Publication number Publication date
CN111583628A (zh) 2020-08-25

Similar Documents

Publication Publication Date Title
CN111583628B (zh) 基于数据质量控制的道路网重型货车交通流量预测方法
Wang et al. Truck traffic flow prediction based on LSTM and GRU methods with sampled GPS data
CN114783183B (zh) 一种基于交通态势算法的监控方法与系统
Lin et al. A review of travel-time prediction in transport and logistics
De Fabritiis et al. Traffic estimation and prediction based on real time floating car data
CN107330217B (zh) 一种基于rbfnn的中观油耗预测方法
CN109376935B (zh) 一种基于神经网络的公交客流分时段组合预测方法
Li et al. Identifying important variables for predicting travel time of freeway with non-recurrent congestion with neural networks
CN109215350A (zh) 一种基于rfid电子车牌数据的短期交通状态预测方法
CN110675626B (zh) 基于多维数据的交通事故黑点预测方法、装置及介质
CN113436433B (zh) 一种高效的城市交通离群值检测方法
CN114187766B (zh) 一种基于饱和率的道路服务水平评价方法
CN115691120A (zh) 一种基于高速公路流水数据的拥堵识别方法及系统
CN117273964B (zh) 一种自适应行驶数据的智能车险策略生成系统及方法
Chen et al. Adaptive ramp metering control for urban freeway using large-scale data
CN118230546A (zh) 一种基于多源数据的城市绿色交通管理系统及方法
CN112767686B (zh) 一种基于多源数据融合的公路网汽车排放估算方法
Jintanakul et al. Bayesian mixture model for estimating freeway travel time distributions from small probe samples from multiple days
CN110956808B (zh) 一种基于非全样定位数据的重型货车交通流量预测方法
CN116453352A (zh) 一种基于k聚类算法和神经网络的货车交通流量预测方法
Othman et al. A novel approach to traffic flow estimation based on floating car data and road topography: Experimental validation in Lyon, France
CN115830855A (zh) 一种基于双状态划分的高速公路路段通行时间预测方法
Jammula et al. Travel time prediction modelling in mixed traffic conditions
Oh Anonymous vehicle tracking for real-time traffic performance measures
Xu et al. A New Design of Real-Time Traffic Index Model for Freeway

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210511