背景技术
浮动车(Float Car),也被称作“探测车(Probe car)”,是近年来国际智能交通系统(ITS)中所采用的获取道路交通信息的先进技术手段之一。其基本原理是:根据装备车载全球定位系统的浮动车在其行驶过程中定期记录的车辆位置,方向和速度信息,应用地图匹配、路径推测等相关的计算模型和算法进行处理,使浮动车位置数据和城市道路在时间和空间上关联起来,最终得到浮动车所经过道路的车辆行驶速度以及道路的行车旅行时间等交通拥堵信息。如果在城市中部署足够数量的浮动车,并将这些浮动车的位置数据通过无线通讯系统定期、实时地传输到一个信息处理中心,由信息中心综合处理,就可以获得整个城市动态、实时的交通拥堵信息。
浮动车数据采集技术(Floating Car Data,FCD)具有安装成本低、维护简易、高效、实时、自动化水平高、检测参数全面等优点,得到了大量推广应用。目前各大中城市都建立了ITS平台并配置了大量的基于出租车或公交车的浮动车设备,其采集到的交通信息数据可以应用于交通状态估计、预测等交通信息服务领域。
交通状态判别通常由浮动车交通信息采集、GPS原始数据预处理、GPS\GIS地图匹配、交通状态参数估计、交通状态判别几个步骤组成:
浮动车交通信息采集系统主要由车载GPS设备、无线通信网络和基于GIS的交通信息处理平台等组成。车载GPS设备接收卫星信号并通过无线通信网络将车辆坐标、速度等数据传送到交通信息中心。基于GIS的交通信息处理平台是指交通信息处理与分析软件系统、数据库及计算机设备等。
GPS原始数据预处理的目的是筛除其中的异常数据,例如,FCD数据中某些数据速度值异常高或小于0;某些数据经纬度信息在一段时间内保持不变,但速度不为0;某些数据方向角异常。对这些异常数据的处理直接影响着路段交通状态参数的准确性。
GPS\GIS地图匹配将浮动车发送的GPS数据与GIS道路信息数据进行比较,用特定的算法判断出浮动车在路网上最有可能的位置,并将此FCD数据匹配到这个路段,使每一条FCD数据属于唯一路段。
交通状态参数估计是利用特定的算法将各路段上的速度数据经过计算得出该路段的状态参数,此过程需考虑浮动车数据的数据量不足等诸多因素,以达到反映路段的真实交通状态的目的。
交通状态判别是根据交通状态参数确定路段的拥堵程度,此过程一般需要考虑判断的阈值设定以及判别结果的鲁棒性。
上述技术环节中,交通状态参数(主要是指车速)估计是交通状态判别的核心技术环节,如果无法对交通状态参数进行有效、接近真实交通状态的估计,整个交通状态的判别根本无从下手。
现有的交通状态估计方法中,比较常见的比如数据排除法,其是人为的将采集到的不确定的回报信息,诸如速度较大和较小的数据、回报时间间隔较大的数据、车速小于前一回报间隔的75%的数据进行排除,这样做虽然简单,但明显的后果是往往把现实道路中真实有用的信息也一起去掉了,最后的结果是道路运行情况始终保持稳定的状态,却不能充分反映全面真实的道路交通状况。也有设置参数简单的将历史数据进行融合的估计方法,但终归存在各种各样的问题,比较难反应真实的交通状况。
发明内容
本发明的目的是解决现有技术存在的缺陷和不足,基于对浮动车数据特性的分析,引入置信度因素,着重考虑浮动车数据样本数量、车速以及交通状态在时间上的延续性,提出了一种基于置信度优化的交通状态参数(车速)估计方法。
本发明所解决的技术问题可以采用以下技术方案来实现:
一种基于置信度优化的交通状态参数估计方法,包括如下步骤:
1、对路段区间每个时段内采集到的所有浮动车车速数据设置权重值,根据权重值计算每个时段的加权平均车速以及每个时段加权平均车速的置信度;
2、对特定的某个时段,若该时段内采集到的浮动车车速数据样本量大于或等于最低样本量,则以步骤1中该时段的加权平均车速作为该时段的平均车速;
3、对特定的某个时段,若该时段内采集到的浮动车车速数据样本量小于最低样本量,则考虑上一时段加权平均车速和上一时段加权平均车速的置信度对该时段平均车速的影响,通过修正步骤1中该时段的加权平均车速,计算该时段的平均车速。
本发明中,步骤1中将浮动车的车速划分为多个速度档,对同一速度档内的车速数据使用相同的权重值,根据速度档内车速数据量比例计算每个速度档的权重值,因此数据量比例大的速度档具有更大的权重值。
为了使计算结果更接近真实路况,对根据车速数据量比例计算的权重值进行修正,高车速的速度档具有更高的修正系数,以置信高车速的数据。
步骤1中,对特定的某个时段,对该时段内每个车速数据的权重值求和,得到该时段加权平均车速的置信度。
本发明中,步骤3中采集到的该时段车速数据样本量越小,计算该时段的平均车速时,该时段加权平均车速采用的修正系数越小,上一时段加权平均车速和上一时段加权平均车速的置信度采用的修正系数越大,即该时段加权平均车速对该时段平均车速的计算结果影响越小,上一时段加权平均车速和上一时段加权平均车速的置信度对该时段平均车速的计算结果影响越大,随着该时段车速数据样本量的减小,逐步置信上一时段的数据。
该时段加权平均车速的修正系数为
上一时段加权平均车速和上一时段加权平均车速的置信度的修正系数为
其中,n为该时段采集到的浮动车车速数据样本量,n
min为最低样本量。
步骤3中,若上一时段的车速数据样本量同样小于最低样本量,则同时考虑该时段历史加权平均车速和历史加权平均车速的置信度对该时段平均车速的影响,通过修正步骤1中该时段的加权平均车速,计算该时段的平均车速,历史加权平均车速和历史加权平均车速的置信度的计算与各时段加权平均车速和加权平均车速的置信度相同。
将截至上一时段采集到的车速数据样本量连续小于最低样本量的时段数定义为上一时段的连续样本不足变量,上一时段的连续样本不足变量越大,计算该时段的平均车速时,该时段历史加权平均车速和历史加权平均车速的置信度采用的修正系数越大,上一时段加权平均车速和上一时段加权平均车速的置信度采用的修正系数越小,即历史加权平均车速和历史加权平均车速的置信度对该时段平均车速的计算结果影响越大,上一时段加权平均车速和上一时段加权平均车速的置信度对该时段平均车速的计算结果影响越小,随着上一时段连续样本不足变量的增大,逐步置信该时段的历史数据。
为了使上一时段数据还可以反映该时段的交通状态,上一时段连续样本不足变量具有可接受的最大值,该时段历史加权平均车速和历史加权平均车速的置信度的修正系数为
上一时段加权平均车速和上一时段加权平均车速的置信度的修正系数为
其中,m
0为上一时段连续样本不足变量,m
max为可接受的最大连续样本不足量,当上一时段的连续样本量不足量大于或者等于可接受的最大连续样本量不足量时,上一时段的数据已经不能反应该时段的交通状态,将不考虑上一时段数据对该时段交通状态的影响。
与现有交通状态估计算法建立在理想或有规律扰动的数据之上,不能有效消除实时浮动车信息中异常数据波动或样本量不足的影响相比,本发明对交通状态参数估计进行了以下几方面的优化:
(1)以自适应配权的手段置信多数车辆,有效减少异常数据对计算结果的影响;
(2)置信快速车辆,使计算结果更接近真实路况;
(3)参数化融合历史数据与临近时段数据,有效解决了样本量不足时交通状态参数估计的问题。
因此,大大提高了交通状态参数估计的准确度和平稳性,可有效地消除异常数据波动过大和数据量不足带来的影响。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。
本发明的核心思想在于,提供一种基于置信度优化的交通状态参数(车速)估计方法,通过引入置信度因素,着重考虑浮动车车速数据样本数量、车速以及交通状态在时间上的延续性,来克服现有的交通状态参数的估计方法无法全面反应真实交通状态参数的问题。
对城市道路交通状态进行判别时,通常是把城市的全部道路划分为多个路段区间,对每个路段区间分别进行交通状态判别,所有的路段区间的交通状态进行汇总,即可得到整个城市道路的交通状态。
对于任何一个路段区间而言,尽管最终目的是想获得该路段实时的交通状态,但实际处理中是将路段区间分为足够小的多个时段,以每个时段的交通状态替代实时的交通状态,在进行交通状态判别之前,首先需要的是对交通状态参数,这里主要是指车速进行估计,得到反应真是交通状态参数,才能准确地对交通状态进行判别。本发明涉及的是对划分好的某一具体路段区间交通状态参数的估计方法,事实上对于任何具体的路段区间,方法都是相同,了解了基本方法,即可对所有的路段区间进行估计。
在进行交通状态参数估计之前,先通过浮动车交通信息采集系统采集浮动车的车速数据,浮动车交通信息采集系统主要由车载GPS设备、无线通信网络和基于GIS的交通信息处理平台等组成,这不是本发明的主要部分,再此不再详述。
如图1所示,对于其中路段区间i的任意一个时段而言,首先是统计该路段区间该时段的车速数据的样本量n,然后根据样本量n计算该路段该时段的加权平均车速以及加权平均车速的置信度。显然,这需要对所有浮动车车速数据设置权重值,对不同车速的数据设置不同的权重值显然是不现实的,通常是根据城市交通的状况,将浮动车的车速化分为多个速度档,同一速度档中的车速数据采用相同的权重值。
不同速度档的权重值,由速度档内车速数据量比例以及速度档的车速决定,例如将车速划分为k个速度档,判别位于路段区间i上所有车速数据vi所在的速度档,并分别计数,每个速度档车速数据数量记为nk,则k档车速车辆权重wk为:
其中,Ck为修正系数,高车速的速度档具有更高的修正系数。因此,权重值的计算结果更加置信数据量比例大的速度档和高车速的速度档的车速数据,前者可有效减少异常数据对计算结果的影响,后者则是计算结果更接近真实路况。
因此,路段区间i该时段的加权平均车速:
其中,vi为该时段内的每个车速数据,wi为每个车速数据对应的权重值,wi根据车速数据vi所述的速度档权重值wk获得。
根据上述方法,路段区间i该时段加权平均车速的置信度:
其中,n为路段区间i该时段的车速数据的样本量。路段区间i每个时段的不同速度档的权重值、加权平均车速、加权平均车速的置信度皆采用上述方法进行计算。
为确保该时段采集的浮动车车速数据能反映真实路况,某时段路段区间i采集到的样本量n应不少于最低样本量nmin,nmin的值则可由概率统计、系统仿真等方法得出。这种情况下,路段区间i该时段计算的加权平均车速即可反应真实的路况,即以该时段计算的加权平均车速作为该时段的平均车速。若样本量不足,则需在融合上一时段或历史车速数据基础上,修正本时段的加权平均车速,估计该时段的平均车速,以下对样本量n不足时情况进行详细说明。
首先,对任何一个时段,将截至该时段采集到的车速数据样本量连续小于最低样本量的时段数定义为该时段的连续样本不足变量,用m对其进行表示,该时段的连续样本不足变量m=上一时段的连续样本不足量m0+1,若任何一个时段采集到的样本量充足,该时段的连续样本不足量m=0。
对特定的某个时段,在该时段的样本量不足,计算该时段浮动车的平均车速时,到底是主要考虑上一时段的车速数据还是主要考虑该时段历史车速数据,由上一时段的连续样本不足变量决定。
若上一时段的连续样本不足量m0=0,即上一时段采集的车速数据样本量大于或者等于最低样本量nmin,实际上,上一时段样本量充足时,只需融合上一时段的车速数据,考虑上一时段加权平均车速和加权平均车速置信度对该时段平均车速的影响,通过修正系数修正后,该时段的平均车速:
式中,
其中,v0为上一时段的加权平均车速,R0为上一时段加权平均车速的置信度,n为本时段采集的车速数据样本量,nmin为最低样本量。由此可见,该时段车速数据样本量越小,计算该时段的平均车速时,该时段加权平均车速采用的修正系数k越小,上一时段加权平均车速和上一时段加权平均车速的置信度采用的修正系数(1-k)越大,即该时段加权平均车速对该时段平均车速的计算结果影响越小,上一时段加权平均车速和上一时段加权平均车速的置信度对该时段平均车速的计算结果影响越大,随着该时段车速数据样本量的减小,逐步置信上一时段的数据。当该时段采集到的车速数据样本量充足时,k=1,实际上式(4)与式(2),完全采用当前时段车速数据估计交通状态参数。
若上一时段的连续样本不足量m0>0,即上一时段采集的车速数据样本量小于最低样本量nmin,实际上,上一时段样本量也不充足,除了融合上一时段的车速数据,考虑上一时段加权平均车速和加权平均车速置信度对该时段平均车速的影响外,还需要同时融合该时段历史加权平均车速和历史加权平均车速置信度对时段平均车速的影响,通过修正系数修正后,估计该时段的平均车速,因为此时由于上一时段车速数据样本量不充足,仅仅融合上一时段的车速数据已经不能反映真实的交通状态。
连续样本不足量具有可接受的最大值,其反应了在多个时段之后,上一时段车速数据是否还可以反映当前交通状态,是否需要将其融合入估计该时段的平均车速,如果上一时段连续样本不足量达到了可以接受的最大值,上一时段的车速数据已经不能反映当前的交通状态,也就无需将其融合入,估计该时段的平均车速。通常也可以将连续样本不足量具有可接受的最大值称为实时数据置信衰减参数,将其记为mmax。
因此,若m0<mmax,则需要同时融合上一时段及该时段历史车速数据估计该时段的平均车速;否则若m0≥mmax,只融合该时段历史车速数据估计该时段的平均车速,该时段平均车速:
式中,
其中,vs为历史加权平均车速,Rs为历史加权平均车速的置信度。由此可见,在该时段采集到的车速数据样本量n一定的情况下,上一时段的连续样本不足变量越大,计算该时段的平均车速时,该时段历史加权平均车速和历史加权平均车速的置信度采用的修正系数j越大,上一时段加权平均车速和上一时段加权平均车速的置信度采用的修正系数(1-j)越小,即历史加权平均车速和历史加权平均车速的置信度对该时段平均车速的计算结果影响越大,上一时段加权平均车速和上一时段加权平均车速的置信度对该时段平均车速的计算结果影响越小,随着上一时段连续样本不足变量的增大,逐步置信该时段的历史数据。当j取0时,反映临近时段样本量充足的情况,完全采用临近时段数据融合计算,式(5)与式(4)等价;当j取1时,反映多个临近时段样本量均不足的情况,则完全采用同期历史数据融合计算。式(5)中各个参数取极值时均有现实的交通情景与之对应,取一般值时则融合临近时段和历史同期数据,使交通参数估计结果尽量符合实际路况。
根据不同的数据状况,完成该时段平均车速的估计后,记录本时段的连续样本不足量,若本时段的连续样本不足量m已经大于mmax,则计为mmax;若本时段采集的浮动车车速数据样本量充足,则复位为0;否则m=m0+1,以为下一时段估计浮动车平均车速做准备。完成了该时段一个路段区间的交通状态参数估计后,即可转入下一路段区间的交通状态参数估计。
实施方式基本逻辑如图2所示,作为最优实施例,将车速分为高中低三档,0-15km/h为低速,15-30km/h为中速,30km/h以上为高速,具体实施方式如下:
①样本量统计及权重值计算
功能:为每个路段计算五分钟内高、中、低车速的权重以及总样本量
输入:
GPS匹配表
高、中、低车速值
输出:
高速车辆权重
中速车辆权重
低速车辆权重
总样本量
参数化:
高、中、低车速值
数据库操作:
读取
实现方法与流程:
客户端界面输入参数,调用数据库储存过程实现,计算公式见式(1)。
②加权平均车速和置信度计算
功能:对于每个路段使用①的结果和GPS匹配表,计算加权平均车速
输入:
GPS匹配表
高、中、低车速修正系数CH、CM、CL(本实施例中CH=0.6、CM=0.5、CL=0.4)各路段高、中、低车速权重值(即①的结果)
输出:
各路段平均车速v
各路段置信度R
参数化:
高、中、低车速修正系数CH、CM、CL
数据库操作:
读取
储存置信度R
实现方法与流程:
客户端界面输入参数,调用数据库储存过程。计算公式见发明内容式(1)、式(3)。
③判定样本量是否充足及计算修正系数k、连续样本不足量m
功能:对于每个路段,使用①的结果,判定总样本量是否充足。若充足则转⑤,若不足,则转④,同时计算k、m
输入:
各路段总样本量
最低样本量nmin
原子路段状态表
可接受的最大连续样本不足量mmax
输出:
布尔型结果(是/否)
修正系数k
上一时段的m0
参数化:
最低样本量nmin
可接受的最大连续样本不足量mmax
数据库操作:
读取
储存本时段的连续样本不足量mi
实现方法与流程:
客户端界面输入参数,调用数据库储存过程。若样本量充足,则k=1,mi=0;若不足,则参照算法发明内容式(5)计算k的值。若上一时段m0<mmax,则mi=m0+1,若上一时段m0=mmax,则mi=mmax。
④平均车速修正计算
功能:对于每个路段,使用②、③的结果,融合上一时段数据或历史数据,修正②的计算结果。
输入:
各路段平均车速v
各路段置信度R
修正系数k(即③的结果)
原子路段状态表
原子路段状态历史表
输出:
各路段优化的区间平均车速
参数化:
数据库操作:
读取
储存各路段平均车速v
实现方法与流程:
根据上一时段连续样本不足量m0,调用数据库储存过程,计算公式见式(5),公式中∑vi·wi可用输入的v·R替代。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。