CN106033643A - 一种数据处理方法及装置 - Google Patents

一种数据处理方法及装置 Download PDF

Info

Publication number
CN106033643A
CN106033643A CN201510104728.3A CN201510104728A CN106033643A CN 106033643 A CN106033643 A CN 106033643A CN 201510104728 A CN201510104728 A CN 201510104728A CN 106033643 A CN106033643 A CN 106033643A
Authority
CN
China
Prior art keywords
data
journey time
section
time
convergence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510104728.3A
Other languages
English (en)
Other versions
CN106033643B (zh
Inventor
任旭
姜荣鑫
胡兆兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Group Liaoning Co Ltd
Original Assignee
China Mobile Group Liaoning Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Group Liaoning Co Ltd filed Critical China Mobile Group Liaoning Co Ltd
Priority to CN201510104728.3A priority Critical patent/CN106033643B/zh
Publication of CN106033643A publication Critical patent/CN106033643A/zh
Application granted granted Critical
Publication of CN106033643B publication Critical patent/CN106033643B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Traffic Control Systems (AREA)

Abstract

本发明实施例公开了一种数据处理方法及装置;其中,所述方法包括:获取第一数据和第二数据;所述第一数据表征基于浮动车采集的第一路段的交通数据;所述第二数据表征基于固定检测器采集的所述第一路段的交通数据;基于所述第一数据获得所述第一路段的第一行程时间;基于所述第二数据获得所述第一路段的第二行程时间;确定融合参数,基于所述融合参数对所述第一行程时间和所述第二行程时间按预设融合方式进行融合估计,获得基于所述融合参数表征的第三数据;所述第三数据表征所述第一路段的行程时间的先验概率的估计;确定所述第三数据满足第一收敛条件时,将所述第三数据所对应的行程时间作为所述第一路段的行程时间。

Description

一种数据处理方法及装置
技术领域
本发明涉及数据处理技术,具体涉及一种数据处理方法及装置。
背景技术
路段行程时间作为评价路段交通运行状况重要指标,能够直观反映当前路网的拥挤水平;作为动态路网阻抗计算的基本信息,能够帮助交通控制中心获取优化路径,从而实现有效的动态路径诱导,是先进的交通信息服务系统的重要基础。
路段行程时间的动态估计主要依赖于交通数据的实时采集,目前,较为常用的交通数据采集方法包括浮动车数据采集和固定检测器数据采集。但是,浮动车难以在时间上得到连续有效的数据,且采集到的数据精度受车载GPS精度、浮动车空载或任意停车等影响较大,使得基于浮动车采集的数据的路段行程时间估计精度较难给出可靠度一致的交通信息。固定检测器采集的数据的样本量大、精确度高,因此结合统计学和交通工程学速度-密度关系模型,基于固定检测器数据能够对路段行程时间进行较为准确估计。固定检测器则能够弥补浮动车在数据采集精度、数据连续采集等方面的缺陷,实现在连续时间间隔内高精度、大样本的交通数据检测。然而,固定检测器铺设在城市主干路网的特定位置上,因此固定检测器有限的空间覆盖率同样影响了路段行程时间的估计精度。
基于浮动车和固定检测器在空间覆盖、时间分布等方面的互补特征,现有技术采用数据融合技术对浮动车采集的数据和固定检测器采集的数据进行融合,从而减少路段行程时间的估计误差。目前常用的数据融合算法如传统的贝叶斯融合估计算法,忽略了城市路网交通运行状态的复杂性,仅利用统计学原理实现两种检测数据的融合处理,难以保证整个城市路网(空间范围内)以及连续时间段(时间范围内)路段行程时间估计的精确度以及稳定性。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种数据处理方法及装置,能够提高路段行程时间的动态估计的精确度及稳定性。
为达到上述目的,本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种数据处理方法,所述方法包括:
获取第一数据和第二数据;所述第一数据表征基于浮动车采集的第一路段的交通数据;所述第二数据表征基于固定检测器采集的所述第一路段的交通数据;
基于所述第一数据获得所述第一路段的第一行程时间;基于所述第二数据获得所述第一路段的第二行程时间;
确定融合参数,基于所述融合参数对所述第一行程时间和所述第二行程时间按预设融合方式进行融合估计,获得基于所述融合参数表征的第三数据;所述第三数据表征所述第一路段的行程时间的先验概率的估计;
确定所述第三数据满足第一收敛条件时,将所述第三数据所对应的行程时间作为所述第一路段的行程时间;其中,所述第一收敛条件包括:具有同一空间属性和时间属性的历史数据统计特征。
上述方案中,所述方法还包括:确定所述第三数据不满足第一收敛条件时,判断所述第三数据是否满足第二收敛条件;确定所述第三数据满足第二收敛条件时,将历史数据中所述第一路段的先验概率的最大值作为第四数据替换所述第三数据,将所述第四数据所对应的行程时间作为所述第一路段的行程时间。
上述方案中,所述方法还包括:确定所述第三数据不满足第二收敛条件时,确定所述第一行程时间和所述第二行程时间中精度较低的行程时间,将所述第三数据对应的所述第一路段的行程时间替换所述精度较低的行程时间,基于替换后的行程时间再按预设融合方式进行融合估计。
上述方案中,所述第一数据包括:时间戳、位置坐标、方向和瞬时速度;相应的,所述基于所述第一数据获得所述第一路段的第一行程时间,包括:
所述第一行程时间满足如下表达式:
t ^ 1 ( k ) = ( 1 - f ( k ) ) t ^ 1 ( k - 1 ) + f ( k ) 1 n ( k ) Σ m = 1 n ( k ) t k m ;
其中,为第i路段的第k个统计时间内的行程时间的估计值;为第i路段的第k-1个统计时间内的行程时间的估计值;f(k)为第k个统计时间的指数平滑系数;n(k)代表第i路段在第k个统计时间内的样本个数;代表第i路段在第k个统计时间内第m个样本的行程时间值;其中,f(k)满足如下表达式:
f ( k ) = 1 1 + σ ϵ ( k ) 2 n ( k ) · ( σ ϵ ( k - 1 ) 2 + σ η ( k ) 2 ) ;
其中,为第i路段在第k个统计时间内行程时间方差,为第i路段在第k-1个统计时间内行程时间估计误差的平方,是以第i路段在第k-1个统计时间内平均值作为其在第k个统计时间内行程时间真值时第k个统计时间内行程时间估计误差的平方;
σ ϵ ( k ) 2 = Σ i = 1 n ( k ) ( t i ( k ) - t ‾ ( k ) ) 2 ; σ ϵ ( k - 1 ) 2 = ( t ^ ( k - 1 ) - t ‾ ( k - 1 ) ) 2 ; σ η ( k ) 2 = ( t ^ ( k ) - t ‾ ( k - 1 ) ) 2 ;
其中,分别为第k个统计时间和第k-1个统计时间的行程时间原始估计结果的平均值,ti(k)为第i个样本的行程时间,为第k个统计时间的行程时间估计值。
上述方案中,所述第二数据包括:路段流量、道路占用率、瞬时速度和排队长度;相应的,所述基于所述第二数据获得所述第一路段的第二行程时间,包括:
所述第二行程时间满足如下表达式:
T=TR+TS
其中,TR为所述第一路段的行程时间;TS为平均延误,所述平均延误包括车辆均匀到达产生的均匀延误d1和车辆随机到达且引发超出饱和周期所产生的随机附加延误d2
上述方案中,所述确定融合参数,包括:基于行程时间的概率密度函数满足对数正态分布X~Lognormal(μ,σ2),且先验概率μ满足正态分布确定融合参数为μ0和σ2
相应的,所述基于所述融合参数对所述第一行程时间和所述第二行程时间按预设融合方式进行融合估计,获得基于所述融合参数表征的第三数据,包括:
所述第三数据满足如下表达式:
μ ^ = μ 0 σ 0 2 + σ 2 Σ i = 1 n x i σ 0 2 + n σ 2 ;
其中,表示先验数据的估计值;xi表示样本值,n为样本个数,μ0分别为先验概率正态分布的均值和方差,σ为对数正态分布的方差。
上述方案中,所述确定所述第三数据满足第一收敛条件,包括:
在所述第一路段的行程时间范围中,当第一行程时间范围对应的先验概率的总和达到第一预设阈值时,确定所述第三数据满足第一收敛条件;
相应的,所述确定所述第三数据不满足第一收敛条件,包括:当第一行程时间范围对应的先验概率的估计值的总和未达到第一预设阈值时,确定所述第三数据不满足第一收敛条件;其中,所述第一行程时间范围为所述第一路段的行程时间范围中的任一行程时间范围。
上述方案中,所述判断所述第三数据是否满足第二收敛条件,包括:判断所述第三数据与上一次融合估计获得的第三数据进行比较;当所述第三数据与上一次融合估计获得的第三数据进行比较结果小于第二预设阈值时,确定所述第三数据满足第二收敛条件;当所述第三数据与上一次融合估计获得的第三数据进行比较结果不小于第二预设阈值时,确定所述第三数据不满足第二收敛条件。
上述方案中,所述确定所述第一行程时间和所述第二行程时间中精度较低的行程时间,包括:获得所述第一行程时间与所述第三数据对应的所述第一路段的行程时间的第一欧式距离;获得所述第二行程时间与所述第三数据对应的所述第一路段的行程时间的第二欧式距离;
将所述第一欧式距离和所述第二欧式距离中数值较小的欧氏距离所对应的行程时间作为所述精度较低的行程时间。
本发明实施例还提供了一种数据处理装置,所述装置包括:数据获取单元、计算单元、融合处理单元和判定单元;其中,
所述数据获取单元,用于获取第一数据和第二数据;所述第一数据表征基于浮动车采集的第一路段的交通数据;所述第二数据表征基于固定检测器采集的所述第一路段的交通数据;
所述计算单元,用于基于所述第一数据获得所述第一路段的第一行程时间;基于所述第二数据获得所述第一路段的第二行程时间;
所述融合处理单元,用于确定融合参数,基于所述融合参数对所述第一行程时间和所述第二行程时间按预设融合方式进行融合估计,获得基于所述融合参数表征的第三数据;所述第三数据表征所述第一路段的行程时间的先验概率的估计;
所述判定单元,用于确定所述第三数据满足第一收敛条件时,将所述第三数据所对应的行程时间作为所述第一路段的行程时间。
上述方案中,所述判定单元,还用于确定所述第三数据不满足第一收敛条件时,判断所述第三数据是否满足第二收敛条件;确定所述第三数据满足第二收敛条件时,将历史数据中所述第一路段的先验概率的最大值作为第四数据替换所述第三数据,将所述第四数据所对应的行程时间作为所述第一路段的行程时间。
上述方案中,所述判定单元,还用于确定所述第三数据不满足第二收敛条件时,确定所述第一行程时间和所述第二行程时间中精度较低的行程时间,将所述第三数据对应的所述第一路段的行程时间替换所述精度较低的行程时间,基于替换后的行程时间再按预设融合方式进行融合估计。
本发明实施例提供的数据处理方法及装置,通过获取第一数据和第二数据;所述第一数据表征基于浮动车采集的第一路段的交通数据;所述第二数据表征基于固定检测器采集的所述第一路段的交通数据;基于所述第一数据获得所述第一路段的第一行程时间;基于所述第二数据获得所述第一路段的第二行程时间;确定融合参数,基于所述融合参数对所述第一行程时间和所述第二行程时间按预设融合方式进行融合估计,获得基于所述融合参数表征的第三数据;所述第三数据表征所述第一路段的行程时间的先验概率的估计;确定所述第三数据满足第一收敛条件时,将所述第三数据所对应的行程时间作为所述第一路段的行程时间;其中,所述第一收敛条件包括:具有同一空间属性和时间属性的历史数据统计特征。如此,采用本发明实施例的技术方案,实现了浮动车数据和固定检测器数据的动态融合估计,并且采用历史数据统计特征的标准,大大提升了路段行程时间估计的精确度和稳定性,解决了在数据缺失以及监测精度不稳定的问题。
附图说明
图1为本发明实施例一的数据处理方法的流程示意图;
图2a至图2b为本发明实施例一中第一统计周期内行程时间的历史数据概率分布及其拟合曲线示意图;
图3a至图3b为本发明实施例一中第二统计周期内行程时间的历史数据概率分布及其拟合曲线示意图;
图4为本发明实施例二的数据处理方法的流程示意图;
图5为本发明实施例三的数据处理装置的组成结构示意图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步详细的说明。
实施例一
本发明实施例提供了一种数据处理方法。图1为本发明实施例一的数据处理方法的流程示意图;如图1所示,所述方法包括:
步骤101:获取第一数据和第二数据;所述第一数据表征基于浮动车采集的第一路段的交通数据;所述第二数据表征基于固定检测器采集的所述第一路段的交通数据。
这里,所述第一数据和所述第二数据是基于同一路段(即所述第一路段)的同一统计时段的交通数据。所述第一数据表征基于浮动车采集的第一路段的交通数据,也即通过浮动车上设置的数据采集装置按照特定周期采集的第一数据,所述第一数据包括:时间戳、位置坐标、方向、速度以及所述浮动车的编号等等。所述第二数据表征基于固定检测器采集的所述第一路段的交通数据,也即设置在道路上的数据采集装置按照特定周期采集的第二数据,所述第二数据包括:路段流量、道路占用率、速度和排队长度等等。本实施例中,所述获取的第一数据和所述第二数据为在所述统计时段内的多个第一数据和第二数据,也即在所述统计时段内获得多个样本。
在实际应用中,所述特定周期以满足动态信息服务的要求,也即满足实际需求,所述特定周期较多设定为1分钟或5分钟,考虑到样本量较低等限制,通常采用5的倍数,例如15分钟或30分钟均可,本实施例中使用5分钟为一个周期。
本实施例中,获取到所述第一数据和所述第二数据后,对所述第一数据和所述第二数据进行预处理,所述预处理包括:滤除所述第一数据和所述第二数据中的异常数据。这里,所述异常数据具体可以是在所述统计时段内缺失的数据等等。
步骤102:基于所述第一数据获得所述第一路段的第一行程时间;基于所述第二数据获得所述第一路段的第二行程时间。
这里,首先基于所述第一数据获得所述第一路段内的浮动车的平均速度,基于所述平均速度和所述第一路段的距离确定所述浮动车通过所述第一路段的平均行程时间。
所述第一数据包括:时间戳、位置坐标、方向和瞬时速度;相应的,所述基于所述第一数据获得所述第一路段的第一行程时间,包括:
所述第一行程时间满足公式(1):
t ^ 1 ( k ) = ( 1 - f ( k ) ) t ^ 1 ( k - 1 ) + f ( k ) 1 n ( k ) Σ m = 1 n ( k ) t k m - - - ( 1 )
其中,为第i路段的第k个统计时间内的行程时间的估计值;为第i路段的第k-1个统计时间内的行程时间的估计值;f(k)为第k个统计时间的指数平滑系数;n(k)代表第i路段在第k个统计时间内的样本个数;代表第i路段在第k个统计时间内第m个样本的行程时间值;则所述可通过第m个浮动车所采集的第一数据计算获得(即基于第m个浮动车所采集的第一数据获得所述第一路段内的第m个浮动车的平均速度,所述平均速度和所述第一路段的距离确定所述第m个浮动车通过所述第一路段的平均行程时间);在本实施例中,所述第k个统计时间为当前的统计时段,则所述第k-1个统计时间则为上一个统计时段;其中,f(k)满足公式(2):
f ( k ) = 1 1 + σ ϵ ( k ) 2 n ( k ) · ( σ ϵ ( k - 1 ) 2 + σ η ( k ) 2 ) - - - ( 2 )
其中,为第i路段在第k个统计时间内行程时间方差,为第i路段在第k-1个统计时间内行程时间估计误差的平方,是以第i路段在第k-1个统计时间内平均值作为其在第k个统计时间内行程时间真值时第k个统计时间内行程时间估计误差的平方;
σ ϵ ( k ) 2 = Σ i = 1 n ( k ) ( t i ( k ) - t ‾ ( k ) ) 2 - - - ( 3 )
σ ϵ ( k - 1 ) 2 = ( t ^ ( k - 1 ) - t ‾ ( k - 1 ) ) 2 - - - ( 4 )
σ η ( k ) 2 = ( t ^ ( k ) - t ‾ ( k - 1 ) ) 2 - - - ( 5 )
其中,分别为第k个统计时间和第k-1个统计时间的行程时间原始估计结果的平均值,ti(k)为第i个样本的行程时间,为第k个统计时间的行程时间估计值。
本步骤中,所述基于所述第二数据获得所述第一路段的第二行程时间,包括:
所述第二行程时间满足如下表达式:
T=TR+TS (6)
其中,TR为所述第一路段的行程时间,具体为所述浮动车通过所述第一路段的时间(具体可采用所述第一路段长度与固定检测器记录的平均瞬时速度v的比值获得);TS为平均延误,具体为下游信号灯产生的平均延误,具体可以是所述浮动车到达下游信号灯处导致的紧急停车等带来的延误,所述平均延误包括车辆均匀到达产生的均匀延误d1和车辆随机到达且引发超出饱和周期所产生的随机附加延误d2。所述均匀延误d1和随机附加延误d2可根据道路信息、交叉口信号灯配时以及路段流量计算得出。
步骤103:确定融合参数,基于所述融合参数对所述第一行程时间和所述第二行程时间按预设融合方式进行融合估计,获得基于所述融合参数表征的第三数据;所述第三数据表征所述第一路段的行程时间的先验概率的估计。
这里,所述确定融合参数,包括:基于行程时间的概率密度函数满足对数正态分布X~Lognormal(μ,σ2),且先验概率μ满足正态分布确定融合参数为μ0和σ2;其中,μ0和σ0分别代表所述先验概率正态分布的均值和方差,σ为对数正态分布的方差。本实施例基于贝叶斯(Bayes)融合的基本原理,假定所述行程时间的概率密度函数满足对数正态分布X~Lognormal(μ,σ2),且先验概率μ满足正态分布根据贝叶斯融合的基本表达式,所述先验概率μ的统计值μ0以及σ2均为未知参数,所述未知参数可利用最大似然估计,基于历史数据得出。则本实施例中,确定融合参数为μ0和σ2
相应的,所述基于所述融合参数对所述第一行程时间和所述第二行程时间按预设融合方式进行融合估计,获得基于所述融合参数表征的第三数据,包括:
所述第三数据满足公式(7):
μ ^ = μ 0 σ 0 2 + σ 2 Σ i = 1 n x i σ 0 2 + n σ 2 - - - ( 7 )
其中,表示先验数据的估计值;xi表示样本值,n为样本个数,μ0分别为先验概率正态分布的均值和方差,σ为对数正态分布的方差。
步骤104:确定所述第三数据满足第一收敛条件时,将所述第三数据所对应的行程时间作为所述第一路段的行程时间;其中,所述第一收敛条件包括:具有同一空间属性和时间属性的历史数据统计特征。
这里,所述确定所述第三数据满足第一收敛条件,包括:
在所述第一路段的行程时间范围中,当第一行程时间范围对应的先验概率的估计值的总和达到第一预设阈值时,确定所述第三数据满足第一收敛条件;相应的,所述确定所述第三数据不满足第一收敛条件,包括:当第一行程时间范围对应的先验概率的总和未达到第一预设阈值时,确定所述第三数据不满足第一收敛条件;其中,所述第一行程时间范围为所述第一路段的行程时间范围中的任一行程时间范围。
本实施例提供的技术方案通过分析路段行程时间历史数据的概率分布及拟合曲线确定行程时间计算的合理范围,即确定所述第三数据是否满足第一收敛条件。图2a至图2b为本发明实施例一中第一统计周期内行程时间的历史数据概率分布及其拟合曲线示意图;如图2a为第一统计周期内行程时间(60至140秒)的历史数据概率分布的柱状图;基于所述图2a获得图2b所示的分布拟合曲线示意图,如图2b所示,拟合曲线下方的阴影面积等于行程时间的历史数据的先验概率总和(等于1),则本实施例中,当所述行程时间的历史数据的先验概率总和达到所述第一预设阈值时,即满足所述第一收敛条件;例如当所述第一预设阈值为95%时,即满足所述行程时间的历史数据的先验概率总和达到95%时(如图2b所示的路段行程时间在第1区间,路段行程时间具体为106秒至124秒),确定满足所述第一收敛条件。再例如,图3a至图3b为本发明实施例一中第二统计周期内行程时间的历史数据概率分布及其拟合曲线示意图;如图3a为第一统计周期内行程时间(90至170秒)的历史数据概率分布的柱状图;基于所述图3a获得图3b所示的分布拟合曲线示意图,如图3b所示,当所述行程时间的历史数据的先验概率总和达到95%时,即满足所述第一收敛条件,如图3b所示的第1区间和第2区间,路段行程时间具体为90秒至98秒以及110秒至122秒。其中,所述第一预设阈值可预先设定。
作为一个实施方式,所述方法还包括:确定所述第三数据不满足第一收敛条件时,判断所述第三数据是否满足第二收敛条件;确定所述第三数据满足第二收敛条件时,将历史数据中所述第一路段的先验概率的最大值作为第四数据替换所述第三数据,将所述第四数据所对应的行程时间作为所述第一路段的行程时间。
具体的,所述第三数据不满足第一收敛条件,具体可如图2b所示,即所述第三数据表征的先验概率的估计值对应的行程时间不在第1区间(106秒至124秒)时,即所述第三数据不在行程时间计算的合理范围,也即所述第三数据不满足第一收敛条件;在例如图3b所示,即所述第三数据表征的先验概率的估计值对应的行程时间不在第1区间(90秒至98秒)和第2区间(110秒至122秒)时,即所述第三数据不在行程时间计算的合理范围,也即所述第三数据不满足第一收敛条件。
进一步地,所述判断所述第三数据是否满足第二收敛条件,包括:判断所述第三数据与上一次融合估计获得的第三数据进行比较;当所述第三数据与上一次融合估计获得的第三数据进行比较结果小于第二预设阈值时,确定所述第三数据满足第二收敛条件;当所述第三数据与上一次融合估计获得的第三数据进行比较结果不小于第二预设阈值时,确定所述第三数据不满足第二收敛条件。
本实施例中,当所述第三数据不满足所述第一收敛条件时,在循环过程中可能进入死循环,为了避免死循环的情况,本实施例提出了所述第二收敛条件,即连续两次的融合结果相差小于第二预设阈值(如10%)时,可认为循环有进入死循环的趋势。其中,所述第二预设阈值可依据实际情况预先设定。
作为一个实施方式,所述方法还包括:确定所述第三数据不满足第二收敛条件时,确定所述第一行程时间和所述第二行程时间中精度较低的行程时间,将所述第三数据对应的所述第一路段的行程时间替换所述精度较低的行程时间,基于替换后的行程时间再按预设融合方式进行融合估计。
具体的,所述确定所述第一行程时间和所述第二行程时间中精度较低的行程时间,包括:获得所述第一行程时间与所述第三数据对应的所述第一路段的行程时间的第一欧式距离;获得所述第二行程时间与所述第三数据对应的所述第一路段的行程时间的第二欧式距离;
将所述第一欧式距离和所述第二欧式距离中数值较小的欧氏距离所对应的行程时间作为所述精度较低的行程时间。
本实施例中,所述第三数据不满足第二收敛条件,即连续两次的融合结果相差不小于第二预设阈值。
其中,本实施例中所述的替换规则在于利用融合结果(即所述第三数据所对应的行程时间)替换源数据中精度较低的数据(浮动车采集的数据和固定检测器采集的数据中精度较低的数据),利用替换后的源数据再进行融合估计。
具体的,欧氏距离为判断离散数据列相似性的有效指标。以统计时间5分钟为时间间隔向前推移的15分钟时间段中(3个5分钟时间段),基于单一数据源的行程时间估计结果和历史数据之间的欧氏距离作为两者在三维空间的距离,其位置坐标为所述时间段内各个统计时间的行程时间。所述欧式距离满足公式(8)所示:
D i = Σ j = 1 3 ( t ij - T j ) 2 - - - ( 8 )
其中,Di为时间段内第i列行程时间估计结果与历史数据的欧氏距离;tij表示第j个统计时段的第i列行程时间估计结果;Tj表示第j个统计时段的行程时间历史数据。
实施例二
本发明实施例还提供了一种数据处理方法。图4为本发明实施例二的数据处理方法的流程示意图;如图4所示,所述方法包括:
步骤201:获取第一数据和第二数据;所述第一数据表征基于浮动车采集的第一路段的交通数据;所述第二数据表征基于固定检测器采集的所述第一路段的交通数据。
这里,所述第一数据和所述第二数据是基于同一路段(即所述第一路段)的同一统计时段的交通数据。所述第一数据表征基于浮动车采集的第一路段的交通数据,也即通过浮动车上设置的数据采集装置按照特定周期采集的第一数据,所述第一数据包括:时间戳、位置坐标、方向、速度以及所述浮动车的编号等等。所述第二数据表征基于固定检测器采集的所述第一路段的交通数据,也即设置在道路上的数据采集装置按照特定周期采集的第二数据,所述第二数据包括:路段流量、道路占用率、速度和排队长度等等。
在实际应用中,所述特定周期以满足动态信息服务的要求,也即满足实际需求,所述特定周期较多设定为1分钟或5分钟,考虑到样本量较低等限制,通常采用5的倍数,例如15分钟或30分钟均可,本实施例中使用5分钟为一个周期。
本实施例中,获取到所述第一数据和所述第二数据后,对所述第一数据和所述第二数据进行预处理,所述预处理包括:滤除所述第一数据和所述第二数据中的异常数据。这里,所述异常数据具体可以是在所述统计时段内缺失的数据等等。
步骤202:基于所述第一数据获得所述第一路段的第一行程时间;基于所述第二数据获得所述第一路段的第二行程时间。
这里,首先基于所述第一数据获得所述第一路段内的浮动车的平均速度,基于所述平均速度和所述第一路段的距离确定所述浮动车通过所述第一路段的平均行程时间。
所述第一数据包括:时间戳、位置坐标、方向和瞬时速度;相应的,所述基于所述第一数据获得所述第一路段的第一行程时间,包括:
所述第一行程时间满足公式(1):
t ^ 1 ( k ) = ( 1 - f ( k ) ) t ^ 1 ( k - 1 ) + f ( k ) 1 n ( k ) Σ m = 1 n ( k ) t k m - - - ( 1 )
其中,为第i路段的第k个统计时间内的行程时间的估计值;为第i路段的第k-1个统计时间内的行程时间的估计值;f(k)为第k个统计时间的指数平滑系数;n(k)代表第i路段在第k个统计时间内的样本个数;代表第i路段在第k个统计时间内第m个样本的行程时间值;则所述可通过第m个浮动车所采集的第一数据计算获得(即基于第m个浮动车所采集的第一数据获得所述第一路段内的第m个浮动车的平均速度,所述平均速度和所述第一路段的距离确定所述第m个浮动车通过所述第一路段的平均行程时间);在本实施例中,所述第k个统计时间为当前的统计时段,则所述第k-1个统计时间则为上一个统计时段;其中,f(k)满足公式(2):
f ( k ) = 1 1 + σ ϵ ( k ) 2 n ( k ) · ( σ ϵ ( k - 1 ) 2 + σ η ( k ) 2 ) - - - ( 2 )
其中,为第i路段在第k个统计时间内行程时间方差,为第i路段在第k-1个统计时间内行程时间估计误差的平方,是以第i路段在第k-1个统计时间内平均值作为其在第k个统计时间内行程时间真值时第k个统计时间内行程时间估计误差的平方;
σ ϵ ( k ) 2 = Σ i = 1 n ( k ) ( t i ( k ) - t ‾ ( k ) ) 2 - - - ( 3 )
σ ϵ ( k - 1 ) 2 = ( t ^ ( k - 1 ) - t ‾ ( k - 1 ) ) 2 - - - ( 4 )
σ η ( k ) 2 = ( t ^ ( k ) - t ‾ ( k - 1 ) ) 2 - - - ( 5 )
其中,分别为第k个统计时间和第k-1个统计时间的行程时间原始估计结果的平均值,ti(k)为第i个样本的行程时间,为第k个统计时间的行程时间估计值。
本步骤中,所述基于所述第二数据获得所述第一路段的第二行程时间,包括:
所述第二行程时间满足如下表达式:
T=TR+TS (6)
其中,TR为所述第一路段的行程时间,具体为所述浮动车通过所述第一路段的时间(具体可采用所述第一路段长度与固定检测器记录的平均瞬时速度v的比值获得);TS为平均延误,具体为下游信号灯产生的平均延误,具体可以是所述浮动车到达下游信号灯处导致的紧急停车等带来的延误,所述平均延误包括车辆均匀到达产生的均匀延误d1和车辆随机到达且引发超出饱和周期所产生的随机附加延误d2。所述均匀延误d1和随机附加延误d2可根据道路信息、交叉口信号灯配时以及路段流量计算得出。
步骤203:确定融合参数,基于所述融合参数对所述第一行程时间和所述第二行程时间按预设融合方式进行融合估计,获得基于所述融合参数表征的第三数据;所述第三数据表征所述第一路段的行程时间的先验概率的估计。
这里,所述确定融合参数,包括:基于行程时间的概率密度函数满足对数正态分布X~Lognormal(μ,σ2),且先验概率μ满足正态分布确定融合参数为μ0和σ2;其中,μ0和σ0分别代表所述先验概率正态分布的均值和方差,σ为对数正态分布的方差。本实施例基于贝叶斯(Bayes)融合的基本原理,假定所述行程时间的概率密度函数满足对数正态分布X~Lognormal(μ,σ2),且先验概率μ满足正态分布根据贝叶斯融合的基本表达式,所述先验概率μ的统计值μ0以及σ2均为未知参数,所述未知参数可利用最大似然估计,基于历史数据得出。则本实施例中,确定融合参数为μ0和σ2
相应的,所述基于所述融合参数对所述第一行程时间和所述第二行程时间按预设融合方式进行融合估计,获得基于所述融合参数表征的第三数据,包括:
所述第三数据满足公式(7):
μ ^ = μ 0 σ 0 2 + σ 2 Σ i = 1 n x i σ 0 2 + n σ 2 - - - ( 7 )
其中,表示先验数据的估计值;xi表示样本值,n为样本个数,μ0分别为先验概率正态分布的均值和方差,σ为对数正态分布的方差。
步骤204:判断所述第三数据是否满足第一收敛条件,当判断的结果为是时,执行步骤205;当判断的结果为否时,执行步骤206。
这里,所述确定所述第三数据满足第一收敛条件,包括:
在所述第一路段的行程时间范围中,当第一行程时间范围对应的先验概率的估计值的总和达到第一预设阈值时,确定所述第三数据满足第一收敛条件;相应的,所述确定所述第三数据不满足第一收敛条件,包括:当第一行程时间范围对应的先验概率的总和未达到第一预设阈值时,确定所述第三数据不满足第一收敛条件;其中,所述第一行程时间范围为所述第一路段的行程时间范围中的任一行程时间范围。
本实施例提供的技术方案通过分析路段行程时间历史数据的概率分布及拟合曲线确定行程时间计算的合理范围,即确定所述第三数据是否满足第一收敛条件。图2a至图2b为本发明实施例一中第一统计周期内行程时间的历史数据概率分布及其拟合曲线示意图;如图2a为第一统计周期内行程时间(60至140秒)的历史数据概率分布的柱状图;基于所述图2a获得图2b所示的分布拟合曲线示意图,如图2b所示,拟合曲线下方的阴影面积等于行程时间的历史数据的先验概率总和(等于1),则本实施例中,当所述行程时间的历史数据的先验概率总和达到所述第一预设阈值时,即满足所述第一收敛条件;例如当所述第一预设阈值为95%时,即满足所述行程时间的历史数据的先验概率总和达到95%时(如图2b所示的路段行程时间在第1区间,路段行程时间具体为106秒至124秒),确定满足所述第一收敛条件。再例如,图3a至图3b为本发明实施例一中第二统计周期内行程时间的历史数据概率分布及其拟合曲线示意图;如图3a为第一统计周期内行程时间(90至170秒)的历史数据概率分布的柱状图;基于所述图3a获得图3b所示的分布拟合曲线示意图,如图3b所示,当所述行程时间的历史数据的先验概率总和达到95%时,即满足所述第一收敛条件,如图3b所示的第1区间和第2区间,路段行程时间具体为90秒至98秒以及110秒至122秒。其中,所述第一预设阈值可预先设定。
步骤205:将所述第三数据所对应的行程时间作为所述第一路段的行程时间。
步骤206:判断所述第三数据是否满足第二收敛条件,当判断的结果为是时,执行步骤207;当判断的结果为否时,执行步骤208。
具体的,所述第三数据不满足第一收敛条件,具体可如图2b所示,即所述第三数据表征的先验概率的估计值对应的行程时间不在第1区间(106秒至124秒)时,即所述第三数据不在行程时间计算的合理范围,也即所述第三数据不满足第一收敛条件;在例如图3b所示,即所述第三数据表征的先验概率的估计值对应的行程时间不在第1区间(90秒至98秒)和第2区间(110秒至122秒)时,即所述第三数据不在行程时间计算的合理范围,也即所述第三数据不满足第一收敛条件。
进一步地,所述判断所述第三数据是否满足第二收敛条件,包括:判断所述第三数据与上一次融合估计获得的第三数据进行比较;当所述第三数据与上一次融合估计获得的第三数据进行比较结果小于第二预设阈值时,确定所述第三数据满足第二收敛条件;当所述第三数据与上一次融合估计获得的第三数据进行比较结果不小于第二预设阈值时,确定所述第三数据不满足第二收敛条件。
步骤207:将历史数据中所述第一路段的先验概率的最大值作为第四数据替换所述第三数据,将所述第四数据所对应的行程时间作为所述第一路段的行程时间。
步骤208:确定所述第一行程时间和所述第二行程时间中精度较低的行程时间,将所述第三数据对应的所述第一路段的行程时间替换所述精度较低的行程时间,重新执行步骤203。
具体的,所述确定所述第一行程时间和所述第二行程时间中精度较低的行程时间,包括:获得所述第一行程时间与所述第三数据对应的所述第一路段的行程时间的第一欧式距离;获得所述第二行程时间与所述第三数据对应的所述第一路段的行程时间的第二欧式距离;
将所述第一欧式距离和所述第二欧式距离中数值较小的欧氏距离所对应的行程时间作为所述精度较低的行程时间。
本实施例中,所述第三数据不满足第二收敛条件,即连续两次的融合结果相差不小于第二预设阈值。
其中,本实施例中所述的替换规则在于利用融合结果(即所述第三数据所对应的行程时间)替换源数据中精度较低的数据(浮动车采集的数据和固定检测器采集的数据中精度较低的数据),利用替换后的源数据再进行融合估计。
具体的,欧氏距离为判断离散数据列相似性的有效指标。以统计时间5分钟为时间间隔向前推移的15分钟时间段中(3个5分钟时间段),基于单一数据源的行程时间估计结果和历史数据之间的欧氏距离作为两者在三维空间的距离,其位置坐标为所述时间段内各个统计时间的行程时间。所述欧式距离满足公式(8)所示:
D i = Σ j = 1 3 ( t ij - T j ) 2 - - - ( 8 )
其中,Di为时间段内第i列行程时间估计结果与历史数据的欧氏距离;tij表示第j个统计时段的第i列行程时间估计结果;Tj表示第j个统计时段的行程时间历史数据。
实施例三
本发明实施例还提供了一种数据处理装置。图5为本发明实施例三的数据处理装置的组成结构示意图,如图5所示,所述装置包括:数据获取单元31、计算单元32、融合处理单元33和判定单元34;其中,
所述数据获取单元31,用于获取第一数据和第二数据;所述第一数据表征基于浮动车采集的第一路段的交通数据;所述第二数据表征基于固定检测器采集的所述第一路段的交通数据;
所述计算单元32,用于基于所述第一数据获得所述第一路段的第一行程时间;基于所述第二数据获得所述第一路段的第二行程时间;
所述融合处理单元33,用于确定融合参数,基于所述融合参数对所述第一行程时间和所述第二行程时间按预设融合方式进行融合估计,获得基于所述融合参数表征的第三数据;所述第三数据表征所述第一路段的行程时间的先验概率的估计;
所述判定单元34,用于确定所述第三数据满足第一收敛条件时,将所述第三数据所对应的行程时间作为所述第一路段的行程时间。
作为一种实施方式,所述判定单元34,还用于确定所述第三数据不满足第一收敛条件时,判断所述第三数据是否满足第二收敛条件;确定所述第三数据满足第二收敛条件时,将历史数据中所述第一路段的先验概率的最大值作为第四数据替换所述第三数据,将所述第四数据所对应的行程时间作为所述第一路段的行程时间。
作为一种实施方式,所述判定单元34,还用于确定所述第三数据不满足第二收敛条件时,确定所述第一行程时间和所述第二行程时间中精度较低的行程时间,将所述第三数据对应的所述第一路段的行程时间替换所述精度较低的行程时间,基于替换后的行程时间再按预设融合方式进行融合估计。
具体的,所述第一数据包括:时间戳、位置坐标、方向和瞬时速度;则所述计算单元32获得的所述第一行程时间满足如下表达式:
t ^ 1 ( k ) = ( 1 - f ( k ) ) t ^ 1 ( k - 1 ) + f ( k ) 1 n ( k ) Σ m = 1 n ( k ) t k m ;
其中,为第i路段的第k个统计时间内的行程时间的估计值;为第i路段的第k-1个统计时间内的行程时间的估计值;f(k)为第k个统计时间的指数平滑系数;n(k)代表第i路段在第k个统计时间内的样本个数;代表第i路段在第k个统计时间内第m个样本的行程时间值;则所述可通过第m个浮动车所采集的第一数据计算获得(即基于第m个浮动车所采集的第一数据获得所述第一路段内的第m个浮动车的平均速度,所述平均速度和所述第一路段的距离确定所述第m个浮动车通过所述第一路段的平均行程时间);在本实施例中,所述第k个统计时间为当前的统计时段,则所述第k-1个统计时间则为上一个统计时段;其中,f(k)满足如下表达式:
f ( k ) = 1 1 + σ ϵ ( k ) 2 n ( k ) · ( σ ϵ ( k - 1 ) 2 + σ η ( k ) 2 ) ;
其中,为第i路段在第k个统计时间内行程时间方差,为第i路段在第k-1个统计时间内行程时间估计误差的平方,是以第i路段在第k-1个统计时间内平均值作为其在第k个统计时间内行程时间真值时第k个统计时间内行程时间估计误差的平方;
σ ϵ ( k ) 2 = Σ i = 1 n ( k ) ( t i ( k ) - t ‾ ( k ) ) 2 ; σ ϵ ( k - 1 ) 2 = ( t ^ ( k - 1 ) - t ‾ ( k - 1 ) ) 2 ; σ η ( k ) 2 = ( t ^ ( k ) - t ‾ ( k - 1 ) ) 2 ;
其中,分别为第k个统计时间和第k-1个统计时间的行程时间原始估计结果的平均值,ti(k)为第i个样本的行程时间,为第k个统计时间的行程时间估计值。
具体的,所述第二数据包括:路段流量、道路占用率、瞬时速度和排队长度;则所述计算单元32获得的所述第二行程时间满足如下表达式:
T=TR+TS
其中,TR为所述第一路段的行程时间,具体为所述浮动车通过所述第一路段的时间(具体可采用所述第一路段长度与固定检测器记录的平均瞬时速度v的比值获得);TS为平均延误,具体为下游信号灯产生的平均延误,具体可以是所述浮动车到达下游信号灯处导致的紧急停车等带来的延误,所述平均延误包括车辆均匀到达产生的均匀延误d1和车辆随机到达且引发超出饱和周期所产生的随机附加延误d2。所述均匀延误d1和随机附加延误d2可根据道路信息、交叉口信号灯配时以及路段流量计算得出。
作为一种实施方式,所述融合处理单元33,用于基于行程时间的概率密度函数满足对数正态分布X~Lognormal(μ,σ2),且先验概率μ满足正态分布确定融合参数为μ0和σ0;还用于获得基于所述融合参数表征的第三数据,所述第三数据满足如下表达式:
μ ^ = μ 0 σ 0 2 + σ 2 Σ i = 1 n x i σ 0 2 + n σ 2 ;
其中,表示先验数据的估计值;xi表示样本值,n为样本个数,μ0分别为先验概率正态分布的均值和方差,σ为对数正态分布的方差。
具体的,所述判定单元34,用于在所述第一路段的行程时间范围中,当第一行程时间范围对应的先验概率的总和达到第一预设阈值时,确定所述第三数据满足第一收敛条件;还用于当第一行程时间范围对应的先验概率的总和未达到第一预设阈值时,确定所述第三数据不满足第一收敛条件;其中,所述第一行程时间范围为所述第一路段的行程时间范围中的任一行程时间范围。
作为另一种实施方式,所述判定单元34,还用于判断所述第三数据与上一次融合估计获得的第三数据进行比较;当所述第三数据与上一次融合估计获得的第三数据进行比较结果小于第二预设阈值时,确定所述第三数据满足第二收敛条件;当所述第三数据与上一次融合估计获得的第三数据进行比较结果不小于第二预设阈值时,确定所述第三数据不满足第二收敛条件。
作为另一种实施方式,所述判定单元34,还用于获得所述第一行程时间与所述第三数据对应的所述第一路段的行程时间的第一欧式距离;获得所述第二行程时间与所述第三数据对应的所述第一路段的行程时间的第二欧式距离;将所述第一欧式距离和所述第二欧式距离中数值较小的欧氏距离所对应的行程时间作为所述精度较低的行程时间。
本领域技术人员应当理解,本发明实施例的数据处理装置中各处理单元的功能,可参照前述数据处理方法的相关描述而理解,本发明实施例的数据处理装置中各处理单元,可通过实现本发明实施例所述的功能的模拟电路而实现,也可以通过执行本发明实施例所述的功能的软件在智能终端上的运行而实现。
本发明实施例三中,所述数据处理装置在实际应用中,可由计算机或服务器实现。所述数据处理装置中的数据获取单元31、计算单元32、融合处理单元33和判定单元34,在实际应用中均可由所述数据处理装置中的中央处理器(CPU,Central Processing Unit)、数字信号处理器(DSP,Digital Signal Processor)或可编程门阵列(FPGA,Field-Programmable Gate Array)实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (12)

1.一种数据处理方法,其特征在于,所述方法包括:
获取第一数据和第二数据;所述第一数据表征基于浮动车采集的第一路段的交通数据;所述第二数据表征基于固定检测器采集的所述第一路段的交通数据;
基于所述第一数据获得所述第一路段的第一行程时间;基于所述第二数据获得所述第一路段的第二行程时间;
确定融合参数,基于所述融合参数对所述第一行程时间和所述第二行程时间按预设融合方式进行融合估计,获得基于所述融合参数表征的第三数据;所述第三数据表征所述第一路段的行程时间的先验概率的估计;
确定所述第三数据满足第一收敛条件时,将所述第三数据所对应的行程时间作为所述第一路段的行程时间;其中,所述第一收敛条件包括:具有同一空间属性和时间属性的历史数据统计特征。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述第三数据不满足第一收敛条件时,判断所述第三数据是否满足第二收敛条件;确定所述第三数据满足第二收敛条件时,将历史数据中所述第一路段的先验概率的最大值作为第四数据替换所述第三数据,将所述第四数据所对应的行程时间作为所述第一路段的行程时间。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:确定所述第三数据不满足第二收敛条件时,确定所述第一行程时间和所述第二行程时间中精度较低的行程时间,将所述第三数据对应的所述第一路段的行程时间替换所述精度较低的行程时间,基于替换后的行程时间再按预设融合方式进行融合估计。
4.根据权利要求1所述的方法,其特征在于,所述第一数据包括:时间戳、位置坐标、方向和瞬时速度;相应的,所述基于所述第一数据获得所述第一路段的第一行程时间,包括:
所述第一行程时间满足如下表达式:
t ^ 1 ( k ) = ( 1 - f ( k ) ) t ^ 1 ( k - 1 ) + f ( k ) 1 n ( k ) Σ m = 1 n ( k ) t k m ;
其中,为第i路段的第k个统计时间内的行程时间的估计值;为第i路段的第k-1个统计时间内的行程时间的估计值;f(k)为第k个统计时间的指数平滑系数;n(k)代表第i路段在第k个统计时间内的样本个数;代表第i路段在第k个统计时间内第m个样本的行程时间值;其中,f(k)满足如下表达式:
f ( k ) = 1 1 + σ ϵ ( k ) 2 n ( k ) · ( σ ϵ ( k - 1 ) 2 + σ η ( k ) 2 ) ;
其中,为第i路段在第k个统计时间内行程时间方差,为第i路段在第k-1个统计时间内行程时间估计误差的平方,是以第i路段在第k-1个统计时间内平均值作为其在第k个统计时间内行程时间真值时第k个统计时间内行程时间估计误差的平方;
σ ϵ ( k ) 2 = Σ i = 1 n ( k ) ( t i ( k ) - t ‾ ( k ) ) 2 ; σ ϵ ( k - 1 ) 2 = ( t ^ ( k - 1 ) - t ‾ ( k - 1 ) ) 2 ; σ η ( k ) 2 = ( t ^ ( k ) - t ‾ ( k - 1 ) ) 2 ;
其中,分别为第k个统计时间和第k-1个统计时间的行程时间原始估计结果的平均值,ti(k)为第i个样本的行程时间,为第k个统计时间的行程时间估计值。
5.根据权利要求1所述的方法,其特征在于,所述第二数据包括:路段流量、道路占用率、瞬时速度和排队长度;相应的,所述基于所述第二数据获得所述第一路段的第二行程时间,包括:
所述第二行程时间满足如下表达式:
T=TR+TS
其中,TR为所述第一路段的行程时间;TS为平均延误,所述平均延误包括车辆均匀到达产生的均匀延误d1和车辆随机到达且引发超出饱和周期所产生的随机附加延误d2
6.根据权利要求1所述的方法,其特征在于,所述确定融合参数,包括:基于行程时间的概率密度函数满足对数正态分布X~Lognormal(μ,σ2),且先验概率μ满足正态分布确定融合参数为μ0和σ2
相应的,所述基于所述融合参数对所述第一行程时间和所述第二行程时间按预设融合方式进行融合估计,获得基于所述融合参数表征的第三数据,包括:
所述第三数据满足如下表达式:
μ ^ = μ 0 σ 0 2 + σ 2 Σ i = 1 n x i σ 0 2 + n σ 2 ;
其中,表示先验数据的估计值;xi表示样本值,n为样本个数,μ0分别为先验概率正态分布的均值和方差,σ为对数正态分布的方差。
7.根据权利要求1或2所述的方法,其特征在于,所述确定所述第三数据满足第一收敛条件,包括:
在所述第一路段的行程时间范围中,当第一行程时间范围对应的先验概率的总和达到第一预设阈值时,确定所述第三数据满足第一收敛条件;
相应的,所述确定所述第三数据不满足第一收敛条件,包括:当第一行程时间范围对应的先验概率的估计值的总和未达到第一预设阈值时,确定所述第三数据不满足第一收敛条件;其中,所述第一行程时间范围为所述第一路段的行程时间范围中的任一行程时间范围。
8.根据权利要求1至3任一项所述的方法,其特征在于,所述判断所述第三数据是否满足第二收敛条件,包括:判断所述第三数据与上一次融合估计获得的第三数据进行比较;当所述第三数据与上一次融合估计获得的第三数据进行比较结果小于第二预设阈值时,确定所述第三数据满足第二收敛条件;当所述第三数据与上一次融合估计获得的第三数据进行比较结果不小于第二预设阈值时,确定所述第三数据不满足第二收敛条件。
9.根据权利要求3所述的方法,其特征在于,所述确定所述第一行程时间和所述第二行程时间中精度较低的行程时间,包括:获得所述第一行程时间与所述第三数据对应的所述第一路段的行程时间的第一欧式距离;获得所述第二行程时间与所述第三数据对应的所述第一路段的行程时间的第二欧式距离;
将所述第一欧式距离和所述第二欧式距离中数值较小的欧氏距离所对应的行程时间作为所述精度较低的行程时间。
10.一种数据处理装置,其特征在于,所述装置包括:数据获取单元、计算单元、融合处理单元和判定单元;其中,
所述数据获取单元,用于获取第一数据和第二数据;所述第一数据表征基于浮动车采集的第一路段的交通数据;所述第二数据表征基于固定检测器采集的所述第一路段的交通数据;
所述计算单元,用于基于所述第一数据获得所述第一路段的第一行程时间;基于所述第二数据获得所述第一路段的第二行程时间;
所述融合处理单元,用于确定融合参数,基于所述融合参数对所述第一行程时间和所述第二行程时间按预设融合方式进行融合估计,获得基于所述融合参数表征的第三数据;所述第三数据表征所述第一路段的行程时间的先验概率的估计;
所述判定单元,用于确定所述第三数据满足第一收敛条件时,将所述第三数据所对应的行程时间作为所述第一路段的行程时间。
11.根据权利要求10所述的装置,其特征在于,所述判定单元,还用于确定所述第三数据不满足第一收敛条件时,判断所述第三数据是否满足第二收敛条件;确定所述第三数据满足第二收敛条件时,将历史数据中所述第一路段的先验概率的最大值作为第四数据替换所述第三数据,将所述第四数据所对应的行程时间作为所述第一路段的行程时间。
12.根据权利要求11所述的装置,其特征在于,所述判定单元,还用于确定所述第三数据不满足第二收敛条件时,确定所述第一行程时间和所述第二行程时间中精度较低的行程时间,将所述第三数据对应的所述第一路段的行程时间替换所述精度较低的行程时间,基于替换后的行程时间再按预设融合方式进行融合估计。
CN201510104728.3A 2015-03-10 2015-03-10 一种数据处理方法及装置 Active CN106033643B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510104728.3A CN106033643B (zh) 2015-03-10 2015-03-10 一种数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510104728.3A CN106033643B (zh) 2015-03-10 2015-03-10 一种数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN106033643A true CN106033643A (zh) 2016-10-19
CN106033643B CN106033643B (zh) 2019-05-24

Family

ID=57149815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510104728.3A Active CN106033643B (zh) 2015-03-10 2015-03-10 一种数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN106033643B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107085944A (zh) * 2017-06-28 2017-08-22 北京数行健科技有限公司 一种交通数据处理系统及方法
CN108960306A (zh) * 2018-06-22 2018-12-07 西安电子科技大学 基于smt大数据的锡膏检测阈值优化方法
WO2020024243A1 (zh) * 2018-08-03 2020-02-06 深圳大学 增量核密度估计器的生成方法、装置和计算机可读存储介质
CN114037017A (zh) * 2021-11-25 2022-02-11 西安电子科技大学 基于误差分布拟合的数据融合方法
WO2022116522A1 (zh) * 2020-12-01 2022-06-09 广州橙行智动汽车科技有限公司 行程融合方法、装置以及车辆

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102013167A (zh) * 2010-12-08 2011-04-13 北京世纪高通科技有限公司 浮动车数据处理方法及装置
KR20110124906A (ko) * 2010-05-12 2011-11-18 한국항공대학교산학협력단 검지체계간의 데이터 퓨전을 통한 실시간 통행시간 산정방법
CN102930718A (zh) * 2012-09-20 2013-02-13 同济大学 基于浮动车数据和线圈流量融合的间断流路段行程时间估计方法
CN103093618A (zh) * 2013-01-05 2013-05-08 北京世纪高通科技有限公司 一种交通数据处理方法及装置
CN103927872A (zh) * 2014-04-28 2014-07-16 武汉大学 一种基于浮动车数据预测多时段行程时间分布的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110124906A (ko) * 2010-05-12 2011-11-18 한국항공대학교산학협력단 검지체계간의 데이터 퓨전을 통한 실시간 통행시간 산정방법
CN102013167A (zh) * 2010-12-08 2011-04-13 北京世纪高通科技有限公司 浮动车数据处理方法及装置
CN102930718A (zh) * 2012-09-20 2013-02-13 同济大学 基于浮动车数据和线圈流量融合的间断流路段行程时间估计方法
CN103093618A (zh) * 2013-01-05 2013-05-08 北京世纪高通科技有限公司 一种交通数据处理方法及装置
CN103927872A (zh) * 2014-04-28 2014-07-16 武汉大学 一种基于浮动车数据预测多时段行程时间分布的方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107085944A (zh) * 2017-06-28 2017-08-22 北京数行健科技有限公司 一种交通数据处理系统及方法
CN108960306A (zh) * 2018-06-22 2018-12-07 西安电子科技大学 基于smt大数据的锡膏检测阈值优化方法
CN108960306B (zh) * 2018-06-22 2022-03-04 西安电子科技大学 基于smt大数据的锡膏检测阈值优化方法
WO2020024243A1 (zh) * 2018-08-03 2020-02-06 深圳大学 增量核密度估计器的生成方法、装置和计算机可读存储介质
WO2022116522A1 (zh) * 2020-12-01 2022-06-09 广州橙行智动汽车科技有限公司 行程融合方法、装置以及车辆
CN114037017A (zh) * 2021-11-25 2022-02-11 西安电子科技大学 基于误差分布拟合的数据融合方法
CN114037017B (zh) * 2021-11-25 2022-10-21 西安电子科技大学 基于误差分布拟合的数据融合方法

Also Published As

Publication number Publication date
CN106033643B (zh) 2019-05-24

Similar Documents

Publication Publication Date Title
Bujorianu et al. Reachability questions in piecewise deterministic Markov processes
CN106033643A (zh) 一种数据处理方法及装置
Essa et al. Simulated traffic conflicts: do they accurately represent field-measured conflicts?
CN107807625B (zh) 一种基于端到端的自动驾驶系统舒适度的评估方法及装置
CN105241465B (zh) 一种道路更新的方法
CN106781488B (zh) 基于车流密度和车速融合的交通运行状态评价方法
CN109272746B (zh) 一种基于bp神经网络数据融合的mfd估测方法
Goyani et al. Investigation of crossing conflicts by vehicle type at unsignalized T-intersections under varying roadway and traffic conditions in India
CN104464307B (zh) 一种基于视频的隧道交通拥堵事件自动检测方法
CN105930565B (zh) 基于线性策略的交叉熵算法的交通仿真模型参数标定方法
CN110189547A (zh) 一种障碍物检测方法、装置及车辆
Li et al. Characterizing Heterogeneity in Drivers’ Merging Maneuvers Using Two‐Step Cluster Analysis
CN108320537A (zh) 车辆排队长度的计算方法及装置
JP2019112049A (ja) 陸上車両の運転者の運転スタイルを認識するための方法及び対応する装置
CN104875740B (zh) 用于管理跟随空间的方法、主车辆以及跟随空间管理单元
CN110853353A (zh) 基于视觉的密度交通车辆计数和交通流量计算方法及系统
CN106080397A (zh) 自适应巡航系统及车载设备
Cetin et al. Factors affecting minimum number of probes required for reliable estimation of travel time
CN107331163A (zh) 一种排队长度计算方法及装置
Li et al. Diagnosing and interpolating loop detector data errors with probe vehicle data
CN110264725B (zh) 路段流量的确定方法及装置
George et al. Area occupancy-based adaptive density estimation for mixed road traffic
Ottaviano et al. Modeling and data fusion of dynamic highway traffic
CN111160594A (zh) 一种到达时间的预估方法、装置及存储介质
Li et al. Modeling and verification of heavy-duty truck drivers’ car-following characteristics

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant