CN106096302A - 基于时间和路段相关性的数据修复方法 - Google Patents

基于时间和路段相关性的数据修复方法 Download PDF

Info

Publication number
CN106096302A
CN106096302A CN201610459938.9A CN201610459938A CN106096302A CN 106096302 A CN106096302 A CN 106096302A CN 201610459938 A CN201610459938 A CN 201610459938A CN 106096302 A CN106096302 A CN 106096302A
Authority
CN
China
Prior art keywords
section
data
represent
time
alpha
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610459938.9A
Other languages
English (en)
Inventor
刘化胜
李从萍
董文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Dina Digital Technology Co Ltd
Original Assignee
Jiangsu Dina Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Dina Digital Technology Co Ltd filed Critical Jiangsu Dina Digital Technology Co Ltd
Priority to CN201610459938.9A priority Critical patent/CN106096302A/zh
Publication of CN106096302A publication Critical patent/CN106096302A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Abstract

本发明提出了一种基于时间和路段相关性的数据修复方法,包括:获取经过数据清洗的动态交通数据;对所述动态交通数据进行基于时间相关性模型的修复,包括:采用二次指数平滑法对所述动态交通数据中连续点上缺失的交通进行预测,得到修复的观测值对所述动态交通数据进行基于路段相关性模型的修复,包括:根据相邻路段之间的相关,计算缺失数据路段上的车辆速度;根据vti,t和vsi,t计算基于时间相关性模型和路段相关性模型线性融合的i表示路段编号。本发明提高了数据修复的质量和数据修复预测的精度,从而提高了道路交通状态的检测精度。

Description

基于时间和路段相关性的数据修复方法
技术领域
本发明涉及智能交通及车联网技术领域,特别涉及一种基于时间和路段相关性的数据修复方法。
背景技术
随着ITS(Intelligent Transport System,智能交通系统)的广泛发展,动态交通数据的应用越来越广泛。通常所说的动态交通数据的清洗包括原始数据中异常数据的识别、过滤和修复等过程。由于数据过滤会引起信息的丢失,为保证城市道路交通状态预测的精确性,有必要使用数据修复方法对缺失的数据进行修复。目前常用与数据修复的算法有加权平均算法和指数平滑法等两种。
(1)加权平均算法是一种优先考虑相邻时间对缺失数据的影响的算法。一般而言,观测值与缺失数据时间相隔越大,其对缺失数据的贡献因子越小;观测值与缺失数据时间相隔越小,其对缺失数据的贡献因子越大。但是该算法只考虑当前相邻时间间隔内观测值对缺失数据的影响,并没有不考虑缺失点的历史趋势,缺乏一定的灵活性。
(2)二次指数平滑法是在移动平均方法基础发展起来的一种时间序列分析预测算法,是对市场现象中的实际观测值计算两次平滑值,并由此建立预测模型,对市场现象进行预测的方法。相对于一次指数平滑法,二次指数平滑法适用于预测有明显趋势变化的市场现象,而且可以实现对市场现象的多期预测和修复。
二次指数平滑法修复缺失数据的关键在于平滑系数的取值,根据以往的研究资料,如果样本点整体波动较大,则平滑系数的值应取大一些,即增加近期样本点对预测结果的影响。如果样本点整体平稳,则平滑系数的值应取小一些。然而,实际的交通系统中,车辆在道路网中采集的信息复杂多样,并不能完全根据采集的交通信息就能判定出需要使用的修复模型。此外,在相邻时间间隔和相邻路段采集的信息很难同步,这意味着如果只考虑交通信息的路段相关性或时间相关性来修复数据,很大程度上将大大增大数据修复的误差。
因此,为提高数据修复和预测的精确度,有必要同时考虑城市道路网中路段的时间相关性和路段相关性,对缺失的数据进行修复。
发明内容
本发明的目的旨在至少解决所述技术缺陷之一。
为此,本发明的目的在于提出一种基于时间和路段相关性的数据修复方法,提高了数据修复的质量和数据修复预测的精度,从而提高了道路交通状态的检测精度。
为了实现上述目的,本发明的实施例提供一种基于时间和路段相关性的数据修复方法,包括如下步骤:
步骤S1,获取经过数据清洗的动态交通数据;
步骤S2,对所述动态交通数据进行基于时间相关性模型的修复,包括:采用二次指数平滑法对所述动态交通数据中连续点上缺失的交通进行预测,得到修复的观测值其中,T表示待修复数据与已知采样点的时间间隔,t表示当前时刻;
步骤S3,对所述动态交通数据进行基于路段相关性模型的修复,包括:根据相邻路段之间的相关,计算缺失数据路段上的车辆速度r表示缺失数据所在的路段号;
步骤S4,根据步骤S2中的计算出时间相关模型下的道路车辆速度vti,t,根据步骤S3中的计算出路段相关模型下的道路车辆速度vsi,t,根据vti,t和vsi,t计算基于时间相关性模型和路段相关性模型线性融合的i表示路段编号。
进一步,在所述步骤S2中,
v ^ t + T = a t + b t T ,
其中,at,bt分别表示模型参数。
进一步,
a t = 2 v t ( 1 ) - v t ( 2 ) b t = α 1 1 - α 1 ( v t ( 1 ) - v t ( 2 ) )
v t ( 1 ) = α 1 v t + ( 1 - α 1 ) v t - 1 ( 1 ) v t ( 2 ) = α 1 v t ( 1 ) + ( 1 - α 1 ) t - 1 ( 2 )
其中,表示一次指数平滑所得的值,表示二次指数平滑所得的值,令v0表示用于预测数据的第一个速度值,α1表示平滑常数,α1∈(0,1)。
进一步,对下式取最小值,得到α1
ϵ = Σ t = 0 n ( v t ( 2 ) - v t ) 2 .
进一步,在所述步骤S3中,
v t r = Σ h = 1 H r β h r · v h r ( h ) ,
其中,r表示缺失数据所在的路段号,Hr表示与路段r相邻的路段的总条数,表示相邻路段的序列号,表示相邻路段h在时间t时的车辆速度;表示权值因子
β h r = r h r Σ τ = 1 H r r τ r
其中,表示缺失数据所在路段r与其他相邻路段之间的路段相关系数。
进一步,在所述步骤S4中,
v i , t ^ = α 2 · vt i , t + ( 1 - α 2 ) · vs i , t
其中,表示路段ri的道路交通速度,α2表示平滑系数,α2∈(0,1)。
根据本发明实施例的基于时间和路段相关性的数据修复方法,将时间相关性修复和路段相关性修复进行融合,对缺失的交通状态数据进行修复。提出的基于时间-路段相关性模型进行数据修复的方法是可行的。从实际的城市道路网来,路段之间错综复杂,相互影响。本发明相较于基于时间相关性模型的数据修复,修复结果更逼近实际观测值,数据修复的质量更高,提高了数据修复预测的精度,从而提高了道路交通状态的检测精度,为后期交通策略的制定提供了理论基础。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明实施例的基于时间和路段相关性的数据修复方法的流程图;
图2为根据本发明实施例的局部路段空间分布示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
本发明提出一种基于时间和路段相关性的数据修复方法,通过建立在完善的“端(客户端)-管(管理系统)-云(云平台)”三层架构之上。利用道路参数的阈值属性,实现车云平台数据的清洗;根据缺失数据的类型,使用城市道路网中路段的时间相关性和路段相关性进行缺失数据的修复。
如图1所示,本发明实施例的基于时间和路段相关性的数据修复方法,包括如下步骤:
步骤S1,获取经过数据清洗的动态交通数据。
具体地,如果采集的动态交通数据在相邻一段时间间隔内相对比较完整,则可以采用交通信息的时间相关模型对数据进行修复和预测。
在道路网中相邻路段信息比较完整的情况下,交通信息的路段相关模型更适用数据的修复和预测。
步骤S2,对动态交通数据进行基于时间相关性模型的修复,包括:采用二次指数平滑法对动态交通数据中连续点上缺失的交通进行预测,得到修复的观测值
v ^ t + T = a t + b t T , - - - ( 1 )
其中,T表示待修复数据与已知采样点的时间间隔,T=1,2,…,t表示当前时刻,中间变量at,bt分别表示模型参数。
at,bt可以通过以下公式计算得到:
a t = 2 v t ( 1 ) - v t ( 2 ) b t = α 1 1 - α 1 ( v t ( 1 ) - v t ( 2 ) ) - - - ( 2 )
{ v t ( 1 ) = α 1 v t + ( 1 - α 1 ) v t - 1 ( 1 ) v t ( 2 ) = α 1 v t ( 1 ) + ( 1 - α 1 ) t - 1 ( 2 ) - - - ( 3 )
其中,表示一次指数平滑所得的值,表示二次指数平滑所得的值,令v0表示用于预测数据的第一个速度值,α1表示平滑常数,α1∈(0,1)。
令绝对误差
ϵ = Σ t = 0 n ( v t ( 2 ) - v t ) 2 - - - ( 4 )
理论上预测值越接近实际观测值,即ε越小,说明数据修复越成功,此时的α1即最优的平滑系数。因此,对公式(4)取最小值,得到的α1即为最优值。
图2为单车道的局部路段空间分布示意图。
如图2所示,黑色圆圈表示路口,实线表示道路(A1至A9路段),箭头表示道路交通流方说向。由于以单车道为例,因此箭头为单向箭头。表1列出了图2中非高峰时段内路段A6与其他路段之间的相关系数。由表1可知,相邻路段的相关系数相对较大,路段之间的相关系数随着路段之间距离的增大而变小。需要注意的是,路段A6和上下流路段,即路段A5和路段A9之间的相关系数相对其他路段要大,而平行路段之间的相关系数相对比较小。例如,路段A6与路段A1、路段A2和路段A3之间的相关系数较小。因此,路段之间的相关系数可以通过相邻路段之间的道路平均速度计算得到。
表1
步骤S3,对动态交通数据进行基于路段相关性模型的修复,包括:根据相邻路段之间的相关,计算缺失数据路段上的车辆速度r表示缺失数据所在的路段号;
v t r = Σ h = 1 H r β h r · v h r ( h ) , - - - ( 5 )
其中,r表示缺失数据所在的路段号,Hr表示与路段r相邻的路段的总条数,表示相邻路段的序列号,表示相邻路段h在时间t时的车辆速度;表示权值因子
β h r = r h r Σ τ = 1 H r r τ r - - - ( 6 )
其中,表示缺失数据所在路段r与其他相邻路段之间的路段相关系数。
在本发明的一个实施例中,路段之间的相关系数随时间变化而变化,如果数据之间没有相关性,则可以取数据缺失日期之间一段时间内的相关系数的平均值。
步骤S4,根据步骤S2中的计算出时间相关模型下的道路车辆速度vti,t,根据步骤S3中的计算出路段相关模型下的道路车辆速度vsi,t,根据vti,t和vsi,t计算基于时间相关性模型和路段相关性模型线性融合的i表示路段编号。
v i , t ^ = α 2 · vt i , t + ( 1 - α 2 ) · vs i , t - - - ( 7 )
其中,表示路段ri的道路交通速度,α2表示平滑系数,α2∈(0,1)。
由此,即为基于时间相关性和路段相关性进行数据修复后得到的缺失数据。采用上述方法对各个路段上的车辆缺失的交通数据进行修复,从而可以得到较为准确道路交通状态,为后期应用分析提供准确的数据基础。
根据本发明实施例的基于时间和路段相关性的数据修复方法,将时间相关性修复和路段相关性修复进行融合,对缺失的交通状态数据进行修复。提出的基于时间-路段相关性模型进行数据修复的方法是可行的。从实际的城市道路网来,路段之间错综复杂,相互影响。本发明相较于基于时间相关性模型的数据修复,修复结果更逼近实际观测值,数据修复的质量更高,提高了数据修复预测的精度,从而提高了道路交通状态的检测精度,为后期交通策略的制定提供了理论基础。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。本发明的范围由所附权利要求极其等同限定。

Claims (6)

1.一种基于时间和路段相关性的数据修复方法,其特征在于,包括如下步骤:
步骤S1,获取经过数据清洗的动态交通数据;
步骤S2,对所述动态交通数据进行基于时间相关性模型的修复,包括:采用二次指数平滑法对所述动态交通数据中连续点上缺失的交通进行预测,得到修复的观测值其中,T表示待修复数据与已知采样点的时间间隔,t表示当前时刻;
步骤S3,对所述动态交通数据进行基于路段相关性模型的修复,包括:根据相邻路段之间的相关,计算缺失数据路段上的车辆速度r表示缺失数据所在的路段号;
步骤S4,根据步骤S2中的计算出时间相关模型下的道路车辆速度vti,t,根据步骤S3中的计算出路段相关模型下的道路车辆速度vsi,t,根据vti,t和vsi,t计算基于时间相关性模型和路段相关性模型线性融合的i表示路段编号。
2.如权利要求1所述的基于时间和路段相关性的数据修复方法,其特征在于,在所述步骤S2中,
v ^ t + T = a t + b t T ,
其中,at,bt分别表示模型参数。
3.如权利要求2所述的基于时间和路段相关性的数据修复方法,其特征在于,
a t = 2 v t ( 1 ) - v t ( 2 ) b t = α 1 1 - α 1 ( v t ( 1 ) - v t ( 2 ) )
v t ( 1 ) = α 1 v t + ( 1 - α 1 ) v t 1 ( 1 ) v t ( 2 ) = α 1 v t ( 1 ) + ( 1 - α 1 ) t - 1 ( 2 )
其中,表示一次指数平滑所得的值,表示二次指数平滑所得的值,令v0表示用于预测数据的第一个速度值,α1表示平滑常数,α1∈(0,1)。
4.如权利要求3所述的基于时间和路段相关性的数据修复方法,其特征在于,对下式取最小值,得到α1
ϵ = Σ t = 0 n ( v t ( 2 ) - v t ) 2 .
5.如权利要求1所述的基于时间和路段相关性的数据修复方法,其特征在于,在所述步骤S3中,
v t r = Σ h = 1 H r β h r · v h r ( h ) ,
其中,r表示缺失数据所在的路段号,Hr表示与路段r相邻的路段的总条数,表示相邻路段的序列号,表示相邻路段h在时间t时的车辆速度;表示权值因子
β h r = r h r Σ τ = 1 H r r τ r
其中,表示缺失数据所在路段r与其他相邻路段之间的路段相关系数。
6.如权利要求1所述的基于时间和路段相关性的数据修复方法,其特征在于,在所述步骤S4中,
v i , t ^ = α 2 · vt i , t + ( 1 - α 2 ) · vs i , t
其中,表示路段ri的道路交通速度,α2表示平滑系数,α2∈(0,1)。
CN201610459938.9A 2016-06-22 2016-06-22 基于时间和路段相关性的数据修复方法 Pending CN106096302A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610459938.9A CN106096302A (zh) 2016-06-22 2016-06-22 基于时间和路段相关性的数据修复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610459938.9A CN106096302A (zh) 2016-06-22 2016-06-22 基于时间和路段相关性的数据修复方法

Publications (1)

Publication Number Publication Date
CN106096302A true CN106096302A (zh) 2016-11-09

Family

ID=57252090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610459938.9A Pending CN106096302A (zh) 2016-06-22 2016-06-22 基于时间和路段相关性的数据修复方法

Country Status (1)

Country Link
CN (1) CN106096302A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109992579A (zh) * 2019-03-28 2019-07-09 湖北交投智能检测股份有限公司 一种公路基础设施多源异质数据的数据修复方法及系统
CN111862595A (zh) * 2020-06-08 2020-10-30 同济大学 基于路网拓扑关系的速度预测方法、系统、介质及设备
CN114419889A (zh) * 2022-01-24 2022-04-29 上海商汤智能科技有限公司 时段划分方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739825A (zh) * 2009-11-06 2010-06-16 吉林大学 基于gps浮动车的交通数据故障识别与修复方法
CN102819682A (zh) * 2012-08-02 2012-12-12 清华大学 一种多阈值空间相关的浮动车数据清洗和修复算法
CN103971520A (zh) * 2014-04-17 2014-08-06 浙江大学 一种基于时空相关性的交通流量数据恢复方法
CN104156579A (zh) * 2014-07-31 2014-11-19 江南大学 一种动态交通异常数据检测与修复方法
CN104916131A (zh) * 2015-05-14 2015-09-16 重庆大学 高速公路事件检测的数据清洗方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739825A (zh) * 2009-11-06 2010-06-16 吉林大学 基于gps浮动车的交通数据故障识别与修复方法
CN102819682A (zh) * 2012-08-02 2012-12-12 清华大学 一种多阈值空间相关的浮动车数据清洗和修复算法
CN103971520A (zh) * 2014-04-17 2014-08-06 浙江大学 一种基于时空相关性的交通流量数据恢复方法
CN104156579A (zh) * 2014-07-31 2014-11-19 江南大学 一种动态交通异常数据检测与修复方法
CN104916131A (zh) * 2015-05-14 2015-09-16 重庆大学 高速公路事件检测的数据清洗方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ZHAOSHENG ZHANG 等;: "《A Study on the Method for Cleaning and Repairing the Probe Vehicle Data》", 《IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS》 *
张照生: "《交通约束下的行车最优路径规划》", 《中国博士学位论文全文数据库工程科技Ⅱ辑》 *
杨元元: "《基于时间序列模型的短时交通流预测的研究与应用》", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 *
王晓原 等;: "《交通流数据清洗规则研究》", 《计算机工程》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109992579A (zh) * 2019-03-28 2019-07-09 湖北交投智能检测股份有限公司 一种公路基础设施多源异质数据的数据修复方法及系统
CN111862595A (zh) * 2020-06-08 2020-10-30 同济大学 基于路网拓扑关系的速度预测方法、系统、介质及设备
CN111862595B (zh) * 2020-06-08 2021-12-31 同济大学 基于路网拓扑关系的速度预测方法、系统、介质及设备
CN114419889A (zh) * 2022-01-24 2022-04-29 上海商汤智能科技有限公司 时段划分方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN105118294B (zh) 一种基于状态模式的短时交通流预测方法
CN108197739B (zh) 一种城市轨道交通乘客流量预测方法
CN103903452B (zh) 交通流短时预测方法
CN109523095B (zh) 基于负荷预测和场景聚类的城市配电网规划方法
CN109215350B (zh) 一种基于rfid电子车牌数据的短期交通状态预测方法
CN104183134B (zh) 基于智能分车型的高速公路短时交通流量预测方法
CN104183119B (zh) 基于路段od反推的实时交通流分布预测方法
CN109492788A (zh) 预测人流量以及建立人流量预测模型的方法及相关设备
CN101794345B (zh) 一种数据处理方法及装置
CN106096302A (zh) 基于时间和路段相关性的数据修复方法
CN106600464A (zh) 基于模糊数学的电网建设新建项目造价快速估算方法
CN108734958B (zh) 一种交通速度预测方法
CN107133400A (zh) 一种飞机结构疲劳可靠度贝叶斯组合预测方法
CN110517485A (zh) 一种基于时段划分的短时交通流预测方法
CN103778323A (zh) 基于指数平滑的预测交通流数据的方法和系统
CN106887141A (zh) 基于排队论的连续交通节点拥塞程度预测模型、系统及方法
CN111737826B (zh) 一种基于增强学习的轨道交通自动仿真建模方法及装置
CN110263860A (zh) 一种高速公路交通流预测方法及装置
CN114529081A (zh) 一种时空联合的交通流量预测方法及装置
CN110991776A (zh) 一种基于gru网络实现水位预测的方法及系统
CN109993341A (zh) 一种基于径向基函数神经网络的客流量预测方法
CN113420488A (zh) 一种基于轨迹重构的城市路网od估计方法
Yao et al. Hybrid model for prediction of real-time traffic flow
He et al. The application of ARIMA-RBF model in urban rail traffic volume forecast
CN105608460A (zh) 多分类器融合方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161109