CN109871377B - 基于车载电子标签数据质量控制的交通异常区段识别方法 - Google Patents

基于车载电子标签数据质量控制的交通异常区段识别方法 Download PDF

Info

Publication number
CN109871377B
CN109871377B CN201910109035.1A CN201910109035A CN109871377B CN 109871377 B CN109871377 B CN 109871377B CN 201910109035 A CN201910109035 A CN 201910109035A CN 109871377 B CN109871377 B CN 109871377B
Authority
CN
China
Prior art keywords
data
abnormal
vehicle
electronic tag
flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910109035.1A
Other languages
English (en)
Other versions
CN109871377A (zh
Inventor
李立志
陈学钢
张力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIANGSU INTELLITRAINS Co.,Ltd.
Original Assignee
Jiangsu Intellitrains Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Intellitrains Co ltd filed Critical Jiangsu Intellitrains Co ltd
Publication of CN109871377A publication Critical patent/CN109871377A/zh
Application granted granted Critical
Publication of CN109871377B publication Critical patent/CN109871377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种基于车载电子标签数据质量控制的交通异常区段识别方法,包括基于错误数据、冗余数据的初步数据检测和质量控制、基于交通流演变规律的数据质量控制、基于有效数据集的高速公路交通异常区段识别。首先对原始车载电子标签数据中的四类错误数据进行识别剔除,获取初步筛选数据集。其次对初步筛选数据中的两类冗余数据进行剔除以获取正确数据集。然后对正确数据集中的流量异常数据进行修复以获取有效数据集。最后借助有效数据集中的车牌号、流量、过车时间等属性,进行高速公路交通异常区段识别及收费系统优化设计,避免了噪声数据的干扰,确保了方案的合理性。

Description

基于车载电子标签数据质量控制的交通异常区段识别方法
技术领域
本发明属于智能交通领域,涉及一种基于车载电子标签数据质量控制的交通异常区段识别方法。
背景技术
随着城市的不断发展,机动车数量逐年攀升,对有限的城市空间造成了巨大的交通压力,国内外各大城市均不同程度地面临着交通运行效率低下、交通事故频发等交通问题,而解决交通问题需以高质量的动态交通数据作为支撑。
而车载电子标签技术作为一种无线通信技术,作为当前进行动态交通数据采集的重要途径,在获取交通数据方面具有造价低、识别快的特征,车载电子标签技术通过无线电讯号识别特定车辆并读写相关数据,无需识别系统与目标间建立机械或者光学接触即可实现车辆的自动辨识与追踪,可便捷地获取大量的交通数据。但受异常交通状况、不良天气及仪器故障等诸多因素影响,车载电子标签技术进行数据采集时易出现标签写入信息错误、传输通讯过程故障及数据重复采集等现象,导致采集的数据存在错误、冗余和异常,需借助异常数据识别修复提高数据质量。
目前,数据的质量控制方法主要有三类:1)基于阈值判别法的错误数据识别;2)基于移动平均及历史数据的缺损数据识别;3)基于数据平滑及回归分析的异常数据识别。虽然前人就异常数据进行了充足的研究,但研究多集中于异常数据的识别,较少涉及数据的修复,在实际操作中进行数据修复仅是借助重复扫描以确认是否为元数据错误,对非元数据错误采用重复读取的方法进行修正,对错误数据仅进行简单的剔除。此外,数据的识别及修复具有严格的适用性,不同数据类型的识别修复方法也千差万别,目前在车载电子标签数据的质量控制方法上仍缺乏一套完整的、能够直接指导数据使用者实际工作的数据质量控制体系。国内也未对大量电子标签数据所隐含的交通规律进行深入研究,发掘数据背后所产生的效益,致使诸多城市对交通异常状态难以被有效识别,制定的交通管控方案缺乏全面的数据支撑。
发明内容
本发明提供了一种避免传统交通数据清洗带来的残缺与不合理,确保车载电子标签数据质量的基于车载电子标签数据质量控制的交通异常区段识别方法,为制定科学合理的交通管控措施提供了正确、全面的数据支撑。
本发明的基于车载电子标签数据质量控制的交通异常区段识别方法,包括以下步骤:
1)识别首位汉字异常数据、字符异常数据、汉字数量异常数据及后五位位数不足数据四类错误数据,对原始车载电子标签数据中的错误数据进行剔除,获取初步筛选数据集;
2)识别重复数据、相似数据两类冗余数据,对初步筛选数据集中的冗余数据进行剔除,获取正确数据集;
3)在正确数据集基础上,将固定时间汇集度下的流量转换为单位小时的标准流量,获取基站标准流量数据集;
4)在标准流量数据集基础上,根据图基平滑法识别异常流量数据,并依据多元线性回归对异常流量数据进行修复;
5)依据有效数据集中的过车时间、车牌号、流量数据,进行高速公路交通异常区段识别。
进一步的,本发明方法中,所述步骤1)中的原始电子标签数据是指车辆驶过电子标签基站时,后台数据管理系统以固定的时间汇集度记录的过车数据,每条数据包括过车时间、车牌号、流量、车道编号。
进一步的,本发明方法中,所述步骤1)中错误数据检测方法如下:
1.1)对于原始车载电子标签数据中的某条车辆数据,判断其车牌号字符长度是否等于8,若不等于8,则进入1.2),否则进入1.3);
1.2)判断字符长度是否大于8,若大于8则标记为“汉字数量异常数据”,进入1.5),若小于8则标记为“后五位位数不足数据”,进入1.5);
1.3)判断车牌首汉字是否异常,若首汉字异常则将其标记为“首汉字异常数据”,进入1.5),否则进入1.4);
1.4)判断车牌中是否包括特殊字符,若有则标记为“字符异常数据”,进入1.5),否则标记为“正确数据”,进入1.5);
1.5)判断是否遍历所有原始电子标签数据,若未遍历则返回步骤1.1)对下一条数据进行判别,否则输出剔除“首汉字异常数据、字符异常数据、汉字数量异常数据、后五位位数不足数据”后的数据,并作为初步筛选数据集。
进一步的,本发明方法中,所述步骤2)中冗余数据检测方法如下:
2.1)将初步筛选数据集所包括的N个不同车牌号标记为P1,P2…PN,并将相同车牌号的过车数据按时间序列排序,具体为:对车牌号Pk包含的
Figure BDA0001967364160000021
个过车时间,按时间排列为过车时间序列
Figure BDA0001967364160000031
k为整数,取值范围[1,N];
2.2)筛选出所有车牌号及过车时间均相同的数据,留下其中一条数据并将剩余的数据标记为“重复数据”,在初步筛选数据集中将所有“重复数据”剔除;
2.3)对同一车牌号的过车时间序列进行差分,具体为:对车牌号Pk的车时间序列
Figure BDA0001967364160000032
依据
Figure BDA0001967364160000033
做差分,其中,
Figure BDA0001967364160000034
为车牌号为Pk的车辆第j+1个过车时间与第j个过车时间的差分值,对于时间差分值
Figure BDA0001967364160000035
小于阈值的数据,留下其中一条数据并将剩余的数据标记为“相似数据”,在初步筛选数据集中将所有“相似数据”剔除;
2.4)判断是否遍历所有初步筛选数据集,若未遍历则返回步骤2.1)对下个车牌号的过车数据进行判别,否则输出剔除所有“重复数据、相似数据”后的数据,作为正确数据集。
进一步的,本发明方法中,所述步骤3)中按照以下方式获取基站标准流量数据集:在正确数据集中,以T为时间汇集度,统计第t个时段经基站m、车道n的车辆数qmn(t),每个时段长度均为T,将
Figure BDA0001967364160000036
称为第t个时段经基站i、车道j的标准流量,T0为单位标准时间,取1小时。
进一步的,本发明方法中,所述步骤4)中按照如下流程识别流量异常数据:
4.1)在标准流量数据中,取时段相邻的四组流量值分别为Qmn(t-2),Qmn(t-1),Qmn(t),Qmn(t+1),取中位数构造一次平滑序列
Figure BDA0001967364160000037
其中t为时段编号、m为基站编号、n为车道编号;
4.2)取
Figure BDA0001967364160000038
的中位数作构造二次平滑序列
Figure BDA0001967364160000039
4.3)令
Figure BDA00019673641600000310
构造三次平滑序列
Figure BDA00019673641600000311
4.4)计算
Figure BDA00019673641600000312
与Qij(t)的均方根误差
Figure BDA00019673641600000313
M表示标准流量数据集的数据量;
4.5)对平滑序列
Figure BDA00019673641600000314
借助RMSEij值进行修正,获取第t个时段,经基站i、车道j的最大、最小流量估计阈值分别为:
Figure BDA00019673641600000315
4.6)若
Figure BDA0001967364160000041
则认为第t个时段,经基站i、车道j的流量数据异常,需要修正,否则认为流量数据正常,无需修正。
进一步的,本发明方法中,所述步骤4)中根据下式对异常流量数据进行修正:
Figure BDA0001967364160000042
其中,m表示流量异常数据出现的时段;Cij(t)表示基站i、车道j在时段m的流量异常数据修正后的值;
Figure BDA0001967364160000043
表示历史上r天,基站i、车道j在时段m的正常流量数据;a0为常数项;a1,a2,...,aM为回归系数;e为随机误差。
原始车载电子标签数据一般包括过车时间、车牌号、流量、车道编号等多项属性,本发明以这些属性信息为基础对车载电子标签数据进行质量控制。
一方面,从错误数据检测和冗余数据检测两个方面进行数据质量的初步控制。第一步,依据车牌号建立错误数据检测方法,对原始车载电子标签数据中的四类错误数据进行识别及剔除,获取初步筛选数据集;第二步,借助相同车牌的过车时间差分建立冗余数据检测方法,再对初步筛选数据集中存在的两类冗余数据进行识别及剔除,获取正确数据集。
进一步地,数据初步质量控制的第一步是依据车牌号来建立错误数据的检测方法,通过该检测方法定义四类错误数据,进而对原始车载电子标签数据中的错误数据进行剔除以获取初步筛选数据集,错误数据检测方法构建步骤如下:
Step 1对于原始车载电子标签数据中的某条车辆数据,判断其车牌号字符长度是否等于8,若不等于8,则进入Step2,否则进入Step3;
Step 2判断字符长度是否大于8,若大于8则标记为“汉字数量异常数据”,进入Step5,若小于8则标记为“后五位位数不足数据”,进入Step5;
Step 3判断车牌首汉字是否异常,若首汉字异常则将其标记为“首汉字异常数据”,进入Step5,否则进入Step4;
Step 4判断车牌中是否包括特殊字符,若有则标记为“字符异常数据”,进入Step5,否则标记为“正确数据”,进入Step5;
Step 5判断是否遍历所有原始电子标签数据,若未遍历则返回步骤Step1对下一条数据进行判别,否则输出剔除“首汉字异常数据、字符异常数据、汉字数量异常数据、后五位位数不足数据”后的数据,并将其称为初步筛选数据集。
进一步地,初步质量控制的第二步依据冗余数据检测方法定义两类冗余数据,对初步筛选数据集做进一步剔除,最终获取正确数据集,冗余数据检测模型构建步骤如下:Step 1将初步筛选数据集所包括的N个不同车牌号标记为P1,P2…PN,并将相同车牌号的过车数据按时间序列排序。如对车牌号Pk包含的
Figure BDA0001967364160000051
个过车时间,按时间排列为过车时间序列
Figure BDA0001967364160000052
Step 2筛选出所有车牌号及过车时间均相同的数据,留下其中一条数据并将剩余的数据标记为“重复数据”,在初步筛选数据集中将所有“重复数据”剔除;
Step 3对同一车牌号的过车时间序列进行差分,如对车牌号Pk的车时间序列
Figure BDA0001967364160000053
依据
Figure BDA0001967364160000054
做差分,其中,
Figure BDA0001967364160000055
为车牌号为Pk的车辆第j+1个过车时间与第j个过车时间的差分值。对于时间差分值
Figure BDA0001967364160000056
小于阈值的数据,留下其中一条数据并将剩余的数据标记为“相似数据”,在初步筛选数据集中将所有“相似数据”剔除;
Step 4判断是否遍历所有初步筛选数据集,若未遍历则返回Step1对下个车牌号的过车数据进行判别,否则输出剔除所有“重复数据、相似数据”后的数据,最终留下正确数据集。
另一方面,数据进一步质量控制在正确数据集基础上,结合基站流量时变规律及邻近基站间的流量关系,对正确数据集做进一步质量控制,包括标准流量数据的获取、异常流量数据的识别及异常流量数据的修正三个步骤。进一步地,基站标准流量数据按照以下方法获取:
Figure BDA0001967364160000057
式中,t为时段编号,每个时段时长均为T;T表示时间汇集度;T0表示单位标准时间,取1小时;qmn(t)表示第t个时段内,经基站i、车道j的车辆数;Qmn(t)表示第t个时段内,经基站i、车道j的标准流量。进一步地,异常流量数据识别是借助图基平滑法来实现的,依据流量最大、最小流量估计阈值确定各时段的合理流量窗,对于不在该流量窗内的标准流量数据,即可认为该时段的流量数据异常,需要进行修复。第t个时段、基站m、车道n的异常流量数据识别方法如下:
Step1在标准流量数据中,取时段相邻的四组流量值分别为Qmn(t-2),Qmn(t-1),Qmn(t),Qmn(t+1),取中位数构造一次平滑序列
Figure BDA0001967364160000058
Step2取
Figure BDA0001967364160000061
的中位数作构造二次平滑序列
Figure BDA0001967364160000062
Step3令
Figure BDA0001967364160000063
构造三次平滑序列
Figure BDA0001967364160000064
Step4计算
Figure BDA0001967364160000065
与Qij(t)的均方根误差
Figure BDA0001967364160000066
M表示标准流量数据集的数据量;
Step5对平滑序列
Figure BDA0001967364160000067
借助RMSEij值进行修正,获取最大、最小流量估计阈值:
Figure BDA0001967364160000068
式中,Qij(max)(t)为第t个时段,经基站i、车道j的最大流量估计阈值;Qij(min)(t)为第t个时段,经基站i、车道j的最小流量估计阈值;
Step 6若
Figure BDA0001967364160000069
则认为第t个时段,经基站i、车道j的流量数据异常,需要修正,否则认为流量数据正常,无需修正。
进一步地,对于异常流量数据,依据同一时段、同一车道,历史上的正常流量,构建多元线性回归模型进行修复:
Figure BDA00019673641600000610
式中,m表示流量异常数据出现的时段;Cij(t)表示基站i、车道j在时段m的流量异常数据修正后的值;
Figure BDA00019673641600000611
表示历史上r天,基站i、车道j在时段m的正常流量数据;a0为常数项;a1,a2,...,aM为回归系数;e为随机误差。
本发明方法方法包括以下两个方面:1)通过数据初步质量控制对四类错误数据、两类冗余数据的识别及剔除;2)通过进一步数据质量控制对异常流量数据的识别及剔除。本发明中,车载电子标签技术的原始数据通常借助基站及车载电子标签获取,基站安装于路侧绿化带或中间分隔带上,在一定高度进行电子标签识别及信息获取,当贴有电子标签的车辆驶入基站检测范围时,即记录基站编号、车座子电子标签编号、车牌号、车辆车道位置、车流量等信息。
有益效果:本发明与现有技术相比,具有以下优点:
当前对数据的质量控制方法研究多具有普适性特点,对不同的数据源,其适用性程度不同,难以直接用于指导数据使用者实际工作。在车载电子标签数据的质量控制方法上仍缺乏一套完整的、能够直接指导数据使用者实际工作的数据质量控制体系,致使研究人员或管理维护人员对车载电子标签数据的清洗时,也仅仅是借助重复扫描以确认是否为源数据错误,对非源数据错误采用重复读取的方法进行修正,对源数据错误仅进行简单的剔除,数据中仍然存在着大量不符合交通规律的异常数据。本发明能够有效地提升车载电子标签技术采集的数据质量,实现了对原始车载电子标签数据中首汉字异常数据、字符异常数据、汉字数量异常数据、后五位位数不足数据四类错误数据及重复数据、相似数据两类冗余数据的高效率剔除。此外,本发明还依据单个基站流量变化规律及相邻基站间的流量联系,利用图基平滑法及多元回归分析,实现了异常流量数据的识别及修复,确保了所获数据符合实际交通流变化规律。本发明确保了车载电子标签数据的合理性,可直接用于指导数据使用者的实际研究,为高速公路交通异常区段识别、收费系统优化设计、停车场管理等方向的研究提供了高质量的数据支撑。
附图说明
图1为车载电子标签数据采集系统示意图;
图2为数据质量控制整体流程图;
图3为数据初步质量控制流程图;
图4为错误数据检测流程图;
图5为冗余数据检测流程图;
图6为进一步数据质量控制流程图。
具体实施方式
以下结合附图对本发明作进一步说明。
如图1所示,车载电子标签数据采集系统由前端数据采集系统和后台数据处理系统两部分组成,其中数据采集系统又包括电子标签、天线及读写器。读写器通过发射天线向外发送扇面射频信号,当贴有电子标签的车辆进入射频信号范围内时,其内置升压电路将天线获得的感应电流进行升压,进而作为芯片的电源,感应电流通过射频前端电路转化为数字信号,数字信号被送入逻辑控制电路进行信息处理,进而从存储器中获取对应的车辆信息,车辆信息经由逻辑控制电路送回射频前端电路,再通过天线将信息发送至读写器,读写器将接收到的射频信号转化为数字信号后传送到数据中心进行存储,从而完成原始车载电子标签数据的采集,原始数据一般包括过车时间、车牌号、流量、车道编号等多项属性。如图2所示,车载电子标签数据的质量控制方法包括基于错误数据、冗余数据的数据初步质量控制及基于交通流演变规律的进一步数据质量控制两个步骤。其中,数据初步质量控制包括两步,首先,依据车牌信息建立错误数据检测方法,对原始车载电子标签数据集中的错误数据进行识别及剔除,获取初步筛选数据集;然后,借助相同车牌的过车时间差分建立冗余数据检测方法,对初步筛选数据集中的冗余数据进行剔除,获取正确数据集。进一步数据质量控制建立在正确数据集基础上,包括三个步骤,首先,将给定时间汇集度下的流量数据转换为标准流量数据,获取标准流量数据集;然后,在标准流量数据集基础上,通过图基平滑法对基站交通流数据进行处理以识别异常流量数据;最后,结合历史上的正常流量数据,运用多元回归对异常流量数据进行修复。
如图3所示,原始车载电子标签数据的初步质量控制主要有两步,第一步,依据车牌号错误类型建立错误数据检测方法,对原始数据中的四类错误数据进行识别及剔除以获取初步筛选数据;第二步,借助相同车牌的过车时间差分建立冗余数据检测方法,再对初步筛选数据中存在的两类冗余数据进行识别及剔除以获取正确数据。
如图4所示,初步质量控制的第一步是依据错误数据检测方法定义首位汉字异常数据、字符异常数据、汉字数量异常数据及后五位位数不足数据四类错误数据,对原始车载电子标签数据中的错误数据进行剔除以获取初步筛选数据集,错误数据检测方法构建步骤如下:
Step 1对于原始车载电子标签数据中的某条车辆数据,判断其车牌号字符长度是否等于8,若不等于8,则进入Step2,否则进入Step3;
Step 2判断字符长度是否大于8,若大于8则标记为“汉字数量异常数据”,进入Step5,若小于8则标记为“后五位位数不足数据”,进入Step5;
Step 3判断车牌首汉字是否异常,若首汉字异常则将其标记为“首汉字异常数据”,进入Step5,否则进入Step4;
Step 4判断车牌中是否包括特殊字符,若有则标记为“字符异常数据”,进入Step5,否则标记为“正确数据”,进入Step5;
Step 5判断是否遍历所有原始电子标签数据。若未遍历则返回步骤Step1对下一条数据进行判别,否则输出剔除“首汉字异常数据、字符异常数据、汉字数量异常数据、后五位位数不足数据”后的数据,并将其称为初步筛选数据集。
如图5所示,数据初步质量控制的第二步依据冗余数据检测方法定义重复数据、相似数据两类冗余数据,对初步筛选数据集做进一步剔除,获取正确数据集,冗余数据检测方法如下:
Step 1将初步筛选数据集所包括的N个不同车牌号标记为P1,P2…PN,并将相同车牌号的过车数据按时间序列排序。如对车牌号Pk包含的
Figure BDA0001967364160000091
个过车时间,按时间排列为过车时间序列
Figure BDA0001967364160000092
其中k为整数,取值范围[1,N];
Step 2筛选出所有车牌号及过车时间均相同的数据,留下其中一条数据并将剩余的数据标记为“重复数据”,在初步筛选数据集中将所有“重复数据”剔除;
Step 3对同一车牌号的过车时间序列进行差分,如对车牌号Pk的车时间序列
Figure BDA0001967364160000093
依据
Figure BDA0001967364160000094
做差分,其中,
Figure BDA0001967364160000095
为车牌号为Pk的车辆第j+1个过车时间与第j个过车时间的差分值。对于时间差分值
Figure BDA0001967364160000096
小于阈值的数据,留下其中一条数据并将剩余的数据标记为“相似数据”,在初步筛选数据集中将所有“相似数据”剔除;
Step 4判断是否遍历所有初步筛选数据集,若未遍历则返回Step1对下个车牌号的过车数据进行判别,否则输出剔除所有“重复数据、相似数据”后的数据,最终留下正确数据集。虽然数据初步质量控制保证了数据在数据类型及重复相似上的正确性,但在实际中由于基站的故障往往会出现虽然数据类型正确且无重复相似数据,但存在部分时段的流量数据与流量时变趋势不符的现象,因此需结合流量时变规律对这些异常流量数据进行识别及修复。如图6所示,数据进一步质量控制建立在所述正确数据集基础上,包括以下三步:
(1)基站流量数据获取。在正确数据集中,以T为时间汇集度,统计第t个时段经基站m、车道n的车辆数qmn(t),每个时段长度均为T。将
Figure BDA0001967364160000097
称为第t个时段经基站i、车道j的标准流量,T0为单位标准时间,取1小时。
其中,为防止车辆到达的随机性对数据统计结果合理性的干扰,时间汇集度T的取值应当进行适当控制,取值范围20-60分钟。
(2)异常流量数据识别。异常流量数据识别借助图基平滑法实现,依据流量最大、最小流量估计阈值确定各时段的合理流量窗,对于不在该流量窗内的标准流量数据,即可认为该时段的流量数据异常,需要进行修复。第t个时段、基站m、车道n的异常流量数据识别方法如下:
Step 1在标准流量数据中,取时段相邻的四组流量值分别为Qmn(t-2),Qmn(t-1),Qmn(t),Qmn(t+1),取中位数构造一次平滑序列
Figure BDA0001967364160000098
Step 2取
Figure BDA0001967364160000101
的中位数作构造二次平滑序列
Figure BDA0001967364160000102
Step 3令
Figure BDA0001967364160000103
构造三次平滑序列
Figure BDA0001967364160000104
Step 4计算
Figure BDA0001967364160000105
与Qij(t)的均方根误差
Figure BDA0001967364160000106
M表示标准流量数据集的数据量;
Step 5对平滑序列
Figure BDA0001967364160000107
借助RMSEij值进行修正,获取最大、最小流量估计阈值:
Figure BDA0001967364160000108
式中,Qij(max)(t)为第t个时段,经基站i、车道j的最大流量估计阈值;Qij(min)(t)为第t个时段,经基站i、车道j的最小流量估计阈值;
Step 6若
Figure BDA0001967364160000109
则认为第t个时段,经基站i、车道j的流量数据异常,需要修正,否则认为流量数据正常,无需修正。
(3)异常流量数据修正。对于异常流量数据,依据同一时段、同一车道,历史上的正常流量,构建多元线性回归模型进行修复:
Figure BDA00019673641600001010
式中,m表示流量异常数据出现的时段;Cij(t)表示基站i、车道j在时段m的流量异常数据修正后的值;
Figure BDA00019673641600001011
表示历史上r天,基站i、车道j在时段m的正常流量数据;a0为常数项;a1,a2,...,aM为回归系数;e为随机误差。
通过对标准流量数据集中的流量异常数据的识别及修正,即可得到有效数据集。该数据集确保了车载电子标签数据的完整性、正确性并符合交通演变规律,避免了异常数据对交通管控决策的误导,为交通管理与控制措施的制定提供了科学的数据支撑。
在高速公路收费站布设微波交通检测器实现对原始交通数据的获取,借助前述质量控制方法获取的有效数据集,进行高速公路交通异常区段识别和收费系统优化设计。
本发明方法中,依据有效数据集中的过车时间、车牌号等信息,可准确高效地对高速公路交通异常区段进行识别,本发明可采用如下具体方法:
Step 1在高速公路各出入口收费站处或路段上设置车载电子标签基站,车辆驶经过时,依据前述电子标签数据的质量控制方法获取有效数据集中的过车时间、车牌号;
Step 2依据相同车牌号经过不同电子标签基站的过车时间,获取车辆该区段的行程时间,再结合电子标签基站位置,获取车辆在该区段的行程车速;
Step 3在一定时段内,若所有车辆在某区段的平均行程车速出现明显的下降,则判断该区段为交通异常区段。
本发明的的主要发明点和创新在于得到有效数据集。上述Step 1至Step 3对高速公路交通异常区段进行识别的方法是现有常规技术手段,本发明除了采用这一方式进行识别过程,还可以采用其他现有已知的方法,只要能实现对高速公路交通异常区段的识别即可。
进一步的,本发明中,高速公路管理部门可以及时对交通异常区段进行排查,判断是否存在交通事故、自然灾害或违章停车等现象。
同时,本发明还可依据有效数据集中的流量数据与高速公路收费站ETC通道单个服务台的服务能力之比,确定合理的ETC通道数量,若实际ETC通道的数量小于合理数量,则需要在该收费站增加ETC通道的数量,使其满足通行需求。
最后应说明的是:尽管本发明就车载电子标签数据质量控制的实施方法进行了示意和描述,但本领域的技术人员应当理解,只要不超出本发明的权利要求所限定的范围,可以对本发明进行各种变化和修改,这些对本发明权利要求进行改进的技术方案,均落入本发明的保护范围。

Claims (5)

1.一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,该方法包括以下步骤:
1)识别首位汉字异常数据、字符异常数据、汉字数量异常数据及后五位位数不足数据四类错误数据,对原始车载电子标签数据中的错误数据进行剔除,获取初步筛选数据集,所述错误数据的检测方法如下:
1.1)对于原始车载电子标签数据中的某条车辆数据,判断其车牌号字符长度是否等于8,若不等于8,则进入1.2),否则进入1.3);
1.2)判断字符长度是否大于8,若大于8则标记为“汉字数量异常数据”,进入1.5),若小于8则标记为“后五位位数不足数据”,进入1.5);
1.3)判断车牌首汉字是否异常,若首汉字异常则将其标记为“首汉字异常数据”,进入1.5),否则进入1.4);
1.4)判断车牌中是否包括特殊字符,若有则标记为“字符异常数据”,进入1.5),否则标记为“正确数据”,进入1.5);
1.5)判断是否遍历所有原始电子标签数据,若未遍历则返回步骤1.1)对下一条数据进行判别,否则输出剔除“首汉字异常数据、字符异常数据、汉字数量异常数据、后五位位数不足数据”后的数据,并作为初步筛选数据集;
2)识别重复数据、相似数据两类冗余数据,对初步筛选数据集中的冗余数据进行剔除,获取正确数据集,所述冗余数据的检测方法如下:
2.1)将初步筛选数据集所包括的N个不同车牌号标记为P1,P2…PN,并将相同车牌号的过车数据按时间序列排序,具体为:对车牌号Pk包含的
Figure FDA0002827737170000011
个过车时间,按时间排列为过车时间序列
Figure FDA0002827737170000012
k为整数,取值范围[1,N];
2.2)筛选出所有车牌号及过车时间均相同的数据,留下其中一条数据并将剩余的数据标记为“重复数据”,在初步筛选数据集中将所有“重复数据”剔除;
2.3)对同一车牌号的过车时间序列进行差分,具体为:对车牌号Pk的车时间序列
Figure FDA0002827737170000013
依据
Figure FDA0002827737170000014
做差分,其中,
Figure FDA0002827737170000015
为车牌号为Pk的车辆第j+1个过车时间与第j个过车时间的差分值,对于时间差分值
Figure FDA0002827737170000016
小于阈值的数据,留下其中一条数据并将剩余的数据标记为“相似数据”,在初步筛选数据集中将所有“相似数据”剔除;
2.4)判断是否遍历所有初步筛选数据集,若未遍历则返回步骤2.1)对下个车牌号的过车数据进行判别,否则输出剔除所有“重复数据、相似数据”后的数据,作为正确数据集;
3)在正确数据集基础上,将固定时间汇集度下的流量转换为单位小时的标准流量,获取基站标准流量数据集;
4)在标准流量数据集基础上,根据图基平滑法识别异常流量数据,并依据多元线性回归对异常流量数据进行修复;
5)依据有效数据集中的过车时间、车牌号、流量数据,采用如下方法进行高速公路交通异常区段识别:
Step 1在高速公路各出入口收费站处或路段上设置车载电子标签基站,车辆驶经过时,依据前述电子标签数据的质量控制方法获取有效数据集中的过车时间、车牌号;
Step 2依据相同车牌号经过不同电子标签基站的过车时间,获取车辆该区段的行程时间,再结合电子标签基站位置,获取车辆在该区段的行程车速;
Step 3在一定时段内,若所有车辆在某区段的平均行程车速出现明显的下降,则判断该区段为交通异常区段。
2.根据权利要求1所述的一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,所述步骤1)中的原始电子标签数据是指车辆驶过电子标签基站时,后台数据管理系统以固定的时间汇集度记录的过车数据,每条数据包括过车时间、车牌号、流量、车道编号。
3.根据权利要求1或2所述的一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,所述步骤3)中按照以下方式获取基站标准流量数据集:在正确数据集中,以T为时间汇集度,统计第t个时段经基站m、车道n的车辆数qmn(t),每个时段长度均为T,将
Figure FDA0002827737170000021
称为第t个时段经基站i、车道j的标准流量,T0为单位标准时间,取1小时。
4.根据权利要求1或2所述的一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,所述步骤4)中按照如下流程识别流量异常数据:
4.1)在标准流量数据中,取时段相邻的四组流量值分别为Qmn(t-2),Qmn(t-1),Qmn(t),Qmn(t+1),取中位数构造一次平滑序列
Figure FDA0002827737170000022
其中t为时段编号、m为基站编号、n为车道编号;
4.2)取
Figure FDA0002827737170000031
的中位数作构造二次平滑序列
Figure FDA0002827737170000032
4.3)令
Figure FDA0002827737170000033
构造三次平滑序列
Figure FDA0002827737170000034
4.4)计算
Figure FDA0002827737170000035
与Qij(t)的均方根误差
Figure FDA0002827737170000036
M表示标准流量数据集的数据量;
4.5)对平滑序列
Figure FDA0002827737170000037
借助RMSEij值进行修正,获取第t个时段,经基站i、车道j的最大、最小流量估计阈值分别为:
Figure FDA0002827737170000038
4.6)若
Figure FDA0002827737170000039
则认为第t个时段,经基站i、车道j的流量数据异常,需要修正,否则认为流量数据正常,无需修正。
5.根据权利要求4所述的一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,所述步骤4)中根据下式对异常流量数据进行修正:
Figure FDA00028277371700000310
其中,m表示流量异常数据出现的时段;Cij(t)表示基站i、车道j在时段m的流量异常数据修正后的值;
Figure FDA00028277371700000311
表示历史上r天,基站i、车道j在时段m的正常流量数据;a0为常数项;a1,a2,...,aM为回归系数;e为随机误差。
CN201910109035.1A 2018-12-03 2019-02-03 基于车载电子标签数据质量控制的交通异常区段识别方法 Active CN109871377B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2018114679603 2018-12-03
CN201811467960 2018-12-03

Publications (2)

Publication Number Publication Date
CN109871377A CN109871377A (zh) 2019-06-11
CN109871377B true CN109871377B (zh) 2021-04-02

Family

ID=66918629

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910109035.1A Active CN109871377B (zh) 2018-12-03 2019-02-03 基于车载电子标签数据质量控制的交通异常区段识别方法

Country Status (1)

Country Link
CN (1) CN109871377B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458966B (zh) * 2019-07-17 2022-06-21 易米智链(重庆)科技有限公司 基于etc的路边停车收费系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004355537A (ja) * 2003-05-30 2004-12-16 Matsushita Electric Ind Co Ltd 交通流データ予測装置及び方法
CN102968901A (zh) * 2012-11-30 2013-03-13 青岛海信网络科技股份有限公司 获取区域拥堵信息的方法及区域拥堵分析装置
CN103971520A (zh) * 2014-04-17 2014-08-06 浙江大学 一种基于时空相关性的交通流量数据恢复方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004355537A (ja) * 2003-05-30 2004-12-16 Matsushita Electric Ind Co Ltd 交通流データ予測装置及び方法
CN102968901A (zh) * 2012-11-30 2013-03-13 青岛海信网络科技股份有限公司 获取区域拥堵信息的方法及区域拥堵分析装置
CN103971520A (zh) * 2014-04-17 2014-08-06 浙江大学 一种基于时空相关性的交通流量数据恢复方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
城市快速路交通流故障数据修复方法研究;邹晓芳;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20170715;第C034-384页 *

Also Published As

Publication number Publication date
CN109871377A (zh) 2019-06-11

Similar Documents

Publication Publication Date Title
EP3349200A1 (en) Method and device for processing traffic road information
CN104318781B (zh) 基于rfid技术的行程速度获取方法
CN104732765B (zh) 基于卡口数据的城市道路饱和度实时监测方法
CN111178577B (zh) 一种基于geohash算法的服务站选址方法
CN104867192A (zh) 基于汽车电子标识的车辆行驶路径识别系统及方法
CN108230724B (zh) 一种基于极大概率估计的城市公交系统车载报站缺失数据修补方法
CN103971097A (zh) 一种基于多尺度笔画模型的车牌识别方法与系统
CN102837717A (zh) 利用车号识别判断列车行进方向及调车情况的方法及装置
CN111144446B (zh) 一种基于时空网格的司机身份识别方法和系统
CN102087789B (zh) 基于交通状态参数的交通状态判别系统和方法
CN104794906A (zh) 室外停车场出口车辆管理平台
CN110867077B (zh) 一种基于交通视频结构化数据质量控制的道路优化方法
CN109871377B (zh) 基于车载电子标签数据质量控制的交通异常区段识别方法
CN114501336B (zh) 一种公路出行量测算方法、装置、电子设备及存储介质
CN107680198A (zh) 共享自行车系统及在该系统中确定共享自行车车况的方法
CN110969861A (zh) 一种车辆识别方法、装置、设备及计算机存储介质
CN106297301A (zh) 一种车辆套牌检查方法及使用该方法的车辆套牌检测系统
CN114049788A (zh) 停车盲点识别方法、装置及电子装置、计算机程序产品
CN101694747B (zh) 异常车速的识别方法和装置
CN111860048A (zh) 智能化道路信息分析方法
CN114170836B (zh) 一种基于泊位信息的移动巡检停车管理方法及系统
CN115967950A (zh) 基于手机信令数据的特征与时序的城际出行模式辨识方法
CN113936481B (zh) 一种信号控制交叉口的空间利用状况评价方法
CN108109369B (zh) 一种基于行驶轨迹的运营车辆和非运营车辆识别监督方法
CN106295738B (zh) 一种车号识别装置、方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210222

Address after: 210049 10 Ma Qun Road, Qixia District, Nanjing, Jiangsu.

Applicant after: JIANGSU INTELLITRAINS Co.,Ltd.

Address before: 210049 10 Ma Qun Road, Qixia District, Nanjing, Jiangsu.

Applicant before: JIANGSU RAIFU INTELLIGENT TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant