CN109871377A - 基于车载电子标签数据质量控制的交通异常区段识别方法 - Google Patents

基于车载电子标签数据质量控制的交通异常区段识别方法 Download PDF

Info

Publication number
CN109871377A
CN109871377A CN201910109035.1A CN201910109035A CN109871377A CN 109871377 A CN109871377 A CN 109871377A CN 201910109035 A CN201910109035 A CN 201910109035A CN 109871377 A CN109871377 A CN 109871377A
Authority
CN
China
Prior art keywords
data
vehicle
abnormal
license plate
traffic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910109035.1A
Other languages
English (en)
Other versions
CN109871377B (zh
Inventor
李立志
陈学钢
张力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIANGSU INTELLITRAINS Co.,Ltd.
Original Assignee
JIANGSU RAIFU INTELLIGENT TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIANGSU RAIFU INTELLIGENT TECHNOLOGY Co Ltd filed Critical JIANGSU RAIFU INTELLIGENT TECHNOLOGY Co Ltd
Publication of CN109871377A publication Critical patent/CN109871377A/zh
Application granted granted Critical
Publication of CN109871377B publication Critical patent/CN109871377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于车载电子标签数据质量控制的交通异常区段识别方法,包括基于错误数据、冗余数据的初步数据检测和质量控制、基于交通流演变规律的数据质量控制、基于有效数据集的高速公路交通异常区段识别。首先对原始车载电子标签数据中的四类错误数据进行识别剔除,获取初步筛选数据集。其次对初步筛选数据中的两类冗余数据进行剔除以获取正确数据集。然后对正确数据集中的流量异常数据进行修复以获取有效数据集。最后借助有效数据集中的车牌号、流量、过车时间等属性,进行高速公路交通异常区段识别及收费系统优化设计,避免了噪声数据的干扰,确保了方案的合理性。

Description

基于车载电子标签数据质量控制的交通异常区段识别方法
技术领域
本发明属于智能交通领域,涉及一种基于车载电子标签数据质量控制的交通异常区段识别方法。
背景技术
随着城市的不断发展,机动车数量逐年攀升,对有限的城市空间造成了巨大的交通压力,国内外各大城市均不同程度地面临着交通运行效率低下、交通事故频发等交通问题,而解决交通问题需以高质量的动态交通数据作为支撑。
而车载电子标签技术作为一种无线通信技术,作为当前进行动态交通数据采集的重要途径,在获取交通数据方面具有造价低、识别快的特征,车载电子标签技术通过无线电讯号识别特定车辆并读写相关数据,无需识别系统与目标间建立机械或者光学接触即可实现车辆的自动辨识与追踪,可便捷地获取大量的交通数据。但受异常交通状况、不良天气及仪器故障等诸多因素影响,车载电子标签技术进行数据采集时易出现标签写入信息错误、传输通讯过程故障及数据重复采集等现象,导致采集的数据存在错误、冗余和异常,需借助异常数据识别修复提高数据质量。
目前,数据的质量控制方法主要有三类:1)基于阈值判别法的错误数据识别;2)基于移动平均及历史数据的缺损数据识别;3)基于数据平滑及回归分析的异常数据识别。虽然前人就异常数据进行了充足的研究,但研究多集中于异常数据的识别,较少涉及数据的修复,在实际操作中进行数据修复仅是借助重复扫描以确认是否为元数据错误,对非元数据错误采用重复读取的方法进行修正,对错误数据仅进行简单的剔除。此外,数据的识别及修复具有严格的适用性,不同数据类型的识别修复方法也千差万别,目前在车载电子标签数据的质量控制方法上仍缺乏一套完整的、能够直接指导数据使用者实际工作的数据质量控制体系。国内也未对大量电子标签数据所隐含的交通规律进行深入研究,发掘数据背后所产生的效益,致使诸多城市对交通异常状态难以被有效识别,制定的交通管控方案缺乏全面的数据支撑。
发明内容
本发明提供了一种避免传统交通数据清洗带来的残缺与不合理,确保车载电子标签数据质量的基于车载电子标签数据质量控制的交通异常区段识别方法,为制定科学合理的交通管控措施提供了正确、全面的数据支撑。
本发明的基于车载电子标签数据质量控制的交通异常区段识别方法,包括以下步骤:
1)识别首位汉字异常数据、字符异常数据、汉字数量异常数据及后五位位数不足数据四类错误数据,对原始车载电子标签数据中的错误数据进行剔除,获取初步筛选数据集;
2)识别重复数据、相似数据两类冗余数据,对初步筛选数据集中的冗余数据进行剔除,获取正确数据集;
3)在正确数据集基础上,将固定时间汇集度下的流量转换为单位小时的标准流量,获取基站标准流量数据集;
4)在标准流量数据集基础上,根据图基平滑法识别异常流量数据,并依据多元线性回归对异常流量数据进行修复;
5)依据有效数据集中的过车时间、车牌号、流量数据,进行高速公路交通异常区段识别。
进一步的,本发明方法中,所述步骤1)中的原始电子标签数据是指车辆驶过电子标签基站时,后台数据管理系统以固定的时间汇集度记录的过车数据,每条数据包括过车时间、车牌号、流量、车道编号。
进一步的,本发明方法中,所述步骤1)中错误数据检测方法如下:
1.1)对于原始车载电子标签数据中的某条车辆数据,判断其车牌号字符长度是否等于8,若不等于8,则进入1.2),否则进入1.3);
1.2)判断字符长度是否大于8,若大于8则标记为“汉字数量异常数据”,进入1.5),若小于8则标记为“后五位位数不足数据”,进入1.5);
1.3)判断车牌首汉字是否异常,若首汉字异常则将其标记为“首汉字异常数据”,进入1.5),否则进入1.4);
1.4)判断车牌中是否包括特殊字符,若有则标记为“字符异常数据”,进入1.5),否则标记为“正确数据”,进入1.5);
1.5)判断是否遍历所有原始电子标签数据,若未遍历则返回步骤1.1)对下一条数据进行判别,否则输出剔除“首汉字异常数据、字符异常数据、汉字数量异常数据、后五位位数不足数据”后的数据,并作为初步筛选数据集。
进一步的,本发明方法中,所述步骤2)中冗余数据检测方法如下:
2.1)将初步筛选数据集所包括的N个不同车牌号标记为P1,P2…PN,并将相同车牌号的过车数据按时间序列排序,具体为:对车牌号Pk包含的个过车时间,按时间排列为过车时间序列k为整数,取值范围[1,N];
2.2)筛选出所有车牌号及过车时间均相同的数据,留下其中一条数据并将剩余的数据标记为“重复数据”,在初步筛选数据集中将所有“重复数据”剔除;
2.3)对同一车牌号的过车时间序列进行差分,具体为:对车牌号Pk的车时间序列依据做差分,其中,为车牌号为Pk的车辆第j+1个过车时间与第j个过车时间的差分值,对于时间差分值小于阈值的数据,留下其中一条数据并将剩余的数据标记为“相似数据”,在初步筛选数据集中将所有“相似数据”剔除;
2.4)判断是否遍历所有初步筛选数据集,若未遍历则返回步骤2.1)对下个车牌号的过车数据进行判别,否则输出剔除所有“重复数据、相似数据”后的数据,作为正确数据集。
进一步的,本发明方法中,所述步骤3)中按照以下方式获取基站标准流量数据集:在正确数据集中,以T为时间汇集度,统计第t个时段经基站m、车道n的车辆数qmn(t),每个时段长度均为T,将称为第t个时段经基站i、车道j的标准流量,T0为单位标准时间,取1小时。
进一步的,本发明方法中,所述步骤4)中按照如下流程识别流量异常数据:
4.1)在标准流量数据中,取时段相邻的四组流量值分别为Qmn(t-2),Qmn(t-1),Qmn(t),Qmn(t+1),取中位数构造一次平滑序列其中t为时段编号、m为基站编号、n为车道编号;
4.2)取的中位数作构造二次平滑序列
4.3)令构造三次平滑序列
4.4)计算与Qij(t)的均方根误差M表示标准流量数据集的数据量;
4.5)对平滑序列借助RMSEij值进行修正,获取第t个时段,经基站i、车道j的最大、最小流量估计阈值分别为:
4.6)若则认为第t个时段,经基站i、车道j的流量数据异常,需要修正,否则认为流量数据正常,无需修正。
进一步的,本发明方法中,所述步骤4)中根据下式对异常流量数据进行修正:
其中,m表示流量异常数据出现的时段;Cij(t)表示基站i、车道j在时段m的流量异常数据修正后的值;表示历史上r天,基站i、车道j在时段m的正常流量数据;a0为常数项;a1,a2,...,aM为回归系数;e为随机误差。
原始车载电子标签数据一般包括过车时间、车牌号、流量、车道编号等多项属性,本发明以这些属性信息为基础对车载电子标签数据进行质量控制。
一方面,从错误数据检测和冗余数据检测两个方面进行数据质量的初步控制。第一步,依据车牌号建立错误数据检测方法,对原始车载电子标签数据中的四类错误数据进行识别及剔除,获取初步筛选数据集;第二步,借助相同车牌的过车时间差分建立冗余数据检测方法,再对初步筛选数据集中存在的两类冗余数据进行识别及剔除,获取正确数据集。
进一步地,数据初步质量控制的第一步是依据车牌号来建立错误数据的检测方法,通过该检测方法定义四类错误数据,进而对原始车载电子标签数据中的错误数据进行剔除以获取初步筛选数据集,错误数据检测方法构建步骤如下:
Step 1对于原始车载电子标签数据中的某条车辆数据,判断其车牌号字符长度是否等于8,若不等于8,则进入Step2,否则进入Step3;
Step 2判断字符长度是否大于8,若大于8则标记为“汉字数量异常数据”,进入Step5,若小于8则标记为“后五位位数不足数据”,进入Step5;
Step 3判断车牌首汉字是否异常,若首汉字异常则将其标记为“首汉字异常数据”,进入Step5,否则进入Step4;
Step 4判断车牌中是否包括特殊字符,若有则标记为“字符异常数据”,进入Step5,否则标记为“正确数据”,进入Step5;
Step 5判断是否遍历所有原始电子标签数据,若未遍历则返回步骤Step1对下一条数据进行判别,否则输出剔除“首汉字异常数据、字符异常数据、汉字数量异常数据、后五位位数不足数据”后的数据,并将其称为初步筛选数据集。
进一步地,初步质量控制的第二步依据冗余数据检测方法定义两类冗余数据,对初步筛选数据集做进一步剔除,最终获取正确数据集,冗余数据检测模型构建步骤如下:Step 1将初步筛选数据集所包括的N个不同车牌号标记为P1,P2…PN,并将相同车牌号的过车数据按时间序列排序。如对车牌号Pk包含的个过车时间,按时间排列为过车时间序列
Step 2筛选出所有车牌号及过车时间均相同的数据,留下其中一条数据并将剩余的数据标记为“重复数据”,在初步筛选数据集中将所有“重复数据”剔除;
Step 3对同一车牌号的过车时间序列进行差分,如对车牌号Pk的车时间序列依据做差分,其中,为车牌号为Pk的车辆第j+1个过车时间与第j个过车时间的差分值。对于时间差分值小于阈值的数据,留下其中一条数据并将剩余的数据标记为“相似数据”,在初步筛选数据集中将所有“相似数据”剔除;
Step 4判断是否遍历所有初步筛选数据集,若未遍历则返回Step1对下个车牌号的过车数据进行判别,否则输出剔除所有“重复数据、相似数据”后的数据,最终留下正确数据集。
另一方面,数据进一步质量控制在正确数据集基础上,结合基站流量时变规律及邻近基站间的流量关系,对正确数据集做进一步质量控制,包括标准流量数据的获取、异常流量数据的识别及异常流量数据的修正三个步骤。进一步地,基站标准流量数据按照以下方法获取:
式中,t为时段编号,每个时段时长均为T;T表示时间汇集度;T0表示单位标准时间,取1小时;qmn(t)表示第t个时段内,经基站i、车道j的车辆数;Qmn(t)表示第t个时段内,经基站i、车道j的标准流量。进一步地,异常流量数据识别是借助图基平滑法来实现的,依据流量最大、最小流量估计阈值确定各时段的合理流量窗,对于不在该流量窗内的标准流量数据,即可认为该时段的流量数据异常,需要进行修复。第t个时段、基站m、车道n的异常流量数据识别方法如下:
Step1在标准流量数据中,取时段相邻的四组流量值分别为Qmn(t-2),Qmn(t-1),Qmn(t),Qmn(t+1),取中位数构造一次平滑序列
Step2取的中位数作构造二次平滑序列
Step3令构造三次平滑序列
Step4计算与Qij(t)的均方根误差M表示标准流量数据集的数据量;
Step5对平滑序列借助RMSEij值进行修正,获取最大、最小流量估计阈值:
式中,Qij(max)(t)为第t个时段,经基站i、车道j的最大流量估计阈值;Qij(min)(t)为第t个时段,经基站i、车道j的最小流量估计阈值;
Step 6若则认为第t个时段,经基站i、车道j的流量数据异常,需要修正,否则认为流量数据正常,无需修正。
进一步地,对于异常流量数据,依据同一时段、同一车道,历史上的正常流量,构建多元线性回归模型进行修复:
式中,m表示流量异常数据出现的时段;Cij(t)表示基站i、车道j在时段m的流量异常数据修正后的值;表示历史上r天,基站i、车道j在时段m的正常流量数据;a0为常数项;a1,a2,...,aM为回归系数;e为随机误差。
本发明方法方法包括以下两个方面:1)通过数据初步质量控制对四类错误数据、两类冗余数据的识别及剔除;2)通过进一步数据质量控制对异常流量数据的识别及剔除。本发明中,车载电子标签技术的原始数据通常借助基站及车载电子标签获取,基站安装于路侧绿化带或中间分隔带上,在一定高度进行电子标签识别及信息获取,当贴有电子标签的车辆驶入基站检测范围时,即记录基站编号、车座子电子标签编号、车牌号、车辆车道位置、车流量等信息。
有益效果:本发明与现有技术相比,具有以下优点:
当前对数据的质量控制方法研究多具有普适性特点,对不同的数据源,其适用性程度不同,难以直接用于指导数据使用者实际工作。在车载电子标签数据的质量控制方法上仍缺乏一套完整的、能够直接指导数据使用者实际工作的数据质量控制体系,致使研究人员或管理维护人员对车载电子标签数据的清洗时,也仅仅是借助重复扫描以确认是否为源数据错误,对非源数据错误采用重复读取的方法进行修正,对源数据错误仅进行简单的剔除,数据中仍然存在着大量不符合交通规律的异常数据。本发明能够有效地提升车载电子标签技术采集的数据质量,实现了对原始车载电子标签数据中首汉字异常数据、字符异常数据、汉字数量异常数据、后五位位数不足数据四类错误数据及重复数据、相似数据两类冗余数据的高效率剔除。此外,本发明还依据单个基站流量变化规律及相邻基站间的流量联系,利用图基平滑法及多元回归分析,实现了异常流量数据的识别及修复,确保了所获数据符合实际交通流变化规律。本发明确保了车载电子标签数据的合理性,可直接用于指导数据使用者的实际研究,为高速公路交通异常区段识别、收费系统优化设计、停车场管理等方向的研究提供了高质量的数据支撑。
附图说明
图1为车载电子标签数据采集系统示意图;
图2为数据质量控制整体流程图;
图3为数据初步质量控制流程图;
图4为错误数据检测流程图;
图5为冗余数据检测流程图;
图6为进一步数据质量控制流程图。
具体实施方式
以下结合附图对本发明作进一步说明。
如图1所示,车载电子标签数据采集系统由前端数据采集系统和后台数据处理系统两部分组成,其中数据采集系统又包括电子标签、天线及读写器。读写器通过发射天线向外发送扇面射频信号,当贴有电子标签的车辆进入射频信号范围内时,其内置升压电路将天线获得的感应电流进行升压,进而作为芯片的电源,感应电流通过射频前端电路转化为数字信号,数字信号被送入逻辑控制电路进行信息处理,进而从存储器中获取对应的车辆信息,车辆信息经由逻辑控制电路送回射频前端电路,再通过天线将信息发送至读写器,读写器将接收到的射频信号转化为数字信号后传送到数据中心进行存储,从而完成原始车载电子标签数据的采集,原始数据一般包括过车时间、车牌号、流量、车道编号等多项属性。如图2所示,车载电子标签数据的质量控制方法包括基于错误数据、冗余数据的数据初步质量控制及基于交通流演变规律的进一步数据质量控制两个步骤。其中,数据初步质量控制包括两步,首先,依据车牌信息建立错误数据检测方法,对原始车载电子标签数据集中的错误数据进行识别及剔除,获取初步筛选数据集;然后,借助相同车牌的过车时间差分建立冗余数据检测方法,对初步筛选数据集中的冗余数据进行剔除,获取正确数据集。进一步数据质量控制建立在正确数据集基础上,包括三个步骤,首先,将给定时间汇集度下的流量数据转换为标准流量数据,获取标准流量数据集;然后,在标准流量数据集基础上,通过图基平滑法对基站交通流数据进行处理以识别异常流量数据;最后,结合历史上的正常流量数据,运用多元回归对异常流量数据进行修复。
如图3所示,原始车载电子标签数据的初步质量控制主要有两步,第一步,依据车牌号错误类型建立错误数据检测方法,对原始数据中的四类错误数据进行识别及剔除以获取初步筛选数据;第二步,借助相同车牌的过车时间差分建立冗余数据检测方法,再对初步筛选数据中存在的两类冗余数据进行识别及剔除以获取正确数据。
如图4所示,初步质量控制的第一步是依据错误数据检测方法定义首位汉字异常数据、字符异常数据、汉字数量异常数据及后五位位数不足数据四类错误数据,对原始车载电子标签数据中的错误数据进行剔除以获取初步筛选数据集,错误数据检测方法构建步骤如下:
Step 1对于原始车载电子标签数据中的某条车辆数据,判断其车牌号字符长度是否等于8,若不等于8,则进入Step2,否则进入Step3;
Step 2判断字符长度是否大于8,若大于8则标记为“汉字数量异常数据”,进入Step5,若小于8则标记为“后五位位数不足数据”,进入Step5;
Step 3判断车牌首汉字是否异常,若首汉字异常则将其标记为“首汉字异常数据”,进入Step5,否则进入Step4;
Step 4判断车牌中是否包括特殊字符,若有则标记为“字符异常数据”,进入Step5,否则标记为“正确数据”,进入Step5;
Step 5判断是否遍历所有原始电子标签数据。若未遍历则返回步骤Step1对下一条数据进行判别,否则输出剔除“首汉字异常数据、字符异常数据、汉字数量异常数据、后五位位数不足数据”后的数据,并将其称为初步筛选数据集。
如图5所示,数据初步质量控制的第二步依据冗余数据检测方法定义重复数据、相似数据两类冗余数据,对初步筛选数据集做进一步剔除,获取正确数据集,冗余数据检测方法如下:
Step 1将初步筛选数据集所包括的N个不同车牌号标记为P1,P2…PN,并将相同车牌号的过车数据按时间序列排序。如对车牌号Pk包含的个过车时间,按时间排列为过车时间序列其中k为整数,取值范围[1,N];
Step 2筛选出所有车牌号及过车时间均相同的数据,留下其中一条数据并将剩余的数据标记为“重复数据”,在初步筛选数据集中将所有“重复数据”剔除;
Step 3对同一车牌号的过车时间序列进行差分,如对车牌号Pk的车时间序列依据做差分,其中,为车牌号为Pk的车辆第j+1个过车时间与第j个过车时间的差分值。对于时间差分值小于阈值的数据,留下其中一条数据并将剩余的数据标记为“相似数据”,在初步筛选数据集中将所有“相似数据”剔除;
Step 4判断是否遍历所有初步筛选数据集,若未遍历则返回Step1对下个车牌号的过车数据进行判别,否则输出剔除所有“重复数据、相似数据”后的数据,最终留下正确数据集。虽然数据初步质量控制保证了数据在数据类型及重复相似上的正确性,但在实际中由于基站的故障往往会出现虽然数据类型正确且无重复相似数据,但存在部分时段的流量数据与流量时变趋势不符的现象,因此需结合流量时变规律对这些异常流量数据进行识别及修复。如图6所示,数据进一步质量控制建立在所述正确数据集基础上,包括以下三步:
(1)基站流量数据获取。在正确数据集中,以T为时间汇集度,统计第t个时段经基站m、车道n的车辆数qmn(t),每个时段长度均为T。将称为第t个时段经基站i、车道j的标准流量,T0为单位标准时间,取1小时。
其中,为防止车辆到达的随机性对数据统计结果合理性的干扰,时间汇集度T的取值应当进行适当控制,取值范围20-60分钟。
(2)异常流量数据识别。异常流量数据识别借助图基平滑法实现,依据流量最大、最小流量估计阈值确定各时段的合理流量窗,对于不在该流量窗内的标准流量数据,即可认为该时段的流量数据异常,需要进行修复。第t个时段、基站m、车道n的异常流量数据识别方法如下:
Step 1在标准流量数据中,取时段相邻的四组流量值分别为Qmn(t-2),Qmn(t-1),Qmn(t),Qmn(t+1),取中位数构造一次平滑序列
Step 2取的中位数作构造二次平滑序列
Step 3令构造三次平滑序列
Step 4计算与Qij(t)的均方根误差M表示标准流量数据集的数据量;
Step 5对平滑序列借助RMSEij值进行修正,获取最大、最小流量估计阈值:
式中,Qij(max)(t)为第t个时段,经基站i、车道j的最大流量估计阈值;Qij(min)(t)为第t个时段,经基站i、车道j的最小流量估计阈值;
Step 6若则认为第t个时段,经基站i、车道j的流量数据异常,需要修正,否则认为流量数据正常,无需修正。
(3)异常流量数据修正。对于异常流量数据,依据同一时段、同一车道,历史上的正常流量,构建多元线性回归模型进行修复:
式中,m表示流量异常数据出现的时段;Cij(t)表示基站i、车道j在时段m的流量异常数据修正后的值;表示历史上r天,基站i、车道j在时段m的正常流量数据;a0为常数项;a1,a2,...,aM为回归系数;e为随机误差。
通过对标准流量数据集中的流量异常数据的识别及修正,即可得到有效数据集。该数据集确保了车载电子标签数据的完整性、正确性并符合交通演变规律,避免了异常数据对交通管控决策的误导,为交通管理与控制措施的制定提供了科学的数据支撑。
在高速公路收费站布设微波交通检测器实现对原始交通数据的获取,借助前述质量控制方法获取的有效数据集,进行高速公路交通异常区段识别和收费系统优化设计。
本发明方法中,依据有效数据集中的过车时间、车牌号等信息,可准确高效地对高速公路交通异常区段进行识别,本发明可采用如下具体方法:
Step 1在高速公路各出入口收费站处或路段上设置车载电子标签基站,车辆驶经过时,依据前述电子标签数据的质量控制方法获取有效数据集中的过车时间、车牌号;
Step 2依据相同车牌号经过不同电子标签基站的过车时间,获取车辆该区段的行程时间,再结合电子标签基站位置,获取车辆在该区段的行程车速;
Step 3在一定时段内,若所有车辆在某区段的平均行程车速出现明显的下降,则判断该区段为交通异常区段。
本发明的的主要发明点和创新在于得到有效数据集。上述Step 1至Step 3对高速公路交通异常区段进行识别的方法是现有常规技术手段,本发明除了采用这一方式进行识别过程,还可以采用其他现有已知的方法,只要能实现对高速公路交通异常区段的识别即可。
进一步的,本发明中,高速公路管理部门可以及时对交通异常区段进行排查,判断是否存在交通事故、自然灾害或违章停车等现象。
同时,本发明还可依据有效数据集中的流量数据与高速公路收费站ETC通道单个服务台的服务能力之比,确定合理的ETC通道数量,若实际ETC通道的数量小于合理数量,则需要在该收费站增加ETC通道的数量,使其满足通行需求。
最后应说明的是:尽管本发明就车载电子标签数据质量控制的实施方法进行了示意和描述,但本领域的技术人员应当理解,只要不超出本发明的权利要求所限定的范围,可以对本发明进行各种变化和修改,这些对本发明权利要求进行改进的技术方案,均落入本发明的保护范围。

Claims (7)

1.一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,该方法包括以下步骤:
1)识别首位汉字异常数据、字符异常数据、汉字数量异常数据及后五位位数不足数据四类错误数据,对原始车载电子标签数据中的错误数据进行剔除,获取初步筛选数据集;
2)识别重复数据、相似数据两类冗余数据,对初步筛选数据集中的冗余数据进行剔除,获取正确数据集;
3)在正确数据集基础上,将固定时间汇集度下的流量转换为单位小时的标准流量,获取基站标准流量数据集;
4)在标准流量数据集基础上,根据图基平滑法识别异常流量数据,并依据多元线性回归对异常流量数据进行修复;
5)依据有效数据集中的过车时间、车牌号、流量数据,进行高速公路交通异常区段识别。
2.根据权利要求1所述的一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,所述步骤1)中的原始电子标签数据是指车辆驶过电子标签基站时,后台数据管理系统以固定的时间汇集度记录的过车数据,每条数据包括过车时间、车牌号、流量、车道编号。
3.根据权利要求1所述的一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,所述步骤1)中错误数据检测方法如下:
1.1)对于原始车载电子标签数据中的某条车辆数据,判断其车牌号字符长度是否等于8,若不等于8,则进入1.2),否则进入1.3);
1.2)判断字符长度是否大于8,若大于8则标记为“汉字数量异常数据”,进入1.5),若小于8则标记为“后五位位数不足数据”,进入1.5);
1.3)判断车牌首汉字是否异常,若首汉字异常则将其标记为“首汉字异常数据”,进入1.5),否则进入1.4);
1.4)判断车牌中是否包括特殊字符,若有则标记为“字符异常数据”,进入1.5),否则标记为“正确数据”,进入1.5);
1.5)判断是否遍历所有原始电子标签数据,若未遍历则返回步骤1.1)对下一条数据进行判别,否则输出剔除“首汉字异常数据、字符异常数据、汉字数量异常数据、后五位位数不足数据”后的数据,并作为初步筛选数据集。
4.根据权利要求1、2或3所述的一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,所述步骤2)中冗余数据检测方法如下:
2.1)将初步筛选数据集所包括的N个不同车牌号标记为P1,P2…PN,并将相同车牌号的过车数据按时间序列排序,具体为:对车牌号Pk包含的个过车时间,按时间排列为过车时间序列k为整数,取值范围[1,N];
2.2)筛选出所有车牌号及过车时间均相同的数据,留下其中一条数据并将剩余的数据标记为“重复数据”,在初步筛选数据集中将所有“重复数据”剔除;
2.3)对同一车牌号的过车时间序列进行差分,具体为:对车牌号Pk的车时间序列依据做差分,其中,为车牌号为Pk的车辆第j+1个过车时间与第j个过车时间的差分值,对于时间差分值小于阈值的数据,留下其中一条数据并将剩余的数据标记为“相似数据”,在初步筛选数据集中将所有“相似数据”剔除;
2.4)判断是否遍历所有初步筛选数据集,若未遍历则返回步骤2.1)对下个车牌号的过车数据进行判别,否则输出剔除所有“重复数据、相似数据”后的数据,作为正确数据集。
5.根据权利要求1、2或3所述的一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,所述步骤3)中按照以下方式获取基站标准流量数据集:在正确数据集中,以T为时间汇集度,统计第t个时段经基站m、车道n的车辆数qmn(t),每个时段长度均为T,将称为第t个时段经基站i、车道j的标准流量,T0为单位标准时间,取1小时。
6.根据权利要求1、2或3所述的一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,所述步骤4)中按照如下流程识别流量异常数据:
4.1)在标准流量数据中,取时段相邻的四组流量值分别为Qmn(t-2),Qmn(t-1),Qmn(t),Qmn(t+1),取中位数构造一次平滑序列其中t为时段编号、m为基站编号、n为车道编号;
4.2)取的中位数作构造二次平滑序列
4.3)令构造三次平滑序列
4.4)计算与Qij(t)的均方根误差M表示标准流量数据集的数据量;
4.5)对平滑序列借助RMSEij值进行修正,获取第t个时段,经基站i、车道j的最大、最小流量估计阈值分别为:
4.6)若则认为第t个时段,经基站i、车道j的流量数据异常,需要修正,否则认为流量数据正常,无需修正。
7.根据权利要求6所述的一种基于车载电子标签数据质量控制的交通异常区段识别方法,其特征在于,所述步骤4)中根据下式对异常流量数据进行修正:
其中,m表示流量异常数据出现的时段;Cij(t)表示基站i、车道j在时段m的流量异常数据修正后的值;表示历史上r天,基站i、车道j在时段m的正常流量数据;a0为常数项;a1,a2,...,aM为回归系数;e为随机误差。
CN201910109035.1A 2018-12-03 2019-02-03 基于车载电子标签数据质量控制的交通异常区段识别方法 Active CN109871377B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2018114679603 2018-12-03
CN201811467960 2018-12-03

Publications (2)

Publication Number Publication Date
CN109871377A true CN109871377A (zh) 2019-06-11
CN109871377B CN109871377B (zh) 2021-04-02

Family

ID=66918629

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910109035.1A Active CN109871377B (zh) 2018-12-03 2019-02-03 基于车载电子标签数据质量控制的交通异常区段识别方法

Country Status (1)

Country Link
CN (1) CN109871377B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458966A (zh) * 2019-07-17 2019-11-15 重庆易米智慧停车服务有限公司 基于etc的路边停车收费系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004355537A (ja) * 2003-05-30 2004-12-16 Matsushita Electric Ind Co Ltd 交通流データ予測装置及び方法
CN102968901A (zh) * 2012-11-30 2013-03-13 青岛海信网络科技股份有限公司 获取区域拥堵信息的方法及区域拥堵分析装置
CN103971520A (zh) * 2014-04-17 2014-08-06 浙江大学 一种基于时空相关性的交通流量数据恢复方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004355537A (ja) * 2003-05-30 2004-12-16 Matsushita Electric Ind Co Ltd 交通流データ予測装置及び方法
CN102968901A (zh) * 2012-11-30 2013-03-13 青岛海信网络科技股份有限公司 获取区域拥堵信息的方法及区域拥堵分析装置
CN103971520A (zh) * 2014-04-17 2014-08-06 浙江大学 一种基于时空相关性的交通流量数据恢复方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邹晓芳: "城市快速路交通流故障数据修复方法研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458966A (zh) * 2019-07-17 2019-11-15 重庆易米智慧停车服务有限公司 基于etc的路边停车收费系统

Also Published As

Publication number Publication date
CN109871377B (zh) 2021-04-02

Similar Documents

Publication Publication Date Title
CN103794070B (zh) 一种基于车路协同的动态诱导信息广播方法及系统
CN104732205B (zh) 一种高速公路逃费稽查的系统
CN107463940A (zh) 基于手机数据的车辆类型识别方法和设备
CN106197458A (zh) 一种基于手机信令数据和导航路线数据的手机用户出行方式识别方法
CN103700174A (zh) 一种基于wifi身份识别的公交客流数据采集及od分析方法
CN103886756A (zh) 基于obu的高速公路路网运行状态检测方法
CN106601005B (zh) 一种基于rfid和微信平台的城市智能交通诱导方法
CN106781509A (zh) 一种基于v2v的协作式城市道路拥堵检测方法
CN106781460B (zh) 一种路段交通状态确定方法及装置
CN113570864B (zh) 一种电动自行车行驶路径匹配方法、设备及存储介质
CN107273771B (zh) 车辆行驶方向的识别方法、系统、标识站、存储器及后台服务器
CN103971097A (zh) 一种基于多尺度笔画模型的车牌识别方法与系统
CN104700630A (zh) 一种高速公路车流量的监测方法及系统
CN107545757A (zh) 基于车牌识别的城市道路流速测量装置和方法
CN102956039B (zh) 基于片区建模的高速公路多路径通行费拆分方法
CN107563288A (zh) 一种套牌车车辆的识别方法和装置
CN104794906A (zh) 室外停车场出口车辆管理平台
CN108984758A (zh) 基于点位识别的车主关联地址分析方法及系统
CN106651732A (zh) 一种高速公路异车换卡逃费车辆筛查方法及系统
CN110096804A (zh) 基于移动终端数据的高速公路服务区的布局方法及系统
CN104299443A (zh) 基于低频有源射频识别技术的停车场车辆定位系统和方法
CN115830729A (zh) 基于高速公路etc数据融合的车辆出行信息提取方法
CN109871377A (zh) 基于车载电子标签数据质量控制的交通异常区段识别方法
CN109830101A (zh) 一种基于异常微波交通数据修复的拥堵区域识别方法
CN110164136A (zh) 套牌车辆识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210222

Address after: 210049 10 Ma Qun Road, Qixia District, Nanjing, Jiangsu.

Applicant after: JIANGSU INTELLITRAINS Co.,Ltd.

Address before: 210049 10 Ma Qun Road, Qixia District, Nanjing, Jiangsu.

Applicant before: JIANGSU RAIFU INTELLIGENT TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant