CN105513368A - 一种基于不确定信息的假牌车筛选方法 - Google Patents

一种基于不确定信息的假牌车筛选方法 Download PDF

Info

Publication number
CN105513368A
CN105513368A CN201510835244.6A CN201510835244A CN105513368A CN 105513368 A CN105513368 A CN 105513368A CN 201510835244 A CN201510835244 A CN 201510835244A CN 105513368 A CN105513368 A CN 105513368A
Authority
CN
China
Prior art keywords
car
data set
bayonet socket
vehicle
false
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510835244.6A
Other languages
English (en)
Other versions
CN105513368B (zh
Inventor
陈涛
李建元
李丹
顾超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yinjiang Technology Co.,Ltd.
Original Assignee
Enjoyor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Enjoyor Co Ltd filed Critical Enjoyor Co Ltd
Priority to CN201510835244.6A priority Critical patent/CN105513368B/zh
Publication of CN105513368A publication Critical patent/CN105513368A/zh
Application granted granted Critical
Publication of CN105513368B publication Critical patent/CN105513368B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/017Detecting movement of traffic to be counted or controlled identifying vehicles

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及一种基于不确定信息的假牌车筛选方法,包括如下步骤:(1)获取卡口过车记录数据与车辆登记信息数据,并进行数据清洗;(2)对清洗后的卡口过车记录数据集作时-空过滤得到新的卡口过车记录数据集;(3)计算并得到嫌疑车辆过车记录数据集与正常车辆过车记录数据集;(4)利用Spark计算嫌疑车辆与正常车辆之间的轨迹匹配度ω;(5)计算嫌疑车辆与正常车辆的车辆相似度θ;(6)利用轨迹匹配度ω与车辆相似度θ计算嫌疑车辆的假牌嫌疑度,得到假牌车筛选结果。本方法可以帮助交管部门主动地发现和查处假牌车辆,整改号牌污损严重的车辆;部署方便,适用性广。

Description

一种基于不确定信息的假牌车筛选方法
技术领域
本发明涉及智能交通领域,尤其涉及一种基于不确定信息的假牌车筛选方法。
背景技术
近年来,随着我国国民经济的高速发展,机动车保有量每年都在持续迅速地增长,各种交通违法违章现象也日渐增多。在各种交通违法违章中,车辆“假牌”、“套牌”是具有严重危害的违法行为。车辆“假牌”现象,指的是车辆伪造、变造机动车号牌,非法使用在机动车辆管理所车辆登记信息中不存在的车牌号的现象。“假牌”现象危害严重,不法分子通过使用“假牌”,逃避城市交通管制措施、逃避交通肇事责任,或从事非法营运及违法犯罪活动,严重影响了城市交通管理和人民生命财产安全,扰乱了社会秩序,危害了社会安全。查处“假牌”车辆,已成为各地公安部门和交通管理部门的重要任务。
从已有文献和公开的专利提出的假牌车筛选识别方法来看,目前涉及假牌筛选识别的方法相对较少。主要方法可分为两类:
(1)基于物联网的检测识别方法,如专利申请号CN201210187968.0采用在交警内部管理系统平台预留车辆安全检测码,通过现场查验输入安全检测码来判断是否假牌套牌;专利申请号CN201320577360.9采用一种基于RFID技术的虚假车牌识别装置,通过将该装置安装在车身,利用射频识别技术来判断车辆是否假牌套牌。
(2)基于车辆信息对比的检测识别方法,如专利申请号CN200819944980.X采用成像装置拍摄车辆外观特征信息并获得成像时间和地理位置信息,通过与管理服务器进行车辆外观特征信息比对,以及与车载设备进行地理位置信息比对,达到识别假牌、套牌的目的;专利申请号CN201510026235.2通过将监控点采集的车辆信息与合法登记车辆信息进行号牌比对,如果发现其中出现合法登记牌照中所没有的牌照信息,则认为该车辆为造假牌照的非法车辆,再作进一步验证。
上述方法在实际应用时存在一些弊端:基于物联网的检测识别方法需要给机动车安装检测设备,并采用人工方式查验或在道路部署无线监测点,成本较高,目前较难普及;基于车辆外观信息比对的方法容易受光照、环境影响较大,准确率不高;直接利用车辆号牌进行比对的方法虽然简单且有一定效果,但容易受到卡口识别错误率影响,以卡口平均识别错误率为3%来论,100万过车记录中就有3万辆车的号牌可能被错误识别成“假牌”。如果认为这些识别错误的都是“假牌”车辆,一方面不符合实际情况,另一方面对后续的视频核查和布控带来极大的不便。为了解决上述方法的弊端,实现快速有效地分析大规模的交通车辆数据,从众多不确定信息中筛选有用信息,准确锁定活跃的“假牌”车辆,需要一种新的技术方案来满足交管部门的需求。
发明内容
本发明为克服上述的不足之处,目的在于提供一种基于不确定信息的假牌车筛选方法,本方法结合了交通卡口的过车信息和车辆登记信息,对车辆的状态信息进行深度刻画分析来筛选嫌疑假牌车辆或车牌污损严重的车辆,融合了车辆的时-空轨迹特性和车牌相似度特性,并综合考虑了卡口的识别错误率因素影响,本方法部署方便,适用性广,能够有效地在大量的数据中筛选出嫌疑假车牌或污损车牌,极大地提高后续核查和布控效率。
本发明是通过以下技术方案达到上述目的:一种基于不确定信息的假牌车筛选方法,包括如下步骤:
(1)获取卡口过车记录数据与车辆登记信息数据,并进行数据清洗得到卡口过车记录数据集K与车辆信息数据集C;
(2)对卡口过车记录数据集K作时-空过滤得到新的卡口过车记录数据集K1
(3)利用卡口过车记录数据集K1与车辆信息数据集C计算并得到嫌疑车辆过车记录数据集X与正常车辆过车记录数据集Z;
(4)基于嫌疑车辆过车记录数据集X与正常车辆过车记录数据集Z,利用Spark计算嫌疑车辆与正常车辆之间的轨迹匹配度ω;
(5)基于嫌疑车辆过车记录数据集X与正常车辆过车记录数据集Z,计算嫌疑车辆与正常车辆的车牌相似度θ;
(6)利用轨迹匹配度ω与车牌相似度θ计算嫌疑车辆的假牌嫌疑度,得到假牌车筛选结果。
作为优选,所述步骤(1)卡口过车记录数据与车辆登记信息数据的数据清洗方法相同,方法如下:根据设定的数据清洗规则,删除不符合规则的数据;削减与假车牌筛选无关的数据维度,将筛选后的数据作为新的数据集。
作为优选,所述步骤(2)得到卡口过车记录数据集K1步骤如下:
(i)以设定时段为时间槽,统计卡口过车记录数据集K中所有卡口在不同时间槽下的识别错误率
(ii)计算卡口的平均识别错误率并去除的时段的卡口过车记录数据,整理后得到按时间过滤的卡口过车记录数据集K';
(iii)基于卡口过车记录数据集K',计算单个卡口i的识别错误率
(iv)计算所有卡口的错误率均值μ和标准差θ,并去除卡口i中的卡口过车记录数据,整理后得到按空间过滤的卡口过车记录数据集K1
作为优选,所述步骤(i)与步骤(iii)计算识别错误率公式如下:
其中,n表示嫌疑车辆的过车记录数,N表示总过车记录数,嫌疑车辆指的是车辆号牌在卡口过车记录数据集中有记录但是在车辆信息数据集中无记录的车辆。
作为优选,所述步骤(3)计算并得到嫌疑车辆过车记录数据集X的步骤如下:
(I)根据卡口过车记录数据集K1统计在卡口过车数据集K1中有记录但在车辆信息数据集C中无记录的车辆号牌,形成新的嫌疑车辆信息,并统计这些车辆号牌重复出现次数作为嫌疑车辆的活跃度ρ1,形成嫌疑车辆活跃度数据集H;
(II)对嫌疑车辆按活跃度由高到底排名,并设定活跃度阈值β;选取活跃度ρ1>β的嫌疑车辆号牌,结合卡口过车记录数据集K1整理后得到嫌疑车辆过车记录数据集X,其中
作为优选,所述步骤(3)计算正常并得到正常车辆过车记录数据集Z的方法为:根据卡口过车记录数据集K1统计在卡口过车数据集K1中有记录且在车辆信息数据集C中有记录的车辆号牌,作为正常车辆的信息,结合卡口过车记录数据集K1,得到正常车辆过车记录数据集Z,其中 Z ⋐ K 1 .
作为优选,所述步骤(4)计算嫌疑车辆与正常车辆之间的轨迹匹配度ω的计算方法如下:
(a)设定时间槽,利用Spark从嫌疑车辆过车记录数据集X中读取嫌疑车牌、卡口编号、过车记录数、过车时间数据,转换为RDD;
(b)根据计算节点数量确定RDD分区数量,将嫌疑车辆过车记录数据集X转化为RDD1[hphm,kkid,counts,times],其中,hphm表示嫌疑车牌,kkid表示卡口编号,counts表示通过某个卡口次数,times表示通过某个卡口的时间段;
(c)将hphm作为key,counts和times作为values,利用pivot_table工具将属于同一个车牌的所有卡口过车记录和各个时间槽整理成用以描述嫌疑车辆轨迹时-空特征的矩阵Us×t,将其整理为RDD2数据集,其中RDD2的Key为嫌疑车牌hphm1,Values为相应矩阵values1;
(d)利用步骤(a)至步骤(c)的方法从正常车辆过车记录数据集Z中整理用以描述正常车辆轨迹时-空特征的矩阵Vs×t,整理为RDD3数据集,其中RDD3的Key为正常车牌hphm2,Values为相应矩阵values2;
(e)将嫌疑车牌RDD2数据集和正常车牌RDD3数据集合分配到数据分区中,并将嫌疑车牌和真实车牌的Key设置为相同,嫌疑车牌数据集RDD2的值为(hphm1,values1),正常车牌数据RDD3的值为(hphm2,values2);
(f)通过Spark对RDD数据的cartesian方法将嫌疑车牌与正常车牌数据混合,形成新的分布式数据集RDD4,其值为((hphm1,values1),(hphm2,values2)),并将RDD4整理成键为(hphm1,hphm2),值为(values1,value2);
(g)采用RDD的reduce操作分布式计算两个values1与values2之间的矩阵相似度,得到嫌疑车辆和正常车辆的轨迹匹配度ω。
作为优选,所述步骤(5)计算嫌疑车辆与正常车辆的车牌相似度θ的计算公式如下:
θ = m M
其中,m表示两车牌之间字符相同的位数,M表示车牌字符位数。
作为优选,所述步骤(6)得到假牌车筛选结果步骤如下:
1)对轨迹匹配度ω和车牌相似度θ进行数据归一化计算;
2)根据归一化后的轨迹匹配度ωnorm和车牌相似度θnorm,计算嫌疑车辆的假牌嫌疑度,计算公式如下所示:
φ=a×ωnorm+(1-a)×θnorm
其中a为权重参数,取值范围为0-1之间;
3)对计算得到的嫌疑车辆假牌嫌疑度φ进行排序,得到最终的假牌嫌疑度排名结果。
作为优选,所述归一化计算公式如下:
x n o r m = x - x min x m a x - x min
其中,x表示原始数据,xnorm表示归一化后的数据,xmin、xmax分别为原始数据集的最小值和最大值。
本发明的有益效果在于:(1)本方法可以帮助交管部门主动地发现和查处假牌车辆,整改号牌污损严重的车辆;(2)本方法能够有效的在大量的数据中筛选出嫌疑假车牌或污损车牌,极大地提高后续核查和布控效率;(3)本发明所采用的方法部署方便,适用性广。
附图说明
图1是本发明方法的流程示意图;
图2是本发明实施例中卡口过车记录数据集K中的数据示例示意图;
图3是本发明实施例中统计得到的卡口各时段识别错误率分布示意图;
图4是本发明实施例中统计得到的各个卡口点位错误率结果示意图;
图5是本发明实施例的图片核查结果示意图。
具体实施方式
下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于此:
实施例:本实施例以杭州2015年5月—2015年9月的卡口过车记录数据,以及截至2015年9月的杭州车辆登记信息数据为例,为保护个人隐私,对于实施例中涉及真实车牌的叙述和附图进行特殊处理。
如图1所示,一种基于不确定信息的假牌车筛选方法,具体实施方式如下:
(1)数据预处理
(1.1)获取卡口过车记录数据,并进行数据清洗,主要过程如下:
根据设定的数据清洗规则,删除不符合规则的数据,如车牌号码为空的数据等;削减与假车牌筛选无关的数据维度,如车辆行驶速度等,将筛选后的数据存储到数据仓库中。为方便表述将其称为卡口过车记录数据集K。在本实施例中,主要针对杭州车辆进行假牌筛选,因此对于非“浙A”牌照、车牌号码为空或带“?”字符、因识别错误导致车牌后五位字符中出现超过3个字母以上、特殊号牌(学、警、试、军)等进行清洗,并进行去重(主要针对卡口编号、方向编号、号牌号码、经过时间4个维度均相同的重复数据)和削减维度,保留“卡口编号”、“方向编号”、“号牌类型”、“车辆类型”、“号牌号码”、“经过时间”、“车身颜色”6个维度。卡口过车记录数据集K中的数据示例如图2所示。
(1.2)获取车辆登记信息数据,并进行数据清洗,过程如下:
根据设定的数据清洗规则,删除不符合规则的数据,如带特殊字符的车牌等;削减与假车牌筛选无关的数据维度,如车辆登记日期等,将筛选后的数据存储到数据仓库中。为方便表述将其称为车辆信息数据集C。在本实施例中,对特殊号牌(学、警、试、军)进行清洗,并只保留“号牌号码”1个维度。
(1.3)卡口过车记录数据的时-空过滤
由于受阴影、光照、图像质量等多方面外部因素影响,卡口设备对于通行车辆的车牌不能够做到100%的正确识别,且不同的时间段的识别错误率也有所波动。为了能够进一步缩小数据分析范围,本发明通过统计所有卡口在不同时段的识别错误率和单个卡口的识别错误率,对卡口过车记录数据进行按时间和空间上的过滤。主要步骤如下:
(1.3.1)按时间
本实施例以3小时为时间槽,统计卡口过车记录数据集K中所有卡口在不同时间槽下的识别错误率。识别错误率的计算方式如公式(1)所示:
其中,n表示嫌疑车辆的过车记录数,N表示总过车记录数,嫌疑车辆指的是车辆号牌在卡口过车记录数据集中有记录但是在车辆信息数据集中无记录的车辆。
各时段的识别错误率计算结果如图3所示。从图中可见,6:00—18:00时段卡口识别错误率小于4%,18:00—6:00卡口识别错误率大于4%,平均识别错误率对于的时间段,认为在这个时间段内卡口识别相对较为稳定。因此,保留6:00—18:00时段的卡口过车记录数据集,整理后得到按时间过滤的卡口过车记录数据集K'。
(1.3.2)按空间
(1.3.2.1)根据步骤(2.1)过滤后得到的卡口过车记录数据集K',按照公式(1)计算单个卡口i的识别错误率
(1.3.2.2)计算所有卡口的错误率均值μ和标准差σ。计算得到μ=3.27%,σ=1.55%。
(1.3.2.3)去除卡口i中的卡口过车记录数据。整理后得到按空间过滤的卡口过车记录数据集K1,存储数据集K1,作为新的卡口过车记录数据集,以留作后面步骤使用。在本实施例中,去除的识别错误率>4.82%的卡口共有48个。各个卡口的错误率以及错误率均值μ以及标准差σ如图4所示。
(1.4)嫌疑车辆和正常车辆的过车记录数据集获取
(1.4.1)嫌疑车辆的过车记录数据集获取
(1.4.1.1)根据步骤(1.3)过滤后得到的新的卡口过车记录数据集K1,重新统计在卡口过车数据集K1中有记录但在车辆信息数据集C中无记录的车辆号牌,形成新的嫌疑车辆信息,并统计这些车辆号牌重复出现次数作为嫌疑车辆的活跃度ρ1,形成嫌疑车辆活跃度数据集H。数据集H的数据格式示例如下表1所示:
嫌疑车辆号牌 活跃度ρ1
浙A##J0 910
表1
(1.4.1.2)对嫌疑车辆按活跃度由高到底排名,并设定活跃度阈值β(β取值为整数,且根据活跃度分布的长尾效应,取值应尽可能小)。本实施例设定活跃度阈值β=10,对于活跃度ρ1<10的正常车辆,认为是由于卡口设备偶然地错误识别予以去除。取活跃度ρ1>10的嫌疑车辆号牌,结合卡口过车记录数据集K1整理后得到嫌疑车辆过车记录数据集X。其中
(1.4.2)正常车辆的过车记录数据集获取
(1.4.2.1)根据步骤(1.3)过滤后得到的新的卡口过车记录数据集K1,统计在卡口过车数据集K1中有记录且在车辆信息数据集C中有记录的车辆号牌,作为正常车辆的信息,结合卡口过车记录数据集K1,形成正常车辆过车记录数据集Z。其中
(2)计算嫌疑车辆与正常车辆之间的轨迹匹配度ω
本实施例利用Spark进行轨迹匹配度计算,将YARN作为Spark的运行平台,采用yarn-cluster模式,这种模式下,SparkDriver将作为YARN中的一个ApplicationMaster在YARN集群中先启动,然后再由ApplicationMaster向YARN中的资源管理器中申请资源启动executor以运行task。计算过程如下:
(2.1)在本实施例中,以1小时为时间槽,共有12个时间槽,经步骤(1.3)筛选后共有可用卡口数487个。Spark应用驱动程序Driver从卡口过车记录数据集K1读取嫌疑车牌、卡口编号、过车记录数、过车时间等数据,转换为RDD并根据计算节点数量来确定RDD分区数量,将嫌疑车辆过车记录数据集X转化为RDD1[浙A8##J0,31000300002501,101,3],其中“浙A8##J0”表示嫌疑车牌hphm,31000300002501表示卡口编号kkid,101表示通过该卡口次数counts,3表示通过该卡口的时间段times,为8:00—9:00时间段。
(2.2)通过map过程将hphm作为Key,counts和times作为Values,利用Pandas包下的pivot_table工具将属于同一个车牌的所有卡口过车记录和各个时间槽整理成用以描述嫌疑车辆轨迹时-空特征的矩阵Us×t,将其整理为RDD2数据集,其中RDD2的Key为嫌疑车牌hphm1,Values为相应矩阵values1。RDD2的示例如下表2所示:
表2
(2.3)采用步骤(2.2)方法,整理用以描述正常车辆轨迹时-空特征的矩阵Vs×t,整理为RDD3数据集,其中RDD3的Key为正常车牌hphm2,Values为相应矩阵values2;并将嫌疑车牌RDD2数据集和正常车牌RDD3数据集合分配到相应的数据分区中,通过map过程将嫌疑车牌和真实车牌的Key设置为相同,Values中包含车牌和相应的卡口过车数据,即嫌疑车牌数据集RDD2的值为(hphm1,values1),正常车牌数据RDD3的值为(hphm2,values2),通过Spark对RDD数据的cartesian方法将嫌疑车牌与正常车牌数据混合,形成新的分布式数据集RDD4,其值为((hphm1,values1),(hphm2,values2));
(2.4)通过map过程将步骤(2.3)产生的RDD4整理为键是(hphm1,hphm2),值为(values1,value2),最后采用RDD的reduce操作分布式计算两个values1与values2之间的矩阵相似度,将计算结果发送给Driver,获得嫌疑车辆和正常车辆的轨迹匹配度ω。
(3)计算嫌疑车辆与正常车辆的车牌相似度θ
计算嫌疑车辆与正常车辆的车牌后五位字符相似度θ。计算公式如下:
θ = m M - - - ( 2 )
其中,m表示两两车牌之间字符相同的位数,M表示车牌字符位数。例如嫌疑车牌后五位字符是8##J0,正常车辆的车牌后五位字符是2##JN,则它们之间的相似度
(4)嫌疑度计算与最终排序结果展现
(4.1)归一化
为了保证轨迹匹配度ω和车牌相似度θ之间尺度的统一,需进行数据归一化计算,轨迹匹配度ω归一化结果为:
ω n o r m = ω - ω min ω m a x - ω min - - - ( 3 )
其中,ω表示原始数据,ωnorm表示归一化后的数据,ωmin、ωmax分别为轨迹匹配度原始数据集的最小值和最大值
车牌相似度θ归一化结果为:
θ n o r m = θ - θ min θ m a x - θ min - - - ( 4 )
其中,θ表示原始数据,θnorm表示归一化后的数据,θmin、θmax分别为车牌相似度原始数据集的最小值和最大值。
(4.2)根据步骤(4.1)归一化后得到的轨迹匹配度ωnorm和车牌相似度θnorm,计算嫌疑车辆的假牌嫌疑度,计算方法如公式(4)所示:
φ=a×ωnorm+(1-a)×θnorm(5)
其中,a为权重参数,取值范围为0-1之间。在本实施例中,取a=0.3,由公式(5)计算得到嫌疑车辆的假牌嫌疑度φ并进行排序,得到最终的假牌嫌疑度排名并进行存储和展现。
本实施例中将嫌疑车辆活跃度排名前10与由本发明方法得到的最终嫌疑度排名前10进行对比展示,并对本发明方法获得的结果进行视频图像核查,核查结果如图5所示。根据视频图像与车辆信息登记表核对发现,利用本发明方法排名前10中有3辆车的车牌能被卡口正确识别且在车辆信息登记表中无记录,极有可能是假牌,如下表3所示。其他车辆号牌或为轻度污损,或为光线、角度问题以及卡口设备本身问题导致被错误识别(如图5中第二张图的方框内所示)。由此可见,利用本发明方法能够更为有效地从不确定信息中筛选出假牌车信息。
嫌疑车辆活跃度排名 最终嫌疑度排名
浙A8##J0(假) 浙A8##J0(假)
浙A7##R5 浙AT8##6(污损)
浙AT##U3 浙AT8##9
浙A0##97 浙A9##16(假)
浙AT##14 浙A1B##7
浙AM##86 浙A3##66(假)
浙A8##0P 浙A8##L0
浙A9##S3 浙A8##Z0
浙AT##2P 浙A0##10
浙AT##20 浙ATU##0
表3
在本实施例中,采用hive作为数据仓库,利用HiveQL进行数据清洗和预处理,利用spark来进行轨迹匹配度和车牌相似度计算,最终获得嫌疑车牌的假牌嫌疑度排序,保证了计算可行性。
综上所述,本发明所采用的技术方案具有以下特点:
1、本发明所采用的技术方案建立的嫌疑车牌信息是从大规模的不确定信息中进行筛选获得有效信息,非被动地根据举报信息进行筛选核查。本发明所采用的技术方案结合了交通卡口的过车信息和车辆登记信息,对车辆的状态信息进行深度刻画分析来筛选嫌疑假牌车辆或车牌污损严重的车辆。利用本发明方法可以帮助交管部门主动地发现和查处假牌车辆,整改号牌污损严重的车辆。
2、本发明所采用的技术方案融合了车辆的时-空轨迹特性和车牌相似度特性,并综合考虑了卡口的识别错误率因素影响,相比现有方法,能够有效的在大量的数据中筛选出嫌疑假车牌或污损车牌,极大地提高后续核查和布控效率
3、本发明所采用的技术方案部署方便,适用性广。本发明的方法通过采集交通卡口设备的过车记录信息和车辆登记信息,结合了Hive数据仓库和spark分布式计算系统,可以对大规模的数据进行分析计算,可以对更多地区和城市的所有交通卡口在较长时段采集的数据进行分析,并且数据越丰富,筛选结果越有效。
以上的所述乃是本发明的具体实施例及所运用的技术原理,若依本发明的构想所作的改变,其所产生的功能作用仍未超出说明书及附图所涵盖的精神时,仍应属本发明的保护范围。

Claims (10)

1.一种基于不确定信息的假牌车筛选方法,其特征在于,包括如下步骤:
(1)获取卡口过车记录数据与车辆登记信息数据,并进行数据清洗得到卡口过车记录数据集K与车辆信息数据集C;
(2)对卡口过车记录数据集K作时-空过滤得到新的卡口过车记录数据集K1
(3)利用卡口过车记录数据集K1与车辆信息数据集C计算并得到嫌疑车辆过车记录数据集X与正常车辆过车记录数据集Z;
(4)基于嫌疑车辆过车记录数据集X与正常车辆过车记录数据集Z,利用Spark计算嫌疑车辆与正常车辆之间的轨迹匹配度ω;
(5)基于嫌疑车辆过车记录数据集X与正常车辆过车记录数据集Z,计算嫌疑车辆与正常车辆的车牌相似度θ;
(6)利用轨迹匹配度ω与车牌相似度θ计算嫌疑车辆的假牌嫌疑度,得到假牌车筛选结果。
2.根据权利要求1所述的一种基于不确定信息的假牌车筛选方法,其特征在于:所述步骤(1)卡口过车记录数据与车辆登记信息数据的数据清洗方法相同,方法如下:根据设定的数据清洗规则,删除不符合规则的数据;削减与假车牌筛选无关的数据维度,将筛选后的数据作为新的数据集。
3.根据权利要求1所述的一种基于不确定信息的假牌车筛选方法,其特征在于:所述步骤(2)得到卡口过车记录数据集K1步骤如下:(i)以设定时段为时间槽,统计卡口过车记录数据集K中所有卡口在不同时间槽下的识别错误率
(ii)计算卡口的平均识别错误率并去除的时段的卡口过车记录数据,整理后得到按时间过滤的卡口过车记录数据集K';
(iii)基于卡口过车记录数据集K',计算单个卡口i的识别错误率
(iv)计算所有卡口的错误率均值μ和标准差θ,并去除卡口i中的卡口过车记录数据,整理后得到按空间过滤的卡口过车记录数据集K1
4.根据权利要求3所述的一种基于不确定信息的假牌车筛选方法,其特征在于:所述步骤(i)与步骤(iii)计算识别错误率公式如下:
其中,n表示嫌疑车辆的过车记录数,N表示总过车记录数,嫌疑车辆指的是车辆号牌在卡口过车记录数据集中有记录但是在车辆信息数据集中无记录的车辆。
5.根据权利要求1所述的一种基于不确定信息的假牌车筛选方法,其特征在于:所述步骤(3)计算并得到嫌疑车辆过车记录数据集X的步骤如下:
(I)根据卡口过车记录数据集K1统计在卡口过车数据集K1中有记录但在车辆信息数据集C中无记录的车辆号牌,形成新的嫌疑车辆信息,并统计这些车辆号牌重复出现次数作为嫌疑车辆的活跃度ρ1,形成嫌疑车辆活跃度数据集H;
(II)对嫌疑车辆按活跃度由高到底排名,并设定活跃度阈值β;选取活跃度ρ1>β的嫌疑车辆号牌,结合卡口过车记录数据集K1整理后得到嫌疑车辆过车记录数据集X,其中
6.根据权利要求1所述的一种基于不确定信息的假牌车筛选方法,其特征在于:所述步骤(3)计算并得到正常车辆过车记录数据集Z的方法为:根据卡口过车记录数据集K1统计在卡口过车数据集K1中有记录且在车辆信息数据集C中有记录的车辆号牌,作为正常车辆的信息,结合卡口过车记录数据集K1,得到正常车辆过车记录数据集Z,其中
7.根据权利要求1所述的一种基于不确定信息的假牌车筛选方法,其特征在于:所述步骤(4)计算嫌疑车辆与正常车辆之间的轨迹匹配度ω的计算方法如下:
(a)设定时间槽,利用Spark从嫌疑车辆过车记录数据集X中读取嫌疑车牌、卡口编号、过车记录数、过车时间数据,转换为RDD;
(b)根据计算节点数量确定RDD分区数量,将嫌疑车辆过车记录数据集X转化为RDD1[hphm,kkid,counts,times],其中,hphm表示嫌疑车牌,kkid表示卡口编号,counts表示通过某个卡口次数,times表示通过某个卡口的时间段;
(c)将hphm作为key,counts和times作为values,利用pivot_table工具将属于同一个车牌的所有卡口过车记录和各个时间槽整理成用以描述嫌疑车辆轨迹时-空特征的矩阵Us×t,将其整理为RDD2数据集,其中RDD2的Key为嫌疑车牌hphm1,Values为相应矩阵values1;
(d)利用步骤(a)至步骤(c)的方法从正常车辆过车记录数据集Z中整理用以描述正常车辆轨迹时-空特征的矩阵Vs×t,整理为RDD3数据集,其中RDD3的Key为正常车牌hphm2,Values为相应矩阵values2;
(e)将嫌疑车牌RDD2数据集和正常车牌RDD3数据集合分配到数据分区中,并将嫌疑车牌和真实车牌的Key设置为相同,嫌疑车牌数据集RDD2的值为(hphm1,values1),正常车牌数据RDD3的值为(hphm2,values2);
(f)通过Spark对RDD数据的cartesian方法将嫌疑车牌与正常车牌数据混合,形成新的分布式数据集RDD4,其值为((hphm1,values1),(hphm2,values2)),并将RDD4整理成键为(hphm1,hphm2),值为(values1,value2);
(g)采用RDD的reduce操作分布式计算两个values1与values2之间的矩阵相似度,得到嫌疑车辆和正常车辆的轨迹匹配度ω。
8.根据权利要求1所述的一种基于不确定信息的假牌车筛选方法,其特征在于:所述步骤(5)计算嫌疑车辆与正常车辆的车牌相似度θ的计算公式如下:
θ = m M
其中,m表示两车牌之间字符相同的位数,M表示车牌字符位数。
9.根据权利要求1所述的一种基于不确定信息的假牌车筛选方法,其特征在于:所述步骤(6)得到假牌车筛选结果步骤如下:
1)对轨迹匹配度ω和车牌相似度θ进行数据归一化计算;
2)根据归一化后的轨迹匹配度ωnorm和车牌相似度θnorm,计算嫌疑车辆的假牌嫌疑度,计算公式如下所示:
φ=a×ωnorm+(1-a)×θnorm
其中a为权重参数,取值范围为0-1之间;
3)对计算得到的嫌疑车辆假牌嫌疑度φ进行排序,得到最终的假牌嫌疑度排名结果。
10.根据权利要求9所述的一种基于不确定信息的假牌车筛选方法,其特征在于:所述归一化计算公式如下:
x n o r m = x - x min x m a x - x min
其中,x表示原始数据,xnorm表示归一化后的数据,xmin、xmax分别为原始数据集的最小值和最大值。
CN201510835244.6A 2015-11-26 2015-11-26 一种基于不确定信息的假牌车筛选方法 Active CN105513368B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510835244.6A CN105513368B (zh) 2015-11-26 2015-11-26 一种基于不确定信息的假牌车筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510835244.6A CN105513368B (zh) 2015-11-26 2015-11-26 一种基于不确定信息的假牌车筛选方法

Publications (2)

Publication Number Publication Date
CN105513368A true CN105513368A (zh) 2016-04-20
CN105513368B CN105513368B (zh) 2017-10-17

Family

ID=55721309

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510835244.6A Active CN105513368B (zh) 2015-11-26 2015-11-26 一种基于不确定信息的假牌车筛选方法

Country Status (1)

Country Link
CN (1) CN105513368B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105913668A (zh) * 2016-07-04 2016-08-31 中国电子科技集团公司第二十八研究所 一种基于海量交通数据统计的定向套牌车检测方法
CN105913656A (zh) * 2016-04-28 2016-08-31 泰华智慧产业集团股份有限公司 基于分布式统计频繁过车的方法及系统
CN105975582A (zh) * 2016-05-05 2016-09-28 重庆市城投金卡信息产业股份有限公司 基于Spark的RFID数据生成出行OD矩阵的方法及系统
CN107680385A (zh) * 2017-10-27 2018-02-09 泰华智慧产业集团股份有限公司 一种确定套牌车的方法及系统
CN107798879A (zh) * 2017-10-25 2018-03-13 济南浪潮高新科技投资发展有限公司 一种智能识别套牌车的方法
CN108875654A (zh) * 2018-06-25 2018-11-23 深圳云天励飞技术有限公司 一种人脸特征采集方法及装置
CN109272034A (zh) * 2018-09-07 2019-01-25 佳都新太科技股份有限公司 一种漏检车牌预测方法及处理终端
CN110444024A (zh) * 2018-05-02 2019-11-12 芝麻开门网络信息股份有限公司 一种基于物联网的套牌车识别系统
CN110570652A (zh) * 2019-07-30 2019-12-13 深圳市天彦通信股份有限公司 车辆套牌检测提醒方法及相关产品
CN110880242A (zh) * 2019-09-28 2020-03-13 安徽百诚慧通科技有限公司 一种判断假牌套牌车辆真实号牌的方法
CN110956822A (zh) * 2019-12-16 2020-04-03 北京明略软件系统有限公司 套牌车识别方法、装置、电子设备和可读存储介质
CN111223305A (zh) * 2019-12-25 2020-06-02 华为技术有限公司 涉牌违法的检测方法和装置
CN112309126A (zh) * 2020-10-30 2021-02-02 杭州海康威视数字技术股份有限公司 车牌检测方法、装置、电子设备及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005196580A (ja) * 2004-01-08 2005-07-21 Hitachi Ltd 通過物識別装置
CN103578277A (zh) * 2012-08-07 2014-02-12 上海弘视通信技术有限公司 套牌嫌疑车搜索方法及其装置
CN104103173A (zh) * 2014-07-22 2014-10-15 银江股份有限公司 一种套牌车辆缉查布控方法
CN104517445A (zh) * 2014-12-09 2015-04-15 浪潮电子信息产业股份有限公司 一种基于大数据的套牌车辆识别方法
US9092979B2 (en) * 2010-12-14 2015-07-28 Xerox Corporation Automated license plate recognition system and method using human-in-the-loop based adaptive learning
CN104933870A (zh) * 2015-05-21 2015-09-23 中兴软创科技股份有限公司 基于车辆行为分析的车辆套牌识别方法与装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005196580A (ja) * 2004-01-08 2005-07-21 Hitachi Ltd 通過物識別装置
US9092979B2 (en) * 2010-12-14 2015-07-28 Xerox Corporation Automated license plate recognition system and method using human-in-the-loop based adaptive learning
CN103578277A (zh) * 2012-08-07 2014-02-12 上海弘视通信技术有限公司 套牌嫌疑车搜索方法及其装置
CN104103173A (zh) * 2014-07-22 2014-10-15 银江股份有限公司 一种套牌车辆缉查布控方法
CN104517445A (zh) * 2014-12-09 2015-04-15 浪潮电子信息产业股份有限公司 一种基于大数据的套牌车辆识别方法
CN104933870A (zh) * 2015-05-21 2015-09-23 中兴软创科技股份有限公司 基于车辆行为分析的车辆套牌识别方法与装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105913656A (zh) * 2016-04-28 2016-08-31 泰华智慧产业集团股份有限公司 基于分布式统计频繁过车的方法及系统
CN105975582A (zh) * 2016-05-05 2016-09-28 重庆市城投金卡信息产业股份有限公司 基于Spark的RFID数据生成出行OD矩阵的方法及系统
CN105975582B (zh) * 2016-05-05 2019-05-14 重庆市城投金卡信息产业股份有限公司 基于Spark的RFID数据生成出行OD矩阵的方法及系统
CN105913668B (zh) * 2016-07-04 2018-05-11 中国电子科技集团公司第二十八研究所 一种基于海量交通数据统计的定向套牌车检测方法
CN105913668A (zh) * 2016-07-04 2016-08-31 中国电子科技集团公司第二十八研究所 一种基于海量交通数据统计的定向套牌车检测方法
CN107798879A (zh) * 2017-10-25 2018-03-13 济南浪潮高新科技投资发展有限公司 一种智能识别套牌车的方法
CN107680385A (zh) * 2017-10-27 2018-02-09 泰华智慧产业集团股份有限公司 一种确定套牌车的方法及系统
CN107680385B (zh) * 2017-10-27 2019-12-24 泰华智慧产业集团股份有限公司 一种确定套牌车的方法及系统
CN110444024A (zh) * 2018-05-02 2019-11-12 芝麻开门网络信息股份有限公司 一种基于物联网的套牌车识别系统
CN108875654A (zh) * 2018-06-25 2018-11-23 深圳云天励飞技术有限公司 一种人脸特征采集方法及装置
CN109272034A (zh) * 2018-09-07 2019-01-25 佳都新太科技股份有限公司 一种漏检车牌预测方法及处理终端
CN110570652B (zh) * 2019-07-30 2021-01-05 深圳市天彦通信股份有限公司 车辆套牌检测提醒方法及相关产品
CN110570652A (zh) * 2019-07-30 2019-12-13 深圳市天彦通信股份有限公司 车辆套牌检测提醒方法及相关产品
CN110880242A (zh) * 2019-09-28 2020-03-13 安徽百诚慧通科技有限公司 一种判断假牌套牌车辆真实号牌的方法
CN110880242B (zh) * 2019-09-28 2020-10-02 安徽百诚慧通科技有限公司 一种判断假牌套牌车辆真实号牌的方法
CN110956822A (zh) * 2019-12-16 2020-04-03 北京明略软件系统有限公司 套牌车识别方法、装置、电子设备和可读存储介质
CN111223305A (zh) * 2019-12-25 2020-06-02 华为技术有限公司 涉牌违法的检测方法和装置
CN111223305B (zh) * 2019-12-25 2022-05-17 华为技术有限公司 涉牌违法的检测方法和装置
CN112309126A (zh) * 2020-10-30 2021-02-02 杭州海康威视数字技术股份有限公司 车牌检测方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN105513368B (zh) 2017-10-17

Similar Documents

Publication Publication Date Title
CN105513368A (zh) 一种基于不确定信息的假牌车筛选方法
CN104200669B (zh) 一种基于Hadoop的套牌车识别方法及系统
CN106022296B (zh) 一种基于车辆热点区域的概率聚合的套牌车检测方法
CN106251635A (zh) 一种套牌嫌疑车牌号的识别方法及系统
CN105575118B (zh) 一种失驾人员筛选方法
CN107832364B (zh) 一种基于时空数据锁定目标对象的方法及装置
CN107329977B (zh) 一种基于概率分布的假牌车二次筛选方法
CN106297304A (zh) 一种基于MapReduce面向大规模卡口数据的套牌车识别方法
CN107256394A (zh) 驾驶员信息与车辆信息核验方法、装置以及系统
CN107945522B (zh) 基于大数据查找嫌疑车辆的方法和系统
CN110888884B (zh) 基于geohash匹配的车码拟合方法及系统
CN103246876A (zh) 基于图像特征比对的车辆套牌识别方法
CN105139659A (zh) 车牌识别方法与装置
CN107645709B (zh) 一种确定人员信息的方法及装置
CN107301779A (zh) 一种身份认证方法及检测设备
CN106710225B (zh) 一种车辆号牌违法的识别方法和监测平台
CN105719489A (zh) 一种基于卡口车辆流向概率的套牌车检测方法
CN103093626A (zh) 一种套牌车的解决方案
CN101593418A (zh) 嫌疑车辆关联查找方法
US10607100B2 (en) Device for recognizing vehicle license plate number and method therefor
CN111404874A (zh) 出租车嫌疑车辆甄别分析体系架构
CN110956822B (zh) 套牌车识别方法、装置、电子设备和可读存储介质
CN113470369B (zh) 一种基于多维度信息判断套牌车辆真实号牌的方法及系统
CN112818724A (zh) 识别非编驾驶或非编押运的方法、装置、设备和存储介质
CN112053564A (zh) 一种高速公路路网车卡不符稽核方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 310012 1st floor, building 1, 223 Yile Road, Hangzhou City, Zhejiang Province

Patentee after: Yinjiang Technology Co.,Ltd.

Address before: 310030 Yinjiang Software Park, No. 2, Xiyuan 8th Road, Xihu Science Park, Hangzhou, Zhejiang

Patentee before: ENJOYOR Co.,Ltd.

CP03 Change of name, title or address