CN105575118B - 一种失驾人员筛选方法 - Google Patents

一种失驾人员筛选方法 Download PDF

Info

Publication number
CN105575118B
CN105575118B CN201510997215.XA CN201510997215A CN105575118B CN 105575118 B CN105575118 B CN 105575118B CN 201510997215 A CN201510997215 A CN 201510997215A CN 105575118 B CN105575118 B CN 105575118B
Authority
CN
China
Prior art keywords
suspicion
mistake
data
driven
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510997215.XA
Other languages
English (en)
Other versions
CN105575118A (zh
Inventor
陈涛
张云云
李建元
李丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yinjiang Technology Co.,Ltd.
Original Assignee
Enjoyor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Enjoyor Co Ltd filed Critical Enjoyor Co Ltd
Priority to CN201510997215.XA priority Critical patent/CN105575118B/zh
Publication of CN105575118A publication Critical patent/CN105575118A/zh
Application granted granted Critical
Publication of CN105575118B publication Critical patent/CN105575118B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/017Detecting movement of traffic to be counted or controlled identifying vehicles
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Traffic Control Systems (AREA)

Abstract

一种失驾人员筛选方法,该方法包括以下步骤:(1)数据预处理,车辆信息数据预处理、违法信息数据预处理和卡口过车记录数据预处理;(2)嫌疑失驾信息获取,失驾人信息和失驾时间信息获取和嫌疑失驾车信息获取;(3)嫌疑失驾车的时‑空轨迹分析,嫌疑失驾车失驾前与失驾后的时‑空轨迹信息获取,嫌疑失驾车失驾前与失驾后的时‑空轨迹匹配度计算,根据计算得到的轨迹匹配度ω,确定嫌疑失驾车嫌疑度。本发明提供一种适用性良好、可靠性较好的失驾人员筛选方法。

Description

一种失驾人员筛选方法
技术领域
本发明属于智能交通领域,尤其是一种失驾人员筛选方法。
背景技术
“失驾”是指驾驶人由于交通违法等原因造成的驾驶证被暂扣、注销、吊销,从而失去合法的机动车驾驶资格。“失驾”人员仍驾驶机动车具有很强的“社会危害性”。一方面,“失驾”等同于“无证驾驶”,当“失驾”车辆发生交通事故,保险公司将会拒绝理赔。因此“失驾”人员驾车发生事故多数会选择逃逸,事故受害人的权益无法得到保障,甚至会造成严重后果。另一方面,“失驾”人员不同于未取得驾驶资格人员,他们已掌握驾驶技能,并且大多已养成驾车出行的习惯,对驾车的依赖会助长其侥幸心理,违法行为具有“易发性”,影响道路交通安全。
对于“失驾”行为的查处执法难度相对较大,一般情况下都是民警在例行查车中“偶遇”,查处概率低、震慑力弱,难以形成大范围的精确打击。而在已有文献和公开的专利提出的针对“失驾”行为筛选的方法目前还很少见。专利申请号CN201310143828.8提出一种违法驾驶员信息获取方法、设备和系统,通过布设车载终端的方式获得车辆违法信息,进而获得违法驾驶员信息。该方法虽然能有效地获取违法车辆和违法驾驶员信息,但设备成本较高,难以推广。专利申请号CN201210575704.2公开了一种基于身份信息的无证驾驶辅助识别方法和系统,通过车载系统和后台服务器来进行驾驶员身份采集和识别,实现对驾驶员身份的确认,有效防止无证驾驶。该方法主要应用于车辆防盗抢的情景下。
为了能够结合现有的道路卡口设备、车辆信息和驾驶员违法信息,实现快速、直观、有效地方向活跃在路上的“失驾”人员,方便后续的查处执法,需要有一种新的技术方案和展现系统来满足交管部门的需求。
发明内容
为了克服已有失驾人员识别方式的适用性较差、可靠性差的不足,本发明提供一种适用性良好、可靠性较好的失驾人员筛选方法。
本发明解决其技术问题所采用的技术方案是:
一种失驾人员筛选方法,该方法包括以下步骤:
(1)数据预处理
(1.1)车辆信息数据预处理,步骤如下:
(1.1.1)数据清洗:获得车辆信息数据,根据设定的清洗规则,删除不符合规则的数据;
(1.1.2)维度削减:删除与失驾分析无关的维度;
(1.1.3)将筛选后的数据存入到数据仓库中,获得预处理后的车辆信息数据集X;
(1.2)违法信息数据预处理,步骤如下:
(1.2.1)数据清洗:获得违法信息数据,根据设定的清洗规则,删除违法时间登记不全的数据;
(1.2.2)维度削减:删除与失驾分析无关的维度;
(1.2.3)将筛选后的数据存入到数据仓库中,获得预处理后的卡口过车信息数据集W;
(1.3)卡口过车记录数据预处理,步骤如下:
(1.3.1)数据清洗:获得卡口过车记录数据,删除车牌号为空的数据,删除设备识别错误的数据;
(1.3.2)数据去重:根据步骤(1.3.1)进行数据清洗后的数据,进行数据去重处理;
(1.3.3)将清洗和去重后的数据存入到数据仓库中,获得预处理后的过车记录信息数据K;
(2)嫌疑失驾信息获取
(2.1)失驾人信息和失驾时间信息获取
利用违法信息数据集W中“违法行为”字段,查找违法行为编码对应的违法名称,获得导致驾驶证吊销的违法行为,并从违法信息数据集W筛选出嫌疑失驾人信息和嫌疑失驾时间信息,存储为嫌疑失驾人信息数据集Wp,其中
(2.2)嫌疑失驾车信息获取
根据步骤(2.1)获得的嫌疑失驾人信息数据集Wp,结合步骤(1.1)获得的车辆信息数据集X,获得嫌疑失驾人名下的车辆信息数据,存储为嫌疑失驾车信息数据集XW,其中
(3)嫌疑失驾车的时-空轨迹分析
(3.1)嫌疑失驾车失驾前与失驾后的时-空轨迹信息获取
(3.1.1)根据步骤(2.1)获得的嫌疑失驾人信息数据集WP,利用其中的“违法时间”字段,作为嫌疑失驾车失驾前与失驾后的临界时间t;
(3.1.2)结合步骤(2.2)获得的嫌疑失驾车信息数据集XW和步骤(1.3)获得的卡口过车信息数据集K,获得嫌疑失驾车的过车信息数据KW;根据临界时间t,将嫌疑失驾车的过车信息数据划分为失驾前过车信息数据和失驾后过车信息数据
(3.1.3)以设定时段为时间槽,假设共有j个时间槽,并设有i个卡口,分别在失驾前过车信息数据和失驾后过车信息数据中统计嫌疑失驾车在各个时间槽内经过各个卡口的总次数,形成一个用以描述嫌疑失驾车在失驾前的轨迹时-空特征的矩阵Ui,j和失驾后的轨迹时-空特征的矩阵Vi,j
(3.2)嫌疑失驾车失驾前与失驾后的时-空轨迹匹配度计算
计算嫌疑失驾车的失驾前的轨迹时-空特征的矩阵Ui,j和失驾后的轨迹时-空特征的矩阵Vi,j之间的相似度,计算过程如下:
(3.2.1)将矩阵Ui,j转换为向量u=(u1,1,u1,2,...,u1,j,...,ui,1,ui,2,...,ui,j),将矩阵Vi,j转换为向量v=(v1,1,v1,2,...,v1,j,...,vi,1,vi,2,...,vi,j);
(3.2.2)利用向量空间的余弦相似度量,作为嫌疑失驾车失驾前与失驾后的轨迹匹配度ω,计算公式为(1):
根据计算得到的轨迹匹配度ω,确定嫌疑失驾车嫌疑度。
进一步,所述步骤(3.2.2)中,嫌疑失驾车嫌疑度分为“高”、“中”、“低”三个等级,所述轨迹匹配度ω大于等于上限阈值,判定为高等级,表明失驾后与失驾前是同一个人驾驶的可能性较高,失驾嫌疑较高;轨迹匹配度ω介于上限阈值和下限阈值之间,判定为中等级,表明失驾后与失驾前是同一个人驾驶的可能性中等,失驾嫌疑中等;所述轨迹匹配度ω小于等于下限阈值,表明失驾后与失驾前是同一个人驾驶的可能性较低,则失驾嫌疑度较低。
再进一步,所述步骤(1.3.2)中,去重方法为:对于一个车牌在同一卡口、方向、时间的多条重复数据,只保留1条数据。
更进一步,所述筛选方法还包括如下步骤:(4)展示过程,根据步骤(3)计算得到的嫌疑失驾车的嫌疑度结果,结合嫌疑失驾车车主基本信息、卡口抓拍的图片信息以及地图信息,进行嫌疑失驾车的排查和稽查布控,步骤如下:
(4.1)在嫌疑失驾车的嫌疑度排名区域,选取某个嫌疑失驾车;
(4.2)选取某个嫌疑失驾车后,在车辆基本信息展示区域会展示该嫌疑失驾车辆的一些基本信息,以及该车车主的基本信息和违法信息;
(4.3)与步骤(4.2)同步地,系统会选取该失驾嫌疑车在失驾前与失驾后的卡口抓拍图片作为一组进行对比展示;
(4.4)如果需要进一步了解该失驾嫌疑车的落脚点分布,会结合地图对该失驾嫌疑车的频繁落脚点进行展现,同时针对某个落脚点卡口i,系统会计算出该嫌疑失驾车在卡口i的到达概率ρa以及在卡口i前往的前往概率ρl
所述步骤(4.4)中,计算步骤如下:
(4.4.1)根据步骤(3.1.2)中获得的嫌疑失驾车的过车信息数据KW,获得同一车牌经过的卡口编号以及经过时间,并按照经过时间进行升序排列,以保证过车信息的时序特征;
(4.4.2)统计号牌1分别在T1→T2,T2→T3,T3→T4,T4→T5,T5→T6,T6→T7从上一卡口到下一卡口的次数;
(4.4.3)根据上一步结果,统计从卡口1出发到其他卡口的概率。
本发明的有益效果主要表现在:1、基于大数据分析的思想,通过的嫌疑失驾车在失驾前与失驾后的行为特征进行深度刻画,从而对嫌疑失驾车的嫌疑度进行合理的排序,并通过对比的方式对嫌疑失驾车失驾前与失驾后的卡口抓拍图片进行展现,极大地提高后续核查和布控效率。2、部署方便,只需城市道路交通卡口设备以及产生的数据、机动车辆信息和驾驶员违法信息即能实现,适用性广,并且数据越丰富,筛选结果越有效。
附图说明
图1是失驾人员筛选方法的流程图。
图2是本发明方法系统展现框架。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种失驾人员筛选方法,包括以下步骤:
(1)数据预处理
(1.1)车辆信息数据预处理,主要步骤如下:
(1.1.1)数据清洗:获得车辆信息数据,根据设定的清洗规则,删除不符合规则的数据,如特殊字符的车牌等。
(1.1.2)维度削减:删除与失驾分析无关的维度,如发动机号、经办人等。
(1.1.3)将筛选后的数据存入到数据仓库中,获得预处理后的车辆信息数据集X。
(1.2)违法信息数据预处理,主要步骤如下:
(1.2.1)数据清洗:获得违法信息数据,根据设定的清洗规则,删除违法时间登记不全的数据。
(1.2.2)维度削减:删除与失驾分析无关的维度,如经办人等。
(1.2.3)将筛选后的数据存入到数据仓库中,获得预处理后的违法信息数据集W。
(1.3)卡口过车记录数据预处理,主要步骤如下:
(1.3.1)数据清洗:获得卡口过车记录数据,删除车牌号为空的数据,删除设备识别错误的数据,如车牌字符带“?”的数据,以及车牌字符出现字母多于3个字母的错牌等
(1.3.2)数据去重:根据步骤(1.3.1)进行数据清洗后的数据,进行数据去重处理,去重方法为:对于一个车牌在同一卡口、方向、时间的多条重复数据,只保留1条数据。
(1.3.3)将清洗和去重后的数据存入到数据仓库中,获得预处理后的卡口过车信息数据集K。
(2)嫌疑失驾信息获取
(2.1)失驾人信息和失驾时间信息获取
利用违法信息数据集W中“违法行为”字段,查找违法行为编码对应的违法名称,结合实际交通法规,获得导致驾驶证吊销的违法行为,并从违法信息数据集W筛选出嫌疑失驾人信息和嫌疑失驾时间信息,存储为嫌疑失驾人信息数据集Wp。其中
(2.2)嫌疑失驾车信息获取
根据步骤(2.1)获得的嫌疑失驾人信息数据集Wp,结合步骤(1.1)获得的车辆信息数据集X,获得嫌疑失驾人名下的车辆信息数据,存储为嫌疑失驾车信息数据集XW。其中
(3)嫌疑失驾车的时-空轨迹分析
(3.1)嫌疑失驾车失驾前与失驾后的时-空轨迹信息获取
(3.1.1)根据步骤(2.1)获得的嫌疑失驾人信息数据集WP,利用其中的“违法时间”字段,作为嫌疑失驾车失驾前与失驾后的临界时间t。
(3.1.2)结合步骤(2.2)获得的嫌疑失驾车信息数据集XW和步骤(1.3)获得的卡口过车信息数据集K,获得嫌疑失驾车的过车信息数据KW。根据临界时间t,将嫌疑失驾车的过车信息数据划分为失驾前过车信息数据和失驾后过车信息数据
(3.1.3)以设定时段为时间槽,假设共有j个时间槽,并设有i个卡口,分别在失驾前过车信息数据和失驾后过车信息数据中统计嫌疑失驾车在各个时间槽内经过各个卡口的总次数,形成一个用以描述嫌疑失驾车在失驾前的轨迹时-空特征的矩阵Ui,j和失驾后的轨迹时-空特征的矩阵Vi,j。Ui,j和Vi,j的一个简单示例如下:
时间槽1 时间槽2 时间槽j
卡口1 u1,1 u1,2 u1,j
卡口2 u2,1 u2,2 u2,j
卡口i ui,1 ui,2 ui,j
该表描述了某个嫌疑失驾车在时间槽1内共经过卡口1的次数为u1,1次,卡口2的次数为u1,2次,卡口i的次数为ui,1次,依次类推。
(3.2)嫌疑失驾车失驾前与失驾后的时-空轨迹匹配度计算
计算嫌疑失驾车的失驾前的轨迹时-空特征的矩阵Ui,j和失驾后的轨迹时-空特征的矩阵Vi,j之间的相似度,计算过程如下:
(3.2.1)将矩阵Ui,j转换为向量u=(u1,1,u1,2,...,u1,j,...,ui,1,ui,2,...,ui,j),将矩阵Vi,j转换为向量v=(v1,1,v1,2,...,v1,j,...,vi,1,vi,2,...,vi,j)。
(3.2.2)利用向量空间的余弦相似度量,作为嫌疑失驾车失驾前与失驾后的轨迹匹配度ω,计算公式为(1):
根据计算得到的轨迹匹配度ω,确定嫌疑失驾车嫌疑度,嫌疑失驾车嫌疑度分为“高”、“中”、“低”三个等级,所述轨迹匹配度ω大于等于上限阈值,判定为高等级,表明失驾后与失驾前是同一个人驾驶的可能性较高,失驾嫌疑较高;轨迹匹配度ω介于上限阈值和下限阈值之间,判定为中等级,表明失驾后与失驾前是同一个人驾驶的可能性中等,失驾嫌疑中等;所述轨迹匹配度ω小于等于下限阈值,表明失驾后与失驾前是同一个人驾驶的可能性较低,则失驾嫌疑度较低。
(4)失驾人员筛选系统展示方法
根据步骤(3)计算得到的嫌疑失驾车的嫌疑度结果,结合嫌疑失驾车车主基本信息、卡口抓拍的图片信息以及地图信息,进行嫌疑失驾车的排查和稽查布控。主要步骤如下:
(4.1)在嫌疑失驾车的嫌疑度排名区域,选取某个嫌疑失驾车。
(4.2)选取某个嫌疑失驾车后,在车辆基本信息展示区域会展示该嫌疑失驾车辆的一些基本信息,如品牌,颜色,车型等,以及该车车主的基本信息和违法信息。
(4.3)与步骤(4.2)同步地,系统会选取该失驾嫌疑车在失驾前与失驾后的卡口抓拍图片作为一组进行对比展示。
(4.4)如果需要进一步了解该失驾嫌疑车的落脚点分布,则可以使用“落脚点稽查布控”功能,系统会结合地图对该失驾嫌疑车的频繁落脚点进行展现,同时针对某个落脚点卡口i,系统会计算出该嫌疑失驾车在卡口i的到达概率ρa(即时间相邻的其他卡口到达卡口i的概率)以及在卡口i前往的前往概率ρl(即时间相邻的卡口i前往其他卡口的概率)。计算步骤如下:
(4.4.1)根据步骤(3.1.2)中获得的嫌疑失驾车的过车信息数据KW,获得同一车牌经过的卡口编号以及经过时间,并按照经过时间进行升序排列,以保证过车信息的时序特征。假设号牌1按时间顺序经过卡口如下:
号牌 卡口 经过时间
号牌1 卡口1 T1
号牌1 卡口2 T2
号牌1 卡口3 T3
号牌1 卡口1 T4
号牌1 卡口4 T5
号牌1 卡口1 T6
号牌1 卡口2 T7
其中T1<T2<T3<T4<T5<T6<T7
(4.4.2)统计号牌1分别在T1→T2,T2→T3,T3→T4,T4→T5,T5→T6,T6→T7从上一卡口到下一卡口的次数,整理得到:
(4.4.3)根据上一步结果,统计从卡口1出发到其他卡口的概率,计算如下:
号牌号码 上一卡口 下一卡口 次数 概率
号牌1 卡口1 卡口2 2 67%
号牌1 卡口1 卡口4 1 33%
类似地,可以统计从其他卡口出发到卡口1的概率,计算如下:
号牌号码 上一卡口 下一卡口 次数 概率
号牌1 卡口3 卡口1 1 50%
号牌1 卡口4 卡口1 1 50%
在实施例中,假设号牌1出现在任意卡口是一个随机独立事件,当号牌1出现在卡口1时,则可以它从卡口3或者卡口4过来的概率均为50%,而接下来它有67%的概率将前往卡口2。在展示界面中,能够局部地显示当在卡口1时,从卡口3、卡口4到卡口1的有向连接线以及从卡口1到卡口2以及卡口1到卡口4的有向连接线,并且以线条的粗细来体现概率的大小,进一步地,可以展现号牌1在全地图的落脚点分布情况以及习惯行驶路线,便于对卡口进行有针对性地重点布控。
以杭州2014年4月-2015年9月的卡口过车记录,截至2015年9月的杭州车辆登记信息数据,以及杭州部分驾驶人违法信息数据为例,对本发明的实施例进行简单说明。为保护个人隐私,对于实施例中的一些个人信息和车辆信息进行特殊处理。
一种非现场的失驾人员筛选和稽查布控方法,所述的数据处理和分析方法包括以下步骤:
(1)数据预处理
(1.1)车辆信息数据预处理,主要步骤如下:
(1.1.1)数据清洗:获得车辆信息数据,根据设定的清洗规则,删除不符合规则的数据,如特殊字符的车牌等。在本实施例中,对特殊号牌(学、军、警、试)进行清洗。
(1.1.2)维度削减:删除与失驾分析无关的维度,如发动机号、经办人等。在本实施例中,保留“号牌号码”、“所有人”、“身份证明信息”三个维度。
(1.1.3)将筛选后的数据存入到数据仓库中,获得预处理后的车辆信息数据集X。在本实施例中,车辆信息数据集的数据示例如下:
AM**52 梁** 332602**********67
(1.2)违法信息数据预处理,主要步骤如下:
(1.2.1)数据清洗:获得违法信息数据,根据设定的清洗规则,删除违法时间登记不全的数据。
(1.2.2)维度削减:删除与失驾分析无关的维度,如经办人等。在本实施例中,保留,“号牌号码”,“驾驶证号码”,“违法行为”,“违法时间”四个维度。
(1.2.3)将筛选后的数据存入到数据仓库中,获得预处理后的违法信息数据集W。在本实施例中,违法信息数据集的示例如下:
浙A8**05 3301************19 1721 2014-07-12 23:08:43
浙AR**28 3410************0X 1721 2014-12-16 11:20:20
浙AL**8Q 3325************12 1721 2014-10-04 09:42:08
(1.3)卡口过车记录数据预处理,主要步骤如下:
(1.3.1)数据清洗:获得卡口过车记录数据,删除车牌号为空的数据,删除设备识别错误的数据,如车牌字符带“?”的数据,以及车牌字符出现字母多于3个字母的错牌等。在本实施例中,在本实施例中,主要针对杭州车辆进行假牌筛选,因此对于非“浙A”牌照、车牌号码为空或带“?”字符、因识别错误导致车牌后五位字符中出现超过3个字母以上、特殊号牌(学、警、试、军)等进行清洗。
(1.3.2)数据去重和维度削减:根据步骤(1.3.1)进行数据清洗后的数据,进行数据去重处理,去重方法为:对于一个车牌在同一卡口、方向、时间的多条重复数据,只保留1条数据。并通过削减维度,保留“卡口编号”、“方向编号”、“号牌类型”、“车辆类型”、“号牌号码”、“经过时间”、“车身颜色”6个维度。
(1.3.3)将清洗和去重后的数据存入到数据仓库中,获得预处理后的卡口过车信息数据集K。卡口过车记录数据集的示例如下:
310003000266 01 01 1 浙AT**65 2015-06-11 13:17:35
310003000266 01 01 1 浙A3**99 2015-06-11 13:19:59
310003000266 01 01 1 浙AT**11 2015-06-11 13:19:17
310003000266 01 01 1 浙A7**98 2015-06-11 13:15:11
(2)嫌疑失驾信息获取
(2.1)失驾人信息和失驾时间信息获取
利用违法信息数据集W中“违法行为”字段,查找违法行为编码对应的违法名称,结合实际交通法规,获得导致驾驶证吊销的违法行为,以及嫌疑失驾人信息和嫌疑失驾时间信息,存储为嫌疑失驾人信息数据集Wp。其中在本实施例中,只针对因“酒驾”导致的架势证吊销的违法行为作为举例。
(2.2)嫌疑失驾车信息获取
根据步骤(2.1)获得的嫌疑失驾人信息数据集Wp,结合步骤(1.1)获得的车辆信息数据集X,获得嫌疑失驾人名下的车辆信息数据,存储为嫌疑失驾车信息数据集XW。其中
(3)嫌疑失驾车的时-空轨迹分析
(3.1)嫌疑失驾车失驾前与失驾后的时-空轨迹信息获取
(3.1.1)根据步骤(2.1)获得的嫌疑失驾人信息数据集WP,利用其中的“违法时间”字段,作为嫌疑失驾车失驾前与失驾后的临界时间t。
(3.1.2)结合步骤(2.2)获得的嫌疑失驾车信息数据集XW和步骤(1.3)获得的卡口过车信息数据集K,获得嫌疑失驾车的过车信息数据KW。根据临界时间t,将嫌疑失驾车的过车信息数据划分为失驾前过车信息数据和失驾后过车信息数据
(3.1.3)在本实施例中,以1小时为时间槽,则1天共有24个时间槽,并共有627个卡口,分别在失驾前过车信息数据和失驾后过车信息数据中统计嫌疑失驾车在各个时间槽内经过各个卡口的总次数,形成一个用以描述某个嫌疑失驾车在失驾前的轨迹时-空特征的矩阵Ui,j和失驾后的轨迹时-空特征的矩阵Vi,j。在本实施例中,由于采用Hive作为数据仓库,因此,对于嫌疑失驾车失驾前的时-空轨迹矩阵Ui,j存储形式为
号牌号码 时间槽 卡口编号 经过次数
浙A8**90 1 3100030000101 0
浙A8**90 1 3100030000102 0
浙A8**90
浙A8**90 8 3100030000101 4
浙A8**90
其中第一列为嫌疑失驾车车牌,第二列为时间槽,1表示“0:00-1:00”,2表示“1:00-2:00”,依次类推,第三列表示经过的卡口编号,第四列表示在对应时间槽和卡口编号经过的次数。
类似地,嫌疑失驾车失驾后的时-空轨迹矩阵Vi,j存储为
号牌号码 时间槽 卡口编号 经过次数
浙A8**90 1 31000300000101 0
浙A8**90 1 31000300000102 1
浙A8**90
浙A8**90 8 31000300000101 3
浙A8**90
(3.2)嫌疑失驾车失驾前与失驾后的时-空轨迹匹配度计算
在本实施例中,由于采用Hive作为数据仓库,利用HiveQL计算嫌疑失驾车的失驾前的轨迹时-空特征的矩阵Ui,j和失驾后的轨迹时-空特征的矩阵Vi,j之间的相似度的计算过程如下:
(3.2.1)根据嫌疑失驾车号牌号码,获得嫌疑失驾车失驾前和失驾后的时-空轨迹矩阵Ui,j和矩阵Vi,j,如步骤(3.1)所示。
(3.2.2)利用向量空间的余弦相似度量,作为嫌疑失驾车失驾前与失驾后的轨迹匹配度ω。针对步骤(3.1)中的嫌疑失驾车“浙A8##90”的时-空轨迹,其轨迹匹配度计算方法为
根据计算得到的轨迹匹配度ω,确定嫌疑失驾车嫌疑度分为“高”、“中”、“低”三个等级。轨迹匹配度越高,表明失驾后与失驾前是同一个人驾驶的可能性越高,则失驾嫌疑越高;轨迹匹配度越低,表明失驾后与失驾前是同一个人驾驶的可能性越低,则失驾嫌疑度越低。在本实施例中,设定0.6<ω≤1时嫌疑度为“高”;当0.3<ω≤0.6时嫌疑度为“中”;当0≤ω≤0.3时嫌疑度为“低”。在本实施例中,号牌号码“浙A8**90”计算得到的失驾嫌疑度为“中”。
(4)失驾人员筛选系统展示方法
根据步骤(3)计算得到的嫌疑失驾车的嫌疑度结果,结合嫌疑失驾车车主基本信息、卡口抓拍的图片信息以及地图信息,进行嫌疑失驾车的稽查布控。展示方法如附图2所示。主要步骤如下:
(4.1)在嫌疑失驾车的嫌疑度排名区域,选取某个嫌疑失驾车。
(4.2)选取某个嫌疑失驾车后,在车辆基本信息展示区域会展示该嫌疑失驾车辆的一些基本信息,如品牌,颜色,车型等,以及该车车主的驾驶证基本信息和违法信息
(4.3)与步骤(4.2)同步地,系统会选取该嫌疑失驾车在失驾前与失驾后的卡口抓拍图片作为一组进行对比展示。
(4.4)根据卡口抓拍图片对比以及车主的驾驶证信息,确定该嫌疑失驾车是否由失驾人员驾驶,如果需要进一步了解该嫌疑失驾车的落脚点分布,则可以使用“落脚点稽查布控”功能,系统会结合地图对该嫌疑失驾车的频繁落脚点进行展现,嫌疑失驾车经过的卡口点位越频繁,该卡口点位展示的圆形图案越大且颜色越深。同时针对某个落脚点卡口i,系统会计算出该嫌疑失驾车在卡口i的到达概率ρa(即时间相邻的其他卡口到达卡口i的概率)以及在卡口i前往的前往概率ρl(即时间相邻的卡口i前往其他卡口的概率)。计算步骤如下:
(4.4.1)根据步骤(3.1.2)中获得的嫌疑失驾车的过车信息数据KW,获得同一车牌经过的卡口编号和经过时间进行升序排列,以保证过车信息的时序特征。对于本实施例中的号牌“浙A8**90”,其在2015年6月-2015年9月按时间顺序经过的卡口情况部分如下所示:
浙A8**90 31000300010003 2015-06-13 14:32:57
浙A8**90 31000300009803 2015-06-13 14:40:25
浙A8**90 31000300013820 2015-06-13 14:44:00
浙A8**90 31000300007001 2015-06-13 14:53:47
浙A8**90 31000300006504 2015-06-15 06:24:06
浙A8**90 31000300014019 2015-06-15 06:25:26
浙A8**90 31000300009804 2015-06-15 06:28:55
浙A8**90 31000300010004 2015-06-15 06:31:41
其中第一列为号牌号码,第二列为卡口编号,第三列为经过时间。
(4.4.2)统计号牌“浙A8**90”从上一个卡口到下一个卡口经过的次数,整理得到部分结果如下所示:
浙A8**90 31000300003601 31000300028404 2
浙A8**90 31000300004004 31000300014219 1
浙A8**90 31000300006003 31000300015401 1
浙A8**90 31000300004303 31000300004301 1
浙A8**90 31000300004301 31000300006902 1
浙A8**90 31000300005101 31000300022801 1
浙A8**90 31000300006003 31000300022801 1
浙A8**90 31000300006504 31000300006902 6
其中第一列为号牌号码,第二列为上一个卡口,第三列为下一个卡口,第四列为次数。
(4.4.3)根据步骤(4.4.2)统计的结果,计算从卡口31000300007001出发到别的卡口的概率,以及从别的卡口到达卡口3100030000701的概率,计算结果如下所示0:
浙A8**90 31000300007001 31000300006901 6 0.857
浙A8**90 31000300007001 31000300006504 1 0.143
浙A8**90 31000300013820 31000300007001 5 0.714
浙A8**90 31000300009803 31000300007001 2 0.286
根据计算结果,可以发现当“浙A8**90”出现在卡口31000300007001时,它有85.7%的概率将出现在卡口31000300006901;同时,它有71.4%的概率是从卡口31000300013820过来。更进一步地,可以认为车辆“浙A8**90”行驶习惯路线为从卡口31000300013820到卡口31000300007001再到卡口31000300006901,并可推广至车辆“浙A8**90”完整的行驶习惯路线。在展示界面中,能够局部显示在卡口31000300007001时,就会显示从卡口31000300007001到卡口31000300006901和卡口310003000065041有向连接线,并以线段粗细来表示概率的大小,进一步地,可以展现车辆“浙A8**90”在全地图的落脚点分布情况以及行驶习惯路线,便于对卡口进行有针对性地重点布控。

Claims (5)

1.一种失驾人员筛选方法,其特征在于:该方法包括以下步骤:
(1)数据预处理
(1.1)车辆信息数据预处理,步骤如下:
(1.1.1)数据清洗:获得车辆信息数据,根据设定的清洗规则,删除不符合规则的数据;
(1.1.2)维度削减:删除与失驾分析无关的维度;
(1.1.3)将筛选后的数据存入到数据仓库中,获得预处理后的车辆信息数据集X;
(1.2)违法信息数据预处理,步骤如下:
(1.2.1)数据清洗:获得违法信息数据,根据设定的清洗规则,删除违法时间登记不全的数据;
(1.2.2)维度削减:删除与失驾分析无关的维度;
(1.2.3)将筛选后的数据存入到数据仓库中,获得预处理后的违法信息数据集W;
(1.3)卡口过车记录数据预处理,步骤如下:
(1.3.1)数据清洗:获得卡口过车记录数据,删除车牌号为空的数据,删除设备识别错误的数据;
(1.3.2)数据去重:根据步骤(1.3.1)进行数据清洗后的数据,进行数据去重处理;
(1.3.3)将清洗和去重后的数据存入到数据仓库中,获得预处理后的卡口过车信息数据集K;
(2)嫌疑失驾信息获取
(2.1)失驾人信息和失驾时间信息获取
利用违法信息数据集W中“违法行为”字段,查找违法行为编码对应的违法名称,获得导致驾驶证吊销的违法行为,并从违法信息数据集W筛选出嫌疑失驾人信息和嫌疑失驾时间信息,存储为嫌疑失驾人信息数据集Wp,其中
(2.2)嫌疑失驾车信息获取
根据步骤(2.1)获得的嫌疑失驾人信息数据集Wp,结合步骤(1.1)获得的车辆信息数据集X,获得嫌疑失驾人名下的车辆信息数据,存储为嫌疑失驾车信息数据集XW,其中
(3)嫌疑失驾车的时-空轨迹分析
(3.1)嫌疑失驾车失驾前与失驾后的时-空轨迹信息获取
(3.1.1)根据步骤(2.1)获得的嫌疑失驾人信息数据集WP,利用其中的“违法时间”字段,作为嫌疑失驾车失驾前与失驾后的临界时间t;
(3.1.2)结合步骤(2.2)获得的嫌疑失驾车信息数据集XW和步骤(1.3)获得的卡口过车信息数据集K,获得嫌疑失驾车的过车信息数据KW;根据临界时间t,将嫌疑失驾车的过车信息数据划分为失驾前过车信息数据和失驾后过车信息数据
(3.1.3)以设定时段为时间槽,假设共有j个时间槽,并设有i个卡口,分别在失驾前过车信息数据和失驾后过车信息数据中统计嫌疑失驾车在各个时间槽内经过各个卡口的总次数,形成一个用以描述嫌疑失驾车在失驾前的轨迹时-空特征的矩阵Ui,j和失驾后的轨迹时-空特征的矩阵Vi,j
(3.2)嫌疑失驾车失驾前与失驾后的时-空轨迹匹配度计算
计算嫌疑失驾车的失驾前的轨迹时-空特征的矩阵Ui,j和失驾后的轨迹时-空特征的矩阵Vi,j之间的相似度,计算过程如下:
(3.2.1)将矩阵Ui,j转换为向量u=(u1,1,u1,2,...,u1,j,...,ui,1,ui,2,...,ui,j),将矩阵Vi,j转换为向量v=(v1,1,v1,2,...,v1,j,...,vi,1,vi,2,...,vi,j);
(3.2.2)利用向量空间的余弦相似度量,作为嫌疑失驾车失驾前与失驾后的轨迹匹配度ω,计算公式为(1):
<mrow> <mi>&amp;omega;</mi> <mo>=</mo> <mfrac> <mrow> <mi>u</mi> <mo>&amp;CenterDot;</mo> <mi>v</mi> </mrow> <mrow> <mo>|</mo> <mo>|</mo> <mi>u</mi> <mo>|</mo> <mo>|</mo> <mo>&amp;times;</mo> <mo>|</mo> <mo>|</mo> <mi>v</mi> <mo>|</mo> <mo>|</mo> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
根据计算得到的轨迹匹配度ω,确定嫌疑失驾车嫌疑度。
2.如权利要求1所述的一种失驾人员筛选方法,其特征在于:所述步骤(3.2.2)中,嫌疑失驾车嫌疑度分为“高”、“中”、“低”三个等级,所述轨迹匹配度ω大于等于上限阈值,判定为高等级,表明失驾后与失驾前是同一个人驾驶的可能性较高,失驾嫌疑较高;轨迹匹配度ω介于上限阈值和下限阈值之间,判定为中等级,表明失驾后与失驾前是同一个人驾驶的可能性中等,失驾嫌疑中等;所述轨迹匹配度ω小于等于下限阈值,表明失驾后与失驾前是同一个人驾驶的可能性较低,则失驾嫌疑度较低。
3.如权利要求1或2所述的一种失驾人员筛选方法,其特征在于:所述步骤(1.3.2)中,去重方法为:对于一个车牌在同一卡口、方向、时间的多条重复数据,只保留1条数据。
4.如权利要求1或2所述的一种失驾人员筛选方法,其特征在于:所述筛选方法还包括如下步骤:(4)展示过程,根据步骤(3)计算得到的嫌疑失驾车的嫌疑度结果,结合嫌疑失驾车车主基本信息、卡口抓拍的图片信息以及地图信息,进行嫌疑失驾车的排查和稽查布控,步骤如下:
(4.1)在嫌疑失驾车的嫌疑度排名区域,选取某个嫌疑失驾车;
(4.2)选取某个嫌疑失驾车后,在车辆基本信息展示区域会展示该嫌疑失驾车辆的一些基本信息,以及该车车主的基本信息和违法信息;
(4.3)与步骤(4.2)同步地,系统会选取该失驾嫌疑车在失驾前与失驾后的卡口抓拍图片作为一组进行对比展示;
(4.4)如果需要进一步了解该失驾嫌疑车的落脚点分布,会结合地图对该失驾嫌疑车的频繁落脚点进行展现,同时针对某个落脚点卡口i,系统会计算出该嫌疑失驾车在卡口i的到达概率ρa以及在卡口i前往的前往概率ρl
5.如权利要求4所述的一种失驾人员筛选方法,其特征在于:所述步骤(4.4)中,计算步骤如下:
(4.4.1)根据步骤(3.1.2)中获得的嫌疑失驾车的过车信息数据KW,获得同一车牌经过的卡口编号以及经过时间,并按照经过时间进行升序排列,以保证过车信息的时序特征;
(4.4.2)统计号牌1分别在T1→T2,T2→T3,T3→T4,T4→T5,T5→T6,T6→T7从上一卡口到下一卡口的次数;
(4.4.3)根据上一步结果,统计从卡口1出发到其他卡口的概率。
CN201510997215.XA 2015-12-25 2015-12-25 一种失驾人员筛选方法 Active CN105575118B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510997215.XA CN105575118B (zh) 2015-12-25 2015-12-25 一种失驾人员筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510997215.XA CN105575118B (zh) 2015-12-25 2015-12-25 一种失驾人员筛选方法

Publications (2)

Publication Number Publication Date
CN105575118A CN105575118A (zh) 2016-05-11
CN105575118B true CN105575118B (zh) 2017-12-19

Family

ID=55885193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510997215.XA Active CN105575118B (zh) 2015-12-25 2015-12-25 一种失驾人员筛选方法

Country Status (1)

Country Link
CN (1) CN105575118B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056912B (zh) * 2016-07-29 2018-10-09 浙江银江研究院有限公司 一种卡口运行状态量化评估方法及系统
CN107301395A (zh) * 2017-06-22 2017-10-27 王杰 一种酒驾检测系统及其检测方法
CN107808512A (zh) * 2017-09-08 2018-03-16 北京悦畅科技有限公司 车辆追踪方法及装置
CN110838235A (zh) * 2018-08-17 2020-02-25 浙江宇视科技有限公司 一种身份识别方法及装置
CN109785615B (zh) * 2018-12-28 2021-07-06 合肥品恩智能科技有限公司 一种用于公安检查站的预警分流子系统
CN110334232A (zh) * 2019-06-28 2019-10-15 深圳市商汤科技有限公司 档案应用方法及装置、存储介质
CN110489400A (zh) * 2019-08-23 2019-11-22 武汉白虹软件科技有限公司 一种实现人车采集数据准实时关联的算法模型
CN110675639B (zh) * 2019-12-03 2020-05-19 武汉中科通达高新技术股份有限公司 基于卡口过车数据分析套牌车所属真牌的方法
CN110956822B (zh) * 2019-12-16 2021-03-12 北京明略软件系统有限公司 套牌车识别方法、装置、电子设备和可读存储介质
CN111477007A (zh) * 2020-03-13 2020-07-31 北京易华录国际技术有限公司 一种车辆查控分析管理系统及方法
CN111222587A (zh) * 2020-04-22 2020-06-02 南京森根安全技术有限公司 基于特征融合的失证人员危险驾驶行为预测方法及系统
CN115100861B (zh) * 2022-06-22 2023-07-21 公安部交通管理科学研究所 一种酒驾车辆识别方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10254806A1 (de) * 2002-11-22 2004-06-17 Robert Bosch Gmbh Verfahren zur Informationsverarbeitung
CN101000716A (zh) * 2007-01-01 2007-07-18 梁嘉麟 一种能够有效制止司机超载开车的监管方法
CN102129728A (zh) * 2010-01-14 2011-07-20 周伟 车辆行驶记录管理系统
JP5036781B2 (ja) * 2009-10-09 2012-09-26 三菱電機株式会社 データ処理装置、データ処理方法及びプログラム
JP2013210975A (ja) * 2012-03-30 2013-10-10 Mitsubishi Heavy Ind Ltd 車両データ処理システム、車両データ処理方法、車両データ処理装置、プログラム、及び記録媒体
CN203401972U (zh) * 2013-07-29 2014-01-22 上海理工大学 一种基于无线传感器网络的驾车行为监测预警系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10254806A1 (de) * 2002-11-22 2004-06-17 Robert Bosch Gmbh Verfahren zur Informationsverarbeitung
CN101000716A (zh) * 2007-01-01 2007-07-18 梁嘉麟 一种能够有效制止司机超载开车的监管方法
JP5036781B2 (ja) * 2009-10-09 2012-09-26 三菱電機株式会社 データ処理装置、データ処理方法及びプログラム
CN102129728A (zh) * 2010-01-14 2011-07-20 周伟 车辆行驶记录管理系统
JP2013210975A (ja) * 2012-03-30 2013-10-10 Mitsubishi Heavy Ind Ltd 車両データ処理システム、車両データ処理方法、車両データ処理装置、プログラム、及び記録媒体
CN203401972U (zh) * 2013-07-29 2014-01-22 上海理工大学 一种基于无线传感器网络的驾车行为监测预警系统

Also Published As

Publication number Publication date
CN105575118A (zh) 2016-05-11

Similar Documents

Publication Publication Date Title
CN105575118B (zh) 一种失驾人员筛选方法
CN106251635A (zh) 一种套牌嫌疑车牌号的识别方法及系统
CN107832364B (zh) 一种基于时空数据锁定目标对象的方法及装置
CN103927879B (zh) 一种监管重点运输车辆违法的系统及方法
CN105719489B (zh) 一种基于卡口车辆流向概率的套牌车检测方法
Kettl Is the worst yet to come?
CN111862606A (zh) 一种基于多源数据的非法营运车辆识别方法
CN104517445A (zh) 一种基于大数据的套牌车辆识别方法
CN107329977B (zh) 一种基于概率分布的假牌车二次筛选方法
CN105513368A (zh) 一种基于不确定信息的假牌车筛选方法
CN106297304A (zh) 一种基于MapReduce面向大规模卡口数据的套牌车识别方法
Nasri et al. Assessing risk factors associated with urban transit bus involved accident severity: a case study of a Middle East country
CN108074400A (zh) 一种基于海量数据分析的重点车辆分析模型
Cross A study of bicycle/motor-vehicle accidents: Identification of problem types and countermeasure approaches
CN101950484A (zh) 鉴别车牌真伪的方法
Baguley The importance of a road accident data system and its utilisation
Bala et al. Geospatial Information System for Crime Analysis and Crime Zone Identification-Case Study of Katsina, Nigeria
Zheng et al. Analyses of multiyear statewide secondary crash data and automatic crash report reviewing
Tamakloe et al. Key factors affecting motorcycle-barrier crash severity: an innovative cluster-regression technique
Buckman et al. Challenging racial profiles: attacking Jim Crow on the interstate
Hall Why police need to enforce traffic laws
Heydari The Invisible Driver of Policing
Anderson Privacy, Technology and the Fourth Amendment: The Future and the Shock
CN105844919A (zh) 一种车牌防伪追踪方法
Cross et al. A study of bicycle/motor-vehicle accidents: identification of problem types and countermeasure approaches. Volume 1

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 310012 floor 1, building 1, No. 223, Yile Road, Xihu District, Hangzhou City, Zhejiang Province

Patentee after: Yinjiang Technology Co.,Ltd.

Address before: 310012 floor 1, building 1, No. 223, Yile Road, Xihu District, Hangzhou City, Zhejiang Province

Patentee before: ENJOYOR Co.,Ltd.

CP01 Change in the name or title of a patent holder