CN114416686B - 一种车辆设备指纹carid识别系统及识别方法 - Google Patents
一种车辆设备指纹carid识别系统及识别方法 Download PDFInfo
- Publication number
- CN114416686B CN114416686B CN202111480843.2A CN202111480843A CN114416686B CN 114416686 B CN114416686 B CN 114416686B CN 202111480843 A CN202111480843 A CN 202111480843A CN 114416686 B CN114416686 B CN 114416686B
- Authority
- CN
- China
- Prior art keywords
- data
- elements
- stroke
- vehicle
- sidn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
Abstract
本发明提供了一种车辆设备指纹CARID识别系统及识别方法,属于车辆识别技术领域,系统包括管理平台、数据库、数据清洗模块、数据处理模块、训练模块和识别模型,该识别系统和方法为高速公路运营稽核查询提供便利,通过将各种要素集合进行大数据模型训练,并根据不同的要素采用多种算法来绑定到同一设备,提高了车辆指纹的准确度和稳定性。
Description
技术领域
本发明涉及车辆偷逃费识别领域,具体涉及一种车辆设备指纹CARID识别系统及识别方法。
背景技术
在高速公路实行全国联网后,数据趋于统一,随着各省高速公路的发展与建设,面对各种新型的逃费手段,正确的识别车辆,对于套牌、换卡、多卡等各种逃费手段有显著作用,但是正确快速的识别车辆的有效手段目前很缺乏,当前主要通过图片识别和静态信息收集直接判别一辆车,其手段相对单一,但是并不能很有效的甄别异常行为车辆,存在图片识别不准、图片丢失;设备直接替换等。
高速公路的数据信息中图片识别技术的准确率受到各种外在影响,如:遮挡、套牌、荧光、高速行驶、跟车识别错误;硬件记录信息极易被篡改,如:一个车多卡、换卡、多OBU情况(车载单元,ETC卡)。车辆行程信息中数据多样,一趟行程多个门架和牌识信息,并不能像传统设备一样有明确、清晰的设备信息,存在的误差和异常情况更复杂,无法使用车牌号等信息来独立识别一辆车。
因此,本发明主要旨在获取多要素,通过多组合多算法的方式为车辆设置设备指纹,确定真实车辆。
发明内容
为了克服现有技术的不足,本发明的目的在于提供一种车辆设备指纹CARID识别系统及识别方法,其能解决上述问题。
设计目的:获取多要素,通过多组合多算法的方式为车辆设置设备指纹,确定真实车辆。
设计可能用到的技术术语;
CPC卡一般指高速公路复合通行卡。CPC卡的路网应用是取消高速公路省界收费站试点工程的基础性、核心工作之一。CPC卡能够识别车辆进、出收费站信息,精确记录车辆的实际行驶路径,为跨省通行费计费、清算等提供重要依据。
ETL-即EXTRACT(提取)、Transform(转换)、LOAD(加载)的数据提取转换加载模块。提取是从数据库读取数据的过程,通常从多种不同类型的来源收集数据;转换是过程转换所提取的数据从先前的形式进入它需要在这样它可以被放置到另一个数据库的形式,通过使用规则或查找表或通过将数据与其他数据组合来进行转换;加载是将数据写入目标数据库的过程。
提取来自一个或多个源的数据,然后将其复制到数据仓库。处理大量数据和多个源系统时,会合并数据。ETL用于将数据从一个数据库迁移到另一个数据库,并且通常是将数据加载到数据集市和数据仓库以及从数据集市(data marts)和数据仓库(datawarehouses)加载数据所需的特定过程,并且这个过程也用于大量地将数据库从一种格式(类型)转换或改变成另一种。
HDFS-Hadoop Distributed File System-分布式文件系统,指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File System),具有高度容错性,便于提高吞吐量,适合大规模数据集上的应用等特点。
设计方案:为了解决上述问题,本申请的总体设计方案如下。
一种车辆设备指纹CARID识别系统,识别系统包括管理平台、数据库、数据清洗模块、数据处理模块、训练模块和识别模型。
所述管理平台与各模块单元电信连接并向各模块配置信息,管理平台还控制车辆识别系统与业务系统的电信连接,以此发起业务数据录入请求、数据处理请求、模型训练请求、识别请求、决策请求和显示请求,对识别模型进行管理和更新操作;
所述数据库采用HDFS分布式文件系统,用于采集并存储业务系统传输的出入口信息、牌识信息、门架信息和异常车黑样本数据,在分布式文件系统中构成大数据集群,实现数据保存落地;
所述数据清洗模块通过对大数据集群的数据清洗,获取行程基本要素和行程视频要素;
所述数据处理模块将数据清洗模块清洗预处理的数据通过数据加工、特征重要性分析、刻画行为要素及要素组合、合并要素生成行程要素的集合,并以此生成对应行程要素宽表;
所述训练模块获取行程要素宽表,根据不同通行方式和出口特情提取有效数据字段列和其组合的字段作为测试集和训练集进行模型训练,提高模型的准确性、稳定性和场景全面性;
所述识别模型用于多场景下不同通行方式独立计算车辆设备指纹,确定通行车辆的实际设备指纹。
进一步的,所述业务系统提供来自省、部以及路段数据,并以parquet方式压缩保存在所述数据库中。
进一步的,所述数据清洗模块对存在问题的数据进行数据清理,数据清洗包括预清洗和后处理,其中预清洗包括相同含义字段数据格式不统一、表格字段编码不一致、业务含义略微差异导致的相同字段表现不同、数据异常后补偿数据和历史数据重复;后处理包括对数据进行标准化以及多表关联补足缺失信息,生成处理完成的包括行程基本要素和行程视频要素的基本行程相关数据表。
进一步的,所述数据处理模块的数据加工用于将1笔行程对应的多笔视频要素信息处理到行程表中,得到初步的行程要素信息表;
所述数据处理模块的特征重要性分析采用MIC方式获取特征要素的区分度和稳定性,从而计算出特征的重要程度,分析特征区分度低的和特征重要性低的特征要素,结合业务去分析其在不同场景的不同作用,将多个特征到一起,以提高区分度,获取重要特性要素;
所述数据处理模块的刻画行为要素及要素组合中,刻画行为要素包括分析特征重要性top的几个特征要素,对其进行行为刻画,基于稽核黑样本的行为模式来进行分析,以行为模式来比对分析与本次行程信息;要素组合为合并刻画的行为要素和行程要素组合,获得相对稳定的特征;
所述数据处理模块的合并要素包括,根据循环重复刻画获得的稳定特征,生成对应行程要素宽表,保持要用的行程要素。
将大数据集群中的数据与处理后得到行程要素信息表,并基于区分度及重要性的行为要素信息来刻画行为要素,得到行程要素宽表。
进一步的,所述训练模块采用决策树模型算法训练,计算模型概率值,验证识别结果的准确率、错误接受率和错误拒绝率,通过对组合要素及其区分度和稳定性的权重调节,达到预计要求。
进一步的,所述重要性用特征程度featurew计算表示:
featurew=weight*mw+(1-weight)*msw……………………………………式1;
式中,feature是权衡区分度与稳定性的参数,在一般情况下认为区分度的权重大于稳定性的权重;mw是第w个特征的最大信息系数;msw是第w个特征的平均稳定性。
进一步的,所述车辆识别系统还包括决策及显示模块;所述决策及显示模块用于将识别模型判定的车辆设备指纹可视化呈现,并同步传输给业务系统结果,对判定为偷逃车辆进行处理。
本发明还提供了一种车辆设备指纹CARID识别方法,方法包括:
S1、数据采集,采集并存储业出入口信息、牌识信息、门架信息和异常车黑样本数据,实现数据保存落地,构成大数据集群;
S2、数据清洗,包括数据预清洗和后处理,生成包括行程基本要素和行程视频要素的基本行程相关数据表;
S3、数据处理,将清洗的数据通过数据加工、特征重要性分析、刻画行为要素及要素组合、合并要素生成行程要素的集合,并以此生成对应行程要素宽表;
S4、模型训练,根据不同的通行方式或出口特情取有效数据列,对识别模型进行训练;
S5、车辆识别实测,通过车辆设备指纹CARID识别模型对经过不同通行方式的车辆计算其车辆设备指纹,生成车辆设备指纹CARID。
进一步的,步骤S5的车辆识别实测包括:
S51、车辆第一次经过时,通行方式a1,通过算法计算一个车辆设备指纹SID,分别为SID1、SID2、……、SIDn,即实际设备FID对应n个计算的设备ID,FID1=(a1[SID1|SID2|……|SIDn]),将计算的车辆设备指纹SID1、SID2、……、SIDn与数据库比对是否有匹配;若是,则确认匹配的车辆设备指纹即为车辆实际设备指纹,直接返回车辆设备指纹,并更新数据库,设置FID1=(a1[SID1|SID2|……|SIDn];若否,则进行下一步;
S52、车辆第二次经过时,通行方式为a1部分信息更改,算法部分要素更改,生成计算n个车辆设备指纹SID2、SID3、……、SIDn、SIDn+1,车辆实际设备对应n+1个计算的设备ID,即FID2=(a1[SID2|……|SIDn|SIDn+1]);将计算的车辆设备指纹SID2、……、SIDn+1与数据库比对是否有匹配;若是,则获取SIDx对应的FID,并更新数据库,设置FID1=(a1[SID1|SID2|……|SIDn|SIDn+1]),直接返回FID1;若否,则返回FID2,并插入数据库FID2=(a1[SID2|……|SIDn|SIDn+1]);车辆第二次通过其他通行方式a2进入,经过的算法不同,个数不同,且要素重要性不同,车辆实际设备对应生成计算m个车辆设备指纹,即FID2=(a2[SID_1|SID_2|……|SIDm]),这根据数据信息确认合并FID1=(a1[SID1|SID2|……|SIDn]|a2[SID_1|SID_2|……|SIDm]),并保存数据库;
S53、重复步骤S52,a1-ax种通行方式,每种通行方式重复次数为执行度为j,对应算法更改j次部分要素,车辆实际设备对应n+j个计算的设备ID,即可能的实际设备FID1=(a1[SID1|SID2|…|SIDj-1|…|SIDn|SIDn+1|SIDn+2|……|SIDn+j]|……|ax[SID1|SID2|……|SIDm|SIDm+j])。根据时间戳,以及FID对应的SID总量,逐渐抛弃过去生成的对应的SID,保证数据的更新。
进一步的,方法还包括:S6、决策和显示,对于步骤S5的车辆设备指纹识别结果进行显示。
相比现有技术,本发明的有益效果在于:本发明将传统的设备指纹运用到车辆上,为不同的车辆提供了一个唯一的标识,可以用于稽查、车辆的查找、轨迹分析、大数据分析等多种应用,为智能交通结合大数据做好基石。
附图说明
图1为本发明车辆设备指纹CARID识别系统示意图;
图2为识别系统拓补图;
图3为本发明特征要素生成的流程图;
图4为本发明特征要素筛选训练方案;
图5为本发明设备指纹计算方案流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
第一实施例
一种车辆设备指纹CARID识别系统,参见图1和图2,识别系统包括管理平台、数据库、数据清洗模块、数据处理模块、训练模块和识别模型。
所述管理平台与各模块单元电信连接并向各模块配置信息,管理平台还控制车辆识别系统与业务系统的电信连接,以此发起业务数据录入请求、数据处理请求、模型训练请求、识别请求、决策请求和显示请求,对识别模型进行管理和更新操作。
对于数据库的存储功能部分,参见图2,数据存储分3块:①管理系统使用的关系型数据库;②HDFS分布式文件系统,用于数据存储;③nosql数据库(非关系型数据库),用于车辆设备指纹的存储。
所述数据库采用HDFS分布式文件系统,用于采集并存储业务系统传输的出入口信息、牌识信息、门架信息和异常车黑样本数据,在分布式文件系统中构成大数据集群,实现数据保存落地。
所述数据清洗模块通过对大数据集群的数据清洗,获取行程基本要素和行程视频要素。
所述数据处理模块将数据清洗模块清洗预处理的数据通过数据加工、特征重要性分析、刻画行为要素及要素组合、合并要素生成行程要素的集合,并以此生成对应行程要素宽表。
所述训练模块获取行程要素宽表,根据不同通行方式和出口特情提取有效数据字段列和其组合的字段作为测试集和训练集进行模型训练,提高模型的准确性、稳定性和场景全面性。
所述识别模型用于多场景下不同通行方式独立计算车辆设备指纹,确定通行车辆的实际设备指纹。
其中,所述业务系统提供来自省、部以及路段数据,并以parquet方式压缩保存在所述数据库中。
其中,所述数据清洗模块对存在问题的数据进行数据清理,数据清洗包括预清洗和后处理,其中预清洗包括相同含义字段数据格式不统一、表格字段编码不一致、业务含义略微差异导致的相同字段表现不同、数据异常后补偿数据和历史数据重复。后处理包括对数据进行标准化以及多表关联补足缺失信息,生成处理完成的包括行程基本要素和行程视频要素的基本行程相关数据表。
其中,所述数据处理模块的数据加工用于将1笔行程对应的多笔视频要素信息处理到行程表中,得到初步的行程要素信息表。
所述数据处理模块的特征重要性分析采用MIC方式获取特征要素的区分度和稳定性,从而计算出特征的重要程度,分析特征区分度低的和特征重要性低的特征要素,结合业务去分析其在不同场景的不同作用,将多个特征到一起,以提高区分度,获取重要特性要素。
所述数据处理模块的刻画行为要素及要素组合中,刻画行为要素包括分析特征重要性top的几个特征要素,对其进行行为刻画,基于稽核黑样本的行为模式来进行分析,以行为模式来比对分析与本次行程信息。要素组合为合并刻画的行为要素和行程要素组合,获得相对稳定的特征。
所述数据处理模块的合并要素包括,根据循环重复刻画获得的稳定特征,生成对应行程要素宽表,保持要用的行程要素。
将大数据集群中的数据与处理后得到行程要素信息表,并基于区分度及重要性的行为要素信息来刻画行为要素,得到行程要素宽表。
进一步的,重要性用特征程度featurew计算表示:
featurew=weight*mw+(1-weight)*msw…………………………………………式1;
式中,feature是权衡区分度与稳定性的参数,在一般情况下认为区分度的权重大于稳定性的权重;mw是第w个特征的最大信息系数;msw是第w个特征的平均稳定性。
其中,所述训练模块采用决策树模型算法训练,计算模型概率值,验证识别结果的准确率、错误接受率和错误拒绝率,通过对组合要素及其区分度和稳定性的权重调节,达到预计要求。
其中,所述车辆识别系统还包括决策及显示模块;所述决策及显示模块用于将识别模型判定的车辆设备指纹可视化呈现。
参见图2,模型训练部分,采用离线方式,通过agent应用或ETL应用来获取业务系统的基础数据。数据从HDFS数据存储—可视化数据处理和标准化—可视化的进行要素分析和模型训练—可视组件化工具用于下游使用的数据增加上车辆设备指纹。
实际测试部分,即指纹应用,包括指纹计算服务器和nosql指纹存储服务器,其与训练好的模型或机器学习平台进行请求交互,基于模型进行车辆设备指纹的识别应用。
进一步的,业务系统及其提供的设备指纹前置应用,为实时数据。其与识别模型的可视化的进行要素分析和模型训练相关联,通过更新数据,完成训练并输出结果被订阅。
第二实施例
一种车辆设备指纹CARID识别方法,是基于车辆基本信息要素、视频要素、行为要素的车辆设备指纹识别方法,参见图2和3,方法包括:
S1、数据采集,采集并存储业出入口(根据高速公路省数据、部数据和各个路段数据收集各类要素)信息、牌识信息、门架信息和异常车黑样本数据,实现数据保存落地,构成大数据集群;即,选数据从省和部以及路段获取过来,落地到大数据环境HDFS中,以parquet方式压缩保存原始数据。
S2、数据清洗,包括数据预清洗和后处理,生成包括行程基本要素和行程视频要素的基本行程相关数据表、即行程要素信息表,表格如下。
其中,预清洗即数据降噪、缺省值补足、数据标准化、数据归一化等基本数据处理。
S3、数据处理,将清洗的数据通过数据加工、特征重要性分析、刻画行为要素及要素组合、合并要素生成行程要素的集合,并以此生成对应行程要素宽表。
数据加工,即将门架信息、门架拍识信息合并到行程表。
采用MIC方式来获取特征要素的区分度和稳定性,从而计算出特征的重要程度。
分析特征区分度低的和特征重要性低的特征要素,结合业务去分析其在不同场景的不同作用,将多个特征到一起,以提高区分度。例如,在CPC卡通行场景下ETC相关的信息在CPC换卡操作时随时可能不可信或者无信息、在相同一辆车行为上ETC常用的ETC卡编号和OBU介质编号基本一致。
分析特征重要性top的几个特征要素,对其进行行为刻画,例如:
行为要素信息 |
实际车牌过去1个月车重标准差 |
实际车牌过去6个月车重标准差 |
OBU过去1年对应识别车牌号集合 |
OBU过去1个月对应识别车牌号集合 |
识别车牌过去一年经过次数 |
OBU近10次匹配的ETC卡集合 |
实际车牌过去一年经过次数 |
刻画行为要素主要基于稽核黑样本的行为模式来进行分析,以及车辆日常行为,主要用于相同车突然行为突变的一个参考,可以用于设备指纹要素信息。
合并上述的要素,完成一次重复,直到对于相关的特征相对稳定。
最终生成对应行程要素宽表,将所有要用的行程要素进行保存。
其中,生成行程要素集合,示例性说明:如生成A、B、C多个特征要素,基于A当前一个月经过地段次数,作为新要素Z,即行为要素为在Z,要素D、E分析并组合,稳定性&区分度符合,那么DE新组合可以作为新要素,循环更新,确定行程要素。经过如此的试错和筛选,获得最后特征稳定的行程要素宽表。
S4、模型训练,参见图4,根据不同的通行方式或出口特情取有效数据列,对识别模型进行训练;
S5、车辆识别实测,通过车辆设备指纹CARID识别模型对经过不同通行方式的车辆计算其车辆设备指纹,生成车辆设备指纹CARID。参见图3,通过数据处理后,筛选出在不同的通行方式场景下可用的数据,获得行程要素宽表,然后,基于不同的通行方式来独自计算车辆设备指纹。
具体的,参见图5,步骤S5的车辆识别实测包括:
进一步的,步骤S5的车辆识别实测包括:
S51、车辆第一次经过时,通行方式a1,通过算法计算一个车辆设备指纹SID,分别为SID1、SID2、……、SIDn,即实际设备FID对应n个计算的设备ID,FID1=(a1[SID1|SID2|……|SIDn]),将计算的车辆设备指纹SID1、SID2、……、SIDn与数据库比对是否有匹配;若是,则确认匹配的车辆设备指纹即为车辆实际设备指纹,直接返回车辆设备指纹,并更新数据库,设置FID1=(a1[SID1|SID2|……|SIDn];若否,则进行下一步;
S52、车辆第二次经过时,通行方式为a1部分信息更改,算法部分要素更改,生成计算n个车辆设备指纹SID2、SID3、……、SIDn、SIDn+1,车辆实际设备对应n+1个计算的设备ID,即FID2=(a1[SID2|……|SIDn|SIDn+1]);将计算的车辆设备指纹SID2、……、SIDn+1与数据库比对是否有匹配;若是,则获取SIDx对应的FID,并更新数据库,设置FID1=(a1[SID1|SID2|……|SIDn|SIDn+1]),直接返回FID1;若否,则返回FID2,并插入数据库FID2=(a1[SID2|……|SIDn|SIDn+1]);车辆第二次通过其他通行方式a2进入,经过的算法不同,个数不同,且要素重要性不同,车辆实际设备对应生成计算m个车辆设备指纹,即FID2=(a2[SID_1|SID_2|……|SIDm]),这根据数据信息确认合并FID1=(a1[SID1|SID2|……|SIDn]|a2[SID_1|SID_2|……|SIDm]),并保存数据库;
S53、重复步骤S52,a1-ax种通行方式,每种通行方式重复次数为执行度为j,对应算法更改j次部分要素,车辆实际设备对应n+j个计算的设备ID,即可能的实际设备FID1=(a1[SID1|SID2|…|SIDj-1|…|SIDn|SIDn+1|SIDn+2|……|SIDn+j]|……|ax[SID1|SID2|……|SIDm|SIDm+j])。
根据时间戳,以及FID对应的SID总量,逐渐抛弃过去生成的对应的SID,保证数据的更新。
进一步的,方法还包括:
S6、决策和显示,对于步骤S5的车辆设备指纹识别结果进行显示。
一个示例中,在数据清洗中,获取路段实际逃费黑样本来做3件事情:
1.建立黑样本分析模型,分析并稽核获取更多黑样本信息。
2.根据黑样本进行特征重要性分析,基于(Maximal Information Coefficient)MIC方案,FSDS-WSC方案获取特征要素的区分度和稳定性,并根据区分度低的要素信息采用要素组合方案,提高区分度。
3.取特征重要性高的要素或者要素组合对行为要素进行刻画。
根据黑样本,对收集的数据进行按照时间分割,分为训练集和测试集,进行模型训练。模型训练方法主要采用RS、GBDT等决策树模型,计算一个模型概率值,也作为后续设备指纹预测标准。验证训练集ACC(准确率)、FAR(错误接受率)、FRR(错误拒绝率),并以此调整要素组合以及设定区分度和稳定性的权重,重复特征获取、行为指标刻画和模型训练步骤,直到ACC达到预计要求。
采用多种组合算法方案,不同特征组合在一定条件下设定不同的算法来计算,以此从服务器端获取唯一设备指纹信息,如设备要素信息发生变动之后将新的设备信息页记录并更新服务端该设备对应信息集合(如车辆通过CPC上高速和ETC上高速)。
第三实施例
本发明还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行前述方法的步骤。其中,所述方法请参见前述部分的详细介绍,此处不再赘述。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、VisualBasic、Fortran2003、Perl、COBOL2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或处理设备上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
第四实施例
本发明还提供了一种终端,包括存储器和处理器,所述存储器上储存有样本库、行程要素宽表和能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行前述方法的步骤。其中,所述方法请参见前述部分的详细介绍,此处不再赘述。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.一种车辆设备指纹CARID识别系统,其特征在于:识别系统包括管理平台、数据库、数据清洗模块、数据处理模块、训练模块和识别模型;
所述管理平台与各模块单元电信连接并向各模块配置信息,管理平台还控制车辆识别系统与业务系统的电信连接,以此发起业务数据录入请求、数据处理请求、模型训练请求、识别请求、决策请求和显示请求,对识别模型进行管理和更新操作;
所述数据库采用HDFS分布式文件系统,用于采集并存储业务系统传输的出入口信息、牌识信息、门架信息和异常车黑样本数据,在分布式文件系统中构成大数据集群,实现数据保存落地;
所述数据清洗模块通过对大数据集群的数据清洗,获取行程基本要素和行程视频要素;
所述数据处理模块将数据清洗模块清洗预处理的数据通过数据加工、特征重要性分析、刻画行为要素及要素组合、合并要素生成行程要素的集合,并以此生成对应行程要素宽表;
所述训练模块获取行程要素宽表,根据不同通行方式和出口特情提取有效数据字段列和其组合的字段作为测试集和训练集进行模型训练;
所述识别模型用于多场景下不同通行方式独立计算车辆设备指纹,确定通行车辆的实际设备指纹;
所述数据清洗模块对存在问题的数据进行数据清理,数据清洗包括预清洗和后处理,其中预清洗包括相同含义字段数据格式不统一、表格字段编码不一致、业务含义略微差异导致的相同字段表现不同、数据异常后补偿数据和历史数据重复;
后处理包括对数据进行标准化以及多表关联补足缺失信息,生成处理完成的包括行程基本要素和行程视频要素的基本行程相关数据表;
所述数据处理模块的数据加工用于将1笔行程对应的多笔视频要素信息处理到行程表中,得到初步的行程要素信息表;
所述数据处理模块的特征重要性分析采用MIC方式获取特征要素的区分度和稳定性,从而计算出特征的重要程度,分析特征区分度低的和特征重要性低的特征要素,结合业务去分析其在不同场景的不同作用,将多个特征到一起,以提高区分度,获取重要特性要素;
所述数据处理模块的刻画行为要素及要素组合中,刻画行为要素包括分析特征重要性top的几个特征要素,对其进行行为刻画,基于稽核黑样本的行为模式来进行分析,以行为模式来比对分析与本次行程信息;
要素组合为合并刻画的行为要素和行程要素组合,获得相对稳定的特征;
所述数据处理模块的合并要素包括,根据循环重复刻画获得的稳定特征,生成对应行程要素宽表,保持要用的行程要素,将大数据集群中的数据与处理后得到行程要素信息表,并基于区分度及重要性的行为要素信息来刻画行为要素,得到行程要素宽表。
2.根据权利要求1所述的识别系统,其特征在于:所述业务系统提供来自省、部以及路段数据,并以parquet方式压缩保存在所述数据库中。
3.根据权利要求1所述的识别系统,其特征在于:所述训练模块采用决策树模型算法训练,计算模型概率值,验证识别结果的准确率、错误接受率和错误拒绝率,通过对组合要素及其区分度和稳定性的权重调节,达到预计要求。
4.根据权利要求1所述的识别系统,其特征在于:所述重要性用特征程度featurew计算表示:
featurew=weight*mw+(1-weight)*msw………………………………………………式1;
式中,feature是权衡区分度与稳定性的参数,在一般情况下认为区分度的权重大于稳定性的权重;
mW是第w个特征的最大信息系数;msW是第w个特征的平均稳定性。
5.根据权利要求1所述的识别系统,其特征在于:所述车辆识别系统还包括决策及显示模块;
所述决策及显示模块用于将识别模型判定的车辆设备指纹可视化呈现。
6.一种车辆设备指纹CARID识别方法,其特征在于,方法包括:
S1、数据采集,采集并存储业出入口信息、牌识信息、门架信息和异常车黑样本数据,实现数据保存落地,构成大数据集群;
S2、数据清洗,包括数据预清洗和后处理,数据清洗模块通过对大数据集群的数据清洗,获取行程基本要素和行程视频要素,生成包括行程基本要素和行程视频要素的基本行程相关数据表,其中,数据清洗模块对存在问题的数据进行数据清理,数据清洗包括预清洗和后处理,其中预清洗包括相同含义字段数据格式不统一、表格字段编码不一致、业务含义略微差异导致的相同字段表现不同、数据异常后补偿数据和历史数据重复;
后处理包括对数据进行标准化以及多表关联补足缺失信息,生成处理完成的包括行程基本要素和行程视频要素的基本行程相关数据表;
S3、数据处理,数据处理模块将清洗的数据通过数据加工、特征重要性分析、刻画行为要素及要素组合、合并要素生成行程要素的集合,并以此生成对应行程要素宽表,其中,所述数据处理模块的数据加工用于将1笔行程对应的多笔视频要素信息处理到行程表中,得到初步的行程要素信息表;
所述数据处理模块的特征重要性分析采用MIC方式获取特征要素的区分度和稳定性,从而计算出特征的重要程度,分析特征区分度低的和特征重要性低的特征要素,结合业务去分析其在不同场景的不同作用,将多个特征到一起,以提高区分度,获取重要特性要素;
所述数据处理模块的刻画行为要素及要素组合中,刻画行为要素包括分析特征重要性top的几个特征要素,对其进行行为刻画,基于稽核黑样本的行为模式来进行分析,以行为模式来比对分析与本次行程信息;
要素组合为合并刻画的行为要素和行程要素组合,获得相对稳定的特征;
所述数据处理模块的合并要素包括,根据循环重复刻画获得的稳定特征,生成对应行程要素宽表,保持要用的行程要素,将大数据集群中的数据与处理后得到行程要素信息表,并基于区分度及重要性的行为要素信息来刻画行为要素,得到行程要素宽表;
S4、模型训练,训练模块获取行程要素宽表,根据不同的通行方式或出口特情取有效数据列,对识别模型进行训练;
S5、车辆识别实测,通过车辆设备指纹CARID识别模型对经过车辆计算车辆设备指纹,生成车辆设备指纹CARID;
所述步骤S5的车辆识别实测包括:
S51、车辆第一次经过时,通行方式a1,通过算法计算一个车辆设备指纹SID,分别为SID1、SID2、……、SIDn,即实际设备FID对应n个计算的设备ID,FID1=(a1[SID1|SID2|……|SIDn])将计算的车辆设备指纹SID1、SID2、……、SIDn与数据库比对是否有匹配;
若是,则确认匹配的车辆设备指纹即为车辆实际设备指纹,直接返回车辆设备指纹,并更新数据库,设置FID1=(a1[SID1|SID2|……|SIDn]);若否,则进行下一步;
S52、车辆第二次经过时,通行方式为a1部分信息更改,算法部分要素更改,生成计算n个车辆设备指纹SID2、SID3、……、SIDn、SIDn+1,车辆实际设备对应n+1个计算的设备ID,即FID2=(a1[SID2|……|SIDn|SIDn+1]);
将计算的车辆设备指纹SID2、……、SIDn+1与数据库比对是否有匹配;
若是,则获取SIDx对应的FID,并更新数据库,设置FID1=(a1[SID1|SID2|……|SIDn|SIDn+1]),直接返回FID1;
若否,则返回FID2,并插入数据库FID2=(a1[SID2|……|SIDn|SIDn+1]);
车辆第二次通过其他通行方式a2进入,经过的算法不同,个数不同,且要素重要性不同,车辆实际设备对应生成计算m个车辆设备指纹,即FID2=(a2[SID_1|SID_2|……|SIDm]),这根据数据信息确认合并FID1=(a1[SID1|SID2|……|SIDn]|a2[SID_1|SID_2|……|SIDm]),并保存数据库;
S53、重复步骤S52,a1-ax种通行方式,每种通行方式重复次数为执行度为j,对应算法更改j次部分要素,车辆实际设备对应n+j个计算的设备ID,即可能的实际设备
FID1=(a1[SID1|SID2|…|SIDj-1|...|SIDn|SIDn+1|SIDn+2|……|SIDn+j]|……|ax[SID1|SID2|……|SIDm|SIDm+j])。
7.根据权利要求6所述的识别方法,其特征在于,方法还包括:
S6、决策和显示,对于步骤S5的车辆设备指纹识别结果进行显示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111480843.2A CN114416686B (zh) | 2021-12-06 | 2021-12-06 | 一种车辆设备指纹carid识别系统及识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111480843.2A CN114416686B (zh) | 2021-12-06 | 2021-12-06 | 一种车辆设备指纹carid识别系统及识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114416686A CN114416686A (zh) | 2022-04-29 |
CN114416686B true CN114416686B (zh) | 2023-04-14 |
Family
ID=81266059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111480843.2A Active CN114416686B (zh) | 2021-12-06 | 2021-12-06 | 一种车辆设备指纹carid识别系统及识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114416686B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115422380B (zh) * | 2022-09-07 | 2024-02-13 | 武汉品致汽车技术有限公司 | 一种汽车用户手册开发方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111597954A (zh) * | 2020-05-12 | 2020-08-28 | 博康云信科技有限公司 | 一种在监控视频中标识车辆位置的方法及系统 |
CN113705495A (zh) * | 2021-09-01 | 2021-11-26 | 南京慧尔视智能科技有限公司 | 一种基于目标识别框的大小车分类方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104463988A (zh) * | 2014-11-13 | 2015-03-25 | 安徽省新方尊铸造科技有限公司 | 一种基于指纹识别技术的高速公路收费系统 |
EP3226239B1 (en) * | 2016-03-30 | 2018-12-19 | Panasonic Automotive & Industrial Systems Europe GmbH | Voice command system |
CN110569921A (zh) * | 2019-09-17 | 2019-12-13 | 中控智慧科技股份有限公司 | 一种车标识别方法、系统、装置及计算机可读介质 |
CN111339977A (zh) * | 2020-03-03 | 2020-06-26 | 河南中光学集团有限公司 | 一种基于远程视频监控的小目标智能识别系统及其识别方法 |
CN112071076A (zh) * | 2020-08-25 | 2020-12-11 | 浙江省机电设计研究院有限公司 | 一种高速公路车辆唯一标识特征提取方法及系统 |
CN113570854A (zh) * | 2021-06-21 | 2021-10-29 | 陕西交通电子工程科技有限公司 | 一种用于高速公路运营管理的智能稽核控制系统 |
-
2021
- 2021-12-06 CN CN202111480843.2A patent/CN114416686B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111597954A (zh) * | 2020-05-12 | 2020-08-28 | 博康云信科技有限公司 | 一种在监控视频中标识车辆位置的方法及系统 |
CN113705495A (zh) * | 2021-09-01 | 2021-11-26 | 南京慧尔视智能科技有限公司 | 一种基于目标识别框的大小车分类方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114416686A (zh) | 2022-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210192586A1 (en) | Systems and Methods for Detecting and Responding to Anomalous Traffic Conditions | |
CN110457294B (zh) | 一种数据处理方法和装置 | |
CN111612040B (zh) | 基于孤立森林算法的财务数据异常检测方法及相关装置 | |
CN111931780A (zh) | 一种会计凭证智能管理方法及设备 | |
CN114416686B (zh) | 一种车辆设备指纹carid识别系统及识别方法 | |
CN110782349A (zh) | 一种模型训练方法和系统 | |
CN115018513A (zh) | 数据巡检方法、装置、设备及存储介质 | |
CN111680082B (zh) | 基于数据整合的政府财政数据采集系统及数据采集方法 | |
CN111680083B (zh) | 智能化多级政府财政数据采集系统及数据采集方法 | |
CN111242779B (zh) | 金融数据特征选择和预测方法、装置、设备及存储介质 | |
CN115271565B (zh) | 基于dea的高速公路路面养护措施评价方法、装置及设备 | |
Xia et al. | A data cleaning service on massive spatio-temporal data in highway domain | |
CN115147029A (zh) | 基于大数据的企业活跃度监测方法及系统 | |
CN115271514A (zh) | 通讯企业的监控方法、装置、电子设备及存储介质 | |
Ding et al. | A data cleaning method on massive spatio-temporal data | |
CN117764757B (zh) | 一种会计凭证一体化智能管理系统 | |
CN113064883A (zh) | 物流风控模型的构建方法、计算机设备和存储介质 | |
Bass et al. | Utility-scale Building Type Assignment Using Smart Meter Data | |
CN107943920A (zh) | 一种基于地铁刷卡数据的出行人群识别方法 | |
CN117057941B (zh) | 基于多维度数据分析的异常消费检测方法 | |
CN117235677B (zh) | 一种汽车配件价格异常识别检测方法 | |
CN112488572B (zh) | 一种审计对象推荐方法、装置、设备和介质 | |
CN112766761A (zh) | 企业研发投入潜力评价方法、装置及系统 | |
CN113806450B (zh) | 一种基于综合交通大数据的融合型旅客关系网络构建方法 | |
US20220284487A1 (en) | Real-Time Revenue Assurance System For Operational Toll Management And A Method Thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |