CN115048365A - 车辆数据的清洗方法、装置、电子装置和存储介质 - Google Patents
车辆数据的清洗方法、装置、电子装置和存储介质 Download PDFInfo
- Publication number
- CN115048365A CN115048365A CN202210385226.2A CN202210385226A CN115048365A CN 115048365 A CN115048365 A CN 115048365A CN 202210385226 A CN202210385226 A CN 202210385226A CN 115048365 A CN115048365 A CN 115048365A
- Authority
- CN
- China
- Prior art keywords
- information
- vehicle data
- license plate
- processed
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/625—License plates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Vehicle Cleaning, Maintenance, Repair, Refitting, And Outriggers (AREA)
Abstract
本申请涉及一种车辆数据的清洗方法、装置、电子装置和存储介质。其中,该车辆数据的清洗方法包括:获取待处理车辆数据;确定待处理车辆数据所对应的车牌的地域信息,地域信息包括省份信息和城市信息;基于预设的地域归属关系,对地域信息中的省份信息和城市信息进行属地准确性校验;将属地准确性效验不通过的待处理车辆数据进行丢弃。通过本申请,解决了相关技术中车辆数据清洗准确率低的问题,提高了车辆数据清洗准确率。
Description
技术领域
本申请涉及图像处理领域,特别是涉及车辆数据的清洗方法、装置、电子装置和存储介质。
背景技术
随着前端设备的日趋先进以及图像识别算法技术的逐渐成熟,针对车辆的抓拍识别效果也越来越好,不过现实场景中总会遇到一些复杂的情景,如:遮挡、光线、天气等因素,导致抓拍识别出的车牌号或车牌类型出现明显的错误,例如:将车牌号中的“D”识别成“O”,以及将车牌类型为小车类型的识别成大车类型,上述数据如果不加以处理则会对后续车辆数据的开发、统计工作造成误导。
针对相关技术中存在车辆数据清洗准确率低的问题,目前还没有提出有效的解决方案。
发明内容
在本实施例中提供了一种车辆数据的清洗方法、装置、电子装置和存储介质,以解决相关技术中车辆数据清洗准确率低的问题。
第一个方面,在本实施例中提供了一种车辆数据的清洗方法,包括:
获取待处理车辆数据;
确定所述待处理车辆数据所对应的车牌的地域信息,所述地域信息包括省份信息和城市信息;
基于预设的地域归属关系,对所述地域信息中的省份信息和城市信息进行属地准确性校验;
将属地准确性效验不通过的待处理车辆数据进行丢弃。
在其中的一些实施例中,在基于预设的地域归属关系,对所述地域信息中的省份信息和城市信息进行属地准确性校验之后,所述方法还包括:
在对所述地域信息中的省份信息和城市信息进行属地准确性校验通过的情况下,对属地准确性效验通过的待处理车辆数据的车牌进行数字位数校验;
将数字位数校验不通过的待处理车辆数据进行丢弃。
在其中的一些实施例中,在确定所述待处理车辆数据所对应的车牌的地域信息之前,所述方法还包括:
确定所述待处理车辆数据所对应的车牌的长度信息;
基于预设的长度标准,对所述车牌的长度信息进行长度准确性效验;
在所述长度准确性效验的结果为通过的情况下,确定所述待处理车辆数据所对应的车牌的地域信息。
在其中的一些实施例中,所述方法还包括:
将长度准确性效验不通过的待处理车辆数据进行丢弃。
在其中的一些实施例中,确定所述待处理车辆数据所对应的车牌的地域信息包括:
根据所述待处理车辆数据所对应的车牌,确定所述车牌的第一位汉字信息和所述车牌的第二位字母信息;
根据所述第一位汉字信息,确定省份信息;
根据所述省份信息和所述第二位字母信息,确定城市信息。
在其中的一些实施例中,基于预设的地域归属关系,对所述地域信息中的省份信息和城市信息进行属地准确性校验包括:
判断所述省份信息是否在预设省份信息内;
在判断到所述省份信息在预设省份信息内的情况下,判断所述城市信息是否在所述省份信息的预设城市信息内;
在判断到所述城市信息在所述省份信息的预设城市信息内的情况下,判定所述待处理车辆数据的归属地校验为通过。
在其中的一些实施例中,在判断到所述省份信息不在预设省份信息内的情况下,或,在判断到所述城市信息不在所述省份信息的预设城市信息内的情况下,所述方法还包括:
判定所述待处理车辆数据的归属地校验为不通过。
在其中的一些实施例中,在判断到所述城市信息在所述省份信息的预设城市信息内的情况下,判定所述待处理车辆数据的归属地校验为通过之后,所述方法还包括:
根据预设的字符标准,对所述待处理车辆数据所对应的车牌进行字符校验;
在对所述待处理车辆数据所对应的车牌进行字符校验不通过的情况下,将进行字符校验不通过的待处理车辆数据进行丢弃。
在其中的一些实施例中,所述方法还包括:
获取未丢弃的目标车辆数据;
根据所述目标车辆数据的车牌,判断所述目标车辆数据的车牌所对应的车辆类型是否唯一;
在判断到所述目标车辆数据的车牌所对应的车辆类型不唯一的情况下,检测历史车辆数据中是否存在所述目标车辆数据的车牌对应的历史车辆类型不唯一的历史信息;
在检测到检测历史车辆数据中存在所述目标车辆数据的车牌对应的历史车辆类型不唯一的历史信息的情况下,将所述目标车辆数据所对应的车辆类型不唯一的历史信息存入数据库。
在其中的一些实施例中,所述方法还包括:
在检测到历史车辆数据中存在所述目标车辆数据的车牌对应的历史车辆类型唯一的历史信息的情况下,获取预设天数内所述目标车辆数据对应的次数最多的目标车辆类型;
将所述目标车辆类型与所述目标车辆数据进行关联并存入数据库。
第二个方面,在本实施例中提供了一种车辆数据的清洗装置,包括:
第一获取模块,用于获取待处理车辆数据;
第一确定模块,用于确定所述待处理车辆数据所对应的车牌的地域信息,所述地域信息包括省份信息和城市信息;
第一校验模块,用于基于预设的地域归属关系,对所述地域信息中的省份信息和城市信息进行属地准确性校验;
第一处理模块,用于将属地准确性效验不通过的待处理车辆数据进行丢弃。
第三个方面,在本实施例中提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述的车辆数据的清洗方法。
第四个方面,在本实施例中提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一个方面所述的车辆数据的清洗方法。
与相关技术相比,在本实施例中提供的车辆数据的清洗方法、装置、电子装置和存储介质,通过获取待处理车辆数据;确定待处理车辆数据所对应的车牌的地域信息,地域信息包括省份信息和城市信息;基于预设的地域归属关系,对地域信息中的省份信息和城市信息进行属地准确性校验;将属地准确性效验不通过的待处理车辆数据进行丢弃的方式,解决了相关技术中车辆数据清洗准确率低的问题,提高了车辆数据清洗准确率。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本实施例的车辆数据的清洗方法的终端的硬件结构框图;
图2是本实施例的车辆数据的清洗方法的流程图;
图3是本实施例的车辆数据的清洗方法的优选流程图;
图4是本实施例的车辆数据的清洗装置的结构框图。
具体实施方式
为更清楚地理解本申请的目的、技术方案和优点,下面结合附图和实施例,对本申请进行了描述和说明。
除另作定义外,本申请所涉及的技术术语或者科学术语应具有本申请所属技术领域具备一般技能的人所理解的一般含义。在本申请中的“一”、“一个”、“一种”、“该”、“这些”等类似的词并不表示数量上的限制,它们可以是单数或者复数。在本申请中所涉及的术语“包括”、“包含”、“具有”及其任何变体,其目的是涵盖不排他的包含;例如,包含一系列步骤或模块(单元)的过程、方法和系统、产品或设备并未限定于列出的步骤或模块(单元),而可包括未列出的步骤或模块(单元),或者可包括这些过程、方法、产品或设备固有的其他步骤或模块(单元)。在本申请中所涉及的“连接”、“相连”、“耦接”等类似的词语并不限定于物理的或机械连接,而可以包括电气连接,无论是直接连接还是间接连接。在本申请中所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。通常情况下,字符“/”表示前后关联的对象是一种“或”的关系。在本申请中所涉及的术语“第一”、“第二”、“第三”等,只是对相似对象进行区分,并不代表针对对象的特定排序。
在本实施例中提供的方法实施例可以在终端、计算机或者类似的运算装置中执行。比如在终端上运行,图1是本实施例的车辆数据的清洗方法的终端的硬件结构框图。如图1所示,终端可以包括一个或多个(图1中仅示出一个) 处理器102和用于存储数据的存储器104,其中,处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置。上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述终端的结构造成限制。例如,终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示出的不同配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如在本实施例中的车辆数据的清洗方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络包括终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(NetworkInterface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频 (Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种车辆数据的清洗方法,图2是本实施例的车辆数据的清洗方法的流程图,如图2所示,该流程包括如下步骤:
步骤S201,获取待处理车辆数据。
在本步骤中,待处理车辆数据可以是实时获取的,也可以是从存储有待处理车辆数据的数据库中获取到的。
步骤S202,确定待处理车辆数据所对应的车牌的地域信息,地域信息包括省份信息和城市信息。
在本步骤中,每个车辆数据均有与之对应的车牌,通过提取车牌的车牌信息,来确定车牌的地域信息。
在一些实施例中,比如提取到车牌号为浙AXXXXX,则可以根据车牌信息中的浙确定该车牌为浙江省的车牌,根据A可以确定该车牌为浙江省杭州市的车牌,则该车牌的地域信息的省份信息为浙江省,其城市信息为杭州市。
步骤S203,基于预设的地域归属关系,对地域信息中的省份信息和城市信息进行属地准确性校验。
在本实施例中,由于车牌的第一位为省份的简称,由汉字表示,第二位为该省份下的城市,由大写字母A-Z表示,所以车牌号中的省份应符合省、直辖市的简称规则,如:浙、苏、沪、京等,第二位的城市应符合各省、直辖市的命名规则,如浙江省下的城市由A、B、C、D、E、F、G、H、J、K、L代表,如出现其他字母即为非法车牌,即判定为校验不通过。
步骤S204,将属地准确性效验不通过的待处理车辆数据进行丢弃。
在本步骤中,将属地准确性效验不通过的待处理车辆数据进行丢弃,可以是指直接对该车辆数据进行清洗,或者,移至到另一个备用数据库中以便于后续用户对不通过的车辆数据进行处理。
基于上述步骤S201至步骤S204,通过基于预设的地域归属关系,对地域信息中的省份信息和城市信息进行属地准确性校验,并将属地准确性效验不通过的待处理车辆数据进行丢弃的方式,避免了相关技术中因车牌信息识别错误而导致车辆清洗的存在误差的问题,解决了相关技术中车辆数据清洗准确率低的问题,提高了车辆数据清洗准确率。
在其中的一些实施例中,在基于预设的地域归属关系,对地域信息中的省份信息和城市信息进行属地准确性校验之后,还可以在对所述地域信息中的省份信息和城市信息进行属地准确性校验通过的情况下,对属地准确性效验通过的待处理车辆数据的车牌进行数字位数校验;将数字位数校验不通过的待处理车辆数据进行丢弃。
在本实施例中,在对所述地域信息中的省份信息和城市信息进行属地准确性校验通过的情况下,进一步的对属地准确性效验通过的待处理车辆数据的车牌进行数字位数校验,并将数字为校验不通过的待处理车辆数据进行丢弃的方式,可以在属地的基础上,再对数字位数校验,从而进一步的提高车辆数据的清洗准确率。
需要说明的是,可能有一些车辆的车牌为非法车牌,例如车牌信息中数字位数不达到预设位数,则需要对该类车辆数据也进行清楚。
在其中的一些实施例中,在确定待处理车辆数据所对应的车牌的地域信息之前,还可以确定待处理车辆数据所对应的车牌的长度信息;基于预设的长度标准,对车牌的长度信息进行长度准确性效验;在长度准确性效验的结果为通过的情况下,确定待处理车辆数据所对应的车牌的地域信息。
在本实施例中,在确定待处理车辆数据所对应的车牌的地域信息之前,通过对长度信息进行判定的方式,可以避免车辆数据中存在车牌长度不达标的车牌所对应的车辆。
需要说明的是,预设的长度标准,可以是根据相关规定中的长度来进行判定的,在一些实施例中,也可以根据用户设定的长度来判定。
在一些实施例中,在对长度信息进行判定的同时,也可以对车牌的进行空值判定,校验该车牌是否为空车牌,从而实现对空车牌的车辆数据的清洗。
在其中的一些实施例中,将长度准确性效验不通过的待处理车辆数据进行丢弃。
在本实施例中,通过将长度准确性校验不通过的待处理车辆数据进行丢弃的方式,实现了对长度不达标的车牌所对应的车辆数据的清洗,避免了长度不达标的车牌所对应的车辆数据对车辆数据的影响。
在其中的一些实施例中,确定待处理车辆数据所对应的车牌的地域信息包括:根据待处理车辆数据所对应的车牌,确定车牌的第一位汉字信息和车牌的第二位字母信息;根据第一位汉字信息,确定省份信息;根据省份信息和第二位字母信息,确定城市信息。
在本实施例中,由于车牌的第一位为省份的简称,由汉字表示,第二位为该省份下的城市,由大写字母A-Z表示,所以车牌号中的省份应符合省、直辖市的简称规则,如:浙、苏、沪、京等,第二位的城市应符合各省、直辖市的命名规则,如浙江省下的城市由A、B、C、D、E、F、G、H、J、K、L代表,如出现其他字母即为非法车牌,通过上述方式,以实现对车辆数据所对应的车牌的地域信息的校验。
在其中的一些实施例中,基于预设的地域归属关系,对地域信息中的省份信息和城市信息进行属地准确性校验包括:判断省份信息是否在预设省份信息内;在判断到省份信息在预设省份信息内的情况下,判断城市信息是否在省份信息的预设城市信息内;在判断到城市信息在省份信息的预设城市信息内的情况下,判定待处理车辆数据的归属地校验为通过。
在本实施例中,通过对省份和省份对应的城市进行双重校验的方式,避免了因环境原因而导致车辆数据对应的车牌识别错误,而导致后续车辆数据存在清洗错误的问题,提高了对车辆数据的进行清洗的准确性。
在其中的一些实施例中,在判断到省份信息不在预设省份信息内的情况下,或,在判断到城市信息不在省份信息的预设城市信息内的情况下,判定待处理车辆数据的归属地校验为不通过。
在本实施例中,在判断到省份信息不在预设省份信息内的情况下,或,在判断到城市信息不在省份信息的预设城市信息内的情况下,均判定为待处理车辆数据的归属地校验为不通过的方式,实现了对车辆数据对应的车牌的双重校验,提高了车辆数据对应的车牌的识别准确性。
在其中的一些实施例中,在判断到城市信息在省份信息的预设城市信息内的情况下,判定待处理车辆数据的归属地校验为通过之后,还可以根据预设的字符标准,对待处理车辆数据所对应的车牌进行字符校验;在对待处理车辆数据所对应的车牌进行字符校验不通过的情况下,将进行字符校验不通过的待处理车辆数据进行丢弃。
在本实施例中,还可以车辆数据对应的车牌的字符信息进行校验,并在对待处理车辆数据所对应的车牌进行字符校验不通过的情况下,将进行字符校验不通过的待处理车辆数据进行丢弃的方式,实现了对车牌的字符校验,进一步提高了对车辆数据清洗的准确性。
在相关技术中,识别到的车牌可能存在对应多种类型的车型问题,因此为了确定识别到的车牌与车型之间的关系,基于上述实施例之后,本申请实施例获取未丢弃的目标车辆数据;根据目标车辆数据的车牌,判断目标车辆数据的车牌所对应的车辆类型是否唯一;在判断到目标车辆数据的车牌所对应的车辆类型不唯一的情况下,检测历史车辆数据中是否存在目标车辆数据的车牌对应的历史车辆类型不唯一的历史信息;在检测到检测历史车辆数据中存在目标车辆数据的车牌对应的历史车辆类型不唯一的历史信息的情况下,将目标车辆数据所对应的车辆类型不唯一的历史信息存入数据库。
在本实施例中,通过在判断到目标车辆数据的车牌所对应的车辆类型不唯一的情况下,检测历史车辆数据中是否存在目标车辆数据的车牌对应的历史车辆类型不唯一的历史信息;在检测到检测历史车辆数据中存在目标车辆数据的车牌对应的历史车辆类型不唯一的历史信息的情况下,将目标车辆数据所对应的车辆类型不唯一的历史信息存入数据库的方式,来实现车辆数据中车型与车牌之间的关联,从而提高了车型与车牌之间的关联准确性。
在其中的一些实施例中,还可以在检测到历史车辆数据中存在目标车辆数据的车牌对应的历史车辆类型唯一的历史信息的情况下,获取预设天数内目标车辆数据对应的次数最多的目标车辆类型;将目标车辆类型与目标车辆数据进行关联并存入数据库。
在本实施例中,通过在检测到历史车辆数据中存在目标车辆数据对应的历史车辆类型唯一的历史信息的情况下,获取预设天数内目标车辆数据对应的次数最多的目标车辆类型;将目标车辆类型与目标车辆数据进行关联入库的方式,取抓拍识别次数最多的车牌号和车牌类型,作为正确的数据入库,以提高车牌与车牌类型的关联性。
下面通过优选实施例对本实施例进行描述和说明。
图3是本实施例的车辆数据的清洗方法的优选流程图一,如图3所示,该车辆数据的清洗方法包括如下步骤:
步骤S301,获取待处理车辆数据。
步骤S302,确定待处理车辆数据所对应的车牌的长度信息。
步骤S303,基于预设的长度标准,对车牌的长度信息进行长度准确性效验,在校验通过的情况下执行步骤S304,否则,执行步骤S309。
在本步骤中,可以是对于车牌号为空或车牌号长度小于7或大于8的车牌,判定为非法车牌号,该非法车牌即为需要丢弃。
步骤S304,确定待处理车辆数据所对应的车牌的地域信息,地域信息包括省份信息和城市信息。
步骤S305,基于预设的地域归属关系,对地域信息中的省份信息和城市信息进行属地准确性校验,在校验通过的情况下执行步骤S306,否则,执行步骤 S309。
步骤S306,对属地准确性效验通过的待处理车辆数据的车牌进行数字位数校验,在校验通过的情况下执行步骤S307,否则,执行步骤S309。
在本步骤中,在相关的车牌号的生成规则中,会至少包含3位数字,因此需要对车牌号中的数字进行计数,少于3位的车牌号判定为非法车牌。
步骤S307,根据预设的字符标准,对待处理车辆数据所对应的车牌进行字符校验,在校验通过的情况下执行步骤S307,否则,执行步骤S309。
在本步骤中,在一些识别出的车牌号中,偶尔会出现“#”、“$”等特殊符号,因此需要判断车牌号中是否会出现这类特殊符合,若出现则判定为非法车牌。
步骤S308,结束。
步骤S309,将待处理车辆数据进行丢弃。
基于上述步骤S301至步骤S309,充分考虑到了各个省、直辖市、自治区下的各个城市情况,针对车牌号第二位做了具体范围校验,避免相关技术中通过正则表达式校验的方式,只要车牌第二位的范围在A-Z即可,因此其识别的准确度低的问题,其次,本申请实施例还增加了车牌号中数字位数的校验以及特殊字符的校验,进一步增加了校验结果的精确性。
作为另一种可实施方式,本实施例提供的车辆数据的清洗方法包括如下步骤:
步骤S401,获取未丢弃的目标车辆数据。
步骤S402,根据目标车辆数据的车牌,判断目标车辆数据的车牌所对应的车辆类型是否唯一,若否,执行步骤S403,若是,执行步骤S407。
步骤S403,在判断到目标车辆数据的车牌所对应的车辆类型不唯一的情况下,检测历史车辆数据中是否存在目标车辆数据的车牌对应的历史车辆类型不唯一的历史信息,若是,执行步骤S404,若是,执行步骤S405。
步骤S404,在检测到检测历史车辆数据中存在目标车辆数据的车牌对应的历史车辆类型不唯一的历史信息的情况下,将目标车辆数据所对应的车辆类型不唯一的历史信息存入数据库。
步骤S405,在检测到历史车辆数据中存在目标车辆数据的车牌对应的历史车辆类型唯一的历史信息的情况下,获取预设天数内目标车辆数据对应的次数最多的目标车辆类型。
步骤S406,将目标车辆类型与目标车辆数据进行关联并存入数据库。
步骤S407,在判定目标车辆数据的车牌所对应的车辆类型唯一情况下,将目标车辆数据的车牌和车牌类型进行关联并存入数据库。
在本实施例中还提供了一种车辆数据的清洗装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。以下所使用的术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管在以下实施例中所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是本实施例的车辆数据的清洗装置的结构框图,如图4所示,该装置包括:
第一获取模块51,用于获取待处理车辆数据;
第一确定模块52,耦合至第一获取模块51,用于确定待处理车辆数据所对应的车牌的地域信息,地域信息包括省份信息和城市信息;
第一校验模块53,耦合至第一确定模块52,用于基于预设的地域归属关系,对地域信息中的省份信息和城市信息进行属地准确性校验;
第一处理模块54,耦合至第一校验模块53,用于将属地准确性效验不通过的待处理车辆数据进行丢弃。
在其中的一些实施例中,该装置还包括:第二校验模块,用于在对地域信息中的省份信息和城市信息进行属地准确性校验通过的情况下,对属地准确性效验通过的待处理车辆数据的车牌进行数字位数校验;第二处理模块,用于将数字位数校验不通过的待处理车辆数据进行丢弃。
在其中的一些实施例中,该装置还包括:第二确定模块,用于确定待处理车辆数据所对应的车牌的长度信息;第三校验模块,用于基于预设的长度标准,对车牌的长度信息进行长度准确性效验;第三确定模块,用于在长度准确性效验的结果为通过的情况下,确定待处理车辆数据所对应的车牌的地域信息。
在其中的一些实施例中,该装置还包括:第三处理模块,用于将长度准确性效验不通过的待处理车辆数据进行丢弃。
在其中的一些实施例中,第一确定模块52包括:第一确定单元,用于根据待处理车辆数据所对应的车牌,确定车牌的第一位汉字信息和车牌的第二位字母信息;第二确定单元,用于根据第一位汉字信息,确定省份信息;第三确定单元,用于根据省份信息和第二位字母信息,确定城市信息,其中,地域信息包括:省份信息和城市信息。
在其中的一些实施例中,第一校验模块53包括:第一判断单元,用于判断省份信息是否在预设省份信息内;第二判断单元,用于在判断到省份信息在预设省份信息内的情况下,判断城市信息是否在省份信息的预设城市信息内;第一判定单元,用于在判断到城市信息在省份信息的预设城市信息内的情况下,判定待处理车辆数据的归属地校验为通过。
在其中的一些实施例中,第一校验模块53还包括:第二判定单元,用于在判断到省份信息不在预设省份信息内的情况下,或,在判断到城市信息不在省份信息的预设城市信息内的情况下,判定待处理车辆数据的归属地校验为不通过。
在其中的一些实施例中,该装置还包括:第四校验模块,用于根据预设的字符标准,对待处理车辆数据所对应的车牌进行字符校验;第四处理模块,用于在对待处理车辆数据所对应的车牌进行字符校验不通过的情况下,将进行字符校验不通过的待处理车辆数据进行丢弃。
在其中的一些实施例中,该装置还包括:第二获取模块,用于获取未丢弃的目标车辆数据;第一判断模块,用于根据目标车辆数据的车牌,判断目标车辆数据的车牌所对应的车辆类型是否唯一;检测模块,用于在判断到目标车辆数据的车牌所对应的车辆类型不唯一的情况下,检测历史车辆数据中是否存在目标车辆数据的车牌对应的历史车辆类型不唯一的历史信息;第一缓存模块,用于在检测到检测历史车辆数据中存在目标车辆数据的车牌对应的历史车辆类型不唯一的历史信息的情况下,将目标车辆数据所对应的车辆类型不唯一的历史信息存入数据库。
在其中的一些实施例中,该装置还包括:第三获取模块,用于在检测到历史车辆数据中存在目标车辆数据的车牌对应的历史车辆类型唯一的历史信息的情况下,获取预设天数内目标车辆数据对应的次数最多的目标车辆类型;第二缓存模块,用于将目标车辆类型与目标车辆数据进行关联并存入数据库。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
在本实施例中还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
步骤S1,获取待处理车辆数据。
步骤S2,确定待处理车辆数据所对应的车牌的地域信息,地域信息包括省份信息和城市信息。
步骤S3,基于预设的地域归属关系,对地域信息中的省份信息和城市信息进行属地准确性校验。
步骤S4,将属地准确性效验不通过的待处理车辆数据进行丢弃。
需要说明的是,在本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,在本实施例中不再赘述。
此外,结合上述实施例中提供的车辆数据的清洗方法,在本实施例中还可以提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种车辆数据的清洗方法。
应该明白的是,这里描述的具体实施例只是用来解释这个应用,而不是用来对它进行限定。根据本申请提供的实施例,本领域普通技术人员在不进行创造性劳动的情况下得到的所有其它实施例,均属本申请保护范围。
显然,附图只是本申请的一些例子或实施例,对本领域的普通技术人员来说,也可以根据这些附图将本申请适用于其他类似情况,但无需付出创造性劳动。另外,可以理解的是,尽管在此开发过程中所做的工作可能是复杂和漫长的,但是,对于本领域的普通技术人员来说,根据本申请披露的技术内容进行的某些设计、制造或生产等更改仅是常规的技术手段,不应被视为本申请公开的内容不足。
“实施例”一词在本申请中指的是结合实施例描述的具体特征、结构或特性可以包括在本申请的至少一个实施例中。该短语出现在说明书中的各个位置并不一定意味着相同的实施例,也不意味着与其它实施例相互排斥而具有独立性或可供选择。本领域的普通技术人员能够清楚或隐含地理解的是,本申请中描述的实施例在没有冲突的情况下,可以与其它实施例结合。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对专利保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (13)
1.一种车辆数据的清洗方法,其特征在于,包括:
获取待处理车辆数据;
确定所述待处理车辆数据所对应的车牌的地域信息,所述地域信息包括省份信息和城市信息;
基于预设的地域归属关系,对所述地域信息中的省份信息和城市信息进行属地准确性校验;
将属地准确性效验不通过的待处理车辆数据进行丢弃。
2.根据权利要求1所述的车辆数据的清洗方法,其特征在于,在基于预设的地域归属关系,对所述地域信息中的省份信息和城市信息进行属地准确性校验之后,所述方法还包括:
在对所述地域信息中的省份信息和城市信息进行属地准确性校验通过的情况下,对属地准确性效验通过的待处理车辆数据的车牌进行数字位数校验;
将数字位数校验不通过的待处理车辆数据进行丢弃。
3.根据权利要求1所述的车辆数据的清洗方法,其特征在于,在确定所述待处理车辆数据所对应的车牌的地域信息之前,所述方法还包括:
确定所述待处理车辆数据所对应的车牌的长度信息;
基于预设的长度标准,对所述车牌的长度信息进行长度准确性效验;
在所述长度准确性效验的结果为通过的情况下,确定所述待处理车辆数据所对应的车牌的地域信息。
4.根据权利要求3所述的车辆数据的清洗方法,其特征在于,所述方法还包括:
将长度准确性效验不通过的待处理车辆数据进行丢弃。
5.根据权利要求1所述的车辆数据的清洗方法,其特征在于,确定所述待处理车辆数据所对应的车牌的地域信息包括:
根据所述待处理车辆数据所对应的车牌,确定所述车牌的第一位汉字信息和所述车牌的第二位字母信息;
根据所述第一位汉字信息,确定省份信息;
根据所述省份信息和所述第二位字母信息,确定城市信息。
6.根据权利要求1所述的车辆数据的清洗方法,其特征在于,基于预设的地域归属关系,对所述地域信息中的省份信息和城市信息进行属地准确性校验包括:
判断所述省份信息是否在预设省份信息内;
在判断到所述省份信息在预设省份信息内的情况下,判断所述城市信息是否在所述省份信息的预设城市信息内;
在判断到所述城市信息在所述省份信息的预设城市信息内的情况下,判定所述待处理车辆数据的归属地校验为通过。
7.根据权利要求6所述的车辆数据的清洗方法,其特征在于,在判断到所述省份信息不在预设省份信息内的情况下,或,在判断到所述城市信息不在所述省份信息的预设城市信息内的情况下,所述方法还包括:
判定所述待处理车辆数据的归属地校验为不通过。
8.根据权利要求6所述的车辆数据的清洗方法,其特征在于,在判断到所述城市信息在所述省份信息的预设城市信息内的情况下,判定所述待处理车辆数据的归属地校验为通过之后,所述方法还包括:
根据预设的字符标准,对所述待处理车辆数据所对应的车牌进行字符校验;
在对所述待处理车辆数据所对应的车牌进行字符校验不通过的情况下,将进行字符校验不通过的待处理车辆数据进行丢弃。
9.根据权利要求1至8任一项所述的车辆数据的清洗方法,其特征在于,所述方法还包括:
获取未丢弃的目标车辆数据;
根据所述目标车辆数据的车牌,判断所述目标车辆数据的车牌所对应的车辆类型是否唯一;
在判断到所述目标车辆数据的车牌所对应的车辆类型不唯一的情况下,检测历史车辆数据中是否存在所述目标车辆数据的车牌对应的历史车辆类型不唯一的历史信息;
在检测到检测历史车辆数据中存在所述目标车辆数据的车牌对应的历史车辆类型不唯一的历史信息的情况下,将所述目标车辆数据所对应的车辆类型不唯一的历史信息存入数据库。
10.根据权利要求9所述的车辆数据的清洗方法,其特征在于,所述方法还包括:
在检测到历史车辆数据中存在所述目标车辆数据的车牌对应的历史车辆类型唯一的历史信息的情况下,获取预设天数内所述目标车辆数据对应的次数最多的目标车辆类型;
将所述目标车辆类型与所述目标车辆数据进行关联并存入数据库。
11.一种车辆数据的清洗装置,其特征在于,包括:
第一获取模块,用于获取待处理车辆数据;
第一确定模块,用于确定所述待处理车辆数据所对应的车牌的地域信息,所述地域信息包括省份信息和城市信息;
第一校验模块,用于基于预设的地域归属关系,对所述地域信息中的省份信息和城市信息进行属地准确性校验;
第一处理模块,用于将属地准确性效验不通过的待处理车辆数据进行丢弃。
12.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至10中任一项所述的车辆数据的清洗方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的车辆数据的清洗方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210385226.2A CN115048365A (zh) | 2022-04-13 | 2022-04-13 | 车辆数据的清洗方法、装置、电子装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210385226.2A CN115048365A (zh) | 2022-04-13 | 2022-04-13 | 车辆数据的清洗方法、装置、电子装置和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115048365A true CN115048365A (zh) | 2022-09-13 |
Family
ID=83157094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210385226.2A Pending CN115048365A (zh) | 2022-04-13 | 2022-04-13 | 车辆数据的清洗方法、装置、电子装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115048365A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117312880A (zh) * | 2023-11-28 | 2023-12-29 | 交通运输部科学研究院 | 一种车辆基本信息数据的处理方法和装置 |
-
2022
- 2022-04-13 CN CN202210385226.2A patent/CN115048365A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117312880A (zh) * | 2023-11-28 | 2023-12-29 | 交通运输部科学研究院 | 一种车辆基本信息数据的处理方法和装置 |
CN117312880B (zh) * | 2023-11-28 | 2024-02-23 | 交通运输部科学研究院 | 一种车辆基本信息数据的处理方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108810116B (zh) | 消息处理方法及相关产品 | |
CN105760738B (zh) | 一种指纹解锁的方法及终端 | |
CN102279786B (zh) | 一种监测应用程序有效访问量的方法及装置 | |
CN110209660B (zh) | 欺诈团伙挖掘方法、装置及电子设备 | |
CN107992356A (zh) | 区块链事务区块处理方法、电子装置及可读存储介质 | |
CN108235303B (zh) | 识别共享流量用户的方法、装置、设备及介质 | |
CN115048365A (zh) | 车辆数据的清洗方法、装置、电子装置和存储介质 | |
CN113132416B (zh) | 一种数据包检测方法及装置 | |
CN110796060B (zh) | 高速行车路线确定方法、装置、设备和存储介质 | |
US11412063B2 (en) | Method and apparatus for setting mobile device identifier | |
CN108173714B (zh) | 公共出口ip地址的检测方法、检测装置和电子设备 | |
CN105205365A (zh) | 一种生物特征信息的注册和认证方法及装置 | |
CN108197050B (zh) | 一种设备识别方法、装置及系统 | |
CN113077018A (zh) | 一种目标对象识别方法、装置、存储介质及电子装置 | |
CN109041049A (zh) | 一种移动终端的寻址方法、寻址装置及终端设备 | |
CN108174379B (zh) | 基于支持向量机和阈值筛选的恶意用户识别方法及装置 | |
CN110532758B (zh) | 一种针对群组的风险识别方法及装置 | |
CN111340114A (zh) | 图像的匹配方法及装置、存储介质和电子装置 | |
CN110532561B (zh) | 数据检测方法及装置、存储介质、电子装置 | |
CN111338837B (zh) | 数据处理方法、装置、设备及介质 | |
CN113393265B (zh) | 过路对象的特征库建库方法、电子装置和存储介质 | |
CN113032234A (zh) | 设备异常代码的识别方法、系统及监测设备数量的方法 | |
CN109325496B (zh) | 基于字符去除的弹幕校验方法、装置、终端及存储介质 | |
CN106649427B (zh) | 一种信息识别的方法及装置 | |
CN114640715A (zh) | 数据处理方法、装置、设备及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |