CN111651979A - 一种车辆属性的纠错方法、装置、存储介质及终端 - Google Patents
一种车辆属性的纠错方法、装置、存储介质及终端 Download PDFInfo
- Publication number
- CN111651979A CN111651979A CN202010334009.1A CN202010334009A CN111651979A CN 111651979 A CN111651979 A CN 111651979A CN 202010334009 A CN202010334009 A CN 202010334009A CN 111651979 A CN111651979 A CN 111651979A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- attribute
- ratio
- static data
- attributes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种车辆属性的纠错方法、装置、存储介质及终端,所述方法包括:获取预先保存的车辆静态数据;基于所述车辆静态数据推断车辆属性,生成多个车辆属性;计算每个车辆属性的可信度占比,所述多个车辆属性的可信度占比之和为1;采用最优策略算法计算得到可信度占比最高的车辆属性;当所述可信度占比最高的车辆属性的可信度大于预设阈值时,将所述可信度占比最高的车辆属性作为纠错后的车辆属性。因此,采用本申请实施例,可以提高车辆属性的准确率。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种车辆属性的纠错方法、装置、存储介质及终端。
背景技术
随着经济的快速发展,车辆的数量每天都在快速增加,由于每个车辆都对应了各自的车辆数据,因此随着车辆的快速增加,车辆产生的静态数据也出现骤增趋势,在利用大数据技术对车辆产生的静态数据进行分析时,首先需要对车辆产生的静态数据进行预处理,比如各种纠错、清洗等操作(例:车辆品牌、车型等属性的纠错)。
在目前车辆属性的纠错方法中,首先根据车辆静态数据中的车辆品牌名称(文本)或者根据车辆识别码(VIN)码推断车辆品牌,然后通过车型型号名称(文本)或者汽车产品型号(GB9417-88)推断车辆型号进行车辆属性纠错。由于这种推断只依赖车辆中某个属性进行车辆属性推断后根据推断结果进行车辆属性纠错,当前这种推断方式维度过于单一,得到的推断结果对数据的纠错效果不够理想,从而降低了车辆属性的准确率。
发明内容
本申请实施例提供了一种车辆属性的纠错方法、装置、存储介质及终端。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
第一方面,本申请实施例提供了一种车辆属性的纠错方法,所述方法包括:
获取预先保存的车辆静态数据;
基于所述车辆静态数据推断车辆属性,生成多个车辆属性;
计算每个车辆属性的可信度占比,所述多个车辆属性的可信度占比之和为1;
采用最优策略算法计算得到可信度占比最高的车辆属性;
当所述可信度占比最高的车辆属性的可信度大于预设阈值时,将所述可信度占比最高的车辆属性作为纠错后的车辆属性。
可选的,在获取预先保存的车辆静态数据之前,还包括:
接收预先采集的车辆静态数据进行保存。
可选的,所述基于所述车辆静态数据推断车辆属性,生成多个车辆属性,包括:
获取车辆属性推测算法;
将所述车辆静态数据输入到所述车辆属性推测算法中,生成多个车辆属性。
可选的,所述计算每个车辆属性的可信度占比,包括:
获取可信度计算算法;
将所述车辆静态数据和所述多个车辆属性输入到所述可信度计算算法中,生成所述车辆属性集合中每个车辆属性的可信度占比。
可选的,所述将所述可信度占比最高的车辆属性作为纠错后的车辆属性,包括:
获取所述可信度占比最高的车辆属性在所述车辆静态数据中对应的属性;
当所述可信度占比最高的车辆属性和所述静态数据中对应的属性不一致时,将所述静态数据中对应的属性替换为所述可信度占比最高的车辆属性。
可选的,所述预先采集的车辆静态数据的采集方式包括人工录入和OCR识别。
可选的,所述可信度计算算法由校验数据的合法性部分和根据经验数据推断部分组成。
第二方面,本申请实施例提供了一种车辆属性的纠错装置,所述装置包括:
数据获取模块,用于获取预先保存的车辆静态数据;
属性生成模块,用于基于所述车辆静态数据推断车辆属性,生成多个车辆属性;
可信度占比计算模块,用于计算每个车辆属性的可信度占比,所述多个车辆属性的可信度占比之和为1;
属性得到模块,用于采用最优策略算法计算得到可信度占比最高的车辆属性;
属性纠错模块,用于当所述可信度占比最高的车辆属性的可信度大于预设阈值时,将所述可信度占比最高的车辆属性作为纠错后的车辆属性。
第三方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
第四方面,本申请实施例提供一种终端,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
本申请实施例提供的技术方案可以包括以下有益效果:
在本申请实施例中,用户终端首先获取预先保存的车辆静态数据,再基于车辆静态数据推断车辆属性,生成多个车辆属性,然后计算出每个车辆属性的可信度占比,其中多个车辆属性的可信度占比之和为1,再采用最优策略算法计算得到可信度占比最高的车辆属性,最后当可信度占比最高的车辆属性的可信度大于预设阈值时,将可信度占比最高的车辆属性作为纠错后的车辆属性。由于本申请通过组合车辆品牌名称(文本)、车型型号名称(文本)、车辆识别码(VIN)码、汽车产品型号(GB9417-88)以及根据真实数据制作的数据字典对车辆的品牌和车型进行各维度推断,根据推断结果对数据进行纠错,从而提高了车辆静态数据的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是本申请实施例提供的一种车辆属性的纠错方法的流程示意图;
图2是本申请实施例提供的一种车辆属性的纠错过程的过程示意图;
图3是本申请实施例提供的另一种车辆属性的纠错方法的流程示意图;
图4是本申请实施例提供的一种车辆属性的纠错装置的装置示意图;
图5是本申请实施例提供的一种终端的结构示意图。
具体实施方式
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
到目前为止,对于车辆属性的纠错,首先根据车辆静态数据中的车辆品牌名称(文本)或者根据车辆识别码(VIN)码推断车辆品牌,然后通过车型型号名称(文本)或者汽车产品型号(GB9417-88)推断车辆型号进行车辆属性纠错。由于这种推断只依赖车辆中某个属性进行车辆属性推断后根据推断结果进行车辆属性纠错,当前这种推断方式维度过于单一,得到的推断结果对数据的纠错效果不够理想,从而降低了车辆属性的准确率。为此,本申请提供了一种车辆属性的纠错方法、装置、存储介质及终端,以解决上述相关技术问题中存在的问题。本申请提供的技术方案中,由于本申请通过组合车辆品牌名称(文本)、车型型号名称(文本)、车辆识别码(VIN)码、汽车产品型号(GB9417-88)以及根据真实数据制作的数据字典对车辆的品牌和车型进行各维度推断,根据推断结果对数据进行纠错,从而提高了车辆静态数据的准确率,下面采用示例性的实施例进行详细说明。
下面将结合附图1-附图3,对本申请实施例提供的车辆属性的纠错方法进行详细介绍。该方法可依赖于计算机程序实现,可运行于基于冯诺依曼体系的车辆属性的纠错装置上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。其中,本申请实施例中的车辆属性的纠错装置可以为用户终端,包括但不限于:个人电脑、平板电脑、手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中用户终端可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,PDA)、5G网络或未来演进网络中的终端设备等。
请参见图1,为本申请实施例提供了一种车辆属性的纠错方法的流程示意图。如图1所示,本申请实施例的所述方法可以包括以下步骤:
S101,获取预先保存的车辆静态数据;
其中,车辆静态数据是由人工录入以及OCR识别车辆数据信息后进行保存的数据源,例如每个车辆对应的品牌名称(文本类型)、车型型号名称(文本类型)、车辆识别码(VIN)码、汽车产品型号等数据信息。
在一种可能的实现方式中,当对一辆目标重卡的静态数据进行预处理时,首先需要在预先保存的车辆静态数据中查询并提取出该重卡的车辆品牌名称(文本类型)、车型型号名称(文本)、车辆识别码(VIN)码、汽车产品型号。
具体的,对重卡的静态数据进行预处理(例如进行车辆各种属性纠错、清洗等操作),预处理结束后方便后续数据分析时使用。在目标重卡车辆预处理时,用户首先通过触发用户终端生成该重卡车辆的静态数据查询指令,该指令通过有线或者无线的方式发送至服务器进行该重卡车辆的静态数据查询,当服务器接收到该查询指令后,服务器根据该指令包含的信息查询该重卡车辆的静态数据,当该重卡的静态数据查询并获取后,服务器通过有线或者无线的方式发送至客户端进行展示。
S102,基于所述车辆静态数据推断车辆属性,生成多个车辆属性;
其中,车辆属性是每个车辆静态数据中包含的具体数据信息,例如某个车辆的品牌名称(文本)、某个车辆车型型号名称(文本)、某个车辆识别码(VIN)码、某个车辆的汽车产品型号等。
在本申请实施例中,用户终端首先根据步骤S101可得到目标重卡车辆对应的静态数据,该目标重卡车辆的静态数据中包含该目标重卡车辆的不同属性,例如品牌名称(文本)、该目标重卡的车型型号名称(文本)、该目标重卡的识别码(VIN码)、该目标重卡的汽车产品型号等,当接收到针对某个目标属性进行属性推断的指令后,用户终端将该属性输入指定的推断函数中进行属性推断,推断结束后生成该目标属性对应的若干个属性数据。
在一种可能的实现方式中,当用户终端根据该目标重卡车辆的静态数据中包含该目标重卡的品牌名称(文本)进行车辆属性推断时,用户终端将该目标重卡的品牌名称(文本)输入推断函数中进行推断,推断结束后生成若干个备选的品牌名称。
在另一种可能的实现方式中,当用户终端根据该目标重卡车辆的静态数据中包含该目标重卡的车型型号名称(文本)可进行车辆属性推断时,用户终端将该目标重卡的车型型号名称输入推断函数中进行推断,推断结束后生成若干个备选的车型型号名称。
在另一种可能的实现方式中,当用户终端根据该目标重卡车辆的静态数据中包含该目标重卡的该目标重卡的识别码(VIN码)进行车辆属性推断时,用户终端将该目标重卡的识别码输入推断函数中进行推断,推断结束后生成若干个备选的识别码(VIN码)。
S103,计算每个车辆属性的可信度占比,所述多个车辆属性的可信度占比之和为1;
其中,可信度是根据步骤S102生成的若干个备选属性进行计算,计算结束后生成的每个属性所占的不同可信度百分比。
在本申请实施例中,用户终端首先根据步骤S102可得到推断出的目标重卡车辆的若干个属性,然后将该若干个属性逐个输入到可信度算法中进行每个属性的可信度计算,计算结束后生成该若干个属性对应的可信度所占百分比。其中该若干个属性对应的可信度所占百分比相加之和为1。
在一种可能的实现方式中,根据目标重卡车辆静态数据中各属性字段的合法性或者格式等信息计算出几个备选品牌或车型的可信度。其中可信度算法由两部分组成,分别是校验数据的合法性和根据经验数据推断。在校验数据的合法性中,比如检验整个静态数据中的车辆属性字段是否完成,VIN长度是否合法,汽车产品型号是否符合国标等。在根据经验数据推断中,经验数据来源于多个方面,例如某个数据录入人会在特定文本的录入时出现固定的错误,比如大写字母I录成数字1,此类数据会影响可信度、例如某批车辆可能是同一车厂的车,此类数据可以通过多车关联来提升可信度。
S104,采用最优策略算法计算得到可信度占比最高的车辆属性;
其中,最优策略算法是根据车辆各属性制定策略和属性可信度占比进行计算得到可信度占比最高的属性的函数模型。
在本申请实施例中,用户终端基于步骤S103可得到该若干属性对应的不同可信度占比,用户终端然后采用最优策略算法对该若干属性对应的可信度和该若干属性制定策略进行计算,计算结束后生成一个可信度占比最高的车辆属性。当获取到可信度占比最高的车辆属性时,通过用户预先设定的外部调节参数(例如可信度阈值)进行比较,当该可信度占比最高的车辆属性大于设定的可信度阈值时,确定该可信度占比最高的车辆属性为可信的,通过该可信度占比最高的车辆属性对重卡的静态数据进行预处理(清洗或跳过),当该可信度占比最高的车辆属性和重卡的静态数据中对应的属性一致时,执行跳过操作,当该可信度占比最高的车辆属性和重卡的静态数据中对应的属性一致时,将该可信度占比最高的车辆属性替换掉重卡的静态数据中对应的属性。
在一种可能的实现方式中,当对某一辆目标重卡进行数据预处理时,例如目标重卡的静态数据D S为:吉H90828,黄色,重型自卸货车,红岩牌,CQ3316HXVG426L,LZFF31W65HD023519,220000,222400,222401,15740,提取需要的属性,品牌名称(文本):福田牌,汽车产品型号:CQ3316HXVG426L,车辆识别号:LZFF31W65HD023519,根据车辆识别号推断的品牌为:P1=福田牌;品牌名称(文本):P2=红岩牌;汽车产品型号推断品牌:P3=福田牌,计算三个备选品牌的可信度分别为T1=0.5,T2=0.2,T3=0.3,则可以计算出最终可信度为0.8(T1+T3),品牌为:福田牌设可信度阈值为0.8,则该纠错模型的计算结果为福田牌可以判断数据源中品牌名称是不可信的。
S105,当所述可信度占比最高的车辆属性的可信度大于预设阈值时,将所述可信度占比最高的车辆属性作为纠错后的车辆属性。
在一种可能的实现方式中,例如图2所示,图2是本申请实施例提供的车辆属性纠错模型的执行流程,首先在输入端包括由人工录入或者OCR识别的重卡静态数据DS和外部可调节参数(可信度阈值),在计算流程中当对某一辆重卡车辆进行属性纠错时,首先在重卡静态数据DS中查询并提取该目标重卡的静态数据,提取后输出的目标重卡静态数据,其中目标重卡静态数据中车辆属性包括车辆品牌名称、车辆识别码和汽车产品型号等数据,然后根据提取的目标重卡静态数据中的某个属性进行推断,推断结束后输出结果属性,分别为属性P1、属性P2和属性P3,再根据目标重卡静态数据和输出结果属性计算出各输出结果属性的可信度占比,分别为T1、T2和T3,再结合输出结果属性和属性的可信度占比进行计算,计算出可信度占比最高的车辆属性为(T,P),T为可信度占比,P为推测的属性,最后将可信度占比最高的车辆属性和预先设定的参数(可信度阈值)进行对比判断,当可信度占比最高的车辆属性大于等于可信度阈值时,输出纠错后的品牌。当可信度占比最高的车辆属性小于可信度阈值时,该记录品牌数据错误,建议跳过。
其中,车辆属性纠错模型计算过程包括:
输入:人工录入,OCR识别之后的重卡静态数据DS=数据源。使用函数FP推测品牌,P=推测的品牌:P1、P2、P3,(P1,P2,P3)=FP(DS)。使用函数FT计算可信度占比,T=可信度占比:T1、T2、T3(0<=T<=1,T1+T2+T3=1),(T1,T2,T3)=FT(DS,P1,P2,P3)。计算可信度比例和推测品牌的元组,根据外部设置的R=可信度比例阈值(0<=R<=1)来计算纠错后的品牌。纠错过程结束,可以将返回的品牌用于清洗该条记录或者跳过该记录。
在本申请实施例中,用户终端首先获取预先保存的车辆静态数据,再基于车辆静态数据推断车辆属性,生成多个车辆属性,然后计算出每个车辆属性的可信度占比,其中多个车辆属性的可信度占比之和为1,再采用最优策略算法计算得到可信度占比最高的车辆属性,最后当可信度占比最高的车辆属性的可信度大于预设阈值时,将可信度占比最高的车辆属性作为纠错后的车辆属性。由于本申请通过组合车辆品牌名称(文本)、车型型号名称(文本)、车辆识别码(VIN)码、汽车产品型号(GB9417-88)以及根据真实数据制作的数据字典对车辆的品牌和车型进行各维度推断,根据推断结果对数据进行纠错,从而提高了车辆静态数据的准确率。
请参见图3,为本申请实施例提供的一种车辆属性的纠错方法的流程示意图。本实施例以车辆属性的纠错方法应用于用户终端中来举例说明。该车辆属性的纠错方法可以包括以下步骤:
S201,接收预先采集的车辆静态数据进行保存;
S202,获取预先保存的车辆静态数据;
S203,获取车辆属性推测算法;
S204,将所述车辆静态数据输入到所述车辆属性推测算法中,生成多个车辆属性;
S205,获取可信度计算算法;
S206,将所述车辆静态数据和所述多个车辆属性输入到所述可信度计算算法中,生成每个车辆属性的可信度占比,所述多个车辆属性的可信度占比之和为1;
S207,采用最优策略算法计算得到可信度占比最高的车辆属性;
S208,获取所述可信度占比最高的车辆属性在所述车辆静态数据中对应的属性;
S209,当所述可信度占比最高的车辆属性和所述静态数据中对应的属性不一致时,将所述静态数据中对应的属性替换为所述可信度占比最高的车辆属性;
在本申请实施例中,用户终端首先获取预先保存的车辆静态数据,再基于车辆静态数据推断车辆属性,生成多个车辆属性,然后计算出每个车辆属性的可信度占比,其中多个车辆属性的可信度占比之和为1,再采用最优策略算法计算得到可信度占比最高的车辆属性,最后当可信度占比最高的车辆属性的可信度大于预设阈值时,将可信度占比最高的车辆属性作为纠错后的车辆属性。由于本申请通过组合车辆品牌名称(文本)、车型型号名称(文本)、车辆识别码(VIN)码、汽车产品型号(GB9417-88)以及根据真实数据制作的数据字典对车辆的品牌和车型进行各维度推断,根据推断结果对数据进行纠错,从而提高了车辆静态数据的准确率。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
请参见图4,其示出了本发明一个示例性实施例提供的车辆属性的纠错装置的结构示意图。该车辆属性的纠错装置可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。该装置1包括数据获取模块10、属性生成模块20、可信度占比计算模块30、属性得到模块40和属性纠错模块50。
数据获取模块10,用于获取预先保存的车辆静态数据;
属性生成模块20,用于基于所述车辆静态数据推断车辆属性,生成多个车辆属性;
可信度占比计算模块30,用于计算每个车辆属性的可信度占比,所述多个车辆属性的可信度占比之和为1;
属性得到模块40,用于采用最优策略算法计算得到可信度占比最高的车辆属性;
属性纠错模块50,用于当所述可信度占比最高的车辆属性的可信度大于预设阈值时,将所述可信度占比最高的车辆属性作为纠错后的车辆属性。
需要说明的是,上述实施例提供的车辆属性的纠错装置在执行车辆属性的纠错方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的车辆属性的纠错装置与车辆属性的纠错方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请实施例中,用户终端首先获取预先保存的车辆静态数据,再基于车辆静态数据推断车辆属性,生成多个车辆属性,然后计算出每个车辆属性的可信度占比,其中多个车辆属性的可信度占比之和为1,再采用最优策略算法计算得到可信度占比最高的车辆属性,最后当可信度占比最高的车辆属性的可信度大于预设阈值时,将可信度占比最高的车辆属性作为纠错后的车辆属性。由于本申请通过组合车辆品牌名称(文本)、车型型号名称(文本)、车辆识别码(VIN)码、汽车产品型号(GB9417-88)以及根据真实数据制作的数据字典对车辆的品牌和车型进行各维度推断,根据推断结果对数据进行纠错,从而提高了车辆静态数据的准确率。
本发明还提供一种计算机可读介质,其上存储有程序指令,该程序指令被处理器执行时实现上述各个方法实施例提供的车辆属性的纠错方法。
本发明还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各个方法实施例所述的车辆属性的纠错方法。
请参见图5,为本申请实施例提供了一种终端的结构示意图。如图5所示,所述终端1000可以包括:至少一个处理器1001,至少一个网络接口1004,用户接口1003,存储器1005,至少一个通信总线1002。
其中,通信总线1002用于实现这些组件之间的连接通信。
其中,用户接口1003可以包括显示屏(Display)、摄像头(Camera),可选用户接口1003还可以包括标准的有线接口、无线接口。
其中,网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器1001可以包括一个或者多个处理核心。处理器1001利用各种借口和线路连接整个电子设备1000内的各个部分,通过运行或执行存储在存储器1005内的指令、程序、代码集或指令集,以及调用存储在存储器1005内的数据,执行电子设备1000的各种功能和处理数据。可选的,处理器1001可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器1001可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1001中,单独通过一块芯片进行实现。
其中,存储器1005可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器1005包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1005可用于存储指令、程序、代码、代码集或指令集。存储器1005可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图5所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及车辆属性的纠错应用程序。
在图5所示的终端1000中,用户接口1003主要用于为用户提供输入的接口,获取用户输入的数据;而处理器1001可以用于调用存储器1005中存储的车辆属性的纠错应用程序,并具体执行以下操作:
获取预先保存的车辆静态数据;
基于所述车辆静态数据推断车辆属性,生成多个车辆属性;
计算每个车辆属性的可信度占比,所述多个车辆属性的可信度占比之和为1;
采用最优策略算法计算得到可信度占比最高的车辆属性;
当所述可信度占比最高的车辆属性的可信度大于预设阈值时,将所述可信度占比最高的车辆属性作为纠错后的车辆属性。
在一个实施例中,所述处理器1001在执行在获取预先保存的车辆静态数据之前时,还执行以下操作:
接收预先采集的车辆静态数据进行保存。
在一个实施例中,所述处理器1001在执行所述基于所述车辆静态数据推断车辆属性,生成多个车辆属性时,具体执行以下操作:
获取车辆属性推测算法;
将所述车辆静态数据输入到所述车辆属性推测算法中,生成多个车辆属性。
在一个实施例中,所述处理器1001在执行所述计算每个车辆属性的可信度占比时,具体执行以下操作:
获取可信度计算算法;
将所述车辆静态数据和所述多个车辆属性输入到所述可信度计算算法中,生成每个车辆属性的可信度占比。
在一个实施例中,所述处理器1001在执行所述将所述可信度占比最高的车辆属性作为纠错后的车辆属性时,具体执行以下操作:
获取所述可信度占比最高的车辆属性在所述车辆静态数据中对应的属性;
当所述可信度占比最高的车辆属性和所述静态数据中对应的属性不一致时,将所述静态数据中对应的属性替换为所述可信度占比最高的车辆属性。
在本申请实施例中,用户终端首先获取预先保存的车辆静态数据,再基于车辆静态数据推断车辆属性,生成多个车辆属性,然后计算出每个车辆属性的可信度占比,其中多个车辆属性的可信度占比之和为1,再采用最优策略算法计算得到可信度占比最高的车辆属性,最后当可信度占比最高的车辆属性的可信度大于预设阈值时,将可信度占比最高的车辆属性作为纠错后的车辆属性。由于本申请通过组合车辆品牌名称(文本)、车型型号名称(文本)、车辆识别码(VIN)码、汽车产品型号(GB9417-88)以及根据真实数据制作的数据字典对车辆的品牌和车型进行各维度推断,根据推断结果对数据进行纠错,从而提高了车辆静态数据的准确率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。
Claims (10)
1.一种车辆属性的纠错方法,其特征在于,所述方法包括:
获取预先保存的车辆静态数据;
基于所述车辆静态数据推断车辆属性,生成多个车辆属性;
计算每个车辆属性的可信度占比,所述多个车辆属性的可信度占比之和为1;
采用最优策略算法计算得到可信度占比最高的车辆属性;
当所述可信度占比最高的车辆属性的可信度大于预设阈值时,将所述可信度占比最高的车辆属性作为纠错后的车辆属性。
2.根据权利要求1所述的方法,其特征在于,在获取预先保存的车辆静态数据之前,还包括:
接收预先采集的车辆静态数据进行保存。
3.根据权利要求1所述的方法,其特征在于,所述基于所述车辆静态数据推断车辆属性,生成多个车辆属性,包括:
获取车辆属性推测算法;
将所述车辆静态数据输入到所述车辆属性推测算法中,生成多个车辆属性。
4.根据权利要求1所述的方法,其特征在于,所述计算每个车辆属性的可信度占比,包括:
获取可信度计算算法;
将所述车辆静态数据和所述多个车辆属性输入到所述可信度计算算法中,生成每个车辆属性的可信度占比。
5.根据权利要求3或4所述的方法,其特征在于,所述将所述可信度占比最高的车辆属性作为纠错后的车辆属性,包括:
获取所述可信度占比最高的车辆属性在所述车辆静态数据中对应的属性;
当所述可信度占比最高的车辆属性和所述静态数据中对应的属性不一致时,将所述静态数据中对应的属性替换为所述可信度占比最高的车辆属性。
6.根据权利要求2所述的方法,其特征在于,所述预先采集的车辆静态数据的采集方式包括人工录入和OCR识别。
7.根据权利要求4所述的方法,其特征在于,所述可信度计算算法由校验数据的合法性部分和根据经验数据推断部分组成。
8.一种车辆属性的纠错装置,其特征在于,所述装置包括:
数据获取模块,用于获取预先保存的车辆静态数据;
属性生成模块,用于基于所述车辆静态数据推断车辆属性,生成多个车辆属性;
可信度占比计算模块,用于计算每个车辆属性的可信度占比,所述多个车辆属性的可信度占比之和为1;
属性得到模块,用于采用最优策略算法计算得到可信度占比最高的车辆属性;
属性纠错模块,用于当所述可信度占比最高的车辆属性的可信度大于预设阈值时,将所述可信度占比最高的车辆属性作为纠错后的车辆属性。
9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~7任意一项的方法步骤。
10.一种终端,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~7任意一项的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010334009.1A CN111651979A (zh) | 2020-04-24 | 2020-04-24 | 一种车辆属性的纠错方法、装置、存储介质及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010334009.1A CN111651979A (zh) | 2020-04-24 | 2020-04-24 | 一种车辆属性的纠错方法、装置、存储介质及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111651979A true CN111651979A (zh) | 2020-09-11 |
Family
ID=72348497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010334009.1A Pending CN111651979A (zh) | 2020-04-24 | 2020-04-24 | 一种车辆属性的纠错方法、装置、存储介质及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111651979A (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147709A (zh) * | 2018-11-02 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 车辆属性模型的训练方法、装置、终端及存储介质 |
-
2020
- 2020-04-24 CN CN202010334009.1A patent/CN111651979A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147709A (zh) * | 2018-11-02 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 车辆属性模型的训练方法、装置、终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111858869B (zh) | 一种数据匹配方法、装置、电子设备和存储介质 | |
CN112434188B (zh) | 一种异构数据库的数据集成方法、装置及存储介质 | |
CN108021863B (zh) | 电子装置、基于图像的年龄分类方法及存储介质 | |
CN113362118B (zh) | 一种基于随机森林的用户用电行为分析方法及系统 | |
CN112712121A (zh) | 一种基于深度神经网络的图像识别模型训练方法、装置及存储介质 | |
CN111626346A (zh) | 数据分类方法、设备、存储介质及装置 | |
CN111161195A (zh) | 一种特征图处理方法、装置、存储介质及终端 | |
CN111598087A (zh) | 不规则文字的识别方法、装置、计算机设备及存储介质 | |
CN112990583A (zh) | 一种数据预测模型的入模特征确定方法及设备 | |
CN112347201B (zh) | 信息处理方法、信息处理装置及终端设备 | |
CN113792033A (zh) | 一种基于Spark的数据质量核查方法、装置、存储介质及终端 | |
CN107077617B (zh) | 指纹提取方法及装置 | |
CN113360300A (zh) | 接口调用链路生成方法、装置、设备及可读存储介质 | |
CN117874224A (zh) | 一种数据处理方法、装置、存储介质及电子设备 | |
CN112215276A (zh) | 一种对抗网络的训练方法、装置、电子设备和存储介质 | |
CN111651979A (zh) | 一种车辆属性的纠错方法、装置、存储介质及终端 | |
CN116168403A (zh) | 医疗数据分类模型训练方法、分类方法、装置及相关介质 | |
CN114490969A (zh) | 基于表格的问答方法、装置以及电子设备 | |
CN113903071A (zh) | 人脸识别方法、装置、电子设备和存储介质 | |
CN115700519A (zh) | 一种文本到图像的生成方法、装置、存储介质及终端 | |
CN112950167A (zh) | 设计服务匹配方法、装置、设备及存储介质 | |
CN113486086A (zh) | 一种基于特征工程的数据挖掘方法及系统 | |
CN113160942A (zh) | 影像数据质量评估方法、装置、终端设备及可读存储介质 | |
CN112527179A (zh) | 涂鸦图像识别方法、装置及终端设备 | |
CN110852083A (zh) | 一种短信模板的生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |