CN117114728A

CN117114728A - 一种车辆版型特征补充方法及装置

Info

Publication number: CN117114728A
Application number: CN202311048459.4A
Authority: CN
Inventors: 周策; 蓬蕾; 黄锡轩; 程博
Original assignee: Guangdong Piston Intelligence Technology Co ltd
Current assignee: Guangdong Piston Intelligence Technology Co ltd
Priority date: 2023-08-18
Filing date: 2023-08-18
Publication date: 2023-11-24
Anticipated expiration: 2043-08-18
Also published as: CN117114728B

Abstract

本发明涉及车辆技术领域，公开了一种车辆版型特征补充方法及装置。该方法对于缺失若干个第一特征的目标版型，若第一特征是配置，则对其匹配标准配置名称，再根据第一特征确定特征补充模型，在模型中搜索第一特征对应的第一取值无差别组，若能够搜索到则根据在第一取值无差别组中获取的第一特征取值对目标版型进行特征补充，若搜索不到则用特征补充模型生成的取值进行特征补充，当所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值时，完成特征补充，最后根据预设规则对补值后的版型数据进行检查，本发明可以提高补值结果的准确度和稳定性，增强车辆数据的完整性和可靠性，为车企提供更准确的市场分析和战略决策依据。

Description

一种车辆版型特征补充方法及装置

技术领域

本发明涉及车辆技术领域，特别是涉及一种车辆版型特征补充方法及装置。

背景技术

在车企出海过程中，了解当地市场销售的车型各版型的详细特征是洞察机会与风险、提高车企在国际市场中决策准确性和可靠性的基础。准确地补全汽车版型级别的特征在车企在出海过程中具有重要的意义。版型级别的特征是指版型的各种参数、配置等，它们直接影响着车型的市场竞争力、定位以及消费者的购买决策。然而，目前很多目标国的数据存在着车型的版型覆盖不全或者版型的特征数据不完整的问题。这一问题阻碍了车企全面了解国外车型的特点和优势，进而影响了其产品选择和市场策略。

目前对缺失信息的补充方法大致有两种，一种是将已有对象进行分类，对于缺失信息的对象，利用其与已有对象类的相似度作为权重，用已有对象类的特征进行补充，比如对网购账号的标签进行补充。但这种补充方法依赖于相似度的准确性，因此适合于同类对象较多且对象之间有频繁交互的情况，而版型特征是静态的信息，各版型之间没有互动，因此该方法不适用于补充版型特征；而且同一特征在不同版型之间存在一定的逻辑关系，所以仅基于相似度进行分类无法准确补充缺失特征。另一种信息补充方法是利用知识图谱或网络图谱，将缺失特征的对象节点确定为待定对象节点，利用图谱中与待定对象节点相连的一个或多个对象节点作为参考节点并利用它们的信息对待定对象节点的缺失特征进行补充。但这种信息补充方法依赖于图谱的完整性和准确性。对于版型数据而言，每年都会出现大量新版型，这些版型之间没有自然的关联和互动。因此，无法仅靠算法提取相邻节点和关系，并自动将其纳入图谱，因此需要依靠人工规则来构建图谱，这不仅需要大量的人力投入，而且可能受限于专家知识的局限性，导致图谱的完整性和准确性受到影响，从而影响特征补充的准确性。

发明内容

本发明提供了一种车辆版型特征补充方法及装置，可以提高补值结果的准确度和稳定性，增强车辆数据的完整性和可靠性。

为了解决上述技术问题，本发明提供了一种车辆版型特征补充方法，包括：

获取目标版型的所有版型数据，确定目标版型缺失的若干个第一特征；其中，所述第一特征包括第一配置和第一参数；所述版型数据包括目标版型中各特征的名称、描述文本和在各版型上的出现情况；

获取每个第一特征对应的特征补充模型；

将目标版型的所有版型数据依次输入至各特征补充模型，分别在各特征补充模型中搜索目标版型的各第一特征所处的第一取值无差别组，并获取各第一取值无差别组对应的第一特征取值，循环利用每个第一特征取值对所述目标版型进行特征补充，并更新所述目标版型的所有版型数据，直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值，完成目标版型的特征补充；其中，每个第一特征对应若干个取值无差别组；处于同一取值无差别组的所有版型的第一特征取值相同。

本发明对于缺失若干个第一特征的目标版型，分别根据缺失的若干个第一特征确定对应的特征补充模型，在特征补充模型中搜索第一特征对应的第一取值无差别组，第一取值无差别组中包括的版型与目标版型在第一特征上的取值相同，因此，获取第一取值无差别组对应的第一特征取值后可以根据获取的若干个第一特征取值对目标版型缺失的若干个第一特征进行特征补充，在完成特征补充后可以通过计算得出第一特征的置信度，当所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值时，完成特征补充；本发明通过车辆版型之间的相似性和逻辑性可以对车辆版型的缺失特征进行特征补充，提高补值结果的准确性以及数据的可靠性。

进一步地，所述获取每个第一特征对应的特征补充模型，具体为：

当第一特征为第一参数时，根据第一参数确定目标版型的第一参数对应的特征补充模型；

当第一特征为第一配置时，在预设的多模态匹配模型中匹配第一配置的标准名称，并根据第一配置的标准名称确定目标版型的第一配置对应的特征补充模型，具体为：

获取第一配置的名称、描述文本和标准配置名称库；

分别根据第一配置的名称和描述文本生成第一名称向量和第一内容向量；

根据所述第一名称向量和所述第一内容向量，计算所述第一配置与所述标准配置名称库中每个标准配置之间的名称相关系数和内容相关系数；

计算所述第一配置与标准配置名称库中每个标准配置之间的取值相似度；

根据所述第一配置与标准配置名称库中每个标准配置之间的名称相关系数、内容相关系数和取值相似度，得出所述第一配置与每个标准配置的配对概率；

将配对概率最大且大于预设的概率阈值的标准配置的名称确定为第一配置的标准名称。

本发明的第一特征包括第一配置和第一参数，由于同一个配置在不同的车企或者国家存在不同的名称，因此需要将第一配置匹配到标准名称，再根据标准名称确定特征补充模型，而第一参数都是统一命名的，因此可以直接根据第一参数确定特征补充模型；利用预设的多模态匹配模型对各配置匹配标准名称，是将根据第一配置的配置信息生成第一名称向量和第一内容向量，根据这两个向量计算出第一配置与标准配置名称库中每个标准配置之间的名称相关系数和内容相关系数，再计算第一配置与标准配置名称库中每个标准配置之间的取值相似度，可以根据计算得出的名称相关系数、内容相关系数和取值相似度得出第一配置与每个标准配置的配对概率，在大于概率阈值的配对概率中确定配对概率最大的标准配置对应的名称为第一配置的标准名称；本发明利用多模态匹配模型对配置匹配标准名称，可以增加数据稠密性，从而提高补值准确性。

进一步地，所述计算所述第一配置与标准配置名称库中每个标准配置之间的取值相似度，具体为：

计算第一配置与标准配置名称库中每个标准配置之间的值域相似度，具体为：

判断第一配置和标准配置的值域类型；其中，所述值域类型包括离散型和数值型；

当第一配置和标准配置的值域类型不同时，第一配置与标准配置的值域相似度为0；

当第一配置和标准配置的值域类型相同时，第一配置与标准配置的值域相似度为第一配置和标准配置的值域交集除以第一配置和标准配置的值域并集的结果；

当第一配置与标准配置的值域相似度为0时，第一配置与标准配置之间的取值相似度为0；

当第一配置与标准配置的值域相似度不为0时，获取包含第一配置和标准配置的第一版型，根据第一版型上的第一配置取值和标准配置取值，计算第一配置与标准配置之间的取值相似度。

进一步地，取值无差别组，具体为：

在预设数据库中获取若干个特征以及每个特征的相关特征；其中，所述相关特征包括生产国、销售国、品牌、车型、版型、改款时间和车身形式；

采用特征选择技术识别出每个特征的值域影响相关特征；

将每个特征的所有值域影响相关特征的值域进行叉乘，形成每个特征对应的若干个最细粒度分组；

分别获取每个特征所有最细粒度分组对应的特征值；

将特征值相同且满足预设约束条件的最细粒度分组聚合成每个特征的取值无差别组。

本发明对于每个特征，可以在预设数据库中获取该特征的所有相关特征，采用特征选择技术得出影响该特征值域的相关特征，将影响该特征值域的所有相关特征的值域进行叉乘可以得出该特征对应的若干个最细粒度分组，在约束条件下将特征值相同的最细粒度分组进行聚合，可以得到该特征的若干个取值无差别组；本发明通过确定每个特征的值域影响相关特征，可以得到每个特征的最细粒度分组，能囊括每个特征的每个取值，为后续的特征补充过程奠定了基础。

进一步地，所述循环利用每个第一特征取值对所述目标版型进行特征补充，并更新所述目标版型的所有版型数据，直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值，具体为：

利用每个第一特征取值对所述目标版型进行特征补充，得到更新后的目标版型的所有版型数据和每个第一特征的置信度；

比较每个第一特征的置信度和预设的第一阈值的大小；

确定置信度大于第一阈值的第一特征完成特征补充，并循环将更新后的目标版型的所有版型数据依次输入至置信度小于第一阈值的第一特征对应的特征补充模型，直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值。

本发明对于目标版型缺失的若干个第一特征，利用若干个第一特征对应的特征补充模型进行独立补值，判断补值后的第一特征的置信度是否大于预设的第一阈值，若大于，则该特征完成特征补充，根据补值后的所有第一特征更新目标版型的版型数据，对置信度不大于第一阈值的第一特征使用特征补充模型进行循环补值并迭代至所有第一特征的置信度都大于第一阈值或循环次数大于预设的第二阈值时，结束循环，完成目标版型的特征补充；本发明先对每个第一特征进行独立补值，再采用迭代循环的方式对目标版型进行特征补充，可以提高补值结果的正确性。

进一步地，所述特征补充模型，具体为：

根据目标特征的数据类型选择训练模型；其中，所述数据类型包括连续型和离散型；

将若干个取值无差别组、若干个版型的所有版型数据和版型间关系数据合并为训练数据集；

按照预设比例将所述训练数据集划分成训练集、验证集和测试集；

随机将若干个版型中的目标特征设置为缺失，训练所述训练模型对缺失目标特征的版型进行特征补充，并采用带有正则条件的损失函数优化所述训练模型；

将训练完成的训练模型确定为目标特征的特征补充模型。

进一步地，所述分别在各特征补充模型中搜索目标版型的各第一特征所处的第一取值无差别组，还包括：

当特征补充模型中不存在目标版型的第一特征所处的第一取值无差别组时，利用第一特征的在各版型上的出现情况和第一特征在各版型上的关系数据，对所述目标版型进行特征补充。

本发明目标版型缺失的第一特征会出现在特征补充模型中搜索不到取值无差别组的情况，此时需要利用模型输入中的第一特征的在各版型上的出现情况，和第一特征在各版型上的关系数据，对所述目标版型进行特征补充，以保证在没有取值无差别组的情况下也能利用特征补充模型对目标版型进行补值。

进一步地，在所述完成目标版型的特征补充后，还包括：

利用预设规则对目标版型的补充特征进行检测；

当检测出所述目标版型的补充特征中存在异常的特征值时，形成异常信号，并将所述异常信号推送至前端服务器。

本发明在完成目标版型的特征补充后，利用预设规则对目标版型的补充特征进行检测，若检测出存在异常的特征值，会形成异常信号，并将其推送至前端服务器，以使相关人员对异常的特征值进行进一步检查和修改，提高补值结果的准确性和数据可靠性。

本发明提供了一种车辆版型特征补充方法，对于缺失若干个第一特征的目标版型，若第一特征是配置，则对第一特征进行标准配置名称匹配，再根据第一特征确定对应的特征补充模型，在特征补充模型中搜索第一特征对应的第一取值无差别组，若能够搜索到则根据在第一取值无差别组中获取的第一特征取值对目标版型进行特征补充，若搜索不到则用特征补充模型生成的取值进行特征补充，当所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值时，完成特征补充，最后根据预设规则对补值后的版型数据进行检查。本发明可以通过车辆版型之间的相似性和逻辑性实现对车辆版型的缺失特征进行特征补充，提高补值结果的准确性以及数据的可靠性，为车企提供更准确的市场分析和战略决策依据。

相应的，本发明提供了一种车辆版型特征补充装置，包括：确定模块、获取模块和特征补充模块；

所述确定模块用于获取目标版型的所有版型数据，确定目标版型缺失的若干个第一特征；其中，所述第一特征包括第一配置和第一参数；所述版型数据包括目标版型中各特征的名称、描述文本和在各版型上的出现情况；

所述获取模块用于获取每个第一特征对应的特征补充模型；

所述特征补充模块用于将目标版型的所有版型数据依次输入至各特征补充模型，分别在各特征补充模型中搜索目标版型的各第一特征所处的第一取值无差别组，并获取各第一取值无差别组对应的第一特征取值，循环利用每个第一特征取值对所述目标版型进行特征补充，并更新所述目标版型的所有版型数据，直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值，完成目标版型的特征补充；其中，每个第一特征对应若干个取值无差别组；处于同一取值无差别组的所有版型的第一特征取值相同。

进一步地，所述获取模块，包括：第一确定单元和第二确定单元；

所述第一确定单元用于当第一特征为第一参数时，根据第一参数确定目标版型的第一参数对应的特征补充模型；

所述第二确定单元用于当第一特征为第一配置时，在预设的多模态匹配模型中匹配第一配置的标准名称，并根据第一配置的标准名称确定目标版型的第一配置对应的特征补充模型，具体为：

获取第一配置的名称、描述文本和标准配置名称库；

本发明提供了一种车辆版型特征补充装置，以模块间的有机结合为基础，提高了补值结果的准确度和稳定性，也增强了车辆数据的完整性和可靠性。

附图说明

图1为本发明提供的车辆版型特征补充方法的一种实施例的流程示意图；

图2为本发明提供的车辆版型特征补充装置的一种实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，应当理解的是，本发明中采用术语如下：

1.“车型”：车企对具有同类型、品牌、车身形式、种类及系列的车辆所给予的名称。

2.“年款”：车企为了保持产品竞争力进行细节升级推出的年度小改款。

3.“配置”：汽车上配备的基于一定的软硬件组合而实现的功能或设施(例如自适应巡航、矩阵大灯等)。

4.“参数”：用于描述汽车物理特征、性能、规格等方面的各种指标、数值或属性(例如长、宽、高、排量等)。

5.“版型”：车企为同一车型及年款下不同配置和动力总成的组合所起的名称。

6.“特征”：包括每个版型对应的参数和配置。其中，每一个字段都被称为一个特征，比如车长、排量、天窗都是不同的特征。

实施例1

参见图1，是本发明提供的车辆版型特征补充方法的一种实施例的流程示意图，该方法包括步骤101至步骤103，各步骤具体如下：

步骤101：获取目标版型的所有版型数据，确定目标版型缺失的若干个第一特征；其中，所述第一特征包括第一配置和第一参数；所述版型数据包括目标版型中各特征的名称、描述文本和在各版型上的出现情况。

在本发明第一实施例中，目标版型的所有版型数据包括目标版型的车型、年款、国别、版型以及相关版型数据，相关版型数据包括版型上市时间、长宽高等物理参数、续航里程等在某种规则下的测量参数、各类配置信息等。

步骤102：获取每个第一特征对应的特征补充模型。

进一步地，在本发明第一实施例中，获取每个第一特征对应的特征补充模型，具体为：

获取第一配置的名称、描述文本和标准配置名称库；

在本发明第一实施例中，第一特征包括第一配置和第一参数，由于同一个配置存在不同的名称，因此需要将第一配置匹配到标准名称，再根据标准名称确定特征补充模型，而第一参数都是统一命名的，因此可以直接根据第一参数确定特征补充模型；本发明在根据配置选取特征补充模型时，对配置匹配标准名称，可以增加数据稠密度，从而提高准确性。

在本发明第一实施例中，标准配置名称库包括各标准配置的名称、描述文本以及标准配置在各版型上的取值等信息。采用汽车BERT模型可以根据第一配置的名称生成第一名称向量，根据第一配置的描述文本生成第一内容向量；分别计算第一配置的第一名称向量和第一内容向量与每个标准配置的名称向量和内容向量之间的相关性，得出名称相关系数和内容相关系数；再计算第一配置与标准配置名称库中每个标准配置之间的取值相似度，可以根据计算得出的名称相关系数、内容相关系数和取值相似度得出第一配置与每个标准配置的配对概率，在大于概率阈值的配对概率中确定配对概率最大的标准配置对应的名称为第一配置的标准名称。

进一步地，在本发明第一实施例中，所述计算所述第一配置与标准配置名称库中每个标准配置之间的取值相似度，具体为：

在本发明第一实施例中，先计算第一配置与标准配置之间的值域相似度，可以加快第一配置与标准配置之间的取值相似度的计算进程。计算第一配置和标准配置值域相似度先确定这两个配置的值域类型是否相同，若不同，则两个配置的值域相似度为0，若相同，则分别计算第一配置和标准配置的值域交集，以及第一配置和标准配置的值域并集，将值域交集除以值域并集即可得出第一配置和标准配置的值域相似度。当值域相似度为0时，直接确定第一配置与标准配置之间的取值相似度为0，当值域相似度不为0时，获取同时包含第一配置和标准配置的第一版型，并根据第一版型上的第一配置取值和标准配置取值可以计算出第一配置与标准配置之间的取值相似度。

作为本发明第一实施例的一种举例，假设配置A的值域是(0,1,2)，配置B的值域是(18，19)，则配置A和配置B的值域相似度为0。假设配置A的值域是(0,1,2)，配置C的值域是(0,1,6,7,8)，则配置A和配置C的值域相似度为2/6＝33％。假设配置E的值域是200-800的连续数值(比如续航里程)，配置F的值域是100-1000，则配置E和配置F的值域相似度＝600/900＝66％。

作为本发明第一实施例的一种举例，假设第一配置和标准配置a同时存在版型1上(版型1为不同地域的同一版型)，则分别获取第一配置在版型1上的取值，和标准配置a在版型1上的取值，再根据这两个取值计算第一配置和标准配置a的取值相似度。

作为本发明第一实施例的一种举例，多模态匹配模型的训练过程为：

可以采用决策树、神经网络或逻辑回归等算法建立匹配模型；

例如用逻辑回归，输入自变量为

因变量为

选用损失函数训练模型参数并优化模型，比如

其中，是版型i和标准版型j的名称相关系数；/>是版型i和标准版型j的内容相关系数；/>是版型i和标准版型j的取值相似度；/> 是连接函数，λ*||β||是正则项以避免过度拟合。

步骤103：将目标版型的所有版型数据依次输入至各特征补充模型，分别在各特征补充模型中搜索目标版型的各第一特征所处的第一取值无差别组，并获取各第一取值无差别组对应的第一特征取值，循环利用每个第一特征取值对所述目标版型进行特征补充，并更新所述目标版型的所有版型数据，直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值，完成目标版型的特征补充；其中，每个第一特征对应若干个取值无差别组；处于同一取值无差别组的所有版型的第一特征取值相同。

进一步地，在本发明第一实施例中，所述取值无差别组，具体为：

采用特征选择技术识别出每个特征的值域影响相关特征；

分别获取每个特征所有最细粒度分组对应的特征值；

在本发明第一实施例中，对于每个特征，在预设数据库中获取该特征的所有相关特征并识别出对该特征的值域影响的相关特征，(其中，识别值域影响相关特征的方法包括但不仅限于方差分析、假设检验、基于树的特征选择、递归特征消除、受限独立性测试等特征选择方法)，将每个特征的所有对其值域有影响的相关特征的值域进行叉乘，得出该特征对应的若干个最细粒度分组，利用无监督聚类将特征值相同的最细粒度分组在约束条件下进行聚合，可以得到该特征的若干个取值无差别组；本发明通过确定每个特征的值域影响相关特征，可以得到每个特征的最细粒度分组，能囊括每个特征的每个取值，为后续的特征补充过程奠定了基础。

作为本发明第一实施例的一种举例，假设“续航里程”这个特征的值域影响相关特征是“销售国”和“车型”，则续航里程的最细粒度分组为销售国*车型，续航里程可以包括泰国*宝马i x3，越南*宝马i x3，印尼*宝马i x3，中国*宝马i x3；假设泰国*宝马i x3和越南*宝马i x3的续航里程取值为500公里，印尼*宝马i x3和中国*宝马i x3的续航里程取值为400公里，则泰国*宝马i x3和越南*宝马i x3聚合成一个续航里程的取值无差别组，印尼*宝马i x3和中国*宝马i x3聚合成一个续航里程的另一个取值无差别组。

进一步地，在本发明第一实施例中，所述循环利用每个第一特征取值对所述目标版型进行特征补充，并更新所述目标版型的所有版型数据，直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值，具体为：

比较每个第一特征的置信度和预设的第一阈值的大小；

在本发明第一实施例中，目标版型缺失若干个第一特征，对目标版型进行特征补充时，需要对每个第一特征进行补值，因此获取每个第一特征对应的特征补充模型，依次将目标版型的所有版型数据输入至这些特征补充模型中，以使特征补充模型根据第一取值无差别组中的第一特征取值对第一特征进行补值。在每个第一特征都完成第一次补值后，比较每个第一特征的置信度和预设的第一阈值的大小，对于置信度大于第一阈值的第一特征，可以确定当前的第一特征取值为最后的补值结果；而置信度不大于第一阈值的第一特征需要进行下一次补值，而且需要根据第一次的补值结果更新目标版型的所有版型数据，将更新后的版型数据再次输入至特征补充模型对第一特征进行补值，直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值，结束循环，完成目标版型的特征补充。

进一步地，在本发明第一实施例中，所述特征补充模型，具体为：

将训练完成的训练模型确定为目标特征的特征补充模型。

作为本发明第一实施例的一种举例，对于连续型的特征(比如车长)选择解决回归问题的模型作为训练模型，对于离散型特征(比如巡航类型)选择能解决分类问题的模型作为训练模型；获取取值无差别组数据、若干个版型的所有版型数据和版型间关系数据，将其合并成训练数据集，按照6：2：2的比例将训练数据集分成训练集、验证集和测试集对模型进行训练；随机将目标特征设置为缺失，缺失率设置为50％以上以增加模型稳定性；选择带有正则条件的损失函数以增加模型稳健性，训练该模型进行特征补充，将训练完成后的模型确定为特征补充模型，特征补充模型建立了各版型各特征之间的关系，特征补充模型可以根据目标版型的版型数据给出缺失特征最可能的取值。

进一步地，在本发明第一实施例中，所述分别在各特征补充模型中搜索目标版型的各第一特征所处的第一取值无差别组，还包括：

在本发明第一实施例中，目标版型缺失的第一特征会出现在特征补充模型中搜索不到取值无差别组的情况，此时需要利用模型输入中的第一特征的在各版型上的出现情况，和第一特征在各版型上的关系数据，对所述目标版型进行特征补充，以保证在没有取值无差别组的情况下也能利用特征补充模型对目标版型进行补值。

进一步地，在本发明第一实施例中，在所述完成目标版型的特征补充后，还包括：

利用预设规则对目标版型的补充特征进行检测；

在本发明第一实施例中，利用预设规则和算法可以对补充完特征的数据进行结果检查，根据补值的置信度和规则识别出不合理的补值，并将检查结果推送到前端以使相关人员进行人工检查与修改。其中，经过人工纠错后的数据可以在特征补充模型的训练过程中作为训练数据输入，以更新特征补充模型，使其不断迭代以达到更好的效果。

综上，本发明第一实施例提供了一种车辆版型特征补充方法，对于缺失若干个第一特征的目标版型，若第一特征是配置，则对第一特征进行标准配置名称匹配，再根据第一特征确定对应的特征补充模型，在特征补充模型中搜索第一特征对应的第一取值无差别组，若能够搜索到则根据在第一取值无差别组中获取的第一特征取值对目标版型进行特征补充，若搜索不到则用特征补充模型生成的取值进行特征补充，当所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值时，完成特征补充，最后根据预设规则对补值后的版型数据进行检查。本发明可以通过车辆版型之间的相似性和逻辑性可以对车辆版型的缺失特征进行特征补充，提高补值结果的准确性以及数据的可靠性，为车企提供更准确的市场分析和战略决策依据。

实施例2

参见图2，是本发明提供的车辆版型特征补充装置的一种实施例的结构示意图，该装置包括确定模块201、获取模块202和特征补充模块203；

确定模块201用于获取目标版型的所有版型数据，确定目标版型缺失的若干个第一特征；其中，所述第一特征包括第一配置和第一参数；所述版型数据包括目标版型中各特征的名称、描述文本和在各版型上的出现情况；

获取模块202用于获取每个第一特征对应的特征补充模型；

特征补充模块203用于将目标版型的所有版型数据依次输入至各特征补充模型，分别在各特征补充模型中搜索目标版型的各第一特征所处的第一取值无差别组，并获取各第一取值无差别组对应的第一特征取值，循环利用每个第一特征取值对所述目标版型进行特征补充，并更新所述目标版型的所有版型数据，直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值，完成目标版型的特征补充；其中，每个第一特征对应若干个取值无差别组；处于同一取值无差别组的所有版型的第一特征取值相同。

进一步地，在本发明第二实施例中，获取模块202，包括：第一确定单元和第二确定单元；

获取第一配置的名称、描述文本和标准配置名称库；

进一步地，在本发明第二实施例中，计算所述第一配置与标准配置名称库中每个标准配置之间的取值相似度，具体为：

进一步地，在本发明第二实施例中，取值无差别组，具体为：

采用特征选择技术识别出每个特征的值域影响相关特征；

分别获取每个特征所有最细粒度分组对应的特征值；

进一步地，在本发明第二实施例中，特征补充模块203，包括：第一补值单元、比较单元和循环单元；

第一补值单元用于利用每个第一特征取值对所述目标版型进行特征补充，得到更新后的目标版型的所有版型数据和每个第一特征的置信度；

比较单元用于每个第一特征的置信度和预设的第一阈值的大小；

循环单元用于确定置信度大于第一阈值的第一特征完成特征补充，并循环将更新后的目标版型的所有版型数据依次输入至置信度小于第一阈值的第一特征对应的特征补充模型，直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值。

进一步地，在本发明第二实施例中，特征补充模型，具体为：

将训练完成的训练模型确定为目标特征的特征补充模型。

进一步地，在本发明第二实施例中，还包括特征补充模块，还包括第二补值单元；

第二补值单元用于当特征补充模型中不存在目标版型的第一特征所处的第一取值无差别组时，利用第一特征的在各版型上的出现情况和第一特征在各版型上的关系数据，对所述目标版型进行特征补充。

进一步地，在本发明第二实施例中，还包括检测模块，包括检测单元和推送单元；

检测单元用于利用预设规则对目标版型的补充特征进行检测；

推送单元用于当检测出所述目标版型的补充特征中存在异常的特征值时，形成异常信号，并将所述异常信号推送至前端服务器。

综上，本发明第二实施例提供了一种车辆版型特征补充装置，以模块间的有机结合为基础，对于缺失若干个第一特征的目标版型，若第一特征是配置，则对第一特征进行标准配置名称匹配，再根据第一特征确定对应的特征补充模型，在特征补充模型中搜索第一特征对应的第一取值无差别组，若能够搜索到则根据在第一取值无差别组中获取的第一特征取值对目标版型进行特征补充，若搜索不到则用特征补充模型生成的取值进行特征补充，当所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值时，完成特征补充，最后根据预设规则对补值后的版型数据进行检查。本发明可以通过车辆版型之间的相似性和逻辑性可以对车辆版型的缺失特征进行特征补充，提高补值结果的准确性以及数据的可靠性，为车企提供更准确的市场分析和战略决策依据。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步的详细说明，应当理解，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围。特别指出，对于本领域技术人员来说，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种车辆版型特征补充方法，其特征在于，包括：

获取每个第一特征对应的特征补充模型；

2.根据权利要求1所述的车辆版型特征补充方法，其特征在于，所述获取每个第一特征对应的特征补充模型，具体为：

获取第一配置的名称、描述文本和标准配置名称库；

3.根据权利要求2所述的车辆版型特征补充方法，其特征在于，所述计算所述第一配置与标准配置名称库中每个标准配置之间的取值相似度，具体为：

4.根据权利要求1所述的车辆版型特征补充方法，其特征在于，所述取值无差别组，具体为：

采用特征选择技术识别出每个特征的值域影响相关特征；

分别获取每个特征所有最细粒度分组对应的特征值；

5.根据权利要求1所述的车辆版型特征补充方法，其特征在于，所述循环利用每个第一特征取值对所述目标版型进行特征补充，并更新所述目标版型的所有版型数据，直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值，具体为：

比较每个第一特征的置信度和预设的第一阈值的大小；

6.根据权利要求1所述的车辆版型特征补充方法，其特征在于，所述特征补充模型，具体为：

将训练完成的训练模型确定为目标特征的特征补充模型。

7.根据权利要求1所述的车辆版型特征补充方法，其特征在于，所述分别在各特征补充模型中搜索目标版型的各第一特征所处的第一取值无差别组，还包括：

8.根据权利要求1所述的车辆版型特征补充方法，其特征在于，在所述完成目标版型的特征补充后，还包括：

利用预设规则对目标版型的补充特征进行检测；

9.一种车辆版型特征补充装置，其特征在于，包括：确定模块、获取模块和特征补充模块；

所述获取模块用于获取每个第一特征对应的特征补充模型；

10.根据权利要求9所述的车辆版型特征补充装置，其特征在于，所述获取模块，包括：第一确定单元和第二确定单元；

获取第一配置的名称、描述文本和标准配置名称库；