CN116776147A

CN116776147A - 一种汽车配件适配模型的生成方法和装置

Info

Publication number: CN116776147A
Application number: CN202310699077.1A
Authority: CN
Inventors: 张虎
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Priority date: 2023-06-13
Filing date: 2023-06-13
Publication date: 2023-09-19

Abstract

本发明公开了一种汽车配件适配模型的生成方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：响应于汽车配件适配模型的生成请求，获取不少于一个初始样本；选取不少于一个正样本标签对应的初始样本作为第一初始样本，对于每个第一初始样本，按照预设的第一扰动规则，对第一初始样本进行扰动处理，并将扰动处理后的第一初始样本的样本标签修改为负样本标签；根据扰动处理后的第一初始样本和初始样本中除第一初始样本之外的第二初始样本，生成训练样本进行模型训练，生成汽车配件适配模型。该实施方式能够提高负样本的数量和构造效率，使得负样本具有不适配关系的特征，使得汽车配件适配模型的准确率更高，提高使用效果。

Description

一种汽车配件适配模型的生成方法和装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种汽车配件适配模型的生成方法和装置。

背景技术

在汽车制造领域中，对于不同品牌型号的汽车，需要适配不同参数的配件。目前的汽车配件适配方案为：直接使用适配的汽车和配件参数构造正样本，通过人工收集和随机构造的方式构造负样本，并使用正样本和负样本进行模型训练，生成汽车配件适配模型，进而通过汽车配件适配模型来识别汽车和配件的适配关系。

在实现本发明过程中，发明人发现现有技术中至少存在如下问题：

负样本的数量较少，构造效率低，难以表示不适配关系的特征，从而影响汽车配件适配模型的准确性和使用效果。

发明内容

有鉴于此，本发明实施例提供一种汽车配件适配模型的生成方法和装置，通过将正样本扰动为负样本，能够提高负样本的数量和构造效率，使得负样本具有不适配关系的特征，从而便于进行汽车配件适配模型的构建，使得汽车配件适配模型的准确率更高，可以比较准确的判断出大量适配关系中存在的少量不适配关系；并且，还通过对正样本进行扰动，增大正样本的差异性，从而进一步提高汽车配件适配模型的准确性和使用效果。

为实现上述目的，根据本发明实施例的一个方面，提供了一种汽车配件适配模型的生成方法。

一种汽车配件适配模型的生成方法，包括：响应于汽车配件适配模型的生成请求，获取不少于一个初始样本，每个所述初始样本包括配件信息和样本标签，所述样本标签包括指示汽车与配件适配的正样本标签和指示汽车与配件不适配的负样本标签；选取不少于一个正样本标签对应的初始样本作为第一初始样本，并且对于每个所述第一初始样本，按照预设的第一扰动规则，对所述第一初始样本进行扰动处理，并将扰动处理后的第一初始样本的样本标签修改为负样本标签；根据扰动处理后的第一初始样本和所述初始样本中除所述第一初始样本之外的第二初始样本，生成训练样本，并通过所述训练样本进行模型训练，生成汽车配件适配模型。

可选地，所述按照预设的第一扰动规则，对所述第一初始样本进行扰动处理，包括：根据所述第一初始样本的配件信息，确定不少于一个第一类型的配件参数和不少于一个第二类型的配件参数；对于每个所述第一类型的配件参数，按照预设的扰动阈值，使用预设分布函数进行计算，得到中间参数值，并根据所述中间参数值，对所述第一类型的配件参数对应的参数值进行扰动处理；对于每个所述第二类型的配件参数，对所述第二类型的配件参数的参数值进行字符分割处理，以对所述第二类型的配件参数对应的参数值进行扰动处理。

可选地，所述根据扰动处理后的第一初始样本和所述初始样本中除所述第一初始样本之外的第二初始样本，生成训练样本之前，还包括：对于每个所述第二初始样本，按照预设的第二扰动规则，对所述第二初始样本进行扰动处理。

可选地，所述按照预设的第二扰动规则，对所述第二初始样本进行扰动处理，包括：根据所述第二初始样本的配件信息，确定不少于一个第一类型的配件参数和不少于一个第二类型的配件参数；对于每个所述第一类型的配件参数，按照预设的扰动阈值，使用均匀分布函数进行计算，得到中间参数值，并根据所述中间参数值，对所述第一类型的配件参数对应的参数值进行扰动处理；对于每个所述第二类型的配件参数，对所述第二类型的配件参数的参数值进行字符分割处理，以对所述第二类型的配件参数对应的参数值进行扰动处理。

可选地，所述根据所述中间参数值，对所述第一类型的配件参数对应的参数值进行扰动处理，包括：根据所述第一类型的配件参数对应的参数值得到最大参数值和最小参数值；根据所述第一类型的配件参数对应的参数值的精度，对所述中间参数值进行精度处理；根据所述第一类型的配件参数对应的参数值、精度处理后的中间参数值、所述最大参数值和所述最小参数值进行计算，得到扰动后的参数值，并将所述第一类型的配件参数对应的参数值修改为所述扰动后的参数值。

可选地，所述对所述第二类型的配件参数的参数值进行字符分割处理，以对所述第二类型的配件参数对应的参数值进行扰动处理，包括：对于每个所述第二类型的配件参数，在所述第二类型的配件参数对应的参数值包括特定字符的情况下，通过所述特定字符对所述第二类型的配件参数对应的参数值进行分割，生成多个分割结果，并将所述第二类型的配件参数对应的参数值随机修改为任一分割结果。

可选地，所述确定不少于一个第一类型的配件参数，包括：从所述配件信息中选出所有第一类型的配件参数，并确定所述第一类型的配件参数的总数；根据所述第一类型的配件参数的总数，计算待选取的第一类型的配件参数的数量；按照所述待选取的第一类型的配件参数的数量，随机从所有第一类型的配件参数中选取对应个数的第一类型的配件参数。

根据本发明实施例的另一方面，提供了一种汽车配件适配模型的生成装置。

一种汽车配件适配模型的生成装置，包括：初始样本获取模块，用于响应于汽车配件适配模型的生成请求，获取不少于一个初始样本，每个所述初始样本包括配件信息和样本标签，所述样本标签包括指示汽车与配件适配的正样本标签和指示汽车与配件不适配的负样本标签；扰动处理模块，用于选取不少于一个正样本标签对应的初始样本作为第一初始样本，并且对于每个所述第一初始样本，按照预设的第一扰动规则，对所述第一初始样本进行扰动处理，并将扰动处理后的第一初始样本的样本标签修改为负样本标签；汽车配件适配模型生成模块，用于根据扰动处理后的第一初始样本和所述初始样本中除所述第一初始样本之外的第二初始样本，生成训练样本，并通过所述训练样本进行模型训练，生成汽车配件适配模型。

可选地，所述扰动处理模块还用于：根据所述第一初始样本的配件信息，确定不少于一个第一类型的配件参数和不少于一个第二类型的配件参数；对于每个所述第一类型的配件参数，按照预设的扰动阈值，使用预设分布函数进行计算，得到中间参数值，并根据所述中间参数值，对所述第一类型的配件参数对应的参数值进行扰动处理；对于每个所述第二类型的配件参数，对所述第二类型的配件参数的参数值进行字符分割处理，以对所述第二类型的配件参数对应的参数值进行扰动处理。

可选地，所述扰动处理模块还用于：对于每个所述第二初始样本，按照预设的第二扰动规则，对所述第二初始样本进行扰动处理。

可选地，所述扰动处理模块还用于：根据所述第二初始样本的配件信息，确定不少于一个第一类型的配件参数和不少于一个第二类型的配件参数；对于每个所述第一类型的配件参数，按照预设的扰动阈值，使用均匀分布函数进行计算，得到中间参数值，并根据所述中间参数值，对所述第一类型的配件参数对应的参数值进行扰动处理；对于每个所述第二类型的配件参数，对所述第二类型的配件参数的参数值进行字符分割处理，以对所述第二类型的配件参数对应的参数值进行扰动处理。

可选地，所述扰动处理模块还用于：根据所述第一类型的配件参数对应的参数值得到最大参数值和最小参数值；根据所述第一类型的配件参数对应的参数值的精度，对所述中间参数值进行精度处理；根据所述第一类型的配件参数对应的参数值、精度处理后的中间参数值、所述最大参数值和所述最小参数值进行计算，得到扰动后的参数值，并将所述第一类型的配件参数对应的参数值修改为所述扰动后的参数值。

可选地，所述扰动处理模块还用于：对于每个所述第二类型的配件参数，在所述第二类型的配件参数对应的参数值包括特定字符的情况下，通过所述特定字符对所述第二类型的配件参数对应的参数值进行分割，生成多个分割结果，并将所述第二类型的配件参数对应的参数值随机修改为任一分割结果。

可选地，所述扰动处理模块还用于：从所述配件信息中选出所有第一类型的配件参数，并确定所述第一类型的配件参数的总数；根据所述第一类型的配件参数的总数，计算待选取的第一类型的配件参数的数量；按照所述待选取的第一类型的配件参数的数量，随机从所有第一类型的配件参数中选取对应个数的第一类型的配件参数。

根据本发明实施例的又一方面，提供了一种电子设备。

一种电子设备，包括：一个或多个处理器；存储器，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现本发明实施例所提供的汽车配件适配模型的生成方法。

根据本发明实施例的又一方面，提供了一种计算机可读介质。

一种计算机可读介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现本发明实施例所提供的汽车配件适配模型的生成方法。

上述发明中的一个实施例具有如下优点或有益效果：通过响应于汽车配件适配模型的生成请求，获取不少于一个初始样本，每个初始样本包括配件信息和样本标签，样本标签包括指示汽车与配件适配的正样本标签和指示汽车与配件不适配的负样本标签；选取不少于一个正样本标签对应的初始样本作为第一初始样本，并且对于每个第一初始样本，按照预设的第一扰动规则，对第一初始样本进行扰动处理，并将扰动处理后的第一初始样本的样本标签修改为负样本标签；根据扰动处理后的第一初始样本和初始样本中除第一初始样本之外的第二初始样本，生成训练样本，并通过训练样本进行模型训练，生成汽车配件适配模型的技术方案，通过将正样本扰动为负样本，能够提高负样本的数量和构造效率，使得负样本具有不适配关系的特征，从而便于进行汽车配件适配模型的构建，使得汽车配件适配模型的准确率更高，可以比较准确的判断出大量适配关系中存在的少量不适配关系；并且，还通过对正样本进行扰动，增大正样本的差异性，从而进一步提高汽车配件适配模型的准确性和使用效果。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明，不构成对本发明的不当限定。其中：

图1是根据本发明一个实施例的汽车配件适配模型的生成方法的主要步骤示意图；

图2是根据本发明一个实施例的汽车配件适配模型的生成方法的流程示意图；

图3是根据本发明一个实施例的汽车配件适配模型的生成装置的主要模块示意图；

图4是本发明实施例可以应用于其中的示例性系统架构图；

图5是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

需要说明的是，本发明的技术方案中，所涉及的用户个人信息的采集、收集、更新、分析、处理、使用、传输、存储等方面，均符合相关法律法规的规定，被用于合法的用途，且不违背公序良俗。对用户个人信息采取必要措施，防止对用户个人信息数据的非法访问，维护用户个人信息安全、网络安全和国家安全。

在汽车领域中，不同配件参数不同，适配不同的汽车品牌及型号，因而一个配件可能适配成千上万辆汽车，一辆汽车可能有成千上万个同类的适配配件。如果购买配件出错，会导致无法安装，或配件无法正常使用；如果安装错误的配件，会影响汽车的正常使用及正常寿命。目前配件厂商会提供一部分的适配车型，但由于需适配的汽车过多，配件厂商提供的适配关系并不全面，需要对汽车及配件的适配关系进行识别判断。目前配件厂商提供的适配关系中，可能会存在少量实际上并不适配的关系，因此需要从大量的适配关系中挖掘出少量的不适配关系，避免用户购买到配件后，由于配件和用户所持汽车不适配，造成安装问题或汽车损坏的问题。

现有技术中，正样本的构造方式为，直接使用适配的汽车参数和配件参数的进行正样本构造，由于适配同一汽车的不同品牌配件的参数略有差异，因而这种正样本构造方法实际效果较差；负样本的构造方式为随机构造和人工收集，随机构造即随机选择不适配的汽车及配件，通过各自的参数构造负样本，由于和汽车适配的特定配件参数不会变化太大，但随机选择的特定配件参数差异比较大，通过这种方法构造出来的负样本不具有代表性，无法挖掘出适配关系中存在的少量不适配关系对应的配件参数的特点，人工收集即使用人工收集到的不适配的关系作为负样本，由于大量适配关系中实际的不适配关系很少，一个配件适配的成千上万车型中，可能仅有几个或者十几个实际上不适配的关系，构建可供训练模型使用的负样本量，需要长时间的积累，难度高，可行性差。

本发明针对汽车及配件的适配关系，提出了一种新的构造训练样本的方法，通过对配件参数进行不同类型、不同程度的扰动，结合该配件适配的汽车的参数，得到训练模型使用的正样本和负样本，并结合随机构造的不适配的关系以及收集到的不适配的关系作为负样本，得到训练数据，进行模型的训练，从而使训练得到的模型收敛更快，且模型准确率更高，可以比较准确的判断出大量适配关系中存在的少量不适配关系。

图1是根据本发明一个实施例的汽车配件适配模型的生成方法的主要步骤示意图。

如图1所示，本发明一个实施例的汽车配件适配模型的生成方法主要包括如下的步骤S101至步骤S103。

步骤S101：响应于汽车配件适配模型的生成请求，获取不少于一个初始样本，每个初始样本包括配件信息和样本标签。样本标签可以包括指示汽车与配件适配的正样本标签和指示汽车与配件不适配的负样本标签。

具体地，初始样本可以包括汽车信息、配件信息和样本标签，汽车信息可以包括品牌、型号、年款、发动机型号等参数，配件可以为轮胎、机油滤清器、雨刮、火花塞等，不同的配件具有不同的配件信息，如蓄电池的配件信息包括冷启动电流、额定容量、蓄电池长度等参数。适配关系：配件能否安装到汽车上。

初始样本的类型可以包括：(1)配件厂商提供的汽车和配件适配的初始样本，该初始样本的样本标签为正样本标签；(2)人工收集到的汽车和配件不适配的初始样本，该初始样本的样本标签为负样本标签；(3)随机构造的汽车和配件不适配的初始样本，该初始样本的样本标签为负样本标签。其中，可以以P1的概率选择类型(1)中的初始样本，以P2的概率选择类型(2)中的初始样本，以P3的概率选择类型(3)中的初始样本，上述P1+P2+P3＝1。P1、P2、P3可以根据人工经验确定，需要确保P1+P2+P3＝1。一般来说，P1＝0.9，P2＝0.05，P3＝0.05即可。通过P1、P2、P3可以限制不同类型样本的数量，避免类型(2)和类型(3)中样本数量过多，类型(1)中样本数量过少，导致模型性能变差的问题。

步骤S102：选取不少于一个正样本标签对应的初始样本作为第一初始样本，并且对于每个第一初始样本，按照预设的第一扰动规则，对第一初始样本进行扰动处理，并将扰动处理后的第一初始样本的样本标签修改为负样本标签。

具体地，对于样本标签为正样本标签每个初始样本，可以以P4的概率保持其为正样本标签，以P5的概率将将其修改为负样本标签，作为第一初始样本，上述P4+P5＝1，从而选取不少于一个正样本标签对应的初始样本作为第一初始样本。

本发明实施例中，由于初始样本中大部分为正样本，因而为了保持正负样本的均衡，需要将一定数量的正样本转换成负样本，避免正样本数量太多，负样本数量太少，导致供模型训练的样本都是正样本，模型无法训练。并且，虽然上述类型(2)和类型(3)的样本也是负样本，但是这些负样本数量太少，且这些负样本的丰富度较差，因而将一定数量的正样本转换成负样本，能够增加负样本的数量和丰富度。

在一个实施例中，按照预设的第一扰动规则，对第一初始样本进行扰动处理，可以包括：根据第一初始样本的配件信息，确定不少于一个第一类型的配件参数和不少于一个第二类型的配件参数；对于每个第一类型的配件参数，按照预设的扰动阈值，使用预设分布函数进行计算，得到中间参数值，并根据中间参数值，对第一类型的配件参数对应的参数值进行扰动处理；对于每个第二类型的配件参数，对第二类型的配件参数的参数值进行字符分割处理，以对第二类型的配件参数对应的参数值进行扰动处理。其中，预设分布函数可以为Γ分布的分布函数，第一类型可以为数值类型，如配件的长、宽、高等，第二类型可以为字符类型，如配件的品牌零件号等。

具体地，对于第一初始样本中选出的每个数值类型的配件参数，根据经验确定扰动阈值T，例如对于某款汽车，某蓄电池在长度为150-250范围内，均可以安装到该汽车上，则该参数的扰动阈值可以为(250-150)/2＝50。基于扰动阈值T，中间参数值v_mid的计算公式可以为：

其中，Γ为Γ分布，random()得到在[0，1]之内均匀分布的随机数。上述公式表示中间参数值v_mid有50％的概率取T+Γ，有50％的概率取-(T+Γ)。Γ分布的分布函数pdf(x)如下：

其中，Γ(α)为Γ函数，当α为正整数时，其定义如下：Γ(α)＝(α-1)！，α和β为参数，“！”为阶乘，α和β可以根据经验取不同值，优选地，α＝2，β＝2，Γ分布的数值范围为(0,+∞)。

本发明实施例使用Γ分布进行扰动处理，扰动后数据的概率密度函数从0增加，到达峰值后再逐步降低，能够克服汽车和配件的适配关系中负样本数据量太少，以及随机构造的负样本无法接近真实适配错误关系的缺点。

在一个实施例中，根据扰动处理后的第一初始样本和初始样本中除第一初始样本之外的第二初始样本，生成训练样本之前，还可以包括：按照预设的第二扰动规则，对第二初始样本进行扰动处理，可以包括：根据第二初始样本的配件信息，确定不少于一个第一类型的配件参数和不少于一个第二类型的配件参数；对于每个第一类型的配件参数，按照预设的扰动阈值，使用均匀分布函数进行计算，得到中间参数值，并根据中间参数值，对第一类型的配件参数对应的参数值进行扰动处理；对于每个第二类型的配件参数，对第二类型的配件参数的参数值进行字符分割处理，以对第二类型的配件参数对应的参数值进行扰动处理。其中，第一类型可以为数值类型，第二类型可以为字符类型。

具体地，对于第二初始样本中选出的每个数值类型的配件参数，根据经验确定扰动阈值T，基于扰动阈值T，

v_mid＝random_uniform(-T,T)；

其中，random_uniform(-T,T)表示在[-T,T]之内均匀分布的随机数。

在一个实施例中，确定不少于一个第一类型的配件参数，可以包括：从配件信息中选出所有第一类型的配件参数，并确定第一类型的配件参数的总数；根据第一类型的配件参数的总数，计算待选取的第一类型的配件参数的数量；按照待选取的第一类型的配件参数的数量，随机从所有第一类型的配件参数中选取对应个数的第一类型的配件参数。

具体地，对于配件信息中包括的所有数值类型的配件参数，随机选择k个配件参数进行扰动。假定共有n₁个数值类型的配件参数，则k的计算方式如下：

其中，int表示取整。

本发明实施例对数据扰动时，不是对所有数值类型参数均进行扰动，而是对部分数值类型参数进行随机扰动，剩下的数值类型参数不进行扰动，但每次扰动的数值类型参数和扰动的范围都不同，这样得到的样本参数变化范围更大，参数更加丰富，更能避免模型陷入过拟合。

在一个实施例中，根据中间参数值，对第一类型的配件参数对应的参数值进行扰动处理，可以包括：根据第一类型的配件参数对应的参数值得到最大参数值和最小参数值；根据第一类型的配件参数对应的参数值的精度，对中间参数值进行精度处理；根据第一类型的配件参数对应的参数值、精度处理后的中间参数值、最大参数值和最小参数值进行计算，得到扰动后的参数值，并将第一类型的配件参数对应的参数值修改为扰动后的参数值。

具体地，中间参数值v_mid进行精度处理，得到精度处理后的中间参数值v，即如果当前参数v_in为整数，则中间参数值v_mid取整，如果当前参数v_in为含有1位有效位的浮点数，则对中间参数值v_mid保留1位小数，从而确保扰动后的数据和初始数据的精度一致。扰动后的参数值v_out的计算公式可以为：

其中，min和max分别表示在与对应的汽车信息适配的情况下，该配件参数对应的最大参数值和最小参数值。

在一个实施例中，对第二类型的配件参数的参数值进行字符分割处理，以对第二类型的配件参数对应的参数值进行扰动处理，可以包括：对于每个第二类型的配件参数，在第二类型的配件参数对应的参数值包括特定字符的情况下，通过特定字符对第二类型的配件参数对应的参数值进行分割，生成多个分割结果，并将第二类型的配件参数对应的参数值随机修改为任一分割结果。

具体地，针对所有字符类型的配件参数，判断字符类型的配件参数对应的参数值中是否有特定字符，特定字符可以“；”(英文分号)、“/”(斜杠)、“”(空格)等。在数值类型的配件参数对应的参数值包括特定字符的情况下，则使用特定字符分割每个参数值，并随机选择一个分割结果更新为参数值。例如，参数值为“abc/def；gh”，则使用“；”、“/”分割后的分割结果为“abc”、“def”、“gh”，并随机从“abc”、“def”、“gh”选择一个分割结果，如“def”作为处理后的参数值。在数值类型的配件参数对应的参数值不包括特定字符的情况下，则无需对该参数值进行处理。

步骤S103：根据扰动处理后的第一初始样本和初始样本中除第一初始样本之外的第二初始样本，生成训练样本，并通过训练样本进行模型训练，生成汽车配件适配模型。

其中，对于第一初始样本，通过汽车信息、修改后的样本标签和扰动后的配件信息和，生成训练样本；对于第二初始样本，通过汽车信息、样本标签和扰动后的配件信息，生成训练样本。将训练样本中的汽车信息和配件信息作为输入，样本标签作为训练目标，进行模型训练，生成汽车配件适配模型。

图2是根据本发明一个实施例的汽车配件适配模型的生成方法的流程示意图。

如图2所示，在一个实施例中，获取不少于一个初始样本，每个初始样本包括配件信息和样本标签，样本标签包括指示汽车与配件适配的正样本标签和指示汽车与配件不适配的负样本标签。选取不少于一个正样本标签对应的初始样本作为第一初始样本，并将所有初始样本中除第一初始样本之外的作为第二初始样本。对于每个第一初始样本，将样本标签修改为负样本标签，使用预设分布函数对数值类型的配件参数进行扰动，通过特定字符对字符类型的配件参数进行分割，得到扰动处理后的第一初始样本。对于每个第二初始样本，使用均匀分布函数对数值类型的配件参数进行扰动，通过特定字符对字符类型的配件参数进行分割，得到扰动处理后的第二初始样本。根据扰动后的初始样本生成训练样本，并通过训练样本进行模型训练，生成汽车配件适配模型。

图3是根据本发明一个实施例的汽车配件适配模型的生成装置的主要模块示意图。

如图3所示，本发明一个实施例的汽车配件适配模型的生成装置300主要包括：初始样本获取模块301、扰动处理模块302、汽车配件适配模型生成模块303。

初始样本获取模块301，用于响应于汽车配件适配模型的生成请求，获取不少于一个初始样本，每个初始样本包括配件信息和样本标签，样本标签包括指示汽车与配件适配的正样本标签和指示汽车与配件不适配的负样本标签。

扰动处理模块302，用于选取不少于一个正样本标签对应的初始样本作为第一初始样本，并且对于每个第一初始样本，按照预设的第一扰动规则，对第一初始样本进行扰动处理，并将扰动处理后的第一初始样本的样本标签修改为负样本标签。

汽车配件适配模型生成模块303，用于根据扰动处理后的第一初始样本和初始样本中除第一初始样本之外的第二初始样本，生成训练样本，并通过训练样本进行模型训练，生成汽车配件适配模型。

在一个实施例中，扰动处理模块302具体用于：根据第一初始样本的配件信息，确定不少于一个第一类型的配件参数和不少于一个第二类型的配件参数；对于每个第一类型的配件参数，按照预设的扰动阈值，使用预设分布函数进行计算，得到中间参数值，并根据中间参数值，对第一类型的配件参数对应的参数值进行扰动处理；对于每个第二类型的配件参数，对第二类型的配件参数的参数值进行字符分割处理，以对第二类型的配件参数对应的参数值进行扰动处理。

在一个实施例中，扰动处理模块302具体用于：对于每个第二初始样本，按照预设的第二扰动规则，对第二初始样本进行扰动处理。

在一个实施例中，扰动处理模块302具体用于：根据第二初始样本的配件信息，确定不少于一个第一类型的配件参数和不少于一个第二类型的配件参数；对于每个第一类型的配件参数，按照预设的扰动阈值，使用均匀分布函数进行计算，得到中间参数值，并根据中间参数值，对第一类型的配件参数对应的参数值进行扰动处理；对于每个第二类型的配件参数，对第二类型的配件参数的参数值进行字符分割处理，以对第二类型的配件参数对应的参数值进行扰动处理。

在一个实施例中，扰动处理模块302具体用于：根据第一类型的配件参数对应的参数值得到最大参数值和最小参数值；根据第一类型的配件参数对应的参数值的精度，对中间参数值进行精度处理；根据第一类型的配件参数对应的参数值、精度处理后的中间参数值、最大参数值和最小参数值进行计算，得到扰动后的参数值，并将第一类型的配件参数对应的参数值修改为扰动后的参数值。

在一个实施例中，扰动处理模块302具体用于：对于每个第二类型的配件参数，在第二类型的配件参数对应的参数值包括特定字符的情况下，通过特定字符对第二类型的配件参数对应的参数值进行分割，生成多个分割结果，并将第二类型的配件参数对应的参数值随机修改为任一分割结果。

在一个实施例中，扰动处理模块302具体用于：从配件信息中选出所有第一类型的配件参数，并确定第一类型的配件参数的总数；根据第一类型的配件参数的总数，计算待选取的第一类型的配件参数的数量；按照待选取的第一类型的配件参数的数量，随机从所有第一类型的配件参数中选取对应个数的第一类型的配件参数。

另外，在本发明实施例中汽车配件适配模型的生成装置的具体实施内容，在上面汽车配件适配模型的生成方法中已经详细说明了，故在此重复内容不再说明。

图4示出了可以应用本发明实施例的汽车配件适配模型的生成方法或汽车配件适配模型的生成装置的示例性系统架构400。

如图4所示，系统架构400可以包括终端设备401、402、403，网络404和服务器405。网络404用以在终端设备401、402、403和服务器405之间提供通信链路的介质。网络404可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备401、402、403通过网络404与服务器405交互，以接收或发送消息等。终端设备401、402、403上可以安装有各种通讯客户端应用，例如汽车配件适配类应用、模型训练应用、样本构造类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。

终端设备401、402、403可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器405可以是提供各种服务的服务器，例如对用户利用终端设备401、402、403所浏览的汽车配件适配类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的汽车配件适配模型的生成请求等数据进行响应于汽车配件适配模型的生成请求，获取不少于一个初始样本，每个初始样本包括配件信息和样本标签，样本标签包括指示汽车与配件适配的正样本标签和指示汽车与配件不适配的负样本标签；选取不少于一个正样本标签对应的初始样本作为第一初始样本，并且对于每个第一初始样本，按照预设的第一扰动规则，对第一初始样本进行扰动处理，并将扰动处理后的第一初始样本的样本标签修改为负样本标签；根据扰动处理后的第一初始样本和初始样本中除第一初始样本之外的第二初始样本，生成训练样本，并通过训练样本进行模型训练，生成汽车配件适配模型等处理，并将处理结果(例如汽车配件适配模型的生成结果--仅为示例)反馈给终端设备。

需要说明的是，本发明实施例所提供的汽车配件适配模型的生成方法一般由服务器405执行，相应地，汽车配件适配模型的生成装置一般设置于服务器405中。

应该理解，图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

下面参考图5，其示出了适于用来实现本发明实施例的终端设备或服务器的计算机系统500的结构示意图。图5示出的终端设备或服务器仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示，计算机系统500包括中央处理单元(CPU)501，其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中，还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

以下部件连接至I/O接口505：包括键盘、鼠标等的输入部分506；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507；包括硬盘等的存储部分508；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器510上，以便于从其上读出的计算机程序根据需要被安装入存储部分508。

特别地，根据本发明公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分509从网络上被下载和安装，和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时，执行本发明的系统中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中，例如，可以描述为：一种处理器包括初始样本获取模块、扰动处理模块、汽车配件适配模型生成模块。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定，例如，初始样本获取模块还可以被描述为“用于响应于汽车配件适配模型的生成请求，获取不少于一个初始样本的模块”。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：响应于汽车配件适配模型的生成请求，获取不少于一个初始样本，每个初始样本包括配件信息和样本标签，样本标签包括指示汽车与配件适配的正样本标签和指示汽车与配件不适配的负样本标签；选取不少于一个正样本标签对应的初始样本作为第一初始样本，并且对于每个第一初始样本，按照预设的第一扰动规则，对第一初始样本进行扰动处理，并将扰动处理后的第一初始样本的样本标签修改为负样本标签；根据扰动处理后的第一初始样本和初始样本中除第一初始样本之外的第二初始样本，生成训练样本，并通过训练样本进行模型训练，生成汽车配件适配模型。

根据本发明实施例的技术方案，响应于汽车配件适配模型的生成请求，获取不少于一个初始样本，每个初始样本包括配件信息和样本标签，样本标签包括指示汽车与配件适配的正样本标签和指示汽车与配件不适配的负样本标签；选取不少于一个正样本标签对应的初始样本作为第一初始样本，并且对于每个第一初始样本，按照预设的第一扰动规则，对第一初始样本进行扰动处理，并将扰动处理后的第一初始样本的样本标签修改为负样本标签；根据扰动处理后的第一初始样本和初始样本中除第一初始样本之外的第二初始样本，生成训练样本，并通过训练样本进行模型训练，生成汽车配件适配模型。通过将正样本扰动为负样本，能够提高负样本的数量和构造效率，使得负样本具有不适配关系的特征，从而便于进行汽车配件适配模型的构建，使得汽车配件适配模型的准确率更高，可以比较准确的判断出大量适配关系中存在的少量不适配关系；并且，还通过对正样本进行扰动，增大正样本的差异性，从而进一步提高汽车配件适配模型的准确性和使用效果。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种汽车配件适配模型的生成方法，其特征在于，包括：

响应于汽车配件适配模型的生成请求，获取不少于一个初始样本，每个所述初始样本包括配件信息和样本标签，所述样本标签包括指示汽车与配件适配的正样本标签和指示汽车与配件不适配的负样本标签；

选取不少于一个正样本标签对应的初始样本作为第一初始样本，并且对于每个所述第一初始样本，按照预设的第一扰动规则，对所述第一初始样本进行扰动处理，并将扰动处理后的第一初始样本的样本标签修改为负样本标签；

根据扰动处理后的第一初始样本和所述初始样本中除所述第一初始样本之外的第二初始样本，生成训练样本，并通过所述训练样本进行模型训练，生成汽车配件适配模型。

2.根据权利要求1所述的方法，其特征在于，所述按照预设的第一扰动规则，对所述第一初始样本进行扰动处理，包括：

根据所述第一初始样本的配件信息，确定不少于一个第一类型的配件参数和不少于一个第二类型的配件参数；

对于每个所述第一类型的配件参数，按照预设的扰动阈值，使用预设分布函数进行计算，得到中间参数值，并根据所述中间参数值，对所述第一类型的配件参数对应的参数值进行扰动处理；

对于每个所述第二类型的配件参数，对所述第二类型的配件参数的参数值进行字符分割处理，以对所述第二类型的配件参数对应的参数值进行扰动处理。

3.根据权利要求1所述的方法，其特征在于，所述根据扰动处理后的第一初始样本和所述初始样本中除所述第一初始样本之外的第二初始样本，生成训练样本之前，还包括：

对于每个所述第二初始样本，按照预设的第二扰动规则，对所述第二初始样本进行扰动处理。

4.根据权利要求3所述的方法，其特征在于，所述按照预设的第二扰动规则，对所述第二初始样本进行扰动处理，包括：

根据所述第二初始样本的配件信息，确定不少于一个第一类型的配件参数和不少于一个第二类型的配件参数；

对于每个所述第一类型的配件参数，按照预设的扰动阈值，使用均匀分布函数进行计算，得到中间参数值，并根据所述中间参数值，对所述第一类型的配件参数对应的参数值进行扰动处理；

5.根据权利要求2或4所述的方法，其特征在于，所述根据所述中间参数值，对所述第一类型的配件参数对应的参数值进行扰动处理，包括：

根据所述第一类型的配件参数对应的参数值得到最大参数值和最小参数值；

根据所述第一类型的配件参数对应的参数值的精度，对所述中间参数值进行精度处理；

根据所述第一类型的配件参数对应的参数值、精度处理后的中间参数值、所述最大参数值和所述最小参数值进行计算，得到扰动后的参数值，并将所述第一类型的配件参数对应的参数值修改为所述扰动后的参数值。

6.根据权利要求2或4所述的方法，其特征在于，所述对所述第二类型的配件参数的参数值进行字符分割处理，以对所述第二类型的配件参数对应的参数值进行扰动处理，包括：

对于每个所述第二类型的配件参数，在所述第二类型的配件参数对应的参数值包括特定字符的情况下，通过所述特定字符对所述第二类型的配件参数对应的参数值进行分割，生成多个分割结果，并将所述第二类型的配件参数对应的参数值随机修改为任一分割结果。

7.根据权利要求2或4所述的方法，其特征在于，所述确定不少于一个第一类型的配件参数，包括：

从所述配件信息中选出所有第一类型的配件参数，并确定所述第一类型的配件参数的总数；

根据所述第一类型的配件参数的总数，计算待选取的第一类型的配件参数的数量；

按照所述待选取的第一类型的配件参数的数量，随机从所有第一类型的配件参数中选取对应个数的第一类型的配件参数。

8.一种汽车配件适配模型的生成装置，其特征在于，包括：

初始样本获取模块，用于响应于汽车配件适配模型的生成请求，获取不少于一个初始样本，每个所述初始样本包括配件信息和样本标签，所述样本标签包括指示汽车与配件适配的正样本标签和指示汽车与配件不适配的负样本标签；

扰动处理模块，用于选取不少于一个正样本标签对应的初始样本作为第一初始样本，并且对于每个所述第一初始样本，按照预设的第一扰动规则，对所述第一初始样本进行扰动处理，并将扰动处理后的第一初始样本的样本标签修改为负样本标签；

汽车配件适配模型生成模块，用于根据扰动处理后的第一初始样本和所述初始样本中除所述第一初始样本之外的第二初始样本，生成训练样本，并通过所述训练样本进行模型训练，生成汽车配件适配模型。

9.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。

10.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的方法。