CN112581250A

CN112581250A - 模型生成方法、装置、计算机设备和存储介质

Info

Publication number: CN112581250A
Application number: CN201910945862.4A
Authority: CN
Inventors: 林建明; 张祺扬
Original assignee: Shenzhen Wuyu Technology Co ltd
Current assignee: Shenzhen Wuyu Technology Co ltd
Priority date: 2019-09-30
Filing date: 2019-09-30
Publication date: 2021-03-30
Anticipated expiration: 2039-09-30
Also published as: CN112581250B

Abstract

本申请涉及一种模型生成方法、装置、计算机设备和存储介质。所述方法包括：获取包括第一子样本集合和第二子样本集合的第一样本集合；通过训练第一子样本集合得到第一目标模型；通过第一目标模型预测第二子样本集合中各个样本的标签得到各个样本的预测标签；通过训练第一子样本集合和携带预测标签的第二子样本集合得到第二目标模型；获取通过训练第二样本集合和第一子样本集合得到的第三迁移模型，第二样本集合和第一样本集合为不同产品中的数据；获取第三样本集合，第三样本集合与第一样本集合为相同产品的数据；根据第三样本集合训练第二目标模型和第三目标模型组成的模型得到预设目标模型。通过迁移模型和样本数据快速建立有效的预测模型。

Description

模型生成方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种模型生成方法、装置、计算机设备和存储介质。

背景技术

随着计算机技术的发展，产品的更新换代日益频繁。为了更加快速，准确，及智能地判断产品中的数据的真实性和有效性，应用大数据及统计学习机器学习的方法来建立数据评估模型，是一种越来越普及且有效的方法。

然而在建立数据评估模型时，不可或缺的是数据样本。这不仅要求有足够多的样本量，用来训练模型，测试调整，及验证模型效果，同样也需要一定时间观察样本的表现，给样本打上准确的标签，这样才能来让模型学习得更精准，在模型未来投产后更准确地判断数据类型。

传统的建模方法为了积累足量及稳定的样本，往往需要等用户相对稳定后，再开始收集样本。同时还需要较长时间的表现期，来评估数据的准确度。而对于新上线的产品，由于上线时间短，缺乏足量的建模数据，也缺乏长时间的数据跟踪，来判断数据在真实性。在这种情景下，工程师往往难以在产品上线初期快速且准确地建立对应的数据评估模型。

发明内容

为了解决上述技术问题，本申请提供了一种模型生成方法、装置、计算机设备和存储介质。

第一方面，本申请提供了一种模型生成方法，包括：

获取第一样本集合，第一样本集合包括第一子样本集合和第二子样本集合，第一子样本集合中的各个样本携带标签；

根据第一子样本集合训练第一模型得到第一目标模型；

通过第一目标模型预测第二子样本集合中的各个样本的标签，得到第二子样本集合中的各个样本的预测标签；

根据第一子样本集合和携带预测标签的第二子样本集合训练第二模型，得到第二目标模型；

获取根据第二样本集合和第一子样本集合训练得到的第三迁移模型，第二样本集合和第一样本集合为不同产品对应的数据；

获取第三样本集合，第三样本集合与第一样本集合为相同产品的数据，第三样本集合携带标签；

根据第二目标模型和第三迁移模型构建预设模型；

根据第三样本集合训练预设模型，得到预设目标模型。

第二方面，本申请提供了一种模型生成装置，包括：

样本获取模块，用于获取第一样本集合，第一样本集合包括第一子样本集合和第二子样本集合，第一子样本集合中的各个样本携带标签；

第一训练模块，用于根据第一子样本集合训练第一模型，得到第一目标模型；

标签预测模块，用于通过第一目标模型预测第二子样本集合中的各个样本的标签，得到第二子样本集合中的各个样本的预测标签；

第二训练模块，用于根据第一子样本集合和携带预测标签的第二子样本集合训练第二模型，得到第二目标模型；

模型获取模块，用于获取根据第二样本集合和第一子样本集合训练得到的第三迁移模型，第二样本集合和第一样本集合为不同产品对应的数据；

样本获取模块还用于获取第三样本集合，第三样本集合与第一样本集合为相同产品的数据，第三样本集合携带标签；

模型构建模块，用于根据第二目标模型和第三迁移模型构建预设模型；

第三训练模块，用于根据第三样本集合训练预设模型，得到预设目标模型。

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：

根据第一子样本集合训练第一模型得到第一目标模型；

根据第二目标模型和第三迁移模型构建预设模型；

根据第三样本集合训练预设模型，得到预设目标模型。

一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

根据第一子样本集合训练第一模型得到第一目标模型；

根据第二目标模型和第三迁移模型构建预设模型；

根据第三样本集合训练预设模型，得到预设目标模型。

上述模型生成方法、装置、计算机设备和存储介质，所述方法包括：获取第一样本集合，第一样本集合包括第一子样本集合和第二子样本集合，第一子样本集合中的各个样本携带标签；根据第一子样本集合训练第一模型得到第一目标模型；通过第一目标模型预测第二子样本集合中的各个样本的标签，得到第二子样本集合中的各个样本的预测标签；根据第一子样本集合和携带预测标签的第二子样本集合训练第二模型，得到第二目标模型；获取根据第二样本集合和第一子样本集合训练得到的第三迁移模型，第二样本集合和第一样本集合为不同产品对应的数据；获取第三样本集合，第三样本集合与第一样本集合为相同产品的数据，第三样本集合携带标签；根据第二目标模型和第三迁移模型构建预设模型；根据第三样本集合训练预设模型，得到预设目标模型。该方法能够借助其他产品的数据来构建迁移模型，且采用产品的少量样本调整迁移模型，采用少量样本构建另外一个模型，组合两个模型，得到目标模型，得到一个能够准确预测前期数据的模型。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为一个实施例中模型生成方法的应用环境图；

图2为一个实施例中模型生成方法的流程示意图；

图3为另一个实施例中模型生成方法的流程示意图；

图4为一个实施例中模型生成装置的结构框图；

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

图1为一个实施例中模型生成方法的应用环境图。参照图1，该模型生成方法应用于模型生成系统。该模型生成系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端，移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

如图2所示，在一个实施例中，提供了一种模型生成方法。本实施例主要以该方法应用于上述图1中的终端110(或服务器120)来举例说明。参照图2，该模型生成方法具体包括如下步骤：

步骤S201，获取第一样本集合。

在本具体实施例中，第一样本集合包括第一子样本集合和第二子样本集合，第一子样本集合中的各个样本携带标签。

具体地，样本是指产品数据或产品对应的用户数据等等，第一样本是指推出的新产品对应的产品数据或用户数据。用户数据可以根据产品需求定义，如可以包括用户的年龄、性别、职业和信用信息等等。第一样本集合是指包含多个样本，即包含多个用户的用户数据。第一子样本集合是指携带真实标签的样本组成的数据集合，第二子样本集合中的各个样本不携带真实标签的样本组成的数据集合。其中标签是用于标识样本所属类型的标签数据，以用户信用为例，则标签可以设置为可信、不可信两种，也可以对可信和不可信在进行细分，得到多个可信级别和多个不可信级别等等。其中用户的信用可以用来评估用户的行为的风险级别等。

步骤S202，根据第一子样本集合训练第一模型得到第一目标模型。

具体地，第一模型是构建的用于对用户数据和产品数据进行评价的模型，其中第一模型是可以为常见的机器学习模型或深度学习模型等。第一目标模型是指通过第一子样本集合对第一模型的参数进行调整后，得到能够较准确的评价第一子样本集合中的各个样本的模型。

在一个实施例中，采用半监督模型训练方法训练第一目标模型，其中半监督训练时可以采用回归方法进行训练。先使用有标签的数据作为训练，然后对无标签的数据进行回归拟合，预测出各个样本对应的标签，得到各个样本的预测标签。回归模型的评估指标可以采用均方误差(Mean Square Error，MSE)，均方误差是指预测标签与真实标签之差平方的期望值，MSE可以评价数据的变化程度，MSE的值越小，表示第一目标模型的精确度越高。

步骤S203，通过第一目标模型预测第二子样本集合中的各个样本的标签，得到第二子样本集合中的各个样本的预测标签。

具体地，预测标签是指通过第一目标模型对样本进行预测得到的标签，预测标签与第一子样本集合中的标签为同样的标签，只是第二子样本集合中是通过预测得到的，而第一子样本集合中的标签是真实标签。

步骤S204，根据第一子样本集合和携带预测标签的第二子样本集合训练第二模型，得到第二目标模型。

具体地，第二模型与第一模型为不同的模型。通过第一子样本集合和第二子样本集合中的各个携带了预测标签的样本更新第二模型的参数，直至第二模型满足预设评价指标时，得到第二目标模型。其中预设评价指标可以采用常见的机器学习的评价指标，如常见评价指标包括模型预测准确率、ROC(Receiver Operating Characteristic Curve，接受者操作特征曲线)、KS值(Kolmogorov Smirnov)和AUC(area under the curve)等。在实际训练过程中评价指令可以根据需求自定义选择。

步骤S205，获取根据第二样本集合和第一子样本集合训练得到的第三迁移模型。

在本具体实施中，第二样本集合和第一样本集合为不同产品对应的数据。

具体地，第三迁移模型是采用与第一样本集合相似的产品中采集的样本集合得到的，即通过第二样本集合训练得到。相似的产品是指具备相似的数据特征，如可以采用信用卡的数据，构建借贷产品的迁移模型，或通过借贷产品的数据，构建信用卡的迁移模型。即通过相似产品的数据，可以快速的构建迁移模型，构建的迁移模型可以用于对新产品的样本进行评价。

步骤S206，获取第三样本集合。

在本具体实施中，第三样本集合与第一样本集合为相同产品的数据，第三样本集合携带标签。

具体地，第三样本集合是指与第一样本集合相同产品的样本数据，第三样本集合中的各个样本可以为第一样本集合之后产生的样本。即得到样本的时间晚于第一样本集合中的各个样本的时间。第三样本集合携带的标签与第一样本集合携带的标签为相同的标签。

步骤S207，根据第二目标模型和第三迁移模型构建预设模型。

步骤S208，根据第三样本集合训练预设模型，得到预设目标模型。

具体地，对第二目标模型和第三目标模型进行构建，得到预设模型，其中预设模型中还包括预测层，预测层的输入数据为第二目标模型和第三目标模型的输出数据。通过第三样本集合对预设模型的参数进行更新，得到预设目标模型，其中参数更新的规则可以采用常见的机器学习的参数更新规则。预设目标模型中的参数可以根据需求自定义设置。如预测层中可以包括加权系数、映射函数等，其中加权系数可以直接对第二目标模型和第三目标模型的数据进行加权，也可以是对第一目标模型的输出数据和第二目标模型的输出数据根据映射函数执行对应的映射之后再进行加权，还可以是直接设置乘积函数，通过乘积函数将第二目标模型和第三目标模型的输出数据执行乘法运算等。

在一个实施例中，分别输入第三样本集合中的各个样本至第二目标模型和第三迁移模型，输出第二目标模型的分类结果和第三迁移模型的分类结果，通过预测层对第二目标模型的分类结果和第三迁移模型的分类结果进行预测，得到第三样本集合中的各个样本的预测结果，根据预测结果和对应的标签动态确定预测层的参数，得到预设目标模型。

具体地，将第三样本集合中的各个样本分别输入第二目标模型和第三迁移模型，分别采用第二目标模型和第三迁移模型对各个样本进行预测，得到各个样本在两个模型中的分类结果，即第二目标模型输出的各个样本的分类结果和对应的第三迁移模型的分类结果，输入各个样本的第二目标模型的分类结果和对应的第三迁移模型的分类结果至预测层，通过预测中的参数对各个样本的两个分类结果进行对应的处理，如进行加权求和、求取乘积和计算映射值等等，根据处理结果进行预测，得到各个样本的预测结果，通过各个样本的预测结果与携带的标签动态调整预测层的参数，直至按照预设的调整规则调整至不在更新预测层的参数时，得到预设目标模型。

在一个实施例中，通过预测层对第二目标模型的分类结果和第三迁移模型的分类结果进行预测，得到第三样本集合中的各个样本的预测结果，包括：通过预测层计算各个样本的第二目标模型的分类结果和第一加权系数的加权值，得到各个样本第一加权值，通过预测层计算各个样本第三迁移模型的分类结果和第二加权系数的加权值，得到各个样本第二加权值，通过预测层根据各个样本第一加权值和对应的第二加权值确定各个样本的预测结果，输出各个样本的预测结果。

具体地，预测层包括第一加权系数和第二加权系数，第一加权系数为第二目标模型的分类结果的加权系数，第二加权系数为第三迁移模型的分类结果的加权系数。根据第一加权系数计算第二目标模型的各个分类结果，得到第一加权值，根据第二加权系数计算各个第三迁移模型的各个分类结果，得到各个样本的第二加权值，计算各个样本的第一加权值和第二加权值的和，得到加权结果，根据各个样本的加权结果确定各个样本的预测结果，输出各个样本的预测结果。通过加权方式对两个分类结果进行加权时，加权系数可以根据需求和实际训练结果确定，若第二目标分类模型的结果可信度更高，则第一加权系数大于第二加权系数，反之则第一加权系数小于第二加权系数。

在一个实施例中，通过预测层计算各个样本的第二目标模型的分类结果和对应的第三迁移模型的分类结果的乘积值，得到第一乘积值，预测层根据第一乘积值确定各个样本的预测结果。

具体地，第一乘积值可以直接对第二目标模型的分类结果和对应的第三迁移模型的分类结果计算乘法得到，也可以在对乘法之后再对乘积值进行对应的算术处理，如计算乘积值的倍数、乘积值平方、开方等等。将直接得到的乘积值或进行算术处理后的乘积值作为第一乘积值。根据第一乘积值确定各个样本的预测结果。通过计算乘积值可以增大数据的范围，从而更好的对数据进行划分，得到更为准确的结果。

在一个实施例中，预测层还包括第一映射函数和第二映射函数，通过预测层对第二目标模型的分类结果和第三迁移模型的分类结果进行预测，得到第三样本集合中的各个样本的预测结果，包括：通过预测层中的第一映射函数对各个样本第二目标模型的分类结果进行映射得到各个样本的第一映射值；通过各个样本的第二映射函数对第三迁移模型的分类结果进行映射得到各个样本的第二映射值；通过预测层计算各个样本的第一映射值和对应的第二映射值的特征值，特征值包括加权值和/或乘积值；预测层根据各个样本的特征值确定各个样本的预测结果。

具体地，第一映射函数和第二映射函数可以为相同的映射函数，也可以为不同的映射函数，常见的映射函数包括指数函数、对数函数等。在映射函数选择是可以根据需求选择对应特征的函数。第一映射函数是用于对第二目标模型输出的分类结果执行映射，第二映射函数是用于对第三迁移模型输出的分类结果执行映射。通过执行第一映射函数和第二映射函数，得到第一映射值和第二映射值，计算第一映射值和第二映射值的特征值，根据各个样本的特征值确定各个样本的预测结果，特征值包括加权值和/或乘积值，即当特征值为加权值时，根据各个样本的加权值确定各个样本的预测结果，当特征值为乘积值时，根据各个样本的乘积值确定各个样本的预测结果，当特征值为加权值和乘积值时，根据各个样本的加权值和乘积值确定各个样本的预测结果。通过不同的映射函数实现对分类结果进行映射，可以对分类结果进行不同的处理，从而得到不同的数据特征。

上述模型生成方法，包括：获取第一样本集合，第一样本集合包括第一子样本集合和第二子样本集合，第一子样本集合中的各个样本携带标签；根据第一子样本集合训练第一模型得到第一目标模型；通过第一目标模型预测第二子样本集合中的各个样本的标签，得到第二子样本集合中的各个样本的预测标签；根据第一子样本集合和携带预测标签的第二子样本集合训练第二模型，得到第二目标模型；获取根据第二样本集合和第一子样本集合训练得到的第三迁移模型，第二样本集合和第一样本集合为不同产品对应的数据；获取第三样本集合，第三样本集合与第一样本集合为相同产品的数据，第三样本集合携带标签；根据第二目标模型和第三迁移模型构建预设模型；根据第三样本集合训练预设模型，得到预设目标模型。采用迁移学习的方法，在相似的产品数据上建立初版模型，然后在真实的数据集上对模型进行调整，来弥补数据量的不足；随后采用半监督学习的方法，利用少量有标签数据给大量无标签数据打标，解决表现期不足，难以判断客户的标签的问题。经过验证，采用这种方式建立的模型与传统方法相比较，节省了大量的时间，同时具有良好的预测能力。

在一个具体的实施例中，上述预设目标模型为风险预测模型，生成风险预测模型的步骤，包括：

步骤S301，获取第一产品的第一样本集合。

步骤S302，对第一样本集合按照是否携带标签进行分类，得到包括携带标签第一子样本集合和不携带标签的第二子样本集合。

步骤S303，获取第二产品的第二样本集合。其中第一产品与第二产品为相似的产品，第二样本集合携带标签。

步骤S304，判断第一样本集合的标签和第二样本集合的标签是否一致，标签一致进入步骤S306，不一致进入步骤S305。

步骤S305，建立第一样本集合的标签和第二样本集合的标签的映射关系。

步骤S306，根据第二样本集合训练迁移模型。

步骤S307，根据第一子样本集合调整迁移模型的参数，得到第三迁移模型。

步骤S308，采用半监督模型学习第一子样本集合，得到第一目标模型。

步骤S309，采用第一目标模型对第二子样本集合进行标签预测，得到第二子样本集合中各个样本的预测标签。

步骤S310，采用第一子样本集合和第二子样本集合中携带预测标签的各个样本训练第二模型，得到第二目标模型。

步骤S311，根据第二目标模型和第三迁移模型构建预测模型。

步骤S312，获取第一产品的第三样本集合。第三样本集合携带标签，第三样本集合的样本为建立第三迁移模型和第二目标模型期间积累的样本。

步骤S313，通过第三样本集合训练预设模型，得到风险预测模型。其中风险预测模型用于预测可的风险，如预测客户的还款风险。

上述风险预测模型的生成方法，首先采用迁移学习的方法，在相似的产品数据上建立第三迁移模型，然后在真实的数据集上对模型进行调整，来弥补数据量的不足；随后采用半监督学习的方法，利用少量有标签数据给大量无标签数据打标，解决表现期不足，难以判断客户的风险标签的问题。采用上述方式建立的模型与传统方法相比较，节省了大量的时间，同时具有良好的风险预测能力。

图2和3为一个实施例中模型生成方法的流程示意图。应该理解的是，虽然图2和3的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2和3中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图4所示，提供了一种模型生成装置200，包括：

样本获取模块201，用于获取第一样本集合，第一样本集合包括第一子样本集合和第二子样本集合，第一子样本集合中的各个样本携带标签。

第一训练模块202，用于根据第一子样本集合训练第一模型，得到第一目标模型。

标签预测模块203，用于通过第一目标模型预测第二子样本集合中的各个样本的标签，得到第二子样本集合中的各个样本的预测标签。

第二训练模块204，用于根据第一子样本集合和携带预测标签的第二子样本集合训练第二模型，得到第二目标模型。

模型获取模块205，用于获取根据第二样本集合和第一子样本集合训练得到的第三迁移模型，第二样本集合和第一样本集合为不同产品对应的数据。

样本获取模块201还用于获取第三样本集合，第三样本集合与第一样本集合为相同产品的数据，第三样本集合携带标签。

模型构建模块206，用于根据第二目标模型和第三迁移模型构建预设模型。

第三训练模块207，用于根据第三样本集合训练预设模型，得到预设目标模型。

在一个实施例中，模型生成装置200，还包括：

迁移模型生成模型，用于获取第二样本集合，根据第二样本集合训练第三模型，得到第三中间模型；根据第一子样本集合更新第三中间模型的参数，得到第三迁移模型。

在一个实施例中，模型生成装置200，还包括：

标签映射模块，用于判断第一子样本集合中携带的标签和第二样本集合中携带的标签是否一致；当标签不一致时，根据预设规则构建第一子样本集合的标签和第二样本集合的标签之间的映射关系。

在一个实施例中，第三训练模块207具体用于分别输入第三样本集合中的各个样本至第二目标模型和第三迁移模型，输出第二目标模型的分类结果和第三迁移模型的分类结果，通过预测层对第二目标模型的分类结果和第三迁移模型的分类结果进行预测，得到第三样本集合中的各个样本的预测结果，根据预测结果和对应的标签动态确定预测层的参数，得到预设目标模型。

在一个实施例中，第三训练模块207具体用于通过预测层计算各个样本的第二目标模型的分类结果和第一加权系数的加权值，得到各个样本第一加权值，通过预测层计算各个样本第三迁移模型的分类结果和第二加权系数的加权值，得到各个样本第二加权值，通过预测层根据各个样本第一加权值和对应的第二加权值确定各个样本的预测结果，输出各个样本的预测结果，预测层包括第一加权系数和第二加权系数，第一加权系数为第二目标模型的分类结果的加权系数，第二加权系数为第三迁移模型的分类结果的加权系数。

在一个实施例中，第三训练模块207具体还用于通过预测层计算各个样本的第二目标模型的分类结果和对应的第三迁移模型的分类结果的乘积值，得到第一乘积值；预测层根据第一乘积值确定各个样本的预测结果。

在一个实施例中，第三训练模块207具体还用于通过预测层中的第一映射函数对各个样本第二目标模型的分类结果进行映射得到各个样本的第一映射值；通过各个样本的第二映射函数对第三迁移模型的分类结果进行映射得到各个样本的第二映射值，通过预测层计算各个样本的第一映射值和对应的第二映射值的特征值，特征值包括加权值和/或乘积值，预测层根据各个样本的特征值确定各个样本的预测结果，其中预测层还包括第一映射函数和第二映射函数。

图5示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110(或服务器120)。如图5所示，该计算机设备通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现模型生成方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行模型生成方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的模型生成装置可以实现为一种计算机程序的形式，计算机程序可在如图5所示的计算机设备上运行。计算机设备的存储器中可存储组成该模型生成装置的各个程序模块，比如，图4所示的样本获取模块201、第一训练模块202、标签预测模块203、第二训练模块204、模型构建模块206和第三训练模块207。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的模型生成方法中的步骤。

例如，图5所示的计算机设备可以通过如图4所示的模型生成装置中的样本获取模块201执行获取第一样本集合，第一样本集合包括第一子样本集合和第二子样本集合，第一子样本集合中的各个样本携带标签。计算机设备可通过第一训练模块202执行根据第一子样本集合训练第一模型，得到第一目标模型。计算机设备可通过标签预测模块203执行通过第一目标模型预测第二子样本集合中的各个样本的标签，得到第二子样本集合中的各个样本的预测标签。计算机设备可通过第二训练模块204执行根据第一子样本集合和携带预测标签的第二子样本集合训练第二模型，得到第二目标模型。计算机设备可通过模型获取模块205执行获取根据第二样本集合和第一子样本集合训练得到的第三迁移模型，第二样本集合和第一样本集合为不同产品对应的数据。计算机设备可通过样本获取模块201还用于获取第三样本集合，第三样本集合与第一样本集合为相同产品的数据，第三样本集合携带标签。计算机设备可通过模型构建模块206执行根据第二目标模型和第三迁移模型构建预设模型。计算机设备可通过第三训练模块207执行根据第三样本集合训练预设模型，得到预设目标模型。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：获取第一样本集合，第一样本集合包括第一子样本集合和第二子样本集合，第一子样本集合中的各个样本携带标签；根据第一子样本集合训练第一模型得到第一目标模型；通过第一目标模型预测第二子样本集合中的各个样本的标签，得到第二子样本集合中的各个样本的预测标签；根据第一子样本集合和携带预测标签的第二子样本集合训练第二模型，得到第二目标模型；获取根据第二样本集合和第一子样本集合训练得到的第三迁移模型，第二样本集合和第一样本集合为不同产品对应的数据；获取第三样本集合，第三样本集合与第一样本集合为相同产品的数据，第三样本集合携带标签；根据第二目标模型和第三迁移模型构建预设模型；根据第三样本集合训练预设模型，得到预设目标模型。

在一个实施例中，获取根据第二样本集合和第一子样本集合训练得到的第三迁移模型之前，处理器执行计算机程序时还实现以下步骤：获取第二样本集合，根据第二样本集合训练第三模型，得到第三中间模型；根据第一子样本集合更新第三中间模型的参数，得到第三迁移模型。

在一个实施例中，根据第一子样本集合更新第三中间模型的参数，得到第三迁移模型之前，处理器执行计算机程序时还实现以下步骤：判断第一子样本集合中携带的标签和第二样本集合中携带的标签是否一致；当标签不一致时，根据预设规则构建第一子样本集合的标签和第二样本集合的标签之间的映射关系。

在一个实施例中，预设模型包括预测层，预测层的输入为第二目标模型和第三迁移模型的输出；根据第三样本集合训练预设模型，得到预设目标模型，包括：分别输入第三样本集合中的各个样本至第二目标模型和第三迁移模型，输出第二目标模型的分类结果和第三迁移模型的分类结果，通过预测层对第二目标模型的分类结果和第三迁移模型的分类结果进行预测，得到第三样本集合中的各个样本的预测结果，根据预测结果和对应的标签动态确定预测层的参数，得到预设目标模型。

在一个实施例中，预测层包括第一加权系数和第二加权系数，第一加权系数为第二目标模型的分类结果的加权系数，第二加权系数为第三迁移模型的分类结果的加权系数；通过预测层对第二目标模型的分类结果和第三迁移模型的分类结果进行预测，得到第三样本集合中的各个样本的预测结果，包括：通过预测层计算各个样本的第二目标模型的分类结果和第一加权系数的加权值，得到各个样本第一加权值；通过预测层计算各个样本第三迁移模型的分类结果和第二加权系数的加权值，得到各个样本第二加权值；通过预测层根据各个样本第一加权值和对应的第二加权值确定各个样本的预测结果，输出各个样本的预测结果。

在一个实施例中，通过预测层对第二目标模型的分类结果和第三迁移模型的分类结果进行预测，得到第三样本集合中的各个样本的预测结果，包括：通过预测层计算各个样本的第二目标模型的分类结果和对应的第三迁移模型的分类结果的乘积值，得到第一乘积值；预测层根据第一乘积值确定各个样本的预测结果。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取第一样本集合，第一样本集合包括第一子样本集合和第二子样本集合，第一子样本集合中的各个样本携带标签；根据第一子样本集合训练第一模型得到第一目标模型；通过第一目标模型预测第二子样本集合中的各个样本的标签，得到第二子样本集合中的各个样本的预测标签；根据第一子样本集合和携带预测标签的第二子样本集合训练第二模型，得到第二目标模型；获取根据第二样本集合和第一子样本集合训练得到的第三迁移模型，第二样本集合和第一样本集合为不同产品对应的数据；获取第三样本集合，第三样本集合与第一样本集合为相同产品的数据，第三样本集合携带标签；根据第二目标模型和第三迁移模型构建预设模型；根据第三样本集合训练预设模型，得到预设目标模型。

在一个实施例中，获取根据第二样本集合和第一子样本集合训练得到的第三迁移模型之前，计算机程序被处理器执行时还实现以下步骤：获取第二样本集合，根据第二样本集合训练第三模型，得到第三中间模型；根据第一子样本集合更新第三中间模型的参数，得到第三迁移模型。

在一个实施例中，根据第一子样本集合更新第三中间模型的参数，得到第三迁移模型之前，计算机程序被处理器执行时还实现以下步骤：判断第一子样本集合中携带的标签和第二样本集合中携带的标签是否一致；当标签不一致时，根据预设规则构建第一子样本集合的标签和第二样本集合的标签之间的映射关系。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本发明的具体实施方式，使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims

1.一种模型生成方法，其特征在于，所述方法包括：

获取第一样本集合，所述第一样本集合包括第一子样本集合和第二子样本集合，所述第一子样本集合中的各个样本携带标签；

根据所述第一子样本集合训练第一模型得到第一目标模型；

通过所述第一目标模型预测所述第二子样本集合中的各个样本的标签，得到所述第二子样本集合中的各个样本的预测标签；

根据所述第一子样本集合和携带所述预测标签的第二子样本集合训练第二模型，得到第二目标模型；

获取根据第二样本集合和所述第一子样本集合训练得到的第三迁移模型，所述第二样本集合和所述第一样本集合为不同产品对应的数据；

获取第三样本集合，所述第三样本集合与所述第一样本集合为相同产品的数据，所述第三样本集合携带标签；

根据所述第二目标模型和所述第三迁移模型构建预设模型；

根据所述第三样本集合训练所述预设模型，得到预设目标模型。

2.根据权利要求1所述的方法，其特征在于，所述获取根据第二样本集合和所述第一子样本集合训练得到的第三迁移模型之前，还包括：

获取所述第二样本集合，根据所述第二样本集合训练第三模型，得到第三中间模型；

根据所述第一子样本集合更新所述第三中间模型的参数，得到所述第三迁移模型。

3.根据权利要求2所述的方法，其特征在于，所述根据所述第一子样本集合更新所述第三中间模型的参数，得到所述第三迁移模型之前，还包括：

判断所述第一子样本集合中携带的标签和所述第二样本集合中携带的标签是否一致；

当标签不一致时，根据预设规则构建所述第一子样本集合的标签和所述第二样本集合的标签之间的映射关系。

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述预设模型包括预测层，所述预测层的输入为所述第二目标模型和所述第三目标模型的输出；

所述根据所述第三样本集合训练所述预设模型，得到预设目标模型，包括：分别输入所述第三样本集合中的各个样本至所述第二目标模型和所述第三迁移模型，输出所述第二目标模型的分类结果和所述第三迁移模型的分类结果，通过所述预测层对所述第二目标模型的分类结果和所述第三迁移模型的分类结果进行预测，得到所述第三样本集合中的各个样本的预测结果，根据所述预测结果和对应的标签动态确定所述预测层的参数，得到所述预设目标模型。

5.根据权利要求4所述的方法，其特征在于，所述预测层包括第一加权系数和第二加权系数，所述第一加权系数为所述第二目标模型的分类结果的加权系数，所述第二加权系数为所述第三迁移模型的分类结果的加权系数；

所述通过所述预测层对所述第二目标模型的分类结果和所述第三迁移模型的分类结果进行预测，得到所述第三样本集合中的各个样本的预测结果，包括：通过所述预测层计算各个样本的所述第二目标模型的分类结果和所述第一加权系数的加权值，得到各个样本第一加权值，通过所述预测层计算各个样本所述第三迁移模型的分类结果和所述第二加权系数的加权值，得到各个样本第二加权值，通过所述预测层根据各个样本所述第一加权值和对应的第二加权值确定各个样本的预测结果，输出各个样本的预测结果。

6.根据权利要求4所述的方法，其特征在于，所述通过所述预测层对所述第二目标模型的分类结果和所述第三迁移模型的分类结果进行预测，得到所述第三样本集合中的各个样本的预测结果，包括：

通过所述预测层计算各个样本的所述第二目标模型的分类结果和对应的所述第三迁移模型的分类结果的乘积值，得到第一乘积值；

所述预测层根据所述第一乘积值确定各个样本的预测结果。

7.根据权利要求4所述的方法，其特征在于，所述预测层还包括第一映射函数和第二映射函数，所述通过所述预测层对所述第二目标模型的分类结果和所述第三迁移模型的分类结果进行预测，得到所述第三样本集合中的各个样本的预测结果，包括：

通过所述预测层中的第一映射函数对各个样本所述第二目标模型的分类结果进行映射得到各个样本的第一映射值；

通过各个样本的所述第二映射函数对所述第三迁移模型的分类结果进行映射得到各个样本的第二映射值；

通过所述预测层计算各个样本的所述第一映射值和对应的所述第二映射值的特征值，所述特征值包括加权值和/或乘积值；

所述预测层根据各个样本的所述特征值确定各个样本的预测结果。

8.一种模型生成装置，其特征在于，所述装置包括：

样本获取模块，用于获取第一样本集合，所述第一样本集合包括第一子样本集合和第二子样本集合，所述第一子样本集合中的各个样本携带标签；

第一训练模块，用于根据所述第一子样本集合训练第一模型，得到第一目标模型；

标签预测模块，用于通过所述第一目标模型预测所述第二子样本集合中的各个样本的标签，得到所述第二子样本集合中的各个样本的预测标签；

第二训练模块，用于根据所述第一子样本集合和携带所述预测标签的第二子样本集合训练第二模型，得到第二目标模型；

模型获取模块，用于获取根据第二样本集合和所述第一子样本集合训练得到的第三迁移模型，所述第二样本集合和所述第一样本集合为不同产品对应的数据；

样本获取模块还用于获取第三样本集合，所述第三样本集合与所述第一样本集合为相同产品的数据，所述第三样本集合携带标签；

模型构建模块，用于根据所述第二目标模型和所述第三迁移模型构建预设模型；

第三训练模块，用于根据所述第三样本集合训练所述预设模型，得到预设目标模型。

9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。