CN115758142A

CN115758142A - 深度学习模型的训练方法、数据处理方法和装置

Info

Publication number: CN115758142A
Application number: CN202211403787.7A
Authority: CN
Inventors: 刘昊骋; 陈才
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-11-10
Filing date: 2022-11-10
Publication date: 2023-03-07

Abstract

本公开提供了一种深度学习模型的训练方法，涉及人工智能技术领域，尤其涉及深度学习和数据处理领域。具体实现方案为：获取标准模型对标准数据源的标准输出结果；使用预训练模型针对标准数据源获取与标准输出结果一致的特征，其中，预训练模型是根据标准输出结果，使用标准数据源以及目标数据源进行训练得到的；将与标准输出结果一致的特征添加到目标数据源，得到更新的目标数据源；以及使用更新的目标数据源训练深度学习模型。本公开还提供了一种数据处理方法、装置、电子设备和存储介质。

Description

深度学习模型的训练方法、数据处理方法和装置

技术领域

本公开涉及人工智能技术领域，尤其涉及深度学习和数据处理技术。更具体地，本公开提供了一种深度学习模型的训练方法、数据处理方法、装置、电子设备和存储介质。

背景技术

来自不同渠道的多个数据源具有各自的特征。因此，在多数据源建模场景下，使用不同数据源训练出来的模型效果不一。

发明内容

本公开提供了一种深度学习模型的训练方法、数据处理方法、装置、设备以及存储介质。

根据第一方面，提供了一种深度学习模型的训练方法，该方法包括：获取标准模型对标准数据源的标准输出结果；使用预训练模型针对标准数据源获取与标准输出结果一致的特征，其中，预训练模型是根据标准输出结果，使用标准数据源以及目标数据源进行训练得到的；将与标准输出结果一致的特征添加到目标数据源，得到更新的目标数据源；以及使用更新的目标数据源训练深度学习模型。

根据第二方面，提供了一种数据处理方法，该方法包括：获取对象针对产品的检索数据；以及将检索数据输入深度学习模型，得到对象交易产品的概率；其中，深度学习模型是根据上述深度学习模型的训练方法训练得到的。

根据第三方面，提供了一种深度学习模型的训练装置，该装置包括：第一获取模块，用于获取标准模型对标准数据源的标准输出结果；第二获取模块，用于使用预训练模型针对标准数据源获取与标准输出结果一致的特征，其中，预训练模型是根据标准输出结果，使用标准数据源以及目标数据源进行训练得到的；更新模块，用于将与标准输出结果一致的特征添加到目标数据源，得到更新的目标数据源；以及第一训练模块，用于使用更新的目标数据源训练深度学习模型。

根据第四方面，提供了一种数据处理装置，该装置包括：第三获取模块，用于获取对象针对产品的检索数据；以及处理模块，用于将检索数据输入深度学习模型，得到对象交易产品的概率；其中，深度学习模型是根据上述深度学习模型的训练装置训练得到的。

根据第五方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行根据本公开提供的方法。

根据第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行根据本公开提供的方法。

根据第七方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序存储于可读存储介质和电子设备其中至少之一上，所述计算机程序在被处理器执行时实现根据本公开提供的方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开的一个实施例的可以应用深度学习模型的训练方法和/或数据处理方法的示例性系统架构示意图；

图2是根据本公开的一个实施例的深度学习模型的训练方法的流程图；

图3A是根据本公开的一个实施例的第n个子模型的训练方法的示意图；

图3B是根据本公开的另一个实施例的第n个子模型的训练方法的示意图；

图4是根据本公开的另一个实施例的深度学习模型的训练方法的流程图；

图5是根据本公开的一个实施例的数据处理方法的流程图；

图6是根据本公开的一个实施例的深度学习模型的训练装置的框图；

图7是根据本公开的一个实施例的数据处理装置的框图；

图8是根据本公开的一个实施例的深度学习模型的训练方法和/或数据处理方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

不同数据源训练出来的模型效果不一，为提高处理精度较低的模型的处理效果，可以融合多个数据源进行建模或者融合多个数据源的模型，但是融合后得到的模型在不同数据源上的表现依然有差异。

不同数据源可以包含相同的样本，但是不同数据源各自的样本的特征不同。例如，来自金融渠道的数据源A可以是用户的交易数据，交易数据例如包括交易时间、交易金额、交易频次等。来自搜索渠道的数据源B可以是用户的检索数据，检索数据例如包括检索频率、查询词等。

数据源A和数据源B可以包含相同的样本(例如用户的ID)，但是同一样本在不同数据源中的特征是不相同的，例如数据源A中样本的特征是由用户的交易数据加工出的变量，数据源B中样本的特征是由检索数据加工出的变量。

数据源A可以应用于金融产品相关任务的模型的训练，金融产品相关任务例如包括预测用户交易产品的概率、预测用户的违约概率等。使用数据源A训练出来的模型(例如模型A)的预测效果较好，例如预测准确率高于0.85。

数据源B也可以应用于上述模型的训练，但是使用数据源B训练出来的模型(例如模型B)的预测效果较差，例如预测准确率低于0.6。

对于渠道B来说，无法获得数据源A的交易数据特征。因此，需要提供一种模型训练方法，既能提高模型B的处理精度，也能避免上述融合多数据源的模型的方式造成的数据处理效果不一致的问题。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

在本公开的技术方案中，在获取或采集用户个人信息之前，均获取了用户的授权或同意。

图1是根据本公开一个实施例的可以应用深度学习模型的训练方法和/或数据处理方法的示例性系统架构示意图。需要注意的是，图1所示仅为可以应用本公开实施例的系统架构的示例，以帮助本领域技术人员理解本公开的技术内容，但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。

如图1所示，根据该实施例的系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线和/或无线通信链路等等。

用户可以使用终端设备101、102、103通过网络104与服务器105进行交互，以接收或发送消息等。终端设备101、102、103可以是各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机等等。

本公开实施例所提供的深度学习模型的训练方法以及数据处理方法中的至少之一一般可以由服务器105执行。相应地，本公开实施例所提供的深度学习模型的训练装置以及数据处理装置一般可以设置于服务器105中。本公开实施例所提供的深度学习模型的训练方法以及数据处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地，本公开实施例所提供的深度学习模型的训练装置以及数据处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。

图2是根据本公开的一个实施例的深度学习模型的训练方法的流程图。

如图2所示，该深度学习模型的训练方法200包括操作S210～操作S240。

在操作S210，获取标准模型对标准数据源的标准输出结果。

例如，标准模型是使用标准数据源进行训练得到的，且标准模型是多个数据源各自训练出来的模型中处理精度最大且大于阈值(0.85)的模型。标准数据源可以是用户的交易数据，标准数据源可以包括多个样本，在标准数据源中每个样本的特征是由用户的交易数据生成的。标准模型对标准数据源的标准输出结果例如是表示用户交易产品的概率的评估值，评估值的取值范围是[0，1]。

在操作S220，使用预训练模型针对标准数据源获取与标准输出结果一致的特征。

例如，预训练模型是根据标准模型的标准输出结果，使用标准数据源和目标数据源进行训练得到的。目标数据源是多个数据源中除标准数据源以外的任一数据源。可以理解，单独使用目标数据源训练出来的模型的处理精度较低(例如小于0.6)。目标数据源可以是用户的检索数据，目标数据源也可以包括多个样本，在目标数据源中每个样本的特征是由用户的检索数据生成的。

例如，可以以标准输出结果为基准，使用标准数据源的样本(例如用户ID)和目标数据源中样本的检索数据特征训练预训练模型，使得训练出的预训练模型针对样本的预测输出结果与标准输出结果一致。

预训练模型的预测输出结果与标准输出结果一致可以有多种形式，例如标准模型对样本X的标准输出结果是评估值

预训练模型对样本X的预测输出结果接近于评估值

又例如，标准模型对样本X的标准输出结果属于范围评估值范围[a，b](a和b均是大于0小于1的数，且a＜b)，预训练模型对样本X的预测输出结果是样本X的评估值属于[a，b]的概率，且该概率接近于1。

因此，预训练模型的预测输出结果可以作为与标准输出结果一致的特征。将标准数据源中的样本输入训练好的预训练模型，便可以得到该特征。

在操作S230，将与标准输出结果一致的特征添加到目标数据源，得到更新的目标数据源。

在操作S240，使用更新的目标数据源训练深度学习模型。

例如，将预训练模型获取的与标准输出结果一致的特征(预训练模型的预测输出结果)添加到目标数据源中，使得更新的目标数据源包含与标准输出结果相一致的特征。使用更新的目标数据源训练深度学习模型，能够使得深度学习模型的处理效果与标准模型的处理效果对齐，例如使得深度学习模型针对目标数据源的处理效果与标准模型针对标准数据源的处理效果接近。

本公开实施例根据标准模型的标准输出结果训练预训练模型，使用预训练模型获取与标准输出结果一致的特征，将该特征添加到目标数据源，得到更新的目标数据源，使用包含与标准输出结果一致的特征的新目标数据源训练的深度学习模型，相比仅使用目标数据源训练的深度学习模型，处理效果能够得到显著提升。

可以理解，使用更新的目标数据源训练深度学习模型，能够使得深度学习模型的处理效果与标准模型的处理效果对齐，例如，使用更新的目标数据源训练的深度学习模型针对目标数据源的处理效果与标准模型针对标准数据源的处理效果接近，因此，能够避免相关技术中使用融合方式得到的模型对不同数据源的效果表现不一致的问题。

根据本公开的实施例，标准数据源中多个样本各自的标准输出结果的范围是[0，1]，可以按照标准输出结果对多个样本进行排序(例如降序排序)，根据排序结果将多个样本划分为N个样本簇。例如，将多个样本等分为N个样本簇，每个样本簇中的样本数量相同。N个样本簇根据划分结果各自具有评估值范围。例如，第n个样本簇具有第n个评估值范围，第n个样本簇中的样本的标准输出结果均属于第n个评估值范围，n＝1，……，N。N为大于等于1的整数，例如N为5到20中的任一整数。

预训练模型可以包括N个子模型，N个子模型可以是使用N个样本簇以及目标数据源进行训练得到的。

根据本公开的实施例，使用N个样本簇以及目标数据源训练N个子模型包括：使用第n个样本簇以及目标数据源训练第n个子模型。或者通过对N个样本簇各自的样本设置对应的指定标签，使用N个样本簇以及目标数据源训练N个子模型。

下面结合图3A～3B对本公开提供的预训练模型的训练方法进行详细说明。

图3A是根据本公开的一个实施例的第n个子模型的训练方法的示意图。

如图3A所示，第n个子模型的输入是第n个样本簇以及目标数据源，第n个样本簇中的样本具有真实标签Y1，Y1的值为0或1，第n个样本簇中的样本的标准输出结果(评估值)属于第n个评估值范围。

针对第n个样本簇中的每个样本，第n个子模型的输出是该样本的评估值属于第n个评估值范围的第一概率，第一概率也可以理解为第n个样本簇中的样本是正样本的概率。

第n个子模型的损失可以是根据第n个样本簇中的样本的第一概率以及对应的真实标签Y1进行计算得到的。根据第n个子模型的损失可以调整第n个模型的参数，直至第n个子模型的损失收敛，得到经训练的第n个子模型。由此，可以得到N个子模型。

图3B是根据本公开的另一个实施例的第n个子模型的训练方法的示意图。

如图3B所示，第n个子模型的输入是N个样本簇以及目标数据源，第n个样本簇中的样本的标准输出结果(评估值)属于第n个评估值范围。N个样本簇中的样本具有指定标签Y2，其中N个样本簇中第n个样本簇的样本的指定标签Y2＝1，其余样本簇的样本的指定标签Y2＝0。例如，n＝1时，第1个样本簇中的样本的指定标签Y2＝1，其余样本簇(第2个样本簇到第N个样本簇)中的样本的指定标签Y2＝0；n＝2时，第2个样本簇中的样本的指定标签Y2＝1，其余样本簇(第1个样本簇、第3个样本簇到第N个样本簇)中的样本的指定标签Y2＝0，以此类推。

针对N个样本簇中的每个样本，第n个子模型的输出是该样本的评估值属于第n个评估值范围的第二概率，第二概率也可以理解为该样本属于第n个样本簇的概率。

第n个子模型的损失可以是根据N个样本簇中的样本的第二概率以及对应的指定标签Y2进行计算得到的。根据第n个子模型的损失可以调整第n个模型的参数，直至第n个子模型的损失收敛，得到经训练的第n个子模型。由此，可以得到N个子模型。

需要说明的是，使用如图3A所示的预训练模型的训练方法可以训练出N个子模型(可以称为方式一的N个子模型)，使用如图3B所示的预训练模型的训练方法也可以训练出N个子模型(可以称为方式2的N个子模型)。在执行使用N个子模型针对标准数据源获取与标准输出结果一致的特征的步骤时，针对标准数据源中的每个样本，可以单独使用方式一的N个子模型获取该样本的N个特征，或者单独使用方式二的N个子模型获取该样本的N个特征，也可以将使用方式一的N个子模型获取的该样本的N个特征与使用方式二的N个子模型获取的该样本的N个特征进行拼接，得到该样本的N个拼接特征。

例如，针对标准数据源中的每个样本，将该样本输入方式一的N个子模型，得到方式一的N个子模型各自输出的该样本的第一概率，作为与标准输出结果一致的该样本的N个特征(方式一的N个特征)。

例如，针对标准数据源中的每个样本，将该样本输入方式二的N个子模型，得到方式二的N个子模型各自输出的该样本的第二概率，作为与标准输出结果一致的该样本的N个特征(方式二的N个特征)。

例如，针对标准数据源中的每个样本，将上述的方式一的N个特征和方式二的N个特征一一对应地进行拼接，得到该样本的N个拼接特征，作为与标准输出结果一致的该样本的N个特征(N个拼接特征)。

例如，可以将上述样本的方式一的N个特征添加到目标数据源中，或者将上述样本的方式二的N个特征添加到目标数据源中，或者将上述样本的N个拼接特征添加到目标数据源中，使得更新的目标数据源包含与标准输出结果相一致的特征。使用更新的目标数据源训练深度学习模型，能够使得深度学习模型的处理效果与标准模型的处理效果对齐。因此，使用包含与标准输出结果一致的特征的新目标数据源训练的深度学习模型，相比仅使用目标数据源训练出的深度学习模型，处理效果能够得到显著提升。

图4是根据本公开的一个实施例的深度学习模型的训练方法的流程图。

如图4所示，该方法包括操作S410～S460。

在操作S410，使用多个数据源分别进行建模，得到多个数据源各自的初始模型。

例如，多个数据源可以包括用户针对产品的交易数据、用户针对产品的检索数据、产品信息数据等。每个数据源各自进行深度学习模型的额训练，得到各自对应的初始模型。初始模型例如是深度学习模型。

在操作S420，判断多个初始模型中是否存在处理精大于阈值(例如0.85)的初始模型。如果存在，执行操作S430；否则流程结束。

例如，在多个初始模型中，使用用户针对产品的交易数据训练出的初始模型的处理精度较高，且高于0.85，而使用用户针对产品的检索数据训练出来的初始模型的处理精度以及使用产品信息数据训练出来的初始模型的处理精度均比较低，例如均低于0.6。

因此，存在处理精度大于阈值的初始模型，可以执行操作S430。

在操作S430，将处理精度大于阈值的初始模型作为标准模型，根据标准模型的标准输出结果，使用标准数据源和目标数据源训练预训练模型。

例如，可以将使用用户针对产品的交易数据训练出的初始模型作为标准模型，将交易数据作为标准数据源，将该标准模型针对标准数据源的输出结果作为标准输出结果。

例如，可以将使用用户针对产品的检索数据训练出来的初始模型作为目标模型，将检索数据作为目标数据源。还可以将使用产品信息数据训练出来的初始模型作为目标模型，将产品信息数据作为目标数据源。

例如，可以以标准输出结果为基准，使用标准数据源和目标数据源练预训练模型，使得训练出的预训练模型针对样本的预测输出结果与标准输出结果一致。

在操作S440，使用预训练模型针对标准数据源获取与标准输出结果一致的特征。

例如，可以将标准数据源中的样本输入预训练模型，得到样本的预测输出结果，作为与标准输出结果一致的样本的特征。

在操作S450，将与标准输出结果一致的特征添加到目标数据源，得到更新的目标数据源。

在操作S460，使用更新的目标数据源训练目标模型。

例如，标准数据源是交易数据，目标数据源是检索数据，将与标准输出结果一致的特征添加到目标数据源中，得到更新的检索数据，使得更新的检索数据中包含了与交易数据的标准输出结果相一致的特征。

因此，相比于单独使用检索数据进行深度学习模型训练，使用更新的检索数据进行深度学习模型的训练，得到的目标模型的处理效果能够得到显著提升。

另外，使用更新的检索数据训练的深度学习模型针对来自检索渠道的检索数据的处理效果与标准模型针对来自金融渠道的交易数据的处理效果接近，能够避免相关技术中使用融合方式得到的模型对不同数据源的效果表现不一致的问题。

图5是根据本公开的一个实施例的数据处理方法的流程图。

如图5所示，该数据处理方法500包括操作S510～S520。

在操作S510，获取对象针对产品的检索数据。

在操作S520，将检索数据输入深度学习模型，得到对象交易产品的概率。

例如，产品可以是金融产品，检索数据可以包括用户针对该产品的检索频率、与该产品相关的关键词(例如产品风险、产品收益、产品行业的分析报告等)。

例如，深度学习模型是根据上述深度学习模型的训练方法进行训练得到的。由于深度学习模型在训练时引入了与交易数据的标准输出结果一致的特征，因此，能够提高基于检索数据预测交易产品的概率的准确率。

图6是根据本公开的一个实施例的深度学习模型的训练装置的框图。

如图6所示，该深度学习模型的训练装置600包括第一获取模块601、第二获取模块602、更新模块603和第一训练模块604。

第一获取模块601用于获取标准模型对标准数据源的标准输出结果。

第二获取模块602用于使用预训练模型针对标准数据源获取与标准输出结果一致的特征，其中，预训练模型是根据标准输出结果，使用标准数据源以及目标数据源进行训练得到的。

更新模块603用于将与标准输出结果一致的特征添加到目标数据源，得到更新的目标数据源。

第一训练模块604用于使用更新的目标数据源训练深度学习模型。

根据本公开的实施例，标准数据源包括多个样本，预训练模型包括N个子模型，N为大于1的整数；深度学习模型的训练装置600还包括第二训练模块，用于根据标准输出结果，使用标准数据源以及目标数据源训练N个子模型。第二训练模块包括划分单元和训练单元。

划分单元用于根据标准输出结果，将多个样本划分为N个样本簇。

训练单元用于使用N个样本簇以及目标数据源训练N个子模型。

根据本公开的实施例，标准输出结果为评估值。划分单元用于按照评估值进行排序；以及根据排序结果将多个样本划分为N个样本簇。

训练单元包括第一训练子单元和第二训练子单元。

第一训练子单元，用于使用第n个样本簇以及目标数据源训练第n个子模型，其中，n＝1，……，N。

第二训练子单元，用于通过对N个样本簇各自的样本设置对应的指定标签，使用N个样本簇以及目标数据源训练N个子模型。

根据本公开的实施例，第n个样本簇具有第n个评估值范围。

第一训练子单元用于将第n个样本簇以及目标数据源输入第n个子模型，得到第n个样本簇中的样本的评估值属于第n个评估值范围的第一概率；根据第n个样本簇中的样本的第一概率以及对应的真实标签，确定第n个子模型的损失；以及根据第n个子模型的损失，调整第n个子模型的参数。

第二获取模块602用于针对标准数据源中的样本，将样本输入第n个子模型，得到该样本的评估值属于第n个评估值范围的第一概率，作为与标准输出结果一致的该样本的第n个特征。

更新模块603用于将标准数据源中多个样本各自的N个特征添加到目标数据源，得到更新的目标数据源。

根据本公开的实施例，第n个样本簇具有第n个评估值范围，指定标签包括正标签和负标签。

第二训练子单元用于对第n个样本簇中的样本设置正标签，并对除第n个样本簇以外的剩余样本簇中的样本设置负标签；将N个样本簇以及目标数据源输入第n个子模型，得到N个样本簇中的样本的评估值属于第n个评估范围的第二概率；根据N个样本簇中的样本的第二概率以及对应的指定标签，确定第n个子模型的损失；以及根据第n个子模型的损失，调整第n个子模型的参数。

第二获取模块602用于针对标准数据源中的每个样本，将该样本输入第n个子模型，得到该样本的评估值属于第n个评估值范围的第二概率，作为与标准输出结果一致的该样本的第n个特征。

根据本公开的实施例，标准数据源包括对象的第一行为数据，目标数据源包括对象的第二行为数据。标准模型是处理精度大于阈值的模型。

图7是根据本公开的一个实施例的数据处理装置的框图。

如图7所示，该数据处理700可以包括第三获取模块701和处理模块702。

第三获取模块701用于获取对象针对产品的检索数据。

处理模块702用于将检索数据输入深度学习模型，得到对象交易产品的概率。

其中，深度学习模型是根据上述深度学习模型的训练装置训练得到的。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图8所示，设备800包括计算单元801，其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序，来执行各种适当的动作和处理。在RAM 803中，还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

设备800中的多个部件连接至I/O接口805，包括：输入单元806，例如键盘、鼠标等；输出单元807，例如各种类型的显示器、扬声器等；存储单元808，例如磁盘、光盘等；以及通信单元809，例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理，例如深度学习模型的训练方法和/或数据处理方法。例如，在一些实施例中，深度学习模型的训练方法和/或数据处理方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元808。在一些实施例中，计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM803并由计算单元801执行时，可以执行上文描述的深度学习模型的训练方法和/或数据处理方法的一个或多个步骤。备选地，在其他实施例中，计算单元801可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行深度学习模型的训练方法和/或数据处理方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种深度学习模型的训练方法，包括：

获取标准模型对标准数据源的标准输出结果；

使用预训练模型针对所述标准数据源获取与所述标准输出结果一致的特征，其中，所述预训练模型是根据所述标准输出结果，使用所述标准数据源以及目标数据源进行训练得到的；

将与所述标准输出结果一致的所述特征添加到所述目标数据源，得到更新的目标数据源；以及

使用所述更新的目标数据源训练所述深度学习模型。

2.根据权利要求1所述的方法，其中，所述标准数据源包括多个样本，所述预训练模型包括N个子模型，N为大于1的整数；所述方法还包括根据所述标准输出结果，使用所述标准数据源以及目标数据源训练所述N个子模型，包括：

根据所述标准输出结果，将所述多个样本划分为N个样本簇；以及

使用所述N个样本簇以及所述目标数据源训练所述N个子模型。

3.根据权利要求2所述的方法，其中，所述标准输出结果为评估值；所述根据所述标准输出结果，将所述多个样本划分为N个样本簇包括：

按照所述评估值进行排序；以及

根据排序结果将所述多个样本划分为所述N个样本簇。

4.根据权利要求3所述的方法，其中，所述使用所述N个样本簇以及所述目标数据源训练所述N个子模型包括：

使用第n个样本簇以及所述目标数据源训练第n个子模型，其中，n＝1，……，N；或者

通过对所述N个样本簇各自的样本设置对应的指定标签，使用所述N个样本簇以及所述目标数据源训练所述N个子模型。

5.根据权利要求4所述的方法，其中，所述第n个样本簇具有第n个评估值范围；所述使用第n个样本簇以及所述目标数据源训练第n个子模型包括：

将所述第n个样本簇以及所述目标数据源输入所述第n个子模型，得到所述第n个样本簇中的样本的评估值属于第n个评估值范围的第一概率；

根据所述第n个样本簇中的样本的第一概率以及对应的真实标签，确定所述第n个子模型的损失；以及

根据所述第n个子模型的损失，调整所述第n个子模型的参数。

6.根据权利要求5所述的方法，其中，

所述使用预训练模型针对所述标准数据源获取与所述标准输出结果一致的特征包括：

针对所述标准数据源中的样本，将所述样本输入第n个子模型，得到该样本的评估值属于第n个评估值范围的第一概率，作为与所述标准输出结果一致的该样本的第n个特征；

所述将与所述标准输出结果一致的所述特征添加到所述目标数据源，得到更新的目标数据源包括：

将所述标准数据源中多个样本各自的N个特征添加到所述目标数据源，得到所述更新的目标数据源。

7.根据权利要求4所述的方法，其中，所述第n个样本簇具有第n个评估值范围，所述指定标签包括正标签和负标签；所述通过对所述N个样本簇各自的样本设置对应的指定标签，使用所述N个样本簇以及所述目标数据源训练所述N个子模型包括：

对第n个样本簇中的样本设置正标签，并对除第n个样本簇以外的剩余样本簇中的样本设置负标签；

将所述N个样本簇以及目标数据源输入第n个子模型，得到N个样本簇中的样本的评估值属于第n个评估范围的第二概率；

根据所述N个样本簇中的样本的第二概率以及对应的指定标签，确定所述第n个子模型的损失；以及

8.根据权利要求7所述的方法，其中，

针对所述标准数据源中的样本，将所述样本输入第n个子模型，得到该样本的评估值属于第n个评估值范围的第二概率，作为与所述标准输出结果一致的该样本的第n个特征；

9.根据权利要求1至8中任一项所述的方法，其中，所述标准数据源包括对象针对产品的交易数据，所述目标数据源包括所述对象针对产品的检索数据。

10.一种数据处理方法，包括：

获取对象针对产品的检索数据；以及

将所述检索数据输入深度学习模型，得到所述对象交易所述产品的概率；

其中，所述深度学习模型是根据权利要求1至9中任一项所述的方法进行训练得到的。

11.一种深度学习模型的训练装置，包括：

第一获取模块，用于获取标准模型对标准数据源的标准输出结果；

第二获取模块，用于使用预训练模型针对所述标准数据源获取与所述标准输出结果一致的特征，其中，所述预训练模型是根据所述标准输出结果，使用所述标准数据源以及目标数据源进行训练得到的；

更新模块，用于将与所述标准输出结果一致的所述特征添加到所述目标数据源，得到更新的目标数据源；以及

第一训练模块，用于使用所述更新的目标数据源训练所述深度学习模型。

12.根据权利要求11所述的装置，其中，所述标准数据源包括多个样本，所述预训练模型包括N个子模型，N为大于1的整数；所述装置还包括第二训练模块，用于根据所述标准输出结果，使用所述标准数据源以及目标数据源训练所述N个子模型，所述第二训练模块包括：

划分单元，用于根据所述标准输出结果，将所述多个样本划分为N个样本簇；以及

训练单元，用于使用所述N个样本簇以及所述目标数据源训练所述N个子模型。

13.根据权利要求12所述的装置，其中，所述标准输出结果为评估值；所述划分单元用于按照所述评估值进行排序；以及根据排序结果将所述多个样本划分为所述N个样本簇。

14.根据权利要求13所述的装置，其中，所述训练单元包括：

第一训练子单元，用于使用第n个样本簇以及所述目标数据源训练第n个子模型，其中，n＝1，……，N；

第二训练子单元，用于通过对所述N个样本簇各自的样本设置对应的指定标签，使用所述N个样本簇以及所述目标数据源训练所述N个子模型。

15.根据权利要求14所述的装置，其中，所述第n个样本簇具有第n个评估值范围；所述第一训练子单元，用于将所述第n个样本簇以及所述目标数据源输入所述第n个子模型，得到所述第n个样本簇中的样本的评估值属于第n个评估值范围的第一概率；根据所述第n个样本簇中的样本的第一概率以及对应的真实标签，确定所述第n个子模型的损失；以及根据所述第n个子模型的损失，调整所述第n个子模型的参数。

16.根据权利要求15所述的装置，其中，

所述第二获取模块，用于针对所述标准数据源中的样本，将所述样本输入第n个子模型，得到该样本的评估值属于第n个评估值范围的第一概率，作为与所述标准输出结果一致的该样本的第n个特征；

所述更新模块，用于将所述标准数据源中多个样本各自的N个特征添加到所述目标数据源，得到所述更新的目标数据源。

17.根据权利要求14所述的装置，其中，所述第n个样本簇具有第n个评估值范围，所述指定标签包括正标签和负标签；所述第二训练子单元，用于对第n个样本簇中的样本设置正标签，并对除第n个样本簇以外的剩余样本簇中的样本设置负标签；将所述N个样本簇以及目标数据源输入第n个子模型，得到N个样本簇中的样本的评估值属于第n个评估范围的第二概率；根据所述N个样本簇中的样本的第二概率以及对应的指定标签，确定所述第n个子模型的损失；以及根据所述第n个子模型的损失，调整所述第n个子模型的参数。

18.根据权利要求17所述的装置，其中，

所述第二获取模块，用于针对所述标准数据源中的每个样本，将该样本输入第n个子模型，得到该样本的评估值属于第n个评估值范围的第二概率，作为与所述标准输出结果一致的该样本的第n个特征；

19.根据权利要求11至18中任一项所述的装置，其中，所述标准数据源包括对象针对产品的交易数据，所述目标数据源包括所述对象针对产品的检索数据。

20.一种数据处理装置，包括：

第三获取模块，用于获取对象针对产品的检索数据；以及

处理模块，用于将所述检索数据输入深度学习模型，得到所述对象交易所述产品的概率；

其中，所述深度学习模型是根据权利要求11至19中任一项所述的装置进行训练得到的。

21.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至10中任一项所述的方法。

22.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1至10中任一项所述的方法。

23.一种计算机程序产品，包括计算机程序，所述计算机程序存储于可读存储介质和电子设备其中至少之一上，所述计算机程序在被处理器执行时实现根据权利要求1至10中任一项所述的方法。