CN116186781A

CN116186781A - 一种模型训练方法、装置、存储介质及电子设备

Info

Publication number: CN116186781A
Application number: CN202310329646.3A
Authority: CN
Inventors: 申书恒; 张长浩; 傅欣艺; 王维强
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2023-03-29
Filing date: 2023-03-29
Publication date: 2023-05-30

Abstract

本说明书公开了一种模型训练方法、装置、存储介质及电子设备。在本说明书提供的模型训练方法中，获取用户在历史上执行交易业务时的业务数据，作为私有样本数据；将所述私有样本数据输入待训练的目标模型，得到所述目标模型输出的所述交易业务的风险表征值；根据所述风险表征值和所述私有样本数据对应的标注，确定第一损失，根据所述第一损失确定所述目标模型的初始梯度；对所述初始梯度进行加扰，得到带扰梯度；将所述带扰梯度输入预先训练的降噪模型中，以通过所述降噪模型根据所述带扰梯度输出降噪梯度，所述降噪梯度用于模拟所述初始梯度各分量之间的关系；采用所述降噪梯度对所述目标模型的参数进行调整。

Description

一种模型训练方法、装置、存储介质及电子设备

技术领域

本说明书涉及计算机技术领域，尤其涉及一种模型训练方法、装置、存储介质及电子设备。

背景技术

如今，在各行业中，服务提供方与用户都越来越注重隐私数据的安全，在执行业务的各个阶段都会对隐私数据进行保护。例如，在一些根据用户提供的数据来为用户提供推荐、分析等服务的业务中，需要根据用户提供的数据来对具有相应功能的模型进行训练。而为了防止用户提供的数据被其他人所窃取，通常会采用差分隐私训练的方式来训练模型。

在差分隐私训练中，会通过对梯度添加噪声的方式来防止攻击者通过窃取训练时的梯度反推出用户的数据。但在上述方法中，对梯度添加噪声必然会对模型的训练产生一定程度的负面影响，降低模型的训练效果。

因此，如何在保护用户隐私数据的同时训练出效果较好的模型是一个亟待解决的问题。

发明内容

本说明书提供一种模型训练方法、装置、存储介质及电子设备，以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案：

本说明书提供了一种模型训练方法，包括：

获取用户在历史上执行交易业务时的业务数据，作为私有样本数据；

将所述私有样本数据输入待训练的目标模型，得到所述目标模型输出的所述交易业务的风险表征值；

根据所述风险表征值和所述私有样本数据对应的标注，确定第一损失，根据所述第一损失确定所述目标模型的初始梯度；

对所述初始梯度进行加扰，得到带扰梯度；

将所述带扰梯度输入预先训练的降噪模型中，以通过所述降噪模型根据所述带扰梯度输出降噪梯度，所述降噪梯度用于模拟所述初始梯度各分量之间的关系；

采用所述降噪梯度对所述目标模型的参数进行调整。

可选地，预先训练降噪模型，具体包括：

从公共数据集中获取公开业务的业务数据，作为公共样本数据，将所述公共样本数据输入待训练的对照模型，得到所述对照模型输出的所述公开业务的对照风险表征值，其中，所述对照模型与所述目标模型的结构相同；

根据所述对照风险表征值和所述公共样本数据对应的标注，确定对照损失，根据所述对照损失确定所述对照模型的对照梯度；

对所述对照梯度进行加扰，得到带扰对照梯度；

将所述带扰对照梯度输入待训练的降噪模型中，以通过所述降噪模型根据所述带扰对照梯度输出待优化降噪梯度；

以所述待优化降噪梯度与所述对照梯度之间的差异最小为优化目标，对所述降噪模型进行训练。

可选地，在确定所述目标模型的初始梯度之前，所述方法还包括：

获取所述目标模型的中间层输出的私有样本特征；

将所述公共样本数据输入所述目标模型，获取所述目标模型的中间层输出的公共样本特征；

确定所述私有样本特征与所述公共样本特征之间的第二损失。

可选地，根据所述第一损失确定所述目标模型的初始梯度，具体包括：

根据所述第一损失以及所述第二损失确定所述目标模型的初始梯度。

可选地，在对所述初始梯度进行加扰之前，所述方法还包括：

当所述初始梯度的值大于指定阈值时，将所述初始梯度的值调整为所述指定阈值。

可选地，对所述初始梯度进行加扰，具体包括：

针对所述初始梯度中的每个分量，在预设的噪声范围内确定扰动噪声，并对该分量的梯度值添加所述扰动噪声。

本说明书提供了一种模型训练装置，包括：

获取模块，用于获取用户在历史上执行交易业务时的业务数据，作为私有样本数据；

输入模块，用于将所述私有样本数据输入待训练的目标模型，得到所述目标模型输出的所述交易业务的风险表征值；

梯度确定模块，用于根据所述风险表征值和所述私有样本数据对应的标注，确定第一损失，根据所述第一损失确定所述目标模型的初始梯度；

加扰模块，用于对所述初始梯度进行加扰，得到带扰梯度；

降噪模块，用于将所述带扰梯度输入预先训练的降噪模型中，以通过所述降噪模型根据所述带扰梯度输出降噪梯度，所述降噪梯度用于模拟所述初始梯度各分量之间的关系；

调整模块，用于采用所述降噪梯度对所述目标模型的参数进行调整。

可选地，所述装置还包括预训练模块，具体用于从公共数据集中获取公开业务的业务数据，作为公共样本数据，将所述公共样本数据输入待训练的对照模型，得到所述对照模型输出的所述公开业务的对照风险表征值，其中，所述对照模型与所述目标模型的结构相同；根据所述对照风险表征值和所述公共样本数据对应的标注，确定对照损失，根据所述对照损失确定所述对照模型的对照梯度；对所述对照梯度进行加扰，得到带扰对照梯度；将所述带扰对照梯度输入待训练的降噪模型中，以通过所述降噪模型根据所述带扰对照梯度输出待优化降噪梯度；以所述待优化降噪梯度与所述对照梯度之间的差异最小为优化目标，对所述降噪模型进行训练。

可选地，所述装置还包括损失确定模块，具体用于获取所述目标模型的中间层输出的私有样本特征；将所述公共样本数据输入所述目标模型，获取所述目标模型的中间层输出的公共样本特征；确定所述私有样本特征与所述公共样本特征之间的第二损失。

可选地，所述梯度确定模块，具体用于根据所述第一损失以及所述第二损失确定所述目标模型的初始梯度。

可选地，所述装置还包括裁剪模块，具体用于当所述初始梯度的值大于指定阈值时，将所述初始梯度的值调整为所述指定阈值。

可选地，所述加扰模块，具体用于针对所述初始梯度中的每个分量，在预设的噪声范围内确定扰动噪声，并对该分量的梯度值添加所述扰动噪声。

本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述模型训练方法。

本说明书提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述模型训练方法。

本说明书采用的上述至少一个技术方案能够达到以下有益效果：

在本说明书提供的模型训练方法中，获取用户在历史上执行交易业务时的业务数据，作为私有样本数据；将所述私有样本数据输入待训练的目标模型，得到所述目标模型输出的所述交易业务的风险表征值；根据所述风险表征值和所述私有样本数据对应的标注，确定第一损失，根据所述第一损失确定所述目标模型的初始梯度；对所述初始梯度进行加扰，得到带扰梯度；将所述带扰梯度输入预先训练的降噪模型中，以通过所述降噪模型根据所述带扰梯度输出降噪梯度，所述降噪梯度用于模拟所述初始梯度各分量之间的关系；采用所述降噪梯度对所述目标模型的参数进行调整。

在采用本说明书提供的模型训练方法对目标模型进行训练时，可在采用私有样本数据训练目标模型时，对目标模型在反向传播的初始梯度进行加扰；通过预先训练的降噪模型出处理带扰梯度，得到保留了一定噪声的同时，能够反映出初始梯度的各分量之间的关系的降噪梯度；根据降噪梯度对目标模型进行调整，在保证了用于训练的私有业务数据不会暴露的基础上，提高了目标模型的训练效果。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，本说明书的示意性实施例及其说明用于解释本说明书，并不构成对本说明书的不当限定。在附

图中：

图1为本说明书中提供的一种模型训练方法的流程示意图；

图2为本说明书提供的一种模型训练装置的示意图；

图3为本说明书提供的一种对应于图1的电子设备示意图。

具体实施方式

如今，许多业务都能够根据用户的数据来针对不同的用户有区分地提供不同的服务，最大程度地保证每个用户的用户体验。在业务所需要使用到的数据中，有一部分数据是征得用户同意后获取的用户个人数据，属于用户隐私。显然，无论是用户还是业务平台都不希望这部分数据泄露出去。

目前，随着人工智能技术的不断发展，许多业务都能够依靠训练好的神经网络模型来完成。而在采用用户提供的数据进行训练的过程中，攻击者能够通过窃取神经网络模型在训练时产生的梯度反推出原始数据。为了防止这种情况发生，许多模型在进行训练时会采用差分隐私技术。

在差分隐私训练中，会对神经网络模型在反向传播时的梯度添加一个噪声，从而使攻击者即使能够窃取到梯度也无法反推出原始数据。然而，这种方式虽然保护了用户隐私，但不难想到，采用带有噪声的梯度对神经网络模型进行训练，必然会对神经网络模型的训练结果产生一定的负面影响。

因此，为解决上述技术问题，本说明书提供了一种能够在保护用户隐私数据的同时，提高神经网络模型训练效果的模型训练方法。

为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书保护的范围。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

图1为本说明书中提供的一种模型训练方法的流程示意图，包括以下步骤：

S100：获取用户在历史上执行交易业务时的业务数据，作为私有样本数据。

在本说明书中，用于实现模型训练方法的执行主体，可以指服务器等设置于业务平台的指定设备，为了便于描述，本说明书仅以服务器是执行主体为例，对本说明书提供的一种模型训练方法进行说明。

本说明书所提供的模型训练方法的主要应用场景为训练针对交易业务的风控模型，其主要功能为根据用户在执行交易业务时的业务数据，对用户执行的交易进行评价。根据模型输出的评价可确定用户执行的交易是否存在风险。在本说明书中，将以上述应用场景为例对本说明书提供的模型训练方法进行说明。

在交易业务的应用场景下，对需要进行训练的目标模型所采用的训练样本为用户在历史上执行交易业务时产生的业务数据。而通常情况下，业务数据中会包含部分用户个人的数据，因此，需要将获取到的业务数据作为私有样本数据处理，不应对外公开。

可以想到的，模型训练的方法较为通用，除本说明书中作为实施例的上述应用场景外，在其他应用场景中也可以采用本说明书提供的模型训练方法，采用不同的训练样本训练出不同功能的神经网络模型。对于该种情况，也应属于本说明书提供的模型训练方法的保护范围之内。

需要说明的是，本说明书中所有对用户数据进行获取、处理的动作都是在征得用户同意后进行实施的。

S102：将所述私有样本数据输入待训练的目标模型，得到所述目标模型输出的所述交易业务的风险表征值。

正如步骤S100中提到的，在本说明书所提供的模型训练方法中，待训练的目标模型为的主要功能为根据用户在执行交易业务时的业务数据，对用户执行的交易进行评价，也就是输出交易业务的风险表征值。因此，可在此步骤中确定目标模型输出的风险表征值。

S104：根据所述风险表征值和所述私有样本数据对应的标注，确定第一损失，根据所述第一损失确定所述目标模型的初始梯度。

在本说明书提供的模型训练方法中，私有样本数据为用户在历史上执行交易业务时的业务数据，而其对应的标注为交易业务是否存在风险。交易业务的标注是根据历史上的真实情况确定的，例如，当一个交易业务在历史上真实发生了风险或存在异常，那么其对应的标注即为“1”，表示该交易业务存在风险；而当一个交易业务在历史上不存在任何风险或异常时，其对应的标注可以为“0”，表示该交易业务不存在风险。

在确定第一损失时，标注“1”可对应于“100％”，“0”可对应于“0％”。目标模型输出的风险表征值的范围在[0，1]之间，用于表示一个交易业务存在风险的概率。根据标注与风险表征值能够确定出第一损失，用于表征标注与风险表征值之间的差异。其中，第一损失可通过多种不同的方式进行确定，例如交叉熵(Cross Entropy，CE)损失。

在训练时，利用得到的第一损失进行反向传播，便能够确定出目标模型初始梯度。

S106：对所述初始梯度进行加扰，得到带扰梯度。

基于差分隐私训练的思想，为了防止攻击者通过窃取目标模型在训练时的梯度进而破解出用于训练的业务数据，在此步骤中可对步骤S104中得到的初始梯度进行加扰，得到带扰梯度。

其中，对初始梯度进行加扰的方式可存在多种，本说明书在此提供一种实施例以供参考。具体的，可针对所述初始梯度中的每个分量，在预设的噪声范围内确定扰动噪声，并对该分量的梯度值添加所述扰动噪声。

本领域技术人员应当明白，梯度通常以矩阵的形式表示，而一个矩阵中会存在若干个不同的元素，也就是若干个不同的分量。针对初始梯度中的每个分量，可在预设的噪声范围内确定出一个扰动噪声，添加到该分量的梯度值上。其中，扰动噪声可以是在预设的噪声范围内随机选择出的噪声，也可以是按照一定的规则确定出的噪声，而预设的噪声范围可以根据具体需求确定，本说明书对此不做具体限制。但为了保证添加噪声的效果，为初始梯度的每个分量上添加的噪声都是单独确定的，并且通常不会为各分量添加相同大小的噪声。

额外的，在训练的过程中，还需要考虑到的一点是，由于梯度是通过样本数据对模型训练得到的，因此梯度与用于训练的样本数据具有一定的相关性，攻击者可以通过梯度反推出用于训练的样本数据。而在这之中，梯度越大，越容易导致样本数据暴露。即使在本说明书提供的模型训练方法中，会对初始梯度进行加扰，但不难想到，在添加的噪声大小取值范围固定的情况下，初始梯度越大，添加的噪声对初始梯度的影响就越小，仍有暴露部分数据的风险。

因此，为解决上述问题，可在得到初始梯度后，对初始梯度进行梯度裁剪。具体的，可在当所述初始梯度的值大于指定阈值时，将所述初始梯度的值调整为所述指定阈值。其中，初始梯度的值可以是指初始梯度的范数，也就是说，当初始梯度的范数大于指定阈值时，可对初始梯度中的每一个分量进行等比例的缩小，使初始梯度的范数等于指定阈值。

S108：将所述带扰梯度输入预先训练的降噪模型中，以通过所述降噪模型根据所述带扰梯度输出降噪梯度，所述降噪梯度用于模拟所述初始梯度各分量之间的关系。

在此步骤中，可将步骤S106中得到的带扰梯度输入预先训练的降噪模型中，得到降噪模型输出的降噪梯度。其中，降噪模型的功能为对带扰梯度进行降噪，同时，使得到的降噪梯度中存在初始梯度中各分量之间的关系。

实际上，在对模型进行训练时，得到的梯度中的各分量并不是完全混乱的。针对同一个模型进行训练时，在每次训练得到的梯度中，各分量之间会存在着一定的关系。同时，本领域技术人员应当明白，大多数情况下，在对模型进行训练时得到的梯度都是稀疏、低秩的。因此，在本说明书提供的模型训练方法中，可预先训练出一个降噪模型，使降噪模型实现对加扰模型进行降噪的同时，学习未添加噪声时的初始梯度的特性，也就是个分量之间的关系。由此，便能够使降噪模型输出的降噪梯度，在保留了适量的噪声的同时，应然能够反映出原本的初始梯度的各分量之间的关系。换句话说，在保留了必要的噪声，对私有业务数据进行保护的同时，去掉不必要的噪声，提高目标模型的训练效果。其中，初始梯度的各分量之间的关系，可以包括各分量的值的比例关系，也可以包括各分量的值之间的大小的趋势；同时，还可包括初始梯度本身的特性，例如稀疏、低秩等。

S110：采用所述降噪梯度对所述目标模型的参数进行调整。

在此步骤中，可采用步骤S108中确定出的目降噪梯度，对目标模型的参数进行调整。当调整后的目标模型满足应用需求后，便可结束训练；而如果调整后的目标模型仍不满足应用需求，可重新执行本说明书提供的模型训练方法，直到目标模型的参数满足应用需求。

在本说明书提供的模型训练方法中所使用的降噪模型，可预先进行训练。具体的，可从公共数据集中获取公开业务的业务数据，作为公共样本数据，将所述公共样本数据输入待训练的对照模型，得到所述对照模型输出的所述公开业务的对照风险表征值，其中，所述对照模型与所述目标模型的结构相同；根据所述对照风险表征值和所述公共样本数据对应的标注，确定对照损失，根据所述对照损失确定所述对照模型的对照梯度；对所述对照梯度进行加扰，得到带扰对照梯度；将所述带扰对照梯度输入待训练的降噪模型中，以通过所述降噪模型根据所述带扰对照梯度输出待优化降噪梯度；以所述待优化降噪梯度与所述对照梯度之间的差异最小为优化目标，对所述降噪模型进行训练。其中，待优化降噪梯度与对照梯度之间的差异可采用多种方式进行表示，例如均方误差(Mean Squared Error，MSE)损失等，本说明书对此不做具体限制。

由于降噪模型的功能时对带有噪声的梯度进行降噪，而梯度是神经网络模型在训练的过程中产生的量，因此，对降噪模型的训练需要在训练其他模型的过程中进行。另一方面，对于不同的模型，其结构不同，需要的参数不同，在训练过程中所产生的梯度的形式便也不相同。因此，为了保证训练出的降噪模型能够应用与目标模型中，需要在训练降噪模型时，采用与目标模型结构相同的对照模型进行辅助训练。

另外，由于在训练降噪模型的过程中，无法保证降噪模型的效果，因此，为了防止私有业务数据暴露，在训练降噪模型时，采用从公共数据集获取的公开业务的业务数据，作为输入对照模型的公共样本数据。

与训练目标模型时相似的，在训练对照模型时，公共样本数据也存在对应的标注。其标注的形式与私有样本数据的标注形式相同，也可用“1”和“0”表示，“1”表示对应的公开业务在历史上是存在风险的业务，“0”表示对应的公开业务在历史上是不存在风险的业务。而根据公共样本数据的标注以及对照模型输出的对照风险表征值，可确定出对照模型在训练时的对照梯度。

同样的，在训练的过程中也需要对对照梯度进行加扰，其加扰方式可与训练目标模型时对初始梯度的加扰方式相同，本说明书在此不再进行赘述。将加扰后的带扰对照梯度输入降噪模型中，得到降噪模型输出的待优化降噪梯度；以待优化降噪梯度和加扰前的对照梯度之间的差异最小为目标，对降噪模型进行训练。由此，在训练完成时便能够得到可以对加扰后的梯度进行降噪，并且模拟加扰前的梯度的各分量之间的关系的降噪模型。

由于在实际应用中，降噪模型并不可能达成100％的完美训练，因此，降噪模型并不能够将带有噪声的梯度的噪声完全去除，得到的降噪梯度必然会保留一部分噪声。而保留的这一部分噪声便能够继续用于对训练数据进行保护，去掉的噪声使模型的训练效果得到提升。

在对降噪模型进行训练时，降噪模型可学习到未添加噪声的梯度的各分量之间的关系。其中，各分量之间的关系可以是各分量的梯度值的比值，也可以是各分量之间的大小关系，也可以是上述两种情况的和。同时，降噪模型还能够学习到未添加噪声的梯度的特性，例如稀疏与低秩。其中，稀疏是指梯度中的大部分分量的值为0；低秩指梯度矩阵的秩较小。举例来说，在未添加噪声的梯度中，存在的值为0的分量，在添加噪声后分量值一定不再为0；而在经过降噪模型的处理后，该部分分量的值会重新变为0。

更进一步的，虽然对照模型与目标模型的结构相同，但公共样本数据与私有样本数据必然是存在差异的。因此，采用公共样本数据与私有样本数据分别训练对照模型与目标模型时，两个模型的参数变化情况也会存在差异，也就意味着模型的梯度存在差异。为了使采用对照模型辅助训练出的降噪模型能够更好地适配目标模型，可对目标模型与对照模型进行一定程度地对齐。具体的，可获取所述目标模型的中间层输出的私有样本特征；将所述公共样本数据输入所述目标模型，获取所述目标模型的中间层输出的公共样本特征；确定所述私有样本特征与所述公共样本特征之间的第二损失。

目标模型的中间层可以是目标模型中能够输出特征向量的任意一层。通常情况下，除了目标模型的最后一层，也就是输出层外，其它网络层均可作为中间层使用；为了保证最好的效果，一般采用目标模型中的第一层作为中间层进行使用。

在得到目标模型的中间层输出的私有样本特征的同时，可将公共样本数据也输入目标模型，得到目标模型的中间层输出的公共样本特征；确定私有样本特征与公有样本特征之间的第二损失。其中，第二损失可以通过多种方式得到，例如Coral损失等，本说明书对此不做具体限制。

在确定出第二损失后，可把第二损失作为参考量之一，与第一损失共同确定初始梯度。具体的，可根据所述第一损失以及所述第二损失确定所述目标模型的初始梯度。其中，可直接将第一损失和第二损失相加得到损失和，并根据损失和确定目标模型的初始梯度；也可分别给第一损失和第二损失赋予不同的权重，得到第一损失与第二损失的加权和，并根据加权和确定目标模型的初始梯度，本说明书对此不做具体限制。

以上为本说明书的一个或多个实施模型训练的方法，基于同样的思路，本说明书还提供了相应的模型训练装置，如图2所示。

图2为本说明书提供的一种模型训练装置的示意图，包括：

获取模块200，用于获取用户在历史上执行交易业务时的业务数据，作为私有样本数据；

输入模块202，用于将所述私有样本数据输入待训练的目标模型，得到所述目标模型输出的所述交易业务的风险表征值；

梯度确定模块204，用于根据所述风险表征值和所述私有样本数据对应的标注，确定第一损失，根据所述第一损失确定所述目标模型的初始梯度；

加扰模块206，用于对所述初始梯度进行加扰，得到带扰梯度；

降噪模块208，用于将所述带扰梯度输入预先训练的降噪模型中，以通过所述降噪模型根据所述带扰梯度输出降噪梯度，所述降噪梯度用于模拟所述初始梯度各分量之间的关系；

调整模块210，用于采用所述降噪梯度对所述目标模型的参数进行调整。

可选地，所述装置还包括预训练模块212，具体用于从公共数据集中获取公开业务的业务数据，作为公共样本数据，将所述公共样本数据输入待训练的对照模型，得到所述对照模型输出的所述公开业务的对照风险表征值，其中，所述对照模型与所述目标模型的结构相同；根据所述对照风险表征值和所述公共样本数据对应的标注，确定对照损失，根据所述对照损失确定所述对照模型的对照梯度；对所述对照梯度进行加扰，得到带扰对照梯度；将所述带扰对照梯度输入待训练的降噪模型中，以通过所述降噪模型根据所述带扰对照梯度输出待优化降噪梯度；以所述待优化降噪梯度与所述对照梯度之间的差异最小为优化目标，对所述降噪模型进行训练。

可选地，所述装置还包括损失确定模块214，具体用于获取所述目标模型的中间层输出的私有样本特征；将所述公共样本数据输入所述目标模型，获取所述目标模型的中间层输出的公共样本特征；确定所述私有样本特征与所述公共样本特征之间的第二损失。

可选地，所述梯度确定模块204，具体用于根据所述第一损失以及所述第二损失确定所述目标模型的初始梯度。

可选地，所述装置还包括裁剪模块216，具体用于当所述初始梯度的值大于指定阈值时，将所述初始梯度的值调整为所述指定阈值。

可选地，所述加扰模块206，具体用于针对所述初始梯度中的每个分量，在预设的噪声范围内确定扰动噪声，并对该分量的梯度值添加所述扰动噪声。

本说明书还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述图1提供的一种模型训练方法。

本说明书还提供了图3所示的一种对应于图1的电子设备的示意结构图。如图3所述，在硬件层面，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，以实现上述图1所述的模型训练方法。当然，除了软件实现方式之外，本说明书并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书的实施例可提供为方法、系统、或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种模型训练方法，包括：

对所述初始梯度进行加扰，得到带扰梯度；

采用所述降噪梯度对所述目标模型的参数进行调整。

2.如权利要求1所述的方法，预先训练降噪模型，具体包括：

对所述对照梯度进行加扰，得到带扰对照梯度；

3.如权利要求2所述的方法，在确定所述目标模型的初始梯度之前，所述方法还包括：

获取所述目标模型的中间层输出的私有样本特征；

4.如权利要求3所述的方法，根据所述第一损失确定所述目标模型的初始梯度，具体包括：

5.如权利要求1所述的方法，在对所述初始梯度进行加扰之前，所述方法还包括：

6.如权利要求1所述的方法，对所述初始梯度进行加扰，具体包括：

7.一种模型训练装置，包括：

加扰模块，用于对所述初始梯度进行加扰，得到带扰梯度；

8.如权利要求7所述的装置，所述装置还包括预训练模块，具体用于从公共数据集中获取公开业务的业务数据，作为公共样本数据，将所述公共样本数据输入待训练的对照模型，得到所述对照模型输出的所述公开业务的对照风险表征值，其中，所述对照模型与所述目标模型的结构相同；根据所述对照风险表征值和所述公共样本数据对应的标注，确定对照损失，根据所述对照损失确定所述对照模型的对照梯度；对所述对照梯度进行加扰，得到带扰对照梯度；将所述带扰对照梯度输入待训练的降噪模型中，以通过所述降噪模型根据所述带扰对照梯度输出待优化降噪梯度；以所述待优化降噪梯度与所述对照梯度之间的差异最小为优化目标，对所述降噪模型进行训练。

9.如权利要求8所述的装置，所述装置还包括损失确定模块，具体用于获取所述目标模型的中间层输出的私有样本特征；将所述公共样本数据输入所述目标模型，获取所述目标模型的中间层输出的公共样本特征；确定所述私有样本特征与所述公共样本特征之间的第二损失。

10.如权利要求9所述的装置，所述梯度确定模块，具体用于根据所述第一损失以及所述第二损失确定所述目标模型的初始梯度。

11.如权利要求7所述的装置，所述装置还包括裁剪模块，具体用于当所述初始梯度的值大于指定阈值时，将所述初始梯度的值调整为所述指定阈值。

12.如权利要求7所述的装置，所述加扰模块，具体用于针对所述初始梯度中的每个分量，在预设的噪声范围内确定扰动噪声，并对该分量的梯度值添加所述扰动噪声。

13.一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1～6任一项所述的方法。

14.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述权利要求1～6任一项所述的方法。