CN112784984A

CN112784984A - 一种模型训练方法及装置

Info

Publication number: CN112784984A
Application number: CN202110125583.0A
Authority: CN
Inventors: 韩岩; 王钰桥
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2021-01-29
Filing date: 2021-01-29
Publication date: 2021-05-11

Abstract

本申请公开了一种模型训练方法及装置，所述方法包括：根据第一模型和原始样本，确定对抗扰动；根据原始样本、对抗扰动和衰减因子确定第一梯度；其中，所述衰减因子用于减小所述对抗扰动对第一梯度的影响；根据所述第一梯度对所述第一模型进行更新，得到第二模型，应用本申请实施例所公开的方法进行模型训练，具有提高模型准确率的效果。

Description

一种模型训练方法及装置

技术领域

本申请涉及神经网络学习技术领域，尤其涉及一种模型训练方法及装置。

背景技术

神经网络是由大量的、简单的处理单元广泛地互相连接而形成的复杂网络系统，它反映了人脑功能的许多基本特征，是一个高度复杂的非线性动力学习系统。利用神经网络的学习能力，使它在对不确定性系统的控制过程中自动学习系统的特性，从而自动适应系统随时间的特性变异，以求达到对系统的最优控制。神经网络在自动过程中，需要提供大量的训练样本以进行训练，但是由于训练样本的数量是有限的，在有限的训练样本下，神经网络训练的准确性较低。

申请内容

本申请实施例提供一种模型训练方法及装置，具有提高模型准确率的效果。

本申请实施例第一方面提供一种模型的训练方法，所述方法包括：根据第一模型和原始样本，确定对抗扰动；根据原始样本、对抗扰动和衰减因子确定第一梯度；其中，所述衰减因子用于减小所述对抗扰动对第一梯度的影响；根据所述第一梯度对所述第一模型进行更新，得到第二模型。

根据本申请另一实施方式，所述根据第一模型和原始样本，确定对抗扰动，包括：根据所述第一模型和原始样本，确定第一损失函数；根据所述第一损失函数和原始样本对所述第一模型反向传播训练，获得第三模型和第二梯度；根据第一损失函数和所述第二梯度确定所述对抗扰动。

根据本申请另一实施方式，根据原始样本、对抗扰动和衰减因子确定第一梯度，包括：根据所述对抗扰动和所述原始样本确定虚拟样本；根据所述第三模型和所述虚拟样本，确定第二损失函数；根据所述第二损失函数和所述虚拟样本对所述第三模型进行反向传播训练，获得第四模型和第三梯度；根据所述衰减因子和所述第三梯度，确定第一梯度。

根据本申请另一实施方式，根据所述第一梯度对所述第一模型进行更新，得到第二模型，包括：根据第三模型对所述第四模型的目标参数进行还原，得到第五模型；根据所述第一梯度对所述第五模型进行更新，获得第二模型。

根据本申请另一实施方式，所述方法还包括：确定衰减函数，基于衰减函数确定衰减因子。

根据本申请另一实施方式，所述方法还包括：根据与所述第一模型对应的模型训练参数确定衰减函数，基于衰减函数确定衰减因子；其中，所述模型训练参数为模型训练时间和模型训练次数的至少一种。

根据本申请另一实施方式，所述衰减函数包含第一衰减函数和第二衰减函数；相应的，所述基于衰减函数确定衰减因子，包括：当所述模型训练参数满足预设参数阈值的情况下，根据所述第一衰减函数确定衰减因子；当所述模型训练参数不满足预设参数阈值的情况下，根据所述第二衰减函数确定衰减因子；其中，所述第一衰减函数和第二衰减函数存在差异。

根据本申请另一实施方式，所述方法还包括：将所述第二模型确定为第一模型；返回执行根据所述第一模型和原始样本，确定对抗扰动。

根据本申请另一实施方式，在所述得到第二模型之后，所述方法还包括：根据所述第二模型确定损失值；在所述损失值满足所述损失阈值的情况下，将所述第二模型确定为目标模型；其中，所述损失阈值为根据模型训练参数确定的。

本申请实施例第二方面提供一种模型的训练装置，所述装置包括：确定模块，用于根据第一模型和原始样本，确定对抗扰动；所述确定模块，还用于根据原始样本、对抗扰动和衰减因子确定第一梯度；其中，所述衰减因子用于减小所述对抗扰动对第一梯度的影响；更新模块，用于根据所述第一梯度对所述第一模型进行更新，得到第二模型。

根据本申请另一实施方式，所述确定模块，包括：确定子模块，用于根据所述第一模型和原始样本，确定第一损失函数；训练子模块，用于根据所述第一损失函数和原始样本对所述第一模型反向传播训练，获得第三模型和第二梯度；所述确定子模块，还用于根据第一损失函数和所述第二梯度确定所述对抗扰动。

根据本申请另一实施方式，所述确定子模块，还用于根据所述对抗扰动和所述原始样本确定虚拟样本；

所述确定子模块，还用于根据所述第三模型和所述虚拟样本，确定第二损失函数；

所述训练子模块，还用于根据所述第二损失函数和所述虚拟样本对所述第三模型进行反向传播训练，获得第四模型和第三梯度；

所述确定子模块，还用于根据所述衰减因子和所述第三梯度，确定第一梯度。

根据本申请另一实施方式，所述更新模块，包括：还原子模块，用于根据第三模型对所述第四模型的目标参数进行还原，得到第五模型；更新子模块，用于根据所述第一梯度对所述第五模型进行更新，获得第二模型。

根据本申请另一实施方式，所述确定模块，还用于确定衰减函数，基于衰减函数确定衰减因子。

根据本申请另一实施方式，所述确定模块，还用于根据与所述第一模型对应的模型训练参数确定衰减函数，基于衰减函数确定衰减因子；其中，所述模型训练参数为模型训练时间和模型训练次数的至少一种。

根据本申请另一实施方式，所述衰减函数包含第一衰减函数和第二衰减函数；相应的，所述确定子模块，还用于当所述模型训练参数满足预设参数阈值的情况下，根据所述第一衰减函数确定衰减因子；所述确定子模块，还用于当所述模型训练参数不满足预设参数阈值的情况下，根据所述第二衰减函数确定衰减因子；其中，所述第一衰减函数和第二衰减函数存在差异。

根据本申请另一实施方式，所述确定模块，还用于将所述第二模型确定为第一模型；所述装置还包括：返回模块，用于返回执行根据所述第一模型和原始样本，确定对抗扰动。

根据本申请另一实施方式，所述确定模块，还用于根据所述第二模型确定损失值；所述确定模块，还用于在所述损失值满足所述损失阈值的情况下，将所述第二模型确定为目标模型；其中，所述损失阈值为根据模型训练参数确定的。

本申请实施例提供的模型训练方法及装置，通过对抗扰动对第一梯度进行扰动，以提升第二模型的泛化能力，并通过衰减因子减小对抗扰动对第一梯度的影响，以避免第二模型存在过拟合问题，使第二模型具有较好的准确率。

需要理解的是，本申请的教导并不需要实现上面所述的全部有益效果，而是特定的技术方案可以实现特定的技术效果，并且本申请的其他实施方式还能够实现上面未提到的有益效果。

附图说明

通过参考附图阅读下文的详细描述，本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本申请的若干实施方式，其中：

图1示出了本申请一种实施例模型的训练方法的实现流程示意图；

图2示出了本申请另一种实施例模型的训练方法确定对抗扰动的实现流程示意图；

图3示出了本申请另一种实施例模型的训练方法确定第一梯度的实现流程示意图；

图4示出了本申请另一种实施例模型的训练方法确定目标模型的实现流程示意图；

图5为本申请另一种实施例模型的训练装置的实现流程示意图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解，给出这些实施方式仅仅是为使本领域技术人员能够更好地理解进而实现本申请，而并非以任何方式限制本申请的范围。相反，提供这些实施方式是为使本申请更加透彻和完整，并能够将本申请的范围完整地传达给本领域的技术人员。

下面结合附图和具体实施例对本申请的技术方案进一步详细阐述。

图1示出了本申请一种实施例模型的训练方法的实现流程示意图。

参见图1，本申请实施例第一方面提供一种模型的训练方法，方法包括：操作101，根据第一模型和原始样本，确定对抗扰动；操作102，根据原始样本、对抗扰动和衰减因子确定第一梯度；其中，衰减因子用于减小对抗扰动对第一梯度的影响；操作103，根据第一梯度对第一模型进行更新，得到第二模型。

本申请实施例提供的模型训练方法，通过对抗扰动对第一梯度进行扰动，以提升第二模型的泛化能力，并通过衰减因子减小对抗扰动对第一梯度的影响，以避免第二模型存在过拟合问题，通过第一梯度对第一模型进行更新，使第二模型具有较好的准确率。

在本方法操作101中，第一模型可以为未经过训练的原始模型、通用预训练模型或经过多轮训练的模型中的任一种或多种；模型类型可以为图像模型和文本模型；模型还可以是单一模型或组合模型。原始样本指代未经过操作102处理的样本，原始样本可以为采集获得的样本，也可以为经过数据预处理获得的样本，其中，原始样本的样本内容根据第一模型的类型和需要利用第二模型进行分类的信息内容进行确定，原始样本可以为离散样本，也可以连续样本。例如，当第二模型为应用于智能客服领域，原始样本可以为与智能客服对应的对话样本，当原始样本为对话样本，通过对抗扰动对原始样本进行扰动，使原始样本具有更多的可解释性。本方法根据原始样本的内容和与第一模型对应的参数确定对抗扰动，以使对抗扰动对原始样本的扰动更具针对性，效果更佳。

在本方法操作102中，衰减因子用于减小对抗扰动对第一梯度的影响。第一梯度可以用于描述第一模型与目标模型之间的准确度差距，以及能够为第一模型参数调整提供最优调整方向。具体的，第一梯度可以用向量表征，通过向量的数值和方向以确定差距和调整方向。根据原始样本、对抗扰动和衰减因子确定第一梯度，衰减因子可以通过减小对抗扰动对原始样本的影响以实现减少对抗扰动对第一梯度的影响的目的，衰减因子也可以通过减小第一梯度以实现减小对抗扰动对第一梯度的影响的目的。通过对抗扰动和衰减因子确定第一梯度，能够使根据第一梯度更新第一模型获得的第二模型更加准确。

在本方法操作103中，根据第一梯度对第一模型进行更新，得到第二模型。当第一模型根据第一梯度进行更新的情况下，能够使更新后的模型的准确率满足或者接近于目标模型。即第二模型可以为目标模型，也可以为相较于第一模型更加接近目标模型的模型。需要补充的是，通过将第二模型作为第一模型多次返回执行上述操作，将每一轮均获得的第二模型作为下一轮的第一模型重新执行，由于对抗扰动根据第一模型和原始样本确定，每一轮根据第一模型和原始样本所确定的对抗扰动会不同，进而能够在有限的原始样本的情况下，通过不同的对抗扰动和衰减因子确定不同的第一梯度，并通过第一梯度对第一模型进行逐轮更新，使第二模型能够逐渐接近直至满足目标模型的要求。通过上述方法，能够获得准确度更高的目标模型。

图2示出了本申请另一种实施例模型的训练方法确定对抗扰动的实现流程示意图。

参见图2，根据本申请另一实施方式，操作101，根据第一模型和原始样本，确定对抗扰动，包括：操作1011，根据第一模型和原始样本，确定第一损失函数；操作1012，根据第一损失函数和原始样本对第一模型反向传播训练，获得第三模型和第二梯度；操作1013，根据第一损失函数和第二梯度确定对抗扰动。

本方法可以根据原始样本和第一模型直接确定对抗扰动；也可以通过构建模型以根据原始样本和第一模型预测对抗扰动；还可以通过根据原始样本和第一模型进行数据处理以确定对抗扰动。

在一种实施场景中，首先，根据第一模型和原始样本，通过计算确定与第一模型和原始样本对应的前向损失函数，即第一损失函数，其中，根据任务类型，第一损失函数可以选为分类损失函数或回归损失函数中的一种，当任务类型为分类的情况下，第一损失函数可以选为多分类交叉熵损失函数，当任务类型为回归的情况下，第一损失函数可以选为均方误差损失函数。需要补充的是，下述其他损失函数或损失值的确定均可以通过这两种或其他损失函数进行确定。并根据第一损失函数和原始样本对第一模型进行反向传播训练，获得第三模型和第二梯度。其中，在反向传播训练中，通过第一损失函数和原始样本对第一模型进行第一次参数更新以获得第三模型，并获得与第三模型对应的第二梯度。第二梯度用于描述第三模型与目标模型之间的准确度偏差，以及能够为第三模型参数调整提供最优调整方向。之后，根据第一损失函数和第二梯度确定对抗扰动。对抗扰动不是无约束的，可以使对抗扰动的范数小于一预设常数，该常数可以基于衰减因子确定，具体的，通过公式可以表示为：

||Δx||≤∈(x)

其中，Δx为对抗扰动，∈(x)为一个预设常数。

可以根据第一损失函数和第二梯度作为参数构建对抗扰动函数，具体的，对抗扰动函数可以基于梯度上升的构思进行确定，以实现对第一梯度进行扰动的目的。对抗扰动可以对原始样本进行扰动，以使对应扰动后样本的损失函数的损失增加，实现扰动的目的。

在一种具体场景中，对抗扰动函数可以确定为：

其中，Δx为对抗扰动，∈(x)为一个常数，

为第二梯度，L(x,y；θ)为第一损失函数，其中，x为与第一损失函数对应的原始样本的输入信息，y与原始样本对应的标签信息，θ是与第一模型对应的模型参数。

为了防止对抗扰动过大，还可以通过构建其他的对抗扰动函数对抗扰动标准化；

在另一种具体场景中，对抗扰动函数可以确定为：

其中，Δx为对抗扰动，∈(x)为一个常数，

在再一种具体实施场景中，对抗扰动函数还可以确定为：

其中，Δx为对抗扰动，∈(x)为一个常数，

为第二梯度，L(x,y；θ)为第一损失函数，其中，x为与第一损失函数对应的原始样本，y与原始样本对应的样本标签，θ是与第一模型对应的模型参数。

可以理解的是，本方法以上述对抗扰动函数为启示，还可以构建其他对抗扰动函数。

图3示出了本申请另一种实施例模型的训练方法确定第一梯度的实现流程示意图。

参见图3，根据本申请另一实施方式，操作102，根据原始样本、对抗扰动和衰减因子确定第一梯度，包括：操作1021，根据对抗扰动和原始样本确定虚拟样本；操作1022，根据第三模型和虚拟样本，确定第二损失函数；操作1023，根据第二损失函数和虚拟样本对第三模型进行反向传播训练，获得第四模型和第三梯度；操作1024，根据衰减因子和第三梯度，确定第一梯度。

本方法可以通过对原始样本、对抗扰动和衰减因子进行整合，确定第一梯度，具体整合方式可以为相乘、相加或其他计算方式中的一种或多种。在一种实施情况下，可以先通过对抗扰动与原始样本进行相加整合，以获得虚拟样本，然后根据虚拟样本和第三模型进行前向传播，获得对应的前向损失函数，即第二损失函数，并根据第二损失函数和虚拟样本对第三模型进行反向传播训练，获得第四模型和第三梯度。其中，第二损失函数可以为分类损失函数或回归损失函数中的一种。同上，在反向传播训练中，通过第二损失函数和虚拟样本对第三模型进行第二次参数更新以获得第四模型，并获得与第四模型对应的第三梯度。在一种可实施方式中，该反向传播训练的函数可以为：

其中，D代表虚拟样本，x+Δx代表与虚拟样本对应的输入信息，y代表与虚拟样本对应的标签信息，θ'是与第三模型对应的模型参数，L(x+Δx,y；θ')是与单个虚拟样本对应的的第二损失函数，Δx是对抗扰动，Ω是与对抗扰动对应的扰动空间；θ”是与第四模型对应的模型参数。

其中，第三梯度用于描述第四模型与目标模型之间准确度的差距，以及能够为第四模型后续的参数调整提供最优调整方向。再通过衰减因子和第三梯度进行相乘整合，确定第一梯度，以使衰减因子对第三梯度进行减弱，从而得到第一梯度。

在另一种实施方式中，可以在获得对抗扰动之后，直接通过衰减因子与对抗扰动整合，该整合可以是相乘、相减、平均等整合方式，以降低对抗扰动的扰动量，通过整合衰减因子的对抗扰动与原始样本进行相加整合，从而获得另一种虚拟样本，通过另一种虚拟样本进行反向传播训练，以获得第四模型和第三梯度，在该种实施方式中，第三梯度即为第一梯度，其中衰减因子同样能够起到减小对抗扰动对第一梯度的影响的作用。

根据本申请另一实施方式，操作103，根据第一梯度对第一模型进行更新，得到第二模型，包括：首先，根据第三模型对第四模型的目标参数进行还原，得到第五模型；然后，根据第一梯度对第五模型进行更新，获得第二模型。

可以理解的是，当原始样本为离散样本，如文本数据的情况下，由原始样本和对抗扰动整合获得的虚拟样本对第三模型反向传播训练后，获得的第四模型的目标参数无法对应至原始样本，基于此，本方法对第四模型中的嵌入(Input Embedding)层中与词向量对应的参数(word_embedding)进行还原，将其还原为第三模型中的嵌入层中与词向量对应的参数，即目标参数为与词向量对应的参数，以获得第五模型，以使第五模型的目标参数能够对应至原始样本，然后根据第一梯度对第五模型的参数进行更新，获得第二模型。

需要补充的是，在另一种实施方式中，在获得第一梯度之后，可以通过第一梯度直接对第一模型或第三模型进行更新，获得另一种第二模型。两种方式所获得达到第二模型相较于第一模型均能够提升预测准确度。

根据本申请另一实施方式，方法还包括：首先，将第二模型确定为第一模型；然后，返回执行根据第一模型和原始样本，确定对抗扰动。

在进行模型训练过程中，通过将第二模型确定为第一模型，可以返回执行操作101至操作103。操作101至操作103的步骤可以多次循环，以使每一轮训练获得的第二模型能够逐渐接近目标模型，使每一轮得到的第二模型能够相较前一轮第二模型在准确度上进行提升。

图4示出了本申请另一种实施例模型的训练方法确定目标模型的实现流程示意图。

参见图4，根据本申请另一实施方式，在操作103，得到第二模型之后，方法还包括：操作401，根据第二模型确定损失值；操作402，在损失值满足损失阈值的情况下，将第二模型确定为目标模型；其中，损失阈值为根据模型训练参数确定的。为了获得目标模型，本方法可以设置预设条件，当第二模型满足预设条件的情况下，将满足预设条件的第二模型确定为目标模型。需要补充的是，当第二模型不满足预设条件的情况下，将不满足预设条件的第二模型确定为第一模型，然后返回执行根据第一模型和原始样本，确定对抗扰动。其中，预设条件可以是第二模型中某一类参数对应的阈值，如果第二模型中该类参数随着模型准确率的提升而下降，当第二模型中该参数低于和等于该阈值的情况下，可以认为第二模型满足预设条件。同理，如果第二模型中该类参数随着模型准确率的提升而提升，当第二模型中该参数低于和等于该阈值的情况下，可以认为第二模型满足预设条件。

在本方法一种实施场景中，预设条件可以为与损失值对应损失阈值，损失阈值可以是预设常数，也可以根据预设规则动态变化的阈值。在其中一种具体实施场景中，损失阈值可以根据模型训练参数确定，可以理解的是，模型训练参数为模型训练时间和模型训练次数的至少一种，在一种具体实施场景中，根据模型精度要求设置对应的模型训练最少时间步，基于模型的模型训练最少时间步确定对应的损失阈值，可以理解的是，模型训练最少时间步越少，对应的损失阈值的精度越小。损失阈值还可以包括损失差阈值和模型训练时间步。在一种具体的实施场景中，当模型训练时间步达到模型训练最少时间步之后，如果在预设数量的训练时间步内，模型的损失值变化小于损失差阈值，将与最后一轮模型训练对应的第二模型确定为目标模型。

根据本申请另一实施方式，方法还包括：确定衰减函数，基于衰减函数确定衰减因子。

在本方法中，衰减因子可以是一个常数，也可以是一个动态变化的数值。当衰减因子为动态变化的数值的情况下，可以通过动态调整衰减因子，使衰减因子能够自适应对应的对抗扰动，起到避免对抗扰动过大，从而减弱对抗扰动对第一梯度的影响的作用。本方法不对衰减函数的函数类型进行限制，其可以是余弦退火衰减函数、指数衰减函数、线性衰减函数等各种类型的衰减函数。本方法在构建衰减函数的时候，可以采用模型训练参数、对抗扰动、第一梯度等任一项或多项与模型训练相关的参数作为衰减函数的参数。例如，以对抗扰动作为衰减函数的参数，随着对抗扰动的增大，减小衰减因子的数值以减弱对抗扰动。

根据本申请另一实施方式，方法还包括：根据与第一模型对应的模型训练参数确定衰减函数，基于衰减函数确定衰减因子；其中，模型训练参数为模型训练时间和模型训练次数的至少一种。

本方法可以通过与第一模型对应的模型训练参数确定衰减函数，例如，根据设置与模型训练时间步相关的衰减函数，在一种实施情况下，训练时间步越多，衰减函数所对应的衰减因子越小，对对抗扰动的衰减效果越好。例如，衰减函数可以为：∈(ts)＝ts/gts+(1-α)。其中，∈(ts)为衰减因子，∈(ts)为0≤α≤1；ts表示模型训练当前时间步；gts表示预设模型训练总时间步；a为常数，a取值为0≤α≤1。

根据本申请另一实施方式，衰减函数包含第一衰减函数和第二衰减函数；相应的，基于衰减函数确定衰减因子，包括：当模型训练参数满足预设参数阈值的情况下，根据第一衰减函数确定衰减因子；当模型训练参数不满足预设参数阈值的情况下，根据第二衰减函数确定衰减因子；其中，第一衰减函数和第二衰减函数存在差异。

衰减函数还可以为通过多个存在差异的衰减函数构成的组合函数，即衰减函数至少包含第一衰减函数和第二衰减函数。第一衰减函数和第二衰减函数的差异包括但不限于，函数中的常数、函数的类型等其他中的一种或多种。第一衰减函数和第二衰减函数可以为：常数、指数函数、线性函数、余弦退火函数等多种函数其中至少一种。根据需要，本方法衰减函数还可以包括第三衰减函数、第四衰减函数，以下不做赘述。需要补充的是，本方法的多个衰减函数所形成的组合衰减函数为连续函数。

本方法在构建衰减函数的时候，可以随着模型训练参数的增大，降低由衰减函数获得的衰减因子的值，也可以是随着模型训练参数的增大，增大由衰减函数获得的衰减因子的值。本方法对模型训练参数进行分段处理，不同段的模型训练参数对应不同的衰减因子。在一种具体实施情况下，可以根据模型训练时间步构建两种衰减函数，在模型训练时间步的数值较低的情况下，采用数值接近或等于1的常数作为衰减因子，以能够快速根据对抗扰动确定模型参数的大致范围，随着模型训练时间步的数值增加，采用数值更小的值作为衰减因子，以提高模型参数的精确度。

在一种具体实施情况下，衰减函数可以为：

其中，∈(ts)为衰减因子，∈(ts)为0≤α≤1，ts表示模型训练时间步；wts表示模型训练分段时间步；其中，模型训练分段时间步小于预设模型训练总时间步，a为常数，a取值为0≤α≤1。在具体实施方式中，α可以常取值为0.8，wts取值为预设模型训练总时间步*0.8。在另一种实施场景中，衰减因子还可以基于第三梯度的值进行确定，即将上述场景中的模型训练时间步替换为与第三梯度对应的变量。

本申请实施例第二方面提供一种模型的训练装置，装置包括：确定模块501，用于根据第一模型和原始样本，确定对抗扰动；确定模块501，还用于根据原始样本、对抗扰动和衰减因子确定第一梯度；其中，衰减因子用于减小对抗扰动对第一梯度的影响；更新模块502，用于根据第一梯度对第一模型进行更新，得到第二模型。

根据本申请另一实施方式，确定模块501，包括：确定子模块5011，用于根据第一模型和原始样本，确定第一损失函数；训练子模块5012，用于根据第一损失函数和原始样本对第一模型反向传播训练，获得第三模型和第二梯度；确定子模块5011，还用于根据第一损失函数和第二梯度确定对抗扰动。

根据本申请另一实施方式，确定子模块5011，还用于根据对抗扰动和原始样本确定虚拟样本；

确定子模块5011，还用于根据第三模型和虚拟样本，确定第二损失函数；

训练子模块5012，还用于根据第二损失函数和虚拟样本对第三模型进行反向传播训练，获得第四模型和第三梯度；

确定子模块5011，还用于根据衰减因子和第三梯度，确定第一梯度。

根据本申请另一实施方式，更新模块502，包括：还原子模块5021，用于根据第三模型对第四模型的目标参数进行还原，得到第五模型；更新子模块5022，用于根据第一梯度对第五模型进行更新，获得第二模型。

根据本申请另一实施方式，确定模块501，还用于确定衰减函数，基于衰减函数确定衰减因子。

根据本申请另一实施方式，确定模块501，还用于根据与第一模型对应的模型训练参数确定衰减函数，基于衰减函数确定衰减因子；其中，模型训练参数为模型训练时间和模型训练次数的至少一种。

根据本申请另一实施方式，衰减函数包含第一衰减函数和第二衰减函数；相应的，确定子模块5011，还用于当模型训练参数满足预设参数阈值的情况下，根据第一衰减函数确定衰减因子；确定子模块5011，还用于当模型训练参数不满足预设参数阈值的情况下，根据第二衰减函数确定衰减因子；其中，第一衰减函数和第二衰减函数存在差异。

根据本申请另一实施方式，确定模块501，还用于将第二模型确定为第一模型；装置还包括：返回模块503，用于返回执行根据第一模型和原始样本，确定对抗扰动。

根据本申请另一实施方式，确定模块501，还用于根据第二模型确定损失值；确定模块501，还用于在损失值满足损失阈值的情况下，将第二模型确定为目标模型；其中，损失阈值为根据模型训练参数确定的。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本申请各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(Read Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种模型的训练方法，所述方法包括：

根据第一模型和原始样本，确定对抗扰动；

根据原始样本、对抗扰动和衰减因子确定第一梯度；其中，所述衰减因子用于减小所述对抗扰动对第一梯度的影响；

根据所述第一梯度对所述第一模型进行更新，得到第二模型。

2.根据权利要求1所述的方法，所述根据第一模型和原始样本，确定对抗扰动，包括：

根据所述第一模型和原始样本，确定第一损失函数；

根据所述第一损失函数和原始样本对所述第一模型反向传播训练，获得第三模型和第二梯度；

根据第一损失函数和所述第二梯度确定所述对抗扰动。

3.根据权利要求2所述的方法，根据原始样本、对抗扰动和衰减因子确定第一梯度，包括：

根据所述对抗扰动和所述原始样本确定虚拟样本；

根据所述第三模型和所述虚拟样本，确定第二损失函数；

根据所述第二损失函数和所述虚拟样本对所述第三模型进行反向传播训练，获得第四模型和第三梯度；

根据所述衰减因子和所述第三梯度，确定第一梯度。

4.根据权利要求3所述的方法，根据所述第一梯度对所述第一模型进行更新，得到第二模型，包括：

根据第三模型对所述第四模型的目标参数进行还原，得到第五模型；

根据所述第一梯度对所述第五模型进行更新，获得第二模型。

5.根据要求1所述的方法，所述方法还包括：

构建衰减函数，基于衰减函数确定衰减因子。

6.根据要求1所述的方法，所述方法还包括：

根据与所述第一模型对应的模型训练参数构建衰减函数，基于衰减函数确定衰减因子；

其中，所述模型训练参数为模型训练时间和模型训练次数的至少一种。

7.根据要求5所述的方法，所述衰减函数包含第一衰减函数和第二衰减函数；

相应的，所述基于衰减函数确定衰减因子，包括：

当所述模型训练参数满足预设参数阈值的情况下，根据所述第一衰减函数构建衰减因子；

当所述模型训练参数不满足预设参数阈值的情况下，根据所述第二衰减函数构建衰减因子；

其中，所述第一衰减函数和第二衰减函数存在差异。

8.根据权利要求1所述的方法，所述方法还包括：

将所述第二模型确定为第一模型；

返回执行根据所述第一模型和原始样本，确定对抗扰动。

9.根据权利要求1所述的方法，在所述得到第二模型之后，所述方法还包括：

根据所述第二模型确定损失值；

在所述损失值满足所述损失阈值的情况下，将所述第二模型确定为目标模型；

其中，所述损失阈值为根据模型训练参数确定的。

10.一种模型的训练装置，所述装置包括：

确定模块，用于根据第一模型和原始样本，确定对抗扰动；

所述确定模块，还用于根据原始样本、对抗扰动和衰减因子确定第一梯度；其中，所述衰减因子用于减小所述对抗扰动对第一梯度的影响；

更新模块，用于根据所述第一梯度对所述第一模型进行更新，得到第二模型。