CN111027717A

CN111027717A - 一种模型训练方法和系统

Info

Publication number: CN111027717A
Application number: CN201911266382.1A
Authority: CN
Inventors: 郇兆鑫; 吴秉哲; 张晓露
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2019-12-11
Filing date: 2019-12-11
Publication date: 2020-04-17

Abstract

本说明书实施例公开了一种模型训练方法。所述方法包括：获取训练样本；使用所述训练样本，所述训练样本为样本图像、样本文本或样本语音，通过随机梯度朗之万动力学算法对初始模型进行多轮训练，得到目标模型，所述目标模型为图像分类模型、文本分类模型或语音分类模型，其中，所述多轮训练包括：基于所述训练样本，确定模型参数对应的梯度下降值；向所述梯度下降值添加随机噪声；判断本轮训练中所述随机梯度朗之万动力学算法是否进入朗之万动力学状态；当未进入朗之万动力学状态，基于所述添加了随机噪声后的梯度下降值，优化模型参数，进行下一轮训练；当进入朗之万动力学状态，从模型参数的后验概率分布中采样模型参数，确定所述目标模型。

Description

一种模型训练方法和系统

技术领域

本说明书涉及机器学习领域，特别涉及一种模型训练方法、系统、装置以及可读存储介质。

背景技术

机器学习模型的准确度长期以来都是评价模型性能的核心标准之一。而即使是经过充分训练的模型，也很容易被对抗样本攻破，导致模型给出错误的分类结果。对抗样本对分类模型分类结果的影响有可能会导致财产损失乃至威胁生命。例如，在保险理赔时，经过修改的事故图像能够使保险理赔模型判定的损伤情况比实际情况严重，从而导致过高的理赔数额。又例如，用户可以修改其面部图像，使人脸识别模型将其识别为其他用户，以盗取其他用户的信息。再例如，一个经过稍加修改的实体停车标志能够使得一个实时的物体识别系统将其误识别为限速标志，从而可能造成交通事故。因此，如何以较低成本有效提高模型的鲁棒性成为机器学习领域亟待解决的问题。

发明内容

本说明书实施例的一个方面提供一种模型训练方法。所述模型训练方法包括：获取训练样本；使用所述训练样本，通过随机梯度朗之万动力学算法对初始模型进行多轮训练，得到目标模型，所述目标模型为图像分类模型、文本分类模型或语音分类模型，其中，所述多轮训练包括：基于所述训练样本，确定模型参数对应的梯度下降值；向所述梯度下降值添加随机噪声；判断本轮训练中所述随机梯度朗之万动力学算法是否进入朗之万动力学状态；当未进入朗之万动力学状态，基于所述添加了随机噪声后的梯度下降值，优化模型参数，进行下一轮训练；当进入朗之万动力学状态，从模型参数的后验概率分布中采样模型参数，确定所述目标模型。

本说明书实施例的另一个方面提供一种模型训练系统，所述系统包括获取模块和训练模块；所述获取模块，用于获取训练样本；所述训练模块，用于使用所述训练样本，通过随机梯度朗之万动力学算法对初始模型进行多轮训练，得到目标模型，所述目标模型为图像分类模型、文本分类模型或语音分类模型，其中，所述多轮训练包括：基于所述训练样本，确定模型参数对应的梯度下降值；向所述梯度下降值添加随机噪声；判断本轮训练中所述随机梯度朗之万动力学算法是否进入朗之万动力学状态；当未进入朗之万动力学状态，基于所述添加了随机噪声后的梯度下降值，优化模型参数，进行下一轮训练；当进入朗之万动力学状态，从模型参数的后验概率分布中采样模型参数，确定所述目标模型。

本说明书实施例的另一个方面提供一种模型训练装置，包括至少一个存储介质和至少一个处理器，所述至少一个存储介质用于存储计算机指令；所述至少一个处理器用于执行所述计算机指令以实现如上所述的模型训练方法。

本说明书实施例的另一个方面提供一种计算机可读存储介质，所述存储介质存储计算机指令，当计算机读取存储介质中的计算机指令后，计算机执行如上所述的模型训练方法。

附图说明

本说明书将以示例性实施例的方式进一步说明，这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的，在这些实施例中，相同的编号表示相同的结构，其中：

图1是根据本说明书一些实施例所示的模型训练系统的示例性模块图；

图2是根据本说明书一些实施例所示的模型训练的示例性流程图；以及

图3是根据本说明书一些实施例所示的模型应用的示例性流程图。

具体实施方式

为了更清楚地说明本说明书实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本说明书的一些示例或实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明，图中相同标号代表相同结构或操作。

应当理解，本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而，如果其他词语可实现相同的目的，则可通过其他表达来替换所述词语。

如本说明书和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备也可能包含其它的步骤或元素。

本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是，前面或后面操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理各个步骤。同时，也可以将其他操作添加到这些过程中，或从这些过程移除某一步或数步操作。

模型参数优化算法的选择对于模型的训练至关重要。随机梯度下降算法(SGD，Stochastic Gradient Descent)具有很多的优良性质，SGD算法能够自动逃离鞍点和比较差的局部最优点，并且在快速计算的基础上，最终计算出来的结果也较好。本说明书的实施例在模型训练过程中采用朗之万动力学算法(SGLD，Stochastic gradient Langevindynamics)对模型参数进行优化。随机梯度朗之万动力学算法(SGLD，Stochastic gradientLangevin dynamics)，是一种结合了SGD算法、罗宾斯-门罗(Robbins-Monro)优化算法和朗之万动力学(Langevin dynamics)的一种优化算法。基于SGLD算法来训练模型，SLGD算法在优化过程中可以给模型的梯度添加随机噪声，而对抗样本的生成方式大多是根据模型的梯度信息设计的一些攻击方式，因此，在模型训练过程中，向模型梯度添加随机噪声，可以使得对抗样本由于模型梯度中已经具有随机噪声而攻击能力降低，从而提高了模型鲁棒性。

本说明书提供的模型训练方法可以应用于多种机器学习模型训练，包括分类模型与回归模型等。所述分类模型可以包括k近邻(k-Nearest Neighbors，KNN)模型、感知机、朴素贝叶斯模型、决策树模型、支持向量机(Support Vector Machine，SVM)模型、自适应提升(AdaBoost)模型、随机森林、贝叶斯网络、神经网络等。所述回归模型包括线性回归、逻辑回归、多项式回归(Polynomial Regression)、逐步回归(Stepwise Regression)、岭回归(Ridge Regression)、套索回归(Lasso Regression)、弹性回归(ElasticNet Regression)等。仅出于说明的目的，本说明书以分类模型为例，对披露的技术方案进行详细阐述，并不旨在限制本说明书的范围。以下通过对附图的描述阐述本说明书披露的技术方案。

图1是根据本说明书一些实施例所示的模型训练系统的示例性模块图。所述系统可以获取训练样本，并基于所述训练样本进行模型训练。如图1所示，所述模型训练系统可以包括获取模块110和训练模块120。

获取模块110可以获取训练样本。在一些实施例中，训练样本可以是指输入到模型中的样本数据。在一些实施例中，所述训练样本可以是图像样本、文本样本、语音样本等，图像样本可以是人脸图像样本、商品图像样本、保险图像样本等，文本样本可以是商品的文本描述，语音样本可以是人声。获取模块110可以直接从模型训练系统(例如，模型训练系统100)中获取，也可以从存储设备中获取，或通过网络从数据库中获取。关于训练样本的更多描述，可以在本说明书的其他部分找到，例如，关于对图2的描述中。

训练模块120可以对初始模型进行训练。在一些实施例中，训练模块120可以使用所述训练样本，通过随机梯度朗之万动力学算法对初始模型进行多轮训练，得到目标模型。其中，所述多轮训练包括：基于所述训练样本，确定模型参数对应的梯度下降值。可以向所述梯度下降值添加随机噪声。可以判断本轮训练中所述随机梯度朗之万动力学算法是否进入朗之万动力学状态。当未进入朗之万动力学状态，可以基于所述添加了随机噪声后的梯度下降值，优化模型参数，进行下一轮训练；当进入朗之万动力学状态，可以从模型参数的后验概率分布中采样模型参数，确定所述目标模型。关于模型训练过程的更多描述，可以在本说明书的其他部分找到，例如，关于对图2的描述中。

应当理解，图1所示的系统及其模块可以利用各种方式来实现。例如，在一些实施例中，系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中，硬件部分可以利用专用逻辑来实现；软件部分则可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本说明书的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用例如由各种类型的处理器所执行的软件实现，还可以由上述硬件电路和软件的结合(例如，固件)来实现。

需要注意的是，以上对于模型训练系统100及其模块的描述，仅为描述方便，并不能把本说明书限制在所举实施例范围之内。可以理解，对于本领域的技术人员来说，在了解该系统的原理后，可能在不背离这一原理的情况下，对各个模块进行任意组合，或者构成子系统与其他模块连接。例如，各个模块可以共用一个存储模块，各个模块也可以分别具有各自的存储模块。诸如此类的变形，均在本说明书的保护范围之内。

图2是根据本说明书一些实施例所示的模型训练的示例性流程图。在一些实施例中，流程200可以由模型训练系统100执行。如图2所示，流程200可以包括：

步骤202，获取训练样本。步骤202可以由获取模块110执行。

在一些实施例中，训练样本可以是样本图像、样本文本、样本语音等。在一些实施例中，用于模型训练的训练样本可以带有正确的样本类别标签。例如，样本图像可以是用于保险理赔的损伤图片,损伤图片反映事故情况，其标签可以是损伤等级。还可以是带有正确商品标签的商品图像，如，苹果、梨、西瓜、香蕉等图像。在一些实施例中，所述样本图像可以为含有用户个人信息的图像。例如，包含用户面部信息的图像，其标签为相应的用户身份(如姓名、身份证号、账号等)。又例如，训练样本可以是用户的语音数据，其标签为相应的用户身份。再例如，训练样本可以是金融产品的文本描述，其标签为相应的金融产品类别。训练样本可以用于进行模型训练以确定模型的参数。所述训练样本可以是人工输入到模型训练系统(例如，模型训练系统100)中的，也可以由获取模块110通过网络从存储设备，或图像、文本或语音数据库中获取。

在获取所述训练样本后，可通过随机梯度朗之万动力学(SGLD)算法对初始模型进行多轮训练，得到目标模型。在一些实施例中，初始模型可以是指未更新过模型参数的原始模型。例如，初始模型可以是未输入过训练样本，模型参数保持为原始构建时的参数的模型。初始模型可以是新构建的模型，也可以是通过获取模块110通过网络从存储设备，或数据库，或通过接口等其他方式获得。随机梯度朗之万动力学算法(SGLD)是一种迭代优化算法，通过该算法可以在训练过程中向梯度下降值添加噪声，从而提高模型的鲁棒性。具体的训练过程如下：

步骤204，基于所述训练样本，确定模型参数对应的梯度下降值。步骤204可以由训练模块120执行。

在一些实施例中，可以基于所述训练样本，确定在每轮模型训练中，模型参数对应的梯度下降值。梯度下降值用于调整模型参数。为了确定梯度下降值，可以首先确定模型参数对应的梯度。梯度用来确定调整模型参数的方向，使得模型参数沿梯度方向调整后，损失函数的值可达到最小，从而使输入数据经过模型处理后的结果与标签值之间的差距最小，以达到训练优化模型的目的。在确定了梯度后，再用梯度乘以步长得到梯度下降值，用所述梯度下降值对模型参数进行调整，即可得到更新后的模型参数。在一些实施例中，可以采用公式(1)所示的罗宾斯-门罗(Robbins-Monro)随机优化算法确定梯度下降值：

其中，θ_t是在第t次迭代时的模型参数，Δθ_t是第t次迭代时模型参数的梯度下降值，∈_t是第t次迭代时的步长，p(θ)是模型参数的先验分布，先验分布可以是进行模型训练之前根据其他有关参数而得到的分布，p(x|θ)是在给定参数θ下数据x的条件概率分布。在一些实施例中，∈_t需要满足

可以根据∈_t＝a(b+t)^-γ(a、b为常数γ∈(0.5,1])设定每轮迭代的∈_t。

步骤206，向所述梯度下降值添加随机噪声。步骤206可以由训练模块120执行。

在一些实施例中，在模型参数对应的梯度下降值确定后，可以向所述梯度下降值添加随机噪声。所述随机噪声可以是服从高斯分布、伯努利分布、泊松分布等的噪声。随机噪声可以向模型的梯度下降值添加不必要或多余的干扰信息。在向模型的梯度下降值添加随机噪声后，训练得到模型可以在对对抗样本进行分类时，可以有效地降低对抗样本的攻击能力，使得模型鲁棒性得到有效地提高。在一些实施例中，可以预先设置随机噪声服从何种分布，训练模块120随机生成服从该分布的噪声序列，再按照噪声序列中噪声的顺序依次向每轮训练中的梯度下降值添加相应噪声。以向Robbins-Monro随机优化算法所确定的梯度下降值中添加高斯噪声为例，模型参数的梯度下降值可以通过公式(2)确定：

与公式(1)相比，公式(2)中多出了噪声项η_t，该噪声服从方差为∈_t的高斯分布。

步骤208，判断本轮训练中所述随机梯度朗之万动力学算法是否进入朗之万动力学状态。步骤208可以由训练模块120执行。

在添加随机噪声后，可以判断本轮训练中SGLD算法是否进入朗之万动力学状态。

在一些实施例中，可以根据添加到梯度下降值的随机噪声与模型梯度下降值的方差，判断是否进入所述朗之万动力学状态。具体地，可以通过比较随机噪声的方差与梯度下降值的方差进行判断。可以预先设置一个远小于1的数值(如0.0001、0.0002等)，当梯度下降值的方差与随机噪声的方差的比值达到该数值时，表明进入朗之万动力学状态。例如，设定参数θ的对数似然估计的真实梯度为公式(3)：

设定公式(4)：

则公式(2)可以表示为：

利用对称预处理矩阵M进行处理后可将各维度转换为相同尺度，公式(5)经过矩阵M处理后可表示为公式(6)：

随机梯度θ_t的协方差矩阵可以根据公式(7)所示的经验协方差估计：

其中N为训练样本的总数量，n为参与随机梯度计算的训练样本的数量，

为第t轮迭代中第i个样本数据的得分，

为经验平均值。注意

其中V_s为得分{s_ti}的经验协方差。由此，随机梯度下降值的方差为

当满足公式(8)时，表明进入朗之万动力学状态：

其中

表示

的最大特征值。

当未进入朗之万动力学状态时，进行步骤210；当进入朗之万动力学状态时，进行步骤212。

步骤210，当未进入朗之万动力学状态，基于所述添加了随机噪声后的梯度下降值，优化模型参数，进行下一轮训练。步骤210可以由训练模块120执行。

当所述随机梯度朗之万动力学算法未进入朗之万动力学状态时，可以调整模型参数，调整的幅度为所述添加了随机噪声后的梯度下降值。具体地，模型参数为θ_t，梯度下降值为Δθ_t，则将模型参数更新为θ_t+1＝θ_t+Δθ_t。模型参数调整后，返回步骤204，进行下一轮训练。

步骤212，当进入朗之万动力学状态，从模型参数的后验概率分布中采样模型参数，确定所述目标模型。步骤212可以由训练模块120执行。

当所述随机梯度朗之万动力学算法进入朗之万动力学状态时，可以从模型参数的后验概率分布中采样模型参数，以用于确定所述目标模型。所述模型参数的后验概率是指模型参数为所需要的目标模型参数的概率。具体地，在进入朗之万动力学状态的轮次及之前的轮次中得到了多个模型参数θ₁、θ₂、θ₃……，这些模型参数的分布满足后验概率分布。在一些实施例中，可以从这些模型参数中确定后验概率最大的参数作为最终的模型参数。

在一些实施例中，所述目标模型可以通过反复重复步骤202至212，直到达到训练终止条件时得到。训练终止条件可以包括模型精度达到预设要求(例如，查准率达到97％、98％、99％等)、损失函数的值不再下降、模型训练达到预设训练迭代次数(例如，10000、20000、30000次等)等。

在一些实施例中，所述目标模型可以是图像分类模型。例如，如上文所述，训练样本可以是用于保险理赔的损伤图片。相应地，用所述训练样本训练得到的目标模型可以用来根据用于保险理赔的损伤图片来判定损伤等级，进一步确定理赔数额。某些别有用心之人会故意向损伤图片添加干扰(即生成对抗样本)，以使目标模型判定的损伤等级比实际情况糟糕，从而获取超出实际损伤的理赔金额。对抗样本可以根据目标模型的损失函数对于损伤图片的梯度确定，或者是将目标模型作为待优化的目标函数，用优化方法寻找满足目标函数的对抗样本。通过以上实施例所训练的目标模型，由于在训练过程中就向损失函数关于训练样本的梯度下降值中添加了随机噪声，模型学习的就是含有噪声的样本，因此，在模型应用时，其对于对抗样本就有比较强的鲁棒性，不容易被对抗样本干扰，更能正确地判定损伤等级，确定合理的理赔金额。又例如，训练样本可以是含有用户个人信息的图像，诸如用户的面部图像。相应地，目标模型可以用来根据用户的面部图像确定用户身份，从而允许用户执行相应操作。某些不法分子可能会对用户的面部图像进行修饰，使目标模型误判用户的身份，从而盗取其他用户的用户信息。而通过以上实施例所训练的目标模型，具有更强的鲁棒性，更能正确地识别用户的身份，保证用户信息的安全。

应当注意的是，上述有关流程200的描述仅仅是为了示例和说明，而不限定本说明书的适用范围。对于本领域技术人员来说，在本说明书的指导下可以对流程200进行各种修正和改变。然而，这些修正和改变仍在本说明书的范围之内。

图3是根据本说明书一些实施例所示的模型应用的示例性流程图。如图3所示，流程300图可以包括：

步骤302，向所述目标模型输入对抗样本，所述对抗样本通过在正常图像、文本或语音中添加干扰后得到。

在一些实施例中，所述正常图像可以是正常取景或拍摄等得到的未添加过干扰的图像，正常文本可以是正常文本输入得到的文本，正常语音可以是正常录音得到的语音。所述目标模型为经过图2所示基于SGLD算法的模型训练方法训练得到的模型。在一些实施例中，所述对抗样本可以是在正常图像、文本或语音中添加了干扰后得到的图像、文本或语音。在一些实施例中，向所述正常图像、文本或语音添加干扰可以为根据训练模型的训练样本，在将所述训练样本输入模型后，根据模型的损失函数对于训练样本的梯度下降值产生的对抗样本来向所述正常图像、文本或语音添加干扰。在一些实施例中，向所述正常图像、文本或语音添加干扰可以是以所述目标模型为待优化的模型，基于其他优化算法(例如，SGD，Adam等)等寻找满足所述目标模型的对抗样本，基于所述对抗样本向所述正常图像、文本或语音添加干扰。关于目标模型的更多说明，可以在本说明书的其他部分找到，例如，图2相关说明。

步骤304，用所述目标模型对所述对抗样本进行分类，得到正确的分类结果。

在一些实施例中，所述正确的分类结果可以是所述对抗样本所对应的正常图像、文本或语音的正确分类。例如，未添加干扰前的正常图像为小狗，在添加干扰后得到对抗样本，目标模型能够正确的输出对抗样本的分类结果为小狗，而不会将对抗样本分类为猫、鸡、鸭等。再例如，未添加干扰前的保险理赔图像的实际损伤等级为1级，在对保险理赔图像添加干扰后得到对抗样本，目标模型能够正确的输出所述对抗样本的实际损伤等级为1级，而不会将所述对抗样本的损伤等级输出为3级、4级或5级等。又例如，未添加干扰前的操作者面部图像实际属于用户A，不法分子企图通过添加干扰让目标模型将小明的面部图像识别为用户B以盗取用户B的信息，目标模型能够正确识别出用户A的身份，而不会将用户A的面部图像识别为用户B。

在一些实施例中，在使用目标模型对所述对抗样本进行分类时，由于目标模型在训练过程中已经向模型的梯度添加了随机噪声，因此，对抗样本对目标模型的攻击能力将会被削弱，目标模型也就能够输出对抗样本的正确分类结果。

应当注意的是，上述有关流程300的描述仅仅是为了示例和说明，而不限定本说明书的适用范围。对于本领域技术人员来说，在本说明书的指导下可以对流程300进行各种修正和改变。然而，这些修正和改变仍在本说明书的范围之内。

本说明书实施例可能带来的有益效果包括但不限于：(1)结合SGLD算法添加随机噪声的特点，将SGLD算法引入到对模型的训练中，在使用SGLD算法优化模型的过程中，通过随机给模型梯度添加随机噪声，使得训练得到模型对对抗样本输出为正确分类结果的能力得到有效地提升，即，有效地提高了模型鲁棒性；(2)模型训练的过程无需在模型训练前或模型的训练过程中增加额外的处理，避免了额外的计算资源消耗和开发成本。需要说明的是，不同实施例可能产生的有益效果不同，在不同的实施例里，可能产生的有益效果可以是以上任意一种或几种的组合，也可以是其他任何可能获得的有益效果。

上文已对基本概念做了描述，显然，对于本领域技术人员来说，上述详细披露仅仅作为示例，而并不构成对本说明书的限定。虽然此处并没有明确说明，本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议，所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。

同时，本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此，应强调并注意的是，本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外，本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外，本领域技术人员可以理解，本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述，包括任何新的和有用的工序、机器、产品或物质的组合，或对他们的任何新的和有用的改进。相应地，本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外，本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品，该产品包括计算机可读程序编码。

计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号，例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式，包括电磁形式、光形式等，或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质，该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播，包括无线电、电缆、光纤电缆、RF、或类似介质，或任何上述介质的组合。

本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写，包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等，常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP，动态编程语言如Python、Ruby和Groovy，或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下，远程计算机可以通过任何网络形式与用户计算机连接，比如局域网(LAN)或广域网(WAN)，或连接至外部计算机(例如通过因特网)，或在云计算环境中，或作为服务使用如软件即服务(SaaS)。

此外，除非权利要求中明确说明，本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用，并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的实施例，但应当理解的是，该类细节仅起到说明的目的，附加的权利要求并不仅限于披露的实施例，相反，权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如，虽然以上所描述的系统组件可以通过硬件设备实现，但是也可以只通过软件的解决方案得以实现，如在现有的服务器或移动设备上安装所描述的系统。

同理，应当注意的是，为了简化本说明书披露的表述，从而帮助对一个或多个实施例的理解，前文对本说明书实施例的描述中，有时会将多种特征归并至一个实施例、附图或对其的描述中。但是，这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上，实施例的特征要少于上述披露的单个实施例的全部特征。

一些实施例中使用了描述成分、属性数量的数字，应当理解的是，此类用于实施例描述的数字，在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明，“大约”、“近似”或“大体上”表明所述数字允许有±20％的变化。相应地，在一些实施例中，说明书和权利要求中使用的数值参数均为近似值，该近似值根据个别实施例所需特点可以发生改变。在一些实施例中，数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值，在具体实施例中，此类数值的设定在可行范围内尽可能精确。

针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料，如文章、书籍、说明书、出版物、文档等，特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外，对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是，如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方，以本说明书的描述、定义和/或术语的使用为准。

最后，应当理解的是，本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此，作为示例而非限制，本说明书实施例的替代配置可视为与本说明书的教导一致。相应地，本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

Claims

1.一种模型训练方法，所述方法包括：

获取训练样本，所述训练样本为样本图像、样本文本或样本语音；

使用所述训练样本，通过随机梯度朗之万动力学算法对初始模型进行多轮训练，得到目标模型，所述目标模型为图像分类模型、文本分类模型或语音分类模型，其中，所述多轮训练包括：

基于所述训练样本，确定模型参数对应的梯度下降值；

向所述梯度下降值添加随机噪声；

判断本轮训练中所述随机梯度朗之万动力学算法是否进入朗之万动力学状态；

当未进入朗之万动力学状态，基于所述添加了随机噪声后的梯度下降值，优化模型参数，进行下一轮训练；

当进入朗之万动力学状态，从模型参数的后验概率分布中采样模型参数，确定所述目标模型。

2.根据权利要求1所述的方法，所述随机噪声为服从高斯分布、伯努利分布或泊松分布的噪声。

3.根据权利要求1所述的方法，所述训练样本为含有用户个人信息的图像、文本或语音；

所述目标模型用于确定用户身份。

4.根据权利要求1所述的方法，所述方法还包括：

向所述目标模型输入对抗样本，所述对抗样本通过在正常图像、文本或语音中添加干扰后得到；

用所述目标模型对所述对抗样本进行分类，得到正确的分类结果。

5.一种模型训练系统，所述系统包括获取模块和训练模块；

所述获取模块，用于获取训练样本，所述训练样本为样本图像、样本文本或样本语音；

所述训练模块，用于使用所述训练样本，通过随机梯度朗之万动力学算法对初始模型进行多轮训练，得到目标模型，所述目标模型为图像分类模型、文本分类模型或语音分类模型，其中，所述多轮训练包括：

基于所述训练样本，确定模型参数对应的梯度下降值；

向所述梯度下降值添加随机噪声；

6.根据权利要求5所述的系统，所述随机噪声为服从高斯分布、伯努利分布或泊松分布的噪声。

7.根据权利要求5所述的系统，所述训练样本为含有用户个人信息的图像、文本或语音；

所述目标模型用于确定用户身份。

8.根据权利要求5所述的系统，所述系统还包括输入模块和确定模块；

所述输入模块，用于向所述目标模型输入对抗样本，所述对抗样本通过在正常图像、文本或语音中添加干扰后得到；

所述确定模块，用于用所述目标模型对所述对抗样本进行分类，得到正确的分类结果。

9.一种模型训练装置，包括至少一个存储介质和至少一个处理器，所述至少一个存储介质用于存储计算机指令；所述至少一个处理器用于执行所述计算机指令以实现如权利要求1～4任一项所述的方法。

10.一种计算机可读存储介质，所述存储介质存储计算机指令，当计算机读取存储介质中的计算机指令后，计算机执行如权利要求1～4任一项所述的方法。