WO2021174935A1

WO2021174935A1 - 对抗生成神经网络的训练方法及系统

Info

Publication number: WO2021174935A1
Application number: PCT/CN2020/134889
Authority: WO
Inventors: 陈卓均; 陆进; 陈斌; 宋晨
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-03-03
Filing date: 2020-12-09
Publication date: 2021-09-10
Also published as: CN111445007B; CN111445007A

Abstract

一种对抗生成神经网络的训练方法，包括步骤：建立初始判别神经网络和初始生成神经网络以组成初始对抗生成神经网络（S100）；初始化初始对抗生成神经网络的参数和边界向量（S102）；获取真实样本集合和随机变量集合，并将随机变量集合输入到初始生成神经网络中以生成假样本集合（S104）；将真实样本集合和假样本集合输入到初始判别神经网络，以得到第一判别输出和第二判别输出（S106）；根据预设的判别损失函数进行计算得到判别损失值（S108）；根据预设的生成损失函数进行计算得到生成损失值（S110）；根据判别损失值和生成损失值对初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络（S112）。通过该方法，能够提高对抗生成神经网络的训练速度和稳定性。

Description

对抗生成神经网络的训练方法及系统

本申请要求于2020年3月3日提交中国专利局、申请号为202010138371.1，发明名称为“对抗生成神经网络的训练方法及系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及计算机技术领域，尤其涉及一种对抗生成神经网络的训练方法、系统、计算机设备及存储介质。

背景技术

赫瑞-瓦特大学(Heriot-Watt University)和谷歌深度神经(Google Deepmind)公司的大规模对抗生成网络训练案例表明，以折页损失函数(Hinge Loss)作为目标函数可以提高对抗生成网络的稳定性。但是，发明人发现，目前的训练方法对Hinge Loss边界的改变相当敏感，边界小时训练稳定，但生成效果偏差；边界大时训练容易造成判别器梯度消失或发生崩溃，但是效果更好。但是如果人工对边界进行调参会严重影响效率；另一方面，目前使判别器输出一维标量然后以其计算目标损失的方法依赖于单一维度的固定边界，会带来模型表征能力的局限性，而且一旦该维度出现崩溃，整个网络将无法恢复，所以训练难度仍然很大。

因此，本申请实施例旨在解决对抗生成神经网络稳定性差和效率低的问题。

发明内容

有鉴于此，本申请实施例提供了一种对抗生成神经网络的训练方法、系统、计算机设备及计算机可读存储介质，能够将对抗生成神经网络的输出映射为高维输出，使得对抗生成神经网络可以在不同的维度和边界进行训练，从而获得较大的收敛梯度，提高了对抗生成神经网络的训练速度和稳定性。

本申请实施例是通过下述技术方案来解决上述技术问题：

一种对抗生成神经网络的训练方法，包括：

建立初始判别神经网络和初始生成神经网络，并将所述初始判别神经网络和所述初始生成神经网络组成初始对抗生成神经网络；

初始化所述初始对抗生成神经网络的参数和所述初始判别神经网络的边界向量，其中，所述边界向量是一个具有预设维度数量的多维向量，所述初始对抗生成神经网络的参数包括所述初始判别神经网络的判别参数和所述初始生成神经网络的生成参数；

获取真实样本集合和随机变量集合，并将所述随机变量集合输入到所述初始生成神经网络中，以生成假样本集合；

将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络，以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出；

根据预设的判别损失函数L _D＝E[max(0,M-D(x))]+E[max(0,M+D(G(z)))]对所述第一判别输出和所述第二判别输出进行计算以得到判别损失值，其中，L _D表示判别损失值，E表示数学期望值，max(0,M-D(x))表示关于0和M-D(x)的最大值函数，max(0,M+D(G(z)))表示关于0和M+D(G(z))的最大值函数，M表示所述边界向量，D(x)表示所述第一判别输出，D(G(z))表示所述第二判别输出；

根据预设的生成损失函数L _G＝-E[D(G(z))]对所述第二判别输出进行计算以得到生成损失值，其中，L _G表示所述生成损失值；

根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络。

为了实现上述目的，本申请实施例还提供一种对抗生成神经网络的训练系统，包括：

建立模块，用于建立初始判别神经网络和初始生成神经网络，并将所述初始判别神经网络和所述初始生成神经网络组成初始对抗生成神经网络；

初始化模块，用于初始化所述初始对抗生成神经网络的参数和所述初始判别神经网络的边界向量，其中，所述边界向量是一个具有预设维度数量的多维向量，所述初始对抗生成神经网络的参数包括所述初始判别神经网络的判别参数和所述初始生成神经网络的生成参数；

生成模块，用于获取真实样本集合和随机变量集合，并将所述随机变量集合输入到所述初始生成神经网络中，以生成假样本集合；

输出模块，用于将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络，以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出；

第一计算模块，用于根据预设的判别损失函数L _D＝E[max(0,M-D(x))]+E[max(0,M+D(G(z)))]对所述第一判别输出和所述第二判别输出进行计算以得到判别损失值，其中，L _D表示判别损失值，E表示数学期望值，max(0,M-D(x))表示关于0和M-D(x)的最大值函数，max(0,M+D(G(z)))表示关于0和M+D(G(z))的最大值函数，M表示所述边界向量，D(x)表示所述第一判别输出，D(G(z))表示所述第二判别输出；

第二计算模块，用于根据预设的生成损失函数L _G＝-E[D(G(z))]对所述第二判别输出进行计算以得到生成损失值，其中，L _G表示所述生成损失值；

更新模块，用于根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络。

为了实现上述目的，本申请实施例还提供一种计算机设备，所述计算机设备包括存储器、处理器以及存储在所述存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下方法：

为了实现上述目的，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行以下方法：

本申请通过多维的边界向量将对抗生成神经网络的输出映射为高维输出，使得对抗生成神经网络可以在不同的维度和边界进行训练，从而获得较大的收敛梯度，提高了对抗生成神经网络的训练速度和稳定性。

以下结合附图和具体实施例对本申请进行详细描述，但不作为对本申请的限定。

附图说明

图1为本申请实施例一之对抗生成神经网络的训练方法的步骤流程图；

图2为本申请实施例二之对抗生成神经网络的训练系统的程序模块示意图；

图3为本申请实施例三之计算机设备的硬件结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本申请要求的保护范围之内。

本申请的技术方案可应用于人工智能、区块链和/或大数据技术领域，具体可涉及神经网络技术。可选的，本申请涉及的数据如真实样本和/或各种参数等可存储于数据库中，或者可以存储于区块链中，比如通过区块链分布式存储，本申请不做限定。

实施例一

请参阅图1，示出了本申请实施例一之对抗生成神经网络的训练方法的步骤流程图。可以理解，本方法实施例中的流程图不用于对执行步骤的顺序进行限定。下面以计算机设备为执行主体进行示例性描述，具体如下：

步骤S100，建立初始判别神经网络和初始生成神经网络，并将所述初始判别神经网络和所述初始生成神经网络组成初始对抗生成神经网络。

对抗生成神经网络(Generative Adversarial Net，GAN)，是一种深度学习神经网络，其核心思想源于博弈论的纳什均衡，由一个生成网络G和一个判别网络D组成。以生成图片为例，其中，生成网络G接收一个随机的噪声Z，并通过这个噪声生成图片生成并输出一张假的照片G(Z)；判别网络接收输入的真照片X或假照片G(Z)，并判断出照片的真假。在训练的过程中，生成网络G的目标就是尽量生成真实的图片去欺骗判别网络D，让判别网络无法判断G(Z)的真假。

具体的，在本实施例中，首先建立初始对抗生成神经网络，所述初始对抗生成神经网络由初始判别神经网络D和初始生成神经网络G组成。其中，所述初始生成神经网络是反卷积神经网络；所述初始判别神经网络是标准的卷积神经网络，所述初始判别神经网络至少包括输入层、卷积层、全连接层和输出层。

示例性的，以反卷积神经网络为基础建立初始生成神经网络，以卷积神经网络为基础建立初始判别神经网络，所述初始生成神经网络和所述初始判别神经网络组成一个用来生成人脸图片的初始对抗生成神经网络，其中，所述以卷积网络建立的初始判别神经网络包括输入层、卷积层、池化层、激活层、全连接层和输出层。

步骤S102，初始化所述初始对抗生成神经网络的参数和所述初始判别神经网络的边界向量，其中，所述边界向量是一个具有预设维度数量的多维向量，所述初始对抗生成神经网络的参数包括所述初始判别神经网络的判别参数和所述初始生成神经网络的生成参数。

具体的，在建立了初始对抗生成神经网络后，则初始化所述初始对抗生成神经网络的参数和所述初始判别神经网络的边界向量M，并将所述边界向量M作为所述初始判别神经网络的输出层的输出参数，其中，所述边界向量M是一个多维的向量，用以将所述初始判别神经网络的输出由单一维度映射为与所述边界向量M对应的多维度；所述初始对抗生成神经网络的参数指的是所述初始判别神经网络和初始生成神经网络的卷积核、步幅、权值和偏置等参数。

在一较佳实施例中，初始化所述初始判别神经网络的边界向量时，可以根据所述边界向量的维度数量和预设的数学分布公式进行取值以生成所述边界向量。

具体的，首先根据预设的多维向量M的维度数量和数学分布公式进行随机取值以生成所述边界向量M，其中，在实际应用中，所述边界向量M的维度应足够大，例如512维，以使对抗生成神经网络的边界更加多样化、所采样的空间更加拟合；所述预设的数学分布公式可以是均匀分布U(0，3]或者数值大于0的截断的正态分布。生成所述边界向量M后，则将其作为所述初始判别神经网络的输出层的输出映射参数，用以对所述输出层的输出进行多维映射。

示例性的，预设的边界向量M的维度为1*10，即10维，所采用的数学分布公式为均匀分布U(0，3]，则随机取值生成的边界向量为M＝{0.2，0.5，0.9，1.1，1.4，1.7，2.2，2.6，2.9，3}。生成所述边界向量M后，将其作为初始判别神经网络的输出映射参数，以期将初始判别神经网络的输出映射为10维的向量。

步骤S104，获取真实样本集合和随机变量集合，并将所述随机变量集合输入到所述初始生成神经网络中，以生成假样本集合。

具体的，真实样本集合X是一系列真实的样本的集合，随机变量集合Z是一组通过标准正太分布获得的随机噪声。所述随机变量集合Z用于生成假的样本，所述真实样本集合用于对所述初始判别神经网络进行训练，将假样本和真样本一起对所述初始判别神经网络进行训练可以提高所述初始判别神经网络鉴别真假样本的能力。

示例性的，真实样本数据集合X可以是一些真实的人脸照片，随机变量集合Z是一组通过标准正太分布取值的随机向量。所述计算机设备将一组随机变量输入到所述初始生成网络，经过卷积、池化、激活和反卷积等操作，可以生成并输出一些假的人脸图片G(Z)。

步骤S106，将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络，以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出。

具体的，将真实样本集合X和所述初始生成网络生成的假样本集合G(Z)输入到所述初始判别神经网络D的输入层，经过卷积层、池化层、激活层、全连接层的处理后，在输出层输出对所述真实样本集合和假样本集合的判别概率。其中，对真实样本集合X的判别概率为D(X)，对假样本集合G(Z)的判别概率为D(G(Z))。

示例性的，将真实的人脸图片和生成的假的人脸图片输入到初始判别网络中，经过卷积、池化、激活等操作后，在全连接层中赋予一定的权重，然后在输出层经过输出映射参数的映射后分别输出对应的判别概率D(X)和D(G(Z))。

在一较佳实施例中，将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出的步骤，具体包括：将所述真实样本集合输入至所述初始判别神经网络中，并根据所述边界向量将与所述真实样本集合对应的第一输出映射为与所述边界向量对应的第一多维向量，以得到所述第一判别输出；

将所述假样本集合输入至所述初始判别神经网络中，并根据所述边界向量将与所述假样本集合对应的第二输出映射为与所述边界向量对应的第二多维向量，以得到所述第二判别输出。

具体的，在没有经过所述边界M的映射之前，判别概率只是一个表征图片真假概率的介于[0，1]的数值，其中，0表示假，1表示真。经过所述边界向量M的多维映射之后，输出的是一个与所述边界向量M的维度对应的多维度向量。所述真实样本集合X输入到所述初始判别神经网络中，经过一系列的操作和所述边界向量M的多维映射后，输出对应的多维向量D(X)；所述假样本集合输入到所述初始判别神经网络中，经过一系列的操作和所述边界向量M的多维映射后，输出对应的多维向量D(G(Z))。

示例性的，将真实的人脸图片输入到所述初始判别神经网络中，经过映射后输出的多维向量是D(X)，将生成的假的人脸图片输入到所述初始判别神经网络中，经过映射后输出的多维向量是D(G(Z))。

步骤S108，根据预设的判别损失函数L _D＝E[max(0,M-D(x))]+E[max(0,M+D(G(z)))]对所述第一判别输出和所述第二判别输出进行计算以得到判别损失值，其中，L _D表示判别损失值，E表示数学期望值，max(0,M-D(x))表示关于0和M-D(x)的最大值函数，max(0,M+D(G(z)))表示关于0和M+D(G(z))的最大值函数，M表示所述边界向量，D(x)表示所述第一判别输出，D(G(z))表示所述第二判别输出。

具体的，在本实施例中，E所表示的数学期望值指的是对期望值函数内的各个数值求算数平均数得到的均值，max所表示的最大值函数具体指的是对最大值函数内的数值求最大值。

示例性的，通过边界向量M映射得到的第一判别输出为D(x)＝{0.3，0.5，0.6，0.9，1.6，1.8，2.1，2.4，2.5，2.9}，第二判别输出为D(G(z))＝{0.1，0.2，0.5，1.0，1.3，1.8，2.3， 2.4，2.7，3}，则E[max(0,M-D(x))]＝(0+0+0.3+0.2+0+0+0.1+0.2+0.4+0.1)÷10＝0.13，E[max(0,M+D(G(z)))]＝(0.1+0.3+0.4+0.1+0.1+0+0.1+0.2+0.2+0)÷10＝0.15，L _D＝0.13+0.15＝0.28。

步骤S110，根据预设的生成损失函数L _G＝-E[D(G(z))]对所述第二判别输出进行计算以得到生成损失值，其中，L _G表示所述生成损失值。

示例性的，第二判别输出为D(G(z))＝{0.1，0.2，0.5，1.0，1.3，1.8，2.3，2.4，2.7，3}，则L _G＝-E[D(G(z))]＝-[(0.1+0.2+0.5+1.0+1.3+1.8+2.3+2.4+2.7+3)]÷10＝-3.06。

步骤S112，根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络。

具体的，根据所述判别损失函数的判别损失值对所述初始判别神经网络的输出层的参数进行偏导函数的求导，得到第一求导结果，并根据所述第一求导结果对所述输出层的参数进行更新；然后将所述第一求导结果反向传播给前面的全连接层，以更新全连接层的参数，以此类推，直至更新完输入层的参数，以得到目标判别神经网络。同样的，初始生成神经网络的更新根据所述生成损失值采用求导和反向传播的方法进行更新，以得到目标生成神经网络，并将所述目标判别神经网络和所述目标生成神经网络组成所述目标对抗生成神经网络。

示例性的，根据判别损失值L _D＝0.28对初始判别神经网络的输出层的权值进行偏导函数的求导，以得到第一求导结果，并根据所述第一求导结果更新所述权值；然后将第一求导结果反向传播给全连接层，并根据第一求导结果更新全连接层的权值；最后将第一求导结果反向传播给卷积层，以更新卷积层的卷积核。以此类推，通过求导和反向传播，更新初始判别神经网络的所有参数。

在一较佳实施例中，根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新之前，还将所述判别损失值与第一预设阈值时进行比较，当所述判别损失值大于第一预设阈值时，则对所述判别参数进行更新，以得到目标判别神经网络；将所述生成损失值与第二预设阈值进行比较，当所述生成损失值大于第二预设阈值时，则对所述生成参数进行更新，以得到目标生成神经网络。

本申请实施例通过多维的边界向量将对抗生成神经网络的输出映射为高维输出，使得对抗生成神经网络可以在不同的维度和边界进行训练，从而获得较大的收敛梯度，提高了对抗生成神经网络的训练速度和稳定性。

实施例二

请参阅图2，示出了本申请实施例二之对抗生成神经网络的训练系统的程序模块示意图。可以理解，本方法实施例中的流程图不用于对执行步骤的顺序进行限定。在本实施例中，对抗生成神经网络的训练系统20可以包括或被分割成一个或多个程序模块，一个或者多个程序模块被存储于存储介质中，并由一个或多个处理器所执行，以完成本申请，并可实现上述对抗生成神经网络的训练方法。本申请实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段，比程序本身更适合于描述对抗生成神经网络的训练系统20在存储介质中的执行过程。以下描述将具体介绍本实施例各程序模块的功能：

建立模块200，用于建立初始判别神经网络和初始生成神经网络，并将所述初始判别神经网络和所述初始生成神经网络组成初始对抗生成神经网络。

GAN是一种深度学习神经网络，其核心思想源于博弈论的纳什均衡，由一个生成网络G和一个判别网络D组成。以生成图片为例，其中，生成网络G接收一个随机的噪声Z，并通过这个噪声生成图片生成并输出一张假的照片G(Z)；判别网络接收输入的真照片X或假照片G(Z)，并判断出照片的真假。在训练的过程中，生成网络G的目标就是尽量生成真实的图片去欺骗判别网络D，让判别网络无法判断G(Z)的真假。

具体的，在本实施例中，所述建立模块200首先建立初始对抗生成神经网络，所述初始对抗生成神经网络由初始判别神经网络D和初始生成神经网络G组成。其中，所述初始生成神经网络是反卷积神经网络；所述初始判别神经网络是标准的卷积神经网络，所述初始判别神经网络至少包括输入层、卷积层、全连接层和输出层。

初始化模块202，用于初始化所述初始对抗生成神经网络的参数和所述初始判别神经网络的边界向量，其中，所述边界向量是一个具有预设维度数量的多维向量，所述初始对抗生成神经网络的参数包括所述初始判别神经网络的判别参数和所述初始生成神经网络的生成参数。

具体的，在所述建立模块200建立了初始对抗生成神经网络后，所述初始化模块202初始化所述初始对抗生成神经网络的参数和所述初始判别神经网络的边界向量M，并将所述边界向量M作为所述初始判别神经网络的输出层的输出参数，其中，所述边界向量M是一个多维的向量，用以将所述初始判别神经网络的输出由单一维度映射为与所述边界向量M对应的多维度；所述初始对抗生成神经网络的参数指的是所述初始判别神经网络和初始生成神经网络的卷积核、步幅、权值和偏置等参数。

在一较佳实施例中，所述初始化模块202在初始化所述初始判别神经网络的边界向量时，还根据所述边界向量的维度数量和预设的数学分布公式进行取值以生成所述边界向量。

具体的，所述初始化模块202首先根据预设的多维向量M的维度数量和数学分布公式进行随机取值以生成所述边界向量M，其中，在实际应用中，所述边界向量M的维度应足够大，例如512维，以使对抗生成神经网络的边界更加多样化、所采样的空间更加拟合；所述预设的数学分布公式可以是均匀分布U(0，3]或者数值大于0的截断的正态分布。生成所述边界向量M后，则将其作为所述初始判别神经网络的输出层的输出映射参数，用以对所述输出层的输出进行多维映射。

生成模块204，用于获取真实样本集合和随机变量集合，并将所述随机变量集合输入到所述初始生成神经网络中，以生成假样本集合。

输出模块206，用于将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络，以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出。

具体的，所述输出模块206将真实样本集合X和所述初始生成网络生成的假样本集合 G(Z)输入到所述初始判别神经网络D的输入层，经过卷积层、池化层、激活层、全连接层的处理后，在输出层输出对所述真实样本集合和假样本集合的判别概率。其中，对真实样本集合X的判别概率为D(X)，对假样本集合G(Z)的判别概率为D(G(Z))。

示例性的，所述输出模块206将真实的人脸图片和生成的假的人脸图片输入到初始判别网络中，经过卷积、池化、激活等操作后，在全连接层中赋予一定的权重，然后在输出层经过输出映射参数的映射后分别输出对应的判别概率D(X)和D(G(Z))。

在一较佳实施例中，所述输出模块206将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出的步骤，还可以包括：将所述真实样本集合输入至所述初始判别神经网络中，并根据所述边界向量将与所述真实样本集合对应的第一输出映射为与所述边界向量对应的第一多维向量，以得到所述第一判别输出；将所述假样本集合输入至所述初始判别神经网络中，并根据所述边界向量将与所述假样本集合对应的第二输出映射为与所述边界向量对应的第二多维向量，以得到所述第二判别输出。

示例性的，所述输出模块206将真实的人脸图片输入到所述初始判别神经网络中，经过映射后输出的多维向量是D(X)，将生成的假的人脸图片输入到所述初始判别神经网络中，经过映射后输出的多维向量是D(G(Z))。

第一计算模块208，用于根据预设的判别损失函数L _D＝E[max(0,M-D(x))]+E[max(0,M+D(G(z)))]对所述第一判别输出和所述第二判别输出进行计算以得到判别损失值，其中，L _D表示判别损失值，E表示数学期望值，max(0,M-D(x))表示关于0和M-D(x)的最大值函数，max(0,M+D(G(z)))表示关于0和M+D(G(z))的最大值函数，M表示所述边界向量，D(x)表示所述第一判别输出，D(G(z))表示所述第二判别输出。

示例性的，通过边界向量M映射得到的第一判别输出为D(x)＝{0.3，0.5，0.6，0.9，1.6，1.8，2.1，2.4，2.5，2.9}，第二判别输出为D(G(z))＝{0.1，0.2，0.5，1.0，1.3，1.8，2.3，2.4，2.7，3}，则E[max(0,M-D(x))]＝(0+0+0.3+0.2+0+0+0.1+0.2+0.4+0.1)÷10＝0.13，E[max(0,M+D(G(z)))]＝(0.1+0.3+0.4+0.1+0.1+0+0.1+0.2+0.2+0)÷10＝0.15，L _D＝0.13+0.15＝0.28。

第二计算模块210，用于根据预设的生成损失函数L _G＝-E[D(G(z))]对所述第二判别输出进行计算以得到生成损失值，其中，L _G表示所述生成损失值。

更新模块212，用于根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络。

具体的，所述更新模块212根据所述判别损失函数的判别损失值对所述初始判别神经网络的输出层的参数进行偏导函数的求导，得到第一求导结果，并根据所述第一求导结果对所述输出层的参数进行更新；然后将所述第一求导结果反向传播给前面的全连接层，以更新全连接层的参数，以此类推，直至更新完输入层的参数，以得到目标判别神经网络。同样的，初始生成神经网络的更新根据所述生成损失值采用求导和反向传播的方法进行更新，以得到目标生成神经网络，并将所述目标判别神经网络和所述目标生成神经网络组成所述目标对抗生成神经网络。

在一较佳实施例中，所述更新模块212根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新之前，还将所述判别损失值与第一预设阈值时进行比较，当所述判别损失值大于第一预设阈值时，则对所述判别参数进行更新，以得到目标判别神经网络；将所述生成损失值与第二预设阈值进行比较，当所述生成损失值大于第二预设阈值时，则对所述生成参数进行更新，以得到目标生成神经网络。

实施例三

参阅图3，是本申请实施例三之计算机设备的硬件架构示意图。本实施例中，所述计算机设备2是一种能够按照事先设定或者存储的指令，自动进行数值计算和/或信息处理的设备。该计算机设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。如图3所示，所述计算机设备2至少包括，但不限于，存储器和处理器，存储器上可存储有计算机程序，并可在处理器上运行，处理器可执行计算机程序时实现上述方法中的部分或全部步骤。可选的，该计算机设备还可包括网络接口和/或对抗生成神经网络的训练系统。例如，该计算机设备包括存储器21、处理器22、网络接口23以及对抗生成神经网络的训练系统20，可通过系统总线相互通信连接存储器21、处理器22、网络接口23、以及对抗生成神经网络的训练系统20。其中：

本实施例中，存储器21至少包括一种类型的计算机可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器21可以是计算机设备2的内部存储单元，例如该计算机设备2的硬盘或内存。在另一些实施例中，存储器21也可以是计算机设备2的外部存储设备，例如该计算机设备2上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中，存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件，例如实施例二的对抗生成神经网络的训练系统20的程序代码等。此外，存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器22在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制计算机设备2 的总体操作。本实施例中，处理器22用于运行存储器21中存储的程序代码或者处理数据，例如运行对抗生成神经网络的训练系统20，以实现实施例一的对抗生成神经网络的训练方法。

所述网络接口23可包括无线网络接口或有线网络接口，该网络接口23通常用于在所述计算机设备2与其他电子装置之间建立通信连接。例如，所述网络接口23用于通过网络将所述计算机设备2与外部终端相连，在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication，GSM)、宽带码分多址(Wideband Code Division Multiple Access，WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。

示例的，处理器可调用存储器存储的介质或程序实现以下方法：

可选的，该处理器还可执行该介质或程序实现上述实施例中方法的其他步骤，这里不再赘述。

需要指出的是，图3仅示出了具有部件20-23的计算机设备2，但是应理解的是，并不要求实施所有示出的部件，可以替代的实施更多或者更少的部件。

在本实施例中，存储于存储器21中的所述对抗生成神经网络的训练系统20还可以被分割为一个或者多个程序模块，所述一个或者多个程序模块被存储于存储器21中，并由一个或多个处理器(本实施例为处理器22)所执行，以完成本申请。

例如，图2示出了所述对抗生成神经网络的训练系统20的程序模块示意图，该实施例中，所述对抗生成神经网络的训练系统20可以被划分为建立模块200、初始化模块202、生成模块204、输出模块206、第一计算模块208、第二计算模块210和更新模块212。其中，本申请所称的程序模块是指能够完成特定功能的一系列计算机程序指令段，比程序更适合于描述所述对抗生成神经网络的训练系统20在所述计算机设备2中的执行过程。所述程序模块200-212的具体功能在实施例二中已有详细描述，在此不再赘述。

实施例四

本实施例还提供一种计算机可读存储介质，如闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等，其上存储有计算机程序，程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储对抗生成神经网络的训练系统20，被处理器执行时实现实施例一的对抗生成神经网络的训练方法。例如，计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行以下方法：

可选的，该计算机程序被处理器执行时还可实现上述实施例中方法的其他步骤，这里不再赘述。进一步可选的，本申请涉及的存储介质如计算机可读存储介质可以是非易失性的，也可以是易失性的。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种对抗生成神经网络的训练方法，其中，包括：

建立初始判别神经网络和初始生成神经网络，并将所述初始判别神经网络和所述初始生成神经网络组成初始对抗生成神经网络；

初始化所述初始对抗生成神经网络的参数和所述初始判别神经网络的边界向量，其中，所述边界向量是一个具有预设维度数量的多维向量，所述初始对抗生成神经网络的参数包括所述初始判别神经网络的判别参数和所述初始生成神经网络的生成参数；

获取真实样本集合和随机变量集合，并将所述随机变量集合输入到所述初始生成神经网络中，以生成假样本集合；

将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络，以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出；

根据预设的判别损失函数L _D＝E[max(0,M-D(x))]+E[max(0,M+D(G(z)))]对所述第一判别输出和所述第二判别输出进行计算以得到判别损失值，其中，L _D表示判别损失值，E表示数学期望值，max(0,M-D(x))表示关于0和M-D(x)的最大值函数，max(0,M+D(G(z)))表示关于0和M+D(G(z))的最大值函数，M表示所述边界向量，D(x)表示所述第一判别输出，D(G(z))表示所述第二判别输出；

根据预设的生成损失函数L _G＝-E[D(G(z))]对所述第二判别输出进行计算以得到生成损失值，其中，L _G表示所述生成损失值；

根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络。
根据权利要求1所述的对抗生成神经网络的训练方法，其中，所述初始判别神经网络的边界向量的初始化，包括：

接收用户发送的初始化指令，以获取所述预设维度数量，并确定所述预设维度数量中的每一个维度；及

根据预设数学分布公式的值域对所述每一个维度进行随机取值，以得到所述边界向量。
根据权利要求1所述的对抗生成神经网络的训练方法，其中，所述将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络，以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出，包括：

将所述真实样本集合输入至所述初始判别神经网络中，并根据所述边界向量将与所述真实样本集合对应的第一输出映射为与所述边界向量对应的第一多维向量，得到所述第一判别输出；

将所述假样本集合输入至所述初始判别神经网络中，并根据所述边界向量将与所述假样本集合对应的第二输出映射为与所述边界向量对应的第二多维向量，得到所述第二判别输出。
根据权利要求1所述的对抗生成神经网络的训练方法，其中，所述根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络，包括：

当所述判别损失值大于第一预设阈值时，则对所述判别参数进行更新，以得到目标判别神经网络；

当所述生成损失值大于第二预设阈值时，则对所述生成参数进行更新，以得到目标生成神经网络；

将所述目标判别神经网络和所述目标生成神经网络进行组合，得到所述目标对抗生成神经网络。
根据权利要求4所述的对抗生成神经网络的训练方法，其中，所述对所述判别参数进行更新，包括：

根据所述判别损失值，将所述判别参数进行求导，得到第一求导结果，并将所述第一求导结果反向传播，以根据所述第一求导结果更新所述判别参数。
根据权利要求4所述的对抗生成神经网络的训练方法，其中，所述对所述生成参数进行更新，包括：

根据所述生成损失值，将所述生成参数进行求导，得到第二求导结果，并将所述第二求导结果反向传播，以根据所述第二求导结果更新所述生成参数。
一种对抗生成神经网络的训练系统，其中，包括：

建立模块，用于建立初始判别神经网络和初始生成神经网络，并将所述初始判别神经网络和所述初始生成神经网络组成初始对抗生成神经网络；

初始化模块，用于初始化所述初始对抗生成神经网络的参数和所述初始判别神经网络的边界向量，其中，所述边界向量是一个具有预设维度数量的多维向量，所述初始对抗生成神经网络的参数包括所述初始判别神经网络的判别参数和所述初始生成神经网络的生成参数；

生成模块，用于获取真实样本集合和随机变量集合，并将所述随机变量集合输入到所述初始生成神经网络中，以生成假样本集合；

输出模块，用于将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络，以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出；

第一计算模块，用于根据预设的判别损失函数L _D＝E[max(0,M-D(x))]+E[max(0,M+D(G(z)))]对所述第一判别输出和所述第二判别输出进行计算以得到判别损失值，其中，L _D表示判别损失值，E表示数学期望值，max(0,M-D(x))表示关于0和M-D(x)的最大值函数，max(0,M+D(G(z)))表示关于0和M+D(G(z))的最大值函数，M表示所述边界向量，D(x)表示所述第一判别输出，D(G(z))表示所述第二判别输出；

第二计算模块，用于根据预设的生成损失函数L _G＝-E[D(G(z))]对所述第二判别输出进行计算以得到生成损失值，其中，L _G表示所述生成损失值；

更新模块，用于根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络。
根据权利要求7所述的对抗生成神经网络的训练系统，其中，所述输出模块还用于：

将所述真实样本集合输入至所述初始判别神经网络中，并根据所述边界向量将与所述真实样本集合对应的第一输出映射为与所述边界向量对应的第一多维向量，得到所述第一判别输出；

将所述假样本集合输入至所述初始判别神经网络中，并根据所述边界向量将与所述假样本集合对应的第二输出映射为与所述边界向量对应的第二多维向量，得到所述第二判别输出。
一种计算机设备，所述计算机设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现以下方法：

建立初始判别神经网络和初始生成神经网络，并将所述初始判别神经网络和所述初始生成神经网络组成初始对抗生成神经网络；

初始化所述初始对抗生成神经网络的参数和所述初始判别神经网络的边界向量，其中，所述边界向量是一个具有预设维度数量的多维向量，所述初始对抗生成神经网络的参数包括所述初始判别神经网络的判别参数和所述初始生成神经网络的生成参数；

获取真实样本集合和随机变量集合，并将所述随机变量集合输入到所述初始生成神经网络中，以生成假样本集合；

将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络，以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出；

根据预设的判别损失函数L _D＝E[max(0,M-D(x))]+E[max(0,M+D(G(z)))]对所述第一判别输出和所述第二判别输出进行计算以得到判别损失值，其中，L _D表示判别损失值，E表示数学期望值，max(0,M-D(x))表示关于0和M-D(x)的最大值函数，max(0,M+D(G(z)))表示关于0和M+D(G(z))的最大值函数，M表示所述边界向量，D(x)表示所述第一判别输出，D(G(z))表示所述第二判别输出；

根据预设的生成损失函数L _G＝-E[D(G(z))]对所述第二判别输出进行计算以得到生成损失值，其中，L _G表示所述生成损失值；

根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络。
根据权利要求9所述的计算机设备，其中，所述初始判别神经网络的边界向量的初始化时，具体实现：

接收用户发送的初始化指令，以获取所述预设维度数量，并确定所述预设维度数量中的每一个维度；及

根据预设数学分布公式的值域对所述每一个维度进行随机取值，以得到所述边界向量。
根据权利要求9所述的计算机设备，其中，所述将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络，以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出时，具体实现：

将所述真实样本集合输入至所述初始判别神经网络中，并根据所述边界向量将与所述真实样本集合对应的第一输出映射为与所述边界向量对应的第一多维向量，得到所述第一判别输出；

将所述假样本集合输入至所述初始判别神经网络中，并根据所述边界向量将与所述假样本集合对应的第二输出映射为与所述边界向量对应的第二多维向量，得到所述第二判别输出。
根据权利要求9所述的计算机设备，其中，所述根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络时，具体实现：

当所述判别损失值大于第一预设阈值时，则对所述判别参数进行更新，以得到目标判别神经网络；

当所述生成损失值大于第二预设阈值时，则对所述生成参数进行更新，以得到目标生成神经网络；

将所述目标判别神经网络和所述目标生成神经网络进行组合，得到所述目标对抗生成神经网络。
根据权利要求12所述的计算机设备，其中，所述对所述判别参数进行更新时，具体实现：

根据所述判别损失值，将所述判别参数进行求导，得到第一求导结果，并将所述第一求导结果反向传播，以根据所述第一求导结果更新所述判别参数。
根据权利要求12所述的计算机设备，其中，所述对所述生成参数进行更新时，具体实现：

根据所述生成损失值，将所述生成参数进行求导，得到第二求导结果，并将所述第二求导结果反向传播，以根据所述第二求导结果更新所述生成参数。
一种计算机可读存储介质，其中，所述计算机可读存储介质内存储有计算机程序，所述计算机程序可被至少一个处理器所执行，以使所述至少一个处理器执行以下方法：

建立初始判别神经网络和初始生成神经网络，并将所述初始判别神经网络和所述初始生成神经网络组成初始对抗生成神经网络；

初始化所述初始对抗生成神经网络的参数和所述初始判别神经网络的边界向量，其中，所述边界向量是一个具有预设维度数量的多维向量，所述初始对抗生成神经网络的参数包括所述初始判别神经网络的判别参数和所述初始生成神经网络的生成参数；

获取真实样本集合和随机变量集合，并将所述随机变量集合输入到所述初始生成神经网络中，以生成假样本集合；

将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络，以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出；

根据预设的判别损失函数L _D＝E[max(0,M-D(x))]+E[max(0,M+D(G(z)))]对所述第一判别输出和所述第二判别输出进行计算以得到判别损失值，其中，L _D表示判别损失值，E表示数学期望值，max(0,M-D(x))表示关于0和M-D(x)的最大值函数，max(0,M+D(G(z)))表示关于0和M+D(G(z))的最大值函数，M表示所述边界向量，D(x)表示所述第一判别输出，D(G(z))表示所述第二判别输出；

根据预设的生成损失函数L _G＝-E[D(G(z))]对所述第二判别输出进行计算以得到生成损失值，其中，L _G表示所述生成损失值；

根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络。
根据权利要求15所述的计算机可读存储介质，其中，所述初始判别神经网络的边界向量的初始化时，具体执行：

接收用户发送的初始化指令，以获取所述预设维度数量，并确定所述预设维度数量中的每一个维度；及

根据预设数学分布公式的值域对所述每一个维度进行随机取值，以得到所述边界向量。
根据权利要求15所述的计算机可读存储介质，其中，所述将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络，以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出时，具体执行：

将所述真实样本集合输入至所述初始判别神经网络中，并根据所述边界向量将与所述真实样本集合对应的第一输出映射为与所述边界向量对应的第一多维向量，得到所述第一判别输出；

将所述假样本集合输入至所述初始判别神经网络中，并根据所述边界向量将与所述假样本集合对应的第二输出映射为与所述边界向量对应的第二多维向量，得到所述第二判别输出。
根据权利要求15所述的计算机可读存储介质，其中，所述根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络时，具体执行：

当所述判别损失值大于第一预设阈值时，则对所述判别参数进行更新，以得到目标判别神经网络；

当所述生成损失值大于第二预设阈值时，则对所述生成参数进行更新，以得到目标生成神经网络；

将所述目标判别神经网络和所述目标生成神经网络进行组合，得到所述目标对抗生成神经网络。
根据权利要求18所述的计算机可读存储介质，其中，所述对所述判别参数进行更新时，具体执行：

根据所述判别损失值，将所述判别参数进行求导，得到第一求导结果，并将所述第一求导结果反向传播，以根据所述第一求导结果更新所述判别参数。
根据权利要求18所述的计算机可读存储介质，其中，所述对所述生成参数进行更新时，具体执行：

根据所述生成损失值，将所述生成参数进行求导，得到第二求导结果，并将所述第二求导结果反向传播，以根据所述第二求导结果更新所述生成参数。