CN107563509A

CN107563509A - 一种基于特征返回的条件dcgan模型的动态调整算法

Info

Publication number: CN107563509A
Application number: CN201710579119.2A
Authority: CN
Inventors: 周智恒; 李立军
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2017-07-17
Filing date: 2017-07-17
Publication date: 2018-01-09
Anticipated expiration: 2037-07-17
Also published as: CN107563509B

Abstract

本发明公开了一种基于特征返回的条件DCGAN模型的动态调整算法，属于深度学习神经网络领域，该算法步骤如下：构造深度卷积生成式对抗网络DCGAN模型；对DCGAN模型进行训练；在判别器的卷积层中，对每一层卷积之后的图像特征数据记为特征数据记录X_i；将所有X_i进行维度扩展；S5、将维度扩展后的特征数据记录X_i与输入生成器中的噪声结合输入到记录图像生成器中进行训练。本方法能够解决在网络训练初期，生成器生成图像不符合数据集特征的问题，使生成器通过学习判别器中卷积过程的图像特征，以更高的效率学习到数据集中的图像特征，从而能够以更快的速度生成符合数据集特征的图像，能够较大程度地减小网络训练所需要的时间。

Description

一种基于特征返回的条件DCGAN模型的动态调整算法

技术领域

本发明涉及深度学习神经网络技术领域，具体涉及一种基于特征返回的条件DCGAN模型的动态调整算法。

背景技术

生成式对抗网络(Generative Adversarial Network,简称GAN)是由Goodfellow在2014年提出的框架，它基于“博奕论”的思想，构造生成器(generator)和判别器(discriminator)两种模型，前者通过输入(0，1)的均匀噪声或高斯随机噪声生成图像，后者对输入的图像进行判别，确定是来自数据集的图像还是由生成器产生的图像。判别器每完成一次判断，将结果误差返回给生成器。利用判别器的返回误差，生成器对自身模型进行进一步的改善，生成质量更高的图像，当生成器无法辨别图像来自于数据集还是生成器时，就认为生成器已经达到“以假乱真”的能力。

然而，在网络训练的过程中，生成器的学习速度往往是非常缓慢的。在网络训练的初期，由于输入噪声的随机性，生成器生成的图像大多数是不符合数据集特征的、毫无规则的图像。唯一的解决办法是，随着网络训练迭代次数的增加，判别器对图像进行判别之后返回的误差，才能够帮助生成器生成符合数据集特征的图像。基于DCGAN模型的网络训练，数据集的规模往往是巨大的，若只能随着网络训练的深入才能提高生成器生成图像的性能，则网络训练前期需要耗费大量的时间让生成器学习数据集中的特征，这大大影响了网络训练的效率。

发明内容

本发明的目的是为了解决现有技术中的上述缺陷，构建了一种基于特征返回的条件DCGAN模型的动态调整算法。

本发明的目的可以通过采取如下技术方案达到：

一种基于特征返回的条件DCGAN模型的动态调整算法，所述动态调整算法包括下列步骤：

S1、构造深度卷积生成式对抗网络DCGAN模型，该DCGAN模型包含记录图像生成器和记录图像判别器，采用交叉熵函数作为双方的损失函数；

S2、输入图像数据集，对所述DCGAN模型进行训练；

S3、在记录图像判别器的卷积层中，对每一层卷积之后的图像特征结果记录下来，第i层卷积之后的特征数据记录为X_i，i＝1,2，…,N,N为记录图像判别器中卷积层的层数；

S4、将所述特征数据记录X_i进行维度扩展，使其维度等于输入记录图像生成器中的噪声维度；

S5、将维度扩展之后的特征数据记录X_i与输入记录图像生成器中的噪声结合，然后共同输入到记录图像生成器中进行训练。

进一步地，所述步骤S2具体如下：

随机初始化所述记录图像生成器和所述记录图像判别器的卷积神经网络中所有的参数和权重，输入图像数据集，然后利用随机梯度下降的方法对参数不断进行训练、调整与更新。

进一步地，所述步骤S3具体如下；

S31、根据所述记录图像判别器中卷积层的层数N，初始化N个维度可扩展的数组data_i，i＝1,2，…,N；

S32、将图像数据集中的一张图片输入至所述记录图像判别器；

S33、所述记录图像判别器对图片进行逐层卷积，将第i层卷积之后得到的特征数据，记录到数组data_i，i＝1,2，…,N中，一张图片卷积完成之后，得到N个储存特征数据的数组data_i，i＝1,2，…,N。

进一步地，所述步骤S4具体如下：

S41、确定输入至所述记录图像生成器的随机噪声维度M；

S42、将N个特征数据记录X_i全部扩展成M维度的数组，填充部分的数据用0表示。

进一步地，所述步骤S5具体如下：

S51、初始化M维度的随机噪声；

S52、将维度扩展之后的特征数据记录X_i与随机噪声进行叠加，得到新数据inputData；

S53、将新数据inputData输入至所述记录图生成器中，进行网络训练。

本发明相对于现有技术具有如下的优点及效果：

1.高效性：本发明根据DCGAN中深度卷积网络的特点，将记录图像判别器对图片进行卷积过程中的特征记录下来并输入至记录图像生成器中，能够使记录图像生成器快速地生成符合数据集特征的图像；

2.鲁棒性：本发明所构建的基于特征返回的条件DCGAN模型，不仅适用于DCGAN，对于其他形式的GAN，例如f-GAN,EB-GAN等网络的训练同样适用，具有较好的能用性，鲁棒性强。

附图说明

图1是本发明公开的一种基于特征返回的条件DCGAN模型的动态调整算法的流程步骤图；

图2是将记录图像判别器在卷积过程中将特征数据记录至数组的过程；

图3是构建基于特征返回的条件DCGAN模型的整体示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例

本实施例公开了一种基于特征返回的条件DCGAN模型的动态调整算法，如附图1所示，具体包括下列步骤：

步骤S1、构造深度卷积生成式对抗网络DCGAN模型，该DCGAN模型包含记录图像生成器和记录图像判别器，采用交叉熵函数作为双方的损失函数；

步骤S2、输入图像数据集，对所述DCGAN模型进行训练；

在没有利用特征返回的思想时，对于记录图像生成器而言，不断输入随机噪声，经过一系列的转置卷积之后，将低维的特征图生成了高维的图像；对于记录图像判别器而言，不断输入数据集中的图像和生成器生成的图像，经过一系列的卷积层之后，将高维的图像最终转化成判别的概率值。

具体实施方式中，首先随机初始化所述记录图像生成器和所述记录图像判别器的卷积神经网络中所有的参数和权重，输入事先准备好的图像数据集，然后利用随机梯度下降的方法对参数不断进行训练、调整与更新。

步骤S3、在记录图像判别器的卷积层中，对每一层卷积之后的图像特征结果记录下来，第i层卷积之后的特征数据记录为X_i，i＝1,2，…,N,N为记录图像判别器中卷积层的层数。

对于DCGAN模型中的判别器而言，每输入一张数据集中的图片，都会对图像的特征进行提取，即进行卷积的操作。每一层卷积操作之后得到的结果，都是对图像特征的提取。在不断进行卷积过程中，将每一卷积层所得到的特征结果都记录下来，返回至记录图像生成器中，从而能够让生成器更快地学习到数据集的特征，加快网络训练的速度。

步骤S4、将所述特征数据记录X_i进行维度扩展，使其维度等于输入记录图像生成器中的噪声维度。

将所有特征数据记录X_i进行维度扩展，使其维度等于输入记录图像生成器中的噪声维度。随着记录图像生成器卷积层的深入，得到的特征数据维度将越来越小，即N个数组data_i，i＝1,2，…,N中的特征数据需要扩展成相同维度之后方能叠加。

具体方法如下：

S41、确定输入至生成器的随机噪声维度M；

S42、将N个特征数组全部扩展成M维度的数组，填充部分的数据用0表示。

步骤S5、将S4中得到的扩展之后的数组与输入生成器中的噪声结合之后，共同输入到记录图像生成器中进行训练。具体过程如下：

S51、初始化M维度的随机噪声；

S52、将S4中得到的所有N个特征数据与随机噪声进行叠加，得到新数据inputData；

S53、将inputData数据输入至生成器中，进行网络训练。

综上所述，本实施例公开了种基于特征返回的条件DCGAN模型的动态调整算法，该模型在网络训练的过程中，让生成器学习判别器中卷积过程的图像特征，以更高的效率学习到数据集中的图像特征，从而能够以更快的速度生成符合数据集特征的图像，能够较大程度地减小网络训练所需要的时间。另外，该思路具有较强的鲁棒性，不仅在DCGAN中发挥作用，也能够在其他改进的GAN模型中起作用。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于特征返回的条件DCGAN模型的动态调整算法，其特征在于，所述动态调整算法包括下列步骤：

S2、输入图像数据集，对所述DCGAN模型进行训练；

2.根据权利要求1所述的一种基于特征返回的条件DCGAN模型的动态调整算法，其特征在于，所述步骤S2具体如下：

3.根据权利要求1所述的一种基于特征返回的条件DCGAN模型的动态调整算法，其特征在于，所述步骤S3具体如下；

4.根据权利要求1所述的一种基于特征返回的条件DCGAN模型的动态调整算法，其特征在于，所述步骤S4具体如下：

S41、确定输入至所述记录图像生成器的随机噪声维度M；

5.根据权利要求1所述的一种基于特征返回的条件DCGAN模型的动态调整算法，其特征在于，所述步骤S5具体如下：

S51、初始化M维度的随机噪声；