CN107563509A - 一种基于特征返回的条件dcgan模型的动态调整算法 - Google Patents

一种基于特征返回的条件dcgan模型的动态调整算法 Download PDF

Info

Publication number
CN107563509A
CN107563509A CN201710579119.2A CN201710579119A CN107563509A CN 107563509 A CN107563509 A CN 107563509A CN 201710579119 A CN201710579119 A CN 201710579119A CN 107563509 A CN107563509 A CN 107563509A
Authority
CN
China
Prior art keywords
image
record
input
dimension
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710579119.2A
Other languages
English (en)
Other versions
CN107563509B (zh
Inventor
周智恒
李立军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201710579119.2A priority Critical patent/CN107563509B/zh
Publication of CN107563509A publication Critical patent/CN107563509A/zh
Application granted granted Critical
Publication of CN107563509B publication Critical patent/CN107563509B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于特征返回的条件DCGAN模型的动态调整算法,属于深度学习神经网络领域,该算法步骤如下:构造深度卷积生成式对抗网络DCGAN模型;对DCGAN模型进行训练;在判别器的卷积层中,对每一层卷积之后的图像特征数据记为特征数据记录Xi;将所有Xi进行维度扩展;S5、将维度扩展后的特征数据记录Xi与输入生成器中的噪声结合输入到记录图像生成器中进行训练。本方法能够解决在网络训练初期,生成器生成图像不符合数据集特征的问题,使生成器通过学习判别器中卷积过程的图像特征,以更高的效率学习到数据集中的图像特征,从而能够以更快的速度生成符合数据集特征的图像,能够较大程度地减小网络训练所需要的时间。

Description

一种基于特征返回的条件DCGAN模型的动态调整算法
技术领域
本发明涉及深度学习神经网络技术领域,具体涉及一种基于特征返回的条件DCGAN模型的动态调整算法。
背景技术
生成式对抗网络(Generative Adversarial Network,简称GAN)是由Goodfellow在2014年提出的框架,它基于“博奕论”的思想,构造生成器(generator)和判别器(discriminator)两种模型,前者通过输入(0,1)的均匀噪声或高斯随机噪声生成图像,后者对输入的图像进行判别,确定是来自数据集的图像还是由生成器产生的图像。判别器每完成一次判断,将结果误差返回给生成器。利用判别器的返回误差,生成器对自身模型进行进一步的改善,生成质量更高的图像,当生成器无法辨别图像来自于数据集还是生成器时,就认为生成器已经达到“以假乱真”的能力。
然而,在网络训练的过程中,生成器的学习速度往往是非常缓慢的。在网络训练的初期,由于输入噪声的随机性,生成器生成的图像大多数是不符合数据集特征的、毫无规则的图像。唯一的解决办法是,随着网络训练迭代次数的增加,判别器对图像进行判别之后返回的误差,才能够帮助生成器生成符合数据集特征的图像。基于DCGAN模型的网络训练,数据集的规模往往是巨大的,若只能随着网络训练的深入才能提高生成器生成图像的性能,则网络训练前期需要耗费大量的时间让生成器学习数据集中的特征,这大大影响了网络训练的效率。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,构建了一种基于特征返回的条件DCGAN模型的动态调整算法。
本发明的目的可以通过采取如下技术方案达到:
一种基于特征返回的条件DCGAN模型的动态调整算法,所述动态调整算法包括下列步骤:
S1、构造深度卷积生成式对抗网络DCGAN模型,该DCGAN模型包含记录图像生成器和记录图像判别器,采用交叉熵函数作为双方的损失函数;
S2、输入图像数据集,对所述DCGAN模型进行训练;
S3、在记录图像判别器的卷积层中,对每一层卷积之后的图像特征结果记录下来,第i层卷积之后的特征数据记录为Xi,i=1,2,…,N,N为记录图像判别器中卷积层的层数;
S4、将所述特征数据记录Xi进行维度扩展,使其维度等于输入记录图像生成器中的噪声维度;
S5、将维度扩展之后的特征数据记录Xi与输入记录图像生成器中的噪声结合,然后共同输入到记录图像生成器中进行训练。
进一步地,所述步骤S2具体如下:
随机初始化所述记录图像生成器和所述记录图像判别器的卷积神经网络中所有的参数和权重,输入图像数据集,然后利用随机梯度下降的方法对参数不断进行训练、调整与更新。
进一步地,所述步骤S3具体如下;
S31、根据所述记录图像判别器中卷积层的层数N,初始化N个维度可扩展的数组datai,i=1,2,…,N;
S32、将图像数据集中的一张图片输入至所述记录图像判别器;
S33、所述记录图像判别器对图片进行逐层卷积,将第i层卷积之后得到的特征数据,记录到数组datai,i=1,2,…,N中,一张图片卷积完成之后,得到N个储存特征数据的数组datai,i=1,2,…,N。
进一步地,所述步骤S4具体如下:
S41、确定输入至所述记录图像生成器的随机噪声维度M;
S42、将N个特征数据记录Xi全部扩展成M维度的数组,填充部分的数据用0表示。
进一步地,所述步骤S5具体如下:
S51、初始化M维度的随机噪声;
S52、将维度扩展之后的特征数据记录Xi与随机噪声进行叠加,得到新数据inputData;
S53、将新数据inputData输入至所述记录图生成器中,进行网络训练。
本发明相对于现有技术具有如下的优点及效果:
1.高效性:本发明根据DCGAN中深度卷积网络的特点,将记录图像判别器对图片进行卷积过程中的特征记录下来并输入至记录图像生成器中,能够使记录图像生成器快速地生成符合数据集特征的图像;
2.鲁棒性:本发明所构建的基于特征返回的条件DCGAN模型,不仅适用于DCGAN,对于其他形式的GAN,例如f-GAN,EB-GAN等网络的训练同样适用,具有较好的能用性,鲁棒性强。
附图说明
图1是本发明公开的一种基于特征返回的条件DCGAN模型的动态调整算法的流程步骤图;
图2是将记录图像判别器在卷积过程中将特征数据记录至数组的过程;
图3是构建基于特征返回的条件DCGAN模型的整体示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
本实施例公开了一种基于特征返回的条件DCGAN模型的动态调整算法,如附图1所示,具体包括下列步骤:
步骤S1、构造深度卷积生成式对抗网络DCGAN模型,该DCGAN模型包含记录图像生成器和记录图像判别器,采用交叉熵函数作为双方的损失函数;
步骤S2、输入图像数据集,对所述DCGAN模型进行训练;
在没有利用特征返回的思想时,对于记录图像生成器而言,不断输入随机噪声,经过一系列的转置卷积之后,将低维的特征图生成了高维的图像;对于记录图像判别器而言,不断输入数据集中的图像和生成器生成的图像,经过一系列的卷积层之后,将高维的图像最终转化成判别的概率值。
具体实施方式中,首先随机初始化所述记录图像生成器和所述记录图像判别器的卷积神经网络中所有的参数和权重,输入事先准备好的图像数据集,然后利用随机梯度下降的方法对参数不断进行训练、调整与更新。
步骤S3、在记录图像判别器的卷积层中,对每一层卷积之后的图像特征结果记录下来,第i层卷积之后的特征数据记录为Xi,i=1,2,…,N,N为记录图像判别器中卷积层的层数。
对于DCGAN模型中的判别器而言,每输入一张数据集中的图片,都会对图像的特征进行提取,即进行卷积的操作。每一层卷积操作之后得到的结果,都是对图像特征的提取。在不断进行卷积过程中,将每一卷积层所得到的特征结果都记录下来,返回至记录图像生成器中,从而能够让生成器更快地学习到数据集的特征,加快网络训练的速度。
步骤S4、将所述特征数据记录Xi进行维度扩展,使其维度等于输入记录图像生成器中的噪声维度。
将所有特征数据记录Xi进行维度扩展,使其维度等于输入记录图像生成器中的噪声维度。随着记录图像生成器卷积层的深入,得到的特征数据维度将越来越小,即N个数组datai,i=1,2,…,N中的特征数据需要扩展成相同维度之后方能叠加。
具体方法如下:
S41、确定输入至生成器的随机噪声维度M;
S42、将N个特征数组全部扩展成M维度的数组,填充部分的数据用0表示。
步骤S5、将S4中得到的扩展之后的数组与输入生成器中的噪声结合之后,共同输入到记录图像生成器中进行训练。具体过程如下:
S51、初始化M维度的随机噪声;
S52、将S4中得到的所有N个特征数据与随机噪声进行叠加,得到新数据inputData;
S53、将inputData数据输入至生成器中,进行网络训练。
综上所述,本实施例公开了种基于特征返回的条件DCGAN模型的动态调整算法,该模型在网络训练的过程中,让生成器学习判别器中卷积过程的图像特征,以更高的效率学习到数据集中的图像特征,从而能够以更快的速度生成符合数据集特征的图像,能够较大程度地减小网络训练所需要的时间。另外,该思路具有较强的鲁棒性,不仅在DCGAN中发挥作用,也能够在其他改进的GAN模型中起作用。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种基于特征返回的条件DCGAN模型的动态调整算法,其特征在于,所述动态调整算法包括下列步骤:
S1、构造深度卷积生成式对抗网络DCGAN模型,该DCGAN模型包含记录图像生成器和记录图像判别器,采用交叉熵函数作为双方的损失函数;
S2、输入图像数据集,对所述DCGAN模型进行训练;
S3、在记录图像判别器的卷积层中,对每一层卷积之后的图像特征结果记录下来,第i层卷积之后的特征数据记录为Xi,i=1,2,…,N,N为记录图像判别器中卷积层的层数;
S4、将所述特征数据记录Xi进行维度扩展,使其维度等于输入记录图像生成器中的噪声维度;
S5、将维度扩展之后的特征数据记录Xi与输入记录图像生成器中的噪声结合,然后共同输入到记录图像生成器中进行训练。
2.根据权利要求1所述的一种基于特征返回的条件DCGAN模型的动态调整算法,其特征在于,所述步骤S2具体如下:
随机初始化所述记录图像生成器和所述记录图像判别器的卷积神经网络中所有的参数和权重,输入图像数据集,然后利用随机梯度下降的方法对参数不断进行训练、调整与更新。
3.根据权利要求1所述的一种基于特征返回的条件DCGAN模型的动态调整算法,其特征在于,所述步骤S3具体如下;
S31、根据所述记录图像判别器中卷积层的层数N,初始化N个维度可扩展的数组datai,i=1,2,…,N;
S32、将图像数据集中的一张图片输入至所述记录图像判别器;
S33、所述记录图像判别器对图片进行逐层卷积,将第i层卷积之后得到的特征数据,记录到数组datai,i=1,2,…,N中,一张图片卷积完成之后,得到N个储存特征数据的数组datai,i=1,2,…,N。
4.根据权利要求1所述的一种基于特征返回的条件DCGAN模型的动态调整算法,其特征在于,所述步骤S4具体如下:
S41、确定输入至所述记录图像生成器的随机噪声维度M;
S42、将N个特征数据记录Xi全部扩展成M维度的数组,填充部分的数据用0表示。
5.根据权利要求1所述的一种基于特征返回的条件DCGAN模型的动态调整算法,其特征在于,所述步骤S5具体如下:
S51、初始化M维度的随机噪声;
S52、将维度扩展之后的特征数据记录Xi与随机噪声进行叠加,得到新数据inputData;
S53、将新数据inputData输入至所述记录图生成器中,进行网络训练。
CN201710579119.2A 2017-07-17 2017-07-17 一种基于特征返回的条件dcgan模型的动态调整方法 Active CN107563509B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710579119.2A CN107563509B (zh) 2017-07-17 2017-07-17 一种基于特征返回的条件dcgan模型的动态调整方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710579119.2A CN107563509B (zh) 2017-07-17 2017-07-17 一种基于特征返回的条件dcgan模型的动态调整方法

Publications (2)

Publication Number Publication Date
CN107563509A true CN107563509A (zh) 2018-01-09
CN107563509B CN107563509B (zh) 2020-11-24

Family

ID=60973590

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710579119.2A Active CN107563509B (zh) 2017-07-17 2017-07-17 一种基于特征返回的条件dcgan模型的动态调整方法

Country Status (1)

Country Link
CN (1) CN107563509B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108459570A (zh) * 2018-03-14 2018-08-28 河海大学常州校区 基于生成对抗网络架构的灌溉配水智能控制系统及方法
CN108829855A (zh) * 2018-06-21 2018-11-16 山东大学 基于条件生成对抗网络的衣着穿搭推荐方法、系统及介质
CN109101992A (zh) * 2018-07-04 2018-12-28 北京市商汤科技开发有限公司 图像匹配方法、装置和计算机可读存储介质
CN109523463A (zh) * 2018-11-20 2019-03-26 中山大学 一种基于条件生成对抗网络的人脸老化方法
CN109871604A (zh) * 2019-01-31 2019-06-11 浙江工商大学 基于深度对抗网络模型的室内功能区划分方法
CN110351536A (zh) * 2019-08-20 2019-10-18 深圳江行联加智能科技有限公司 一种变电站环境异常检测系统、方法及装置
US11250329B2 (en) 2017-10-26 2022-02-15 Nvidia Corporation Progressive modification of generative adversarial neural networks
US11263525B2 (en) 2017-10-26 2022-03-01 Nvidia Corporation Progressive modification of neural networks

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120155766A1 (en) * 2010-12-17 2012-06-21 Sony Corporation Patch description and modeling for image subscene recognition
CN105046277A (zh) * 2015-07-15 2015-11-11 华南农业大学 特征显著性在图像质量评价中的鲁棒机理研究方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120155766A1 (en) * 2010-12-17 2012-06-21 Sony Corporation Patch description and modeling for image subscene recognition
CN105046277A (zh) * 2015-07-15 2015-11-11 华南农业大学 特征显著性在图像质量评价中的鲁棒机理研究方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ALEC RADFORD 等: "UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS", 《ARXIV》 *
IAN J. GOODFELLOW 等: "Generative Adversarial Nets", 《ARXIV》 *
RAYMOND A. YEH 等: "Semantic Image Inpainting with Deep Generative Models", 《ARXIV》 *
TENSORFLOW: "Image Completion with Deep Learning in TensorFlow", 《HTTP://BAMOS.GITHUB.IO/2016/08/09/DEEP-COMPLETION/》 *
徐一峰: "生成对抗网络理论模型和应用综述", 《金华职业技术学院学报》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11250329B2 (en) 2017-10-26 2022-02-15 Nvidia Corporation Progressive modification of generative adversarial neural networks
US11263525B2 (en) 2017-10-26 2022-03-01 Nvidia Corporation Progressive modification of neural networks
US11763168B2 (en) 2017-10-26 2023-09-19 Nvidia Corporation Progressive modification of generative adversarial neural networks
CN108459570A (zh) * 2018-03-14 2018-08-28 河海大学常州校区 基于生成对抗网络架构的灌溉配水智能控制系统及方法
CN108459570B (zh) * 2018-03-14 2021-07-27 河海大学常州校区 基于生成对抗网络架构的灌溉配水智能控制系统及方法
CN108829855A (zh) * 2018-06-21 2018-11-16 山东大学 基于条件生成对抗网络的衣着穿搭推荐方法、系统及介质
CN109101992A (zh) * 2018-07-04 2018-12-28 北京市商汤科技开发有限公司 图像匹配方法、装置和计算机可读存储介质
CN109101992B (zh) * 2018-07-04 2022-02-22 北京市商汤科技开发有限公司 图像匹配方法、装置和计算机可读存储介质
CN109523463A (zh) * 2018-11-20 2019-03-26 中山大学 一种基于条件生成对抗网络的人脸老化方法
CN109871604A (zh) * 2019-01-31 2019-06-11 浙江工商大学 基于深度对抗网络模型的室内功能区划分方法
CN110351536A (zh) * 2019-08-20 2019-10-18 深圳江行联加智能科技有限公司 一种变电站环境异常检测系统、方法及装置

Also Published As

Publication number Publication date
CN107563509B (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
CN107563509A (zh) 一种基于特征返回的条件dcgan模型的动态调整算法
CN107563493A (zh) 一种多生成器卷积合成图像的对抗网络算法
CN107590518A (zh) 一种多特征学习的对抗网络训练方法
CN107862377A (zh) 一种基于文本‑图像生成对抗网络模型的分组卷积方法
CN107392312A (zh) 一种基于dcgan性能的动态调整算法
CN105657402B (zh) 一种深度图恢复方法
CN107689034A (zh) 一种神经网络的训练方法、去噪方法及装置
CN104102919B (zh) 一种有效防止卷积神经网络过拟合的图像分类方法
CN104268594B (zh) 一种视频异常事件检测方法及装置
CN107563995A (zh) 一种多判别器误差反传的对抗网络方法
CN107016406A (zh) 基于生成式对抗网络的病虫害图像生成方法
CN107944546A (zh) 一种基于原始生成对抗网络模型的残差网络方法
CN108830252A (zh) 一种融合全局时空特征的卷积神经网络人体动作识别方法
CN104299243B (zh) 一种基于霍夫森林的目标跟踪方法
CN106919897A (zh) 一种基于三级残差网络的人脸图像年龄估计方法
CN107590532A (zh) 一种基于wgan的超参数动态调整方法
CN105160678A (zh) 基于卷积神经网络的无参考立体图像质量评估方法
CN107590530A (zh) 一种基于生成对抗网络的逐层更新算法
CN107316066A (zh) 基于多通路卷积神经网络的图像分类方法及系统
CN107169527A (zh) 基于协同深度学习的医学图像分类方法
CN105678248A (zh) 基于深度学习的人脸关键点对齐算法
CN107992944A (zh) 一种基于原始生成对抗网络模型的多尺度卷积方法
CN108470196A (zh) 一种基于深度卷积对抗网络模型生成手写数字的方法
CN107133892A (zh) 一种网络钢琴课的实时评价方法及系统
CN110490968A (zh) 基于生成对抗网络的光场轴向重聚焦图像超分辨方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant