CN107944546A - 一种基于原始生成对抗网络模型的残差网络方法 - Google Patents
一种基于原始生成对抗网络模型的残差网络方法 Download PDFInfo
- Publication number
- CN107944546A CN107944546A CN201711122573.1A CN201711122573A CN107944546A CN 107944546 A CN107944546 A CN 107944546A CN 201711122573 A CN201711122573 A CN 201711122573A CN 107944546 A CN107944546 A CN 107944546A
- Authority
- CN
- China
- Prior art keywords
- residual error
- mrow
- network
- maker
- originally generated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本发明公开了一种基于原始生成对抗网络模型的残差网络方法,属于深度学习神经网络领域,包括以下步骤:S1、构造原始生成对抗网络模型;S2、构造神经网络充当生成器与判别器的功能;S3、初始化随机噪声,输入生成器中;S4、在神经网络中利用残差网络对图像进行卷积操作;S5、将残差网络操作得到的损失函数输入生成器进行后续训练。本方法构建的基于残差网络的原始生成对抗网络模型,改变了判别器、生成器接收图片后的卷积方式,让判别器、生成器能够以更大的范围对图像的特征进行学习,从而能够提高整个网络训练模型的鲁棒性。
Description
技术领域
本发明涉及深度学习神经网络技术领域,具体涉及一种基于原始生成对抗网络模型的残差网络方法。
背景技术
生成式对抗网络(Generative Adversarial Network,简称GAN)是由Goodfellow在2014年提出的深度学习框架,它基于“博奕论”的思想,构造生成器(generator)和判别器(discriminator)两种模型,前者通过输入(0,1)的均匀噪声或高斯随机噪声生成图像,后者对输入的图像进行判别,确定是来自数据集的图像还是由生成器产生的图像。
在传统的对抗网络模型中,判别器往往是通过原始的卷积核进行的操作,对生成器生成图像的特征进行解析,进行一种新特征的学习,往往需要在学习到一种旧的特征结束之后才能进行。在这种情况下,生成器所学习到的特征范围较小,学习效率较低。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于原始生成对抗网络模型的残差网络方法。
本发明的目的可以通过采取如下技术方案达到:
一种基于原始生成对抗网络模型的残差网络方法,所述的残差网络方法包括下列步骤:
S1、构造原始生成对抗网络模型,通过生成器生成图像输入至判别器进行网络训练;
S2、构造神经网络充当生成器与判别器的功能;
S3、初始化随机噪声,输入生成器中;
S4、在神经网络中利用残差网络对图像进行卷积操作;
S5、将残差网络操作得到的损失函数输入生成器进行后续训练。
进一步地,所述的步骤S4具体过程如下:
S41、收集浅层神经网络的梯度;
S42、将浅层神经网络的梯度加到深层神经网络中去。
进一步地,所述的步骤S5具体过程如下:
S51、将卷积操作之后得到的图像特征图,输入判别器中进行判别;
S52、将残差网络操作之后得到的损失函数,输入生成器进行后续训练。
进一步地,所述的损失函数的表达式为:
其中,D(x)表示判别器对图像的判别,pr表示数据集图像的分布,pg表示生成图像的分布,λ为超参数,为梯度,E为取均值的操作符号。
本发明相对于现有技术具有如下的优点及效果:
高效性:本发明将残差网络运用到原始生成对抗网络模型中来,将浅层的梯度直接加到深层的神经网络中去,避免了梯度逐层传递而消失的情况,提高了网络训练的效率。
附图说明
图1是本发明中原始生成对抗网络通过残差网络进行训练的整体流程图;
图2是本发明中将浅层梯度加在深层网络的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
本实施例公开了一种基于原始生成对抗网络模型的残差网络方法,具体包括下列步骤:
步骤S1、构造原始生成对抗网络模型,通过生成器生成图像输入至判别器进行网络训练。
步骤S2、构造神经网络充当生成器与判别器的功能;
不同的卷积核,体现在矩阵数值的不同、行列数的不同。
构造多个卷积核,在处理图像的过程中,不同的卷积核意味着能够在网络训练的过程中学习到生成图像的不同特征。
在传统的对抗网络模型中,卷积神经网络的梯度是逐层向深层传递的,在训练的过程中,梯度会随着卷积神经网络的深入而逐渐变小甚至消失,这种情况导致的结果是网络训练的效率低下。而本发明将残差网络运用到原始生成对抗网络模型中来,将浅层的梯度直接加到深层的神经网络中去,避免了梯度逐层传递而消失的情况,提高了网络训练的效率。
在实际应用中,应该根据数据集图像特征的复杂程度,设置卷积核的个数。
步骤S3、初始化随机噪声,输入生成器中。
步骤S4、在神经网络中利用残差网络对图像进行卷积操作。
具体过程如下:
S41、收集浅层神经网络的梯度;
S42、将浅层神经网络的梯度加到深层神经网络中去。
步骤S5、将残差网络操作得到的损失函数输入生成器进行后续训练。具体过程如下:
S51、将步骤S4中卷积之后的特征图,输入判别器进行判别;
S52、将残差网络操作得到的损失函数输入生成器进行后续训练。
损失函数的作用是衡量判别器对生成图像判断的能力。损失函数的值越小,说明在当前迭代中,判别器能够有较好的性能辨别生成器的生成图像;反之则说明判别器的性能较差。
损失函数的表达式为:
其中,D(x)表示判别器对图像的判别,pr表示数据集图像的分布,pg表示生成图像的分布,λ为超参数,为梯度。E为取均值的操作符号。
综上所述,本实施例公开了一种基于原始生成对抗网络模型的残差网络方法,相比于传统的原始对抗网络模型,改变了判别器接收图片后的对图像特征进行学习的方式。在传统的对抗网络模型中,卷积神经网络的梯度是逐层向深层传递的,在训练的过程中,梯度会随着卷积神经网络的深入而逐渐变小甚至消失,这种情况导致的结果是网络训练的效率低下。而本发明将残差网络运用到深度卷积对抗网络模型中来,将浅层的梯度直接加到深层的神经网络中去,避免了梯度逐层传递而消失的情况,提高了网络训练的效率。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (4)
1.一种基于原始生成对抗网络模型的残差网络方法,其特征在于,所述的残差网络方法包括下列步骤:
S1、构造原始生成对抗网络模型,通过生成器生成图像输入至判别器进行网络训练;
S2、构造神经网络充当生成器与判别器的功能;
S3、初始化随机噪声,输入生成器中;
S4、在神经网络中利用残差网络对图像进行卷积操作;
S5、将残差网络操作得到的损失函数输入生成器进行后续训练。
2.根据权利要求1所述的一种基于原始生成对抗网络模型的残差网络方法,其特征在于,所述的步骤S4具体过程如下:
S41、收集浅层神经网络的梯度;
S42、将浅层神经网络的梯度加到深层神经网络中去。
3.根据权利要求1所述的一种基于原始生成对抗网络模型的残差网络方法,其特征在于,所述的步骤S5具体过程如下:
S51、将卷积操作之后得到的图像特征图,输入判别器中进行判别;
S52、将残差网络操作之后得到的损失函数,输入生成器进行后续训练。
4.根据权利要求3所述的一种基于原始生成对抗网络模型的残差网络方法,其特征在于,所述的损失函数的表达式为:
<mrow>
<mi>L</mi>
<mrow>
<mo>(</mo>
<mi>D</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<msub>
<mi>E</mi>
<mrow>
<mi>x</mi>
<mo>~</mo>
<mi>p</mi>
<mi>r</mi>
</mrow>
</msub>
<mo>&lsqb;</mo>
<mi>D</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>+</mo>
<msub>
<mi>E</mi>
<mrow>
<mi>x</mi>
<mo>~</mo>
<mi>p</mi>
<mi>g</mi>
</mrow>
</msub>
<mo>&lsqb;</mo>
<mi>D</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>+</mo>
<msub>
<mi>&lambda;E</mi>
<mrow>
<mi>x</mi>
<mo>~</mo>
<mi>X</mi>
</mrow>
</msub>
<msub>
<mo>&dtri;</mo>
<mi>x</mi>
</msub>
</mrow>
其中,D(x)表示判别器对图像的判别,pr表示数据集图像的分布,pg表示生成图像的分布,λ为超参数,为梯度,E为取均值的操作符号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711122573.1A CN107944546A (zh) | 2017-11-14 | 2017-11-14 | 一种基于原始生成对抗网络模型的残差网络方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711122573.1A CN107944546A (zh) | 2017-11-14 | 2017-11-14 | 一种基于原始生成对抗网络模型的残差网络方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107944546A true CN107944546A (zh) | 2018-04-20 |
Family
ID=61934056
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711122573.1A Pending CN107944546A (zh) | 2017-11-14 | 2017-11-14 | 一种基于原始生成对抗网络模型的残差网络方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107944546A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564550A (zh) * | 2018-04-25 | 2018-09-21 | Oppo广东移动通信有限公司 | 图像处理方法、装置及终端设备 |
CN109410974A (zh) * | 2018-10-23 | 2019-03-01 | 百度在线网络技术(北京)有限公司 | 语音增强方法、装置、设备及存储介质 |
CN109902602A (zh) * | 2019-02-16 | 2019-06-18 | 北京工业大学 | 一种基于对抗神经网络数据增强的机场跑道异物材料识别方法 |
CN110598851A (zh) * | 2019-08-29 | 2019-12-20 | 北京航空航天大学合肥创新研究院 | 一种融合lstm和gan的时间序列数据异常检测方法 |
CN111755024A (zh) * | 2019-03-27 | 2020-10-09 | 四川大学 | 一种基于迁移学习的暴恐音频检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107016406A (zh) * | 2017-02-24 | 2017-08-04 | 中国科学院合肥物质科学研究院 | 基于生成式对抗网络的病虫害图像生成方法 |
CN107103590A (zh) * | 2017-03-22 | 2017-08-29 | 华南理工大学 | 一种基于深度卷积对抗生成网络的图像反射去除方法 |
-
2017
- 2017-11-14 CN CN201711122573.1A patent/CN107944546A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107016406A (zh) * | 2017-02-24 | 2017-08-04 | 中国科学院合肥物质科学研究院 | 基于生成式对抗网络的病虫害图像生成方法 |
CN107103590A (zh) * | 2017-03-22 | 2017-08-29 | 华南理工大学 | 一种基于深度卷积对抗生成网络的图像反射去除方法 |
Non-Patent Citations (3)
Title |
---|
IAN J. GOODFELLOW 等: "Generative Adversarial Nets", 《ARXIV》 * |
ISHAAN GULRAJANI 等: "Improved Training of Wasserstein GANs", 《ARXIV》 * |
KAIMING HE 等: "Deep Residual Learning for Image Recognition", 《ARXIV》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564550A (zh) * | 2018-04-25 | 2018-09-21 | Oppo广东移动通信有限公司 | 图像处理方法、装置及终端设备 |
CN108564550B (zh) * | 2018-04-25 | 2020-10-02 | Oppo广东移动通信有限公司 | 图像处理方法、装置及终端设备 |
CN109410974A (zh) * | 2018-10-23 | 2019-03-01 | 百度在线网络技术(北京)有限公司 | 语音增强方法、装置、设备及存储介质 |
CN109902602A (zh) * | 2019-02-16 | 2019-06-18 | 北京工业大学 | 一种基于对抗神经网络数据增强的机场跑道异物材料识别方法 |
CN109902602B (zh) * | 2019-02-16 | 2021-04-30 | 北京工业大学 | 一种基于对抗神经网络数据增强的机场跑道异物材料识别方法 |
CN111755024A (zh) * | 2019-03-27 | 2020-10-09 | 四川大学 | 一种基于迁移学习的暴恐音频检测方法 |
CN111755024B (zh) * | 2019-03-27 | 2023-02-10 | 四川大学 | 一种基于迁移学习的暴恐音频检测方法 |
CN110598851A (zh) * | 2019-08-29 | 2019-12-20 | 北京航空航天大学合肥创新研究院 | 一种融合lstm和gan的时间序列数据异常检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107944546A (zh) | 一种基于原始生成对抗网络模型的残差网络方法 | |
CN107871142A (zh) | 一种基于深度卷积对抗网络模型的空洞卷积方法 | |
CN107862377A (zh) | 一种基于文本‑图像生成对抗网络模型的分组卷积方法 | |
CN107590518A (zh) | 一种多特征学习的对抗网络训练方法 | |
CN107944358A (zh) | 一种基于深度卷积对抗网络模型的人脸生成方法 | |
CN107590531A (zh) | 一种基于文本生成的wgan方法 | |
CN107689034A (zh) | 一种神经网络的训练方法、去噪方法及装置 | |
Kobler et al. | Variational networks: connecting variational methods and deep learning | |
CN105657402B (zh) | 一种深度图恢复方法 | |
CN109003240B (zh) | 一种基于多尺度并行cnn的图像去噪方法 | |
CN107563493A (zh) | 一种多生成器卷积合成图像的对抗网络算法 | |
CN107563510A (zh) | 一种基于深度卷积神经网络的wgan模型方法 | |
CN107886162A (zh) | 一种基于wgan模型的可变形卷积核方法 | |
CN107767413A (zh) | 一种基于卷积神经网络的图像深度估计方法 | |
CN107563509A (zh) | 一种基于特征返回的条件dcgan模型的动态调整算法 | |
CN105096326B (zh) | 一种使用移动最小二乘法的拉普拉斯抠图矩阵方法 | |
CN107992944A (zh) | 一种基于原始生成对抗网络模型的多尺度卷积方法 | |
CN107016406A (zh) | 基于生成式对抗网络的病虫害图像生成方法 | |
CN108009568A (zh) | 一种基于wgan模型的行人检测方法 | |
CN106408522A (zh) | 一种基于卷积对神经网络的图像去噪方法 | |
CN108629422A (zh) | 一种基于知识指导-战术感知的智能体学习方法 | |
CN107943750A (zh) | 一种基于wgan模型的分解卷积方法 | |
CN109785249A (zh) | 一种基于持续性记忆密集网络的图像高效去噪方法 | |
CN108470196A (zh) | 一种基于深度卷积对抗网络模型生成手写数字的方法 | |
CN103049891B (zh) | 基于自适应窗口选择的视频图像去模糊方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180420 |