CN108932534A - 一种基于深度卷积生成对抗网络的图片生成方法 - Google Patents

一种基于深度卷积生成对抗网络的图片生成方法 Download PDF

Info

Publication number
CN108932534A
CN108932534A CN201810773710.6A CN201810773710A CN108932534A CN 108932534 A CN108932534 A CN 108932534A CN 201810773710 A CN201810773710 A CN 201810773710A CN 108932534 A CN108932534 A CN 108932534A
Authority
CN
China
Prior art keywords
picture
confrontation network
depth convolution
generation method
arbiter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810773710.6A
Other languages
English (en)
Inventor
瞿文政
兰锦华
方锦浩
刘剑锋
利国成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201810773710.6A priority Critical patent/CN108932534A/zh
Publication of CN108932534A publication Critical patent/CN108932534A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种基于深度卷积生成对抗网络的图片生成方法,包括图片收集、图片预处理、图片导入网络和网络训练图片;本发明的有益效果在于,该发明的图片生成方法能够客服拍摄角度、背景等差异,相比于生成对抗网络,深度卷积生成对抗网络提高了图片生成的相似度,因此能够生成全新的高精度目标图像。

Description

一种基于深度卷积生成对抗网络的图片生成方法
技术领域
本发明涉及图片生成技术领域,尤其涉及一种基于深度卷积生成对抗网络的图片生成方法。
背景技术
近年来,虚拟现实在教育培训、工程建筑等领域得到广泛应用,而图像生成作为虚拟现实的技术瓶颈,极大限制了虚拟现实的进一步发展。业内,Adobe公司等已尝试在产品中加入智能抠图、智能编辑助手等功能,通过简单的图像生成系统,帮助普通人进行虚拟现实构建工作。然而,现有的图像生成过程中,特征表达与融合往往忽略图像的深层语义,从而直接降低了图像生成的精度。
Alec Radford等提出深度卷积生成对抗网络。深度卷积生成对抗网络结合深度学习和生成对抗网络的优点,利用卷积神经网络的特征提取能力,提高了生成网络的学习效果。首先,训练一个生成器G,从随机噪声或者潜在变量中生成逼真的的样本,同时,训练一个判别器D来鉴别真实数据和生成数据,两者同时训练,利用G和D构成动态“博弈过程”,直到达到一个纳什均衡,生成器生成的数据与真实样本无差别,判别器也无法正确的区分生成数据和真实数据。通过基于深度卷积生成对抗网络,提出新的图像生成方法,通过大量的图片训练,最终自主生成全新的高精度目标图像。
发明内容
本发明的目的:提供一种基于深度卷积生成对抗网络的图片生成方法,利用深度卷积生成对抗网络的生成器通过随机噪声生成图像,进而判别器提取特征用于生成图片,并通过与真实图片对比,实时调整深度卷积生成对抗网络,从而优化图片的生成能力。
为了实现上述目的,本发明的技术方案是:一种基于深度卷积生成对抗网络的图片生成方法,包括如下步骤:
步骤1,随机收集N个具有相同内容的真实图片,作为图片训练样本和真实图片样本;
步骤2,对步骤1中收集的N个真实图片进行预处理;
步骤3,将预处理后的N个图片训练样本和N个真实图片图片输入至深度卷积生成对抗网络;
步骤4,采用深度卷积生成对抗网络对输入的N个图片训练样本和N个真实图片样本进行训练;
步骤5,生成接近真实图片样本的N个仿真图片。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,步骤4包含如下步骤:
步骤4.1,深度卷及生成对抗网络包括生成器G和判别器D;
步骤4.2,设计生成判别器D的损失函数。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,所述的生成器G为编码器、转换器或解码器。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,所述的生成器G为反卷积生成器G,所述的判别器D为卷积判别器D。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,步骤4.1包含如下步骤:
步骤4.1.1,采用与所述的判别器D模型对偶的方式生成所述的生成器G;
步骤4.1.2,采用标准化操作构建所述生成器G。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,所述的判别器D的损失函数:
其中,x采样于真实图片样本数据分布Pdata(x),z采样于随机噪声分布Pz(z),E[]表示期望。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,所述的生成器G输入层的激活函数为双曲正切函数;其他层的激活函数为ReLU函数:
其中,xi为输入的真实图片数据,i表示所述生成器G接收的随机噪声的数量。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,所述的判别器D每层的激活函数为Leaky ReLU函数:
其中,0<ai<1,xi为输入的真实图片数据,i表示所述判别器D接收的随机噪声的数量。
综上所述,本发明的有益效果在于,该发明的图片生成方法能够客服拍摄角度、背景等差异,相比于生成对抗网络,深度卷积生成对抗网络提高了图片生成的相似度,因此能够生成全新的高精度目标图像。
附图说明
图1是本发明一种基于深度卷积生成对抗网络的图片生成方法的流程图。
图2是本发明一种基于深度卷积生成对抗网络的图片生成方法损失函数的变化趋势。
具体实施方式
以下结合附图进一步说明本发明的实施例。
参见附图1,对本发明做进一步的详细描述:
一种基于深度卷积生成对抗网络的图片生成方法,包括如下步骤:
步骤1,随机收集N个具有相同内容的真实图片,作为图片训练样本和真实图片样本;
步骤2,对步骤1中收集的N个真实图片进行预处理;
步骤3,将预处理后的N个图片训练样本和N个真实图片图片输入至深度卷积生成对抗网络;
步骤4,采用深度卷积生成对抗网络对输入的N个图片训练样本和N个真实图片样本进行训练;
步骤5,生成接近真实图片样本的N个仿真图片。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,步骤4包含如下步骤:
步骤4.1,深度卷及生成对抗网络包括生成器G和判别器D;
步骤4.2,设计生成判别器D的损失函数。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,所述的生成器G为编码器、转换器或解码器。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,所述的生成器G为反卷积生成器G,所述的判别器D为卷积判别器D。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,步骤4.1包含如下步骤:
步骤4.1.1,采用与所述的判别器D模型对偶的方式生成所述的生成器G;
步骤4.1.2,采用标准化操作构建所述生成器G。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,所述的判别器D的损失函数:
其中,x采样于真实图片样本数据分布Pdata(x),z采样于随机噪声分布Pz(z),E[]表示期望。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,所述的生成器G输入层的激活函数为双曲正切函数;其他层的激活函数为ReLU函数:
其中,xi为输入的真实图片数据,i表示所述生成器G接收的随机噪声的数量。
上述的基于深度卷积生成对抗网络的图片生成方法,其中,所述的判别器D每层的激活函数为Leaky ReLU函数:
其中,0<ai<1,xi为输入的真实图片数据,i表示所述判别器D接收的随机噪声的数量。
实施例:
步骤1,收集1640个64*64像素、背景色彩各异的彩色花朵图片分别作为训练图片样本和真实图片样本;
步骤2,对收集的1640个64*64像素的图片进行简单的预处理;
步骤3,将预处理完毕后的训练图片样本数据和真实图片数据导入深度卷积生成对抗网络的数据文件夹中;
步骤4,将训练超参数设置为100轮和500轮,学习率设置为0.0002对输入的1640个训练图片样本数据和真实图片数据进行训练,在该网络下,分别计算生成器G和判别器D的损失函数,再利用随机梯度下降算法训练所述生成器G和判别器D,最终得到最优函数,并得到训练好的1640个图片数据;
结果表明,500轮时的图片训练结果比100轮时的图片训练结果更接近原始图片,由图2可以看出,模型前期,损失函数呈下降趋势,模型后期损失函数出现较为明显的震荡出现,说明随着训练的不断进行生成器G和判别器D得到不断的完善,并且由于两者之间呈现对抗的状态,因此会出现图中此消彼长的震荡现象。
综上所述,本发明的有益效果在于,该发明的图片生成方法能够客服拍摄角度、背景等差异,相比于生成对抗网络,深度卷积生成对抗网络提高了图片生成的相似度,因此能够生成全新的高精度目标图像。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构变换,或直接或间接运用附属在其他相关产品的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种基于深度卷积生成对抗网络的图片生成方法,其特征在于:包括如下步骤:
步骤1,随机收集N个具有相同内容的真实图片,作为图片训练样本和真实图片样本;
步骤2,对步骤1中收集的N个真实图片进行预处理;
步骤3,将预处理后的N个图片训练样本和N个真实图片图片输入至深度卷积生成对抗网络;
步骤4,采用深度卷积生成对抗网络对输入的N个图片训练样本和N个真实图片样本进行训练;
步骤5,生成接近真实图片样本的N个仿真图片。
2.根据权利要求1所述的一种基于深度卷积生成对抗网络的图片生成方法,其特征在于:步骤4包含如下步骤:
步骤4.1,深度卷及生成对抗网络包括生成器G和判别器D;
步骤4.2,设计生成判别器D的损失函数。
3.根据权利要求2所述的一种基于深度卷积生成对抗网络的图片生成方法,其特征在于:所述的生成器G为编码器、转换器或解码器。
4.根据权利要求2所述的一种基于深度卷积生成对抗网络的图片生成方法,其特征在于:所述的生成器G为反卷积生成器G,所述的判别器D为卷积判别器D。
5.根据权利要求1或2所述的一种基于深度卷积生成对抗网络的图片生成方法,其特征在于:步骤4.1包含如下步骤:
步骤4.1.1,采用与所述的判别器D模型对偶的方式生成所述的生成器G;
步骤4.1.2,采用标准化操作构建所述生成器G。
6.根据权利要求2所述的一种基于深度卷积生成对抗网络的图片生成方法,其特征在于:所述的判别器D的损失函数:
其中,x采样于真实图片样本数据分布Pdata(x),z采样于随机噪声分布Pz(z),E[]表示期望。
7.根据权利要求2所述的一种基于深度卷积生成对抗网络的图片生成方法,其特征在于:所述的生成器G输入层的激活函数为双曲正切函数;其他层的激活函数为ReLU函数:
其中,xi为输入的真实图片数据,i表示所述生成器G接收的随机噪声的数量。
8.根据权利要求2所述的一种基于深度卷积生成对抗网络的图片生成方法,其特征在于:所述的判别器D每层的激活函数为Leaky ReLU函数:
其中,0<ai<1,xi为输入的真实图片数据,i表示所述判别器D接收的随机噪声的数量。
CN201810773710.6A 2018-07-15 2018-07-15 一种基于深度卷积生成对抗网络的图片生成方法 Pending CN108932534A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810773710.6A CN108932534A (zh) 2018-07-15 2018-07-15 一种基于深度卷积生成对抗网络的图片生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810773710.6A CN108932534A (zh) 2018-07-15 2018-07-15 一种基于深度卷积生成对抗网络的图片生成方法

Publications (1)

Publication Number Publication Date
CN108932534A true CN108932534A (zh) 2018-12-04

Family

ID=64447749

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810773710.6A Pending CN108932534A (zh) 2018-07-15 2018-07-15 一种基于深度卷积生成对抗网络的图片生成方法

Country Status (1)

Country Link
CN (1) CN108932534A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109674471A (zh) * 2018-12-18 2019-04-26 中国科学技术大学 一种基于生成对抗网络的电阻抗成像方法及系统
CN109697694A (zh) * 2018-12-07 2019-04-30 山东科技大学 基于多头注意力机制的高分辨率的图片的生成方法
CN109741244A (zh) * 2018-12-27 2019-05-10 广州小狗机器人技术有限公司 图片生成方法及装置、存储介质及电子设备
CN109800732A (zh) * 2019-01-30 2019-05-24 北京字节跳动网络技术有限公司 用于生成漫画头像生成模型的方法和装置
CN109933677A (zh) * 2019-02-14 2019-06-25 厦门一品威客网络科技股份有限公司 图像生成方法和图像生成系统
CN110070174A (zh) * 2019-04-10 2019-07-30 厦门美图之家科技有限公司 一种生成对抗网络的稳定训练方法
CN110135301A (zh) * 2019-04-30 2019-08-16 百度在线网络技术(北京)有限公司 交通牌识别方法、装置、设备和计算机可读介质
CN110415182A (zh) * 2019-06-18 2019-11-05 平安科技(深圳)有限公司 眼底oct影像增强方法、装置、设备及存储介质
CN111461250A (zh) * 2020-04-09 2020-07-28 上海城诗信息科技有限公司 一种街景模型生成方法、装置、系统及存储介质
WO2021072870A1 (zh) * 2019-10-15 2021-04-22 平安科技(深圳)有限公司 基于对抗网络的指纹模型生成方法以及相关装置
CN112861217A (zh) * 2021-01-14 2021-05-28 重庆交通大学 基于对抗生成网络的园林设计中图像处理方法、系统
GB2607385A (en) * 2021-02-24 2022-12-07 Nvidia Corp Generating frames for neural simulation using one or more neural networks

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697694A (zh) * 2018-12-07 2019-04-30 山东科技大学 基于多头注意力机制的高分辨率的图片的生成方法
CN109697694B (zh) * 2018-12-07 2023-04-07 山东科技大学 基于多头注意力机制的高分辨率的图片的生成方法
CN109674471A (zh) * 2018-12-18 2019-04-26 中国科学技术大学 一种基于生成对抗网络的电阻抗成像方法及系统
CN109741244A (zh) * 2018-12-27 2019-05-10 广州小狗机器人技术有限公司 图片生成方法及装置、存储介质及电子设备
CN109800732A (zh) * 2019-01-30 2019-05-24 北京字节跳动网络技术有限公司 用于生成漫画头像生成模型的方法和装置
CN109800732B (zh) * 2019-01-30 2021-01-15 北京字节跳动网络技术有限公司 用于生成漫画头像生成模型的方法和装置
CN109933677A (zh) * 2019-02-14 2019-06-25 厦门一品威客网络科技股份有限公司 图像生成方法和图像生成系统
CN110070174A (zh) * 2019-04-10 2019-07-30 厦门美图之家科技有限公司 一种生成对抗网络的稳定训练方法
CN110135301A (zh) * 2019-04-30 2019-08-16 百度在线网络技术(北京)有限公司 交通牌识别方法、装置、设备和计算机可读介质
CN110135301B (zh) * 2019-04-30 2022-02-22 百度在线网络技术(北京)有限公司 交通牌识别方法、装置、设备和计算机可读介质
WO2020252898A1 (zh) * 2019-06-18 2020-12-24 平安科技(深圳)有限公司 眼底oct影像增强方法、装置、设备及存储介质
CN110415182A (zh) * 2019-06-18 2019-11-05 平安科技(深圳)有限公司 眼底oct影像增强方法、装置、设备及存储介质
CN110415182B (zh) * 2019-06-18 2024-03-05 平安科技(深圳)有限公司 眼底oct影像增强方法、装置、设备及存储介质
WO2021072870A1 (zh) * 2019-10-15 2021-04-22 平安科技(深圳)有限公司 基于对抗网络的指纹模型生成方法以及相关装置
CN111461250A (zh) * 2020-04-09 2020-07-28 上海城诗信息科技有限公司 一种街景模型生成方法、装置、系统及存储介质
CN112861217A (zh) * 2021-01-14 2021-05-28 重庆交通大学 基于对抗生成网络的园林设计中图像处理方法、系统
GB2607385A (en) * 2021-02-24 2022-12-07 Nvidia Corp Generating frames for neural simulation using one or more neural networks

Similar Documents

Publication Publication Date Title
CN108932534A (zh) 一种基于深度卷积生成对抗网络的图片生成方法
CN107766447B (zh) 一种使用多层注意力网络机制解决视频问答的方法
CN106548208B (zh) 一种照片图像快速智能风格化方法
WO2020107806A1 (zh) 一种推荐方法及装置
CN107766506A (zh) 一种基于层次化注意力机制的多轮对话模型构建方法
CN110188598A (zh) 一种基于MobileNet-v2的实时手部姿态估计方法
Jönsson et al. Multi-Scattering software: part I: online accelerated Monte Carlo simulation of light transport through scattering media
CN107437077A (zh) 一种基于生成对抗网络的旋转面部表示学习的方法
CN106156003A (zh) 一种问答系统中的问句理解方法
CN107766320A (zh) 一种中文代词消解模型建立方法及装置
CN112949647B (zh) 三维场景描述方法、装置、电子设备和存储介质
CN107909014A (zh) 一种基于深度学习的视频理解方法
Wang et al. Construction of a virtual reality platform for UAV deep learning
CN108229287A (zh) 图像识别方法和装置、电子设备和计算机存储介质
CN109871485A (zh) 一种个性化推荐方法及装置
CN106339368A (zh) 文本情感倾向的获取方法及装置
CN109284767A (zh) 一种基于增广样本和多流层的行人检索方法
CN107066979A (zh) 一种基于深度信息和多维度卷积神经网络的人体动作识别方法
CN112580720A (zh) 一种模型训练方法及装置
CN110795565A (zh) 基于语义识别的别名挖掘方法、装置、介质及电子设备
CN110245602A (zh) 一种基于深度卷积特征的水下静目标识别方法
CN106383586A (zh) 一种孤独症谱系障碍儿童训练系统
CN106407932A (zh) 基于分数阶微积分与广义逆神经网络的手写数字识别方法
CN117033609B (zh) 文本视觉问答方法、装置、计算机设备和存储介质
CN114332565A (zh) 一种基于分布估计的条件生成对抗网络文本生成图像方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20181204

WD01 Invention patent application deemed withdrawn after publication