CN110717555B - 一种基于自然语言和生成对抗网络的图片生成系统及装置 - Google Patents

一种基于自然语言和生成对抗网络的图片生成系统及装置 Download PDF

Info

Publication number
CN110717555B
CN110717555B CN201911270382.9A CN201911270382A CN110717555B CN 110717555 B CN110717555 B CN 110717555B CN 201911270382 A CN201911270382 A CN 201911270382A CN 110717555 B CN110717555 B CN 110717555B
Authority
CN
China
Prior art keywords
resolution
picture
group
low
resolution picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911270382.9A
Other languages
English (en)
Other versions
CN110717555A (zh
Inventor
宋永生
郭旭
王楠
王逸飞
李穗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenling Technology Beijing Co ltd
Original Assignee
Jiangsu United Industrial Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu United Industrial Ltd By Share Ltd filed Critical Jiangsu United Industrial Ltd By Share Ltd
Priority to CN201911270382.9A priority Critical patent/CN110717555B/zh
Publication of CN110717555A publication Critical patent/CN110717555A/zh
Application granted granted Critical
Publication of CN110717555B publication Critical patent/CN110717555B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本说明书实施例提供了一种基于自然语言和生成对抗网络的图片生成系统及装置,通过对自然语言向量化获得服从高斯分布的语言向量;根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片;将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片;将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片,解决了现有技术中无法根据文字内容生成超分辨率图像的技术问题,达到了能够根据输入的文字信息和描述,输出符合文字内容的超分辨率图片的技术效果。

Description

一种基于自然语言和生成对抗网络的图片生成系统及装置
技术领域
本说明书实施例涉及计算机技术领域,尤其涉及一种基于自然语言和生成对抗网络的图片生成系统及装置。
背景技术
近年来图像生成领域飞速发展,生成对抗网络的方法被广泛用来生成图像,但是这一类方案是根据已有的图片,生成具有近似风格和内容的图片,属于根据图片生成图片的范畴,且生成的图片分辨率无法满足超分辨率的要求。
但本申请发明人在实现本申请实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
现有技术中存在无法根据文字内容生成超分辨率图像的技术问题。
发明内容
本说明书实施例提供及一种基于自然语言和生成对抗网络的图片生成系统及装置,解决了现有技术中存在无法根据文字内容生成超分辨率图像的技术问题,达到了能够根据输入的文字信息和描述,输出符合文字内容的超分辨率图片的技术效果。
鉴于上述问题,提出了本申请实施例以便提供一种基于自然语言和生成对抗网络的图片生成系统及装置。
第一方面,本说明书实施例提供一种基于自然语言和生成对抗网络的图片生成系统,所述系统包括:根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量;根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片;将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片;将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片。
优选地,所述根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量,包括:根据所述TF-IDF方法与词嵌入处理所述自然语言获得文字矩阵;根据高斯分布方法对所述文字矩阵数据条件增强,将所述文字矩阵与全连接层连接,获得服从高斯分布的语言向量。
优选地,所述根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片,包括:将所述语言向量与初始化噪音数据输入第一组生成器,输出图片数据;将所述图片数据、原始图片信息与自然语言文字嵌入信息输入第一组判别器,获得判别后的低分辨率图片,其中,定义在所述第一组生成器与所述第一组判别器中的第一损失函数,对所述低分辨率图片进行训练,获得所述第一损失函数的最小值。
优选地,所述将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片,包括:将低分辨率图片和所述自然语言向量化处理,获得特征向量;将所述特征向量输入第二组生成器和第二组判别器,输出高分辨率图片,其中,定义在所述第二组生成器与所述第二组判别器中的第二损失函数,对所述低分辨率图片进行训练,获得所述第二损失函数的最小值。
优选地,所述将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片,包括:将所述低分辨率图片输入第三生成器与第三判别器,根据所述残差网络对所述低分辨率图片采样,获得高分辨率图像,其中所述高分辨率图像比所述低分辨率图片的分辨率高;将所述高分辨率图像输入第四生成器与第四判别器,根据所述残差网络对述高分辨率图像采样,获得超分辨率图像,其中所述超分辨率图像比所述第一分辨率图片的分辨率高;定义在所述第三组生成器与所述第三组判别器中第三损失函数和在所述第四组生成器与所述第四组判别器中第四损失函数,分别对所述高分辨率图像与所述超分辨率图像进行训练,获得所述第三损失函数与所述第四损失函数的最小值。
优选地,所述系统包括:记录所述第一组生成器、所述第二组生成器、所述第三组生成器与所述第四组生成器的权值,确定完整生成器;将所述自然语言输入所述完整生成器,输出所述超分辨率图片。
第二方面,本说明书实施例提供一种基于自然语言和生成对抗网络的图片生成装置,所述装置包括:
第一获得单元,用于根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量;
第二获得单元,用于根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片;
第三获得单元,用于将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片;
第一操作单元,用于将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片。
优选地,所述第一获得单元中根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量,包括:
第四获得单元,用于根据所述TF-IDF方法与词嵌入处理所述自然语言获得文字矩阵;
第五获得单元,用于根据高斯分布方法对所述文字矩阵数据条件增强,将所述文字矩阵与全连接层连接,获得服从高斯分布的语言向量。
优选地,所述第二获得单元中根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片,包括:
第一输出单元,用于将所述语言向量与初始化噪音数据输入第一组生成器,输出图片数据;
第六获得单元,用于将所述图片数据、原始图片信息与自然语言文字嵌入信息输入第一组判别器,获得判别后的低分辨率图片,其中,定义在所述第一组生成器与所述第一组判别器中的第一损失函数,对所述低分辨率图片进行训练,获得所述第一损失函数的最小值。
优选地,所述第三获得单元中将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片,包括:
第七获得单元,用于将低分辨率图片和所述自然语言向量化处理,获得特征向量;
第二输出单元,用于将所述特征向量输入第二组生成器和第二组判别器,输出高分辨率图片,其中,定义在所述第二组生成器与所述第二组判别器中的第二损失函数,对所述低分辨率图片进行训练,获得所述第二损失函数的最小值。
优选地,所述第一操作单元中将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片,包括:
第八获得单元,用于将所述低分辨率图片输入第三生成器与第三判别器,根据所述残差网络对所述低分辨率图片采样,获得高分辨率图像,其中所述高分辨率图像比所述低分辨率图片的分辨率高;
第九获得单元,用于将所述高分辨率图像输入第四生成器与第四判别器,根据所述残差网络对述高分辨率图像采样,获得超分辨率图像,其中所述超分辨率图像比所述第一分辨率图片的分辨率高,其中,定义在所述第三组生成器与所述第三组判别器中第三损失函数和在所述第四组生成器与所述第四组判别器中第四损失函数,分别对所述高分辨率图像与所述超分辨率图像进行训练,获得所述第三损失函数与所述第四损失函数的最小值。
优选地,所述装置包括:
第一确定单元,用于记录所述第一组生成器、所述第二组生成器、所述第三组生成器与所述第四组生成器的权值,确定完整生成器;
第三输出单元,用于将所述自然语言输入所述完整生成器,输出所述超分辨率图片。
第三方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述系统的步骤。
第四方面,本说明书实施例提供一种基于自然语言和生成对抗网络的图片生成装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行上述任一项所述系统的步骤。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本说明书实施例提供的基于自然语言和生成对抗网络的图片生成系统及装置,通过根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量;根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片;将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片;将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片。解决了现有技术中存在无法根据文字内容生成超分辨率图像的技术问题,达到了能够根据输入的文字信息和描述,输出符合文字内容的超分辨率图片的技术效果。
附图说明
图1为本说明书实施例中提供的一种基于自然语言和生成对抗网络的图片生成系统流程图;
图2为本说明书实施例中提供的一种基于自然语言和生成对抗网络的图片生成装置示意图;
图3为本说明书实施例中提供的另一种基于自然语言和生成对抗网络的图片生成装置示意图。
附图标号说明:总线300,接收器301,处理器302,发送器303,存储器304,总线接口306。
具体实施方式
本发明实施例提供了一种基于自然语言和生成对抗网络的图片生成系统及装置,用于解决了现有技术中存在无法根据文字内容生成超分辨率图像的技术问题,本发明提供的技术方案总体思路如下:
在本发明实施例的技术方案中,通过根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量;根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片;将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片;将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片。解决了存在无法根据文字内容生成超分辨率图像的技术问题,达到了能够根据输入的文字信息和描述,输出符合文字内容的超分辨率图片的技术效果。
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。
在本文公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本文公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
实施例一
图1为本发明实施例中一种基于自然语言和生成对抗网络的图片生成系统的流程示意图。如图1所示。所述系统应用于一基于自然语言和生成对抗网络的图片生成设备,所述基于自然语言和生成对抗网络的图片生成处理设备包括一输入设备和一显示设备,所述输入设备内部具有文字输入模块、文字处理模块、存储器、信号输入模块,所述输入设备可以与键盘等产生输出信号的设备进行连接,所述显示设备与所述输入设备连接,能够将所述键盘等输入设备处理的图片显示出来的显示屏等设备。该系统包括步骤S101-S104。
S101:根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量;
进一步的,所述根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量,包括:根据所述TF-IDF方法与词嵌入处理所述自然语言获得文字矩阵;根据高斯分布方法对所述文字矩阵数据条件增强,将所述文字矩阵与全连接层连接,获得服从高斯分布的语言向量。
具体而言,通过根据所述TF-IDF方法与词嵌入处理所述自然语言获得文字矩阵,根据高斯分布方法对所述文字矩阵数据条件增强,将所述文字矩阵与全连接层连接,获得服从高斯分布的语言向量。
S102:根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片;
进一步的,所述根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片,包括:将所述语言向量与初始化噪音数据输入第一组生成器,输出图片数据;将所述图片数据、原始图片信息与自然语言文字嵌入信息输入第一组判别器,获得判别后的低分辨率图片,其中,定义在所述第一组生成器与所述第一组判别器中的第一损失函数,对所述低分辨率图片进行训练,获得所述第一损失函数的最小值。
具体而言,通过在多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络。将所述语言向量与初始化噪音数据输入第一组生成器,输出图片数据,将所述图片数据、原始图片信息与自然语言文字嵌入信息输入第一组判别器,获得判别后的低分辨率图片,所述低分辨率图片是利用文本描述粗略勾画物体主要的形状和颜色的图片。定义在所述第一组生成器与所述第一组判别器中图片生成和判别的第一损失函数,对所述低分辨率图片进行训练,获得所述第一损失函数的最小值,即通过对所述低分辨率图片进行训练使第一损失函数降到最低。
S103:将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片;
进一步的,所述将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片,包括:将低分辨率图片和所述自然语言向量化处理,获得特征向量;将所述特征向量输入第二组生成器和第二组判别器,输出高分辨率图片,其中,定义在所述第二组生成器与所述第二组判别器中的第二损失函数,对所述低分辨率图片进行训练,获得所述第二损失函数的最小值。
具体而言,将低分辨率图片和所述自然语言向量化处理,获得特征向量。将所述特征向量输入第二组生成器,输出高分辨率图片,所述高分辨率图片为细节丰富的图片。将所述高分辨率图片输入第二组判别器,进行判别。定义在所述第二组生成器与所述第二组判别器中的第二损失函数,对所述低分辨率图片进行训练,将所述第二损失函数降到最低。
S104:将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片。
进一步的,所述将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片,包括:将所述低分辨率图片输入第三生成器与第三判别器,根据所述残差网络对所述低分辨率图片采样,获得高分辨率图像,其中所述高分辨率图像比所述低分辨率图片的分辨率高;将所述高分辨率图像输入第四生成器与第四判别器,根据所述残差网络对述高分辨率图像采样,获得超分辨率图像,其中所述超分辨率图像比所述第一分辨率图片的分辨率高,其中,定义在所述第三组生成器与所述第三组判别器中第三损失函数和在所述第四组生成器与所述第四组判别器中第四损失函数,分别对所述高分辨率图像与所述超分辨率图像进行训练,获得所述第三损失函数与所述第四损失函数的最小值。
具体而言,通过将所述低分辨率图片输入第三生成器,根据所述残差网络对所述低分辨率图片采样,确定所述低分辨率图片与下一级分辨率图片的残差,能够生成更高分辨率的高分辨率图像,通过所述第三判别器对所述高分辨率图像进行判别。将所述高分辨率图像输入第四生成器,根据所述残差网络对述高分辨率图像采样,确定所述高分辨率图像与下一级分辨率图片的残差,能够生成更高分辨率的超分辨率图像,通过所述第四判别器对所述超分辨率图像进行判别。当所述第四生成器还未生成超分辨率图片时,可不断的加深神经网络并重复上述第三生成器与第四生成器生成图片的过程,直至生成超分辨率图片。定义所有的生成器和判别器的损失函数,并对生成器生成的图片进行训练,使损失函数值降低。
进一步的,所述系统包括:记录所述第一组生成器、所述第二组生成器、所述第三组生成器与所述第四组生成器的权值,确定完整生成器;将所述自然语言输入所述完整生成器,输出所述超分辨率图片。
具体而言,记录上述步骤中所有生成器的权值作为完整的生成器,通过对完整的生成器生成的图片进行训练,获得训练好的生成对抗网络模型。在所述生成对抗网络模型中输入医院文字描述,能够输出一张满足设置参数的超分辨图片,如输入文字为一条黄色毛的小狗在草地上奔跑,通过训练好的生成对抗网络模型,可以获得一张1024×1024分辨率的图片。
实施例二
基于与前述实施例中一种基于自然语言和生成对抗网络的图片生成系统同样的发明构思,本发明还提供一种基于自然语言和生成对抗网络的图片生成装置,如图2所示,包括:
第一获得单元11,用于根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量;
第二获得单元12,用于根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片;
第三获得单元13,用于将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片;
第一操作单元14,用于将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片。
进一步的,所述第一获得单元中根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量,包括:
第四获得单元,用于根据所述TF-IDF方法与词嵌入处理所述自然语言获得文字矩阵;
第五获得单元,用于根据高斯分布方法对所述文字矩阵数据条件增强,将所述文字矩阵与全连接层连接,获得服从高斯分布的语言向量。
进一步的,所述第二获得单元中根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片,包括:
第一输出单元,用于将所述语言向量与初始化噪音数据输入第一组生成器,输出图片数据;
第六获得单元,用于将所述图片数据、原始图片信息与自然语言文字嵌入信息输入第一组判别器,获得判别后的低分辨率图片,其中,定义在所述第一组生成器与所述第一组判别器中的第一损失函数,对所述低分辨率图片进行训练,获得所述第一损失函数的最小值。
进一步的,所述第三获得单元中将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片,包括:
第七获得单元,用于将低分辨率图片和所述自然语言向量化处理,获得特征向量;
第二输出单元,用于将所述特征向量输入第二组生成器和第二组判别器,输出高分辨率图片,其中,定义在所述第二组生成器与所述第二组判别器中的第二损失函数,对所述低分辨率图片进行训练,获得所述第二损失函数的最小值。
进一步的,所述第一操作单元中将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片,包括:
第八获得单元,用于将所述低分辨率图片输入第三生成器与第三判别器,根据所述残差网络对所述低分辨率图片采样,获得高分辨率图像,其中所述高分辨率图像比所述低分辨率图片的分辨率高;
第九获得单元,用于将所述高分辨率图像输入第四生成器与第四判别器,根据所述残差网络对述高分辨率图像采样,获得超分辨率图像,其中所述超分辨率图像比所述第一分辨率图片的分辨率高,其中,定义在所述第三组生成器与所述第三组判别器中第三损失函数和在所述第四组生成器与所述第四组判别器中第四损失函数,分别对所述高分辨率图像与所述超分辨率图像进行训练,获得所述第三损失函数与所述第四损失函数的最小值。
进一步的,所述装置包括:
第一确定单元,用于记录所述第一组生成器、所述第二组生成器、所述第三组生成器与所述第四组生成器的权值,确定完整生成器;
第三输出单元,用于将所述自然语言输入所述完整生成器,输出所述超分辨率图片。
前述图1实施例一中的一种基于自然语言和生成对抗网络的图片生成系统的各种变化方式和具体实例同样适用于本实施例的一种基于自然语言和生成对抗网络的图片生成装置,通过前述对一种基于自然语言和生成对抗网络的图片生成系统的详细描述,本领域技术人员可以清楚的知道本实施例中一种基于自然语言和生成对抗网络的图片生成装置的实施系统,所以为了说明书的简洁,在此不再详述。
实施例三
基于与前述实施例一中一种基于自然语言和生成对抗网络的图片生成系统同样的发明构思,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前文所述一种基于自然语言和生成对抗网络的图片生成系统的任一系统的步骤。
其中,在图3中,总线架构(用总线300来代表),总线300可以包括任意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口306在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器302负责管理总线300和通常的处理,而存储器304可以被用于存储处理器302在执行操作时所使用的数据。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本说明书实施例提供的基于自然语言和生成对抗网络的图片生成系统及装置,通过根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量;根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片;将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片;将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片,解决了存在无法根据文字内容生成超分辨率图像的技术问题,达到了能够根据输入的文字信息和描述,输出符合文字内容的超分辨率图片的技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为系统、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的系统、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。
显然,本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样,倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内,则本说明书也意图包含这些改动和变型在内。

Claims (9)

1.一种基于自然语言和生成对抗网络的图片生成方法,其特征在于,所述方法包括:
根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量;
根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片;
将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片;
将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片,包括:
将所述低分辨率图片输入第三组生成器与第三组判别器,根据所述残差网络对所述低分辨率图片采样,获得高分辨率图像,其中所述高分辨率图像比所述低分辨率图片的分辨率高;
将所述高分辨率图像输入第四组生成器与第四组判别器,根据所述残差网络对述高分辨率图像采样,获得超分辨率图像,其中所述超分辨率图像比所述高分辨率图片的分辨率高。
2.如权利要求1所述的方法,其特征在于,所述根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量,包括:
根据所述TF-IDF方法与词嵌入处理所述自然语言获得文字矩阵;
根据高斯分布方法对所述文字矩阵数据条件增强,将所述文字矩阵与全连接层连接,获得服从高斯分布的语言向量。
3.如权利要求1所述的方法,其特征在于,所述根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片,包括:
将所述语言向量与初始化噪音数据输入第一组生成器,输出图片数据;
将所述图片数据、原始图片信息与自然语言文字嵌入信息输入第一组判别器,获得判别后的低分辨率图片,其中,定义在所述第一组生成器与所述第一组判别器中的第一损失函数,对所述低分辨率图片进行训练,获得所述第一损失函数的最小值。
4.如权利要求3所述的方法,其特征在于,所述将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片,包括:
将低分辨率图片和所述自然语言向量化处理,获得特征向量;
将所述特征向量输入第二组生成器和第二组判别器,输出高分辨率图片,其中,定义在所述第二组生成器与所述第二组判别器中的第二损失函数,对所述低分辨率图片进行训练,获得所述第二损失函数的最小值。
5.如权利要求4所述的方法,其特征在于,所述将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片,包括:
定义在所述第三组生成器与所述第三组判别器中第三损失函数和在所述第四组生成器与所述第四组判别器中第四损失函数,分别对所述高分辨率图像与所述超分辨率图像进行训练,获得所述第三损失函数与所述第四损失函数的最小值。
6.如权利要求5所述的方法,其特征在于,所述方法包括:
记录所述第一组生成器、所述第二组生成器、所述第三组生成器与所述第四组生成器的权值,确定完整生成器;
将所述自然语言输入所述完整生成器,输出所述超分辨率图片。
7.一种基于自然语言和生成对抗网络的图片生成装置,其特征在于,所述装置包括:
第一获得单元,用于根据TF-IDF方法与词嵌入对自然语言向量化获得服从高斯分布的语言向量;
第二获得单元,用于根据多组深度神经网络设置多组生成器与判别器建立层叠生成对抗网络,将所述语言向量输入所述层叠生成对抗网络中,获得低分辨率图片;
第三获得单元,用于将所述低分辨率图片和所述自然语言输入所述层叠生成对抗网络中,获得高分辨率图片;
第一操作单元,用于将所述高分辨率图片输入残差网络,结合所述层叠生成对抗网络,所述低分辨率图片生成超分辨率图片;
所述第一操作单元包括:
第八获得单元,用于将所述低分辨率图片输入第三组生成器与第三组判别器,根据所述残差网络对所述低分辨率图片采样,获得高分辨率图像,其中所述高分辨率图像比所述低分辨率图片的分辨率高;
第九获得单元,用于将所述高分辨率图像输入第四组生成器与第四组判别器,根据所述残差网络对述高分辨率图像采样,获得超分辨率图像。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6任一项所述方法的步骤。
9.一种基于自然语言和生成对抗网络的图片生成装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-6任一项所述方法的步骤。
CN201911270382.9A 2019-12-12 2019-12-12 一种基于自然语言和生成对抗网络的图片生成系统及装置 Active CN110717555B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911270382.9A CN110717555B (zh) 2019-12-12 2019-12-12 一种基于自然语言和生成对抗网络的图片生成系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911270382.9A CN110717555B (zh) 2019-12-12 2019-12-12 一种基于自然语言和生成对抗网络的图片生成系统及装置

Publications (2)

Publication Number Publication Date
CN110717555A CN110717555A (zh) 2020-01-21
CN110717555B true CN110717555B (zh) 2020-08-25

Family

ID=69216668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911270382.9A Active CN110717555B (zh) 2019-12-12 2019-12-12 一种基于自然语言和生成对抗网络的图片生成系统及装置

Country Status (1)

Country Link
CN (1) CN110717555B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111402365B (zh) * 2020-03-17 2023-02-10 湖南大学 一种基于双向架构对抗生成网络的由文字生成图片的方法
CN111597338B (zh) * 2020-05-19 2023-04-18 杭州英视信息科技有限公司 对抗支持向量机
CN112669215A (zh) * 2021-01-05 2021-04-16 北京金山云网络技术有限公司 一种训练文本图像生成模型、文本图像生成的方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109671125B (zh) * 2018-12-17 2023-04-07 电子科技大学 一种高度融合的gan网络装置及实现文本生成图像的方法
US10452902B1 (en) * 2018-12-21 2019-10-22 Capital One Services, Llc Patent application image generation systems
CN110490946B (zh) * 2019-07-15 2023-07-04 同济大学 基于跨模态相似度和生成对抗网络的文本生成图像方法
CN110415176A (zh) * 2019-08-09 2019-11-05 北京大学深圳研究生院 一种文本图像超分辨率方法

Also Published As

Publication number Publication date
CN110717555A (zh) 2020-01-21

Similar Documents

Publication Publication Date Title
CN110717555B (zh) 一种基于自然语言和生成对抗网络的图片生成系统及装置
US20200242409A1 (en) Method, device and terminal for generating training data
US10552712B2 (en) Training device and training method for training image processing device
EP3961441B1 (en) Identity verification method and apparatus, computer device and storage medium
CN111079570A (zh) 一种人体关键点识别方法、装置及电子设备
US20220222925A1 (en) Artificial intelligence-based image processing method and apparatus, device, and storage medium
CN111275784B (zh) 生成图像的方法和装置
CN110210626A (zh) 数据处理方法、装置和计算机可读存储介质
CN109684476B (zh) 一种文本分类方法、文本分类装置及终端设备
CN114170482B (zh) 一种文档预训练模型训练方法、装置、设备及介质
JP6612486B1 (ja) 学習装置、分類装置、学習方法、分類方法、学習プログラム、及び分類プログラム
WO2020256732A1 (en) Domain adaptation and fusion using task-irrelevant paired data in sequential form
CN110929041A (zh) 基于分层注意力机制的实体对齐方法及系统
CN114219971A (zh) 一种数据处理方法、设备以及计算机可读存储介质
KR20230132350A (ko) 연합 감지 모델 트레이닝, 연합 감지 방법, 장치, 설비 및 매체
van Tulder et al. Representation learning for cross-modality classification
CN111126566B (zh) 基于gan模型的异常家具布局数据检测方法
CN111259623A (zh) 一种基于深度学习的pdf文档段落自动提取系统及装置
CN109447240B (zh) 图形图像复制模型的训练方法、存储介质及计算设备
CN116842384A (zh) 多模态模型训练方法、装置、电子设备及可读存储介质
CN116152368A (zh) 字体生成方法、字体生成模型的训练方法、装置及设备
Bruch et al. Evaluation of semi-supervised learning using sparse labeling to segment cell nuclei
CN114676705A (zh) 一种对话关系处理方法、计算机及可读存储介质
CN107742316A (zh) 图像拼接点获取方法及获取装置
KR20210038027A (ko) 신경망 압축 훈련 방법 및 압축된 신경망을 이용하는 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220516

Address after: Room 408, unit 2, building 15, courtyard 16, Yingcai North Third Street, future science city, Changping District, Beijing 102200

Patentee after: Wenling Technology (Beijing) Co.,Ltd.

Address before: Room 1502, Tongfu building, 501 Zhongshan South Road, Qinhuai District, Nanjing, Jiangsu 210006

Patentee before: Jiangsu United Industrial Limited by Share Ltd.

TR01 Transfer of patent right