CN111462263A - 一种图像生成方法及装置 - Google Patents

一种图像生成方法及装置 Download PDF

Info

Publication number
CN111462263A
CN111462263A CN202010181201.1A CN202010181201A CN111462263A CN 111462263 A CN111462263 A CN 111462263A CN 202010181201 A CN202010181201 A CN 202010181201A CN 111462263 A CN111462263 A CN 111462263A
Authority
CN
China
Prior art keywords
preset
image
draft image
draft
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010181201.1A
Other languages
English (en)
Other versions
CN111462263B (zh
Inventor
薛锐青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Xiamen Yunzhixin Intelligent Technology Co Ltd
Original Assignee
Unisound Intelligent Technology Co Ltd
Xiamen Yunzhixin Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Intelligent Technology Co Ltd, Xiamen Yunzhixin Intelligent Technology Co Ltd filed Critical Unisound Intelligent Technology Co Ltd
Priority to CN202010181201.1A priority Critical patent/CN111462263B/zh
Publication of CN111462263A publication Critical patent/CN111462263A/zh
Application granted granted Critical
Publication of CN111462263B publication Critical patent/CN111462263B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像生成方法及装置,包括:根据预设图片生成图像精度递增的预设草稿图像;利用预设草稿图像和实际草稿图像对预设模型进行训练;保存训练好的预设模型;获取当前图片,将当前图片输入到训练好的预设模型确定当前图片对应的目标图像。通过获取预设图片精度递增的预设草稿图像来使得预设模型获得大量的训练数据,并且在生成预设草稿图像的过程中像素点不是一次性的生成的,而是逐渐生成的并且生成的预设草稿图像可供用户选择性的进行对预设模型的训练。解决了现有技术中由于在生成伪造图像的过程中次生成所有像素点,导致生成的图片质量较差和在生成过程中无法进行人为干预从而出现不确定因素导致模型不完善的问题。

Description

一种图像生成方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种图像生成方法及装置。
背景技术
深度学习引领着新一轮的人工智能浪潮,在很多领域受到广泛关注。尤其在图形图像领域里,人脸识别和自动驾驶等应用正在逐渐进入我们的生活。深度学习是机器学习中一种基于对数据进行表征学习的方法。模仿人脑的机制来解释数据,例如图像,声音和文本等。其优势在于用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。现有技术中的深度学习模型通过手机海量图图像,将其结合随机噪声输入到生成器中生成伪造图像,然后将伪造图像和实际图像输入到判别器中判别伪造图像是否为实际图像,将判别器和生成器结合训练深度学习模型,这种方法存在以下缺点:(1)在生成伪造图像的过程中次生成所有像素点,导致生成的图片质量较差;(2)在生成过程中无法进行人为干预从而出现不确定因素导致模型不完善。
发明内容
针对上述所显示出来的问题,本方法基于根据预设图片生成图像精度递增的预设草稿图像,利用预设草稿图像和实际草稿图像对预设模型进行训练,最后将当前图片输入训练好的模型中获取目标图像。
一种图像生成方法,包括以下步骤:
根据预设图片生成图像精度递增的预设草稿图像;
利用所述预设草稿图像和实际草稿图像对预设模型进行训练;
保存训练好的预设模型;
获取当前图片,将所述当前图片输入到所述训练好的预设模型确定所述当前图片对应的目标图像。
优选的,所述根据预设图片生成图像精度递增的预设草稿图像,包括:
获取预设数目个所述预设图片;
根据类别对所述预设数目个预设图片进行分类,分为n个类别;
对所述n个类别中每个预设图片进行序号排列;
将每个预设图片的序号和随机噪声输入到生成器中以生成最粗糙的第一预设草稿图像;
将所述第一预设草稿图像和所述每个预设图片对应的序号输入到所述生成器中生成相比于所述第一预设草稿图像相精细的第二预设草稿图像;
基于所述第二预设草稿图像,将所述第二预设草稿图像的生成步骤迭代m次,直到生成大于等于预设精度的预设草稿图像;
确定所述第一预设草稿图像到最精致的预设草稿图像为每个预设图片的所述预设草稿图像。
优选的,所述利用所述预设草稿图像和实际草稿图像对预设模型进行训练,包括:
将所述每个预设图片的预设草稿图像和所述每个图片的实际草稿图像输入到判别器中进行相似度判别,输出判别结果;
将所述判别结果中与所述实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像;
将每个预设图片的最终草稿图像保存到所述预设模型中并对所述预设模型进行训练。
优选的,所述获取当前图片,将所述当前图片输入到所述训练好的预设模型确定所述当前图片对应的目标图像,包括:
对所述当前图片进行像素优化;
将优化后的当前图片和所述随机噪声输入到生成器中获得最粗糙的第一当前图像;
将所述第一当前图像和所述随机噪声输入到所述生成器中生成相比于所述第一当前图像精细的第二当前图像,迭代此步骤以生成更多当前图像直到生成大于等于预设精度的当前图像为止;
将生成的多个当前图像输入到所述训练后的预设模型中进行筛选以确定所述目标图像。
优选的,所述将所述判别结果中所述预设草稿图像和所述实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像,包括:
将所述预设草稿图像代入到预先建立的直角坐标系中,以所述预设草稿图像中心为原点;
确定所述预设草稿图像在所述直角坐标系中每个象限的第一像素数据;
将所述第一像素数据与所述实际草稿图像的在所述每个象限的第二像素数据作对比;
确定每个象限中所述第一像素数据和第二像素数据的相似百分比;
计算四个象限的最终百分比;
将所述最终百分比大于等于所述预设阈值的预设草稿图像确定为最终草稿图像。
一种图像生成装置,该装置包括:
生成模块,用于根据预设图片生成图像精度递增的预设草稿图像;
训练模块,用于利用所述预设草稿图像和实际草稿图像对预设模型进行训练;
保存模块,用于保存训练好的预设模型;
确定模块,用于获取当前图片,将所述当前图片输入到所述训练好的预设模型确定所述当前图片对应的目标图像。
优选的,所述生成模块,包括:
获取子模块,用于获取预设数目个所述预设图片;
分类模块,用于根据类别对所述预设数目个预设图片进行分类,分为n个类别;
排序模块,用于对所述n个类别中每个预设图片进行序号排列;
第一生成子模块,用于将每个预设图片的序号和随机噪声输入到生成器中以生成最粗糙的第一预设草稿图像;
第二生成子模块,用于将所述预设草稿图像和所述每个预设图片对应的序号输入到所述生成器中生成相比于所述第一预设草稿图像相精细的第二预设草稿图像;
第三生成子模块,用于基于所述第二预设草稿图像,将所述第二预设草稿图像的生成步骤迭代m次,直到生成大于等于预设精度的预设草稿图像;
确定子模块,用于确定所述第一预设草稿图像到最精致的预设草稿图像为每个预设图片的所述预设草稿图像。
优选的,所述训练模块,包括:
判别子模块,用于将所述每个预设图片的预设草稿图像和所述每个图片的实际草稿图像输入到判别器中进行相似度判别,输出判别结果;
确认子模块,用于将所述判别结果中与所述实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像;
训练子模块,用于将每个预设图片的最终草稿图像保存到所述预设模型中并对所述预设模型进行训练。
优选的,所述确定模块,包括:
优化子模块,用于对所述当前图片进行像素优化;
第四生成子模块,用于将优化后的当前图片和所述随机噪声输入到生成器中获得最粗糙的第一当前图像;
第五生成子模块,用于将所述第一当前图像和所述随机噪声输入到所述生成器中生成相比于所述第一当前图像精细的第二当前图像,迭代此步骤以生成更多当前图像直到生成大于等于预设精度的当前图像为止;
筛选子模块,用于将生成的多个当前图像输入到所述训练后的预设模型中进行筛选以确定所述目标图像。
优选的,所述确认子模块,包括:
代入单元,用于将所述预设草稿图像代入到预先建立的直角坐标系中,以所述预设草稿图像中心为原点;
第一确定单元,用于确定所述预设草稿图像在所述直角坐标系中每个象限的第一像素数据;
对比单元,用于将所述第一像素数据与所述实际草稿图像的在所述每个象限的第二像素数据作对比;
第二确定单元,用于确定每个象限中所述第一像素数据和第二像素数据的相似百分比;
计算单元,用于计算四个象限的最终百分比;
第三确定单元,用于将所述最终百分比大于等于所述预设阈值的预设草稿图像确定为最终草稿图像。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明所提供的一种图像生成方法的工作流程图;
图2为本发明所提供的一种图像生成方法的另一工作流程图;
图3为本发明所提供的一种图像生成装置的结构图;
图4为本发明所提供的一种图像生成装置的另一结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
深度学习引领着新一轮的人工智能浪潮,在很多领域受到广泛关注。尤其在图形图像领域里,人脸识别和自动驾驶等应用正在逐渐进入我们的生活。深度学习是机器学习中一种基于对数据进行表征学习的方法。模仿人脑的机制来解释数据,例如图像,声音和文本等。其优势在于用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。现有技术中的深度学习模型通过手机海量图图像,将其结合随机噪声输入到生成器中生成伪造图像,然后将伪造图像和实际图像输入到判别器中判别伪造图像是否为实际图像,将判别器和生成器结合训练深度学习模型,这种方法存在以下缺点:(1)在生成伪造图像的过程中次生成所有像素点,导致生成的图片质量较差;(2)在生成过程中无法进行人为干预从而出现不确定因素导致模型不完善。为了解决上述问题,本实施例公开了一种基于根据预设图片生成图像精度递增的预设草稿图像,利用预设草稿图像和实际草稿图像对预设模型进行训练,最后将当前图片输入训练好的模型中获取目标图像的方法。
一种图像生成方法,如图1所示,包括以下步骤:
步骤S101、根据预设图片生成图像精度递增的预设草稿图像;
步骤S102、利用预设草稿图像和实际草稿图像对预设模型进行训练;
步骤S103、保存训练好的预设模型;
步骤S104、获取当前图片,将当前图片输入到训练好的预设模型确定当前图片对应的目标图像。
上述技术方案的工作原理为:根据预设图片生成图像精度递增的预设草稿图像;然后利用预设草稿图像和实际草稿图像对预设模型进行训练;保存训练好的预设模型;最后获取当前图片,将当前图片输入到训练好的预设模型确定当前图片对应的目标图像。
上述技术方案的有益效果为:通过获取预设图片精度递增的预设草稿图像来使得预设模型获得大量的训练数据,并且在生成预设草稿图像的过程中像素点不是一次性的生成的,而是逐渐生成的并且生成的预设草稿图像可供用户选择性的进行对预设模型的训练。去除了预设草稿图像中的不确定因素,解决了现有技术中由于在生成伪造图像的过程中次生成所有像素点,导致生成的图片质量较差和在生成过程中无法进行人为干预从而出现不确定因素导致模型不完善的问题。
在一个实施例中,根据预设图片生成图像精度递增的预设草稿图像,包括:
获取预设数目个所述预设图片;
根据类别对预设数目个预设图片进行分类,分为n个类别;
对n个类别中每个预设图片进行序号排列;
将每个预设图片的序号和随机噪声输入到生成器中以生成最粗糙的第一预设草稿图像;
将第一预设草稿图像和每个预设图片对应的序号输入到生成器中生成相比于第一预设草稿图像相精细的第二预设草稿图像;
基于第二预设草稿图像,将第二预设草稿图像的生成步骤迭代m次,直到生成大于等于预设精度的预设草稿图像;
确定第一预设草稿图像到最精致的预设草稿图像为每个预设图片的预设草稿图像;
在本实施例中,上述n个类别可以根据图片的内容进行分类,例如可以分为风景图片、人物图片、动漫图片等。上述n为大于等于2的正整数。
上述技术方案的有益效果为:通过分类可以使序号排列更加简单,根据序号将预设图片输入到生成器中生成预设草稿图像可以避免重复生成预设草稿图像,节省了成本并且提高了工作效率。
在一个实施例中,如图2所示,利用预设草稿图像和实际草稿图像对预设模型进行训练,包括:
步骤S201、将每个预设图片的预设草稿图像和每个图片的实际草稿图像输入到判别器中进行相似度判别,输出判别结果;
步骤S202、将判别结果中与实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像;
步骤S203、将每个预设图片的最终草稿图像保存到预设模型中并对预设模型进行训练;
在本实施例中,上述预设阈值可以为95%。
上述技术方案的有益效果为:确定与实际草稿图像相似的预设草稿图像作为训练数据,使得预设训练模型可以针对性对预设草稿图像和实际草稿图像的相似度进行标记,从而使得预设训练模型在输入当前图片时可以直接获得与实际草稿图像相似的图像。
在一个实施例中,获取当前图片,将当前图片输入到训练好的预设模型确定当前图片对应的目标图像,包括:
对当前图片进行像素优化;
将优化后的当前图片和随机噪声输入到生成器中获得最粗糙的第一当前图像;
将第一当前图像和随机噪声输入到生成器中生成相比于第一当前图像精细的第二当前图像,迭代此步骤以生成更多当前图像直到生成大于等于预设精度的当前图像为止;
将生成的多个当前图像输入到训练后的预设模型中进行筛选以确定目标图像。
上述技术方案的有益效果为:通过对当前图片进行像素优化来使得当前图片的像素更高从而可以更直观的生成多个当前图像。
在一个实施例中,将判别结果中预设草稿图像和实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像,包括:
将预设草稿图像代入到预先建立的直角坐标系中,以预设草稿图像中心为原点;
确定预设草稿图像在直角坐标系中每个象限的第一像素数据;
将第一像素数据与实际草稿图像的在每个象限的第二像素数据作对比;
确定每个象限中所述第一像素数据和第二像素数据的相似百分比;
计算四个象限的最终百分比;
将最终百分比大于等于预设阈值的预设草稿图像确定为最终草稿图像。
上述技术方案的有益效果为:使得对比的结果更加准确进而可以更准确的确定最终草稿图像。
在一个实施例中,包括:
第1步:收集海量图片;
第2步:对图片进行类别标注;
第3步:将随机噪声和过程序号输入到生成器网络,生成最粗糙草稿图像;
第4步:将第3步生成的草稿图像和过程序号重复输入到生成器网络,生成更精细草稿图像,这一步迭代若干轮;
第5步:将生成的草稿图像与真实的草稿图像输入到判别器;
第6步:判别器判断输入图像是否为真实草稿图像;
第7步:生成器和判别器联合训练,直到模型收敛;
第8步:将随机噪声和当前图片输入生成器,生成最粗糙草稿图像;
第9步:将第8步生成的草稿图像和过程序号重复输入到生成器网络,生成更精细草稿图像,这一步迭代若干轮;
第10步:输出最终生成的图像。
上述技术方案的有益效果为:1.使用对抗生成网络分层生成图像,效果更好;2.生成中间结果可以人工干预控制。
本实施例还公开了一种图像生成装置,如图3所示,该装置包括:
生成模块301,用于根据预设图片生成图像精度递增的预设草稿图像;
训练模块302,用于利用预设草稿图像和实际草稿图像对预设模型进行训练;
保存模块303,用于保存训练好的预设模型;
确定模块304,用于获取当前图片,将当前图片输入到训练好的预设模型确定当前图片对应的目标图像。
在一个实施例中,生成模块,包括:
获取子模块,用于获取预设数目个预设图片;
分类模块,用于根据类别对预设数目个预设图片进行分类,分为n个类别;
排序模块,用于对n个类别中每个预设图片进行序号排列;
第一生成子模块,用于将每个预设图片的序号和随机噪声输入到生成器中以生成最粗糙的第一预设草稿图像;
第二生成子模块,用于将预设草稿图像和每个预设图片对应的序号输入到生成器中生成相比于第一预设草稿图像相精细的第二预设草稿图像;
第三生成子模块,用于基于第二预设草稿图像,将第二预设草稿图像的生成步骤迭代m次,直到生成大于等于预设精度的预设草稿图像;
确定子模块,用于确定第一预设草稿图像到最精致的预设草稿图像为每个预设图片的预设草稿图像。
在一个实施例中,训练模块,包括:
判别子模块,用于将每个预设图片的预设草稿图像和每个图片的实际草稿图像输入到判别器中进行相似度判别,输出判别结果;
确认子模块,用于将判别结果中与实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像;
训练子模块,用于将每个预设图片的最终草稿图像保存到预设模型中并对预设模型进行训练。
在一个实施例中,确定模块,包括:
优化子模块3041,用于对当前图片进行像素优化;
第四生成子模块3042,用于将优化后的当前图片和随机噪声输入到生成器中获得最粗糙的第一当前图像;
第五生成子模块3043,用于将第一当前图像和随机噪声输入到生成器中生成相比于第一当前图像精细的第二当前图像,迭代此步骤以生成更多当前图像直到生成大于等于预设精度的当前图像为止;
筛选子模块3044,用于将生成的多个当前图像输入到训练后的预设模型中进行筛选以确定目标图像。
在一个实施例中,确认子模块,包括:
代入单元,用于将预设草稿图像代入到预先建立的直角坐标系中,以预设草稿图像中心为原点;
第一确定单元,用于确定预设草稿图像在直角坐标系中每个象限的第一像素数据;
对比单元,用于将第一像素数据与实际草稿图像的在每个象限的第二像素数据作对比;
第二确定单元,用于确定每个象限中第一像素数据和第二像素数据的相似百分比;
计算单元,用于计算四个象限的最终百分比;
第三确定单元,用于将最终百分比大于等于预设阈值的预设草稿图像确定为最终草稿图像。
本领域技术人员应当理解的是,本发明中的第一、第二指的是不同应用阶段而已。
本领域技术用户员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种图像生成方法,其特征在于,包括以下步骤:
根据预设图片生成图像精度递增的预设草稿图像;
利用所述预设草稿图像和实际草稿图像对预设模型进行训练;
保存训练好的预设模型;
获取当前图片,将所述当前图片输入到所述训练好的预设模型确定所述当前图片对应的目标图像。
2.根据权利要求1所述图像生成方法,其特征在于,所述根据预设图片生成图像精度递增的预设草稿图像,包括:
获取预设数目个所述预设图片;
根据类别对所述预设数目个预设图片进行分类,分为n个类别;
对所述n个类别中每个预设图片进行序号排列;
将每个预设图片的序号和随机噪声输入到生成器中以生成最粗糙的第一预设草稿图像;
将所述第一预设草稿图像和所述每个预设图片对应的序号输入到所述生成器中生成相比于所述第一预设草稿图像相精细的第二预设草稿图像;
基于所述第二预设草稿图像,将所述第二预设草稿图像的生成步骤迭代m次,直到生成大于等于预设精度的预设草稿图像;
确定所述第一预设草稿图像到最精致的预设草稿图像为每个预设图片的所述预设草稿图像。
3.根据权利要求1所述图像生成方法,其特征在于,所述利用所述预设草稿图像和实际草稿图像对预设模型进行训练,包括:
将所述每个预设图片的预设草稿图像和所述每个图片的实际草稿图像输入到判别器中进行相似度判别,输出判别结果;
将所述判别结果中与所述实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像;
将每个预设图片的最终草稿图像保存到所述预设模型中并对所述预设模型进行训练。
4.根据权利要求1所述图像生成方法,其特征在于,所述获取当前图片,将所述当前图片输入到所述训练好的预设模型确定所述当前图片对应的目标图像,包括:
对所述当前图片进行像素优化;
将优化后的当前图片和所述随机噪声输入到生成器中获得最粗糙的第一当前图像;
将所述第一当前图像和所述随机噪声输入到所述生成器中生成相比于所述第一当前图像精细的第二当前图像,迭代此步骤以生成更多当前图像直到生成大于等于预设精度的当前图像为止;
将生成的多个当前图像输入到所述训练后的预设模型中进行筛选以确定所述目标图像。
5.根据权利要求3所述图像生成方法,其特征在于,所述将所述判别结果中所述预设草稿图像和所述实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像,包括:
将所述预设草稿图像代入到预先建立的直角坐标系中,以所述预设草稿图像中心为原点;
确定所述预设草稿图像在所述直角坐标系中每个象限的第一像素数据;
将所述第一像素数据与所述实际草稿图像的在所述每个象限的第二像素数据作对比;
确定每个象限中所述第一像素数据和第二像素数据的相似百分比;
计算四个象限的最终百分比;
将所述最终百分比大于等于所述预设阈值的预设草稿图像确定为最终草稿图像。
6.一种图像生成装置,其特征在于,该装置包括:
生成模块,用于根据预设图片生成图像精度递增的预设草稿图像;
训练模块,用于利用所述预设草稿图像和实际草稿图像对预设模型进行训练;
保存模块,用于保存训练好的预设模型;
确定模块,用于获取当前图片,将所述当前图片输入到所述训练好的预设模型确定所述当前图片对应的目标图像。
7.根据权利要求6所述图像生成装置,其特征在于,所述生成模块,包括:
获取子模块,用于获取预设数目个所述预设图片;
分类模块,用于根据类别对所述预设数目个预设图片进行分类,分为n个类别;
排序模块,用于对所述n个类别中每个预设图片进行序号排列;
第一生成子模块,用于将每个预设图片的序号和随机噪声输入到生成器中以生成最粗糙的第一预设草稿图像;
第二生成子模块,用于将所述第一预设草稿图像和所述每个预设图片对应的序号输入到所述生成器中生成相比于所述第一预设草稿图像相精细的第二预设草稿图像;
第三生成子模块,用于基于所述第二预设草稿图像,将所述第二预设草稿图像的生成步骤迭代m次,直到生成大于等于预设精度的预设草稿图像;
确定子模块,用于确定所述第一预设草稿图像到最精致的预设草稿图像为每个预设图片的所述预设草稿图像。
8.根据权利要求6所述图像生成装置,其特征在于,所述训练模块,包括:
判别子模块,用于将所述每个预设图片的预设草稿图像和所述每个图片的实际草稿图像输入到判别器中进行相似度判别,输出判别结果;
确认子模块,用于将所述判别结果中与所述实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像;
训练子模块,用于将每个预设图片的最终草稿图像保存到所述预设模型中并对所述预设模型进行训练。
9.根据权利要求6所述图像生成装置,其特征在于,所述确定模块,包括:
优化子模块,用于对所述当前图片进行像素优化;
第四生成子模块,用于将优化后的当前图片和所述随机噪声输入到生成器中获得最粗糙的第一当前图像;
第五生成子模块,用于将所述第一当前图像和所述随机噪声输入到所述生成器中生成相比于所述第一当前图像精细的第二当前图像,迭代此步骤以生成更多当前图像直到生成大于等于预设精度的当前图像为止;
筛选子模块,用于将生成的多个当前图像输入到所述训练后的预设模型中进行筛选以确定所述目标图像。
10.根据权利要求8所述图像生成装置,其特征在于,所述确认子模块,包括:
代入单元,用于将所述预设草稿图像代入到预先建立的直角坐标系中,以所述预设草稿图像中心为原点;
第一确定单元,用于确定所述预设草稿图像在所述直角坐标系中每个象限的第一像素数据;
对比单元,用于将所述第一像素数据与所述实际草稿图像的在所述每个象限的第二像素数据作对比;
第二确定单元,用于确定每个象限中所述第一像素数据和第二像素数据的相似百分比;
计算单元,用于计算四个象限的最终百分比;
第三确定单元,用于将所述最终百分比大于等于所述预设阈值的预设草稿图像确定为最终草稿图像。
CN202010181201.1A 2020-03-16 2020-03-16 一种图像生成方法及装置 Active CN111462263B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010181201.1A CN111462263B (zh) 2020-03-16 2020-03-16 一种图像生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010181201.1A CN111462263B (zh) 2020-03-16 2020-03-16 一种图像生成方法及装置

Publications (2)

Publication Number Publication Date
CN111462263A true CN111462263A (zh) 2020-07-28
CN111462263B CN111462263B (zh) 2023-08-11

Family

ID=71680778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010181201.1A Active CN111462263B (zh) 2020-03-16 2020-03-16 一种图像生成方法及装置

Country Status (1)

Country Link
CN (1) CN111462263B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829894A (zh) * 2019-01-09 2019-05-31 平安科技(深圳)有限公司 分割模型训练方法、oct图像分割方法、装置、设备及介质
CN110223359A (zh) * 2019-05-27 2019-09-10 浙江大学 一种基于生成对抗网络的双阶段多配色线稿上色模型及其构建方法和应用
WO2020029356A1 (zh) * 2018-08-08 2020-02-13 杰创智能科技股份有限公司 一种基于生成对抗网络的脸部变化预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020029356A1 (zh) * 2018-08-08 2020-02-13 杰创智能科技股份有限公司 一种基于生成对抗网络的脸部变化预测方法
CN109829894A (zh) * 2019-01-09 2019-05-31 平安科技(深圳)有限公司 分割模型训练方法、oct图像分割方法、装置、设备及介质
CN110223359A (zh) * 2019-05-27 2019-09-10 浙江大学 一种基于生成对抗网络的双阶段多配色线稿上色模型及其构建方法和应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
卢倩雯;陶青川;赵娅琳;刘蔓霄;: "基于生成对抗网络的漫画草稿图简化" *

Also Published As

Publication number Publication date
CN111462263B (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
Afzal et al. Document image binarization using lstm: A sequence learning approach
CN113642576B (zh) 一种目标检测及语义分割任务中训练图像集合的生成方法及装置
CN101615244A (zh) 手写板坯号自动识别方法及识别装置
CN110298353B (zh) 一种字符识别方法及系统
Quiros et al. A genetic algorithm and artificial neural network-based approach for the machine vision of plate segmentation and character recognition
CN110796174A (zh) 多类型虚拟样本的生成方法、装置、电子设备及存储介质
CN111915635A (zh) 支持自阅卷的试题解析信息生成方法及系统
CN112132766A (zh) 图像的修复方法和装置、存储介质、电子装置
Lu et al. Secure halftone image steganography based on feature space and layer embedding
CN117011563A (zh) 基于半监督联邦学习的道路损害巡检跨域检测方法及系统
CN114187640A (zh) 一种基于线上课堂的学情观察方法、系统、设备及介质
Zhu et al. Toward generalist anomaly detection via in-context residual learning with few-shot sample prompts
CN111462263B (zh) 一种图像生成方法及装置
CN112529917A (zh) 一种三维目标分割方法、装置、设备和存储介质
CN112749696A (zh) 一种文本检测方法及装置
CN114663731B (zh) 车牌检测模型的训练方法及系统、车牌检测方法及系统
CN110321889A (zh) 一种图片文件中插图定位提取方法及系统
CN113139932B (zh) 一种基于集成学习的深度学习缺陷图像识别方法及系统
CN113191942A (zh) 生成图像的方法、训练人物检测模型的方法、程序及装置
CN112287898A (zh) 一种图像的文本检测质量评价方法及系统
CN112287938A (zh) 一种文本分割方法、系统、设备以及介质
CN113628089A (zh) 图像处理方法、装置、存储介质及计算机设备
CN115035315B (zh) 一种基于注意力机制的瓷砖色差分级检测方法及系统
Kim et al. Semi-supervised Synthetic-to-Real Domain Adaptation for Fine-grained Naval Ship Image Classification
CN114677751B (zh) 学习状态的监控方法、监控装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant