CN111462263A

CN111462263A - 一种图像生成方法及装置

Info

Publication number: CN111462263A
Application number: CN202010181201.1A
Authority: CN
Inventors: 薛锐青
Original assignee: Unisound Intelligent Technology Co Ltd; Xiamen Yunzhixin Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd; Xiamen Yunzhixin Intelligent Technology Co Ltd
Priority date: 2020-03-16
Filing date: 2020-03-16
Publication date: 2020-07-28
Anticipated expiration: 2040-03-16
Also published as: CN111462263B

Abstract

本发明公开了一种图像生成方法及装置，包括：根据预设图片生成图像精度递增的预设草稿图像；利用预设草稿图像和实际草稿图像对预设模型进行训练；保存训练好的预设模型；获取当前图片，将当前图片输入到训练好的预设模型确定当前图片对应的目标图像。通过获取预设图片精度递增的预设草稿图像来使得预设模型获得大量的训练数据，并且在生成预设草稿图像的过程中像素点不是一次性的生成的，而是逐渐生成的并且生成的预设草稿图像可供用户选择性的进行对预设模型的训练。解决了现有技术中由于在生成伪造图像的过程中次生成所有像素点，导致生成的图片质量较差和在生成过程中无法进行人为干预从而出现不确定因素导致模型不完善的问题。

Description

一种图像生成方法及装置

技术领域

本发明涉及数据处理技术领域，尤其涉及一种图像生成方法及装置。

背景技术

深度学习引领着新一轮的人工智能浪潮，在很多领域受到广泛关注。尤其在图形图像领域里，人脸识别和自动驾驶等应用正在逐渐进入我们的生活。深度学习是机器学习中一种基于对数据进行表征学习的方法。模仿人脑的机制来解释数据，例如图像，声音和文本等。其优势在于用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。现有技术中的深度学习模型通过手机海量图图像，将其结合随机噪声输入到生成器中生成伪造图像，然后将伪造图像和实际图像输入到判别器中判别伪造图像是否为实际图像，将判别器和生成器结合训练深度学习模型，这种方法存在以下缺点：(1)在生成伪造图像的过程中次生成所有像素点，导致生成的图片质量较差；(2)在生成过程中无法进行人为干预从而出现不确定因素导致模型不完善。

发明内容

针对上述所显示出来的问题，本方法基于根据预设图片生成图像精度递增的预设草稿图像，利用预设草稿图像和实际草稿图像对预设模型进行训练，最后将当前图片输入训练好的模型中获取目标图像。

一种图像生成方法，包括以下步骤：

根据预设图片生成图像精度递增的预设草稿图像；

利用所述预设草稿图像和实际草稿图像对预设模型进行训练；

保存训练好的预设模型；

获取当前图片，将所述当前图片输入到所述训练好的预设模型确定所述当前图片对应的目标图像。

优选的，所述根据预设图片生成图像精度递增的预设草稿图像，包括：

获取预设数目个所述预设图片；

根据类别对所述预设数目个预设图片进行分类，分为n个类别；

对所述n个类别中每个预设图片进行序号排列；

将每个预设图片的序号和随机噪声输入到生成器中以生成最粗糙的第一预设草稿图像；

将所述第一预设草稿图像和所述每个预设图片对应的序号输入到所述生成器中生成相比于所述第一预设草稿图像相精细的第二预设草稿图像；

基于所述第二预设草稿图像，将所述第二预设草稿图像的生成步骤迭代m次，直到生成大于等于预设精度的预设草稿图像；

确定所述第一预设草稿图像到最精致的预设草稿图像为每个预设图片的所述预设草稿图像。

优选的，所述利用所述预设草稿图像和实际草稿图像对预设模型进行训练，包括：

将所述每个预设图片的预设草稿图像和所述每个图片的实际草稿图像输入到判别器中进行相似度判别，输出判别结果；

将所述判别结果中与所述实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像；

将每个预设图片的最终草稿图像保存到所述预设模型中并对所述预设模型进行训练。

优选的，所述获取当前图片，将所述当前图片输入到所述训练好的预设模型确定所述当前图片对应的目标图像，包括：

对所述当前图片进行像素优化；

将优化后的当前图片和所述随机噪声输入到生成器中获得最粗糙的第一当前图像；

将所述第一当前图像和所述随机噪声输入到所述生成器中生成相比于所述第一当前图像精细的第二当前图像，迭代此步骤以生成更多当前图像直到生成大于等于预设精度的当前图像为止；

将生成的多个当前图像输入到所述训练后的预设模型中进行筛选以确定所述目标图像。

优选的，所述将所述判别结果中所述预设草稿图像和所述实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像，包括：

将所述预设草稿图像代入到预先建立的直角坐标系中，以所述预设草稿图像中心为原点；

确定所述预设草稿图像在所述直角坐标系中每个象限的第一像素数据；

将所述第一像素数据与所述实际草稿图像的在所述每个象限的第二像素数据作对比；

确定每个象限中所述第一像素数据和第二像素数据的相似百分比；

计算四个象限的最终百分比；

将所述最终百分比大于等于所述预设阈值的预设草稿图像确定为最终草稿图像。

一种图像生成装置，该装置包括：

生成模块，用于根据预设图片生成图像精度递增的预设草稿图像；

训练模块，用于利用所述预设草稿图像和实际草稿图像对预设模型进行训练；

保存模块，用于保存训练好的预设模型；

确定模块，用于获取当前图片，将所述当前图片输入到所述训练好的预设模型确定所述当前图片对应的目标图像。

优选的，所述生成模块，包括：

获取子模块，用于获取预设数目个所述预设图片；

分类模块，用于根据类别对所述预设数目个预设图片进行分类，分为n个类别；

排序模块，用于对所述n个类别中每个预设图片进行序号排列；

第一生成子模块，用于将每个预设图片的序号和随机噪声输入到生成器中以生成最粗糙的第一预设草稿图像；

第二生成子模块，用于将所述预设草稿图像和所述每个预设图片对应的序号输入到所述生成器中生成相比于所述第一预设草稿图像相精细的第二预设草稿图像；

第三生成子模块，用于基于所述第二预设草稿图像，将所述第二预设草稿图像的生成步骤迭代m次，直到生成大于等于预设精度的预设草稿图像；

确定子模块，用于确定所述第一预设草稿图像到最精致的预设草稿图像为每个预设图片的所述预设草稿图像。

优选的，所述训练模块，包括：

判别子模块，用于将所述每个预设图片的预设草稿图像和所述每个图片的实际草稿图像输入到判别器中进行相似度判别，输出判别结果；

确认子模块，用于将所述判别结果中与所述实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像；

训练子模块，用于将每个预设图片的最终草稿图像保存到所述预设模型中并对所述预设模型进行训练。

优选的，所述确定模块，包括：

优化子模块，用于对所述当前图片进行像素优化；

第四生成子模块，用于将优化后的当前图片和所述随机噪声输入到生成器中获得最粗糙的第一当前图像；

第五生成子模块，用于将所述第一当前图像和所述随机噪声输入到所述生成器中生成相比于所述第一当前图像精细的第二当前图像，迭代此步骤以生成更多当前图像直到生成大于等于预设精度的当前图像为止；

筛选子模块，用于将生成的多个当前图像输入到所述训练后的预设模型中进行筛选以确定所述目标图像。

优选的，所述确认子模块，包括：

代入单元，用于将所述预设草稿图像代入到预先建立的直角坐标系中，以所述预设草稿图像中心为原点；

第一确定单元，用于确定所述预设草稿图像在所述直角坐标系中每个象限的第一像素数据；

对比单元，用于将所述第一像素数据与所述实际草稿图像的在所述每个象限的第二像素数据作对比；

第二确定单元，用于确定每个象限中所述第一像素数据和第二像素数据的相似百分比；

计算单元，用于计算四个象限的最终百分比；

第三确定单元，用于将所述最终百分比大于等于所述预设阈值的预设草稿图像确定为最终草稿图像。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明所提供的一种图像生成方法的工作流程图；

图2为本发明所提供的一种图像生成方法的另一工作流程图；

图3为本发明所提供的一种图像生成装置的结构图；

图4为本发明所提供的一种图像生成装置的另一结构图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

深度学习引领着新一轮的人工智能浪潮，在很多领域受到广泛关注。尤其在图形图像领域里，人脸识别和自动驾驶等应用正在逐渐进入我们的生活。深度学习是机器学习中一种基于对数据进行表征学习的方法。模仿人脑的机制来解释数据，例如图像，声音和文本等。其优势在于用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。现有技术中的深度学习模型通过手机海量图图像，将其结合随机噪声输入到生成器中生成伪造图像，然后将伪造图像和实际图像输入到判别器中判别伪造图像是否为实际图像，将判别器和生成器结合训练深度学习模型，这种方法存在以下缺点：(1)在生成伪造图像的过程中次生成所有像素点，导致生成的图片质量较差；(2)在生成过程中无法进行人为干预从而出现不确定因素导致模型不完善。为了解决上述问题，本实施例公开了一种基于根据预设图片生成图像精度递增的预设草稿图像，利用预设草稿图像和实际草稿图像对预设模型进行训练，最后将当前图片输入训练好的模型中获取目标图像的方法。

一种图像生成方法，如图1所示，包括以下步骤：

步骤S101、根据预设图片生成图像精度递增的预设草稿图像；

步骤S102、利用预设草稿图像和实际草稿图像对预设模型进行训练；

步骤S103、保存训练好的预设模型；

步骤S104、获取当前图片，将当前图片输入到训练好的预设模型确定当前图片对应的目标图像。

上述技术方案的工作原理为：根据预设图片生成图像精度递增的预设草稿图像；然后利用预设草稿图像和实际草稿图像对预设模型进行训练；保存训练好的预设模型；最后获取当前图片，将当前图片输入到训练好的预设模型确定当前图片对应的目标图像。

上述技术方案的有益效果为：通过获取预设图片精度递增的预设草稿图像来使得预设模型获得大量的训练数据，并且在生成预设草稿图像的过程中像素点不是一次性的生成的，而是逐渐生成的并且生成的预设草稿图像可供用户选择性的进行对预设模型的训练。去除了预设草稿图像中的不确定因素，解决了现有技术中由于在生成伪造图像的过程中次生成所有像素点，导致生成的图片质量较差和在生成过程中无法进行人为干预从而出现不确定因素导致模型不完善的问题。

在一个实施例中，根据预设图片生成图像精度递增的预设草稿图像，包括：

获取预设数目个所述预设图片；

根据类别对预设数目个预设图片进行分类，分为n个类别；

对n个类别中每个预设图片进行序号排列；

将第一预设草稿图像和每个预设图片对应的序号输入到生成器中生成相比于第一预设草稿图像相精细的第二预设草稿图像；

基于第二预设草稿图像，将第二预设草稿图像的生成步骤迭代m次，直到生成大于等于预设精度的预设草稿图像；

确定第一预设草稿图像到最精致的预设草稿图像为每个预设图片的预设草稿图像；

在本实施例中，上述n个类别可以根据图片的内容进行分类，例如可以分为风景图片、人物图片、动漫图片等。上述n为大于等于2的正整数。

上述技术方案的有益效果为：通过分类可以使序号排列更加简单，根据序号将预设图片输入到生成器中生成预设草稿图像可以避免重复生成预设草稿图像，节省了成本并且提高了工作效率。

在一个实施例中，如图2所示，利用预设草稿图像和实际草稿图像对预设模型进行训练，包括：

步骤S201、将每个预设图片的预设草稿图像和每个图片的实际草稿图像输入到判别器中进行相似度判别，输出判别结果；

步骤S202、将判别结果中与实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像；

步骤S203、将每个预设图片的最终草稿图像保存到预设模型中并对预设模型进行训练；

在本实施例中，上述预设阈值可以为95％。

上述技术方案的有益效果为:确定与实际草稿图像相似的预设草稿图像作为训练数据，使得预设训练模型可以针对性对预设草稿图像和实际草稿图像的相似度进行标记，从而使得预设训练模型在输入当前图片时可以直接获得与实际草稿图像相似的图像。

在一个实施例中，获取当前图片，将当前图片输入到训练好的预设模型确定当前图片对应的目标图像，包括：

对当前图片进行像素优化；

将优化后的当前图片和随机噪声输入到生成器中获得最粗糙的第一当前图像；

将第一当前图像和随机噪声输入到生成器中生成相比于第一当前图像精细的第二当前图像，迭代此步骤以生成更多当前图像直到生成大于等于预设精度的当前图像为止；

将生成的多个当前图像输入到训练后的预设模型中进行筛选以确定目标图像。

上述技术方案的有益效果为：通过对当前图片进行像素优化来使得当前图片的像素更高从而可以更直观的生成多个当前图像。

在一个实施例中，将判别结果中预设草稿图像和实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像，包括：

将预设草稿图像代入到预先建立的直角坐标系中，以预设草稿图像中心为原点；

确定预设草稿图像在直角坐标系中每个象限的第一像素数据；

将第一像素数据与实际草稿图像的在每个象限的第二像素数据作对比；

计算四个象限的最终百分比；

将最终百分比大于等于预设阈值的预设草稿图像确定为最终草稿图像。

上述技术方案的有益效果为：使得对比的结果更加准确进而可以更准确的确定最终草稿图像。

在一个实施例中，包括：

第1步：收集海量图片；

第2步：对图片进行类别标注；

第3步：将随机噪声和过程序号输入到生成器网络，生成最粗糙草稿图像；

第4步：将第3步生成的草稿图像和过程序号重复输入到生成器网络，生成更精细草稿图像，这一步迭代若干轮；

第5步：将生成的草稿图像与真实的草稿图像输入到判别器；

第6步：判别器判断输入图像是否为真实草稿图像；

第7步：生成器和判别器联合训练，直到模型收敛；

第8步：将随机噪声和当前图片输入生成器，生成最粗糙草稿图像；

第9步：将第8步生成的草稿图像和过程序号重复输入到生成器网络，生成更精细草稿图像，这一步迭代若干轮；

第10步：输出最终生成的图像。

上述技术方案的有益效果为：1.使用对抗生成网络分层生成图像，效果更好；2.生成中间结果可以人工干预控制。

本实施例还公开了一种图像生成装置，如图3所示，该装置包括：

生成模块301，用于根据预设图片生成图像精度递增的预设草稿图像；

训练模块302，用于利用预设草稿图像和实际草稿图像对预设模型进行训练；

保存模块303，用于保存训练好的预设模型；

确定模块304，用于获取当前图片，将当前图片输入到训练好的预设模型确定当前图片对应的目标图像。

在一个实施例中，生成模块，包括：

获取子模块，用于获取预设数目个预设图片；

分类模块，用于根据类别对预设数目个预设图片进行分类，分为n个类别；

排序模块，用于对n个类别中每个预设图片进行序号排列；

第二生成子模块，用于将预设草稿图像和每个预设图片对应的序号输入到生成器中生成相比于第一预设草稿图像相精细的第二预设草稿图像；

第三生成子模块，用于基于第二预设草稿图像，将第二预设草稿图像的生成步骤迭代m次，直到生成大于等于预设精度的预设草稿图像；

确定子模块，用于确定第一预设草稿图像到最精致的预设草稿图像为每个预设图片的预设草稿图像。

在一个实施例中，训练模块，包括：

判别子模块，用于将每个预设图片的预设草稿图像和每个图片的实际草稿图像输入到判别器中进行相似度判别，输出判别结果；

确认子模块，用于将判别结果中与实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像；

训练子模块，用于将每个预设图片的最终草稿图像保存到预设模型中并对预设模型进行训练。

在一个实施例中，确定模块，包括：

优化子模块3041，用于对当前图片进行像素优化；

第四生成子模块3042，用于将优化后的当前图片和随机噪声输入到生成器中获得最粗糙的第一当前图像；

第五生成子模块3043，用于将第一当前图像和随机噪声输入到生成器中生成相比于第一当前图像精细的第二当前图像，迭代此步骤以生成更多当前图像直到生成大于等于预设精度的当前图像为止；

筛选子模块3044，用于将生成的多个当前图像输入到训练后的预设模型中进行筛选以确定目标图像。

在一个实施例中，确认子模块，包括：

代入单元，用于将预设草稿图像代入到预先建立的直角坐标系中，以预设草稿图像中心为原点；

第一确定单元，用于确定预设草稿图像在直角坐标系中每个象限的第一像素数据；

对比单元，用于将第一像素数据与实际草稿图像的在每个象限的第二像素数据作对比；

第二确定单元，用于确定每个象限中第一像素数据和第二像素数据的相似百分比；

计算单元，用于计算四个象限的最终百分比；

第三确定单元，用于将最终百分比大于等于预设阈值的预设草稿图像确定为最终草稿图像。

本领域技术人员应当理解的是，本发明中的第一、第二指的是不同应用阶段而已。

本领域技术用户员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种图像生成方法，其特征在于，包括以下步骤：

根据预设图片生成图像精度递增的预设草稿图像；

保存训练好的预设模型；

2.根据权利要求1所述图像生成方法，其特征在于，所述根据预设图片生成图像精度递增的预设草稿图像，包括：

获取预设数目个所述预设图片；

对所述n个类别中每个预设图片进行序号排列；

3.根据权利要求1所述图像生成方法，其特征在于，所述利用所述预设草稿图像和实际草稿图像对预设模型进行训练，包括：

4.根据权利要求1所述图像生成方法，其特征在于，所述获取当前图片，将所述当前图片输入到所述训练好的预设模型确定所述当前图片对应的目标图像，包括：

对所述当前图片进行像素优化；

5.根据权利要求3所述图像生成方法，其特征在于，所述将所述判别结果中所述预设草稿图像和所述实际草稿图像相似度大于等于预设阈值的预设草稿图像作为最终草稿图像，包括：

计算四个象限的最终百分比；

6.一种图像生成装置，其特征在于，该装置包括：

保存模块，用于保存训练好的预设模型；

7.根据权利要求6所述图像生成装置，其特征在于，所述生成模块，包括：

获取子模块，用于获取预设数目个所述预设图片；

第二生成子模块，用于将所述第一预设草稿图像和所述每个预设图片对应的序号输入到所述生成器中生成相比于所述第一预设草稿图像相精细的第二预设草稿图像；

8.根据权利要求6所述图像生成装置，其特征在于，所述训练模块，包括：

9.根据权利要求6所述图像生成装置，其特征在于，所述确定模块，包括：

优化子模块，用于对所述当前图片进行像素优化；

10.根据权利要求8所述图像生成装置，其特征在于，所述确认子模块，包括：

计算单元，用于计算四个象限的最终百分比；