CN109064389A

CN109064389A - 一种手绘线条画生成现实感图像的深度学习方法

Info

Publication number: CN109064389A
Application number: CN201810859788.XA
Authority: CN
Inventors: 陈昭炯; 蔡雨婷; 叶东毅
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2018-08-01
Filing date: 2018-08-01
Publication date: 2018-12-21
Anticipated expiration: 2038-08-01
Also published as: CN109064389B

Abstract

本发明涉及一种手绘线条画生成现实感图像的深度学习方法，S1:建立双层GAN结构，包括第一层GAN结构和第二层GAN结构；S2:收集并生成用于训练网络的“真实图像‑模拟线条画”数据集；S3:根据“真实图像‑模拟线条画”数据集，训练第一层GAN结构，得到训练后的第一层GAN结构；S4:将待处理的手绘线条画输入训练后的第一层GAN结构，得到粗粒度现实感图像；S5:根据“真实图像‑粗粒度现实感图像”数据集，训练第二层GAN结构，得到训练后的第二层GAN结构；S6:将粗粒度现实感图像输入训练后的第二层GAN结构，得到高分辨现实感图像。本发明采用级联两层GAN网络结构，逐步纠偏、丰富图像细节，生成具有现实感的高分辨图像；便捷实用，有利于人机交互，生成图效果具真实感。

Description

一种手绘线条画生成现实感图像的深度学习方法

技术领域

本发明涉及图形图像的现实感生成领域，具体涉及一种手绘线条画生成现实感图像的深度学习方法。

背景技术

随着智能手机等触屏设备和人机交互技术的快速发展与普及，手绘线条画成为一种运用广泛的人机交互载体；同时，手绘线条画也是人类对事物的抽象化、概括化的认知体现，对手绘线条画的研究有助于了解人的认知规律，是人工智能领域中很有活力的研究方向。目前已有针对手绘线条画识别、基于手绘线条画的图像检索等问题的研究工作，而本发明提出了一类新的应用，即用户输入手绘线条画，本方法可生成对应的现实感图像。具体而言，就是用户输入手绘线条画，本发明可生成出内容一致、形状相似的现实感图像。本方法将传统手绘艺术和智能技术相结合，在视觉编辑、幼儿教育、商业推广、人机交互等方面可产生更有创造性、趣味性和实用性的应用效果。

发明内容

有鉴于此，本发明的目的在于提供一种手绘线条画生成现实感图像的深度学习方法，用于实现手绘线条画生成现实感图像。

为实现上述目的，本发明采用如下技术方案：

一种手绘线条画生成现实感图像的深度学习方法，包括以下步骤：

步骤S1:建立双层GAN结构，包括第一层GAN结构和第二层GAN结构；

步骤S2:收集并生成用于训练网络的“真实图像-模拟线条画”数据集；

步骤S3:根据“真实图像-模拟线条画”数据集，训练第一层GAN结构，得到训练后的第一层GAN结构；

步骤S4:将待处理的手绘线条画输入训练后的第一层GAN结构，得到粗粒度现实感图像；

步骤S5:根据“真实图像-粗粒度现实感图像”数据集，训练第二层GAN结构，得到训练后的第二层GAN结构；

步骤S6:将粗粒度现实感图像输入训练后的第二层GAN结构，得到高分辨现实感图像。

进一步的，步骤S1具体为:

步骤S11:基于GAN框架，建立双层GAN结构；GAN框架是由两个模型构成，分别称为生成模型和判别模型。生成模型的任务是学习真实图像的特征分布从而产生一张同分布的模拟图片，判别模型用于判断一张给定的图片是来自数据集里的真实图片还是生成器生成的同分布模拟图片。两个模型联合进行对抗训练，生成模型产生一张图片期望欺骗判别模型，而判别模型要判断这张图片的真伪，随着训练的过程的迭代进行，两个模型最终达到稳态，此时生成模型就学习到了训练数据的分布从而可用于模拟产生与数据分布相似的图像。本方法中，生成模型采用“U-net”结构形式；两层GAN的结构是相同的；

步骤S12设定GAN的目标函数描述为：生成器G用于将输入图像z∈Z_input转换为图像G(z)，同时z有一一对应的目标图x∈X_grouud-truth，生成器的目标是使“输入图像-生成图像”的数据概率分布趋近于“输入图像-真实图像”的概率分布，即P_G(z)-z～P_x-z；鉴别器D用于区分生成的样本G(z)与输入的样本z是否是真实的一对；此外，除了保证“输入图像-生成图像”数据分布的真实性，还要保证生成图像本身的真实性，故加入约束生成图像与真实图像相似度的损失项。

步骤13:根据GAN的目标函数描述，为保证生成图像本身的真实性，加入约束生成图像与真实图像相似度的损失项；得到网络的损失函数为：

其中，E·表示数学期望，P·表示概率分布，D(z，x)表示鉴别器输出的z与x相似度的概率值，G(z)表示生成器根据样本z而生成的图像的特征量，λ表示权重系数，||·||₁表示L1范数，即向量中各个元素绝对值之和，z∈Z_input表示输入图像，x∈X_ground-truth表示输入图像对应的目标图。

进一步的，所述步骤S2具体为：

步骤S21:收集某一类别足量的真实图像；

步骤S22:将图像的尺寸调整为正方形；一般可取为256×256；

步骤S23:去除图像的复杂背景，留下主体对象，处理后图像记为B；

步骤S24:使用加权最小二乘滤波器对B进行锐化处理，锐化后的图像记为B’；

步骤S25:采用HED边缘检测网络分别对B和B’进行边缘提取，得到的边缘图记为B_E和B′_E；

步骤S26:合并B_E和B′_E的像素点并过滤阴影部分得到图像B的线条画轮廓，记为B_C；其过程如下：遍历B_E和B′_E所有像素点，比较对应像素值(B_E)_ij、(B'_E)_ij(i表示第i行，j表示第j列)。若(B_E)_ij<(B'_E)_ij，则反之，则同时对阴影部分进行过滤：若(B_C)_ij大于某一阈值(一般取160～200)，则

步骤S27:采用移动最小二乘法对得到的线条画轮廓B_C进行变形；其过程如下：在B_C上随机产生五个源点，记为O_i(i＝1,2,3,4,5),设定阈值ran(通常10～20个像素点)，对O_i的横坐标和纵坐标±ran的范围内随机取目标点T_i(i＝1,2,3,4,5)，得到5个源点及对应的5个目标点，采用移动最小二乘变形法根据源点与目标点对B_C变形，变形后的图像轮廓记为B_S，用于模拟图像B的线条画形态。

进一步的，所述步骤S3具体为：

步骤S31：将图像B与根据其生成的模拟线条画B_S组合成对，作为第一层GAN的训练样本对；

步骤S32:GAN优化的目标是一个极小极大博弈问题，即最大化D的区分度，最小化G(B_S)和真实数据集的数据分布,优化问题描述为：

其中，E·表示数学期望，P·表示概率分布，D(z，x)表示鉴别器输出的z与x相似度的概率值，G(z)表示生成器根据样本z而生成的图像的特征量，λ表示权重系数，||·||₁表示L1范数，即向量中各个元素绝对值之和，表示输入的模拟线条画，B∈B_ground-truth表示模拟线条画对应的真实图。

生成器G需要生成符合图像B分布的数据以欺骗鉴别器，鉴别器D根据真实数据B与生成数据G(B_S)的输入来分别输出一个概率值或者说一个标量值，表示D对于输入是真实数据还是生成数据的置信度，以此判断G的产生数据的性能好坏；当最终D不能区分真实数据B和生成数据G(B_S)时，就认为生成器G达到了最优；

步骤S33:将不断地接近P_B作为收敛的判断标准，保证两者学习速率基本一致，达到最大迭代次数完成训练。需要保证两者学习速率基本一致，也就是先训练一次G，再训练一次D，保证训练的稳定。设置最大迭代次数(约为200)进行训练。

进一步的，所述步骤S4具体为

步骤S41:将模拟线条画B_S输入到已训练好的第一层模型中，输出粗粒度现实感图像，记为T₁。

进一步的，所述步骤S5具体为

步骤S51:将图像B与粗粒度现实感图像T₁组合成对，作为第二层GAN的训练样本对；

步骤S52:第二层GAN优化的目标是一个极小极大博弈问题，即最大化D的区分度，最小化G(T₁)和真实数据集的数据分布，描述如下：

其中，E·表示数学期望，P·表示概率分布，D(z，x)表示鉴别器输出的z与x相似度的概率值，G(z)表示生成器根据样本z而生成的图像的特征量，λ表示权重系数，||·||₁表示L1范数，即向量中各个元素绝对值之和，T₁∈T_1input表示输入的粗粒度现实感图像，B∈B_ground-truth表示粗粒度现实感图像对应的真实图。

生成器G需要生成符合真实图像B分布的数据欺骗鉴别器，鉴别器D根据真实数据B与生成数据G(T₁)的输入来分别输出一个概率值或者说一个标量值，表示D对于输入是真实数据还是生成数据的置信度，以此判断G的产生数据的性能好坏；当最终D不能区分真实数据B和生成数据G(T₁)时，就认为生成器G达到了最优；

步骤S53：在训练过程中，不断地接近P_B是收敛的判断标准；保证两者学习速率一致，达到最大迭代次数完成训练。需要保证两者学习速率基本一致，也就是先训练一次G，再训练一次D，保证训练的稳定。设置最大迭代次数(约为200)进行训练。

本发明与现有技术相比具有以下有益效果：

本发明的有益效果是给出了一种手绘线条画的到现实感图像的转换方法，利用该方法可以将任意手绘线条画转换为其对应类别的真实图像，使用方便简洁，效果良好，具有很强的实用性和广阔的应用前景。

附图说明

图1是本发明方法流程图；

图2是本发明一实施例中双层GAN结构；

图3是本发明一实施例中分步处理图；

图4是本发明一实施例中处理效果图；

图5是本发明一实施例中GAN网络生成器结构细节；

图6是本发明一实施例中GAN网络鉴别器结构细节。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

请参照图1，本发明提供一种手绘线条画生成现实感图像的深度学习方法，用户首先输入一幅手绘线条画，本发明首先使用第一层生成对抗网络(GAN)根据手绘线条画的结构布局、语义关系等简单信息生成粗粒度现实感图像；再使用第二层GAN将前一层GAN的转换结果作为输入，生成更生动形象的高分辨率图像。具体包括以下步骤：

在本发明一实施例中，步骤S1具体为:

步骤S11:基于GAN框架，建立双层GAN结构；GAN框架是由两个模型构成，分别称为生成模型和判别模型。生成模型的任务是学习真实图像的特征分布从而产生一张同分布的模拟图片，判别模型用于判断一张给定的图片是来自数据集里的真实图片还是生成器生成的同分布模拟图片。两个模型联合进行对抗训练，生成模型产生一张图片期望欺骗判别模型，而判别模型要判断这张图片的真伪，随着训练的过程的迭代进行，两个模型最终达到稳态，此时生成模型就学习到了训练数据的分布从而可用于模拟产生与数据分布相似的图像。本方法中，生成模型采用“U-net”结构形式；两层GAN的结构是同样的；

在本发明一实施例中，步骤S12设定GAN的目标函数描述为：生成器G用于将输入图像z∈Z_input转换为图像G(z)，同时z有一一对应的目标图x∈X_ground-truth，生成器的目标是使“输入图像-生成图像”的数据概率分布趋近于“输入图像-真实图像”的概率分布，即P_G(z)-z～P_x-z；鉴别器D用于区分生成的样本G(z)与输入的样本z是否是真实的一对；此外，除了保证“输入图像-生成图像”数据分布的真实性，还要保证生成图像本身的真实性，故加入约束生成图像与真实图像相似度的损失项。

在本发明一实施例中，进一步的，所述步骤S2具体为：

步骤S21:收集某一类别足量的真实图像；

步骤S22:将图像的尺寸调整为正方形；一般可取为256×256；

步骤S26:合并B_E和B′_E的像素点并过滤阴影部分得到图像B的线条画轮廓，记为B_C；其过程如下：遍历B_E和B′_E所有像素点，比较对应像素值(BE)_ij、(B'_E)_ij(i表示第i行，j表示第j列)。若(B_E)_ij<(B'E)_ij，则反之，则同时对阴影部分进行过滤：若(B_C)_ij大于某一阈值(一般取160～200)，则

在本发明一实施例中，进一步的，所述步骤S3具体为：

在本发明一实施例中，所述步骤S4具体为

在本发明一实施例中，进一步的，所述步骤S5具体为：

以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围。

Claims

1.一种手绘线条画生成现实感图像的深度学习方法，其特征在于：包括以下步骤：

步骤S1：建立双层GAN结构，包括第一层GAN结构和第二层GAN结构；

步骤S2：收集并生成用于训练网络的“真实图像-模拟线条画”数据集；

步骤S3：根据“真实图像-模拟线条画”数据集，训练第一层GAN结构，得到训练后的第一层GAN结构；

步骤S4：将待处理的手绘线条画输入训练后的第一层GAN结构，得到粗粒度现实感图像；

步骤S5：根据“真实图像-粗粒度现实感图像”数据集，训练第二层GAN结构，得到训练后的第二层GAN结构；

步骤S6：将粗粒度现实感图像输入训练后的第二层GAN结构，得到高分辨现实感图像。

2.根据权利要求1所述的一种手绘线条画生成现实感图像的深度学习方法，其特征在于：所述步骤S1具体为：

步骤S11：基于GAN框架，建立双层GAN结构；

步骤S12设定GAN的目标函数描述为：生成器G用于将输入图像z∈Z_input转换为图像G(z)，同时z有一一对应的目标图x∈X_ground-truth，生成器的目标是使“输入图像-生成图像”的数据概率分布趋近于“输入图像-真实图像”的概率分布，即P_G(z)-z～P_x-z；鉴别器D用于区分生成的样本G(z)与输入的样本z是否是真实的一对；

步骤13：根据GAN的目标函数描述，为保证生成图像本身的真实性，加入约束生成图像与真实图像相似度的损失项；得到网络的损失函数为：

3.根据权利要求1所述的一种手绘线条画生成现实感图像的深度学习方法，其特征在于：所述步骤S2具体为：

步骤S21：收集某一类别足量的真实图像；

步骤S22：将图像的尺寸调整为正方形；

步骤S23：去除图像的复杂背景，留下主体对象，处理后图像记为B；

步骤S24：使用加权最小二乘滤波器对B进行锐化处理，锐化后的图像记为B’；

步骤S25：采用HED边缘检测网络分别对B和B’进行边缘提取，得到的边缘图记为B_E和B′_E；

步骤S26：合并B_E和B′_E的像素点并过滤阴影部分得到图像B的线条画轮廓，记为B_C；

步骤S27：采用移动最小二乘法对得到的线条画轮廓B_C进行变形，记为B_S。

4.根据权利要求1所述的一种手绘线条画生成现实感图像的深度学习方法，其特征在于：所述步骤S3具体为：

步骤S32：GAN优化的目标是一个极小极大博弈问题，即最大化D的区分度，最小化G(B_S)和真实数据集的数据分布，优化问题描述为：

生成器G需要生成符合图像B分布的数据以欺骗鉴别器，鉴别器D根据真实数据B与生成数据G(B_S)的输入来分别输出一个概率值或者说一个标量值，表示D对于输入是真实数据还是生成数据的置信度，以此判断G的产生数据的性能好坏；当最终D 不能区分真实数据B和生成数据G(B_S)时，就认为生成器G达到了最优；

步骤S33：将不断地接近P_B作为收敛的判断标准，保证两者学习速率基本一致，达到最大迭代次数完成训练。

5.根据权利要求1所述的一种手绘线条画生成现实感图像的深度学习方法，其特征在于：所述步骤S4具体为：

步骤S41：将模拟线条画B_S输入到已训练好的第一层模型中，输出粗粒度现实感图像，记为T₁。

6.根据权利要求1所述的一种手绘线条画生成现实感图像的深度学习方法，其特征在于：所述步骤S5具体为

步骤S51：将图像B与粗粒度现实感图像T₁组合成对，作为第二层GAN的训练样本对；

步骤S52：第二层GAN优化的目标是一个极小极大博弈问题，即最大化D的区分度，最小化G(T₁)和真实数据集的数据分布，描述如下：

步骤S53：在训练过程中，不断地接近P_B是收敛的判断标准；保证两者学习速率一致，达到最大迭代次数完成训练。