CN111667007A

CN111667007A - 一种基于对抗生成网络的人脸铅笔画图像生成方法

Info

Publication number: CN111667007A
Application number: CN202010510263.2A
Authority: CN
Inventors: 王存睿; 黄星宇
Original assignee: Dalian Minzu University
Current assignee: Dalian Minzu University
Priority date: 2020-06-08
Filing date: 2020-06-08
Publication date: 2020-09-15

Abstract

一种基于对抗生成网络的人脸铅笔画图像生成方法，包括以下步骤：S1、图片处理；S2、模型构建；S3、模型训练；S4、人脸铅笔画生成。与现有的技术相比一种基于对抗生成网络的人脸铅笔画生成方法。该本发明将极大提高人脸铅笔画制作效率，减轻了设计对于人工的依赖，极大的缩短了人脸铅笔画制作的周期，使得人脸铅笔画的生成变得简单方便。而且为多个行业的应用和推广提供了可靠依据。能够丰富电影、电视、广告等数字媒体和文化行业的材料，为其多元化设计提供素材。

Description

一种基于对抗生成网络的人脸铅笔画图像生成方法

技术领域

本发明涉及计算机图形学与人工智能领域，尤其涉及一种基于对抗生成网络的人脸铅笔画图像生成方法。

背景技术

随着经济和社会的发展，以及人类精神层次的提高，人们对图像不再仅仅追求真实的效果，同时也追求图像的非真实感。近年来，人脸铅笔画生成技术在执法、数字娱乐等诸多领域的应用越来越受到人们的关注。

随着深度学习技术在计算机视觉领域的不断发展，越来越多的研究者将深度神经网络技术用人脸铅笔画生成。生成式对抗网络(GAN)因其能够合成与自然图像几乎无法区分的图像而受到越来越多的关注。很对使用GAN进行人脸铅笔画生成的研究效果很差。丢失了个性特征，存在模糊和变形效果的局限性。

发明内容

本发明的目的是提供一种避免模糊和变形，形成铅笔画效果自然的基于对抗生成网络的人脸铅笔画图像生成方法。

本发明解决现有技术问题所采用的技术方案：一种基于对抗生成网络的人脸铅笔画图像生成方法，包括以下步骤：

S1、图片处理：从已知的人脸图像数据集中选取预设数量A的人脸图像作为人脸数据训练数据集；从已知的人脸铅笔画数据集中预设数量B的人脸铅笔画图像作为铅笔画训练数据集；并将人脸数据训练数据集和铅笔画训练数据集中的图像缩放至同样大小；A,B均为自然数；

S2、模型构建：生成对抗网络包括生成器和判别器，生成器采用编码器-解码器,判别器为卷积神经网络；编码器与解码器之间添加有连接层，生成器使用的卷积核为4*4，之后跟2*2、步长为2的最大池化层；使用下采样的激活函数‘relu’、上采样激活函数‘tanh’并采用‘same’模式作为生成器的输出；同时，在编码器解码器中间添加类别向量，所述类别向量随机向量；将人脸数据训练数据集中的人脸图像依次输入生成器中输出生成铅笔画图像，并保存为生成铅笔画数据集；

构建判别器的方法：所述判别器采用3个级联的Conv-BN-LReLu网络结构，最后采用两层全连接神经网络；判别器仅是对输入图像卷积得到30×30×1的张量大小作为输出；所述判别器使用patch判别器，patch判别器以输入图像的每一小块的patch单元来进行，即将生成器生成“假”照片划分为N*N个patch单元后，对每一单元进行判别真假；最后一层将输入图像的每个像素通过sigmoid函数激活，输出为真的概率值，再对所有patch单元的判别结果取平均得到最终损失函数；向判别器中输入铅笔画训练数据集中的图像以及生成铅笔画图像对二者进行判别；判别器的输出结果若为1则表示输入图片100％是真实人脸图像，判别器的输出结果若为0，则表示输入图片不可能是真实人脸图像；判别器的输出结果若为0.5，则表示由生成铅笔画数据集中的铅笔画图像的图片质量为最佳；

S3、模型训练：利用步骤S1得到的人脸数据训练数据集、人脸铅笔画训练数据集对生成对抗网络进行训练，得到训练后的对抗生成网络，并保存训练完成的参数；对生成对抗网络进行训练时，当损失函数达到最小时，生成对抗网络训练完成；所述损失函数如下：

L＝w_advL_adv+w₁L₁+w_cateL_cate

L_adv＝E_x,y[logD(x,y)]+E_x,z[log(1-D(x,y)]

其中，pdata表示样本分布，pinput表示噪声分布，y为铅笔画训练数据集中的图像，x为生成铅笔画数据集中的铅笔画图像，D(x,y)表示判别器对图像y和铅笔画图像x的判别输出结果，；L_adv代表判别器对于生成图像与真实图像之间的判别损失；L1为度量生成图像与铅笔画训练数据集中的图像在像素空间的匹配程度；L_cate为类别损失函数，w_adv，w₁，w_cate为权重系数；

S4、人脸铅笔画生成：依次将待处理的人脸图像输入到训练后的对抗生成网络中，则得到对应人脸铅笔画图像。

所述已知的人脸图像数据集为名人人脸属性数据集CelebA，预设数量A为10000，已知的人脸铅笔画数据集为中大人脸素描FERET数据库CUFSF。

本发明的有益效果在于：与现有的技术相比一种基于对抗生成网络的人脸铅笔画生成方法。该本发明将极大提高人脸铅笔画制作效率，减轻了设计对于人工的依赖，极大的缩短了人脸铅笔画制作的周期，使得人脸铅笔画的生成变得简单方便。而且为多个行业的应用和推广提供了可靠依据。能够丰富电影、电视、广告等数字媒体和文化行业的材料，为其多元化设计提供素材。

附图说明

图1是本发明的流程图。

图2是本发明的网络结构图。

图3是本发明的生成效果图。

具体实施方式

以下结合附图及具体实施方式对本发明进行说明：

如图1所示，一种基于对抗生成网络的人脸铅笔画图像生成方法，包括以下步骤：

S1、初始图片处理：从名人人脸属性数据集CelebA中选取1000张人脸图像作为人脸数据训练数据集；从中大人脸素描FERET数据库CUFSF中预设数量的人脸铅笔画图像作为铅笔画训练数据集；并将人脸数据训练数据集和铅笔画训练数据集中的图像缩放至同样大小。

S2、构建模型：生成对抗网络包括生成器和判别器，网络结构如图2所示。生成器采用编码器-解码器,判别器为卷积神经网络；编码器与解码器之间添加有连接层，生成器使用的卷积核为4*4，之后跟2*2、步长为2的最大池化层；使用下采样的激活函数‘relu’、上采样激活函数‘tanh’并采用‘same’模式作为生成器的输出；同时，在编码器解码器中间添加类别向量，其中类别向量是一个64维的随机向量，使得网络在训练时能够更好的区分人脸特征；将人脸数据训练数据集中的人脸图像依次输入生成器中输出生成铅笔画图像，并保存为生成铅笔画数据集；为了减少编码过程中的特征损失，编码器与解码器的对应层进行跳跃连接。跳跃连接编码器和解码器的对应层。

构建判别器的方法：所述判别器采用3个级联的Conv-BN-LReLu网络结构，最后采用两层全连接神经网络；判别器仅是对输入图像卷积得到30×30×1的张量大小作为输出；所述判别器使用patch判别器，patch判别器以输入图像的每一小块的patch单元来进行，即将生成器生成“假”照片划分为N*N个patch单元后，对每一单元进行判别真假；最后一层将输入图像的每个像素通过sigmoid函数激活，输出为真的概率值，再对所有patch单元的判别结果取平均得到最终损失函数；向判别器中输入铅笔画训练数据集中的图像以及生成铅笔画数据集中的铅笔画图像对二者进行判别；判别器的输出结果若为1则表示输入图片100％是真实人脸图像，判别器的输出结果若为0，则表示输入图片不可能是真实人脸图像；判别器的输出结果若为0.5，则表示判别器无法判断输入图片的真假，此时，由生成铅笔画数据集中的铅笔画图像的图片质量为最佳。

S3、模型训练：利用步骤S1得到的人脸数据训练数据集、人脸铅笔画训练数据集对生成对抗网络进行训练，得到训练后的对抗生成网络，并保存训练完成的参数；对生成对抗网络进行训练时，当损失函数达到最小时，生成对抗网络训练完成。

在训练神经网络过程中。将人脸数据训练数据集中的真实人脸图像输入到生成器中输出生成铅笔画图像，同时将铅笔画训练数据集与生成铅笔画图像输入到判别器中，判别真伪，并计算损失函数。如公式(2)所示。对于判别器而言，希望网络生成的人脸铅笔画图像被判别出假的可能性越大越好。而生成网络希望生成的人脸铅笔画图像被判别为真的可能性越大越好。所以生成网络最小化损失函数，而判别网络最大化损失函数，调整网络参数。因此，损失函数L如下：

L＝w_advL_adv+w₁L₁+w_cateL_cate (1)

L_adv＝E_x,y[logD(x,y)]+E_x,z[log(1-D(x,y)] (2)

其中，pdata表示样本分布，pinput表示噪声分布，y为铅笔画训练数据集中的图像，x为生成铅笔画数据集中的铅笔画图像，D(x,y)表示判别器对图像y和铅笔画图像x的判别输出结果，；L_adv代表判别器对于生成图像与真实图像之间的判别损失；L1为度量生成图像与铅笔画训练数据集中的图像在像素空间的匹配程度；L_cate为类别损失函数，w_adv，w₁，w_cate为权重系数。

S4、依次将待处理的人脸图像输入到训练后的对抗生成网络中，则得到对应人脸铅笔画图像；如图3所示。待处理的人脸图像实际为彩色图片，为满足专利说明书附图要求特做去色处理。

以上内容是结合具体的优选技术方案对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于对抗生成网络的人脸铅笔画图像生成方法，其特征在于，包括以下步骤：

L＝w_advL_adv+w₁L₁+w_cateL_cate

L_adv＝E_x,y[logD(x,y)]+E_x,z[log(1-D(x,y)]

2.根据权利要求1所述的一种基于对抗生成网络的人脸铅笔画图像生成方法，其特征在于，所述已知的人脸图像数据集为名人人脸属性数据集CelebA，预设数量A为10000，已知的人脸铅笔画数据集为中大人脸素描FERET数据库CUFSF。