CN114092354A

CN114092354A - 一种基于生成对抗网络的人脸图像修复方法

Info

Publication number: CN114092354A
Application number: CN202111415514.XA
Authority: CN
Inventors: 李天成; 何维; 严林; 杨川勇; 伍贤宇; 刘光飞; 张凯; 刘春芳; 李达平
Original assignee: Agricultural Bank of China Sichuan Branch
Current assignee: Agricultural Bank of China Sichuan Branch
Priority date: 2021-11-25
Filing date: 2021-11-25
Publication date: 2022-02-25

Abstract

本发明公开了一种基于生成对抗网络的人脸图像修复方法，包括：建立人脸图片数据库；采集完整的人脸图片和破损的人脸图片；建立图片数据集；将数据集内完整的人脸图片划分为训练集、测试集；将训练集中的图片生成随机的破损图片；将训练集中的破损图片输入到图像修复模型中得到修复后的图像；将修复后的图像与完整图像计算损失，反馈至图像修复模型调整参数进行迭代优化训练；将测试集中的图片生成随机的破损图片并输入至训练好的图像修复模型中，得到最优的图像修复模型；将破损的人脸图片经破损区域检测模块检测后输入图像修复模型中，得到修复后的人脸图片。本发明能快速高效地完成破损人脸图像修复任务，解决人脸图像因破损而影响查看的问题。

Description

一种基于生成对抗网络的人脸图像修复方法

技术领域

本发明涉及图像修复技术领域，尤其涉及一种基于生成对抗网络的人脸图像修复方法。

背景技术

随着电子照相设备的普及，数码照片已经进入人们生活的方方面面，使用电子设备拍照成为了人们日常生活的普遍行为，图像处理也因此受到了广泛地关注。同时伴随着移动互联网的发展，人们热衷于人脸照片相关的娱乐分享社交活动，而且对拍照得到的人脸图像的审美要求越来越高。现有的电子设备提供一系列的拍照功能，可以对人脸图像进行自动美化，拥有包括美白、祛痘、自动美妆等功能，但是缺乏人脸图像修复的相关功能。当针对一些存在脸部缺陷的用户，针对拍出来的人脸图像，无法有效地去除人脸图像的缺陷。同时，在探案侦查、考古和艺术等领域已损坏人脸图像也需要进行修复，成熟的人脸修复技术具有非常重要的意义与应用价值。

图像修复是图像处理中极其重要的部分，图像修复根据图像完好部分的信息，来填补有遮挡、破损或是多余的部分，可用于去除照片的遮挡，修复破损的文物图像，图像数据预处理等领域。

传统的图像修复技术往往需要缺陷部分的形状特定，并且纹理重复简单，这局限了图像修复的应用场景。随着计算机运算能力的提升和算法模型的成熟，深度学习技术在计算机视觉的诸多领域取得了丰硕的成果。蒙特利尔大学的学者Ian Goodfellow于2014年提出“生成式对抗网络”的概念，极大地促进了生成模型的发展，各种演进的模型在近两年应运而生。

生成式对抗网络基本思想源自博弈论，由一个生成器和一个鉴别器构成，通过对抗学习的方式来训练。生成模型捕捉样本数据的分布，判别模型是一个二分类器，判别输入的是真实数据还是生成的样本。通过对大量同类数据的学习，拟合出数据的概率分布，并生成同类型的数据，这与图像修复的目标相契合。

随着深度学习、计算机视觉和计算机图像学领域的发展，图像修复在此基础上成为了一个研究重点并在多个领域被广泛应用。传统的基于结构与基于纹理的图像修复算法只能修复小区域的破损。由于自然图像固有的模糊和复杂性，基于纹理和局部插值的传统方法对于语义信息缺失严重的图像修复具有相当的局限性，存在修复细节模糊，修复图像不平滑等问题。特别是针对面部缺失关键信息(如眼睛、鼻子)的人脸图像修复问题，传统方法的修复效果不佳，很难修复出符合人类视觉认知的效果。人脸图像修复被广泛应用于公安刑侦、影视特技等种种实际场景中，然而也仍然存在图像修复质量和速度有待提高、模型训练稳定性不足等问题。

发明内容

本发明的目的在于解决现有技术的不足，提供了一种基于生成对抗网络的人脸图像修复方法。

本发明的目的是通过以下技术方案来实现的：

一种基于生成对抗网络的人脸图像修复方法，包括以下步骤：

S1：建立人脸图片数据库；

S2：采集完整的人脸图片和有破损的人脸图片，建立图片数据集；

S3：将数据集内完整的人脸图片划分为训练集、测试集；

S4：将训练集中的图片通过二值掩码生成随机的破损图片；

S5：将训练集中的破损图片输入到图像修复模型中得到修复后的图像，图像修复模型中所有空洞卷积核大小均为3×3，扩张率为2，步长为1；标准卷积核的大小为3×3，除了第二与第四个标准卷积核的步长为2以外，其余标准卷积核的步长均为1；转置卷积核大小均为4×4，且步长为1/2在每个卷积层、空洞卷积层、转置卷积层之后均需要通过批量归一化层；除最后一层激活函数为Tanh以外，其余层的激活函数均使用ReLU；

S6：将修复后的图像与完整图像计算损失，反馈至图像修复模型进行参数调整并迭代优化训练；

S7：将测试集中的图片通过二值掩码生成随机的破损图片并输入至训练好的图像修复模型中，验证模型的修复能力，并得到最优的图像修复模型；

S8：将破损的人脸图片经破损区域检测模块检测后，输入最优的图像修复模型中进行修复，得到修复后的人脸图片。

所述步骤S3中人脸图片按照9:1的随机比例划分为训练集与测试集。

所述步骤S4中需对训练集中的每一张图片通过二值掩码生成一定大小内的随机破损区域。

所述步骤S5中用于训练的图像修复模型为生成对抗路网络与残差网络组成，破损照片输入图像修复模型，生成对抗网络中的生成器通过残差网络捕获提取破损人脸图像中完好区域的高级特征，并利用转置卷积层与卷积层将残差网络提取到的高级特征修复图像中的破损区域，得到修复后的图像。

生成对抗网络中的生成器通过卷积层与空洞卷积层捕获破损图像已有信息的高级特征，之后利用转置卷积层与卷积层将残差网络提取到的高级特征进行复原得到修复后的图像。

修复后的图像将送入生成对抗网络中的判别器来判断图像的修复效果，判别器由全局判别器与局部判别器组成，全局判别器网络的输入由真实图像与修复后的图像组成，局部判别器网络的输入是由局部真实图像与局部修复图像组成，全局和局部判别器网络的输出都是长度为1024的向量，并拼接为一个长度为2048的向量后再输入一个全连接层，最终输出图像为真实图像的概率值。

所述残差网络由七个残差块组成，每两个卷积层或空洞卷积层构成一个残差块。

破损照片输入图像修复模型，模型通过二值掩码标记出破损区域与完好区域，生成器提取破损人脸图像中完好区域的高级特征，并使用高级特征修复图像中的破损区域，判别器评估图像的修复效果，并反馈调节生成器中的参数，提高图像修复质量，最终得到最优模型。

所述步骤S6中训练包括使用Adam优化器训练生成对抗路网络的生成器，使用RMSProp优化器训练生成对抗路网络的判别器。

本发明的有益效果：

1.通过建立训练集与测试集，构建最优的基于生成对抗网络的人脸图像修复模型。

2.该模型能快速、高质量地完成图像修复任务，解决了人脸图像因破损而影响查看的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1是本发明的流程框图。

具体实施方式

应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

随着深度学习、计算机视觉和计算机图像学领域的发展，图像修复在此基础上成为了一个研究重点并在多个领域被广泛应用。

传统的基于结构与基于纹理的图像修复算法只能修复小区域的破损。由于自然图像固有的模糊和复杂性，基于纹理和局部插值的传统方法对于语义信息缺失严重的图像修复具有相当的局限性，存在修复细节模糊，修复图像不平滑等问题。特别是针对面部缺失关键信息(如眼睛、鼻子)的人脸图像修复问题，传统方法的修复效果不佳，很难修复出符合人类视觉认知的效果。人脸图像修复被广泛应用于公安刑侦、影视特技等种种实际场景中，然而也仍然存在图像修复质量和速度有待提高、模型训练稳定性不足等问题。

本发明的目的在于解决现有技术的不足，提供了一种基于生成对抗网络的人脸图像修复方法

如图1所示，一种基于生成对抗网络的人脸图像修复方法，包括以下步骤：

S1：建立人脸图片数据库；

S3：将数据集内完整的人脸图片划分为训练集、测试集；

S4：将训练集中的图片通过二值掩码生成随机的破损图片；

S5：将训练集中的破损图片输入到图像修复模型中得到修复后的图像；

所述步骤S5中用于训练的图像修复模型为生成对抗路网络与残差网络组成，破损照片输入图像修复模型，生成对抗网络中的生成器通过卷积层与空洞卷积层捕获破损图像已有信息的高级特征，每2个卷积层或空洞卷积层构成1个残差块，总共7个残差块组成残差网络，之后利用转置卷积层与卷积层将残差网络提取到的高级特征进行复原得到修复后的图像。

生成对抗网络中的生成器通过卷积层与空洞卷积层捕获破损图像已有信息的高级特征，每2个卷积层或空洞卷积层构成1个残差块，总共7个残差块组成残差网络，之后利用转置卷积层与卷积层将残差网络提取到的高级特征进行复原得到修复后的图像。所有空洞卷积核大小均为3×3，扩张率为2，步长为1；标准卷积核的大小为3×3，除了第二与第四个标准卷积核的步长为2以外，其余标准卷积核的步长均为1；转置卷积核大小均为4×4，且步长为1/2在每个卷积层、空洞卷积层、转置卷积层之后均需要通过批量归一化层；除最后一层激活函数为Tanh以外，其余层的激活函数均使用ReLU。

修复后的图像将送入生成对抗网络中的判别器来判断图像的修复效果，判别器由全局判别器与局部判别器组成，全局判别器网络的输入由真实图像与修复后的图像组成，局部判别器网络的输入是由局部真实图像与局部修复图像组成，全局和局部判别器网络的输出都是长度为1024的向量，并拼接为一个长度为2048的向量后再输入一个全连接层，最终输出图像为真实图像的概率值。破损照片输入图像修复模型，模型通过二值掩码标记出破损区域与完好区域，生成器提取破损人脸图像中完好区域的高级特征，并使用高级特征修复图像中的破损区域，判别器评估图像的修复效果，并反馈调节生成器中的参数，提高图像修复质量，最终得到最优模型。

所述特征提取的处理包括卷积层、空洞卷积层，残差块、全连接层、批量归一化、ReLU激活函数、Adam优化算法。

所述图像破损图像修复的处理包括转置卷积层、全连接层、Tanh激活函数。

所述步骤S6中训练的处理包括对抗训练、卷积层、空洞卷积层、全连接层、SmoothL1损失函数、Wasserstein-GP对抗损失、联合损失、梯度惩罚、层归一化、Leaky ReLU激活函数、RMSProp优化算法。

在模型的训练方面，算法选择使用Adam优化器训练生成器，学习率为0.0002；使用RMSProp优化器训练判别器，动量(momentum)为0.5。训练过程共进行50轮迭代，每轮迭代共有s步(s＝训练集样本总数/每批次样本数量(Batch Size))。具体流程如下：

IF epoch<＝20do:

For(k＝1；k<＝s；k++):

从训练集中取出每批次样本数量(16)个样本{x₁....x₁₆}并生成具有随机破损区域的相对应的二值掩码，组成数据{(x₁,m₁)....(x₁₆,m₁₆)}作为输入数据{c₁....c₁₆}输入生成器，并生成相应的修复完成后的图像{C(c₁)....C(c₁₆)}；

计算输入与真实图片的内容重建损失；

使用ADAM优化器更新生成器的参数θ

ELSEIF 20<epoch<＝50:

For(k＝1；k<＝s；k++):

从训练集中取出每批次样本数量(16)个样本{x₁....x₁₆}并生成具有随机破损区域的相对应的二值掩码组成数据{(x₁,m₁)....(x₁₆,m₁₆)}作为输入数据{c₁....c₁₆}输入生成器，并生成相应的修复完成后的图像{G(c₁)....G(c₁₆)}

使用RMSProp优化器更新局部判别器的参数β₁,和全局判别器的参数β₂，并更新梯度惩罚系数λ_gp，当λ_gp的值为10时，则保持不变。

根据全局与局部判别器的综合结果反馈，与生成器进行对抗训练，使用ADAM优化器更新图像修复网络的参数θ

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护的范围由所附的权利要求书及其等效物界定。

Claims

1.一种基于生成对抗网络的人脸图像修复方法，其特征在于，包括以下步骤：

S1：建立人脸图片数据库；

S3：将数据集内完整的人脸图片划分为训练集、测试集；

S4：将训练集中的图片通过二值掩码生成随机的破损图片；

2.如权利要求1所述的一种基于生成对抗网络的人脸图像修复方法，其特征在于，所述步骤S3中人脸图片按照9:1的随机比例划分为训练集与测试集。

3.如权利要求1所述的一种基于生成对抗网络的人脸图像修复方法，其特征在于，所述步骤S4中需对训练集中的每一张图片通过二值掩码生成一定大小内的随机破损区域。

4.如权利要求1所述的一种基于生成对抗网络的人脸图像修复方法，其特征在于，所述步骤S5中用于训练的图像修复模型为生成对抗路网络与残差网络组成，破损照片输入图像修复模型，生成对抗网络中的生成器通过残差网络捕获提取破损人脸图像中完好区域的高级特征，并利用转置卷积层与卷积层将残差网络提取到的高级特征修复图像中的破损区域，得到修复后的图像。

5.如权利要求4所述的一种基于生成对抗网络的人脸图像修复方法，其特征在于，所述残差网络由七个残差块组成，每两个卷积层或空洞卷积层构成一个残差块。

6.如权利要求1所述的一种基于生成对抗网络的人脸图像修复方法，其特征在于，所述步骤S6中训练包括使用Adam优化器训练生成对抗路网络的生成器，使用RMSProp优化器训练生成对抗路网络的判别器。