CN114764754B

CN114764754B - 一种基于几何感知先验引导的遮挡人脸修复方法

Info

Publication number: CN114764754B
Application number: CN202210307257.6A
Authority: CN
Inventors: 李雅倩; 张秀敏; 肖存军; 李海滨; 张文明
Original assignee: Yanshan University
Current assignee: Yanshan University
Priority date: 2022-03-25
Filing date: 2022-03-25
Publication date: 2024-04-09
Anticipated expiration: 2042-03-25
Also published as: CN114764754A

Abstract

本发明公开了一种基于几何感知先验引导的遮挡人脸修复方法，包括如下步骤：步骤S1、建立人脸语义解析模块；步骤S2、将遮挡人脸图像输入到人脸语义解析模块中以获取人脸语义解析图；步骤S3、将人脸语义解析图、遮挡人脸图像和随机遮挡Mask拼接成5通道的图片，作为步骤S4中修复网络生成器的输入；步骤S4、构造修复网络生成器，得到最终修复图像；步骤S5、修复图像输入到全局判别器和局部判别器；步骤S6、用设计好的方法在公开数据集上进行实验并测试Peak Signal‑to‑Noise Ratio、Structural Similarity Index和Fréchet Inception Distance三个指标。

Description

一种基于几何感知先验引导的遮挡人脸修复方法

技术领域

本发明涉及图像处理技术，尤其是一种基于几何感知先验引导的遮挡人脸修复方法。

背景技术

图像修复技术是利用破损图像中未缺失区域信息，按照一定的修复规则，对图像中被污染或缺失的区域进行像素修补、填充，本质上是对像素之间复杂关系的建模，而这正是深度神经网络的优势所在。目前最具有代表性的生成模型为生成对抗网络GAN(Generative Adversarial Networks)。

现如今随着科技的发展及社会需求，人脸识别技术得到进一步的发展。但人脸图像获取时，不仅会受环境影响，而且存在人脸被遮挡的情况，这些因素都会影响人脸识别的准确率。随着此次席卷全球的肺炎疫情的发展，人们的公共卫生意识大幅提高，外出时佩戴口罩的现象大幅增加，遮挡情况成为所有人脸识别系统无法回避的问题。遮挡的存在一方面造成判别性信息大量丢失，另一方面会导致类内距离增大，类间距离减小，导致人脸识别算法的准确率大幅下降。因此有必要针对遮挡展开研究，尽可能保证遮挡情况下的识别不受影响。

有遮挡的人脸修复任务，不能将修复的重点仅仅集中于视觉上的语义一致性，更应该关注修复人脸的身份认证问题。以人脸识别为目的进行遮挡人脸修复，基本思路是引入与身份识别相关的损失函数。现有的方法提出一个包含LSTM解码器和双通道LSTM解码器的网络进行遮挡检测和修复，引入分类损失使身份信息损失最小化。虽然取得了一定成果，但尚有以下问题未解决：损失函数的计算依据是整个人脸的特征图，但遮挡只占人脸上的一部分区域，因此缺乏针对性；损失函数的计算一般采用L1或L2范数，会使修复后的人脸趋向于数据集的平均人脸，不利于后续识别；修复是一个估计的过程，不可信，修复不可避免，但是目前对修复的可信度缺乏评价方法，导致基于修复的应用缺乏理论支撑。

因此，基于上述问题亟需提出一种更加高效的、以人脸识别为目的的遮挡人脸修复方法。

发明内容

本发明需要解决的技术问题是提供一种基于几何感知先验引导的遮挡人脸修复方法，既能满足视觉上的语义一致性，又能满足修复人脸身份认证的遮挡人脸修复方法。

为解决上述技术问题，本发明所采用的技术方案是：一种基于几何感知先验引导的遮挡人脸修复方法，包括如下步骤：

步骤S1、建立人脸语义解析模块，人脸语义解析模块由BiseNet网络构成，BiseNet网络包括空间分支、上下文分支和特征融合模块；

步骤S2、将遮挡人脸图像输入到人脸语义解析模块中以获取人脸语义解析图；

步骤S3、将人脸语义解析图、遮挡人脸图像和随机遮挡Mask拼接成5通道的图片，作为步骤S4中生成器的输入，为遮挡人脸修复提供人脸几何先验知识；

步骤S4、构造生成器，生成器包括编码器和解码器，编码器根据遮挡人脸图像、随机遮挡Mask与人脸语义解析图生成目标人脸图像的人脸特征向量，根据人脸特征向量提取目标人脸图像中受遮挡区域对应的遮挡特征向量，解码器根据遮挡特征向量，生成遮挡部分图像，得到最终修复图像；

步骤S5、修复图像输入到全局判别器和局部判别器，其中局部判别器包括左眼局部判别器、右眼局部判别器和嘴局部判别器，引入具有左眼、右眼、嘴局部判别器的面部组件损失，并且基于判别器学习到的特征进行进一步的风格监督；

步骤S6、用设计好的方法在公开数据集上进行实验并测试Peak Signal-to-NoiseRatio、Structural Similarity Index和Fréchet Inception Distance三个指标。

本发明技术方案的进一步改进在于：所述步骤S4的具体步骤为：

步骤S41、在编码器中，首先经过一个7*7的卷积，扩大感受野，再经过两个步长为2的4*4卷积进行特征提取，提取的特征记为x₁；

步骤S42、使用上下文聚合变换模块增强上下文特征推理和遮挡区域的纹理合成，将输入特征x₁分别输入到四个不同空洞率的空洞卷积，使用大的空洞率关注图片的全局特征，小的空洞率关注图片的局部特征，最后通过一个3*3卷积将四个输出特征进行特征融合得到特征x₂；

步骤S43、使用门控残差连接单元将输入特征x₁与输出特征x₂聚合，得到最终的编码器特征x₃,其中门控残差连接单元包含一个标准卷积和sigmoid激活函数，该门控残差连接单元减小了遮挡区域内外颜色差异；

步骤S44、连续使用两次倍率为2的关注特征重要性的上采样对特征x₃进行解码，得到在空间维度上与输入图像高度和宽度一样大的修复人脸图像。

本发明技术方案的进一步改进在于：所述步骤S43中门控残差连接单元首先通过3*3的标准卷积和sigmoid激活函数，计算空间变异门控值g，然后上下文聚合变换模块通过加权的方式将输入特征x₁和学习到的残差特征x₂聚集起来得到最终的编码特征x₃，特征x₃定义如下：

x₃＝x₁×g+x₂×(1-g)。

本发明技术方案的进一步改进在于：所述步骤S5中全局判别器和局部判别器均使用3层步长为2的4*4标准卷积层，且每一层都将特征图的空间大小减少两倍，输出预测图，，预测图的每个像素表示输入图像中N×N遮挡区域的预测为真或假，并计算对抗损失L_adv、重建损失L_rec、感知损失L_per、特征风格损失L_sty、人脸组件损失L_comp和人脸身份距离保持损失L_id以判定修复的人脸图像是否服从真实人脸图像分布；

全局判别器和局部判别器的总损失函数的公式如下：

L＝λ_advL_adv+λ_recL_rec+λ_perL_per+λ_styL_sty+λ_compL_comp+λ_idL_id，

其中，所述L_adv为对抗损失函数；L_rec是重建损失函数；L_per是感知损失函数；L_sty是特征风格损失函数；L_comp是人脸组件损失函数；L_id是人脸身份距离保持损失函数，λ_adv、λ_rec、λ_per、λ_sty、λ_comp和λ_id分别为预设的人脸修复网络模型中对抗损失、重建损失、感知损失函数、特征风格损失、人脸组件损失、人脸身份距离保持损失的权重参数。

本发明技术方案的进一步改进在于：所述对抗损失函数L_adv的公式如下：

其中，D表示判别器，z是修复的图像，x是真实图像，σ为降采样和高斯滤波的组合函数，m是对应的二进制掩模。

本发明技术方案的进一步改进在于：所述重建损失函数L_rec的公式如下：

L_rec＝||x-G(x⊙(1-m),m)||₁，

其中，x是真实图像，G是生成器，m为对应的二进制掩模，⊙表示像素乘法。

本发明技术方案的进一步改进在于：所述感知损失函数L_per的公式如下：

其中，φ_i为预训练网络VGG19的第i层特征图，N_i为φ_i中元素的数量，z是修复图像。

本发明技术方案的进一步改进在于：所述特征风格损失函数L_sty的公式如下：

L_sty＝E_i[||φ_i(x)^Tφ_i(x)-φ_i(z)^Tφ_i(z)||₁]，

其中，φ_i为预训练网络VGG19的第i层特征图，x是真实图像，z是修复图像。

本发明技术方案的进一步改进在于：所述人脸组件损失L_comp的公式如下：

其中ROI是人脸关键组件区域，D_ROI是关键组件区域判别器，Gram表示矩阵计算，ψ是判别器学习到的多分辨率特征，x是真实图像，z是修复图像，λ_local和λ_fs分别表示局部判别损失和特征风格损失的权重参数。

本发明技术方案的进一步改进在于：所述人脸身份距离保持损失函数L_id的公式如下：

L_id＝λ_id||η(z)-η(x)||₁

其中，η为人脸特征提取器(本发明中选用ArcFace模型)，λ_id为人脸身份距离保持损失的权重参数，x是真实图像，z是修复图像。

由于采用了上述技术方案，本发明取得的技术进步是：

1、本发明通过把人脸语义解析图、遮挡人脸图像和随机遮挡Mask拼接为5通道的图像作为生成器的输入，为生成器提供了遮挡区域的面部属性，例如，被遮挡人脸的眼睛形状或嘴的大小，一定程度上提高了修复精度；在遮挡区域面积大时，人脸语义解析图能够提供有效的几何结构信息，显著提高了大面积遮挡区域的修复效果；

2、本发明重新设计了具有上下文推理能力的上下文聚合变换模块，并采用门控残差连接单元，解决了被修复区域与其他区域色彩差异问题，特别地，对于不规则的大面积遮挡人脸，能够保证修复区域与周围图像上下文的结构一致性；

3、本发明使用带有人脸组件损失的判别器，增强了对修复后人脸组件的可靠性和真实性的二次判定，并且应用人脸身份距离保持损失，使修复的结果与真实图像保持较小的距离，显著提高了修复人脸的真实性。

附图说明

图1为本发明的总体结构图；

图2为本发明修复网络生成器结构图；

图3为本发明修复网络判别器结构图；

图4为本发明上下文聚合变换模块结构图；

图5为本发明人脸几何先验生成器结构图。

具体实施方式

一种基于几何感知先验引导的遮挡人脸修复方法，本发明整体结构如图1所示，包括如下步骤：

步骤S1、建立人脸语义解析模块，如图5所示，人脸语义解析网络使用BiseNet网络，此网络包含三个部分：空间分支、上下文分支和特征融合模块。BiseNet网络的空间分支选用ResNet18代替原始的轻量级网络，在参数量增加的可接受范围内，能够提取更精准的人脸语义解析信息。

遮挡的人脸图像分别输入到空间分支和上下文分支，然后特征融合模块进行特征融合，融合后的特征经过8倍上采样得到输出的人脸语义解析图。在空间分支中，输入图像经过3个卷积模块，每个卷积模块中包含一个步长为1卷积核为3*3的标准卷积，数据归一化和ReLU激活函数。在上下文分支中利用ResNet18对输入图像进行4次共32倍的连续下采样，用于提取特征，16倍下采样后的特征和32倍下采样后的特征分别经过全局池化、1*1标准卷积、数据归一化和sigmoid激活函数后与原特征相乘后再相加，并与空间分支输出特征经过特征融合模块特征融合，得到人脸语义解析图。其中特征融合模块先将空间分支和上下文分支的特征进行通道拼接，经过一个标准卷积、数据归一化和ReLU激活函数得到中间层特征，中间层特征经过空间注意力模块再与原始中间层特征相加得到融合后的特征。其中空间注意力模块包括全局池化层、1*1标准卷积层、ReLU激活函数、1*1标准卷积层和sigmoid激活函数；

步骤S3、将人脸语义解析图、遮挡人脸图像和随机遮挡Mask拼接成5通道的图片，作为步骤S4中生成器的输入，为遮挡人脸修复提供人脸几何先验知识，减少了光照条件、化妆等因素对修复效果的影响。

步骤S4、构造生成器，生成器结构如图2所示，生成器包括编码器和解码器，编码器根据遮挡人脸图像、随机遮挡Mask与人脸语义解析图生成目标人脸图像的人脸特征向量，根据人脸特征向量提取目标人脸图像中受遮挡区域对应的遮挡特征向量，解码器根据遮挡特征向量，生成遮挡部分图像，得到最终修复图像；

具体步骤为：

步骤S41、在编码器中，首先经过一个7*7的卷积，扩大感受野，以便后面网络获取更多的信息。再经过两个步长为2的4*4卷积进行特征提取，提取的特征记为x₁；

步骤S42、使用上下文聚合变换模块增强上下文特征推理和遮挡区域的纹理合成，本发明使用8个堆叠的上下文聚合变换模块，其中上下文聚合变换模块结构图如图4所示。将输入特征x₁分别输入到四个不同空洞率的空洞卷积，具体的，每个上下文聚合变换模块将特征x₁分别输入空洞率为1、2、4、8的3*3空洞卷积，对输入特征x₁执行不同的转换。使用大的空洞率关注图片的全局特征，小的空洞率关注图片的局部特征，最后通过一个3*3卷积将四个输出特征进行特征融合得到特征x₂；

步骤S43、使用门控残差连接单元将输入特征x₁与输出特征x₂聚合，得到最终的编码器特征x₃；本发明在上下文聚合变换模块中引入一个门控残差连接单元，门控残差连接单元包含一个标准卷积和sigmoid激活函数，该门控残差连接单元减小了遮挡区域内外颜色差异。门控残差连接单元首先通过3*3的标准卷积和sigmoid激活函数，计算空间变异门控值g，然后上下文聚合变换模块通过加权的方式将输入特征x₁和学习到的残差特征x₂聚集起来得到最终的编码特征x₃，特征x₃定义如下：

x₃＝x₁×g+x₂×(1-g)。

步骤S44、上下文聚合变换模块输出的特征x₃通过两次倍率为2的关注特征重要性的上采样(FIFAU)，最后经过一个步长为1的3*3标准卷积，得到最终修复图像。其中FIFAU上采样方式包含两个模块：核生成模块和特征增强模块。核生成模块旨在为每个位置预测一个自适应内核，在输入特征馈入到核生成模块后，PixelShuffle对其进σ行2倍率重排,得到尺寸F₁[C/(4σ²),2σH,2σW],为了获得更大的感受野，避免远距离引起的信息不相关的问题，学习到更多的空间信息，FIFAU中使用空洞率为2的3*3卷积，并将通道压缩为Ck,得到的F2尺寸为[C_k,2σH-2,2σW-2]。针对PixelShuffle带来的特征堆叠，本发明使用平均池化，核尺寸为2*2，对F₂进行二次特征提取，考虑感受野中所有像素的平均值，且在压缩图像的同时，保持特征不变，将特征尺寸为F₂[C_k,2σH-2,2σW-2]编码为F₃[C_k,σH,σW],考虑特征增强模块中我们选用的邻域尺寸为N(F_x,k_up)，每个像素点需要k_up×k_up大小的上采样内核，本发明再用一个3×3卷积扩大内核邻域接收范围，使C_m＝k² _up，输出F₄[C_m,σH,σW],然后选用softmax函数进行归一化。特征增强模块，对于F上的像素点x＝(i,j),都对应F₅上σ个尺寸为k_up×k_up的内核W_x’,选取以x为中心的正方形邻域N(F_x,k_up)作为特征感受野，将内核与局部邻域进行加权和运算，生成逐像素的上采样输出F_out。特征增强定义如下：

步骤S5、修复图像输入到全局判别器和局部判别器，其中局部判别器包括左眼局部判别器、右眼局部判别器和嘴局部判别器，判别器结构如图3所示，本发明引入具有左眼、右眼、嘴局部判别器的面部组件损失，并且基于判别器学习到的特征进行进一步的风格监督。全局判别器和局部判别器均使用3层步长为2的4*4标准卷积层，且每一层都将特征图的空间大小减少两倍，输出预测图，预测图的每个像素表示输入图像中N×N遮挡区域的预测为真或假。计算对抗损失L_adv、重建损失L_rec、感知损失L_per、特征风格损失L_sty、人脸组件损失L_comp和人脸身份距离保持损失L_id以判定修复的人脸图像是否服从真实人脸图像分布。

本发明应用了三个局部判别器，分别是左眼局部判别器、右眼局部判别器和嘴局部判别器。局部判别器首先用关键组件对齐裁剪关键组件区域，对于每个区域，训练单独的小的局部判别器来区分修复的遮挡区域是否真实，使每个关键组件区域接近自然的面部成分分布。为了保证每个像素修复的精度和视觉上的真实性，选择以下损失函数用来优化修复效果：

全局判别器和局部判别器的总损失函数的公式如下：

L＝λ_advL_adv+λ_recL_rec+λ_perL_per+λ_styL_sty+λ_compL_comp+λ_idL_id，

各个损失函数定义如下：

对抗损失函数L_adv的公式如下：

其中，D表示判别器，z是修复的图像，x是真实图像，σ为降采样和高斯滤波的组合函数，m是对应的二进制掩模(未遮挡区域像素为0，遮挡区域像素为1)。

重建损失函数L_rec的公式如下：

L_rec＝||x-G(x⊙(1-m),m)||₁，

其中，x是真实图像，G是生成器，m为对应的二进制掩模(未遮挡区域像素为0，遮挡区域像素为1)，⊙表示像素乘法。

感知损失函数L_per的公式如下：

特征风格损失函数L_sty的公式如下：

L_sty＝E_i[||φ_i(x)^Tφ_i(x)-φ_i(z)^Tφ_i(z)||₁]，

人脸组件损失L_comp的公式如下：

所述人脸身份距离保持损失函数L_id的公式如下：

L_id＝λ_id||η(z)-η(x)||₁

步骤S6、了验证本发明的有效性，在公共数据集CelebA-HQ上进行实验，数据集图像分辨率为1024*1024，为了方便训练，减少图像背景对遮挡人脸修复效果的影响及现有设备的局限性，本发明将数据集中图像进行人脸识别、脸部裁剪并重新缩放图像分辨率为160*160大小，CelebA-HQ数据集共30000张人脸图像，取28000张人脸图像训练网络，2000张人脸图像进行测试，在测试集上测试Peak Signal-to-Noise Ratio(PSNR)、StructuralSimilarity Index(SSIM)和Fréchet Inception Distance(FID)三个指标。

本发明提出的方法既能满足视觉上的语义一致性，又能满足修复人脸身份认证的需求，有效提高了遮挡人脸修复的精度。

本文应用了具体实例对本发明原理及实施过程进行了阐述，以上实例的说明只是为了帮助更好地理解本发明的方法以及核心思想，并不是对本发明方法的限制；应当指出，对于本技术领域的一般技术人员，依据本发明原理，做出的没有创造性的改进，均应视为本发明的保护范围。

Claims

1.一种基于几何感知先验引导的遮挡人脸修复方法，其特征在于：包括如下步骤：

步骤S3、将人脸语义解析图、遮挡人脸图像和随机遮挡Mask拼接成5通道的图片，作为步骤S4中修复网络生成器的输入，为遮挡人脸修复提供人脸几何先验知识；

步骤S4、构造修复网络生成器，修复网络生成器包括编码器和解码器，编码器根据遮挡人脸图像、随机遮挡Mask与人脸语义解析图生成目标人脸图像的人脸特征向量，根据人脸特征向量提取目标人脸图像中受遮挡区域对应的遮挡特征向量，解码器根据遮挡特征向量，生成遮挡部分图像，得到最终修复图像；

步骤S4的具体步骤为：

步骤S44、连续使用两次倍率为2的关注特征重要性的上采样对特征x₃进行解码，得到在空间维度上与输入图像高度和宽度一样大的修复人脸图像；

2.根据权利要求1所述的一种基于几何感知先验引导的遮挡人脸修复方法，其特征在于：所述步骤S43中门控残差连接单元首先通过3*3的标准卷积和sigmoid激活函数，计算空间变异门控值g，然后上下文聚合变换模块通过加权的方式将输入特征x₁和学习到的残差特征x₂聚集起来得到最终的编码特征x₃，特征x₃定义如下：

x₃＝x₁×g+x₂×(1-g)。

3.根据权利要求1所述的一种基于几何感知先验引导的遮挡人脸修复方法，其特征在于：所述步骤S5中全局判别器和局部判别器均使用3层步长为2的4*4标准卷积层，且每一层都将特征图的空间大小减少两倍，输出预测图，预测图的每个像素表示输入图像中N×N遮挡区域的预测为真或假，并计算对抗损失L_adv、重建损失L_rec、感知损失L_per、特征风格损失L_sty、人脸组件损失L_comp和人脸身份距离保持损失L_id以判定修复的人脸图像是否服从真实人脸图像分布；

全局判别器和局部判别器的总损失函数的公式如下：

L＝λ_advL_adv+λ_recL_rec+λ_perL_per+λ_styL_sty+λ_compL_comp+λ_idL_id，

4.根据权利要求3所述的一种基于几何感知先验引导的遮挡人脸修复方法，其特征在于：所述对抗损失函数L_adv的公式如下：

5.根据权利要求3所述的一种基于几何感知先验引导的遮挡人脸修复方法，其特征在于：所述重建损失函数L_rec的公式如下：

L_rec＝||x-G(x⊙(1-m),m)||₁，

其中，x是真实图像，G是修复网络生成器，m为对应的二进制掩模，⊙表示像素乘法。

6.根据权利要求3所述的一种基于几何感知先验引导的遮挡人脸修复方法，其特征在于：所述感知损失函数L_per的公式如下：

7.根据权利要求3所述的一种基于几何感知先验引导的遮挡人脸修复方法，其特征在于：所述特征风格损失函数L_sty的公式如下：

L_sty＝E_i[||φ_i(x)^Tφ_i(x)-φ_i(z)^Tφ_i(z)||₁]，

8.根据权利要求3所述的一种基于几何感知先验引导的遮挡人脸修复方法，其特征在于：所述人脸组件损失L_comp的公式如下：

9.根据权利要求3所述的一种基于几何感知先验引导的遮挡人脸修复方法，其特征在于：所述人脸身份距离保持损失函数L_id的公式如下：

L_id＝λ_id||η(z)-η(x)||₁，

其中，η为人脸特征提取器，λ_id为人脸身份距离保持损失的权重参数，x是真实图像，z是修复图像。