CN113128467B

CN113128467B - 基于面部先验知识的低分辨率人脸超分辨与识别的方法

Info

Publication number: CN113128467B
Application number: CN202110510886.4A
Authority: CN
Inventors: 蹇木伟; 王芮; 王星; 陈吉; 举雅琨; 傅德谦; 张问银; 董良; 董波; 黄振; 尹义龙
Original assignee: Linyi University; Shandong University of Finance and Economics
Current assignee: Linyi University; Shandong University of Finance and Economics
Priority date: 2021-05-11
Filing date: 2021-05-11
Publication date: 2022-03-29
Anticipated expiration: 2041-05-11
Also published as: CN113128467A

Abstract

本发明提供了一种基于面部先验知识的低分辨率人脸超分辨与识别的方法,包括S1：数据集构建；S2：对

进行人脸超分辨，并由此得到映射矩阵

；S3:构建特征提取器

，分别将

和

映射到公共空间

；S4：获得相对应的

个映射矩阵

；S5：获取

图像的先验知识，得到多个超分辨结果

；S6：分别将

和

经过

映射到公共空间

，并将其类别分配给

；S7：最后产生人脸超分辨与识别结果。通过本发明的技术方案，本发明内容主要包括两部分，一是训练低分辨率和高分辨率组成的人脸对数据集；二是同时将分辨率和高分辨率的人脸同时映射到公共空间来训练一个非线性转换器，目的是提高低质量人脸图像识别的准确性。

Description

基于面部先验知识的低分辨率人脸超分辨与识别的方法

技术领域

本发明涉及模式识别技术领域，具体而言，特别涉及一种基于面部先验知识的低分辨率人脸超分辨与识别的方法。

背景技术

目前，人脸识别技术已经相对成熟且应用研究十分广泛，普及到了现代社会生活的方方面面。但是，很多人脸识别系统是在人脸对象属于高质量图像的前提下工作，因此当现实世界由于各种原因导致人脸属于低分边图像时，如监控设备、距离等等，往往该系统表现出较差的性能，甚至不能识别。人脸超分辨技术，可以实现增强低分辨率人脸图像的分辨率，以产生相应的高分辨率人脸图像。因此，实现将人脸超分辨与人脸识别任务联结，可以直接提高人脸识别系统的鲁棒性，也可以用于寻找犯罪分子等其他人脸相关任务。

针对解决当高质量的图像库可用于识别低分辨率探头人脸图像的问题，现有的标准方法主要有三种：1) 向下采样注册图像（gallery images）至评测图像（probe images）的分辨率，然后执行识别。这类方法虽有效但会使得高分辨率注册图像中可用的其他具有辨别力的信息丢失。2）同时将LR评测和HR注册图像映射到公共空间，其中相应的LR和HR图像距离最近。3）将低分辨率图像重建到高分辨率的评测图像，然后用于识别。这类方法重点关注模型的超分辨技术，没有针对识别性能进行优化。另一方面，考虑到人脸图像是一个高度结构化的对象，其相对于自然图像具有明显的特定信息，因此有必要探索和利用面部的独特信息作为先验知识来促进面部细节增强。

综上所述，对于人脸识别任务，脸部的分辨率是至关重要的因素，尤其是嘴巴和眼睛、眉毛等关键区域的特征对于面部感知以及面部神经反应有直接影响。因此，将注意力选择作为先验知识并参与指导低分辨人脸到高分辨的恢复过程，对该人脸超分辨行为有大大的刺激作用，最后将其结果用于提高人脸识别任务的鲁棒性和实用性。

发明内容

本发明面向真实场景下人脸图像低分辨的现象，为解决目前人脸识别系统在该情况下性能下降的问题，采用基于面部先验知识的低分辨率人脸超分辨与识别的一体化技术来实现人脸细节增强和分辨率的提升。本发明提供了一种基于面部先验知识的低分辨率人脸超分辨与识别的方法。

本发明是通过如下技术方案实现的：一种基于面部先验知识的低分辨率人脸超分辨与识别的方法，具体包括以下步骤：

S1：数据集构建；构建包含低分辨人脸和高分辨人脸对的训练数据集

，以及高分辨的注册人脸数据库（galleryset）

和低分辨人脸评测数据集（probeset）

；

S2：对

进行人脸超分辨，保存为

；将SRCNN网络

作为本步骤的超分辨骨干网络：先使用双三次（bicubic）插值将

上采样到

的同样大小，然后通过三层卷积神经网络做非线性映射，将其结果保存为

，并由此得到映射矩阵

；

S3:构建特征提取器

，分别将

和

映射到公共空间

，分别记作

、

和

；

S4：查找与评测数据相似的人脸对，在特征空间

中，查找与

最相似的

个

，即

对

，根据S2中的映射矩阵

，获得相对应的

个映射矩阵

；

S5：获取

图像的先验知识，结合相似人脸对的映射矩阵

，超分辨评测数据

，得到多个超分辨结果

；

S6：分别将

和

经过

映射到公共空间

，同S3，然后找到与

距离最小的

，并将其类别分配给

；

S7：最后产生人脸超分辨与识别结果。

作为优选方案，步骤S1中，具体包括以下步骤：

S1-1：构建包含低分辨人脸和高分辨人脸对的训练数据集

，其中

来源于人脸数据集ffhq，

由公式（1）生成，

（1），

其中

表示

和模糊核

的卷积操作，

这里取高斯模糊；

表示下采样操作；

表示加性高斯白噪声；

表示JPEG压缩操作；

S1-2：构建高分辨的注册人脸数据库（galleryset）

，数据同样来源于数据集ffhq，与

的身份信息是无重复；

S1-3：构建低分辨人脸评测数据集（probeset）

，数据来源于人脸数据集HELEN，其生成方式同公式（1）。

进一步地，公式（1）中

，

，而且N<M。

作为优选方案，步骤S3中，具体包括以下步骤：

S3-1：使用的ResNet18网络做为特征提取器

，并将其最后一层全连接层丢弃掉；

S3-2：将

通过特征提取器

映射到公共空间

，分别记作

和

；

S3-3：首先将

通过bicubic放大到所需要的尺寸，然后同样由

将其映射到公共空间

，记作

；

作为优选方案，步骤S4中，具体包括以下步骤：

S4-1：在空间

中，根据欧式距离计算与

与

的相似度，记作

；

(2)

其中

表示人脸对中高分辨率人脸的数量；

S4-2：保存距离最小即相似度值最大的前

个

,

，即对应为

对

；

S4-3：获取映射矩阵，假设这

对人脸隶属于M类不同身份的人脸，同时根据步骤S2中的映射矩阵

，获得相对应的

个映射矩阵

。

作为优选方案，步骤S5中，具体包括以下步骤：

S5-1：由预训练好的人脸解析网络（face parsing network, FPN）

生成

的面部解析图（parsing map）

，由此可得到其语义成分级的边缘信息semanticedge maps，记作

，其中

采用的是encoder-resnet-decoder的网络架构，首先是在4个下采样模块和4个上采用模块之间插入10个resnet blocks，然后是两个卷积层用来输出

；

S5-2：超分辨

，将

与

进行级联操作，统一作为

网络的输入，依次利用

个映射矩阵

，得到

个超分辨结果

，

，即

（2）

其中

表示级联操作。

本发明由于采用了以上技术方案，与现有技术相比使其具有以下有益效果：本发明内容主要包括两部分，一是训练低分辨率和高分辨率组成的人脸对数据集，目的是学习LR-to-HR的非线性映射矩阵，为probe样本的超分辨操作提供支撑；二是同时将分辨率和高分辨率的人脸同时映射到公共空间来训练一个非线性转换器，目的是提高低质量人脸图像识别的准确性。值得一提的是，对于probe样本的超分辨，该发明不仅有效利用了与其相似高分辨人脸图像的映射矩阵，这很大程度上提高了模型效率，而且融合了人脸固有的语义成分先验知识，提升了人脸超分辨的性能的同时也实现了低分辨率人脸识别的目的，最终形成了一体化算法，有针对性地克服非受控环境下低分辨率人脸图像的识别难点问题。

本发明的附加方面和优点将在下面的描述部分中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1为本发明的方法流程图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

下面结合图1对本发明的实施例的基于面部先验知识的低分辨率人脸超分辨与识别的方法进行具体说明。

如图1所示，本发明提出了一种基于面部先验知识的低分辨率人脸超分辨与识别的方法，具体包括以下步骤：

，以及高分辨的注册人脸数据库（galleryset）

和低分辨人脸评测数据集（probeset）

；其中

和

来自不同的数据集，但是由相同的降级模型合成，目的是拟合真实世界中的低质量人脸图像。具体包括以下步骤：

S1-1：构建包含低分辨人脸和高分辨人脸对的训练数据集

，其中

来源于人脸数据集ffhq，

由公式（1）生成，

（1），

其中

表示

和模糊核

的卷积操作，

这里取高斯模糊；

表示下采样操作；

表示加性高斯白噪声；

表示JPEG压缩操作；

，

，而且N<M。

S1-2：构建高分辨的注册人脸数据库（galleryset）

，数据同样来源于数据集ffhq，与

的身份信息是无重复；

S1-3：构建低分辨人脸评测数据集（probeset）

，数据来源于人脸数据集HELEN，其生成方式同公式（1）。

S2：对

进行人脸超分辨，保存为

；将预训练好的SRCNN网络

上采样到

，并由此得到映射矩阵

；

S3:构建特征提取器

，分别将

和

映射到公共空间

，分别记作

、

和

；具体包括以下步骤：

S3-1：使用预训练好的ResNet18网络做为特征提取器

，并将其最后一层全连接层丢弃掉；

S3-2：将

通过特征提取器

映射到公共空间

，分别记作

和

；

S3-3：首先将

通过bicubic放大到所需要的尺寸，然后同样由

将其映射到公共空间

，记作

。

S4：查找与评测数据相似的人脸对，在特征空间

中，查找与

最相似的

个

，即

对

，根据S2中的映射矩阵

，获得相对应的

个映射矩阵

；具体包括以下步骤：

S4-1：在空间

中，根据欧式距离计算与

与

的相似度，记作

；

(2)

其中

表示人脸对中高分辨率人脸的数量；

S4-2：保存距离最小即相似度值最大的前

个

,

，即对应为

对

；

S4-3：获取映射矩阵，假设这

，获得相对应的

个映射矩阵

。

S5：获取

图像的先验知识，结合相似人脸对的映射矩阵

，超分辨评测数据

，得到多个超分辨结果

；具体包括以下步骤：

S5-1：由预训练好的人脸解析网络（face parsing network, FPN）

生成

的面部解析图（parsing map）

，这些成分包括眉毛、眼睛、鼻子、嘴巴和皮肤这五个面部区域。由此可得到其语义成分级的边缘信息semanticedge maps，记作

，其可作为先验知识在重建过程中起到约束作用。其中

；

S5-2：超分辨

，将

与

进行级联操作，统一作为

网络的输入，依次利用

个映射矩阵

，得到

个超分辨结果

，

，即

（2）

其中

表示级联操作。这种做法可以对

网络施加面部语义成分注意力，而且通过

的指导可以产生更加清晰的人脸。

S6：分别将

和

经过

映射到公共空间

，同S3，然后找到与

距离最小的

，并将其类别分配给

；

S7：最后产生人脸超分辨与识别结果。

在本发明的描述中，术语“多个”则指两个或两个以上，除非另有明确的限定，术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制；术语“连接”、“安装”、“固定”等均应做广义理解，例如，“连接”可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是直接相连，也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本说明书的描述中，术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或实例。而且，描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。