CN113158866A

CN113158866A - 一种基于注意力机制与数据不平衡的跨年龄人脸识别方法

Info

Publication number: CN113158866A
Application number: CN202110401376.3A
Authority: CN
Inventors: 颜成钢; 张杰华; 孙垚棋; 张继勇; 李宗鹏; 张勇东
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2021-04-14
Filing date: 2021-04-14
Publication date: 2021-07-23

Abstract

本发明公开了一种基于注意力机制与数据不平衡的跨年龄人脸识别方法。首先从跨年龄人脸识别数据集中抽取同一个人不同年龄的面部照片组成人脸时间序列，通过自注意力机制进行处理得到处理后的特征序列；然后将自注意力机制处理后的特征序列进行线性融合；将将融合后的面部特征分解为身份特征与年龄特征；采用重加权的年龄损失和身份损失分别对年龄估计和身份估计任务进行监督，并采用相关性损失约束年龄特征与身份特征之间的相似性。本发明方法通过融合同一个身份不同年龄的面部照片以及自注意力机制，学习了年龄对面部的影响，提取了更加鲁棒的身份特征；通过重加权年龄损失，缓解了年龄数据分布不平衡导致的准确率下降。

Description

一种基于注意力机制与数据不平衡的跨年龄人脸识别方法

技术领域

本发明涉及计算机视觉领域，尤其涉及一种基于注意力机制和数据平衡的跨年龄人脸识别方案，一种跨年龄人脸识别方案。

背景技术

随着社会经济与科学技术的发展，人脸识别在各行各业已经得到了广泛的应用，并且取得了令人印象深刻的表现。然而，面对人脸的随着年龄的老化，一般的人脸识别方案暴露了其低鲁棒性的缺陷，不能够准确、稳定的识别有着较大年龄差别的人脸。

随着年龄的老化，有时人脸在不同年龄之间的差距甚至会超过不同人之间的差距。因此，跨年龄人脸识别的一个关键挑战是从人脸提取不受年龄影响的身份特征，从而克服年龄的影响。总的来说，跨年龄人脸识别可以分为生成方法与判别方法。生成方法通过建模人脸老化过程生成人脸在不同的年龄的图像进行识别，判别方法则是通过提取不受年龄影响的身份特征进行人脸识别。许多判别方法简单的通过移除人脸特征中的年龄因素提取身份特征，但是这种方法会在一定程度上损失身份信息。此外，深度学习对于数据集有着巨大的依赖，而跨年龄人脸数据集通常表现出严重的年龄标签分布不均，即青年、中年的人脸数据较多，低龄和高龄人群的人脸数据较少，这种数据分布的不均衡很大程度上影响了跨年龄人脸识别的效果。

发明内容

针对现有技术中存在的不足，本发明提供一种基于注意力机制与数据不平衡的跨年龄人脸识别方法。本发明旨在解决如何通过神经网络从人脸提取鲁棒的身份特征，从而提高跨年龄人脸识别的准确性与鲁棒性。

为了达到上述目的，我们从人脸序列中提取面部特征序列，通过自注意力机制捕获序列中的全局信息，通过一个重加权年龄损失函数缓解年龄标签的不平衡分布，此外，我们通过特征融合与分解提高了身份特征对年龄因素的鲁棒性，最终提高跨年龄人脸识别的准确性。

一种基于注意力机制与数据不平衡的跨年龄人脸识别方法，步骤如下：

步骤1、从跨年龄人脸识别数据集Morph中抽取同一个人不同年龄的面部照片组成人脸时间序列，通过特征提取网络提取面部特征序列，通过自注意力机制进行处理得到处理后的特征序列；

步骤2、将自注意力机制处理后的特征序列进行线性融合。

步骤3、将融合后的面部特征分解为身份特征与年龄特征。

步骤4、监督训练；

采用重加权的年龄损失和身份损失分别对年龄估计和身份估计任务进行监督，并采用相关性损失约束年龄特征与身份特征之间的相似性。

步骤1、从跨年龄人脸识别数据集Morph中抽取同一个人不同年龄的面部照片组成人脸时间序列：

其中p代表身份，l代表序列长度。通过特征提取网络提取面部特征序列：

为了捕获序列间的全局信息与相互作用，引导模型关注身份信息，将面部特征序列堆叠为

并计算相互之间的注意力：

其中，σ是softmax函数，W^Q，W^K，W^V是独立的参数矩阵，d_k是W^K的维度，然后输出重建为l个独立的特征表示为：

步骤2、将自注意力机制处理后的特征序列进行线性融合。

其中w_i是权重，满足

的约束。

步骤3、将融合后的面部特征分解为身份特征与年龄特征。

首先通过三个全连接层将融合后的特征x^p进行非线性变换得到年龄特征x_age，然后将年龄特征x_age投影到融合后的面部特征x^p，得到投影后的年龄特征

从融合的面部特征中减去投影后的年龄特征即可得到身份特征：

将身份特征

通过一个全连接层进行身份识别，投影后的年龄特征

通过一个全连接层进行年龄估计。

步骤4、监督训练；

重加权的年龄损失：

L_age是交叉熵损失，w是每个样本的权重，对于年龄为y_i的样本，年龄损失为交叉熵损失L_age与w的积。age_m和age_f分别为数据集中样本数量最大与最小的年龄。由于输入样本有不同的年龄，因此每次都将人脸时间序列中的第二个样本年龄作为整个序列的年龄标签。

身份损失同样采用交叉熵损失。

相关性损失：

L_c＝exp(|P|)

其中P描述了年龄特征与身份特征的相关性，μ_age与

分别表示

的均值与方差，

是一个学习参数。

本发明所达到的有益效果为：

通过融合同一个身份不同年龄的面部照片以及自注意力机制，学习了年龄对面部的影响，提取了更加鲁棒的身份特征；通过重加权年龄损失，缓解了年龄数据分布不平衡导致的准确率下降。

附图说明

图1为本发明方法流程图；

图2为本发明实施例采用的网络结构示意图。

具体实施方式

下面结合附图并通过具体实施例对本发明做进一步详述。

本方法所采用的网络结构如图2所示，首先通过一个特征提取网络对输入的进行特征提取，随后的自注意力模块对提取的面部特征序列进行处理，特征融合部分对面部特征序列进行融合，随后通过特征分解模块得到年龄特征与身份特征，由分类器估计出相应的年龄与身份。

如图1所示，本发明的具体实施例及其实施过程如下：

具体实施过程包括深度模型的训练与测试两个阶段：

步骤1：从Morph数据集中选取三张人脸照片样本，身份为p：

取第二个照片对应的年龄为整个序列的年龄。通过特征提取网络提取面部特征序列：

所述的特征提取网络采用ResNet-50。将面部特征序列堆叠

通过自注意力模块处理，学习特征之间的相互关系：

其中σ是softmax函数，W^Q，W^K，W^V是独立的参数矩阵，d_k是W^K的维度。然后将输出重建为三个独立的特征表示为：

步骤2：将序列中的三个特征线性融合。

步骤3：通过三个全连接层将融合后的特征x^p进行非线性变换，从融合特征中提取年龄特征x_age，然后将年龄特征x_age投影到融合后的面部特征x^p，得到投影后的年龄特征：

将身份特征

通过一个全连接层进行身份识别，投影后的年龄特征

通过一个全连接层进行年龄估计。

步骤4、监督训练。

重加权的年龄损失：

L_age是普通的交叉熵损失，w是每个样本的权重，对于年龄为y_i的样本年龄损失因为交叉熵损失L_age与w的积。age_m和age_f分别为数据集中样本数量最大与最小的年龄，此处分别取22与80。由于输入的样本有三个不同的年龄，因此每次都将第二个图片的年龄作为整个序列的年龄标签(当样本数大于三时，依然采用第二个样本的年龄)。

身份损失同样采用交叉熵损失。