CN114821704B

CN114821704B - 一种基于关键点注意力机制的口罩人脸识别方法

Info

Publication number: CN114821704B
Application number: CN202210262458.9A
Authority: CN
Inventors: 李潇; 胡俐蕊
Original assignee: Guilin University of Technology
Current assignee: Guilin University of Technology
Priority date: 2022-03-16
Filing date: 2022-03-16
Publication date: 2024-05-24
Anticipated expiration: 2042-03-16
Also published as: CN114821704A

Abstract

口罩人脸识别成为人脸识别领域的难点和热点，传统基于卷积神经网络人脸识别算法由于没有大面积遮挡的去噪能力在口罩人脸识别任务中准确率较低。本发明是一种基于关键点注意力机制的口罩人脸识别技术。首先在注意力机制引入使用关键点注意力替代全连接操作，形成区块注意力效果，再通过掩码(mask)操作，抑制大面积口罩信息表达并增强有效人脸部分特征，从而提升口罩人脸识别准确率。

Description

一种基于关键点注意力机制的口罩人脸识别方法

技术领域

本发明涉及深度学习中的注意力机制，通过改进注意力机制，增强模型的去噪能力，能够有效抑制口罩信息对人脸识别的干扰。本文还涉及深度学习技术中的卷据神经网络，将关键点注意力机制嵌入卷积神经网络中，形成人脸特征提取模型。

背景技术

新冠疫情的爆发极大的改变了人们的生活习惯，人人佩戴口罩成为了防疫的基本行为。这就对人脸识别技术提出了较大的挑战，对佩戴口罩下的人脸进行身份识别。口罩人脸识别有着有效人脸面积小和口罩信息干扰的特点。因此发明一种能够进行口罩人脸识别方法具有很高的实用价值。

发明内容

本发明为了解决现有人脸识别技术的不足，提出了一种基于关键点注意力机制的口罩人脸识别方法，在注意力机制引入使用关键点注意力替代全连接操作，形成区块注意力效果，再通过掩码(mask)操作，抑制大面积口罩信息表达并增强有效人脸部分特征，从而提升口罩人脸识别准确率。将关键点注意力机制嵌入ResNet50中，使用该模型进行人脸特征提取并识别。为实现上述功能，本发明提出了一种基于关键点注意力机制的口罩人脸识别方法，包括以下步骤：

1)在注意力机制使用分组卷积获取人脸关键点；

2)使用Sigmoid函数降低口罩信息；

3)将关键点注意力机制嵌入到卷积神经网络中，构建出人脸特征提取模型；

4)使用数据集对模型进行训练；

5)使用人脸识别模型对摄像头捕获的人脸图像进行身份识别。

在步骤1)中，本发明的关键点注意力机制结构如图1所示。Layer3_out是ResNet50的layer3的输出特征图大小为1024×14×14，将其作为关键点注意力机制的输入。采用关键点注意力机制替代了原注意力机制的全连接，如图1所示。使用3×3卷积(Conv_3×3)去除冗余信息，实现关键特征的提取(大小为1024×6×6)，再使用该特征图输入特征图X进行与通过1×1卷积(Conv_1×1)整合后特征图相乘，通过softmax函数，进而形成新的注意力分布：

C＝softmax(Conv_1×1(X)Conv_3×3(X)^T)

得到的注意力分布再与输入特征图相乘：

在步骤2)中，步骤1)获得关键点特征图与X相比形成了更合理的区块注意力，有助于模型对有效人脸的特征提取。在/>中口罩区域对人脸识别是无用的，人脸区域是识别判别的依据，为了进一步区分两部分区域，本文还在注意力机制中引入了掩码操作。将通过Sigmoid函数，形成0～1的注意力，再与“1”相加，与X相乘，使用relu函数引入非线性，得到Attention_feature(Y)：

当时就消除了该部分特征(即消除口罩特征)。掩码部分相当于一个权重器，增强有一样的特征，抑制无意义的信息。通过关键特征注意力和掩码的融合，实现从口罩人脸中分离出有效人脸。

在步骤3)中，将关键点注意力机制嵌入到ResNet50模型中，构建人脸特征提取模型，网络结构如图2所示。ResNet50的输入图片大小为112×112，在layer3的特征图大小为1024×14×14，将关键点注意力机制嵌入到layer3后面，将layer3的输出特征作为改进注意力机制的输入特征。

在步骤4)中，本发明将实验参数统一设置为：输入图片大小112×112，训练集batch_size和测试的batch_size为128，进行10个迭代训练(epoch)，使用随机梯度下降(SGD)作为网络优化器，初始学习率为0.02。使用口罩人脸和正常人脸1：1的混合数据集进行训练.

在步骤5)中，先使用摄像头获得实时的人脸图像，使用retinaface进行人脸检测，使用本文的模型对检测到人脸进行特征提取，再进行特征比对，获得身份信息。

附图说明

图1关键点注意力机制结构图

图2基于关键点注意力机制的ResNet50网络结构图

图3相似计算过程图

图4映射计算过程图

具体实施方式

本发明实施例中，为解决使用传统人脸识别对口罩人脸识别准确率低的问题，采用基于关键点注意力机制的口罩人脸识别方法进行人脸识别，从而提高了人脸识别的精准度。

下面结合附图及具体实施例对本发明做进一步详细的说明。

在步骤1)中，关键点注意力机制的输入为1024×14×14，进行相似计算如图3所示。记输入特征图X大小为H×W×C，通过θ(1×1卷积)后大小为H×W×C，将X拆分(split)为大小为1×1×C的i,j(i,j＝H×W)个向量。另使用3×3卷积(Conv_3×3)去除冗余信息，实现关键特征的提取(大小为1024×6×6)，并实现同样的拆分，然后将两两进行相似计算(内积)，获得关于X的协方差矩阵C，对求得协方差矩阵C做softmax计算，将协方差矩阵中每行相似度分数转化为概率，获得C注意力图：

C＝softmax(Conv_1×1(X)Conv_3×3(X)^T)

得到的注意力分布再与输入特征图相乘进行映射计算如图4,对通过σ(1×1卷积)后的X的H和W两个维度进行拉平(flatten)，再与相似计算获得的注意力图C相乘，将HW维度重新展开(expand)：

X＝CX

在步骤2)中，步骤1)获得关键点特征图与X相比形成了更合理的区块注意力，有助于模型对有效人脸的特征提取。在X中口罩区域对人脸识别是无用的，人脸区域是识别判别的依据，为了进一步区分两部分区域，本发明还在注意力机制中引入了掩码操作。将/>通过Sigmoid函数，形成0～1的注意力，再与“1”相加，与X相乘，使用relu函数引入非线性，得到Attention_feature(Y)：

Claims

1.一种基于关键点注意力机制的口罩人脸识别方法，其特征在于，包括以下步骤：

1)在注意力机制使用分组卷积获取人脸关键点：

Layer3_out是ResNet50的layer3的输出特征图大小为1024×14×14，将其作为关键点注意力机制的输入；采用关键点注意力机制替代了原注意力机制的全连接；使用3×3卷积去除冗余信息，实现大小为1024×6×6的关键特征提取，再使用该特征图输入特征图X进行与通过1×1卷积整合后特征图相乘，通过softmax函数，进而形成新的注意力分布：

C＝softmax(Conv_1×1(X)Conv_3×3(X)^T)

得到的注意力分布再与输入特征图相乘：

2)使用Sigmoid函数降低口罩信息:

步骤1)获得关键点特征图与X相比形成了更合理的区块注意力，有助于模型对有效人脸的特征提取；在/>中口罩区域对人脸识别是无用的，人脸区域是识别判别的依据，为了进一步区分两部分区域，在注意力机制中引入了掩码操作；将/>通过Sigmoid函数，形成0～1的注意力，再与“1”相加，与X相乘，使用relu函数引入非线性，得到Attention_feature(Y)：

当时就消除了该部分口罩特征；掩码部分相当于一个权重器，增强有一样的特征，抑制无意义的信息；通过关键特征注意力和掩码的融合，实现从口罩人脸中分离出有效人脸；

4)使用数据集对模型进行训练；

2.根据权利要求1所述的一种基于关键点注意力机制的口罩人脸识别方法，其特征在于；在步骤1)中，关键点注意力机制的输入为1024×14×14，记输入特征图X大小为H×W×C，通过θ后大小为H×W×C，将X拆分(split)为大小为1×1×C的i,j个向量，其中i,j＝H×W；另使用3×3卷积去除冗余信息，实现大小为1024×6×6的关键特征提取，并实现同样的拆分，然后将两两进行相似计算，获得关于X的协方差矩阵C，对求得协方差矩阵C做softmax计算，将协方差矩阵中每行相似度分数转化为概率，获得C注意力图：

C＝softmax(Conv_1×1(X)Conv_3×3(X)^T)

得到的注意力分布再与输入特征图相乘进行映射计算,对通过σ后的X的H和W两个维度进行拉平，再与相似计算获得的注意力图C相乘，将HW维度重新展开：

获得关键点特征图

3.根据权利要求1所述的一种基于关键点注意力机制的口罩人脸识别方法，其特征在于；在步骤2)中，将通过Sigmoid函数，形成0～1的注意力，再与“1”相加，与X相乘，使用relu函数引入非线性，得到Attention_feature(Y)：

当时就消除了该部分口罩特征；通过关键特征注意力和掩码的融合，实现从口罩人脸中分离出有效人脸。