CN112069877B

CN112069877B - 一种基于边缘信息和注意力机制的人脸信息识别方法

Info

Publication number: CN112069877B
Application number: CN202010704678.3A
Authority: CN
Inventors: 胡玮; 特古斯
Original assignee: Peking University
Current assignee: Peking University
Priority date: 2020-07-21
Filing date: 2020-07-21
Publication date: 2022-05-03
Anticipated expiration: 2040-07-21
Also published as: CN112069877A

Abstract

本发明公开了一种基于边缘信息和注意力机制的人脸信息识别方法。本方法为：1)对输入的人脸图像进行特征提取得到该人脸图像的低层特征图；2)从该低层特征图中提取高层次特征和低层次特征；并对该低层特征图进行处理得到边缘二值图像；3)根据边缘二值图像对高层次特征和低层次特征分别进行滤波、池化采样，得到投影矩阵；4)将该投影矩阵、高层次特征、低层次特征输入图卷积模块进行推理，获得图结构的节点特征并将其输入反投影模块，得到优化后的高层特征、低层特征；5)将优化后的高层特征和低层特征送到解码器进行上采样到相同尺度并拼接在一起输入卷积网络进行更新处理得到该人脸图像的人脸信息。本发明有更低的计算时间和空间复杂度。

Description

一种基于边缘信息和注意力机制的人脸信息识别方法

技术领域

本发明涉及人脸解析领域，其理论基础涉及神经网络和计算机视觉领域。

背景技术

人脸解析即将人脸中的不同部位赋予不同的标签，进行像素级的语义分割。其会为每个语义成分(如面部皮肤，眼睛，嘴巴和鼻子)分配一个像素级标签，是语义分割中的一项特殊任务。它已应用于各种场景中，例如面部理解，编辑，合成和动画。

现有基于区域的方法来分别对面部五官进行建模，并取得了很好的效果。但是，这些方法基于每个区域内的单独信息，无法利用区域之间的相关性来捕获远程依赖关系。

实际上，面部成分彼此之间具有丰富的相关性。例如，当人们微笑时，眼睛，嘴巴和眉毛通常会变得更弯曲。面部成分之间的相关性是面部表示中的关键线索，在面部解析中应予以考虑。

发明内容

为了解决上述问题，本发明提出了一种用于人脸解析的注意力机制模块和神经网络框架。本发明建议学习面部图像上的不同五官之间的图结构G，该图结构G表示区域之间的关系并实现对非局部区域的推理以捕获远距离依赖性。为了联系面部图像像素和图结构顶点，本发明投影了一个像素集合(“区域”)，其中的像素具有相似的特征。区域中的逐像素特征将聚合到相应顶点的特征中。

具体来说，对于给定的一张人脸图像，本发明首先通过已有的ResNet主干网络对高级和低级特征进行编码后，建立一个投影矩阵将具有相似特征的像素集合映射到图结构中的每个顶点。每个顶点的特征被视为像素特征的加权聚合，其中通过为五官边缘像素的特征分配较大的权重。接下来，本发明通过图卷积学习和推理顶点之间的关系，以进一步提取全局的语义信息。最终，将学习到的特征投影回逐像素的特征图，并根据卷积模块来产生成最后的人脸信息。总体来说，本发明提出通过在对不同像素区域建模到的图结构，来利用区域之间的关系进行人脸解析，其中将投影具有相似特征的像素集合到每个顶点，并推理出这些关系以捕获远距离依存关系。

本发明的技术方案为：

一种基于边缘信息和注意力机制的人脸信息识别方法，其步骤包括：

1)对输入的人脸图像进行特征提取得到该人脸图像的低层特征图；

2)使用多层次池化模块从该低层特征图中提取高层次特征和低层次特征；使用边缘提取模块对该低层特征图进行处理得到边缘二值图像；

3)根据该边缘二值图像对高层次特征和低层次特征分别进行滤波、池化采样，得到投影矩阵，将该人脸图像中具有相似特征的像素集合映射到图结构G中的每个顶点；其中图结构G＝{V,E,W}；V为图结构G上顶点的集合，|V|＝N为图结构G的顶点个数；E为图结构G中边的集合；W为带权邻接矩阵，其中的元素w_i,j是图结构G中连接顶点i与顶点j的边的权重；

4)将该投影矩阵、高层次特征输入图卷积模块进行推理，获得图结构G的节点特征并将其输入反投影模块，得到优化后的高层特征；将该投影矩阵、低层次特征输入图卷积模块进行推理，获得图结构G的节点特征并将其输入反投影模块，得到优化后的低层特征；

5)将优化后的高层特征和低层特征馈送到解码器进行上采样到相同尺度并拼接在一起输入卷积网络；

6)卷积网络对输入特征数据进行更新处理得到该人脸图像的人脸信息。

进一步的，利用ResNet骨干网络对输入的人脸图像进行特征提取得到所述低层特征图。

进一步的，利用图拉普拉斯矩阵L＝D-W计算得到带权邻接矩阵W，其中D为对角矩阵，

一种基于边缘信息和注意力机制的人脸信息识别系统，其特征在于，包括特征提取模块、边缘感知图推理模块和解码器模块；其中，

特征提取模块，用于输入的人脸图像进行特征提取得到该人脸图像的低层特征图；然后从该低层特征图中提取高层次特征和低层次特征，以及对该低层特征图进行处理得到边缘二值图像；

边缘感知图推理模块，用于根据该边缘二值图像对高层次特征和低层次特征分别进行滤波、池化采样，得到投影矩阵，将该人脸图像中具有相似特征的像素集合映射到图结构G中的每个顶点；其中图结构G＝{V,E,W}；V为图结构G上顶点的集合，|V|＝N为图结构G的顶点个数；E为图结构G中边的集合；W为带权邻接矩阵，其中的元素w_i,j是图结构G中连接顶点i与顶点j的边的权重；然后将该投影矩阵、高层次特征输入图卷积模块进行推理，获得图结构G的节点特征并将其输入反投影模块，得到优化后的高层特征；以及将该投影矩阵、低层次特征输入图卷积模块进行推理，获得图结构G的节点特征并将其输入反投影模块，得到优化后的低层特征；

解码器模块，用于对优化后的高层特征和低层特征进行上采样到相同尺度并拼接在一起输入卷积网络进行特征数据更新处理得到该人脸图像的人脸信息。

与现有技术相比，本发明的积极效果为：

在人脸五官的边缘处有更好的分割结果；有更低的计算时间和空间复杂度。

附图说明

图1为本发明的方法流程图。

图2为边缘感知图推理模块处理流程图。

具体实施方式

下面结合附图和实施例对本发明提供的一种声源定向框架进行介绍。

在介绍方法的主要步骤之前，本发明首先介绍一下谱图理论，谱图理论将是本发明中的方法的核心。

(1)图和图拉普拉斯矩阵：

本发明定义一个无向图，G＝{V,E,W}。V为图G上顶点的集合，|V|＝N为图G的顶点个数；E为图G中边的集合；W为带权邻接矩阵。其中W是一个N×N的实对称矩阵，w_i,j是连接图G中顶点i与顶点j的边的权重，通常使用非负值作为权重。

图拉普拉斯矩阵通常被定义为L＝D-W，其中D为对角矩阵，

在介绍完基本的谱图理论之后，开始讨论本发明中的方法。本发明的模型结构如下：

特征提取部分：

(1)利用ResNet骨干网络对输入的人脸图像进行特征提取得到低层特征图；

(2)使用多层次池化模块提取高层次特征和低层次特征；

(3)使用边缘提取模块对低层特征图处理得到边缘二值图像。

边缘感知图推理模块，其数据处理流程如图2所示：

(1)根据边缘二值图像对高层次特征和低层次特征分别进行滤波、池化采样，得到投影矩阵，将该人脸图像中具有相似特征的像素集合映射到图结构G中的每个顶点；

(2)将投影矩阵和高层次特征、低层次特征输入图卷积模块进行推理(参考《图卷积神经网络综述》计算机学报2020.5)，获得图结构G的节点特征；

(3)将图结构G的节点特征输入反投影模块，得到优化后的高层特征和低层特征。

解码器模块：

(1)将优化后的高层特征和低层特征馈送到解码器；

(2)解码器将两个特征利用上采样到相同尺度并拼接在一起；

(3)利用卷积网络进行特征更新输出最终解析结果，即人脸图像的人脸信息。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种基于边缘信息和注意力机制的人脸信息识别方法，其步骤包括：

3)根据该边缘二值图像对高层次特征和低层次特征分别进行滤波、池化采样，得到投影矩阵，将该人脸图像中具有相似特征的像素集合映射到图结构G中的每个顶点；其中图结构G＝{V，E，W}；V为图结构G上顶点的集合，|V|＝N为图结构G的顶点个数；E为图结构G中边的集合；W为带权邻接矩阵，其中的元素w_i，j是图结构G中连接顶点i与顶点j的边的权重；

2.如权利要求1所述的方法，其特征在于，利用ResNet骨干网络对输入的人脸图像进行特征提取得到所述低层特征图。

3.如权利要求1所述的方法，其特征在于，利用图拉普拉斯矩阵L＝D-W计算得到带权邻接矩阵W，其中D为对角矩阵，

4.一种基于边缘信息和注意力机制的人脸信息识别系统，其特征在于，包括特征提取模块、边缘感知图推理模块和解码器模块；其中，

边缘感知图推理模块，用于根据该边缘二值图像对高层次特征和低层次特征分别进行滤波、池化采样，得到投影矩阵，将该人脸图像中具有相似特征的像素集合映射到图结构G中的每个顶点；其中图结构G＝{V，E，W}；V为图结构G上顶点的集合，|V|＝N为图结构G的顶点个数；E为图结构G中边的集合；W为带权邻接矩阵，其中的元素w_i，j是图结构G中连接顶点i与顶点j的边的权重；然后将该投影矩阵、高层次特征输入图卷积模块进行推理，获得图结构G的节点特征并将其输入反投影模块，得到优化后的高层特征；以及将该投影矩阵、低层次特征输入图卷积模块进行推理，获得图结构G的节点特征并将其输入反投影模块，得到优化后的低层特征；

5.如权利要求4所述的系统，其特征在于，所述特征提取模块利用ResNet骨干网络对输入的人脸图像进行特征提取得到所述低层特征图。

6.如权利要求4所述的系统，其特征在于，所述边缘感知图推理模块利用图拉普拉斯矩阵L＝D-W计算得到带权邻接矩阵W，其中D为对角矩阵，