CN114898429B

CN114898429B - 一种热红外-可见光跨模态人脸识别的方法

Info

Publication number: CN114898429B
Application number: CN202210503206.0A
Authority: CN
Inventors: 殷光强; 李超; 王治国; 杨晓宇; 刘学婷
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2022-05-10
Filing date: 2022-05-10
Publication date: 2023-05-30
Anticipated expiration: 2042-05-10
Also published as: CN114898429A

Abstract

本发明涉及人脸识别技术领域，特别是涉及一种热红外‑可见光跨模态人脸识别的方法，包括以下步骤：分别对可见光图像和热红外图像进行多级特征的学习；分别对可见光图像和热红外图像进行多级特征的提取；将可见光图像和热红外图像的三级特征利用群卷积的方式进行特征融合，再将融合后的特征输入深度学习网络中，得到最终的识别结果。通过本方法，能有效解决复杂场景下人脸识别的速度与准确度不高的问题。

Description

一种热红外-可见光跨模态人脸识别的方法

技术领域

本发明涉及人脸识别技术领域，特别是涉及一种热红外-可见光跨模态人脸识别的方法。

背景技术

国内外人脸识别的技术手段已经从传统的单模态方法发展到跨模态方法，正在向着人脸识别快速化、精细化方向发展。目前常见的人脸识别方式主要有：基于几何特征的人脸识别、基于神经网络的人脸识别以及近红外-可见光跨模态人脸识别等。基于几何特征的人脸识别准确率较低；基于神经网络的人脸识别需要较多的样本进行训练，但在许多场景中样本数量是很有限的。

现有技术中，提出了公开号为CN101404060，公开日为2009年04月08日的中国发明专利文件，该专利文献所公开的技术方案如下：一种基于可见光与近红外Gabor信息融合的人脸识别方法，该方法包括：分别采集可见光源下和近红外光源下的人脸图像，分别提取两种图像的Gabor特征在特征层进行融合；采用AdaBoost算法对融合后的特征进行特征选择，并采用最近邻分类对其进行相似度的计算和分类。本发明具有非常高的正确率，对光照对人脸识别的影响具有很好的鲁棒性，此外，相比与其他方法，本发明还具有所用特征数少，分类速度快等优点。

上述技术方案在实际使用过程中，会出现以下问题：在完全黑暗的环境下，人脸识别效果仍有较大提升空间，不能快速、有效、安全地在复杂场景下识别出人员身份。

发明内容

为解决上述技术问题，本发明提出了一种热红外-可见光跨模态人脸识别的方法，能有效解决复杂场景下人脸识别的速度与准确度不高的问题。

本发明是通过采用下述技术方案实现的：

一种热红外-可见光跨模态人脸识别的方法，其特征在于：包括以下步骤：

S₁. 分别对可见光图像和热红外图像进行多级特征的学习，所述多级特征的学习具体指采用五个卷积层学习到不同深度的特征；

S₂. 分别对可见光图像和热红外图像进行多级特征的提取，所述多级特征的提取具体指采用三个相邻深度特征组合模块，将学习到的不同深度的特征组合成三种不同深度的三级特征；

S₃. 将可见光图像和热红外图像的三级特征利用群卷积的方式进行特征融合，再将融合后的特征输入深度学习网络中，得到最终的识别结果。

所述步骤S₃中的特征融合具体包括以下步骤：

S₃₁. 将可见光图像和热红外图像提取的三级特征，进行级联操作，并通过卷积操作，构成共享特征2；

S₃₂. 将可见光图像和热红外图像提取的三级特征分别各自分成M组，构成分组特征，将可见光图像和热红外图像的分组特征进行一对一的组合，进行交叉级联，构成M个初步的融合特征；

S₃₃. 将上述的M个初步的融合特征分别进行卷积操作，然后组合成一个完整的特征，构成共享特征1；

S₃₄. 将共享特征1和共享特征2，进行级联操作，构成最后的融合特征。

所述步骤S₁具体包括以下步骤：

S₁₁. 分别对可见光图像和热红外图像进行采集；

S₁₂. 分别对采集到的可见光图像和热红外图像进行图像预处理操作；

S₁₃. 分别利用五层卷积神经网络训练可见光图像和热红外图像，分别学习出五层不同深度的特征。

所述步骤S₁₂中对采集到的可见光图像进行图像预处理操作具体指：对可见光图像进行灰度化处理、几何变换处理和图像增强处理。

所述步骤S₁₂中对采集到的热红外图像进行图像预处理操作具体指：利用插值法对热红外图像进行预处理。

所述步骤S₂具体指：第一个相邻深度特征组合模块提取学习到的前三层特征，将其组合成第一个三级特征；第二个相邻深度特征组合模块提取学习到的中间三层特征，将其组合成第二个三级特征；第三个相邻深度特征组合模块提取学习到的后三层特征，将其组合成第三个三级特征。

与现有技术相比，本发明的有益效果表现在：

1、本发明中，针对复杂场景下的人脸图像，先通过人脸识别技术实现人脸图像的特征提取，然后通过相邻深度特征组合模块将特征组合成三种不同深度的三级特征，再将可见光图像组合的三级特征和热红外图像组合的三级特征做特征融合，以提高复杂场景下人脸识别的速度与准确度。

其中，相邻深度特征组合模块是多级特征的集成的结构，能提高特征提取性能。在分层特征集成机制HIFI 中，集成了来自不同级别的所有卷积层的特征，因此需要学习较多的参数，有较高的计算复杂度。在特征金字塔网络FPN 中，仅集成了两个相邻层中的特征。相邻深度特征组合模块专用于提取每个单峰图像特征，使用多个相邻深度特征组合模块集成多个相邻级别的特征。与特征金字塔网络FPN 相比，本发明中的相邻深度特征组合模块能捕获更多的空间细节。

2、传统的融合模型可以很好地捕捉到连结特征之间的完全跨模态相关性，但单个模态的一些显著特征也可能由于特征数量庞大而淹没在级联特征中，这将降低后续融合特征的可辨识性。另外，在具有多级特征的前提下，直接串联可能会增加网络参数，这对于多模态方法的训练是不可取的。而使用群卷积的方式进行特征融合，可以解决这类的问题。然而，虽然群卷积可以极大地减少参数，但它只能捕捉到同一组内特征之间的部分跨模态相关性，这可能会削弱所有特征映射之间的跨模态相关性。所以在群卷积的基础上，本申请提出用多卷积群融合来代替传统特征融合。

与现有的融合方法相比，本申请所提出的多分支群融合方法可以更好地捕捉图像的跨模态特征。利用多个多分支群融合方法，可以提取出包含语义信息和视觉细节的融合特征，用于显著性目标检测。更重要的是，由于采用卷积，多分支群卷积方法比传统融合方法需要更少的网络参数。

3、本发明中，分别对热红外图像和可见光图像进行图像预处理操作，该预处理可以通过多种类型的图像处理方法增加底库中的照片数量，以图像处理的方式生成人员不同角度、环境、距离的照片，这种方式以较低的人力物力成本获得了多种状况下的人脸照片，提高人脸识别系统的比对成功率。

附图说明

下面将结合说明书附图和具体实施方式对本发明作进一步的详细说明，其中：

图1为本发明中相邻深度特征组合模块的示意图；

图2为本发明中特征融合的示意图。

具体实施方式

实施例1

作为本发明基本实施方式，本发明包括一种热红外-可见光跨模态人脸识别的方法，包括以下步骤：

S₁. 分别对可见光图像和热红外图像进行多级特征的学习，所述多级特征的学习具体指采用五个卷积层学习到不同深度的特征。

S₂. 分别对可见光图像和热红外图像进行多级特征的提取，所述多级特征的提取具体指采用三个相邻深度特征组合模块，将学习到的不同深度的特征组合成三种不同深度的三级特征。

实施例2

作为本发明一较佳实施方式，本发明包括一种热红外-可见光跨模态人脸识别的方法，包括以下步骤：

该步骤具体包括：第一个相邻深度特征组合模块提取学习到的前三层特征，将其组合成第一个三级特征；第二个相邻深度特征组合模块提取学习到的中间三层特征，将其组合成第二个三级特征；第三个相邻深度特征组合模块提取学习到的后三层特征，将其组合成第三个三级特征。

S₃. 将可见光图像和热红外图像的三级特征利用群卷积的方式进行特征融合，再将融合后的特征输入深度学习网络中，得到最终的识别结果。其中，步骤S₃中的特征融合可以采用多卷积群融合模块来实现。

所述多卷积群融合模块左边部分是多组融合分支，将连接的输入特征沿着信道先分成 M 组，然后使用多个卷积层再每组融合。右侧为单组融合分支，直接对连接的输入特征进行两个堆叠的规则卷积层，得到融合的特征。最后通过连接两个分支的输出得到融合后的特征。如上所述，多分支群融合模块可以通过单组融合分支捕获图像特征之间的全跨模态关联。通过多组融合分支，可以从每幅单模态输入图像中提取出更多的显著特征。

实施例3

作为本发明最佳实施方式，本发明包括一种热红外-可见光跨模态人脸识别的方法，包括以下步骤：

S₁. 分别对可见光图像和热红外图像进行多级特征的学习，具体包括以下步骤：

S₁₁. 分别对可见光图像和热红外图像进行采集。在视频采集端采用两个摄像头进行图像的采集，其中可见光摄像头的分辨率可以为1280×960，热红外摄像头的分辨率可以为640×480。

S₁₂. 分别对采集到的可见光图像和热红外图像进行图像预处理操作，具体包括对可见光图像进行灰度化处理、几何变换处理和图像增强处理，利用插值法对热红外图像进行预处理。

其中，由于成像、采集角度等原因可能造成采集的人脸有一定的变形，对于肉眼来说这些变形并不会带来太大的干扰，但对计算机来说却是截然不同的。对训练数据进行几何变换处理为的是模拟现实中的多种拍摄场景下拍摄人脸的几何失真，通过这种方式可以将人脸识别系统的注意力集中在图像内容的本身特征而不是位置、角度和尺度等其他信息。

其中，插值法用于修改图像的尺寸，所有插值法都可行，单双线性插值法的效果最佳。

S₂. 分别对可见光图像和热红外图像进行多级特征的提取。在进行可见光图像和热红外图像的多级特征提取前，分别将可见光图像和热红外图像学习到的特征的长宽统一，通道数固定为128。

在进行多级特征的提取时，采用三个相邻深度特征组合模块ADFC，将学习到的不同深度的特征组合成三种不同深度的三级特征。参照说明书附图1，具体为：第一个相邻深度特征组合模块ADFC1提取学习到的前三层特征，将其组合成第一个三级特征；第二个相邻深度特征组合模块ADFC2提取学习到的中间三层特征，将其组合成第二个三级特征；第三个相邻深度特征组合模块ADFC3提取学习到的后三层特征，将其组合成第三个三级特征。

S₃. 将可见光图像和热红外图像的三级特征利用群卷积的方式进行特征融合，再将融合后的特征输入深度学习网络中，得到最终的识别结果。其中，参照说明书附图2，特征融合具体包括以下步骤：

S₃₁. 将可见光图像和热红外图像提取的三级特征，进行级联操作，并通过卷积操作，构成共享特征2。

S₃₂. 将可见光图像和热红外图像提取的三级特征分别各自分成M组，构成分组特征，将可见光图像和热红外图像的分组特征进行一对一的组合，进行交叉级联，构成M个初步的融合特征。

S₃₃. 将上述的M个初步的融合特征分别进行卷积操作，然后组合成一个完整的特征，构成共享特征1。

综上所述，本领域的普通技术人员阅读本发明文件后，根据本发明的技术方案和技术构思无需创造性脑力劳动而作出的其他各种相应的变换方案，均属于本发明所保护的范围。

Claims

1.一种热红外-可见光跨模态人脸识别的方法，其特征在于：包括以下步骤：

S₃. 将可见光图像和热红外图像的三级特征利用群卷积的方式进行特征融合，再将融合后的特征输入深度学习网络中，得到最终的识别结果；

所述步骤S₂具体指：第一个相邻深度特征组合模块提取学习到的前三层特征，将其组合成第一个三级特征；第二个相邻深度特征组合模块提取学习到的中间三层特征，将其组合成第二个三级特征；第三个相邻深度特征组合模块提取学习到的后三层特征，将其组合成第三个三级特征；

所述步骤S₃中的特征融合具体包括以下步骤：

2.根据权利要求1所述的一种热红外-可见光跨模态人脸识别的方法，其特征在于：所述步骤S₁具体包括以下步骤：

S₁₁. 分别对可见光图像和热红外图像进行采集；

3.根据权利要求2所述的一种热红外-可见光跨模态人脸识别的方法，其特征在于：所述步骤S₁₂中对采集到的可见光图像进行图像预处理操作具体指：对可见光图像进行灰度化处理、几何变换处理和图像增强处理。

4.根据权利要求2或3所述的一种热红外-可见光跨模态人脸识别的方法，其特征在于：所述步骤S₁₂中对采集到的热红外图像进行图像预处理操作具体指：利用插值法对热红外图像进行预处理。