CN109214286A

CN109214286A - 基于深度神经网络多层特征融合的人脸识别方法

Info

Publication number: CN109214286A
Application number: CN201810863541.5A
Authority: CN
Inventors: 章东平; 毕崇圆; 陶禹诺
Original assignee: China Jiliang University
Current assignee: China Jiliang University
Priority date: 2018-08-01
Filing date: 2018-08-01
Publication date: 2019-01-15
Anticipated expiration: 2038-08-01
Also published as: CN109214286B

Abstract

本发明公开了一种基于深度神经网络多层特征融合的人脸识别方法，利用一个输出维度为D2的全连接层Fc2替代DeepID网络结构中的softmax层，Fc2层后面连接多层特征融合损失层，将改进的网络结构称为多层特征融合网络，所述多层特征融合损失层是在计算训练样本之间类内距离与类间距离损失的基础上将Fc1层和Fc2层的输出特征也作为损失函数的输入。获得人脸图像A和人脸图像B的人脸特征分别为F₁和F₂，计算两个特征向量之间的余弦相似度S，设置人脸相似度阈值为T，如果S≥T，则认为人脸图像A和人脸图像B为同一个人，如果S＜T，则认为人脸图像A和人脸图像B为不同人。

Description

基于深度神经网络多层特征融合的人脸识别方法

技术领域

本发明属于深度神经网络提取脸部特征的深度学习领域，涉及到神经网络、模式识别等技术，尤其涉及到一种基于深度神经网络多层特征融合的人脸识别。

背景技术

人脸识别技术是跨图像处理、模式识别等多学科的技术，通过利用计算机对人脸图像进行处理和分析，获取有效特征信息，进行身份识别。相比其它生物识别技术，人脸识别具有采集的非接触性、非强制性、操作简单、结果直观、隐蔽性好等特点，更为人们所接受。人脸是一个包含着丰富信息的模式的集合，是人类互相辩证和识别的主要标志之一，也是图像和视频中视觉感兴趣的对象之一。与指纹、虹膜、语音等其他人体生物特征相比，人脸识别更加直接，无需干扰人们的正常行为就能较好的达到识别效果。

人脸涉及各种不同的活动，它包含了人类大多数的感觉器官：眼睛、耳朵、嘴巴和鼻子，这些器官赋予了人的视觉、听觉、味觉和嗅觉能力。除了这些生物特征之外，它还提供了关于人的健康、情绪状态、身份、年龄、性别等的一些信息。脸部的机器分析(及自动面部分析)在许多新兴的计算机视觉应用中也起到关键性的作用，包括生物识别系统、人机界面、智能环境、视觉监控和基于内容的多媒体数据库图像检索。由于其许多潜在应用，自动面部分析，例如包括面部检测、人脸识别、性别分类、年龄估计和面部表情识别已成为计算机视觉研究中最活跃的课题之一。

虽然人脸识别具有很多的优势，但是在人脸识别时，由于姿态、光照、表情、年龄、遮挡等原因，程序会将同一个人的多张图片识别为不同的人，这大大提升了人脸识别的难度。

发明内容

本发明克服了现有技术的不足之处，提出了一种基于深度神经网络多层特征融合的人脸识别，意在利用改进的DeepID网络结构，结合类内距离和类间距离，获得人脸识别的网络模型，提高人脸识别的准确率。

本发明为达上述发明目的，采用如下技术方案：

步骤1：数据准备：获得公开的CASIA-webface人脸数据库与MS-Celeb-1M人脸数据库作为训练数据集。

步骤2：网络结构：在深度卷积神经网络DeepID网络结构的基础上进行改进，利用一个输出维度为D₂的全连接层F_c2替代DeepID网络结构中的softmax层，F_c2层后面连接多层特征融合损失层，将改进的网络结构称为多层特征融合网络，所述DeepID网络结构包含四个卷积层(每个卷积层后带有一个最大池化层)、一个全连接层F_c1一个softmax层，所述多层特征融合损失层是在计算训练样本之间类内距离与类间距离损失的基础上将F_c1层和F_c2层的输出特征也作为损失函数的输入。

进一步地，所述损失函数的公式为：

其中，λ₁、λ₂、λ₃、λ₄分别表示F_c1层的类内距离损失权重、F_c2层的类内距离损失权重、F_c1层的类间距离损失权重、F_c2层的类间距离损失权重，n表示训练数据集中第i类样本的数量，N表示训练数据集中样本的种类数，u_ik表示训练数据集中第i类第k个样本在F_c1层的输出特征，v_ik表示表示训练数据集中第i类第k个样本在F_c2层的输出特征，表示训练数据集中第i类样本在F_c1层输出的类均值特征，表示训练数据集中第i类样本在F_c2层输出的类均值特征表示训练数据集中第j类样本在F_c1层输出的类均值特征,表示训练数据集中第j类样本在F_c2层输出的类均值特征；

步骤3：网络训练：将步骤1中的训练数据集输入到多层特征融合网络中进行训练获得人脸识别模型。

步骤4：网络测试：将人脸图像A和人脸图像B输入到特征融合网络中，并利用人脸识别模型进行特征提取，获得人脸图像A和人脸图像B的人脸特征分别为F₁和F₂，计算两个特征向量之间的余弦相似度S，设置人脸相似度阈值为T，如果S≥T，则认为人脸图像A和人脸图像B为同一个人，如果S＜T，则认为人脸图像A和人脸图像B为不同人。

附图说明

图1是深度神经网络多层特征融合的人脸识别流程图。

具体实施方式

本实施例中，如图1所示，深度神经网络多层特征融合的人脸识别流程图，具体实现主要包括如下步骤：

步骤1：数据准备：获得公开的CASIA-webface人脸数据库与MS-Celeb-1M人脸数据库作为训练数据集，其中，CASIA-Webface人脸数据库包括10,575个人的494,414张人脸图像，平均每个人有46.8张训练数据。MS-Celeb-1M人脸数据库包括100,000个名人的大约100,000,000张不同的人脸图像，平均每个名人有100张训练数据。

步骤2：网络结构：在深度卷积神经网络DeepID网络结构的基础上进行改进，利用一个输出维度为D₂的全连接层F_c2替代DeepID网络结构中的softmax层，F_c2层后面连接多层特征融合损失层，将改进的网络结构称为多层特征融合网络，所述DeepID网络结构四个卷积层(每个卷积层后带有一个最大池化层)、一个全连接层F_c1一个softmax层，，所述多层特征融合损失层是在计算训练样本之间类内距离与类间距离损失的基础上将F_c1层和F_c2层的输出特征也作为损失函数的输入。

进一步地，所述损失函数的公式为：

设置λ₁＝λ₂＝λ₃＝λ₄＝0.5，训练数据集中样本的种类数N＝10575是CASIA-Webface人脸数据库中人的数量，n＝128为每类样本参与训练的数量。

步骤3：网络训练：将CASIA-Webface人脸数据库的照片和MS-Celeb-1M人脸数据库的照片分别转换为64*64分辨率大小的照片，训练时，每次输入网络的训练数据为128张图片，进行人脸识别模型的训练。

步骤4：网络测试：将人脸图像A和人脸图像B输入到特征融合网络中，并利用人脸识别模型进行特征提取，获得人脸图像A和人脸图像B的人脸特征分别为F₁和F₂，计算两个特征向量之间的余弦相似度S，设置人脸相似度阈值T＝0.8，如果S≥0.8，则认为人脸图像A和人脸图像B为同一个人，如果S＜0.8，则认为人脸图像A和人脸图像B为不同人。

Claims

1.一种基于深度神经网络多层特征融合的人脸识别方法，其特征在于包括如下步骤：

步骤1：数据准备：获得公开的CASIA-Webface人脸数据库与MS-Celeb-1M人脸数据库作为训练数据集；

步骤2：网络结构：在深度卷积神经网络DeepID网络结构的基础上进行改进，利用一个输出维度为D₂的全连接层F_c2替代DeepID网络结构中的softmax层，F_c2层后面连接多层特征融合损失层，将改进的网络结构称为多层特征融合网络，所述DeepID网络结构包含四个卷积层、一个全连接层F_c1一个softmax层，所述多层特征融合损失层是在计算训练样本之间类内距离与类间距离损失的基础上将F_c1层和F_c2层的输出特征也作为损失函数的输入；

步骤3：网络训练：将步骤1中的训练数据集输入到多层特征融合网络中进行训练获得人脸识别模型；

2.如权利要求1所述的基于深度神经网络多层特征融合的人脸识别方法，其特征在于：所述步骤2中损失函数的公式为：

其中，λ₁、λ₂、λ₃、λ₄分别表示F_c1层的类内距离损失权重、F_c2层的类内距离损失权重、F_c1层的类间距离损失权重、F_c2层的类间距离损失权重，n表示训练数据集中第i类样本的数量，N表示训练数据集中样本的种类数，u_ik表示训练数据集中第i类第k个样本在F_c1层的输出特征，v_ik表示表示训练数据集中第i类第k个样本在F_c2层的输出特征，表示训练数据集中第i类样本在F_c1层输出的类均值特征，表示训练数据集中第i类样本在F_c2层输出的类均值特征,表示训练数据集中第j类样本在F_c1层输出的类均值特征,表示训练数据集中第j类样本在F_c2层输出的类均值特征。