CN110569780A

CN110569780A - 一种基于深度迁移学习的高精度人脸识别方法

Info

Publication number: CN110569780A
Application number: CN201910825038.5A
Authority: CN
Inventors: 张文铸; 宋靖东
Original assignee: Beijing Qingfan Technology Co Ltd
Current assignee: Beijing Qingfan Technology Co Ltd
Priority date: 2019-09-03
Filing date: 2019-09-03
Publication date: 2019-12-13

Abstract

本发明公开了一种基于深度迁移学习的高精度人脸识别方法，首先利用中规模人脸图片数据集以及SoftMax分类损失函数对深度卷积神经网络进行分类训练，通过梯度下降算法优化模型参数，得到初始人脸识别模型；随后更换大规模目标数据集，加载初始人脸模型除SoftMax分类层外的前N‑1层，同时采用Arcface损失函数对加载后的深度卷积神经网络进行训练，利用梯度下降优化模型参数，得到目标人脸识别模型。本发明利用深度迁移学习技术，既解决了SoftMax损失函数精度不高的问题，也解决了直接使用Arcface损失函数难以收敛的问题，提高了人脸识别模型的训练速度和识别精度，最终在公开测试集LFW上的识别精度为99.40％。

Description

一种基于深度迁移学习的高精度人脸识别方法

技术领域

本发明涉及人工智能与图像处理领域，具体是涉及一种基于深度迁移学习的高精度人脸识别方法。

背景技术

人脸识别宏观上分为两类：人脸验证和人脸识别。人脸验证是1∶1的比对，即判断两张图片里的人是否为同一人。人脸识别是1∶N的比对，即判断系统当前见到的人，为事先见过的众多人中的哪一个。人脸识别算法经历了早期算法(基于几何特征、基于模板匹配等)、人工特征+分类器和深度学习三个阶段。目前而言，深度学习算法已经成为人脸识别领域的主流算法，极大地提高了人脸识别的精度，推动这一技术走向实用。

目前人脸识别领域主要存在以下问题：识别精度和模型训练速度难以平衡。为了加速人脸识别模型训练使其能够快速收敛，现在主流的做法是采用SoftMax分类损失函数，该损失函数可以加快分类速度，但由于自身的弊端导致其无法将不同的类分离的很远，既无法保证类内距离很小，也无法保类间距离很大，这导致最终训练得到的人脸识别模型鲁棒性很差，很容易出现误分类的情况，人脸识别精度无法得到保障。为了提升人脸识别精度，现在主流的做法是更换损失函数，目前常用的损失函数有：Triplet Loss、CenterLoss、Arcface、Normface、AM-SoftMax等，它们都具有相同的特性，即都可以在训练的时候使得不同类样本尽量分离，同类样本尽量紧凑，从而使得类间距离大于类内距离，极大地减小了人脸识别误分类的风险，识别精度大幅提升。但由于这些损失函数相对于SoftMax损失函数更加苛刻，因此收敛速度很慢甚至难以收敛。

发明内容

本发明的目的在于克服以上存在的技术问题，提供一种基于深度迁移学习的高精度人脸识别方法，该方法利用迁移学习技术对人脸识别模型进行训练，在保证收敛速度的同时可以得到高精度的人脸识别模型。

为实现上述目的，本发明采用如下的技术方案：

一种基于深度迁移学习的高精度人脸识别方法，包括初始人脸识别模型单元、目标人脸识别模型单元及分类器单元三个模块；

所述初始人脸识别模型单元用于快速提升人脸识别精度，使分类损失收敛至较小数值，并将得到的模型传送至所述目标人脸识别模型单元作下一步处理；

所述目标人脸识别模型单元利用迁移学习技术在所述初始人脸识别模型单元的基础上进一步提升人脸识别精度；

所述分类器单元利用所述目标人脸识别模型对真实环境人脸图像进行特征提取，训练多分类逻辑回归线性分类器，并用其进行预测；步骤如下：

步骤S1：选取中规模人脸数据集和分类损失函数，搭建深度卷积神经网络，将所述中规模人脸数据集输入到所述深度卷积神经网络，通过所述分类损失函数对所述深度卷积神经网络进行分类训练，再利用梯度下降算法对人脸识别模型进行参数优化，得到初始人脸识别模型；

步骤S2：选取大规模人脸数据集和损失函数，加载所述步骤S1得到的初始人脸识别模型，采用所述损失函数对加载后的深度卷积神经网络进行训练，得到目标人脸识别模型；

步骤S3：利用所述目标人脸识别模型对真实环境训练人脸图像进行特征提取，得到训练特征矩阵，训练分类器；

步骤S4：利用所述目标人脸识别模型对真实环境测试人脸图像进行特征提取，得到测试特征矩阵，用训练的分类器进行预测，最后得到预测结果。

进一步地，所述步骤S1中的中规模人脸数据集有8万个人，500万张图片，每张图片为160×160的RGB彩色图像。

进一步地，所述步骤S1中选择的损失函数为SoftMax分类损失函数。

进一步地，所述步骤S2中的大规模人脸数据集有10万个人，800万张图片，每张图片为160×160的RGB彩色图像。

进一步地，所述步骤S2中选择的损失函数为Arcface损失函数。

进一步地，所述步骤S3和步骤S4中的真实环境人脸图像为160×160的RGB彩色图像。

进一步地，所述步骤S3和步骤S4中的分类器为多分类逻辑回归线性分类器。

本发明的有益效果：

本发明利用深度迁移学习技术，可以解决训练速度和训练精度之间的矛盾，既能较快速实现收敛，也能得到高精度的人脸识别模型，高效且可复现，能够适用于其它物体识别任务，具有较强的适应能力。

附图说明

图1：本发明一种基于深度迁移学习的高精度人脸识别方法的流程图。

具体实施方式

下面结合附图及实施例对本发明进行详细说明。

如图1所示，本发明提供了一种基于深度迁移学习技术的高精度人脸识别方法，该方法由三部分组成，包括初始人脸识别模型单元、目标人脸识别模型单元以及分类器单元。

初始人脸识别模型单元的功能是快速地提升人脸识别的精度，使分类损失迅速收敛至一个较小的值。该单元以160×160的RGB人脸彩色图像作为深度卷积神经网络的输入，选取中规模人脸数据集作为训练数据集(8万个人，500万张图片)。为了能够快速收敛，选取SoftMax分类损失函数作为该单元的Loss Function。利用梯度下降法优化模型参数，最终得到的初始人脸识别模型在公开测试集LFW上的验证精度为98％左右。

目标人脸识别模型单元的功能是在所述初始人脸识别模型单元的基础上利用深度迁移学习技术进一步提升人脸识别模型精度至State-of-the-Art精度，同时由于有初始人脸识别模型单元的存在，此单元可以快速收敛至目标精度，不会存在收敛很慢甚至难以收敛的问题。此单元以160×160的RGB人脸彩色图像作为深度卷积神经网络的输入，选取大规模人脸数据集作为训练数据集(10万个人，800万张图片)。为了能够使得不同类样本尽可能分离，同类样本尽可能紧凑，提升识别精度，选用Arcface损失函数作为该单元的LossFunction，具体形式为：

其中，N为样本数，C为类别数，为归一化的人脸特征向量和归一化的对应该类别的权重向量之间的内积，cos(θ_j)为归一化的人脸特征向量和归一化的其它类别的权重向量之间的内积。m为引入的间隔参数，m越大，惩罚力度越大，s的引入是为了确保能够收敛。

利用梯度下降法优化模型参数，最终得到的目标人脸识别模型在公开测试集LFW上的验证精度为99.40％。

分类器单元的功能为利用所述目标人脸识别模型对真实环境训练人脸图像进行特征提取，得到训练人脸特征矩阵，训练多分类逻辑回归线性分类器。随后利用所述目标人脸识别模型对真实环境测试人脸图像进行特征提取，得到测试人脸特征矩阵，利用训练得到的分类器进行预测，得到测试结果。

经测试，在光照、分辨率低、低头、遮挡等多种情况影响下，最终该模型在真实环境下依旧能取得95.3％人脸识别精度，支持多人脸同时识别，识别响应速度快，效果良好。

最后应说明的是：以上实施例仅用以说明本发明而并非限制本发明所描述的技术方案；因此，尽管本说明书参照上述的各个实施例对本发明已进行了详细的说明，但是，本领域的普通技术人员应当理解，仍然可以对本发明进行修改或等同替换；而一切不脱离本发明的精神和范围的技术方案及其改进，其均应涵盖在本发明的权利要求范围中。

Claims

1.一种基于深度迁移学习的高精度人脸识别方法，其特征在于：包括初始人脸识别模型单元、目标人脸识别模型单元及分类器单元三个模块；

2.根据权利要求1所述的基于深度迁移学习的高精度人脸识别方法，其特征在于：所述步骤S1中的中规模人脸数据集有8万个人，500万张图片，每张图片为160×160的RGB彩色图像。

3.根据权利要求1所述的基于深度迁移学习的高精度人脸识别方法，其特征在于：所述步骤S1中选择的分类损失函数为SoftMax分类损失函数。

4.根据权利要求1所述的基于深度迁移学习的高精度人脸识别方法，其特征在于：所述步骤S2中的大规模人脸数据集有10万个人，800万张图片，每张图片为160×160的RGB彩色图像。

5.根据权利要求1所述的基于深度迁移学习的高精度人脸识别方法，其特征在于：所述步骤S2中选择的损失函数为Arcface损失函数。

6.根据权利要求1所述的基于深度迁移学习的高精度人脸识别方法，其特征在于：所述步骤S3和步骤S4中的真实环境人脸图像为160×160的RGB彩色图像。

7.根据权利要求1所述的基于深度迁移学习的高精度人脸识别方法，其特征在于：所述步骤S3和步骤S4中的分类器为多分类逻辑回归线性分类器。