CN108446661A

CN108446661A - 一种深度学习并行化人脸识别方法

Info

Publication number: CN108446661A
Application number: CN201810280026.4A
Authority: CN
Inventors: 强保华; 史喜娜; 谢武; 赵兴朝; 王培雷; 张世豪
Original assignee: Guilin University of Electronic Technology
Current assignee: Guilin University of Electronic Technology
Priority date: 2018-04-01
Filing date: 2018-04-01
Publication date: 2018-08-24
Anticipated expiration: 2038-04-01
Also published as: CN108446661B

Abstract

本发明公开了一种基于数据扩增的深度学习并行化人脸识别方法，所述方法通过将人脸数据集进行数据扩增得到一个大规模的人脸数据集来提高人脸识别的准确率；然后将得到的大规模人脸数据集输入到改进的残差网络中进行深度学习，从而将人脸图像的特征转换为二进制哈希码以加快识别的效率；模型训练是在基于caffeonspark的分布式平台上进行的，从而减少模型训练时间；最后将得到的模型在LFW数据集上进行人脸验证来检验模型的泛化能力以及改进的残差网络的可行性。本发明能够提高人脸识别的准确率及识别效率。

Description

一种深度学习并行化人脸识别方法

技术领域

本发明涉及生物特征识别领域，具体涉及一种深度学习并行化人脸识别方法。

背景技术

人脸识别是生物特征识别技术中最重要的一项技术，目前基于深度学习的人脸识别遇到的问题主要有两方面：首先是数据集的收集，如何收集大量的人脸数据以及如何收集多姿态多表情的数据是当前的一大难点，对于国际上通用的人脸识别评测标准的LFW（Labeled Faces in the Wild）数据集来说，在55749个类别中，有1680个类别只有一张图像，这样势必会造成在提取人脸图像特征的时候导致训练集中的特征较少，使其准确率较低，因此采用面部图像的数据增加从姿势、表情两方面对面部图像进行扩充来丰富每个主题的外观变化，并将其应用于训练或测试图像而不改变其标签，同时也能避免对现有数据集的过度开发。其次是人脸识别在使用深度学习进行模型训练的效率，当数据集规模巨大时，模型训练的时间就会急剧增加，为了提高模型训练的效率因此采用并行化架构。在Linux环境下搭建Caffe框架，然后采用深度卷积神经网络对扩充后的数据集进行模型训练，训练完成后通过汉明距离来判断两个人脸图像是否具有相同的身份，并完成对结果的检测和对训练模型的优劣度评价。

发明内容

本发明提供一种基于数据扩增的深度学习并行化人脸识别方法，能够提高人脸识别的准确率及识别效率。本发明通过将人脸数据集进行数据扩增得到一个大规模的人脸数据集来提高人脸识别的准确率；然后将得到的大规模人脸数据集输入到改进的残差网络中进行深度学习，从而将人脸图像的特征转换为二进制哈希码以加快识别的效率；模型训练是在基于CaffeOnSpark的分布式平台上进行的，从而减少模型训练时间；最后将得到的模型在LFW数据集上进行人脸验证来检验模型的泛化能力以及改进的残差网络的可行性。

针对当前人脸识别领域最紧缺的海量数据素材资源，本发明提供了一个更容易获取人脸数据集的手段来增加人脸识别系统的训练数据大小，能从一定程度上提高数据容量，达到提高模型效率的目的。该方法通过建立3D模型与人脸特征点相对位置之间的关系，在30个通用的3D模型上对2D图像进行投影变换来扩充其面部姿势，但是得到的人脸图像存在噪声会降低人脸识别的准确率。因此将得到的人脸数据通过对抗神经网络来进行去噪处理，通过数据扩增的方法将CASIA-Webface数据集从姿态、形状以及标签等三个方面合成新的人脸图像，将其从50万张图像扩充为200万的大型人脸数据集。

为了提高人脸验证的效率，本发明还提供了一个改进的残差网络，将残差网络改进成双路网络结构并在其中引入哈希层将人脸图像的特征映射为二进制哈希码来进行人脸验证，将改进后的网络结构简称为Siamese-ResNet。将一对人脸图像输入到Siamese-ResNet中，并通过卷积池化等操作得到两张图的特征，其特征通过哈希层进而转化为低维的二进制哈希码，设定阈值并通过汉明距离来进行计算哈希码之间的距离，来判断该对象对是否为同一个人。

针对现有单机GPU数量扩展能力有限、训练速度较慢等问题，本发明还提供了基于CaffeOnSpark的深度学习模型化并行化的框架。CaffeOnSpark采用基于Spark DataFrameAPI的MemoryData Layer作为数据输入，将模型存储在HDFS中，同时借助RDD的特点，将数据快速分发到各个节点，每个计算节点完成模型初始化之后，通过Solver调用正向传播、反向传播和权值的合并操作来完成一次迭代。将四个单机单卡的NIVDIA Tesla P100通过该方法搭建成一个分布式的深度学习平台来进行大规模数据集的模型训练，来加快模型训练，提高实验效率。

附图说明

图1为基于数据扩增的深度学习并行化人脸识别方法的流程图。

图2为深度学习并行化结构的结构图。

图3为人脸图像特征提取以及人脸验证的过程图。

图4为改进的残差网络Siamese-ResNet的结构图。

图5为Siamese-ResNet网络的原理图。

具体实施方式

参照图1，基于数据扩增的深度学习并行化人脸识别方法的实现包括如下步骤：

（1）给定原始CASIA-Webface数据集，其中包括10575个人的49万张人脸图像。

（2）根据人脸特征点检测获得的68个特征点和30个3D人脸模板合成不同姿态和外形的3D人脸，再将其投影变换成2D图像，得到一个大小为200万的人脸数据集。具体的，就是指定一副人脸图像通过face_landmarks计算出68个特征点的坐标值；通过分解它所包含的3D头部形状相对于图像的旋转矩阵，然后，对不同的偏航角采样，为未知的视点创建新的旋转矩阵，把它渲染在固定的偏航值θ设置为 0°、±40°、±75°的角度，然后合成人脸图像。

（3）得到的大规模人脸数据集存在一定的噪声会影响人脸识别的准确率，因此通过抗神经网络对扩充后百万级别的人脸数据集进行人脸修正，将其中存在很大噪声的图片进行去噪，提高人脸图像的质量从而提高人脸识别的准确率。

（4）搭建基于深度学习框架Caffe的并行化平台CaffeOnSpark，将大数据平台Spark和深度学习框架Caffe相结合来提高并行化平台的数据处理效率，从而缩短模型训练的时间。

（5）将扩充后的人脸数据集在CaffeOnSpark平台上进行处理，将其转化为LMDB文件，同时将文件存储在HDFS中，借助Spark的RDD特征，将数据快速分发到各个节点上进行预训练，生成caffemodel特征文件并得到人脸分类的结果。

（6）改进残差网络，将ResNet-50改成双路残差网络，并在分类层之前引入哈希层，将人脸图像转换成二进制哈希码来降低图像的存储空间并提高人脸验证的效率，将改进型后的网络称为Siamese-ResNet网络，并调用生成的caffemodel特征文件在LFW人脸数据对上进行人脸验证。

参照图2，并行化训练包括如下步骤：

（1）获得含有249万张训练样本的图片数据集，并按照节点数量对模型进行分片并分发给各节点，总迭代次数设为t，t=50万。

（2）在每个计算节点分别将接受的数据输入网络模型中，得到输出。

（3）使用反向传播算法依次计算网络更新梯度和模型权重。

（4）收集各计算节点更新的模型权重并进行堆或加操作。

（5）将步骤（4）收集到的模型权重分片分发给各计算节点。

（6）当迭代次数为t时，则算法终止，否则跳至步骤（2），如此循环。

参照图3，其中人脸图像特征生成过程以及在LFW上进行验证的具体步骤如下：

（1）将获得的百万人脸的数据集输入到残差网络中进行预训练，经过卷积层、池化层和分类器层，训练得到一个百万级别的人脸图像网络模型。

（2）构建Siamese-ResNet网络，在LFW人脸数据集上进行人脸验证，将人脸图像对转换成二进制哈希码通过汉明距离并设定阈值来衡量两个人是否为同一个人，其中经过实验表明阈值设置为0.85时人脸验证的识别率准确率最高。

参照图4和图5，构建的Siamese-ResNet网络结构主要包括如下步骤：

（1）在ResNet-50中的数据层之后加一个slice层，该层负责把输入的人脸图像对按通道切分，这样在data层中只有一个图像，与之成对的图像在data_p中。

（2）然后在分类层前引入哈希层，将图像特征映射为二进制哈希码。

（3）通过卷积池化等操作，分别输出特征向量和。

（4）然后构造两个特征向量的距离度量作为两张图片的相似度计算函数，其中采用汉明距离来进行相似度计算。

Claims

1.一种深度学习并行化人脸识别方法，所述方法包括：

给定原始CASIA-Webface数据集，根据人脸特征点检测获得特征点和3D人脸模板合成不同姿态和外形的3D人脸，再将其投影变换成2D图像，得到人脸数据集，并对所述人脸数据集进行数据扩增；

指定一副人脸图像通过face_landmarks计算出特征点的坐标值，通过分解所包含的3D头部形状相对于图像的旋转矩阵，对不同的偏航角采样，为未知的视点创建新的旋转矩阵，把它渲染在固定的偏航值θ，偏航值θ分别设置为 0°、±40°、±75°，然后合成人脸图像；采用抗神经网络进行人脸图像去噪；

搭建基于深度学习框架Caffe的并行化平台CaffeOnSpark，将大数据平台Spark和深度学习框架Caffe相结合，用于并行化平台的数据处理。

2.根据权利要求1所述的方法，所述方法还包括：改进的残差网络，将残差网络改进成双路网络结构Siamese-ResNet，并在其中引入哈希层将人脸图像的特征映射为二进制哈希码来进行人脸验证；搭建所述Siamese-ResNet网络结构包括如下步骤：

（1）在ResNet-50中的数据层之后加一个slice层，该层负责把输入的人脸图像对按通道切分，这样在data层中只有一个图像，与之成对的图像在data_p中；

（2）然后在分类层前引入哈希层，将图像特征映射为二进制哈希码；

（3）通过卷积池化等操作，分别输出特征向量和；

3.根据权利要求1或2所述的方法，所述方法还包括：扩充人脸数据集，将扩充后的人脸数据集在CaffeOnSpark平台上进行处理，将其转化为LMDB文件，同时将文件存储在HDFS中，借助Spark的RDD特征，将数据快速分发到各个节点上进行预训练，生成caffemodel特征文件并得到人脸分类的结果。

4.根据权利要求3所述的方法，其中的人脸数据集在CaffeOnSpark平台上进行处理，包括如下步骤：

（1）获得含有249万张训练样本的图片数据集，并按照节点数量对模型进行分片并分发给各节点，总迭代次数设为t，t=50万；

（2）在每个计算节点分别将接受的数据输入网络模型中，得到输出；

（3）使用反向传播算法依次计算网络更新梯度和模型权重；

（4）收集各计算节点更新的模型权重并进行堆或加操作；

（5）将步骤（4）收集到的模型权重分片分发给各计算节点；