CN110516544A

CN110516544A - 基于深度学习的人脸识别方法、装置及计算机可读存储介质

Info

Publication number: CN110516544A
Application number: CN201910658687.0A
Authority: CN
Inventors: 黄秋凤; 李珊珊
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-07-19
Filing date: 2019-07-19
Publication date: 2019-11-29
Anticipated expiration: 2039-07-19
Also published as: CN110516544B; WO2021012494A1

Abstract

本发明涉及一种人工智能技术，揭露了一种基于深度学习的人脸识别方法，包括：基于爬虫技术从网页中获取人脸图像数据，组成原始人脸图像集，根据Gabor滤波器提取所述原始人脸图像集的人脸特征得到人脸特征集，根据下采样技术对所述人脸特征集进行降维处理形成人脸特征向量集，将所述人脸特征向量集输入至预先构建的卷积神经网络模型中训练，直至所述卷积神经网络内的损失函数值小于预设阈值时退出训练，接收用户人脸图片，并将所述用户人脸图片输入至所述卷积神经网络中进行人脸识别，并输出识别结果。本发明还提出一种基于深度学习的人脸识别装置以及一种计算机可读存储介质。本发明可以实现高效精准的人脸识别。

Description

基于深度学习的人脸识别方法、装置及计算机可读存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种基于Gabor滤波器与卷积神经网络的人脸识别方法、装置及计算机可读存储介质。

背景技术

人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。目前人脸识别技术主要用摄像机等摄像装备采集含有人脸的图像或视频流，并自动在图像中检测人脸，进而对检测到的人脸进行脸部识别的一系列相关操作。人脸识别的过程就是对标准的人脸图像进行特征提取和对特征进行识别的过程。因此所提取到的人脸图像特征的质量直接影响着最终的识别准确率，同时识别模型对人脸识别准确率也起到至关重要的影响。但目前多数的特征提取主要靠人工提取特征，该方法受很多因素的制约，且目前识别模型都基于传统机器学习算法，因此总体来说，人脸识别效果不理想、识别精度不高。

发明内容

本发明提供一种基于深度学习的人脸识别方法、装置及计算机可读存储介质，其主要目的在于当用户输入人脸图片或视频时，从所述人脸图片或视频中精准的识别出人脸结果。

为实现上述目的，本发明提供的一种基于深度学习的人脸识别方法，包括：

基于爬虫技术从网页中获取人脸图像数据，组成原始人脸图像集；

根据Gabor滤波器提取所述原始人脸图像集的人脸特征得到人脸特征集，根据下采样技术对所述人脸特征集进行降维处理形成人脸特征向量集；

将所述人脸特征向量集输入至预先构建的卷积神经网络模型中训练，直至所述卷积神经网络内的损失函数值小于预设阈值时退出训练；

接收用户人脸图片，并将所述用户人脸图片输入至所述卷积神经网络中进行人脸识别，并输出识别结果。

可选地，所述网页包括ORL人脸数据库、Yale人脸数据库、AR人脸数据库、和/或FERET人脸数据库的网页。

可选地，所述根据Gabor滤波器提取所述原始人脸图像集的人脸特征得到人脸特征集，包括：

由若干个Gabor滤波器组成的Gabor滤波器组接收所述原始人脸图像集；

所述Gabor滤波器组依次与所述原始人脸图像集内的图片做第一卷积操作得到Gabor特征；

将每次第一卷积操作得到的Gabor特征组成集合得到所述人脸特征集。

可选地，所述第一卷积操作为：

O_y,u,v(x₁,x₂)＝M(x₁,x₂)*φ_y,u,v(z)

其中，O_y,u,v(x₁,x₂)为所述Gabor特征，M(x₁,x₂)为所述原始人脸图像集内的图片的像素值坐标，φ_y,u,v(z)为卷积函数，z为卷积算子，y,u,v代表图片的三个分量，其中y为图片明亮度、u,v为图片的色度。

可选地，所述卷积神经网络包括十六层卷积层、十六层池化层和一层全连接层；以及所述将所述人脸特征向量集输入至预先构建的卷积神经网络模型中训练，直至所述卷积神经网络内的损失函数值小于预设阈值时退出训练，包括：

所述卷积神经网络接收所述人脸特征向量集后，将所述人脸特征向量集输入至所述十六层卷积层和十六层池化层进行第二卷积操作和最大池化操作后输入至全连接层；

所述全连接层结合激活函数计算得到训练值，将所述训练值输入至所述模型训练层的损失函数中，所述损失函数计算出损失值，判断所述损失值与预设阈值的大小关系，直至所述损失值小于所述预设阈值时，所述卷积神经网络退出训练。

此外，为实现上述目的，本发明还提供一种基于深度学习的人脸识别装置，该装置包括存储器和处理器，所述存储器中存储有可在所述处理器上运行的基于深度学习的人脸识别程序，所述基于深度学习的人脸识别程序被所述处理器执行时实现如下步骤：

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有基于深度学习的人脸识别程序，所述基于深度学习的人脸识别程序可被一个或者多个处理器执行，以实现如上所述的基于深度学习的人脸识别方法的步骤。

本发明提出的基于深度学习的人脸识别方法、装置及计算机可读存储介质，采用爬虫技术可从网上采取到大量高质量的人脸数据集，为后续人脸特征的分析及识别做好了前置基础，同时由于多数人脸不会占据整张图片或视频，因此根据Gabor滤波器的形状，从整张图片或视频中抽取人脸部分的特征，不仅减少手工提取特征带来的繁琐，同时更为后续卷积神经网络分析人脸特征做好充足准备，所述卷积神经网络可有效分析人脸特征并产生精准的人脸识别效果。因此，本发明可实现高效精准的人脸识别效果。

附图说明

图1为本发明一实施例提供的基于深度学习的人脸识别方法的流程示意图；

图2为本发明一实施例提供的基于深度学习的人脸识别方法的Gabor特征生成图；

图3为本发明一实施例提供的基于深度学习的人脸识别装置的内部结构示意图；

图4为本发明一实施例提供的基于深度学习的人脸识别装置中基于深度学习的人脸识别程序的模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明提供一种基于深度学习的人脸识别方法。参照图1所示，为本发明一实施例提供的基于深度学习的人脸识别方法的流程示意图。该方法可以由一个装置执行，该装置可以由软件和/或硬件实现。

在本实施例中，基于深度学习的人脸识别方法包括：

S1、基于爬虫技术从网页，如若干个人脸图像数据库的网页中获取人脸图像数据，组成原始人脸图像集。

所述若干个人脸图像数据库包括ORL人脸数据库、Yale人脸数据库、AR人脸数据库、和/或FERET人脸数据库等。其中，所述Yale人脸数据库包括15人，其中每人11张照片，每张照片都有光照条件的变化、表情的变化等；所述FERET人脸库是美国国防部的Counterdrug Technology Transfer Program(CTTP)为了促进人脸识别技术的进一步优化，发起的人脸识别技术(Face Recognition Technology，简称FERET)的人脸库收集活动，所述FERET人脸库包括通用人脸库以及通用测试标准。同一人脸图片包括不同表情，光照，姿态和年龄段的图片。

较佳地，本发明运用python的Urllib模块读取web页面数据，如读取FERET人脸库的网页，并对所述FERET人脸数据库的网页中的人脸图像数据进行抓取，并将这些数据组成原始人脸图像集，同理所述Urllib模块读取Yale人脸数据库、AR人脸数据库等网页，并进行人脸图像数据抓取后放至所述原始人脸图像集。

S2、根据Gabor滤波器提取所述原始人脸图像集的人脸特征得到人脸特征集，根据下采样技术对所述人脸特征集进行降维处理形成人脸特征向量集。

优选地，本发明将若干个Gabor滤波器组成Gabor滤波器组，所述Gabor滤波器组接收所述原始人脸图像集后，所述Gabor滤波器组依次与所述原始人脸图像集内的图片做第一卷积操作得到Gabor特征，将每次第一卷积操作得到的Gabor特征组成集合得到所述人脸特征集。

进一步地，所述第一卷积操作为：

O_y,u,v(x₁,x₂)＝M(x₁,x₂)*φ_y,u,v(z)

本发明较佳实施例选用40个Gabor滤波器组成Gabor滤波器组，如所述40个Gabor滤波器组成Gabor滤波器组读取所述原始人脸图像集的一个图像，将其与所述Gabor滤波器组进行第一卷积操作后得到Gabor特征，每个Gabor特征的特征维数为40，以此类推Gabor特征组成了所述人脸特征集。原始人脸图像到Gabor特征的变化如附图2所示。

优选地，所述下采样技术降维处理包括第一次特征降维和第二次特征降维。所述第一次特征降维是依次从所述人脸特征集中提取Gabor特征，并基于一个矩阵维度为2*2的滑动窗口从左到右、从上到下依次在所述提取出的Gabor特征上进行步长为2的平均值采样，由此所述提取出的Gabor特征的特征维数降至原先维度的1/4，特征维度变为10，完成所述第一次特征降维。

可选地，Gabor特征的特征维数降至原先维度的1/4后再接RBM模型进行所述第二次特征降维，所述RBM是一个能量模型(Energy based model,EBM)，是从物理学能量模型中演变而来，所述RBM模型接收输入数据后根据能量函数求解所述输入数据的概率分布，基于所述概率分布求解最优化后得到输出数据。具体地，所述第二次特征降维将所述第一次特征降维后的人脸特征集作为所述RBM模型的输入数据，较佳地，所述RBM模型的输出特征的特征维度为5，综合来说，降维处理将Gabor特征的特征维度从40降至5，以此类推处理每个Gabor特征并最终将输出的降维特征组成人脸特征向量集。

S3、将所述人脸特征向量集输入至预先构建的卷积神经网络模型中训练，直至所述卷积神经网络内的损失函数值小于预设阈值时退出训练。

较佳地，所述预先构建的卷积神经网络包括十六层卷积层、十六层池化层和一层全连接层，所述卷积神经网络接收所述人脸特征向量集后，将所述人脸特征向量集输入至所述十六层卷积层和十六层池化层进行第二卷积操作和最大池化操作后输入至全连接层；

进一步地，所述全连接层结合激活函数计算得到训练值，将所述训练值输入至所述模型训练层的损失函数中，所述损失函数计算出损失值，判断所述损失值与预设阈值的大小关系，直至所述损失值小于所述预设阈值时，所述卷积神经网络退出训练。

本发明较佳实施例所述第二卷积操作为：

其中ω’为输出数据，ω为输入数据，k为卷积核的大小，s为所述卷积操作的步幅，p为数据补零矩阵，所述最大池化操作是在矩阵内选择矩阵数据中数值最大的值代替整个矩阵；

所述激活函数为：

其中y为所述训练值，e为无限不循环小数。

本发明较佳实施例所述损失值T为：

其中，n为所述原始图片集大小，y_t为所述训练值，μ_t为所述原始图片集，所述预设阈值一般设置在0.01。

S4、接收用户人脸图片，并将所述用户人脸图片输入至所述卷积神经网络中进行人脸识别，并输出识别结果。

发明还提供一种基于深度学习的人脸识别装置。参照图3所示，为本发明一实施例提供的基于深度学习的人脸识别装置的内部结构示意图。

在本实施例中，所述基于深度学习的人脸识别装置1可以是PC(PersonalComputer，个人电脑)，或者是智能手机、平板电脑、便携计算机等终端设备，也可以是一种服务器等。该基于深度学习的人脸识别装置1至少包括存储器11、处理器12，通信总线13，以及网络接口14。

其中，存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是基于深度学习的人脸识别装置1的内部存储单元，例如该基于深度学习的人脸识别装置1的硬盘。存储器11在另一些实施例中也可以是基于深度学习的人脸识别装置1的外部存储设备，例如基于深度学习的人脸识别装置1上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(FlashCard)等。进一步地，存储器11还可以既包括基于深度学习的人脸识别装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于基于深度学习的人脸识别装置1的应用软件及各类数据，例如基于深度学习的人脸识别程序01的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行基于深度学习的人脸识别程序01等。

通信总线13用于实现这些组件之间的连接通信。

网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该装置1与其他电子设备之间建立通信连接。

可选地，该装置1还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在基于深度学习的人脸识别装置1中处理的信息以及用于显示可视化的用户界面。

图3仅示出了具有组件11-14以及基于深度学习的人脸识别程序01的基于深度学习的人脸识别装置1，本领域技术人员可以理解的是，图3示出的结构并不构成对基于深度学习的人脸识别装置1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

在图3所示的装置1实施例中，存储器11中存储有基于深度学习的人脸识别程序01；处理器12执行存储器11中存储的基于深度学习的人脸识别程序01时实现如下步骤：

进一步地，所述第一卷积操作为：

O_y,u,v(x₁,x₂)＝M(x₁,x₂)*φ_y,u,v(z)

本发明较佳实施例所述第二卷积操作为：

所述激活函数为：

其中y为所述训练值，e为无限不循环小数。

本发明较佳实施例所述损失值T为：

可选地，在其他实施例中，基于深度学习的人脸识别程序还可以被分割为一个或者多个模块，一个或者多个模块被存储于存储器11中，并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明，本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段，用于描述基于深度学习的人脸识别程序在基于深度学习的人脸识别装置中的执行过程。

例如，参照图4所示，为本发明基于深度学习的人脸识别装置一实施例中的基于深度学习的人脸识别程序的程序模块示意图，该实施例中，所述基于深度学习的人脸识别程序可以被分割为源数据接收模块10、特征提取模块20、模型训练模块30以及人脸识别结果输出模块40，示例性地：

所述源数据接收模块10用于：基于爬虫技术从网页中获取人脸图像数据，组成原始人脸图像集。

所述特征提取模块20用于：根据Gabor滤波器提取所述原始人脸图像集的人脸特征得到人脸特征集，根据下采样技术对所述人脸特征集进行降维处理形成人脸特征向量集。

所述模型训练模块30用于：将所述人脸特征向量集输入至预先构建的卷积神经网络模型中训练，直至所述卷积神经网络内的损失函数值小于预设阈值时退出训练。

所述人脸识别结果输出模块40用于：接收用户人脸图片，并将所述用户人脸图片输入至所述卷积神经网络中进行人脸识别，并输出识别结果。

上述源数据接收模块10、特征提取模块20、模型训练模块30以及人脸识别结果输出模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同，在此不再赘述。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有基于深度学习的人脸识别程序，所述基于深度学习的人脸识别程序可被一个或多个处理器执行，以实现如下操作：

本发明计算机可读存储介质具体实施方式与上述基于深度学习的人脸识别装置和方法各实施例基本相同，在此不作累述。

需要说明的是，上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于深度学习的人脸识别方法，其特征在于，所述方法包括：

2.如权利要求1所述的基于深度学习的人脸识别方法，其特征在于，所述网页包括ORL人脸数据库、Yale人脸数据库、AR人脸数据库、和/或FERET人脸数据库的网页。

3.如权利要求1或2所述的基于深度学习的人脸识别方法，其特征在于，所述根据Gabor滤波器提取所述原始人脸图像集的人脸特征得到人脸特征集，包括：

4.如权利要求3所述的基于深度学习的人脸识别方法，其特征在于，所述第一卷积操作为：

O_y,u,v(x₁,x₂)＝M(x₁,x₂)*φ_y,u,v(z)

5.如权利要求4所述的基于深度学习的人脸识别方法，其特征在于，所述卷积神经网络包括十六层卷积层、十六层池化层和一层全连接层；以及所述将所述人脸特征向量集输入至预先构建的卷积神经网络模型中训练，直至所述卷积神经网络内的损失函数值小于预设阈值时退出训练，包括：

6.一种基于深度学习的人脸识别装置，其特征在于，所述装置包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的基于深度学习的人脸识别程序，所述基于深度学习的人脸识别程序被所述处理器执行时实现如下步骤：

7.如权利要求7所述的基于深度学习的人脸识别装置，其特征在于，所述网页包括ORL人脸数据库、Yale人脸数据库、AR人脸数据库、和/或FERET人脸数据库的网页。

8.如权利要求6或7所述的基于深度学习的人脸识别装置，其特征在于，其特征在于，所述根据Gabor滤波器提取所述原始人脸图像集的人脸特征得到人脸特征集，包括：

9.如权利要求8所述的基于深度学习的人脸识别装置，其特征在于，所述第一卷积操作为：

O_y,u,v(x₁,x₂)＝M(x₁,x₂)*φ_y,u,v(z)

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有基于深度学习的人脸识别程序，所述基于深度学习的人脸识别程序可被一个或者多个处理器执行，以实现如权利要求1至5中任一项所述的基于深度学习的人脸识别方法的步骤。