CN107609459B - 一种基于深度学习的人脸识别方法及装置 - Google Patents
一种基于深度学习的人脸识别方法及装置 Download PDFInfo
- Publication number
- CN107609459B CN107609459B CN201611158851.4A CN201611158851A CN107609459B CN 107609459 B CN107609459 B CN 107609459B CN 201611158851 A CN201611158851 A CN 201611158851A CN 107609459 B CN107609459 B CN 107609459B
- Authority
- CN
- China
- Prior art keywords
- face
- images
- image
- neural network
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明适用于人脸识别技术领域,提供了基于深度学习的人脸识别方法及装置,包括:构建基于人脸训练图像的深度神经网络;获取待识别图像;检测待识别图像中的人脸区域并将其提取出来;将人脸区域图像转化为标准正面人脸图像后,输入至深度神经网络;利用深度神经网络,输出标准正面人脸图像的表达向量;将表达向量与人脸库中的每个人脸描述特征进行比对,以获取待识别图像的人脸身份。在本发明中,由于使用了多张人脸训练图像作为监督信息来建立深度神经网络,且每张图像的人物特征都是基于深度神经网络来提取,因此能学习并使用到鲁棒性更强的人物特征,相比于传统的人脸识别方法,人脸识别效果更好,在复杂环境条件下,能拥有更强的抗干扰能力。
Description
技术领域
本发明属于人脸识别技术领域,尤其涉及一种基于深度学习的人脸识别方法及装置。
背景技术
随着视频监控的快速普及,众多视频监控的应用迫切需要一种能用于远距离、用户非配合状态下的快速身份识别技术,以求远距离快速确认人员身份,实现智能预警。因此,不断发展起来的人脸识别技术在该过程中发挥了主要的作用。人脸识别技术是基于人的脸部特征,对输入的人脸图像或者视频流进行处理,以识别每个人脸的身份的技术。主要的人脸识别方法包括以下步骤:提取图像中每个人脸所蕴涵的身份特征,将其与已知的人脸进行匹配对比,从而达到识别每个人脸的身份的效果。
目前,提取每个人脸中所蕴涵的身份特征主要是通过基于手工设计的特征提取算法来在实现。而在实际复杂环境中,人脸数据往往存在着各种因素的影响,例如光照、遮挡、姿态变化等,在这种情况下,现有基于手工设计特征提取算法的人脸识别方法具有较差的鲁棒性,对上述影响因素的抗干扰能力较差,而这些不可控制的因素使得基于现有方法的人脸识别性能急剧下降,难以保证人脸识别的效果,存在人脸识别准确率低的问题。
发明内容
有鉴于此,本发明实施例提供了一种基于深度学习的人脸识别方法及系统,以解决现有技术对人脸数据中的复杂环境因素抗干扰能力差以及具备较低鲁棒性的问题。
第一方面,提供了一种基于深度学习的人脸识别方法,包括:
构建并训练基于人脸训练图像的深度神经网络;
获取待识别图像;
检测所述待识别图像中人脸区域的位置并将所述人脸区域提取出来;
将所述人脸区域图像转化为标准正面人脸图像后,输入至所述深度神经网络;
利用所述深度神经网络,输出所述标准正面人脸图像的表达向量,所述表达向量描述了所述待识别图像的人脸特征;
将所述表达向量与人脸库中的每个人脸描述特征进行比对,以获取所述待识别图像的人脸身份。
第二方面,提供了一种基于深度学习的人脸识别装置,包括:
训练单元,用于构建并训练基于人脸训练图像的深度神经网络;
获取单元,用于获取待识别图像;
检测单元,用于检测所述待识别图像中人脸区域的位置并将所述人脸区域提取出来;
转化单元,用于将所述人脸区域图像转化为标准正面人脸图像后,输入至所述深度神经网络;
输出单元,用于利用所述深度神经网络,输出所述标准正面人脸图像的表达向量,所述表达向量描述了所述待识别图像的人脸特征;
识别单元,用于将所述表达向量与人脸库中的每个人脸描述特征进行比对,以获取所述待识别图像的人脸身份。
在本发明实施例中,通过将待识别图像调整为标准正面图像,再与已知人物身份的图像进行逐一对比,能够加大人脸识别的准确度。由于使用了多张人脸训练图像作为监督信息的来源以建立深度神经网络,且每张图像的人物特征都是基于深度神经网络来提取,因此能够学习并使用到鲁棒性更强的人物特征,相比于传统的人脸识别方法,人脸识别的效果更好,在复杂环境条件下,能拥有更强的抗干扰能力。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于深度学习的人脸识别方法的实现流程图;
图2是本发明实施例提供的基于深度学习的人脸识别方法S103的具体实现流程图;
图3是本发明实施例提供的基于深度学习的人脸识别方法S104的具体实现流程图;
图4是本发明实施例提供的基于深度学习的人脸识别方法S105的具体实现流程图;
图5是本发明实施例提供的基于深度学习的人脸识别方法S101的具体实现流程图;
图6是本发明实施例提供的基于深度学习的人脸识别装置的结构框图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
本发明实施例基于深度神经网络来实现,对神经网络模型的训练依靠人物训练图像的人物特征来对模型的参数进行估计及优化调整,以相同的神经网络模型来处理不同的图像,待识别图像依次通过各级深度神经网络,获得图像的特征表达向量后,将表达向量与多个人像库中记录的人脸描述特征进行对比,将不符合匹配条件的人物图像淘汰,最终,接受符合匹配条件的人物图像对应的人物身份作为人脸识别的结果。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本发明实施例提供的基于深度学习的人脸识别方法的实现流程,详述如下:
在S101中,构建并训练基于人脸训练图像的深度神经网络。
所述人脸训练图像包含但不限于不同人脸朝向、不同遮挡物以及不同光照条件下的多张人脸图像。
在本实施例中,通过收集各种条件下的人脸训练图像或输入数量足够多的人脸训练图像来建立深度神经网络模型,该人物训练图像为已知人物身份信息的具有标记的图像样本,用于调整深度神经网络模型的参数,使该模型能够基于监督学习,在实际应用中达到所要求的识别性能。
在S102中,获取待识别图像。
待识别图像可以为一副或多副人脸图像,甚至可以是从视频流中截取出来的图像画面或根据客观描述拼接、绘制出来的人脸图画。所述待识别图像预先输入并存储于人脸识别装置的系统中。
在本实施例中,利用OpenCV(Open Source Computer Vision Library,开源计算机视觉库)读取所述系统中存储的待识别图像。
在S103中,检测所述待识别图像中人脸区域的位置并将所述人脸区域提取出来。
在待识别图像中,由于存在各种动物、物品或其他背景元素的干扰,需要先对图像中的人脸区域进行检测,确认是否存在待检测的人脸目标,并将存在待识别图像中的人脸目标位置记录下来。
作为本发明的一个实施例,图2示出了本发明实施例提供的基于深度学习的人脸识别方法S103的具体实现流程,详述如下:
在S201中,对所述待识别图像进行预处理。
在本实施例中,对所述待识别图像进行预处理可以包括:对待识别图像进行灰度化处理或者进行高斯模糊处理。若选用高斯模糊,则应当附加图像锐化处理,以突出待识别图像中的边界条纹细节,使深度神经网络模型能够从中提取出更具有判定性的人物识别特征。
在本实施例中,预处理方式优选为灰度化处理,该处理可以通过直方图、灰度变化或正交变换的方式来实现。
在S202中,通过预先加载的Haar人脸检测模型,对所述预处理后的待识别图像进行人脸区域的定位。
Haar(Haar-like)人脸检测模型通过对待识别图像中的Haar特征进行计算,以确认当前图像中是否存在人脸,该过程基于OpenCV中的HaarCascades目标检测框架来自动完成。
当前,Haar特征分为四类:边缘特征、线性特征、中心特征和对角线特征。四类Haar特征组合成为特征模板。特征模板内有白色和黑色两种矩形,该模板的Haar特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值反映了待识别图像的灰度变化情况,通过以Haar特征值来量化人脸特征,可实现人脸和非人脸区域的区分。
由于Haar特征模板子窗口在待识别图片中不断地进行移位及滑动,因此,子窗口每到一个位置,就会通过计算出该区域的Haar特征。通过利用预先训练好的级联分类器对该Haar特征进行筛选,一旦该特征通过了所有分类器的筛选,则判定该区域为人脸。
经过上述检测,能够定位出待识别图像中的人脸区域。
此外,还可以通过使用基于OpenCV的脸部标记检测器(face landmark detector)对待识别图像进行人脸检测,该检测器从预先标记好脸部关键点的多张人脸图像中训练获得。
在S203中,根据所述人脸区域的定位,在所述待识别图像中将所述人脸区域提取出来。
当检测到人脸区域后,将人脸区域所处在待识别图像中的位置信息记录下来,如该人脸区域左上角的坐标以及人脸区域的宽度和高度等。根据记录的区域起止点或区域大小信息,能够单独从待识别图像中将人脸区域提取出来。
在本实施例中,由于目前彩色图像基本都采用RGB颜色模式,而RGB并不能真实反映图像的形态特征,因此为了减少提取图像Haar特征的时间,提高图像处理的效率,将待识别图像经过灰度化等预处理,转换为8位的灰度值图像。通过对图像的Haar特征进行计算,能够检测出人脸区域位置,将包含干扰因素的非人脸区域淘汰,能够提高后续图像处理的速度与精确度。
在S104中,将所述人脸区域图像转化为标准正面人脸图像后,输入至所述深度神经网络。
由于大部分情况下,图像中的人脸朝向会存在一定的角度倾斜,朝向太偏的人脸图像会提高后续算法的识别难度,因此,在本实施例中,将待识别图像中的人脸区域图像进行校正,以方便后续模型对其进行处理。
作为本发明的一个实施例,图3示出了本发明实施例提供的基于深度学习的人脸识别方法S104的具体实现流程,详述如下:
在S301中,标记所述人脸区域图像中的关键点位置。
对人脸区域中的关键点进行检测,将满足关键点特征的位置标记出来。所述关键点包括但不限于左瞳孔,右瞳孔,左眉毛,右眉毛,鼻子左侧,鼻孔下侧,上嘴唇下侧,嘴角和脸颊等具体人脸器官点。
在S302中,通过仿射变换函数校准所述关键点位置,输出校准人脸图像。
对于所述每个关键点位置,仿射变换的功能是实现关键点二维坐标到二维坐标之间的线性变换,且保持待识别图像的“平直性”和“平行性”。通过一系列的原子变换的复合来实现,包括但不限于平移,缩放,翻转,旋转和剪切等操作。
经仿射变换函数处理后的关键点原坐标(x,y)变为了新坐标(x',y'),各个关键点新坐标的集合,实现了将人脸区域中的倾斜人脸转换为人脸正对图片观察者的校准人脸图像。
在S303中,将所述校准人脸图像缩放至预设尺寸,以获得所述标准正面人脸图像。
在本实施例中,将所述校准人脸图像放大至预设尺寸,能够保留待识别图像中的更多人脸细节特征,从而使得人脸识别效果更为准确;将所述校准人脸图像缩小至预设尺寸,能够加快人脸识别的速度,减少处理过程中的运算量。因此,根据实际需求获取预设尺寸,满足预设尺寸的校准人脸图像为所述标准正面人脸图像。
通过发明人的实验发现,预设尺寸优选为96x96。该尺寸能够将人脸完整并且清晰地展现出来,且能够较好地平衡图像后续处理的速度及精度。
在S105中,利用所述深度神经网络,输出所述标准正面人脸图像的表达向量,所述表达向量描述了所述待识别图像的人脸特征。
该深度神经网络包含了多个层,不同层的作用有所差异。在本实施例中,该网络为基于GoogLeNet的深度神经网络,网络结构如表1所示:
表1
在表1中,layer列表示深度神经网络中每个层的名称,其中,Conv表示卷积层,Pool表示池化层,Rnorm1表示正则化层,Fc1表示全连接层,每层名称后面的数字表示该层的序号,例如,Conv1表示第一层卷积层;Layer-in表示对应的每个神经网络层的图像输入维度,如“220_220_3”表示输入的图像宽为220,高为220,输入的频道数为3;Layer-out表示对应的每个神经网络层的图像特征输出维度;Kernel表示对应的每个神经网络层所用的过滤器,如“7_7_3,2”表示过滤器的宽为7,高为7,输入的频道数为3,2表示该过滤器在输入的图像中每次滑动的步长;L2表示对连接的网络层权值进行第二范式规约化,以防止神经网络模型的过拟合;FLPS表示每秒所执行的浮点运算次数,如“115M”表示每秒115百万次浮点运算。其中,频道数表示图像的数量。
可以理解的是,在实际应用的网络结构中,可以包含其他数量的层次结构。
在本实施例中,通过将标准正面人脸图像输入所述深度神经网络,经过深度网络模型的最后一个完全连接层,能够输出该待识别图像的人脸描述特征,并通过表达向量来表示。由于该网络层有128个神经元,能够产生128个输出,因此所述人脸描述特征为一个128维的向量。
所述表达向量获取后,对其进行L2归一化,即以向量中每个元素除以向量的L2范数。
归一化后向量的元素值波动范围变得相对稳定,不会因为某些元素值较小或较大而对神经网络模型的训练造成干扰。
在S106中,将所述表达向量与人脸库中的每个人脸描述特征进行比对,以获取所述待识别图像的人脸身份。
由于表达向量表示待识别图像的人脸描述特征,因此可以将人脸库中的多个人脸图像的人脸描述特征与所述表达向量进行比对,满足对比条件的人脸库图像为待识别图像的人脸识别结果。根据特征比对规则,还能够筛选出与待识别图像匹配度最高的多个候选人物身份。
作为本发明的另一个实施例,图4示出了本发明实施例提供的基于深度学习的人脸识别方法S105的具体实现流程,详述如下:
S401,在获取人脸库中的每一张人脸对比图像。
S402,对于所述每一张人脸对比图像,检测所述人脸对比图像中人脸区域的位置,并将所述人脸区域提取出来作为第二图像。
S403,将所述每张第二图像分别转化为标准正面人脸图像后,输入至所述深度神经网络。
S404,根据所述每张标准正面人脸图像,利用所述深度神经网络,提取所述每张人脸对比图像的人脸描述特征。
对于上述实施例S102至S105中所述的内容,在本实施例的S401至S404中也同样适用,区别在于本实施例中处理的原始图像为多张人脸对比图像,S102至S105中处理的原始图像为待识别图像,其余实现原理均相同,在此不一一赘述。
S405,分别计算所述表达向量与所述每张人脸对比图像中所述人脸描述特征的特征距离。
每张人脸对比图像中的人脸描述特征同样可以使用一个特征向量来表示,该特征向量与所述待识别图像的表达向量的特征距离通过以下方式求出:
将两个向量相减求出差值向量;
计算所述差值向量中的每个元素值的平方和,输出为特征向量与表达向量的特征距离。
其中,每个元素对应128-D向量中的一个维度特征值。
S406,获取所述特征距离小于预设阈值的所述人脸对比图像,所述人脸对比图像对应的人脸身份输出为所述待识别图像的人脸身份。
上述每个特征距离与预设阈值进行对比的过程属于一个二分类问题,即,判断特征距离对应的人脸对比图像是匹配该待识别图像或者不匹配该待识别图像。
在本实施例中,设置预设阈值作为人脸识别的匹配条件,当特征距离小于或等于预设阈值时,所述特征距离对应的人脸对比图像即被视为与待识别图像匹配,该待识别图像中人脸的身份则得到了确认,为所述人脸对比图像中注册的人脸身份。
作为本发明的另一个实施例,上述预设阈值优选为1.05,是一个具有人脸判定性的阈值。
在本发明实施例中,通过将待识别图像调整为标准正面图像,再与已知人物身份的图像进行逐一对比,能够加大人脸识别的准确度。由于使用了多张人脸训练图像作为监督信息的来源以建立深度神经网络,且每张图像的人物特征都是基于深度神经网络来提取,因此能够学习并使用到鲁棒性更强的人物特征,相比于传统的人脸识别方法,人脸识别的效果更好,在复杂环境条件下,能拥有更强的抗干扰能力。
作为本发明的另一个实施例,对于深度神经网络结构的训练可以使用随机梯度下降的优化方法。其中,模型的势能项设置为0.9,学习率固定为0.01,每6个训练次数(epochs)减少25%,分类任务使用交叉实体损失(Cross-entity Loss)函数。
具体地,如图5所示:
在S501中,利用开源的预训练模型初始化所述深度神经网络。
在本实施例中,采用Caffe开源的预训练模型初始化深度神经网络的起始模型状态。
在S502中,将多种类型的多张人脸训练图像输入所述深度神经网络。
使用多张人脸训练图像作为训练样本的人脸数据,所述不同类型的图像包含姿态,光照,遮挡、人等较多影响因素。
在S503中,根据所述每张人脸训练图像的特征,使用异步随机梯度下降算法学习所述深度神经网络的特征提取参数。
在S504中,根据所述特征提取参数,使用交叉实体损失函数计算所述深度神经网络的特征提取效果值。
在S505中,令所述深度神经网络迭代学习所述特征提取参数,直至所述特征提取效果值满足预设优化目标。
为了使得属于同一身份人的人脸训练图像的特征距离尽可能小,属于不同身份人的人脸训练图像的特征距离尽可能大,在本实施例中,以三张人脸训练图像构成一个三元组,表述为(Anchor,Positive,Negative)。其中,Anchor人脸训练图像与Positive人脸训练图像属于同一个身份人,Anchor人脸训练图像与Negative人脸训练图像属于不同的身份人。在交叉实体损失函数的指导下,神经网络模型会逐渐学习到提取如下性质的人脸特征:Anchor人脸训练图像与Positive人脸训练图像的特征距离总小于Anchor人脸训练图像与Negative人脸训练图像的特征距离。
假设第i个三元组为tuple i(Anchori,Positivei,Negativei),从该三元组中提取出的每张人脸训练图像的人脸描述特征分别为:(Pi Anchor,Pi Positive,Pi Negative),则深度神经网络的特征提取参数优化的目标如下:
T为所有三元组人脸训练图像构成的集合。因此,若Cross-entity Loss为L,以L来表示特征提取效果,则L的表达式如下:
其中,δ设置为0.5,i为三元组的索引下标,K为训练三元组的总数。
本实施例中,在对深度神经网络训练时,利用多张人脸训练图像的监督信息(包括人脸关键点的位置、人脸的属性等)对所述神经网络进行训练,有助于增强人脸特征提取任务的学习。损失函数值越小,从图像中提取出的人物描述特征越具有判定性,模型优化的程度越高,有利于提高人脸识别方法的鲁棒性和对复杂情况的处理能力。由于整个过程中模型的参数是随着人物训练图像的输入而不断发生动态的变化,能够实现自适应的参数调整,因此,通过本方法能够得到更好的深度神经网络训练效果。
本发明实施例通过将待识别图像调整为标准正面图像,再与已知人物身份的图像进行逐一对比,能够加大人脸识别的准确度。由于使用了多张人脸训练图像作为监督信息的来源来建立深度神经网络,且每张图像的人物特征都是基于深度神经网络来提取,因此能够学习并使用到鲁棒性更强的人物特征,相比于传统的人脸识别方法,人脸识别的效果更好,在复杂环境条件下,能拥有更强的抗干扰能力。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的基于深度学习的人脸识别方法,图6示出了本发明实施例提供的基于深度学习的人脸识别装置的结构框图,所述人脸识别装置可以是软件单元、硬件单元或者是软硬结合的单元。为了便于说明,仅示出了与本实施例相关的部分。
参照图6,该装置包括:
训练单元61,用于构建并训练基于人脸训练图像的深度神经网络。
获取单元62,用于获取待识别图像。
检测单元63,用于检测所述待识别图像中人脸区域的位置并将所述人脸区域提取出来。
转化单元64,用于将所述人脸区域图像转化为标准正面人脸图像后,输入至所述深度神经网络。
输出单元65,用于利用所述深度神经网络,输出所述标准正面人脸图像的表达向量,所述表达向量描述了所述待识别图像的人脸特征。
识别单元66,用于将所述表达向量与人脸库中的每个人脸描述特征进行比对,以获取所述待识别图像的人脸身份。
可选地,所述检测单元63包括:
预处理子单元,用于对所述待识别图像进行预处理。
定位子单元,用于通过预先加载的Haar人脸检测模型,对所述预处理后的待识别图像进行人脸区域的定位。
提取子单元,用于根据所述人脸区域的定位,在所述待识别图像中将所述人脸区域提取出来。
可选地,所述转化单元64包括:
标记子单元,用于标记所述人脸区域图像中的关键点位置。
校准子单元,用于通过仿射变换函数校准所述关键点位置,输出校准人脸图像。
缩放子单元,用于将所述校准人脸图像缩放至预设尺寸,以获得所述标准正面人脸图像。
可选地,所述训练单元61包括:
初始化子单元,用于利用开源的预训练模型初始化所述深度神经网络。
输入子单元,用于将多种类型的多张人脸训练图像输入所述深度神经网络。
学习子单元,用于根据所述每张人脸训练图像的特征,使用异步随机梯度下降算法学习所述深度神经网络的特征提取参数。
计算子单元,用于根据所述特征提取参数,使用交叉实体损失函数计算所述深度神经网络的特征提取效果值。
迭代子单元,用于令所述深度神经网络迭代学习所述特征提取参数,直至所述特征提取效果值满足预设优化目标。
可选地,所述识别单元66包括:
第二获取单元,用于获取人脸库中的每一张人脸对比图像。
第二检测单元,用于对于所述每一张人脸对比图像,检测所述人脸对比图像中人脸区域的位置,并将所述人脸区域提取出来作为第二图像。
第二转化单元,用于将所述每张第二图像分别转化为标准正面人脸图像后,输入至所述深度神经网络。
提取单元,用于根据所述每张标准正面人脸图像,利用所述深度神经网络,提取所述每张人脸对比图像的人脸描述特征。
计算单元,用于分别计算所述表达向量与所述每张人脸对比图像中所述人脸描述特征的特征距离。
对比单元,用于获取所述特征距离小于预设阈值的所述人脸对比图像,所述人脸对比图像对应的人脸身份输出为所述待识别图像的人脸身份。
在本发明实施例中,通过将待识别图像调整为标准正面图像,再与已知人物身份的图像进行逐一对比,能够加大人脸识别的准确度。由于使用了多张人脸训练图像作为监督信息的来源来建立深度神经网络,且每张图像的人物特征都是基于深度神经网络来提取,因此能够学习并使用到鲁棒性更强的人物特征,相比于传统的人脸识别方法,人脸识别的效果更好,在复杂环境条件下,能拥有更强的抗干扰能力。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明实施例各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于深度学习的人脸识别方法,其特征在于,包括:
构建并训练基于人脸训练图像的深度神经网络,包括:
利用开源的预训练模型初始化所述深度神经网络;
将多种类型的多张人脸训练图像输入所述深度神经网络;
根据每张人脸训练图像的特征,使用异步随机梯度下降算法学习所述深度神经网络的特征提取参数,包括以三张人脸训练图像构成一个三元组,表述为(Anchor,Positive,Negative),其中,Anchor人脸训练图像与Positive人脸训练图像属于同一个身份人,Anchor人脸训练图像与Negative人脸训练图像属于不同的身份人;
根据所述特征提取参数,使用交叉实体损失函数计算所述深度神经网络的特征提取效果值;
令所述深度神经网络迭代学习所述特征提取参数,直至所述特征提取效果值满足预设优化目标;
获取待识别图像;
检测所述待识别图像中人脸区域的位置并将所述人脸区域提取出来;
将所述人脸区域图像转化为标准正面人脸图像后,输入至所述深度神经网络;
利用所述深度神经网络,输出所述标准正面人脸图像的表达向量,所述表达向量描述了所述待识别图像的人脸特征;
将所述表达向量与人脸库中的每个人脸描述特征进行比对,以获取所述待识别图像的人脸身份。
2.如权利要求1所述的方法,其特征在于,所述检测所述待识别图像中人脸区域的位置并将所述人脸区域提取出来包括:
对所述待识别图像进行预处理;
通过预先加载的Haar人脸检测模型,对所述预处理后的待识别图像进行人脸区域的定位;
根据所述人脸区域的定位,在所述待识别图像中将所述人脸区域提取出来。
3.如权利要求1所述的方法,其特征在于,所述将所述人脸区域图像转化为标准正面人脸图像包括:
标记所述人脸区域图像中的关键点位置;
通过仿射变换函数校准所述关键点位置,输出校准人脸图像;
将所述校准人脸图像缩放至预设尺寸,以获得所述标准正面人脸图像。
4.如权利要求1至3中任一项所述的方法,其特征在于,所述将所述表达向量与人脸库中的每个人脸描述特征进行比对,以获取所述待识别图像的人脸身份包括:
获取人脸库中的每一张人脸对比图像;
对于所述每一张人脸对比图像,检测所述人脸对比图像中人脸区域的位置,并将所述人脸区域提取出来作为第二图像;
将所述每张第二图像分别转化为标准正面人脸图像后,输入至所述深度神经网络;
根据所述每张标准正面人脸图像,利用所述深度神经网络,提取所述每张人脸对比图像的人脸描述特征;
分别计算所述表达向量与所述每张人脸对比图像中所述人脸描述特征的特征距离;
获取所述特征距离小于预设阈值的所述人脸对比图像,所述人脸对比图像对应的人脸身份输出为所述待识别图像的人脸身份。
5.一种基于深度学习的人脸识别装置,其特征在于,包括:
训练单元,用于构建并训练基于人脸训练图像的深度神经网络,
所述训练单元包括:
初始化子单元,用于利用开源的预训练模型初始化所述深度神经网络;
输入子单元,用于将多种类型的多张人脸训练图像输入所述深度神经网络;
学习子单元,用于根据每张人脸训练图像的特征,使用异步随机梯度下降算法学习所述深度神经网络的特征提取参数,包括以三张人脸训练图像构成一个三元组,表述为(Anchor,Positive,Negative),其中,Anchor人脸训练图像与Positive人脸训练图像属于同一个身份人,Anchor人脸训练图像与Negative人脸训练图像属于不同的身份人;
计算子单元,用于根据所述特征提取参数,使用交叉实体损失函数计算所述深度神经网络的特征提取效果值;
迭代子单元,用于令所述深度神经网络迭代学习所述特征提取参数,直至所述特征提取效果值满足预设优化目标;
获取单元,用于获取待识别图像;
检测单元,用于检测所述待识别图像中人脸区域的位置并将所述人脸区域提取出来;
转化单元,用于将所述人脸区域图像转化为标准正面人脸图像后,输入至所述深度神经网络;
输出单元,用于利用所述深度神经网络,输出所述标准正面人脸图像的表达向量,所述表达向量描述了所述待识别图像的人脸特征;
识别单元,用于将所述表达向量与人脸库中的每个人脸描述特征进行比对,以获取所述待识别图像的人脸身份。
6.如权利要求5所述的装置,其特征在于,所述检测单元包括:
预处理子单元,用于对所述待识别图像进行预处理;
定位子单元,用于通过预先加载的Haar人脸检测模型,对所述预处理后的待识别图像进行人脸区域的定位;
提取子单元,用于根据所述人脸区域的定位,在所述待识别图像中将所述人脸区域提取出来。
7.如权利要求5所述的装置,其特征在于,所述转化单元包括:
标记子单元,用于标记所述人脸区域图像中的关键点位置;
校准子单元,用于通过仿射变换函数校准所述关键点位置,输出校准人脸图像;
缩放子单元,用于将所述校准人脸图像缩放至预设尺寸,以获得所述标准正面人脸图像。
8.如权利要求5至7中任一项所述的装置,其特征在于,所述识别单元包括:
第二获取单元,用于获取人脸库中的每一张人脸对比图像;
第二检测单元,用于对于所述每一张人脸对比图像,检测所述人脸对比图像中人脸区域的位置,并将所述人脸区域提取出来作为第二图像;
第二转化单元,用于将所述每张第二图像分别转化为标准正面人脸图像后,输入至所述深度神经网络;
提取单元,用于根据所述每张标准正面人脸图像,利用所述深度神经网络,提取所述每张人脸对比图像的人脸描述特征;
计算单元,用于分别计算所述表达向量与所述每张人脸对比图像中所述人脸描述特征的特征距离;
对比单元,用于获取所述特征距离小于预设阈值的所述人脸对比图像,所述人脸对比图像对应的人脸身份输出为所述待识别图像的人脸身份。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611158851.4A CN107609459B (zh) | 2016-12-15 | 2016-12-15 | 一种基于深度学习的人脸识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611158851.4A CN107609459B (zh) | 2016-12-15 | 2016-12-15 | 一种基于深度学习的人脸识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107609459A CN107609459A (zh) | 2018-01-19 |
CN107609459B true CN107609459B (zh) | 2018-09-11 |
Family
ID=61055407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611158851.4A Active CN107609459B (zh) | 2016-12-15 | 2016-12-15 | 一种基于深度学习的人脸识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107609459B (zh) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108334863B (zh) * | 2018-03-09 | 2020-09-04 | 百度在线网络技术(北京)有限公司 | 身份认证方法、系统、终端和计算机可读存储介质 |
CN108427939B (zh) * | 2018-03-30 | 2022-09-23 | 百度在线网络技术(北京)有限公司 | 模型生成方法和装置 |
CN108520184A (zh) * | 2018-04-16 | 2018-09-11 | 成都博锐智晟科技有限公司 | 一种隐私保护的方法及系统 |
CN108346208A (zh) * | 2018-04-19 | 2018-07-31 | 深圳安邦科技有限公司 | 一种深度学习的人脸识别系统 |
CN108629330A (zh) * | 2018-05-22 | 2018-10-09 | 上海交通大学 | 基于多级联分类器的人脸动态捕捉与快速识别方法及系统 |
CN108769520B (zh) * | 2018-05-31 | 2021-04-13 | 康键信息技术(深圳)有限公司 | 电子装置、图像处理方法和计算机可读存储介质 |
CN108921106B (zh) * | 2018-07-06 | 2021-07-06 | 重庆大学 | 一种基于capsule的人脸识别方法 |
CN110728168B (zh) * | 2018-07-17 | 2022-07-22 | 广州虎牙信息科技有限公司 | 部位识别方法、装置、设备及存储介质 |
CN110826371A (zh) * | 2018-08-10 | 2020-02-21 | 京东数字科技控股有限公司 | 一种动物识别方法、装置、介质及电子设备 |
CN110837762B (zh) * | 2018-08-17 | 2022-09-27 | 南京理工大学 | 基于GoogLeNet的卷积神经网络行人识别方法 |
CN109241890B (zh) * | 2018-08-24 | 2020-01-14 | 北京字节跳动网络技术有限公司 | 面部图像校正方法、装置及存储介质 |
CN111062400B (zh) * | 2018-10-16 | 2024-04-30 | 浙江宇视科技有限公司 | 目标匹配方法及装置 |
CN111241892A (zh) * | 2018-11-29 | 2020-06-05 | 中科视语(北京)科技有限公司 | 一种基于多神经网络模型联合优化的人脸识别方法及系统 |
CN109657595B (zh) * | 2018-12-12 | 2023-05-02 | 中山大学 | 基于堆叠沙漏网络的关键特征区域匹配人脸识别方法 |
CN109784255B (zh) * | 2019-01-07 | 2021-12-14 | 深圳市商汤科技有限公司 | 神经网络训练方法及装置以及识别方法及装置 |
CN109886157A (zh) * | 2019-01-30 | 2019-06-14 | 杭州芯影科技有限公司 | 一种基于毫米波图像的人脸识别方法及系统 |
CN109948568A (zh) * | 2019-03-26 | 2019-06-28 | 东华大学 | 基于arm微处理器和深度学习的嵌入式人脸识别系统 |
CN110059645A (zh) * | 2019-04-23 | 2019-07-26 | 杭州智趣智能信息技术有限公司 | 一种人脸识别方法、系统及电子设备和存储介质 |
CN111860069A (zh) * | 2019-04-30 | 2020-10-30 | 百度时代网络技术(北京)有限公司 | 图像处理方法和系统 |
WO2020237482A1 (zh) * | 2019-05-27 | 2020-12-03 | 深圳市汇顶科技股份有限公司 | 用于人脸识别的光学传感器、装置、方法和电子设备 |
WO2020237483A1 (zh) * | 2019-05-27 | 2020-12-03 | 深圳市汇顶科技股份有限公司 | 用于人脸识别的光学传感器、装置、方法和电子设备 |
CN110458134B (zh) * | 2019-08-17 | 2020-06-16 | 南京昀趣互动游戏有限公司 | 一种人脸识别方法及装置 |
CN110633655A (zh) * | 2019-08-29 | 2019-12-31 | 河南中原大数据研究院有限公司 | 一种attention-attack人脸识别攻击算法 |
CN110598638A (zh) * | 2019-09-12 | 2019-12-20 | Oppo广东移动通信有限公司 | 模型训练方法、人脸性别预测方法、设备及存储介质 |
CN110852150B (zh) * | 2019-09-25 | 2022-12-20 | 珠海格力电器股份有限公司 | 一种人脸验证方法、系统、设备及计算机可读存储介质 |
CN110909618B (zh) * | 2019-10-29 | 2023-04-21 | 泰康保险集团股份有限公司 | 一种宠物身份的识别方法及装置 |
CN110796112A (zh) * | 2019-11-05 | 2020-02-14 | 青岛志泊电子信息科技有限公司 | 一种基于matlab的车内人脸识别系统 |
CN111104852B (zh) * | 2019-11-06 | 2020-10-16 | 重庆邮电大学 | 一种基于启发式高斯云变换的人脸识别技术 |
CN111275005B (zh) * | 2020-02-21 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 绘制人脸图像识别方法、计算机可读存储介质和相关设备 |
CN111291711A (zh) * | 2020-02-25 | 2020-06-16 | 山东超越数控电子股份有限公司 | 一种基于Python的深度学习人脸识别方法,设备及可读存储介质 |
CN111783605B (zh) * | 2020-06-24 | 2024-05-24 | 北京百度网讯科技有限公司 | 一种人脸图像识别方法、装置、设备及存储介质 |
CN111783681B (zh) * | 2020-07-02 | 2024-08-13 | 深圳市万睿智能科技有限公司 | 大规模人脸库识别方法、系统、计算机设备及存储介质 |
CN111768511A (zh) * | 2020-07-07 | 2020-10-13 | 湖北省电力装备有限公司 | 一种基于云测温设备的员工信息记录方法及装置 |
CN111797792A (zh) * | 2020-07-10 | 2020-10-20 | 重庆三峡学院 | 一种基于校园管理的新型身份识别装置与方法 |
CN111797793A (zh) * | 2020-07-10 | 2020-10-20 | 重庆三峡学院 | 一种基于人脸识别技术的校园身份智能管理系统 |
CN112069895A (zh) * | 2020-08-03 | 2020-12-11 | 广州杰赛科技股份有限公司 | 一种小目标的人脸识别方法及装置 |
CN112784712B (zh) * | 2021-01-08 | 2023-08-18 | 重庆创通联智物联网有限公司 | 一种基于实时监控的失踪儿童预警实现方法、装置 |
CN113743176A (zh) * | 2021-01-29 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 一种图像识别方法、设备和计算机可读存储介质 |
CN112863593B (zh) * | 2021-02-05 | 2024-02-20 | 厦门大学 | 基于皮肤宏基因组数据的身份鉴定特征提取方法及系统 |
CN115311705B (zh) * | 2022-07-06 | 2023-08-15 | 南京邮电大学 | 一种基于深度学习的人脸云识别系统 |
CN116912918B (zh) * | 2023-09-08 | 2024-01-23 | 苏州浪潮智能科技有限公司 | 一种人脸识别方法、装置、设备及计算机可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978550A (zh) * | 2014-04-08 | 2015-10-14 | 上海骏聿数码科技有限公司 | 基于大规模人脸数据库的人脸识别方法及系统 |
CN105117692A (zh) * | 2015-08-05 | 2015-12-02 | 福州瑞芯微电子股份有限公司 | 一种基于深度学习的实时人脸识别方法及系统 |
CN105512638A (zh) * | 2015-12-24 | 2016-04-20 | 黄江 | 一种基于融合特征的人脸检测与对齐方法 |
CN105550642A (zh) * | 2015-12-08 | 2016-05-04 | 康佳集团股份有限公司 | 基于多尺度线性差分特征低秩表示的性别识别方法及系统 |
CN105678232A (zh) * | 2015-12-30 | 2016-06-15 | 中通服公众信息产业股份有限公司 | 一种基于深度学习的人脸图片特征提取与对比方法 |
CN106022317A (zh) * | 2016-06-27 | 2016-10-12 | 北京小米移动软件有限公司 | 人脸识别方法及装置 |
-
2016
- 2016-12-15 CN CN201611158851.4A patent/CN107609459B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978550A (zh) * | 2014-04-08 | 2015-10-14 | 上海骏聿数码科技有限公司 | 基于大规模人脸数据库的人脸识别方法及系统 |
CN105117692A (zh) * | 2015-08-05 | 2015-12-02 | 福州瑞芯微电子股份有限公司 | 一种基于深度学习的实时人脸识别方法及系统 |
CN105550642A (zh) * | 2015-12-08 | 2016-05-04 | 康佳集团股份有限公司 | 基于多尺度线性差分特征低秩表示的性别识别方法及系统 |
CN105512638A (zh) * | 2015-12-24 | 2016-04-20 | 黄江 | 一种基于融合特征的人脸检测与对齐方法 |
CN105678232A (zh) * | 2015-12-30 | 2016-06-15 | 中通服公众信息产业股份有限公司 | 一种基于深度学习的人脸图片特征提取与对比方法 |
CN106022317A (zh) * | 2016-06-27 | 2016-10-12 | 北京小米移动软件有限公司 | 人脸识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107609459A (zh) | 2018-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107609459B (zh) | 一种基于深度学习的人脸识别方法及装置 | |
CN106096538B (zh) | 基于定序神经网络模型的人脸识别方法及装置 | |
CN104036255B (zh) | 一种人脸表情识别方法 | |
Silberman et al. | Instance segmentation of indoor scenes using a coverage loss | |
Lu et al. | Learning optimal seeds for diffusion-based salient object detection | |
Lajevardi et al. | Higher order orthogonal moments for invariant facial expression recognition | |
Wu et al. | Face alignment via boosted ranking model | |
CN110909618B (zh) | 一种宠物身份的识别方法及装置 | |
CN104361313B (zh) | 一种基于多核学习异构特征融合的手势识别方法 | |
CN104834941A (zh) | 基于计算机输入下的稀疏自编码的脱机手写体识别方法 | |
CN102968626B (zh) | 一种人脸图像匹配的方法 | |
CN106372581A (zh) | 构建及训练人脸识别特征提取网络的方法 | |
CN105354565A (zh) | 基于全卷积网络人脸五官定位与判别的方法及系统 | |
JP5120238B2 (ja) | オブジェクト領域抽出装置及びオブジェクト領域抽出プログラム | |
CN109002463A (zh) | 一种基于深度度量模型的文本检测方法 | |
Vinoth Kumar et al. | A decennary survey on artificial intelligence methods for image segmentation | |
CN106056627B (zh) | 一种基于局部鉴别性稀疏表示的鲁棒目标跟踪方法 | |
Lu et al. | A novel synergetic classification approach for hyperspectral and panchromatic images based on self-learning | |
Kim et al. | A shape preserving approach for salient object detection using convolutional neural networks | |
WO2022062403A9 (zh) | 表情识别模型训练方法、装置、终端设备及存储介质 | |
Zhu et al. | Multiple human identification and cosegmentation: A human-oriented CRF approach with poselets | |
CN112200216A (zh) | 汉字识别方法、装置、计算机设备和存储介质 | |
US11521427B1 (en) | Ear detection method with deep learning pairwise model based on contextual information | |
Dalara et al. | Entity Recognition in Indian Sculpture using CLAHE and machine learning | |
CN109543590B (zh) | 一种基于行为关联度融合特征的视频人体行为识别算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1244335 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |