CN104915625B - 一种人脸识别的方法及装置 - Google Patents

一种人脸识别的方法及装置 Download PDF

Info

Publication number
CN104915625B
CN104915625B CN201410088003.5A CN201410088003A CN104915625B CN 104915625 B CN104915625 B CN 104915625B CN 201410088003 A CN201410088003 A CN 201410088003A CN 104915625 B CN104915625 B CN 104915625B
Authority
CN
China
Prior art keywords
facial image
classification
residual
image
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410088003.5A
Other languages
English (en)
Other versions
CN104915625A (zh
Inventor
米建勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Chongqing University of Post and Telecommunications
Original Assignee
Tencent Technology Shenzhen Co Ltd
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd, Chongqing University of Post and Telecommunications filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201410088003.5A priority Critical patent/CN104915625B/zh
Publication of CN104915625A publication Critical patent/CN104915625A/zh
Application granted granted Critical
Publication of CN104915625B publication Critical patent/CN104915625B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种人脸识别的方法及装置,所述方法包括:预先存储至少一个类别的人脸图像,每个类别包括至少一张人脸图像,将人脸图像转化成向量的形式;接收任一待识别人脸图像,将待识别人脸图像转化成向量的形式;针对待识别人脸图像,分别计算每个类别的人脸图像对应的编码向量;分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像;获取每个类别对应的残差向量;分别将每个类别的残差向量转化为残差图像;获取每个残差图像上目标像素点的聚集度平均值;将具有最大平均聚集度值的残差图像对应的类别确定为待识别人脸图像的类别。与现有技术相比,本发明不需要预先判断图片是否为遮挡图片,而是自适应的识别有遮挡的图像。

Description

一种人脸识别的方法及装置
技术领域
本发明涉及数据处理领域,具体涉及一种人脸识别的方法及装置。
背景技术
人脸识别技术是生物特征识别的一个重要发展方向,目前该技术仍然面临多方面的挑战。其中就包括面部图像出现随机遮挡时,识别准确出现明显下降的问题。
利用预先存储的人脸图像线性表达输入的待识别人脸图像是目前一种较为流行的人脸识别方法。这些方法基于一个重要假设,就是属于同一个人的人脸图像分布在一个特有的线性子空间上。因此一张人脸图像可以由来自同一个类别(每个人就是一个类别)的其他人脸图像所线性表达,但不能被其他类别的人脸图像正确线性表达。
但是,当人脸图像上出现遮挡时,以上线性子空间的假设就不再成立,也就是说被遮挡图片不能被同一类别的其他图片所正确的线性表达了。为解决这一问题,现有的方法一般需要先判断图片是否为被遮挡图片,再设计有针对性的方法来识别遮挡图片。
发明内容
针对上述问题,本发明提供了一种人脸识别的方法及装置,不需要预先判断图片是否为遮挡图片,而是自适应的识别有遮挡的图像。
本发明提供了一种人脸识别的方法,所述方法包括:
接收任一待识别人脸图像,并将所述待识别人脸图像转化成向量的形式;
针对所述待识别人脸图像,分别计算预先存储的每个类别的人脸图像对应的编码向量,其中,每个类别包括至少一张人脸图像,每张人脸图像被预先转化成向量的形式;
利用每个类别的人脸图像和所述类别对应的编码向量,分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像;
根据每个类别对应的重构人脸图像和所述待识别人脸图像,得到每个类别对应的残差向量;
分别将每个类别的残差向量转化为残差图像;
分别获取每个残差图像上的目标像素点的聚集度平均值;
将最大聚集度平均值对应的类别确定为所述待识别人脸图像的类别。
优选地,所述针对所述待识别人脸图像,分别计算预先存储的每个类别的人脸图像对应的编码向量,包括:
利用公式(1),分别计算每个类别的人脸图像对应的编码向量;
其中,表示类别为i的人脸图像所构成的线性空间模型,y∈Rm×1表示所述待识别人脸图像,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量。
优选地,所述利用每个类别的人脸图像和所述类别对应的编码向量,分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像,包括:
利用公式(2),分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像;
其中,表示类别为i的人脸图像所构成的线性空间模型,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量,表示类别为i的人脸图像对应的重构人脸图像。
优选地,所述根据每个类别对应的重构人脸图像和所述待识别人脸图像,得到每个类别对应的残差向量,包括:
利用公式(3),得到每个类别对应的残差向量;
其中,y∈Rm×1表示所述待识别人脸图像,表示类别为i的人脸图像对应的重构人脸图像,表示类别为i的人脸图像对应的残差向量。
优选地,所述方法还包括:
判断所述残差向量中的各个元素值是否处于预设的阈值范围;
将处于所述阈值范围的元素值置为第一标识值,以及将不处于所述阈值范围的元素值置为第二标识值。
优选地,所述分别获取每个残差图像上的目标像素点的聚集度平均值,包括:
将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;
计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点的残差值和所述目标像素点的残差值;
获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;
分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
优选地,所述分别获取每个残差图像上的目标像素点的聚集度平均值,包括:
将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;
计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点中具有第一标识值的像素点的个数;
获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;
分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
本发明还提供了一种人脸识别的装置,所述装置包括:
接收模块,用于接收任一待识别人脸图像,并将所述待识别人脸图像转化成向量的形式;
计算模块,用于针对所述待识别人脸图像,分别计算预先存储的每个类别的人脸图像对应的编码向量,其中,每个类别包括至少一张人脸图像,每张人脸图像被预先转化成向量的形式;
重构模块,用于利用每个类别的人脸图像和所述类别对应的编码向量,分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像;
第一获取模块,用于根据每个类别对应的重构人脸图像和所述待识别人脸图像,得到每个类别对应的残差向量;
转化模块,用于分别将每个类别的残差向量转化为残差图像;
第二获取模块,用于分别获取每个残差图像上的目标像素点的聚集度平均值;
确定模块,用于将最大聚集度平均值对应的类别确定为所述待识别人脸图像的类别。
优选地,所述计算模块为利用公式(1),分别计算每个类别的人脸图像对应的编码向量的模块;
其中,表示类别为i的人脸图像所构成的线性空间模型,y∈Rm×1表示所述待识别人脸图像,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量。
优选地,所述重构模块为利用公式(2),分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像的模块;
其中,表示类别为i的人脸图像所构成的线性空间模型,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量,表示类别为i的人脸图像对应的重构人脸图像。
优选地,所述第一获取模块为利用公式(3),得到每个类别对应的残差向量的模块;
其中,y∈Rm×1表示所述待识别人脸图像,表示类别为i的人脸图像对应的重构人脸图像,表示类别为i的人脸图像对应的残差向量。
优选地,所述装置还包括:
判断模块,用于判断所述残差向量中的各个元素值是否处于预设的阈值范围;
第一标记模块,用于将处于所述阈值范围的元素值置为第一标识值;
第二标记模块,用于将不处于所述阈值范围的元素值置为第二标识值。
优选地,所述第二获取模块包括:
第一确定子模块,用于将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;
第一计算子模块,用于计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点的残差值和所述目标像素点的残差值;
第一获取子模块,用于获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;
第二获取子模块,用于分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
优选地,所述第二获取模块包括:
第二确定子模块,用于将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;
第二计算子模块,用于计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点中具有第一标识值的像素点的个数;
第三获取子模块,用于获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;
第四获取子模块,用于分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
本发明预先存储至少一个类别的人脸图像,每个类别包括至少一张人脸图像,并将所述人脸图像转化成向量的形式;在接收任一待识别人脸图像之后,将所述待识别人脸图像转化成向量的形式;首先针对所述待识别人脸图像,分别计算每个类别的人脸图像对应的编码向量;其次,利用每个类别的人脸图像和所述类别对应的编码向量,分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像;再次,根据每个类别对应的重构人脸图像和所述待识别人脸图像,得到每个类别对应的残差向量;并分别将每个类别的残差向量转化为残差图像;最后,分别获取每个残差图像上的目标像素点的聚集度平均值;将最大聚集度平均值对应的类别确定为所述待识别人脸图像的类别。与现有技术相比,本发明不需要预先判断图片是否为遮挡图片,而是自适应的识别有遮挡的图像。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的人脸识别的方法流程图;
图2为本发明提供的同一个类别的人脸图像示意图;
图3为本发明提供的各个类别对应的残差图像对比图;
图4为本发明提供的人脸识别的装置结构图;
图5为本发明提供的人脸识别的装置结构图;
图6为本发明提供的所述第二获取模块的结构图;
图7为本发明提供的所述第二获取模块的另一种结构图;
图8为本发明提供的终端相关的手机的部分结构的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
参考图1,图1为本实施例提供的人脸识别的方法流程图,具体可以包括:
S101:接收任一待识别人脸图像,并将所述待识别人脸图像转化成向量的形式。
本实施例中,接收任意一张人脸图像作为待识别人脸图像,所述待识别人脸图像可以为带遮挡的人脸图像,如对人的眼部和\或嘴部遮挡的人脸图像。具体的,接收待识别人脸图像的方式不做限制,如可以通过摄像头的拍照功能获取待识别人脸图像等。
实际应用中,在对所述待识别人脸图像进行识别之前,首先将所述待识别人脸图像转化成向量的形式。具体的,可以首先获取待识别人脸图像对应的像素矩阵,其次,将获取的像素矩阵中的每行像素或者每列像素首尾连接,得到所述待识别人脸图像的向量形式。
S102:针对所述待识别人脸图像,分别计算预先存储的每个类别的人脸图像对应的编码向量,其中,每个类别包括至少一张人脸图像,每张人脸图像被预先转化成向量的形式。
本实施例中,预先存储至少一个类别的人脸图像,每个类别包括至少一张人脸图像,并将所述人脸图像转化成向量的形式。
实际应用中,预先存储N张人脸图像,并将属于同一个对象的人脸图像定义为属于一个类别的人脸图像,如图2所示,图2为同一个类别的人脸图像示意图。通常属于同一个类别的人脸图像为多张,而且,预先存储的人脸图像的尺寸一般被裁减为预设像素的格式。
实际应用中,在使用预先存储的人脸图像之前,首先将人脸图像转化成向量的形式。具体的,可以首先获取每个人脸图像对应的像素矩阵,其次,将获取的像素矩阵中的每行像素或者每列像素首尾连接,得到所述人脸图像的向量形式。
由于同一个人的无遮挡的人脸图片可以认为是分布在一个线性子空间上,也就是说属于同一个类别的人脸图像相互可以线性表达。也可以理解为,属于同一个类别的待识别人脸图像可以被该类别的人脸图像线性表达。假如待识别人脸图像属于第k个类别,那么待识别人脸图像可以被第k个类别的人脸图像线性表达,如y=Akαk,其中,αk表示第k个类别的编码向量,Ak表示第k个类别的人脸图像,y表示待识别人脸图像。
但是当人脸图像上出现遮挡时,该待识别人脸图像就会偏离其所在的线性子空间,使得属于同一个类别的待识别人脸图像不可以被该类别的人脸图像正确的线性表达。现有技术中使得的一般线性回归方法不能恢复带有遮挡的待识别人脸图像的正确的编码向量。本实施例根据线性编码纠错理论,通过解L1范数优化问题获得带有遮挡的待识别人脸图像的正确的编码向量。一般情况下,本实施例能够识别的待识别人脸图像为局部被遮挡的人脸图像。
实际应用中,针对预先接收的待识别人脸图像,可以利用公式(1),分别计算每个类别的人脸图像对应的编码向量;
其中,表示类别为i的人脸图像所构成的线性空间模型,y∈Rm×1表示所述待识别人脸图像,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量。
S103:利用每个类别的人脸图像和所述类别对应的编码向量,分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像。
本实施例中,通过计算得到每个类别对应的编码向量后,可以利用得到的编码向量与该类别的人脸图像重构所述待识别人脸图像,最终得到各个类别对应的重构人脸图像。
实际应用中,可以利用公式(2),分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像;
其中,表示类别为i的人脸图像所构成的线性空间模型,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量,表示类别为i的人脸图像对应的重构人脸图像。
S104:根据每个类别对应的重构人脸图像和所述待识别人脸图像,得到每个类别对应的残差向量。
实际应用中,可以利用公式(3),得到每个类别对应的残差向量;
其中,y∈Rm×1表示所述待识别人脸图像,表示类别为i的人脸图像对应的重构人脸图像,表示类别为i的人脸图像对应的残差向量。
另外,本实施例还可以判断所述残差向量中的各个元素值是否处于预设的阈值范围,并将处于所述阈值范围的元素值置为第一标识值,将不处于所述阈值范围的元素值置为第二标识值。其中,元素值置为第一标识值的像素点是被人脸图像正确表达的像素点,同理,元素值置为第二标识值的像素点是被人脸图像错误表达的像素点。
实际应用中,可以通过公式(4)确定残差向量中的各个元素值;
其中,表示第i个类别对应的残差向量中的第j个元素值,[-t,t]为预先设置的阈值范围,可以将t设置为0.005。当残差向量中的元素值处于预设的阈值范围时,将所述元素值置为0,否则,将其设置为1。其中,元素值为0的像素点是被正确表达的像素点,同理,元素值为1的像素点是被错误表达的像素点。
S105:分别将每个类别的残差向量转化为残差图像。
本实施例在获取各个类别的残差向量后,把各个类别的残差向量转化为图像形式,得到所述类别对应的残差图像,相当于把人脸图像转化成向量形式的逆过程。如图3所示,(a)列表示带有遮挡的待识别人脸图像,(b)列表示预先存储的三个类别的人脸图像,(c)列表示(b)列中的各个类别对应的残差图像。另外,所述残差图像的尺寸一般为预设像素的格式。
实际应用中,在残差图像中,可以将元素值置为第二标识值的像素点标称黑色,以明显的标识出该类别的待识别人脸图像未正确表达的像素,白色像素点表示被正确表达的像素。如图3所示,可以看到正确类别所对应的残差图像完全把遮挡部分表现出来,其它类别对应的残差图像未正确表达的像素比较分散。
S106:分别获取每个残差图像上的目标像素点的聚集度平均值。
本实施例中,在获取各个类别的残差图像后,分别获取每个残差图像上的目标像素点的聚集度平均值,具体方法包括:
方法一:
首先将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;其次,计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点的残差值和所述目标像素点的残差值;再次,获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;最后,分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
方法二:
首先将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;其次,计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点中具有第一标识值的像素点的个数;再次,获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;最后,分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
S107:将最大聚集度平均值对应的类别确定为所述待识别人脸图像的类别。
如图3所示,(b)列第一个人脸图像所述的类别实际上与(a)中待识别人脸图像的类别相同,可见,正确类别对应的残差图像上被置为第一标识值的点聚集在一起,所以聚集度平均值为最大的。
实际应用中,将最大的聚集度平均值对应的类别确定为需要识别的待识别人脸图像所属的类别。
本实施例预先存储至少一个类别的人脸图像,每个类别包括至少一张人脸图像,并将所述人脸图像转化成向量的形式;在接收任一待识别人脸图像之后,将所述待识别人脸图像转化成向量的形式;首先针对所述待识别人脸图像,分别计算每个类别的人脸图像对应的编码向量;其次,利用每个类别的人脸图像和所述类别对应的编码向量,分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像;再次,根据每个类别对应的重构人脸图像和所述待识别人脸图像,得到每个类别对应的残差向量;并分别将每个类别的残差向量转化为残差图像;最后,分别获取每个残差图像上的目标像素点的聚集度平均值;将最大聚集度平均值对应的类别确定为所述待识别人脸图像的类别。与现有技术相比,本实施例不需要预先判断图片是否为遮挡图片,而是自适应的识别有遮挡的图像。
实施例二
参考图4,图4为本实施例提供的人脸识别的装置结构图,所述装置包括:
接收模块401,用于接收任一待识别人脸图像,并将所述待识别人脸图像转化成向量的形式;
计算模块402,用于针对所述待识别人脸图像,分别计算每个类别的人脸图像对应的编码向量;
重构模块403,用于利用每个类别的人脸图像和所述类别对应的编码向量,分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像;
第一获取模块404,用于根据每个类别对应的重构人脸图像和所述待识别人脸图像,得到每个类别对应的残差向量;
转化模块405,用于分别将每个类别的残差向量转化为残差图像;
第二获取模块406,用于分别获取每个残差图像上的目标像素点的聚集度平均值;
确定模块407,用于将最大聚集度平均值对应的类别确定为所述待识别人脸图像的类别。
具体的,所述计算模块为利用公式(1),分别计算每个类别的人脸图像对应的编码向量的模块;
其中,表示类别为i的人脸图像所构成的线性空间模型,y∈Rm×1表示所述待识别人脸图像,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量。
具体的,所述重构模块为利用公式(2),分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像的模块;
其中,表示类别为i的人脸图像所构成的线性空间模型,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量,表示类别为i的人脸图像对应的重构人脸图像。
具体的,所述第一获取模块为利用公式(3),得到每个类别对应的残差向量的模块;
其中,y∈Rm×1表示所述待识别人脸图像,表示类别为i的人脸图像对应的重构人脸图像,表示类别为i的人脸图像对应的残差向量。
另外,参考图5,图5为本实施例提供的人脸识别的装置结构图,所述装置不仅包括图4中的模块,还可以包括判断模块501、第一标记模块502和第二标记模块503:
所述判断模块501,用于判断所述残差向量中的各个元素值是否处于预设的阈值范围;
所述第一标记模块502,用于将处于所述阈值范围的元素值置为第一标识值;
所述第二标记模块503,用于将不处于所述阈值范围的元素值置为第二标识值。
实际应用中,参考图6,图6为所述第二获取模块的结构图,其中,所述第二获取模块406具体包括:
第一确定子模块601,用于将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;
第一计算子模块602,用于计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点的残差值和所述目标像素点的残差值;
第一获取子模块603,用于获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;
第二获取子模块604,用于分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
实际应用中,参考图7,图7为所述第二获取模块的结构图,其中,所述第二获取模块406具体包括:
第二确定子模块701,用于将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;
第二计算子模块702,用于计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点中具有第一标识值的像素点的个数;
第三获取子模块703,用于获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;
第四获取子模块704,用于分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
本发明实施例还提供了一种终端,如图8所示,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该终端可以包括手机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)、POS(Point ofSales,销售终端)、车载电脑等任意终端设备,以终端为手机为例:
图8示出的是与本发明实施例提供的终端相关的手机的部分结构的框图。参考图8,手机包括:射频(Radio Frequency,RF)电路810、存储器820、输入单元830、显示单元840、传感器850、音频电路860、无线保真(wireless fidelity,WiFi)模块870、处理器880、以及电源890等部件。本领域技术人员可以理解,图8中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图8对手机的各个构成部件进行具体的介绍:
RF电路810可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器880处理;另外,将设计上行的数据发送给基站。通常,RF电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,LNA)、双工器等。此外,RF电路810还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication,GSM)、通用分组无线服务(General Packet RadioService,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE))、电子邮件、短消息服务(Short Messaging Service,SMS)等。
存储器820可用于存储软件程序以及模块,处理器880通过运行存储在存储器820的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器820可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等,本发明中存储数据区可存储多个类别的人脸图像,其中,人脸图像可以被预先转化成向量的形式被存储。此外,存储器820可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元830可用于接收输入的数字或字符信息,以及产生与手机800的用户设置以及功能控制有关的键信号输入。本发明中的输入单元830可用于接收待识别人脸图像。具体地,输入单元830可包括触控面板831以及其他输入设备832。触控面板831,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板831上或在触控面板831附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板831可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器880,并能接收处理器880发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板831。除了触控面板831,输入单元830还可以包括其他输入设备832。具体地,其他输入设备832可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元840可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元840可包括显示面板841,可选的,可以采用液晶显示器(Liquid CrystalDisplay,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板841。进一步的,触控面板831可覆盖显示面板841,当触控面板831检测到在其上或附近的触摸操作后,传送给处理器880以确定触摸事件的类型,随后处理器880根据触摸事件的类型在显示面板841上提供相应的视觉输出。虽然在图8中,触控面板831与显示面板841是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板831与显示面板841集成而实现手机的输入和输出功能。
手机800还可包括至少一种传感器860,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板841的亮度,接近传感器可在手机移动到耳边时,关闭显示面板841和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路860、扬声器861,传声器862可提供用户与手机之间的音频接口。音频电路860可将接收到的音频数据转换后的电信号,传输到扬声器861,由扬声器861转换为声音信号输出;另一方面,传声器862将收集的声音信号转换为电信号,由音频电路860接收后转换为音频数据,再将音频数据输出处理器880处理后,经RF电路810以发送给比如另一手机,或者将音频数据输出至存储器820以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块870可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图8示出了WiFi模块870,但是可以理解的是,其并不属于手机800的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器880是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器820内的软件程序和/或模块,以及调用存储在存储器820内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器880可包括一个或多个处理单元;优选的,处理器880可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器880中。
手机800还包括给各个部件供电的电源890(比如电池),优选的,电源可以通过电源管理系统与处理器880逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机800还可以包括摄像头、蓝牙模块等,在此不再赘述。
具体在本实施例中,终端中的处理器880会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器820中,并由处理器880来运行存储在存储器820中的应用程序,从而实现各种功能:
接收任一待识别人脸图像,并将所述待识别人脸图像转化成向量的形式;
针对所述待识别人脸图像,分别计算预先存储的每个类别的人脸图像对应的编码向量,其中,每个类别包括至少一张人脸图像,每张人脸图像被预先转化成向量的形式;
利用每个类别的人脸图像和所述类别对应的编码向量,分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像;
根据每个类别对应的重构人脸图像和所述待识别人脸图像,得到每个类别对应的残差向量;
分别将每个类别的残差向量转化为残差图像;
分别获取每个残差图像上的目标像素点的聚集度平均值;
将最大聚集度平均值对应的类别确定为所述待识别人脸图像的类别。
优选地,所述针对所述待识别人脸图像,分别计算预先存储的每个类别的人脸图像对应的编码向量,包括:
利用公式(1),分别计算每个类别的人脸图像对应的编码向量;
其中,表示类别为i的人脸图像所构成的线性空间模型,y∈Rm×1表示所述待识别人脸图像,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量。
优选地,所述利用每个类别的人脸图像和所述类别对应的编码向量,分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像,包括:
利用公式(2),分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像;
其中,表示类别为i的人脸图像所构成的线性空间模型,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量,表示类别为i的人脸图像对应的重构人脸图像。
优选地,所述根据每个类别对应的重构人脸图像和所述待识别人脸图像,得到每个类别对应的残差向量,包括:
利用公式(3),得到每个类别对应的残差向量;
其中,y∈Rm×1表示所述待识别人脸图像,表示类别为i的人脸图像对应的重构人脸图像,表示类别为i的人脸图像对应的残差向量。
优选地,所述方法还包括:
判断所述残差向量中的各个元素值是否处于预设的阈值范围;
将处于所述阈值范围的元素值置为第一标识值,以及将不处于所述阈值范围的元素值置为第二标识值。
优选地,所述分别获取每个残差图像上的目标像素点的聚集度平均值,包括:
将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;
计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点的残差值和所述目标像素点的残差值;
获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;
分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
优选地,所述分别获取每个残差图像上的目标像素点的聚集度平均值,包括:
将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;
计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点中具有第一标识值的像素点的个数;
获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;
分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
与现有技术相比,本实施例提供的人脸识别的装置不需要预先判断图片是否为遮挡图片,而是自适应的识别有遮挡的图像。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明实施例所提供的一种人脸识别的方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种人脸识别的方法,其特征在于,所述方法包括:
接收任一待识别人脸图像,并将所述待识别人脸图像转化成向量的形式;
针对所述待识别人脸图像,分别计算预先存储的每个类别的人脸图像对应的编码向量,其中,每个类别包括至少一张人脸图像,每张人脸图像被预先转化成向量的形式;
利用每个类别的人脸图像和所述类别对应的编码向量,分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像;
根据每个类别对应的重构人脸图像和所述待识别人脸图像,得到每个类别对应的残差向量;
判断所述残差向量中的各个元素值是否处于预设的阈值范围;
将处于所述阈值范围的元素值置为第一标识值,以及将不处于所述阈值范围的元素值置为第二标识值;
分别将每个类别的残差向量转化为残差图像;
分别获取每个残差图像上的目标像素点的聚集度平均值;所述目标像素点是残差图像上与所述第一标识值对应的像素点;
将最大聚集度平均值对应的类别确定为所述待识别人脸图像的类别。
2.根据权利要求1所述的方法,其特征在于,所述针对所述待识别人脸图像,分别计算预先存储的每个类别的人脸图像对应的编码向量,包括:
利用公式(1),分别计算每个类别的人脸图像对应的编码向量;
其中,表示类别为i的人脸图像所构成的线性空间模型,y∈Rm×1表示所述待识别人脸图像,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量。
3.根据权利要求1或2所述的方法,其特征在于,所述利用每个类别的人脸图像和所述类别对应的编码向量,分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像,包括:
利用公式(2),分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像;
其中,表示类别为i的人脸图像所构成的线性空间模型,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量,表示类别为i的人脸图像对应的重构人脸图像。
4.根据权利要求3所述的方法,其特征在于,所述根据每个类别对应的重构人脸图像和所述待识别人脸图像,得到每个类别对应的残差向量,包括:
利用公式(3),得到每个类别对应的残差向量;
其中,y∈Rm×1表示所述待识别人脸图像,表示类别为i的人脸图像对应的重构人脸图像,表示类别为i的人脸图像对应的残差向量。
5.根据权利要求1所述的方法,其特征在于,所述分别获取每个残差图像上的目标像素点的聚集度平均值,包括:
将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;
计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点的残差值和所述目标像素点的残差值;
获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;
分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
6.根据权利要求1所述的方法,其特征在于,所述分别获取每个残差图像上的目标像素点的聚集度平均值,包括:
将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;
计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点中具有第一标识值的像素点的个数;
获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;
分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
7.一种人脸识别的装置,其特征在于,所述装置包括:
接收模块,用于接收任一待识别人脸图像,并将所述待识别人脸图像转化成向量的形式;
计算模块,用于针对所述待识别人脸图像,分别计算预先存储的每个类别的人脸图像对应的编码向量,其中,每个类别包括至少一张人脸图像,每张人脸图像被预先转化成向量的形式;
重构模块,用于利用每个类别的人脸图像和所述类别对应的编码向量,分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像;
第一获取模块,用于根据每个类别对应的重构人脸图像和所述待识别人脸图像,得到每个类别对应的残差向量;
判断模块,用于判断所述残差向量中的各个元素值是否处于预设的阈值范围;
第一标记模块,用于将处于所述阈值范围的元素值置为第一标识值;
第二标记模块,用于将不处于所述阈值范围的元素值置为第二标识值;
转化模块,用于分别将每个类别的残差向量转化为残差图像;
第二获取模块,用于分别获取每个残差图像上的目标像素点的聚集度平均值;所述目标像素点是残差图像上与所述第一标识值对应的像素点;
确定模块,用于将最大聚集度平均值对应的类别确定为所述待识别人脸图像的类别。
8.根据权利要求7所述的装置,其特征在于,所述计算模块为利用公式(1),分别计算每个类别的人脸图像对应的编码向量的模块;
其中,表示类别为i的人脸图像所构成的线性空间模型,y∈Rm×1表示所述待识别人脸图像,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量。
9.根据权利要求7或8所述的装置,其特征在于,所述重构模块为利用公式(2),分别重构所述待识别人脸图像,得到每个类别对应的重构人脸图像的模块;
其中,表示类别为i的人脸图像所构成的线性空间模型,αi∈Rp×1(i=1,…,c)表示类别为i的人脸图像对应的编码向量,表示类别为i的人脸图像对应的重构人脸图像。
10.根据权利要求9所述的装置,其特征在于,所述第一获取模块为利用公式(3),得到每个类别对应的残差向量的模块;
其中,y∈Rm×1表示所述待识别人脸图像,表示类别为i的人脸图像对应的重构人脸图像,表示类别为i的人脸图像对应的残差向量。
11.根据权利要求7所述的装置,其特征在于,所述第二获取模块包括:
第一确定子模块,用于将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;
第一计算子模块,用于计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点的残差值和所述目标像素点的残差值;
第一获取子模块,用于获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;
第二获取子模块,用于分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
12.根据权利要求7所述的装置,其特征在于,所述第二获取模块包括:
第二确定子模块,用于将每个残差图像上与所述第一标识值对应的像素点确定为目标像素点;
第二计算子模块,用于计算任一目标像素点的聚集度值,所述聚集度值包括与所述目标像素点距离为1的8个像素点中具有第一标识值的像素点的个数;
第三获取子模块,用于获取每个残差图像对应的聚集度值,所述聚集度值包括所述残差图像上所有目标像素点的聚集度值的和;
第四获取子模块,用于分别将每个残差图像对应的聚集度值除以所述残差图像上的目标像素点的总数,得到所述残差图像上的目标像素点的聚集度平均值。
CN201410088003.5A 2014-03-11 2014-03-11 一种人脸识别的方法及装置 Active CN104915625B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410088003.5A CN104915625B (zh) 2014-03-11 2014-03-11 一种人脸识别的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410088003.5A CN104915625B (zh) 2014-03-11 2014-03-11 一种人脸识别的方法及装置

Publications (2)

Publication Number Publication Date
CN104915625A CN104915625A (zh) 2015-09-16
CN104915625B true CN104915625B (zh) 2019-04-26

Family

ID=54084683

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410088003.5A Active CN104915625B (zh) 2014-03-11 2014-03-11 一种人脸识别的方法及装置

Country Status (1)

Country Link
CN (1) CN104915625B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389573B (zh) * 2015-12-23 2019-03-26 山东大学 一种基于局部三值模式分层重构的人脸识别方法
CN108182429B (zh) * 2018-02-01 2022-01-28 重庆邮电大学 基于对称性的人脸图像特征提取的方法及装置
CN109800704B (zh) * 2019-01-17 2021-05-14 深圳英飞拓智能技术有限公司 抓拍视频人脸检测的方法及装置
CN109902720B (zh) * 2019-01-25 2020-11-27 同济大学 基于子空间分解进行深度特征估计的图像分类识别方法
CN110119746B (zh) * 2019-05-08 2021-11-30 北京市商汤科技开发有限公司 一种特征识别方法及装置、计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101819628A (zh) * 2010-04-02 2010-09-01 清华大学 结合形状特征的稀疏表示人脸识别方法
CN101976352A (zh) * 2010-10-29 2011-02-16 上海交通大学 基于小样本学习和稀疏表示的多光照人脸识别方法
CN103246870A (zh) * 2013-04-24 2013-08-14 重庆大学 一种基于梯度稀疏表示的人脸识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101819628A (zh) * 2010-04-02 2010-09-01 清华大学 结合形状特征的稀疏表示人脸识别方法
CN101976352A (zh) * 2010-10-29 2011-02-16 上海交通大学 基于小样本学习和稀疏表示的多光照人脸识别方法
CN103246870A (zh) * 2013-04-24 2013-08-14 重庆大学 一种基于梯度稀疏表示的人脸识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Robust Face Recognition via Sparse Representation";John Wright 等;《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》;20090228;第31卷(第2期);第210-217页

Also Published As

Publication number Publication date
CN104915625A (zh) 2015-09-16

Similar Documents

Publication Publication Date Title
CN109213728A (zh) 基于增强现实的文物展示方法及系统
CN103854298A (zh) 一种图片与二维码融合的方法及终端
CN107197146A (zh) 图像处理方法及相关产品
CN104915625B (zh) 一种人脸识别的方法及装置
CN108271012A (zh) 一种深度信息的获取方法、装置以及移动终端
CN106296623B (zh) 一种图片处理方法及装置
CN108132752A (zh) 一种文本编辑方法及移动终端
CN104820546B (zh) 功能信息展示方法和装置
CN109409244A (zh) 一种物体摆放方案的输出方法和移动终端
CN110391867A (zh) Dci检测方法、dci发送方法、终端和基站
CN107103074B (zh) 一种分享信息的处理方法和移动终端
CN108595201A (zh) 一种应用程序更新方法及移动终端
CN108257104A (zh) 一种图像处理方法及移动终端
CN109739394A (zh) 一种sar值的处理方法、移动终端
CN110096203A (zh) 一种截图方法及移动终端
CN109743449A (zh) 一种虚拟按键显示方法及终端
CN105992001B (zh) 一种对图片进行量化处理的方法及装置
CN109195191A (zh) 一种小区重选控制方法及终端
CN108063861A (zh) 一种状态提醒的方法、装置以及移动终端
CN108762621B (zh) 一种消息显示方法及移动终端
CN110536005A (zh) 一种对象显示调整方法及终端
CN110413639A (zh) 数据核查方法及装置、电子设备和计算机可读存储介质
CN110162234A (zh) 一种应用控制方法及终端设备
CN109815349A (zh) 一种信息获取方法及终端设备
CN109669656A (zh) 一种信息显示方法及终端设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant