CN107609528A - 人脸图像的识别方法、装置及终端 - Google Patents
人脸图像的识别方法、装置及终端 Download PDFInfo
- Publication number
- CN107609528A CN107609528A CN201710860585.8A CN201710860585A CN107609528A CN 107609528 A CN107609528 A CN 107609528A CN 201710860585 A CN201710860585 A CN 201710860585A CN 107609528 A CN107609528 A CN 107609528A
- Authority
- CN
- China
- Prior art keywords
- image
- compression
- identified
- picture library
- mixed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明提供了一种人脸图像的识别方法、装置及终端。该方法包括:根据第一压缩算法和第一图像质量分别对待识别的人脸图像和图库中所有图像进行压缩存储;创建压缩后的待识别的人脸图像与压缩后的图库中每个图像的混合图像,并根据第一压缩算法和第一图像质量分别对混合图像进行压缩;以及计算压缩后的混合图像的匹配因子,并根据该匹配因子确定识别结果。通过本发明,采用相同压缩算法和图像质量对混合图像前后的图像进行压缩,并计算压缩后的混合图像的匹配因子,根据该匹配因子确定识别结果的方式,解决了相关技术中人脸识别方法不能满足现场实时应用的要求的问题,进而达到了识别精度高、运行速度快效果。
Description
技术领域
本发明涉及图像分析领域,尤其涉及一种人脸图像的识别方法、装置及终端。
背景技术
最近,新上市的苹果手机(iPhone 10)加入了人脸识别(Face Recognition,简称为FR)功能,从而引发了人们对人脸识别技术的再度关注。然而,由于FR技术是一个正在发展的研究领域,它不如指纹认证技术那么准确,所以,在实际应用中受限,没有被广泛推广。
在相关技术中,主成分分析(Principal Component Analysis,简称为PCA)算法和线性判别分析(Linear Discriminant Analysis,简称为LDA)算法运行速度快,但在人脸识别精确度方面表现不佳。弹性束图匹配(Elastic Bunch Graph Matching,简称为EBGM)算法和人脸模式字节(Face Pattern Byte,简称为FPB)算法的基于小波的人脸识别方法虽然性能优良,但由于计算量高,运行缓慢。
可见,目前人脸识别算法的主要缺点是识别精度低(一般小于90%),而且运行速度慢,不能满足现场实时应用的要求。
发明内容
本发明的主要目的在于提供一种人脸图像的识别方案,以至少解决上述相关技术中人脸识别方法不能满足现场实时应用的要求的问题。
为了实现上述目的,根据本发明的一方面,提供了一种人脸图像的识别方法,该方法包括:根据第一压缩算法和第一图像质量分别对待识别的人脸图像和图库中所有图像进行压缩存储;创建压缩后的待识别的人脸图像与压缩后的图库中每个图像的混合图像,并根据第一压缩算法和第一图像质量分别对混合图像进行压缩;以及计算压缩后的混合图像的匹配因子,并根据该匹配因子确定识别结果。
优选地,在该匹配因子为压缩后的混合图像中每个像素的位数(Bits Per Pixel,简称为BPP)的情况下,根据该匹配因子确定识别结果包括:比较压缩后的混合图像的该匹配因子,将图库中与最小的匹配因子对应的图像,确定为与待识别的人脸图像匹配的图像。
优选地,在该匹配因子为复合压缩比(Composite Compression Ratio,简称为CCR)的情况下,根据该匹配因子确定识别结果包括:比较压缩后的混合图像的该匹配因子,将图库中与最大的匹配因子对应的图像,确定为与待识别的人脸图像匹配的图像,其中,复合压缩比为:其中,RMi为混合图像的压缩比,RPi为待识别的人脸图像的压缩比,RGi为图库中图像的压缩比。
优选地,创建压缩后的待识别的人脸图像与压缩后的图库中每个图像的混合图像包括:通过行或列交织压缩后的待识别的人脸图像和压缩后的图库中每个图像形成混合图像;或者通过邻域交织压缩后的待识别的人脸图像和压缩后的图库中每个图像形成混合图像。
优选地,创建压缩后的待识别的人脸图像与压缩后的图库中每个图像的混合图像之前,将待识别的人脸图像和图库中每个图像进行脸部配准。
优选地,根据匹配因子确定识别结果包括:通过分数层融合(Score-LevelFusion)算法,融合图库中图像在不同数据集中的上述匹配因子,并确定识别结果,其中,上述数据集包括以下至少之一:可见光图像数据集、红外图像数据集、超光谱图像数据集。
优选地,上述第一图像质量(Image Quality,简称为IQ)为30%。
优选地,上述第一压缩算法包括以下之一:联合图像专家小组(JointPhotographic Experts Group,简称为JPEG)算法、JPEG 2000算法、标签图像文件格式(TagImage File Format,简称为TIFF)算法、更好的便携图形(Better Portable Graphics,简称为BPG)算法、便携式网络图形(Portable Network Graphics,简称为PNG)算法。
为了实现上述目的,根据本发明的另一方面,还提供了一种人脸图像的识别装置,该装置包括:存储模块,用于存储压缩后的待识别的人脸图像和压缩后的图库中图像;混合模块,用于创建压缩后的待识别的人脸图像与压缩后的图库中每个图像的混合图像;压缩模块,用于根据第一压缩算法和第一图像质量对待识别的人脸图像、图库中所有图像以及混合图像进行压缩;以及判定模块,用于计算压缩后的混合图像的匹配因子,并根据该匹配因子确定识别结果。
为了实现上述目的,根据本发明的再一方面,还提供了一种终端,该终端包括摄像头模块和匹配模块,其中,摄像头模块,用于采集待识别的人脸图像,并将待识别的人脸图像发送给匹配模块;匹配模块包括:存储单元,用于存储压缩后的待识别的人脸图像和压缩后的图库中图像;混合单元,用于创建压缩后的待识别的人脸图像与压缩后的图库中每个图像的混合图像;压缩单元,用于根据第一压缩算法和第一图像质量对待识别的人脸图像、图库中所有图像以及混合图像进行压缩;以及识别单元,用于计算压缩后的混合图像的匹配因子,并根据该匹配因子确定识别结果。
通过本发明,采用相同压缩算法和图像质量对混合图像前后的图像进行压缩,并计算压缩后的混合图像的匹配因子,根据该匹配因子确定识别结果的方式,解决了相关技术中人脸识别方法不能满足现场实时应用的要求的问题,进而达到了识别精度高、运行速度快和错误接受率低的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的人脸图像的识别方法的流程图;
图2是根据本发明实施例的人脸图像的识别装置的结构框图;
图3是根据本发明实施例的终端的结构框图;
图4是根据本发明优选实施例的终端的结构框图;
图5是根据本发明优选实施例的基于压缩的人脸识别方法的流程图;
图6是根据本发明另一优选实施例的人脸图像的识别方法处理流程图;以及
图7是根据本发明另一优选实施例的人脸图像的识别方法的示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本发明的实施例中,提供了一种人脸图像的识别方法。图1是根据本发明实施例的人脸图像的识别方法的流程图,如图1所示,该方法包括以下步骤:
步骤S102,根据第一压缩算法和第一图像质量分别对待识别的人脸图像和图库中所有图像进行压缩存储;
步骤S104,创建压缩后的待识别的人脸图像与压缩后的图库中每个图像的混合图像,并根据第一压缩算法和第一图像质量分别对混合图像进行压缩;
步骤S106,计算压缩后的混合图像的匹配因子;以及
步骤S108,根据该匹配因子确定识别结果。
通过上述方法,采用相同压缩算法和图像质量对混合图像前后的图像进行压缩,并计算压缩后的混合图像的匹配因子,根据匹配因子确定识别结果的方式,解决了相关技术中人脸识别方法不能满足现场实时应用的要求的问题,进而达到了识别精度高、运行速度快和错误接受率低的效果。
需要说明的是,对于许多与图像相关的应用,图像压缩往往是用来满足有带宽和存储限制的网络应用,而本发明实施例中的所提及的“图像压缩”是进行人脸识别的必要过程,基于相关像素压缩率高的原理,利用压缩后的待识别人脸图像和压缩后的图库中多个图像生成多个混合图像(即每个压缩后的图库图像均与压缩后的待识别人脸图像生成一个混合图像,而图库中有多个图像),比对多个混合图像的压缩率,将最大压缩率对应的图库中图像确定为与待识别人脸图像的匹配图像。
此外,本发明实施例中的图库图像通常为一个或多个数据集,每个数据集中有多个图像,所以,需要对数据集中每个图像进行压缩和创建相应的混合图像,而每个混合图像又对应其压缩后的匹配因子,因此,图库数据集中的每个图像与混合图像和匹配因子均有一一对应关系。
在实施过程中,在步骤S104之前,将待识别的人脸图像和图库中的每个图像进行脸部配准。即在创建混合图像之前将被混合的图像进行脸部配准,优选地,该脸部配准步骤可以在步骤S102之后,这样有利于提高识别精度和运行效率。其中,待识别人脸图像可以来自实时成像终端或系统(例如,相机或手机等具有摄像功能的终端),图库中图像可以来自终端或系统本地存储,也可以来自网盘、闪存盘(如U盘)或内存卡(如SD卡、CF卡)等第三方存储介质。
进一步地,在步骤S104中,可以通过行或列交织压缩后的待识别的人脸图像和压缩后的图库中每个图像形成混合图像,也可以是通过邻域交织压缩后的待识别的人脸图像和压缩后的图库中每个图像形成混合图像,还可以是通过其他类似方法形成混合图像。其中,可以是将待识别的人脸图像作为探头(probe)图像,创建图库(gallery)中每个图像与探头图像对应的混合图像,即利用探头图像和图库图像创建混合图像。需要说明的是,创建混合图像的探头图像和图库图像必须是使用相同压缩算法和相同图像压缩质量(即第一图像质量)压缩后的图像。并且,本发明实施例中统一使用相同的压缩算法和图像质量对待识别人脸图像、图库图像以及两者的混合图像进行压缩,这样使得判定识别结果的匹配因子相关性强且有意义。
优选地,步骤S102和步骤S104中第一压缩算法可以包括以下之一:JPEG算法、JPEG2000算法、TIFF算法、BPG算法、PNG算法。这些压缩算法标准通用,应用广泛。
经分析验证,在人脸识别过程中进行图像压缩,压缩有助于人脸匹配过程,因而提高识别精度。其中,10%或以上的压缩比(压缩图像比原始图像)不会影响使用主成分分析(PCA)的FR精度。需要说明的是,人脸识别的典型报告集中在如何在不降低识别精度的前提下,最大化压缩率。在实施过程中,步骤S102和步骤S104中压缩时可以设置第一图像质量为10%、20%、30%或40%等。而在实验测试过程中,设置第一图像质量(IQ)为30%,可以得到更高的人脸识别精度。
在具体实施过程中,步骤S106中的匹配因子(即人脸匹配度量)可以是BPP,也可以是复合压缩比(Composite Compression Ratio,简称为CCR),或者其他测量压缩的参数作为匹配人脸识别的度量。
如果该匹配因子是每像素位数(BPP),则该匹配因子可以由如下公式得出:
其中,NMiCB为压缩后的混合图像的字节数,NMiP为混合图像的像素数。例如,混合图像的分辨率是320×320,则混合图像的像素数为320×320=102400,也就是说混合图像分辨率的值即为混合图像的像素数。
如果该匹配因子是CCR,则该匹配因子可以由如下公式得出:
其中,RMi为混合图像的压缩比,RPi为待识别的人脸图像的压缩比,RGi为图库中图像的压缩比。
需要说明的是,压缩比(Compression ratio,简称为CR)=压缩前字节数/压缩后字节数。例如,RMi为混合图像压缩前字节数/该混合图像压缩后字节数,RPi为待识别的人脸图像压缩前字节数/待识别的人脸图像压缩后字节数;RGi为图库中图像压缩前字节数/图库中该图像压缩后字节数。
步骤S108根据步骤S106计算出的匹配因子来判定与待识别人脸图像(即探头图像)的匹配结果(即识别结果)。其中,该匹配结果或识别结果包括:图库中存在一个与待识别人脸图像匹配的图像;或者图库中并不存在与待识别人脸图像匹配的图像。
以下先讨论图库中存在一个与待识别人脸图像(或探头图像)匹配的图像的情况:
例如,匹配因子为BPP时,则比较图库中所有图像对应形成的混合图像压缩后的BPP的大小,将与最小的BPP对应的图库中图像,确定为与待识别的人脸图像匹配的图像。在另一个实施例中,匹配因子为CCR时,则比较图库中所有图像对应形成的混合图像压缩后的CCR的大小,将与最大的CCR对应的图库中图像,确定为与待识别的人脸图像匹配的图像。
此外,图库中并不存在与待识别人脸图像匹配的图像的情况:例如,在具体实施过程中,可以根据经验值给步骤S106中的匹配因子预设一个阈值,如果该匹配因子为BPP,则BPP大于该阈值时,确定图库中没有与待识别的人脸图像匹配的图像,如果该匹配因子为CCR,则CCR小于该阈值时,确定图库中没有与待识别的人脸图像匹配的图像。
进一步地,在步骤S108中,可以通过分数层融合(Score-Level Fusion)算法,融合图库中图像在不同数据集中的上述匹配因子,并确定识别结果,其中,上述数据集包括以下至少之一:可见光图像数据集、红外图像数据集、超光谱图像数据集。例如,融合图库中图像在两个不同可见光图像数据集中对应的匹配因子,也可以融合图库中图像在一个可见光图像数据集和两个红外图像数据集中对应的匹配因子。
在实施过程中,分数层融合算法往往是在多个数据集中展开的,即,在每个数据集中,分别计算根据待识别人脸图像和图库图像创建的混合图像压缩后的匹配因子,再将多个数据集中的匹配因子进行分数层融合,从而可以确定最终的匹配结果。
对应于上述的方法,在本发明实施例中还提供了一种人脸图像的识别装置。图2是根据本发明实施例的人脸图像的识别装置的结构框图,如图2所示,该装置包括:存储模块22,用于存储压缩后的待识别的人脸图像和压缩后的图库中图像;混合模块24,用于创建压缩后的待识别的人脸图像与压缩后的图库中每个图像的混合图像;压缩模块26,用于根据第一压缩算法和第一图像质量对待识别的人脸图像、图库中所有图像以及混合图像进行压缩;以及判定模块28,用于计算压缩后的混合图像的匹配因子,并根据该匹配因子确定识别结果。
通过上述装置,压缩模块26将待识别的人脸图像、图库图像以及两者的混合图像使用相同压缩算法和图像质量进行压缩,以及判定模块28计算压缩后的混合图像的匹配因子,并根据该匹配因子确定识别结果,解决了相关技术中人脸识别方法不能满足现场实时应用的要求的问题,进而达到了识别精度高、运行速度快和错误接受率低的效果。
其中,人脸图像的识别装置可以通过网络、内存卡、闪存卡或其他第三方设备,获取待识别的人脸图像和图库图像。
优选地,压缩模块26中所使用的第一压缩算法可以包括以下之一:JPEG算法、JPEG2000算法、TIFF算法、BPG算法、PNG算法。
在实施过程中,混合模块24可以是通过行或列交织压缩后的待识别的人脸图像和压缩后的图库中每个图像形成混合图像,也可以是通过邻域交织压缩后的待识别的人脸图像和压缩后的图库中每个图像形成混合图像。
需要说明的是,装置实施例中描述的终端对应于上述的方法实施例,其具体的实现过程在方法实施例中已经进行过详细说明,在此不再赘述。
在本发明实施例中还提供了一种终端。在实际应用中可以是一种实时成像系统,例如,带摄像头的相机或手机等。
图3是根据本发明实施例的终端的结构框图,如图3所示,该终端包括:摄像头模块32和匹配模块34,下面对该结构进行详细说明。
其中,摄像头模块32,用于采集待识别的人脸图像,并将待识别的人脸图像发送给匹配模块34;匹配模块34包括:存储单元342,用于存储压缩后的待识别的人脸图像和压缩后的图库中图像;混合单元344,用于创建压缩后的待识别的人脸图像与压缩后的图库中每个图像的混合图像;压缩单元346,用于根据第一压缩算法和第一图像质量对待识别的人脸图像、图库中所有图像以及混合图像进行压缩;以及识别单元348,用于计算压缩后的混合图像的匹配因子,并根据该匹配因子确定识别结果。
通过上述终端,摄像头模块32将采集后的待识别的人脸图像发送给匹配模块34,压缩单元346将待识别的人脸图像、图库图像以及两者的混合图像使用相同压缩算法和图像质量进行压缩,识别单元348计算压缩后的混合图像的匹配因子,并根据匹配因子确定识别结果,从而解决了相关技术中人脸识别方法不能满足现场实时应用的要求的问题,进而达到了识别精度高、运行速度快的效果。
优选地,压缩单元346中所使用的第一压缩算法可以包括以下之一:JPEG算法、JPEG 2000算法、TIFF算法、BPG算法、PNG算法。
进一步地,在实施过程中,压缩单元346中设置图像质量(IQ)可以为30%,可以得到更精准的人脸匹配图像。
在一个实施例中,识别单元348中的匹配因子是BPP,在另一个实施例中,识别单元348的匹配因子也可以是CCR,或者其他测量压缩的参数。当然,也有待识别的人脸图像不在图库图像中的情况,这里主要讨论待识别的人脸图像在图库图像中,则如果匹配因子为BPP,则与最小的BPP对应的图库图像是与待识别的人脸图像匹配的图像;如果匹配因子为CCR,则与最大的CCR对应的图库图像是与待识别的人脸图像匹配的图像。
图4是根据本发明优选实施例的终端的结构框图,如图4所示,匹配模块34还包括:预处理单元422,用于将待识别的人脸图像和图库中每个图像进行脸部配准。例如,对待识别的人脸图像和图库图像进行脸部检测,将脸部图像提取并对齐。存储单元342是存储经预处理单元422处理后,并压缩后的待识别的人脸图像和图库中图像。其中,混合单元344可以是通过行或列交织压缩后的待识别的人脸图像和压缩后的图库中每个图像形成混合图像,也可以是通过邻域交织压缩后的待识别的人脸图像和压缩后的图库中每个图像形成混合图像。
本发明还提供了一个优选实施例,结合了上述多个优选实施例的技术方案,下面结合图5来详细描述。
在优选实施例中,提出了一种基于标准图像压缩算法(如JPEG)的新型人脸识别方法,即,基于压缩的(Compression-Based,以下简称为CPB)人脸识别方法。图5是根据本发明优选实施例的基于压缩的人脸识别方法的流程图,如图5所示,该流程包括以下步骤:
步骤S502,通过所选压缩算法对所有图库图像进行压缩。其中,所选压缩算法可以是JPEG或PNG等标准图像压缩算法,所选的压缩时的图像质量可以是10%、20%、30%或40%等。
步骤S504,用探头(probe)图像和图库(gallery)图像形成混合图像,然后压缩。其中,创建混合图像时,首先需要对探头图像进行压缩,即,按照步骤S502中压缩图库图像时相同的压缩算法和图像质量进行压缩;其次,利用压缩后的探头图像和步骤S502中压缩后的图库图像形成混合图像;然后,使用与压缩探头图像和图库图像相同的压缩算法和图像质量对混合图像进行一一压缩。
步骤S506,通过压缩后的探头图像、图库图像和混合图像计算复合压缩比(CCR)。这里的CCR可以由以下公式得出:
其中,RMi为混合图像的压缩比,RPi为待识别的人脸图像的压缩比,RGi为图库中图像的压缩比。
步骤S508,比较CCR值,最大的CCR值对应于匹配的人脸。
需要说明的是,图像压缩对于数据传输和存储(例如,数字成像和网页浏览中使用的JPEG图像)是必需的。图像压缩可以是有损的或无损的,本实施例主要强调有损压缩。有许多标准图像格式和相应的压缩算法,例如,JPEG(DCT-离散余弦变换),JPEG 2000(DWT-离散小波变换)。
在测试过的实施例中,人脸识别最优的压缩图像质量:IQ=30%。
此外,在当前主流商用的成像设备(如数字相机、智能手机)中,图像均已JPEG的压缩格式存储,快速高效、节省空间。因此,进一步地,另一个优选实施例中,提出一种直接利用图像压缩进行人脸识别的方法(以下简称为JPEG-CPB),快速、精确又标准的解决方案,以便集成到实时成像平台。
下面将结合实例对本发明实施例的实现过程进行详细描述。
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本优选实施例提供了一种高识别精度(Accuracy)、低错误接受率(FalseAcceptance Rate,简称为FAR)的基于压缩的(CPB)人脸识别方法,以应用于现场实时图像识别系统或设备。
图6是根据本发明另一优选实施例的人脸图像的识别方法处理流程图,如图6所示,该方法包括如下步骤:
步骤S602,获取人脸图像。该步骤可以包括获取待识别的人脸图像(即探头图像)以及获取图库图像。其中,可以从现场摄像机或其他带有摄像头的设备中获取探头图像,图库图像可以是事先存储在数据库中的,也可以是从网络、存储卡等途径获取的。
步骤S604,图像预处理。正规化所有探头图像和图库图像,并且必须提取和对齐(配准)所有面部图像(仅包含脸部的区域)。
步骤S606,创建并压缩混合图像。首先,所有图像(包括探头图像和图库图像)都必须用所选的压缩算法和图像质量(IQ)进行压缩后存储,例如,IQ=30%的JPEG压缩。其次,创建混合图像。给定一个探头图像,通过行(或列、或邻域)交织探头图像和图库图像创建混合图像。其中,创建混合图像时所使用的探头图像和图库图像均为使用“IQ=30%的JPEG”压缩算法压缩后的图像。然后,使用相同的压缩方法(JPEG)和相同的IQ(30%)压缩混合图像。
图7是根据本发明另一优选实施例的人脸图像的识别方法的示意图,如图7所示,一个探头图像P(即可见光图像,又称RGB图像)显示在第一列中,来自同一数据集的两个图库图像(即G1和G2)呈现在中间列,相应的混合图像(即PG1和PG2)显示在右列,且探头图像、图库图像和混合图像均使用JPEG压缩算法及IQ为30%进行压缩。其中,压缩后的混合图像面部匹配参数BPP显示在混合图像下方,BPP最小者为匹配人脸。在图7中,BPP最小者为0.179,其混合图像P1对应的图库中的图像为1,所以,图库图像1为与探头图像P匹配的人脸图像。
具体实施过程中,可以通过从探头图像中取出奇数行(或列)和来自图库图像的偶数行(或列,或邻域)来形成混合图像。以这种方式,混合图像具有与探头图像和图库图像相同的分辨率(参照图7)。
步骤S608,计算人脸匹配度量(即匹配因子)。优选地,该人脸匹配度量可以为复合压缩比(CCR)或每像素位数(BPP),表达式分别为:
(1)CCR=CR(混合图像)×2/[CR(探头图像)+CR(图库图像)],其中,CR=(压缩前图像的字节数)/(压缩后图像的字节数)。
也即CCR=(混合图像压缩前图像的字节数/混合图像压缩后图像的字节数)×2/[(探头图像压缩前图像的字节数/探头图像压缩后图像的字节数)+(图库图像压缩前图像的字节数/图库图像压缩后图像的字节数)]
(2)BBP=(混合图像压缩后的字节数)×8/(混合图像的像素数)。
步骤S610,人脸识别。对于封闭数据集(即所有的探头图像都包含在图库数据集中),将探头图像与所有图库图像混合、压缩后,计算人脸匹配度量,最大CCR(或最小BPP)对应的图库图像就是匹配的人脸图像。对于开放数据集(即探头图像不包含在图库数据集中),则必须在一个较大的封闭数据集上分析所有的人脸匹配度量值(分为匹配的和不匹配的两组),然后推导出一个阈值以最小化识别误差,比如,设置BPP作为人脸匹配度量(即匹配因子)时阈值TBPP=0.25(通常匹配人脸的BPP小于该值)。如果在一个开放数据集上,匹配人脸的BPP值(即该数据集上BPP的最小值)大于TBPP,则该探头图像不在开放数据集中。
此外,通过分数层融合(score-level fusion)可以进一步提高人脸识别精度。其中,此处的分数是指人脸匹配度量值,可以来自不同算法或不同摄像头(如可见光和红外);融合是指用统计方法(如K近邻算法,K Nearest Neighbor,简称为KNN)结合分数再进行分类识别。
表1是在两个人脸图库数据集(即来自两个摄像头,共105个受试者,每个受试对象至少有4幅人脸图像)上测试的四个人脸识别算法的识别精度(Accuracy,简称为AC,单位%)和低错误接受率(FAR,单位%)。其中,采用行交织,BPP作为匹配因子。见下表1,四个人脸识别算法分别为:基于JPEG压缩的人脸识别(JPEG-CBP),圆形高斯滤波(CircularGaussian Filter,简称为CGF),人脸模式字节(Face Pattern Byte,简称为FPB),线性判别分析(LDA)。其中,KNN融合是用K近邻算法进行分数层融合后的人脸识别精度。底行和右列分别给出2个分数和4个分数融合结果,而右下角是所有8个分数的融合结果。
表1
在本优选实施例中,人脸匹配的所需时间大约就是压缩混合图像的所需时间。在包含105名受试者的人脸数据库(可见光图像数据集)上测试了上述CPB的人脸识别方法,见表1,其中,使用JPEG压缩时,可见光图像的脸部识别精度为94.76%。在同一面数据集上,FPB算法的准确率为91.43%。由此可见,基于JPEG压缩(JPEG-CPB)的人脸识别是标准和快速的,可以集成到实时成像设备中。
需要说明的是,本优选实施例中基于压缩的人脸识别方法,尽管举例说明使用的是JPEG压缩算法(即JPEG-CPB),但是本发明实施例也可用使用其它压缩算法实现,如JPEG2000,标签图像文件格式(Tag Image File Format,简称为TIFF)、更好的便携图形(BetterPortable Graphics,简称为BPG)、便携式网络图形(Portable Network Graphics,简称为PNG)等等。
另外,本实施例适用于多光谱(multispectral images)的人脸图像,比如,可见光,近红外、中红外、远红外,或超光谱图像(hyperspectral images)。
可见,基于压缩(CPB)的人脸识别算法的优点如下:
(1)识别精度高:显著高于现有的人脸识别方法;
(2)算法标准快速:像人脸检测算法一样,可以集成到现有的实时成像系统(相机),或带有摄像头的智能终端(手机、平板电脑等);
(3)节省存储空间:实验中如使用人脸图像的分辨率是320x320像素,图像压缩质量30%,则仅占6K字节。
综上所述,通过上述实施例,采用相同压缩算法和图像质量对混合图像前后的图像进行压缩,并计算压缩后的混合图像的匹配因子,根据该匹配因子确定识别结果的方式,解决了相关技术中人脸识别方法不能满足现场实时应用的要求的问题,进而达到了识别精度高、运行速度快和错误接受率低的效果。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种人脸图像的识别方法,其特征在于,所述方法包括:
根据第一压缩算法和第一图像质量分别对待识别的人脸图像和图库中所有图像进行压缩存储;
创建压缩后的所述待识别的人脸图像与压缩后的所述图库中每个图像的混合图像,并根据所述第一压缩算法和所述第一图像质量分别对所述混合图像进行压缩;以及
计算压缩后的所述混合图像的匹配因子,并根据所述匹配因子确定识别结果。
2.根据权利要求1所述的方法,其特征在于,在所述匹配因子为压缩后的所述混合图像中每个像素的位数的情况下,根据所述匹配因子确定识别结果包括:
比较压缩后的所述混合图像的所述匹配因子,将所述图库中与最小的所述匹配因子对应的图像,确定为与所述待识别的人脸图像匹配的图像。
3.根据权利要求1所述的方法,其特征在于,在所述匹配因子为复合压缩比的情况下,根据所述匹配因子确定识别结果包括:
比较压缩后的所述混合图像的所述匹配因子,将所述图库中与最大的所述匹配因子对应的图像,确定为与所述待识别的人脸图像匹配的图像,其中,所述复合压缩比为:
其中,RMi为所述混合图像的压缩比,RPi为所述待识别的人脸图像的压缩比,RGi为所述图库中图像的压缩比。
4.根据权利要求1所述的方法,其特征在于,创建压缩后的所述待识别的人脸图像与压缩后的所述图库中每个图像的混合图像包括:
通过行或列交织压缩后的所述待识别的人脸图像和压缩后的所述图库中每个图像形成所述混合图像;或者
通过邻域交织压缩后的所述待识别的人脸图像和压缩后的所述图库中每个图像形成所述混合图像。
5.根据权利要求1所述的方法,其特征在于,创建压缩后的所述待识别的人脸图像与压缩后的所述图库中每个图像的混合图像之前,包括:
将所述待识别的人脸图像和所述图库中每个图像进行脸部配准。
6.根据权利要求1所述的方法,其特征在于,根据所述匹配因子确定识别结果包括:
通过分数层融合算法,融合所述图库中图像在不同数据集中的所述匹配因子,并确定识别结果,其中,所述数据集包括以下至少之一:可见光图像数据集、红外图像数据集、超光谱图像数据集。
7.根据权利要求1所述的方法,其特征在于,所述第一图像质量为30%。
8.根据权利要求1至7任一项所述的方法,其特征在于,所述第一压缩算法包括以下之一:
联合图像专家小组算法、联合图像专家小组2000算法、标签图像文件格式算法、更好的便携图形算法、便携式网络图形算法。
9.一种人脸图像的识别装置,其特征在于,所述装置包括:
存储模块,用于存储压缩后的待识别的人脸图像和压缩后的图库中图像;
混合模块,用于创建压缩后的所述待识别的人脸图像与压缩后的所述图库中每个图像的混合图像;
压缩模块,用于根据第一压缩算法和第一图像质量对所述待识别的人脸图像、所述图库中所有图像以及所述混合图像进行压缩;以及
判定模块,用于计算压缩后的所述混合图像的匹配因子,并根据所述匹配因子确定识别结果。
10.一种终端,其特征在于,所述终端包括摄像头模块和匹配模块,其中,
所述摄像头模块,用于采集待识别的人脸图像,并将所述待识别的人脸图像发送给所述匹配模块;
所述匹配模块包括:
存储单元,用于存储压缩后的所述待识别的人脸图像和压缩后的图库中图像;
混合单元,用于创建压缩后的所述待识别的人脸图像与压缩后的所述图库中每个图像的混合图像;
压缩单元,用于根据第一压缩算法和第一图像质量对所述待识别的人脸图像、所述图库中所有图像以及所述混合图像进行压缩;以及
识别单元,用于计算压缩后的所述混合图像的匹配因子,并根据所述匹配因子确定识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710860585.8A CN107609528A (zh) | 2017-09-21 | 2017-09-21 | 人脸图像的识别方法、装置及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710860585.8A CN107609528A (zh) | 2017-09-21 | 2017-09-21 | 人脸图像的识别方法、装置及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107609528A true CN107609528A (zh) | 2018-01-19 |
Family
ID=61061709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710860585.8A Pending CN107609528A (zh) | 2017-09-21 | 2017-09-21 | 人脸图像的识别方法、装置及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107609528A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103716505A (zh) * | 2012-09-28 | 2014-04-09 | 北京蒙恬科技有限公司 | 图像识别系统及方法 |
CN104199454A (zh) * | 2014-09-27 | 2014-12-10 | 江苏华宏实业集团有限公司 | 高压线路巡检机器人控制系统 |
CN106709479A (zh) * | 2017-02-24 | 2017-05-24 | 深圳英飞拓科技股份有限公司 | 基于视频图像的人脸检测方法及系统 |
-
2017
- 2017-09-21 CN CN201710860585.8A patent/CN107609528A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103716505A (zh) * | 2012-09-28 | 2014-04-09 | 北京蒙恬科技有限公司 | 图像识别系统及方法 |
CN104199454A (zh) * | 2014-09-27 | 2014-12-10 | 江苏华宏实业集团有限公司 | 高压线路巡检机器人控制系统 |
CN106709479A (zh) * | 2017-02-24 | 2017-05-24 | 深圳英飞拓科技股份有限公司 | 基于视频图像的人脸检测方法及系统 |
Non-Patent Citations (1)
Title |
---|
YUFENG ZHENG等: "Fast and Accurate Face Recognition Based on Image Compression", 《PROCEEDINGS OF SPIE》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Blind image quality assessment based on multichannel feature fusion and label transfer | |
Qureshi et al. | A bibliography of pixel-based blind image forgery detection techniques | |
JP4732660B2 (ja) | ビジュアルアテンションシステム | |
US8031947B2 (en) | Method and system for rapid matching of video streams | |
EP1271403B1 (en) | Method and device for character location in images from digital camera | |
WO2017000716A2 (zh) | 图片的管理方法、装置及终端设备 | |
KR100422709B1 (ko) | 영상 의존적인 얼굴 영역 추출방법 | |
Minaee et al. | Screen content image segmentation using least absolute deviation fitting | |
WO2017080196A1 (zh) | 基于人脸图像的视频分类方法和装置 | |
CN110490214B (zh) | 图像的识别方法及系统、存储介质及处理器 | |
Diana Andrushia et al. | Saliency-based image compression using Walsh–Hadamard transform (WHT) | |
Vidyadharan et al. | Digital image forgery detection using compact multi-texture representation | |
CN110245573A (zh) | 一种基于人脸识别的签到方法、装置及终端设备 | |
Cui et al. | Infrared and visible image fusion using detail enhanced channel attention network | |
Agarwal et al. | Directional local co-occurrence patterns based on Haar-like filters | |
Al-Jubouri | Integration colour and texture features for content-based image retrieval | |
Shivakumara et al. | A new RGB based fusion for forged IMEI number detection in mobile images | |
CN108198163A (zh) | 一种基于离散余弦变换的全色与多光谱图像融合方法 | |
CN115147895B (zh) | 人脸鉴伪方法及装置 | |
CN107609528A (zh) | 人脸图像的识别方法、装置及终端 | |
Agarwal et al. | Blind forensics of images using higher order local binary pattern | |
Varish et al. | A content based image retrieval using color and texture features | |
Moin et al. | Face recognition in JPEG compressed domain: a novel coefficient selection approach | |
EP2884427A1 (en) | Method and system for describing an image | |
Nikalje et al. | Copy-Move and Image Splicing Forgery Detection based on Convolution Neural Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180119 |