CN107392183B - 人脸分类识别方法、装置及可读存储介质 - Google Patents
人脸分类识别方法、装置及可读存储介质 Download PDFInfo
- Publication number
- CN107392183B CN107392183B CN201710732433.XA CN201710732433A CN107392183B CN 107392183 B CN107392183 B CN 107392183B CN 201710732433 A CN201710732433 A CN 201710732433A CN 107392183 B CN107392183 B CN 107392183B
- Authority
- CN
- China
- Prior art keywords
- face
- feature
- image
- classified
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0463—Neocognitrons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种人脸分类识别方法、装置及可读存储介质,所述方法包括:获取待分类人脸图像,所述待分类人脸图像的类别为K类,所述K为不小于1的整数;将所述待分类人脸图像进行Gabor滤波,获得对应的M幅人脸特征图像,所述M为大于1的整数;将获得的人脸特征图像通过卷积神经网络进行特征提取,获得对应的M*N*K个第一特征值,所述N为特征数量扩增的倍数,且所述N为大于M的整数;根据所述第一特征值对所述待分类人脸图像进行分类识别。本发明通过将待分类人脸图像通过Gabor滤波获得的人脸特征图像通过卷积神经网络进行特征提取,再对提取的更多数量的纹理特征进行分类识别,实现对应的待分类人脸图像的分类识别,提高人脸分类识别的准确性。
Description
技术领域
本发明涉及人脸分类识别领域,尤其涉及一种人脸分类识别方法、装置及可读存储介质。
背景技术
Gabor滤波器是一种短时傅里叶变化,可以达到空域和频域的局部最优化。利用Gabor滤波器对人脸特征进行提取时,在空间域和频率域具有良好的方向选择性和频率选择性,可以有效的表达一幅人脸图像的信息。卷积神经网络(Convolutional NeuralNetworks,CNN)是多层感知机的变种,是神经网络的一种,是一种深度的监督学习下的机器学习模型,具有极强的适应性,善于挖掘数据局部特征,提取全局训练特征和分类。在本质上是输入到输出的映射,能够学习大量的输入与输出之间的映射关系,而不需要任何输入输出之间的精确的数学表达式。它包括卷积层,降采样层,全连接层,每一层有多个特征图,每个特征图通过一种卷积滤波器提取输入的一种特征,每个特征图有多个神经元。
利用Gabor滤波器滤波提取人脸特征再进行分类识别时,一幅图像提取的特征较少,且当人脸发生偏转,光照条件发生变化时,提取的纹理特征也会发生变化,导致进行人脸识别时出现错误。
上述信息仅用于辅助理解本发明的技术方案,并不代表承认上述信息是现有技术。
发明内容
本发明的主要目的在于提供一种人脸分类识别方法、装置及可读存储介质,旨在解决上述利用Gabor滤波器提取的人脸特征进行分类识别,易出现人脸识别错误的技术问题。
为实现上述目的,本发明提供一种人脸分类识别方法,所述人脸分类识别方法包括以下步骤:
获取待分类人脸图像,所述待分类人脸图像的类别为K类,所述K为不小于1的整数;
将所述待分类人脸图像进行Gabor滤波,获得对应的M幅人脸特征图像所述M为大于1的整数;
将获得的人脸特征图像通过卷积神经网络进行特征提取,获得对应的M*N*K个第一特征值,所述N为特征数量扩增的倍数,且所述N为大于M的整数;
根据所述第一特征值对所述待分类人脸图像进行分类识别。
优选地,所述将获得的人脸特征图像通过卷积神经网络进行特征提取,具体包括:
将所述人脸特征图像依次通过卷积神经网络的第一卷积层、第一最大池化层、第二卷积层、第二最大池化层及第一全连接层,进行特征提取。
优选地,所述将获得的人脸特征图像通过卷积神经网络进行特征提取,获得对应的M*N*K个第一特征值之后,所述方法还包括:
将所述人脸特征图像中每幅人脸特征图像分别均分成A块,所述A为大于1的整数;
将均分获得的图像通过卷积神经网络进行特征提取,获得对应的A*M*N*K个第二特征值;
相应地,所述根据所述第一特征值对所述待分类人脸图像进行分类识别,具体包括:
根据所述第一特征值及所述第二特征值对所述待分类人脸图像进行分类识别。
优选地,所述将均分获得的图像通过卷积神经网络进行特征提取,具体包括:
将均分获得的图像依次通过卷积神经网络的第三卷积层、第三最大池化层、第四卷积层及第二全连接层,进行特征提取。
优选地,所述根据所述第一特征值及所述第二特征值对所述待分类人脸图像进行分类识别,具体包括:
将所述第一特征值及所述第二特征值进行组合,获得组合结果;
将所述组合结果按照预设规则进行特征提取,获得N*K个第三特征值;
根据所述第三特征值对所述待分类人脸图像进行分类识别。
优选地,所述将所述第一特征值及所述第二特征值进行组合,获得组合结果,具体包括:
将所述第一特征值及所述第二特征值进行组合,获得(M+A*M)行N*K列的特征值矩阵;
相应地,所述将所述组合结果按照预设规则进行特征提取,获得N*K个第三特征值,具体包括:
将所述特征值矩阵按照预设规则进行特征提取,获得N*K个第三特征值。
优选地,所述将所述特征值矩阵按照预设规则进行特征提取,获得N*K个第三特征值,具体包括:
对所述特征值矩阵进行最大值提取,提取每一行的最大值,获得N*K个第三特征值。
优选地,所述根据所述第三特征值对所述待分类人脸图像进行分类识别,具体包括:
将所述第三特征值通过支持向量机进行所述待分类人脸图像的分类识别。
此外,为实现上述目的,本发明还提出一种人脸分类识别装置,所述人脸分类识别装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的人脸分类识别程序,所述人脸分类识别程序配置为实现如上文所述的人脸分类识别方法的步骤。
此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有人脸分类识别程序,所述人脸分类识别程序被处理器执行时实现如上文所述的人脸分类识别方法的步骤。
本发明通过将待分类人脸图像通过Gabor滤波获得的人脸特征图像通过卷积神经网络进行特征提取,获得更多数量的纹理特征,再对获得的更多数量的纹理特征进行分类识别,实现对应的待分类人脸图像的分类识别,提高人脸分类识别的准确性。
附图说明
图1为本发明一种人脸分类识别方法实施例方案涉及的硬件运行环境的人脸分类识别装置结构示意图;
图2为本发明一种人脸分类识别方法第一实施例的流程示意图;
图3为本发明一种人脸分类识别方法第二实施例的流程示意图;
图4为本发明一种人脸分类识别方法第二实施例中举例的人脸图像通过卷积神经网络进行特征提取的流程框图;
图5为本发明一种人脸分类识别方法第二实施例中将人脸特征图像通过SVM分类的效果图;
图6为本发明一种人脸分类识别方法第二实施例中将第三特征值通过SVM分类的效果图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的人脸分类识别装置结构示意图。
如图1所示,该人脸分类识别装置可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对人脸分类识别装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及人脸分类识别程序。
在图1所示的人脸分类识别装置中,网络接口1004主要用于连接服务器,与服务器进行数据通信;用户接口1003主要用于接收用户的输入指令;所述人脸分类识别装置通过处理器1001调用存储器1005中存储的人脸分类识别装置程序,并执行以下操作:
获取待分类人脸图像,所述待分类人脸图像的类别为K类,所述K为不小于1的整数;
将所述待分类人脸图像进行Gabor滤波,获得对应的M幅人脸特征图像,所述M为大于1的整数;
将获得的人脸特征图像通过卷积神经网络进行特征提取,获得对应的M*N*K个第一特征值,所述N为特征数量扩增的倍数,且所述N为大于M的整数;
根据所述第一特征值对所述待分类人脸图像进行分类识别。
进一步地,处理器1001可以调用存储器1005中存储的人脸分类识别程序,还执行以下操作:
将所述人脸特征图像依次通过卷积神经网络的第一卷积层、第一最大池化层、第二卷积层、第二最大池化层及第一全连接层,进行特征提取。
进一步地,处理器1001可以调用存储器1005中存储的人脸分类识别程序,还执行以下操作:
将所述人脸特征图像中每幅人脸特征图像分别均分成A块,所述A为大于1的整数;
将均分获得的图像通过卷积神经网络进行特征提取,获得对应的A*M*N*K个第二特征值;
相应地,所述根据所述第一特征值对所述待分类人脸图像进行分类识别,具体包括:
根据所述第一特征值及所述第二特征值对所述待分类人脸图像进行分类识别。
进一步地,处理器1001可以调用存储器1005中存储的人脸分类识别程序,还执行以下操作:
将均分获得的图像依次通过卷积神经网络的第三卷积层、第三最大池化层、第四卷积层及第二全连接层,进行特征提取。
进一步地,处理器1001可以调用存储器1005中存储的人脸分类识别程序,还执行以下操作:
将所述第一特征值及所述第二特征值进行组合,获得组合结果;
将所述组合结果按照预设规则进行特征提取,获得N*K个第三特征值;
根据所述第三特征值对所述待分类人脸图像进行分类识别。
进一步地,处理器1001可以调用存储器1005中存储的人脸分类识别程序,还执行以下操作:
将所述第一特征值及所述第二特征值进行组合,获得(M+A*M)行N*K列的特征值矩阵;
相应地,所述将所述组合结果按照预设规则进行特征提取,获得N*K个第三特征值,具体包括:
将所述特征值矩阵按照预设规则进行特征提取,获得N*K个第三特征值。
进一步地,处理器1001可以调用存储器1005中存储的人脸分类识别程序,还执行以下操作:
对所述特征值矩阵进行最大值提取,提取每一行的最大值,获得N*K个第三特征值。
进一步地,处理器1001可以调用存储器1005中存储的人脸分类识别程序,还执行以下操作:
将所述第三特征值通过支持向量机进行所述待分类人脸图像的分类识别。
本实施例上述方案,通过将待分类人脸图像通过Gabor滤波获得的人脸特征图像通过卷积神经网络进行特征提取,获得更多数量的纹理特征,再对获得的更多数量的纹理特征进行分类识别,实现对应的待分类人脸图像的分类识别,提高人脸分类识别的准确性。
基于上述硬件结构,提出本发明一种人脸分类识别方法实施例。
参照图2,提出本发明一种人脸分类识别方法第一实施例。
在本实施例中,所述人脸分类识别方法包括以下步骤:
步骤S10,获取待分类人脸图像,所述待分类人脸图像的类别为K类,所述K为不小于1的整数;
可理解的是,通常人脸分类识别,是将多个人的多张人脸图像进行分类识别,以实现将每个人的多张人脸图像识别出来进行归类。每个人的相应的多张人脸图像属于一个类别,首先获取需要分类识别的多张人脸图像,所述多张人脸图像中可能有多个人相应的多张图像,即包括多个类别的人脸图像,将每一张需要分类识别的人脸图像作为所述待分类人脸图像,所述K为不小于1的整数,当只有一个人的人脸图像时,所述K等于1。
比如:有5个人的分别20张人脸照片需要进行分类识别,则,待分类人脸图像为所述100张人脸照片,所述待分类人脸图像的类别为5类,即K等于5。
需要说明的是,获取一张人脸图像,在本实施例中采用人脸图像大小为80*80,大小可进行变化,但图像大小必须包括人脸部分。当摄像头距离拍摄人脸图像距离较远时,则截取的图像大小较小,当摄像头距离拍摄人脸图像距离较近时,则截取的图像大小较大。
步骤S20,将所述待分类人脸图像进行Gabor滤波,获得对应的M幅人脸特征图像,所述M为大于1的整数;
应理解的是,利用Gabor滤波器对人脸特征进行提取时,通常使用8个方向5个尺度的Gabor滤波,在空间域和频率域具有良好的方向选择性和频率选择性,可以有效的表达一幅人脸图像的信息。使用8个方向5个尺度的Gabor滤波,对一幅待分类人脸图像进行Gabor滤波,获得对应的40幅人脸特征图像,即所述M等于40。多幅待分类人脸图像分别进行Gabor滤波,分别获得每幅待分类人脸图像对应的M幅人脸特征图像。例如:对10幅待分类人脸图像分别进行Gabor滤波,使用8个方向5个尺度的Gabor滤波,则分别获得10幅待分类人脸图像对应的40幅人脸特征图像,共10*40幅人脸特征图像。
步骤S30,将获得的人脸特征图像通过卷积神经网络进行特征提取,获得对应的M*N*K个第一特征值,所述N为特征数量扩增的倍数,且所述N为大于M的整数;
可理解的是,待分类人脸图像经过Gabor滤波,得到M幅人脸特征图像,将所述M幅人脸特征图像通过卷积神经网络进行特征提取,以获取更多数量的纹理特征,纹理特征增多更容易精确的进行纹理分类。通过卷积神经网络,每幅人脸特征图像都会提取出更多的纹理特征,则M幅人脸特征图像通过卷积神经网络进行特征提取,根据卷积核大小及待分类人脸图像的类别,特征提取的同时特征数量实现了扩增,特征数量扩增的倍数为N,所述N为大于M的整数,则将获得相应的M*N*K个第一特征值。
在具体实现中,所述将获得的人脸特征图像通过卷积神经网络进行特征提取,具体包括:
将所述人脸特征图像依次通过卷积神经网络的第一卷积层、第一最大池化层、第二卷积层、第二最大池化层及第一全连接层,进行特征提取。
需要说明的是,卷积神经网络由层构成,每层有简单的接口:把输入的三维数据转换为输出的三维数据,通常使用可微函数或者不用参数。卷积网络由一系列的层构成,数据在层之间流动。常用到的层包括:卷积层Convolutional Layer、池化层Pooling Layer、全连接层Fully-Connected Layer。卷积层是卷积网络的核心,卷积操作是输入的局部区域和卷积核的点乘。在卷积神经网络中,常常在连续卷积层中间隔插入池化层,池化操作可以减小数据量,从而减小参数,降低计算,因此防止过拟合。池化操作在每个深度切片上进行,例如使用MAX(最大)操作。常用的池化核是2x2大小,在每个深度切片的宽度和高度方向下进行下采样,忽略掉75%的激活信息。池化操作,保持深度大小不变。如果一层的神经元和前一层的每个神经元都有连接,这样的层叫做全连接层。
应理解的是,以一个类别的待分类人脸图像,使用8个方向5个尺度的Gabor滤波,获得对应的40幅人脸特征图像,进一步说明。所述40幅80*80的人脸特征图像,通过第一卷积层,卷积核大小为7*7*64,得到40个40*40*64输出;再通过第一最大池化层,也可理解为第一最大混合层,所述第一最大混合层为经过2*2个核,提取出1个最大值代替原2*2尺寸的数据,因此得到图像输出为40个20*20*64;所述最大混合层之后再通过第二卷积层,卷积核为1*1*192,得到40个20*20*192输出;再通过第二最大池化成,也可理解为第二最大混合层,得到40个10*10*192输出;通过第一全连接层,即将每个行进行首尾相连,得到40*1*19200个第一特征值,即M等于40,K等于1,N等于19200。
步骤S40,根据所述第一特征值对所述待分类人脸图像进行分类识别。
可理解的是,经过Gabor滤波,获得的M幅人脸特征图像通过卷积神经网络进行特征提取,提取出更多的纹理特征,即所述第一特征值,将所述第一特征值通过分类器,就可实现更准确的分类识别,以完成所述第一特征值对应的待分类人脸图像的分类识别。
本实施例上述方案,通过将待分类人脸图像通过Gabor滤波获得的人脸特征图像通过卷积神经网络进行特征提取,获得更多数量的纹理特征,再对获得的更多数量的纹理特征进行分类识别,实现对应的待分类人脸图像的分类识别,提高人脸分类识别的准确性。
进一步地,如图3所示,基于第一实施例提出本发明一种人脸分类识别方法第二实施例。
在本实施例中,在所述步骤S30之后,还包括如下步骤:
步骤S301,将所述人脸特征图像中每幅人脸特征图像分别均分成A块,所述A为大于1的整数;
可理解的是,为了将纹理特征进行分模块详细的特征提取,再对M幅人脸特征图像进行均分,每幅人脸特征图像都均分成A块,所述A为大于1的整数。
例如:所述A为4,获取大小为80*80的待分类人脸图像,使用8个方向5个尺度的Gabor滤波,获得对应的40幅人脸特征图像,则对40幅人脸特征图像分别均分为4块,获得4*40*40*40幅图像。
步骤S302,将均分获得的图像通过卷积神经网络进行特征提取,获得对应的A*M*N*K个第二特征值;
应理解的是,将均分后的A*M幅特征图像通过卷积神经网络进行特征提取,以获取更多数量的针对不同分模块的纹理特征,分模块的纹理特征增多更容易精确的进行纹理分类。通过卷积神经网络,均分后的各分模块的特征图像都会提取出更多的纹理特征,则均分后的A*M幅特征图像通过特征提取获得对应的A*M*N*K个第二特征值,所述第二特征值更能体现人脸图像各个分模块的特征,从而使后续的分类识别更准确。
具体实现中,所述将均分获得的图像通过卷积神经网络进行特征提取,具体包括:
将均分获得的图像依次通过卷积神经网络的第三卷积层、第三最大池化层、第四卷积层及第二全连接层,进行特征提取。
可理解的是,所述A为4,获取大小为80*80的一个类别的待分类人脸图像,使用8个方向5个尺度的Gabor滤波,获得对应的40幅人脸特征图像,则对40幅人脸特征图像分别均分为4块,获得4*40*40*40幅图像。将均分获得的4*40*40*40个图像通过第三卷积层,卷积核也为3*3*64,得到4*40个20*20*64输出;再通过第三最大池化层,也可理解为第三最大混合层,得到4*40个10*10*64个输出;再通过第四卷积层,核函数为1*1*192,得到4*40个1*19200输出,再通过第二全连接层,即将每个行进行首尾相连,得到4*40*1*19200个第二特征值,即所述A等于4,所述M等于40,所述K等于1,所述N等于19200。
相应地,所述步骤S40,具体包括:
根据所述第一特征值及所述第二特征值对所述待分类人脸图像进行分类识别。
应理解的是,经过Gabor滤波,获得的M幅人脸特征图像通过卷积神经网络进行特征提取,提取出更多的纹理特征,即所述第一特征值;又将所述M幅人脸特征图像中的每幅人脸特征图像分别均分成A块,均分获得的图像通过卷积神经网络进行特征提取,以获得各分模块更多的纹理特征,即所述第二特征值;结合所述第一特征值及所述第二特征值,将所述第一特征值及所述第二特征值通过分类器,从而使分类器更好的利用人脸图像的整体及模块的纹理特征,进行更加准确的人脸分类识别。
可理解的是,所述人脸特征图像通过卷积神经网络的第一卷积层、第一最大池化层、第二卷积层、第二最大池化层及第一全连接层,进行特征提取,获得所述第一特征值,所述人脸特征图像进行均分后,将均分获得的图像通过卷积神经网络的第三卷积层、第三最大池化层、第四卷积层及第二全连接层,进行特征提取,获得所述第二特征值。所述第一特征值及所述第二特征值是通过卷积神经网络的不同层的计算,提取出的人脸图像的不同的特征值,将所述第一特征值及所述第二特征值进行组合,可获得更加全面的特征值来体现人脸图像。
应理解的是,所述第一特征值及所述第二特征值进行组合,获得的组合结果中特征值数据较大,体现更全面的人脸特征的同时也存在过多的相近的特征,过多的相近的特征来进行分类识别时所起的区别作用不明显,则可对这部分的特征进行优化,即将所述组合结果通过卷积神经网络进行特征提取,提取出区别性大的特征值,获得N个第三特征值。
需要说明的是,获得的所述第三特征值能够充分体现出人脸图像的特征,可将所述第三特征值通过分类器进行相应的分类识别,以实现对应的待分类人脸图像的分类识别。在本实施例中,为了利用更加有代表性的特征值来提高人脸图像分类识别的准确性,所述根据所述第一特征值及所述第二特征值对所述待分类人脸图像进行分类识别,具体包括:将所述第一特征值及所述第二特征值进行组合,获得组合结果;将所述组合结果按照预设规则进行特征提取,获得N*K个第三特征值;根据所述第三特征值对所述待分类人脸图像进行分类识别。
可理解的是,所述预设规则,可以是提取行或列的最大值,也可以是提取行或列的平均值,本实施例对此不加以限制。
在本实施例中,为了提高人脸图像分类识别的准确性,所述将所述第一特征值及所述第二特征值进行组合,获得组合结果,具体包括:
步骤S401,将所述第一特征值及所述第二特征值进行组合,获得(M+A*M)行N*K列的特征值矩阵;
可理解的是,所述第一特征值为M*N*K个,所述第二特征值为A*M*N*K个,将所述第一特征值及所述第二特征值进行组合,即可形成(M+A*M)行N*K列的特征值矩阵的输出。
相应地,所述将所述组合结果按照预设规则进行特征提取,获得N*K个第三特征值,具体包括:
将所述特征值矩阵按照预设规则进行特征提取,获得N*K个第三特征值;
应理解的是,(M+A*M)行N*K列的特征值,数据量较大,可做进一步优化,将所述(M+A*M)行N*K列的特征值经过卷积神经网络进行特征提取,可针对(M+A*M)行特征值的每一行提取出最大值,即可获得N*K个第三特征值。
可理解的是,所述将所述特征值矩阵按照预设规则进行特征提取,获得N*K个第三特征值,具体包括:
步骤S402,对所述特征值矩阵进行最大值提取,提取每一行的最大值,获得N*K个第三特征值。
需要说明的是,在所述特征值矩阵中,每一行的特征值很多相似的特征,而最大值的特征值具有更好的区分效果,则对(M+A*M)行N*K列的特征值矩阵,进行每一行的最大值提取,获得N*K列的最大特征值,即所述N*K个第三特征值。
例如,参照图4所示,获取大小为80*80的一个类别的待分类人脸图像,使用8个方向5个尺度的Gabor滤波,获得对应的40幅人脸特征图像,所述40幅80*80的人脸特征图像,通过第一卷积层,卷积核大小为7*7*64,得到40个40*40*64输出;再通过第一最大池化层,也可理解为第一最大混合层,所述第一最大混合层为经过2*2个核,提取出1个最大值代替原2*2尺寸的数据,因此得到图像输出为40个20*20*64;所述最大混合层之后再通过第二卷积层,卷积核为1*1*192,得到40个20*20*192输出;再通过第二最大池化成,也可理解为第二最大混合层,得到40个10*10*192输出;通过第一全连接层,即将每个行进行首尾相连,得到40*1*19200个第一特征值。
又将40幅人脸特征图像分别均分为4块,获得4*40*40*40幅图像。将均分获得的4*40*40*40个图像通过第三卷积层,卷积核也为3*3*64,得到4*40个20*20*64输出;再通过第三最大池化层,也可理解为第三最大混合层,得到4*40个10*10*64个输出;再通过第四卷积层,核函数为1*1*192,得到4*40个1*19200输出,再通过第二全连接层,即将每个行进行首尾相连,得到4*40*1*19200个第二特征值,即所述A等于4,所述M等于40,所述K等于1,所述N等于19200。
将40*1*19200个第一特征值及4*40*1*19200个第二特征值进行组合,获得特征值矩阵,即所述组合结果:(40+4*40)*1*19200个特征值,再将所述特征值矩阵进行每一行的最大值提取,获得1*19200个第三特征值。
在所述步骤S402之后,还包括步骤:
根据所述第三特征值对所述待分类人脸图像进行分类识别。
可理解的是,对特征值矩阵进行了每行的最大值提取,获得的N*K个第三特征值更具有代表性,同时精简了数据量,将所述第三特征值再通过分类器,可更加高效的获得准确的人脸分类识别结果。
在具体实现中,所述根据所述第三特征值对所述待分类人脸图像进行分类识别,具体包括:
步骤S403,将所述第三特征值通过支持向量机进行所述待分类人脸图像的分类识别。
可理解的是,利用Gabor滤波器滤波提取人脸特征再进行SVM(Support VectorMachine,支持向量机)分类识别时,一幅图像提取的特征较少,且当人脸发生偏转,光照条件发生变化时,提取的纹理特征也会发生变化,导致进行人脸识别时出现错误。在利用SVM分类识别时,需要纹理特征越多越容易精确的进行纹理分类。采用将Gabor滤波器获得的人脸特征图像通过卷积神经网络进行特征提取,输出的第三特征值再利用SVM分类器进行分类识别。相比较直接利用Gabor滤波器获得的人脸特征图像进行SVM分类识别而言,能够避免光照和偏转对特征提取误差的判定,大大提高了分类识别的准确率。
参照图5所示,图5为将所述人脸特征图像通过SVM分类的效果图,直接将经过Gabor滤波器提取的M幅人脸特征图像通过SVM分类器进行待分类图像的分类识别,分类的结果示意图如图5所示,存在一定的误判,分类的准确率不高。
参照图6所示,图6为将所述第三特征值通过SVM分类的效果图,经过Gabor滤波器提取的M幅人脸特征图像通过卷积神经网络进行特征提取,所述人脸特征图像通过卷积神经网络的第一卷积层、第一最大池化层、第二卷积层、第二最大池化层及第一全连接层,进行特征提取,获得所述第一特征值;再将所述人脸特征图像进行均分,将均分获得的图像通过卷积神经网络的第三卷积层、第三最大池化层、第四卷积层及第二全连接层,进行特征提取,获得所述第二特征值本实施例,通过将M幅人脸特征图像分别均分成多块,将均分获得的图像通过卷积神经网络进行特征提取,提取出更多的各分模块的纹理特征,将所述M幅人脸特征图像通过卷积神经网络提取的第一特征值与均分后的图像通过卷积神经网络提取的第二特征值结合,获得(M+A*M)行N*K列的特征值矩阵,将所述特征值矩阵提取每一行的最大值,获得N*K个第三特征值,将所述第三特征值通过SVM分类器进行待分类人脸图像的分类识别,分类的结果示意图如图6所示,减少了误判的发生,提高了人脸分类识别的准确率。
本实施例,通过将M幅人脸特征图像分别均分成多块,将均分获得的图像通过卷积神经网络进行特征提取,提取出更多的各分模块的纹理特征,将所述M幅人脸特征图像通过卷积神经网络提取的第一特征值与均分后的图像通过卷积神经网络提取的第二特征值结合,获得的特征值矩阵经过卷积神经网络进行特征提取,提取每一行的最大值,获得N*K个第三特征值,将所述第三特征值通过SVM分类器进行对应的待分类人脸图像的分类识别,减少了误判的发生,提高了人脸分类识别的准确率。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有人脸分类识别程序,所述人脸分类识别程序被处理器执行时实现如下操作:
获取待分类人脸图像,所述待分类人脸图像的类别为K类,所述K为不小于1的整数;
将所述待分类人脸图像进行Gabor滤波,获得对应的M幅人脸特征图像,所述M为大于1的整数;
将获得的人脸特征图像通过卷积神经网络进行特征提取,获得对应的M*N*K个第一特征值,所述N为特征数量扩增的倍数,且所述N为大于M的整数;
根据所述第一特征值对所述待分类人脸图像进行分类识别。
进一步地,所述人脸分类识别程序被处理器执行时还实现如下操作:
将所述人脸特征图像依次通过卷积神经网络的第一卷积层、第一最大池化层、第二卷积层、第二最大池化层及第一全连接层,进行特征提取。
进一步地,所述人脸分类识别程序被处理器执行时还实现如下操作:
将所述人脸特征图像中每幅人脸特征图像分别均分成A块,所述A为大于1的整数;
将均分获得的图像通过卷积神经网络进行特征提取,获得对应的A*M*N*K个第二特征值;
相应地,所述根据所述第一特征值对所述待分类人脸图像进行分类识别,具体包括:
根据所述第一特征值及所述第二特征值对所述待分类人脸图像进行分类识别。
进一步地,所述人脸分类识别程序被处理器执行时还实现如下操作:
将均分获得的图像依次通过卷积神经网络的第三卷积层、第三最大池化层、第四卷积层及第二全连接层,进行特征提取。
进一步地,所述人脸分类识别程序被处理器执行时还实现如下操作:
将所述第一特征值及所述第二特征值进行组合,获得组合结果;
将所述组合结果按照预设规则进行特征提取,获得N*K个第三特征值;
根据所述第三特征值对所述待分类人脸图像进行分类识别。
进一步地,所述人脸分类识别程序被处理器执行时还实现如下操作:
将所述第一特征值及所述第二特征值进行组合,获得(M+A*M)行N*K列的特征值矩阵;
相应地,所述将所述组合结果按照预设规则进行特征提取,获得N*K个第三特征值,具体包括:
将所述特征值矩阵按照预设规则进行特征提取,获得N*K个第三特征值。
进一步地,所述人脸分类识别程序被处理器执行时还实现如下操作:
对所述特征值矩阵进行最大值提取,提取每一行的最大值,获得N*K个第三特征值。
进一步地,所述人脸分类识别程序被处理器执行时还实现如下操作:
将所述第三特征值通过支持向量机进行所述待分类人脸图像的分类识别。
本实施例上述方案,通过将待分类人脸图像通过Gabor滤波获得的人脸特征图像通过卷积神经网络进行特征提取,获得更多数量的纹理特征,再对获得的更多数量的纹理特征进行分类识别,实现对应的待分类人脸图像的分类识别,提高人脸分类识别的准确性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本文中,单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图信息所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (9)
1.一种人脸分类识别方法,其特征在于,所述方法包括以下步骤:
获取待分类人脸图像,所述待分类人脸图像的类别为K类,所述K为不小于1的整数;
将所述待分类人脸图像进行Gabor滤波,获得对应的M幅人脸特征图像,所述M为大于1的整数;
将获得的人脸特征图像通过卷积神经网络进行特征提取,获得对应的M*N*K个第一特征值,所述N为特征数量扩增的倍数,且所述N为大于M的整数;
根据所述第一特征值对所述待分类人脸图像进行分类识别;
所述将获得的人脸特征图像通过卷积神经网络进行特征提取,获得对应的M*N*K个第一特征值之后,所述方法还包括:
将所述人脸特征图像中每幅人脸特征图像分别均分成A块,所述A为大于1的整数;
将均分获得的图像通过卷积神经网络进行特征提取,获得对应的A*M*N*K个第二特征值;
相应地,所述根据所述第一特征值对所述待分类人脸图像进行分类识别,具体包括:
根据所述第一特征值及所述第二特征值对所述待分类人脸图像进行分类识别。
2.如权利要求1所述的人脸分类识别方法,其特征在于,所述将获得的人脸特征图像通过卷积神经网络进行特征提取,具体包括:
将所述人脸特征图像依次通过卷积神经网络的第一卷积层、第一最大池化层、第二卷积层、第二最大池化层及第一全连接层,进行特征提取。
3.如权利要求1所述的人脸分类识别方法,其特征在于,所述将均分获得的图像通过卷积神经网络进行特征提取,具体包括:
将均分获得的图像依次通过卷积神经网络的第三卷积层、第三最大池化层、第四卷积层及第二全连接层,进行特征提取。
4.如权利要求1所述的人脸分类识别方法,其特征在于,所述根据所述第一特征值及所述第二特征值对所述待分类人脸图像进行分类识别,具体包括:
将所述第一特征值及所述第二特征值进行组合,获得组合结果;
将所述组合结果按照预设规则进行特征提取,获得N*K个第三特征值;
根据所述第三特征值对所述待分类人脸图像进行分类识别。
5.如权利要求4所述的人脸分类识别方法,其特征在于,所述将所述第一特征值及所述第二特征值进行组合,获得组合结果,具体包括:
将所述第一特征值及所述第二特征值进行组合,获得(M+A*M)行N*K列的特征值矩阵;
相应地,所述将所述组合结果按照预设规则进行特征提取,获得N*K个第三特征值,具体包括:
将所述特征值矩阵按照预设规则进行特征提取,获得N*K个第三特征值。
6.如权利要求5所述的人脸分类识别方法,其特征在于,所述将所述特征值矩阵按照预设规则进行特征提取,获得N*K个第三特征值,具体包括:
对所述特征值矩阵进行最大值提取,提取每一行的最大值,获得N*K个第三特征值。
7.如权利要求4所述的人脸分类识别方法,其特征在于,所述根据所述第三特征值对所述待分类人脸图像进行分类识别,具体包括:
将所述第三特征值通过支持向量机进行所述待分类人脸图像的分类识别。
8.一种人脸分类识别装置,其特征在于,所述人脸分类识别装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的人脸分类识别程序,所述人脸分类识别程序配置为实现如权利要求1至7中任一项所述的人脸分类识别方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有人脸分类识别程序,所述人脸分类识别程序被处理器执行时实现如权利要求1至7中任一项所述的人脸分类识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710732433.XA CN107392183B (zh) | 2017-08-22 | 2017-08-22 | 人脸分类识别方法、装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710732433.XA CN107392183B (zh) | 2017-08-22 | 2017-08-22 | 人脸分类识别方法、装置及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107392183A CN107392183A (zh) | 2017-11-24 |
CN107392183B true CN107392183B (zh) | 2022-01-04 |
Family
ID=60346606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710732433.XA Active CN107392183B (zh) | 2017-08-22 | 2017-08-22 | 人脸分类识别方法、装置及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107392183B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107993186B (zh) * | 2017-12-14 | 2021-05-25 | 中国人民解放军国防科技大学 | 一种基于Winograd算法的3D CNN加速方法及系统 |
CN108229341B (zh) * | 2017-12-15 | 2021-08-06 | 北京市商汤科技开发有限公司 | 分类方法和装置、电子设备、计算机存储介质 |
CN109934047A (zh) * | 2017-12-15 | 2019-06-25 | 浙江舜宇智能光学技术有限公司 | 基于深度学习的人脸识别系统及其人脸识别方法 |
CN109389593A (zh) * | 2018-09-30 | 2019-02-26 | 内蒙古科技大学 | 一种红外图像小目标的检测方法、装置、介质及设备 |
CN110245621B (zh) * | 2019-06-17 | 2023-10-17 | 深圳Tcl新技术有限公司 | 人脸识别装置及图像处理方法、特征提取模型、存储介质 |
CN110516544B (zh) * | 2019-07-19 | 2024-04-09 | 平安科技(深圳)有限公司 | 基于深度学习的人脸识别方法、装置及计算机可读存储介质 |
CN110569873A (zh) * | 2019-08-02 | 2019-12-13 | 平安科技(深圳)有限公司 | 图像识别模型训练方法、装置以及计算机设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101276421A (zh) * | 2008-04-18 | 2008-10-01 | 清华大学 | 人脸部件特征和Gabor人脸特征融合的人脸识别方法及其装置 |
CN105488461A (zh) * | 2015-11-24 | 2016-04-13 | 苏州铭冠软件科技有限公司 | 基于Gabor特征的人脸检测方法 |
CN105718889A (zh) * | 2016-01-21 | 2016-06-29 | 江南大学 | 基于GB(2D)2PCANet深度卷积模型的人脸身份识别方法 |
CN106127159A (zh) * | 2016-06-28 | 2016-11-16 | 电子科技大学 | 一种基于卷积神经网络的性别识别方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130004028A1 (en) * | 2011-06-28 | 2013-01-03 | Jones Michael J | Method for Filtering Using Block-Gabor Filters for Determining Descriptors for Images |
CN104463172B (zh) * | 2014-12-09 | 2017-12-22 | 重庆中科云丛科技有限公司 | 基于人脸特征点形状驱动深度模型的人脸特征提取方法 |
CN105678208B (zh) * | 2015-04-21 | 2019-03-08 | 深圳Tcl数字技术有限公司 | 提取人脸纹理的方法及装置 |
US10068171B2 (en) * | 2015-11-12 | 2018-09-04 | Conduent Business Services, Llc | Multi-layer fusion in a convolutional neural network for image classification |
CN105913025B (zh) * | 2016-04-12 | 2019-02-26 | 湖北工业大学 | 一种基于多特征融合的深度学习人脸识别方法 |
-
2017
- 2017-08-22 CN CN201710732433.XA patent/CN107392183B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101276421A (zh) * | 2008-04-18 | 2008-10-01 | 清华大学 | 人脸部件特征和Gabor人脸特征融合的人脸识别方法及其装置 |
CN105488461A (zh) * | 2015-11-24 | 2016-04-13 | 苏州铭冠软件科技有限公司 | 基于Gabor特征的人脸检测方法 |
CN105718889A (zh) * | 2016-01-21 | 2016-06-29 | 江南大学 | 基于GB(2D)2PCANet深度卷积模型的人脸身份识别方法 |
CN106127159A (zh) * | 2016-06-28 | 2016-11-16 | 电子科技大学 | 一种基于卷积神经网络的性别识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107392183A (zh) | 2017-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107392183B (zh) | 人脸分类识别方法、装置及可读存储介质 | |
US10445562B2 (en) | AU feature recognition method and device, and storage medium | |
CN110287962B (zh) | 基于超对象信息的遥感图像目标提取方法、装置及介质 | |
CN108256544B (zh) | 图片分类方法和装置、机器人 | |
CN110516544B (zh) | 基于深度学习的人脸识别方法、装置及计算机可读存储介质 | |
CN112016438B (zh) | 一种基于图神经网络识别证件的方法及系统 | |
Vig et al. | Large-scale optimization of hierarchical features for saliency prediction in natural images | |
US9418283B1 (en) | Image processing using multiple aspect ratios | |
CN105404845B (zh) | 图片处理方法及装置 | |
CN111428807A (zh) | 图像处理方法及计算机可读存储介质 | |
CN109241861B (zh) | 一种数学公式识别方法、装置、设备及存储介质 | |
CN106650615B (zh) | 一种图像处理方法及终端 | |
CN109409384A (zh) | 基于细粒度图像的图像识别方法、装置、介质及设备 | |
CN110245621B (zh) | 人脸识别装置及图像处理方法、特征提取模型、存储介质 | |
CN109271930A (zh) | 微表情识别方法、装置与存储介质 | |
CN107464245B (zh) | 一种图像结构边缘的定位方法及装置 | |
CN109977762B (zh) | 一种文本定位方法及装置、文本识别方法及装置 | |
WO2023116565A1 (zh) | 智能设计网络安全架构图的方法 | |
CN111860309A (zh) | 一种人脸识别方法及系统 | |
CN110807463B (zh) | 图像分割方法、装置、计算机设备和存储介质 | |
CN111784665A (zh) | 基于傅里叶变换的oct图像质量评估方法、系统及装置 | |
CN115909445A (zh) | 人脸图像伪造检测方法及相关设备 | |
CN107368847B (zh) | 一种作物叶部病害识别方法及系统 | |
CN114049491A (zh) | 指纹分割模型训练、指纹分割方法、装置、设备及介质 | |
Liu et al. | A novel SVM network using HOG feature for prohibition traffic sign recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |