CN107563287A - 人脸识别方法和装置 - Google Patents

人脸识别方法和装置 Download PDF

Info

Publication number
CN107563287A
CN107563287A CN201710632418.8A CN201710632418A CN107563287A CN 107563287 A CN107563287 A CN 107563287A CN 201710632418 A CN201710632418 A CN 201710632418A CN 107563287 A CN107563287 A CN 107563287A
Authority
CN
China
Prior art keywords
mrow
matrix
sample set
identified
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710632418.8A
Other languages
English (en)
Other versions
CN107563287B (zh
Inventor
周静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jianghan University
Original Assignee
Jianghan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jianghan University filed Critical Jianghan University
Publication of CN107563287A publication Critical patent/CN107563287A/zh
Application granted granted Critical
Publication of CN107563287B publication Critical patent/CN107563287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种人脸识别方法和装置,属于生物识别领域。所述方法包括:对待识别样本集进行预处理,得到待识别样本集的非负矩阵;采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行处理,求出所述待识别样本集的最优基矩阵和最优系数矩阵;采用训练好的分类器对所述待识别样本集的最优系数矩阵进行分类,完成人脸识别。本发明采用新加性迭代规则进行迭代优化求解待识别样本集的最优基矩阵和最优系数矩阵,提高了识别率,减少了运算量,使得最终该人脸识别方法具有较高的识别率和较短的运算时间。

Description

人脸识别方法和装置
技术领域
本发明涉及生物识别领域,特别涉及一种人脸识别方法和装置。
背景技术
人脸识别是一种新兴的生物识别技术,由于在应用方面具有非接触性、友好、使用方便、直观等优点,使其在罪犯识别、证件验证及医学等领域有着广泛的应用前景和巨大的市场潜力。
目前常见的人脸识别技术可分为几类:基于几何特征的识别技术、基于数学模型的识别技术、基于子空间分析的识别技术等。基于子空间分析的识别技术是当前人脸识别中的主流方法之一,它的基本思想是通过一个映射将高维空间中的人脸图像投影到一个低维子空间中,在这个低维子空间中对特征系数进行分类识别。传统的子空间分析法一般采用主成分分析(Principal Components Analysis,PCA)、稀疏非负矩阵分解(Sparse Non-negative Matrix Factorization,SNMF)、凸非负矩阵分解(Convex NMF,CNMF)等特征降维方法。
非负矩阵分解是在矩阵的所有元素均非负的条件下实现矩阵的分解。图像灰度值的非负性使得非负矩阵分解较无限制的主成分分析更具有可解释性。直接用NMF进行人脸特征提取,由于基矩阵没有被优化和稀疏,导致人脸识别率不高;SNMF通过对NMF计算得到的基矩阵进行稀疏,可一定程度上提高人脸识别率。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
现有SNMF分解方法均采用的是乘性迭代规则,导致基矩阵不够优化,识别率不高;现有SNMF虽然能够在NMF的基础上提高人脸识别率,但识别率较高的SNMF方法,其运算量过大,速度过慢;而运算量小速度快的SNMF方法,其人脸识别率仍然不高,最高仅达到89%,而且随着R的增大,识别率反而是降低的,不利于后期人脸图像的重建。
发明内容
为了解决现有技术中SNMF的人脸识别率不高、运算量大、不利于图像重建等问题,本发明实施例提供了一种人脸识别方法和装置。所述技术方案如下:
第一方面,本发明实施例提供了一种人脸识别方法,所述方法包括:对待识别样本集进行预处理,得到待识别样本集的非负矩阵;采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行处理,求出所述待识别样本集的最优基矩阵和最优系数矩阵,所述待识别样本集的最优基矩阵和最优系数矩阵采用如下迭代公式迭代产生:
其中,S为所述待识别样本集的非负矩阵,大小为I×J,I、J均为正整数,I为所述待识别样本集中每个样本的低频特征维度,J为所述待识别样本集的样本数量;P'表示第n次迭代得到的基矩阵,P表示第n+1次迭代得到的基矩阵,P'和P大小均为I×R,R表示P的特征维度,R为正整数且I≥R;Q'表示第n次迭代得到的系数矩阵,Q表示第n+1次迭代得到的系数矩阵,Q'和Q大小均为R×J;P′T为P'的转置矩阵,Q′T为Q'的转置矩阵;Pir为P的第i行第r列的元素,Qrj为Q的第r行第j列的元素,P′ir为P'的第i行第r列的元素,Q′rj为Q'的第r行第j列的元素,i、r、j和n均为正整数,且i≤I,r≤R,j≤J;当J(P,Q)的值最小时,P为最优基矩阵,Q为最优系数矩阵,
采用训练好的分类器对所述待识别样本集的最优系数矩阵进行分类,完成人脸识别。
在本发明实施例的一种实现方式中,所述采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行处理,求出所述待识别样本集的最优基矩阵和最优系数矩阵,包括:在设定范围内确定R的值;对于确定出的R的值,采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行分解,求出R对应的所述待识别样本集的最优基矩阵和最优系数矩阵。
在本发明实施例的另一种实现方式中,所述对于确定出的R的值,采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行分解,求出R对应的所述待识别样本集的最优基矩阵和最优系数矩阵,包括:根据R确定初始基矩阵和初始系数矩阵;根据所述初始基矩阵和初始系数矩阵以及所述迭代公式进行迭代计算;将每一步迭代计算出的基矩阵和系数矩阵代入目标函数:
当所述目标函数的值达到稳定状态,结束迭代计算,并将最后一次迭代计算出的基矩阵和系数矩阵作为所述待识别样本集的最优基矩阵和最优系数矩阵,其中,所述稳定状态是指所述目标函数的值保持不变或者变动幅度小于预定幅度;或者,当迭代次数达到迭代次数阈值时,选取最后一次迭代计算出的基矩阵和系数矩阵作为最优基矩阵和最优系数矩阵。
在本发明实施例的另一种实现方式中,所述对于确定出的R的值,采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行分解,求出R对应的所述待识别样本集的最优基矩阵和最优系数矩阵,还包括:确定稀疏化阈值;在每一步迭代计算后,判断迭代计算出的基矩阵中的每个数值与稀疏化阈值的大小;将迭代计算出的基矩阵中大于稀疏化阈值的数值设置为1,将迭代计算出的基矩阵中小于或等于稀疏化阈值的数值设置为0。
在本发明实施例的另一种实现方式中,所述方法还包括:对训练样本集进行预处理,得到训练样本集的非负矩阵;采用新加性迭代稀疏非负矩阵分解法对所述训练样本集的非负矩阵进行处理,求出所述训练样本集的最优基矩阵和最优系数矩阵,所述最优基矩阵和最优系数矩阵采用与所述待识别样本集处理时相同的迭代公式迭代产生;采用所述训练样本集的最优系数矩阵训练分类器。
第二方面,本发明实施例还提供了一种人脸识别装置,所述装置包括:预处理单元,用于对待识别样本集进行预处理,得到待识别样本集的非负矩阵;分解单元,用于采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行处理,求出所述待识别样本集的最优基矩阵和最优系数矩阵,所述待识别样本集的最优基矩阵和最优系数矩阵采用如下迭代公式迭代产生:
其中,S为所述待识别样本集的非负矩阵,大小为I×J,I、J均为正整数,I为所述待识别样本集中每个样本的低频特征维度,J为所述待识别样本集的样本数量;P'表示第n次迭代得到的基矩阵,P表示第n+1次迭代得到的基矩阵,P'和P大小均为I×R,R表示P的特征维度,R为正整数且I≥R;Q'表示第n次迭代得到的系数矩阵,Q表示第n+1次迭代得到的系数矩阵,Q'和Q大小均为R×J;P′T为P'的转置矩阵,Q′T为Q'的转置矩阵;Pir为P的第i行第r列的元素,Qrj为Q的第r行第j列的元素,P′ir为P'的第i行第r列的元素,Q′rj为Q'的第r行第j列的元素,i、r、j和n均为正整数,且i≤I,r≤R,j≤J;当J(P,Q)的值最小时,P为最优基矩阵,Q为最优系数矩阵,
分类单元,用于采用训练好的分类器对所述待识别样本集的最优系数矩阵进行分类,完成人脸识别。
在本发明实施例的一种实现方式中,所述分解单元,用于在设定范围内确定R的值;对于确定出的R的值,采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行分解,求出R对应的所述待识别样本集的最优基矩阵和最优系数矩阵。
在本发明实施例的另一种实现方式中,所述分解单元,用于根据R确定初始基矩阵和初始系数矩阵;根据所述初始基矩阵和初始系数矩阵以及所述迭代公式进行迭代计算;将每一步迭代计算出的基矩阵和系数矩阵代入目标函数:
当所述目标函数的值达到稳定状态,结束迭代计算,并将最后一次迭代计算出的基矩阵和系数矩阵作为所述待识别样本集的最优基矩阵和最优系数矩阵,其中,所述稳定状态是指所述目标函数的值保持不变或者变动幅度小于预定幅度(该预定幅度可以根据实际需要设定);或者,当迭代次数达到迭代次数阈值时,选取最后一次迭代计算出的基矩阵和系数矩阵作为最优基矩阵和最优系数矩阵。
在本发明实施例的另一种实现方式中,所述分解单元,还用于确定稀疏化阈值;在每一步迭代计算后,判断迭代计算出的基矩阵中的每个数值与稀疏化阈值的大小;将迭代计算出的基矩阵中大于稀疏化阈值的数值设置为1,将迭代计算出的基矩阵中小于或等于稀疏化阈值的数值设置为0。
在本发明实施例的另一种实现方式中,所述装置还包括训练单元;所述预处理单元,还用于对训练样本集进行预处理,得到训练样本集的非负矩阵;所述分解单元,还用于采用新加性迭代稀疏非负矩阵分解法对所述训练样本集的非负矩阵进行处理,求出所述训练样本集的最优基矩阵和最优系数矩阵,所述最优基矩阵和最优系数矩阵采用与所述待识别样本集处理时相同的迭代公式迭代产生;所述训练单元,用于采用所述训练样本集的最优系数矩阵训练分类器。
第三方面,本发明实施例提供了一种人脸识别装置,所述装置包括:存储器、与存储器连接的处理器,所述存储器用于存储软件程序以及模块,当所述处理器用于运行或执行存储在所述存储器内的软件程序以及模块时,可以执行第一方面所述的方法。
第四方面,本发明实施例还提供了一种计算机可读介质,用于存储供人脸识别装置执行的程序代码,所述程序代码包括执行第一方面所述的方法的指令。
本发明实施例提供的技术方案带来的有益效果是:
本发明采用新加性迭代规则进行迭代优化求解最优基矩阵和最优系数矩阵,比传统的乘性迭代规则更优,得到的最优基矩阵的特征数据更为集中,从而使得最优系数矩阵的权重分布更集中、更易于分类,有效提高了人脸识别率和减少了运算量,最终使得该人脸识别方法具有较高的识别率和较短的运行时间,识别率高达99%。而且本发明方法随着R的增大,识别率逐渐增高,有利于后期人脸图像的重建。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的人脸识别方法流程图;
图2a-图2d是PCA及各种NMF方法得到的基矩阵图像;
图3是PCA及各种NMF方法的人脸识别率随R的变化示意图
图4是PCA及各种NMF方法的运行时间随R的变化示意图
图5是本发明实施例提供的人脸识别装置结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是本发明实施例提供的一种人脸识别方法的流程图,参见图1,该方法包括:
步骤S11:获取训练样本集,并表示为初始非负矩阵。
在本发明实施例中,获取训练样本集包括但不限于从已有的网络图库中获取训练样本集,或者根据图像制得训练样本集,这里的图像可以事先拍摄获得。
例如,可以采用剑桥大学提供的ORL(Olivetti Research Laboratory)图库中的人脸作为训练样本集。ORL图库中共收集了40个人的不同表情的人脸图像,每人各10张图像共400张,每张图像有256个灰度级,大小为112×92。其中每个人的脸部表情和脸部细节都有着不同程度的变化,如笑与不笑、眼睛睁与闭、戴与不戴眼镜等;人脸姿态也有相当程度的变化,深度旋转和平面旋转最大可达20度;人脸的尺度也有多达10%的变化。对每个人随机选取5张图像组成训练样本集。这样训练样本集中有200张人脸图像。当然,这里的训练样本集的获取仅为举例,实际中还可以通过其他数据库或者用户自身准备的图像实现。
训练样本集通常包括多张样本图像,这多张图像构成一个非负矩阵。以上述训练样本集为例,200张样本图像,每个样本图像包括10304(112×92)个像素,则这个训练样本集构成的初始非负矩阵V'的大小为10304×200。
步骤S12:对训练样本集进行预处理,得到训练样本集的非负矩阵,该训练样本集的非负矩阵为包含训练样本集中每张图像的低频特征信息的非负矩阵。
由于步骤S11已将训练样本集表示为初始非负矩阵,所以步骤S12实际是以初始非负矩阵为对象进行的预处理。
由于在人脸识别时,光照条件、摄像设备等外部环境的影响,以及表情、姿态变化、年龄、遮盖等人脸自身变化,都使获得图像往往存在有噪声、对比度不够等缺陷,数据与现实相差很大,对算法的识别率影响很大。为了保证提取的特征对人脸变化具有较好的鲁棒性,需要对人脸图像进行预处理。通过对人脸图像进行预处理,能够去除一定的噪声和光照的影响,降低高频信息对识别率的干扰。在本发明实施例中,对人脸图像进行预处理可以包括以下步骤:
第一步,对人脸图像进行直方图均衡化,从而能够提高细节对比度。直方图均衡化是指将一张图像的像素值均匀地分布在图像的各个区间上,从而使图像的视觉效果得到改善,提高图像的对比度。直方图均衡化后,各级灰度比例趋向平衡;经过直方图均衡化后,图像的细节成分会更加清楚。
第二步,对直方图均衡化后的人脸图像进行灰度归一化。
灰度归一化用来对原始图像的光照不均进行补偿,从而克服光照变化对识别带来的影响,具有一定的鲁棒性。主要过程如下:给定图像的灰度均值和方差,用线性的方法将给定值赋予灰度均值和方差,这样可以统一图像的亮度和对比度,使得所有人脸图像都遵循相同或相似的灰度分布。通过对图像进行灰度归一化,可以克服光照变化对识别效果的影响。
第三步,采用小波变换提取人脸图像低频信息。
小波变换是时间和频率的局部变换,能更加有效地从信号中提取信息和分析局部信号,在时域、频域都有很强的表征信号局部特征的能力。
用小波提取人脸图像的特征,主要使用小波提取人脸图像的低频信息,减少作为噪声的图像高频信息在识别分类时的干扰。输入的人脸图像经过二维离散小波变换(一层小波分解)后会产生4个子图像(LL,LH,HL,HH)。其中,LL是低频成分(含有人脸图像的低频信息),包含了原始图像的大部分信息,可以作为原始图像的近似,同时大大压制了随机噪声等高频信息。继续对LL低频子图像进行二维离散小波变换后得到包含样本大量低频信息的非负矩阵V。
通过上述预处理最终得到包含低频信息(低频特征)的训练样本集的非负矩阵V,该矩阵的大小为I×J,I为训练样本集中每个样本的低频特征维度,J为训练样本集中的样本数量,I、J均为正整数。以前文大小为10304×200的初始非负矩阵V'为例,该非负矩阵V'经过上述预处理后得到的训练样本集的非负矩阵V的大小为2784×200。
在本发明实施例这,预处理方法不限于上述步骤S12所包括的第一步至第三步,还可以采用其他方式实现,如均值滤波、中值滤波等。本发明对此不做限制。
步骤S13:采用新加性迭代稀疏非负矩阵分解法对训练样本集的非负矩阵进行处理,求出训练样本集的最优基矩阵和最优系数矩阵,训练样本集的最优基矩阵和最优系数矩阵采用如下迭代公式迭代产生:
其中,V为训练样本集的非负矩阵,大小(维度)为I×J,I、J均为正整数,I为训练样本集中每个样本(即每张图像)的低频特征维度,J为训练样本集的样本数量(即图像数量);W'表示第n次迭代得到的表示基矩阵,W表示第n+1次迭代得到的基矩阵,基矩阵中包含的是图像的特征数据,大小为I×R,R表示W的特征维度,R为正整数且I≥R;H'表示第n次迭代得到的系数矩阵,H表示第n+1次迭代得到的系数矩阵,系数矩阵中包含的是图像特征的权重系数,大小为R×J;W′T为W'的转置矩阵,H′T为H'的转置矩阵;Wir为W的第i行第r列的元素,Hrj为H的第r行第j列的元素,W′ir为W'的第i行第r列的元素,H′rj为H'的第r行第j列的元素,i、r、j和n均为正整数,且i≤I,r≤R,j≤J;当J(W,H)的值最小时,W为最优基矩阵,H为最优系数矩阵,
其中,训练样本集的非负矩阵也即前文训练样本集的初始非负矩阵经过预处理后得到的矩阵,W具体为第n+1次迭代得到的训练样本集的非负矩阵的基矩阵,H为第n+1次迭代得到的训练样本集的非负矩阵的系数矩阵。
采用上述公式可以对基矩阵和系数矩阵中的每个元素进行迭代,这些元素构成基矩阵和系数矩阵,所以通过矩阵中元素的迭代,即完成了对基矩阵和系数矩阵的迭代运算。
在上述公式中,(VH'T)ir表示V乘以H'T(H'的转置矩阵)得到的矩阵中的第i行第r个元素。其他括号运算与之类似,这里不再赘述。
例如,V的大小为2784×200,当R=35时,即特征维度被降至35,W的大小为2784×35,H的大小为35×200;或者,当R=20时,此时特征维度被降至20,W的大小为2784×20,H的大小为20×200。
在步骤S13中,迭代公式是根据新加性迭代稀疏非负矩阵分解法确定得到的,其原理如下:
首先,将非负矩阵V看成含加性噪声的线性混合体模型,则非负矩阵分解的初始目标函数为:
令α′,β′<0,采用梯度下降法得到公式(2)。因为梯度偏导对应的向量是目标函数J增加最快方向,所以当α′,β′取负值,则式(2)是向目标函数J减少最快的方向迭代。
由式(1)求偏导,可得到代入式(2),可得到迭代规则(3),其中α,β>0:
设置新的迭代步长权重α、β如下:
由于α,β>0,所以在式(3)中设置此α、β是满足梯度迭代下降准则的,即一定会使目标函数(1)减小。基于新的迭代步长权重(4)、(5),可得到W、H的加性迭代规则如式(6)、(7)所示:
在上述公式中,最优基矩阵W和最优系数矩阵H能够满足残差值J(W,H)最小,使得W×H得到的数据能够尽可能地还原原始图像。在本发明实施例中,步骤S13可以包括:
在设定范围内确定R的值;对于确定出的R的值,采用新的加性迭代稀疏非负矩阵分解法对非负矩阵进行分解,求出R对应的训练样本集的最优基矩阵和最优系数矩阵。
在本发明实施例中,设定范围优选为175≥R≥20。R取值过小时,维度降至过低导致特征丢失严重,而随着R的增加,人脸轮廓各部分主要器官会逐渐显露,细节部分越来越清晰,即R的值越大,重建图像的效果就越好,所以R的取值不宜过小,当R小于20时,基矩阵特征维度过低,特征过多丢失,会导致后期图像重建失真严重;当R接近I时,重建的人脸图像与原始图像一样的清晰,没有视觉上的任何差异。但是R过大会导致计算时间过长,且识别率已经到达上限,不会随着R的增大而无限增大,所以R的取值不宜过大,当R超过175时,运行时间过长且识别率保持99%不变。因此本发明实施例中,设定R范围为175≥R≥20。
具体地,对于确定的R的值,采用新加性迭代稀疏非负矩阵分解法对训练样本集的非负矩阵进行分解,包括:
第一步,根据R确定初始基矩阵和初始系数矩阵。在本发明实施例中,第一步采用如下方式完成:按照初始基矩阵和初始系数矩阵的维度分别产生随机矩阵。即产生维度为I×R的随机矩阵和R×J的随机矩阵,且随机数值在0-1之间。
第二步,根据初始基矩阵和初始系数矩阵以及迭代公式进行迭代计算。
第三步,将每一步迭代计算出的基矩阵和系数矩阵代入目标函数:
当目标函数的值达到稳定状态,结束迭代计算,并将最后一次迭代计算出的基矩阵和系数矩阵作为训练样本集的最优基矩阵和最优系数矩阵;或者,当迭代次数达到迭代次数阈值时,选取最后一次迭代计算出的基矩阵和系数矩阵作为训练样本集的最优基矩阵和最优系数矩阵。
利用公式(6)、(7)进行迭代计算,每次迭代计算出新的Wir和Hrj,由Wir和Hrj计算J(W,H)的取值;随着迭代次数增多,J(W,H)值不断减小,当J(W,H)的取值达到稳定状态时,结束迭代,且将最后一次迭代得到的Wir和Hrj所构成的W和H矩阵作为最优基矩阵和最优系数矩阵。这里稳定状态是指,J(W,H)的取值保持不变或者变动幅度小于预定幅度,例如J(W,H)的取值变化小于千分之一时,认为J(W,H)的取值达到稳定状态。另外,由于本发明实施例采用的迭代算法为梯度下降算法,所以迭代出的结果能够使J(W,H)的取值越来越小,所以稳定后直接选取最后一次的迭代结果作为最优基矩阵和最优系数矩阵。
或者,当迭代次数达到预定的迭代次数时,选取最后一次迭代得到的W和H作为最优基矩阵和最优系数矩阵。例如,预定的迭代次数为300次,且在300次迭代结束时,J(W,H)的取值仍未保持不变,选取最后一次迭代得到的W和H作为最优基矩阵和最优系数矩阵。
在进行新加性迭代的同时需要对基矩阵进行稀疏化。稀疏化基矩阵的过程包括:确定稀疏化阈值;在每一步迭代计算后,判断迭代计算出的基矩阵中的每个数值与稀疏化阈值的大小;将迭代计算出的基矩阵中大于稀疏化阈值的数值设置为1,将迭代计算出的基矩阵中小于或等于稀疏化阈值的数值设置为0。下一步迭代时,采用该稀疏化后的基矩阵。该稀疏化阈值为一个预设置,可以根据实际需要提前给定。
在迭代中利用阈值化方法将基矩阵稀疏化为0、1矩阵,可使得图像基矩阵中的特征数据更集中、更稀疏、更加突出人脸特征,能够有效提取出能突出表现人脸特征的特征集,并使得对应的系数矩阵中的权重系数更集中,更易于分类,从而提高识别率;同时,处理后的矩阵稀疏化,降低了矩阵运算量,加快了本发明的计算速度。
在本发明实施例中,W'、H'初始值都是0-1之间的随机数矩阵,因此,稀疏化阈值的选定范围在0-1之间。优选地,该稀疏化阈值可以设置为0.01。
步骤S14:采用训练样本集的最优系数矩阵训练分类器。
在本发明实施例中,分类器为支持向量机(Support Vector Machine,SVM)分类器。SVM实质上是一个二类分类器,而将多个类别的人脸进行训练分类是一个典型的多分类问题。SVM处理多分类问题可采用“一对一”和“一对多”两种策略,而“一对一”策略的分类的结果更为精确。因此,本发明采用的是“一对一”的策略,将样本的N类进行两两分类,构造N(N-1)/2个分类器。例如,人脸样本的类别总数N为40时,采用“一对一”方法构造780个分类器。
不同的R的值对应训练样本集的最优基矩阵的维度不同,维度越大,特征数据保留越多,分类识别率越高。在步骤S14,优选地,采用R=175的训练样本集的最优系数矩阵来训练分类器,保证较高的识别率。
将训练样本集的最优系数矩阵的转置矩阵HT和类别标签矩阵Y作为上述SVM分类器的输入训练集,用该训练集训练分类器。类别标签矩阵是在做二分类时使用的用于标记样本类别的矩阵,其数据只有两个值如0、1,每个值分别代表了人脸样本所属的类别,如1代表一类,0代表另一类(二分类)。
具体训练过程为:分解得到的训练样本集的最优系数矩阵H大小为R×200,将H转置得到大小为200×R的矩阵HT。因为40类人中每类人的人脸训练样本是5张图像,所以要区分第p类(39≥p≥1)和第q类(40≥q≥p+1)样本(二分类问题)时,HT中属于第p类的共有5个样本,属于第q类的共有5个样本。第p类样本构成大小为5×R(175≥R≥20)的矩阵X1,其类别标签矩阵为5×1的全1列向量Y1,第q类样本构成大小为5×R(175≥R≥20)的矩阵X2,其类别标签矩阵为全0的列向量Y2。将矩阵X1和X2组合成大小为10×R的样本矩阵X,Y1和Y2组合成10×1的类别标签矩阵Y,将X、Y矩阵作为SVM分类器的输入训练集,通过SVM算法算出能正确划分第p类和第q类样本的二分类器参数信息。p从1连续取值到39,同时q从p+1连续取值到40,即共需40(40-1)/2次SVM计算,将每次算出的正确的二分类的参数连续存储在一个文件里,即可得到多分类器参数文件,分类时调用该文件,获取多分类器的参数信息。
步骤S15:对待识别样本集进行预处理,得到待识别样本集的非负矩阵。
在本发明实施例中,待识别样本集既可以是实际需要进行分类的人脸图像的集合,也可以是用来进行测试的人脸图像的集合,本发明对其获取的方式不做限制。待识别样本集也是由多张人脸图像构成,例如,由多类人(如40类人)的多张人脸图像构成200张样本图像,每个样本图像包括10304(112×92)个像素,则这个待识别样本集构成的初始非负矩阵S'的大小为10304×200。
在步骤S15中对待识别样本集的初始非负矩阵进行预处理的过程与步骤S12中对训练样本集的初始非负矩阵进行预处理的过程相同,这里不再赘述。通过S12预处理过程,最终得到包含低频信息的待识别样本集的非负矩阵S,该矩阵的大小为I×J,I为待识别样本集中每个样本的低频特征维度,J为待识别样本集中的样本数量,I、J均为正整数。以前文大小为10304×200的初始非负矩阵S'为例,经过预处理后得到的待识别样本集的非负矩阵S的大小为2784×200。
步骤S16:采用新加性迭代稀疏非负矩阵分解法对待识别样本集的非负矩阵进行处理,求出待识别样本集的最优基矩阵和最优系数矩阵,待识别样本集的最优基矩阵和最优系数矩阵采用如下迭代公式迭代产生:
其中,S为所述待识别样本集的非负矩阵,大小为I×J,I、J均为正整数,I为所述待识别样本集中每个样本的低频特征维度,J为所述待识别样本集的样本数量;P'表示第n次迭代得到的基矩阵,P表示第n+1次迭代得到的基矩阵,P'和P大小均为I×R,R表示P的特征维度,R为正整数且I≥R;Q'表示第n次迭代得到的系数矩阵,Q表示第n+1次迭代得到的系数矩阵,Q'和Q大小均为R×J;P′T为P'的转置矩阵,Q′T为Q'的转置矩阵;Pir为P的第i行第r列的元素,Qrj为Q的第r行第j列的元素,P′ir为P'的第i行第r列的元素,Q′rj为Q'的第r行第j列的元素,i、r、j和n均为正整数,且i≤I,r≤R,j≤J;当J(P,Q)的值最小时,P为最优基矩阵,Q为最优系数矩阵,
其中,待识别样本集的非负矩阵也即前文待识别样本集的初始非负矩阵经过预处理后得到的矩阵,P具体为第n+1次迭代得到的待识别样本集的非负矩阵的基矩阵,Q为第n+1次迭代得到的待识别样本集的非负矩阵的系数矩阵。
在步骤S16对采用新加性迭代稀疏非负矩阵分解法对待识别样本集的非负矩阵进行处理的过程,与在步骤S13中采用新加性迭代稀疏非负矩阵分解法对训练样本集的非负矩阵进行处理的过程相同,这里不再赘述。
不同R的值对应不同的分解维度,分解维度越大,特征丢失越少,分类识别越准确。在步骤S16中,优选地,采用R=175对待识别样本集的非负矩阵进行分解,从而保证较高的识别率。
步骤S17:采用训练好的分类器对待识别样本集的最优系数矩阵进行分类,完成人脸识别。
对待识别样本集的最优系数矩阵进行分类,比直接用待识别样本集的非负矩阵进行分类,特征更集中,运算量更小。在本发明实施例中,采用分类器对待识别样本集的最优系数矩阵进行分类可以包括:对待识别样本集的最优系数矩阵进行转置处理,采用分类器对转置处理后的待识别样本集的最优系数矩阵进行分类。
分类识别过程为:大小为R×200的系数矩阵,转置得到大小为200×R的矩阵QT,输入至SVM分类器进行分类,并定义一个类别投票矩阵用于对系数矩阵中的每个样本所属类别进行投票,类别投票矩阵大小为m×s,其中m为样本总个数200,s为类别总数40。调用S14中训练得到的多分类器参数文件,对200个样本中每一个样本依次进行二分类判断,判断其是属于第p类还是第q类,p从1连续取值到39,同时q从p+1连续取值到40。如果该样本被判断为属于第p类,那么类别投票矩阵的第p列加1,即对第p列投1票;反之,如果该样本被分类器判断为第q类,则类别投票矩阵的第q列加1,即对第q列投1票。统计类别投票矩阵的所有列中得票最多的那一列的列编号就是该样本的类别编号。统计200个样本的分类情况,可以得到大小为200×1的类别编号矩阵。类别编号矩阵的行值对应样本个数,列值对应的样本所属类别编号。实验表明,采用SVM“一对一”分类器能够正确分类识别不同表情属于同一张人脸。
如果需要进行分类识别的图像数量超过这个数量时,可以同时扩大训练样本集的初始非负矩阵和待识别样本集的初始非负矩阵的维数即可。如80个人的1600张人脸,每人20张人脸,若每个人随机选取10张图像组成训练样本集,剩下的每个人的10张图像组成待识别样本集,则训练样本集和待识别样本集中各有800张人脸图像,若每张图像大小为130×100,则扩大训练样本集初始非负矩阵V'和待识别样本集初始非负矩阵S'的维数均为I'×J',其中I'=13000,J'=800,依次采用步骤S12-S17,即可完成分类识别。如果需要进行分类识别的图像数量小于这个数量时,可以缩小训练样本集的初始非负矩阵和待识别样本集初始非负矩阵的维数即可。如20个人,每个人10张人脸图像,共计200张图像,若每人随机选取5张作为训练样本集,剩下5张作为待识别样本集,则训练样本集和待识别样本集中各有100张人脸图像。若每张图像大小为90×60,则指定训练样本集初始非负矩阵V'和待识别样本集初始非负矩阵S'的维数均为I'×J':I'=5400,J'=100,执行步骤S12-S17,即可完成分类识别。
当进行分类识别时,如果待识别图像在训练集中不存在,此时可以将该待识别图像加入到训练集中,采用新加性迭代稀疏非负矩阵分解法重新计算得到新的最优基矩阵和最优系数矩阵;并用新的最优系数矩阵作为输入,重新训练分类器。
下面通过对比测试,对本发明实施例提供的人脸识别方法的效果进行说明:
对比测试中采用的三种对比方法分别为:a、PCA方法;b、基本SNMF方法;c、CNMF方法。本发明实施例提供的方法为:d、新加性迭代SNMF方法。
取ORL图库中每人各10张图像共400张,每张图像有256个灰度级,大小为112×92。其中每个人的脸部表情和脸部细节都有着不同程度的变化,如笑与不笑、眼睛睁与闭、戴与不戴眼镜等;人脸姿态也有相当程度的变化,深度旋转和平面旋转最大可达20度;人脸的尺度也有多达10%的变化。对每个人随机选取前5张图像作为训练图像,构成训练样本集,剩下的5张作为待识别图像,构成待识别样本集。这样训练样本集和待识别样本集中各有200张。
图2a-图2d分别是本发明实施例提供的a-d四种方法从训练样本集中得到的最优基矩阵图像。b方法采用的乘性迭代方法,d方法对b方法进行改进,采用新加性迭代规则优化、稀疏基矩阵。由图2可看出,d方法得到的最优基矩阵图像如图2d所示,能够准确反映人脸眼睛、鼻子的位置特征信息,使得人脸特征数据更加集中、稀疏;而a、b、c方法得到的最优基矩阵图像如图2a、2b、2c所示,特征信息过于分散模糊,不够集中。因此,相对于a、b、c方法,本发明提出的新加性迭代SNMF方法,算出的最优基矩阵所包含的特征数据更稀疏,特征信息更准确集中,对应的人脸特征的最优系数矩阵的分类会更准确。在R取不同值时的人脸识别率、算法所耗费时间方面,四种方法的对比结果如下表1、表2所示,R连续取值时的四种方法的效果对比曲线,如图3、图4所示。
表1-R取不同值各种NMF方法的人脸识别率对比
R 20 35 55 75 175
方法a 21% 16.5% 18.5% 15.5% 14.5%
方法b 85% 88% 89% 87% 80%
方法c 67% 54% 22% 16% 3%
方法d 90.5% 92% 94% 96% 99%
表2-R取不同值各种NMF方法的运行时间对比(单位:秒)
由表1及图3可知,采用本发明提出的新加性迭代SNMF方法,可大幅度提高人脸识别率,识别率要明显高于a-c三种方法;这是由于本发明的技术方案中发明的新加性迭代规则比传统的乘性迭代规则更优,所得到的最优基矩阵和最优系数矩阵数据更集中更稀疏。由图3可知,本发明提出的新加性迭代SNMF方法随着R的增加,识别率不断增大,当R=175时,识别率高达99%,R继续增大时,识别率保持99%不变;而方法b提供的SNMF方法,当R增至55时,识别率最高,仅为89%,且R继续增大,识别率反而降低;方法a和方法c的识别率较低,且随着R增大识别率不断降低。而R越大,图像重建越准确,因此由图3可知,只有本发明所提出的新加性迭代SNMF方法能够保证在较高的识别率下,也能取得较高的R的值,从而保证能更好地重建图像。
由表2和图4中给出的各种方法所需要的运算时间,可知本发明提供的新加性迭代SNMF方法识别速度最快,尤其当R不断增大时本发明提出的方法仍然较其他三种方法更快。这是因为本发明的技术方案中发明的新加性迭代规则可得到最优稀疏基矩阵和最优系数矩阵,减少计算量。
由图3和图4可知,已有的a、b、c三种方法,随着R的增加,其识别率不断降低,所耗费时间却不断增加;随着R的增加,本发明的技术方案虽然运行时间有所增加,但识别率不断增高;同时,本发明提供的方法d在识别率最高为99%时R取值为175,而其他方法的识别率最高时的R取值均比较小,而R越大,后期图像重建越准确。因此,综合考虑算法时间、识别率的总体性能及后期图像重建的准确率,本发明所提方法要明显优于已有的相关的a、b、c三种方法。
基于本发明实施例提供的新加性迭代SNMF方法,综合考虑识别率、运算时间,后期图像重建等因素,选择R=175,编写了基于MATLAB的人脸识别软件,从200张人脸中以99%的概率随机挑出不同人的待识别人脸图像,在不同表情、眼睛睁与闭、是否戴眼镜的情况下,软件均分类识别正确。软件能在99%的概率下挑出一个人进行正确识别并输出标识此人身份的正面脸,同时在软件界面文本框中能正确给出该人脸所属类别及待识别样本集的识别率。
综上所述,本发明提供的基于新加性迭代SNMF方法的人脸识别技术,有较高的理论价值;同时本发明的技术方案能取得极高的人脸识别率,且计算时间短,并能够保证后期人脸重建较高的准确率,且此技术已通过软件实现,工程应用价值大。
图5是本发明实施例提供了一种人脸识别装置的结构示意图,参见图5,该装置包括:
预处理单元201,用于对待识别样本集进行预处理,得到待识别样本集的非负矩阵;
分解单元202,用于采用新加性迭代稀疏非负矩阵分解法对待识别样本集的非负矩阵进行处理,求出待识别样本集的最优基矩阵和最优系数矩阵,待识别样本集的最优基矩阵和最优系数矩阵采用如下迭代公式迭代产生:
其中,S为所述待识别样本集的非负矩阵,大小为I×J,I、J均为正整数,I为所述待识别样本集中每个样本的低频特征维度,J为所述待识别样本集的样本数量;P'表示第n次迭代得到的基矩阵,P表示第n+1次迭代得到的基矩阵,P'和P大小均为I×R,R表示P的特征维度,R为正整数且I≥R;Q'表示第n次迭代得到的系数矩阵,Q表示第n+1次迭代得到的系数矩阵,Q'和Q大小均为R×J;P′T为P'的转置矩阵,Q′T为Q'的转置矩阵;Pir为P的第i行第r列的元素,Qrj为Q的第r行第j列的元素,P′ir为P'的第i行第r列的元素,Q′rj为Q'的第r行第j列的元素,i、r、j和n均为正整数,且i≤I,r≤R,j≤J;当J(P,Q)的值最小时,P为最优基矩阵,Q为最优系数矩阵,
分类单元203,用于采用训练好的分类器对待识别样本集的最优系数矩阵进行分类,完成人脸识别。
在本发明实施例中,分解单元202,用于在设定范围内确定R的值;对于确定出的R的值,采用新加性迭代稀疏非负矩阵分解法对待识别样本集的非负矩阵进行分解,求出R对应的所述待识别样本集的最优基矩阵和最优系数矩阵。
在本发明实施例中,设定范围优选可以为175≥R≥20。
在本发明实施例中,分解单元202,用于根据R确定初始基矩阵和初始系数矩阵;根据初始基矩阵和初始系数矩阵以及迭代公式进行迭代计算;将每一步迭代计算出的基矩阵和系数矩阵代入目标函数:
当目标函数的值达到稳定状态,结束迭代计算,并将最后一次迭代计算出的基矩阵和系数矩阵作为待识别样本集的最优基矩阵和最优系数矩阵,其中,稳定状态是指目标函数的值保持不变或者变动幅度小于预定幅度;或者,当迭代次数达到迭代次数阈值时,选取最后一次迭代计算出的基矩阵和系数矩阵作为待识别样本集的最优基矩阵和最优系数矩阵。
在本发明实施例中,分解单元202,还用于确定稀疏化阈值;在每一步迭代计算后,判断迭代计算出的基矩阵中的每个数值与稀疏化阈值的大小;将迭代计算出的基矩阵中大于稀疏化阈值的数值设置为1,将迭代计算出的基矩阵中小于或等于稀疏化阈值的数值设置为0。
进一步地,该装置还包括训练单元204;
预处理单元201,还用于对训练样本集进行预处理,得到训练样本集的非负矩阵;
分解单元202,还用于采用新加性迭代稀疏非负矩阵分解法对训练样本集的非负矩阵进行处理,求出训练样本集的最优基矩阵和最优系数矩阵,最优基矩阵和最优系数矩阵采用与待识别样本集处理时相同的迭代公式迭代产生;
训练单元204,用于采用所述训练样本集的最优系数矩阵训练分类器。
需要说明的是:上述实施例提供的人脸识别装置在人脸识别时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的人脸识别装置与人脸识别方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种人脸识别方法,其特征在于,所述方法包括:
对待识别样本集进行预处理,得到待识别样本集的非负矩阵;
采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行处理,求出所述待识别样本集的最优基矩阵和最优系数矩阵,所述待识别样本集的最优基矩阵和最优系数矩阵采用如下迭代公式迭代产生:
<mrow> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mi>r</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>P</mi> <mrow> <mi>i</mi> <mi>r</mi> </mrow> <mo>&amp;prime;</mo> </msubsup> <mo>+</mo> <msubsup> <mi>P</mi> <mrow> <mi>i</mi> <mi>r</mi> </mrow> <mo>&amp;prime;</mo> </msubsup> <mfrac> <msub> <mrow> <mo>(</mo> <msup> <mi>SQ</mi> <mrow> <mo>&amp;prime;</mo> <mi>T</mi> </mrow> </msup> <mo>)</mo> </mrow> <mrow> <mi>i</mi> <mi>r</mi> </mrow> </msub> <msub> <mrow> <mo>(</mo> <msup> <mi>P</mi> <mo>&amp;prime;</mo> </msup> <msup> <mi>Q</mi> <mo>&amp;prime;</mo> </msup> <msup> <mi>Q</mi> <mrow> <mo>&amp;prime;</mo> <mi>T</mi> </mrow> </msup> <mo>)</mo> </mrow> <mrow> <mi>i</mi> <mi>r</mi> </mrow> </msub> </mfrac> <mo>,</mo> <msub> <mi>Q</mi> <mrow> <mi>r</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>Q</mi> <mrow> <mi>r</mi> <mi>j</mi> </mrow> <mo>&amp;prime;</mo> </msubsup> <mo>+</mo> <msubsup> <mi>Q</mi> <mrow> <mi>r</mi> <mi>j</mi> </mrow> <mo>&amp;prime;</mo> </msubsup> <mfrac> <msub> <mrow> <mo>(</mo> <msup> <mi>P</mi> <mrow> <mo>&amp;prime;</mo> <mi>T</mi> </mrow> </msup> <mi>S</mi> <mo>)</mo> </mrow> <mrow> <mi>r</mi> <mi>j</mi> </mrow> </msub> <msub> <mrow> <mo>(</mo> <msup> <mi>P</mi> <mrow> <mo>&amp;prime;</mo> <mi>T</mi> </mrow> </msup> <msup> <mi>P</mi> <mo>&amp;prime;</mo> </msup> <msup> <mi>Q</mi> <mo>&amp;prime;</mo> </msup> <mo>)</mo> </mrow> <mrow> <mi>r</mi> <mi>j</mi> </mrow> </msub> </mfrac> <mo>;</mo> </mrow>
其中,S为所述待识别样本集的非负矩阵,大小为I×J,I、J均为正整数,I为所述待识别样本集中每个样本的低频特征维度,J为所述待识别样本集的样本数量;P'表示第n次迭代得到的基矩阵,P表示第n+1次迭代得到的基矩阵,P'和P大小均为I×R,R表示P的特征维度,R为正整数且I≥R;Q'表示第n次迭代得到的系数矩阵,Q表示第n+1次迭代得到的系数矩阵,Q'和Q大小均为R×J;P′T为P'的转置矩阵,Q′T为Q'的转置矩阵;Pir为P的第i行第r列的元素,Qrj为Q的第r行第j列的元素,P′ir为P'的第i行第r列的元素,Q′rj为Q'的第r行第j列的元素,i、r、j和n均为正整数,且i≤I,r≤R,j≤J;当J(P,Q)的值最小时,P为最优基矩阵,Q为最优系数矩阵,
采用训练好的分类器对所述待识别样本集的最优系数矩阵进行分类,完成人脸识别。
2.根据权利要求1所述的方法,其特征在于,所述采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行处理,求出所述待识别样本集的最优基矩阵和最优系数矩阵,包括:
在设定范围内确定R的值;
对于确定出的R的值,采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行分解,求出R对应的所述待识别样本集的最优基矩阵和最优系数矩阵。
3.根据权利要求2所述的方法,其特征在于,所述对于确定出的R的值,采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行分解,求出R对应的所述待识别样本集的最优基矩阵和最优系数矩阵,包括:
根据R确定初始基矩阵和初始系数矩阵;
根据所述初始基矩阵和初始系数矩阵以及所述迭代公式进行迭代计算;
将每一步迭代计算出的基矩阵和系数矩阵代入目标函数:
<mrow> <mi>J</mi> <mrow> <mo>(</mo> <mrow> <mi>P</mi> <mo>,</mo> <mi>Q</mi> </mrow> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </munder> <msup> <mrow> <mo>&amp;lsqb;</mo> <msub> <mi>S</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mrow> <mo>(</mo> <mi>P</mi> <mi>Q</mi> <mo>)</mo> </mrow> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&amp;rsqb;</mo> </mrow> <mn>2</mn> </msup> <mo>;</mo> </mrow>
当所述目标函数的值达到稳定状态,结束迭代计算,并将最后一次迭代计算出的基矩阵和系数矩阵作为所述待识别样本集的最优基矩阵和最优系数矩阵,其中,所述稳定状态是指所述目标函数的值保持不变或者变动幅度小于预定幅度;或者,当迭代次数达到迭代次数阈值时,选取最后一次迭代计算出的基矩阵和系数矩阵作为所述待识别样本集的最优基矩阵和最优系数矩阵。
4.根据权利要求3所述的方法,其特征在于,所述对于确定出的R的值,采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行分解,求出R对应的所述待识别样本集的最优基矩阵和最优系数矩阵,还包括:
确定稀疏化阈值;
在每一步迭代计算后,判断迭代计算出的基矩阵中的每个数值与稀疏化阈值的大小;将迭代计算出的基矩阵中大于稀疏化阈值的数值设置为1,将迭代计算出的基矩阵中小于或等于稀疏化阈值的数值设置为0。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
对训练样本集进行预处理,得到训练样本集的非负矩阵;
采用新加性迭代稀疏非负矩阵分解法对所述训练样本集的非负矩阵进行处理,求出所述训练样本集的最优基矩阵和最优系数矩阵,所述最优基矩阵和最优系数矩阵采用与所述待识别样本集处理时相同的迭代公式迭代产生;
采用所述训练样本集的最优系数矩阵训练分类器。
6.一种人脸识别装置,其特征在于,所述装置包括:
预处理单元,用于对待识别样本集进行预处理,得到待识别样本集的非负矩阵;
分解单元,用于采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行处理,求出所述待识别样本集的最优基矩阵和最优系数矩阵,所述待识别样本集的最优基矩阵和最优系数矩阵采用如下迭代公式迭代产生:
<mrow> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mi>r</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>P</mi> <mrow> <mi>i</mi> <mi>r</mi> </mrow> <mo>&amp;prime;</mo> </msubsup> <mo>+</mo> <msubsup> <mi>P</mi> <mrow> <mi>i</mi> <mi>r</mi> </mrow> <mo>&amp;prime;</mo> </msubsup> <mfrac> <msub> <mrow> <mo>(</mo> <msup> <mi>SQ</mi> <mrow> <mo>&amp;prime;</mo> <mi>T</mi> </mrow> </msup> <mo>)</mo> </mrow> <mrow> <mi>i</mi> <mi>r</mi> </mrow> </msub> <msub> <mrow> <mo>(</mo> <msup> <mi>P</mi> <mo>&amp;prime;</mo> </msup> <msup> <mi>Q</mi> <mo>&amp;prime;</mo> </msup> <msup> <mi>Q</mi> <mrow> <mo>&amp;prime;</mo> <mi>T</mi> </mrow> </msup> <mo>)</mo> </mrow> <mrow> <mi>i</mi> <mi>r</mi> </mrow> </msub> </mfrac> <mo>,</mo> <msub> <mi>Q</mi> <mrow> <mi>r</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <msubsup> <mi>Q</mi> <mrow> <mi>r</mi> <mi>j</mi> </mrow> <mo>&amp;prime;</mo> </msubsup> <mo>+</mo> <msubsup> <mi>Q</mi> <mrow> <mi>r</mi> <mi>j</mi> </mrow> <mo>&amp;prime;</mo> </msubsup> <mfrac> <msub> <mrow> <mo>(</mo> <msup> <mi>P</mi> <mrow> <mo>&amp;prime;</mo> <mi>T</mi> </mrow> </msup> <mi>S</mi> <mo>)</mo> </mrow> <mrow> <mi>r</mi> <mi>j</mi> </mrow> </msub> <msub> <mrow> <mo>(</mo> <msup> <mi>P</mi> <mrow> <mo>&amp;prime;</mo> <mi>T</mi> </mrow> </msup> <msup> <mi>P</mi> <mo>&amp;prime;</mo> </msup> <msup> <mi>Q</mi> <mo>&amp;prime;</mo> </msup> <mo>)</mo> </mrow> <mrow> <mi>r</mi> <mi>j</mi> </mrow> </msub> </mfrac> <mo>;</mo> </mrow>
其中,S为所述待识别样本集的非负矩阵,大小为I×J,I、J均为正整数,I为所述待识别样本集中每个样本的低频特征维度,J为所述待识别样本集的样本数量;P'表示第n次迭代得到的基矩阵,P表示第n+1次迭代得到的基矩阵,P'和P大小均为I×R,R表示P的特征维度,R为正整数且I≥R;Q'表示第n次迭代得到的系数矩阵,Q表示第n+1次迭代得到的系数矩阵,Q'和Q大小均为R×J;P′T为P'的转置矩阵,Q′T为Q'的转置矩阵;Pir为P的第i行第r列的元素,Qrj为Q的第r行第j列的元素,P′ir为P'的第i行第r列的元素,Q′rj为Q'的第r行第j列的元素,i、r、j和n均为正整数,且i≤I,r≤R,j≤J;当J(P,Q)的值最小时,P为最优基矩阵,Q为最优系数矩阵,
分类单元,用于采用训练好的分类器对所述待识别样本集的最优系数矩阵进行分类,完成人脸识别。
7.根据权利要求6所述的装置,其特征在于,所述分解单元,用于在设定范围内确定R的值;对于确定出的R的值,采用新加性迭代稀疏非负矩阵分解法对所述待识别样本集的非负矩阵进行分解,求出R对应的所述待识别样本集的最优基矩阵和最优系数矩阵。
8.根据权利要求7所述的装置,其特征在于,所述分解单元,用于根据R确定初始基矩阵和初始系数矩阵;根据所述初始基矩阵和初始系数矩阵以及所述迭代公式进行迭代计算;将每一步迭代计算出的基矩阵和系数矩阵代入目标函数:
<mrow> <mi>J</mi> <mrow> <mo>(</mo> <mrow> <mi>P</mi> <mo>,</mo> <mi>Q</mi> </mrow> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </munder> <msup> <mrow> <mo>&amp;lsqb;</mo> <msub> <mi>S</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mrow> <mo>(</mo> <mi>P</mi> <mi>Q</mi> <mo>)</mo> </mrow> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>&amp;rsqb;</mo> </mrow> <mn>2</mn> </msup> <mo>;</mo> </mrow>
当所述目标函数的值达到稳定状态,结束迭代计算,并将最后一次迭代计算出的基矩阵和系数矩阵作为所述待识别样本集的最优基矩阵和最优系数矩阵,其中,所述稳定状态是指所述目标函数的值保持不变或者变动幅度小于预定幅度;或者,当迭代次数达到迭代次数阈值时,选取最后一次迭代计算出的基矩阵和系数矩阵作为所述待识别样本集的最优基矩阵和最优系数矩阵。
9.根据权利要求8所述的装置,其特征在于,所述分解单元,还用于确定稀疏化阈值;在每一步迭代计算后,判断迭代计算出的基矩阵中的每个数值与稀疏化阈值的大小;将迭代计算出的基矩阵中大于稀疏化阈值的数值设置为1,将迭代计算出的基矩阵中小于或等于稀疏化阈值的数值设置为0。
10.根据权利要求6-9任一项所述的装置,其特征在于,所述装置还包括训练单元;
所述预处理单元,还用于对训练样本集进行预处理,得到训练样本集的非负矩阵;
所述分解单元,还用于采用新加性迭代稀疏非负矩阵分解法对所述训练样本集的非负矩阵进行处理,求出所述训练样本集的最优基矩阵和最优系数矩阵,所述最优基矩阵和最优系数矩阵采用与所述待识别样本集处理时相同的迭代公式迭代产生;
所述训练单元,用于采用所述训练样本集的最优系数矩阵训练分类器。
CN201710632418.8A 2017-06-16 2017-07-28 人脸识别方法和装置 Active CN107563287B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2017104582005 2017-06-16
CN201710458200 2017-06-16

Publications (2)

Publication Number Publication Date
CN107563287A true CN107563287A (zh) 2018-01-09
CN107563287B CN107563287B (zh) 2019-12-31

Family

ID=60973929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710632418.8A Active CN107563287B (zh) 2017-06-16 2017-07-28 人脸识别方法和装置

Country Status (1)

Country Link
CN (1) CN107563287B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256569A (zh) * 2018-01-12 2018-07-06 电子科技大学 一种复杂背景下的对象识别方法及使用的计算机技术
CN112613583A (zh) * 2021-01-05 2021-04-06 广东工业大学 一种针对低频噪声人脸图像的高频信息提取聚类方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102393910A (zh) * 2011-06-29 2012-03-28 浙江工业大学 一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法
CN103366182A (zh) * 2013-07-05 2013-10-23 西安电子科技大学 基于全监督非负矩阵分解的人脸识别方法
CN103413117A (zh) * 2013-07-17 2013-11-27 浙江工业大学 一种基于局部保持非负矩阵分解的增量学习人脸识别方法
CN103971132A (zh) * 2014-05-27 2014-08-06 重庆大学 应用二维非负稀疏偏最小二乘进行人脸识别的方法
CN104732535A (zh) * 2015-03-18 2015-06-24 河海大学 一种约束稀疏的非负矩阵分解方法
CN105223175A (zh) * 2015-09-28 2016-01-06 江南大学 一种三维荧光光谱结合非负矩阵分解鉴别浓香型白酒年份的方法
CN105469034A (zh) * 2015-11-17 2016-04-06 西安电子科技大学 基于加权式鉴别性稀疏约束非负矩阵分解的人脸识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102393910A (zh) * 2011-06-29 2012-03-28 浙江工业大学 一种基于非负矩阵分解和隐马尔科夫模型的人体行为识别方法
CN103366182A (zh) * 2013-07-05 2013-10-23 西安电子科技大学 基于全监督非负矩阵分解的人脸识别方法
CN103413117A (zh) * 2013-07-17 2013-11-27 浙江工业大学 一种基于局部保持非负矩阵分解的增量学习人脸识别方法
CN103971132A (zh) * 2014-05-27 2014-08-06 重庆大学 应用二维非负稀疏偏最小二乘进行人脸识别的方法
CN104732535A (zh) * 2015-03-18 2015-06-24 河海大学 一种约束稀疏的非负矩阵分解方法
CN105223175A (zh) * 2015-09-28 2016-01-06 江南大学 一种三维荧光光谱结合非负矩阵分解鉴别浓香型白酒年份的方法
CN105469034A (zh) * 2015-11-17 2016-04-06 西安电子科技大学 基于加权式鉴别性稀疏约束非负矩阵分解的人脸识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JUAN JOSÉ BURRED: "Detailed derivation of multiplicative update rules for NMF", 《JJBURRED.COM》 *
原蕾 等: "基于非负稀疏矩阵分解的人脸表情识别", 《万方数据》 *
林庆 等: "一种改进的基于NMF的人脸识别方法", 《计算机科学》 *
郑明秋 等: "改进非负矩阵分解的神经网络人脸识别", 《液晶与显示》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256569A (zh) * 2018-01-12 2018-07-06 电子科技大学 一种复杂背景下的对象识别方法及使用的计算机技术
CN108256569B (zh) * 2018-01-12 2022-03-18 电子科技大学 一种复杂背景下的对象识别方法及使用的计算机技术
CN112613583A (zh) * 2021-01-05 2021-04-06 广东工业大学 一种针对低频噪声人脸图像的高频信息提取聚类方法
CN112613583B (zh) * 2021-01-05 2023-07-21 广东工业大学 一种针对低频噪声人脸图像的高频信息提取聚类方法

Also Published As

Publication number Publication date
CN107563287B (zh) 2019-12-31

Similar Documents

Publication Publication Date Title
CN107563385B (zh) 基于深度卷积生成式对抗网络的车牌字符识别方法
CN108564129B (zh) 一种基于生成对抗网络的轨迹数据分类方法
CN109214273A (zh) 人脸图像比对方法、装置、计算机设备及存储介质
CN109614979A (zh) 一种基于选择与生成的数据增广方法及图像分类方法
Zhang et al. Efficient feature learning and multi-size image steganalysis based on CNN
Shrivastava et al. Learning discriminative dictionaries with partially labeled data
CN109711426A (zh) 一种基于gan和迁移学习的病理图片分类装置及方法
Goh et al. Food-image Classification Using Neural Network Model
CN107341510A (zh) 基于稀疏正交的双图非负矩阵分解的图像聚类方法
CN106503616A (zh) 一种基于分层超限学习机的运动想象脑电信号分类方法
CN105718944A (zh) 基于核空间的深度散射卷积网络学习方法和系统
Ren et al. Evaluating generalization ability of convolutional neural networks and capsule networks for image classification via top-2 classification
CN105868796A (zh) 基于核空间的线性鉴别稀疏表示分类器的设计方法
CN105956570A (zh) 基于唇部特征和深度学习的笑脸识别方法
Cui et al. A gender classification method for Chinese mitten crab using deep convolutional neural network
Ma et al. Joint-label learning by dual augmentation for time series classification
Love et al. Topological deep learning
Tan et al. Style interleaved learning for generalizable person re-identification
CN107563287A (zh) 人脸识别方法和装置
CN114492634A (zh) 一种细粒度装备图片分类识别方法及系统
CN114155572A (zh) 一种面部表情识别方法和系统
CN105389573B (zh) 一种基于局部三值模式分层重构的人脸识别方法
CN115457374B (zh) 基于推理模式评估深伪图像检测模型泛化性方法及装置
SaiRam et al. Hsd-cnn: Hierarchically self decomposing cnn architecture using class specific filter sensitivity analysis
CN107341485A (zh) 人脸识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant