CN105069406A - 基于优化的核Fukunaga-Koontz变换的人脸识别方法 - Google Patents

基于优化的核Fukunaga-Koontz变换的人脸识别方法 Download PDF

Info

Publication number
CN105069406A
CN105069406A CN201510439601.7A CN201510439601A CN105069406A CN 105069406 A CN105069406 A CN 105069406A CN 201510439601 A CN201510439601 A CN 201510439601A CN 105069406 A CN105069406 A CN 105069406A
Authority
CN
China
Prior art keywords
matrix
sigma
koontz
fukunaga
core
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510439601.7A
Other languages
English (en)
Other versions
CN105069406B (zh
Inventor
周晓彦
郑文明
朱小芳
陈彭鑫
马婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN201510439601.7A priority Critical patent/CN105069406B/zh
Publication of CN105069406A publication Critical patent/CN105069406A/zh
Application granted granted Critical
Publication of CN105069406B publication Critical patent/CN105069406B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于优化的核Fukunaga-Koontz变换的人脸识别方法,包括从训练样本中提取图像特征、选择高斯核函数并优化参数、对样本数据降维、计算各类样本的自相关矩阵和白化矩阵、确定人脸类别等步骤。本发明对KFKT方法进行核优化,从而改善其识别性能。

Description

基于优化的核Fukunaga-Koontz变换的人脸识别方法
技术领域
本发明属于图像处理的技术领域,特别涉及了基于优化的核Fukunaga-Koontz变换的人脸识别方法。
背景技术
人脸识别研究是当前模式识别和人工智能领域的研究热点,具有广阔的应用前景。在进行人脸识别时,为提高识别准确性通常要降低输入人脸特征向量的维数。常用的数据降维方法包括主成分分析(PCA)和线性判别分析方法(LDA)等。其中,PCA方法是一种无监督的数据降维方法,旨在寻找样本数据的一最佳表示子空间,使得在该子空间中样本数据被最大限度地保留。而LDA方法则是一种有监督的数据降维方法,它旨在寻找最佳子空间使得各类样本数据在该子空间中尽可能地被分开。两种方法的共同之处在于均要求所处理的样本数据呈线性分布。对于非线性分布的情况,可采用核映射方式对PCA和LDA进行非线性推广。
Fukunaga-Koontz变换(FKT)子空间方法是另一种常用的特征提取方法,最早用于解决两类的模式识别问题。与PCA方法的目标相同,FKT旨在建立对某类具有最佳表示,而对其他类别最差表示的子空间。早先FKT方法主要目前在与构造线性子空间,并关注于两类的问题,但这并不能满足实际应用的需要。为解决这一不足,Li等提出了基于核的FKT(KFKT)方法,该方法旨在构造非线性的子空间,并通过采用一对多的策略将两类问题推广到了多类问题。Zheng和Lin提出了另一种KFKT方法,该方法基于类协方差矩阵的联合对角化。虽然通过核技巧的使用为非线性子空间的构造提供了一种有效的解决方法,但是KFKT的性能在很大程序上依赖于核映射的选择。要使得KFKT获得更好的性能,必须对其进行核优化。
在本发明之前,如何对KFKT方法进行核优化,从而改善其识别性能的研究涉及较少。
发明内容
为了解决上述背景技术提出的技术问题,本发明旨在提供基于优化的核Fukunaga-Koontz变换的人脸识别方法,对KFKT方法进行核优化,从而改善其识别性能。
为了实现上述技术目的,本发明的技术方案为:
基于优化的核Fukunaga-Koontz变换的人脸识别方法,包括以下步骤:
(1)从c类训练人脸表情图像样本集中提取图像特征矢量集Xi,i=1,2,…,c;
(2)选择高斯函数作为核函数,求解最优的高斯核函数的参数σ;
(3)根据求得的最优的高斯核函数,采用核主成分分析法求解样本数据的变换矩阵WKPCA,并对每类样本数据进行变换,得到降维后的样本数据矩阵其中,为Xi的非线性映射;
(4)根据降维后的样本数据矩阵,计算c类样本的自相关矩阵Ri,并求解c个自相关矩阵的白化矩阵P;
(5)利用白化矩阵对自相关矩阵进行白化变换,得求解能同时对角化c个的正交变换矩阵Ui,即,其中,Λi是近似对角矩阵,再求出Ui对应于Λi最大对角元的优化列向量
(6)对于给定的测试人脸图像向量xt,利用WKPCA和P对xt,得其中,Φ(*)表示非线性映射,则xt所属人脸类别由下式确定:
i * = arg max i { Δ i } - - - ( 1 )
式(1)中, Δ i = x ^ t - U ~ i U ~ i T x ^ t .
进一步地,步骤(2)中选择的高斯函数的具体形式:
k ( x , y ) = exp { - σ | | x - y | | 2 } - - - ( 2 )
进一步地,步骤(2)的具体过程如下:
(a)定义高斯核函数参数σ的优化问题:
arg max J ( &sigma; ) = &Sigma; i < j ( n i T K i i n i + n j T K j j n j - 2 n i T K i j n j ) &Sigma; i = 1 c 1 a i &lsqb; T r ( K i i ) - T r ( K i i N i ) &rsqb; - - - ( 3 )
式(3)中,Tr(*)表示矩阵的迹,ni是一ai×1的向量,该向量的元素为1/ai,Ni是一ni×ni阶的矩阵,Kij=Φ(Xi)TΦ(Xj)的第r行第l列元素(Kij)rl=Φ(xir)TΦ(xjl)=k(xir,xjl),xir和xjl分别表示Xi和Xj的第r列和第l列;
(b)对J(σ)进行关于参数σ的求导运算,得到最优的参数σ:
&part; J ( &sigma; ) &part; &sigma; = &Sigma; i < j T r ( N i &dtri; &sigma; K i j N j ) &Sigma; i = 1 c 1 a i &lsqb; T r ( &dtri; &sigma; K i i ) - T r ( &dtri; &sigma; K i i N i ) &rsqb; - - - ( 4 )
式(4)中,▽σKij=-KijοAij,ο表示Hadamard点乘,Aij是一ni×nj阶矩阵,其第r行第l列元素(Aij)rl=||xir-xjl||2
进一步地,在步骤(b)中,采用投影梯度算法求解式(4)。
进一步地,在步骤(4)中,采用奇异值分解法求解c个自相关矩阵的白化矩阵P。
采用上述技术方案带来的有益效果:
本发明提出核映射优化方法找到KFKT方法的最优核函数,从而能有效改善识别方法的性能,提高识别准确性。本发明在国际著名的两个人脸数据库(FERET和Yale人脸数据库)上进行了实验验证,实验结果证实了有效性,也显示出对不同核函数参数初始值均具有较好的鲁棒性的优点。
附图说明
图1是本发明的基本流程图;
图2是FERET数据库中人脸图像示例图;
图3是Yale数据库中人脸图像示例图;
图4是FERET数据库上不同高斯核参数下人脸识别平均错误率的对比图。
具体实施方式
以下将结合附图,对本发明的技术方案进行详细说明。
如图1所示本发明的基本流程图,基于优化的核Fukunaga-Koontz变换的人脸识别方法,包括以下步骤:
(1)从c类训练人脸表情图像样本集中提取图像特征矢量集Xi,i=1,2,…,c;
(2)选择高斯函数作为核函数,求解最优的高斯核函数的参数σ;
(3)根据求得的最优的高斯核函数,采用核主成分分析法求解样本数据的变换矩阵WKPCA,并对每类样本数据进行变换,得到降维后的样本数据矩阵其中,为Xi的非线性映射;
(4)根据降维后的样本数据矩阵,计算c类样本的自相关矩阵Ri,并采用奇异值分解法求解c个自相关矩阵的白化矩阵P;
(5)利用白化矩阵对自相关矩阵进行白化变换,得求解能同时对角化c个的正交变换矩阵Ui,即,其中,Λi是近似对角矩阵,再求出Ui对应于Λi最大对角元的优化列向量
(6)对于给定的测试人脸图像向量xt,利用WKPCA和P对xt,得其中,Φ(*)表示非线性映射,则xt所属人脸类别由下式确定:
i * = arg max i { &Delta; i } - - - ( 1 )
上式中, &Delta; i = x ^ t - U ~ i U ~ i T x ^ t .
在本实施例中,步骤(2)的具体过程如下:
定义如下的目标函数:
arg max &Phi; J ( &Phi; ) = T r ( &Sigma; i < j ( m i &Phi; - m j &Phi; ) ( m i &Phi; - m j &Phi; ) T ) T r ( &Sigma; i = 1 c &Sigma; i &Phi; ) , s . t . &epsiv; L &le; T r ( &Sigma; i = 1 c &Sigma; i &Phi; ) &le; &epsiv; U - - - ( 2 )
其中,参数εL和εUL<εU)是两个门限阈值,并且以避免算法的过拟合,Tr(*)表示求矩阵的迹,上表Φ表示非线性映射,分别表示第i类样本数据的均值和协方差矩阵,并且可分别表示:
&Sigma; i &Phi; = 1 a i &Phi; ( X i ) ( I i - N i ) &Phi; ( X i ) T , m i &Phi; = &Phi; ( X i ) n i - - - ( 3 )
其中,ni是一ai×1的向量,其元素为1/ai,Ni是一ni×ni阶的矩阵,Φ(*)表示非线性映射。由上式可进一步得到:
T r ( &Sigma; i &Phi; ) = 1 a i T r ( &Phi; ( X i ) ( I i - N i ) &Phi; ( X i ) T ) = 1 a i T r ( K i i ) - 1 a i T r ( K i i N i ) - - - ( 4 )
T r ( m i &Phi; T m j &Phi; ) = T r ( n i T &Phi; ( X i ) T &Phi; ( X j ) n j ) = n i T K i j n j - - - ( 5 )
其中,Kij=Φ(Xi)TΦ(Xj),其第r行第l列元素(Kij)rl=Φ(xir)TΦ(xjl)=k(xir,xjl),xir和xjl分别表示Xi和Xj的第r列和第l列。在此情况下,可得核映射的优化问题等价于核函数的优化问题。
利用高斯核函数k(x,y)=exp{-σ||x-y||2}来进行优化,其中σ是高斯核函数的参数。根据上文,可得如下关于高斯核函数参数的优化问题:
arg max &sigma; J ( &sigma; ) = &Sigma; i < j ( n i T K i i n i + n j T K j j n j - 2 n i T K i j n j ) &Sigma; i = 1 c 1 a i &lsqb; T r ( K i i ) - T r ( K i i N i ) &rsqb; - - - ( 6 )
对J(σ)进行关于σ参数的求导运算,求导的值为0时,即为σ参数最优值:
&part; J ( &sigma; ) &part; &sigma; = &Sigma; i < j T r ( N i &dtri; &sigma; K i j N j ) &Sigma; i = 1 c 1 n i &lsqb; T r ( &dtri; &sigma; K i i ) - T r ( &dtri; &sigma; K i i N i ) &rsqb; - - - ( 7 )
其中,▽σKij=-KijοAij,ο表示Hadamard点乘,Aij是一ni×nj阶矩阵,其第r行第l列元素(Aij)rl=||xir-xjl||2。式(7)的优化问题可以采用梯度投影算法求解。
在FERET人脸数据库和Yale人脸数据库的测试中,体现了本发明的有效性。对于FERET数据库,选取了100个人的400图片,其中每个人包含4张人脸图片。图像被剪切并被下采样为72×46像素大小。Yale人脸库包含15个人,每个人11幅图片,总共165幅图片。图像被剪切并被下采样为64×64像素大小。图2为FERET数据库中人脸图像示例图,图3为Yale数据库中人脸图像示例图。
为了说明本发明的有效性,在实验中,采用了交叉验证的方式的进行实验设计。其中,对于FERET数据库,实验中采用四折交叉验证策略:将整个数据集划分为大小相同的四个子集,选取其中的一个子集作为测试数据集,而采用其他三个子集作为训练数据集,循环4次实验直到每个子集均被作为测试集。对于Yale人脸数据库,由于该数据库的图像数目相对较少,因此采用了留一法(leave-one-out)交叉验证策略来进行实验:在整个数据集中选取一个样本作为测试数据,将其余的样本作为训练数据,循环此过程直至样本集中的每个样本均被用作一次测试数据。为进行实验对比,也采用了KPCA,KDA,KFKT方法进行了同样的实验。对于KPCA和KDA方法也分别采用了最近邻分类器和线性分类器。而对于KFKT,则采用类最小重构错误率来进行分类。
图4显示了FERET数据库上不同高斯核参数下的平均测试错误率(%),而表1则显示了Yale库的实验结果。
表1
识别方法 σ=10-9 σ=5×10-9 σ=10-8 σ=5×10-8 σ=10-7
KPCA 29.09 26.67 27.88 28.48 29.09
KDA 9.09 10.30 11.52 15.76 18.18
KFKT 20.61 17.58 17.58 21.21 23.64
KFKT_OPT 12.12 12.12 12.12 12.12 12.12
在图4和表1中,输入高斯核参数作为KFKT_OPT核优化算法的初始值。从图4和表1中可以看出,采用KFKT方法可获得比KPCA和KDA更低的错误率。另外,相比于KFKT方法,经核函数优化后的KFKT方法(KFKT_OPT)取得了更好的识别效果。其次,相对于其他识别方法,优化后的KFKT_OPT方法对于不同的高斯核参数也具有很好的鲁棒性。
综上所述,本发明的优点和效果是通过对KFKT方法的核映射进行优化,获得最佳的核函数参数,从而提高识别的准确性。
以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

Claims (5)

1.基于优化的核Fukunaga-Koontz变换的人脸识别方法,其特征在于,包括以下步骤:
(1)从c类训练人脸表情图像样本集中提取图像特征矢量集Xi,i=1,2,…,c;
(2)选择高斯函数作为核函数,求解最优的高斯核函数的参数σ;
(3)根据求得的最优的高斯核函数,采用核主成分分析法求解样本数据的变换矩阵WKPCA,并对每类样本数据进行变换,得到降维后的样本数据矩阵其中,为Xi的非线性映射;
(4)根据降维后的样本数据矩阵,计算c类样本的自相关矩阵Ri,并求解c个自相关矩阵的白化矩阵P;
(5)利用白化矩阵对自相关矩阵进行白化变换,得求解能同时对角化c个的正交变换矩阵Ui,即,其中,Λi是近似对角矩阵,再求出Ui对应于Λi最大对角元的优化列向量
(6)对于给定的测试人脸图像向量xt,利用WKPCA和P对xt,得其中,Φ(*)表示非线性映射,则xt所属人脸类别由下式确定:
i * = arg min i { &Delta; i } - - - ( 1 )
式(1)中,
2.根据权利要求1所述基于优化的核Fukunaga-Koontz变换的人脸识别方法,其特征在于,步骤(2)中选择的高斯函数的具体形式:
k(x,y)=exp{-σ||x-y||2}(2)
3.根据权利要求2所述基于优化的核Fukunaga-Koontz变换的人脸识别方法,其特征在于,步骤(2)的具体过程如下:
(a)定义高斯核函数参数σ的优化问题:
arg max J ( &sigma; ) = &Sigma; i < j ( n i T K i i n i + n j T K j j n j - 2 n i T K i j n j ) &Sigma; i = 1 c 1 a i &lsqb; T r ( K i i ) - T r ( K i i N i ) &rsqb; - - - ( 3 )
式(3)中,Tr(*)表示矩阵的迹,ni是一ai×1的向量,该向量的元素为1/ai,Ni是一ni×ni阶的矩阵,Kij=Φ(Xi)TΦ(Xj)的第r行第l列元素(Kij)rl=Φ(xir)TΦ(xjl)=k(xir,xjl),xir和xjl分别表示Xi和Xj的第r列和第l列;
(b)对J(σ)进行关于参数σ的求导运算,得到最优的参数σ:
&part; J ( &sigma; ) &part; &sigma; = &Sigma; i < j T r ( N i &dtri; &sigma; K i j N j ) &Sigma; i = 1 c 1 a i &lsqb; T r ( &dtri; &sigma; K i i ) - T r ( &dtri; &sigma; K i i N i ) &rsqb; - - - ( 4 )
式(4)中,о表示Hadamard点乘,Aij是一ni×nj阶矩阵,其第r行第l列元素(Aij)rl=||xir-xjl||2
4.根据权利要求3所述基于优化的核Fukunaga-Koontz变换的人脸识别方法,其特征在于,在步骤(b)中,采用投影梯度算法求解式(4)。
5.根据权利要求1所述基于优化的核Fukunaga-Koontz变换的人脸识别方法,其特征在于:在步骤(4)中,采用奇异值分解法求解c个自相关矩阵的白化矩阵P。
CN201510439601.7A 2015-07-23 2015-07-23 基于优化的核Fukunaga-Koontz变换的人脸识别方法 Expired - Fee Related CN105069406B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510439601.7A CN105069406B (zh) 2015-07-23 2015-07-23 基于优化的核Fukunaga-Koontz变换的人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510439601.7A CN105069406B (zh) 2015-07-23 2015-07-23 基于优化的核Fukunaga-Koontz变换的人脸识别方法

Publications (2)

Publication Number Publication Date
CN105069406A true CN105069406A (zh) 2015-11-18
CN105069406B CN105069406B (zh) 2018-06-01

Family

ID=54498768

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510439601.7A Expired - Fee Related CN105069406B (zh) 2015-07-23 2015-07-23 基于优化的核Fukunaga-Koontz变换的人脸识别方法

Country Status (1)

Country Link
CN (1) CN105069406B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7010167B1 (en) * 2002-04-30 2006-03-07 The United States Of America As Represented By The National Security Agency Method of geometric linear discriminant analysis pattern recognition
CN101241599A (zh) * 2008-02-28 2008-08-13 上海交通大学 红外线列探测器成像中基于列的弱小目标检测方法
CN101620851A (zh) * 2008-07-01 2010-01-06 邹采荣 一种基于改进Fukunage-koontz变换的语音情感识别系统
CN102142082A (zh) * 2011-04-08 2011-08-03 南京邮电大学 用于人脸识别的基于虚拟样本的核鉴别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7010167B1 (en) * 2002-04-30 2006-03-07 The United States Of America As Represented By The National Security Agency Method of geometric linear discriminant analysis pattern recognition
CN101241599A (zh) * 2008-02-28 2008-08-13 上海交通大学 红外线列探测器成像中基于列的弱小目标检测方法
CN101620851A (zh) * 2008-07-01 2010-01-06 邹采荣 一种基于改进Fukunage-koontz变换的语音情感识别系统
CN102142082A (zh) * 2011-04-08 2011-08-03 南京邮电大学 用于人脸识别的基于虚拟样本的核鉴别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DI YOU等: ""Kernel Optimization in Discriminant Analysis"", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 *
WENMING ZHENG等: ""A new discriminant subspace analysis approach for multi-class problem"", 《PATTERN RECOGNITION》 *
YUNG-HUI LI等: ""Kernel Fukunaga-Koontz transform subspaces for enhances face recognition"", 《IEEE CONFERENCE ON COMPUTER VISION & PATTERN RECOGNITION》 *

Also Published As

Publication number Publication date
CN105069406B (zh) 2018-06-01

Similar Documents

Publication Publication Date Title
CN107563385B (zh) 基于深度卷积生成式对抗网络的车牌字符识别方法
Liew et al. Gender classification: a convolutional neural network approach
Hariharan et al. Discriminative decorrelation for clustering and classification
Xu et al. Automatic 3D face recognition from depth and intensity Gabor features
CN106570521B (zh) 多语言场景字符识别方法及识别系统
Mashhoori et al. Block-wise two-directional 2DPCA with ensemble learning for face recognition
CN107292225B (zh) 一种人脸识别方法
CN104299003A (zh) 一种基于相似规则高斯核函数分类器的步态识别方法
CN103186776B (zh) 基于多特征和深度信息的人体检测方法
Rehman et al. Image classification based on complex wavelet structural similarity
Van et al. Robust finger vein identification base on discriminant orientation feature
CN105631433A (zh) 一种两维线性鉴别分析的人脸识别方法
CN105844261A (zh) 基于优化特征投影矩阵的3d掌纹稀疏表示识别方法
Huang et al. DropRegion training of inception font network for high-performance Chinese font recognition
Nimbarte et al. Age Invariant Face Recognition using Convolutional Neural Network.
Zhang et al. Evaluation of weighted Fisher criteria for large category dimensionality reduction in application to Chinese handwriting recognition
Dagher et al. Improving the SVM gender classification accuracy using clustering and incremental learning
Jordao et al. Deep network compression based on partial least squares
CN103632145A (zh) 一种基于模糊二维非相关判别转换的人脸识别方法
CN103246877A (zh) 基于图像轮廓的人脸识别新方法
CN101877065A (zh) 小样本条件下的人脸图像非线性鉴别特征抽取和识别方法
Subbuthai et al. Identifying the character by applying PCA method using Matlab
CN110287973B (zh) 一种基于低秩鲁棒线性鉴别分析的图像特征提取方法
CN100449567C (zh) 一种基于块内相关性的二维主元分析人脸识别方法
CN105718858A (zh) 一种基于正负广义最大池化的行人识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180601