CN101620670A - 一种应用于面部表情识别的模糊判别分析方法 - Google Patents
一种应用于面部表情识别的模糊判别分析方法 Download PDFInfo
- Publication number
- CN101620670A CN101620670A CN200810122807A CN200810122807A CN101620670A CN 101620670 A CN101620670 A CN 101620670A CN 200810122807 A CN200810122807 A CN 200810122807A CN 200810122807 A CN200810122807 A CN 200810122807A CN 101620670 A CN101620670 A CN 101620670A
- Authority
- CN
- China
- Prior art keywords
- omega
- test
- fuzzy
- membership
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明提出了一种应用于面部表情识别的模糊判别分析方法,通过采用模糊K近邻方法(Fuzzy KNN)来设计每个训练样本的类隶属度。在此基础上运用典型相关分析(CCA)方法求解使得训练样本和其所对应的模糊类隶属度之间具有最大相关性的投影方向,并采用最小二乘回归(LSR)方法来建立输入数据和相应的类隶属度数据之间的关系式,然后根据类隶属度数据来建立类别索引。为了提高识别效果,可以通过核函数把上述方法推广到核空间中。该方法提供了一种有效的手段估计一个待测试样本的属于某一类别的可能性大小情况,解决了实际中许多面部表情图像样本并不能简单地归属于某一类别的问题。通过实验表明,本发明的方法相对传统的表情识别方法具有更好的识别性能。
Description
技术领域
本发明涉及一种模糊判别分析方法,特别涉及一种应用于面部表情识别的模糊判别分析方法。
背景技术
目前,线性判别分析(LDA)方法已被成功应用于许多模式识别问题中,如人脸识别、图像恢复、面部表情识别等。传统的判别分析方法要求每个训练样本唯一地隶属于某一类别的模式类型。然而,在实际中,有些模式样本并不能简单地归属于某一类别。在这种情况下,传统的判别分析方法就无法再被很好地应用。例如,在进行面部表情识别时,每幅面部图像可能包含所有的六种基本表情信息(高兴、悲伤、惊奇、生气、厌恶和害怕)。因此,简单地将每幅面部图像分类到六种基本表情中的一种是不合理的。近年来,Kwak和Pedrycz又提出了一种模糊Fisherfaces方法来进行人脸识别。模糊Fisherface方法本质上仍然限制在传统的LDA方法的框架中,并且它的公式表达也与Fisherface方法相似。与传统的Fisher脸方法相比较,主要差别就在于每一类样本均值的计算。由于Fisherface方法为每个训练样本建立相应的类模糊隶属度,因此在类均值计算方面也把类隶属度考虑在内。
典型相关分析(CCA)是一种用于刻画两个多维变量之间线性关系的方法,其基本思想为:假设{x,y}∈Rn×m是两个多维随机变量,则CCA的目标就在于寻找一对投影方向ωx和ωy,使得两个投影值ωx Tx和ωy Ty之间的相关性ρ(x,y)达到最大值。利用CCA进行判别分析,即通过对每个训练样本赋予一个二值模式的类隶属度来获得与LDA等价的判别分析方法。
如何合理的设计每个训练样本的类隶属度,并且结合CCA方法求解投影方向,建立输入数据和相应的类隶属度数据之间的关系,从而建立类别索引,对最终的系统的识别率影响很大。目前的一些方法没有有效地解决这些问题,将典型相关分析的模糊判别方法应用于表情识别的研究方法也不够成熟。此外,基于核函数的学习算法是近几年来在非线性特征提取或分类方面广泛采用的方法,其基本思想是将数据映射到一个高维的特征空间中,然后在高维的特征空间中进行线性特征提取问题。基于核函数的典型学习算法包括核主成分分析(KPCA)方法,广义判别分析(GDA)方法,和核典型相关分析(KCCA)方法等。如何将核函数和现有的典型方法相结合并用于表情识别,也是有待解决的问题。
发明内容
本发明的目的就在于解决现有技术的缺陷,设计、研究应用于面部表情识别的典型相关分析的模糊判别分析方法。
本发明的技术方案是:
一种应用于面部表情识别的模糊判别分析方法,其特征在于包括以下步骤:
(1)利用模糊K近邻指定类隶属度;
采用的是模糊K近邻(Fuzzy K-NN)方法为每一个训练样本xi建立一个与之相关联系的类隶属度矢量si j(j=1,2,...,c);方法流程如下:
(a)计算任意两个训练点xi和xj之间的距离,用dij=d(xi,xj)表示该距离;
(b)令D是一个N×N矩阵,其元素由dij组成,并设D的对角元素为无穷大;
(c)以升序方式来排列D的每列元素,并搜集与所选考虑的样本的最近邻的样本类别标识数;
(d)计算第j个样本对第i类的隶属度:如果i等于第j个训练样本的类别标识数,那么 否则
(2)运用典型相关分析(CCA)方法寻找训练样本和模糊类隶属度之间的最大相关性投影方向;
CCA的目标是寻找一对投影方向ωx和ωy,使得两个投影值ωx Tx和ωy Ty之间的相关性ρ(x,y)达到最大值,即:
这里采用拉格朗日乘子法进行求解上述优化问题;
(3)采用最小二乘回归(LSR)方法来建立输入数据和相应的类隶属度数据之间的关系式,并根据类隶属度数据建立类别索引;
设{(ωx i,ωy i)}i=1 t为利用CCA方法求得的t组投影方向,令:
设ai和bi(i=1,2,…,N)分别为xi和yi(i=1,2,…,N)在Px和Py上的投影值,则
设存在一个映射函数f(·)使得f(a)=b,其中a和b分别为x和y到Px和Py上的投影;设定f是一个线性变换,则存在一个t×t的矩阵使得Pa≈b;
采用最小二乘回归方法(LSR)来求解矩阵P:
在对某个样本进行识别时,令xtest表示该测试样本,ytest表示其相应的类隶属度矢量。令atest和btest分别是xtest和ytest在Px和Py上的投影值,那么:
设ytest i为ytest的第i个元素,则与测试样本最匹配表情类别为:
在所述的应用于面部表情识别的典型相关分析的模糊判别分析方法中,可以将该方法推广到核空间中,即将输入数据xi从输入空间Rn映射到特征空间F中,即Φ:Rn→F,x→Φ(x),其中任意两个点Φ(x)和Φ(y)的内积可以通过核函数k(x,y)计算得到;建立基于核函数的典型相关分析的模糊判别分析方法。
在所述的应用于面部表情识别的典型相关分析的模糊判别分析方法中,所述的模糊K-NN方法需要定义距离度量来计算每个数据点的类隶属度,设两个点x和y之间的距离为,即:
在所述的应用于面部表情识别的典型相关分析的模糊判别分析方法中,所述的核函数k(x,y)可以选为单项式核或高斯核。
本发明的优点和效果在于:
1.利用模糊K近邻指定类隶属度,改变了传统的判别分析方法要求每个训练样本唯一地隶属于某一类别的模式类型,解决了实际中许多面部表情图像样本并不能简单地归属于某一类别的问题。
2.通过新颖的基于典型相关分析(CCA)的判别分析方法,使每个训练样本类隶属度同多个模式类别建立联系,从而后续使识别更加精确。
3.通过基于最小二乘的回归(LSR)的方法,根据方法建立的关系可以更加有效地预测给定的面部表情的类别,获得比传统方法更好的表情识别效果。
4.利用核主成分分析(KPCA)的特征融合方法,将数据映射到一个高维的特征空间中,在该空间中进行线性特征提取,使得输入的图像特征矢量具有更好的识别特性。
本发明的其他优点和效果将在下面继续描述。
附图说明
图1——样本图像说明
图2——基于JAFFE数据库的平均识别率的比较
图3——基于Ekman面部表情数据库的平均识别率的比较
具体实施方式
下面结合附图和实施例,对本发明所述的技术方案作进一步的阐述。
1.利用模糊K近邻指定类隶属度
首先,需要为每一个训练样本xi建立一个与之相关联系的类隶属度矢量si j(j=1,2,…,c)。这里采用的是模糊K近邻(Fuzzy K-NN)方法来求解类隶属度矢量。由于模糊K-NN方法需要定义距离度量来计算每个数据点的类隶属度,设两个点x和y之间的距离为,即:
模糊K-NN方法流程如下:
(a)计算任意两个训练点xi和xj之间的距离,用dij=d(xi,xj)表示该距离。
(b)令D是一个N×N矩阵,其元素由dij组成,并设D的对角元素为无穷大。
(c)以升序方式来排列D的每列元素,并搜集与所选考虑的样本的最近邻的样本类别标识数。
(d)计算第j个样本对第i类的隶属度:如果i等于第j个训练样本的类别标识数,那么 否则
2.运用典型相关分析(CCA)方法寻找训练样本和模糊类隶属度之间的最大相关性投影方向
令{xi,si j}i=1,2,…,N;j=1,2,…,c是样本数为N,类别数为c的训练样本集,si j(j=1,2,…,c)为该训练样本xi∈Rn的隶属度矢量,并满足约束条件 令 CCA的目标是寻找一对投影方向ωx和ωy,使得两个投影值ωx Tx和ωy Ty之间的相关性ρ(x,y)达到最大值,其中:
那么在这里,CCA的目标是求解以下的优化问题:
其中X=[x1 x2…xN],Y=[y1y2…yN]。
采用拉格朗日乘子法进行求解上述问题,则与(式3)相对应的拉格朗日表达式为:
(式4)两边分别对ωx和ωy求偏导并令其为零,可得:
从(式5)和(式6),可得:
XYT(YYT)-1YXTωx=λ2XXTωx (式8)
通过对矩阵XXT应用完全Cholesky分解,则广义特征方程(式8)可归结为求解一对称矩阵的特征值问题,从而可以得出最优的投影方向ωz和ωy。
3. 采用最小二乘回归(LSR)方法来建立输入数据和相应的类隶属度数据之间的关系式,并根据类隶属度数据来建立类别索引。
设{(ωx i,ωy i)}i=1 t为利用CCA方法求得的t组投影方向,令
假设ai和bi(i=1,2,…,N)分别为xi和yi(i=1,2,…,N)在Px和Py上的投影值,则:
设存在一个映射函数f(·)使得f(a)=b,其中a和b分别为x和y到Px和Py上的投影。设f是一个线性变换,则存在一个t×t的矩阵P,使得Pa≈b。
采用最小二乘回归方法(LSR)来求解矩阵P,令
ε(P)=‖Pa-b‖2=aTPTPa-aTPTb-bTPa+bTb (式11)
在(式11)两边分别对P求偏导,并令其值为零,则可得:
由(式12)可得:
PaaT=baT (式13)
令 (式14)
于是,变换矩阵P可以通过下式估计:
在对某个样本进行识别时,令xtest表示该测试样本,ytest表示其相应的类隶属度矢量。令atest和btest分别是xtest和ytest在Px和Py上的投影值,则可得:
联合(式17)、(式18)和(式19),可得
于是,(式20)中的投影ytest可以通过下式求解:
设ytest i为ytest的第i个元素,则与测试样本最匹配表情类别为:
4.基于核函数的典型相关分析的模糊判别分析方法
由于核函数在表情识别上具有一定的优越性,在上述基本方法的基础上,可以通过核函数将其推广到核空间中,建立基于核函数的典型相关分析的模糊判别分析方法。
令Φ是一个非线性映射,它将输入数据从输入空间Rn映射到特征空间F中,即Φ:Rn→F,x→Φ(x),其中任意两个点Φ(x)和Φ(y)的内积可以通过核函数k(x,y)计算得到:
k(x,y)=(Φ(x))TΦ(y)(式23)
于是,目标是求解一对投影方向ωФ(x)和ωy,使得相关函数ρ(Ф(x),y)达到最大值:
其中Φ(X)=[Ф(x1)Ф(x2)…Φ(xN)]。
(式24)的优化问题可以采用拉格朗日乘子法进行求解。设{(ωФ(x) i,ωy i)}i=1 t是KCCA的t组投影方向。那么ωФ(x) i可表示为:
其中,αi是一个N维矢量。
令 A=[α1…αt]。从而可得PФ(x)=Φ(x)A。设Φ(xtest)为特征空间中的某一测试样本,ytest是其所对应的类隶属度矢量。令atest和btest分别表示是Φ(xtest)和ytest在PФ(x)和Py上的投影值,则:
其中Ktest=(Ф(X)))TΦ(xtest)能通过核函数计算得到。
根据(式21),投影ytest可以由下式算得:
此外,(式1)中的距离公式可由下式替代:
5.性能评价
在两个常用的面部表情数据库进行相应的实验来测试本发明所提出的方法的性能。在基于核函数的典型相关分析的模糊判别分析方法中,分别采用了单项式核和高斯核作为核函数,其定义如下:
(1)单项式核:k(x,y)=(xTy)d,其中d是单项式核的度.
(2)高斯核: 其中σ是高斯核的参数。
实验数据库分别取自日本女性面部表情(JAFFE)数据库和Ekman和Friesen的面部表情图像集。JAFFE数据库中包含213张面部图像,覆盖了由10位日本女性所显示的7种面部表情(高兴、悲伤、惊奇、生气、厌恶、害怕和中性)。对于7种表情中的每一种每个人有两到四张图像。原始图像的灰度级为256。Ekman和Friesen的数据库中包含6位男性和8位女性的共计110张图像。对于7种表情中的每一种每人至多有一到两张图像。每幅图像的灰度级为256。在预处理阶段,从每幅面部图像中手工定位出34个基准点。图1显示了34个基准点的一个示例。
在标定出34个基准点后,取每幅图像在基准点处的Gabor小波的幅值作为该点处的面部表情特征,其中,Gabor核的定义如下:
其中u和v表示了Gabor核的方向和尺度,ku,v的定义如下:
ku,v=kvexp(iφu)(式30)
其中kv=π/2v(v∈{1,2,…,5}),φu=πu/6(u∈{0,1,2,…,5})。
因此,在34个基准点处的所有特征组成一个1020维的矢量。考虑到本实验采用的表情数据库的数据比较少,采用“leave-one-class-out”交叉验证实验策略来进行实验。在“leave-one-class-out”交叉验证实验中,取某一类别的所有图像都被作为测试数据,而剩余的图像作为训练数据。这种过程重复进行直到每一类数据都被用作一次测试数据。实验以平均识别率作为最终的表情识别率。为了对比分析,同时分别采用了GDA方法、LDA方法和KCCA方法进行了同样的实验。图2和图3分别显示了基于JAFFE数据库和Ekman和Friesen数据库上的各种系统的结果。从图2和图3可以看出,本文提出的方法获得了最好的性能。
Claims (4)
1.一种应用于面部表情识别的模糊判别分析方法,其特征在于包括以下步骤:
(1)利用模糊K近邻指定类隶属度;
采用的是模糊K近邻(Fuzzy K-NN)方法为每一个训练样本xi建立一个与之相关联系的类隶属度矢量si j(j=1,2,…,c);该方法流程如下:
(a)计算任意两个训练点xi和xj之间的距离,用dij=d(xi,xj)表示该距离;
(b)令D是一个N×N矩阵,其元素由dij组成,并设D的对角元素为无穷大;
(c)以升序方式来排列D的每列元素,并搜集与所选考虑的样本的最近邻的样本类别标识数;
(d)计算第j个样本对第i类的隶属度:如果i等于第j个训练样本的类别标识数,那么 否则
(2)运用典型相关分析(CCA)方法寻找训练样本和模糊类隶属度之间的最大相关性投影方向;
CCA的目标是寻找一对投影方向ωx和ωy,使得两个投影值ωx Tx和ωy Ty之间的相关性ρ(x,y)达到最大值,即:
这里采用拉格朗日乘子法进行求解上述优化问题;
(3)采用最小二乘回归(LSR)方法来建立输入数据和相应的类隶属度数据之间的关系式,并根据类隶属度数据建立类别索引;
设{(ωx i,ωy i)}i=1 t为利用CCA方法求得的t组投影方向,令:
设ai和bi(i=1,2,…,N)分别为xi和yi(i=1,2,…,N)在Px和Py上的投影值,则
设存在一个映射函数f(·)使得f(a)=b,其中a和b分别为x和y到Px和Py上的投影;设定f是一个线性变换,则存在一个t×t的矩阵使得Pa≈b;
采用最小二乘回归方法(LSR)来求解矩阵P:
在对某个样本进行识别时,令xtest表示该测试样本,ytest表示其相应的类隶属度矢量;令atest和btest分别是xtest和ytest在Px和Py上的投影值,那么:
设ytest i为ytest的第i个元素,则与测试样本最匹配表情类别为:
2.根据权利要求1所述的一种应用于面部表情识别的模糊判别分析方法,其特征在于,可以将该方法推广到核空间中,即将输入数据xi从输入空间Rn映射到特征空间F中,即Φ:Rn→F,x→Φ(x),其中任意两个点Φ(x)和Φ(y)的内积可以通过核函数k(x,y)计算得到;建立基于核函数的典型相关分析的模糊判别分析方法。
3.根据权利要求1所述的一种应用于面部表情识别的模糊判别分析方法,其特征在于,所述的模糊K-NN方法需要定义距离度量来计算每个数据点的类隶属度,设两个点x和y之间的距离为,即:
4.根据权利要求1所述的一种应用于面部表情识别的模糊判别分析方法,其特征在于,所述的核函数k(x,y)可以选为单项式核或高斯核。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810122807A CN101620670A (zh) | 2008-07-01 | 2008-07-01 | 一种应用于面部表情识别的模糊判别分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810122807A CN101620670A (zh) | 2008-07-01 | 2008-07-01 | 一种应用于面部表情识别的模糊判别分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101620670A true CN101620670A (zh) | 2010-01-06 |
Family
ID=41513898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810122807A Pending CN101620670A (zh) | 2008-07-01 | 2008-07-01 | 一种应用于面部表情识别的模糊判别分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101620670A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163288A (zh) * | 2011-04-06 | 2011-08-24 | 北京中星微电子有限公司 | 眼镜检测方法和装置 |
CN103186774A (zh) * | 2013-03-21 | 2013-07-03 | 北京工业大学 | 一种基于半监督学习的多姿态人脸表情识别方法 |
CN102163288B (zh) * | 2011-04-06 | 2016-12-14 | 北京中星微电子有限公司 | 眼镜检测方法和装置 |
CN108304866A (zh) * | 2018-01-22 | 2018-07-20 | 西南交通大学 | 一种多视图特征判别方法 |
CN110136124A (zh) * | 2019-05-17 | 2019-08-16 | 江门市中心医院 | 一种基于鲁棒速度函数的胸膜接触性肺结节分割方法 |
CN111261172A (zh) * | 2020-01-21 | 2020-06-09 | 北京爱数智慧科技有限公司 | 一种声纹识别方法和装置 |
-
2008
- 2008-07-01 CN CN200810122807A patent/CN101620670A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163288A (zh) * | 2011-04-06 | 2011-08-24 | 北京中星微电子有限公司 | 眼镜检测方法和装置 |
CN102163288B (zh) * | 2011-04-06 | 2016-12-14 | 北京中星微电子有限公司 | 眼镜检测方法和装置 |
CN103186774A (zh) * | 2013-03-21 | 2013-07-03 | 北京工业大学 | 一种基于半监督学习的多姿态人脸表情识别方法 |
CN103186774B (zh) * | 2013-03-21 | 2016-03-09 | 北京工业大学 | 一种基于半监督学习的多姿态人脸表情识别方法 |
CN108304866A (zh) * | 2018-01-22 | 2018-07-20 | 西南交通大学 | 一种多视图特征判别方法 |
CN110136124A (zh) * | 2019-05-17 | 2019-08-16 | 江门市中心医院 | 一种基于鲁棒速度函数的胸膜接触性肺结节分割方法 |
CN111261172A (zh) * | 2020-01-21 | 2020-06-09 | 北京爱数智慧科技有限公司 | 一种声纹识别方法和装置 |
CN111261172B (zh) * | 2020-01-21 | 2023-02-10 | 北京爱数智慧科技有限公司 | 一种声纹识别方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101620669B (zh) | 一种人脸身份和表情的同步识别方法 | |
CN100483445C (zh) | 基于几何保存的人脸子空间识别方法 | |
CN102880877A (zh) | 一种基于轮廓特征的目标识别方法 | |
CN103218628A (zh) | 一种基于团块与轨迹特征的异常行为描述方法 | |
CN107273926A (zh) | 一种基于余弦相似度加权的线性判别分析降维方法 | |
CN106778512A (zh) | 一种基于lbp和深度学校的非限制条件下人脸识别方法 | |
CN103679718A (zh) | 一种基于显著性的快速场景分析方法 | |
CN104636732A (zh) | 一种基于序列深信度网络的行人识别方法 | |
CN105787451A (zh) | 一种基于多判决点模式的指纹匹配方法 | |
CN105893947A (zh) | 基于多局部相关特征学习的两视角人脸识别方法 | |
CN101620670A (zh) | 一种应用于面部表情识别的模糊判别分析方法 | |
CN103903238A (zh) | 图像特征的显著结构和相关结构融合方法 | |
CN106096528B (zh) | 一种基于二维耦合边距Fisher分析的跨视角步态识别方法 | |
Li et al. | Hypergraph transformer neural networks | |
CN103714340A (zh) | 基于图像分块的自适应特征提取方法 | |
CN104899604A (zh) | 一种基于数据集合并的特征级融合方法 | |
Sun et al. | CRNet: Channel-enhanced Remodeling-based Network for Salient Object Detection in Optical Remote Sensing Images | |
CN102831445B (zh) | 基于语义Hough变换和偏最小二乘法的目标检测方法 | |
Xiao et al. | Manipulation detection of key populations under information measurement | |
CN102005050A (zh) | 用于变化检测的高斯对数模型单边曲率拟合阈值方法 | |
CN102289679B (zh) | 一种基于相关特征和非线性映射的固定视角人脸超分辨率识别方法 | |
CN103177264A (zh) | 基于视觉词典全局拓扑表达的图像分类方法 | |
CN102663392A (zh) | 一种基于拉普拉斯算子的图像特征提取方法 | |
CN101482917B (zh) | 一种基于二阶二维主分量分析的人脸识别系统和方法 | |
CN102779271A (zh) | 基于谱稀疏典型相关分析的表情语义稀疏量化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20100106 |