CN102592148A - 基于非负矩阵分解和多种距离函数的人脸识别方法 - Google Patents

基于非负矩阵分解和多种距离函数的人脸识别方法 Download PDF

Info

Publication number
CN102592148A
CN102592148A CN2011104544078A CN201110454407A CN102592148A CN 102592148 A CN102592148 A CN 102592148A CN 2011104544078 A CN2011104544078 A CN 2011104544078A CN 201110454407 A CN201110454407 A CN 201110454407A CN 102592148 A CN102592148 A CN 102592148A
Authority
CN
China
Prior art keywords
sigma
matrix
distance
vector
prime
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011104544078A
Other languages
English (en)
Inventor
薛云
曾青松
蒋亚军
邹雁
魏燕达
伍银波
胡晓晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Guangzhou Panyu Polytechnic
Guangdong Institute of Science and Technology
Original Assignee
South China Normal University
Guangzhou Panyu Polytechnic
Guangdong Institute of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University, Guangzhou Panyu Polytechnic, Guangdong Institute of Science and Technology filed Critical South China Normal University
Priority to CN2011104544078A priority Critical patent/CN102592148A/zh
Publication of CN102592148A publication Critical patent/CN102592148A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了基于非负矩阵分解和多种距离函数的人脸识别方法,包括:人脸图像特征的提取:针对学习图库中全部人脸图像做非负矩阵分解,得到对应的基图像和每张学习图像对应的权重向量即特征向量;利用非负矩阵分解的算法,对测试图像中全部图像做特征提取,得到每张测试图对应的特征向量;利用得到的特征向量,首先计算每一类已知身份的训练样本图像集合对应的平均特征向量Hm;然后对每个测试图像计算其与各类别训练图像集对应均值向量之间的相似度,并结合多种不同距离函数给出相似度的量化数值,找出与测试图最接近的训练图类别即最近邻点,并根据最近邻分类的方法将测试图划归最近邻所在类别,即对全部测试图像进行身份识别。

Description

基于非负矩阵分解和多种距离函数的人脸识别方法
技术领域
本发明涉及图像处理和模式识别技术的应用领域,具体涉及一种基于非负矩阵分解(NMF)和多种距离函数的图像识别方法。
背景技术
在人脸识别领域,目前有很多方法,这些方法大致可以分为两大类:非监督的的识别方法和有监督的识别方法。非监督的的识别方法事先对分类过程不施加任何的先验知识,而仅凭待分类样本提取出的特征,建立决策规则来进行分类,主要包括主成分分析(PCA),非负矩阵分解(NMF)。
主成分分析(PCA)的基本方法如下:
先设X={Xn∈Rd|n=|1,...,N}为一组向量即数据集。
然后,针对数据集计算对应的平均向量EX和协方差矩阵M。
EX = 1 N Σ n = 1 N X n ,
X ^ = { X ^ n , n = 1 , . . . , N } with X ^ n = X n - EX ,
M = cov ( X ^ ) , withM ( i , j ) = 1 N - 1 Σ n = 1 N ( X ^ n ( i ) X ^ n ( j ) ) , 1 ≤ i , j ≤ d .
接下来是计算矩阵M的特征值和特征向量。根据矩阵理论,协方差矩阵M是正定的,所以拥有非负特征值,对应的特征向量集可以构成一个完备的线性正交空间。
最后,对前述步骤计算出的特征值从大到小进行排序,并选择最大的k个特征值以及对应的特征向量,再计算集合X中全部向量对这些特征向量的投影系数,并以此作为原有的这些高维向量降维之后的特征向量。在人脸图像的识别中,识别是通过比较学习图像和测试图像在主成分分析之后相应的特征向量之间相似度。
虽然主成分分析方法得到了广泛的应用,但由于它是将信号进行正交分解,其分解的结果中含有负值,缺失了实际的物理含义;信息或信号处理的许多数据具有非负性的特点,如灰度图像等。在用线性表示方法处理这类数据时,往往要求分解的结果(包括基向量和系数)都是非负的.此时若采用传统方法如主成分分析,因为其结果中含有负数而失去了物理意义。
主成分分析应用到人脸图像识别方面称之为特征脸(eigenface),也取得了较好的效果。但是传统的特征脸方法有其局限性。首先,主成分分析的基图像缺乏直观性。其次,这种方法是基于整体图像进行特征提取和识别,因此很难处理图像中部分被遮挡的情况。
而非负矩阵分解(NMF)作为一种特征提取的方法能避免以上不足之处。它在特征提取过程中对基向量和权重向量都施加了非负限制,从而在对原图像进行近似重构的时候只允许对数据进行相加的组合。
非负矩阵分解(NMF)的基本方法如下:
非负矩阵分解是一种多变量分析方法。假设处理m个n维空间的样本数据,用n×m数据矩阵V表示,该数据矩阵中各个元素都是非负的,表示为V≥0。然后对矩阵V进行线性分解,以两个新的非负矩阵(n×r矩阵W与r×m矩阵H)来近似原矩阵
Figure BDA0000126701910000021
其中矩阵W中列为非负基向量,而H中列代表权重向量即组合系数;i,j分别表示V中对应元素的行号与列号,a表示矩阵乘法时对应的元素在各自行列中的序号,n与m分别表示矩阵V的行数与列数,r表示W中列数,即对V做分解过程中用到的非负基向量个数。
为了实现矩阵的非负分解,首先需要定义一个损失函数来刻画分解前后的逼近程度
F = Σ i = 1 n Σ j = 1 m [ V ij log V ij ( WH ) ij - V ij + ( WH ) ij ]
然后在非负性约束下求解,采用的是以下迭代算法
W ia ← W ia Σ j V ij ( WH ) ij H aj ,
W ia ← W ia Σ j W ja ,
H aj ← H aj Σ i W ia V ij ( WH ) ij .
从以上公式可以看出,该迭代规则适合分解当中非负数据的特点,即在非负性初始化的基础上,在迭代过程中能始终简单地保持非负性,从而确保数据的整体特征是局部特征的非负线性组合,局部特征在构成整体特征时不会产生正负抵消的情况,因此具有明确的物理含义。
针对图像处理问题,非负矩阵分解(NMF)算法应用的流程图如图1所示。
发明内容
本发明的目的在于针对主成分分析方法的不足,利用非负矩阵分解方法构造一个非监督的人脸识别系统,同时鉴于以往的人脸识别系统当中在进行特征比对和分类决策时采用的距离函数主要是欧几里德距离或者马氏距离,都没有考虑到待识别对象的数据向量符合非负性的特征,因此采用了多种距离应用于分类器,令识别系统的性能有进一步提升,在现有技术的基础上,进一步提高了算法的鲁棒性、准确性和实时性。本发明通过如下技术方案实现。
一种基于非负矩阵分解和多种距离函数的人脸图像识别方法,包括如下步骤:
(1)学习图库中人脸图像特征的提取:针对学习图库中全部人脸图像做非负矩阵分解,得到对应的基图像和每张学习图像对应的权重向量即特征向量;
(2)利用非负矩阵分解的算法,在步骤(1)的基础上对测试图像中全部图像做特征提取,得到每张测试图对应的特征向量;
(3)利用步骤(1)和(2)中得到的特征向量,首先计算每一类已知身份的训练样本图像集合对应的平均特征向量Hm;然后对每个测试图像计算其与各类别训练图像集对应均值向量之间的相似度,并结合多种不同距离函数给出相似度的量化数值dist(Ht,Hm),在此基础上找出与测试图像最接近的训练图类别即最近邻点,并根据最近邻分类的方法将测试图划归最近邻所在类别,即对全部测试图像进行身份识别。
上述的基于非负矩阵分解和多种距离函数的人脸图像识别方法中,步骤(1)进一步包括:
1)获取人脸图像并做规一化使其大小一致,形成一个实验数据库,并分成训练集和测试集;
2)首先,使用一个n×m矩阵V1代表训练图像数据集;
其次,采用非负矩阵分解(NMF)对矩阵V1进行分解以提取特征;非负矩阵分解(NMF)的方法如下:
非负矩阵分解是一种多变量分析方法。假设处理m个n维空间的样本数据,用n×m数据矩阵V表示,该数据矩阵中各个元素都是非负的,表示为V≥0。然后对矩阵V进行线性分解,以两个新的非负矩阵(n×r矩阵W与r×m矩阵H)来近似原矩阵
其中矩阵W中列为非负基向量,而H中列代表权重向量即组合系数;i,j分别表示V中对应元素的行号与列号,a表示矩阵乘法时对应的元素在各自行列中的序号,n与m分别表示矩阵V的行数与列数,r表示W中列数,即对V做分解过程中用到的非负基向量个数;
为了实现矩阵的非负分解,首先需要定义一个损失函数来刻画分解前后的逼近程度
F = Σ i = 1 n Σ j = 1 m [ V ij log V ij ( WH ) ij - V ij + ( WH ) ij ]
然后在非负性约束下求解,采用的是以下迭代算法
W ia ← W ia Σ j V ij ( WH ) ij H aj ,
W ia ← W ia Σ j W ja ,
H aj ← H aj Σ i W ia V ij ( WH ) ij .
从以上公式可以看出,该迭代规则适合分解当中非负数据的特点,即在非负性初始化的基础上,在迭代过程中能始终简单地保持非负性,从而确保数据的整体特征是局部特征的非负线性组合,局部特征在构成整体特征时不会产生正负抵消的情况,因此具有明确的物理含义。
针对图像处理问题,非负矩阵分解(NMF)算法应用的流程图如图1所示。
非负矩阵分解算法应用到训练图像数据集对应的矩阵V1时,可以得到两个新的矩阵(W1和H1):
Figure BDA0000126701910000054
其中W1为基矩阵,H1为权重矩阵;i,j分别表示V1中对应元素的行号与列号,a表示矩阵乘法时该元素在行列中的序号,r表示W1中列数,即对V1做分解过程中用到的非负基向量个数。
完成分解后针对训练图像建立不同的库来分别保存它们的基向量和权重向量。
上述基于非负矩阵分解(NMF)和多种距离函数的人脸图像识别方法中,步骤(2)进一步包括:
对全部图像进行特征提取,本系统中分别采用两种不同方法获得训练图像和测试图像的特征向量。
方法1:
定义W1对应的广义逆矩阵 W + = ( W 1 T w 1 ) - 1 w 1 T , 再令每个训练图像Vi表示为投影到W+的特征向量H′i=W+Vi,而任一个待分类的测试图像Vt可以将特征表示为H′t=W+Vt
方法2:
利用在训练阶段获得的基矩阵W1,可以继续使用原有的非负矩阵分解算法中迭代公式,但在迭代中保持W1不变(即不对W1进行更新),从而得到测试图像对应的权重矩阵H2。然后,分别用H1和H2中列向量作为学习图像和测试图像的特征向量。
上述基于非负矩阵分解(NMF)和多种距离函数的人脸图像识别方法中,步骤(3)进一步包括:
首先计算每一类训练样本图像集合对应的平均特征向量Hm;然后对每个测试图像计算其与各类别对应均值向量之间的各种距离度量dist(Ht,Hm)(距离的各种定义参见下文),并根据最近邻分类的方法将测试图像归为距离最近的一类。
为提高分类性能,该人脸识别系统当中采用多种距离函数度量,对非负矩阵分解后的图像特征向量进行相似性度量,再利用最近邻分类的方法给出测试图的分类决策。
首先设X,Y是利用非负矩阵分解方法得到的长度为n的特征向量,其中X代表测试图像的权重向量,而Y表示训练图像的权重向量;而σ是训练图像对应权重向量的协方差矩阵,而{si,i=1,L,n}表示σ中对角元的平方根,即标准差,在此基础上引入特征向量之间各种距离函数的定义如下(其中i表示元素在向量中的标号,n表示向量的长度,d(X,Y)表示两个向量之间距离,xi与yi分别表示向量X与Y中的分量,min与max分别表示集合当中的极小值与极大值):
(1)、曼哈顿距离(即L1距离)
d ( X , Y ) = Σ i = 1 n | x i - y i |
(2)、欧氏距离
d ( X , Y ) = Σ i = 1 n ( x i - y i ) 2
(3)、切比雪夫距离
d ( X , Y ) = max 1 ≤ i ≤ n | x i - y i |
(4)、马氏距离
d ( X , Y ) = ( X - Y ) ′ σ - 1 ( X - Y )
(5)、兰斯距离
d ( X , Y ) = Σ i = 1 n | x i - y i | | x i | + | y i |
(6)、统计距离
d ( X , Y ) = Σ i = 1 n | x i - y i s i |
(7)、散度
d ( X , Y ) = Σ i = 1 n ( x i ln x i y i - x i + y i )
(8)、Kullback-Leibler距离(相对熵)
d ( X , Y ) = Σ i = 1 n x i ′ log 2 x i ′ y i ′ , x i ′ = | x i | Σ i = 1 n | x i | , y i ′ = | y i | Σ i = 1 n | y i |
(9)、对称化散度
d ( X , Y ) = Σ i = 1 n ( x i ln x i y i - x i + y i ) + Σ i = 1 n ( y i ln y i x i - y i + x i ) = Σ i = 1 n ( x i ln x i yi + y i ln y i x i )
(10)、对称化的Kullback-Leibler距离
d ( X , Y ) = Σ i = 1 n x i ′ log 2 x i ′ y i ′ + Σ i = 1 n y i ′ log 2 y i ′ x i ′ , x i ′ = | x i | Σ i = 1 n | x i | , y i ′ = | y i | Σ i = 1 n | y i |
(11)、马氏角距离
d ( X , Y ) = 1 - X ′ σ - 1 Y X ′ σ - 1 X Y ′ σ - 1 Y
(12)、卡方距离
d ( X , Y ) = Σ i = 1 n ( x i - y i ) 2 x i + y i
(13)、基于指数相似系数的距离
d ( X , Y ) = 1 - γ 2 ( X , Y ) , γ ( X , Y ) = 1 n Σ i = 1 n e - 3 4 ( x i - y 2 ) 2 s i 2
(14)、基于非参数相似系数的距离
d ( X , Y ) = 1 - γ 2 ( X , Y ) , γ ( X , Y ) = n + - n - n + + n -
此处 X i ′ = x i - x ‾ , y i ′ = y i - y ‾ ,
Figure BDA0000126701910000089
Figure BDA00001267019100000810
分别表示向量X与Y中分量的均值,
n+表示{x′iy′i≥0,i=1,L,n}的次数,而n-表示{x′iy′i<0,i=1,L,n}的次数。
(15)、余弦距离
d ( X , Y ) = 1 - cos ( X , Y ) = 1 - Σ i = 1 n x i y i ( Σ i = 1 n x i 2 ) ( Σ i = 1 n y i 2 )
(16)、基于相关系数的距离(CCBD)
d ( X , Y ) = 1 - γ ( X , Y ) , γ ( X , Y ) = Σ i = 1 n ( x i - x ‾ ) ( y i - y ‾ ) [ Σ i = 1 n ( x i - x ‾ ) 2 ] [ Σ i = 1 n ( y i - y ‾ ) 2 ]
前述四种距离的定义都基于不同的相似系数γ(X,Y),各自对应的具体定义参见上式。本方法中提出两种尚未用于人脸识别的新距离,由于它们是基于非负向量之间两种相似系数γ(X,Y)的距离,所以适用于非负矩阵分解方法的应用,其中各自对应的系数γ(X,Y)定义如下。
(17)、基于非负向量相似系数的距离1(NVSC1)
d ( X , Y ) = 1 - γ 2 ( X , Y ) , γ ( X , Y ) = Σ i = 1 n min ( x i , y i ) Σ i = 1 n max ( x i , y i )
(18)、基于非负向量相似系数的距离2(NVSC2)
d ( X , Y ) = 1 - γ 2 ( X , Y ) , γ ( X , Y ) = Σ i = 1 n min ( x i , y i ) Σ i = 1 n ( x i + y i ) / 2
在所有上述距离函数中,曼哈顿距离、欧氏距离和马氏距离在模式识别领域应用最为广泛。
本发明在非负矩阵分解的基础上,通过引入新的距离,以非负向量之间相似系数为基础的(NVSC)距离,能够显著的提高人脸识别率。本发明注重理论和实际应用的结合,进一步丰富了人脸识别领域的技术方法。
与传统的主成分分析(PCA)技术和基于欧式距离的人脸识别系统相比,本发明有以下优点:
1)在功能上,非负矩阵分解(NMF)实现了对大脑基于部分感知功能的模拟,既可以兼顾图像各个部分的特征,也可以兼顾总体特征,因此对于有遮挡的图像识别更为有效。
2)在应用上,非负性的数据大量存在,且非负分解的结果具有明确直观的物理含义;
3)在算法上,采用简单有效的乘法迭代规则,很好地保持了非负性,并提升了计算速度;
4)NMF作为一种低秩逼近算法,能有效节约存储和计算资源;
5)针对NMF的数据特点,在识别阶段采用多种特征提取方法和距离函数,能够充分发掘这种特征提取方法的潜力,提升系统的分类性能。尤其是新定义的两种NVSC距离,充分考虑了非负矩阵分解方法的特点,在前述步骤中得到非负特征向量的基础上给出的距离计算公式简单直观,计算量小,处理速度快,而且应用后得到的人脸识别系统能产生更好的识别结果。
附图说明
图1是非负矩阵分解算法的流程图。
图2是训练阶段的流程图。
图3是:识别阶段的流程图。
具体实施方式
下面结合附图,对本发明的具体实施方式作进一步说明,但本发明的保护范围和实施不限于此。
基于非负矩阵分解(NMF)和多种距离函数的人脸识别方法,如图3所示,其具体实现步骤如下:
(1)学习图库中人脸图像特征的提取:针对学习图库中全部人脸图像做非负矩阵分解,得到对应的基图像和每张学习图像对应的权重向量即特征向量。
(2)利用非负矩阵分解的算法,在步骤(1)的基础上对测试图像中全部图像做特征提取,得到每张测试图对应的特征向量。
(3)利用步骤(1),(2)中得到的特征向量,首先计算每一类已知身份的训练样本图像集合对应的平均特征向量Hm;然后对每个测试图像计算其与各类别训练图像集对应均值向量之间的相似度,并结合多种不同距离函数给出相似度的量化数值dist(Ht,Hm)(距离的各种定义参见上文),在此基础上找出与测试图最接近的训练图类别即最近邻点,并根据最近邻分类的方法将测试图划归最近邻所在类别,即对全部测试图像进行身份识别。
以国际上公认的用于人脸识别实验的MIT-CBCL人脸图库为例,该图库当中有10个人的面部图像,每个人有324张脸图,光线强度和拍照角度各异。本方法预先已将这3240张图像归一化为23*28的尺寸,并随机抽取每个人的10张图作为训练图,余下的作为测试图,从而形成训练图库和测试图库。
步骤(1)的具体实施步骤为:
首先读取训练图库当中的每幅图像,并且将获得的数字矩阵每列依次连接之后形成一个644维列向量,将所有训练图读取之后将所有列向量汇总可以形成644×100矩阵V1
其次,采用非负矩阵分解(NMF)对V1进行分解以提取特征,采用的是前述迭代算法,分解之后可以得到两个新矩阵(W1和H1):
Figure BDA0000126701910000111
其中W1为训练图对应的基矩阵,H1为权重矩阵;i,j分别表示V1中对应元素的行号与列号,a表示矩阵乘法时该元素在行列中的序号,r表示W1中列数,即对V1做分解过程中用到的非负基向量个数,根据经验,r取80左右时可以取得较好的分解与识别效果。
完成分解后针对训练图像建立不同的库来分别保存它们的基向量和权重向量。
步骤(2)的具体实施步骤为:
针对图库中100张训练图像和3140张测试图像,本系统中分别采用两种不同方法获得每张训练图像和测试图像对应的特征向量(在下面的阐述和实验结果中,会把这两种办法分别表示为方法1与方法2)。
方法1:
定义W1对应的广义逆矩阵 W + = ( W 1 T W 1 ) - 1 W 1 T , 再令每个训练图像Vi表示为投影到W+的特征向量H′i=W+Vi,而任一个待分类的测试图像Vt可以将特征表示为H′t=W+Vt
方法2:
利用全部测试图像得到一个644*3140的矩阵V2,然后利用在步骤1中获得的基矩阵W1,可以继续使用原有的非负矩阵分解算法中迭代公式,但在迭代中保持W1不变(即不对W1进行更新),从而得到测试图像对应的权重矩阵H2。然后,分别用H1和H2中列向量作为学习图像和测试图像的特征向量,此时每幅人脸图像都已经在非负矩阵分解的基础上用80维的特征向量表示。
步骤三的具体实施步骤为:
在已知测试图和各类别训练图像对应的全部特征向量之后,首先计算每一类训练样本中10幅图像在前述非负矩阵分解步骤之后特征向量的均值向量Hm;然后对每个测试图像计算其与各类别对应均值向量之间的各种距离度量dist(Ht,Hm)(距离的各种定义参见上文),并根据最近邻分类的方法将测试图像归为距离最近的一类。
上述两个阶段的流程图如图2(在识别阶段,只图示第二种特征提取方法)。
为提高分类性能,该人脸识别系统当中采用了多种距离函数度量,并对其性能进行了比较。实验表明,采用两种NVSC距离的计算速度比较快,更重要的是针对非负矩阵分解方法提取出来的特征向量,能够取得更好的人脸识别效果。
表1是在CBCL图库上具体实现该人脸识别系统之后,采用两种不同的特征提取方法,并结合各种距离函数的定义,得到的识别率汇总情况(即对全部测试图像进行分类决策之后,实现正确分类的测试图占总数的比例)。
表1
从表格中可以看出,第二种特征提取方法通常能取得更好的识别结果,而在此前提下,提出的两种NVSC距离是所有距离当中识别效果最好的度量函数。

Claims (6)

1.基于非负矩阵分解和多种距离函数的人脸识别方法,其特征在于包括如下步骤:
(1)学习图库中人脸图像特征的提取:针对学习图库中全部人脸图像做非负矩阵分解,得到对应的基图像和每张学习图像对应的权重向量即特征向量;
(2)利用非负矩阵分解的算法,在步骤(1)的基础上对测试图像中全部图像做特征提取,得到每张测试图对应的特征向量;
(3)利用步骤(1)和(2)中得到的特征向量,首先计算每一类已知身份的训练样本图像集合对应的平均特征向量Hm;然后对每个测试图像计算其与各类别训练图像集对应均值向量之间的相似度,并结合多种不同距离函数给出相似度的量化数值dist(Ht,Hm),在此基础上找出与测试图像最接近的训练图类别即最近邻点,并根据最近邻分类的方法将测试图划归最近邻所在类别,即对全部测试图像进行身份识别。
2.根据权利要求1所述的基于非负矩阵分解和多种距离函数的人脸识别方法,其特征在于步骤(1)进一步包括:
1)获取人脸图像并做规一化使其大小一致,形成一个实验数据库,并分成训练集和测试集;
2)首先,使用一个n×m矩阵V1代表训练图像数据集;
其次,采用非负矩阵分解对矩阵V1进行分解以提取特征;非负矩阵分解(NMF)的方法如下:
处理m个n维空间的样本数据,用n×m数据矩阵V表示,该数据矩阵中各个元素都是非负的,表示为V≥0,然后对矩阵V进行线性分解,以两个新的非负矩阵n×r矩阵W与r×m矩阵H来近似原矩阵,
Figure FDA0000126701900000011
其中矩阵W中列为非负基向量,而矩阵H中列代表权重向量即组合系数;i,j分别表示矩阵V中对应元素的行号与列号,a表示矩阵乘法时对应的元素在各自行列中的序号,n与m分别表示矩阵V的行数与列数;r表示W中列数,即对V做分解过程中用到的非负基向量个数;
为了实现矩阵的非负分解,首先需要定义一个损失函数F来刻画分解前后的逼近程度:
F = Σ i = 1 n Σ j = 1 m [ V ij log V ij ( WH ) ij - V ij + ( WH ) ij ]
然后在非负性约束下求解,采用以下迭代算法,
W ia ← W ia Σ j V ij ( WH ) ij H aj ,
W ia ← W ia Σ j W ja ,
H aj ← H aj Σ i W ia V ij ( WH ) ij .
从以上公式可知,该迭代算法适合分解当中非负数据的特点,即在非负性初始化的基础上,在迭代过程中能始终简单地保持非负性,从而确保数据的整体特征是局部特征的非负线性组合,局部特征在构成整体特征时不会产生正负抵消的情况。
3.根据权利要求1所述的基于非负矩阵分解和多种距离函数的人脸识别方法,其特征在于步骤(2)中非负矩阵分解算法应用到训练图像数据集对应的矩阵V1时,得到两个新的矩阵W1和H1:
Figure FDA0000126701900000031
其中W1为基矩阵,H1为权重矩阵;i,j分别表示V1中对应元素的行号与列号,a表示矩阵乘法时该元素在行列中的序号,r表示W1中列数,即对V1做分解过程中用到的非负基向量个数;
完成分解后针对训练图像建立不同的库来分别保存它们的基向量和权重向量。
4.根据权利要求3所述的基于非负矩阵分解和多种距离函数的人脸识别方法,其特征在于步骤(2)进一步包括:
对全部图像进行特征提取,分别采用两种不同方式获得训练图像和测试图像的特征向量。
方式1:
定义W1对应的广义逆矩阵 W + = ( W 1 T W 1 ) - 1 W 1 T , 再令每个训练图像Vi表示为投影到W+的特征向量H′i=W+Vi,而任一个待分类的测试图像Vt能将特征表示为H′t=W+Vt
方式2:
利用在训练阶段获得的基矩阵W1,继续使用原有的非负矩阵分解算法中迭代公式,但在迭代中保持W1不变,即不对基矩阵W1进行更新,从而得到测试图像对应的权重矩阵H2;然后,分别用H1和H2中列向量作为学习图像和测试图像的特征向量。
5.根据权利要求1所述的基于非负矩阵分解和多种距离函数的人脸识别方法,其特征在于步骤(3)进一步包括:
首先计算每一类训练样本图像集合对应的平均特征向量Hm;然后对每个测试图像计算其与各类别对应均值向量之间的各种距离度量dist(Htt,m),并根据最近邻分类的方法将测试图像归为距离最近的一类;
为提高分类性能,在人脸识别系统当中采用多种距离函数度量,对非负矩阵分解后的图像特征向量进行相似性度量,再利用最近邻分类的方法给出测试图的分类;
首先设X,Y是利用非负矩阵分解方法得到的长度为n的特征向量,其中X代表测试图像的权重向量,而Y表示训练图像的权重向量;而σ是训练图像对应权重向量的协方差矩阵,而{si,i=1,L,n}表示σ中对角元的平方根,即标准差,在此基础上引入特征向量之间各种距离函数的定义如下,其中i表示元素在向量中的标号,n表示向量的长度,d(X,Y)表示两个向量之间距离,xi与yi分别表示向量X与Y中的分量,min与max分别表示集合当中的极小值与极大值:
(1)、曼哈顿距离
d ( X , Y ) = Σ i = 1 n | x i - y i |
(2)、欧氏距离
d ( X , Y ) = Σ i = 1 n ( x i - y i ) 2
(3)、切比雪夫距离
d ( X , Y ) = max 1 ≤ i ≤ n | x i - y i |
(4)、马氏距离
d ( X , Y ) = ( X - Y ) ′ σ - 1 ( X - Y )
(5)、兰斯距离
d ( X , Y ) = Σ i = 1 n | x i - y i | | x i | + | y i |
(6)、统计距离
d ( X , Y ) = Σ i = 1 n | x i - y i s i |
(7)、散度
d ( X , Y ) = Σ i = 1 n ( x i ln x i y i - x i + y i )
(8)、Kullback-Leibler距离
d ( X , Y ) = Σ i = 1 n x i ′ log 2 x i ′ y i ′ , x i ′ = | x i | Σ i = 1 n | x i | , y i ′ = | y i | Σ i = 1 n | y i |
(9)、对称化散度
d ( X , Y ) = Σ i = 1 n ( x i ln x i y i - x i + y i ) + Σ i = 1 n ( y i ln y i x i - y i + x i ) = Σ i = 1 n ( x i ln x i yi + y i ln y i x i )
(10)、对称化的Kullback-Leibler距离
d ( X , Y ) = Σ i = 1 n x i ′ log 2 x i ′ y i ′ + Σ i = 1 n y i ′ log 2 y i ′ x i ′ , x i ′ = | x i | Σ i = 1 n | x i | , y i ′ = | y i | Σ i = 1 n | y i |
(11)、马氏角距离
d ( X , Y ) = 1 - X ′ σ - 1 Y X ′ σ - 1 X Y ′ σ - 1 Y
(12)、卡方距离
d ( X , Y ) = Σ i = 1 n ( x i - y i ) 2 x i + y i
(13)、基于指数相似系数的距离
d ( X , Y ) = 1 - γ 2 ( X , Y ) , γ ( X , Y ) = 1 n Σ i = 1 n e - 3 4 ( x i - y i ) 2 s i 2
(14)、基于非参数相似系数的距离
d ( X , Y ) = 1 - γ 2 ( X , Y ) , γ ( X , Y ) = n + - n - n + + n - ,
此处 x i ′ = x i - x ‾ , y i ′ = y i - y ‾ ,
Figure FDA00001267019000000514
Figure FDA00001267019000000515
分别表示向量X与Y中分量的均值,n+表示{x′iy′i≥0,i=1,L,n}的次数,而n-表示{x′iy′i<0,i=1,L,n}的次数。
(15)、余弦距离
d ( X , Y ) = 1 - cos ( X , Y ) = 1 - Σ i = 1 n x i y i ( Σ i = 1 n x i 2 ) ( Σ i = 1 n y i 2 )
(16)、基于相关系数的距离
d ( X , Y ) = 1 - γ ( X , Y ) , γ ( X , Y ) = Σ i = 1 n ( x i - x ‾ ) ( y i - y ‾ ) [ Σ i = 1 n ( x i - x ‾ ) 2 ] [ Σ i = 1 n ( y i - y ‾ ) 2 ] ;
6.根据权利要求5所述的基于非负矩阵分解和多种距离函数的人脸识别方法,其特征在于所述距离还包括以下两种用于人脸识别的新距离,该两种新距离基于非负向量之间两种相似系数γ(X,Y)的距离,适用于非负矩阵分解方法的应用,其中各自对应的系数γ(X,Y)定义如下:
(17)、基于非负向量相似系数的距离1
d ( X , Y ) = 1 - γ 2 ( X , Y ) , γ ( X , Y ) = Σ i = 1 n min ( x i , y i ) Σ i = 1 n max ( x i , y i )
(18)、基于非负向量相似系数的距离2(NVSC2)
d ( X , Y ) = 1 - γ 2 ( X , Y ) , γ ( X , Y ) = Σ i = 1 n min ( x i , y i ) Σ i = 1 n ( x i + y i ) / 2 .
CN2011104544078A 2011-12-29 2011-12-29 基于非负矩阵分解和多种距离函数的人脸识别方法 Pending CN102592148A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011104544078A CN102592148A (zh) 2011-12-29 2011-12-29 基于非负矩阵分解和多种距离函数的人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104544078A CN102592148A (zh) 2011-12-29 2011-12-29 基于非负矩阵分解和多种距离函数的人脸识别方法

Publications (1)

Publication Number Publication Date
CN102592148A true CN102592148A (zh) 2012-07-18

Family

ID=46480758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104544078A Pending CN102592148A (zh) 2011-12-29 2011-12-29 基于非负矩阵分解和多种距离函数的人脸识别方法

Country Status (1)

Country Link
CN (1) CN102592148A (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020017A (zh) * 2012-12-05 2013-04-03 湖州师范学院 一种流行正则和鉴别信息最大化的非负矩阵分解方法
CN103150383A (zh) * 2013-03-15 2013-06-12 中国科学院计算技术研究所 一种短文本数据的事件演化分析方法
CN103366182A (zh) * 2013-07-05 2013-10-23 西安电子科技大学 基于全监督非负矩阵分解的人脸识别方法
US9280701B2 (en) * 2014-05-08 2016-03-08 Shutterfly, Inc. Grouping face images using statistic distribution estimate
CN105740360A (zh) * 2016-01-26 2016-07-06 上海师范大学 艺术品图像中古典母题的识别与检索方法
CN105893954A (zh) * 2016-03-30 2016-08-24 深圳大学 一种基于核机器学习的非负矩阵分解人脸识别方法及系统
WO2016175895A1 (en) * 2015-04-29 2016-11-03 Shutterfly, Inc. Image product creation based on face images grouped using image product statistics
CN106597439A (zh) * 2016-12-12 2017-04-26 电子科技大学 一种基于增量学习的合成孔径雷达目标识别方法
CN106845397A (zh) * 2017-01-18 2017-06-13 湘潭大学 一种基于相似度度量的人脸确认方法
CN107423717A (zh) * 2017-08-01 2017-12-01 山东大学 一种基于联合非负矩阵二分解的手工绘制电气符号和标准电气符号的匹配识别方法
CN107704830A (zh) * 2017-10-09 2018-02-16 中国科学院重庆绿色智能技术研究院 一种视频数据多维非负隐特征的提取装置和方法
CN108304756A (zh) * 2017-01-12 2018-07-20 南亚科技股份有限公司 晶圆识别方法及设备
CN108460365A (zh) * 2018-03-27 2018-08-28 百度在线网络技术(北京)有限公司 身份认证方法和装置
CN108549883A (zh) * 2018-08-06 2018-09-18 国网浙江省电力有限公司 一种人脸再识别方法
CN109190518A (zh) * 2018-08-14 2019-01-11 电子科技大学 一种基于通用的集合度量学习的人脸验证方法
CN109508697A (zh) * 2018-12-14 2019-03-22 深圳大学 基于e辅助函数的半非负矩阵分解的人脸识别方法、系统及存储介质
CN109800787A (zh) * 2018-12-14 2019-05-24 西安交通大学 基于相对特征距离误差度量的图像模板匹配方法
CN110084883A (zh) * 2019-04-15 2019-08-02 昆明理工大学 一种诱发大脑活动重建面部图像的方法
CN110569879A (zh) * 2019-08-09 2019-12-13 平安科技(深圳)有限公司 舌头图像提取方法、装置及计算机可读存储介质
CN110598790A (zh) * 2019-09-12 2019-12-20 北京达佳互联信息技术有限公司 一种图像的识别方法、装置、电子设备及存储介质
CN111126169A (zh) * 2019-12-03 2020-05-08 重庆邮电大学 基于正交化的图正则非负矩阵分解的人脸识别方法及系统
CN111126102A (zh) * 2018-10-30 2020-05-08 富士通株式会社 人员搜索方法、装置及图像处理设备
CN111862624A (zh) * 2020-07-29 2020-10-30 浙江大华技术股份有限公司 车辆匹配方法、装置、存储介质及电子装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100329518A1 (en) * 2009-06-25 2010-12-30 Pixart Imaging Inc. Dynamic image compression method for human face detection

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100329518A1 (en) * 2009-06-25 2010-12-30 Pixart Imaging Inc. Dynamic image compression method for human face detection

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
《ICML'07 Proceedings of the 24th international conference on Machine learning》 20071231 Aharon Bar Hillel,Daphna Weinshall 《Learning distance function by coding similarity》 65-72 1-6 , *
AHARON BAR HILLEL,DAPHNA WEINSHALL: "《Learning distance function by coding similarity》", 《ICML’07 PROCEEDINGS OF THE 24TH INTERNATIONAL CONFERENCE ON MACHINE LEARNING》 *
YUN XUE等: "《Evaluation of Distance Measures for NMF-based Face Recognition》", 《COMPUTATIONAL INTELLIGENCE AND SECURITY, 2006 INTERNATIONAL CONFERENCE ON》 *
李勇智,杨静宇: "《基于非负矩阵分解新的人脸识别方法》", 《系统仿真学报》 *
程磊,郑鑫: "《基于图像块复杂度和分段距离函数的人眼定位算法研究》", 《价值工程》 *

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020017A (zh) * 2012-12-05 2013-04-03 湖州师范学院 一种流行正则和鉴别信息最大化的非负矩阵分解方法
CN103150383A (zh) * 2013-03-15 2013-06-12 中国科学院计算技术研究所 一种短文本数据的事件演化分析方法
CN103150383B (zh) * 2013-03-15 2015-07-29 中国科学院计算技术研究所 一种短文本数据的事件演化分析方法
CN103366182A (zh) * 2013-07-05 2013-10-23 西安电子科技大学 基于全监督非负矩阵分解的人脸识别方法
CN103366182B (zh) * 2013-07-05 2016-06-29 西安电子科技大学 基于全监督非负矩阵分解的人脸识别方法
US9280701B2 (en) * 2014-05-08 2016-03-08 Shutterfly, Inc. Grouping face images using statistic distribution estimate
US9626550B2 (en) * 2014-05-08 2017-04-18 Shutterfly, Inc. Grouping face images using statistic distribution estimate
WO2016175895A1 (en) * 2015-04-29 2016-11-03 Shutterfly, Inc. Image product creation based on face images grouped using image product statistics
CN105740360A (zh) * 2016-01-26 2016-07-06 上海师范大学 艺术品图像中古典母题的识别与检索方法
CN105740360B (zh) * 2016-01-26 2020-12-01 上海师范大学 艺术品图像中古典母题的识别与检索方法
CN105893954B (zh) * 2016-03-30 2019-04-23 深圳大学 一种基于核机器学习的非负矩阵分解人脸识别方法及系统
WO2017166933A1 (zh) * 2016-03-30 2017-10-05 深圳大学 一种基于核机器学习的非负矩阵分解人脸识别方法及系统
US10679040B2 (en) 2016-03-30 2020-06-09 Shenzhen University Non-negative matrix factorization face recognition method and system based on kernel machine learning
CN105893954A (zh) * 2016-03-30 2016-08-24 深圳大学 一种基于核机器学习的非负矩阵分解人脸识别方法及系统
CN106597439A (zh) * 2016-12-12 2017-04-26 电子科技大学 一种基于增量学习的合成孔径雷达目标识别方法
CN108304756A (zh) * 2017-01-12 2018-07-20 南亚科技股份有限公司 晶圆识别方法及设备
CN106845397A (zh) * 2017-01-18 2017-06-13 湘潭大学 一种基于相似度度量的人脸确认方法
CN106845397B (zh) * 2017-01-18 2020-04-14 湘潭大学 一种基于相似度度量的人脸确认方法
CN107423717A (zh) * 2017-08-01 2017-12-01 山东大学 一种基于联合非负矩阵二分解的手工绘制电气符号和标准电气符号的匹配识别方法
CN107423717B (zh) * 2017-08-01 2020-01-14 山东大学 一种基于联合非负矩阵二分解的手工绘制电气符号和标准电气符号的匹配识别方法
CN107704830B (zh) * 2017-10-09 2020-12-08 中国科学院重庆绿色智能技术研究院 一种视频数据多维非负隐特征的提取装置和方法
CN107704830A (zh) * 2017-10-09 2018-02-16 中国科学院重庆绿色智能技术研究院 一种视频数据多维非负隐特征的提取装置和方法
CN108460365B (zh) * 2018-03-27 2022-04-12 百度在线网络技术(北京)有限公司 身份认证方法和装置
CN108460365A (zh) * 2018-03-27 2018-08-28 百度在线网络技术(北京)有限公司 身份认证方法和装置
CN108549883A (zh) * 2018-08-06 2018-09-18 国网浙江省电力有限公司 一种人脸再识别方法
CN109190518A (zh) * 2018-08-14 2019-01-11 电子科技大学 一种基于通用的集合度量学习的人脸验证方法
CN109190518B (zh) * 2018-08-14 2022-03-18 电子科技大学 一种基于通用的集合度量学习的人脸验证方法
CN111126102A (zh) * 2018-10-30 2020-05-08 富士通株式会社 人员搜索方法、装置及图像处理设备
CN109508697A (zh) * 2018-12-14 2019-03-22 深圳大学 基于e辅助函数的半非负矩阵分解的人脸识别方法、系统及存储介质
CN109800787A (zh) * 2018-12-14 2019-05-24 西安交通大学 基于相对特征距离误差度量的图像模板匹配方法
CN109508697B (zh) * 2018-12-14 2022-03-08 深圳大学 基于e辅助函数的半非负矩阵分解的人脸识别方法、系统及存储介质
CN110084883A (zh) * 2019-04-15 2019-08-02 昆明理工大学 一种诱发大脑活动重建面部图像的方法
CN110569879A (zh) * 2019-08-09 2019-12-13 平安科技(深圳)有限公司 舌头图像提取方法、装置及计算机可读存储介质
CN110569879B (zh) * 2019-08-09 2024-03-15 平安科技(深圳)有限公司 舌头图像提取方法、装置及计算机可读存储介质
CN110598790A (zh) * 2019-09-12 2019-12-20 北京达佳互联信息技术有限公司 一种图像的识别方法、装置、电子设备及存储介质
CN111126169A (zh) * 2019-12-03 2020-05-08 重庆邮电大学 基于正交化的图正则非负矩阵分解的人脸识别方法及系统
CN111126169B (zh) * 2019-12-03 2022-08-30 重庆邮电大学 基于正交化的图正则非负矩阵分解的人脸识别方法及系统
CN111862624A (zh) * 2020-07-29 2020-10-30 浙江大华技术股份有限公司 车辆匹配方法、装置、存储介质及电子装置
CN111862624B (zh) * 2020-07-29 2022-05-03 浙江大华技术股份有限公司 车辆匹配方法、装置、存储介质及电子装置

Similar Documents

Publication Publication Date Title
CN102592148A (zh) 基于非负矩阵分解和多种距离函数的人脸识别方法
Thai et al. Image classification using support vector machine and artificial neural network
Kussul et al. Improved method of handwritten digit recognition tested on MNIST database
CN104318219A (zh) 基于局部特征及全局特征结合的人脸识别方法
CN103020265B (zh) 图像检索的方法和系统
CN102982349A (zh) 一种图像识别方法及装置
Athitsos et al. Efficient nearest neighbor classification using a cascade of approximate similarity measures
Jung et al. Rigid motion segmentation using randomized voting
CN108038438B (zh) 一种基于奇异值分解的多源人脸图像联合特征提取方法
CN105069774B (zh) 基于多示例学习与图割优化的目标分割方法
CN103164701B (zh) 手写体数字识别方法及装置
Ye et al. Detecting USM image sharpening by using CNN
CN112733590A (zh) 一种基于二阶混合注意力的行人重识别方法
Peleshko et al. Research of usage of Haar-like features and AdaBoost algorithm in Viola-Jones method of object detection
CN104077590A (zh) 一种视频指纹提取方法及系统
CN111325237B (zh) 一种基于注意力交互机制的图像识别方法
CN110472652A (zh) 基于语义引导的少量样本分类方法
CN110969089A (zh) 噪声环境下的轻量级人脸识别系统及识别方法
CN109934272A (zh) 一种基于全卷积网络的图像匹配方法
Sisodia et al. ISVM for face recognition
CN112381458A (zh) 项目评审方法、项目评审装置、设备及存储介质
CN116935373B (zh) 多类型车牌识别模型的训练方法、装置、设备及存储介质
CN102034102B (zh) 图像显著对象提取方法、互补显著度图学习方法及系统
CN105205487A (zh) 一种图片处理方法及装置
Chen et al. Large-scale indoor/outdoor image classification via expert decision fusion (edf)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120718