CN103020017A - 一种流行正则和鉴别信息最大化的非负矩阵分解方法 - Google Patents

一种流行正则和鉴别信息最大化的非负矩阵分解方法 Download PDF

Info

Publication number
CN103020017A
CN103020017A CN2012105281144A CN201210528114A CN103020017A CN 103020017 A CN103020017 A CN 103020017A CN 2012105281144 A CN2012105281144 A CN 2012105281144A CN 201210528114 A CN201210528114 A CN 201210528114A CN 103020017 A CN103020017 A CN 103020017A
Authority
CN
China
Prior art keywords
matrix
authentication information
negative
formula
popular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012105281144A
Other languages
English (en)
Inventor
蒋云良
胡文军
王娟
王培良
顾永跟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huzhou University
Original Assignee
Huzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huzhou University filed Critical Huzhou University
Priority to CN2012105281144A priority Critical patent/CN103020017A/zh
Publication of CN103020017A publication Critical patent/CN103020017A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种流行正则和鉴别信息最大化的非负矩阵分解方法,包括计算数据集X=[x1,Λ,xN]的p近邻权矩阵W;然后根据A)步骤中所得的p近邻权矩阵W,计算拉普拉斯矩阵L=D-W,所述D为对角矩阵且计算M矩阵;通过迭代规则计算基向量矩阵和编码向量矩阵四个主要步骤。本发明方法的优势在于:在进行非负矩阵分解时,本发明利用流行正则项保持数据潜在流行结构的同时,最大化基向量中的类间重要鉴别信息,从而使得分解后得到的编码向量更具数据表示能力。

Description

一种流行正则和鉴别信息最大化的非负矩阵分解方法
【技术领域】
本发明涉及数据表示,具体涉及流行正则和鉴别信息最大化的非负矩阵分解方法。 
【背景技术】
非负矩阵分解(NMF)是一种常用的矩阵分解方法,它是将矩阵分解为两个非负矩阵的乘积形式,非负矩阵分解因为只能进行纯加性的组合运算,所以常被解释成是一种基于部分的数据表示方法,这与常用的奇异值分解、主成份分析和独立成份分析完全不同。目前,非负矩阵分解在计算视觉、模式识别和文本挖掘等方面获得了巨大应用,特别是在人脸识别、文本表示方面。 
许多学者对非负矩阵分解方法进行了深入研究,提出了多种改进的非负矩阵分解方法,如半非负矩阵分解(Semi-NMF)、凸非负矩阵分解(Convex-NMF)和图正则的非负矩阵分解(GNMF)等。图正则的非负矩阵分解方法将数据矩阵分解为基向量和对应编码向量乘积,认为编码向量是数据集在基向量下的一种数据表示,进而引入一正则项使得编码向量保持数据潜在的流行结构,最终获得了较好的效果。 
实际上,基向量中包含了类间的重要信息,这对分类和聚类等机器学习任务起着重要的作用,但这些信息如何在非负矩阵分解中获得利用却是未知,此外,基向量中的类间信息引入到图正则的非负矩阵分解方法,对其将是一种有益的补充,这些都需要人们去研究。 
【发明内容】
本发明的目的是在非负矩阵分解时利用基向量中的类间重要信息,同时保持数据潜在的流行结构,提供一种流行正则和鉴别信息最大化的非负矩阵分解方法,使得本发明所获得的编码向量具有更好的数据表示能力。 
为实现上述目的,本发明提出了一种流行正则和鉴别信息最大化的非负矩阵分解方法,包含如下步骤: 
A):首先计算数据集X=[x1,Λ,xN]的p近邻权矩阵W,计算方法为: 
Figure BDA00002529940900011
或 
Figure BDA00002529940900012
其中,
Figure BDA00002529940900013
N(xi)和N(xj)分别是xi和xj的p个近邻子集,σ为常量; 
B):然后根据A)步骤中所得的p近邻权矩阵W,计算拉普拉斯矩阵 L=D-W,所述D为对角矩阵且
C):计算M矩阵 
M = ( I - 1 K E ) T ( I - 1 K E ) = I - 1 K E , - - - ( 3 )
其中,K为类别数,E为K阶全1阵,I为K阶单位阵; 
D):通过迭代规则计算基向量矩阵
Figure BDA00002529940900023
和编码向量矩阵 
Figure BDA00002529940900024
u ik ← u ik ( XV + λ 2 U ) ik ( UV T V + λ 2 K UE ) ik - - - ( 4 )
v jk ← v jk ( X T U + λ 1 WV ) jk ( VU T U + λ 1 DV ) jk - - - ( 5 )
其中,λ1和λ2是两个控制参数。 
作为优选,所述C)步骤中计算M矩阵的步骤包括: 
1)首先设定基向量矩阵
Figure BDA00002529940900027
中各个列向量uk在某种程度上代表了各类中心; 
2)然后将类间信息表示为: 
R 2 ( U ) = Σ i = 1 K | | u i - 1 K Σ j = 1 K u j | | 2
= Tr ( U ( I - 1 K E ) T ( I - 1 K E ) U T ) , - - - ( 6 )
= Tr ( UMU T )
其中,K为类别数,E为K阶全1阵,I为K阶单位阵,Tr表示矩阵的基,M矩阵如下: 
M = ( I - 1 K E ) T ( I - 1 K E ) = I - 1 K E - - - ( 7 )
作为优选,所述D)步骤中基向量矩阵和编码向量矩阵 
Figure BDA000025299409000213
的迭代公式计算求解步骤包括: 
1)利用编码向量矩阵
Figure BDA000025299409000214
的第j行向量构造一列向量,记为zj=[vjk,Λ,vjK]T,则zj是xi在基U下的一种表示,因此可通过最小式8来保持数据的流行结构, 
R 1 ( V ) = 1 2 Σ i , j = 1 N | | z i - z j | | 2 W ij
= Σ i = 1 N z i T z i D ii - Σ i , j = 1 N z i T z j W ij - - - ( 8 )
= Tr ( V T DV ) - Tr ( V T WV )
= Tr ( V T LV )
2)利用式8和式6构造本发明流行正则和鉴别信息最大化的非负矩阵分解方法的目标函数,如下: 
O4(U,V)=‖X-UVT21R1(V)-λ2R2(U) 
=Tr((X-UVT)(X-UVT)T)+λ1R1(V)-λ2R2(U)(9) 
=Tr(XXT)-2Tr(XVUT)+Tr(UVTVUT
1Tr(VTLV)-λ2Tr(UMUT
其中,λ1和λ2是两个控制参数。 
3)由于U和V非负,故定义U和V的拉格朗日乘子Θ=[θik]和Φ=[φjk],得到拉格朗日函数,如下: 
L(U,V)=O4(U,V)+Tr(ΘUT)+Tr(ΦVT
=Tr(XXT)-2Tr(XVUT)+Tr(UVTVUT)+λ1Tr(VTLV)(10) 
2Tr(UMUT)+Tr(ΘUT)+Tr(ΦVT
4)利用式10,此时L(U,V)对应取极值的必要条件表示为 
∂ L ( U , V ) ∂ U = - 2 XV + 2 U V T V - 2 λ 2 UM + Θ = 0 - - - ( 11 )
∂ L ( U , V ) ∂ V = - 2 X T U + 2 V U T U + 2 λ 1 LV + Φ = 0 - - - ( 12 )
5)根据Karush-Kuhn-Tucker(KKT)条件,有θikuik=0和φjkvjk=0,由式11和式12可得 
-(XV)ikuik+(UVTV)ikuik2(UM)ikuik=0(13) 
-(XTU)jkvjk+(VUTU)jkvjk1(LV)jkvjk=0(14) 
由式13和式14得到基向量矩阵和编码向量矩阵的迭代规则。 
作为优选,所述D)步骤中λ1=100,λ2=500。 
本发明的优点是:本发明在进行非负矩阵分解时利用流行正则项保持数据潜在流行结构,同时最大化基向量中的类间重要鉴别信息,从而使得分解后得 到的编码向量更具数据表示能力。 
本发明的特征及优点将通过实施例结合附图进行详细说明。 
【附图说明】
图1是本发明一种流行正则和鉴别信息最大化的非负矩阵分解方法的应用示意图。 
【具体实施方式】
实施例一 
在真实的PIE人脸图像数据集数据集上,利用本发明进行数据矩阵分解获得相应的编码向量,然后再进行聚类任务。参阅图1:本发明一种流行正则和鉴别信息最大化的非负矩阵分解方法,包括如下步骤: 
A):首先计算数据集X=[x1,Λ,xN]的p近邻权矩阵W,计算方法为: 
Figure BDA00002529940900041
或 
其中,
Figure BDA00002529940900043
N(xi)和N(xj)分别是xi和xj的p个近邻子集,σ为常量; 
B):然后根据A)步骤中所得的p近邻权矩阵W,计算拉普拉斯矩阵L=D-W,所述D为对角矩阵且
Figure BDA00002529940900044
C):计算M矩阵 
M = ( I - 1 K E ) T ( I - 1 K E ) = I - 1 K E , - - - ( 3 )
其中,K为类别数,E为K阶全1阵,I为K阶单位阵; 
D):通过迭代规则计算基向量矩阵和编码向量矩阵
u ik ← u ik ( XV + λ 2 U ) ik ( UV T V + λ 2 K UE ) ik - - - ( 4 )
v jk ← v jk ( X T U + λ 1 WV ) jk ( VU T U + λ 1 DV ) jk - - - ( 5 )
其中,λ1为100,λ2为500; 
E)最后完成后续任务。 
参阅表1,MMNMF对应本发明方法,由于本发明最大化基向量中的类间鉴别信息,使得非负矩阵分解得到的编码向量更具表示能力,结果K-Means聚类方法在编码向量上获得好的聚类性能。 
表1 
实施例二 
在真实的COIL20手写数字图像数据集数据集上,利用本发明进行数据矩阵分解获得相应的编码向量,然后再进行聚类任务。参阅图1:本发明一种流行正则和鉴别信息最大化的非负矩阵分解方法,包括如下步骤: 
A):首先计算数据集X=[x1,Λ,xN]的p近邻权矩阵W,计算方法为: 
Figure BDA00002529940900052
或 
Figure BDA00002529940900053
其中,
Figure BDA00002529940900054
N(xi)和N(xj)分别是xi和xj的p个近邻子集,σ为常量; 
B):然后根据A)步骤中所得的p近邻权矩阵W,计算拉普拉斯矩阵L=D-W,所述D为对角矩阵且
Figure BDA00002529940900055
C):计算M矩阵 
M = ( I - 1 K E ) T ( I - 1 K E ) = I - 1 K E , - - - ( 3 )
其中,K为类别数,E为K阶全1阵,I为K阶单位阵; 
D):通过迭代规则计算基向量矩阵
Figure BDA00002529940900057
和编码向量矩阵
Figure BDA00002529940900058
u ik ← u ik ( XV + λ 2 U ) ik ( UV T V + λ 2 K UE ) ik - - - ( 4 )
v jk ← v jk ( X T U + λ 1 WV ) jk ( VU T U + λ 1 DV ) jk - - - ( 5 )
其中,λ1为100,λ2为500; 
E)最后完成后续任务。 
参阅表2,MMNMF对应本发明方法,由于本发明最大化基向量中的类间鉴别信息,使得非负矩阵分解得到的编码向量更具表示能力,结果K-Means聚类方法在编码向量上获得好的聚类性能。 
表2 
实施例三 
在真实的TDT2文本数据集数据集上,利用本发明进行数据矩阵分解获得相应的编码向量,然后再进行聚类任务。参阅图1:本发明一种流行正则和鉴别信息最大化的非负矩阵分解方法,包括如下步骤: 
A):首先计算数据集X=[x1,Λ,xN]的p近邻权矩阵W,计算方法为: 
Figure BDA00002529940900062
或 
Figure BDA00002529940900063
其中,
Figure BDA00002529940900064
N(xi)和N(xj)分别是xi和xj的p个近邻子集,σ为常量; 
B):然后根据A)步骤中所得的p近邻权矩阵W,计算拉普拉斯矩阵L=D-W,所述D为对角矩阵且
Figure BDA00002529940900065
C):计算M矩阵 
M = ( I - 1 K E ) T ( I - 1 K E ) = I - 1 K E , - - - ( 3 )
其中,K为类别数,E为K阶全1阵,I为K阶单位阵; 
D):通过迭代规则计算基向量矩阵
Figure BDA00002529940900072
和编码向量矩阵
Figure BDA00002529940900073
u ik ← u ik ( XV + λ 2 U ) ik ( UV T V + λ 2 K UE ) ik - - - ( 4 )
v jk ← v jk ( X T U + λ 1 WV ) jk ( VU T U + λ 1 DV ) jk - - - ( 5 )
其中,λ1为100,λ2为500; 
E)最后完成后续任务。 
参阅表3,MMNMF对应本发明方法,由于本发明最大化基向量中的类间鉴别信息,使得非负矩阵分解得到的编码向量更具表示能力,结果K-Means聚类方法在编码向量上获得好的聚类性能。 
表3 
Figure BDA00002529940900076
上述实施例是对本发明的说明,不是对本发明的限定,任何对本发明简单变换后的方案均属于本发明的保护范围。 

Claims (4)

1.一种流行正则和鉴别信息最大化的非负矩阵分解方法,其特征在于:包含如下步骤: 
A):首先计算数据集X=[x1,Λ,xN]的p近邻权矩阵W,计算方法为: 
Figure FDA00002529940800011
或 
Figure FDA00002529940800012
其中,N(xi)和N(xj)分别是xi和xj的p个近邻子集,σ为常量; 
B):然后根据A)步骤中所得的p近邻权矩阵W,计算拉普拉斯矩阵L=D-W,所述D为对角矩阵且
Figure FDA00002529940800014
C):计算M矩阵 
Figure FDA00002529940800015
其中,K为类别数,E为K阶全1阵,I为K阶单位阵; 
D):通过迭代规则计算基向量矩阵
Figure FDA00002529940800016
和编码向量矩阵
Figure FDA00002529940800018
Figure FDA00002529940800019
其中,λ1和λ2是两个控制参数。 
2.如权利要求1所述的一种流行正则和鉴别信息最大化的非负矩阵分解方法,其特征在于:所述C)步骤中计算M矩阵的步骤包括: 
1)首先设定基向量矩阵
Figure FDA000025299408000110
中各个列向量uk在某种程度上代表了各类中心; 
2)然后将类间信息表示为: 
Figure FDA000025299408000111
Figure FDA000025299408000112
Figure FDA000025299408000113
其中,K为类别数,E为K阶全1阵,I为K阶单位阵,Tr表示矩阵的基,M矩阵如下: 
3.如权利要求1所述的一种流行正则和鉴别信息最大化的非负矩阵分解方法,其特征在于:所述D)步骤中基向量矩阵
Figure FDA00002529940800022
和编码向量矩阵 
Figure FDA00002529940800023
的迭代公式计算求解步骤包括: 
1)利用编码向量矩阵
Figure FDA00002529940800024
的第j行向量构造一列向量,记为zj=[vjk,Λ,vjk]T,则zj是xi在基U下的一种表示,因此可通过最小式8来保持数据的流行结构, 
Figure FDA00002529940800026
Figure FDA00002529940800027
2)利用式8和式6构造本发明流行正则和鉴别信息最大化的非负矩阵分解方法的目标函数,如下: 
O4(U,V)=‖X-UVT21R1(V)-λ2R2(U) 
=Tr((X-UVT)(X-UVT)T)+λ1R1(V)-λ2R2(U)(9) 
=Tr(XXT)-2Tr(XVUT)+Tr(UVTVUT
1Tr(VTLV)-λ2Tr(UMUT
其中,λ1和λ2是两个控制参数。 
3)由于U和V非负,故定义U和V的拉格朗日乘子Θ=[θik]和Φ=[φjk],得到拉格朗日函数,如下: 
L(U,V)=O4(U,V)+Tr(ΘUT)+Tr(ΦVT
=Tr(XXT)-2Tr(XVUT)+Tr(UVTVUT)+λ1Tr(VTLV)(10) 
2Tr(UMUT)+Tr(ΘUT)+Tr(ΦVT
4)利用式10,此时L(U,V)对应取极值的必要条件表示为 
Figure FDA00002529940800029
Figure FDA000025299408000210
5)根据Karush-Kuhn-Tucker(KKT)条件,有θikuik=0和φjkvjk=0,由式11和式12可得 
-(XV)ikuik+(UVTV)ikuik2(UM)ikuik=0(13) 
-(XTU)jkvjk+(VUTU)jkvjk1(LV)jkvjk=0(14) 
由式13和式14得到基向量矩阵和编码向量矩阵的迭代规则。 
4.如权利要求1所述的一种流行正则和鉴别信息最大化的非负矩阵分解方法,其特征在于:所述D)步骤中λ1=100,λ2=500。 
CN2012105281144A 2012-12-05 2012-12-05 一种流行正则和鉴别信息最大化的非负矩阵分解方法 Pending CN103020017A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012105281144A CN103020017A (zh) 2012-12-05 2012-12-05 一种流行正则和鉴别信息最大化的非负矩阵分解方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012105281144A CN103020017A (zh) 2012-12-05 2012-12-05 一种流行正则和鉴别信息最大化的非负矩阵分解方法

Publications (1)

Publication Number Publication Date
CN103020017A true CN103020017A (zh) 2013-04-03

Family

ID=47968638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012105281144A Pending CN103020017A (zh) 2012-12-05 2012-12-05 一种流行正则和鉴别信息最大化的非负矩阵分解方法

Country Status (1)

Country Link
CN (1) CN103020017A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103838974A (zh) * 2014-03-18 2014-06-04 湖州师范学院 一种基于elm与图正则化的数据表示方法
CN104063717A (zh) * 2014-07-09 2014-09-24 哈尔滨工业大学 局部结构保持的全局监督图嵌入复杂系统监测数据可视化方法
CN105095275A (zh) * 2014-05-13 2015-11-25 中国科学院自动化研究所 文档聚类的方法及装置
CN107609596A (zh) * 2017-09-22 2018-01-19 江苏理工学院 无参数自动加权多图正则化非负矩阵分解及图像聚类方法
CN108415883A (zh) * 2018-02-13 2018-08-17 中国科学院西安光学精密机械研究所 基于子空间聚类的凸非负矩阵分解方法
CN109885028A (zh) * 2019-03-13 2019-06-14 东北大学 基于相关熵诱导度量的电熔氧化镁熔炼过程故障检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719270A (zh) * 2009-12-25 2010-06-02 武汉大学 一种基于非负矩阵分解的人脸超分辨率处理方法
CN102306492A (zh) * 2011-09-09 2012-01-04 中国人民解放军理工大学 基于卷积非负矩阵分解的语音转换方法
CN102592148A (zh) * 2011-12-29 2012-07-18 华南师范大学 基于非负矩阵分解和多种距离函数的人脸识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719270A (zh) * 2009-12-25 2010-06-02 武汉大学 一种基于非负矩阵分解的人脸超分辨率处理方法
CN102306492A (zh) * 2011-09-09 2012-01-04 中国人民解放军理工大学 基于卷积非负矩阵分解的语音转换方法
CN102592148A (zh) * 2011-12-29 2012-07-18 华南师范大学 基于非负矩阵分解和多种距离函数的人脸识别方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103838974A (zh) * 2014-03-18 2014-06-04 湖州师范学院 一种基于elm与图正则化的数据表示方法
CN105095275A (zh) * 2014-05-13 2015-11-25 中国科学院自动化研究所 文档聚类的方法及装置
CN105095275B (zh) * 2014-05-13 2019-04-05 中国科学院自动化研究所 文档聚类的方法及装置
CN104063717A (zh) * 2014-07-09 2014-09-24 哈尔滨工业大学 局部结构保持的全局监督图嵌入复杂系统监测数据可视化方法
CN104063717B (zh) * 2014-07-09 2017-03-22 哈尔滨工业大学 局部结构保持的全局监督图嵌入复杂系统监测数据可视化方法
CN107609596A (zh) * 2017-09-22 2018-01-19 江苏理工学院 无参数自动加权多图正则化非负矩阵分解及图像聚类方法
CN107609596B (zh) * 2017-09-22 2020-09-15 江苏理工学院 无参数自动加权多图正则化非负矩阵分解及图像聚类方法
CN108415883A (zh) * 2018-02-13 2018-08-17 中国科学院西安光学精密机械研究所 基于子空间聚类的凸非负矩阵分解方法
CN108415883B (zh) * 2018-02-13 2020-06-16 中国科学院西安光学精密机械研究所 基于子空间聚类的凸非负矩阵分解方法
CN109885028A (zh) * 2019-03-13 2019-06-14 东北大学 基于相关熵诱导度量的电熔氧化镁熔炼过程故障检测方法
CN109885028B (zh) * 2019-03-13 2021-06-22 东北大学 基于相关熵诱导度量的电熔氧化镁熔炼过程故障检测方法

Similar Documents

Publication Publication Date Title
Li et al. Temporal subspace clustering for human motion segmentation
Shahroudy et al. Multimodal multipart learning for action recognition in depth videos
CN103020017A (zh) 一种流行正则和鉴别信息最大化的非负矩阵分解方法
Zhang et al. Robust latent low rank representation for subspace clustering
Chen et al. Integrating global and local structures: A least squares framework for dimensionality reduction
Prokhorov A convolutional learning system for object classification in 3-D lidar data
Wang Block principal component analysis with L1-norm for image analysis
Lin et al. Capturing patterns via parsimonious t mixture models
Mashhoori et al. Block-wise two-directional 2DPCA with ensemble learning for face recognition
Hu et al. A new face recognition method based on image decomposition for single sample per person problem
Prates et al. Kernel cross-view collaborative representation based classification for person re-identification
Newman et al. Image classification using local tensor singular value decompositions
Pan et al. A divide-and-conquer method for scalable robust multitask learning
Dhingra Lwposr: Lightweight efficient fine grained head pose estimation
CN101877065B (zh) 小样本条件下的人脸图像非线性鉴别特征抽取和识别方法
CN103714340A (zh) 基于图像分块的自适应特征提取方法
CN104318224A (zh) 一种人脸识别方法及监控设备
Feng et al. Bi-iterative algorithm for extracting independent components from array signals
CN102289679B (zh) 一种基于相关特征和非线性映射的固定视角人脸超分辨率识别方法
Tan et al. Tensor recovery via multi-linear augmented Lagrange multiplier method
Cotter et al. A hardware accelerated multilevel visual classifier for embedded visual-assist systems
Zhang et al. Spectral error correcting output codes for efficient multiclass recognition
Sun et al. Support vector machine committee for classification
Bachega et al. Classification of high-dimensional data using the sparse matrix transform
Feng et al. Improving ESVM with generalized cross-validation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20130403