CN108009586B - 封顶概念分解方法及图像聚类方法 - Google Patents
封顶概念分解方法及图像聚类方法 Download PDFInfo
- Publication number
- CN108009586B CN108009586B CN201711257431.6A CN201711257431A CN108009586B CN 108009586 B CN108009586 B CN 108009586B CN 201711257431 A CN201711257431 A CN 201711257431A CN 108009586 B CN108009586 B CN 108009586B
- Authority
- CN
- China
- Prior art keywords
- matrix
- objective function
- diagonal
- decomposition
- negative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2133—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on naturality criteria, e.g. with non-negative factorisation or negative correlation
Abstract
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种封顶概念分解方法及图像聚类方法。
背景技术
在模式识别、计算机视觉、图像聚类等应用中,数据表示是一个根本问题,且经常与高维度数据关联。但是在高维度数据处理的过程中,往往需要使用低秩表示来从原始数据表达式中得到信息和特征。在这种情况下,矩阵分解被广泛运用线性数据表示中,其是将矩阵拆解为数个矩阵的乘积,如,给出一个原始数据矩阵X,通过矩阵分解寻找到两个或更多的矩阵,使他们的乘积近似于原始数据矩阵。
随着矩阵分解的广泛使用,概念分解作为一种有效的矩阵分解方法同样得到了广泛的关注。概念分解(Concept Factorization,CF)是非负矩阵分解(Non-negative MatrixFactorization,NMF)的一种变形,在分解过程中,每一个群是数据点的一个线性组合,每一个数据点是群中心的线性组合。相比于非负矩阵分解来说,概念分解的适用范围更广,但是概念分解有一个很大的缺陷,就是不能调解数据中的离群值和噪声,一点点的噪声入口都会影响分解结果,尤其是遇到极端异常值时,表现更糟糕。
发明内容
针对上述问题,本发明提供了一种封顶概念分解方法及图像聚类方法,有效解决现有技术中概念分解不能调解数据中的离群值和噪声,从而影响图像聚类的正确率。
本发明提供的技术方案如下:
一种封顶概念分解方法中包括:
S10获取待分解的非负矩阵X=[x1,x2,...,xn]∈Rd*n,其中,d为特征值的维度数,n为非负矩阵中数据点的个数;
S20根据所述非负矩阵构建目标函数J(F,G):
s.t.F≥0,G≥0,GTG=I
其中W表示权矩阵,F=xjW,xj表示数据集中的第j个数据点,gj表示第j个样本的表示系数,θ>0表示用于处理极端异常值的阈值,I表示单位矩阵;
S30根据所述目标函数J(F,G),使用迭代加权的方法,输出权矩阵W和特征矩阵G,完成对非负矩阵X的概念分解;
在步骤S3中包括:
S31根据导数相同原理,将目标函数J(F,G)进行变形得到变形的目标函数Y(F,G):
S32根据所述变形的目标函数Y(F,G),使用迭代乘性方法,输出权矩阵W和特征矩阵G,完成对非负矩阵X的概念分解;
在步骤S32中具体包括:
S321运用矩阵的迹将变形的目标函数Y(F,G)进行变换得到新的目标函数Z(F,G):
s.t.F≥0,G≥0,GTG=I
其中,X为数据集矩阵,F=xjW,xj表示第j个数据点的向量,W表示权矩阵,GT表示系数矩阵G的转置,D为对角矩阵,其第j个对角元素Djj,I为单位矩阵;
S322当对角矩阵D固定时,新的目标函数Z(F,G)为:
s.t.F≥0,G≥0,GTG=I
S323根据步骤S322中的目标函数Z(F,G)得到权矩阵W和特征矩阵G:
其中Wik表示权矩阵元素,Gjk表示系数矩阵的元素,D为对角矩阵,X表示非负矩阵;
S324当矩阵F和特征矩阵G不变时,对角矩阵D的迭代范数为:
其中W表示权矩阵,Djj表示对角矩阵D的第j个对角元素,xj表示数据集中第j个样本,gj表示样本xj的表示系数,θ为阈值;
S325根据步骤S323和步骤S324中得到的权矩阵W、特征矩阵G及对角矩阵D进行循环迭代预设次数,输出权矩阵W和特征矩阵G,完成对非负矩阵X的概念分解。
本发明还提供了一种图像聚类方法,包括:
从图像库中提m个图像,并构造q个最邻近图;
采用上述封顶概念分解方法得到特征矩阵G;
利用k-means算法对特征矩阵G进行分析,完成图像聚类。
本发明中的方法是对原有的概念分解方法一种改进,用来解决了现有的概念分解方法中存在的噪声和离群值问题。具体来说,本发明的方法对重建值与原有样本数据进行误差分析,如差值超过一定的阀值θ,模型则认为该样本是极端噪声样本,否则为正常样本。其中,本阀值的选择是一种无参数的方式进行,没有增加模型的参数,故具有较强的实用性。相较于现有的概念分解方法,本发明方法对于某些存在极端异常值的数据的现实问题,更加有效。
另外,本发明中的概念分解方法适用范围更加广泛,绝大多数的现实问题及应用都可以很好地解决,尤其是高维数据聚类。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对上述特性、技术特征、优点及其实现方式予以进一步说明。
图1为本发明中封顶概念分解方法流程示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
我们知道,现有的概念分解方法是在非负矩阵分解方法的基础上提出来的,其中,
在非负矩阵分解方法中,给出一个非负矩阵X=[x1,x2....xn]∈RN*K,X的每一列是一个样本向量,非负矩阵分解方法的目的就是寻找两个非负矩阵F=[fik]∈RM*K和G=[gjk]∈RN*K,其乘积接近于非负矩阵X,其目标函数O为:
O=||X-FGT||2
其中,||.||代表矩阵的罗贝尼乌斯范。
在现有的概念分解方法中,每一个基本向量fk都是样本向量xj的非负线性组合,即,
其中,ωjk≥0,让W=[ωjk]∈RN*K,概念分解的本质是寻找如下近似值:
X≈XWGT
通过求最小值,得到目标函数O':
O=||X-XWGT||2
最小化上述目标函数O,得到权矩阵W和特征矩阵G的迭代函数:
其中,K=XTX,这些乘性迭代范数只包含X的内积,所以很容易地被核化。
但是,在很多应用中,数据通常会被很大的正噪音局部影响。因为残差平方,很少的离群值都会带有极大的错误从而极易影响目标函数。虽然,当噪声的位置知道的时候,一些现存的概念分解的变形的方法可以将这些被污染的数据当作遗漏值。但是,在绝大多数的现实应用中,位置是不知道的。因此,本发明提出了一种全新的鲁棒性封顶范数概念分解方法,其运用稀疏的误差矩阵用于重建,来捕捉数据中的噪声。
如图1所示为本发明提供的封顶概念分解方法流程示意图,从图中可以看出,在该封顶概念分解方法中包括:
S10获取待分解的非负矩阵X=[x1,x2,...,xn]∈Rd*n,其中,d为特征值的维度数,n为非负矩阵中数据点的个数;
S20根据非负矩阵构建目标函数J(F,G):
s.t.F≥0,G≥0,GTG=I
其中,θ>0,用于挑选极端异常值的阈值;F∈Rd*k,表示k个基本因子,k为类的个数;G∈Rn*k,其是类别标志,表示最终的分群结果。为了提高其有效性,在该封顶概念分解方法中,对目标函数J(F,G)中的特征矩阵G进行正交性约束,以保证方法的单值性,提高分群的准确度。
S30根据目标函数J(F,G),使用迭代加权的方法,输出权矩阵W和特征矩阵G,完成对非负矩阵X的概念分解。
基于以上方法,为了优化算法,根据导数相同的方法原理,对于目标函数J(F,G)进行变形,得到变形的目标函数Y(F,G):
在根据变形的目标函数Y(F,G)迭代得到权矩阵W和特征矩阵G的过程中,将变形的目标函数Y(F,G)进行转换得到新的目标函数Z(F,G):
s.t.F≥0,G≥0,GTG=I
其中,D为对角矩阵,其中,第j个对角元素Djj为dj。
得到新的目标函数Z(F,G)后,通过迭代加权最优化策略进行求解即可。具体,当对角矩阵D固定时,新的目标函数Z(F,G)可以被扩展为:
s.t.F≥0,G≥0,GTG=I
以此权矩阵W和特征矩阵G的迭代规则为:
当基础矩阵F和特征矩阵G不变时,对角矩阵D的迭代范数为:
最后,根据上述步骤权矩阵W、特征矩阵G及对角矩阵D之后,随即开始进行迭代循环,当达到预设的循环次数t之后,输出权矩阵W和特征矩阵G,完成对非负矩阵X的鲁棒性封顶范数下的概念分解。
本发明还提供了一种图像聚类方法,在该图像聚类方法中包括:从图像库中提m个图像,并构造q个最邻近图;采用上述封顶概念分解方法得到特征矩阵G;利用k-means算法对特征矩阵G进行分析,完成图像聚类。具体,该图像聚类方法除了可以应用于正常的图片聚类之外,可以应用于人脸图像聚类等。
应当说明的是,上述实施例均可根据需要自由组合。以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通相关人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (1)
1.一种图像聚类方法,其特征在于,所述图像聚类方法中包括:
从图像库中提m个图像,并构造q个最邻近图;
采用封顶概念分解方法得到特征矩阵G;
利用k-means算法对特征矩阵G进行分析,完成图像聚类;
封顶概念分解方法中包括:
S10获取待分解的非负矩阵X=[x1,x2,...,xn]∈Rd*n,其中,d为特征值的维度数,n为非负矩阵中数据点的个数;
S20根据所述非负矩阵构建目标函数J(F,G):
s.t.F≥0,G≥0,GTG=I
其中,W表示权矩阵,xj表示第j个数据点,θ>0表示用于处理极端异常值的阈值;
S30根据所述目标函数J(F,G),使用迭代加权的方法,输出权矩阵W和特征矩阵G,完成对非负矩阵X的概念分解;
在步骤S3中包括:
S31根据导数相同原理,将目标函数J(F,G)进行变形得到变形的目标函数Y(F,G):
S32根据所述变形的目标函数Y(F,G),使用迭代加权的方法,输出权矩阵W和特征矩阵G,完成对非负矩阵X的概念分解;
在步骤S32中具体包括:
S321运用矩阵的迹将变形的目标函数Y(F,G)进行变换得到新的目标函数Z(F,G):
s.t.F≥0,G≥0,GTG=I
其中,xj表示第j个数据点,W表示权矩阵,D为对角矩阵,其第j个对角元素Djj;
S322当对角矩阵D固定时,新的目标函数Z(F,G)为:
s.t.F≥0,G≥0,GTG=I
S323根据步骤S322中的目标函数Z(F,G)得到权矩阵W和特征矩阵G,其中:
其中D为对角矩阵;
S324当矩阵F和特征矩阵G不变时,对角矩阵D的迭代范数为:
其中W表示权矩阵,Djj表示对角矩阵D的第j个对角元素,xj表示第j个数据点,θ为处理极端奇异值的阈值;
S325根据步骤S323和步骤S324中得到的权矩阵W、特征矩阵G及对角矩阵D进行循环迭代预设次数,输出权矩阵W和特征矩阵G,完成对非负矩阵X的概念分解。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711257431.6A CN108009586B (zh) | 2017-12-04 | 2017-12-04 | 封顶概念分解方法及图像聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711257431.6A CN108009586B (zh) | 2017-12-04 | 2017-12-04 | 封顶概念分解方法及图像聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108009586A CN108009586A (zh) | 2018-05-08 |
CN108009586B true CN108009586B (zh) | 2021-09-24 |
Family
ID=62056207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711257431.6A Active CN108009586B (zh) | 2017-12-04 | 2017-12-04 | 封顶概念分解方法及图像聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108009586B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447147B (zh) * | 2018-10-24 | 2021-07-06 | 西安电子科技大学 | 基于双图稀疏的深度矩阵分解的图像聚类方法 |
CN109508737B (zh) * | 2018-10-31 | 2023-09-22 | 江苏理工学院 | 基于深度矩阵的约束概念分解聚类方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006134011A1 (de) * | 2005-06-17 | 2006-12-21 | Siemens Aktiengesellschaft | Verfahren zur rechnergestützten verarbeitung von digitalen daten |
CN104134068A (zh) * | 2014-08-12 | 2014-11-05 | 江苏理工学院 | 基于稀疏编码的监控车辆特征表示及分类方法 |
CN105469034A (zh) * | 2015-11-17 | 2016-04-06 | 西安电子科技大学 | 基于加权式鉴别性稀疏约束非负矩阵分解的人脸识别方法 |
CN107341510A (zh) * | 2017-07-05 | 2017-11-10 | 西安电子科技大学 | 基于稀疏正交的双图非负矩阵分解的图像聚类方法 |
-
2017
- 2017-12-04 CN CN201711257431.6A patent/CN108009586B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006134011A1 (de) * | 2005-06-17 | 2006-12-21 | Siemens Aktiengesellschaft | Verfahren zur rechnergestützten verarbeitung von digitalen daten |
CN104134068A (zh) * | 2014-08-12 | 2014-11-05 | 江苏理工学院 | 基于稀疏编码的监控车辆特征表示及分类方法 |
CN105469034A (zh) * | 2015-11-17 | 2016-04-06 | 西安电子科技大学 | 基于加权式鉴别性稀疏约束非负矩阵分解的人脸识别方法 |
CN107341510A (zh) * | 2017-07-05 | 2017-11-10 | 西安电子科技大学 | 基于稀疏正交的双图非负矩阵分解的图像聚类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108009586A (zh) | 2018-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11645835B2 (en) | Hypercomplex deep learning methods, architectures, and apparatus for multimodal small, medium, and large-scale data representation, analysis, and applications | |
Arora et al. | Stochastic optimization for PCA and PLS | |
Zhang et al. | Robust non-negative matrix factorization | |
Saegusa et al. | Joint estimation of precision matrices in heterogeneous populations | |
CN108415883B (zh) | 基于子空间聚类的凸非负矩阵分解方法 | |
CN111191719B (zh) | 一种基于自表示和图谱约束的非负矩阵分解的图像聚类方法 | |
CN110579967B (zh) | 基于同时降维和字典学习的过程监控方法 | |
CN111324791B (zh) | 一种多视数据子空间聚类方法 | |
CN105528620B (zh) | 一种联合鲁棒主成分特征学习与视觉分类方法及系统 | |
Flenner et al. | A deep non-negative matrix factorization neural network | |
Li et al. | Tensor completion from one-bit observations | |
Salazar | On Statistical Pattern Recognition in Independent Component Analysis Mixture Modelling | |
Hoegaerts et al. | Efficiently updating and tracking the dominant kernel principal components | |
CN110717519A (zh) | 训练、特征提取、分类方法、设备及存储介质 | |
CN110032704B (zh) | 数据处理方法、装置、终端及存储介质 | |
Yu et al. | Gan-based enhanced deep subspace clustering networks | |
CN108009586B (zh) | 封顶概念分解方法及图像聚类方法 | |
Wang et al. | High-dimensional Data Clustering Using K-means Subspace Feature Selection. | |
Böhmer et al. | Regularized sparse kernel slow feature analysis | |
Jana et al. | Support recovery with stochastic gates: Theory and application for linear models | |
CN106960225B (zh) | 一种基于低秩监督的稀疏图像分类方法 | |
CN111695570A (zh) | 一种基于变分原型推理的小样本下语义分割方法 | |
CN109325515B (zh) | 基于局部学习正则化的深度矩阵分解方法及图像聚类方法 | |
Wang et al. | Data recovery and subspace clustering from quantized and corrupted measurements | |
CN109190645B (zh) | 一种高阶高维图像数据的表示与分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |