CN110414560A - 一种用于高维图像数据的自主子空间聚类方法 - Google Patents

一种用于高维图像数据的自主子空间聚类方法 Download PDF

Info

Publication number
CN110414560A
CN110414560A CN201910560704.7A CN201910560704A CN110414560A CN 110414560 A CN110414560 A CN 110414560A CN 201910560704 A CN201910560704 A CN 201910560704A CN 110414560 A CN110414560 A CN 110414560A
Authority
CN
China
Prior art keywords
autonomous
matrix
sample
self
dimensional image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910560704.7A
Other languages
English (en)
Other versions
CN110414560B (zh
Inventor
杜博
刘友发
张乐飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201910560704.7A priority Critical patent/CN110414560B/zh
Publication of CN110414560A publication Critical patent/CN110414560A/zh
Application granted granted Critical
Publication of CN110414560B publication Critical patent/CN110414560B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种用于高维图像数据的自主子空间聚类方法,包括获取高维图像数据,基于自主学习正则化项,通过求解样本权重的优化问题来学习样本的权重;通过带权重的自表示模型求自表示系数;利用自表示系数建立样本的相似度图;基于样本的相似度图进行谱聚类;检验收敛条件,若不满足则返回,若满足则流程终止,得到最终的自主子空间聚类结果。该方法将自主学习与子空间聚类进行融合,通过一种新的自主正则化项来对样本进行权重调整,有效的改善了子空间聚类模型的局部最优解,从而提升子空间聚类的性能。

Description

一种用于高维图像数据的自主子空间聚类方法
技术领域
本发明属于计算机视觉领域,具体涉及用于高维图像数据的一种自主子空间聚类方法。
背景技术
高维数据遍及于很多计算机视觉应用,如人脸聚类、运动分割等,这些数据通常位于多个低维子空间中,如何找出这些数据相应的子空间?这是一个具有挑战性的问题。从高维数据集中恢复出潜在的低维子空间结构有助于减少计算代价,算法的内存需求和噪声或异常物。因此,解决这个问题具有重要意义。子空间聚类是一个流行的方法,近些年有大量的工作涌现,但大多数是基于自表示模型来建模的。基于自表示模型的方法具有一定的可解释性,例如,Elhamifar,Ehsan和Rene Vidal于2013年在著名的模式识别与机器智能期刊IEEE Transactions on Pattern Analysis and Machine Intelligence上发表名为“Sparse subspace clustering:Algorithm,theory,and applications”的论文,解释了自表示模型挖掘潜在子空间的可行性,为子空间聚类提供了一个比较好的建模方法,但这种方法依赖于下面两个假设之一:
1)子空间独立性。
2)子空间的不相交性。
然而,在实际应用中,这二者往往很难满足。最近,基于相似度和子空间聚类的联合框架收到关注,例如Chun-Guang Li,Chong You和Rene Vidal于2017年发表在图像处理顶级期刊IEEE Transactions on Image Processing上的名“Structured SparseSubspace Clustering:A Joint Affinity Learning and Subspace ClusteringFramework”的文章。然而这些方法都利用了自表示模型,但是都忽略了它所依赖的假设在实际中很难成立的事实,因此需要一种适用范围更广的子空间聚类方法。
发明内容
为了解决上述技术问题,本发明提供了一种用于高维图像数据的自主子空间聚类方法,通过自主学习与子空间聚类融合,使得子空间聚类能适应更松的假设:
1)部分子空间独立。
或者
2)部分子空间不相交性。
本发明所采用的技术方案为一种用于高维图像数据的自主子空间聚类方法,包括以下步骤:
步骤1,获取高维图像数据,基于自主学习正则化项,通过求解样本权重的优化问题来学习样本的权重;
步骤2,通过带权重的自表示模型求自表示系数;
步骤3,利用自表示系数建立样本的相似度图;
步骤4,基于步骤3所得样本的相似度图进行谱聚类;
步骤5,检验收敛条件,若不满足则返回步骤1,若满足则流程终止,得到最终的自主子空间聚类结果。
而且,步骤1中,求解样本权重的优化问题如下,
其中,wi表示第i个样本xi的权重,||·||1表示l1范数,设有N个样本构成的矩阵X=[x1,...,xN],N为样本总数,zi为xi的自表示系数,Ei为样本xi的噪声,Ei=xi-Xzi;自主学习正则化项衰减因子γ和控制学习复杂度的参数为自主学习参数,其中γ>0。
而且,样本权重的优化问题的解为,
其中,为权重wi的最优解。
而且,步骤2中通过带权重的自表示模型求自表示系数,实现方式为求解如下优化问题:
s.t.X=XZ+E,diag(Z)=0,
其中,||·||1为l1范数,X=[x1,...,xN]为N个样本构成的矩阵,相应噪声矩阵E=[E1,...,EN],diag(Z)表示变量自表示系数矩阵Z=[Zij]1≤i≤N,1≤j≤N的所有对角元组成的向量,Zij为系数矩阵Z第i行第j列的元素;表示矩阵的逐点乘积;λ>0和α>0均为折衷参数;流形正则化项使得被分割进不同子空间的样本的相似度变小,Θ为示性矩阵。
而且,步骤3中所述利用自表示系数建立样本的相似度图,实现过程为建立相似度矩阵其中,|Z|表示对矩阵Z中的每一个元素取绝对值后得到的矩阵,ZT表示矩阵Z的转置。
本发明将自主学习和子空间聚类融合,引入了新的自主正则化项,使得新的子空间聚类模型适用范围更广,不必局限于子空间独立性假设或子空间不相交性假设,有效改善子空间聚类模型的局部最优解,成功提升了高维图像数据的子空间聚类的性能。
附图说明
图1为本发明的实施例的流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
参见图1,本发明实施例提供的一种用于高维图像数据的自主子空间聚类方法,包括以下步骤:
步骤S1:获取计算机视觉和图像处理应用中的高维图像数据,得到样本数据,通过新的自主学习方法来学习样本的权重;
实施例中,步骤1具体实现方式为求解样本权重的优化问题:
其中,wi表示第i个样本xi的权重,||·||1表示l1范数,设有N个样本构成的矩阵X=[x1,...,xN],N为样本总数,zi为xi的自表示系数,Ei为样本xi的噪声,Ei=xi-Xzi
自主学习正则化项衰减因子γ和控制学习复杂度的参数为自主学习参数,其中γ>0。
上述优化问题的解为:
其中,为权重wi的最优解。
步骤S2:通过带权重的自表示模型求自表示系数;
实施例中,步骤S2具体实现方式为求解如下带权重的自表示模型问题:
s.t.X=XZ+E,diag(Z)=0,
其中,||·||1为l1范数,X=[x1,...,xN]为N个样本构成的矩阵,相应噪声矩阵E=[E1,...,EN],diag(Z)表示变量自表示系数矩阵Z=[Zij]1≤i≤N,1≤j≤N的所有对角元组成的向量,Zij为系数矩阵Z第i行第j列的元素;表示矩阵的逐点乘积;λ>0和α>0均为折衷参数;流形正则化项使得被分割进不同子空间的样本的相似度变小,Θ为示性矩阵。
设为标记样本对应的子空间,建立数据分割矩阵如下:
Q∈{Q∈{0,1}N×K:Q1K×1=1K×1,rank(Q)=K},
其中,Q=[Qik]1≤i≤N,1≤k≤K为,rank(Q)表示矩阵Q的秩,若矩阵Q第i行第k列的元素Qik=1,则表明将第i个样本归入进第k个子空间,K为子空间的总数目,1K×1表示所有元素为1的K维列向量;
流形正则化项计算如下,
其中,Q(i,:)和Q(j,:)分别表示矩阵Q的第i行和第j行向量,Θij为示性矩阵Θ第i行第j列的元素。
例如数据来源于多个子空间S1,S2和S3的并集中,但是他们的真实子空间标签是不可用的。将每个样本上的噪声项加权,表明不同样本的重要性程度。
步骤S3:利用自表示系数建立样本的相似度图;
实施例中,步骤3具体实现方式为:建立相似度矩阵其中,|Z|表示对矩阵Z中的每一个元素取绝对值后得到的矩阵,ZT表示矩阵Z的转置,矩阵S的(i,j)位置的元素sij为第i个样本和第j个样本之间的相似度。
步骤S4,基于步骤S3所得样本的相似度图进行谱聚类:
通过对样本上的相似度图进行谱聚类,谱聚类可采用现有技术,为便于实施参考起见,介绍如下:
(1)根据相似度图求拉普拉斯矩阵;
(2)对拉普拉斯矩阵进行特征分解;
(3)取前K个最大的特征值对应的特征向量组成矩阵U,这里,K为用户指定的蔟的个数;
(4)对矩阵U的行进行K均值聚类。
基于谱聚类,可以实现对样本的分割,理想情况下,来源于用一个子空间的样本会聚到同一个子空间中,来源于不同子空间的样本则位于不同的子空间中。
通过自表示系数可以求出任意两个样本之间的相似度,以所有样本为顶点,相似度为边可以建立一个图G,理想情况下,只有属于同一个子空间的样本之间才会有边链接,根据谱聚类的原理,实施例将G分割成三个子图,如G1,G2和G3,分别对应到三个子空间S1,S2和S3
步骤S5:检验收敛条件(如:是否达到预设的最大的迭代次数),若不满足,则返回步骤1继续执行;若满足,则流程终止,得到最终的自主子空间聚类结果。
具体实施时,为了验证聚类效果,可将最终学得的自表示系数矩阵Z进行可视化,Z的每个元素都是代表样本对之间的相似关系,相似的样本对会被聚进同一个蔟中,然后将可视化结果与样本的原始蔟进行对比。
以上是本发明涉及的自主子空间聚类的实现步骤,具体实施时可采用计算机软件技术实现自动运行流程,运行本发明流程的装置也应当在保护范围内。本发明通过将自主学习和子空间聚类进行融合,引入新的自主正则化项,有效的提升的聚类模型的适用范围,不必局限于子空间独立性假设或子空间不相交性假设。
在具体实现的时候还有以下注意事项:
首先,将自主学习和子空间聚类融合,优化过程中需等到结果稳定下来(即步骤S5判定收敛条件满足。)。
其次,由于数据采集设备的差异,采集到的数据的噪声差别很大,噪声会影响步骤S1中权重的求解,这样自主正则化项里的参数将对最终结果产生大的影响,因此需要有关于噪音的一些先验信息。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (5)

1.一种用于高维图像数据的自主子空间聚类方法,其特征在于,包括以下步骤:
步骤1,获取高维图像数据,基于自主学习正则化项,通过求解样本权重的优化问题来学习样本的权重;
步骤2,通过带权重的自表示模型求自表示系数;
步骤3,利用自表示系数建立样本的相似度图;
步骤4,基于步骤3所得样本的相似度图进行谱聚类;
步骤5,检验收敛条件,若不满足则返回步骤1,若满足则流程终止,得到最终的自主子空间聚类结果。
2.根据权利要求1所述的用于高维图像数据的自主子空间聚类方法,其特征在于:步骤1中,求解样本权重的优化问题如下,
其中,wi表示第i个样本xi的权重,||·||1表示l1范数,设有N个样本构成的矩阵X=[x1,...,xN],N为样本总数,zi为xi的自表示系数,Ei为样本xi的噪声,Ei=xi-Xzi;自主学习正则化项衰减因子γ和控制学习复杂度的参数为自主学习参数,其中γ>0。
3.根据权利要求2所述的用于高维图像数据的自主子空间聚类方法,其特征在于:样本权重的优化问题的解为,
其中,为权重wi的最优解。
4.根据权利要求2或3所述的用于高维图像数据的自主子空间聚类方法,其特征在于:步骤2中通过带权重的自表示模型求自表示系数,实现方式为求解如下优化问题:
s.t.X=XZ+E,diag(Z)=0,
其中,||·||1为l1范数,X=[x1,...,xN]为N个样本构成的矩阵,相应噪声矩阵E=[E1,...,EN],diag(Z)表示变量自表示系数矩阵Z=[Zij]1≤i≤N,1≤j≤N的所有对角元组成的向量,Zij为系数矩阵Z第i行第j列的元素;表示矩阵的逐点乘积;λ>0和α>0均为折衷参数;流形正则化项使得被分割进不同子空间的样本的相似度变小,Θ为示性矩阵。
5.根据权利要求4所述的用于高维图像数据的自主子空间聚类方法,其特征在于:步骤3中所述利用自表示系数建立样本的相似度图,实现过程为建立相似度矩阵其中,|Z|表示对矩阵Z中的每一个元素取绝对值后得到的矩阵,ZT表示矩阵Z的转置。
CN201910560704.7A 2019-06-26 2019-06-26 一种用于高维图像数据的自主子空间聚类方法 Active CN110414560B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910560704.7A CN110414560B (zh) 2019-06-26 2019-06-26 一种用于高维图像数据的自主子空间聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910560704.7A CN110414560B (zh) 2019-06-26 2019-06-26 一种用于高维图像数据的自主子空间聚类方法

Publications (2)

Publication Number Publication Date
CN110414560A true CN110414560A (zh) 2019-11-05
CN110414560B CN110414560B (zh) 2022-06-07

Family

ID=68359841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910560704.7A Active CN110414560B (zh) 2019-06-26 2019-06-26 一种用于高维图像数据的自主子空间聚类方法

Country Status (1)

Country Link
CN (1) CN110414560B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111324453A (zh) * 2020-01-23 2020-06-23 天津大学 用于区块链平台资源调度的方法
CN113159211A (zh) * 2021-04-30 2021-07-23 杭州好安供应链管理有限公司 用于相似图像检索的方法、计算设备和计算机存储介质
CN117611931A (zh) * 2024-01-23 2024-02-27 西南科技大学 一种基于深度自表示局部块学习的数据分类方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140122039A1 (en) * 2012-10-25 2014-05-01 The Research Foundation For The State University Of New York Pattern change discovery between high dimensional data sets
CN107832791A (zh) * 2017-11-06 2018-03-23 辽宁工程技术大学 一种基于高维重叠数据分析的子空间聚类方法
CN109063757A (zh) * 2018-07-20 2018-12-21 西安电子科技大学 基于块对角表示和视图多样性的多视图子空间聚类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140122039A1 (en) * 2012-10-25 2014-05-01 The Research Foundation For The State University Of New York Pattern change discovery between high dimensional data sets
CN107832791A (zh) * 2017-11-06 2018-03-23 辽宁工程技术大学 一种基于高维重叠数据分析的子空间聚类方法
CN109063757A (zh) * 2018-07-20 2018-12-21 西安电子科技大学 基于块对角表示和视图多样性的多视图子空间聚类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HONG YU等: "Self-paced Learning based Multi-view Spectral Clustering", 《2017 INTERNATIONAL CONFERENCE ON TOOLS WITH ARTIFICIAL INTELLIGENCE》 *
郑建炜等: "融合关联矩阵自学习和显式秩约束的数据表示分簇算法", 《计算机学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111324453A (zh) * 2020-01-23 2020-06-23 天津大学 用于区块链平台资源调度的方法
CN111324453B (zh) * 2020-01-23 2023-01-03 天津大学 用于区块链平台资源调度的方法
CN113159211A (zh) * 2021-04-30 2021-07-23 杭州好安供应链管理有限公司 用于相似图像检索的方法、计算设备和计算机存储介质
CN117611931A (zh) * 2024-01-23 2024-02-27 西南科技大学 一种基于深度自表示局部块学习的数据分类方法及系统
CN117611931B (zh) * 2024-01-23 2024-04-05 西南科技大学 一种基于深度自表示局部块学习的数据分类方法及系统

Also Published As

Publication number Publication date
CN110414560B (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
Li et al. Incomplete multi-view clustering with joint partition and graph learning
Xie et al. Hyper-Laplacian regularized multilinear multiview self-representations for clustering and semisupervised learning
Yuan et al. Tensor ring decomposition with rank minimization on latent space: An efficient approach for tensor completion
Patel et al. Latent space sparse and low-rank subspace clustering
Fowlkes et al. Spectral grouping using the nystrom method
Feng et al. Adaptive unsupervised multi-view feature selection for visual concept recognition
CN111178432A (zh) 多分支神经网络模型的弱监督细粒度图像分类方法
CN108171279B (zh) 一种多视角视频自适应乘积Grassmann流形子空间聚类方法
CN110414560B (zh) 一种用于高维图像数据的自主子空间聚类方法
CN109376787B (zh) 流形学习网络及基于其的计算机视觉图像集分类方法
CN110516533B (zh) 一种基于深度度量的行人再辨识方法
CN112990265A (zh) 基于二部图的后期融合多视图聚类机器学习方法及系统
CN110263855B (zh) 一种利用共基胶囊投影进行图像分类的方法
CN109840518B (zh) 一种结合分类与域适应的视觉追踪方法
CN114969648B (zh) 基于模态自适应调整降维的故障检测方法及系统
Gopinath et al. Adaptive graph convolution pooling for brain surface analysis
Peng et al. Integrating feature and graph learning with low-rank representation
Liu et al. Multi-view subspace clustering based on tensor schatten-p norm
CN111340106A (zh) 基于图学习和视图权重学习的无监督多视图特征选择方法
CN111325288B (zh) 基于聚类思想的多视角动态脑网络特征维度约减方法
CN112465062A (zh) 一种基于流形学习和秩约束的聚类方法
CN113505831A (zh) 一种基于核范数约束的多视图聚类方法及系统
CN109190505A (zh) 基于视觉理解的图像识别方法
CN111160161B (zh) 一种基于噪声剔除的自步学习人脸年龄估计方法
CN113033626A (zh) 基于多任务协同学习的图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant