CN112148911B - 一种多视图本征低秩结构的图像聚类方法 - Google Patents

一种多视图本征低秩结构的图像聚类方法 Download PDF

Info

Publication number
CN112148911B
CN112148911B CN202010835395.2A CN202010835395A CN112148911B CN 112148911 B CN112148911 B CN 112148911B CN 202010835395 A CN202010835395 A CN 202010835395A CN 112148911 B CN112148911 B CN 112148911B
Authority
CN
China
Prior art keywords
matrix
view
dataset
clustering method
adjacency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010835395.2A
Other languages
English (en)
Other versions
CN112148911A (zh
Inventor
沈项军
王志扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN202010835395.2A priority Critical patent/CN112148911B/zh
Publication of CN112148911A publication Critical patent/CN112148911A/zh
Application granted granted Critical
Publication of CN112148911B publication Critical patent/CN112148911B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种多视图本征低秩结构的图像聚类方法,采集v个视图组成多视图数据集X;初始化变量,包括构造多视图数据集X的邻接矩阵W、出度矩阵D和拉普拉斯矩阵L;根据数据集X、初始化邻近矩阵W和拉普拉斯矩阵L构造目标优化函数;利用增广拉格朗日乘法对目标优化函数进行处理,更新各项变量并计算计算损失函数;设置迭代循环条件,直到满足循环条件则退出循环,输出的邻接矩阵W为最优解;根据得出的最优相似矩阵W,对相似矩阵W使用强连通分量算法,即可得出多视图数据集的聚类标签。本发明充分利用多视图数据的信息,同时添加相似矩阵动态调节约束,让谱聚类能够利用共同低秩Z0的信息,从而提高聚类的准确性。

Description

一种多视图本征低秩结构的图像聚类方法
技术领域
本发明涉及图像处理技术,具体是一种多视图本征低秩结构的图像聚类方法。
背景技术
聚类是无监督学习中的一个重要的研究内容,是应用最广泛的数据分析技术之一,应 用范围包括统计学、计算机科学、生物学、社会科学和心理学。现有的多视图图像聚类技 术,主要分成两类:基于子空间算法和基于谱聚类的算法。目前针对多视图的聚类算法还有不完善之处,仍有改进之处。例如,谱聚类效果非常依赖于相似矩阵,不同的相似矩阵 得到的最终聚类效果可能很不同;不能很好的利用多视图的数据特征进行聚类等等问题。
发明内容
为了解决现有技术的不足,本发明提出了一种多视图本征低秩结构的图像聚类方法, 通过结合低秩表达和谱聚类,并在低秩部分中提取多视图共同的低秩Z0,从而充分利用多 视图数据的信息;同时添加相似矩阵动态调节约束让谱聚类能够利用共同低 秩Z0的信息,从而提高聚类的准确性。
本发明所采用的技术方案如下:
一种多视图本征低秩结构的图像聚类方法,包括如下步骤:
步骤1,采集v个视图组成多视图数据集X={x1,x2,...,xv},其中,xi为第i个视图,i=1,2,...,v;
步骤2,初始化变量,包括构造多视图数据集X的邻接矩阵W、出度矩阵D和拉普拉斯矩阵L;
步骤3,根据数据集X、初始化邻近矩阵W和拉普拉斯矩阵L构造目标优化函数,
步骤4,利用增广拉格朗日乘法对目标优化函数进行处理,更新各项变量并计算计算 损失函数;
步骤5,设置迭代循环条件,直到满足循环条件则退出循环,输出的邻接矩阵W为最优解;
步骤6,根据步骤5计算得出的最优相似矩阵W,对相似矩阵W使用强连通分量算法,即可得出多视图数据集的聚类标签。
进一步,使用K近邻算法构造多视图数据集X的邻接矩阵W的方法为:
其中,wij为邻接矩阵W中第i行第j列元素,xi,i为多视图数据集X中第i个视图第i行元素,xi,j为多视图数据集X中第i个视图第j行元素;由wij组成多视图数据集X的邻接矩阵W。
进一步,基于邻接矩阵W中的元素wij计算得出度矩阵D的元素即矩阵 的对角线元素为矩阵W对应行的行和,其余元素为0,dii为度矩阵D中第i行第i列元素,wij为邻接矩阵W中第i行第j列元素,n表示视图中图像的数量。
进一步,根据计算得出度矩阵D和邻接矩阵W,得到拉普拉斯矩阵L=D-W。
进一步,所述目标优化函数表示为:
其中,为相似矩阵动态调节项,λ1、λ2、λ3均为平衡因子;Ui为松弛变量,i=1,2,...,v;Zi为第i个视图独立的特征部分,i=1,2,...,v;Zj为第j个视图独立的特征部分,j=1,2,...,v;Z0为本征低秩部分,Tr(·)为矩阵迹运算,/>为Zi的转置;F为指示矩阵,FT为指示矩阵的转置,L为拉普拉斯矩阵,Ei为第i个视图的残差项,i=1,2,...,v;Xi为多 视图数据集X的第i个视图,i=1,2,...,v;Pi为数据集的低秩成分,i=1,2,...,v;n为数据 的数量,I代表单位矩阵,||·||F、||·||*、||·||1、||·||2,1分别表示矩阵的F范数、核范数、1范 数和21范数。
进一步,利用增广拉格朗日乘法对目标优化函数进行处理得到:
其中,为拉格朗日函数,Hi、Ji、Ki均为拉格朗日乘子矩阵,i=1,2,...,v。
进一步,对各个变量进行更新求解:
Step1,通过对拉格朗日函数求Pi的偏导数,并令偏导数为0,计算可得:
Step2,通过对拉格朗日函数求Z0的偏导数,并令偏导数为0,计算可得:
Step3,邻近矩阵W可以通过对拉格朗日函数中只包含W的项恒等变形得到:
其中wi为邻接矩阵W中第i行元素,因此元素wij的更新公式为:
其中,fi为指示矩阵F的第i列元素,fj为指示矩阵F的第j列元素,η为拉格 朗日乘子。
Step4,松弛变量Ui的更新公式为:
其中,μ为惩罚因子,
Step5,残差项Ei的更新公式为:
Step6,计算损失函数:
进一步,循环条件为整体损失函数Loss小于1e-6或者迭代次数大于200次。
本发明的有益效果:
1、本发明通过将获取多视图数据的共同低秩部分,能够更好的挖掘多视图数据的共同 特征,可以提高聚类结果的精确度。
2、本发明通过相似矩阵动态调节约束,能够让谱聚类从低秩结构中学习数据特征,提 供更好的相似矩阵,从而提高聚类的性能。本发明的聚类效果相较于同类的聚类方法在ORL 和Yale数据集上,聚类的准确度、标准化互信息、精确度、召回率等6个聚类指标都有提升。
附图说明
图1是本发明提出的方法的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本 发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不 用于限定本发明。
如图1所示的一种多视图本征低秩结构的图像聚类方法,包括如下步骤:
步骤1,采集v个视图组成多视图数据集X={x1,x2,...,xv},其中,xi为第i个视图,i=1,2,...,v,且xi∈Di×n,其中,Di为第i个视图的维度,n表示视图中图像的数量,视图的维度Di是由图像的多个属性组成的,如颜色、角度、光感等属性。
步骤2,初始化变量;
步骤2.1,使用K近邻算法对数据集X构造多视图数据集X的邻接矩阵W,具体为:
其中,wij为邻接矩阵W中第i行第j列元素,xi,j为多视图数据集X中第i个视图第i行元素,xi,j为多视图数据集X中第i个视图第j行元素;由wij组成多视图数据集X的邻接矩阵W。
步骤2.2,基于邻接矩阵W中的元素wij计算得出度矩阵D的元素即矩阵D的对角线元素为矩阵W对应行的行和,其余元素为0。dii为度矩阵D中第i行第i列元素,wij为邻接矩阵W中第i行第j列元素,n表示视图中图像的数量。
步骤2.3,根据计算得出度矩阵D和邻接矩阵W,得到拉普拉斯矩阵L=D-W。
步骤3,根据数据集X、初始化邻近矩阵W和拉普拉斯矩阵L构造目标优化函数:
其中,为相似矩阵动态调节项,λ1、λ2、λ3均为平衡因子;Ui为松弛变量,i=1,2,...,v;Zi为第i个视图独立的特征部分,i=1,2,...,v;Zj为第j个视图独立的特征部分,j=1,2,...,v;Z0为本征低秩部分,Tr(·)为矩阵迹运算,/>为Zi的转置;F为指示矩阵,FT为指示矩阵的转置,L为拉普拉斯矩阵,Ei为第i个视图的残差项,i=1,2,...,v;Xi为多 视图数据集X的第i个视图,i=1,2,...,v;Pi为数据集的低秩成分,i=1,2,...,v;n为数据 的数量,I代表单位矩阵;||·||F、||·||*、||·||1、||·||2,1分别表示矩阵的F范数、核范数、1范 数和21范数。
步骤4,迭代更新各项变量:
步骤4.1,利用增广拉格朗日乘法对目标优化函数进行处理得到:
其中,为拉格朗日函数,Hi、Ji、Ki为拉格朗日乘子矩阵,i=1,2,...,v,〈A,B〉=Tr(ATB), Xi为X的第i个视图,i=1,2,...,v。
步骤4.2,根据所构造的拉格朗日函数,对各个变量进行更新求解:
Step1,通过对拉格朗日函数求Pi的偏导数,并令偏导数为0,计算可得:
Step2,通过对拉格朗日函数求Z0的偏导数,并令偏导数为0,计算可得:
Step3,邻近矩阵W可以通过对拉格朗日函数中只包含W的项恒等变形得到:其中,wi为邻接矩阵W中第i行元素,因此元素wij的更 新公式为:
其中,fi为指示矩阵F的第i列元素,fj为指示矩阵F的第j列元素,η为拉格 朗日乘子。
Step4,松弛变量Ui的更新公式为:
其中,μ为惩罚因子,
Step5,残差项Ei的更新公式为:
Step6,计算损失函数:
步骤5,设置循环条件:整体损失函数小于1e-6或者迭代次数大于200次;在循环过程中,根据步骤4.2中Step1至Step5更新Pi、Z0、W、Ui、Ei,直到满足循环条件。当循 环退出,输出的邻接矩阵W为最优解。
步骤6:根据步骤5计算得出的最优相似矩阵W,对相似矩阵W使用强连通分量算法,即可得出多视图数据集的聚类标签。
为了说明本发明方法所带来的技术效果,以下结合本发明方法与同类的聚类效果进行 对比,结合下表数据可以看出,在ORL和Yale数据集上,聚类的准确度、标准化互信息、精确度、召回率等6个聚类指标都有提升。
聚类结果
以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员 能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据 本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。

Claims (7)

1.一种多视图本征低秩结构的图像聚类方法,其特征在于,包括如下步骤:
步骤1,采集v个视图组成多视图数据集X={x1,x2,…,xi,…,xv},其中,xi为第i个视图;
步骤2,初始化变量,包括构造多视图数据集X的邻接矩阵W、出度矩阵D和拉普拉斯矩阵L;
步骤3,根据数据集X、初始化邻近矩阵W和拉普拉斯矩阵L构造目标优化函数,所述目标优化函数表示为:
s.t.Xi=XiPi+Ei,Pi=Zi+Z0,Pi=Ui,FTF=I,wij≥0,
其中,为相似矩阵动态调节项,λ1、λ2、λ3均为平衡因子;Ui为松弛变量,i=1,2,…,v;Zi为第i个视图独立的特征部分,i=1,2,…,v;Zj为第j个视图独立的特征部分,j=1,2,…,v;Z0为本征低秩部分,Tr(·)为矩阵迹运算,/>为Zi的转置;F为指示矩阵,FT为指示矩阵的转置,L为拉普拉斯矩阵,Ei为第i个视图的残差项,i=1,2,…,v;Xi为多视图数据集X的第i个视图,i=1,2,…,v;Pi为数据集的低秩成分,i=1,2,…,v;I代表单位矩阵,‖·‖F、‖·‖*、‖·‖1、‖·‖2,1分别表示矩阵的F范数、核范数、1范数和21范数;
步骤4,利用增广拉格朗日乘法对目标优化函数进行处理,更新各项变量并计算损失函数;
步骤5,设置迭代循环条件,直到满足循环条件则退出循环,输出的邻接矩阵W为最优解;
步骤6,根据步骤5计算得出的邻接矩阵W,对邻接矩阵W使用强连通分量算法,即可得出多视图数据集的聚类标签。
2.根据权利要求1所述的一种多视图本征低秩结构的图像聚类方法,其特征在于,使用K近邻算法构造多视图数据集X的邻接矩阵W的方法为:
其中,wij为邻接矩阵W中第i行第j列元素,xi,i为多视图数据集X中第i个视图第i列元素,xi,j为多视图数据集X中第i个视图第j列元素;由wij组成多视图数据集X的邻接矩阵W。
3.根据权利要求2所述的一种多视图本征低秩结构的图像聚类方法,其特征在于,基于邻接矩阵W中的元素wij计算得出度矩阵D的元素即矩阵D的对角线元素为矩阵W对应行的行和,其余元素为0,dii为出度矩阵D中第i行第i列元素,wij为邻接矩阵W中第i行第j列元素,n表示视图中图像的数量。
4.根据权利要求3所述的一种多视图本征低秩结构的图像聚类方法,其特征在于,根据计算得出度矩阵D和邻接矩阵W,得到拉普拉斯矩阵L=D-W。
5.根据权利要求1所述的一种多视图本征低秩结构的图像聚类方法,其特征在于,利用增广拉格朗日乘法对目标优化函数进行处理得到:
其中,为拉格朗日函数,Hi、Ji、Ki均为拉格朗日乘子矩阵,i=1,2,…,v;μ为惩罚因子。
6.根据权利要求5所述的一种多视图本征低秩结构的图像聚类方法,其特征在于,对各个变量进行更新求解:
Step1,通过对拉格朗日函数求Pi的偏导数,并令偏导数为0,计算可得:
Step2,通过对拉格朗日函数求Z0的偏导数,并令偏导数为0,计算可得:
Step3,邻接矩阵W通过对拉格朗日函数中只包含W的项恒等变形得到:
其中,wi为邻接矩阵W中第i行元素,因此元素wij的更新公式为:
其中,fi为指示矩阵F的第i列元素,fj为指示矩阵F的第j列元素,η为拉格朗日乘子;
Step4,松弛变量Ui的更新公式为:
其中,μ为惩罚因子,
Step5,残差项Ei的更新公式为:
Step6,计算损失函数:
7.根据权利要求1-6中任意一项权利要求所述的一种多视图本征低秩结构的图像聚类方法,其特征在于,循环条件为整体损失函数小于1*10-6或者迭代次数大于200次。
CN202010835395.2A 2020-08-19 2020-08-19 一种多视图本征低秩结构的图像聚类方法 Active CN112148911B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010835395.2A CN112148911B (zh) 2020-08-19 2020-08-19 一种多视图本征低秩结构的图像聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010835395.2A CN112148911B (zh) 2020-08-19 2020-08-19 一种多视图本征低秩结构的图像聚类方法

Publications (2)

Publication Number Publication Date
CN112148911A CN112148911A (zh) 2020-12-29
CN112148911B true CN112148911B (zh) 2024-03-19

Family

ID=73887891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010835395.2A Active CN112148911B (zh) 2020-08-19 2020-08-19 一种多视图本征低秩结构的图像聚类方法

Country Status (1)

Country Link
CN (1) CN112148911B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112766412B (zh) * 2021-02-05 2023-11-07 西北民族大学 一种基于自适应稀疏图学习的多视图聚类方法
CN113505838B (zh) * 2021-07-14 2023-05-26 广东工业大学 一种图像聚类方法、装置、电子设备及存储介质
CN113936196B (zh) * 2021-09-29 2024-05-14 江苏大学 一种基于低秩拉普拉斯图学习的鲁棒数据降维方法
CN117874444A (zh) * 2024-01-18 2024-04-12 中国矿业大学 一种时空图信号降噪重构方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776812A (zh) * 2018-05-31 2018-11-09 西安电子科技大学 基于非负矩阵分解和多样-一致性的多视图聚类方法
CN109002854A (zh) * 2018-07-20 2018-12-14 西安电子科技大学 基于隐表示和自适应的多视图子空间聚类方法
CN109543723A (zh) * 2018-11-05 2019-03-29 南京理工大学 一种鲁棒的图像聚类方法
CN110263815A (zh) * 2019-05-27 2019-09-20 广东工业大学 基于块对角表示和视图一致性的多视图子空间聚类方法
CN111401468A (zh) * 2020-03-26 2020-07-10 上海海事大学 一种基于共享近邻的权重自更新多视角谱聚类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776812A (zh) * 2018-05-31 2018-11-09 西安电子科技大学 基于非负矩阵分解和多样-一致性的多视图聚类方法
CN109002854A (zh) * 2018-07-20 2018-12-14 西安电子科技大学 基于隐表示和自适应的多视图子空间聚类方法
CN109543723A (zh) * 2018-11-05 2019-03-29 南京理工大学 一种鲁棒的图像聚类方法
CN110263815A (zh) * 2019-05-27 2019-09-20 广东工业大学 基于块对角表示和视图一致性的多视图子空间聚类方法
CN111401468A (zh) * 2020-03-26 2020-07-10 上海海事大学 一种基于共享近邻的权重自更新多视角谱聚类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MULTI-VIEW CLUSTERING VIA SIMULTANEOUSLY LEARNING GRAPH REGULARIZED LOW-RANK TENSOR REPRESENTATION AND AFFINITY MATRIX;Yongyong Chen等;2019 IEEE International Conference on Multimedia and Expo (ICME);第1348-1352页 *
拉普拉斯秩约束的子空间聚类算法;杨艺芳等;计算机工程与设计;第40卷(第8期);第2242-2245页 *

Also Published As

Publication number Publication date
CN112148911A (zh) 2020-12-29

Similar Documents

Publication Publication Date Title
CN112148911B (zh) 一种多视图本征低秩结构的图像聚类方法
Li et al. Towards faster training of global covariance pooling networks by iterative matrix square root normalization
Jia et al. Label distribution learning with label correlations on local samples
Kang et al. Learning consistent feature representation for cross-modal multimedia retrieval
CN107203787B (zh) 一种无监督正则化矩阵分解特征选择方法
CN109241995B (zh) 一种基于改进型ArcFace损失函数的图像识别方法
Chang et al. Automatic channel pruning via clustering and swarm intelligence optimization for CNN
CN109190511B (zh) 基于局部与结构约束低秩表示的高光谱分类方法
Bai et al. Clustering by twin support vector machine and least square twin support vector classifier with uniform output coding
CN108460412B (zh) 一种基于子空间联合稀疏低秩结构学习的图像分类方法
CN110598022B (zh) 一种基于鲁棒深度哈希网络的图像检索系统与方法
CN105046323B (zh) 一种正则化rbf网络多标签分类方法
Yang et al. Local label descriptor for example based semantic image labeling
Xu et al. Robust PCANet on target recognition via the UUV optical vision system
CN110263815A (zh) 基于块对角表示和视图一致性的多视图子空间聚类方法
CN108647726A (zh) 一种图像聚类方法
Liang et al. Co-consensus semi-supervised multi-view learning with orthogonal non-negative matrix factorization
Zhang et al. SLRRSC: single-cell type recognition method based on similarity and graph regularization constraints
Jin et al. Research on image sentiment analysis technology based on sparse representation
CN110276049A (zh) 一种半监督自适应图正则化判别非负矩阵分解方法
Xing et al. Nonnegative matrix factorization by joint locality-constrained and ℓ 2, 1-norm regularization
Sun et al. A dynamic constraint representation approach based on cross-domain dictionary learning for expression recognition
CN115017366B (zh) 基于多粒度语境化和多结构保存的无监督视频哈希检索方法
CN107133348A (zh) 大规模图片集中基于语义一致性的近似搜索方法
Xu et al. Graphical lasso quadratic discriminant function and its application to character recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant