CN110175631A - 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法 - Google Patents

一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法 Download PDF

Info

Publication number
CN110175631A
CN110175631A CN201910352469.4A CN201910352469A CN110175631A CN 110175631 A CN110175631 A CN 110175631A CN 201910352469 A CN201910352469 A CN 201910352469A CN 110175631 A CN110175631 A CN 110175631A
Authority
CN
China
Prior art keywords
matrix
multiple view
cluster
subspace
oriental
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910352469.4A
Other languages
English (en)
Other versions
CN110175631B (zh
Inventor
吴松松
卢志强
姚礼昕
莫晓晖
岳东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201910352469.4A priority Critical patent/CN110175631B/zh
Publication of CN110175631A publication Critical patent/CN110175631A/zh
Application granted granted Critical
Publication of CN110175631B publication Critical patent/CN110175631B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明揭示了一种基于共同学习子空间结构和聚类指示矩阵的多视图图像聚类方法,该方法包括如下步骤:S1:获取多视图图像数据;S2:对给定多视图图像数据进行子空间学习,得到多视图子空间表示、连续指示矩阵、离散指示矩阵;S3:对多视图子空间表示、连续指示矩阵、离散指示矩阵进行迭代更新,得到更新后的多视图子空间表示;S4:应用所述S3步骤得到的多视图子空间表示构造邻接矩阵;S5:应用所述S4步骤得到的邻接矩阵,调用谱聚类算法,得到聚类结果。与已有的多视图聚类方法相比,大量的实验结果证明该方法可以显著提高收敛速率和聚类性能。

Description

一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类 方法
技术领域
本发明涉及一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法,可用于模式识别中的多视图聚类领域。
背景技术
在计算机视觉和模式识别领域,聚类是一项基本的数据处理技术。在现实中数据可以被多种特征表述,例如图像可以被Intensity,LBP和Gabor三个特征描述,网页可以被不同格式的文本,不同语言等刻画。利用数据的多视图特征对数据进行分类,可以大大提高分类的正确率。随着互联网和计算机的迅猛发展、大数据时代的到来,对数据的聚类处理显得尤为重要,而目这个问题越来越受到人工智能领域的关注。
多视图聚类隶属于无监督学习,它试图将数据集中的样本划分为若干个不相交的子集。多视图聚类既可以是一个单独的过程,用于寻找数据的内在结构,也可以作为分类等其它学习任务前驱过程,例如,在商业应用中需要对新用户的类型进行判别,此时就需要先对用户数据进行聚类。在多视图聚类中,怎样保证不同视图下聚类的一致性非常重要。解决多视图聚类问题的方法都是建立在谱聚类的基础之上的,而谱聚类算法是建立在谱图理论基础上,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。谱聚类算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量,然后选择合适的特征向量聚类不同的数据点。同时现存的多数多视图聚类算法把子空间学习和谱聚类分开进行,忽略了两者之间的紧密联系,从而导致了算法聚类性能的不佳。
发明内容
本发明的目的就是为了解决现有技术中存在的上述问题,提出一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法。
本发明的目的将通过以下技术方案得以实现:一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法,该方法包括如下步骤:
S1:获取多视图图像数据;
S2:对给定多视图图像数据进行子空间学习,得到多视图子空间表示、连续指示矩阵、离散指示矩阵;
S3:对多视图子空间表示、连续指示矩阵、离散指示矩阵进行迭代更新,得到更新后的多视图子空间表示;
S4:应用所述S3步骤得到的多视图子空间表示构造邻接矩阵;
S5:应用所述S4步骤得到的邻接矩阵,调用谱聚类算法,得到聚类结果。
优选地,在所述S2步骤中,子空间表示刻画的是数据在子空间的分布结构,离散指示矩阵为一个只含有{0,1}的矩阵,行数对应于多视图数据的个数,列数对应多视图数据的类别数。
优选地,在所述S5步骤中,利用子空间表示构造邻接矩阵,把邻接矩阵作为谱聚类算法的输入,得到算法下的聚类标签,最后把预测的聚类标签与数据的真实类别标签进行对比,得出评价算法的聚类指标。
优选地,在所述S2步骤中,
假设给定一组多视图数据和所属类别{1,...,c},n代表有n个数据,v代表第v个视图,dv是第v个视图下的特征维度; Zv∈Rn×n是第v个视图下的子空间表示,是误差项,F∈Rn×c连续指示矩阵, P∈Rn×c离散指示矩阵,Q∈Rc×c转换矩阵,Zv,Ev,F,P,Q都为未知;为邻接矩阵,Lv=Dv-Wv为拉普拉斯矩阵,其中dii=∑jwij
公式(1)所示模型能直接从多视图数据学得多视图子空间表示、连续指示矩阵、离散指示矩阵,模型如下:
s.t Zv(i,i)=0,FTF=I,QTQ=I,P∈Idx (1)
第一项是自我表示项,自我表示项是学习数据的子空间结构;第二项是误差项,第三项是连续指示矩阵学习,能保证不同视图下聚类结果的一致性;第四项是离散指示矩阵学习,λ,β,γ是惩罚参数。
优选地,在所述S3步骤中,(1)式模型中有五个未知量,能够通过交替求解的方法求解,具体过程如下:
固定E,F,P和Q求解Z:
对(2)式求解得:
其中Fi是F的第i行,y是Y 的第i列,K=X-(XZ-xzT)-E,zT是Z的第i行;
固定Z,F,P和Q,求解E:
对(4)式求解得:
固定Z,E,P和Q,求解F:
利用可行的正交约束优化方法解决公式(6);
固定Z,E,P和F,求解Q:
Q=UVT (8)
其中U和V是PTF的奇异值分解;
固定Z,E,F和Q,求解P:
对(9)式求解:
优选地,在所述S4步骤中,通过迭代优化Zv,Ev,F,Q和P,用Zv构造邻接矩阵然后利用谱聚类得到预测的聚类标签,并与真实的数据标签进行对比,得到聚类的评价指标。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:在相同的实验数据条件下,通过共同学习的方式直接从多视图数据学得多视图子空间表示、连续指示矩阵、离散指示矩阵,并通过三者的迭代优化提高子空间表示刻画数据内在结构的性能。考虑子空间学习和谱聚类之间的联系,把两者放在一个模型中,对邻接矩阵进行了优化的同时还保证了不同视图下聚类结果的一致性。联合全部视图的子空间表示构造邻接矩阵,充分考虑视图的信息客观上提高多视图图像的聚类精度。
本技术方案的亮点在于共同学习多视图子空间表示、连续指示矩阵、离散指示矩阵,在迭代优化得到更新后的多视图子空间表示的同时还保证了不同视图下聚类的一致性,然后联合全部视图的子空间表示构造邻接矩阵,从而有效地提高聚类的性能。
附图说明
图1为本发明多视图图像聚类领域的工作流程图。
具体实施方式
本发明的目的、优点和特点,将通过下面优选实施例的非限制性说明进行图示和解释。这些实施例仅是应用本发明技术方案的典型范例,凡采取等同替换或者等效变换而形成的技术方案,均落在本发明要求保护的范围之内。
本发明揭示了一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法,如图1所示,该方法包括如下步骤:
S1:获取多视图图像数据;
S2:对给定多视图图像数据进行子空间学习,得到多视图子空间表示、连续指示矩阵、离散指示矩阵;
S3:对多视图子空间表示、连续指示矩阵、离散指示矩阵进行迭代更新,得到更新后的多视图子空间表示;
S4:应用所述S3步骤得到的多视图子空间表示构造邻接矩阵;
S5:应用所述S4步骤得到的邻接矩阵,调用谱聚类算法,得到聚类结果。
具体实施方式如下:
假设给定一组多视图图像数据和所属类别{1,...,c},n代表有n个数据,v代表第v个视图,dv是第v个视图下的特征维度。 Zv∈Rn×n是第v个视图下的子空间表示,是误差项,F∈Rn×c连续指示矩阵, P∈Rn×c离散指示矩阵,Q∈Rc×c转换矩阵,Zv,Ev,F,P,Q都是未知的。为邻接矩阵,Lv=Dv-Wv为拉普拉斯矩阵,其中dii=∑jwij
公式(1)所示模型能直接从多视图数据学得子空间表示、连续指数矩阵、离散指示矩阵。模型如下:
s.t Zv(i,i)=0,FTF=I,QTQ=I,P∈Idx (1)
第一项是自我表示项,自我表示项是学习数据的子空间结构。第二项是误差项,因为真实数据可能存在误差。第三项是连续指示矩阵学习,它能保证不同视图下聚类结果的一致性。第四项是离散指示矩阵学习,λ,β,γ是惩罚参数。
公式(1)模型中有五个未知量,可以通过交替求解的方法求解,为了简化求解过程,省略去变量的上标,具体过程如下:
固定E,F,P和Q求解Z:
对(2)式求解得:
其中Fi是F的第i行,y是Y的第i列,
K=X-(XZ-xzT)-E,zT是Z的第i行。
固定Z,F,P和Q,求解E:
对(4)式求解得:
固定Z,E,P和Q,求解F:
利用可行的正交约束优化方法解决公式(6)
固定Z,E,P和F,求解Q,其中U和V是PTF的奇异值分解:
所以:Q=UVT (8)
固定Z,E,F和Q,求解P:
对(9)式求解的:
通过迭代优化Zv,Ev,F,Q和P,用Zv构造邻接矩阵然后利用谱聚类得到预测的聚类标签,并与真实的数据标签进行对比,得到聚类的评价指标。
将本发明的一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法在Yale and Olivetti Research Laboratory(ORL)人脸数据库上进行实验,并将实验结果与其他多视图聚类方法进行对比分析。
具体地,Yale数据集包含了15个人的165幅图像,每一类有11幅图像,类别为:中心光,带眼镜,无眼镜,快乐,悲伤,左光,右光,困,正常,惊讶和眨眼。ORL数据集中包含了40个不同对象的400幅图像,每个对象都包含10幅不同的图像。实验用的Yale数据集和ORL数据集都含有3个视图:Intensity维度为4096,LBP维度为3304, Gabor维度为6750。在相同的实验设置下,选取了6个被广泛认可目行具有代表性的方法作为对比,即SSC,Min-Dis,RMSC,ConReg和LTMSC,Di-MSC。同时,用两个广泛应用于聚类领域的指标(NMI、ACC)来度量算法的性能,表示中的数据为平均值(±标准差)。
实验结果如下:
表一:Yale数据集上各种方法的实验结果
方法 NMI ACC
SSC 0.671(±0.011) 0.627(±0.000)
Min-Dis 0.645(±0.005) 0.615(±0.043)
RMSC 0.684(±0.033) 0.642(±0.036)
ConReg 0.673(±0.023) 0.611(±0.035)
LTMSC 0.765(±0.008) 0.741(±0.002)
Di-MSC 0.727(±0.010) 0.709(±0.003)
OURS 0.782(±0.004) 0.792(±0.026)
表二:ORL数据集上各种方法的实验结果
本发明利用共同学习的方法从多视图数据中得到多视图子空间表示、连续指示矩阵、离散指示矩阵,通过三者的迭代得到优化后的多视图子空间表示,使构造的邻接矩阵更能刻画子空间结构,同时保证了不同视图下聚类的一致性。实验用聚类指标NMI和ACC 来度量算法的好坏。从表一、表二中的结果可以看出,本发明提出的方法比其他6种方法的聚类指标都高,实验验证了本发明能有效地提高聚类的性能。
本发明尚有多种实施方式,凡采用等同变换或者等效变换而形成的所有技术方案,均落在本发明的保护范围之内。

Claims (6)

1.一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法,其特征在于:该方法包括如下步骤:
S1:获取多视图图像数据;
S2:对给定多视图图像数据进行子空间学习,得到多视图子空间表示、连续指示矩阵、离散指示矩阵;
S3:对多视图子空间表示、连续指示矩阵、离散指示矩阵进行迭代更新,得到更新后的多视图子空间表示;
S4:应用所述S3步骤得到的多视图子空间表示构造邻接矩阵;
S5:应用所述S4步骤得到的邻接矩阵,调用谱聚类算法,得到聚类结果。
2.根据权利要求1所述的一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法,其特征在于:在所述S2步骤中,子空间表示刻画的是数据在子空间的分布结构,离散指示矩阵为一个只含有{0,1}的矩阵,行数对应于多视图数据的个数,列数对应多视图数据的类别数。
3.根据权利要求1所述的一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法,其特征在于:在所述S5步骤中,利用子空间表示构造邻接矩阵,把邻接矩阵作为谱聚类算法的输入,得到算法下的聚类标签,最后把预测的聚类标签与数据的真实类别标签进行对比,得出评价算法的聚类指标。
4.根据权利要求1所述的一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法,其特征在于:在所述S2步骤中,
假设给定一组多视图数据和所属类别{1,...,c},n代表有n个数据,v代表第v个视图,dv是第v个视图下的特征维度;Zv∈Rn×n是第v个视图下的子空间表示,是误差项,F∈Rn×c连续指示矩阵,P∈Rn×c离散指示矩阵,Q∈Rc×c转换矩阵,Zv,Ev,F,P,Q都为未知;为邻接矩阵,Lv=Dv-Wv为拉普拉斯矩阵,其中dii=∑jwij
公式(1)所示模型能直接从多视图数据学得多视图子空间表示、连续指示矩阵、离散指示矩阵,模型如下:
s.t Zv(i,i)=0,FTF=I,QTQ=I,P∈Idx (1)
第一项是自我表示项,自我表示项是学习数据的子空间结构;第二项是误差项,第三项是连续指示矩阵学习,能保证不同视图下聚类结果的一致性;第四项是离散指示矩阵学习,λ,β,γ是惩罚参数。
5.根据权利要求4所述的一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法,其特征在于:在所述S3步骤中,公式(1)模型中有五个未知量,能够通过交替求解的方法求解,具体过程如下:
固定E,F,P和Q求解Z:
对(2)式求解得:
其中Fi是F的第i行,y是Y的第i列,K=X-(XZ-xzT)-E,zT是Z的第i行;
固定Z,F,P和Q,求解E:
对(4)式求解得:
固定Z,E,P和Q,求解F:
利用可行的正交约束优化方法解决公式(6);
固定Z,E,P和F,求解Q:
Q=UVT (8)
其中U和V是PTF的奇异值分解;
固定Z,E,F和Q,求解P:
对(9)式求解:
6.根据权利要求1所述的一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法,其特征在于:在所述S4步骤中,通过迭代优化Zv,Ev,F,Q和P,用Zv构造邻接矩阵然后利用谱聚类得到预测的聚类标签,并与真实的数据标签进行对比,得到聚类的评价指标。
CN201910352469.4A 2019-04-28 2019-04-28 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法 Active CN110175631B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910352469.4A CN110175631B (zh) 2019-04-28 2019-04-28 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910352469.4A CN110175631B (zh) 2019-04-28 2019-04-28 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法

Publications (2)

Publication Number Publication Date
CN110175631A true CN110175631A (zh) 2019-08-27
CN110175631B CN110175631B (zh) 2022-08-30

Family

ID=67690202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910352469.4A Active CN110175631B (zh) 2019-04-28 2019-04-28 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法

Country Status (1)

Country Link
CN (1) CN110175631B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113221974A (zh) * 2021-04-26 2021-08-06 中山大学 一种交叉图匹配不完整多视图聚类方法及装置
CN113569973A (zh) * 2021-08-04 2021-10-29 咪咕文化科技有限公司 多视图聚类方法、装置、电子设备及计算机可读存储介质
CN116310452A (zh) * 2023-02-16 2023-06-23 广东能哥知识科技有限公司 一种多视图聚类方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971197A (zh) * 2017-03-02 2017-07-21 北京工业大学 基于差异性与一致性约束的多视数据的子空间聚类方法
CN107292341A (zh) * 2017-06-20 2017-10-24 西安电子科技大学 基于成对协同正则化和nmf的自适应多视图聚类方法
CN109145975A (zh) * 2018-08-14 2019-01-04 聚时科技(上海)有限公司 一种矩阵范数导出正则化的多视图聚类机器学习方法
CN109409422A (zh) * 2018-10-12 2019-03-01 广西师范大学 一种基于谱旋转的一步谱聚类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971197A (zh) * 2017-03-02 2017-07-21 北京工业大学 基于差异性与一致性约束的多视数据的子空间聚类方法
CN107292341A (zh) * 2017-06-20 2017-10-24 西安电子科技大学 基于成对协同正则化和nmf的自适应多视图聚类方法
CN109145975A (zh) * 2018-08-14 2019-01-04 聚时科技(上海)有限公司 一种矩阵范数导出正则化的多视图聚类机器学习方法
CN109409422A (zh) * 2018-10-12 2019-03-01 广西师范大学 一种基于谱旋转的一步谱聚类方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113221974A (zh) * 2021-04-26 2021-08-06 中山大学 一种交叉图匹配不完整多视图聚类方法及装置
CN113221974B (zh) * 2021-04-26 2022-02-08 中山大学 一种交叉图匹配不完整多视图聚类方法及装置
CN113569973A (zh) * 2021-08-04 2021-10-29 咪咕文化科技有限公司 多视图聚类方法、装置、电子设备及计算机可读存储介质
CN113569973B (zh) * 2021-08-04 2024-04-19 咪咕文化科技有限公司 多视图聚类方法、装置、电子设备及计算机可读存储介质
CN116310452A (zh) * 2023-02-16 2023-06-23 广东能哥知识科技有限公司 一种多视图聚类方法及系统
CN116310452B (zh) * 2023-02-16 2024-03-19 广东能哥知识科技有限公司 一种多视图聚类方法及系统

Also Published As

Publication number Publication date
CN110175631B (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
CN109977994B (zh) 一种基于多示例主动学习的代表性图像选取方法
Yin Nonlinear dimensionality reduction and data visualization: a review
CN110175631A (zh) 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法
CN109784405A (zh) 基于伪标签学习和语义一致性的跨模态检索方法及系统
CN111611323A (zh) 一种面向数据融合的迭代结构化多视图子空间聚类方法,设备及可读存储介质
Duan et al. Improving spectral clustering with deep embedding and cluster estimation
Bahrami et al. Joint auto-weighted graph fusion and scalable semi-supervised learning
Bahadur et al. Dimension estimation using autoencoders
CN111027636B (zh) 基于多标签学习的无监督特征选择方法及系统
Yuan et al. Learning overlapping community-based networks
Chen et al. Deep subspace image clustering network with self-expression and self-supervision
Zhang et al. Multi-label feature selection based on logistic regression and manifold learning
Yang et al. Unsupervised feature selection based on reconstruction error minimization
CN110738245A (zh) 一种面向科学数据分析的自动聚类算法选择系统及方法
Kuhn et al. Brcars: a dataset for fine-grained classification of car images
Huang et al. Deep embedded multi-view clustering via jointly learning latent representations and graphs
CN116051924B (zh) 一种图像对抗样本的分治防御方法
Feng et al. Supervised feature subset selection with ordinal optimization
Ebrahimi et al. Integration of deep learning model and feature selection for multi-label classification
Bahrami et al. Automatic image annotation using an evolutionary algorithm (IAGA)
CN109614581A (zh) 基于对偶局部学习的非负矩阵分解聚类方法
Zhong et al. Selection of diverse features with a diverse regularization
WO2021059527A1 (ja) 学習装置、学習方法、及び、記録媒体
Nazi et al. Generalized clustering by learning to optimize expected normalized cuts
CN112101086A (zh) 一种基于链接预测的人脸聚类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant