CN109063757A - 基于块对角表示和视图多样性的多视图子空间聚类方法 - Google Patents

基于块对角表示和视图多样性的多视图子空间聚类方法 Download PDF

Info

Publication number
CN109063757A
CN109063757A CN201810801590.6A CN201810801590A CN109063757A CN 109063757 A CN109063757 A CN 109063757A CN 201810801590 A CN201810801590 A CN 201810801590A CN 109063757 A CN109063757 A CN 109063757A
Authority
CN
China
Prior art keywords
matrix
indicates
view
indicate
multiple view
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810801590.6A
Other languages
English (en)
Inventor
王秀美
张越美
高新波
张天真
李洁
邓成
田春娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201810801590.6A priority Critical patent/CN109063757A/zh
Publication of CN109063757A publication Critical patent/CN109063757A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种基于块对角表示和视图多样性的多视图子空间聚类方法,主要解决多视图聚类方法中存在的聚类准确率低的问题,实现步骤为:获取原始数据集的多视图数据矩阵;构建基于块对角和视图多样性的多视图子空间聚类的目标函数;对目标函数进行优化;对优化后的目标函数中的变量进行初始化;对优化后的目标函数中的变量进行交替迭代;计算优化后的目标函数中的变量多视图自表示系数矩阵的值;对原始数据集进行聚类。本发明将视图多样性约束项与块对角表示约束项结合起来,得到块对角结构更加完整和准确的多视图数据集的相似度矩阵,有效提高了多视图聚类的准确率,可用于图像分割,异常检测,商务分析等领域。

Description

基于块对角表示和视图多样性的多视图子空间聚类方法
技术领域
本发明属于计算机视觉和模式识别技术领域,涉及一种多视图子空间聚类方法,具体涉及一种基于块对角表示和视图多样性的多视图子空间聚类方法,可用于图像分割,异常检测,商务统计等。
背景技术
随着计算机信息技术的快速发展,数据快速增长,在海量数据中提取有用的信息和知识是当今时代所面临的一个重要挑战,而数据挖掘是可用于发现数据中隐藏信息、提取数据中的知识的一类方法。聚类是一种基本的数据挖掘方法,聚类是以无监督学习的方式将一个数据集中的所有样本分成多个簇的过程,使得每个簇中的样本相似度高,不同簇中的样本的相似度低。
数据集最初是用单一的特征数据表示的,称为单视图数据集,基于这类数据集,出现了一些传统的聚类方法,例如K均值聚类、谱聚类、基于密度的聚类和层次聚类等基本方法。但是单视图数据集中所包含的原始数据集的信息并不完整。而随着信息技术的发展,越来越多的数据集是用多种不同类型的特征表示的,即多视图数据集,利用传统的聚类方法处理这类数据集的一种朴素的方法是前期融合,即将多视图数据集的多视图数据矩阵联结起来组成一个数据矩阵,再利用传统的聚类方法进行聚类,但是该类方法忽视了每个视图的统计特性存在差异这个事实,并且将多视图数据矩阵联结起来破坏了多视图数据集中数据的内部结构,使得聚类准确率并不理想。因此出现了基于后期融合的多视图聚类方法,这类方法通常是对每个视图进行聚类,或者获得多视图数据集的一个低维嵌入,进而得到多视图数据集的一致的聚类结果。
基于后期融合的多视图聚类方法的基本做法是将视图间的相似性和差异性考虑在目标函数内,主要包括基于非负矩阵分解的多视图聚类和基于子空间学习的多视图聚类。基于非负矩阵分解的多视图聚类通常将多视图数据矩阵进行分解,得到与每个视图对应的基矩阵和与每个视图对应的系数矩阵,对得到的每个视图的系数矩阵进行融合得到一致的多视图系数矩阵,进而对获得的一致的多视图系数矩阵进行K均值聚类,得到多视图数据集的一致的聚类结果。基于子空间学习的多视图聚类是基于多视图数据集的每个样本可以用自身所在的簇中的其他样本进行线性组合这个理论,进而得到多视图数据集的相似度矩阵。近年来,多视图子空间聚类是在单视图子空间聚类方法的基础上发展而来的,常用的单视图子空间聚类方法包括稀疏子空间聚类和低秩表示子空间聚类,但是这两种单视图子空间聚类方法是在数据集所在空间的多个子空间是相互独立的基础上进行的,进而可以得到一个具有块对角结构的数据集自表示系数矩阵,但是实际的数据集由于噪声和异常数据的干扰,数据集自表示系数矩阵往往不是块对角的,为解决这个问题,Canyi Lu,JiashiFeng,Zhouchen Liu,Tao Mei和Shuicheng Yan在2018年的IEEE Transactions onPattern Analysis and Machine Intelligence上,发表了名为“Subspace Clustering byBlock Diagonal Representation”的文章,公开了一种通过块对角表示进行子空间聚类的方法,该方法直接对通过数据集的自表示系数矩阵得到的相似度矩阵进行块对角约束,使通过数据集的自表示系数矩阵得到的相似度矩阵更加接近其原始数据集的相似度矩阵,能够在一定程度上排除噪声对原始数据集聚类准确率的影响,因此,该方法有效提高了单视图聚类的准确率。到目前为止,基于块对角表示的子空间聚类的方法仅用于对单视图数据集的聚类。
现有的基于子空间学习的多视图聚类方法是在上述单视图子空间聚类的基础上发展而来的,通过将不同视图间的一致性信息、多样性信息考虑在目标函数内,有效提高了聚类的准确率,近年来出现了一些基于子空间学习的多视图聚类方法,例如,XiaochunCao,Changqing Zhang,Huazhu Fu和Si Liu等人在2015年的IEEE conference onComputer Vision and Pattern Recognition上,发表了名为“Diversity-induced Multi-view Subspace Clustering”的文章,公开了一种多样性诱导的多视图子空间聚类方法,为了充分利用多视图数据集的多样性的信息,该方法利用希尔伯特-施密特独立性判别准则获取原始多视图数据集的多样性信息,有效提高了多视图数据集的聚类准确率,该方法假设多视图数据集所在空间中的多个子空间是相互独立的,即多视图数据矩阵的自表示系数矩阵是块对角的,但是现实中的多视图数据集由于受到噪声的影响,多视图自表示系数矩阵往往不是块对角的,该方法没有考虑到这个问题,进而影响了多视图数据集聚类结果的准确率。
发明内容
本发明的目的在于克服上述现有技术存在的不足,提出了一种基于块对角表示和视图多样性的多视图子空间聚类方法,用于提高多视图数据集聚类的准确率。
本发明的技术思路是:获取原始数据集的多视图数据矩阵,将每个视图矩阵分解为视图矩阵自身和该视图对应的视图自表示系数矩阵,多个视图的视图自表示系数矩阵构成多视图自表示系数矩阵,并利用多视图数据矩阵分解的重构误差项、视图多样性约束项和多视图关联矩阵的块对角约束项,构建基于块对角表示和视图多样性的多视图子空间聚类的目标函数,通过优化目标函数之后得到的多视图自表示系数矩阵构建原始数据集的相似度矩阵,利用谱聚类得到原始数据集的聚类结果。实现步骤如下:
(1)获取原始数据集的多视图数据矩阵
从原始数据集包含的多幅图像中分别提取不同类型的特征数据,相同特征数据组成视图矩阵,多个视图矩阵组成原始数据集的多视图数据矩阵其中,X(v)表示第v个视图矩阵,v=1,2,…,m,m表示视图矩阵的数目,m≥2;
(2)构建基于块对角表示和视图多样性的多视图子空间聚类的目标函数O,实现步骤为:
(2a)将分解为和多视图自表示系数矩阵乘积的差作为误差重构项并计算的度量其中,Z(v)表示第v个视图矩阵X(v)的自表示系数矩阵,表示矩阵F范数的平方;
(2b)利用希尔伯特-施密特独立性判别准则,构造视图多样性约束项并设的权重为λ1,其中,I表示单位矩阵,N表示原始数据集样本数据点的数目,1表示元素全为1的N维向量,tr(·)表示矩阵的迹,(·)T表示矩阵的转置;
(2c)计算多视图关联矩阵其中,|·|表示对矩阵的每个元素取绝对值后组成的矩阵,W(v)表示第v个视图矩阵X(v)的关联矩阵;
(2d)计算的拉普拉斯矩阵构造的块对角表示约束项W(v)的块对角表示约束项并设的权重为λ2,其中,Diag(·)表示向量的对角化,K表示原始数据集中样本数据点的类别的数目,2≤K<N,λi(Y)表示将矩阵Y的特征值的集合G中的特征值按照从小到大的顺序进行排列之后得到的特征值的集合G'的第i个特征值,i=1,2,…,K;
(2e)将进行加权相加,得到基于块对角表示和视图多样性的多视图子空间聚类的目标函数O:
(3)对目标函数O进行优化:
通过将目标函数O中加权的块对角表示约束项替换为得到优化后的目标函数O':
其中,表示的替代矩阵变量,J(v)表示Z(v)的替代矩阵变量,表示误差项,表示的度量,λ3表示的权重,表示的辅助矩阵变量,U(v)表示的辅助矩阵变量,U(v)的约束为C,C表示且tr(U(v))=K,表示B-A是半正定矩阵,<·,·>表示矩阵的内积,
(4)对优化后的目标函数O'中的变量进行初始化:
将O'中的变量中包含的所有元素初始化为0;
(5)对优化后的目标函数O'中的变量进行交替迭代:
对O'中的变量进行交替迭代,得到与各变量对应的迭代更新表达式
(6)计算优化后的目标函数O'中变量的值:
(6a)设定O'的最大迭代次数;
(6b)利用O'中各变量的迭代更新表达式对O'中的变量进行迭代更新,得到更新后的多视图自表示系数矩阵
(7)对原始数据集进行聚类:
(7a)计算原始数据集的相似度矩阵S;
(7b)计算原始数据集的聚类结果:
(7b1)对相似度矩阵S的每一行求和得到的向量t进行对角化,得到S的度矩阵D,并计算S的拉普拉斯矩阵L,
(7b2)对拉普拉斯矩阵L进行特征值分解,得到特征值集合E和E中的每个特征值对应的特征向量组成的矩阵T;
(7b3)对E中的特征值按照从小到大的顺序进行排列,得到特征值集合E',取E'的前K个特征值组成集合EK,并从T中选取与EK中的每个特征值对应的特征向量组成特征向量矩阵T',再将T'每一行归一化的结果作为样本数据点;
(7b4)随机选取T'中的K个样本数据点,并将每个样本数据点作为初始的一类的聚类中心,得到K个类别的聚类中心集合R;
(7b5)计算T'中每个样本数据点到R中的每个聚类中心的欧式距离,并将各样本数据点分配到与自身欧氏距离最小的聚类中心所属的类别中,计算属于第k个类别的样本数据点的均值作为第k个类别的聚类中心,得到K个类别的聚类中心,实现对R进行更新,其中,k=1,2,…,K;
(7b6)重复执行步骤(7b5),直到聚类中心集合R不再发生变化为止,得到原始数据集的聚类结果。
本发明与现有技术相比,具有以下优点:
本发明在构建目标函数时,将多视图数据矩阵分解为多视图数据矩阵和多视图自表示系数矩阵,利用希尔伯特-施密特独立性判别准则构造视图多样性约束项,充分利用了多视图的多样性信息,并通过构造多视图关联矩阵的块对角表示约束项使多视图关联矩阵是块对角的,通过将视图多样性约束项和块对角表示约束项结合起来使得原始数据集的相似度矩阵具有更加完整的块对角结构,因此可以得到更加准确的原始数据集的相似度矩阵,与现有技术相比,有效提高了多视图数据集聚类的准确率。
附图说明
图1为本发明的实现流程图;
图2-图3为本发明与现有的多样性诱导的多视图子空间聚类方法在MSRC-v1数据集和UCI手写体数据集下的聚类准确率仿真结果对比图;
具体实施方式
下面结合附图和具体实施例,对本发明作进一步详细描述。
参照图1,基于块对角表示和视图多样性的多视图子空间聚类方法,包括如下步骤:
步骤1)获取原始数据集的多视图数据矩阵
由于原始数据集中包含的每幅图像中包含多种类型的特征,从原始数据集包含的多幅图像中分别提取不同类型的特征数据,相同特征数据组成视图矩阵,多个视图矩阵组成原始数据集的多视图数据矩阵其中,X(v)表示第v个视图矩阵,v=1,2,…,m,m表示视图矩阵的数目,m≥2。
步骤2)构建基于块对角表示和视图多样性的多视图子空间聚类的目标函数O,实现步骤为:
(2a)为了得到原始数据集中样本之间的相似度,将分解为和多视图自表示系数矩阵为了获得用表示的不一致性,将乘积的差作为误差重构项为了衡量用表示的不一致性的大小,计算的度量其中,Z(v)表示第v个视图矩阵X(v)的自表示系数矩阵,表示矩阵F范数的平方;
(2b)为了充分的利用多视图数据集的各个视图所包含的信息,利用希尔伯特-施密特独立性判别准则,构造视图多样性约束项并设的权重为λ1,其中,I表示单位矩阵,N表示原始数据集样本数据点的数目,1表示元素全为1的N维向量,tr(·)表示矩阵的迹,(·)T表示矩阵的转置;
(2c)计算多视图关联矩阵其中,|·|表示对矩阵的每个元素取绝对值后组成的矩阵,W(v)表示第v个视图矩阵X(v)的关联矩阵;
(2d)为了使多视图关联矩阵的结构是块对角的,计算的拉普拉斯矩阵构造的块对角表示约束项W(v)的块对角表示约束项并设的权重为λ2,其中,Diag(·)表示向量的对角化,K表示原始数据集中样本数据点的类别的数目,2≤K<N,λi(Y)表示将矩阵Y的特征值的集合G中的特征值按照从小到大的顺序进行排列之后得到的特征值的集合G'的第i个特征值,i=1,2,…,K;
(2e)将视图多样性约束项和多视图自表示系数矩阵块对角表示约束项结合起来,可以使原始数据集的相似度矩阵具有更加完整的块对角结构,将进行加权相加,得到基于块对角表示和视图多样性的多视图子空间聚类的目标函数O:
步骤3)对目标函数O进行优化:
由于目标函数O中关于的子问题不是凸函数,因此无法获得的全局最优解,为使目标函数O中关于的子问题是凸函数,将作为的替代矩阵变量,J(v)表示Z(v)的替代矩阵变量,并且设置J(v)的约束为J(v)=Z(v),计算作为误差项的度量,设置的权重为λ3,此时,由于目标函数O中对应的的子问题的解无法得到,利用作为的辅助矩阵变量,且U(v)表示的辅助矩阵变量,设置U(v)的约束为C,C表示且tr(U(v))=K,得到优化后的目标函数O':
其中,表示B-A是半正定矩阵,<·,·>表示矩阵的内积。
步骤4)对优化后的目标函数O'中的变量进行初始化:
将O'中的变量中包含的所有元素初始化为0,对O'中的变量进行初始化是为了保证优化算法的迭代运行。
步骤5)对优化后的目标函数O'中的变量进行交替迭代:
对O'中的变量进行交替迭代,得到与各变量对应的迭代更新表达式实现步骤为:
(I)利用迭代更新多视图自表示系数矩阵其中 lyap(·)表示Sylvester方程的解;
(Ⅱ)利用迭代更新多视图关联矩阵其中,|·|表示对矩阵的每个元素取绝对值后组成的矩阵;
(Ⅲ)计算W(v)的拉普拉斯矩阵L(v),L(v)=Diag(W(v)1)-W(v),对L(v)进行特征值分解,得到L(v)的特征值的集合E(v)和E(v)中的每个特征值对应的L(v)的特征向量组成的特征向量矩阵M(v),对E(v)中的元素按照从小到大的顺序进行排列得到特征值的集合的前K个元素所对应的M(v)中的特征向量组成特征向量矩阵V(v),利用V(v)V(v)T迭代更新W(v)的辅助矩阵变量U(v),利用V(v)V(v)T的集合迭代更新块对角表示约束项的辅助矩阵变量
(Ⅳ)利用迭代更新的替代矩阵变量其中,(·)+表示使矩阵的正的元素保持不变,其余元素为0所组成的矩阵,diag(·)表示将矩阵的对角元素组成一个向量。
步骤6)计算优化后的目标函数O'中变量的值:
(6a)设定O'的最大迭代次数;
(6b)利用O'中各变量的迭代更新表达式对O'中的变量进行迭代更新,得到更新后的多视图自表示系数矩阵
步骤7)对原始数据集进行聚类:
(7a)计算原始数据集的相似度矩阵S,计算公式为:
(7b)计算原始数据集的聚类结果:
(7b1)对相似度矩阵S的每一行求和得到的向量t进行对角化,得到S的度矩阵D,并计算S的拉普拉斯矩阵L,
(7b2)对拉普拉斯矩阵L进行特征值分解,得到特征值集合E和E中的每个特征值对应的特征向量组成的矩阵T;
(7b3)对E中的特征值按照从小到大的顺序进行排列,得到特征值集合E',取E'的前K个特征值组成集合EK,并从T中选取与EK中的每个特征值对应的特征向量组成特征向量矩阵T',再将T'每一行归一化的结果作为样本数据点;
(7b4)随机选取T'中的K个样本数据点,并将每个样本数据点作为初始的一类的聚类中心,得到K个类别的聚类中心集合R;
(7b5)计算T'中每个样本数据点到R中的每个聚类中心的欧式距离,并将各样本数据点分配到与自身欧氏距离最小的聚类中心所属的类别中,计算属于第k个类别的样本数据点的均值作为第k个类别的聚类中心,得到K个类别的聚类中心,实现对R进行更新,其中,k=1,2,…,K;
(7b6)重复执行步骤(7b5),直到聚类中心集合R不再发生变化为止,得到原始数据集的聚类结果。
下面结合仿真实验,对本发明的技术效果作进一步说明。
1.仿真条件和内容
仿真条件:
仿真实验中计算机配置环境为Intel(R)Core(i7-7700)3.60GHZ中央处理器、内存32G、WINDOWS7操作系统,计算机仿真软件采用MATLAB R2016b软件。
仿真实验分别采用MSRC-v1数据集和UCI手写体数据集。
仿真内容:
仿真1
利用本发明和现有的隐多视图子空间聚类方法在MSRC-v1数据集下,对聚类的准确率进行对比仿真,其结果如图2所示。
仿真2
利用本发明和现有的隐多视图子空间聚类方法在UCI书写体数据集下,对聚类的准确率进行对比仿真,其结果如图3所示。
2.仿真结果分析:
参照图2,在MSRC-v1数据集下,当测试样本的数目分别为28、56、84、112、140、168、196时,采用本发明得到的聚类结果的准确率均比采用现有技术得到的聚类结果的准确率高,当测试样本的数目为140时,本发明较现有技术提升的聚类准确率最小,为1.0%,当测试样本的数目为28时,本发明较现有技术提升的准确率最大,为5.3%。参照图3,在UCI手写体数据集下,当测试样本数目分别为100、200、300、400、500、600时,采用本发明得到的聚类结果的准确率均比采用现有技术得到的聚类结果的准确率高,并且在测试样本的数目为200时,本发明较现有技术提升的准确率最小,为4.0%。
由图2-图3的仿真结果,在不同的数据集下,采用不同数目的测试数据时,利用本发明对多视图数据集聚类的准确率均高于采用现有技术对多视图数据集聚类的准确率,这是因为在进行多视图数据集的聚类时,本发明利用视图多样性约束项表示不同视图的不同信息,并且利用块对角表示约束使原始数据集的相似度矩阵的结构更加准确,与现有技术相比,有效提高了多视图数据集聚类的准确率。

Claims (3)

1.一种基于块对角表示和视图多样性的多视图子空间聚类方法,其特征在于,包括如下步骤:
(1)获取原始数据集的多视图数据矩阵
从原始数据集包含的多幅图像中分别提取不同类型的特征数据,相同特征数据组成视图矩阵,多个视图矩阵组成原始数据集的多视图数据矩阵其中,X(v)表示第v个视图矩阵,v=1,2,…,m,m表示视图矩阵的数目,m≥2;
(2)构建基于块对角表示和视图多样性的多视图子空间聚类的目标函数O,实现步骤为:
(2a)将分解为和多视图自表示系数矩阵乘积的差作为误差重构项并计算的度量其中,Z(v)表示第v个视图矩阵X(v)的自表示系数矩阵,表示矩阵F范数的平方;
(2b)利用希尔伯特-施密特独立性判别准则,构造视图多样性约束项并设的权重为λ1,其中,I表示单位矩阵,N表示原始数据集样本数据点的数目,1表示元素全为1的N维向量,tr(·)表示矩阵的迹,(·)T表示矩阵的转置;
(2c)计算多视图关联矩阵其中,|·|表示对矩阵的每个元素取绝对值后组成的矩阵,W(v)表示第v个视图矩阵X(v)的关联矩阵;
(2d)计算的拉普拉斯矩阵构造的块对角表示约束项W(v)的块对角表示约束项并设的权重为λ2,其中,Diag(·)表示向量的对角化,K表示原始数据集中样本数据点的类别的数目,2≤K<N,λi(Y)表示将矩阵Y的特征值的集合G中的特征值按照从小到大的顺序进行排列之后得到的特征值的集合G'的第i个特征值,i=1,2,…,K;
(2e)将进行加权相加,得到基于块对角表示和视图多样性的多视图子空间聚类的目标函数O:
(3)对目标函数O进行优化:
通过将目标函数O中加权的块对角表示约束项替换为得到优化后的目标函数O':
其中,表示的替代矩阵变量,J(v)表示Z(v)的替代矩阵变量,表示误差项,表示的度量,λ3表示的权重,表示的辅助矩阵变量,U(v)表示的辅助矩阵变量,U(v)的约束为C,C表示且tr(U(v))=K,表示B-A是半正定矩阵,<·,·>表示矩阵的内积,
(4)对优化后的目标函数O'中的变量进行初始化:
将O'中的变量中包含的所有元素初始化为0;
(5)对优化后的目标函数O'中的变量进行交替迭代:
对O'中的变量进行交替迭代,得到与各变量对应的迭代更新表达式
(6)计算优化后的目标函数O'中变量的值:
(6a)设定O'的最大迭代次数;
(6b)利用O'中各变量的迭代更新表达式对O'中的变量进行迭代更新,得到更新后的多视图自表示系数矩阵
(7)对原始数据集进行聚类:
(7a)计算原始数据集的相似度矩阵S;
(7b)计算原始数据集的聚类结果:
(7b1)对相似度矩阵S的每一行求和得到的向量t进行对角化,得到S的度矩阵D,并计算S的拉普拉斯矩阵L,
(7b2)对拉普拉斯矩阵L进行特征值分解,得到特征值集合E和E中的每个特征值对应的特征向量组成的矩阵T;
(7b3)对E中的特征值按照从小到大的顺序进行排列,得到特征值集合E',取E'的前K个特征值组成集合EK,并从T中选取与EK中的每个特征值对应的特征向量组成特征向量矩阵T',再将T'每一行归一化的结果作为样本数据点;
(7b4)随机选取T'中的K个样本数据点,并将每个样本数据点作为初始的一类的聚类中心,得到K个类别的聚类中心集合R;
(7b5)计算T'中每个样本数据点到R中的每个聚类中心的欧式距离,并将各样本数据点分配到与自身欧氏距离最小的聚类中心所属的类别中,计算属于第k个类别的样本数据点的均值作为第k个类别的聚类中心,得到K个类别的聚类中心,实现对R进行更新,其中,k=1,2,…,K;
(7b6)重复执行步骤(7b5),直到聚类中心集合R不再发生变化为止,得到原始数据集的聚类结果。
2.根据权利要求书1所述的基于块对角表示和视图多样性的多视图子空间聚类方法,其特征在于,步骤(5)所述的对优化后的目标函数O'中的变量进行交替迭代,实现步骤为:
(I)利用迭代更新多视图自表示系数矩阵其中 lyap(·)表示Sylvester方程的解,表示多视图数据矩阵,I表示单位矩阵,N表示原始数据集样本数据点的数目,1表示元素全为1的N维向量,tr(·)表示矩阵的迹,(·)T表示矩阵的转置,λ1表示视图多样性约束项的权重,λ3表示误差项的权重,视图m表示视图矩阵的数目;
(Ⅱ)利用迭代更新多视图关联矩阵其中,|·|表示对矩阵的每个元素取绝对值后组成的矩阵,W(v)表示第v个视图矩阵X(v)的关联矩阵,表示的替代矩阵变量;
(Ⅲ)计算W(v)的拉普拉斯矩阵L(v),L(v)=Diag(W(v)1)-W(v),对L(v)进行特征值分解,得到L(v)的特征值的集合E(v)和E(v)中的每个特征值对应的L(v)的特征向量组成的特征向量矩阵M(v),对E(v)中的元素按照从小到大的顺序进行排列得到特征值的集合的前K个元素所对应的M(v)中的特征向量组成特征向量矩阵V(v),利用V(v)V(v)T迭代更新W(v)的辅助矩阵变量U(v),利用V(v)V(v)T的集合迭代更新块对角表示约束项的辅助矩阵变量
(Ⅳ)利用迭代更新的替代矩阵变量其中,(·)+表示使矩阵的正的元素保持不变,其余元素为0所组成的矩阵,diag(·)表示将矩阵的对角元素组成一个向量,λ2表示块对角表示约束项的权重。
3.根据权利要求书1所述的基于块对角表示和视图多样性的多视图子空间聚类方法,其特征在于,步骤(7a)所述的计算原始数据集的相似度矩阵S,计算公式为:
其中,|·|表示对矩阵的每个元素取绝对值后组成的矩阵,(·)T表示矩阵的转置,表示更新后的多视图自表示系数矩阵,m表示视图矩阵的数目。
CN201810801590.6A 2018-07-20 2018-07-20 基于块对角表示和视图多样性的多视图子空间聚类方法 Pending CN109063757A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810801590.6A CN109063757A (zh) 2018-07-20 2018-07-20 基于块对角表示和视图多样性的多视图子空间聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810801590.6A CN109063757A (zh) 2018-07-20 2018-07-20 基于块对角表示和视图多样性的多视图子空间聚类方法

Publications (1)

Publication Number Publication Date
CN109063757A true CN109063757A (zh) 2018-12-21

Family

ID=64817584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810801590.6A Pending CN109063757A (zh) 2018-07-20 2018-07-20 基于块对角表示和视图多样性的多视图子空间聚类方法

Country Status (1)

Country Link
CN (1) CN109063757A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948466A (zh) * 2019-02-28 2019-06-28 中国电力科学研究院有限公司 一种识别交流超特高压输电线路可听噪声异常数据的方法和系统
CN110414560A (zh) * 2019-06-26 2019-11-05 武汉大学 一种用于高维图像数据的自主子空间聚类方法
CN110675412A (zh) * 2019-09-27 2020-01-10 腾讯科技(深圳)有限公司 图像分割方法、图像分割模型的训练方法、装置及设备
CN111027624A (zh) * 2019-12-10 2020-04-17 广东工业大学 一种基于非线性增强子空间聚类的图像识别方法
CN111046745A (zh) * 2019-11-20 2020-04-21 北京工业大学 基于软块对角的多视聚类方法
CN113435603A (zh) * 2021-06-01 2021-09-24 浙江师范大学 基于代理图改善的后期融合多核聚类机器学习方法及系统
CN113947135A (zh) * 2021-09-27 2022-01-18 华东师范大学 基于缺失图重构和自适应近邻的不完整多视图聚类方法
WO2022267956A1 (zh) * 2021-06-24 2022-12-29 浙江师范大学 基于矩阵分解和多划分对齐的多视图聚类方法及系统
CN116310462A (zh) * 2023-05-19 2023-06-23 浙江财经大学 一种基于秩约束自表示的图像聚类方法及装置
CN117611931A (zh) * 2024-01-23 2024-02-27 西南科技大学 一种基于深度自表示局部块学习的数据分类方法及系统

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948466A (zh) * 2019-02-28 2019-06-28 中国电力科学研究院有限公司 一种识别交流超特高压输电线路可听噪声异常数据的方法和系统
CN110414560B (zh) * 2019-06-26 2022-06-07 武汉大学 一种用于高维图像数据的自主子空间聚类方法
CN110414560A (zh) * 2019-06-26 2019-11-05 武汉大学 一种用于高维图像数据的自主子空间聚类方法
CN110675412A (zh) * 2019-09-27 2020-01-10 腾讯科技(深圳)有限公司 图像分割方法、图像分割模型的训练方法、装置及设备
CN110675412B (zh) * 2019-09-27 2023-08-01 腾讯科技(深圳)有限公司 图像分割方法、图像分割模型的训练方法、装置及设备
CN111046745A (zh) * 2019-11-20 2020-04-21 北京工业大学 基于软块对角的多视聚类方法
CN111046745B (zh) * 2019-11-20 2023-08-04 北京工业大学 基于软块对角的多视聚类方法
CN111027624B (zh) * 2019-12-10 2022-10-21 广东工业大学 一种基于非线性增强子空间聚类的图像识别方法
CN111027624A (zh) * 2019-12-10 2020-04-17 广东工业大学 一种基于非线性增强子空间聚类的图像识别方法
CN113435603A (zh) * 2021-06-01 2021-09-24 浙江师范大学 基于代理图改善的后期融合多核聚类机器学习方法及系统
WO2022267956A1 (zh) * 2021-06-24 2022-12-29 浙江师范大学 基于矩阵分解和多划分对齐的多视图聚类方法及系统
CN113947135A (zh) * 2021-09-27 2022-01-18 华东师范大学 基于缺失图重构和自适应近邻的不完整多视图聚类方法
CN113947135B (zh) * 2021-09-27 2022-07-08 华东师范大学 基于缺失图重构和自适应近邻的不完整多视图聚类方法
CN116310462A (zh) * 2023-05-19 2023-06-23 浙江财经大学 一种基于秩约束自表示的图像聚类方法及装置
CN116310462B (zh) * 2023-05-19 2023-08-11 浙江财经大学 一种基于秩约束自表示的图像聚类方法及装置
CN117611931A (zh) * 2024-01-23 2024-02-27 西南科技大学 一种基于深度自表示局部块学习的数据分类方法及系统
CN117611931B (zh) * 2024-01-23 2024-04-05 西南科技大学 一种基于深度自表示局部块学习的数据分类方法及系统

Similar Documents

Publication Publication Date Title
CN109063757A (zh) 基于块对角表示和视图多样性的多视图子空间聚类方法
Cai et al. Island loss for learning discriminative features in facial expression recognition
CN109002854A (zh) 基于隐表示和自适应的多视图子空间聚类方法
CN110659665B (zh) 一种异维特征的模型构建方法及图像识别方法、装置
CN103927511B (zh) 基于差异特征描述的图像识别方法
CN107145836B (zh) 基于栈式边界辨别自编码器的高光谱图像分类方法
CN105760900B (zh) 基于近邻传播聚类和稀疏多核学习的高光谱图像分类方法
CN105354555B (zh) 一种基于概率图模型的三维人脸识别方法
CN105930873B (zh) 一种基于子空间的自步跨模态匹配方法
Wu et al. Manifold kernel sparse representation of symmetric positive-definite matrices and its applications
CN110175642A (zh) 一种基于pca降维和特征二元化的菊花相似性计算方法
CN110276746A (zh) 一种鲁棒性遥感图像变化检测方法
CN106250918B (zh) 一种基于改进的推土距离的混合高斯模型匹配方法
CN105740917B (zh) 带有标签学习的遥感图像的半监督多视图特征选择方法
CN110348287A (zh) 一种基于字典和样本相似图的无监督特征选择方法和装置
Goh et al. Unsupervised Riemannian clustering of probability density functions
Liang et al. Decentralized dimensionality reduction for distributed tensor data across sensor networks
Li et al. Self-weighted unsupervised LDA
CN111680579A (zh) 一种自适应权重多视角度量学习的遥感图像分类方法
CN103714340A (zh) 基于图像分块的自适应特征提取方法
US11935302B2 (en) Object re-identification using multiple cameras
Guo et al. Data induced masking representation learning for face data analysis
CN109886315A (zh) 一种基于核保持的图像相似性度量方法
Li et al. A non-rigid 3D model retrieval method based on scale-invariant heat kernel signature features
CN105046286A (zh) 基于自动视图生成和联合l1,2范数最小化的监督多视图特征选择方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20181221