CN110175631B - 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法 - Google Patents
一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法 Download PDFInfo
- Publication number
- CN110175631B CN110175631B CN201910352469.4A CN201910352469A CN110175631B CN 110175631 B CN110175631 B CN 110175631B CN 201910352469 A CN201910352469 A CN 201910352469A CN 110175631 B CN110175631 B CN 110175631B
- Authority
- CN
- China
- Prior art keywords
- clustering
- matrix
- view
- subspace
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Computing Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明揭示了一种基于共同学习子空间结构和聚类指示矩阵的多视图图像聚类方法,该方法包括如下步骤:S1:获取多视图图像数据;S2:对给定多视图图像数据进行子空间学习,得到多视图子空间表示、连续指示矩阵、离散指示矩阵;S3:对多视图子空间表示、连续指示矩阵、离散指示矩阵进行迭代更新,得到更新后的多视图子空间表示;S4:应用所述S3步骤得到的多视图子空间表示构造邻接矩阵;S5:应用所述S4步骤得到的邻接矩阵,调用谱聚类算法,得到聚类结果。与已有的多视图聚类方法相比,大量的实验结果证明该方法可以显著提高收敛速率和聚类性能。
Description
技术领域
本发明涉及一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法,可用于模式识别中的多视图聚类领域。
背景技术
在计算机视觉和模式识别领域,聚类是一项基本的数据处理技术。在现实中数据可以被多种特征表述,例如图像可以被Intensity,LBP和Gabor三个特征描述,网页可以被不同格式的文本,不同语言等刻画。利用数据的多视图特征对数据进行分类,可以大大提高分类的正确率。随着互联网和计算机的迅猛发展、大数据时代的到来,对数据的聚类处理显得尤为重要,而目这个问题越来越受到人工智能领域的关注。
多视图聚类隶属于无监督学习,它试图将数据集中的样本划分为若干个不相交的子集。多视图聚类既可以是一个单独的过程,用于寻找数据的内在结构,也可以作为分类等其它学习任务前驱过程,例如,在商业应用中需要对新用户的类型进行判别,此时就需要先对用户数据进行聚类。在多视图聚类中,怎样保证不同视图下聚类的一致性非常重要。解决多视图聚类问题的方法都是建立在谱聚类的基础之上的,而谱聚类算法是建立在谱图理论基础上,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。谱聚类算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量,然后选择合适的特征向量聚类不同的数据点。同时现存的多数多视图聚类算法把子空间学习和谱聚类分开进行,忽略了两者之间的紧密联系,从而导致了算法聚类性能的不佳。
发明内容
本发明的目的就是为了解决现有技术中存在的上述问题,提出一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法。
本发明的目的将通过以下技术方案得以实现:一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法,该方法包括如下步骤:
S1:获取多视图图像数据;
S2:对给定多视图图像数据进行子空间学习,得到多视图子空间表示、连续指示矩阵、离散指示矩阵;
S3:对多视图子空间表示、连续指示矩阵、离散指示矩阵进行迭代更新,得到更新后的多视图子空间表示;
S4:应用所述S3步骤得到的多视图子空间表示构造邻接矩阵;
S5:应用所述S4步骤得到的邻接矩阵,调用谱聚类算法,得到聚类结果。
优选地,在所述S2步骤中,子空间表示刻画的是数据在子空间的分布结构,离散指示矩阵为一个只含有{0,1}的矩阵,行数对应于多视图数据的个数,列数对应多视图数据的类别数。
优选地,在所述S5步骤中,利用子空间表示构造邻接矩阵,把邻接矩阵作为谱聚类算法的输入,得到算法下的聚类标签,最后把预测的聚类标签与数据的真实类别标签进行对比,得出评价算法的聚类指标。
优选地,在所述S2步骤中,
假设给定一组多视图数据v∈[1,2,...,V]和所属类别{1,...,c},n代表有n个数据,v代表第v个视图,dv是第v个视图下的特征维度;Zv∈Rn×n是第v个视图下的子空间表示,是误差项,F∈Rn×c连续指示矩阵,P∈Rn×c离散指示矩阵,Q∈Rc×c转换矩阵,Zv,Ev,F,P,Q都为未知;为邻接矩阵,Lv=Dv-Wv为拉普拉斯矩阵,其中dii=∑jwij;公式(1)所示模型能直接从多视图数据学得多视图子空间表示、连续指示矩阵、离散指示矩阵,模型如下:
第一项是自我表示项,自我表示项是学习数据的子空间结构;第二项是误差项,第三项是连续指示矩阵学习,能保证不同视图下聚类结果的一致性;第四项是离散指示矩阵学习,λ,β,γ是惩罚参数。
优选地,在所述S3步骤中,(1)式模型中有五个未知量,能够通过交替求解的方法求解,具体过程如下:
固定E,F,P和Q求解Z:
对(2)式求解得:
固定Z,F,P和Q,求解E:
对(4)式求解得:
固定Z,E,P和Q,求解F:
利用可行的正交约束优化方法解决公式(6);
固定Z,E,P和F,求解Q:
Q=UVT (8)
其中U和V是PTF的奇异值分解;
固定Z,E,F和Q,求解P:
本发明采用以上技术方案与现有技术相比,具有以下技术效果:在相同的实验数据条件下,通过共同学习的方式直接从多视图数据学得多视图子空间表示、连续指示矩阵、离散指示矩阵,并通过三者的迭代优化提高子空间表示刻画数据内在结构的性能。考虑子空间学习和谱聚类之间的联系,把两者放在一个模型中,对邻接矩阵进行了优化的同时还保证了不同视图下聚类结果的一致性。联合全部视图的子空间表示构造邻接矩阵,充分考虑视图的信息客观上提高多视图图像的聚类精度。
本技术方案的亮点在于共同学习多视图子空间表示、连续指示矩阵、离散指示矩阵,在迭代优化得到更新后的多视图子空间表示的同时还保证了不同视图下聚类的一致性,然后联合全部视图的子空间表示构造邻接矩阵,从而有效地提高聚类的性能。
附图说明
图1为本发明多视图图像聚类领域的工作流程图。
具体实施方式
本发明的目的、优点和特点,将通过下面优选实施例的非限制性说明进行图示和解释。这些实施例仅是应用本发明技术方案的典型范例,凡采取等同替换或者等效变换而形成的技术方案,均落在本发明要求保护的范围之内。
本发明揭示了一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法,如图1所示,该方法包括如下步骤:
S1:获取多视图图像数据;
S2:对给定多视图图像数据进行子空间学习,得到多视图子空间表示、连续指示矩阵、离散指示矩阵;
S3:对多视图子空间表示、连续指示矩阵、离散指示矩阵进行迭代更新,得到更新后的多视图子空间表示;
S4:应用所述S3步骤得到的多视图子空间表示构造邻接矩阵;
S5:应用所述S4步骤得到的邻接矩阵,调用谱聚类算法,得到聚类结果。
具体实施方式如下:
假设给定一组多视图图像数据v∈[1,2,...,V]和所属类别{1,...,c},n代表有n个数据,v代表第v个视图,dv是第v个视图下的特征维度。Zv∈Rn×n是第v个视图下的子空间表示,是误差项,F∈Rn×c连续指示矩阵,P∈Rn×c离散指示矩阵,Q∈Rc×c转换矩阵,Zv,Ev,F,P,Q都是未知的。为邻接矩阵,Lv=Dv-Wv为拉普拉斯矩阵,其中dii=∑jwij。
公式(1)所示模型能直接从多视图数据学得子空间表示、连续指数矩阵、离散指示矩阵。模型如下:
第一项是自我表示项,自我表示项是学习数据的子空间结构。第二项是误差项,因为真实数据可能存在误差。第三项是连续指示矩阵学习,它能保证不同视图下聚类结果的一致性。第四项是离散指示矩阵学习,λ,β,γ是惩罚参数。
公式(1)模型中有五个未知量,可以通过交替求解的方法求解,为了简化求解过程,省略去变量的上标,具体过程如下:
固定E,F,P和Q求解Z:
对(2)式求解得:
固定Z,F,P和Q,求解E:
对(4)式求解得:
固定Z,E,P和Q,求解F:
利用可行的正交约束优化方法解决公式(6)
固定Z,E,P和F,求解Q,其中U和V是PTF的奇异值分解:
所以:Q=UVT (8)
固定Z,E,F和Q,求解P:
将本发明的一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法在Yale and Olivetti Research Laboratory(ORL)人脸数据库上进行实验,并将实验结果与其他多视图聚类方法进行对比分析。
具体地,Yale数据集包含了15个人的165幅图像,每一类有11幅图像,类别为:中心光,带眼镜,无眼镜,快乐,悲伤,左光,右光,困,正常,惊讶和眨眼。ORL数据集中包含了40个不同对象的400幅图像,每个对象都包含10幅不同的图像。实验用的Yale数据集和ORL数据集都含有3个视图:Intensity维度为4096,LBP维度为3304,Gabor维度为6750。在相同的实验设置下,选取了6个被广泛认可目具有代表性的方法作为对比,即SSC,Min-Dis,RMSC,ConReg和LTMSC,Di-MSC。同时,用两个广泛应用于聚类领域的指标(NMI、ACC)来度量算法的性能,表示中的数据为平均值(±标准差)。
实验结果如下:
表一:Yale数据集上各种方法的实验结果
方法 | NMI | ACC |
SSC | 0.671(±0.011) | 0.627(±0.000) |
Min-Dis | 0.645(±0.005) | 0.615(±0.043) |
RMSC | 0.684(±0.033) | 0.642(±0.036) |
ConReg | 0.673(±0.023) | 0.611(±0.035) |
LTMSC | 0.765(±0.008) | 0.741(±0.002) |
Di-MSC | 0.727(±0.010) | 0.709(±0.003) |
OURS | 0.782(±0.004) | 0.792(±0.026) |
表二:ORL数据集上各种方法的实验结果
本发明利用共同学习的方法从多视图数据中得到多视图子空间表示、连续指示矩阵、离散指示矩阵,通过三者的迭代得到优化后的多视图子空间表示,使构造的邻接矩阵更能刻画子空间结构,同时保证了不同视图下聚类的一致性。实验用聚类指标NMI和ACC来度量算法的好坏。从表一、表二中的结果可以看出,本发明提出的方法比其他6种方法的聚类指标都高,实验验证了本发明能有效地提高聚类的性能。
本发明尚有多种实施方式,凡采用等同变换或者等效变换而形成的所有技术方案,均落在本发明的保护范围之内。
Claims (5)
1.一种基于共同学习子空间结构和聚类指示矩阵的多视图图像聚类方法,其特征在于:该方法包括如下步骤:
S1:获取多视图图像数据;
S2:对给定多视图图像数据进行子空间学习,得到多视图子空间表示、连续指示矩阵、离散指示矩阵;
其中,假设给定一组多视图数据和所属类别{1,...,c},n代表有n个数据,v代表第v个视图,dv是第v个视图下的特征维度;Zv∈Rn×n是第v个视图下的子空间表示,是误差项,F∈Rn×c连续指示矩阵,P∈Rn×c离散指示矩阵,Q∈Rc×c转换矩阵,Zv,Ev,F,P,Q都为未知;为邻接矩阵,Lv=Dv-Wv为拉普拉斯矩阵,其中dii=∑jwij;公式(1)所示模型能直接从多视图数据学得多视图子空间表示、连续指示矩阵、离散指示矩阵,模型如下:
s.tZv(i,i)=0,FTF=I,QTQ=I,P∈Idx (1)
第一项是自我表示项,自我表示项是学习数据的子空间结构;第二项是误差项,第三项是连续指示矩阵学习,能保证不同视图下聚类结果的一致性;第四项是离散指示矩阵学习,λ,β,γ是惩罚参数;
S3:对多视图子空间表示、连续指示矩阵、离散指示矩阵进行迭代更新,得到更新后的多视图子空间表示;
S4:应用所述S3步骤得到的多视图子空间表示构造邻接矩阵;
S5:应用所述S4步骤得到的邻接矩阵,调用谱聚类算法,得到聚类结果。
2.根据权利要求1所述的一种基于共同学习子空间结构和聚类指示矩阵的多视图图像聚类方法,其特征在于:在所述S2步骤中,子空间表示刻画的是数据在子空间的分布结构,离散指示矩阵为一个只含有{0,1}的矩阵,行数对应于多视图数据的个数,列数对应多视图数据的类别数。
3.根据权利要求1所述的一种基于共同学习子空间结构和聚类指示矩阵的多视图图像聚类方法,其特征在于:在所述S5步骤中,利用子空间表示构造邻接矩阵,把邻接矩阵作为谱聚类算法的输入,得到算法下的聚类标签,最后把预测的聚类标签与数据的真实类别标签进行对比,得出评价算法的聚类指标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910352469.4A CN110175631B (zh) | 2019-04-28 | 2019-04-28 | 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910352469.4A CN110175631B (zh) | 2019-04-28 | 2019-04-28 | 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110175631A CN110175631A (zh) | 2019-08-27 |
CN110175631B true CN110175631B (zh) | 2022-08-30 |
Family
ID=67690202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910352469.4A Active CN110175631B (zh) | 2019-04-28 | 2019-04-28 | 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110175631B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113221974B (zh) * | 2021-04-26 | 2022-02-08 | 中山大学 | 一种交叉图匹配不完整多视图聚类方法及装置 |
CN113569973B (zh) * | 2021-08-04 | 2024-04-19 | 咪咕文化科技有限公司 | 多视图聚类方法、装置、电子设备及计算机可读存储介质 |
CN116310452B (zh) * | 2023-02-16 | 2024-03-19 | 广东能哥知识科技有限公司 | 一种多视图聚类方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106971197A (zh) * | 2017-03-02 | 2017-07-21 | 北京工业大学 | 基于差异性与一致性约束的多视数据的子空间聚类方法 |
CN107292341A (zh) * | 2017-06-20 | 2017-10-24 | 西安电子科技大学 | 基于成对协同正则化和nmf的自适应多视图聚类方法 |
CN109145975A (zh) * | 2018-08-14 | 2019-01-04 | 聚时科技(上海)有限公司 | 一种矩阵范数导出正则化的多视图聚类机器学习方法 |
CN109409422A (zh) * | 2018-10-12 | 2019-03-01 | 广西师范大学 | 一种基于谱旋转的一步谱聚类方法 |
-
2019
- 2019-04-28 CN CN201910352469.4A patent/CN110175631B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106971197A (zh) * | 2017-03-02 | 2017-07-21 | 北京工业大学 | 基于差异性与一致性约束的多视数据的子空间聚类方法 |
CN107292341A (zh) * | 2017-06-20 | 2017-10-24 | 西安电子科技大学 | 基于成对协同正则化和nmf的自适应多视图聚类方法 |
CN109145975A (zh) * | 2018-08-14 | 2019-01-04 | 聚时科技(上海)有限公司 | 一种矩阵范数导出正则化的多视图聚类机器学习方法 |
CN109409422A (zh) * | 2018-10-12 | 2019-03-01 | 广西师范大学 | 一种基于谱旋转的一步谱聚类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110175631A (zh) | 2019-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhu et al. | Fast and stable clustering analysis based on Grid-mapping K-means algorithm and new clustering validity index | |
Unnikrishnan et al. | Toward objective evaluation of image segmentation algorithms | |
CN110175631B (zh) | 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法 | |
Yang et al. | Discriminative nonnegative spectral clustering with out-of-sample extension | |
Xu et al. | A feasible density peaks clustering algorithm with a merging strategy | |
Amelio et al. | Data mining: clustering | |
Li et al. | Hybrid recommendation algorithm of cross-border e-commerce items based on artificial intelligence and multiview collaborative fusion | |
Jiang et al. | Knowledge transfer for spectral clustering | |
Jahani et al. | Unsupervised feature selection guided by orthogonal representation of feature space | |
Bu et al. | Integrating additional knowledge into the estimation of graphical models | |
Shang et al. | Feature selection via non-convex constraint and latent representation learning with laplacian embedding | |
Hooshyar et al. | Clustering algorithms in an educational context: An automatic comparative approach | |
CN114898167A (zh) | 基于视图间差异性检测的多视图子空间聚类方法及系统 | |
Choi et al. | Convex clustering for binary data | |
Arjaria et al. | Performances of Machine Learning Models for Diagnosis of Alzheimer’s Disease | |
Jia et al. | Auto weighted robust dual graph nonnegative matrix factorization for multiview clustering | |
Rastin et al. | Prototype-based clustering for relational data using barycentric coordinates | |
Hoseini et al. | Unsupervised feature selection in linked biological data | |
He | Drug-Target Interaction Prediction Based on Knowledge Graph and Convolutional Neural Network Integrated with CBAM Module | |
Liao et al. | Adaptive Initialization Method Based on Spatial Local Information for k‐Means Algorithm | |
CN106203517A (zh) | 一种核范数驱动的数据分类方法及系统 | |
CN114625952A (zh) | 一种基于VSM和AMMK-means的信息推荐方法及系统 | |
De Amorim et al. | Selecting the Minkowski exponent for intelligent K-Means with feature weighting | |
Wang et al. | Robust multi-view features fusion method based on CNMF | |
TU | Online Text Retrieval Method Based on Convolution Neural Network. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |