CN110175631B

CN110175631B - 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法

Info

Publication number: CN110175631B
Application number: CN201910352469.4A
Authority: CN
Inventors: 吴松松; 卢志强; 姚礼昕; 莫晓晖; 岳东
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2019-04-28
Filing date: 2019-04-28
Publication date: 2022-08-30
Anticipated expiration: 2039-04-28
Also published as: CN110175631A

Abstract

本发明揭示了一种基于共同学习子空间结构和聚类指示矩阵的多视图图像聚类方法，该方法包括如下步骤：S1：获取多视图图像数据；S2：对给定多视图图像数据进行子空间学习，得到多视图子空间表示、连续指示矩阵、离散指示矩阵；S3：对多视图子空间表示、连续指示矩阵、离散指示矩阵进行迭代更新，得到更新后的多视图子空间表示；S4：应用所述S3步骤得到的多视图子空间表示构造邻接矩阵；S5：应用所述S4步骤得到的邻接矩阵，调用谱聚类算法，得到聚类结果。与已有的多视图聚类方法相比，大量的实验结果证明该方法可以显著提高收敛速率和聚类性能。

Description

一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法

技术领域

本发明涉及一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法，可用于模式识别中的多视图聚类领域。

背景技术

在计算机视觉和模式识别领域，聚类是一项基本的数据处理技术。在现实中数据可以被多种特征表述，例如图像可以被Intensity，LBP和Gabor三个特征描述，网页可以被不同格式的文本，不同语言等刻画。利用数据的多视图特征对数据进行分类，可以大大提高分类的正确率。随着互联网和计算机的迅猛发展、大数据时代的到来，对数据的聚类处理显得尤为重要，而目这个问题越来越受到人工智能领域的关注。

多视图聚类隶属于无监督学习，它试图将数据集中的样本划分为若干个不相交的子集。多视图聚类既可以是一个单独的过程，用于寻找数据的内在结构，也可以作为分类等其它学习任务前驱过程，例如，在商业应用中需要对新用户的类型进行判别，此时就需要先对用户数据进行聚类。在多视图聚类中，怎样保证不同视图下聚类的一致性非常重要。解决多视图聚类问题的方法都是建立在谱聚类的基础之上的，而谱聚类算法是建立在谱图理论基础上，它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。谱聚类算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵，并且计算矩阵的特征值和特征向量，然后选择合适的特征向量聚类不同的数据点。同时现存的多数多视图聚类算法把子空间学习和谱聚类分开进行，忽略了两者之间的紧密联系，从而导致了算法聚类性能的不佳。

发明内容

本发明的目的就是为了解决现有技术中存在的上述问题，提出一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法。

本发明的目的将通过以下技术方案得以实现：一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法，该方法包括如下步骤：

S1：获取多视图图像数据；

S2：对给定多视图图像数据进行子空间学习，得到多视图子空间表示、连续指示矩阵、离散指示矩阵；

S3：对多视图子空间表示、连续指示矩阵、离散指示矩阵进行迭代更新，得到更新后的多视图子空间表示；

S4：应用所述S3步骤得到的多视图子空间表示构造邻接矩阵；

S5：应用所述S4步骤得到的邻接矩阵，调用谱聚类算法，得到聚类结果。

优选地，在所述S2步骤中，子空间表示刻画的是数据在子空间的分布结构，离散指示矩阵为一个只含有{0，1}的矩阵，行数对应于多视图数据的个数，列数对应多视图数据的类别数。

优选地，在所述S5步骤中，利用子空间表示构造邻接矩阵，把邻接矩阵作为谱聚类算法的输入，得到算法下的聚类标签，最后把预测的聚类标签与数据的真实类别标签进行对比，得出评价算法的聚类指标。

优选地，在所述S2步骤中，

假设给定一组多视图数据

v∈[1，2，...，V]和所属类别{1，...，c}，n代表有n个数据，v代表第v个视图，d_v是第v个视图下的特征维度；Z^v∈R^n×n是第v个视图下的子空间表示，

是误差项，F∈R^n×c连续指示矩阵，P∈R^n×c离散指示矩阵，Q∈R^c×c转换矩阵，Z^v，E^v，F，P，Q都为未知；

为邻接矩阵，L^v＝D^v-W^v为拉普拉斯矩阵，其中d_ii＝∑_jw_ij；公式(1)所示模型能直接从多视图数据学得多视图子空间表示、连续指示矩阵、离散指示矩阵，模型如下：

第一项是自我表示项，自我表示项是学习数据的子空间结构；第二项是误差项，第三项是连续指示矩阵学习，能保证不同视图下聚类结果的一致性；第四项是离散指示矩阵学习，λ，β，γ是惩罚参数。

优选地，在所述S3步骤中，(1)式模型中有五个未知量，能够通过交替求解的方法求解，具体过程如下：

固定E，F，P和Q求解Z：

对(2)式求解得：

其中

Fⁱ是F的第i行，y是Y的第i列，

K＝X-(XZ-xz^T)-E，z^T是Z的第i行；

固定Z，F，P和Q，求解E：

对(4)式求解得：

固定Z，E，P和Q，求解F：

利用可行的正交约束优化方法解决公式(6)；

固定Z，E，P和F，求解Q：

Q＝UV^T (8)

其中U和V是P^TF的奇异值分解；

固定Z，E，F和Q，求解P：

对(9)式求解：

优选地，在所述S4步骤中，通过迭代优化Z^v，E^v，F，Q和P，用Z^v构造邻接矩阵

然后利用谱聚类得到预测的聚类标签，并与真实的数据标签进行对比，得到聚类的评价指标。

本发明采用以上技术方案与现有技术相比，具有以下技术效果：在相同的实验数据条件下，通过共同学习的方式直接从多视图数据学得多视图子空间表示、连续指示矩阵、离散指示矩阵，并通过三者的迭代优化提高子空间表示刻画数据内在结构的性能。考虑子空间学习和谱聚类之间的联系，把两者放在一个模型中，对邻接矩阵进行了优化的同时还保证了不同视图下聚类结果的一致性。联合全部视图的子空间表示构造邻接矩阵，充分考虑视图的信息客观上提高多视图图像的聚类精度。

本技术方案的亮点在于共同学习多视图子空间表示、连续指示矩阵、离散指示矩阵，在迭代优化得到更新后的多视图子空间表示的同时还保证了不同视图下聚类的一致性，然后联合全部视图的子空间表示构造邻接矩阵，从而有效地提高聚类的性能。

附图说明

图1为本发明多视图图像聚类领域的工作流程图。

具体实施方式

本发明的目的、优点和特点，将通过下面优选实施例的非限制性说明进行图示和解释。这些实施例仅是应用本发明技术方案的典型范例，凡采取等同替换或者等效变换而形成的技术方案，均落在本发明要求保护的范围之内。

本发明揭示了一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法，如图1所示，该方法包括如下步骤：

S1：获取多视图图像数据；

S4：应用所述S3步骤得到的多视图子空间表示构造邻接矩阵；

具体实施方式如下：

假设给定一组多视图图像数据

v∈[1，2，...，V]和所属类别{1，...，c}，n代表有n个数据，v代表第v个视图，d_v是第v个视图下的特征维度。Z^v∈R^n×n是第v个视图下的子空间表示，

是误差项，F∈R^n×c连续指示矩阵，P∈R^n×c离散指示矩阵，Q∈R^c×c转换矩阵，Z^v，E^v，F，P，Q都是未知的。

为邻接矩阵，L^v＝D^v-W^v为拉普拉斯矩阵，其中d_ii＝∑_jw_ij。

公式(1)所示模型能直接从多视图数据学得子空间表示、连续指数矩阵、离散指示矩阵。模型如下：

第一项是自我表示项，自我表示项是学习数据的子空间结构。第二项是误差项，因为真实数据可能存在误差。第三项是连续指示矩阵学习，它能保证不同视图下聚类结果的一致性。第四项是离散指示矩阵学习，λ，β，γ是惩罚参数。

公式(1)模型中有五个未知量，可以通过交替求解的方法求解，为了简化求解过程，省略去变量的上标，具体过程如下：

固定E，F，P和Q求解Z：

对(2)式求解得：

其中

Fⁱ是F的第i行，y是Y的第i列，

K＝X-(XZ-xz^T)-E，z^T是Z的第i行。

固定Z，F，P和Q，求解E：

对(4)式求解得：

固定Z，E，P和Q，求解F：

利用可行的正交约束优化方法解决公式(6)

固定Z，E，P和F，求解Q，其中U和V是P^TF的奇异值分解：

所以：Q＝UV^T (8)

固定Z，E，F和Q，求解P：

对(9)式求解的：

通过迭代优化Z^v，E^v，F，Q和P，用Z^v构造邻接矩阵

将本发明的一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法在Yale and Olivetti Research Laboratory(ORL)人脸数据库上进行实验，并将实验结果与其他多视图聚类方法进行对比分析。

具体地，Yale数据集包含了15个人的165幅图像，每一类有11幅图像，类别为：中心光，带眼镜，无眼镜，快乐，悲伤，左光，右光，困，正常，惊讶和眨眼。ORL数据集中包含了40个不同对象的400幅图像，每个对象都包含10幅不同的图像。实验用的Yale数据集和ORL数据集都含有3个视图：Intensity维度为4096，LBP维度为3304，Gabor维度为6750。在相同的实验设置下，选取了6个被广泛认可目具有代表性的方法作为对比，即SSC，Min-Dis，RMSC，ConReg和LTMSC，Di-MSC。同时，用两个广泛应用于聚类领域的指标(NMI、ACC)来度量算法的性能，表示中的数据为平均值(±标准差)。

实验结果如下：

表一：Yale数据集上各种方法的实验结果

方法	NMI	ACC
			SSC	0.671(±0.011)	0.627(±0.000)
Min-Dis	0.645(±0.005)	0.615(±0.043)
			RMSC	0.684(±0.033)	0.642(±0.036)
ConReg	0.673(±0.023)	0.611(±0.035)
			LTMSC	0.765(±0.008)	0.741(±0.002)
Di-MSC	0.727(±0.010)	0.709(±0.003)
			OURS	0.782(±0.004)	0.792(±0.026)

表二：ORL数据集上各种方法的实验结果

本发明利用共同学习的方法从多视图数据中得到多视图子空间表示、连续指示矩阵、离散指示矩阵，通过三者的迭代得到优化后的多视图子空间表示，使构造的邻接矩阵更能刻画子空间结构，同时保证了不同视图下聚类的一致性。实验用聚类指标NMI和ACC来度量算法的好坏。从表一、表二中的结果可以看出，本发明提出的方法比其他6种方法的聚类指标都高，实验验证了本发明能有效地提高聚类的性能。

本发明尚有多种实施方式，凡采用等同变换或者等效变换而形成的所有技术方案，均落在本发明的保护范围之内。