CN111611323A - 一种面向数据融合的迭代结构化多视图子空间聚类方法,设备及可读存储介质 - Google Patents

一种面向数据融合的迭代结构化多视图子空间聚类方法,设备及可读存储介质 Download PDF

Info

Publication number
CN111611323A
CN111611323A CN202010272240.2A CN202010272240A CN111611323A CN 111611323 A CN111611323 A CN 111611323A CN 202010272240 A CN202010272240 A CN 202010272240A CN 111611323 A CN111611323 A CN 111611323A
Authority
CN
China
Prior art keywords
matrix
view
data
oriented
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010272240.2A
Other languages
English (en)
Inventor
于晓
刘慧�
郭强
阮怀军
封文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Academy of Agricultural Sciences
Shandong University of Finance and Economics
Original Assignee
Shandong Academy of Agricultural Sciences
Shandong University of Finance and Economics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Academy of Agricultural Sciences, Shandong University of Finance and Economics filed Critical Shandong Academy of Agricultural Sciences
Priority to CN202010272240.2A priority Critical patent/CN111611323A/zh
Publication of CN111611323A publication Critical patent/CN111611323A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种面向数据融合的迭代结构化多视图子空间聚类方法,设备及可读存储介质,构建多视图子空间聚类ISSMSC模型;对目标函数进行求解和目标优化,获得子空间的数目k和维数,并将数据点分割到子空间中,实现多视图子空间聚类。本方法的矩阵减少了不同簇之间的关系,并增强了同一簇内的关系。邻接矩阵的比较证明了本模型的优势。本方法基于数据的自表达特性,不仅探索了各视图之间的共享信息,而且利用了各视图之间的潜在补充信息。考虑到聚类过程中产生的分割矩阵对邻接矩阵学习的影响,在学习过程中引入了结构化的l1范数。此外,还设计了一种有效的优化算法来解决该问题。

Description

一种面向数据融合的迭代结构化多视图子空间聚类方法,设 备及可读存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种面向数据融合的迭代结构化多视图子空间聚类方法,设备及可读存储介质。
背景技术
随着信息技术的发展,每天都会产生大量数据。毫不夸张地说,我们生活在数据的海洋中,其中大多数数据是高维的。由于计算机性能的限制,处理高维数据并非易事。在计算过程中,随着数据量的增加,计算量呈指数级增长。这种现象通常被称为维数的诅咒。为了避免这种影响,有许多降维策略,例如主成分分析(PCA),非负矩阵分解(NMF),线性判别分析(LDA)等。这些方法已被广泛用于许多领域,例如模式识别和图像处理。
然而,由于现实世界中的高维数据通常来自多个空间,仅仅依靠数据降维技术还不能解决现实需求,因此便出现了子空间分割的需求,而子空间聚类就是一种解决子空间分割问题的方法。本研究正是针对多源农业产业信息资源整合共享领域中问题,为多源、异构、海量的产业信息资源存储与分析提供技术支撑。
目前产业数据分析需求要解决的问题就是将来自于不同特征视图数据进行子空间聚类,对它的研究基于相同子空间中的数据应该相似、不同子空间中的数据具有差异性的原理将高维数据映射到不同的子空间中。传统的聚类方法一般采用欧氏距离作为数据之间的相似性度量,但是在高维空间中难以用欧氏距离来度量相似性。
而基于稀疏和低秩的子空间聚类算法对高维数据的聚类十分有效。鉴于此,子空间聚类已广泛应用于图像分割、面部聚类、运动分割等方面。
在现实世界中,数据可以用多种形式的视图来解释。例如,可以用局部二进制模式(LBP),定向梯度金字塔直方图(PHOG)、尺度不变特征变换(SIFT)、定向梯度直方图 (HOG)和其他特征来描述图像。网页可以用指向它们的文本或超链接来表示。文档可以翻译成不同的语言版本。多视图子空间聚类通过同时使用数据的多个特征将高维数据映射到不同子空间中。与子空间聚类相比,多视图子空间聚类可以达到更高的精度,具有广阔的应用前景。
尽管多视图子空间聚类已有大量研究,但许多研究还是从原始数据中重建数据点。研究表明,邻接矩阵的学习会受到数据质量的影响,而原始数据通常包含噪声和冗余信息,所以直接使用原始数据进行重建效果难以满足实际需要,图像精确度较低交。
发明内容
为了克服上述现有技术中的不足,本发明是在多视图子空间聚类中在表示矩阵的学习过程中使用分割矩阵信息。本发明提出了一种面向数据融合的迭代结构化多视图子空间聚类方法。从潜在信息中学习所有视图的共享表示,并同时使用不同视图之间的补充信息。
在每次迭代期间,利用在第二阶段的过程中形成的矩阵来更新第一阶段中的参数,并且使用来自第一阶段的表示矩阵来对第二阶段中的数据点进行聚类。在表示矩阵的过程中,基于共识原则的预设下获得了不同视图的共享稀疏表示。
方法包括:步骤一,构建多视图子空间聚类ISSMSC模型;
步骤二,对目标函数进行求解和目标优化,获得子空间的数目k和维数,并将数据点分割到子空间中,,实现多视图子空间聚类。
本发明还提供一种实现面向数据融合的迭代结构化多视图子空间聚类方法的设备,包括:
存储器,用于存储计算机程序及面向数据融合的迭代结构化多视图子空间聚类方法;
处理器,用于执行所述计算机程序及面向数据融合的迭代结构化多视图子空间聚类方法,以实现面向数据融合的迭代结构化多视图子空间聚类方法的步骤。
本发明还提供一种具有面向数据融合的迭代结构化多视图子空间聚类方法的可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行以实现面向数据融合的迭代结构化多视图子空间聚类方法的步骤。
从以上技术方案可以看出,本发明具有以下优点:
本方法的矩阵减少了不同簇之间的关系,并增强了同一簇内的关系。邻接矩阵的比较证明了本模型的优势。
本方法基于数据的自表达特性,不仅探索了各视图之间的共享信息,而且利用了各视图之间的潜在补充信息。考虑到聚类过程中产生的分割矩阵对邻接矩阵学习的影响,在学习过程中引入了结构化的l1范数。此外,还设计了一种有效的优化算法来解决该问题。在七个基准数据集中进行了实验。与最新算法相比,本算法在NMI、ACC等方面更好。
附图说明
为了更清楚地说明本发明的技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为面向数据融合的迭代结构化多视图子空间聚类方法流程图;
图2为数据集UCI的t-SNE可视化示意图;
图3为参数的敏感性分析示意图;
图4为用t-SNE可视化不同数据集上的共享示意图;
图5为Yale数据集上的邻接矩阵比较图.
具体实施方式
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
本发明提供一种面向数据融合的迭代结构化多视图子空间聚类方法,如图1所示,是基于多视图子空间聚类来实现。
多视图子空间聚类可以分为三类:基于谱聚类的方法、基于张量分解的方法和基于深度学习的方法。其中,基于谱聚类的方法由于其易实现性和有效性而最为流行。
基于谱聚类的方法通常包含两个阶段。在第一阶段构造邻接(相似度)矩阵,在第二阶段通过执行谱聚类算法获得聚类结果。具体而言,在获得相似度矩阵之后,使用谱(特征值)进行降维。然后,使用k-means算法将数据划分为维数较低的簇。
构造相似度矩阵主要有四种方法:ε-邻域图,k-最近邻图,完全连通图和自表示方法,其中自表示方法是应用最广的。本发明利用了视图之间的互补知识,并在第二阶段将分割矩阵与第一阶段的数据表示相结合,促进对邻接矩阵的学习。
本发明涉及的方法用于解决子空间聚类的ISSMSC技术。
本发明的方法中,给定一组待聚类的数据D={d1,d2,…,dN}∈RM×N,D的N个数据点来自于k个未知维数的子空间
Figure RE-GDA0002595155660000041
的并,且子空间
Figure RE-GDA0002595155660000042
是相互独立的。子空间聚类的目标是求解子空间的数目k和它们的维数,并将数据点分割到其相应的子空间中。为了方便起见,在表1中对整篇文章中的符号进行解释。
Figure RE-GDA0002595155660000043
这里引入了一些相关的定义来解释本文中的术语。
本发明涉及数据的自表达属性。基于数据的自表达属性,子空间并集中的每个数据点都可以通过数据集中其他点的组合来有效地进行重建。即:
给定n个数据点Y=[y1,y2,…,yi,…,yn]∈Rd×n,每一列是一个向量,代表一个样本。通过使用数据的自表达属性,Y可以用Y=YZ表示,其中Z=[z1,z2,…,zi,…,zn]∈Rn×n是系数矩阵,zi代表原始数据点yi
那么,基于数据自表达属性的子空间聚类方法主要解决如下问题:
min||E||n1+λ||Z||n2
s.t.Y=YZ+E,diag(Z)=0 (1)
其中||·||n1和||·||n2是范数,λ是用来权衡两范数的比例参数,Z是子空间表示矩阵,当||Z||n2=||Z||1时使用diag(Z)=0来避免Z是单位矩阵。使用谱聚类的方法,一旦得到Z,就可以通过
Figure RE-GDA0002595155660000051
获得邻接矩阵。然后对A使用谱聚类算法,从而得到聚类结果。
子空间结构化范数l1是在[13]中提出的,通过在谱聚类过程中利用相关信息,帮助自表达模型产生更好的邻接矩阵。
本发明还涉及子空间结构化范数l1。给定表示矩阵Z,可以计算出邻接矩阵A。对数据聚类就是找出分割矩阵Q,满足
Figure RE-GDA0002595155660000052
其中q(i)andq(j)分别是矩阵Q的第i行和第j行。很显然,表示矩阵Z和分割矩阵Q都是用来保存数据的分割信息。使用表示矩阵Z关于Q的子空间结构范数
Figure RE-GDA0002595155660000053
来量化矩阵 Z和Q之间的相互作用。
将Z的子空间结构化范数l1定义为:
Figure RE-GDA0002595155660000054
其中||Z||1是标准的l1范数,在SSC算法中使用过,保证矩阵的稀疏性。
子空间结构化范数l1可以看成是标准l1范数加上惩罚项,该惩罚项在点i和j不相似时使用分割矩阵Q将两点分割到不同的子空间中。
作为本发明中的步骤一构建多视图子空间聚类ISSMSC模型,具体涉及了如下方式:
给定多视图数据集X,X(v)代表第v个视图,有一系列向量组成, X(v)=[x1,x2,…,xi,…,xn]∈Rd×n,其中xi可以用字典A=[a1,a2,…,ai,…,an]中的基线性组合表示,X(v)可以表示为
X(v)=A(v)R(v) (3)
其中R(v)={r1,r2,…,ri,…,rn},ri用来表示xi
多视图子空间聚类的基本预设是同一数据实例的不同视图共享公共子空间。根据此预设,存在跨多个视图的数据点共享表示。假定不同视图X(1),X(2),…,(V)的共享表示是R,第v个视图的重构错误是
Figure RE-GDA0002595155660000061
数据集可以表示为:
Figure RE-GDA0002595155660000062
图2是数据集UCI的t-SNE可视化表示。从图2中可以看出,不同视图的数据分布并不相同。各个视图的数据中不仅包含了一致信息,也包含了互补信息。为了提高学习性能,既利用了不同视图之间的一致信息,也利用了它们间的互补信息。考虑到使用潜在信息代替原始特征来提高数据质量,在子空间聚类的自表达方法的基础上,将R表示为:
R=RZ+Ez (5)
其中Ez表示子空间表示产生的错误。
minLr(X,AR)+λ1Lz(R,RZ)++λ2Ω(Z)
s.t.X={X(1),X(2),…,X(V)},A={A(1),A(2),…,A(V)} (6)
L(·,·)和Ω(·)分别表示损失函数和正则项,λ12用来平衡这三项。
通常,基于谱聚类的算法包含两个阶段。在阶段1,构造邻接矩阵Z。在阶段2中,将K均值算法应用于L,该L通常是Z的拉普拉斯矩阵或由Z形成的归一化拉普拉斯矩阵。在阶段2,生成矩阵Q,这有助于学习Z。为了利用阶段2中的分割信息,将结构化的l1范数引入目标函数:
min||Er||2,11||Ez||2,12||Z||1,Q
s.t.X=AR+Er,R=RZ+Ez,AAT=1 and diag(Z)=0 (7)
其中||Z||1,Q是结构化的l1范数,||·||2,1是l2,1范数,用来让列向量尽可能为0。
从方程(1)中可以看出||Z||1,Q=||Z||1+α||Z||Q,其中||·||1是l1范数。由于l1范数是l0范数的逼近,l0范数能保证矩阵的稀疏性,模型得到了数据集的稀疏性表示。设Θ是子空间结构化矩阵:
Figure RE-GDA0002595155660000072
其中q(i)是矩阵Q的第i行,得到目标函数如下:
Figure RE-GDA0002595155660000073
这里⊙代表矩阵的哈达马积(Hadamard product),α用来对各项进行平衡制约。将重构误差Er和空间表示误差Ez串联起来,得到误差矩阵E。那么,最终目标函数变换为:
Figure RE-GDA0002595155660000081
作为步骤二,对目标函数进行求解和目标优化,获得子空间的数目k和维数,并将数据点分割到子空间中。
经过模型构建可知,方程(10)中的目标函数是非凸的,但可以使用ADMM算法来求解。ADMM的全称为Alternating Direction Method of Multipliers,即期望结合乘子法的弱条件的收敛性以及对偶上升法的可分解求解性。ADMM其实和乘子法很像,只是乘子法里把和放一块求解,而ADMM是分开求解,类似迭代一步的Gauss-Seidel方法。鉴于现实应用中数据的高维性,ADMM求解模型可以把一个大问题分成可分布式同时求解的多个小问题,从而有效缩小了问题的规模,即分而治之的策略。
对于方程(10)中的目标函数的获取,配置参数J来实现。
将目标函数变为:
Figure RE-GDA0002595155660000082
通过使用增强拉格朗日乘数法(ALM),上述问题等同于最小化以下问题:
Figure RE-GDA0002595155660000091
作为本发明的实施例,可以对上述进行配置,具体的,固定其他变量,通过Ak来更新 A
Figure RE-GDA0002595155660000092
给定目标函数
Figure RE-GDA0002595155660000093
最优解R=UVT,其中U和V是矩阵GTQ的SVD分解的左右奇异值。
设A是正交矩阵,根据定理1,A的最优解是(A*)T=UVT,其中U和V分别是矩阵
Figure RE-GDA0002595155660000094
的SVD分解的左右奇异值。
作为本发明的实施例,可以对上述进行配置,具体的,固定其他变量来配置R
Figure RE-GDA0002595155660000101
对R求导,并将导数设为0,得到:
Figure RE-GDA0002595155660000102
这是个标准的西尔维斯特方程,可以使用Bartels-Stewart算法求解。
作为本发明的实施例,可以对上述进行配置,具体的,通过固定其他变量可以配置Z。
Figure RE-GDA0002595155660000103
将Z的导数设为零,得到
Figure RE-GDA0002595155660000104
作为本发明的实施例,可以对上述进行配置,具体的,固定其他变量来配置J
Figure RE-GDA0002595155660000105
通过将J的导数设为0,得到
Figure RE-GDA0002595155660000111
其中S是软阈值操作符。
作为本发明的实施例,可以对上述进行配置,具体的,固定其他变量来配置E
Figure RE-GDA0002595155660000112
M是将矩阵
Figure RE-GDA0002595155660000113
连接起来得到的矩阵。
作为本发明的实施例,可以对上述进行配置,具体的配置乘子,乘子可以通过下列方式配置。
Figure RE-GDA0002595155660000114
Figure RE-GDA0002595155660000115
Figure RE-GDA0002595155660000116
上述模型的求解与优化过程可描述为以下算法:
Figure RE-GDA0002595155660000121
本发明提出的ISSMSC模型的复杂性主要包括6个子问题。更新A的复杂度为 O(k2d+k3),,其中k和d分别是共享表示的维度和多视图所有特征的维度。更新R的复杂度为O(n3+dn2+kn2+dk2),,其中n是数据的样本数。更新Z的复杂度为O(n3+n2k)。更新J的复杂度为O(n3)。更新E的复杂度为O(n)。更新乘子的复杂度为O(kn2+knd)。每次迭代的总复杂度为O(n3+dn2+kn2+dk2+n+k2d+k3)。由于n<<d,所以总复杂度约为O(n3+dn2+k3)。
本发明提出的方法在各种数据集上进行了实验,包括两个图像聚类数据集、两个面部聚类数据集、一个手写数字聚类数据集、一个文档聚类数据集和一个多模态数据集。对于人脸聚类,使用了两个基准数据集yale和ORL。对于图像聚类,使用了msrv和landuse 数据集。对于手写数字聚类,选择了UCI。并且还把BBCSport用作文档聚类数据集,将 Xmedia用作多模态数据集。
对于本发明实验数据集的描述方式为:
(1)Yale由15个人的165张灰度图像组成。每个人有11张图像,在每张图像中都有着不同的面部表情或配饰。该数据集使用了三个图像特征,即强度值,LBP值和Gabor 值。
(2)ORL由40个人的400张人脸图像组成。每个人都有10张不同的图像,这些图像的拍摄时间、光线和面部表情各不相同。提取三种类型的特征即强度值、LBP值和Gabor 值来构造不同的视图属性。
(3)UCI handwritten Digit set包含2000个手写数字示例(0-9)。每个数字有200个具有6个特征的样本。76个表示字符形状的傅立叶系数,216个表示轮廓相关性的系数和64个Karhunen-Love系数
(4)BBCSport包含来自BBC Sport网站的体育新闻文件。有两个视图,这些文档属于5个主题领域。
(5)MSRV1包含240个图像和9个类别。选择了7个类别的图像,分别是树木、建筑物、飞机、牛、脸、汽车和自行车。从每个图像中提取6种类型的特征来构造视图特征。这6种特征分别是:CENT、CMT、Gist、HOG、LBP、SIFT。
(6)LandUse-21包含来自21个类别的2100个卫星图像。每个类别有100张图片。使用了三种图像特征:Gist、PHOG和LBP。
(7)Xmedia是一个多模态数据集,包含5000个文本、5000个图像、500个视频、 1000个音频剪辑和500个3D模型。
表格2数据集的统计特性
Figure RE-GDA0002595155660000141
数据集的统计特征如表2所示,包括实例数、数据维数以及视图和聚类数。
本发明的评估指标包括:
使用六个主流的指标来评估性能:标准化互信息(NMI)、准确性(ACC)、F得分(F)、兰德指数(RI)、精度(P)和召回率(R)。在这些指标中,ACC和NMI是使用最广的指标。兰德指数、F分数、精度和召回率也被广泛使用。这些度量标准的值表示聚类的质量:值越高,效果越好。
对参数的敏感性分析为,本方法中有两个超参数,即λ和α。在[0.0010.010.1110100 1000]中改变λ和α值,进行五次灵敏度测试,记录NMI、ACC、F、RI、P和R的平均数。结果表明,参数的变化对性能影响很小。从图3可以看出,本方法的性能稳定且突出。
对本发明涉及的面向数据融合的迭代结构化多视图子空间聚类方法进行可视化评估,具体的,对聚类结果进行了可视化,进一步验证本方法的优势。图4由左到右分别显示了 t分布随机邻域嵌入(t-SNE)的学习共享表示。不同的颜色代表不同的类别。相同颜色的点越近,可分离性就越好。显然,图中相同颜色的点非常接近,这说明共享表示矩阵的可分离性非常好,即学习到的表示矩阵适合于将相似的数据样本分配到相同的簇中。
将本方法与以下6种方法进行比较。前两个是单视图方法,其他是多视图方法。
(1)SC——Ng A Y,Jordan M I,Weiss Y.On spectral clustering:Advances inneural information processing systems.:选择了信息量最大的视图来执行传统的谱聚类算法。
(2)SSC——Elhamifar E,Vidal R.Sparse subspace clustering:Algorithm,theory,and applications.IEEE transactions on pattern analysis and machineintelligence:对所有的视图进行了实验,选择了结果最好的视图。
(3)Min-Disagreement——De Sa V R.Spectral clustering with twoviews.In:ICML workshop on learning with multiple views:基于最小化分歧,该方法创建了二部图并使用谱聚类获得了最终结果。
(4)Co-regularized——Kumar A,Rai P,Daume H.Co-regularized multi-viewspectral clustering.In:Advances in neural information processing systems:通过使用共同正则化的假设,可以使同一聚类中具有不同视图的相同数据具有相同的优化功能。
(5)LMSC——Zhang C,Hu Q,Fu H,et al.Latent Multi-view SubspaceClustering.In: Proceedings of the IEEE Conference on Computer Vision&PatternRecognition:该方法利用不同视图间的潜在互补信息实现数据重构。
(6)DimSC——Cao X,Zhang C,Fu H,et al.Diversity-induced multi-viewsubspace clustering.In:Proceedings of the IEEE conference on computer visionand pattern recognition:该方法使用希尔伯特·施密特(Hilbert Schmidt) 独立标准作为多样性项,以增强多视图表示的互补性。
将所有参数调整为最佳后,每种方法运行30次,计算平均值和标准偏差。本方法有两个超参数:λ和α。将它们依次设为[0.001 0.01 0.1 1 10 100 1000]集合中的一个值,并在每个数据集上找出最佳的参数。
本发明涉及的面向数据融合的迭代结构化多视图子空间聚类方法在七个公开的基准数据集上进行了实验,包括两个人脸聚类数据集、两个图像聚类数据集、一个手写数字聚类数据集,一个文档聚类数据集和一个多模态数据集。对于人脸聚类,在两个基准数据集Yale和ORL上进行了评估。使用了三个特征:强度值,LBP和Gabor。聚类结果如表3 和表4所示。对于图像聚类,选择了Landuse和MSRV进行评估,结果如表5和表6所示。在手写数字数据集UCI上评估了算法,结果显示在表7中。对于文档聚类,使用BBC数据集,结果在表8中显示。我们还将方法应用到Xmedia数据集上,该数据集是由文本、图像、视频、音频剪辑和3D模型组成的多模态数据集。数据集中有20个类别,每个媒体实例都有类别标签。在每种模态下,在每个类别中随机选择10个实例形成了一个视图。因此,数据集中有五个视图,分别是音频剪辑、3D模型、图像、文本、视频。结果如表9 所示。这些表中的前两个结果以粗体显示。
从结果分析,可以得到如下结论:首先,在不同视图之间采用补充信息的方法要比其他方法表现更好。就NMI而言,上述6种方法和本方法在前两名中出现的次数分别为0、 2、0、2、2、1和7。在这些算法中,Co-regulized、LTMS、DIMSC和本方法利用了不同视图之间的互补知识,其结果要优于其他视图。
其次,SSC和本方法在BBC数据集的结果中排名前两位。SSC和本方法的结果比其他方法要好得多。原因是BBC数据集的两个视图本身就是稀疏的。因此,稀疏表示方法 (例如SSC和本方法)更适合此数据集。
第三,本方法总体上优于其他算法。例如,就Yale数据集上的NMI,ACC,F和R 而言,本方法超出了次优6.2%,5.8%,2.3%,6.5%。在Yale、ORL、Landuse、MSRV、 UCI、BBC和Xmedia数据集结果的NMI指标方面,它分别比最差的一个高出13.8%,7%, 10.8%,6.1%,37.6%,67.8%,8.2%。
综上所述,实验证明了本方法的有效性。其优势可以归结为两个方面。1)运用不同视图之间的互补知识。当数据集中的一个视图包含在其他视图中不存在的信息时,可以通过探索潜在的共享表示来使用互补信息,从而改善性能。2)在学习邻接矩阵的过程中,将通过谱聚类获得的分割矩阵与共享表示相结合。具体而言,分割矩阵有助于获得邻接矩阵,因此可以提高性能。这两个原因使本算法优于其他最新方法。
表格3结论(平均标准差)Yale
Figure RE-GDA0002595155660000181
表格4结论(平均标准差)ORL
Figure RE-GDA0002595155660000182
表格5结论(平均标准差)Landuse
Figure RE-GDA0002595155660000183
表格6结论(平均标准差)MSRV
Figure RE-GDA0002595155660000191
表格7结论(平均标准差)UCI
Figure RE-GDA0002595155660000192
表格8结论(平均标准差)BBC
Figure RE-GDA0002595155660000193
表格9结论(平均标准差)xmedia
Figure RE-GDA0002595155660000194
为了验证本算法在学习高质量邻接图是有效的,对通过本方法获得的邻接图与其他方法进行比较。除了本算法外,SSC、LMSC和Dims这三种算法也可以生成具有对角块结构的邻接图。图5中的方块显示了邻接矩阵的可能分割情况,块的清晰度显示了潜在聚类结果的性能。Yale数据集上的邻接矩阵比较情况如图5所示。本方法的矩阵减少了不同簇之间的关系,并增强了同一簇内的关系。邻接矩阵的比较证明了本模型的优势。
本方法基于数据的自表达特性,不仅探索了各视图之间的共享信息,而且利用了各视图之间的潜在补充信息。考虑到聚类过程中产生的分割矩阵对邻接矩阵学习的影响,在学习过程中引入了结构化的l1范数。此外,还设计了一种有效的优化算法来解决该问题。在七个基准数据集中进行了实验。与最新算法相比,本算法在NMI、ACC等方面更好。
基于本发明提供的方法,本发明还提供一种实现面向数据融合的迭代结构化多视图子空间聚类方法的设备,包括:
存储器,用于存储计算机程序及面向数据融合的迭代结构化多视图子空间聚类方法;
处理器,用于执行所述计算机程序及面向数据融合的迭代结构化多视图子空间聚类方法,以实现面向数据融合的迭代结构化多视图子空间聚类方法的步骤。
本发明还提供一种具有面向数据融合的迭代结构化多视图子空间聚类方法的可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行以实现面向数据融合的迭代结构化多视图子空间聚类方法的步骤。
实现面向数据融合的迭代结构化多视图子空间聚类方法的设备是结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的实现面向数据融合的迭代结构化多视图子空间聚类方法的设备可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据实现面向数据融合的迭代结构化多视图子空间聚类方法的设备公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的索引方法。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (6)

1.一种面向数据融合的迭代结构化多视图子空间聚类方法,其特征在于,方法包括:
步骤一,构建多视图子空间聚类ISSMSC模型;
步骤二,对目标函数进行求解和目标优化,获得子空间的数目k和维数,并将数据点分割到子空间中,,实现多视图子空间聚类。
2.根据权利要求1所述的方法,其特征在于,
步骤一还包括:
给定多视图数据集X,X(v)代表第v个视图,X(v)由一系列向量组成,X(v)=[x1,x2,...,xi,...,xn]∈Rd×n,其中xi可以用字典A=[a1,a2,...,ai,...,an]中的基线性组合表示,X(v)可以表示为
X(v)=A(v)R(v) (3)
其中R(v)={r1,r2,...,ri,...,rn},ri用来表示xi
多视图子空间聚类的设置是同一数据的不同视图共享公共子空间;
根据此设置,存在跨多个视图的数据点共享表示;
设置不同视图X(1),X(2),...,X(V)的共享表示是R,第v个视图的重构错误是
Figure FDA0002443528350000011
数据集可以表示为:
Figure FDA0002443528350000012
在子空间聚类的自表达方法的基础上,将R表示为:
R=RZ+Ez (5)
其中Ez表示子空间表示产生的错误;
minLr(X,AR)+λ1Lz(R,RZ)++λ2Ω(Z)
s.t.X={X(1),X(2),...,X(V)},A={A(1),A(2),…,A(V)} (6)
L(·,·)和Ω(·)分别表示损失函数和正则项,λ1和λ2用来平衡这三项。
3.根据权利要求2所述的方法,其特征在于,
步骤一还包括:
基于谱聚类的算法包含两个阶段;
在阶段1,构造邻接矩阵Z;
在阶段2中,将K均值算法应用于L,该L通常是Z的拉普拉斯矩阵或由Z形成的归一化拉普拉斯矩阵;生成矩阵Q,将结构化的l1范数引入目标函数:
min||Er||2,11||Ez||2,12||Z||1,Q
s.t.X=AR+Er,R=RZ+Ez,AAT=1and diag(Z)=0 (7)
其中||Z||1,Q是结构化的l1范数,||·||2,1是l2,1范数,用来让列向量尽可能为0;
基于||Z||1,Q=||Z||1+α||Z||Q,其中||·||1是l1范数;
由于l1范数是l0范数的逼近,l0范数能保证矩阵的稀疏性,模型得到了数据集的稀疏性表示;
设Θ是子空间结构化矩阵:
Figure FDA0002443528350000021
其中q(i)是矩阵Q的第i行,得到目标函数如下:
min||Er||2,11||Ez||2,12(||Z||1+α||Θ⊙Z||1)
s.t.X=AR+Er,R=RZ+Ez,AAT=1and diag(Z)=0 (9)
这里⊙代表矩阵的哈达马积(Hadamard product),α用来对各项进行平衡制约;
将重构误差Er和空间表示误差Ez串联起来,得到误差矩阵E;
目标函数变换为:
min||E||2,1+λ(||Z||1+α||Θ⊙Z||1)
s.t.X=AR+Er,R=RZ+Ez,E=[Er;Ez],AAT=1and diag(Z)=0 (10)。
4.根据权利要求1或2所述的方法,其特征在于,步骤二还包括:
对方程(10)中的目标函数获取,并配置参数J;
目标函数变为:
min||E||2,1+λ(||J||1+α||Θ⊙J||1)
s.t.X=AR+Er,R=RZ+Ez,E=[Er;Ez],AAT=1,J=Z,
diag(Z)=0,diag(J)=0
(11)
通过使用增强拉格朗日乘数法(ALM)最小化得出
Figure FDA0002443528350000031
s.t.AAT=1,dia.g(Z)=0,dia.g(J)=0
(12)。
5.一种实现面向数据融合的迭代结构化多视图子空间聚类方法的设备,其特征在于,包括:
存储器,用于存储计算机程序及面向数据融合的迭代结构化多视图子空间聚类方法;
处理器,用于执行所述计算机程序及面向数据融合的迭代结构化多视图子空间聚类方法,以实现如权利要求1至4任意一项所述面向数据融合的迭代结构化多视图子空间聚类方法的步骤。
6.一种具有面向数据融合的迭代结构化多视图子空间聚类方法的可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1至4任意一项所述面向数据融合的迭代结构化多视图子空间聚类方法的步骤。
CN202010272240.2A 2020-04-09 2020-04-09 一种面向数据融合的迭代结构化多视图子空间聚类方法,设备及可读存储介质 Pending CN111611323A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010272240.2A CN111611323A (zh) 2020-04-09 2020-04-09 一种面向数据融合的迭代结构化多视图子空间聚类方法,设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010272240.2A CN111611323A (zh) 2020-04-09 2020-04-09 一种面向数据融合的迭代结构化多视图子空间聚类方法,设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN111611323A true CN111611323A (zh) 2020-09-01

Family

ID=72203658

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010272240.2A Pending CN111611323A (zh) 2020-04-09 2020-04-09 一种面向数据融合的迭代结构化多视图子空间聚类方法,设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN111611323A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112464004A (zh) * 2020-11-26 2021-03-09 大连理工大学 一种多视角深度生成图像聚类方法
CN113034537A (zh) * 2021-02-26 2021-06-25 中国科学院计算技术研究所 基于多几何模型融合的结构一致性运动分割方法和系统
CN114510518A (zh) * 2022-04-15 2022-05-17 北京快立方科技有限公司 一种海量结构化数据的自适应聚合方法、系统及电子设备
CN114936252A (zh) * 2022-04-24 2022-08-23 贵州财经大学 一种基于语义特征组的信用卡客户流失数据降维可视化分析方法
CN115131642A (zh) * 2022-08-30 2022-09-30 之江实验室 一种基于多视子空间聚类的多模态医学数据融合系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112464004A (zh) * 2020-11-26 2021-03-09 大连理工大学 一种多视角深度生成图像聚类方法
CN113034537A (zh) * 2021-02-26 2021-06-25 中国科学院计算技术研究所 基于多几何模型融合的结构一致性运动分割方法和系统
CN114510518A (zh) * 2022-04-15 2022-05-17 北京快立方科技有限公司 一种海量结构化数据的自适应聚合方法、系统及电子设备
CN114510518B (zh) * 2022-04-15 2022-07-12 北京快立方科技有限公司 一种海量结构化数据的自适应聚合方法、系统及电子设备
CN114936252A (zh) * 2022-04-24 2022-08-23 贵州财经大学 一种基于语义特征组的信用卡客户流失数据降维可视化分析方法
CN114936252B (zh) * 2022-04-24 2023-01-31 贵州财经大学 一种基于语义特征组的信用卡客户流失数据降维可视化分析方法
CN115131642A (zh) * 2022-08-30 2022-09-30 之江实验室 一种基于多视子空间聚类的多模态医学数据融合系统

Similar Documents

Publication Publication Date Title
Wang et al. Multi-view subspace clustering with intactness-aware similarity
Huang et al. Robust multi-view data clustering with multi-view capped-norm k-means
Yin et al. Incomplete multi-view clustering via subspace learning
CN111611323A (zh) 一种面向数据融合的迭代结构化多视图子空间聚类方法,设备及可读存储介质
Zeng et al. A unified collaborative multikernel fuzzy clustering for multiview data
Bekkerman et al. Multi-modal clustering for multimedia collections
Zhang et al. Unsupervised and semi-supervised image classification with weak semantic consistency
Qian et al. Unsupervised feature selection for multi-view clustering on text-image web news data
CN110222213B (zh) 一种基于异构张量分解的图像分类方法
Cai et al. Semi-supervised multi-view clustering based on orthonormality-constrained nonnegative matrix factorization
Chen et al. Sparse latent semantic analysis
Yu et al. Fine-grained similarity fusion for multi-view spectral clustering
Böhm et al. Robust information-theoretic clustering
Deng et al. Large-scale multi-task image labeling with adaptive relevance discovery and feature hashing
Chen et al. LABIN: Balanced min cut for large-scale data
Tong et al. A deep discriminative and robust nonnegative matrix factorization network method with soft label constraint
Wang et al. Region-aware hierarchical latent feature representation learning-guided clustering for hyperspectral band selection
Ma et al. Simultaneous multi-graph learning and clustering for multiview data
CN110175631A (zh) 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法
Cai et al. Semantic-enhanced image clustering
Pavithra et al. An efficient seed points selection approach in dominant color descriptors (DCD)
Lopes et al. Non-negative matrix factorization (NMF)
CN109614581B (zh) 基于对偶局部学习的非负矩阵分解聚类方法
Pi et al. A dual reformulation and solution framework for regularized convex clustering problems
Li et al. Non-reference image quality assessment based on deep clustering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200901

RJ01 Rejection of invention patent application after publication