CN115631361A - 一种融合低秩核学习和自适应超图的图像聚类方法 - Google Patents

一种融合低秩核学习和自适应超图的图像聚类方法 Download PDF

Info

Publication number
CN115631361A
CN115631361A CN202211249403.0A CN202211249403A CN115631361A CN 115631361 A CN115631361 A CN 115631361A CN 202211249403 A CN202211249403 A CN 202211249403A CN 115631361 A CN115631361 A CN 115631361A
Authority
CN
China
Prior art keywords
matrix
kernel
hypergraph
adaptive
rank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211249403.0A
Other languages
English (en)
Inventor
杜宇慧
牛菊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanxi University
Original Assignee
Shanxi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanxi University filed Critical Shanxi University
Priority to CN202211249403.0A priority Critical patent/CN115631361A/zh
Publication of CN115631361A publication Critical patent/CN115631361A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及图像聚类领域,公开了一种融合低秩核学习和自适应超图的图像聚类方法,该方法包括如下步骤:S1,获取图像数据;S2,通过低秩共识核学习、核空间下图像数据自表达和自适应超图正则化,迭代地构建超图和更新超图拉普拉斯矩阵、系数矩阵、共识核矩阵和候选核权重,直到达到收敛条件;S3,应用所述S2步骤得到的系数矩阵构造相似度矩阵;S4,应用所述S3步骤得到的相似度矩阵,调用谱聚类算法,得到聚类结果。本发明方法集成自适应超图正则化、核空间下数据自表达和低秩核学习到一个框架中,实现了三者的交替指导和动态提升,优化地利用了不同候选核下的样本关联性,挖掘了更稳定的高阶关系,从而更深层次地挖掘数据的内在结构。

Description

一种融合低秩核学习和自适应超图的图像聚类方法
技术领域
本发明涉及一种融合低秩核学习和自适应超图的图像聚类方法,可用于模式识别中的图像聚类领域。
背景技术
图像数据的聚类分析具有广泛的研究和应用前景。在计算机视觉和模式识别领域,图像是一种最普遍的视觉信息呈现。图像数据通常是高维和非线性可分的,表现为包含大量冗余特征、分布更稀疏和包含至少一个具有非凸形状边界的簇。数据聚类作为一种基本的数据处理技术日益成熟,为解决图像数据的聚类问题提供了方法依据。谱聚类方法具有检测数据的复杂结构和处理非线性可分数据的能力,适用于图像数据的聚类。
度量数据对象之间的相似性对于谱聚类至关重要。谱聚类通过将数据对象和成对数据对象之间的相似度分别视为图的顶点和连接两个顶点的边的权重,将聚类问题转化为图划分问题。根据不同的度量相似度的方式,谱聚类方法主要分为基于距离的方法和基于表示的方法。基于距离的方法很难揭示非线性流形中数据对象之间的内在相似性和反映真实分布信息,对数据中的噪声损伤很敏感。基于表示的方法通过数据的自表达自动有效地度量数据对象之间的关系以提高聚类性能,引起了人们的极大关注。
但是,在处理复杂的真实世界的图像数据时,由于相关的基于表示的谱聚类方法的自表达属性不能够有效地保证空间近邻的数据对象在潜在的系数空间中也有相似表示,因此,它挖掘数据内在结构的能力有限。
发明内容
为了克服已有的聚类方法挖掘图像数据对象之间相似性关系的局限和聚类性能的不足,本发明提供了一种融合低秩核学习和自适应超图的图像聚类方法,通过在迭代过程中交替优化和求解,能够实现低秩共识核学习、核空间下数据自表达和自适应超图正则化三者的交替指导和动态提升,更深层次地挖掘数据对象之间的内在相似性关系,并用于非线性可分数据的聚类任务。其中,本发明提出的自适应超图,即自适应地融合候选核的近邻核来动态地构建概率超图,优化地利用了不同候选核下的样本关联性,挖掘了更稳定的高阶关系。
为了达到上述目的,本发明采用了下列技术方案:
一种融合低秩核学习和自适应超图的图像聚类方法,该方法包括如下步骤:
S1,获取图像数据;
S2,通过低秩共识核学习、核空间下图像数据自表达和自适应超图正则化,迭代地构建超图和更新超图拉普拉斯矩阵、系数矩阵、共识核矩阵和候选核权重,直到达到收敛条件;
S3,应用所述S2步骤得到的系数矩阵构造相似度矩阵;
S4,应用所述S3步骤得到的相似度矩阵,调用谱聚类算法,得到聚类结果。
优选地,在所述S1步骤中,假设图像数据为
Figure BDA0003887334400000021
n表示有n个数据对象,d表示数据对象的特征维度,将X中的每个数据对象看作一个顶点,顶点集为V={v1,v2,…,vn}。
优选地,所述步骤S2的具体过程为:公式(1)所示模型能直接从图像数据中学得系数矩阵、共识核矩阵、候选核权重,模型如下:
Figure BDA0003887334400000031
Figure BDA0003887334400000032
其中,第一项是核空间下数据自表达约束项,第二项是系数矩阵的稀疏或低秩正则项,第三项是共识核学习约束项,第四项是共识核的低秩正则项,第五项是自适应超图正则项;
给定m个候选核矩阵,
Figure BDA0003887334400000033
是第r个候选核矩阵,
Figure BDA0003887334400000034
表示第r个候选核矩阵中第i行第j列的元素,
Figure BDA0003887334400000035
是系数矩阵,
Figure BDA0003887334400000036
是共识核矩阵,
Figure BDA0003887334400000037
是候选核权重向量,gr是第r个候选核对应的权重,φ(X)表示未知的核映射函数,K=φ(X)Tφ(X),‖·‖F是Frobenius范数,第一项
Figure BDA0003887334400000038
Figure BDA0003887334400000039
可转化为
Figure BDA00038873344000000310
ρ(Z)为‖Z‖1或‖Z‖*,‖·‖1和‖·‖*分别是l1范数和核范数,
Figure BDA00038873344000000311
是标准化的超图拉普拉斯矩阵,α、β、γ和δ是惩罚参数;
采用交替方向乘子法求解公式(1)中Z,K,g,步骤如下:首先在公式(1)中分离变量,引入变量
Figure BDA00038873344000000312
Figure BDA00038873344000000313
并添加相应的约束;然后重写公式(1)对应的增广拉格朗日函数:
Figure BDA00038873344000000314
其中,μ是惩罚参数,
Figure BDA00038873344000000315
Figure BDA00038873344000000316
是拉格朗日乘子;最后,为了获得最小化增广拉格朗日函数(2)的最优解Z*,K*,g*,迭代更新Z,K,g,LsymH也随g自适应变化,并利用可行性误差更新拉格朗日乘子,当满足收敛条件时,迭代停止。
进一步地,所述迭代的具体过程为:设最大迭代次数为T,第t(0≤t≤T)次迭代的优化变量和拉格朗日乘子分别为{Z(t),K(t),g(t),LsymH (t),J(t),W(t)}和{Y1 (t),Y2 (t)},初始化g(0)=1,初始化Z(0)和J(0)为单位矩阵,初始化K(0),W(0)
Figure BDA0003887334400000041
Y1 (0)和Y1 (0)为零矩阵,从{1e-5,1e-3,0.1,10,1e3,1e5}范围中初始化μ(0),参数的具体迭代过程如下:
S21,固定g(t),更新LsymH (t+1)的过程如下:
加权融合候选核的近邻核:
Figure BDA0003887334400000042
Figure BDA0003887334400000043
其中,Hr(i,j)表示第r个候选核的近邻核矩阵Hr中第i行第j列的元素,Nk(i)表示数据对象i的k个近邻集合,G为加权融合后的矩阵;
构建超图,超图
Figure BDA0003887334400000044
包含顶点集V={v1,v2,…,vn}和超边集ε={e1,ej,…,en},通过关联矩阵H(t)和超边权重矩阵W(t)刻画:
Figure BDA0003887334400000045
Figure BDA0003887334400000046
其中,H(vi,ej)是关联矩阵H中第i行第j列的元素,表示顶点vi与超边ej之间的相似度,超边权重矩阵W是一个对角矩阵,w(ej)是W中第j行第j列的元素,表示超边ej的权重,Gij表示矩阵G中第i行第j列的元素,
Figure BDA0003887334400000047
Figure BDA0003887334400000048
是矩阵
Figure BDA0003887334400000049
中第i行第j列的元素;
更新LsymH (t+1)
Figure BDA0003887334400000051
其中,De和Dv分别为包含所有超边的度和包含所有顶点的度的对角矩阵,超边ej的度
Figure BDA0003887334400000052
顶点vi的度
Figure BDA0003887334400000053
S22,固定LsymH (t+1),K(t),J(t),Y1 (t)和μ(t),更新Z(t+1)
Z(t+1)=(K(t)(t)I+2δLsymH (t+1))-1(K(t)(t)J(t)+Y1 (t)),#(8)
令Z(t+1)中小于0的元素为0:
Z(t+1)=max(Z(t+1),0),#(9)
S23,固定Z(t+1),g(t),W(t),μ(t)和Y2 (t),更新K(t+1)
Figure BDA0003887334400000054
令K(t+1)中小于0的元素为0:
K(t+1)=max(K(t+1),0),#(11)
S24,固定Z(t+1),μ(t)和Y1 (t),更新J(t+1)
若ρ(J)=‖J‖1,则:
Figure BDA0003887334400000055
若ρ(J)=‖J‖*,则:
Figure BDA0003887334400000056
其中,
Figure BDA0003887334400000057
Cij是矩阵C中第i行第j列的元素,U(t)、V(t)和σ(t)分别是对应于C(t)的奇异值分解的左奇异向量、右奇异向量和奇异值;
令J(t+1)中小于0的元素为0:
J(t+1)=max(J(t+1),0),#(14)
S25,固定K(t+1),μ(t)和Y2 (t),更新W(t+1)
Figure BDA0003887334400000061
其中,
Figure BDA0003887334400000062
Figure BDA0003887334400000063
Figure BDA0003887334400000064
分别是对应于D(t)的奇异值分解的左奇异向量、右奇异向量和奇异值;
令W(t+1)中小于0的元素为0:
W(t+1)=max(W(t+1),0),#(16)
S26,固定K(t+1),更新g(t+1)
求解g(t+1)的优化问题变为求解一个带有线性约束的二次规划问题,可利用存在的MATLAB函数quadprog求解;
S27,更新拉格朗日乘子Y1 (t+1),Y2 (t+1)和μ(t+1)
Y1 (t+1)=Y1 (t)(t)(J-Z),#(17)
Y2 (t+1)=Y2 (t)(t)(W-K),#(18)
μ(t+1)=min(μmax,τμ(t)),#(19)
其中,τ根据经验调整,μmax是μ被允许的最大值;
S28,判断是否达到迭代停止条件,迭代停止条件为:
Figure BDA0003887334400000065
其中,ε为阈值,若达到迭代停止条件,则得到最终的Z*,K*,g*,否则继续执行S21-S28。
优选地,在所述S3步骤中,应用所述S2步骤得到的系数矩阵构造相似度矩阵为:
S=|Z|+|Z|T.#(21)
优选地,所述S4步骤具体为:把相似度矩阵作为谱聚类算法的输入,调用谱聚类算法,得到聚类结果。
与现有技术相比本发明具有以下优点:
本发明的方法不同于已有的基于表示的谱聚类方法,本方法融合低秩核学习和自适应超图获得相似度矩阵从而进行谱聚类,其特色和创新主要在于:1)本发明提出集成自适应超图正则化、数据自表达和低秩核学习到一个统一的目标函数中,交替优化和求解,实现了三者的交替指导和动态提升,可更深层次地挖掘数据的内在相似性关系,并用于非线性可分数据的聚类任务;2)本发明提出自适应地融合候选核的近邻核来动态地构建概率超图,优化地利用了不同候选核下的样本关联性,挖掘了更稳定的高阶关系;3)与传统的基于表示的谱聚类方法和基于核的谱聚类方法相比,本发明更能有效地挖掘非线性可分数据之间的内在相似性关系,提升聚类性能。
附图说明
图1是使用本发明方法对图像数据进行聚类的工作流程图。
具体实施方式
本发明的目的、优点和特点,将通过下面优选实施例的非限制性说明进行图示和解释。这些实施例仅是应用本发明技术方案的典型范例,凡采取等同替换或者等效变换而形成的技术方案,均落在本发明要求保护的范围之内。
本发明揭示了一种融合低秩核学习和自适应超图的图像聚类方法,如图1所示,该方法包括如下步骤:
S1,获取图像数据;假设图像数据为
Figure BDA0003887334400000071
n表示有n个数据对象,d表示数据对象的特征维度,将X中的每个数据对象看作一个顶点,顶点集为V={v1,v2,…,vn};
S2,通过低秩共识核学习、核空间下图像数据自表达和自适应超图正则化,迭代地构建超图和更新超图拉普拉斯矩阵、系数矩阵、共识核矩阵和候选核权重,直到达到收敛条件;具体过程为:
公式(1)所示模型能直接从图像数据中学得系数矩阵、共识核矩阵、候选核权重,模型如下:
Figure BDA0003887334400000081
Figure BDA0003887334400000082
其中,第一项是核空间下数据自表达约束项,第二项是系数矩阵的稀疏或低秩正则项,第三项是共识核学习约束项,第四项是共识核的低秩正则项,第五项是自适应超图正则项;
给定m个候选核矩阵,
Figure BDA0003887334400000083
是第r个候选核矩阵,
Figure BDA0003887334400000084
表示第r个候选核矩阵中第i行第j列的元素,
Figure BDA0003887334400000085
是系数矩阵,
Figure BDA0003887334400000086
是共识核矩阵,
Figure BDA0003887334400000087
是候选核权重向量,gr是第r个候选核对应的权重,φ(X)表示未知的核映射函数,K=φ(X)Tφ(X),‖·‖F是Frobenius范数,第一项
Figure BDA0003887334400000088
Figure BDA0003887334400000089
可转化为
Figure BDA00038873344000000810
ρ(Z)为‖Z‖1或‖Z‖*,‖·‖1和‖·‖*分别是l1范数和核范数,
Figure BDA00038873344000000811
是标准化的超图拉普拉斯矩阵,α、β、γ和δ是惩罚参数;
采用交替方向乘子法求解公式(1)中Z,K,g,步骤如下:首先在公式(1)中分离变量,引入变量
Figure BDA00038873344000000812
Figure BDA00038873344000000813
并添加相应的约束;然后重写公式(1)对应的增广拉格朗日函数:
Figure BDA0003887334400000091
其中,μ是惩罚参数,
Figure BDA0003887334400000092
Figure BDA0003887334400000093
是拉格朗日乘子;最后,为了获得最小化增广拉格朗日函数(2)的最优解Z*,K*,g*,迭代更新Z,K,g,LsymH也随g自适应变化,并利用可行性误差更新拉格朗日乘子,当满足收敛条件时,迭代停止。
进一步地,所述迭代的具体过程为:设最大迭代次数为T,第t(0≤t≤T)次迭代的优化变量和拉格朗日乘子分别为{Z(t),K(t),g(t),LsymH (t),J(t),W(t)}和{Y1 (t),Y2 (t)},初始化g(0)=1,初始化Z(0)和J(0)为单位矩阵,初始化K(0),W(0)
Figure BDA0003887334400000094
Y1 (0)和Y1 (0)为零矩阵,从{1e-5,1e-3,0.1,10,1e3,1e5}范围中初始化μ(0),参数的具体迭代过程如下:
S21,固定g(t),更新LsymH (t+1)的过程如下:
加权融合候选核的近邻核:
Figure BDA0003887334400000095
Figure BDA0003887334400000096
其中,Hr(i,j)表示第r个候选核的近邻核矩阵Hr中第i行第j列的元素,Nk(i)表示数据对象i的k个近邻集合,G为加权融合后的矩阵;
构建超图,超图
Figure BDA0003887334400000097
包含顶点集V={v1,v2,…,vn}和超边集ε={e1,ej,…,en},通过关联矩阵H(t)和超边权重矩阵W(t)刻画:
Figure BDA0003887334400000101
Figure BDA0003887334400000102
其中,H(vi,ej)是关联矩阵H中第i行第j列的元素,表示顶点vi与超边ej之间的相似度,超边权重矩阵W是一个对角矩阵,w(ej)是W中第j行第j列的元素,表示超边ej的权重,Gij表示矩阵G中第i行第j列的元素,
Figure BDA0003887334400000103
Figure BDA0003887334400000104
是矩阵
Figure BDA0003887334400000105
中第i行第j列的元素;
更新LsymH (t+1)
Figure BDA0003887334400000106
其中,De和Dv分别为包含所有超边的度和包含所有顶点的度的对角矩阵,超边ej的度
Figure BDA0003887334400000107
顶点vi的度
Figure BDA0003887334400000108
S22,固定LsymH (t+1),K(t),J(t),Y1 (t)和μ(t),更新Z(t+1)
Z(t+1)=(K(t)(t)I+2δLsymH (t+1))-1(K(t)(t)J(t)+Y1 (t)),#(8)
令Z(t+1)中小于0的元素为0:
Z(t+1)=max(Z(t+1),0),#(9)
S23,固定Z(t+1),g(t),W(t),μ(t)和Y2 (t),更新K(t+1)
Figure BDA0003887334400000109
令K(t+1)中小于0的元素为0:
K(t+1)=max(K(t+1),0),#(11)
S24,固定Z(t+1),μ(t)和Y1 (t),更新J(t+1)
若ρ(J)=‖J‖1,则:
Figure BDA0003887334400000111
若ρ(J)=‖J‖*,则:
Figure BDA0003887334400000112
其中,
Figure BDA0003887334400000113
Cij是矩阵C中第i行第j列的元素,U(t)、V(t)和σ(t)分别是对应于C(t)的奇异值分解的左奇异向量、右奇异向量和奇异值;
令J(t+1)中小于0的元素为0:
J(t+1)=max(J(t+1),0),#(14)
S25,固定K(t+1),μ(t)和Y2 (t),更新W(t+1)
Figure BDA0003887334400000114
其中,
Figure BDA0003887334400000115
Figure BDA0003887334400000116
Figure BDA0003887334400000117
分别是对应于D(t)的奇异值分解的左奇异向量、右奇异向量和奇异值;
令W(t+1)中小于0的元素为0:
W(t+1)=max(W(t+1),0),#(16)
S26,固定K(t+1),更新g(t+1)
求解g(t+1)的优化问题变为求解一个带有线性约束的二次规划问题,可利用存在的MATLAB函数quadprog求解;
S27,更新拉格朗日乘子Y1 (t+1),Y2 (t+1)和μ(t+1)
Y1 (t+1)=Y1 (t)(t)(J-Z),#(17)
Y2 (t+1)=Y2 (t)(t)(W-K),#(18)
μ(t+1)=min(μmax,τμ(t)),#(19)
其中,τ根据经验调整,μmax是μ被允许的最大值;
S28,判断是否达到迭代停止条件,迭代停止条件为:
Figure BDA0003887334400000121
其中,ε为阈值,若达到迭代停止条件,则得到最终的Z*,K*,g*,否则继续执行S21-S28。
S3,应用所述S2步骤得到的系数矩阵构造相似度矩阵:
S=|Z|+|Z|T.#(21)
S4,应用所述步骤S3得到的相似度矩阵,把相似度矩阵作为谱聚类算法的输入,调用谱聚类算法,得到聚类结果。
性能对比:
将本发明的一种融合低秩核学习和自适应超图的图像聚类方法在JAFFE人脸图像数据集和COIL20目标图像数据集上进行实验,使用聚类评估指标评估本发明的方法和对比聚类方法的聚类性能,进行对比分析。
具体地,JAFFE数据集包含213张照片,为10名日本女性在实验环境下根据指示分别做出七种表情(包括悲伤、快乐、生气、厌恶、惊讶、恐惧和中性),并由照相机拍摄人脸表情,每种表情大概有3或4张样片。COIL20数据集包含1440张图片,为20个物体被从不同角度拍摄(每隔5度拍摄一张图片),每个物体有72张图片。实验用的JAFFE数据集和COIL20数据集的特征维度分别为676和1024。
在相同的实验设置下,选取了8个相关的具有代表性的聚类方法作为对比方法(K-means、Normalized cut(Ncut)、Sparse Subspace Clustering(SSC)、Least SquaresRegression(LSR)、Low-Rank Representation(LRR)、Single Kernel-based LearningMethod(SKLM)、Multiple Kernel-based Learning Method(MKLM)和Low-rank KernelLearning for Graph Matrix(LKG)),与本发明的方法Joint Low-rank Consensus KernelLearning and Adaptive Probabilistic Hypergraph Regularization for SpectralClustering(LKHR)进行对比实验,LKGs和LKGr分别代表ρ(Z)=‖Z‖1和ρ(Z)=‖Z‖*情况下的LKG方法,LKHRs和LKHRr分别代表ρ(Z)=‖Z‖1和ρ(Z)=‖Z‖*情况下的LKHR方法。
使用两个被广泛使用的聚类评估指标Accuracy(ACC)和Normalized MutualInformation(NMI)来度量算法的性能,表中的每个方法对应的聚类评估指标数值为100次聚类的平均值,表中的SKLM方法对应的聚类评估指标数值为多个单核(线性核、多项式核和高斯核)下的平均值(最大值,最小值)。
实验结果如下:
表一:JAFFE数据集上各种方法的实验结果
Figure BDA0003887334400000131
Figure BDA0003887334400000141
表二:COIL20数据集上各种方法的实验结果
方法 ACC NMI
K-means 0.65 0.76
Ncut 0.85 0.91
SSC 0.72 0.86
LSR 0.68 0.77
LRR 0.66 0.78
SKLM 0.75(0.9,0.66) 0.84(0.94,0.76)
MKLM 0.74 0.82
LKGs 0.78 0.91
LKGr 0.79 0.85
LKHRs 0.92 0.96
LKHRr 0.92 0.96
本发明提出集成自适应超图正则化、数据自表达和低秩核学习到一个统一的目标函数中,交替优化和求解,实现了三者的交替指导和动态提升,更深层次地挖掘数据的内在相似性关系,并用于非线性可分数据的聚类任务。并且,本发明提出自适应地融合候选核的近邻核来动态地构建概率超图,优化地利用了不同候选核下的样本关联性,挖掘了更稳定的高阶关系。实验中使用聚类指标Accuracy(ACC)和Normalized Mutual Information(NMI)来度量算法的聚类性能。表一和表二的结果显示了本发明提出的方法的聚类性能优于其他对比的聚类方法,表明本发明方法可以显著提高图像数据的聚类性能。
本发明尚有多种实施方式,凡采用等同变换或者等效变换而形成的所有技术方案,均落在本发明的保护范围之内。

Claims (6)

1.一种融合低秩核学习和自适应超图的图像聚类方法,其特征在于:所述方法包括如下步骤:
S1,获取图像数据;
S2,通过低秩共识核学习、核空间下图像数据自表达和自适应超图正则化,迭代地构建超图和更新超图拉普拉斯矩阵、系数矩阵、共识核矩阵和候选核权重,直到达到收敛条件;
S3,应用所述S2步骤得到的系数矩阵构造相似度矩阵;
S4,应用所述S3步骤得到的相似度矩阵,调用谱聚类算法,得到聚类结果。
2.根据权利要求1所述的一种融合低秩核学习和自适应超图的图像聚类方法,其特征在于:在所述S1步骤中,假设图像数据为
Figure FDA0003887334390000011
n表示有n个数据对象,d表示数据对象的特征维度,将X中的每个数据对象看作一个顶点,顶点集为V={v1,v2,…,vn}。
3.根据权利要求1所述的一种融合低秩核学习和自适应超图的图像聚类方法,其特征在于,所述步骤S2的具体过程为:
公式(1)所示模型能直接从图像数据中学得系数矩阵、共识核矩阵、候选核权重,模型如下:
Figure FDA0003887334390000012
Figure FDA0003887334390000013
其中,第一项是核空间下数据自表达约束项,第二项是系数矩阵的稀疏或低秩正则项,第三项是共识核学习约束项,第四项是共识核的低秩正则项,第五项是自适应超图正则项;
给定m个候选核矩阵,
Figure FDA0003887334390000021
是第r个候选核矩阵,
Figure FDA0003887334390000022
表示第r个候选核矩阵中第i行第j列的元素,
Figure FDA0003887334390000023
是系数矩阵,
Figure FDA0003887334390000024
是共识核矩阵,
Figure FDA0003887334390000025
是候选核权重向量,gr是第r个候选核对应的权重,φ(X)表示未知的核映射函数,K=φ(X)Tφ(X),‖·‖F是Frobenius范数,第一项
Figure FDA0003887334390000026
Figure FDA0003887334390000027
可转化为
Figure FDA0003887334390000028
ρ(Z)为‖Z‖1或‖Z‖*,‖·‖1和‖·‖*分别是l1范数和核范数,
Figure FDA0003887334390000029
是标准化的超图拉普拉斯矩阵,α、β、γ和δ是惩罚参数;
采用交替方向乘子法求解公式(1)中Z,K,g,步骤如下:首先,在公式(1)中分离变量,引入变量
Figure FDA00038873343900000210
Figure FDA00038873343900000211
并添加相应的约束;然后,重写公式(1)对应的增广拉格朗日函数:
Figure FDA00038873343900000212
其中,μ是惩罚参数,
Figure FDA00038873343900000213
Figure FDA00038873343900000214
是拉格朗日乘子;最后,为了获得最小化增广拉格朗日函数(2)的最优解Z*,K*,g*,迭代更新Z,K,g,LsymH也随g自适应变化,并利用可行性误差更新拉格朗日乘子,当满足收敛条件时,迭代停止。
4.根据权利要求3所述的一种融合低秩核学习和自适应超图的图像聚类方法,其特征在于,所述S3步骤中,应用所述S2步骤得到的系数矩阵构造相似度矩阵为:
S=|Z|+|Z|T.#(3)。
5.根据权利要求3所述的一种融合低秩核学习和自适应超图的图像聚类方法,其特征在于,所述迭代的具体过程为:设最大迭代次数为T,第t(0≤t≤T)次迭代的优化变量和拉格朗日乘子分别为{Z(t),K(t),g(t),LsymH (t),J(t),W(t)}和{Y1 (t),Y2 (t)},初始化g(0)=1,初始化Z(0)和J(0)为单位矩阵,初始化K(0),W(0)
Figure FDA00038873343900000312
Y1 (0)和Y1 (0)为零矩阵,从{1e-5,1e-3,0.1,10,1e3,1e5}范围中初始化μ(0),参数的具体迭代过程如下:
S21,固定g(t),更新LsymH (t+1)的过程如下:
加权融合候选核的近邻核:
Figure FDA0003887334390000031
Figure FDA0003887334390000032
其中,Hr(i,j)表示第r个候选核的近邻核矩阵Hr中第i行第j列的元素,Nk(i)表示数据对象i的k个近邻集合,G为加权融合后的矩阵;
构建超图,超图
Figure FDA0003887334390000033
包含顶点集V={v1,v2,…,vn}和超边集
Figure FDA0003887334390000034
Figure FDA0003887334390000035
通过关联矩阵H(t)和超边权重矩阵W(t)刻画:
Figure FDA0003887334390000036
Figure FDA0003887334390000037
其中,H(vi,ej)是关联矩阵H中第i行第j列的元素,表示顶点vi与超边ej之间的相似度,超边权重矩阵W是一个对角矩阵,w(ej)是W中第j行第j列的元素,表示超边ej的权重,Gij表示矩阵G中第i行第j列的元素,
Figure FDA0003887334390000038
Figure FDA0003887334390000039
是矩阵
Figure FDA00038873343900000310
中第
Figure FDA00038873343900000313
行第
Figure FDA00038873343900000314
列的元素;
更新LsymH (t+1)
Figure FDA00038873343900000311
其中,De和Dv分别为包含所有超边的度和包含所有顶点的度的对角矩阵,超边ej的度
Figure FDA0003887334390000041
顶点vi的度
Figure FDA0003887334390000042
S22,固定LsymH (t+1),K(t),J(t),Y1 (t)和μ(t),更新Z(t+1)
Z(t+1)=(K(t)(t)I+2δLsymH (t+1))-1(K(t)(t)J(t)+Y1 (t)),#(9)
令Z(t+1)中小于0的元素为0:
Z(t+1)=max(Z(t+1),0),#(10)
S23,固定Z(t+1),g(t),W(t),μ(t)和Y2 (t),更新K(t+1)
Figure FDA0003887334390000043
令K(t+1)中小于0的元素为0:
K(t+1)=max(K(t+1),0),#(12)
S24,固定Z(t+1),μ(t)和Y1 (t),更新J(t+1)
若ρ(J)=‖J‖1,则:
Figure FDA0003887334390000044
若ρ(J)=‖J‖*,则:
Figure FDA0003887334390000045
其中,
Figure FDA0003887334390000046
Cij是矩阵C中第i行第j列的元素,U(t)、V(t)和σ(t)分别是对应于C(t)的奇异值分解的左奇异向量、右奇异向量和奇异值;
令J(t+1)中小于0的元素为0:
J(t+1)=max(J(t+1),0),#(15)
S25,固定K(t+1),μ(t)和Y2 (t),更新W(t+1)
Figure FDA0003887334390000051
其中,
Figure FDA0003887334390000052
Figure FDA0003887334390000053
Figure FDA0003887334390000054
分别是对应于D(t)的奇异值分解的左奇异向量、右奇异向量和奇异值;
令W(t+1)中小于0的元素为0:
W(t+1)=max(W(t+1),0),#(17)
S26,固定K(t+1),更新g(t+1)
求解g(t+1)的优化问题变为求解一个带有线性约束的二次规划问题,可利用存在的MATLAB函数quadprog求解;
S27,更新拉格朗日乘子Y1 (t+1),Y2 (t+1)和μ(t+1)
Y1 (t+1)=Y1 (t)(t)(J-Z),#(18)
Y2 (t+1)=Y2 (t)(t)(W-K),#(19)
μ(t+1)=min(μmax,τμ(t)),#(20)
其中,τ根据经验调整,μmax是μ被允许的最大值;
S28,判断是否达到迭代停止条件,迭代停止条件为:
Figure FDA0003887334390000055
其中,ε为阈值,若达到迭代停止条件,则得到最终的Z*,K*,g*,否则继续执行S21-S28。
6.根据权利要求1所述的一种融合低秩核学习和自适应超图的图像聚类方法,其特征在于,所述S4步骤具体为:把相似度矩阵作为谱聚类算法的输入,调用谱聚类算法,得到聚类结果。
CN202211249403.0A 2022-10-12 2022-10-12 一种融合低秩核学习和自适应超图的图像聚类方法 Pending CN115631361A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211249403.0A CN115631361A (zh) 2022-10-12 2022-10-12 一种融合低秩核学习和自适应超图的图像聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211249403.0A CN115631361A (zh) 2022-10-12 2022-10-12 一种融合低秩核学习和自适应超图的图像聚类方法

Publications (1)

Publication Number Publication Date
CN115631361A true CN115631361A (zh) 2023-01-20

Family

ID=84905621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211249403.0A Pending CN115631361A (zh) 2022-10-12 2022-10-12 一种融合低秩核学习和自适应超图的图像聚类方法

Country Status (1)

Country Link
CN (1) CN115631361A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117036762A (zh) * 2023-08-03 2023-11-10 北京科技大学 一种多模态数据聚类方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117036762A (zh) * 2023-08-03 2023-11-10 北京科技大学 一种多模态数据聚类方法
CN117036762B (zh) * 2023-08-03 2024-03-22 北京科技大学 一种多模态数据聚类方法

Similar Documents

Publication Publication Date Title
Xie et al. Hyper-Laplacian regularized multilinear multiview self-representations for clustering and semisupervised learning
Wang et al. Spectral–spatial multi-feature-based deep learning for hyperspectral remote sensing image classification
Patel et al. Latent space sparse and low-rank subspace clustering
Zhang et al. Robust low-rank kernel multi-view subspace clustering based on the schatten p-norm and correntropy
CN112116017B (zh) 基于核保持的图像数据降维方法
Zhou et al. Point cloud denoising review: from classical to deep learning-based approaches
EP4163831A1 (en) Neural network distillation method and device
CN109190511B (zh) 基于局部与结构约束低秩表示的高光谱分类方法
Zhao et al. Joint face alignment and segmentation via deep multi-task learning
CN110717519A (zh) 训练、特征提取、分类方法、设备及存储介质
Lu et al. Hyper-Laplacian regularized multi-view subspace clustering with low-rank tensor constraint
CN113344103B (zh) 基于超图卷积神经网络的高光谱遥感图像地物分类方法
CN110689049A (zh) 基于黎曼核字典学习算法的视觉分类方法
CN116188941A (zh) 一种基于松弛标注的流形正则化宽度学习方法及系统
Hao et al. Tensor-based incomplete multi-view clustering with low-rank data reconstruction and consistency guidance
CN115631361A (zh) 一种融合低秩核学习和自适应超图的图像聚类方法
CN109447147B (zh) 基于双图稀疏的深度矩阵分解的图像聚类方法
Zhang et al. Center consistency guided multi-view embedding anchor learning for large-scale graph clustering
Ma et al. Hybrid spatial-spectral feature in broad learning system for Hyperspectral image classification
You et al. Robust structure low-rank representation in latent space
Lu et al. Robust low-rank representation with adaptive graph regularization from clean data
Guo et al. A sparse oblique-manifold nonnegative matrix factorization for hyperspectral unmixing
CN111310807B (zh) 一种基于异质特征联合自表示的特征子空间与亲和矩阵联合学习方法
Cheng et al. Double-noise-dual-problem approach to the augmented Lagrange multiplier method for robust principal component analysis
Bi et al. A robust optimal mean cosine angle 2DPCA for image feature extraction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination