CN111709478B - 一种基于锚图的模糊聚类方法及装置 - Google Patents

一种基于锚图的模糊聚类方法及装置 Download PDF

Info

Publication number
CN111709478B
CN111709478B CN202010554321.1A CN202010554321A CN111709478B CN 111709478 B CN111709478 B CN 111709478B CN 202010554321 A CN202010554321 A CN 202010554321A CN 111709478 B CN111709478 B CN 111709478B
Authority
CN
China
Prior art keywords
matrix
anchor
fuzzy
graph
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010554321.1A
Other languages
English (en)
Other versions
CN111709478A (zh
Inventor
杨晓君
许裕雄
郭春炳
蔡湧达
梁珂
黄晓蓓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202010554321.1A priority Critical patent/CN111709478B/zh
Publication of CN111709478A publication Critical patent/CN111709478A/zh
Application granted granted Critical
Publication of CN111709478B publication Critical patent/CN111709478B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Abstract

本申请公开了一种基于锚图的模糊聚类方法及装置,方法包括:从图像的原始数据矩阵选取多个锚点构成锚图矩阵;将锚图矩阵与对角矩阵的逆矩阵相乘,并对相乘后的矩阵进行奇异值分解得到谱嵌入数据;建立全局的模糊隶属度矩阵与锚图矩阵的关系;由模糊隶属度矩阵与锚图矩阵的关系建立基于锚图的模糊聚类目标函数,目标函数中设置了正则项;迭代求解基于锚图的模糊聚类目标函数,直到基于锚图的模糊聚类目标函数收敛;采用收敛的基于锚图的模糊聚类目标函数对谱嵌入数据进行离散化,得到聚类结果。本申请能够更好地获取锚图和模糊隶属度之间的联系,平衡数据点和所有聚类中心的模糊隶属度,获得更合理的模糊隶属度。

Description

一种基于锚图的模糊聚类方法及装置
技术领域
本申请涉及图像聚类技术领域,尤其涉及一种基于锚图的模糊聚类方法及装置。
背景技术
近年来,基于锚图的快速谱聚类算法(Fast Spectral Clustering based onAnchor Graph,FSCAG)以其优异的性能受到越来越多的关注。FSCAG算法主要有两步所组成,分别为构造基于锚点的相似图和采用K-均值对谱嵌入数据离散化。FSCAG算法采用锚点代表原始数据点构造相似图,大大降低了计算复杂度,有效解决了谱聚类算法在大规模数据中难以获得较好的聚类结果的问题。由于FSCAG算法中的邻接矩阵是由数据样本及其锚点的相似图构成的,其谱嵌入结果比传统的谱聚类方法更难以离散化,在一定程度上影响了聚类精度。在谱嵌入数据离散化过程中,大多数谱聚类算法都采用K-均值算法。
K-均值算法将数据点分配给具有硬隶属关系的聚类中心,随着谱嵌入数据量大、维度高等问题的出现,K-均值算法已经不能更好实现离散化从而获得更优异的聚类结果。模糊K-均值算法是一种改进的K-means聚类算法,能够有效对谱嵌入数据进行离散化。但模糊K-均值算法采用欧式距离计算数据点与聚类中心的模糊隶属度在异常环境中缺乏鲁棒性,且现有的模糊K-均值算法难以找到合适的正则项来约束数据点与聚类中心的模糊隶属度。
发明内容
本申请提供了一种基于锚图的模糊聚类方法及装置,解决了现有技术计算数据点与聚类中心的模糊隶属度在异常环境中缺乏鲁棒性,以及模糊隶属度存在最近类吞并其他类的技术问题。
有鉴于此,本申请第一方面提供了一种基于锚图的模糊聚类方法,所述方法包括:
从图像的原始数据矩阵选取多个锚点构成锚图矩阵;
将所述锚图矩阵与对角矩阵的逆矩阵相乘,并对相乘后的矩阵进行奇异值分解得到谱嵌入数据;
建立全局的模糊隶属度矩阵与所述锚图矩阵的关系;
由所述模糊隶属度矩阵与所述锚图矩阵的关系建立基于锚图的模糊聚类目标函数,所述目标函数中设置了用于平衡聚类中心点与谱嵌入数据点之间模糊隶属度的正则项;
迭代求解所述基于锚图的模糊聚类目标函数,直到所述基于锚图的模糊聚类目标函数收敛;
采用收敛的所述基于锚图的模糊聚类目标函数对谱嵌入数据进行离散化,得到聚类结果。
可选的,所述从图像的原始数据矩阵选取多个锚点构成锚图矩阵,具体为:
当所述图像的原始数据矩阵为X=[x1,x2,...,xn]T∈Rn×d,有n个原始数据点,其中选取图像的多个锚点构成锚点的集合为A=[a1,a2,...,am]T∈Rm×d,m为锚点的个数,d为锚点的特征维数,则锚图矩阵B中的元素为:
Figure BDA0002543735950000021
式中,
Figure BDA0002543735950000022
代表数据点xi距离最近的k个锚点的索引,K(·)是一种高斯核函数,K(·)表示为:
Figure BDA0002543735950000023
式中,σ是热核参数;d(xi,aj)是xi与aj欧式距离的平方表示为
Figure BDA0002543735950000024
bij为第i个数据点与第j个锚点之间的距离,表示的是锚图矩阵B中的元素;矩阵B∈Rn×m为锚图矩阵。
可选的,所述将所述锚图矩阵与对角矩阵的逆矩阵相乘,并对相乘后的矩阵进行奇异值分解得到谱嵌入数据,具体为:
对BΛ-1进行奇异值分解得到谱嵌入数据U,B为锚图矩阵,矩阵Λ为对角矩阵,对角矩阵Λ的第j行第j列元素为
Figure BDA0002543735950000025
-1满足:
Figure BDA0002543735950000031
Figure BDA0002543735950000032
为所述图像的原始数据矩阵的邻接矩阵,即谱嵌入数据U中的元素为矩阵
Figure BDA0002543735950000033
的特征向量对应的最大的c个特征值。
可选的,所述建立全局的模糊隶属度矩阵与所述锚图矩阵的关系,具体为:
设置矩阵Y为全局的模糊隶属度矩阵,则全局的模糊隶属度矩阵与锚图矩阵的关系为:
Y=BZ
式中,矩阵Z为锚点的模糊隶属度矩阵。
可选的,所述由所述模糊隶属度矩阵与所述锚图矩阵的关系建立基于锚图的模糊聚类目标函数,具体为:
基于锚图的模糊聚类目标函数为:
Figure BDA0002543735950000034
其中,vj为聚类中心矩阵V中的元素,表示聚类中心点;yij为全局的模糊隶属度矩阵Y中的元素,表示谱嵌入数据U中的谱嵌入数据点ui与聚类中心点vj之间的模糊隶属度,λ1为施加的正则项,用于平衡聚类中心点与谱嵌入数据点之间的模糊隶属度。
可选的,所述迭代求解所述基于锚图的模糊聚类目标函数,直到所述基于锚图的模糊聚类目标函数收敛,具体为:
当基于锚图的模糊聚类目标函数不满足收敛条件时,依次对聚类中心矩阵V、锚点的模糊隶属度矩阵Z以及全局的模糊隶属度矩阵Y进行更新,将更新后的矩阵V、Z和Y代入基于锚图的模糊聚类目标函数中进行计算,直到基于锚图的模糊聚类目标函数满足前后两次迭代结果之差小于预设的阈值时,结束迭代。
本申请第二方面提供一种基于锚图的模糊聚类装置,所述装置包括:
锚图矩阵构造单元,用于从图像的原始数据矩阵选取多个锚点构成锚图矩阵;
谱嵌入数据获取单元,用于将所述锚图矩阵与对角矩阵的逆矩阵相乘,并对相乘后的矩阵进行奇异值分解得到谱嵌入数据;
关系建立单元,用于建立全局的模糊隶属度矩阵与所述锚图矩阵的关系;
目标函数建立单元,用于由所述模糊隶属度矩阵与所述锚图矩阵的关系建立基于锚图的模糊聚类目标函数,所述目标函数中设置了用于平衡聚类中心点与谱嵌入数据点之间模糊隶属度的正则项;
迭代求解单元,用于迭代求解所述基于锚图的模糊聚类目标函数,直到所述基于锚图的模糊聚类目标函数收敛;
离散化单元,用于采用收敛的所述基于锚图的模糊聚类目标函数对谱嵌入数据进行离散化,得到聚类结果。
可选的,所述锚图矩阵构造单元具体用于当所述图像的原始数据矩阵为X=[x1,x2,...,xn]T∈Rn×d,有n个原始数据点,其中选取图像的多个锚点构成锚点的集合为A=[a1,a2,...,am]T∈Rm×d,m为锚点的个数,d为锚点的特征维数,则锚图矩阵B中的元素为:
Figure BDA0002543735950000041
式中,
Figure BDA0002543735950000042
代表数据点xi距离最近的k个锚点的索引,K(·)是一种高斯核函数,K(·)表示为:
Figure BDA0002543735950000043
式中,σ是热核参数;d(xi,aj)是xi与aj欧式距离的平方表示为
Figure BDA0002543735950000044
bij为第i个数据点与第j个锚点之间的距离,表示的是锚图矩阵B中的元素;矩阵B∈Rn×m为锚图矩阵。
可选的,所述谱嵌入数据获取单元具体用于对BΛ-1进行奇异值分解得到谱嵌入数据U,B为锚图矩阵,矩阵Λ为对角矩阵,对角矩阵Λ的第j行第j列元素为
Figure BDA0002543735950000045
-1满足:
Figure BDA0002543735950000046
Figure BDA0002543735950000047
为所述图像的原始数据矩阵的邻接矩阵,即谱嵌入数据U中的元素为矩阵
Figure BDA0002543735950000048
的特征向量对应的最大的c个特征值。
可选的,所述关系建立单元具体用于设置矩阵Y为全局的模糊隶属度矩阵,则全局的模糊隶属度矩阵与锚图矩阵的关系为:
Y=BZ
式中,矩阵Z为锚点的模糊隶属度矩阵。
从以上技术方案可以看出,本申请具有以下优点:
本申请中,提供了一种基于锚图的模糊聚类方法,方法包括:从图像的原始数据矩阵选取多个锚点构成锚图矩阵;将锚图矩阵与对角矩阵的逆矩阵相乘,并对相乘后的矩阵进行奇异值分解得到谱嵌入数据;建立全局的模糊隶属度矩阵与锚图矩阵的关系;由模糊隶属度矩阵与锚图矩阵的关系建立基于锚图的模糊聚类目标函数,目标函数中设置了用于平衡聚类中心点与谱嵌入数据点之间模糊隶属度的正则项;迭代求解基于锚图的模糊聚类目标函数,直到基于锚图的模糊聚类目标函数收敛;采用收敛的基于锚图的模糊聚类目标函数对谱嵌入数据进行离散化,得到聚类结果。
本申请通过对构建锚图进行谱分解获得谱嵌入数据,然后对谱嵌入数据进行离散化,并且在对谱嵌入数据进行离散化的目标函数中添加了用于平衡聚类中心点与谱嵌入数据点之间模糊隶属度的正则项,从而得到更合理的模糊隶属度,获得更高的聚类精度。
附图说明
图1为本申请一种基于锚图的模糊聚类方法的一个实施例的方法流程图;
图2为本申请一种基于锚图的模糊聚类装置的一个实施例的装置结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请一种基于锚图的模糊聚类方法的一个实施例的方法流程图,如图1所示,图1中包括:
101、从图像的原始数据矩阵选取多个锚点构成锚图矩阵。
需要说明的是,可以假设图像的原始数据矩阵为X=[x1,x2,...,xn]T∈Rn×d,有n个原始数据点,其中选取图像的多个锚点构成锚点的集合为A=[a1,a2,...,am]T∈Rm×d,m为锚点的个数,d为锚点的特征维数。那么锚图矩阵B为:
Figure BDA0002543735950000061
式中,
Figure BDA0002543735950000062
代表数据点xi距离最近的k个锚点的索引,K(·)是一种高斯核函数,K(·)表示为:
Figure BDA0002543735950000063
式中,σ是热核参数;d(xi,aj)是xi与aj欧式距离的平方表示为
Figure BDA0002543735950000064
bij为第i个数据点与第j个锚点之间的距离,表示的是锚图矩阵B中的元素;矩阵B∈Rn×m为锚图矩阵。
102、由锚图矩阵与对角矩阵的逆矩阵相乘,并对相乘后的矩阵进行奇异值分解得到谱嵌入数据。
需要说明的是,可以设置矩阵
Figure BDA0002543735950000065
为原始数据矩阵的邻接矩阵,可以表示为:
Figure BDA0002543735950000066
其中,矩阵Λ为对角矩阵,对角矩阵Λ的第j行第j列元素为
Figure BDA0002543735950000067
根据邻接矩阵的定义,谱嵌入数据U可以由对BΛ-1进行奇异值分解获得,即为矩阵
Figure BDA0002543735950000068
的特征向量对应的最大的c个特征值。
103、建立全局的模糊隶属度矩阵与锚图矩阵的关系。
需要说明的是,可以设置矩阵Y为全局的模糊隶属度矩阵,则全局的模糊隶属度矩阵与锚图矩阵的关系为:
Y=BZ
其中,矩阵Z为锚点的模糊隶属度矩阵,谱嵌入数据为U,其中U∈Rn×c。矩阵V为聚类中心矩阵。
104、由模糊隶属度矩阵与锚图矩阵的关系建立基于锚图的模糊聚类目标函数,目标函数中设置了用于平衡聚类中心点与谱嵌入数据点之间模糊隶属度的正则项。
需要说明的是,为了获得更合理的模糊隶属度,则基于锚图的模糊聚类目标函数为:
Figure BDA0002543735950000069
其中,vj为聚类中心点,yij为谱嵌入数据点ui与聚类中心点vj之间的模糊隶属度。λ1为施加的正则项,用于平衡聚类中心点与谱嵌入数据点之间的模糊隶属度。
105、迭代求解基于锚图的模糊聚类目标函数,直到基于锚图的模糊聚类目标函数收敛。
需要说明的是,采用迭代优化方法对公式求解,其求解过程如下:
当基于锚图的模糊聚类目标函数不满足收敛条件时,依次对聚类中心矩阵V、锚点的模糊隶属度矩阵Z以及全局的模糊隶属度矩阵Y进行更新,将更新后的矩阵V、Z和Y代入基于锚图的模糊聚类目标函数中进行计算,直到基于锚图的模糊聚类目标函数满足前后两次迭代结果之差小于预设的阈值时,结束迭代。
其中,聚类中心矩阵V的更新公式为:
Figure BDA0002543735950000071
式中Vk表示聚类中心矩阵V的元素。
锚点的模糊隶属度矩阵Z的更新矩阵为:
Z=(BTB)-1BTY
全局的模糊隶属度矩阵Y的更新公式为:
Figure BDA0002543735950000072
式中,yij表示全局的模糊隶属度矩阵Y中的元素。
迭代完成后得到最终的基于锚图的模糊聚类目标函数,之后采用基于锚图的模糊聚类目标函数对谱嵌入数据U进行离散化,得到最终的聚类结果。
需要说明的是,关于聚类中心矩阵V、锚点的模糊隶属度矩阵Z以及全局的模糊隶属度矩阵Y的更新公式的推导过程如下所示:
(1)聚类中心矩阵V的更新公式为:
当全局的模糊隶属度矩阵Y和锚点的模糊隶属度矩阵Z固定时,基于锚图的模糊聚类目标函数可以转换成:
Figure BDA0002543735950000073
可将上式化简为:
Figure BDA0002543735950000081
对式中的Vk求导,并令上式等于零,可化简为:
Figure BDA0002543735950000082
式中Vk表示聚类中心矩阵的元素。
(2)锚点的模糊隶属度矩阵Z的更新公式为:
当全局的模糊隶属度矩阵Y和聚类中心矩阵V固定时,对锚点的模糊隶属度矩阵Z进行求解,则基于锚图的模糊聚类目标函数可以转换成:
Figure BDA0002543735950000083
上式为最小二乘问题,那么上式的解为:
Z=(BTB)-1BTY
即为全局最优解。
(3)全局的模糊隶属度矩阵Y的更新公式:
当聚类中心矩阵V和锚点的模糊隶属度矩阵Z固定时,对全局的模糊隶属度矩阵Y进行求解,则基于锚图的模糊聚类目标函数可以转换成:
Figure BDA0002543735950000084
可以设置di,j=||ui-vj||2,则上式可以简化为:
Figure BDA0002543735950000085
式中,dij∈D,dij表示为距离矩阵D中的元素,则上式可以装换成:
Figure BDA0002543735950000086
式中,Tr(·)表示矩阵的迹,当仅考虑全局的模糊隶属度矩阵Y时,上式可以转换成:
Figure BDA0002543735950000087
式中,参数λ2为基于锚点图的模糊聚类算法的约束条件,参数α为拉格朗日乘数。对上式中的全局的模糊隶属度矩阵Y进行求导,并令上式等于零,则上式可以转换成:
D+2λ1Y+2λ2YYTY+α=2λ1BZ+2λ2Y
根据卡罗需-库恩-塔克最优化条件(Karush-Kuhn-Tuckre,KKT),αοY=0(ο为哈达玛乘积),对上式中的全局的模糊隶属度矩阵Y进行哈达玛乘积运算,则可以得到:
Figure BDA0002543735950000091
式中,yij表示全局的模糊隶属度矩阵Y中的元素。
106、采用收敛的基于锚图的模糊聚类目标函数对谱嵌入数据进行离散化,得到聚类结果。
本申请通过先通过对构建锚图进行谱分解获得谱嵌入数据,然后对谱嵌入数据进行离散化,并且在对谱嵌入数据进行离散化的目标函数中添加了用于平衡聚类中心点与谱嵌入数据点之间模糊隶属度的正则项,从而得到更合理的模糊隶属度,使得获得更高的聚类精度。
本申请还包括一种基于锚图的模糊聚类方法的一个具体的应用例,具体包括:
首先获取图像的原始数据矩阵X,锚点数m,图像类别c,邻近的数据点数k,正则项λ1,约束条件λ2,采用邻近法初始化全局的模糊隶属度矩阵Y。
1、构建锚图:从原始数据矩阵X中选取m个锚点,根据以下公式获得锚图矩阵。
Figure BDA0002543735950000092
2、获得谱嵌入数据:根据以下公式对BΛ-1进行奇异值分解获得谱嵌入数据矩阵U。
Figure BDA0002543735950000093
3、基于锚图的模糊聚类:当基于锚图的模糊聚类目标函数不满足收敛条件时,依次更新聚类中心矩阵V、锚点的模糊隶属度矩阵Z以及全局的模糊隶属度矩阵Y,直到更新后的矩阵V、Z和Y能够使基于锚图的模糊聚类目标函数收敛。
为了验证本方法的有效性,本申请采用六个基准数据集和其他八种流行的聚类算法进行实验,通过聚类精度对实验结果进行评估。
具体的,采用的聚类算法分别包括:K-meas++、FCM、R-cut、N-cut、NMF_MMC、LSC-R(K)、FSCAG和FCAG。
采用的基准数据集分别为MSRA25、CONTROL、JAFFE50、USPS_20、COIL20和COIL100,以上数据集都是图像数据集,数据集的详细信息如表1所示:
表1基准数据集的详细信息
数据集 数据点数 维数 类别数
MSRA25 1799 256 12
CONTROL 600 60 6
JAFFE50 213 1024 10
USPS_20 1854 256 10
COIL20 1440 1024 20
COIL100 7000 1024 100
为了实验的公平性,本申请设参数λ1=0.1、λ2=0.1、k=15和m=100,对每种算法进行15次实验,获得的聚类精度如表2所示。在每个数据集实验中,对于获得最好的聚类精度进行了加粗处理。如表2所示,与FSCAG相比,本申请提出的FCAG算法替代K-means对谱嵌入数据进行离散化,FCAG的聚类精度在六个基准数据集下都优异于FSCAG;与LSC-R和LSC-K相比,FCAG算法在高维数据中获得了更好的聚类精度,说明快速谱嵌入能够有效处理高维数据;FCAG的聚类精度在相同实验下都优异经典的K-meas++、FCM、R-cut、N-cut和NMF_MMC算法,更加说明FCAG算法具有鲁棒性和有效性。
表2各类算法的聚类精度
Figure BDA0002543735950000101
Figure BDA0002543735950000111
以上是本申请的方法的实施例,本申请还包括一种基于锚图的模糊聚类装置的实施例,如图2所示,图2中包括:
锚图矩阵构造单元201,用于从图像的原始数据矩阵选取多个锚点构成锚图矩阵;
谱嵌入数据获取单元202,用于将锚图矩阵与对角矩阵的逆矩阵相乘,并对相乘后的矩阵进行奇异值分解得到谱嵌入数据;
关系建立单元203,用于建立全局的模糊隶属度矩阵与锚图矩阵的关系;
目标函数建立单元204,用于由模糊隶属度矩阵与锚图矩阵的关系建立基于锚图的模糊聚类目标函数,目标函数中设置了用于平衡聚类中心点与谱嵌入数据点之间模糊隶属度的正则项;
迭代求解单元205,用于迭代求解基于锚图的模糊聚类目标函数,直到基于锚图的模糊聚类目标函数收敛;
离散化单元206,用于采用收敛的基于锚图的模糊聚类目标函数对谱嵌入数据进行离散化,得到聚类结果。
在一种具体的实施方式中,锚图矩阵构造单元201具体用于当图像的原始数据矩阵为X=[x1,x2,...,xn]T∈Rn×d,有n个原始数据点,其中选取图像的多个锚点构成锚点的集合为A=[a1,a2,...,am]T∈Rm×d,m为锚点的个数,d为锚点的特征维数,则锚图矩阵B中的元素为:
Figure BDA0002543735950000121
式中,
Figure BDA0002543735950000122
代表数据点xi距离最近的k个锚点的索引,K(·)是一种高斯核函数,K(·)表示为:
Figure BDA0002543735950000123
式中,σ是热核参数;d(xi,aj)是xi与aj欧式距离的平方表示为
Figure BDA0002543735950000124
bij为第i个数据点与第j个锚点之间的距离,表示的是锚图矩阵B中的元素;矩阵B∈Rn×m为锚图矩阵。
在一种具体的实施方式中,谱嵌入数据获取单元202具体用于对BΛ-1进行奇异值分解得到谱嵌入数据U,B为锚图矩阵,矩阵Λ为对角矩阵,对角矩阵Λ的第j行第j列元素为
Figure BDA0002543735950000125
-1满足:
Figure BDA0002543735950000126
Figure BDA0002543735950000127
为所述图像的原始数据矩阵的邻接矩阵,即谱嵌入数据U中的元素为矩阵
Figure BDA0002543735950000128
的特征向量对应的最大的c个特征值。
在一种具体的实施方式中,关系建立单元203具体用于设置矩阵Y为全局的模糊隶属度矩阵,则全局的模糊隶属度矩阵与锚图矩阵的关系为:
Y=BZ
式中,矩阵Z为锚点的模糊隶属度矩阵。
在一种具体的实施方式中,目标函数建立单元204具体用于建立基于锚图的模糊聚类目标函数为:
Figure BDA0002543735950000129
其中,vj为聚类中心矩阵V中的元素,表示聚类中心点;yij为全局的模糊隶属度矩阵Y中的元素,表示谱嵌入数据U中的谱嵌入数据点ui与聚类中心点vj之间的模糊隶属度,λ1为施加的正则项,用于平衡聚类中心点与谱嵌入数据点之间的模糊隶属度。
在一种具体的实施方式中,迭代求解单元205具体用于当基于锚图的模糊聚类目标函数不满足收敛条件时,依次对聚类中心矩阵V、锚点的模糊隶属度矩阵Z以及全局的模糊隶属度矩阵Y进行更新,将更新后的矩阵V、Z和Y代入基于锚图的模糊聚类目标函数中进行计算,直到基于锚图的模糊聚类目标函数满足前后两次迭代结果之差小于预设的阈值时,结束迭代。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请中术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:RandomAccess Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种基于锚图的模糊聚类方法,其特征在于,包括:
从图像的原始数据矩阵选取多个锚点构成锚图矩阵;
将所述锚图矩阵与对角矩阵的逆矩阵相乘,并对相乘后的矩阵进行奇异值分解得到谱嵌入数据;其中,所述对角矩阵为所述锚图矩阵的对角矩阵;
建立全局的模糊隶属度矩阵与所述锚图矩阵的关系;
由所述模糊隶属度矩阵与所述锚图矩阵的关系建立基于锚图的模糊聚类目标函数,所述目标函数中设置了用于平衡聚类中心点与谱嵌入数据点之间模糊隶属度的正则项;
迭代求解所述基于锚图的模糊聚类目标函数,直到所述基于锚图的模糊聚类目标函数收敛;
采用收敛的所述基于锚图的模糊聚类目标函数对谱嵌入数据进行离散化,得到聚类结果。
2.根据权利要求1所述的基于锚图的模糊聚类方法,其特征在于,所述从图像的原始数据矩阵选取多个锚点构成锚图矩阵,具体为:
当所述图像的原始数据矩阵为X=[x1,x2,...,xn]T∈Rn×d,有n个原始数据点,其中选取图像的多个锚点构成锚点的集合为A=[a1,a2,...,am]T∈Rm×d,m为锚点的个数,d为锚点的特征维数,则锚图矩阵B中的元素为:
Figure FDA0003560600610000011
式中,
Figure FDA0003560600610000012
代表数据点xi距离最近的k个锚点的索引,K(·)是一种高斯核函数,K(·)表示为:
Figure FDA0003560600610000013
式中,σ是热核参数;d(xi,aj)是xi与aj欧式距离的平方表示为
Figure FDA0003560600610000014
bij为第i个数据点与第j个锚点之间的距离,表示的是锚图矩阵B中的元素;矩阵B∈Rn×m为锚图矩阵。
3.根据权利要求2所述的一种基于锚图的模糊聚类方法,其特征在于,所述将所述锚图矩阵与对角矩阵的逆矩阵相乘,并对相乘后的矩阵进行奇异值分解得到谱嵌入数据,具体为:
对BΛ-1进行奇异值分解得到谱嵌入数据U,B为锚图矩阵,矩阵Λ为对角矩阵,对角矩阵Λ的第j行第j列元素为
Figure FDA0003560600610000021
-1满足:
Figure FDA0003560600610000022
Figure FDA0003560600610000023
为所述图像的原始数据矩阵的邻接矩阵,即谱嵌入数据U中的元素为矩阵
Figure FDA0003560600610000024
的特征向量对应的最大的c个特征值。
4.根据权利要求3所述的一种基于锚图的模糊聚类方法,其特征在于,所述建立全局的模糊隶属度矩阵与所述锚图矩阵的关系,具体为:
设置矩阵Y为全局的模糊隶属度矩阵,则全局的模糊隶属度矩阵与锚图矩阵的关系为:
Y=BZ
式中,矩阵Z为锚点的模糊隶属度矩阵。
5.根据权利要求4所述的一种基于锚图的模糊聚类方法,其特征在于,所述由所述模糊隶属度矩阵与所述锚图矩阵的关系建立基于锚图的模糊聚类目标函数,具体为:
基于锚图的模糊聚类目标函数为:
Figure FDA0003560600610000025
其中,vj为聚类中心矩阵V中的元素,表示聚类中心点;yij为全局的模糊隶属度矩阵Y中的元素,表示谱嵌入数据U中的谱嵌入数据点ui与聚类中心点vj之间的模糊隶属度,λ1为施加的正则项,用于平衡聚类中心点与谱嵌入数据点之间的模糊隶属度。
6.根据权利要求5所述的一种基于锚图的模糊聚类方法,其特征在于,所述迭代求解所述基于锚图的模糊聚类目标函数,直到所述基于锚图的模糊聚类目标函数收敛,具体为:
当基于锚图的模糊聚类目标函数不满足收敛条件时,依次对聚类中心矩阵V、锚点的模糊隶属度矩阵Z以及全局的模糊隶属度矩阵Y进行更新,将更新后的矩阵V、Z和Y代入基于锚图的模糊聚类目标函数中进行计算,直到基于锚图的模糊聚类目标函数满足前后两次迭代结果之差小于预设的阈值时,结束迭代。
7.一种基于锚图的模糊聚类装置,其特征在于,包括:
锚图矩阵构造单元,用于从图像的原始数据矩阵选取多个锚点构成锚图矩阵;
谱嵌入数据获取单元,用于将所述锚图矩阵与对角矩阵的逆矩阵相乘,并对相乘后的矩阵进行奇异值分解得到谱嵌入数据;其中,所述对角矩阵为所述锚图矩阵的对角矩阵;
关系建立单元,用于建立全局的模糊隶属度矩阵与所述锚图矩阵的关系;
目标函数建立单元,用于由所述模糊隶属度矩阵与所述锚图矩阵的关系建立基于锚图的模糊聚类目标函数,所述目标函数中设置了用于平衡聚类中心点与谱嵌入数据点之间模糊隶属度的正则项;
迭代求解单元,用于迭代求解所述基于锚图的模糊聚类目标函数,直到所述基于锚图的模糊聚类目标函数收敛;
离散化单元,用于采用收敛的所述基于锚图的模糊聚类目标函数对谱嵌入数据进行离散化,得到聚类结果。
8.根据权利要求7所述的基于锚图的模糊聚类装置,其特征在于,所述锚图矩阵构造单元具体用于当所述图像的原始数据矩阵为X=[x1,x2,...,xn]T∈Rn×d,有n个原始数据点,其中选取图像的多个锚点构成锚点的集合为A=[a1,a2,...,am]T∈Rm×d,m为锚点的个数,d为锚点的特征维数,则锚图矩阵B中的元素为:
Figure FDA0003560600610000031
式中,
Figure FDA0003560600610000032
代表数据点xi距离最近的k个锚点的索引,K(·)是一种高斯核函数,K(·)表示为:
Figure FDA0003560600610000033
式中,σ是热核参数;d(xi,aj)是xi与aj欧式距离的平方表示为
Figure FDA0003560600610000034
bij为第i个数据点与第j个锚点之间的距离,表示的是锚图矩阵B中的元素;矩阵B∈Rn×m为锚图矩阵。
9.根据权利要求8所述的基于锚图的模糊聚类装置,其特征在于,所述谱嵌入数据获取单元具体用于对BΛ-1进行奇异值分解得到谱嵌入数据U,B为锚图矩阵,矩阵Λ为对角矩阵,对角矩阵Λ的第j行第j列元素为
Figure FDA0003560600610000035
-1满足:
Figure FDA0003560600610000041
Figure FDA0003560600610000043
为所述图像的原始数据矩阵的邻接矩阵,即谱嵌入数据U中的元素为矩阵
Figure FDA0003560600610000042
的特征向量对应的最大的c个特征值。
10.根据权利要求9所述的基于锚图的模糊聚类装置,其特征在于,所述关系建立单元具体用于设置矩阵Y为全局的模糊隶属度矩阵,则全局的模糊隶属度矩阵与锚图矩阵的关系为:
Y=BZ
式中,矩阵Z为锚点的模糊隶属度矩阵。
CN202010554321.1A 2020-06-17 2020-06-17 一种基于锚图的模糊聚类方法及装置 Active CN111709478B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010554321.1A CN111709478B (zh) 2020-06-17 2020-06-17 一种基于锚图的模糊聚类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010554321.1A CN111709478B (zh) 2020-06-17 2020-06-17 一种基于锚图的模糊聚类方法及装置

Publications (2)

Publication Number Publication Date
CN111709478A CN111709478A (zh) 2020-09-25
CN111709478B true CN111709478B (zh) 2022-06-24

Family

ID=72541106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010554321.1A Active CN111709478B (zh) 2020-06-17 2020-06-17 一种基于锚图的模糊聚类方法及装置

Country Status (1)

Country Link
CN (1) CN111709478B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114863151B (zh) * 2022-03-20 2024-02-27 西北工业大学 一种基于模糊理论的图像降维聚类方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012041063A1 (en) * 2010-09-28 2012-04-05 Huawei Technologies Co., Ltd. System and method for image authentication
CN106055580A (zh) * 2016-05-23 2016-10-26 中南大学 一种基于Radviz的模糊聚类结果可视化方法
CN109858531A (zh) * 2019-01-14 2019-06-07 西北工业大学 一种基于图的高光谱遥感图像快速聚类算法
CN110751206A (zh) * 2019-10-17 2020-02-04 北京中盾安全技术开发公司 一种多目标智能成像与识别装置及方法
CN111062428A (zh) * 2019-12-11 2020-04-24 广东工业大学 一种高光谱图像的聚类方法、系统及设备
CN111191698A (zh) * 2019-12-22 2020-05-22 中国人民解放军陆军工程大学 基于非负矩阵分解和模糊c均值的聚类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012041063A1 (en) * 2010-09-28 2012-04-05 Huawei Technologies Co., Ltd. System and method for image authentication
CN106055580A (zh) * 2016-05-23 2016-10-26 中南大学 一种基于Radviz的模糊聚类结果可视化方法
CN109858531A (zh) * 2019-01-14 2019-06-07 西北工业大学 一种基于图的高光谱遥感图像快速聚类算法
CN110751206A (zh) * 2019-10-17 2020-02-04 北京中盾安全技术开发公司 一种多目标智能成像与识别装置及方法
CN111062428A (zh) * 2019-12-11 2020-04-24 广东工业大学 一种高光谱图像的聚类方法、系统及设备
CN111191698A (zh) * 2019-12-22 2020-05-22 中国人民解放军陆军工程大学 基于非负矩阵分解和模糊c均值的聚类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《Fast adaptive neighbors clustering via emb e dde d clustering》;Yijun Liu et al;;《www.elsevier.com/locate/neucom》;20200225;第331-341页; *
《Fuzzy Clustering with Partial Supervision》;Witold Pedrycz et al;;《IEEE TRANSACTIONS ON SYSTEMS,》;19971031;第787-795页; *

Also Published As

Publication number Publication date
CN111709478A (zh) 2020-09-25

Similar Documents

Publication Publication Date Title
Armanfard et al. Local feature selection for data classification
CA2312902C (en) Visualization and self-organization of multidimensional data through equalized orthogonal mapping
CN111291139A (zh) 基于注意力机制的知识图谱长尾关系补全方法
Ding et al. A multiway p-spectral clustering algorithm
CN103985112B (zh) 基于改进多目标粒子群优化聚类的图像分割方法
CN111062428A (zh) 一种高光谱图像的聚类方法、系统及设备
CN108846261B (zh) 基于可视图算法的基因表达时序数据分类方法
CN111128301A (zh) 一种基于模糊聚类的重叠蛋白质复合物识别方法
CN111709478B (zh) 一种基于锚图的模糊聚类方法及装置
CN108921853B (zh) 基于超像素和免疫稀疏谱聚类的图像分割方法
Geng et al. Local-density subspace distributed clustering for high-dimensional data
Krishnan et al. A modified Kohonen map algorithm for clustering time series data
CN114841055A (zh) 一种基于生成对抗网络的无人机集群任务预分配方法
CN111753904A (zh) 一种快速高光谱图像聚类方法、装置、设备及介质
Yildiz et al. Comparison of dimension reduction techniques on high dimensional datasets.
Paul et al. Kernel k-means, by all means: Algorithms and strong consistency
CN115984595A (zh) 一种基于拉普拉斯秩约束的多元图聚类方法
CN113378900B (zh) 一种基于聚类的大规模不规则kpi时间序列的异常检测方法
Dalatu et al. Hybrid distance functions for K-Means clustering algorithms
CN109614581A (zh) 基于对偶局部学习的非负矩阵分解聚类方法
CN114429404A (zh) 一种多模异质社交网络社区发现方法
Zheng et al. Improving pattern discovery and visualisation with self-adaptive neural networks through data transformations
CN113611368A (zh) 基于2d嵌入的半监督单细胞聚类方法、装置、计算机设备
CN109978066B (zh) 基于多尺度数据结构的快速谱聚类方法
Priam Symmetric Generative Methods and tSNE: A Short Survey.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant