CN108154157B - 一种基于集成的快速谱聚类方法 - Google Patents

一种基于集成的快速谱聚类方法 Download PDF

Info

Publication number
CN108154157B
CN108154157B CN201711278376.9A CN201711278376A CN108154157B CN 108154157 B CN108154157 B CN 108154157B CN 201711278376 A CN201711278376 A CN 201711278376A CN 108154157 B CN108154157 B CN 108154157B
Authority
CN
China
Prior art keywords
spectral clustering
feature vector
color
result
entries
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711278376.9A
Other languages
English (en)
Other versions
CN108154157A (zh
Inventor
王晓春
常晨昱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201711278376.9A priority Critical patent/CN108154157B/zh
Publication of CN108154157A publication Critical patent/CN108154157A/zh
Application granted granted Critical
Publication of CN108154157B publication Critical patent/CN108154157B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于集成的快速谱聚类方法,输入图片,然后划定移动窗口,使移动窗口在水平或者垂直方向上平移,将输入的每张图片划分为若干块;对得到的分块的HSV颜色空间进行颜色直方图统计,提取颜色特征向量;将获取到的每张图的颜色特征向量作为谱聚类的输入,得到每张图片的谱聚类结果,得到相应颜色向量的label值;使用BIRCH分类树对步骤3中被label值标记的颜色特征向量分类;使用BIRCH分类树结果对谱聚类的结果进行集成;将集成后的label值通过不同的颜色进行标记,得到图片分割的结果。本方法通过BIRCH分类树,将谱聚类的结果修正,得到的聚类效果更好。

Description

一种基于集成的快速谱聚类方法
技术领域
本发明属于物体识别技术领域,具体涉及一种基于集成的快速谱聚类方法。
背景技术
在自主式机器人系统里仍在继续解决的问题就是,物体识别问题,即如何使机器人感知系统能够识别出其中的物体,从而进行相应的环境建模功能的实现。传统谱聚类存在着它自身的问题:1)相关参数及相似度矩阵构建并不能通过统一方式确定;2)由于要对数据集中的所有数据进行两两之间的距离计算来构建距离矩阵时间与空间复杂度都不容忽视,当数据规模上升时,数据不能一次载入内存;3)构造一个数据集大小为Q的相似度矩阵并计算它的特征值与特征向量带来的计算复杂度通常为O(n3),在实际应用中,在数量级超过千级的时候,谱聚类就开始逐渐不可使用了。
Donghui Yan等人提出一种快速谱聚类方法。首先对输入数据使用K-means算法进行聚类,得到k个簇,计算得到所有簇的聚类中心;然后建立数据与簇中心的对应表;最后使用谱聚类算法对得到的聚类中心进行聚类,得到相应的label值,并通过对应表,将label值标记到每条数据,此方法虽然加快了谱聚类的聚类速度,但是导致了聚类精度的下降。
发明内容
本发明的目的在于提供一种基于集成的快速谱聚类方法,以克服现有技术的缺陷,本发明运行时间更短,资源占用更小,准确率更高,相对于KASP方法,本方法通过BIRCH分类树,将谱聚类的结果修正,得到的聚类效果更好。
为达到上述目的,本发明采用如下技术方案:
一种基于集成的快速谱聚类方法,包括以下步骤:
步骤1:输入图片,然后划定移动窗口,使移动窗口在水平或者垂直方向上平移,将输入的每张图片划分为若干块;
步骤2:对得到的分块的HSV颜色空间进行颜色直方图统计,提取颜色特征向量;
步骤3:将获取到的每张图的颜色特征向量作为谱聚类的输入,得到每张图片的谱聚类结果,得到相应颜色特征向量的label值;
步骤4:使用BIRCH分类树对步骤3中被label值标记的颜色特征向量分类;
步骤5:使用BIRCH分类树结果对谱聚类的结果进行集成;
步骤6:将集成后的label值通过不同的颜色进行标记,得到图片分割的结果。
进一步地,步骤1中移动窗口的尺寸为10×10。
进一步地,步骤2具体为:将HSV颜色空间的色度H均匀地分割为15个区间,而将饱和度S和亮度V均匀地分割为4个区间,则每一个色彩都被分成了三部分:15个取值的色度,4个取值的饱和度与4个取值的亮度,所有区间的排列组合能够生成240种不同的颜色组合,然后将移动窗口中的所有像素分配到对应的组合中,得到一个高度稀疏的特征向量f。
进一步地,步骤3具体包括:
步骤3.1:计算得到的特征向量的相似度矩阵S,由相似度矩阵S构建度矩阵DU和邻接矩阵W;
步骤3.2:根据公式L=DU-1L=I-DU-1W,计算拉普拉斯矩阵L;
步骤3.3:求解拉普拉斯矩阵L的特征值,并从小到大排序,取前k小的特征值并存储与之对应的特征向量v1,v2,v3,...,vk
步骤3.4:将前k小特征值对应的特征向量依次排列,组成n×k的矩阵F,其中n为提取到的特征向量的总数,k为前k小特征值对应特征向量的个数,即矩阵的维度;
步骤3.5:利用K-means聚类算法将步骤3.4中得到的矩阵F中数据聚成k簇C1,C2,C3,...,Ck
进一步地,步骤4具体包括:
步骤4.1:从通过谱聚类得到的label值标记过的特征向量中扫描一条,从根节点起按照最小距离原则递归下降至叶结点;
步骤4.2:判断该叶结点中与步骤4.1中得到的特征向量最近的CF条目是否能吸收步骤4.1中得到的特征向量,具体是判断CF条目与步骤4.1中得到的特征向量的CF条目的直径D是否小于阈值T;
步骤4.3:如果CF条目与步骤4.1中得到的特征向量的CF条目的直径D小于阈值,且该叶结点仍有空间接受步骤4.1中得到的特征向量的CF条目,即该叶结点的CF数目小于分支因子B,分支因子B表示树节点容纳的最大CF数,则添加步骤4.1中得到的特征向量的CF条目至该叶结点的CF列表,更新从根节点到该叶结点路径上所有的CF信息;如果CF条目与步骤4.1中得到的特征向量的CF条目的直径D小于阈值,该叶结点的CF数目大于分支因子B,则分裂该叶结点:选取该叶结点的所有CF条目和步骤4.1中得到的特征向量的CF中最远的两个CF条目作为种子结点,将这两个种子结点作为原结点的父结点的新子结点,再将剩余CF条目按距离最小原则重新分配到新的叶结点中,删除原叶结点,并更新树,当根节点分裂时,树高增加一层,如果CF条目与步骤4.1中得到的特征向量的CF条目的直径D大于阈值,则重复进行步骤4.1;
步骤4.4:将得到叶结点结果作为分类结果;
其中CF为聚类特征,是总结一个簇的信息的三元组,定义如下:给定处于同一簇的m个d维数据点{x1,x2,x3,...,xm}组成的集合X,聚类特征向量
Figure GDA0002483169550000031
其中m是簇中数据点的数量,
Figure GDA0002483169550000032
是簇内所有数据点的线性和,即
Figure GDA0002483169550000041
Figure GDA0002483169550000042
是簇内所有数据点的平方和,即
Figure GDA0002483169550000043
Figure GDA0002483169550000044
对应的簇中心x0,半径R,直径D的公式如下:
Figure GDA0002483169550000045
Figure GDA0002483169550000046
Figure GDA0002483169550000047
其中,SSi代表
Figure GDA0002483169550000048
的第i维数值,LSi代表
Figure GDA0002483169550000049
的第i维数值。
进一步地,步骤5具体为:根据步骤4BIRCH分类树得到的label值对谱聚类的结果进行修正和集成,将特征向量依次插入BIRCH树中时,通过特征向量之间的距离与阈值T的比较,如果特征向量之间的距离小于阈值T,则与已有簇合并,否则,得到新的类。
进一步地,阈值T的确定步骤为:
A、对于每张图片提取到的特征向量数#FV为:
width=(Width-N)/M+1
height=(Height-N)/M+1
#FV=width×height;
B、计算每个图像中提取的特征向量与特征向量搜索树中的近似最近邻之间的距离dFV,j,通过下式确定阈值:
Figure GDA00024831695500000410
其中l为读取的图片数量,dFV,j为第j个特征向量与其近似最近邻之间的距离。
进一步地,步骤6具体包括:
步骤6.1:设定一个包含RGB颜色值的数组;
步骤6.2:将不同的RGB值赋值给不同的label值;
步骤6.3:使用label对应的RGB值标记出图片不同的物体,得到分割结果。
与现有技术相比,本发明具有以下有益的技术效果:
本发明方法首先将大规模数据集分解成单个计算机能够接受的处理单元,并对各处理单元依次进行谱聚类,最终通过BIRCH算法对聚类结果进行合并,使得单个计算机可以对大规模数据集实施谱聚类算法,极大地降低了谱聚类算法对内存大小的要求,明显地提升了谱聚类算法的速度和准确度。
附图说明
图1是本发明方法流程图;
图2是本发明方法第一对比图;
图3是本发明方法第二对比图;
图4是本发明方法第三对比图;
图5是本发明方法第四对比图;
图6是本发明方法第五对比图;
图7是本发明方法第六对比图;
图8是本发明方法第七对比图;
图9是本发明方法第八对比图;
图10是本发明方法第九对比图;
图11是本发明方法第十对比图;
图12是本发明方法第十一对比图;
图13是本发明方法第十二对比图;
图14是本发明方法第十三对比图;
图15是本发明方法第十四对比图;
图16是本发明方法第十五对比图;
图17是本发明方法第十六对比图;
图18是本发明方法第十七对比图;
图19是本发明方法第十八对比图;
图20是本发明方法第十九对比图;
图21是本发明方法第二十对比图;
图22是本发明方法第二十一对比图;
图23是本发明方法第二十二对比图;
图24是本发明方法第二十三对比图;
图25是本发明方法第二十四对比图;
图26是本发明方法第二十五对比图。
其中,图2-图26中(a)均为原图,(b)均为本发明方法结果图,(c)均为对比方法KASP结果图。
具体实施方式
下面对本发明作进一步详细描述:
如图1所示,本方法运行环境为:
系统环境:Windows10专业版
硬件环境:Intel i5-7300HQ 2.5GHZ,8GB RAM
开发环境:Python3.5.2,Pycharm 2017.1
输入:自行采集的图片数据集。
1)划定10×10的移动窗口,窗口在水平或者垂直方向上平移将输入的每张图片划分为多个小块:
2)对得到的分块的HSV颜色空间进行颜色直方图统计,提取颜色特征向量:
步骤2)具体为:
色度H被均匀地分割为15个区间,而饱和度S和亮度V被均匀地分割为4个区间。至此,每一个色彩都被分成了三部分:有15个取值的色度,有4个取值的饱和度与同样有4个取值的亮度,所有区间的排列组合可以生成240种不同的颜色可能。然后将移动窗口中的所有像素分配到对应的可能中,得到一个高度稀疏的特征向量f(颜色直方图)。
3)将获取到的每张图的颜色特征向量作为谱聚类的输入,得到每张图片的谱聚类结果,得到相应颜色特征向量的label值;
步骤3)具体为:
A、计算得到的特征向量的相似度矩阵S,由相似度矩阵S构建度矩阵DU,邻接矩阵W;
B、根据公式L=DU-1L=I-DU-1W,计算拉普拉斯矩阵;
其中L为拉普拉斯矩阵,DU为度矩阵,W为邻接矩阵
C、求解拉普拉斯矩阵L的特征值,并从小到大排序,取前k小的特征值并存储与之对应的特征向量v1,v2,v3,...,vk
D、将前k小特征值对应的特征向量依次排列,组成n×k的矩阵F其中n为提取到的特征向量的总数,k为前k小特征值对应特征向量的个数,即矩阵的维度;
E、利用K-means聚类算法将步骤3.4中得到的矩阵F中数据聚成k簇C1,C2,C3,...,Ck
4)使用BIRCH分类树对步骤3)中被label值标记的颜色向量进行分类;
步骤4)具体为:
A、从通过谱聚类得到的label值标记过的的特征向量中扫描一条,从根节点起按照最小距离原则递归下降至叶结点;
B、判断该叶结点中与新的数据最近的CF条目是否能吸收步骤4.1中得到的特征向量(判断该CF条目与步骤4.1中得到的特征向量的CF条目的指标是否小于T,如直径D是否小于阈值T);
C、如果CF条目与步骤4.1中得到的特征向量的CF条目的直径D小于阈值,且该叶结点仍有空间接受步骤4.1中得到的特征向量的CF条目,即该叶结点的CF数目小于分支因子B,分支因子B表示树节点容纳的最大CF数,则添加步骤4.1中得到的特征向量的CF条目至该叶结点的CF列表,更新从根节点到该叶结点路径上所有的CF信息;如果CF条目与步骤4.1中得到的特征向量的CF条目的直径D小于阈值,该叶结点的CF数目大于分支因子B,则分裂该叶结点:选取该叶结点的所有CF条目和步骤4.1中得到的特征向量的CF中最远的两个CF条目作为种子结点,将这两个种子结点作为原结点的父结点的新子结点,再将剩余CF条目按距离最小原则重新分配到新的叶结点中,删除原叶结点,并更新树,当根节点分裂时,树高增加一层,如果CF条目与步骤4.1中得到的特征向量的CF条目的直径D大于阈值,则重复进行步骤A;
D、将得到叶子结点结果作为分类结果。
其中CF为聚类特征,是总结一个簇的信息的三元组,定义如下:给定处于同一簇的m个d维数据点{x1,x2,x3,...,xm}组成的集合X,聚类特征向量
Figure GDA0002483169550000081
其中m是簇中数据点的数量,
Figure GDA0002483169550000082
是簇内所有数据点的线性和,即
Figure GDA0002483169550000083
Figure GDA0002483169550000084
是簇内所有数据点的平方和,即
Figure GDA0002483169550000085
对应的簇中心x0,半径R,直径D的公式如下:
Figure GDA0002483169550000086
Figure GDA0002483169550000087
Figure GDA0002483169550000091
其中,SSi代表
Figure GDA0002483169550000092
的第i维数值,LSi代表
Figure GDA0002483169550000093
的第i维数值。
5)使用BIRCH分类树结果对谱聚类的结果进行集成;
步骤5)具体为:
A、获取到步骤1)和步骤4)中的label值;
B、根据步骤4)BIRCH分类树得到的label值对谱聚类的结果进行修正和集成,将特征向量依次插入BIRCH树中时,通过特征向量之间的距离与阈值T的比较,判断对于之前已插入特征向量的新的特征向量是否与已有簇合并,从而决定得到新的类还是并入已有类中。如果特征向量之间的距离小于阈值T,则与已有簇合并,否则,得到新的类。
其中阈值的确定步骤为:
a、对于每张图片提取到的特征向量数#FV为:
width=(Width-N)/M+1
height=(Height-N)/M+1
#FV=width×height
其中Width为图片宽度,Height为图片长度,M为移动窗口的移动值。
b、对于阈值的确定,我们计算每个图像中提取的特征向量与特征向量搜索树中的近似最近邻之间的距离dFV,j,通过下式确定阈值:
Figure GDA0002483169550000094
其中l为读取的图片数量,dFV,j为第j个特征向量与其近似最近邻之间的距离,阈值为特征向量与最近邻之间距离的均值与1.5个标准差之和。
6)将集成后的label值通过不同的颜色进行标记,得到图片分割的结果。
步骤6)具体为:
A、设定一个包含RGB颜色值的数组;
B、将不同的RGB值赋值给不同的label值;
使用label对应的RGB值标记出图片不同的物体,得到分割结果。
下面对本发明的实施过程作进一步描述:
如图2至26,通过对比图,可以看出,本方法的聚类准确度更高。
对于图6、7、10,本方法对于树荫部分的聚类效果更好,KASP方法将树荫部分分为了两类,本方法将树荫分为一类,更符合实际情况。
对于图11、12,本方法对于路面上的井盖识别更加准确,KASP没有标记出路面上的井盖,而本方法将路面上的井盖较为准确地标记出来。
对于Berkeley数据集,图17、18,对于图中的建筑,本方法得到的建筑结果轮廓更加清晰,建筑中的柱子都准确地分割出来;图22中,本方法得到圆顶建筑的中具体的子建筑的分割结果,而对比方法KASP没有将具体的子建筑分割出来;图23中,本方法将天空中的白云准确地分割出来,KASP没有达到这个效果;对于图19、图20、图21以及图24至图26,本方法得到的结果轮廓更加清晰,在对于天空、地面等面积较大的物体的聚类结果更加准确;KASP对于天空、地面等面积较大的物体,得到了多个类,结果并不准确。
本方法通过摄像头采集关于场景的多张图像,并进而在计算机上对图像进行颜色特征提取及基于谱聚类算法的分割处理,以便对目标物体进行自主识别。与传统的聚类算法相比,谱聚类算法不仅能够对非凸分布的样本空间聚类,而且对数据的维度不敏感,因而极大地丰富了聚类分析的研究内容,然而谱聚类算法对数据集的大小非常敏感,为了对大量提取的特征进行谱聚类,面临的问题是此算法的高时间及空间复杂度。本方法通过摄像头采集关于场景的多张图像,并进而在计算机上对图像进行颜色特征提取及基于谱聚类算法的分割处理,以便对目标物体进行自主识别。与传统的聚类算法相比,本发明的谱聚类算法不仅能够对非凸分布的样本空间聚类,而且对数据的维度不敏感,因而极大地丰富了聚类分析的研究内容。

Claims (8)

1.一种基于集成的快速谱聚类方法,其特征在于,包括以下步骤:
步骤1:输入图片,然后划定移动窗口,使移动窗口在水平或者垂直方向上平移,将输入的每张图片划分为若干块;
步骤2:对得到的分块的HSV颜色空间进行颜色直方图统计,提取颜色特征向量;
步骤3:将获取到的每张图的颜色特征向量作为谱聚类的输入,得到每张图片的谱聚类结果,得到相应颜色特征向量的label值;
步骤4:使用BIRCH分类树对步骤3中被label值标记的颜色特征向量分类;
步骤5:使用BIRCH分类树结果对谱聚类的结果进行集成;
步骤6:将集成后的label值通过不同的颜色进行标记,得到图片分割的结果。
2.根据权利要求1所述的一种基于集成的快速谱聚类方法,其特征在于,步骤1中移动窗口的尺寸为10×10。
3.根据权利要求1所述的一种基于集成的快速谱聚类方法,其特征在于,步骤2具体为:将HSV颜色空间的色度H均匀地分割为15个区间,而将饱和度S和亮度V均匀地分割为4个区间,则每一个色彩都被分成了三部分:15个取值的色度,4个取值的饱和度与4个取值的亮度,所有区间的排列组合能够生成240种不同的颜色组合,然后将移动窗口中的所有像素分配到对应的组合中,得到一个高度稀疏的特征向量f。
4.根据权利要求1所述的一种基于集成的快速谱聚类方法,其特征在于,步骤3具体包括:
步骤3.1:计算得到的特征向量的相似度矩阵S,由相似度矩阵S构建度矩阵DU和邻接矩阵W;
步骤3.2:根据公式L=DU-1L=I-DU-1W,计算拉普拉斯矩阵L;
步骤3.3:求解拉普拉斯矩阵L的特征值,并从小到大排序,取前k小的特征值并存储与之对应的特征向量v1,v2,v3,...,vk
步骤3.4:将前k小特征值对应的特征向量依次排列,组成n×k的矩阵F,其中n为提取到的特征向量的总数,k为前k小特征值对应特征向量的个数,即矩阵的维度;
步骤3.5:利用K-means聚类算法将步骤3.4中得到的矩阵F中数据聚成k簇C1,C2,C3,...,Ck
5.根据权利要求1所述的一种基于集成的快速谱聚类方法,其特征在于,步骤4具体包括:
步骤4.1:从通过谱聚类得到的label值标记过的特征向量中扫描一条,从根节点起按照最小距离原则递归下降至叶结点;
步骤4.2:判断该叶结点中与步骤4.1中得到的特征向量最近的CF条目是否能吸收步骤4.1中得到的特征向量,具体是判断CF条目与步骤4.1中得到的特征向量的CF条目的直径D是否小于阈值T;
步骤4.3:如果CF条目与步骤4.1中得到的特征向量的CF条目的直径D小于阈值,且该叶结点仍有空间接受步骤4.1中得到的特征向量的CF条目,即该叶结点的CF数目小于分支因子B,分支因子B表示树节点容纳的最大CF数,则添加步骤4.1中得到的特征向量的CF条目至该叶结点的CF列表,更新从根节点到该叶结点路径上所有的CF信息;如果CF条目与步骤4.1中得到的特征向量的CF条目的直径D小于阈值,该叶结点的CF数目大于分支因子B,则分裂该叶结点:选取该叶结点的所有CF条目和步骤4.1中得到的特征向量的CF中最远的两个CF条目作为种子结点,将这两个种子结点作为原结点的父结点的新子结点,再将剩余CF条目按距离最小原则重新分配到新的叶结点中,删除原叶结点,并更新树,当根节点分裂时,树高增加一层,如果CF条目与步骤4.1中得到的特征向量的CF条目的直径D大于阈值,则重复进行步骤4.1;
步骤4.4:将得到叶结点结果作为分类结果;
其中CF为聚类特征,是总结一个簇的信息的三元组,定义如下:给定处于同一簇的m个d维数据点{x1,x2,x3,...,xm}组成的集合X,聚类特征向量
Figure FDA0002483169540000031
其中m是簇中数据点的数量,
Figure FDA0002483169540000032
是簇内所有数据点的线性和,即
Figure FDA0002483169540000033
Figure FDA0002483169540000034
是簇内所有数据点的平方和,即
Figure FDA0002483169540000035
对应的簇中心x0,半径R,直径D的公式如下:
Figure FDA0002483169540000036
Figure FDA0002483169540000037
Figure FDA0002483169540000038
其中,SSi代表
Figure FDA0002483169540000039
的第i维数值,LSi代表
Figure FDA00024831695400000310
的第i维数值。
6.根据权利要求5所述的一种基于集成的快速谱聚类方法,其特征在于,步骤5具体为:根据步骤4BIRCH分类树得到的label值对谱聚类的结果进行修正和集成,将特征向量依次插入BIRCH树中时,通过特征向量之间的距离与阈值T的比较,如果特征向量之间的距离小于阈值T,则与已有簇合并,否则,得到新的类。
7.根据权利要求6所述的一种基于集成的快速谱聚类方法,其特征在于,阈值T的确定步骤为:
A、对于每张图片提取到的特征向量数#FV为:
width=(Width-N)/M+1
height=(Height-N)/M+1
#FV=width×height;
B、计算每个图像中提取的特征向量与特征向量搜索树中的近似最近邻之间的距离dFV,j,通过下式确定阈值:
Figure FDA0002483169540000041
其中l为读取的图片数量,dFV,j为第j个特征向量与其近似最近邻之间的距离。
8.根据权利要求1所述的一种基于集成的快速谱聚类方法,其特征在于,步骤6具体包括:
步骤6.1:设定一个包含RGB颜色值的数组;
步骤6.2:将不同的RGB值赋值给不同的label值;
步骤6.3:使用label对应的RGB值标记出图片不同的物体,得到分割结果。
CN201711278376.9A 2017-12-06 2017-12-06 一种基于集成的快速谱聚类方法 Active CN108154157B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711278376.9A CN108154157B (zh) 2017-12-06 2017-12-06 一种基于集成的快速谱聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711278376.9A CN108154157B (zh) 2017-12-06 2017-12-06 一种基于集成的快速谱聚类方法

Publications (2)

Publication Number Publication Date
CN108154157A CN108154157A (zh) 2018-06-12
CN108154157B true CN108154157B (zh) 2020-07-28

Family

ID=62466110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711278376.9A Active CN108154157B (zh) 2017-12-06 2017-12-06 一种基于集成的快速谱聚类方法

Country Status (1)

Country Link
CN (1) CN108154157B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111476253B (zh) * 2019-01-23 2024-04-02 阿里巴巴集团控股有限公司 服装图像分类、图像分类方法、装置及设备
CN110070121B (zh) * 2019-04-15 2021-08-10 西北工业大学 一种基于树策略与平衡k均值聚类的快速近似k近邻方法
CN111383239B (zh) * 2020-02-24 2022-06-03 上海航天控制技术研究所 基于迭代搜索的火星图像误边缘剔除及轮廓精确拟合方法
CN111752391A (zh) * 2020-06-30 2020-10-09 广州志胜游艺设备有限公司 一种虚拟互动方法及计算机可读存储介质
CN112132212B (zh) * 2020-09-22 2022-08-09 福州大学 一种容忍异常原料的木材原料选色方法
CN113554074A (zh) * 2021-07-09 2021-10-26 浙江工贸职业技术学院 一种基于分层Laplace的图像特征分析方法
CN117034051B (zh) * 2023-07-27 2024-05-03 广东省水利水电科学研究院 基于birch算法的水利信息聚合方法、装置及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751666A (zh) * 2009-10-16 2010-06-23 西安电子科技大学 基于谱聚类的半监督多光谱遥感图像分割方法
CN102982338A (zh) * 2012-10-25 2013-03-20 西安电子科技大学 基于谱聚类的极化sar图像分类方法
CN103426175A (zh) * 2013-08-23 2013-12-04 西安电子科技大学 基于特征值度量谱聚类的极化sar图像分割方法
CN104778666A (zh) * 2015-04-14 2015-07-15 哈尔滨工程大学 一种基于谱聚类和混合模型聚类的图像分割方法
JP2017027592A (ja) * 2015-07-23 2017-02-02 三菱電機株式会社 画像をセグメント化する方法およびシステム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751666A (zh) * 2009-10-16 2010-06-23 西安电子科技大学 基于谱聚类的半监督多光谱遥感图像分割方法
CN102982338A (zh) * 2012-10-25 2013-03-20 西安电子科技大学 基于谱聚类的极化sar图像分类方法
CN103426175A (zh) * 2013-08-23 2013-12-04 西安电子科技大学 基于特征值度量谱聚类的极化sar图像分割方法
CN104778666A (zh) * 2015-04-14 2015-07-15 哈尔滨工程大学 一种基于谱聚类和混合模型聚类的图像分割方法
JP2017027592A (ja) * 2015-07-23 2017-02-02 三菱電機株式会社 画像をセグメント化する方法およびシステム

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Fast Approximate Spectral Clustering;Donghui Yan et al.;《Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining》;20091231;第1-23页 *
图像分割的谱聚类算法集成;贾建华 等;《西安交通大学学报》;20100630;第44卷(第6期);第93-98页 *
基于BIRCH和GAD的谱聚类算法研究;丁光华;《中国优秀硕士学位论文全文数据库 信息科技辑》;20101015;第I140-75页 *
基于改进的SOM聚类连续属性离散化算法;陶刚 等;《计算机应用》;20150620;第35卷(第S1期);第89-92页 *

Also Published As

Publication number Publication date
CN108154157A (zh) 2018-06-12

Similar Documents

Publication Publication Date Title
CN108154157B (zh) 一种基于集成的快速谱聚类方法
US9824294B2 (en) Saliency information acquisition device and saliency information acquisition method
CN104599275B (zh) 基于概率图模型的非参数化的rgb-d场景理解方法
CN110163239B (zh) 一种基于超像素和条件随机场的弱监督图像语义分割方法
WO2020206850A1 (zh) 基于高维图像的图像标注方法和装置
Sajjad et al. Integrating salient colors with rotational invariant texture features for image representation in retrieval systems
WO2023083059A1 (zh) 一种路面缺陷检测方法、装置、电子设备和可读存储介质
US9530218B2 (en) Method for classification and segmentation and forming 3D models from images
CN106933816A (zh) 基于全局特征和局部特征的跨镜头目标检索系统及方法
Almogdady et al. A flower recognition system based on image processing and neural networks
WO2017181892A1 (zh) 前景分割方法及装置
CN110866896A (zh) 基于k-means与水平集超像素分割的图像显著性目标检测方法
CN109145964B (zh) 一种实现图像颜色聚类的方法和系统
CN111310768B (zh) 基于鲁棒性背景先验和全局信息的显著性目标检测方法
Cheng et al. Urban road extraction via graph cuts based probability propagation
CN112287935B (zh) 一种基于显著性先验的图像语义分割方法及系统
CN111510792B (zh) 基于自适应加权图差异分析的视频摘要生成方法及系统
Alvarado-Robles et al. An approach for shadow detection in aerial images based on multi-channel statistics
Lu et al. Spectral segmentation via midlevel cues integrating geodesic and intensity
CN111062393B (zh) 一种基于谱聚类的自然场景汉字分割方法
CN112037230B (zh) 一种基于超像素和超度量轮廓图的林区图像分割方法
CN111161282B (zh) 基于深度种子的图像多层次分割的目标尺度选择方法
Pan et al. Incrementally detecting moving objects in video with sparsity and connectivity
Aoulalay et al. Classification of Moroccan decorative patterns based on machine learning algorithms
Hu et al. Automatic spectral video matting

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant