CN111428764A - 一种用于图像类别识别的图像聚类方法 - Google Patents

一种用于图像类别识别的图像聚类方法 Download PDF

Info

Publication number
CN111428764A
CN111428764A CN202010185125.1A CN202010185125A CN111428764A CN 111428764 A CN111428764 A CN 111428764A CN 202010185125 A CN202010185125 A CN 202010185125A CN 111428764 A CN111428764 A CN 111428764A
Authority
CN
China
Prior art keywords
image
clustering
unit
rectangle
thiessen polygon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010185125.1A
Other languages
English (en)
Other versions
CN111428764B (zh
Inventor
刘丹
任志愿
赵明
吴超
史梦雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010185125.1A priority Critical patent/CN111428764B/zh
Publication of CN111428764A publication Critical patent/CN111428764A/zh
Application granted granted Critical
Publication of CN111428764B publication Critical patent/CN111428764B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification

Abstract

本发明公开了一种用于图像类别识别的图像聚类方法,属于于图像处理技术领域。本发明通过基于泰森多边形的k均值算法改进,达到更精准和高效地实现数据对象聚类和区分数据对象之间的不同,通过基于加权平均值法的k均值算法改进,进一步提高聚类效率,通过基于主成分分析法的k均值算法改进,把多维的数据特征降维,以方便使用泰森多边形初始化,最终得到改进的k均值算法,从而基于该改进的k均值算法实现本发明的图像聚类处理,提升图像的管理和检索性能。

Description

一种用于图像类别识别的图像聚类方法
技术领域
本发明属于图像处理技术领域,具体涉及一种用于图像类别识别的图像聚类方法。
背景技术
在如今信息高度膨胀的社会,数字图像信息迅猛增加。如何对海量的图像数据进行高效的查询和处理,并获得有价值的数据信息至关重要。在图像检索处理时,为了提升检索效率,会应用到图像类别识别处理,即首先对图像库中的图像进行聚类处理,例如k均值聚类,将图像库聚类为K个大类;图像检索处理时,先实现待检索图像的图像类别识别处理,即粗略检索(即在K个大类的中心点图像中查询与当前待检索图像最相似的中心点图像),然后再与待检索图像最相似的类簇中对图像进行遍历检索,获取图像检索结果。
目前,对聚类算法的研究包括算法性能的改进、适用于特定数据的聚类算法研究、聚类数目的确定、初始聚类中心的选择、聚类效果的评价指标等多种研究方向。
k均值聚类算法,是一种无监督的聚类方法,是可以处理大量个案的算法,它也是通过逐步将样本不断靠近中心点,又称逐步样本聚类算法。根据选定的中心点尝试发现相对近似的个案组的分析过程。分析方法有几个优点,相对于分层方法,算法相对简单,算法效率较高。算法受欢迎的原因一个在于它易于解释、实现简单、收敛速度快、对稀疏数据的适应性强。另一个优点是它在接受测量距离方面的灵活性。K-means的主要缺点是,当数据中有异常值时,可能会得到扭曲的结果,即单个异常值可以显著增加平方误差。然后,这些更典型的对象将被划分为非常少的组,但是异常值将被放在非常小甚至单个的集群中。
在k均值聚类处理时,给定一个数据集U,记为U={N1,N2,N3,…,Nn},其中Ni(i=1,2,…,n)一般是指元组或者记录。设置K为参数,将数据集中的n个元组或记录分成K个聚类组,其中K<n,以使各个聚类组组内达到较高的相似度,而各组间具有最大的差异性。聚类得到的这K个分组需要满足以下几个条件:每个分组中的数据元组或者记录数必须大于零;每个数据元组或者记录有且仅属于一个分组。
从数据集U={N1,N2,N3,…,Nn}中任意选择K个对象作为初始质心,即所期望的聚类簇个数;而将数据集中其余对象指派到离它们最近的质心所在的聚类组中,其中“最近”是指它们与其中一个聚类中心的相似度最高或者说距离(一般指欧氏距离)最短;根据所得的聚类簇,重新计算每个聚类簇的新质心,即该聚类簇中所有对象的均值;不断重复上述的指派和更新质心的过程,直到聚类质心不在发生任何变化或者标准测度函数开始收敛,则结束聚类。一般标准测度函数是指均方差,即准则函数。
但是,由于经典k均值聚类算法中初始聚类数目和初始聚类中心点选取困难,从而导致基于k均值聚类算法的图像聚类处理的准确性和效率有待于进一步提升。
发明内容
本发明的发明目的在于:针对上述存在的问题,对k均值聚类方式进行了改进,从而基于改进的k均值聚类方式,根据图像的像素特征,实现对图像的聚类处理,使得相似度高的图像归为一类,从而提升图像的管理和检索性能。
本发明的用于图像类别识别的图像聚类方法包括下列步骤:
步骤S1:对待处理的图像进行降维处理:
步骤S101:对待处理的图像的像素值进行归一化处理;其中,待处理的图像的尺寸相同,图像尺寸表示为n×m;
步骤S102:计算每幅图像的相关系数矩阵:
第q幅图像的相关系数矩阵
Figure BDA0002413906670000021
其中,xki、xkj分别表示第q幅图像的第k行第i列、第k行第j列的像素值,
Figure BDA0002413906670000022
表示分别表示图像q的第i列、第j列的像素均值,i,j=1,2,…,m;
步骤S103:基于主成分分析得到降维后的图像数据:
计算相关系数矩阵Rq的特征根并降序排列:λ12,…,λm
将与m个特征值λ12,…,λm对应的特征向量记为:αj=[α1j α2j … αmj]T,其中j=1,2,…,m;
根据公式yij=α1jxi12jxi2+…+αmjxim计算主成分yij,其中i=1,2,…,n,j=1,2,…,m;
计算每个特征值λj的累计贡献率
Figure BDA0002413906670000023
筛选累计贡献率SCRj大于或等于累计贡献率阈值δthr的特征值,再从筛选出的特征值中的选取前两个最大特征值并将对应特征向量记为α1,α2
分别将α1和α2对应的主成分的均值记为yq1、yq2,从而得到第q个图像降维后的图像数据Yq={yq1,yq2}。
步骤S2:基于泰森多边形对待聚类的图像集进行聚类处理:
步骤S201:基于降维后的图像数据构建泰森多边形:
将图像数据Yq={yq1,yq2}作为数据点q,其中yq1,yq2用于标识数据点q的位置坐标;
在数据点q所在的二维平面内构建矩形E,且所有待聚类的图像数据Yq所对应的数据点均位于矩形E中;
在所有降维后的图像数据集所构成的二维平面α内,构建一个矩形E,所有待聚类的图像数据Yq位于所述矩形E内;
在点q所在的二维平面内构建泰森多边形,且各个泰森多边形单元的母点均在矩形E中;
步骤S202:遍历泰森多边形中的边缘单元,确定泰森多边形单元的顶点集:
对当前边缘单元Vi,连接边缘单元Vi和其相邻单元Vi+1的母点,将母点的连线的斜率记为k1;以及将边缘单元Vi和其相邻单元Vi+1的公共边的斜率记为k2
若k2>k1,则边缘单元Vi和其相邻单元Vi+1的公共边和矩形E相交,计算边缘单元Vi和其相邻单元Vi+1与矩形E的公共交点并加入边缘单元Vi的顶点集中;若k2≤k1,则将该公共边与矩形E交点加入Vi+1单元的顶点集中;其中单元的顶点集的初始值为空集;
其中,若边缘单元与矩形E的交点位于不同的边上,则将边缘单元与矩形E的所有交点加入当前边缘单元的顶点集中;
步骤S203:基于泰森多边形设置初始聚类数和初始聚类中心点:
计算当前泰森多边形的每个泰森多边形单元的单元密度系数,若存在单元密度系数小于预置的密度系数阈值,则将单元密度系数大于或等于密度系数阈值的泰森多边形单元的质心为新的母点重新生成新的泰森多边形;
若当前泰森多边形的每个泰森多边形单元的单元密度系数均大于或等于密度系数阈值,则保留当前泰森多边形,否则继续重新生成新的泰森多边形;
将保留的泰森多边形的单元个数作为聚类数目k,并将每个泰森多边形单元的母点作为初始聚类中心点D1,D2,…,Dk
其中,单元密度系数为:单元密度与参数ρrectangle的比值,
Figure BDA0002413906670000041
d表示矩形区域中全部的数据点数,Srectangle表示矩形E的面积;单元密度为泰森多边形单元包括的数据点数与其面积的比值;
步骤S204:基于确定的聚类数目k、以及初始聚类中心点D1,D2,…,Dk,通过k均值聚类法对所有图像数据Yq进行聚类处理,得到k个聚类结果;
再将当前k个聚类结果转换为对应的原始图像,得到待处理的图像的聚类结果。
进一步的,步骤S204中,在k均值聚处理时,为了提升聚类的准确性,可根据数据对象的加权平均值
Figure BDA0002413906670000042
进行聚类而非现有的k均值处理时所采用的数据对象的欧式距离;
且聚类处理时采用的收敛准则函数为:
Figure BDA0002413906670000043
其中,函数d(·)表示两个数据对象之间的欧式距离,
Figure BDA0002413906670000044
Ni表示第i个簇类Ci包括的数据对象数,数据对象数xj的权值
Figure BDA0002413906670000045
中间参
Figure BDA0002413906670000046
参数
Figure BDA0002413906670000047
N表示聚类数据对象数,即待进行聚类处理的图像数。
综上所述,由于采用了上述技术方案,本发明的有益效果是:本发明通过基于泰森多边形的k均值算法改进,达到更精准和高效地实现数据对象聚类和区分数据对象之间的不同,通过基于加权平均值法的k均值算法改进,进一步提高聚类效率,通过基于主成分分析法的k均值算法改进,把多维的数据特征降维,以方便使用泰森多边形初始化,最终得到改进的k均值算法,从而基于该改进的k均值算法实现本发明的图像聚类处理,提升图像的管理和检索性能。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合实施方式,对本发明作进一步地详细描述。
本发明通过基于泰森多边形的k均值算法改进,更精准和高效地实现图像聚类和区分图像之间的不同,通过基于加权平均值法的k均值算法改进,进一步提高聚类效率,通过基于主成分分析法的k均值算法改进,把多维的图像数据特征降维,以方便使用泰森多边形初始化,最终得到改进的k均值算法,从而实现对图像的聚类处理。
本发明的图像聚类方法可用于图像检索,即基于本发明改进后的k均值算法对图像库中的图像进行聚类处理,得到多个聚类结果和对应的中心点;当进行图像检索处理时,首先基于图像的像素的前2个主成分(确定方式与聚类处理中的方式相同)同各个聚类中心点的欧式距离,从所有中心点中检索与待检索图像最相似的中心点,确定待检索图像的图像类别,即与待检索图像最相似的类簇;然后再在该最相似的类簇中对图像进行遍历检索,查找与待检索图像最相似的图像,从而获得图像检索结果。
其中,聚类处理的具体实现过程为:
(1)定义Q表示待聚类的图像数量,即图像库的图像数量;并定义Xq表示第q个图像,每个图像具有n个行像素,m个列像素。则每个图像Xq构成了n×m阶矩阵:
Figure BDA0002413906670000051
则图像数据集可以表示为X={X1,X2,…,XQ}。
(2)将n×m阶矩阵Xq中的图像数据标准化(归一化处理),即将矩阵Xq中的图像数据都映射到[-1,1]区间。
例如,可采用下述归一化公式实现:
Figure BDA0002413906670000052
Figure BDA0002413906670000053
其中,xi'j是xij归一化之后的值,xij是Xq中的元素,a=-1,b=1,
Figure BDA0002413906670000054
表示Xq中元素的最小值,
Figure BDA0002413906670000055
表示Xq中元素的最大值,i=1,2,…,n;j=1,2,…,m。
(3)计算图像库中各图像的相关系数矩阵,即矩阵Xq的相关系数矩阵Rq
Figure BDA0002413906670000056
其中,
Figure BDA0002413906670000057
表示分别表示矩阵Xq的第i列、第j列的均值。
(4)计算相关系数矩阵Rq的特征值λ1≥λ2≥…≥λm>0以及对应的特征向量:
Figure BDA0002413906670000061
(5)计算主成分:yij=α1jxi12jxi2+…+αmjxim,i=1,2,…,n;j=1,2,…,m;
(6)计算每个特征值λj的累计贡献率
Figure BDA0002413906670000062
对累计贡献率达到贡献率阈值(取值范围可设置为[0.85,0.95])进行降序排序为:λ1≥λ2≥…≥λp,其中p≤m,选取前2个特征值对应的主成分,记为:[mi1,mi2](i=1,2,…,n),对选取出来的主成分求列均值可得最终的转换目标(z1,z2),其中
Figure BDA0002413906670000063
将Q个图像的前2个主成分的转换目标组成二维数据集Y={Y1,Y2,…,YQ},其中,Yq={yq1,yq2},q=1,2,…,Q,yq1,yq2表示第q个图像的前2个主成分的转换目标。
在本申请中,为了进一步减少计算量,可以先从满足累积贡献率条件(累计贡献率达到贡献率阈值)的特征值中筛选出前2个最大特征值,并将其对应的特征向量记为α1,α2
然后再根据公式
Figure BDA0002413906670000064
得到对应特征向量α1、α2的主成分,其中xi表示当前图像的第i行的像素对应的像素向量,i=1,2,…,n;
再分别将n个
Figure BDA0002413906670000065
的均值记为yq1、yq2,从而得到第q个图像降维后的图像数据Yq={yq1,yq2}。
(7)在Y={Y1,Y2,…,YQ}所构成的二维平面α内(横纵坐标为图像的前2个主成分,即一个主成分为横坐标,另一个为纵坐标),构建一个简单的矩形E,其四条边分别是eup、edown、eleft、eright,将待聚类的数据集Y归置于E所形成的二维封区域中,并运用简单的增量法构建整个空间平面区域的泰森多边形,从而使得Q个点分布在各个泰森多边形单元中,其中,全部的母点(落在每个泰森多边形单元中的全部点的几何平均值)都在构造好的矩形E中。
(8)从泰森多边形中找出位于边缘的单元Vi并且计算出边缘单元Vi和相邻单元Vi+1与矩形E边的交点。
计算方法如下:
先找到与Vi单元相邻的Vi+1单元,连接相邻两个单元的母点并根据这两个母点的坐标值求出连线的斜率k1,同时求出这两个单元公共边的斜率k2
然后比较k1和k2的大小,若k2>k1,则这两个单元的公共边和矩形E的当前边缘边相交,此时可知Vi和Vi+1与矩形E边的公共交点,将求得的交点归于Vi单元的顶点集中,否则归于Vi+1单元的顶点集中。
(9)反复执行步骤(8),直到循环一周后返回最初的单元。
(10)查看各个边缘单元与矩形E的交点,如果交点位于不同的边上,则需要在顶点集中加入矩形交点。
(11)计算泰森多边形有限区域的密度,该密度的值就是区域内所有数据点数与区域的面积的比值,然后计算出区域内的每一个泰森多边形单元的密度,此时该密度的数值等于泰森多边形单元中所包含的数据点数与其面积的比值。
本具体实施方式中,泰森多边形的单元面积计算方式为:
设泰森多边形中某单元的顶点集为C={C1,C2,…,Cl,Cl+1},其中C1=Cl+1,每个顶点坐标表示为(xi,yi)(i=1,2,…,l),则该单元的面积为:
Figure BDA0002413906670000071
基于得到的第i个泰森多边形单元的面积Si,以及该泰森多边形单元包括的数据点数di,根据公式
Figure BDA0002413906670000072
得到每个泰森多边形单元密度大小ρi;从而根据公式
Figure BDA0002413906670000073
得到每个泰森多边形单元密度系数ηi,即每个泰森多边形单元面积和全部四边形区域面积的比值,比值为,其中,
Figure BDA0002413906670000074
d表示四边形区域中全部的数据点数,Srectangle表示整个矩形区域面积,即矩形E的面积。
若存在泰森多边形单元的密度系数不满足预设置的密度系数阈值ηthreshold(即ηi<ηthreshold),则将满足条件(ηi≥ηthreshold)的各单元的质心分别作为新的母点重新生成新的泰森多边形,直到当前生成的泰森多边形的每个单元均满足条件。
最终,得到满足条件的泰森多边形的单元个数为初始聚类数目k和每个单元的母点为初始聚类中心点D1,D2,…,Dk
(12)数据集Y={Y1,Y2,…,YQ}、初始聚类数目k、初始聚类中心D1,D2,…,Dk
k个簇分别用C1,C2,…,Ck表示,Ci中数据对象的个数用Ni表示,其中i=1,2,…,k,则每个簇所对应的数据集中的每一个数据对象的权值表达式为:
Figure BDA0002413906670000081
其中
Figure BDA0002413906670000082
d(x,y)表示Ci中的数据对象x和y之间的距离,即欧式距离。λj值越小,相似性越高;λj值越大,相似性越低。
簇中对象的加权平均值表达式为:
Figure BDA0002413906670000083
其中,xj代表其中随机的数据对象,λj表示它的加权平均值的大小。
(13)计算目标准则函数值J*,更新每个簇的中心点,直到满足预设的收敛条件即J*<Jthreshold
其中,目标准则函数的表达式为:
Figure BDA0002413906670000084
其中
Figure BDA0002413906670000085
(14)将聚类结果转换成对应的图像数据(即将各簇类中的Yq替换为对应的Xq),在同一个聚类簇中的图像具有相同的图像类别,归为一类。
以上所述,仅为本发明的具体实施方式,本说明书中所公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换;所公开的所有特征、或所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以任何方式组合。

Claims (6)

1.用于图像类别识别的图像聚类方法,其特征在于,包括下列步骤:
步骤S1:对待处理的图像进行降维处理:
步骤S101:对待处理的图像的像素值进行归一化处理;其中,待处理的图像的尺寸相同,图像尺寸表示为n×m;
步骤S102:计算每幅图像的相关系数矩阵:
第q幅图像的相关系数矩阵
Figure FDA0002413906660000011
其中,xki、xkj分别表示第q幅图像的第k行第i列、第k行第j列的像素值,
Figure FDA0002413906660000012
表示分别表示图像q的第i列、第j列的像素均值,i,j=1,2,…,m;
步骤S103:基于主成分分析得到降维后的图像数据:
计算相关系数矩阵Rq的特征根并降序排列:λ12,…,λm
将与m个特征值λ12,…,λm对应的特征向量记为:αj=[α1j α2j…αmj]T,其中j=1,2,…,m;
根据公式yij=α1jxi12jxi2+…+αmjxim计算主成分yij,其中i=1,2,…,n,j=1,2,…,m;
计算每个特征值λj的累计贡献率
Figure FDA0002413906660000013
筛选累计贡献率SCRj大于或等于累计贡献率阈值δthr的特征值,再从筛选出的特征值中的选取前两个最大特征值并将对应特征向量记为α1,α2
分别将α1和α2对应的主成分的均值记为yq1、yq2,从而得到第q个图像降维后的图像数据Yq={yq1,yq2}。
步骤S2:基于泰森多边形对待聚类的图像集进行聚类处理:
步骤S201:基于降维后的图像数据构建泰森多边形:
将图像数据Yq={yq1,yq2}作为数据点q,其中yq1,yq2用于标识数据点q的位置坐标;
在数据点q所在的二维平面内构建矩形E,且所有待聚类的图像数据Yq所对应的数据点均位于矩形E中;
在所有降维后的图像数据集所构成的二维平面α内,构建一个矩形E,所有待聚类的图像数据Yq位于所述矩形E内;
在点q所在的二维平面内构建泰森多边形,且各个泰森多边形单元的母点均在矩形E中;
步骤S202:遍历泰森多边形中的边缘单元,确定泰森多边形单元的顶点集:
对当前边缘单元Vi,连接边缘单元Vi和其相邻单元Vi+1的母点,将母点的连线的斜率记为k1;以及将边缘单元Vi和其相邻单元Vi+1的公共边的斜率记为k2
若k2>k1,则边缘单元Vi和其相邻单元Vi+1的公共边和矩形E相交,计算边缘单元Vi和其相邻单元Vi+1与矩形E的公共交点并加入边缘单元Vi的顶点集中;若k2≤k1,则将该公共边与矩形E交点加入Vi+1单元的顶点集中;其中单元的顶点集的初始值为空集;
其中,若边缘单元与矩形E的交点位于不同的边上,则将边缘单元与矩形E的所有交点加入当前边缘单元的顶点集中;
步骤S203:基于泰森多边形设置初始聚类数和初始聚类中心点:
计算当前泰森多边形的每个泰森多边形单元的单元密度系数,若存在单元密度系数小于预置的密度系数阈值,则将单元密度系数大于或等于密度系数阈值的泰森多边形单元的质心为新的母点重新生成新的泰森多边形;
若当前泰森多边形的每个泰森多边形单元的单元密度系数均大于或等于密度系数阈值,则保留当前泰森多边形,否则继续重新生成新的泰森多边形;
将保留的泰森多边形的单元个数作为聚类数目k,并将每个泰森多边形单元的母点作为初始聚类中心点D1,D2,…,Dk
其中,单元密度系数为:单元密度与参数ρrectangle的比值,
Figure FDA0002413906660000021
d表示四边形区域中全部的数据点数,Srectangle表示矩形E的面积;单元密度为泰森多边形单元包括的数据点数与其面积的比值;
步骤S204:基于确定的聚类数目k、以及初始聚类中心点D1,D2,…,Dk,通过k均值聚类法对所有图像数据Yq进行聚类处理,得到k个聚类结果;
再将当前k个聚类结果转换为对应的原始图像,得到待处理的图像的聚类结果。
2.如权利要求1所述的方法,其特征在于,步骤S204中,在k均值聚处理时,根据数据对象的加权平均值
Figure FDA0002413906660000031
进行聚类;
且聚类处理时采用的收敛准则函数为:
Figure FDA0002413906660000032
其中,函数d(·)表示两个数据对象之间的欧式距离,
Figure FDA0002413906660000033
Ni表示第i个簇类Ci包括的数据对象数,数据对象数xj的权值
Figure FDA0002413906660000034
中间参
Figure FDA0002413906660000035
参数
Figure FDA0002413906660000036
N表示聚类数据对象数。
3.如权利要求1所述的方法,其特征在于,将步骤S103替换为:
计算相关系数矩阵Rq的特征值并降序排列:λ12,…,λm
将与m个特征值λ12,…,λm对应的特征向量记为:αj=[α1j α2j…αmj]T,其中j=1,2,…,m;
计算每个特征值λj的累计贡献率
Figure FDA0002413906660000037
筛选累计贡献率SCRj大于或等于累计贡献率阈值δthr的特征值,再从筛选出的特征值中的选取前两个最大特征值并将对应特征向量记为α1,α2
根据公式
Figure FDA0002413906660000038
得到对应特征向量α1、α2的两组主成分
Figure FDA0002413906660000039
其中xi表示当前图像第i行的像素对应的像素向量,i=1,2,…,n;
分别将每组主成分个
Figure FDA00024139066600000310
的均值记为yq1、yq2,从而得到第q个图像降维后的图像数据Yq={yq1,yq2}。
4.如权利要求1所述的方法,其特征在于,步骤S103中,累计贡献率阈值δthr的取值范围为[0.85,0.95]。
5.如权利要求1所述的方法,其特征在于,步骤S101,归一化后的像素值的取值区间为[-1,1]。
6.如权利要求1所述的方法,其特征在于,泰森多边形单元的单元面积计算方式为:
定义单元的顶点集C={C1,C2,…,Cl,Cl+1},其中C1=Cl+1,每个顶点坐标为(xi,yi)(i=1,2,…,l);
根据公式
Figure FDA0002413906660000041
计算单元面积S。
CN202010185125.1A 2020-03-17 2020-03-17 一种用于图像类别识别的图像聚类方法 Expired - Fee Related CN111428764B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010185125.1A CN111428764B (zh) 2020-03-17 2020-03-17 一种用于图像类别识别的图像聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010185125.1A CN111428764B (zh) 2020-03-17 2020-03-17 一种用于图像类别识别的图像聚类方法

Publications (2)

Publication Number Publication Date
CN111428764A true CN111428764A (zh) 2020-07-17
CN111428764B CN111428764B (zh) 2022-06-03

Family

ID=71547980

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010185125.1A Expired - Fee Related CN111428764B (zh) 2020-03-17 2020-03-17 一种用于图像类别识别的图像聚类方法

Country Status (1)

Country Link
CN (1) CN111428764B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113361944A (zh) * 2021-06-21 2021-09-07 鑫安利中(北京)科技有限公司 基于物联网和人工智能的安全生产指标异常快速感知方法
CN113726824A (zh) * 2021-11-03 2021-11-30 成都无糖信息技术有限公司 一种基于图像特征的诈骗网站查找方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002077903A2 (en) * 2001-03-26 2002-10-03 Cellomics, Inc. Methods for determining the organization of a cellular component of interest
US20100111396A1 (en) * 2008-11-06 2010-05-06 Los Alamos National Security Object and spatial level quantitative image analysis
CN107679644A (zh) * 2017-08-28 2018-02-09 河海大学 一种基于降雨类型特征的站点雨量资料插补方法
CN108805201A (zh) * 2018-06-08 2018-11-13 湖南宸瀚信息科技有限责任公司 目标图像数据集生成方法及其装置
CN108875760A (zh) * 2017-05-11 2018-11-23 阿里巴巴集团控股有限公司 聚类方法和装置
CN109543723A (zh) * 2018-11-05 2019-03-29 南京理工大学 一种鲁棒的图像聚类方法
CN109614458A (zh) * 2018-12-20 2019-04-12 中国人民解放军战略支援部队信息工程大学 基于导航数据的城市社区结构挖掘方法与装置
CN110609916A (zh) * 2019-09-25 2019-12-24 四川东方网力科技有限公司 视频图像数据检索方法、装置、设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002077903A2 (en) * 2001-03-26 2002-10-03 Cellomics, Inc. Methods for determining the organization of a cellular component of interest
US20100111396A1 (en) * 2008-11-06 2010-05-06 Los Alamos National Security Object and spatial level quantitative image analysis
CN108875760A (zh) * 2017-05-11 2018-11-23 阿里巴巴集团控股有限公司 聚类方法和装置
CN107679644A (zh) * 2017-08-28 2018-02-09 河海大学 一种基于降雨类型特征的站点雨量资料插补方法
CN108805201A (zh) * 2018-06-08 2018-11-13 湖南宸瀚信息科技有限责任公司 目标图像数据集生成方法及其装置
CN109543723A (zh) * 2018-11-05 2019-03-29 南京理工大学 一种鲁棒的图像聚类方法
CN109614458A (zh) * 2018-12-20 2019-04-12 中国人民解放军战略支援部队信息工程大学 基于导航数据的城市社区结构挖掘方法与装置
CN110609916A (zh) * 2019-09-25 2019-12-24 四川东方网力科技有限公司 视频图像数据检索方法、装置、设备和存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SANTOSH KUMAR VIPPARTHI: ""ANTIC:ANTithteic Isomeric Cluster Patterns for Medical Image Retrieval and Change Detection"", 《IET COMPUTER VISION》 *
梦符佳月: ""Grasshopper实现K均值聚类算法"", 《HTTPS://ZHUANLAN.ZHIHU.COM/P/72340628》 *
段文静: ""高维数据下基于密度聚类方法的研究与应用"", 《中国优秀硕士学位论文全文数据库 社会科学II辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113361944A (zh) * 2021-06-21 2021-09-07 鑫安利中(北京)科技有限公司 基于物联网和人工智能的安全生产指标异常快速感知方法
CN113726824A (zh) * 2021-11-03 2021-11-30 成都无糖信息技术有限公司 一种基于图像特征的诈骗网站查找方法及系统
CN113726824B (zh) * 2021-11-03 2022-01-07 成都无糖信息技术有限公司 一种基于图像特征的诈骗网站查找方法及系统

Also Published As

Publication number Publication date
CN111428764B (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
CN109887015B (zh) 一种基于局部曲面特征直方图的点云自动配准方法
CN107679078A (zh) 一种基于深度学习的卡口图像车辆快速检索方法及系统
CN107085607B (zh) 一种图像特征点匹配方法
CN107679509B (zh) 一种小环藻识别方法及装置
CN109960737B (zh) 半监督深度对抗自编码哈希学习的遥感影像内容检索方法
CN108154094B (zh) 基于子区间划分的高光谱图像非监督波段选择方法
CN111428764B (zh) 一种用于图像类别识别的图像聚类方法
CN107368807A (zh) 一种基于视觉词袋模型的监控视频车型分类方法
CN106650580B (zh) 基于图像处理的货架快速清点方法
CN106780639B (zh) 基于显著性特征稀疏嵌入和极限学习机的哈希编码方法
Lin et al. Image retrieval system based on adaptive color histogram and texture features
CN109583469B (zh) 基于互信息的k均值高光谱图像波段聚类方法
CN108491430A (zh) 一种基于对特征方向进行聚类的无监督哈希检索方法
US20070070365A1 (en) Content-based image retrieval based on color difference and gradient information
CN111242221A (zh) 基于图匹配的图像匹配方法、系统及存储介质
CN113112519A (zh) 基于感兴趣目标分布的关键帧筛选方法
CN110659608A (zh) 基于多特征融合的场景分类方法
CN111798526B (zh) 基于聚类空间映射的彩色图像主色快速提取方法及系统
CN114862902A (zh) 一种基于四叉树的光照自适应orb特征提取和匹配方法
CN114358166A (zh) 一种基于自适应k均值聚类的多目标定位方法
CN111860359B (zh) 一种基于改进随机森林算法的点云分类方法
CN106780294B (zh) 一种基于特征描述符的圆弧匹配方法
CN111127407B (zh) 一种基于傅里叶变换的风格迁移伪造图像检测装置及方法
CN111414958A (zh) 一种视觉词袋金字塔的多特征图像分类方法及系统
CN111914930A (zh) 一种基于自适应微簇融合的密度峰值聚类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220603