CN115100453B - 一种图像聚类方法、装置、终端及计算机可读存储介质 - Google Patents

一种图像聚类方法、装置、终端及计算机可读存储介质 Download PDF

Info

Publication number
CN115100453B
CN115100453B CN202211014888.5A CN202211014888A CN115100453B CN 115100453 B CN115100453 B CN 115100453B CN 202211014888 A CN202211014888 A CN 202211014888A CN 115100453 B CN115100453 B CN 115100453B
Authority
CN
China
Prior art keywords
image
clustering
target
neighbor
clustered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211014888.5A
Other languages
English (en)
Other versions
CN115100453A (zh
Inventor
庄瑞格
朱树磊
殷俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN202211014888.5A priority Critical patent/CN115100453B/zh
Publication of CN115100453A publication Critical patent/CN115100453A/zh
Application granted granted Critical
Publication of CN115100453B publication Critical patent/CN115100453B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation

Abstract

本发明提供一种图像聚类方法、装置、终端及计算机可读存储介质,图像聚类方法包括获取待聚类图像集,待聚类图像集包括多张目标图像;基于至少两种聚类方式分别对待聚类图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果;基于至少两种聚类方式分别对应的第一聚类结果,确定各目标图像的真实近邻集;基于各目标图像的真实近邻集,对待聚类图像集中的目标图像进行第二次聚类。本申请通过多种聚类方法分别对待聚类图像集中的目标图像进行聚类处理,得到多个第一聚类结果;对多个第一聚类结果进行集成学习确定各目标图像的真实近邻集,进而对待聚类图像集中的目标图像进行第二次聚类,提高目标图像的聚类结果的准确率。

Description

一种图像聚类方法、装置、终端及计算机可读存储介质
技术领域
本发明涉及图像识别技术领域,特别是涉及一种图像聚类方法、装置、终端及计算机可读存储介质。
背景技术
随着人脸识别技术的发展,人脸识别的准确率得到了极大的提升。然后,人脸识别的高精度在很大程度上依赖于大规模的标注数据集。虽然现在在互联网上能轻易收集到大量的人脸图片,但是对这些数据进行高精度的标注是十分昂贵的。因此,高精度的人脸聚类技术面临急切的需求。
发明内容
本发明主要解决的技术问题是提供一种图像聚类方法、装置、终端及计算机可读存储介质,解决现有技术中聚类结果的准确率比较低的问题。
为解决上述技术问题,本发明采用的第一个技术方案是:提供一种图像聚类方法,包括:获取待聚类图像集,待聚类图像集包括多张目标图像;基于至少两种聚类方式分别对待聚类图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果;基于至少两种聚类方式分别对应的第一聚类结果,确定各目标图像的真实近邻集;基于各目标图像的真实近邻集,对待聚类图像集中的目标图像进行第二次聚类,得到最佳聚类结果。
其中,基于至少两种聚类方式分别对待聚类图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果,包括:对待聚类图像集中的目标图像进行放回采样,得到至少两个子图像集;通过至少两种聚类方式分别对各子图像集中的目标图像进行初始聚类,得到各聚类方式与各子图像集之间分别对应的第一聚类结果。
其中,基于至少两种聚类方式分别对待聚类图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果,之前还包括:对待聚类图像集中的目标图像进行特征提取,得到目标图像的第一特征图;将各目标图像的第一特征图分别进行降维,得到各目标图像的第二特征图;基于至少两种聚类方式分别对待聚类图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果,包括:采用至少两种聚类方式,基于各目标图像的第二特征图分别对待聚类图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果。
其中,将各目标图像的第一特征图分别进行降维,得到各目标图像的第二特征图,包括:采用PCA方法分别对各目标图像的第一特征图分别进行降维,得到各目标图像的第二特征图。
其中,基于至少两种聚类方式分别对应的第一聚类结果,确定各目标图像的真实近邻集,包括:遍历待聚类图像集中各目标图像,基于选取的目标图像与待聚类图像集中其他目标图像之间的相似度,确定选取的目标图像对应的近邻图像集,近邻图像集包括与选取的目标图像的相似度最高的预设数量个近邻图像;基于目标图像的近邻图像集和至少两种聚类方式分别对应的第一聚类结果,确定目标图像的真实近邻集,真实近邻集为近邻图像集的子集;基于各目标图像分别对应的真实近邻集,对目标图像进行第二次聚类。
其中,第一聚类结果包括待聚类图像集中包含的目标图像的聚类类别;基于目标图像的近邻图像集和至少两种聚类方式分别对应的第一聚类结果,确定目标图像的真实近邻集,包括:基于目标图像与近邻图像在第一聚类结果中的占比,确定目标图像与近邻图像是否属于同一类簇;基于近邻图像集中与目标图像属于同一类簇的近邻图像,确定目标图像的真实近邻集。
其中,基于目标图像与近邻图像在第一聚类结果中的占比,确定目标图像与近邻图像是否属于同一类簇,包括:在目标图像对应的近邻图像集中选取一近邻图像;在所有第一聚类结果中,统计得到同时包含目标图像和选取的近邻图像的第一聚类结果的个数为第一数量;在同时包含目标图像和选取的近邻图像的所有第一聚类结果中,统计得到目标图像的聚类类别和选取的近邻图像的聚类类别相同的第一聚类结果的个数为第二数量;基于第二数量在第一数量中的占比,确定目标图像与选取的近邻图像是否属于同一类簇。
其中,基于第二数量在第一数量中的占比,确定选取的目标图像与近邻图像是否属于同一类簇,包括:响应于第二数量在第一数量中的占比大于预设值,确定目标图像与选取的近邻图像属于同一类簇;响应于第二数量在第一数量中的占比小于或等于预设值,确定目标图像与选取的近邻图像不属于同一类簇。
其中,基于各目标图像的真实近邻集,对待聚类图像集中的目标图像进行第二次聚类,包括:基于各目标图像的真实近邻集,确定任意两个目标图像之间的亲和度;基于任意两个目标图像之间的亲和度,将待聚类图像集中的目标图像划分为至少一个类簇图像集;类簇图像集中包括亲和度大于亲和度阈值的至少两个目标图像;对至少一个类簇图像集进行聚合,得到待聚类图像集的最佳聚类结果。
其中,基于第一图像的真实近邻集与第二图像的真实近邻集,确定第一图像和第二图像之间对应的亲和度,包括:基于第二图像的真实近邻集的补集与第一图像的真实近邻集之间的交集,确定第一近邻集;第一近邻集为第一图像的真实近邻集的子集;基于第一图像的真实近邻集的补集与第二图像的真实近邻集之间的交集,确定第二近邻集;第二近邻集为第二图像的真实近邻集的子集;基于第一近邻集和第二近邻集分别与第一图像的真实近邻集和第二图像的真实近邻集,确定第一图像和第二图像之间的亲和度。
其中,基于第一近邻集和第二近邻集分别与第一图像的真实近邻集和第二图像的真实近邻集,确定第一图像和第二图像之间的亲和度,包括:基于第一近邻集和第二近邻集分别与第一图像的真实近邻集和第二图像的真实近邻集,确定第一图像和第二图像分别对应的相似差;在第一图像和第二图像分别对应的相似差中,基于数值最大的相似差,确定第一图像和第二图像之间的亲和度。
其中,基于第一近邻集和第二近邻集分别与第一图像的真实近邻集和第二图像的真实近邻集,确定第一图像和第二图像分别对应的相似差,包括:基于第一图像的真实近邻集和第二图像的真实近邻集分别与第一近邻集和第二近邻集,确定第一图像和第二图像分别与第一近邻集和第二近邻集之间对应的相似值;基于第一图像与第一近邻集对应的相似值和第一图像与第二近邻集对应的相似值之间的差值,确定第一图像的相似差;基于第二图像与第一近邻集对应的相似值和第二图像与第二近邻集对应的相似值之间的差值,确定第二图像的相似差。
其中,最佳聚类结果包括多个最佳类簇,每个最佳类簇包括至少一个目标图像;对至少一个类簇图像集进行聚合,得到待聚类图像集的最佳聚类结果,还包括:基于任意两个类簇图像集是否包含相同的目标图像的情况,对至少一个类簇图像集进行聚合,得到至少一个最佳类簇;其中,每个最佳类簇包括至少一个类簇图像集;当最佳类簇包括多个类簇图像集时,多个类簇图像集中的任意两个类簇图像集包含相同的目标图像;响应于两个类簇图像集中包含同一目标图像,则将两个聚类图像集中包含的所有目标图像合并,形成最佳类簇;归属于同一类簇。
为解决上述技术问题,本发明采用的第二个技术方案是:提供一种图像聚类装置,图像聚类装置包括:获取模块,用于获取待聚类图像集,待聚类图像集包括多张目标图像;第一聚类模块,用于基于至少两种聚类方式分别对待聚类图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果;分析模块,用于基于至少两种聚类方式分别对应的第一聚类结果,确定各目标图像的真实近邻集;第二聚类模块,用于基于各目标图像的真实近邻集,对待聚类图像集中的目标图像进行第二次聚类。
为解决上述技术问题,本发明采用的第三个技术方案是:提供一种终端,该终端包括存储器、处理器以及存储于存储器中并在处理器上运行的计算机程序,处理器用于执行程序数据以实现上述图像聚类方法中的步骤。
为解决上述技术问题,本发明采用的第四个技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述图像聚类方法中的步骤。
本发明的有益效果是:区别于现有技术的情况,提供的一种图像聚类方法、装置、终端及计算机可读存储介质,图像聚类方法包括获取待聚类图像集,待聚类图像集包括多张目标图像;基于至少两种聚类方式分别对待聚类图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果;基于至少两种聚类方式分别对应的第一聚类结果,确定各目标图像的真实近邻集;基于各目标图像的真实近邻集,对待聚类图像集中的目标图像进行第二次聚类,得到最佳聚类结果。本申请通过多种聚类方法分别对待聚类图像集中的目标图像进行聚类处理,得到多个第一聚类结果;对多个第一聚类结果进行集成学习确定各目标图像的真实近邻集,基于目标图像的真实近邻集对待聚类图像集中的目标图像进行第二次聚类,能够提高待聚类图像集中目标图像的聚类结果的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明提供的图像聚类方法的流程示意图;
图2是本发明提供的图像聚类方法一具体实施例的流程示意图;
图3是图2提供的图像聚类方法中步骤S207一具体实施例的流程示意图;
图4是图2提供的图像聚类方法中步骤S208一具体实施例的流程示意图;
图5是图4提供的图像聚类方法中步骤S2083一具体实施例的流程示意图;
图6是本发明提供的图像聚类装置一实施例的示意框图;
图7是本发明提供的终端一实施方式的示意框图;
图8是本发明提供的计算机可读存储介质一实施方式的示意框图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明所提供的一种图像聚类方法做进一步详细描述。
请参阅图1,图1是本发明提供的图像聚类方法的流程示意图。本实施例中提供一种图像聚类方法,该图像聚类方法包括如下步骤。
S11:获取待聚类图像集,待聚类图像集包括多张目标图像。
具体地,对待聚类图像集中的目标图像进行特征提取,得到目标图像的第一特征图;将各目标图像的第一特征图分别进行降维,得到各目标图像的第二特征图。具体地,采用PCA方法分别对各目标图像的第一特征图分别进行降维,得到各目标图像的第二特征图。
S12:基于至少两种聚类方式分别对待聚类图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果。
具体地,对待聚类图像集中的目标图像进行放回采样,得到至少两个子图像集;通过至少两种聚类方式分别对各子图像集中的目标图像进行初始聚类,得到各聚类方式与各子图像集之间分别对应的第一聚类结果。
采用至少两种聚类方式,基于各目标图像的第二特征图分别对待聚类图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果。
S13:基于至少两种聚类方式分别对应的第一聚类结果,确定各目标图像的真实近邻集。
具体地,遍历待聚类图像集中各目标图像,基于选取的目标图像与待聚类图像集中其他目标图像之间的相似度,确定选取的目标图像对应的近邻图像集,近邻图像集包括与选取的目标图像的相似度最高的预设数量个近邻图像;基于目标图像的近邻图像集和至少两种聚类方式分别对应的第一聚类结果,确定目标图像的真实近邻集,真实近邻集为近邻图像集的子集。
在一实施例中,基于目标图像与近邻图像在第一聚类结果中的占比,确定目标图像与近邻图像是否属于同一类簇;基于近邻图像集中与目标图像属于同一类簇的近邻图像,确定目标图像的真实近邻集。
S14:基于各目标图像的真实近邻集,对待聚类图像集中的目标图像进行第二次聚类,得到最佳聚类结果。
具体地,在目标图像对应的近邻图像集中选取一近邻图像;在所有第一聚类结果中,统计得到同时包含目标图像和选取的近邻图像的第一聚类结果的个数为第一数量;在同时包含目标图像和选取的近邻图像的所有第一聚类结果中,统计得到目标图像的聚类类别和选取的近邻图像的聚类类别相同的第一聚类结果的个数为第二数量;基于第二数量在第一数量中的占比,确定目标图像与选取的近邻图像是否属于同一类簇。
响应于第二数量在第一数量中的占比大于预设值,确定目标图像与选取的近邻图像属于同一类簇;响应于第二数量在第一数量中的占比小于或等于预设值,确定目标图像与选取的近邻图像不属于同一类簇。
在一实施例中,基于各目标图像的真实近邻集,确定任意两个目标图像之间的亲和度;基于任意两个目标图像之间的亲和度,将待聚类图像集中的目标图像划分为至少一个类簇图像集;类簇图像集中包括亲和度大于亲和度阈值的至少两个目标图像;对至少一个类簇图像集进行聚合,得到待聚类图像集的最佳聚类结果。
在一具体实施例中,基于第二图像的真实近邻集的补集与第一图像的真实近邻集之间的交集,确定第一近邻集;第一近邻集为第一图像的真实近邻集的子集;基于第一图像的真实近邻集的补集与第二图像的真实近邻集之间的交集,确定第二近邻集;第二近邻集为第二图像的真实近邻集的子集;基于第一近邻集和第二近邻集分别与第一图像的真实近邻集和第二图像的真实近邻集,确定第一图像和第二图像之间的亲和度。
其中,基于第一近邻集和第二近邻集分别与第一图像的真实近邻集和第二图像的真实近邻集,确定第一图像和第二图像分别对应的相似差;在第一图像和第二图像分别对应的相似差中,基于数值最大的相似差,确定第一图像和第二图像之间的亲和度。
具体地,基于第一图像的真实近邻集和第二图像的真实近邻集分别与第一近邻集和第二近邻集,确定第一图像和第二图像分别与第一近邻集和第二近邻集之间对应的相似值;基于第一图像与第一近邻集对应的相似值和第一图像与第二近邻集对应的相似值之间的差值,确定第一图像的相似差;基于第二图像与第一近邻集对应的相似值和第二图像与第二近邻集对应的相似值之间的差值,确定第二图像的相似差。
在一实施例中,最佳聚类结果包括多个最佳类簇,每个最佳类簇包括至少一个目标图像。基于任意两个类簇图像集是否包含相同的目标图像的情况,对至少一个类簇图像集进行聚合,得到至少一个最佳类簇;其中,每个最佳类簇包括至少一个类簇图像集;当最佳类簇包括多个类簇图像集时,多个类簇图像集中的任意两个类簇图像集包含相同的目标图像;响应于两个类簇图像集中包含同一目标图像,则将两个聚类图像集中包含的所有目标图像合并,形成最佳类簇;归属于同一类簇。
本实施例提供的图像聚类方法,包括获取待聚类图像集,待聚类图像集包括多张目标图像;基于至少两种聚类方式分别对待聚类图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果;基于至少两种聚类方式分别对应的第一聚类结果,确定各目标图像的真实近邻集;基于各目标图像的真实近邻集,对待聚类图像集中的目标图像进行第二次聚类。本申请通过多种聚类方法分别对待聚类图像集中的目标图像进行聚类处理,得到多个第一聚类结果;对多个第一聚类结果进行集成学习确定各目标图像的真实近邻集,基于目标图像的真实近邻集对待聚类图像集中的目标图像进行第二次聚类,能够提高待聚类图像集中目标图像的聚类结果的准确率,得到最佳聚类结果。
请参阅图2,图2是本发明提供的图像聚类方法一具体实施例的流程示意图。本实施例中提供一种图像聚类方法,该图像聚类方法包括如下步骤。
S201:获取待聚类图像集。
具体地,待聚类图像集包括多张目标图像。其中,目标图像包括人脸图像、人体图像等。也可以为其他包含同类型部位的图像。在一具体实施例中,M张人脸图像组成待聚类图像集。M张人脸图像可以N个不同的人,且每张人脸图像中仅包含一张人脸。M、N均取正整数,且M≥N。
S202:对待聚类图像集中的目标图像进行特征提取,得到目标图像的第一特征图。
具体地,通过特征提取网络对待聚类图像集中的目标图像进行特征提取,得到各目标图像的第一特征图。其中,待聚类图像集中包含的所有目标图像的第一特征图的维度均为d维。例如,待聚类图像集中包含的所有目标图像的第一特征图分别表示为x1、x2、x3、...、xn,∀xi∈Rd
S203:将各目标图像的第一特征图分别进行降维,得到各目标图像的第二特征图。
具体地,为了减少聚类过程中的运算时间和内存占比,可以将目标图像的第一特征图进行降维,得到目标图像的第二特征图。
在一实施例中,采用主成分分析(Principal Component Analysis,PCA)方法分别对各目标图像的第一特征图分别进行降维,得到各目标图像的第二特征图。
在一具体实施例中,待聚类图像集中包含的所有目标图像的第一特征图组成数据矩阵X∈Rd*n。待聚类图像集中的各第一特征图的特征值减去数据集的特征均值,并计算各第一特征图的协方差矩阵
Figure 272024DEST_PATH_IMAGE001
,用特征值分解方法求各协方差矩阵的特征值和特征向量,对特征值从大到小进行排序,选择其中最大的k个特征值对应的特征向量分别作为行向量组成特征向量矩阵P,再将数据矩阵X转换到k个特征向量构建的新空间中,即Y=PX,Y表示降维后的数据矩阵,基于降维后的数据矩阵确定目标图像的第二特征图。
第二特征图的维度为k维,k小于d。例如,待聚类图像集中包含的所有目标图像的第二特征图分别表示为x1、x2、x3、...、xn,∀xi∈Rk,组成的数据矩阵为X∈Rk*n
S204:对待聚类图像集中的目标图像进行放回采样,得到至少两个子图像集。
具体地,为了提高聚类结果的准确率,采用集成学习中的套袋法(bagging)对待聚类图像集中抽取目标图像进行放回采样,确定多个子图像集。
在一实施例中,每次从待聚类图像集中抽取预设数量的目标图像,归属于一子图像集,将抽取的目标图像放回待聚类图像集中,再抽取预设数量的目标图像归属于上述的子图像集,直至子图像集中的目标图像达到设定的数量,结束一轮目标图像的抽取。其中,待聚类图像集中的部分目标图像可能被多次抽取到,而部分目标图像可能一次都没有被抽中。
从待聚类图像集中经过q轮抽取,得到q个子图像集,q个子图像集之间是相互独立的。例如,待聚类图像集中包含的目标图像为x1、x2、x3、...、xn,∀xi∈Rk,经过放回采样后得到的子图像集包括x'1、x'2、x'2、...、x'n,∀x'i∈Rk
S205:采用至少两种聚类方式,基于各目标图像的第二特征图分别对子图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果。
具体地,为了提高聚类结果的稳定性,将集成学习的思想结合到聚类方法中,使用多种聚类方法分别对子图像集中的目标图像进行初始聚类,得到各聚类方法对子图像集进行聚类的第一聚类结果。也就是说,有T种聚类方式分别对子图像集进行聚类,得到子图像集的T种第一聚类结果。第一聚类结果包括待聚类图像集中包含的目标图像的聚类类别。
上述步骤S204中得到q个子图像集,每个子图像集均经过T种聚类方式进行初始聚类,即得到待聚类图像集对应的T*q个第一聚类结果。其中,T*q个第一聚类结果用r1、r2、r3、...、rm表示。
聚类方式包括聚类方法和聚类参数。同一聚类方法,不同的聚类参数也可以称为不同的聚类方式。例如,聚类参数可以为超参数和/或最忌种子。其中,聚类方法包括K-means、层次聚类方法、谱聚类、密度聚类中的至少两种。也可以为其他聚类方法,只要能对子图像集进行聚类即可。
在一具体实施例中,当聚类方法为K-means时,可以设定三个聚类中心数k分别k1、k2和k3,采用3个随机种子seed1、seed2和seed3生成3个初始聚类中心,对于同一子图像集,通过组合能得到9个第一聚类结果。通过上述方法能将聚类方式数量进行扩充,为描述清晰,采用符号C0、C1、…Ch表示h+1种聚类方式。
S206:遍历待聚类图像集中各目标图像,基于选取的目标图像与待聚类图像集中其他目标图像之间的相似度,确定选取的目标图像对应的近邻图像集。
具体地,近邻图像集包括与选取的目标图像的相似度最高的预设数量个近邻图像。
根据待聚类图像集中各目标图像的第一特征图之间的相似度,确定目标图像之间的相似度。将选取的目标图像与其他目标图像之间分别对应的相似度从大到小进行排序,选取靠前的k个相似度分别对应的其他目标图像作为选取的目标图像的近邻图像,通过k个近邻图像组成选取的目标图像的近邻图像集。例如,对于选取的目标图像为x1,选取的目标图像的近邻图像集用{
Figure 686825DEST_PATH_IMAGE002
}来表示,其中,
Figure 691690DEST_PATH_IMAGE003
表示近邻图像集中与选取的目标图像x1的相似度为第j近的目标图像。
遍历待聚类图像集中的各目标图像,得到各目标图像的近邻图像集。
S207:基于目标图像的近邻图像集和至少两种聚类方式分别对应的第一聚类结果,确定目标图像的真实近邻集。
具体地,为了进一步确定目标图像与近邻图像集中的各近邻图像是否属于同一类簇,即确定目标图像和近邻图像是否属于同一人。基于目标图像的近邻图像集和步骤S205得到的待聚类图像集对应的T*q个第一聚类结果,确定目标图像的真实近邻集的具体实施方式包括如下步骤。其中,真实近邻集为近邻图像集的子集。
请参阅图3,图3是图2提供的图像聚类方法中步骤S207一具体实施例的流程示意图。
S2071:基于目标图像与近邻图像在第一聚类结果中的占比,确定目标图像与近邻图像是否属于同一类簇。
具体地,在目标图像对应的近邻图像集中选取一近邻图像;在所有第一聚类结果中,统计得到同时包含目标图像和选取的近邻图像的第一聚类结果的个数为第一数量。在同时包含目标图像和选取的近邻图像的所有第一聚类结果中,统计得到目标图像的聚类类别和选取的近邻图像的聚类类别相同的第一聚类结果的个数为第二数量;基于第二数量在第一数量中的占比,确定目标图像与选取的近邻图像是否属于同一类簇。
在一具体实施例中,选取目标图像x1的一个近邻图像
Figure 864045DEST_PATH_IMAGE004
,统计得到T*q个第一聚类结果中同时包含目标图像x1和近邻图像
Figure 346979DEST_PATH_IMAGE005
的第一聚类结果的数量为m1。即同时包含目标图像x1和近邻图像
Figure 616286DEST_PATH_IMAGE006
的第一聚类结果用r1、r2、r3、...、rm1表示。统计m1个第一聚类结果中目标图像x1和近邻图像
Figure 792053DEST_PATH_IMAGE006
聚类于同一类簇的第一聚类结果的数量为
Figure 776671DEST_PATH_IMAGE007
。通过
Figure 860033DEST_PATH_IMAGE008
在m1中的占比确定目标图像x1和近邻图像
Figure 983847DEST_PATH_IMAGE009
是否属于同一类簇。也就是说,目标图像x1和近邻图像
Figure 330515DEST_PATH_IMAGE010
属于同一类簇的概率
Figure 805358DEST_PATH_IMAGE011
。通过将目标图像x1和近邻图像
Figure 98936DEST_PATH_IMAGE005
属于同一类簇的概率与预设值进行比较,进而确定近邻图像
Figure 342836DEST_PATH_IMAGE012
是否为目标图像x1的真实近邻图像。
S2072:基于近邻图像集中与目标图像属于同一类簇的近邻图像,确定目标图像的真实近邻集。
具体地,响应于第二数量在第一数量中的占比大于预设值,确定目标图像与选取的近邻图像属于同一类簇。也就是说,目标图像x1和近邻图像
Figure 860405DEST_PATH_IMAGE013
属于同一类簇的概率大于预设值,则近邻图像
Figure 153370DEST_PATH_IMAGE005
作为目标图像x1的真实近邻图像。
响应于第二数量在第一数量中的占比小于或等于预设值,确定目标图像与选取的近邻图像不属于同一类簇。也就是说,目标图像x1和近邻图像
Figure 47377DEST_PATH_IMAGE004
属于同一类簇的概率小于或等于预设值,则近邻图像
Figure 411362DEST_PATH_IMAGE014
不是目标图像x1的真实近邻图像。
遍历目标图像x1的近邻图像集中各近邻图像与目标图像x1之间的概率,选取近邻图像集中与目标图像x1属于同一类簇的所有近邻图像作为真实近邻图像,通过真实近邻图像组成目标图像x1的真实近邻集。例如,目标图像x1的真实近邻集为
Figure 37516DEST_PATH_IMAGE015
,其中,k1表示目标图像x1的真实近邻集中包含的真实近邻图像的个数。
相比于目标图像x1的真实近邻集相比于目标图像x1的近邻图像集中包含的噪声更少,目标图像x1和真实近邻集中包含的真实近邻图像为一类的概率更大。
在一实施例中,在多张目标图像中任意选取两张目标图像,一张目标图像为第一图像,另一张目标图像为第二图像。在另一实施例中,待聚类图像集至少包括第一图像、第二图像和第三图像。
S208:基于第一图像的真实近邻集与第二图像的真实近邻集,确定第一图像和第二图像之间对应的亲和度。
具体地,第一图像的真实近邻集用A表示,A={a1、a2、a3、...、
Figure 752531DEST_PATH_IMAGE016
},
Figure 184649DEST_PATH_IMAGE017
表示集合A内包含的元素的数量。第二图像的真实近邻集用B表示,B={b1、b2、b3、...、
Figure 871983DEST_PATH_IMAGE018
},
Figure 525162DEST_PATH_IMAGE019
表示集合B内包含的元素的数量。确定第一图像和第二图像之间对应的亲和度的具体步骤如下所示。
请参阅图4,图4是图2提供的图像聚类方法中步骤S208一具体实施例的流程示意图。
S2081:基于第二图像的真实近邻集的补集与第一图像的真实近邻集之间的交集,确定第一近邻集。
具体地,通过第二图像的真实近邻集B的补集与第一图像的真实近邻集A之间的交集确定第一近邻集A1。第一近邻集A1是第一图像的真实近邻集A中不包含于第二图像的真实近邻集B中的元素。也就是说,第一近邻集A1可以表示为
Figure 196315DEST_PATH_IMAGE020
。第一近邻集为第一图像的真实近邻集的子集。
S2082:基于第一图像的真实近邻集的补集与第二图像的真实近邻集之间的交集,确定第二近邻集。
具体地,通过第一图像的真实近邻集A的补集与第二图像的真实近邻集B之间的交集确定第二近邻集B1。第二近邻集B1是第二图像的真实近邻集B中不包含于第一图像的真实近邻集A中的元素。也就是说,第二近邻集B1可以表示为
Figure 166545DEST_PATH_IMAGE021
。第二近邻集为第二图像的真实近邻集的子集。
S2083:基于第一近邻集和第二近邻集分别与第一图像的真实近邻集和第二图像的真实近邻集,确定第一图像和第二图像之间的亲和度。
具体地,基于第一近邻集和第二近邻集分别与第一图像的真实近邻集和第二图像的真实近邻集,确定第一图像和第二图像之间的亲和度的具体步骤如下。
请参阅图5,图5是图4提供的图像聚类方法中步骤S2083一具体实施例的流程示意图。
S2083a:基于第一图像的真实近邻集和第二图像的真实近邻集分别与第一近邻集和第二近邻集,确定第一图像和第二图像分别与第一近邻集和第二近邻集之间对应的相似值。
在一具体实施例中,对于第一图像的真实近邻集A,计算第一图像的真实近邻集A分别与第一近邻集A1和第二近邻集B1之间的相似值。
基于如下公式1计算得到第一图像的真实近邻集A与第一近邻集A1之间的相似值
Figure 239543DEST_PATH_IMAGE022
Figure 941920DEST_PATH_IMAGE023
(公式1)
基于如下公式2计算得到第一图像的真实近邻集A与第二近邻集B1之间的相似值
Figure 834790DEST_PATH_IMAGE024
Figure 608711DEST_PATH_IMAGE025
(公式2)
通过公式1计算得到第二图像的真实近邻集B与第一近邻集A1之间的相似值
Figure 332953DEST_PATH_IMAGE026
;通过公式2计算得到第二图像的真实近邻集B与第二近邻集B1之间的相似值
Figure 268548DEST_PATH_IMAGE027
S2083b:基于第一近邻集和第二近邻集分别与第一图像的真实近邻集和第二图像的真实近邻集,确定第一图像和第二图像分别对应的相似差。
具体地,通过第一图像的真实近邻集A与第一近邻集A1之间的相似值
Figure 586397DEST_PATH_IMAGE028
与第一图像的真实近邻集A与第二近邻集B1之间的相似值
Figure 901359DEST_PATH_IMAGE029
之间的差值确定第一图像对应的相似差SA,即
Figure 683370DEST_PATH_IMAGE030
通过第二图像的真实近邻集B与第一近邻集A1之间的相似值
Figure 852183DEST_PATH_IMAGE031
与第二图像的真实近邻集B与第二近邻集B1之间的相似值
Figure 985225DEST_PATH_IMAGE032
之间的差值确定第二图像对应的相似差SB,即
Figure 835369DEST_PATH_IMAGE033
如果第一图像的相似差SA和第二图像的相似差SB之间的差值越接近于0,表示第一图像和第二图像属于同一人的概率越大。
S2083c:在第一图像和第二图像分别对应的相似差中,基于数值最大的相似差,确定第一图像和第二图像之间的亲和度。
具体地,基于第一图像与第一近邻集对应的相似值和第一图像与第二近邻集对应的相似值之间的差值,确定第一图像的相似差;基于第二图像与第一近邻集对应的相似值和第二图像与第二近邻集对应的相似值之间的差值,确定第二图像的相似差。
在一具体实施例中,基于如下公式3基于数值最大的相似差,确定第一图像和第二图像之间的亲和度P。
P=1-max(SA,SB)(公式3)
式中:P表示亲和度,SA表示第一图像的相似差;SB表示第二图像的相似差。
S209:基于第一图像和第二图像之间的亲和度,确定第一图像和第二图像是否属于同一类簇图像集。
具体地,将第一图像和第二图像之间的亲和度与亲和度阈值进行比较。响应于亲和度超过亲和度阈值,确定第一图像和第二图像属于同一类簇图像集。
通过步骤S208和步骤S209确定第二图像和第三图像是否属于同一类簇图像集、第一图像和第三类簇是否属于同一类簇图像集。
S210:对至少一个类簇图像集进行聚合,得到待聚类图像集的最佳聚类结果。
具体地,基于任意两个类簇图像集是否包含相同的目标图像的情况,对至少一个类簇图像集进行聚合,得到至少一个最佳类簇;其中,每个最佳类簇包括至少一个类簇图像集;当最佳类簇包括多个类簇图像集时,多个类簇图像集中的任意两个类簇图像集包含相同的目标图像;响应于两个类簇图像集中包含同一目标图像,则将两个聚类图像集中包含的所有目标图像合并,形成最佳类簇;归属于同一类簇。
在一具体实施例中,第一图像和第二图像归属于同一类簇图像集,第二图像与第三图像归属于同一类簇图像集。第一图像和第三图像归属于不同的类簇。
基于目标图像之间亲和度的传导性,第一图像和第二图像归属于同一类簇、第三图像和第二图像归属于同一类簇图像集,即使通过亲和度判断第一图像和第三图像分别归属于不同的类簇,也可以基于传导性将第一图像和第二图像、第三图像归属于同一类簇图像集。
通过上述步骤遍历待聚类图像中所有的目标图像,得到待聚类图像对应的最佳聚类结果。
本实施例提供的图像聚类方法包括获取待聚类图像集,待聚类图像集包括多张目标图像;基于至少两种聚类方式分别对待聚类图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果;基于至少两种聚类方式分别对应的第一聚类结果,确定各目标图像的真实近邻集;基于各目标图像的真实近邻集,对待聚类图像集中的目标图像进行第二次聚类。本申请通过多种聚类方法分别对待聚类图像集中的目标图像进行聚类处理,得到多个第一聚类结果;对多个第一聚类结果进行集成学习确定各目标图像的真实近邻集,基于目标图像的真实近邻集对待聚类图像集中的目标图像进行第二次聚类,能够提高待聚类图像集中目标图像的聚类结果的准确率。
参阅图6,图6是本发明提供的图像聚类装置一实施例的示意框图。本实施例提供一种图像聚类装置60,图像聚类装置60包括获取模块61、第一聚类模块62、分析模块63和第二聚类模块64。
获取模块61用于获取待聚类图像集,待聚类图像集包括多张目标图像。
第一聚类模块62用于基于至少两种聚类方式分别对待聚类图像集中的目标图像进行初始聚类,得到至少两种聚类方式分别对应的第一聚类结果。
分析模块63用于基于至少两种聚类方式分别对应的第一聚类结果,确定各目标图像的真实近邻集。
第二聚类模块64用于基于各目标图像的真实近邻集,对待聚类图像集中的目标图像进行第二次聚类,得到最佳聚类结果。
本实施例中通过多种聚类方法分别对待聚类图像集中的目标图像进行聚类处理,得到多个第一聚类结果;对多个第一聚类结果进行集成学习确定各目标图像的真实近邻集,基于目标图像的真实近邻集对待聚类图像集中的目标图像进行第二次聚类,能够提高待聚类图像集中目标图像的聚类结果的准确率。
请参阅图7,图7是本发明提供的终端一实施方式的示意框图。终端80包括相互耦接的存储器81和处理器82,处理器82用于执行存储器81中存储的程序指令,以实现上述任一图像聚类方法实施例的步骤。在一个具体的实施场景中,终端80可以包括但不限于:微型计算机、服务器,此外,终端80还可以包括笔记本电脑、平板电脑等移动设备,在此不做限定。
具体而言,处理器82用于控制其自身以及存储器81以实现上述任一图像聚类方法实施例的步骤。处理器82还可以称为CPU(Central Processing Unit,中央处理单元)。处理器82可能是一种集成电路芯片,具有信号的处理能力。处理器82还可以是通用处理器、数字信号处理器(Digital Signal Processor, DSP)、专用集成电路(Application SpecificIntegrated Circuit, ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器82可以由集成电路芯片共同实现。
请参阅图8,图8是本发明提供的计算机可读存储介质一实施方式的示意框图。计算机可读存储介质90存储有能够被处理器运行的程序指令901,程序指令901用于实现上述任一图像聚类方法实施例的步骤。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的实施方式,并非因此限制本发明的专利保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (13)

1.一种图像聚类方法,其特征在于,包括:
获取待聚类图像集,所述待聚类图像集包括多张目标图像;
基于至少两种聚类方式分别对所述待聚类图像集中的目标图像进行初始聚类,得到所述至少两种聚类方式分别对应的第一聚类结果;
遍历所述待聚类图像集中各所述目标图像,基于选取的所述目标图像与所述待聚类图像集中其他所述目标图像之间的相似度,确定所述选取的目标图像对应的近邻图像集,所述近邻图像集包括与所述选取的目标图像的所述相似度最高的预设数量个近邻图像;
基于所述目标图像的近邻图像集和所述至少两种聚类方式分别对应的第一聚类结果,确定所述目标图像的真实近邻集,所述真实近邻集为所述近邻图像集的子集;
基于各所述目标图像的真实近邻集,对所述待聚类图像集中的所述目标图像进行第二次聚类,得到最佳聚类结果;
其中,所述基于所述目标图像的近邻图像集和所述至少两种聚类方式分别对应的第一聚类结果,确定所述目标图像的真实近邻集,包括:
基于所述目标图像与所述近邻图像在所述第一聚类结果中的占比,确定所述目标图像与所述近邻图像是否属于同一类簇;基于所述近邻图像集中与所述目标图像属于同一类簇的所述近邻图像,确定所述目标图像的真实近邻集;
其中,所述第一聚类结果包括所述待聚类图像集中包含的所述目标图像的聚类类别;
所述基于所述目标图像与所述近邻图像在所述第一聚类结果中的占比,确定所述目标图像与所述近邻图像是否属于同一类簇,包括:
在所述目标图像对应的所述近邻图像集中选取一所述近邻图像;
在所有所述第一聚类结果中,统计得到同时包含所述目标图像和所述选取的近邻图像的所述第一聚类结果的个数为第一数量;
在同时包含所述目标图像和所述选取的近邻图像的所有所述第一聚类结果中,统计得到所述目标图像的聚类类别和所述选取的近邻图像的聚类类别相同的所述第一聚类结果的个数为第二数量;
基于所述第二数量在所述第一数量中的占比,确定所述目标图像与所述选取的近邻图像是否属于同一类簇。
2.根据权利要求1所述的图像聚类方法,其特征在于,
所述基于至少两种聚类方式分别对所述待聚类图像集中的目标图像进行初始聚类,得到所述至少两种聚类方式分别对应的第一聚类结果,包括:
对所述待聚类图像集中的所述目标图像进行放回采样,得到至少两个子图像集;
通过所述至少两种聚类方式分别对各所述子图像集中的目标图像进行初始聚类,得到各所述聚类方式与各所述子图像集之间分别对应的所述第一聚类结果。
3.根据权利要求1或2所述的图像聚类方法,其特征在于,
所述基于至少两种聚类方式分别对所述待聚类图像集中的目标图像进行初始聚类,得到所述至少两种聚类方式分别对应的第一聚类结果,之前还包括:
对所述待聚类图像集中的所述目标图像进行特征提取,得到所述目标图像的第一特征图;将各所述目标图像的第一特征图分别进行降维,得到各所述目标图像的第二特征图;
所述基于至少两种聚类方式分别对所述待聚类图像集中的目标图像进行初始聚类,得到所述至少两种聚类方式分别对应的第一聚类结果,包括:
采用所述至少两种聚类方式,基于各所述目标图像的第二特征图分别对所述待聚类图像集中的所述目标图像进行初始聚类,得到所述至少两种聚类方式分别对应的第一聚类结果。
4.根据权利要求3所述的图像聚类方法,其特征在于,
所述将各所述目标图像的第一特征图分别进行降维,得到各所述目标图像的第二特征图,包括:
采用PCA方法分别对各所述目标图像的第一特征图分别进行降维,得到各所述目标图像的第二特征图。
5.根据权利要求1所述的图像聚类方法,其特征在于,
所述基于所述第二数量在所述第一数量中的占比,确定所述选取的目标图像与所述近邻图像是否属于同一类簇,包括:
响应于所述第二数量在所述第一数量中的占比大于预设值,确定所述目标图像与所述选取的近邻图像属于同一类簇;响应于所述第二数量在所述第一数量中的占比小于或等于所述预设值,确定所述目标图像与所述选取的近邻图像不属于同一类簇。
6.根据权利要求1所述的图像聚类方法,其特征在于,
所述基于各所述目标图像的真实近邻集,对所述待聚类图像集中的所述目标图像进行第二次聚类,得到最佳聚类结果,包括:
基于各所述目标图像的真实近邻集,确定任意两个所述目标图像之间的亲和度;
基于任意两个所述目标图像之间的亲和度,将所述待聚类图像集中的所述目标图像划分为至少一个类簇图像集;所述类簇图像集中包括所述亲和度大于亲和度阈值的至少两个所述目标图像;
对所述至少一个类簇图像集进行聚合,得到所述待聚类图像集的最佳聚类结果。
7.根据权利要求6所述的图像聚类方法,其特征在于,
所述任意两个目标图像之间的亲和度通过如下方式确定,包括:
在所述多张目标图像中任意选取两张所述目标图像,一张所述目标图像为第一图像,另一张所述目标图像为第二图像;
基于所述第二图像的真实近邻集的补集与所述第一图像的真实近邻集之间的交集,确定第一近邻集;所述第一近邻集为所述第一图像的真实近邻集的子集;
基于所述第一图像的真实近邻集的补集与所述第二图像的真实近邻集之间的交集,确定第二近邻集;所述第二近邻集为所述第二图像的真实近邻集的子集;
基于所述第一近邻集和所述第二近邻集分别与所述第一图像的真实近邻集和所述第二图像的真实近邻集,确定所述第一图像和所述第二图像之间的亲和度。
8.根据权利要求7所述的图像聚类方法,其特征在于,
所述基于所述第一近邻集和所述第二近邻集分别与所述第一图像的真实近邻集和所述第二图像的真实近邻集,确定所述第一图像和所述第二图像之间的亲和度,包括:
基于所述第一近邻集和所述第二近邻集分别与所述第一图像的真实近邻集和所述第二图像的真实近邻集,确定所述第一图像和所述第二图像分别对应的相似差;
在所述第一图像和所述第二图像分别对应的所述相似差中,基于数值最大的所述相似差,确定所述第一图像和所述第二图像之间的亲和度。
9.根据权利要求8所述的图像聚类方法,其特征在于,
所述基于所述第一近邻集和所述第二近邻集分别与所述第一图像的真实近邻集和所述第二图像的真实近邻集,确定所述第一图像和所述第二图像分别对应的相似差,包括:
基于所述第一图像的真实近邻集和所述第二图像的真实近邻集分别与所述第一近邻集和所述第二近邻集,确定所述第一图像和所述第二图像分别与所述第一近邻集和所述第二近邻集之间对应的相似值;
基于所述第一图像与所述第一近邻集对应的所述相似值和所述第一图像与所述第二近邻集对应的所述相似值之间的差值,确定所述第一图像的相似差;
基于所述第二图像与所述第一近邻集对应的所述相似值和所述第二图像与所述第二近邻集对应的所述相似值之间的差值,确定所述第二图像的相似差。
10.根据权利要求6所述的图像聚类方法,其特征在于,所述最佳聚类结果包括多个最佳类簇,每个所述最佳类簇包括至少一个所述目标图像;
所述对所述至少一个类簇图像集进行聚合,得到所述待聚类图像集的最佳聚类结果,还包括:
基于任意两个所述类簇图像集是否包含相同的所述目标图像的情况,对所述至少一个类簇图像集进行聚合,得到至少一个所述最佳类簇;其中,每个所述最佳类簇包括至少一个所述类簇图像集;当所述最佳类簇包括多个所述类簇图像集时,所述多个所述类簇图像集中的任意两个所述类簇图像集包含相同的所述目标图像;
响应于两个所述类簇图像集中包含同一所述目标图像,则将所述两个所述类簇图像集中包含的所有所述目标图像合并,形成所述最佳类簇;归属于同一类簇。
11.一种图像聚类装置,其特征在于,包括:
获取模块,用于获取待聚类图像集,所述待聚类图像集包括多张目标图像;
第一聚类模块,用于基于至少两种聚类方式分别对所述待聚类图像集中的目标图像进行初始聚类,得到所述至少两种聚类方式分别对应的第一聚类结果;
分析模块,用于遍历所述待聚类图像集中各所述目标图像,基于选取的所述目标图像与所述待聚类图像集中其他所述目标图像之间的相似度,确定所述选取的目标图像对应的近邻图像集,所述近邻图像集包括与所述选取的目标图像的所述相似度最高的预设数量个近邻图像;基于所述目标图像的近邻图像集和所述至少两种聚类方式分别对应的第一聚类结果,确定所述目标图像的真实近邻集,所述真实近邻集为所述近邻图像集的子集;其中,所述分析模块还用于基于所述目标图像与所述近邻图像在所述第一聚类结果中的占比,确定所述目标图像与所述近邻图像是否属于同一类簇;基于所述近邻图像集中与所述目标图像属于同一类簇的所述近邻图像,确定所述目标图像的真实近邻集;所述第一聚类结果包括所述待聚类图像集中包含的所述目标图像的聚类类别;在所述目标图像对应的所述近邻图像集中选取一所述近邻图像;在所有所述第一聚类结果中,统计得到同时包含所述目标图像和所述选取的近邻图像的所述第一聚类结果的个数为第一数量;在同时包含所述目标图像和所述选取的近邻图像的所有所述第一聚类结果中,统计得到所述目标图像的聚类类别和所述选取的近邻图像的聚类类别相同的所述第一聚类结果的个数为第二数量;基于所述第二数量在所述第一数量中的占比,确定所述目标图像与所述选取的近邻图像是否属于同一类簇;
第二聚类模块,用于基于各所述目标图像的真实近邻集,对所述待聚类图像集中的所述目标图像进行第二次聚类,得到最佳聚类结果。
12.一种终端,其特征在于,所述终端包括存储器、处理器以及存储于所述存储器中并在所述处理器上运行的计算机程序,所述处理器用于执行程序数据以实现如权利要求1~10任一项所述的图像聚类方法中的步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1~10任一项所述的图像聚类方法中的步骤。
CN202211014888.5A 2022-08-23 2022-08-23 一种图像聚类方法、装置、终端及计算机可读存储介质 Active CN115100453B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211014888.5A CN115100453B (zh) 2022-08-23 2022-08-23 一种图像聚类方法、装置、终端及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211014888.5A CN115100453B (zh) 2022-08-23 2022-08-23 一种图像聚类方法、装置、终端及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN115100453A CN115100453A (zh) 2022-09-23
CN115100453B true CN115100453B (zh) 2022-11-18

Family

ID=83300607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211014888.5A Active CN115100453B (zh) 2022-08-23 2022-08-23 一种图像聚类方法、装置、终端及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN115100453B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101859326A (zh) * 2010-06-09 2010-10-13 南京大学 一种图像检索方法
KR101414045B1 (ko) * 2013-06-24 2014-07-02 인하대학교 산학협력단 분광라이브러리 데이터와 입력된 초분광영상을 이용한 표적탐지방법
CN109447186A (zh) * 2018-12-13 2019-03-08 深圳云天励飞技术有限公司 聚类方法及相关产品
CN112766299A (zh) * 2020-12-09 2021-05-07 江苏师范大学 一种人脸图像的迭代式双向连接聚类算法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101859326A (zh) * 2010-06-09 2010-10-13 南京大学 一种图像检索方法
KR101414045B1 (ko) * 2013-06-24 2014-07-02 인하대학교 산학협력단 분광라이브러리 데이터와 입력된 초분광영상을 이용한 표적탐지방법
CN109447186A (zh) * 2018-12-13 2019-03-08 深圳云天励飞技术有限公司 聚类方法及相关产品
CN112766299A (zh) * 2020-12-09 2021-05-07 江苏师范大学 一种人脸图像的迭代式双向连接聚类算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"A novel internal validity index based on the cluster centre and the nearest neighbour cluster";Shibing Zhou等;《Applied Soft Computing》;20181031;第71卷;全文 *
"混合属性数据集的基于近邻连接的两阶段聚类算法";陈新泉;《计算机工程与科学》;20120930;第34卷(第09期);全文 *

Also Published As

Publication number Publication date
CN115100453A (zh) 2022-09-23

Similar Documents

Publication Publication Date Title
Zhao et al. Learning mid-level filters for person re-identification
Sznitman et al. Active testing for face detection and localization
Ibrahim et al. Cluster representation of the structural description of images for effective classification
Lin et al. Large-scale image clustering based on camera fingerprints
CA3066029A1 (en) Image feature acquisition
Srinivas et al. Structured sparse priors for image classification
CN111428587B (zh) 人群计数及密度估计方法、装置、存储介质及终端
Dehshibi et al. Cubic norm and kernel-based bi-directional PCA: toward age-aware facial kinship verification
CN110751027B (zh) 一种基于深度多示例学习的行人重识别方法
Madheswaran et al. Classification of brain MRI images using support vector machine with various Kernels
CN112991263A (zh) 用于提升pd-l1免疫组化病理切片tps计算准确度的方法及设备
CN112016623A (zh) 一种人脸聚类方法、装置、设备及存储介质
Banerjee et al. Robust clustering
CN107480628B (zh) 一种人脸识别方法及装置
Phan et al. Image clustering by source camera via sparse representation
CN115100453B (zh) 一种图像聚类方法、装置、终端及计算机可读存储介质
CN112800138B (zh) 大数据分类方法及系统
Lee et al. Automatic classification on patient-level breast cancer metastases
Hoti et al. A semiparametric density estimation approach to pattern classification
Patil et al. Embedded Integration Strategy to Image Segmentation Using Canny Edge and K-Means Algorithm
Salloum et al. Efficient image splicing localization via contrastive feature extraction
Zhao Ensemble methods for anomaly detection
CN111625672B (zh) 图像处理方法、装置、计算机设备及存储介质
Bucak et al. Online video scene clustering by competitive incremental NMF
CN108830313B (zh) 一种共生模式图像挖掘方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant