CN112949710B

CN112949710B - 一种图像的聚类方法和装置

Info

Publication number: CN112949710B
Application number: CN202110220248.9A
Authority: CN
Inventors: 甘露; 付琰; 周洋杰; 陈亮辉; 许顺楠
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-02-26
Filing date: 2021-02-26
Publication date: 2023-06-13
Anticipated expiration: 2041-02-26
Also published as: EP3905126A3; US20210365713A1; US11804069B2; CN112949710A; EP3905126A2

Abstract

本公开公开了一种图像的聚类方法和装置，涉及人工智能技术领域，进一步涉及大数据技术领域。具体实现方案为：获取新增图像，对新增图像进行聚类，以获取第一聚类簇；从已有的历史聚类簇中，获取与第一聚类簇相似的历史聚类簇，作为第二聚类簇；获取第一聚类簇与第二聚类簇之间的距离；基于距离，对第一聚类簇和第二聚类簇进行融合，以生成目标聚类簇。本公开的一种图像的聚类方法和装置，在基于新增图像的情况下无需对已有的历史聚类簇进行二次聚类处理，而是直接对新旧聚类簇进行融合，可以将新聚类簇中的新增图像批量融合到历史聚类簇中，不仅可以解决二次聚类占用较大资源的问题，而且提高了新增图像的聚类效率。

Description

一种图像的聚类方法和装置

技术领域

本公开涉及人工智能技术领域，进一步涉及大数据技术领域。

背景技术

现有的图像聚类方法主要为，针对大量图像，先进行抽样获取抽样图像，对抽样图像进行聚类，得到各个聚类结果的质心，然后将大量图像中的未抽样到的图像或者新增的图像，通过二次聚类的方式归类到已有的各个聚类结果中，得到最终的聚类结果。通过二次聚类的方式对未抽样图像或者新增图像进行归类，往往需要多次执行聚类过程，导致聚类占用资源较多，聚类时效性低。

发明内容

本公开提供了一种图像的聚类方法。在基于新增图像的情况下无需对已有的历史聚类簇进行二次聚类处理，而是直接对新旧类簇进行融合，可以将新聚类簇中的新增图像批量融合到历史聚类簇中，不仅可以解决二次聚类占用较大资源的问题，而且提高了新增图像的聚类效率。

根据本公开的另一方面，提供了一种图像的聚类装置。

根据本公开的另一方面，提供了一种电子设备。

根据本公开的另一方面，提供了一种非瞬时计算机可读存储介质。

根据本公开的另一方面，提供了一种计算机程序产品。

为达上述目的，本公开第一方面实施例提出了一种图像的聚类方法方法，包括：

获取新增图像，对所述新增图像进行聚类，以获取第一聚类簇；

从已有的历史聚类簇中，获取与所述第一聚类簇相似的历史聚类簇，作为第二聚类簇；

获取所述第一聚类簇与所述第二聚类簇之间的距离；

基于所述距离，对所述第一聚类簇和所述第二聚类簇进行融合，以生成目标聚类簇。

为达上述目的，本公开第二方面实施例提出了一种图像的聚类方法装置，包括：

第一获取模块，用于获取新增图像，对所述新增图像进行聚类，以获取第一聚类簇；

第二获取模块，用于从已有的历史聚类簇中，获取与所述第一聚类簇相似的历史聚类簇，作为第二聚类簇；

第三获取模块，用于获取所述第一聚类簇与所述第二聚类簇之间的距离；

簇融合模块，用于基于所述距离，对所述第一聚类簇和所述第二聚类簇进行融合，以生成目标聚类簇。

为达上述目的，本公开第三方面实施例提出了一种电子设备，包括存储器、处理器。所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以实现如本公开第一方面实施例所述的图像的聚类方法。

为达上述目的，本公开第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于实现如本公开第一方面实施例所述的图像的聚类方法。

为达上述目的，本公开第五方面实施例提出了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时以实现如本公开第一方面实施例所述的图像的聚类方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开实施例一种图像的聚类方法的示意图；

图2是根据本公开实施例获取历史聚类簇的示意图；

图3是根据本公开实施例将冲突新增图像从目标聚类簇中拆出示意图；

图4是根据本公开实施例确定冲突新增图像的示意图；

图5是根据本公开实施例一种图像的聚类方法的流程示意图；

图6是根据本公开实施例一种图像的聚类装置的示意图；

图7是根据本公开实施例一种电子设备的结构图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

图像处理(Image Processing)，用计算机对图像进行分析，以达到所需结果的技术。又称影像处理。图像处理一般指数字图像处理。数字图像是指用工业相机、摄像机、扫描仪等设备经过拍摄得到的一个大的二维数组，该数组的元素称为像素，其值称为灰度值。图像处理技术一般包括图像压缩，增强和复原，匹配、描述和识别3个部分。

深度学习(Deep Learning，简称DL)，是机器学习(Machine Learning，简称ML)领域中一个新的研究方向，它被引入机器学习使其更接近于最初的目标——人工智能。深度学习是学习样本数据的内在律和表示层次，这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法，在语音和图像识别方面取得的效果，远远超过先前相关技术。

计算机视觉(Computer Vision)，是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shannon定义的，可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息，所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。

人工智能(Artificial Intelligence，简称AI)，是研究使计算机来模拟人生的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术，也有软件层面的技术。人工智能硬件技术一般包括计算机视觉技术、语音识别技术、自然语言处理技术以及及其学习/深度学习、大数据处理技术、知识图谱技术等几大方面。

图1是根据本公开一个实施例的图像的聚类方法的流程图，如图1所示，该图像的聚类方法包括以下步骤：

S101，获取新增图像，对新增图像进行聚类，以获取第一聚类簇。

聚类是一种将物理或抽象对象的集合分成由类似的对象组成的多个类的无监督处理手段。

本公开中新增图像可以为图像采集装置新采集的图像，也可以为已有图像中未抽样到的图像。在获取到新增图像后，可以对新增图像进行聚类，最终得到新增图像对应的第一聚类簇，其中，第一聚类簇可以为一个或者多个，由新增图像的实际图像情况确定。

本公开中，在对新增图像进行聚类时，首先对新增图像进行特征信息的提取，基于提取到的特征信息进行聚类。其中，图像的特征信息可以包括：人脸特征、人体属性、车辆属性、时间属性等。可选地，可以基于图像识别模型对图像进行特征信息的提取，得到图像的特征信息，其中特征信息可以以向量的形式进行表述。可选地，为了提供图像特征提取的效率，可以采用分布式聚类算法对新增图像进行聚类处理。例如，可以采用K-Means聚类、均值漂移聚类、基于密度的聚类方法、用高斯混合模型的最大期望聚类、凝聚层次聚类、图团体检测。

下面以K-means聚类为例对图像的聚类过程进行说明，随机选取K个特征向量作为初始的聚类中心，随机选取的特征向量为K个新增图像的特征向量，对新增图像中每一个特征向量计算与每个聚类中心的欧式距离，选择欧式距离最小的聚类中心作为相同的类，对所有新增图像中每一个特征向量进行一次聚类结束后，求其中心点作为新的聚类中心，循环此过程直到聚类中心不再发生变化为止。得到新增图像对应的一个或者多个新增的聚类簇，作为第一聚类簇。

本公开实施例中，聚类的执行可以在预设的时间节点，比如说每隔两个小时对图像进行一次聚类，此两个小时中增加的图像即为新增图像；也可以在新增图像累积到一定数量时，比如说新增加了一万张图像的时候对图像进行一次聚类，此一万张图像即为新增图像。两个小时和一万张图像此处仅为示例，不能作为限制本申请的条件。

S102，从已有的历史聚类簇中，获取与第一聚类簇相似的历史聚类簇，作为第二聚类簇。

本公开实施例中，由于聚类是每隔一定时间或者每新增一定数量的图片就会进行聚类，也就是说在每次聚类之前，已经存在之前聚类产生的聚类簇，将每次聚类前已经存在的聚类簇作为历史聚类簇。获取与第一聚类簇相似的历史聚类簇，可以将相似的第一聚类簇与历史聚类簇融合，将相同特征的图像聚类在一起。

针对任意一个第一聚类簇，将该第一聚类簇的聚类中心图像的特征向量分别与历史聚类簇的聚类中心图像的特征向量进行比较，可以获取第一聚类簇与每个历史聚类簇的相似度。例如，可以获取第一聚类簇的聚类中心图像的特征向量，以及历史聚类簇的聚类中心图像的特征向量，获取两个聚类中心图像特征向量的欧式距离或者余弦值来衡量两者的相似性。

进一步地，可以预先设置相似度阈值，通过该相似度阈值来判断两个聚类簇是否相似，本公开对相似度阈值的具体取值不进行限定。

当第一聚类簇与历史聚类簇的相似度大于或者等于预设的相似度阈值时，说明该历史聚类簇与第一聚类簇相似，将此历史聚类簇作为第二聚类簇。需要说明的是，每个第一聚类簇对应的第二聚类簇可以为一个或多个。一般相似度阈值越高，第一聚类簇对应的第二聚类簇的数量越少，相似度阈值越低，第一聚类簇对应的第二聚类簇的数量越多。

S103，获取第一聚类簇与第二聚类簇之间的距离。

作为一种可能的实现方式，计算第一聚类簇中每个新增图像与该聚类簇的聚类中心的欧式距离，将每个方向上距离聚类中心的欧式距离最大的图像作为第一聚类簇的边缘新增图像。计算第二聚类簇中每个图像与该聚类簇的聚类中心的欧式距离，将每个方向上距离聚类中心的欧式距离最大的图像作为第二聚类簇的边缘历史图像。根据边缘新增图像的特征向量和边缘历史图像的特征向量，可以计算得到第一聚类簇和第二聚类簇之间的最小距离、最大距离或者平均距离。需要说明的是，特征向量可以为特定特征的向量，也可以为多个特征的融合向量。

作为另一种可能的实现方式，在获取到第一聚类簇和第二聚类簇后，可以获取第一聚类簇与第二聚类簇之间的距离。可选地，获取作为第一聚类簇的聚类中心的图像，以及作为第二聚类簇的聚类中心的图像，获取两个图像之间的距离，作为第一聚类簇与第二聚类簇之间的距离。

作为另一种可能的实现方式，以属于第一聚类簇的任意一个新增图像为例，获取该任意一个新增图像与属于第二聚类簇的每个图像之间的距离，然后获取所有距离的平均值，将距离的平均值作为第一聚类簇与第二聚类簇之间的距离。

S104，基于距离，对第一聚类簇和第二聚类簇进行融合，以生成目标聚类簇。

本公开中，确定第一聚类簇与第二聚类簇的聚类中心的欧式距离，结合距离对距离进行从小到大排序，得到排序结果。将与第一聚类簇距离最小的第二聚类簇作为待合并的目标第二聚类簇，并将目标第二聚类簇与第一聚类簇进行融合，得到融合后聚类簇，作为目标聚类簇，并重新确定聚类中心。

以新增图像为人脸图像为例，基于人脸特征对人脸图像进行聚类，从而可以将属于同一个人的图像汇总到一起，汇总在一起的目标聚类簇，就可以作为同一个人的图像档案。也就是说，以聚类出的目标聚类簇中的人脸图像，生成同一个人的图像档案。以新增图像为动物图像为例时，可以基于提取的特征对动物图像进行聚类，最终生成同一个动物的图像档案。

本公开提出的图像的聚类方法，获取新增图像，对新增图像进行聚类，以获取第一聚类簇，从已有的历史聚类簇中，获取与第一聚类簇相似的历史聚类簇，作为第二聚类簇，获取第一聚类簇与第二聚类簇之间的距离，基于该距离对第一聚类簇和第二聚类簇进行融合，以生成目标聚类簇。本公开在基于新增图像的情况下无需对已有的历史聚类簇进行二次聚类处理，而是直接对新旧类簇进行融合，可以将新聚类簇中的新增图像批量融合到历史聚类簇中，不仅可以解决二次聚类占用较大资源的问题，而且提高了新增图像的聚类效率。

图2是根据本公开的图像的聚类方法的流程图，在上述实施例的基础之上，从已有的历史聚类簇中，获取与第一聚类簇相似的历史聚类簇，如图2所示，包括以下步骤：

S201，获取第一聚类簇的第一簇中心向量和历史聚类簇的第二簇中心向量。

第一簇中心向量和第二簇中心向量的获取过程是类似的，可以将新增图像，以及已经聚类过的历史图像称为待聚类的图像，下面以待聚类图像为例，来说明聚类簇的簇中心向量的获取过程。

作为一种可能的实现方式：根据属于同一聚类簇的图像的目标特征向量，确定簇中心向量。当待聚类图像为新增图像时，获取到的簇中心向量即为第一簇中心向量。当待聚类图像为历史图像时，获取到的簇中心向量即为第二簇中心向量。

以人脸特征为特征信息为例，采用CNN卷积神经网络模型对图像进行特征提取，将图像集输入训练好的CNN卷积神经网络模型中，提取出描述该图像的特征向量。例如，可以将人脸特征向量作为目标特征向量，确定第一聚类簇和第二聚类簇后，根据属于第一聚类簇的新增图像的人脸特征向量，确定该第一聚类簇的第一簇中心向量；根据属于历史聚类簇的历史图像的人脸特征向量，确定历史聚类簇的第二簇中心向量。

作为另一种可能的实现方式：从待聚类图像中提取多个特征信息对应的多个特征向量，特征信息包括：人脸特征、人体属性、车辆属性、时间属性等。对多个特征向量采用直接拼接或者以权重和的形式进行融合得到融合后的结果，作为融合特征向量。根据属于同一聚类簇的图像的融合特征向量，确定簇中心向量。当待聚类图像为新增图像时，获取到的簇中心向量即为第一簇中心向量，当待聚类图像为历史图像时，获取到的簇中心向量即为第二簇中心向量。

需要说明的是，簇中心向量可以为质心对应的向量，其中，质心由所有属于该类簇的目标特征向量的欧式距离的平均值得到。可选地，先计算该聚类簇的质心，再确定距离质心最近的待聚类图像，将该待聚类图像对应的目标特征向量，作为簇中心向量。

S202，获取第一簇中心向量与第二簇中心向量之间的相似度。

可选地，获取第一簇中心向量与第二簇中心向量的余弦值，通过该余弦值来衡量两者的相似性。

S203，基于相似度从已有的历史聚类簇中，获取相似的历史聚类簇。

可选地，将第一聚类簇与每个历史聚类簇的相似度与预设的相似度阈值进行比较，选取超出相似度阈值的历史聚类簇，作为相似的历史聚类簇即第二聚类簇。可选地，将第一聚类簇与每个历史聚类簇的相似度进行排序，从大到小的顺序选取一定数量的历史聚类簇，作为相似的历史聚类簇即第二聚类簇。

本公开中，新增的第一聚类簇的簇中心向量，从历史聚类簇中选取出相似的历史聚类簇，有利于后续聚类簇的融合，并且在融合时优先融合到相似的历史聚类簇中，提高了聚类的准确性。

图3是根据本公开的图像的聚类方法的流程图，在上述实施例的基础之上，将第一聚类簇合并至目标第二聚类簇中，生成目标聚类簇之后，如图3所示，聚类方法还包括以下步骤：

S301，获取属于第一聚类簇的目标新增图像的第一属性信息。

可选地，以人脸图像为例，属性信息可以包括衣服属性、车牌属性、时空属性、性别属性等。可选地，采用CNN卷积神经网络模型进行特征提取的过程中，在CNN卷积神经网络中可以同步提取图像的属性信息。

需要说明的是，新增图像中的属于第一聚类簇的新增图像称为目标新增图像。将属于第一聚类簇的目标新增图像在训练好的CNN卷积神经网络模型中提取出描述该图像的比如衣服颜色、车牌号信息、时空信息和/或性别信息等作为第一属性信息。

以狗的图像为例，属性信息可以包括狗的颜色、狗的种类、狗的年龄、狗的住所等作为第一属性信息。

S302，获取属于目标第二聚类簇的目标历史图像的第二属性信息。

需要说明的是，历史图像中的属于目标第二聚类簇的历史图像称为目标历史图像。与第一属性信息的过程类似，此处不再赘述。

S303，基于第一属性信息和第二属性信息，确定目标新增图像中是否存在与目标历史图像冲突的冲突新增图像。

如图4所示，基于第一属性信息和第二属性信息，确定属于目标新增图像中是否存在与目标历史图像冲突的冲突新增图像，包括以下步骤：

S401，获取属于同一时间范围内的目标新增图像和目标历史图像。

每个图象都有各自的生成时间，以图像的生成时间为依据，对目标新增图像和目标历史图像进行时间段归类，获取属于同一时间范围内的目标新增图像和目标历史图像。比如将2021年2月1日的所有目标新增图像和目标历史图像提取出来，此时获取得到的目标新增图像和目标历史图像属于同一时间范围内。

S402，响应于属于同一时间范围内的目标新增图像的第一属性信息和目标历史图像的第二属性信息相异，将第一属性信息与目标历史图像的第二属性信息相异的目标新增图像，确定为冲突新增图像。

根据第一属性信息和第二属性信息，即从衣服颜色、车牌号信息、时空信息等多个方面，判断目标新增图像与目标历史图像是否存在冲突。一般情况下同一对象的同一类型的属性信息在同一时间段内往往是相同，若目标新增图像与目标历史图像的属性信息在同一时间段内相异，说明目标新增图像与目标历史图像可能不属于同一对象。比如，同一个人在一天内的衣服往往是不变的，因此，可以基于该人员的在目标新增图像中衣服的颜色，与属于同一天的目标历史图像中衣服的颜色，来判断目标新增图像中是否存在与目标历史图像存在冲突的冲突新增图像，即将目标新增图像中衣服颜色与目标历史图像中衣服颜色不同的新增图像，确定为冲突新增图像。在比如，说某个目标新增图像的车牌号与目标历史图像中的车牌号不相同，则判断该目标新增图像为冲突新增图像；比如说某个目标新增图像的某时间点的地点显示为新疆，而目标历史图像中该时间点的地点显示为海南，显然同一人员不可能同一时刻出现在距离如此之大的两地，则判断该目标新增图像为冲突新增图像。

S304，响应于存在冲突新增图像，将冲突新增图像从目标聚类簇中拆出，并以拆出的冲突新增图像形成另一聚类簇。

若目标新增图像的第一属性信息与目标聚类簇中的第二属性信息相异，说明该目标新增图像并不属于该目标聚类簇，确定该目标新增图像为冲突新增图像，将该冲突新增图像进行标记并从目标聚类簇中拆出。进一步地，由于冲突新增图像之间是具有相似性的新增图像，因此可以直接以拆出的冲突新增图像形成另一聚类簇。可选地，也可以基于冲突新增图像的原始属性信息，对冲突新增图像进行划分，形成至少一个聚类簇。

本公开中，对目标新增图像的第一属性信息与目标历史图像中的第二属性信息进行比较，可以识别出不属于目标聚类簇的目标新增图像，将其确定为冲突新增图像并拆出，并以拆出的冲突新增图像形成另一聚类簇。可以保证目标聚类簇中的图像属性信息相同。可选地，以人脸图像为例，识别冲突新增图像并拆出，并以拆出的冲突新增图像形成另一聚类簇，可以保证目标聚类簇中的图像都为同一个人在特定时间段的行踪，提高了聚类的准确性。

进一步地，根据上述得到的目标聚类簇的聚类中心，计算目标聚类簇中各图象与该目标聚类簇聚类中心的欧氏距离，将欧氏距离最小的图像设定为该目标聚类簇的标识图象。被选取为标识图像的图像，可能为新聚类到目标聚类簇的新增图像，也可能为之前聚类到目标聚类簇中的历史图像。

以人像为例，最终生成的目标聚类簇内包括的图像往往属于为同一个人，该目标聚类簇内的图像可以形成该人员的图像档案，可以将该目标聚类簇中距离聚类中心距离最近的人像作为该人员的标识图像，可以以该标识图像作为该人员的档案封面。

本公开实施例中，基于人工标注的目标聚类簇的黑白名单，可以将黑白名单中的图像分别作为训练样本图像，从而可以用于对图像识别模型进行优化训练，得到识别精度更高的模型。

图5是根据本公开的图像的聚类方法的流程图，如图5所示，图像的聚类方法包括以下步骤：

S501，获取新增图像，对新增图像进行聚类，以获取第一聚类簇。

S502，获取第一聚类簇的第一簇中心向量和历史聚类簇的第二簇中心向量。

S503，获取第一簇中心向量与第二簇中心向量之间的相似度。

S504，基于相似度从已有的历史聚类簇中，获取相似的历史聚类簇，作为第二聚类簇。

关于上述S502～S504的具体介绍，可参见上述实施例中S102步骤相关内容的记载，此处不再赘述。

S505，获取第一聚类簇与第二聚类簇之间的距离。

S506，选取与第一聚类簇距离最小的目标第二聚类簇，将第一聚类簇合并至目标第二聚类簇中，生成目标聚类簇。

S507，获取属于第一聚类簇的目标新增图像的第一属性信息。

S508，获取属于目标第二聚类簇的目标历史图像的第二属性信息。

S509，获取属于同一时间范围内的目标新增图像和目标历史图像。

S510，响应于属于同一时间范围内的目标新增图像的第一属性信息和目标历史图像的第二属性信息相异，将第一属性信息与目标历史图像的第二属性信息相异的目标新增图像，确定为冲突新增图像。

S511，响应于存在冲突新增图像，将冲突新增图像从目标聚类簇中拆出，并以拆出的冲突新增图像形成另一聚类簇。

可选地，本公开实施例的处理对象并不局限于图像，可以对其他类型的新增数据进行同样的处理。

本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用，均符合相关法律法规的规定，且不违背公序良俗。本公开的意图是，应以使无意或未经授权的使用访问风险最小化的方式来管理和处理个人信息数据。通过限制数据收集并在不再需要时删除数据，从而将风险降到最低。需要说明的是，本申请中与人员有关的所有信息，均在人员知情且同意的情况下收集。

图6是根据本公开一个实施例的图像的聚类装置600的结构图。如图6所示，图像的聚类装置600包括：

第一获取模块61，用于获取新增图像，对新增图像进行聚类，以获取第一聚类簇；

第二获取模块62，用于从已有的历史聚类簇中，获取与第一聚类簇相似的历史聚类簇，作为第二聚类簇；

第三获取模块63，用于获取第一聚类簇与第二聚类簇之间的距离；

簇融合模块64，用于基于距离，对第一聚类簇和第二聚类簇进行融合，以生成目标聚类簇。

需要说明的是，前述对图像的聚类方法实施例的解释说明也适用于该实施例的图像的聚类装置，此处不再赘述。

本公开提出的图像的聚类装置，获取新增图像，对新增图像进行聚类，以获取第一聚类簇，从已有的历史聚类簇中，获取与第一聚类簇相似的历史聚类簇，作为第二聚类簇，获取第一聚类簇与第二聚类簇之间的距离，基于该距离对第一聚类簇和第二聚类簇进行融合，以生成目标聚类簇。本公开在基于新增图像的情况下无需对已有的历史聚类簇进行二次聚类处理，而是直接对新旧类簇进行融合，可以将新聚类簇中的新增图像批量融合到历史聚类簇中，不仅可以解决二次聚类占用较大资源的问题，而且提高了新增图像的聚类效率。

进一步的，在本公开实施例一种可能的实现方式中，第二获取模块62具体用于：获取第一聚类簇的第一簇中心向量和历史聚类簇的第二簇中心向量；获取第一簇中心向量与第二簇中心向量之间的相似度；基于相似度从已有的历史聚类簇中，获取相似的历史聚类簇。

进一步的，在本公开实施例一种可能的实现方式中，第二获取模块62还用于：从待聚类的图像中提取目标特征向量，并根据属于同一聚类簇的图像的目标特征向量，确定簇中心向量。

进一步的，在本公开实施例一种可能的实现方式中，第二获取模块62还用于：响应于待聚类图像中携带人脸，从待聚类图像中提取人脸特征向量作为目标特征向量。

进一步的，在本公开实施例一种可能的实现方式中，第二获取模块62还用于：从待聚类图像中提取多个特征向量，并对多个特征向量进行特征融合，生成融合特征向量；基于同一聚类簇的图像的融合特征向量确定簇中心向量。

进一步的，在本公开实施例一种可能的实现方式中，簇融合模块64具体用于：根据距离，选取与第一聚类簇距离最小的目标第二聚类簇，将第一聚类簇合并至目标第二聚类簇中，生成目标聚类簇。

进一步的，在本公开实施例一种可能的实现方式中，簇融合模块64还用于：生成目标聚类簇之后，获取属于第一聚类簇的目标新增图像的第一属性信息；获取属于目标第二聚类簇的目标历史图像的第二属性信息；基于第一属性信息和第二属性信息，确定目标新增图像中是否存在与目标历史图像冲突的冲突新增图像；响应于存在冲突新增图像，将冲突新增图像从目标聚类簇中拆出，并以拆出的冲突新增图像形成另一聚类簇。

进一步的，在本公开实施例一种可能的实现方式中，簇融合模块64还用于：获取属于同一时间范围内的目标新增图像和目标历史图像；响应于属于同一时间范围内的目标新增图像的第一属性信息和目标历史图像的第二属性信息相异，将第一属性信息与目标历史图像的第二属性信息相异的目标新增图像，确定为冲突新增图像。

进一步的，在本公开实施例一种可能的实现方式中，还包括标记模块65，用于：以距离目标聚类簇的簇中心最近的图像作为目标聚类簇的标识图像。

进一步的，在本公开实施例一种可能的实现方式中，第三获取模块63，用于：获取属于第一聚类簇且位于第一聚类簇边缘的边缘新增图像；获取属于第二聚类簇且位于第二聚类簇边缘的边缘历史图像；

根据边缘新增图像的特征向量和边缘历史图像的特征向量，获取第一聚类簇和第二聚类簇之间的距离。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图7所示，设备700包括计算单元701，其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序，来执行各种适当的动作和处理。在RAM 703中，还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

设备700中的多个部件连接至I/O接口705，包括：输入单元706，例如键盘、鼠标等；输出单元707，例如各种类型的显示器、扬声器等；存储单元708，例如磁盘、光盘等；以及通信单元709，例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理，例如图像的聚类方法。例如，在一些实施例中，图像的聚类方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元708。在一些实施例中，计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时，可以执行上文描述的图像的聚类方法的一个或多个步骤。备选地，在其他实施例中，计算单元701可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行图像的聚类方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务端可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务(“Virtual Private Server”，或简称“VPS”)中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合区块链的服务器。

根据本申请的实施例，本申请还提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时以实现如本公开第一方面实施例的图像的聚类方法。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种图像的聚类方法，包括：

获取新增图像，对所述新增图像采用分布式聚类算法进行聚类，以获取第一聚类簇；

获取所述第一聚类簇与所述第二聚类簇之间的距离；

根据所述距离，选取与所述第一聚类簇距离最小的目标第二聚类簇，将所述第一聚类簇合并至所述目标第二聚类簇中，生成所述目标聚类簇；其中，所述将所述第一聚类簇合并至所述目标第二聚类簇中，生成所述目标聚类簇之后，还包括：

获取属于所述第一聚类簇的目标新增图像的第一属性信息；

获取属于所述目标第二聚类簇的目标历史图像的第二属性信息；

基于所述第一属性信息和所述第二属性信息，确定所述目标新增图像中是否存在与所述目标历史图像冲突的冲突新增图像；

响应于存在所述冲突新增图像，将所述冲突新增图像从所述目标聚类簇中拆出，并以拆出的所述冲突新增图像形成另一聚类簇；所述基于所述第一属性信息和所述第二属性信息，确定所述目标新增图像中是否存在与所述目标历史图像冲突的冲突新增图像，包括：

对目标新增图像和目标历史图像进行时间段归类，获取属于同一时间范围内的目标新增图像和目标历史图像；

响应于属于同一时间范围内的所述目标新增图像的第一属性信息和所述目标历史图像的第二属性信息相异，将所述第一属性信息与所述目标历史图像的第二属性信息相异的目标新增图像，确定为所述冲突新增图像，其中，所述第一属性信息和所述第二属性信息，包括：衣服颜色、车牌号信息、时空信息；

所述从已有的历史聚类簇中，获取与所述第一聚类簇相似的历史聚类簇，包括：

从待聚类图像中提取多个特征信息对应的多个特征向量，对多个特征向量采用直接拼接或以权重和的形式进行融合得到融合后的结果，作为融合特征向量；根据属于同一聚类簇的图像的融合特征向量，确定簇中心向量；

获取所述第一聚类簇的第一簇中心向量和所述历史聚类簇的第二簇中心向量；

获取所述第一簇中心向量与所述第二簇中心向量之间的相似度；

基于所述相似度从已有的所述历史聚类簇中，获取所述相似的历史聚类簇，其中，进行特征提取的过程中，同步提取聚类图像的属性信息。

2.根据权利要求1所述的方法，其中，还包括：

从待聚类的图像中提取目标特征向量，并根据属于同一聚类簇的所述图像的目标特征向量，确定簇中心向量。

3.根据权利要求2所述的方法，其中，还包括：

响应于所述待聚类图像中携带人脸，从所述待聚类图像中提取人脸特征向量作为所述目标特征向量。

4.根据权利要求1所述的方法，其中，还包括：

从待聚类图像中提取多个特征向量，并对所述多个特征向量进行特征融合，生成融合特征向量；

基于同一聚类簇的所述图像的融合特征向量确定簇中心向量。

5.根据权利要求1所述的方法，其中，还包括：

以距离所述目标聚类簇的簇中心最近的图像作为所述目标聚类簇的标识图像。

6.根据权利要求1-4任一项所述的方法，其中，所述获取所述第一聚类簇与所述第二聚类簇之间的距离，包括：

获取属于所述第一聚类簇且位于第一聚类簇边缘的边缘新增图像；

获取属于所述第二聚类簇且位于第二聚类簇边缘的边缘历史图像；

根据所述边缘新增图像的特征向量和所述边缘历史图像的特征向量，获取所述第一聚类簇和所述第二聚类簇之间的距离。

7.一种图像的聚类的装置，包括：

第一获取模块，用于获取新增图像，对所述新增图像采用分布式聚类算法进行聚类，以获取第一聚类簇；

簇融合模块，用于根据所述距离，选取与所述第一聚类簇距离最小的目标第二聚类簇，将所述第一聚类簇合并至所述目标第二聚类簇中，生成所述目标聚类簇,其中，

生成所述目标聚类簇之后，获取属于所述第一聚类簇的目标新增图像的第一属性信息；

响应于存在所述冲突新增图像，将所述冲突新增图像从所述目标聚类簇中拆出，并以拆出的所述冲突新增图像形成另一聚类簇；所述簇融合模块，还用于：

响应于属于同一时间范围内的所述目标新增图像的第一属性信息和所述目标历史图像的第二属性信息相异，将所述第一属性信息与所述目标历史图像的第二属性信息相异的目标新增图像，确定为所述冲突新增图像，其中，所述第一属性信息和所述第二属性信息，包括：衣服颜色、车牌号信息、时空信息；所述第二获取模块，还用于：

基于所述相似度从已有的所述历史聚类簇中，获取所述相似的历史聚类簇，其中，进行特征提取的过程中，同步提取待聚类图像的属性信息。

8.根据权利要求7所述的装置，其中，所述第二获取模块，还用于：

9.根据权利要求8所述的装置，其中，所述第二获取模块，还用于：

10.根据权利要求9所述的装置，其中，所述第二获取模块，还用于：

11.根据权利要求7所述的装置，其中，还包括：

标记模块，用于以距离所述目标聚类簇的簇中心最近的图像作为所述目标聚类簇的标识图像。

12.根据权利要求7-10任一项所述的装置，其中，所述第三获取模块，还用于：

13.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。