CN117333926A

CN117333926A - 一种图片聚合方法、装置、电子设备及可读存储介质

Info

Publication number: CN117333926A
Application number: CN202311617503.9A
Authority: CN
Inventors: 张星宇
Original assignee: Shenzhen Xumi Yuntu Space Technology Co Ltd
Current assignee: Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority date: 2023-11-30
Filing date: 2023-11-30
Publication date: 2024-01-02
Anticipated expiration: 2043-11-30
Also published as: CN117333926B

Abstract

本申请提供了一种图片聚合方法、装置电子设备及可读存储介质。该方法包括：根据第一待分类图片的面部特征对源数据集合进行第一聚类计算，以将源数据集合划分为至少二个面部聚类簇；对各面部聚类簇进行筛选，以确定各面部聚类簇对应的面部代表簇；将各面部代表簇中的第三待分类图片的面部特征和身体特征进行拼接处理，以确定各第三待分类图片的整体特征；根据第三待分类图片的整体特征，对各第三待分类图片进行第二聚类计算，以确定至少二个整体分类簇；根据抓拍频率阈值对整体分类簇中的第四待分类图片进行筛选，以确定目标图片集合。本申请可以实现特征信息互补，提升在复杂场景下的人员聚合精度，可以显著提高图片聚合的精度和鲁棒性。

Description

一种图片聚合方法、装置、电子设备及可读存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种图片聚合方法、装置电子设备及可读存储介质。

背景技术

人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸进行脸部识别的一系列相关技术，通常也叫做人像识别、面部识别。

人脸聚类技术是人脸相关算法应用在安防、交通等监控场景中的一项重要技术，在视频监控场景下，对场景内到访人员进行人员聚合，区别不同人在空间内的游逛情况。

但是，现有技术中，由于抓拍的图片经常呈现模糊、大姿态、遮挡等特点，形成许多噪声图片，导致大量人脸照片无法聚类，难以将不同时刻、不同空间的图片聚合起来，导致算法的健壮性不足，影响聚合效果。

发明内容

有鉴于此，本申请实施例提供了一种图片聚合方法、装置、电子设备及存储介质，以解决现有技术中图片聚合不稳定的问题。

本申请实施例的第一方面，提供了一种图片聚合方法，该方法包括：

确定源数据集合；该源数据集合中包括多个第一待分类图片；

确定第一待分类图片的识别特征；该识别特征包括面部特征和身体特征；

根据第一待分类图片的面部特征对源数据集合进行第一聚类计算，以将源数据集合划分为至少二个面部聚类簇；各面部聚类簇中包括多个第二待分类图片；

对各面部聚类簇进行筛选，以确定各面部聚类簇对应的面部代表簇；各面部代表簇中包括至少一个第三待分类图片；

将各面部代表簇中的第三待分类图片的面部特征和身体特征进行拼接处理，以确定各第三待分类图片的整体特征；

根据第三待分类图片的整体特征，对各第三待分类图片进行第二聚类计算，以确定至少二个整体分类簇；各整体分类簇中包括至少一个第四待分类图片；

根据抓拍频率阈值对整体分类簇中的第四待分类图片进行筛选，以确定目标图片集合。

本申请实施例的第二方面，提供了一种图片聚合装置，包括：

源数据集合确定模块，用于确定源数据集合；该源数据集合中包括多个第一待分类图片；

识别特征确定模块，用于确定第一待分类图片的识别特征；该识别特征包括面部特征和身体特征；

面部聚类簇确定模块，用于根据第一待分类图片的面部特征对源数据集合进行第一聚类计算，以将源数据集合划分为至少二个面部聚类簇；各面部聚类簇中包括多个第二待分类图片；

面部代表簇确定模块，用于对各面部聚类簇进行筛选，以确定各面部聚类簇对应的面部代表簇；各面部代表簇中包括至少一个第三待分类图片；

整体特征确定模块，用于将各面部代表簇中的第三待分类图片的面部特征和身体特征进行拼接处理，以确定各第三待分类图片的整体特征；

整体分类簇确定模块，用于根据第三待分类图片的整体特征，对各第三待分类图片进行第二聚类计算，以确定至少二个整体分类簇；各整体分类簇中包括至少一个第四待分类图片；

目标图片集合确定模块，用于根据抓拍频率阈值对整体分类簇中的第四待分类图片进行筛选，以确定目标图片集合。

本申请实施例的第三方面，提供了一种电子设备，包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述方法的步骤。

本申请实施例的第四方面，提供了一种可读存储介质，该可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述方法的步骤。

本申请实施例与现有技术相比存在的有益效果是：本申请实施例通过将源数据集合中的第一待分类图片根据不同线索的视觉信息层级进行聚合形成整体分类簇，根据源数据的重要性从整体分类簇的第四待分类图片中进行筛选确定最终的目标图片集合。一方面保持了初聚类结果中簇的多样性，另一方面，极大地降低了因抓拍图片模糊、大姿态、遮挡等造成的噪声干扰，依据重要性为不同视觉线索赋予不同权重，这种方式可以实现特征信息互补，提升在复杂场景下的人员聚合精度，可以显著提高图片聚合的精度和鲁棒性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本申请实施例的应用场景的场景示意图；

图2是本申请实施例提供的一种图片聚合方法的流程示意图；

图3是本申请实施例提供的一种图片聚合装置的示意图；

图4是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

下面将结合附图详细说明根据本申请实施例的一种图片聚合方法及装置。

图1是本申请实施例的一种应用场景的场景示意图。该应用场景可以包括终端设备101、102和103、服务器104、网络105。

终端设备101、102和103可以是硬件，也可以是软件。当终端设备101、102和103为硬件时，其可以是具有显示屏且支持与服务器104通信的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等；当终端设备101、102和103为软件时，其可以安装在如上的电子设备中。终端设备101、102和103可以实现为多个软件或软件模块，也可以实现为单个软件或软件模块，本申请实施例对此不作限制。进一步地，终端设备101、102和103上可以安装有各种应用，例如数据处理应用、即时通信工具、社交平台软件、搜索类应用、购物类应用等。

服务器104可以是提供各种服务的服务器，例如，对与其建立通信连接的终端设备发送的请求进行接收的后台服务器，该后台服务器可以对终端设备发送的请求进行接收和分析等处理，并生成处理结果。服务器104可以是一台服务器，也可以是由若干台服务器组成的服务器集群，或者还可以是一个云计算服务中心，本申请实施例对此不作限制。

需要说明的是，服务器104可以是硬件，也可以是软件。当服务器104为硬件时，其可以是为终端设备101、102和103提供各种服务的各种电子设备。当服务器104为软件时，其可以是为终端设备101、102和103提供各种服务的多个软件或软件模块，也可以是为终端设备101、102和103提供各种服务的单个软件或软件模块，本申请实施例对此不作限制。

网络105可以是采用同轴电缆、双绞线和光纤连接的有线网络，也可以是无需布线就能实现各种通信设备互联的无线网络，例如，蓝牙（Bluetooth）、近场通信（Near FieldCommunication，NFC）、红外（Infrared）等，本申请实施例对此不作限制。

用户可以通过终端设备101、102和103经由网络105与服务器104建立通信连接，以接收或发送信息等。具体地，服务器104确定源数据集合；该源数据集合中包括多个第一待分类图片；服务器104确定第一待分类图片的识别特征；该识别特征包括面部特征和身体特征；根据第一待分类图片的面部特征对源数据集合进行第一聚类计算，以将源数据集合划分为至少二个面部聚类簇；各面部聚类簇中包括多个第二待分类图片；服务器104对各面部聚类簇进行筛选，以确定各面部聚类簇对应的面部代表簇；各面部代表簇中包括至少一个第三待分类图片；将各面部代表簇中的第三待分类图片的面部特征和身体特征进行拼接处理，以确定各第三待分类图片的整体特征；服务器104根据第三待分类图片的整体特征，对各第三待分类图片进行第二聚类计算，以确定至少二个整体分类簇；各整体分类簇中包括至少一个第四待分类图片；服务器104根据抓拍频率阈值对整体分类簇中的第四待分类图片进行筛选，以确定目标图片集合。

需要说明的是，终端设备101、102和103、服务器104以及网络105的具体类型、数量和组合可以根据应用场景的实际需求进行调整，本申请实施例对此不作限制。

图2是本申请实施例提供的一种图片聚合方法的流程示意图。图2的图片聚合方法可以由图1的终端设备或者服务器执行。如图2所示，该图片聚合方法包括：

S201，确定源数据集合；该源数据集合中包括多个第一待分类图片；

S202，确定第一待分类图片的识别特征；该识别特征包括面部特征和身体特征；

S203，根据第一待分类图片的面部特征对源数据集合进行第一聚类计算，以将源数据集合划分为至少二个面部聚类簇；各面部聚类簇中包括多个第二待分类图片；

S204，对各面部聚类簇进行筛选，以确定各面部聚类簇对应的面部代表簇；各面部代表簇中包括至少一个第三待分类图片；

S205，将各面部代表簇中的第三待分类图片的面部特征和身体特征进行拼接处理，以确定各第三待分类图片的整体特征；

S206，根据第三待分类图片的整体特征，对各第三待分类图片进行第二聚类计算，以确定至少二个整体分类簇；各整体分类簇中包括至少一个第四待分类图片；

S207，根据抓拍频率阈值对整体分类簇中的第四待分类图片进行筛选，以确定目标图片集合。

具体地，由于在人脸识别的过程中，抓拍的图片经常呈现模糊、大姿态、遮挡等特点，形成许多噪声图片，导致大量人脸照片无法聚类，难以将不同时刻、不同空间的图片聚合起来，所以无法很好的区别不同人在空间内的游逛情况。因此，本实施例详细介绍一种图片聚合方法，以改善这种图片聚合效果不好的情况。本实施例中的源数据集合是指跟第一待分类图片相关的所有信息的集合。每一张第一待分类图片相关的信息可以为一条源数据，比如：第一待分类图片中人物的面部数据、身体数据、抓拍时间、抓拍地点等信息。

进一步地，可以使用人脸识别模型或者人体再识别模型对第一待分类图片进行识别提取，以提取出能够代表第一待分类图片的识别特征，一般来说，识别特征包括面部特征和身体特征，面部特征和身体特征能够很好的代表第一待分类图片所包含的语义信息。

进一步地，得到第一待分类图片的识别特征，可以根据识别特征进行一个预先聚类的过程，在保证聚类后簇的多样性的情况下先预先降低第一待分类图片中噪声图片所造成的影响。因为面部特征在人员识别中起到的代表作用最大，所以选择第一待分类图片的面部特征对源数据集合进行第一聚类计算，通过建立拓扑图，以面部特征作为拓扑图的节点，面部相似度作为拓扑图中边的权重，使用阈值确定边的存在性，构建拓扑图，使用社区发现算法（infomap）进行拓扑图聚类发现，将源数据集合划分为至少二个面部聚类簇，其中各面部聚类簇中包括多个第二待分类图片。第二待分类图片分属于各面部聚类簇，属于同一面部聚类簇的第二待分类图片中，面部特征类内距离足够小，属于不同面部聚类簇的面部特征类间距离足够大。

进一步地，为了减少后续步骤的运算量，提高效率和准确率，对各面部聚类簇进行筛选，以确定各面部聚类簇对应的面部代表簇，各面部代表簇中包括至少一个第三待分类图片。一般可以认为，面部代表簇与面部聚类簇的的数量一至，但是每个面部代表簇与其相对应的面部聚类簇所包含的数据量不一样，面部代表簇的数据量要少于相对应的面部聚类簇的数据量，但是面部代表簇的数据质量是面部聚类簇里质量最好的前几个。也就是说，同一簇内，第三待分类图片能够比较好的代表第二待分类图片。一般情况下，可以使用经典的划分聚类算法（KMean），分别对面部聚类簇内的数据进行聚类。假设指定聚类数为5，也就是每个面部代表簇内第三待分类图片的数量为5，使用面部特征作为样本特征，然后在聚类结果中选取靠近聚类中心的5个第二待分类图片作为代表性数据，代表性数据即为第三待分类图片，这5个代表性数据所组成的集合就是一个面部代表簇。代表性数据的数量，也就是聚类数根据每个面部聚类簇内的第二待分类图片数量而定，一般来说，第二待分类图片数量越多，相应聚类数也越大。

进一步地，如果只是基于面部特征进行聚类，存在错误率，因为人与人之间的人脸遮挡极易导致聚类错误，随着聚类基数的快速增长，这种聚类错误会逐渐放大，导致聚类精度降低。识别特征中不但包括面部特征还有身体特征，身体特征对面部特征的分析辨认能够起到一定的辅助作用，因此，面部特征与身体特征相关联再聚合，相当于引入更多辅助分析数据，能够进一步提升聚类精度。所以，在进一步聚类之前，将各面部代表簇中的第三待分类图片的面部特征和身体特征进行拼接处理，来确定各第三待分类图片的整体特征。这样，整体特征包含了各第三待分类图片的面部特征和身体特征的语义信息，通过融合的信息，极大提升数据聚类的精度。

进一步地，确定好了整体特征，选择第三待分类图片的整体特征对进行第二聚类计算，通过建立拓扑图，以整体特征作为拓扑图的节点，特征相似度作为拓扑图中边的权重，构建拓扑图，使用社区发现算法（infomap）进行拓扑图聚类发现，将第三待分类图片划分为至少二个整体分类簇，其中各整体分类簇中包括多个第四待分类图片。此时，根据整体特征进一步分类的第四待分类图片，整体分类簇之间分类更加的精细化。

进一步地，虽然最终的整体分类簇将最初的源数据集合进行比较精细的分类，但是整体分类簇的内部第四待分类图片可能会存在冗杂、价值低的图片，还需要进一步对整体分类簇中的第四待分类图片进行筛选，以确定目标图片集合。具体地，根据抓拍频率阈值能够实现对第四待分类图片的筛选。抓拍频率阈值是一个可调节的参数，用于控制哪些第四待分类图片应该被保留作为筛选结果，哪些第四待分类图片应该被排除。其中，如果抓拍频率阈值设置得太高，可能会导致漏掉一些价值高的聚合图片；如果抓拍频率阈值设置得太低，可能会包含一些价值低的冗杂的图片，降低准确性。因此，选择合适的抓拍频率阈值是需要经验和实验来得到的。通过设定一个合适的抓拍频率阈值，可以控制筛选结果的精度。将抓拍频率高于抓拍频率阈值的第四待分类图片保留为筛选结果加入目标图片集合。在一些情况下，抓拍频率低于抓拍频率阈值的第四待分类图片有可能存在误判的情况，比如，相应的抓拍频率出现判断失误的情况，还可以基于抓拍频率高于抓拍频率阈值的第四待分类图片对抓拍频率低于抓拍频率阈值的第四待分类图片进行孤立判别，也就是相似度计算，从而从中筛选合适的第四待分类图片加入目标图片集合，目标图片集合即为最终经过聚类筛选合格的图片集合。

根据本申请实施例提供的技术方案，通过将源数据集合中的第一待分类图片根据不同线索的视觉信息层级进行聚合形成整体分类簇，根据源数据的重要性从整体分类簇的第四待分类图片中进行筛选确定最终的目标图片集合。一方面保持了初聚类结果中簇的多样性，另一方面，极大地降低了因抓拍图片模糊、大姿态、遮挡等造成的噪声干扰，依据重要性为不同视觉线索赋予不同权重，这种方式可以实现特征信息互补，提升在复杂场景下的人员聚合精度，可以显著提高图片聚合的精度和鲁棒性。

在一些实施例中，根据第一待分类图片的面部特征对源数据集合进行第一聚类计算，以将源数据集合划分为至少二个面部聚类簇包括：

根据第一待分类图片的面部特征建立第一拓扑图；

利用预设的社区发现算法对第一拓扑图进行第一聚类计算以将源数据集合划分为至少二个面部聚类簇；

其中，任意两个面部聚类簇的交集为零；全部面部聚类簇的并集为全部面部特征。

具体地，根据第一待分类图片的面部特征构建第一拓扑图可以帮助捕捉更多的关联性信息，特别是在源数据集合中的第一待分类图片之间存在模糊、大姿态、遮挡等特点的情况下。通过第一拓扑图的聚类过程，可以更全面地发现相似的参考特征，从而提高了聚类结果的准确性。第一拓扑图中的聚类算法可以更高效地对相似的面部特征进行聚合，降低了计算的复杂度和时间开销。

进一步地，利用预设的社区发现算法对第一拓扑图进行第一聚类计算以将源数据集合划分为至少二个面部聚类簇，第一拓扑图中的聚类是指将第一待分类图片中相似的面部特征聚合在一起形成社区。社区聚类的过程中，社区发现算法会根据拓扑图中节点之间的相似度分数来不断优化社区的划分，直到达到一定的收敛条件为止。聚类的结果是将第一分类图片中相似的面部特征聚合在一起，形成若干个社区，每个社区代表一个面部聚类簇。每个面部聚类簇包含了相似的面部特征，为了更好地组织数据和利用相似性信息，通常会将一个面部特征分配给一个聚类簇。也就是说，任意两个面部聚类簇的交集为零，即它们之间没有共同的面部特征。通过第一拓扑图的聚类结果，所有相似的面部特征都被分配到一个面部聚类簇中，而且每个面部特征只属于一个面部簇。因此，全部面部聚类簇的并集包含了第一待分类图片的全部面部特征。利用预设的社区发现算法对第一拓扑图进行第一聚类计算以将源数据集合划分为至少二个面部聚类簇的具体过程如下：

从源数据集合中的所有第一待分类图片中选取所有的面部特征，并将它们作为拓扑图的节点。接下来，计算每对面部特征之间的面部相似度，面部相似度的计算衡量了两个面部特征之间的相似程度。面部相似度的计算可以使用不同的相似度计算方法，例如余弦相似度、欧氏距离等。面部相似度的计算如下：

其中，表示第i条和第j条第一待分类图片的面部相似度，/>和/>分别第i条和第j条第一待分类图片的面部特征，/>表示向量的内积，/>表示向量的模。

在计算了各面部特征之间的面部相似度后，根据预设的阈值，确定哪些面部特征之间的相似度不小于该阈值。当任意两个面部特征之间的相似度不小于预设的阈值时，为这两个面部特征之间建立拓扑边。拓扑边的建立表示了面部特征之间的关联性，即相似度高于阈值的面部特征之间存在一种连接。

例如，假设阈值为0.55，可以通过如下方法判断第i条和第j条第一待分类图片的面部特征是否存在拓扑边：

其中，表示判断第i条和第j条第一待分类图片的面部特征之间是否存在拓扑边的输出结果，/>表示第i条和第j条第一待分类图片的面部特征的面部相似度。当大于等于阈值0.55时，/>的值取1，表示第i条和第j条第一待分类图片的面部特征之间存在拓扑边；当/>小于关联阈值0.55时，/>的值取0，表示第i条和第j条第一待分类图片的面部特征不存在拓扑边。

通过第一拓扑图中的拓扑边，可以表示面部特征之间的相似度或相关性。边的存在表示了相似的面部特征之间存在一种连接，从而确定了第一待分类图片之间的关联性。通过利用预设的社区发现算法对第一拓扑图进行聚类，成功建立了第一待分类图片中面部特征之间的面部聚类簇结构。该面部聚类簇结构是本图片聚合方法的初步聚类形式。

在一些实施例中，对各面部聚类簇进行筛选，以确定各面部聚类簇对应的面部代表簇包括：

确定代表数据数量；

基于划分聚类算法对每个面部聚类簇内的第二待分类图片进行聚类处理以确定聚类中心；

确定靠近聚类中心且达到代表数据数量的第三待分类图片；

根据第三待分类图片确定面部代表簇。

具体地，为了减少后续步骤的运算量，提高效率和准确率，对各面部聚类簇进行筛选，以确定各面部聚类簇对应的面部代表簇。一般可以认为，面部代表簇与面部聚类簇的的数量一至，但是每个面部代表簇与其相对应的面部聚类簇所包含的数据量不一样，面部代表簇的数据量要少于相对应的面部聚类簇的数据量，但是面部代表簇的数据质量是面部聚类簇里质量最好的前几个。也就是说，同一簇内，第三待分类图片能够比较好的代表第二待分类图片。一般情况下，可以使用经典的划分聚类算法（KMean），分别对面部聚类簇内的数据进行聚类。首先，需要确定代表数据数量，代表数据数量，也就是聚类数，根据每个面部聚类簇内的第二待分类图片数量而定，一般来说，第二待分类图片数量越多，相应聚类数也越大。假设指定聚类数为5，也就是每个面部代表簇内第三待分类图片的数量为5，使用面部特征作为样本特征，然后在聚类结果中选取靠近聚类中心的5个第二待分类图片作为代表性数据，重新聚类筛选出的代表性数据即为第三待分类图片，这5个代表性数据所组成的集合就是一个面部代表簇。

在一些实施例中，身体特征包括全身特征和半身特征，则将各面部代表簇中的第三待分类图片的面部特征和身体特征进行拼接处理，以确定各第三待分类图片的整体特征包括：

对面部代表簇中的第三待分类图片的面部特征、全身特征和半身特征进行权重分配；

对权重分配后的面部特征、全身特征和半身特征进行拼接以确定整体特征。

具体地，如果只是基于面部特征进行聚类，存在错误率，因为人与人之间的人脸遮挡极易导致聚类错误，随着聚类基数的快速增长，这种聚类错误会逐渐放大，导致聚类精度降低。识别特征中不但包括面部特征还有身体特征，身体特征还包括全身特征和半身特征，全身特征也就是人体特征，整体特征。半身特征就是头肩部分的特征。身体特征对面部特征的分析辨认能够起到一定的辅助作用，因此，面部特征与身体特征相关联再聚合，相当于引入更多辅助分析数据，能够进一步提升聚类精度。所以，在进一步聚类之前，将各面部代表簇中的第三待分类图片的面部特征、全身特征和半身特征进行拼接处理，来确定各第三待分类图片的整体特征。这样，整体特征包含了各第三待分类图片的面部特征和全身特征和半身特征的语义信息，通过融合的信息，极大提升数据聚类的精度。同样，这也是一个多线索数据的构建过程。具体过程如下：

首先对各个特征进行L2范数归一化处理，归一化是将特征向量的各个维度都映射到一个统一的范围，使得所有特征向量在各个维度上的取值都处于相同的尺度。这样做的目的是消除不同维度尺度不一致可能带来的影响，确保特征向量之间的相似度计算更加准确和可靠。例如，本实施例中，可以通过以下公式对第三待分类图片的面部特征、全身特征和半身特征进行归一化处理：

为第三待分类图片经过归一化处理后的目标特征（k=1、2、3，1代表面部特征；2代表全身特征，3代表半身特征），/>为第三待分类图片经过人脸检测算法，进行特征提取得到的原始特征向量，/>表示向量的模。

归一化后的特征具有单位长度，这样做的目的是消除特征向量的尺度影响，使得所有特征向量在各个维度上的取值都处于相同的尺度范围。这样，不同特征向量之间的相似度计算更加准确和稳定，避免由于特征向量尺度不一致而引起的问题。

接下来，构建多线索数据特征，也就是整体特征，对面部特征、全身特征和半身特征进行拼接处理，如下公式所示：

其中F为整体特征，为归一化处理后的面部特征，/>为归一化处理后的全身特征，/>归一化处理后的为半身特征，其中/>表示向量拼接。因为不同特征对聚类的影响效果是不一样的，那么可以根据影响效果的大小对不同特征分别赋予不同的权重，比如上式中的权重0.8、0.6、0.6。权重分配后的面部特征、全身特征和半身特征进行拼接，来确定各第三待分类图片的整体特征。这样，整体特征包含了各第三待分类图片的面部特征和全身特征和半身特征的语义信息，通过融合的信息，极大提升数据聚类的精度。

在一些实施例中，根据第三待分类图片的整体特征，对各第三待分类图片进行第二聚类计算，以确定至少二个整体分类簇包括：

根据第三待分类图片的整体特征建立第二拓扑图；

利用预设的社区发现算法对第二拓扑图进行第二聚类计算以将第三待分类图片划分为至少二个整体分类簇；

其中，任意两个整体分类簇的交集为零；全部整体分类簇的并集为全部整体特征。

具体地，利用预设的社区发现算法对第二拓扑图进行第二聚类计算以将第三待分类图片划分为至少二个整体分类簇，第二拓扑图中的聚类是指将第三待分类图片中相似的整体特征聚合在一起形成社区。社区聚类的过程中，社区发现算法会根据拓扑图中节点之间的相似度分数来不断优化社区的划分，直到达到一定的收敛条件为止。聚类的结果是将第三分类图片中相似的整体特征聚合在一起，形成若干个社区，每个社区代表一个整体分类簇。每个整体分类簇包含了相似的整体特征，为了更好地组织数据和利用相似性信息，通常会将一个整体特征分配给一个整体分类簇。也就是说，任意两个整体分类簇的交集为零，即它们之间没有共同的参考特征。通过第二拓扑图的聚类结果，所有相似的整体特征都被分配到一个整体分类簇中，而且每个整体特征只属于一个整体分类簇。因此，全部整体分类簇的并集包含了第三待分类图片的全部整体特征。具体计算过程如下：

从所有第三待分类图片中选取所有的整体特征，并将它们作为拓扑图的节点。接下来，计算每对整体特征之间的特征相似度，特征相似度的计算衡量了两个整体特征之间的相似程度。特征相似度的计算可以使用不同的相似度计算方法，例如余弦相似度、欧氏距离等。特征相似度的计算如下：

其中，表示第n条和第m条第三待分类图片的特征相似度，/>和/>分别第n条和第m条第三待分类图片的整体特征，/>表示向量的内积。

在计算了各整体特征之间的特征相似度后，根据预设的阈值，确定哪些整体特征之间的相似度不小于该阈值。当任意两个整体特征之间的相似度不小于预设的阈值时，为这两个整体特征之间建立拓扑边。拓扑边的建立表示了整体特征之间的关联性，即相似度高于阈值的整体特征之间存在一种连接。为了进一步提升第三待分类图片的聚类精度，还可以采用社区发现算法对第三待分类图片的面部特征进行聚类计算，基于整体特征和面部特征的相似度划分整体分类簇。

例如，假设整体特征的特征相似度阈值为0.5，面部特征相似度阈值为0.35，可以通过如下方法判断第n条和第m条第三分类图片的整体特征之间是否存在拓扑边：

其中，表示判断第n条和第m条第三分类图片的整体特征之间是否存在拓扑边的输出结果，/>表示第n条和第m条第三分类图片的面部特征之间的面部相似度，表示第n条和第m条第三分类图片的整体特征之间的特征相似度。当/>大于等于阈值0.35时，/>大于等于阈值0.5时，/>的值取1，表示第n条和第m条第三分类图片的整体特征之间存在拓扑边；不满足上述条件时，/>的值取0，表示第n条和第m条第三分类图片的整体特征之间不存在拓扑边。

通过第二拓扑图中的拓扑边，可以表示整体特征之间的相似度或相关性。边的存在表示了相似的整体特征之间存在一种连接，从而确定了第三待分类图片之间的关联性。通过利用预设的社区发现算法对第二拓扑图进行聚类，成功建立了第三待分类图片中整体特征之间的整体分类簇结构。该整体分类簇结构是本图片聚合方法的尾段聚类形式。

在一些实施例中，根据抓拍频率阈值对整体分类簇中的第四待分类图片进行筛选，以确定目标图片集合包括：

根据整体分类簇中每个第四待分类图片的抓拍时间确定抓拍频率；

将抓拍频率大于等于预设的抓拍频率阈值的对应的第四待分类图片作为第一候选图片；

根据第一候选图片建立目标图片集合。

具体地，源数据集合中数据包括第一待分类图片中人物的面部数据、身体数据、抓拍时间、抓拍地点等信息，而第一待分类图片、第二待分类图片、第三待分类图片、第四待分类图片是依次包含的关系，所以能够确定第四待分类图片的抓拍时间，进而确定单人场景内摄像头的最小抓拍频率。抓拍频率阈值是一个可调节的参数，用于控制哪些第四待分类图片应该被保留作为筛选结果，哪些第四待分类图片应该被排除。其中，如果抓拍频率阈值设置得太高，可能会导致漏掉一些价值高的聚合图片；如果抓拍频率阈值设置得太低，可能会包含一些价值低的冗杂的图片，降低准确性。因此，选择合适的抓拍频率阈值是需要经验和实验来得到的。通过设定一个合适的抓拍频率阈值，可以控制筛选结果的精度。将抓拍频率高于抓拍频率阈值的第四待分类图片作为第一候选图片，将第一候选图片加入到目标图片集合。

在一些实施例中，根据抓拍频率阈值对整体分类簇中的第四待分类图片进行筛选，以确定目标图片集合，还包括：

将抓拍频率小于预设的抓拍频率阈值的对应的第四待分类图片作为待筛选图片；

基于第一候选图片将待筛选图片进行孤立判别以从待筛选图片中确定第二候选图片；

根据第一候选图片和第二候选图片建立目标图片集合。

具体地，在一些情况下，抓拍频率低于抓拍频率阈值的第四待分类图片有可能存在误判的情况，比如，相应的抓拍频率出现判断失误的情况。因此，还可以基于第一候选图片将待筛选图片进行孤立判别以从待筛选图片中确定第二候选图片。一般情况下，可以通过将待筛选图片逐一与第一候选图片进行相似度计算，该相似度计算可以以第四待分类图片的面部特征进行相似度计算，该相似度计算原理述步骤已有介绍，这里不再赘述。如果存在相似，那么说明相似的待筛选图片不存在孤立的情况，可以选择将待筛选图片和与其相似度最大的第一候选图片划分为同一集合中，具体过程如下：

其中，为待筛选图片的面部特征/>和第一候选图片的面部特征/>之间是否存在拓扑边的输出结果，/>表示待筛选图片的面部特征/>和第一候选图片的面部特征之间的面部相似度。选择/>最大值且小于等于阈值0.4时，/>的值取1，表示待筛选图片的面部特征/>和第一候选图片的面部特征/>之间存在拓扑边，当/>最大值大于关联阈值0.4时，/>的值取0，表示待筛选图片的面部特征/>和第一候选图片的面部特征/>之间不存在拓扑边，即该待筛选图片是孤立的。

假设第一候选图片的集合为G1，经过孤立判别后，第二候选图片的集合为G2，那么目标图片集合也就是最终的聚合结果为G=G1+G2。

因此，经过对源数据集合中的第一待筛选图片进行初步聚类、多线索层的再聚类、基于抓拍频率阈值的往复筛选，确定目标图片集合，其聚合精度显著提升。

上述所有可选技术方案，可以采用任意结合形成本申请的可选实施例，在此不再一一赘述。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

图3是本申请实施例提供的一种图片聚合装置的示意图。如图3所示，该图片聚合装置包括：

源数据集合确定模块301，被配置为用于确定源数据集合；该源数据集合中包括多个第一待分类图片；

识别特征确定模块302，被配置为用于确定第一待分类图片的识别特征；该识别特征包括面部特征和身体特征；

面部聚类簇确定模块303，被配置为用于根据第一待分类图片的面部特征对源数据集合进行第一聚类计算，以将源数据集合划分为至少二个面部聚类簇；各面部聚类簇中包括多个第二待分类图片；

面部代表簇确定模块304，被配置为用于对各面部聚类簇进行筛选，以确定各面部聚类簇对应的面部代表簇；各面部代表簇中包括至少一个第三待分类图片；

整体特征确定模块305，被配置为用于将各面部代表簇中的第三待分类图片的面部特征和身体特征进行拼接处理，以确定各第三待分类图片的整体特征；

整体分类簇确定模块306，被配置为用于根据第三待分类图片的整体特征，对各第三待分类图片进行第二聚类计算，以确定至少二个整体分类簇；各整体分类簇中包括至少一个第四待分类图片；

目标图片集合确定模块307，被配置为用于根据抓拍频率阈值对整体分类簇中的第四待分类图片进行筛选，以确定目标图片集合。

在一些实施例中，图3的面部聚类簇确定模块303包括：

根据第一待分类图片的面部特征建立第一拓扑图；

在一些实施例中，图3的面部代表簇确定模块304包括：

确定代表数据数量；

确定靠近聚类中心且达到代表数据数量的第三待分类图片；

根据第三待分类图片确定面部代表簇。

在一些实施例中，身体特征包括全身特征和半身特征，则图3的整体特征确定模块305包括：

在一些实施例中，图3的整体分类簇确定模块306包括：

根据第三待分类图片的整体特征建立第二拓扑图；

在一些实施例中，图3的目标图片集合确定模块307包括：

根据第一候选图片建立目标图片集合。

在一些实施例中，图3的目标图片集合确定模块307还包括：

根据第一候选图片和第二候选图片建立目标图片集合。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

图4是本申请实施例提供的电子设备4的示意图。如图4所示，该实施例的电子设备4包括：处理器401、存储器402以及存储在该存储器402中并且可在处理器401上运行的计算机程序403。处理器401执行计算机程序403时实现上述各个方法实施例中的步骤。或者，处理器401执行计算机程序403时实现上述各装置实施例中各模块/单元的功能。

电子设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备4可以包括但不仅限于处理器401和存储器402。本领域技术人员可以理解，图4仅仅是电子设备4的示例，并不构成对电子设备4的限定，可以包括比图示更多或更少的部件，或者不同的部件。

处理器401可以是中央处理单元（Central Processing Unit，CPU），也可以是其它通用处理器、数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field-Programmable Gate Array，FPGA）或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

存储器402可以是电子设备4的内部存储单元，例如，电子设备4的硬盘或内存。存储器402也可以是电子设备4的外部存储设备，例如，电子设备4上配备的插接式硬盘，智能存储卡（Smart Media Card，SMC），安全数字（Secure Digital，SD）卡，闪存卡（Flash Card）等。存储器402还可以既包括电子设备4的内部存储单元也包括外部存储设备。存储器402用于存储计算机程序以及电子设备所需的其它程序和数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个可读存储介质（例如计算机可读存储介质）中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，计算机程序可以存储在可读存储介质中，该计算机程序在被处理器执行时，可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读存储介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random AccessMemory，RAM）、电载波信号、电信信号以及软件分发介质等。

以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种图片聚合方法，其特征在于，所述方法包括：

确定源数据集合；所述源数据集合中包括多个第一待分类图片；

确定所述第一待分类图片的识别特征；所述识别特征包括面部特征和身体特征；

根据所述第一待分类图片的面部特征对所述源数据集合进行第一聚类计算，以将所述源数据集合划分为至少二个面部聚类簇；各所述面部聚类簇中包括多个第二待分类图片；

对各所述面部聚类簇进行筛选，以确定各所述面部聚类簇对应的面部代表簇；各所述面部代表簇中包括至少一个第三待分类图片；

将各所述面部代表簇中的所述第三待分类图片的所述面部特征和所述身体特征进行拼接处理，以确定各所述第三待分类图片的整体特征；

根据所述第三待分类图片的整体特征，对各所述第三待分类图片进行第二聚类计算，以确定至少二个整体分类簇；各所述整体分类簇中包括至少一个第四待分类图片；

根据抓拍频率阈值对所述整体分类簇中的所述第四待分类图片进行筛选，以确定目标图片集合。

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一待分类图片的面部特征对所述源数据集合进行第一聚类计算，以将所述源数据集合划分为至少二个面部聚类簇包括：

根据所述第一待分类图片的面部特征建立第一拓扑图；

利用预设的社区发现算法对所述第一拓扑图进行第一聚类计算以将所述源数据集合划分为至少二个面部聚类簇；

其中，任意两个所述面部聚类簇的交集为零；全部所述面部聚类簇的并集为全部所述面部特征。

3.根据权利要求1所述的方法，其特征在于，所述对各所述面部聚类簇进行筛选，以确定各所述面部聚类簇对应的面部代表簇包括：

确定代表数据数量；

基于划分聚类算法对每个所述面部聚类簇内的第二待分类图片进行聚类处理以确定聚类中心；

确定靠近所述聚类中心且达到所述代表数据数量的第三待分类图片；

根据所述第三待分类图片确定所述面部代表簇。

4.根据权利要求1所述的方法，其特征在于，所述身体特征包括全身特征和半身特征，则将各所述面部代表簇中的第三待分类图片的所述面部特征和所述身体特征进行拼接处理，以确定各所述第三待分类图片的整体特征包括：

对所述面部代表簇中的第三待分类图片的所述面部特征、全身特征和半身特征进行权重分配；

对权重分配后的所述面部特征、全身特征和半身特征进行拼接以确定所述整体特征。

5.根据权利要求1所述的方法，其特征在于，所述根据所述第三待分类图片的整体特征，对各所述第三待分类图片进行第二聚类计算，以确定至少二个整体分类簇包括：

根据所述第三待分类图片的整体特征建立第二拓扑图；

利用预设的社区发现算法对所述第二拓扑图进行第二聚类计算以将所述第三待分类图片划分为至少二个整体分类簇；

其中，任意两个所述整体分类簇的交集为零；全部所述整体分类簇的并集为全部所述整体特征。

6.根据权利要求1所述的方法，其特征在于，所述根据抓拍频率阈值对所述整体分类簇中的所述第四待分类图片进行筛选，以确定目标图片集合包括：

根据所述整体分类簇中每个所述第四待分类图片的抓拍时间确定抓拍频率；

将所述抓拍频率大于等于预设的抓拍频率阈值的对应的所述第四待分类图片作为第一候选图片；

根据所述第一候选图片建立所述目标图片集合。

7.根据权利要求6所述的方法，其特征在于，所述根据抓拍频率阈值对所述整体分类簇中的所述第四待分类图片进行筛选，以确定目标图片集合，还包括：

将所述抓拍频率小于预设的抓拍频率阈值的对应的所述第四待分类图片作为待筛选图片；

基于所述第一候选图片将所述待筛选图片进行孤立判别以从待筛选图片中确定第二候选图片；

根据所述第一候选图片和第二候选图片建立所述目标图片集合。

8.一种图片聚合装置，其特征在于，包括：

源数据集合确定模块，用于确定源数据集合；所述源数据集合中包括多个第一待分类图片；

识别特征确定模块，用于确定所述第一待分类图片的识别特征；所述识别特征包括面部特征和身体特征；

面部聚类簇确定模块，用于根据所述第一待分类图片的面部特征对所述源数据集合进行第一聚类计算，以将所述源数据集合划分为至少二个面部聚类簇；各所述面部聚类簇中包括多个第二待分类图片；

面部代表簇确定模块，用于对各所述面部聚类簇进行筛选，以确定各所述面部聚类簇对应的面部代表簇；各所述面部代表簇中包括至少一个第三待分类图片；

整体特征确定模块，用于将各所述面部代表簇中的所述第三待分类图片的所述面部特征和所述身体特征进行拼接处理，以确定各所述第三待分类图片的整体特征；

整体分类簇确定模块，用于根据所述第三待分类图片的整体特征，对各所述第三待分类图片进行第二聚类计算，以确定至少二个整体分类簇；各所述整体分类簇中包括至少一个第四待分类图片；

目标图片集合确定模块，用于根据抓拍频率阈值对所述整体分类簇中的所述第四待分类图片进行筛选，以确定目标图片集合。

9.一种电子设备，包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。

10.一种可读存储介质，所述可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。