CN110781710A

CN110781710A - 一种目标对象聚类方法及装置

Info

Publication number: CN110781710A
Application number: CN201811544296.8A
Authority: CN
Inventors: 张修宝; 沈海峰
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2018-12-17
Filing date: 2018-12-17
Publication date: 2020-02-11
Anticipated expiration: 2038-12-17
Also published as: CN111597980A; CN111597979B; CN111597979A; CN111597980B; CN110781710B

Abstract

本申请涉及图像处理技术领域，尤其涉及一种目标对象聚类方法及装置，所述方法包括：获取监控视频，从所述监控视频的图像中截取包括目标对象信息的子图像并记录每个子图像的帧号；然后，提取每个子图像的特征向量，并基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中；最后，基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合，并调整所述待调整的类别集合中包括的子图像。通过这种方法，可以提升目标对象聚类的准确率。

Description

一种目标对象聚类方法及装置

技术领域

本申请涉及图像处理技术领域，尤其涉及一种目标对象聚类方法及装置。

背景技术

在视频监控、安防、无人驾驶等应用领域中，一般会涉及到对监控视频中的目标对象进行检测，目标对象例如为监控视频中出现的行人、或车辆等。具体的，在一些特定应用场景下，例如，确定目标对象在监控视频所监控的区域内的活动情况时，需要从监控视频中筛选出所有出现有目标对象的图像，这就涉及到对监控视频中出现有目标对象的图像进行聚类。

现有技术中，常用的聚类算法主要为K-means和KD-tree等，但是这类聚类算法往往首先要确定出一个类别阈值，以便确定出需要将目标对象需要聚为几类，但是在对监控视频中的目标对象进行聚类时，往往很难确定出需要将目标对象聚为多少类，因此，这种类别阈值的选取可能会出现较大误差，进而导致聚类准确率较低。

发明内容

有鉴于此，本申请实施例提供一种目标对象聚类方法及装置，以提升目标对象检测过程中的聚类的准确率。

主要包括以下几个方面：

第一方面，本申请实施例提供了一种目标对象聚类方法，包括：

获取监控视频，从所述监控视频的图像中截取包括目标对象信息的子图像并记录每个子图像的帧号；

提取每个子图像的特征向量，并基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中；

基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合，并调整所述待调整的类别集合中包括的子图像。

一种可能的实施方式中，所述基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中，包括：

针对待聚类的第i个子图像，将所述第i个子图像划分至第k个类别集合中；i，k为正整数；

从除所述第i个子图像之外的待聚类的子图像中，选择符合所述第k个类别集合的聚类条件的子图像并划分至所述第k个类别集合中。

一种可能的实施方式中，所述从除所述第i个子图像之外的待聚类的子图像中，选择符合所述第k个类别集合的聚类条件的子图像并划分至所述第k个类别集合中，包括：

从除所述第i个子图像之外的待聚类的子图像中依次选取子图像，执行第一聚类过程，直至遍历完待聚类的全部子图像；其中，所述第一聚类过程包括：

计算选取的子图像的特征向量与所述第i个子图像的特征向量之间的第一特征相似度；

当确定选取的第j个子图像对应的第一特征相似度大于第一设定阈值时，将所述第j个子图像划分至所述第k个类别集合中；

将在第j个子图像之后选取的子图像作为剩余子图像，计算每个剩余子图像的特征向量与所述第k个类别集合中任一个子图像的特征向量之间的第二特征相似度；

基于每个剩余子图像对应的第二特征相似度，将对应的第二特征相似度大于所述第一设定阈值的剩余子图像划分至所述第k个类别集合。

在截取出的子图像中依次选取待聚类的子图像，以选取的子图像作为聚类中心，执行第二聚类过程，直至遍历完待聚类的全部子图像；其中，所述第二聚类过程包括：

计算所述选取的子图像的特征向量与除所述选取的子图像之外的每个待聚类的子图像的特征向量之间的第三特征相似度；

基于每个待聚类的子图像对应的第三特征相似度，筛选出对应的第三特征相似度大于第一设定阈值的待聚类的子图像；

将所述选取的子图像、以及所述对应的第三特征相似度大于第一设定阈值的待聚类的子图像划分至同一类别集合中。

一种可能的实施方式中，所述基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合，包括：

确定划分的各类别集合中子图像的最大帧号以及最小帧号；

检测划分的各类别集合分别对应的最大帧号和最小帧号之间的中间帧号是否连续；

将中间帧号不连续的类别集合确定为待调整的类别集合。

一种可能的实施方式中，调整所述待调整的类别集合中包括的子图像，包括：

针对第n个待调整的类别集合，确定所述第n个待调整的类别集合中缺失的中间帧号；

确定除所述第n个待调整的类别集合之外的其它类别集合中与所述缺失的中间帧号匹配的第一候选子图像；以及，确定所述第n个待调整的类别集合中与所述缺失的中间帧号相邻的帧号匹配的第一参考子图像；

计算所述第一参考子图像的特征向量与每个第一候选子图像的特征向量之间的第四特征相似度；

基于每个第一参考子图像对应的第四特征相似度，筛选出对应的第四特征相似度大于第二设定阈值的第一候选子图像；

将筛选出的第一候选子图像划分至所述第n个待调整的类别集合中。

一种可能的实施方式中，确定除所述第n个待调整的类别集合之外的其它类别集合中与所述缺失的中间帧号匹配的第一候选子图像，包括：

从所述其它类别集合中筛选出子图像的帧号为所述缺失的中间帧号的第一候选类别集合；

确定所述第一候选类别集合中包括的帧号为所述缺失的中间帧号的第一候选子图像。

一种可能的实施方式中，基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合，包括：

针对划分的第n个类别集合，确定第n个类别集合中子图像的最大帧号、以及与所述最大帧号匹配的第二参考子图像；

确定除所述第n个类别集合之外的其它类别集合中与所述最大帧号的下一帧号匹配的第二候选子图像；

计算所述第二参考子图像的特征向量与每个第二候选子图像的特征向量之间的第四特征相似度；

当存在所述第四特征相似度大于第二设定阈值的第二候选子图像时，将所述第四特征相似度大于第二设定阈值的第二候选子图像所在的第二候选类别集合、以及所述第n个类别集合，确定为待调整的类别集合。

一种可能的实施方式中，所述调整所述待调整的类别集合中包括的子图像，包括：

将所述第二候选类别集合中包括的所述第四特征相似度大于所述第二设定阈值的第二候选子图像划分至所述第n个类别集合中。

针对划分的第n个类别集合，确定第n个类别集合中子图像的最小帧号、以及与所述最小帧号匹配的第三参考子图像；

确定除所述第n个类别集合之外的其它类别集合中与所述最小帧号的上一帧号匹配的第三候选子图像；

计算所述第三参考子图像的特征向量与每个第三候选子图像的特征向量之间的第四特征相似度；

当存在所述第四特征相似度大于第二设定阈值的第三候选子图像时，将所述第四特征相似度大于第二设定阈值的第三候选子图像所在的第三候选类别集合、以及所述第n个类别集合，确定为待调整的类别集合。

将所述第三候选类别集合中包括的所述第四特征相似度大于所述第二设定阈值的第三候选子图像划分至所述第n个类别集合中。

第二方面，本申请实施例提供了一种目标对象聚类装置，包括：

获取模块，用于获取监控视频，从所述监控视频的图像中截取包括目标对象信息的子图像并记录每个子图像的帧号；

划分模块，用于提取每个子图像的特征向量，并基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中；

调整模块，用于基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合，并调整所述待调整的类别集合中包括的子图像。

一种可能的设计中，所述划分模块，在基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中时，具体用于：

一种可能的设计中，所述划分模块，在从除所述第i个子图像之外的待聚类的子图像中，选择符合所述第k个类别集合的聚类条件的子图像并划分至所述第k个类别集合中时，具体用于：

一种可能的设计中，所述调整模块，在基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合时，具体用于：

确定划分的各类别集合中子图像的最大帧号以及最小帧号；

将中间帧号不连续的类别集合确定为待调整的类别集合。

一种可能的设计中，所述调整模块，在调整所述待调整的类别集合中包括的子图像时，具体用于：

一种可能的设计中，所述调整模块，在确定除所述第n个待调整的类别集合之外的其它类别集合中与所述缺失的中间帧号匹配的第一候选子图像时，具体用于：

第三方面，本申请实施例还提供一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行上述第一方面，或第一方面的任一种可能的实施方式中所述的目标对象聚类方法的步骤。

第四方面，本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述第一方面，或第一方面的任一种可能的实施方式中所述的目标对象聚类方法的步骤。

本申请实施例提供的目标对象聚类方法及装置，通过从所述监控视频的图像中截取包括目标对象信息的子图像，然后从目标对象信息的子图像进行聚类时，首先基于提取的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中，进一步地，还可以利用每个类别集合中包括的子图像的帧号，来调整类别集合中包括的子图像。通过上述方式先利用子图像的特征向量对子图像进行粗聚类，然后根据类别集合中包含的子图像的帧号，对类别集合中包括的子图像进行调整，由此可以降低仅根据子图像的特征向量进行聚类时产生的误差，进而提升聚类的准确率。

为使本申请实施例的上述目的、特征和优点能更明显易懂，下面将结合实施例，并配合所附附图，作详细说明。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例提供的一种目标对象聚类方法的流程示意图；

图2示出了本申请实施例提供的第一聚类过程的流程示意图；

图3示出了本申请实施例提供的第二聚类过程的流程示意图；

图4示出了本申请实施例提供的确定待调整的类别集合的方法流程图；

图5示出了本申请实施例提供的调整待调整的类别集合中缺失的中间帧号的方法流程图；

图6示出了本申请实施例提供的另一种确定待调整的类别集合的方法流程图；

图7示出了本申请实施例提供的另一种确定待调整的类别集合的方法流程图；

图8示出了本申请实施例提供的一种目标对象聚类装置800的架构示意图；

图9示出了本申请实施例提供的电子设备900的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。以下对本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

首先，对本申请可适用的应用场景进行介绍。本申请可以应用于根据监控视频确定目标对象在监控视频所监控的区域内的活动情况等应用场景下。示例性的，目标对象例如为行人、车辆等，通过对监控视频中出现有行人或车辆的图像进行识别，可以推断出行人或车辆在监控视频所监控的区域内的移动轨迹等。

值得注意的是，因为现有技术中对目标对象进行聚类时常用的聚类算法主要为K-means和KD-tree等，这类聚类算法往往需要提前设置聚类的类别阈值，然而在实际应用时，在对监控视频中的目标对象进行聚类时，往往很难确定出需要将目标对象分为多少类，因此，这种类别阈值的选取可能会出现较大误差，进而导致聚类准确率较低。

针对上述问题，本申请提供了一种目标对象聚类方法及装置，可以在从监控视频中截取出包含目标对象信息的子图像之后，依据子图像的特征向量将包含相同的目标对象信息的子图像划分至不同的类别集合中，然后还可以利用每个类别集合中包括的子图像的帧号对类别集合中的子图像进行调整。由此可以提升对监控视频中出现的目标对象的聚类准确率。

下面，结合具体实施例对本申请提供的技术方案进行详细说明。

参见图1所示，为本申请实施例提供的一种目标对象聚类方法的流程示意图，包括以下步骤：

步骤101、获取监控视频，从监控视频的图像中截取包括目标对象信息的子图像并记录每个子图像的帧号。

其中，目标对象信息可以为监控视频中包含目标对象的图像上目标对象所在区域的像素信息。

具体实施中，因为并不是监控视频的每一帧图像都包含目标对象信息，例如，若目标对象是某一个行人，获取的监控视频中只有某一段时间内出现了该行人，则首先可以识别监控视频中筛选出包含有目标对象信息的图像，然后进一步从筛选出的图像中截取包括目标对象信息的子图像。

在一种可能的实施方式中，可以对监控视频的每一帧图像进行识别，判断图像中是否包含目标对象信息，也可以每隔预设帧数，选择一帧图像进行识别，判断图像中是否包含目标对象信息。当确定某一帧图像中包含目标对象信息时，可以将包含目标对象信息的图像作为子图像；或者，可以在包含目标对象信息的图像中，对目标对象进行标注，然后将有标注的部分截取出来作为子图像，例如，可以使用矩形框对目标对象进行标注，然后将标注的矩形框区域截取出来作为子图像。

步骤102、提取每个子图像的特征向量，并基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中。

在本申请一实施例中，在基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分到同一类别集合中时，以待聚类的第i个子图像为例，可以将第i个子图像划分至第k个类别集合中，i，k为正整数；然后从除第i个子图像之外的待聚类的子图像中，选择符合第k个类别集合的聚类条件的子图像，并划分至第k个类别集合中。

例如，若待聚类的子图像为第1个子图像，第2个子图像，第3子图像，第4个子图像，第5个子图像；则可以将第1个子图像划分至第1个类别集合中，然后从第2个子图像，第3子图像，第4个子图像，第5个子图像中选择符合第1个类别集合的聚类条件的子图像，并划分在第1个类别集合中。

具体的，在将第i个子图像之外的待聚类的子图像中，选择符合第k个类别集合的聚类条件的子图像并划分至第k个类别集合中时，可以从除第i个子图像之外的待聚类的子图像中依次选取子图像，执行第一聚类过程，直至遍历完待聚类的全部子图像。其中，第一聚类过程如图2所示，包括以下步骤：

步骤201、计算选取的子图像的特征向量与第i个子图像的特征向量之间的第一特征相似度。

其中，选取的子图像的特征向量可以反映出选取的子图像中所包括的目标对象的特征，第i个子图像的特征向量可以反映出第i个子图像中包括的目标对象的特征，通过计算选取的子图像的特征向量与第i个子图像的特征向量之间的第一特征相似度可以得知选取的子图像中包括的目标对象与第i个子图像中包括的目标对象之间的相似程度。

一示例中，计算第一特征相似度时，例如可以计算选取的子图像的特征向量与第i个子图像的特征向量之间余弦相似度，其中，余弦相似度的计算方法可以按照如下公式：

其中，A_i表示第i个子图像的特征向量，B_i表示选取的子图像的特征向量，n表示特征向量所包含的特征值的个数，θ表示选取的子图像的特征向量与第i个子图像的特征向量之间的夹角。

根据上述公式计算出cosθ的值之后，余弦值可以用来表征选取的子图像的特征向量与第i个子图像的特征向量之间的第一特征相似度，θ越小，cosθ越接近于1，表明上述两个特征向量越相似。

又一示例中，还可以计算选取的子图像的特征向量与第i个子图像的特征向量之间的欧式距离，将计算出的欧式距离作为选取的子图像的特征向量与第i个子图像的特征向量之间的第一特征相似度，具体欧式距离的计算方法不在此展开说明。

步骤202、当确定选取的第j个子图像对应的第一特征相似度大于第一设定阈值时，将第j个子图像划分至第k个类别集合中。

具体实施中，设第j个子图像为除第i个子图像之外的待聚类的子图像中的任意一个子图像，当计算出第j个子图像的特征向量与第i个子图像的特征向量之间的第一特征相似度大于第一设定阈值时，将第j个子图像划分至第i个子图像所在的类别集合中。

步骤203、将在第j个子图像之后选取的子图像作为剩余子图像，计算每个剩余子图像的特征向量与第k个类别集合中任一个子图像的特征向量之间的第二特征相似度。

示例性的，设第m个子图像为除第i个子图像和第j个子图像之外的待聚类的子图像中的任意一个子图像，则可以计算第m个子图像的特征向量与第i个子图像的特征向量之间的第二特征相似度，或者计算第m个子图像的特征向量与第j个子图像的特征向量之间的第二特征相似度，当然实际应用中，当第k个类别集合中还包括除第i个子图像和第j个子图像之外的其它子图像，也可以计算第m个子图像的特征向量与上述其它子图像中的任意一个子图像的特征向量，然后根据计算出的第二特征相似度，确定是否将第m个子图像划分至第k个类别集合中。

在一种可能的实施方式中，第二特征相似度的计算方法可以与第一特征相似度的计算方法相同，在此将不再赘述；或者，第一特征相似度采取余弦相似度的计算方法，第二特征相似度采取欧氏距离的计算方法或者通过哈希算法来计算相似度，具体的，欧式距离的计算方法和通过哈希算法计算相似度的方法，本申请实施例不再展开说明。

步骤204、基于每个剩余子图像对应的第二特征相似度，将对应的第二特征相似度大于第一设定阈值的剩余子图像划分至第k个类别集合。

具体的，可以计算待聚类的子图像中，除第i个子图像和第j个子图像外的每一个子图像的特征向量与第i个子图像的特征向量或者第j个子图像的特征向量之间的第二特征相似度，并将第二特征相似度大于第一设定阈值的子图像划分至第k个类别集合中。

例如，将第i个子图像和第j个子图像划分至第k个类别集合中之后，待聚类的子图像还包括第a个子图像、第b个子图像、第c个子图像、以及第d个子图像，则可以分别计算第a个子图像、第b个子图像、第c个子图像、以及第d个子图像的特征向量与第i个子图像或第j个子图像之间的第二特征相似度，当第a个子图像的特征向量和第i个子图像的特征向量之间的第二特征相似度大于第一设定阈值时，将第a个子图像划分至第k个类别集合中；当第b个子图像的特征向量和第i个子图像的特征向量，以及第b个子图像的特征向量和第j个子图像的特征向量之间的第二特征相似度均小于第一设定阈值，则不将第b个子图像划分至第k个类别集合中。

下面结合具体实施场景，对上述第一聚类过程进行示例性说明。

设第一设定阈值为H，目标对象为监控视频中的行人，选定第一个行人作为类别集合1的一个行人，后续针对监控视频中所有待聚类的行人，计算每个待聚类的行人与选定的第一个行人之间第一特征相似度，直至计算出所有待聚类的行人的第二个行人与第一个行人之间的第一特征相似度大于第一设定阈值H时，将第二个行人划分至类别集合1中，此时类别集合1包含第一个行人和第二个行人，再计算剩余的每一个待聚类的行人与第一个行人或者第二个行人之间的第二特征相似度，当计算出第N个行人与第一个行人或第二个行人之间的第二特征相似度大于第一设定阈值H时，将第N个行人划分至类别集合1中，以此类推，直至遍历完剩余的全部待聚类的行人，由此，完成类别集合1的聚类。

在本申请的另一实施例中，在基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中时，还可以在截取出的子图像中依次选取待聚类的子图像，以选取的子图像作为聚类中心，执行第二聚类过程，直至遍历完待聚类的全部子图像。其中，第二聚类过程可以为图3所示的方法，包括以下步骤：

步骤301、计算选取的子图像的特征向量与除选取的子图像之外的每个待聚类的子图像的特征向量之间的第三特征相似度。

步骤302、基于每个待聚类的子图像对应的第三特征相似度，筛选出对应的第三特征相似度大于第一设定阈值的待聚类的子图像。

步骤303、将选取的子图像、以及对应的第三特征相似度大于第一设定阈值的待聚类的子图像划分至同一类别集合中。

具体实施中，第三特征相似度的计算方式与第一特征相似度和/或第二特征相似度的计算方式可以相同，在此将不再赘述。

上述示出的两种聚类过程，对于特征向量发生变化的子图像，可能会导致类别集合的划分不准确。例如，对于行人过马路的场景下，以行人为目标对象，在没有车辆遮挡行人时拍摄的包含有行人的信息的子图像与有车辆遮挡行人时拍摄的包含有行人的信息的子图像的特征向量之间的特征相似度可能较小，这种情况下，很容易将包含同一行人特征的不同子图像划分到不同的类别集合中，导致有的类别集合中缺失一些原属于本类别集合中的行人的图像，而有的类别集合中多了不属于本类别集合中的行人图像。

针对上述问题，本申请还提供一种基于子图像的帧号来调整类别集合中包括的子图像的方案，参照下述步骤103：

步骤103、基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合，并调整待调整的类别集合中包括的子图像。

考虑到监控视频中出现的目标对象的移动轨迹往往是连续的，也就是说，包含有目标对象信息的子图像的帧号是连续的，基本不会出现在连续几帧子图像中中间某一帧子图像中不包含目标对象信息，基于上述目标对象的移动连续性的特点，通过判断类别集合中包括的子图像的帧号是否连续，以确定待调整的类别集合，并调整待调整的类别集合中包括的子图像。

以下列举两种情况下确定待调整的类别集合、以及调整待调整的类别集合中包括的子图像的具体方式：

情况一、检测类别集合中中间帧号的子图像是否缺失。

可以按照图4所示的方法，确定待调整的类别集合，包括以下步骤：

步骤401、确定划分的各类别集合中子图像的最大帧号以及最小帧号。

步骤402、检测划分的各类别集合分别对应的最大帧号和最小帧号之间的中间帧号是否连续。

步骤403、将中间帧号不连续的类别集合确定为待调整的类别集合。

示例性的，若类别集合A包含的子图像的帧号分别为1，2，3，4，5，6，7，8，最大帧号为8，最小帧号为1，最大帧号和最小帧号之间的中间帧号为连续帧号，因此类别集合A为不需要调整的类别集合；若类别集合B包含的子图像的帧号分别为1，2，3，4，6，7，8，最大帧号为8，最小帧号为1，最大帧号和最小帧号之间的中间帧号不是连续帧号，因此类别集合B为待调整的类别集合。

进一步地，可以按照图5所示的方法，调整待调整的类别集合中缺失的中间帧号，包括以下步骤：

步骤501、针对第n个待调整的类别集合，确定第n个待调整的类别集合中缺失的中间帧号。

待调整的类别集合为包含的子图像的帧号不连续的集合，可以根据包含的子图像的帧号，确定待调整的类别集合中缺失的中间帧号。

例如，若待调整的类别集合中包含的子图像的帧号为1，2，3，4，6，7，8，则缺失的中间帧号为5。

步骤502、确定除第n个待调整的类别集合之外的其它类别集合中与缺失的中间帧号匹配的第一候选子图像；以及，确定第n个待调整的类别集合中与缺失的中间帧号相邻的帧号匹配的第一参考子图像。

具体的，可以从其他类别集合中筛选出子图像的帧号为缺失的中间帧号的第一候选类别集合，然后确定第一候选类别集合中包括的帧号为缺失的中间帧号的第一候选子图像。

例如，若第n个待调整的类别集合缺失的帧号为6，则确定从其他类别集合中包含帧号为6的子图像的类别集合为第一候选类别集合，然后从第一候选类别集合中筛选出帧号为6的子图像，确定为第一候选子图像。

一种可能的实施方式中，若缺失的中间帧号为x，则可以将第n个待调整的类别集合中第x+1个子图像作为第一参考子图像，或者将第x-1个子图像作为第一参考子图像，或者同时将第x+1个子图像和第x-1个子图像作为第一参考子图像。

步骤503、计算第一参考子图像的特征向量与每个第一候选子图像的特征向量之间的第四特征相似度。

其中，第四特征相似度与第一特征相似度、第二特征相似度、第三特征相似度中任意一个的计算方法相同，在此将不再赘述。

具体的，若第一参考子图像为一个子图像，则可以计算第一参考子图像的特征向量与每个第一候选子图像的特征向量之间的第四特征相似度；若第一参考子图像中包含的子图像的个数大于1，则计算第一参考子图像中的每一个子图像的特征向量与每个第一候选子图像的特征向量之间的第四特征相似度。

步骤504、基于每个第一参考子图像对应的第四特征相似度，筛选出对应的第四特征相似度大于第二设定阈值的第一候选子图像。

步骤505、将筛选出的第一候选子图像划分至第n个待调整的类别集合中。

一种可能的实施方式中，计算出的第四特征相似度均小于或等于第二设定阈值，这种情况下，将不调整第n个待调整的类别集合。例如对于行人过马路的监控视频，在很长的时间段内行人完全被车辆挡住，这种情况下，无法在监控视频中获取行人在被车辆完全遮挡时的特征信息，因此可能造成用于描述行人的特征信息的类别集合中的帧号不连续。通过这种方式，可以从其他类别集合中筛选出第n个待调整的类别集合所缺失的帧号所对应的子图像，提高了聚类的准确率。

情况二、类别集合中的最大帧号和最小帧号之间的帧号是连续的，但是却丢失了最大帧号之后的特征信息或者最小帧号之前的特征信息，这种情况下，也需要对类别集合进行调整。

一种可能的实施方式中，在判断是否丢失最大帧号之后的特征信息时，可以按照图6所示的方法，基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合，包括以下步骤：

步骤601、针对划分的第n个类别集合，确定第n个类别集合中子图像的最大帧号、以及与最大帧号匹配的第二参考子图像。

步骤602、确定除第n个类别集合之外的其它类别集合中与最大帧号的下一帧号匹配的第二候选子图像。

示例性的，若第n个类别集合中的最大帧号为x，则在其他类别集合中确定第x+1个子图像为第二参考子图像。

步骤603、计算第二参考子图像的特征向量与每个第二候选子图像的特征向量之间的第四特征相似度。

步骤604、当存在第四特征相似度大于第二设定阈值的第二候选子图像时，将第四特征相似度大于第二设定阈值的第二候选子图像所在的第二候选类别集合、以及第n个类别集合，确定为待调整的类别集合。

按照图6所示的方法，确定待调整的类别集合后，可以将第二候选类别集合中包括的第四特征相似度大于第二设定阈值的第二候选子图像划分至第n个类别集合中，从而实现对第n个类别集合的调整。

另一种可能的实施方式中，在判断是否丢失最小帧号之前的特征信息时，可以按照图7所示的方法，基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合，包括以下步骤：

步骤701、针对划分的第n个类别集合，确定第n个类别集合中子图像的最小帧号、以及与最小帧号匹配的第三参考子图像。

步骤702、确定除第n个类别集合之外的其它类别集合中与最小帧号的上一帧号匹配的第三候选子图像。

步骤703、计算第三参考子图像的特征向量与每个第三候选子图像的特征向量之间的第四特征相似度。

步骤704、当存在第四特征相似度大于第二设定阈值的第三候选子图像时，将第四特征相似度大于第二设定阈值的第三候选子图像所在的第三候选类别集合、以及第n个类别集合，确定为待调整的类别集合。

按照图7所示的方法，确定待调整的类别集合后，可以将第三候选类别集合中包括的第四特征相似度大于第二设定阈值的第三候选子图像划分至第n个类别集合中，从而实现对第n个类别集合的调整。

通过本实施例提供的方法，可以根据类别集合中包含的子图像的帧号，对类别集合中包括的子图像进行调整，由此可以降低仅根据子图像的特征向量之间的特征相似度进行聚类的误差，进而提升聚类的准确率。

上述实施例中，通过从所述监控视频的图像中截取包括目标对象信息的子图像，然后从目标对象信息的子图像进行聚类时，首先基于提取的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中，进一步地，还可以利用每个类别集合中包括的子图像的帧号，来调整类别集合中包括的子图像。通过上述方式先利用子图像的特征向量对子图像进行粗聚类，然后根据类别集合中包含的子图像的帧号，对类别集合中包括的子图像进行调整，由此可以降低仅根据子图像的特征向量进行聚类时产生的误差，进而提升聚类的准确率。

参见图8所示，为本申请实施例提供的一种目标对象聚类装置800的架构示意图，包括获取模块801、划分模块802、以及调整模块803，具体的：

获取模块801，用于获取监控视频，从所述监控视频的图像中截取包括目标对象信息的子图像并记录每个子图像的帧号；

划分模块802，用于提取每个子图像的特征向量，并基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中；

调整模块803，用于基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合，并调整所述待调整的类别集合中包括的子图像。

一种可能的设计中，所述划分模块802，在基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中时，具体用于：

一种可能的设计中，所述划分模块802，在从除所述第i个子图像之外的待聚类的子图像中，选择符合所述第k个类别集合的聚类条件的子图像并划分至所述第k个类别集合中时，具体用于：

一种可能的设计中，所述调整模块803，在基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合时，具体用于：

确定划分的各类别集合中子图像的最大帧号以及最小帧号；

将中间帧号不连续的类别集合确定为待调整的类别集合。

一种可能的设计中，所述调整模块803，在调整所述待调整的类别集合中包括的子图像时，具体用于：

一种可能的设计中，所述调整模块803，在确定除所述第n个待调整的类别集合之外的其它类别集合中与所述缺失的中间帧号匹配的第一候选子图像时，具体用于：

上述目标对象聚类装置，通过从所述监控视频的图像中截取包括目标对象信息的子图像，然后从目标对象信息的子图像进行聚类时，首先基于提取的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中，进一步地，还可以利用每个类别集合中包括的子图像的帧号，来调整类别集合中包括的子图像。通过上述方式先利用子图像的特征向量对子图像进行粗聚类，然后根据类别集合中包含的子图像的帧号，对类别集合中包括的子图像进行调整，由此可以降低仅根据子图像的特征向量进行聚类时产生的误差，进而提升聚类的准确率。

基于同一技术构思，本申请实施例还提供了一种电子设备。参照图9所示，为本申请实施例提供的电子设备900的结构示意图，包括处理器901、存储器902、和总线903。其中，存储器902用于存储执行指令，包括内存9021和外部存储器9022；这里的内存9021也称内存储器，用于暂时存放处理器901中的运算数据，以及与硬盘等外部存储器9022交换的数据，处理器901通过内存9021与外部存储器9022进行数据交换，当计算机设备900运行时，处理器901与存储器902之间通过总线903通信，使得处理器901在执行以下指令：

其中，处理器901的具体处理流程可以参照上述方法实施例的记载，这里不再赘述。

基于相同的技术构思，本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述目标对象聚类方法的步骤。

具体地，该存储介质能够为通用的存储介质，如移动磁盘、硬盘等，该存储介质上的计算机程序被运行时，能够执行上述目标对象聚类方法，以提升目标对象聚类的准确率。

基于相同的技术构思，本申请实施例还提供了一种计算机程序产品，包括存储了程序代码的计算机可读存储介质，程序代码包括的指令可用于执行上述目标对象聚类方法的步骤，具体实现可参见上述方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种目标对象聚类方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中，包括：

3.如权利要求2所述的方法，其特征在于，所述从除所述第i个子图像之外的待聚类的子图像中，选择符合所述第k个类别集合的聚类条件的子图像并划分至所述第k个类别集合中，包括：

4.如权利要求1所述的方法，其特征在于，所述基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中，包括：

5.如权利要求1所述的方法，其特征在于，所述基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合，包括：

确定划分的各类别集合中子图像的最大帧号以及最小帧号；

将中间帧号不连续的类别集合确定为待调整的类别集合。

6.如权利要求5所述的方法，其特征在于，调整所述待调整的类别集合中包括的子图像，包括：

7.如权利要求6所述的方法，其特征在于，确定除所述第n个待调整的类别集合之外的其它类别集合中与所述缺失的中间帧号匹配的第一候选子图像，包括：

8.如权利要求1所述的方法，其特征在于，基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合，包括：

9.如权利要求8所述的方法，其特征在于，所述调整所述待调整的类别集合中包括的子图像，包括：

10.如权利要求1所述的方法，其特征在于，基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合，包括：

11.如权利要求10所述的方法，其特征在于，所述调整所述待调整的类别集合中包括的子图像，包括：

12.一种目标对象聚类装置，其特征在于，包括：

13.如权利要求12所述的装置，其特征在于，所述划分模块，在基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中时，具体用于：

14.如权利要求13所述的装置，其特征在于，所述划分模块，在从除所述第i个子图像之外的待聚类的子图像中，选择符合所述第k个类别集合的聚类条件的子图像并划分至所述第k个类别集合中时，具体用于：

15.如权利要求12所述的装置，其特征在于，所述划分模块，在基于提取出的每个子图像的特征向量，将包括相同目标对象信息的子图像划分在同一类别集合中时，具体用于：

16.如权利要求12所述的装置，其特征在于，所述调整模块，在基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合时，具体用于：

确定划分的各类别集合中子图像的最大帧号以及最小帧号；

将中间帧号不连续的类别集合确定为待调整的类别集合。

17.如权利要求16所述的装置，其特征在于，所述调整模块，在调整所述待调整的类别集合中包括的子图像时，具体用于：

18.如权利要求17所述的装置，其特征在于，所述调整模块，在确定除所述第n个待调整的类别集合之外的其它类别集合中与所述缺失的中间帧号匹配的第一候选子图像时，具体用于：

19.如权利要求12所述的装置，其特征在于，所述调整模块，在基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合时，具体用于：

20.如权利要求19所述的装置，其特征在于，所述调整模块，在调整所述待调整的类别集合中包括的子图像时，具体用于：

21.如权利要求12所述的装置，其特征在于，所述调整模块，在基于划分的各类别集合中包括的子图像的帧号，确定待调整的类别集合时，具体用于：

22.如权利要求21所述的装置，其特征在于，所述调整模块，在调整所述待调整的类别集合中包括的子图像时，具体用于：

23.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述处理器执行所述机器可读指令，以执行如权利要求1至11任一所述的目标对象聚类方法的步骤。

24.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至11任一所述的目标对象聚类方法的步骤。