CN112948613B

CN112948613B - 图像增量聚类方法、系统、介质及装置

Info

Publication number: CN112948613B
Application number: CN202011392551.9A
Authority: CN
Inventors: 凌英剑; 田国栋
Original assignee: Shanghai Yuncong Enterprise Development Co ltd
Current assignee: Shanghai Yuncong Enterprise Development Co ltd
Priority date: 2020-12-01
Filing date: 2020-12-01
Publication date: 2023-09-15
Anticipated expiration: 2040-12-01
Also published as: CN112948613A

Abstract

本发明属于图像处理技术领域，具体涉及一种图像增量聚类方法、系统、介质及装置。本发明旨在解决如何利用有限的计算资源快速地处理海量复杂的人脸图像数据样本的技术问题。为此目的，本发明通过为全量聚类获得的每个新簇生成簇表示，并针对每个新簇在所有的老簇中进行向量相似度检索，在相似的老簇中选取最优的一个或多个老簇，将新簇与选取出最优的老簇合并然后将输出合并后的簇表示作为最优的老簇的簇表示。如此，通过簇表示来表征一个簇中所有图像数据样本的特征向量，降低了对系统内存的需求；通过向量相似度检索和相似度匹配处理来得到最优的老簇并更新老簇，减少了图像数据样本聚类所需的时间，提高了图像预处理的效率。

Description

图像增量聚类方法、系统、介质及装置

技术领域

本发明属于图像处理的技术领域，具体涉及一种图像增量聚类方法、系统、介质及装置。

背景技术

在人员管理系统、视频监控系统等系统中往往需要从人脸库中海量的人脸图像数据样本中检索出特定的人脸图像，用来实现图像中人脸的识别功能，该功能即涉及到图像处理技术。

目前，视频监控系统采集的人脸数量一般呈指数增长，形成海量的人脸库。海量人脸库的检索问题可以简单表述为：给定一个有N张人脸的大规模人脸库和一张待查询人脸，在海量人脸库中快速的检索出与待查询人脸最相似的前n张人脸图像。

然而，由于对大规模图像目标(如：人脸)特征库进行逐一比对的计算复杂度较高，一般需要采用聚类检索的方式，同时也对图像聚类检索时降低系统内存需求、减少图像聚类所需时间提出了更高的要求，以便能更高效的实现对海量复杂图像数据的聚类处理。

相应地，本领域需要一种改进的图像增量聚类方法、系统、介质及装置来解决上述问题。

发明内容

为了克服上述缺陷，提出了本发明，以提供解决或至少部分解决：如何利用有限的计算资源快速地处理海量复杂的人脸图像数据样本的技术问题，尤其是在尽量节省资源快速预处理图像数据样本。本发明为解决上述技术问题提供了一种图像增量聚类方法、系统、介质及装置。

第一方面，本发明提供的一种图像增量聚类方法，包括：在原图像数据样本中新增加图像数据样本后，对新增加的图像数据样本进行全量聚类而获得一个或多个新簇，并为每个新簇生成簇表示；根据新簇的簇表示在所有老簇的簇表示中进行向量相似度检索，确定与所述新簇相似的老簇，其中所述老簇基于所述原图像数据样本进行聚类而获得；在所述相似的老簇中选取一个或多个老簇；将新簇与选取出的老簇合并，输出合并后的簇表示；其中，所述簇表示用于表征簇中的图像数据样本的特征向量。

作为本发明提供的上述图像增量聚类方法的一种优选的技术方案，根据新簇的簇表示在所有老簇的簇表示中进行向量相似度检索，确定与所述新簇相似的老簇，具体包括：以新簇的簇表示作为查询向量，以所有老簇的簇表示作为底库向量，通过向量相似度检索算法来确定与所述新簇相似的老簇；在所述相似的老簇中选取一个或多个老簇，具体包括：将所述新簇的簇表示和与其相似的老簇的簇表示进行相似度匹配以获得最优的老簇。

作为本发明提供的上述图像增量聚类方法的一种优选的技术方案，通过向量相似度检索算法来确定与所述新簇相似的老簇，具体包括：通过向量相似度检索算法获得所述新簇的近邻信息；其中，所述近邻信息包括：与每个所述新簇邻近的一个或多个老簇，以及每个所述新簇与邻近的一个或多个所述老簇之间的近邻得分；所述近邻得分表示所述新簇与一个或多个所述老簇之间的相似度；将所述近邻得分与阈值进行比较，以获得所述近邻得分大于或等于所述阈值的老簇作为与所述新簇相似的老簇。

作为本发明提供的上述图像增量聚类方法的一种优选的技术方案，将所述新簇的簇表示和与其相似的老簇的簇表示进行相似度匹配以获得最优的老簇，具体包括：计算所述新簇的簇表示和与其相似的老簇的簇表示之间的第二相似度；根据所述第二相似度，通过分类器判断所述新簇和与其相似的老簇是否属于同一类别；如果是，则将所述相似的老簇确定为最优的老簇。

作为本发明提供的上述图像增量聚类方法的一种优选的技术方案，更新合并后的最优的老簇的簇表示，具体包括：根据每个新簇的簇表示，对合并后的最优的老簇的簇表示进行更新。

作为本发明提供的上述图像增量聚类方法的一种优选的技术方案，其中，所述簇表示包括：中心簇表示和场景簇表示；其中，“以新簇的簇表示作为查询向量”具体为：以新簇的中心簇表示作为所述查询向量；其中，“以所有老簇的簇表示作为底库向量”包括：以所有老簇的中心簇表示作为所述底库向量；其中，所述近邻得分为在向量相似度检索时比对新簇的中心簇表示与老簇的中心簇表示所获得的中心簇表示相似度；其中，“进行相似度匹配”包括：以所述场景簇表示进行匹配；其中，所述第二相似度为计算新簇的场景簇表示和与其相似的老簇的场景簇表示所获得的场景簇表示相似度；其中，输出合并后的簇表示包括对最优的老簇的中心簇表示和场景簇表示都进行更新。

作为本发明提供的上述图像增量聚类方法的一种优选的技术方案，还包括：全量聚类所得到的每个新簇为C＝{x₁,x₂,...,x_c}，为其生成的中心簇表示为场景簇表示为/>其中，x₁为属于所述新簇C的第1个图像数据样本的特征向量，x_i为属于所述新簇C的第i个图像数据样本的特征向量，x_c为属于所述新簇C的第c个图像数据样本的特征向量，所述新簇C中图像数据样本的特征向量的总数为c个；m为根据所述新簇C中图像数据样本的图片质量分将所述新簇C中的图像数据样本划分成的总场景数；Y_i为所述新簇C的第i个场景簇表示，n为所述新簇C中属于第i个场景的图像数据样本总数；其中，若属于某个场景的图像数据样本的样本数为0，则不计算所述场景的场景簇表示；其中，与所述新簇的邻近的老簇表示为I_i＝{X₁,X₂,...,X_k}以及所述新簇与邻近的老簇的近邻得分表示为D_i＝{d₁,d₂,...,d_k}；其中，近邻得分d₁,d₂,...,d_k中低于阈值的则表明新簇与相应的邻近的老簇匹配失败；其中，当所述新簇C的第i个场景簇表示为Y_i、相应的近邻得分大于或等于所述阈值的相似的老簇的第i个场景簇表示为Y′_i，则计算的第二相似度为第i个场景的相似度Y_i ^TY_i'；其中，若所述新簇或所述相似的老簇的某个场景的图像数据样本的个数为0则相似度记为0；其中，将新簇与选取出的老簇合并，输出合并后的簇表示，具体为：具有c个图像数据样本的新簇C的中心簇表示X与合并入的具有c’个图像数据样本的最优的老簇C’的中心簇表示X’，更新的最优的老簇的中心簇表示的为：所述新簇C的具有n个图像数据样本的第i个场景的场景簇表示为Y_i与合并入的最优的老簇C’的具有n’个图像数据样本的第i个场景的场景簇表示为Y_i′，更新的最优的老簇的场景簇表示为：/>

作为本发明提供的上述图像增量聚类方法的一种优选的技术方案，所述全量聚类采用的算法为K-means、DBSCAN、或层次聚类算法；并且/或者，所述向量相似度检索算法为采用暴力检索、Hash检索、IVFFlat、IVFPQ、HNSW中的任一种算法；并且/或者，所述向量相似度采用向量内积计算、L1距离计算、L2距离计算中的任一种方式进行计算；并且/或者，所述分类器包括随机森林、xgboost、逻辑回归中的任一种；并且/或者，所述场景簇表示包括人脸中的人脸角度、模糊程度、光照强弱以及人体状态中的站姿、坐姿和躺姿中的至少一种场景下的场景簇表示。

第二方面，在本发明提供的一种图像增量聚类系统中，包括：生成模块，用于在原图像数据样本中新增加图像数据样本后，对新增加的图像数据样本进行全量聚类而获得一个或多个新簇，并为每个新簇生成簇表示；检索模块，用于根据新簇的簇表示在所有老簇的簇表示中进行向量相似度检索，确定与所述新簇相似的老簇，其中所述老簇基于所述原图像数据样本进行聚类而获得；匹配模块，用于在所述相似的老簇中选取一个或多个老簇；合并更新模块，用于将新簇与选取出的老簇合并，输出合并后的簇表示；其中，所述簇表示用于表征簇中的图像数据样本的特征向量。

作为本发明提供的上述图像增量聚类系统的一种优选的技术方案，所述检索模块具体用于：以新簇的簇表示作为查询向量，以所有老簇的簇表示作为底库向量，通过向量相似度检索算法来确定与所述新簇相似的老簇；所述匹配模块具体用于：在将新簇和与其相似的老簇进行匹配时，将所述新簇的簇表示和与其相似的老簇的簇表示进行相似度匹配以获得最优的老簇。

作为本发明提供的上述图像增量聚类系统的一种优选的技术方案，所述检索模块还具体用于：通过向量相似度检索算法获得所述新簇的近邻信息；其中，所述近邻信息包括：与每个所述新簇邻近的一个或多个老簇，以及每个所述新簇与邻近的一个或多个所述老簇之间的近邻得分；所述近邻得分表示所述新簇与一个或多个所述老簇之间的相似度；将所述近邻得分与阈值进行比较，以获得所述近邻得分大于或等于所述阈值的老簇作为与所述新簇相似的老簇。

作为本发明提供的上述图像增量聚类系统的一种优选的技术方案，所述匹配模块包括：计算模块，用于计算所述新簇的簇表示和与其相似的老簇的簇表示之间的第二相似度；判断模块，用于根据所述第二相似度，通过分类器判断所述新簇和与其相似的老簇是否属于同一类别；如果是，则将所述相似的老簇确定为最优的老簇。

作为本发明提供的上述图像增量聚类系统的一种优选的技术方案，所述合并更新模块具体用于：根据每个新簇的簇表示，对合并后的最优的老簇的簇表示进行更新。

作为本发明提供的上述图像增量聚类系统的一种优选的技术方案，其中，所述簇表示包括：中心簇表示和场景簇表示；其中，“以新簇的簇表示作为查询向量”具体为：以新簇的中心簇表示作为所述查询向量；其中，“以所有老簇的簇表示作为底库向量”包括：以所有老簇的中心簇表示作为所述底库向量；其中，所述近邻得分为在向量相似度检索时比对新簇的中心簇表示与老簇的中心簇表示的中心簇表示所获得的相似度；其中，“进行相似度匹配”包括：以所述场景簇表示进行匹配；其中，所述第二相似度为计算新簇的场景簇表示和与其相似的老簇的场景簇表示所获得的场景簇表示相似度；其中，输出合并后的簇表示包括对最优的老簇的中心簇表示和场景簇表示都进行更新。

作为本发明提供的上述图像增量聚类系统的一种优选的技术方案，全量聚类所得到的每个新簇为C＝{x₁,x₂,...,x_c}，为其生成的中心簇表示为场景簇表示为/>其中，x₁为属于所述新簇C的第1个图像数据样本的特征向量，x_i为属于所述新簇C的第i个图像数据样本的特征向量，x_c为属于所述新簇C的第c个图像数据样本的特征向量，所述新簇C中图像数据样本的特征向量的总数为c个；m为根据所述新簇C中图像数据样本的图片质量分将所述新簇C中的图像数据样本划分成的总场景数；Y_i为所述新簇C的第i个场景簇表示，n为所述新簇C中属于第i个场景的图像数据样本总数；其中，若属于某个场景的图像数据样本的样本数为0，则不计算所述场景的场景簇表示；其中，与所述新簇的邻近的老簇表示为I_i＝{X₁,X₂,...,X_k}以及所述新簇与邻近的老簇的近邻得分表示为D_i＝{d₁,d₂,...,d_k}；其中，近邻得分d₁,d₂,...,d_k中低于阈值的则表明新簇与相应的邻近的老簇匹配失败；其中，当所述新簇C的第i个场景簇表示为Y_i、相应的近邻得分大于或等于所述阈值的最相似的老簇的第i个场景簇表示为Y′_i，则计算的第二相似度为第i个场景的相似度Y_i ^TY_i'；其中，若所述新簇或所述最相似的老簇的某个场景的图像数据样本的个数为0则相似度记为0；其中，将新簇与选取出的老簇合并，输出合并后的簇表示，具体为：具有c个图像数据样本的新簇C的中心簇表示X与合并入的具有c’个图像数据样本的最优的老簇C’的中心簇表示X’，更新的最优的老簇的中心簇表示的为：所述新簇C的具有n个图像数据样本的第i个场景的场景簇表示为Y_i与合并入的最优的老簇C’的具有n’个图像数据样本的第i个场景的场景簇表示为Y_i′，更新的最优的老簇的场景簇表示为：/>

作为本发明提供的上述图像增量聚类系统的一种优选的技术方案，所述全量聚类采用的算法为K-means、DBSCAN、或层次聚类算法；并且/或者，所述向量相似度检索算法包括采用暴力检索、Hash检索、IVFFlat、IVFPQ、HNSW中的任一种算法；并且/或者，所述向量相似度采用向量内积计算、L1距离计算、L2距离计算中的任一种方式进行计算；并且/或者，所述分类器包括随机森林、xgboost、逻辑回归中的任一种；并且/或者，所述场景簇表示包括人脸中的人脸角度、模糊程度、光照强弱以及人体状态中的站姿、坐姿和躺姿中的至少一种场景下的场景簇表示。

第三方面，在本发明提供的一种计算机可读存储介质中，所述计算机可读存储介质中存储有多条程序代码，其特征在于，当处理器加载并运行所述多条程序代码时，实现如前述第一方面中任一技术方案所述的图像增量聚类方法。

第四方面，在本发明提供的一种图像增量聚类装置中，包括处理器和存储装置，所述存储装置适于存储多条程序代码，其特征在于，所述程序代码适于由所述处理器加载并运行以执行如前述第一方面中任一技术方案所述的图像增量聚类方法。

本发明上述一个或多个技术方案，至少具有如下一种或多种有益效果：通过为全量聚类获得的每个新簇生成簇表示，并针对每个新簇在所有的老簇中进行向量相似度检索，以及将每个新簇与相似的老簇进行相似度匹配处理，最后更新与新簇合并后的老簇对应的簇表示。如此，通过簇表示来表征一个簇中所有图像数据样本的特征向量，降低了对系统内存的需求；通过向量相似度检索和相似度匹配处理来得到最优的老簇并更新老簇，避免了从图像数据样本的样本层面直接进行簇的比对和更新，减少了图像数据样本聚类所需的时间，提高了图像预处理的效率，同时更好地实现了海量复杂图像数据样本的聚类处理。

此外，本发明上述一个或多个技术方案，还至少具有如下一种或多种有益效果：通过为每个新簇生成对应的中心簇表示和场景簇表示作为簇表示，然后先以每个新簇对应的簇表示中的中心簇表示作为查询向量并以所有老簇对应的簇表示中的所有中心簇表示作为底库向量进行向量相似度检索，来实现粗粒度的检索，再以簇表示中的场景簇表示在相似度匹配处理时进行匹配，实现了细粒度的匹配。如此，通过按照中心簇表示和场景簇表示进行新的图像数据样本与老的图像数据样本的比对，加速了新的图像数据样本与老的图像数据样本的比对过程，进一步提高了利用有限的计算资源快速地处理海量复杂的图像数据样本的效率。

附图说明

下面参照附图来描述本发明的具体实施方式，附图中：

图1为根据本发明的图像增量聚类方法的一个实施例的主要步骤流程示意图；

图2为根据本发明的图像增量聚类系统的主要模块结构图。

具体实施方式

下面参照附图来描述本发明的一些实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非旨在限制本发明的保护范围。

在本发明的描述中，“模块”、“处理器”可以包括硬件、软件或者两者的组合。一个模块可以包括硬件电路，各种合适的感应器，通信端口，存储器，也可以包括软件部分，比如程序代码，也可以是软件和硬件的组合。处理器可以是中央处理器、微处理器、图像处理器、数字信号处理器或者其他任何合适的处理器。处理器具有数据和/或信号处理功能。处理器可以以软件方式实现、硬件方式实现或者二者结合方式实现。非暂时性的计算机可读存储介质包括任何合适的可存储程序代码的介质，比如磁碟、硬盘、光碟、闪存、只读存储器、随机存取存储器等等。术语“A和/或B”表示所有可能的A与B的组合，比如只是A、只是B或者A和B。术语“至少一个A或B”或者“A和B中的至少一个”含义与“A和/或B”类似，可以包括只是A、只是B或者A和B。单数形式的术语“一个”、“这个”也可以包含复数形式。当然，上述可以替换的实施方式之间、以及可以替换的实施方式和优选的实施方式之间还可以交叉配合使用，从而组合出新的实施方式以适用于更加具体的应用场景。

为了解决如何利用有限的计算资源快速地处理海量复杂的人脸图像数据样本的技术问题。本实施例提供了一种图像增量聚类方法、系统、介质及装置。

本实施例通过为全量聚类获得的每个新簇生成簇表示，并针对每个新簇在所有的老簇中进行向量相似度检索，以及将每个新簇与相似的老簇进行相似度匹配处理，最后更新与新簇合并后的老簇对应的簇表示。如此，通过簇表示来表征一个簇中所有图像数据样本的特征向量，降低了对系统内存的需求；通过向量相似度检索和相似度匹配处理来得到最优的老簇并更新老簇，避免了从图像数据样本的样本层面直接进行簇的比对和更新，减少了图像数据样本聚类所需的时间，提高了图像预处理的效率，同时更好地实现了海量复杂图像数据样本的聚类处理。

【实施例1】

本实施例提供的一种图像增量聚类方法，如图1所示，该方法包括：

S100、在原图像数据样本中新增加图像数据样本后，对新增加的图像数据样本进行全量聚类而获得一个或多个新簇，并为每个新簇生成簇表示。

其中，上述的“增量聚类”是指在原图像数据样本中新增加图像数据样本后，对新增加的图像数据样本进行聚类；上述的“全量聚类”是将全部新的图像数据样本进行分类，将分类后属于同一类别的图像数据样本的集合称为一个新簇，“增量聚类”和“全量聚类”是相对而言的。在进行全量聚类时可以使用K-means(即k均值聚类算法，k-means clusteringalgorithm)、DBSCAN(即基于密度的噪声应用空间聚类算法，Density-Based SpatialClustering of Applications with Noise)、或层次聚类算法等算法工具。为了描述简洁，在此不再对上述向量相似度检索算法的具体工作原理和运算过程进行赘述。

需要说明的是，每个图像数据样本均包含大量的特征，而一个簇表示中包含大量的图片数据，如果在进行新簇和老簇的聚类时，直接在图像数据样本层面进行簇的比对和更新，则处理过程会很复杂，需要大量的运行内存并且需要耗费大量的处理时间。

为了进一步地提高图像数据样本处理的效率，本实施例的簇表示包括：中心簇表示和场景簇表示。如此，将图像数据样本聚类后进行簇表示，降低了对系统内存的需求。其中，簇表示中的场景簇表示可以包括人脸中的人脸角度、模糊程度、光照强弱以及人体状态中的站姿、坐姿和躺姿中的至少一种场景下的场景簇表示。其中，簇表示用于表征簇中的图像数据样本的特征向量。

如此，可以从两个层次对在原图像数据样本中新增加的图像数据样本进行处理：将中心簇表示作为一个簇的粗粒度的特征向量，先通过其粗粒度的特征向量进行初步聚类，这样能够先通过简单的查询以在海量的老簇中筛选出与新簇邻近的老簇；然后，在筛选出的老簇中再通过将场景簇表示作为粗粒度的特征向量进行匹配，以最终实现新簇与老簇的聚类。从而，通过在中心簇表示和场景簇表示的层面对图像数据样本进行聚类，以便利用有限的计算资源快速地处理海量复杂的人脸角度、模糊程度、光照强度等不同环境或场景下的人脸图像数据。

示例性地，假设全量聚类所得到的每个新簇为C＝{x₁,x₂,...,x_c}，为其生成的中心簇表示为场景簇表示为/>

其中，x₁为属于新簇C的第1个图像数据样本的特征向量，xi为属于新簇C的第i个图像数据样本的特征向量，x_c为属于新簇C的第c个图像数据样本的特征向量，新簇C中图像数据样本的特征向量的总数为c个；m为根据新簇C中图像数据样本的图片质量分将新簇C中的图像数据样本划分成的总场景数；Y_i为新簇C的第i个场景簇表示，n为新簇C中属于第i个场景的图像数据样本总数；其中，若属于某个场景的图像数据样本的样本数为0，则不计算场景的场景簇表示。

S200、根据新簇的簇表示在所有老簇的簇表示中进行向量相似度检索，确定与新簇相似的老簇，其中老簇基于原图像数据样本进行聚类而获得。

示例性地，步骤S200具体包括：以新簇的簇表示作为查询向量，以所有老簇的簇表示作为底库向量，通过向量相似度检索算法进行向量相似度检索，以确定与新簇相似的老簇。其中，“以新簇的簇表示作为查询向量”为：以新簇的中心簇表示作为查询向量；其中，“以所有老簇的簇表示作为底库向量”包括：以所有老簇的所有中心簇表示作为底库向量。

进一步地，可以根据查询向量和所有底库向量，通过向量相似度检索算法，获得查询向量对应的新簇的近邻信息；其中，近邻信息包括：与每个新簇邻近的一个或多个老簇，以及每个新簇与邻近的一个或多个老簇之间的近邻得分；近邻得分表示新簇与一个或多个老簇之间的第一相似度。具体地，该近邻得分可以为在向量相似度检索时比对新簇的中心簇表示与老簇的中心簇表示所获得的中心簇表示相似度。从而，在向量相似度检索的结果中，按照第一相似度的排名可以得到与新簇相似的一个或多个老簇以及最相似的老簇。

进一步，为了减少后续新簇与老簇匹配的工作量，并提高图像聚类的效率，在确定与新簇相似的老簇时，还具体包括：将表示新簇与老簇相似度的近邻得分与阈值进行比较，以获得近邻得分大于或等于阈值的老簇作为与新簇相似的老簇。如此，可以将相似度较低的老簇剔除，以提高新簇与老簇匹配时的处理速度。可以理解的是，步骤S200中是以一个新簇为例进行说明的，而多个新簇可以用同样的方法分别来进行向量相似度检索。

其中，在向量相似度检索算法中，该检索算法可以为暴力检索、Hash检索(也成为了哈希检索、哈希查找)、IVFFlat(文件倒排索引算法，Inverted File Flat)、IVFPQ(文件倒排乘积量化算法，Inverted File Product Quantizer)、HNSW(分层的可导航小世界算法，Hierarchical Navigable Small World)中的任一种算法。为了描述简洁，在此不再对上述向量相似度检索算法的具体工作原理和运算过程进行赘述。

其中，向量相似度采用包括向量内积计算、L1距离计算、L2距离计算中的任一种方式进行计算。为了描述简洁，在此不再对上述计算向量相似度时所使用的算法的具体工作原理和运算过程进行赘述。

S300、在相似的老簇中选取一个或多个老簇。

示例性地，在相似的老簇中选取一个或多个老簇，即将新簇和与其相似的老簇进行匹配以获得最优的老簇，该步骤具体包括：将新簇的簇表示和与其相似的老簇的簇表示进行相似度匹配。其中，“进行相似度匹配”包括：以场景簇表示进行匹配。

进一步，步骤S300具体包括：根据新簇的簇表示与相应的相似的老簇的簇表示，计算第二相似度；根据统计的第二相似度，经分类器判断新簇与相应的相似的老簇是否属于同一类别；如果是，则新簇与相应的相似的老簇匹配成功，并且将相似的老簇匹配为相应的新簇的最优的老簇。其中，第二相似度为计算新簇的场景簇表示和相应的相似的老簇的场景簇表示所获得的场景簇表示相似度。在该步骤中，通过在多个场景簇的层次将新簇和老簇进行匹配，最终保证了新簇与老簇匹配的精确度。

示例性地，假设与新簇的邻近的老簇表示为I_i＝{X₁,X₂,...,X_k}以及新簇与邻近的老簇的近邻得分表示为D_i＝{d₁,d₂,...,d_k}；其中，近邻得分d₁,d₂,...,d_k中低于阈值的则表明新簇与相应的邻近的老簇匹配失败。

其中，当新簇C的第i个场景簇表示为Y_i、相应的近邻得分大于或等于阈值的相似的老簇的第i个场景簇表示为Y′_i，则计算的第二相似度为第i个场景的相似度Y_i ^TY_i'，即向量Y_i与Y_i'的内积，其中，向量Y_i ^T表示向量Y_i的转置；其中，若新簇或相似的老簇的某个场景的图像数据样本的个数为0则相似度记为0。

其中，分类器可以为随机森林、xgboost(eXtreme Gradient Boosting，即极端梯度提升)、逻辑回归中的一种。为了描述简洁，在此不再对上述分类器的具体工作原理和运算过程进行赘述。

S400、将新簇与选取出的老簇合并，输出合并后的簇表示。

示例性地，将匹配成功的每个新簇与匹配上的最优的老簇进行合并，并更新与新簇合并后的老簇的簇表示，即所有的新簇匹配完成后，合并新簇与相应的最优的老簇，可以理解为新簇中所有的图像数据样本与相应的最优的老簇中的图像数据样本属于同一类别，在匹配成功后将新簇中的图像数据样本合并到对应的最优的老簇中。

步骤S4具体包括：所有的新簇匹配完成后，合并新簇与匹配上的相应的最优的老簇；根据每个新簇的簇表示，对合并后的最优的老簇的簇表示进行更新。其中，对合并入的最优的老簇的簇表示进行更新包括对其中心簇表示和场景簇表示进行更新。可以理解的是，原先的新簇和老簇分别有独立的簇表示，在合并成一个簇之后需要用同一的簇表示替换原先的老簇，即实现对老簇的更新。如此，当之后再对新增的图像数据样本进行聚类时，可以仅在更新后的老簇的簇表示的基础上进行，大大提高了图像数据样本聚类的效率。

示例性地，在将新簇与选取出的老簇合并，输出合并后的簇表示时，假设具有c个图像数据样本的新簇C的中心簇表示X与合并入的具有c’个图像数据样本的最优的老簇C’的中心簇表示X’，更新的最优的老簇的中心簇表示的为：新簇C的具有n个图像数据样本的第i个场景的场景簇表示为Y_i与合并入的最优的老簇C’的具有n’个图像数据样本的第i个场景的场景簇表示为Y_i′，更新的最优的老簇的场景簇表示为：

在本实施例提供的图像增量聚类方法中，通过为每个新簇生成中心簇表示和场景簇表示作为簇表示，然后先以每个新簇的簇表示中的中心簇表示作为查询向量并以所有老簇的簇表示中的所有中心簇表示作为底库向量进行向量相似度检索，来实现粗粒度的检索，再以簇表示中的场景簇表示在相似度匹配处理时进行匹配，实现了细粒度的匹配。如此，通过按照中心簇表示和场景簇表示进行新的图像数据样本与老的图像数据样本的比对，加速了新的图像数据样本与老的图像数据样本的比对过程，进一步提高了利用有限的计算资源快速地处理海量复杂的图像数据样本的效率。

需要说明的是，尽管上文详细描述了本发明方法的详细步骤，但是，在不偏离本发明的基本原理的前提下，本领域技术人员可以对上述步骤进行组合、拆分及调换顺序，如此修改后的技术方案并没有改变本发明的基本构思，因此也落入本发明的保护范围之内。

【实施例2】

在本实施例提供的一种图像增量聚类系统中，如图2所示，该图像增量聚类系统包括：生成模块，用于在原图像数据样本中新增加图像数据样本后，对新增加的图像数据样本进行全量聚类而获得一个或多个新簇，并为每个新簇生成簇表示；检索模块，用于根据新簇的簇表示在所有老簇的簇表示中进行向量相似度检索，确定与新簇相似的老簇，其中所述老簇基于所述原图像数据样本进行聚类而获得；匹配模块，用于在所述相似的老簇中选取一个或多个老簇；合并更新模块，用于将新簇与选取出的老簇合并，输出合并后的簇表示；其中，簇表示用于表征簇中的图像数据样本的特征向量。

作为本实施例提供的上述图像增量聚类系统的一种优选的实施方式，该检索模块具体用于：以新簇的簇表示作为查询向量，以所有老簇的簇表示作为底库向量，通过向量相似度检索算法来确定与新簇相似的老簇；该匹配模块具体用于：在将新簇和与其相似的老簇进行匹配时，将新簇的簇表示和与其相似的老簇的簇表示进行相似度匹配以获得最优的老簇。

作为本实施例提供的上述图像增量聚类系统的一种优选的实施方式，该检索模块还具体用于：通过向量相似度检索算法获得新簇的近邻信息；其中，近邻信息包括：与每个新簇邻近的一个或多个老簇，以及每个新簇与邻近的一个或多个老簇之间的近邻得分；近邻得分表示新簇与一个或多个老簇之间的第一相似度；将近邻得分与阈值进行比较，以获得近邻得分大于或等于阈值的老簇作为与新簇相似的老簇。

作为本实施例提供的上述图像增量聚类系统的一种优选的实施方式，该匹配模块包括：计算模块，用于计算新簇的簇表示和与其相似的老簇的簇表示之间的第二相似度；判断模块，用于根据第二相似度，通过分类器判断新簇和与其相似的老簇是否属于同一类别；如果是，则将相似的老簇确定为最优的老簇。

作为本实施例提供的上述图像增量聚类系统的一种优选的实施方式，该合并更新模块具体用于：根据每个新簇的簇表示，对合并后的最优的老簇的簇表示进行更新。或者，该合并更新模块还可以包括：合并模块，用于所有的新簇匹配完成后，合并新簇与匹配上的相应的最优的老簇；更新模块，用于根据每个新簇的簇表示，对合并后的最优的老簇的簇表示进行更新。

作为本实施例提供的上述图像增量聚类系统的一种优选的实施方式，其中，簇表示包括：中心簇表示和场景簇表示；其中，“以新簇的簇表示作为查询向量”具体为：以新簇的中心簇表示作为查询向量；其中，“以所有老簇的簇表示作为底库向量”包括：以所有老簇的中心簇表示作为底库向量；其中，近邻得分为在向量相似度检索时比对新簇的中心簇表示与老簇的中心簇表示的中心簇表示所获得的相似度；其中，“进行相似度匹配”包括：以场景簇表示进行匹配；其中，第二相似度为计算新簇的场景簇表示和与其相似的老簇的场景簇表示所获得的场景簇表示相似度；其中，输出合并后的簇表示包括对最优的老簇的中心簇表示和场景簇表示都进行更新。

作为本实施例提供的上述图像增量聚类系统的一种优选的实施方式，全量聚类所得到的每个新簇为C＝{x₁,x₂,...,x_c}，为其生成的中心簇表示为场景簇表示为/>其中，x₁为属于新簇C的第1个图像数据样本的特征向量，x_i为属于新簇C的第i个图像数据样本的特征向量，x_c为属于新簇C的第c个图像数据样本的特征向量，新簇C中图像数据样本的特征向量的总数为c个；m为根据新簇C中图像数据样本的图片质量分将新簇C中的图像数据样本划分成的总场景数；Y_i为新簇C的第i个场景簇表示，n为新簇C中属于第i个场景的图像数据样本总数；其中，若属于某个场景的图像数据样本的样本数为0，则不计算场景的场景簇表示；其中，与新簇的邻近的老簇表示为I_i＝{X₁,X₂,...,X_k}以及新簇与邻近的老簇的近邻得分表示为D_i＝{d₁,d₂,...,d_k}；其中，近邻得分d₁,d₂,...,d_k中低于阈值的则表明新簇与相应的邻近的老簇匹配失败；其中，当新簇C的第i个场景簇表示为Y_i、相应的近邻得分大于或等于阈值的最相似的老簇的第i个场景簇表示为Y′_i，则计算的第二相似度为第i个场景的相似度Y_i ^TY_i'；其中，若新簇或最相似的老簇的某个场景的图像数据样本的个数为0则相似度记为0；其中，将新簇与选取出的老簇合并，输出合并后的簇表示，具体为：具有c个图像数据样本的新簇C的中心簇表示X与合并入的具有c’个图像数据样本的最优的老簇C’的中心簇表示X’，更新的最优的老簇的中心簇表示的为：/> 新簇C的具有n个图像数据样本的第i个场景的场景簇表示为Y_i与合并入的最优的老簇C’的具有n’个图像数据样本的第i个场景的场景簇表示为Y_i′，更新的最优的老簇的场景簇表示为：/>

作为本实施例提供的上述图像增量聚类系统的一种优选的实施方式，全量聚类采用的算法为K-means、DBSCAN、或层次聚类算法；并且/或者，向量相似度检索算法包括采用暴力检索、Hash检索、IVFFlat、IVFPQ、HNSW中的任一种算法；并且/或者，向量相似度采用向量内积计算、L1距离计算、L2距离计算中的任一种方式进行计算；并且/或者，分类器包括随机森林、xgboost、逻辑回归中的任一种；并且/或者，场景簇表示包括人脸中的人脸角度、模糊程度、光照强弱以及人体状态中的站姿、坐姿和躺姿中的至少一种场景下的场景簇表示。

需要说明的是，本实施例提供的图像增量聚类系统与前述实施例1中的图像增量聚类方法是相互对应的，故不再对本实施例中的图像处理系统进行赘述，关于图像处理系统的说明请参见【实施例1】。

在本实施例提供的一种图像增量聚类系统中，通过为每个新簇生成对应的中心簇表示和场景簇表示作为簇表示，然后先以每个新簇对应的簇表示中的中心簇表示作为查询向量并以所有老簇对应的簇表示中的所有中心簇表示作为底库向量进行向量相似度检索，来实现粗粒度的检索，再以簇表示中的场景簇表示在相似度匹配处理时进行匹配，实现了细粒度的匹配。如此，通过按照中心簇表示和场景簇表示进行新的图像数据样本与老的图像数据样本的比对，加速了新的图像数据样本与老的图像数据样本的比对过程，进一步提高了利用有限的计算资源快速地处理海量复杂的图像数据样本的效率。

要说明的是，上述实施例提供的图像增量聚类系统，仅以上述各功能模块(如生成模块、检索模块、匹配模块、合并更新模块等)的划分进行举例说明，在实际应用中，可以根据需要而将上述功能模块由不同的功能模块来完成，即将本发明实施例中的功能模块再分解或者组合，例如，上述实施例的功能模块可以合并为一个功能模块，也可以进一步拆分成多个子模块，以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的功能模块名称，仅仅是为了进行区分，不视为对本发明的不当限定。

【实施例3】

本领域的技术人员应当理解的是，在本实施例提供的一种计算机可读存储介质中，该存储介质存储有多条程序代码，该程序代码适于由处理器加载并运行以执行前述第一方面任一种的图像增量聚类方法。该存储介质中包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

【实施例4】

在本实施例提供的一种图像增量聚类装置中，包括处理器和存储装置，存储装置适于存储多条程序代码，其特征在于，该程序代码适于由处理器加载并运行以执行如前述第一方面中任一实施方式的图像增量聚类方法。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的保护范围之内并且形成不同的实施例。例如，在本发明的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征作出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种图像增量聚类方法，其特征在于，包括：

在原图像数据样本中新增加图像数据样本后，对新增加的图像数据样本进行全量聚类而获得一个或多个新簇，并为每个新簇生成簇表示；

根据新簇的簇表示在所有老簇的簇表示中进行向量相似度检索，确定与所述新簇相似的老簇，其中所述老簇基于所述原图像数据样本进行聚类而获得；

在所述相似的老簇中选取一个或多个老簇；

将新簇与选取出的老簇合并，输出合并后的簇表示；

其中，所述簇表示用于表征簇中的图像数据样本的特征向量；

所述簇表示包括：中心簇表示和场景簇表示；

根据新簇的簇表示在所有老簇的簇表示中进行向量相似度检索，确定与所述新簇相似的老簇，具体包括：

以新簇的簇表示作为查询向量，以所有老簇的簇表示作为底库向量，通过向量相似度检索算法来确定与所述新簇相似的老簇；

在所述相似的老簇中选取一个或多个老簇，具体包括：将所述新簇的簇表示和与其相似的老簇的簇表示进行相似度匹配以获得最优的老簇；

“以新簇的簇表示作为查询向量”具体为：以新簇的中心簇表示作为所述查询向量；

“以所有老簇的簇表示作为底库向量”包括：以所有老簇的中心簇表示作为所述底库向量；

“进行相似度匹配”包括：以所述场景簇表示进行匹配；

全量聚类所得到的每个新簇为C＝{x₁,x₂,...,x_c}，为其生成的中心簇表示为场景簇表示为/>

x₁为属于所述新簇C的第1个图像数据样本的特征向量，x_i为属于所述新簇C的第i个图像数据样本的特征向量，x_c为属于所述新簇C的第c个图像数据样本的特征向量，所述新簇C中图像数据样本的特征向量的总数为c个；m为根据所述新簇C中图像数据样本的图片质量分将所述新簇C中的图像数据样本划分成的总场景数；Y_i为所述新簇C的第i个场景簇表示，n为所述新簇C中属于第i个场景的图像数据样本总数。

2.如权利要求1所述的方法，其特征在于，通过向量相似度检索算法来确定与所述新簇相似的老簇，具体包括：

通过向量相似度检索算法获得所述新簇的近邻信息；

其中，所述近邻信息包括：与每个所述新簇邻近的一个或多个老簇，以及每个所述新簇与邻近的一个或多个所述老簇之间的近邻得分；

所述近邻得分表示所述新簇与一个或多个所述老簇之间的第一相似度；

将所述近邻得分与阈值进行比较，以获得所述近邻得分大于或等于所述阈值的老簇作为与所述新簇相似的老簇。

3.如权利要求2所述的方法，其特征在于，将所述新簇的簇表示和与其相似的老簇的簇表示进行相似度匹配以获得最优的老簇，具体包括：

计算所述新簇的簇表示和与其相似的老簇的簇表示之间的第二相似度；

根据所述第二相似度，通过分类器判断所述新簇和与其相似的老簇是否属于同一类别；

如果是，则将所述相似的老簇确定为最优的老簇。

4.如权利要求3所述的方法，其特征在于，

所述近邻得分为在向量相似度检索时，比对新簇的中心簇表示与老簇的中心簇表示所获得的中心簇表示相似度；

所述第二相似度为计算新簇的场景簇表示和与其相似的老簇的场景簇表示所获得的场景簇表示相似度；

输出合并后的簇表示包括对最优的老簇的中心簇表示和场景簇表示都进行更新。

5.如权利要求4所述的方法，其特征在于，还包括：

与所述新簇的邻近的老簇表示为I_i＝{X₁,X₂,...,X_k}以及所述新簇与邻近的老簇的近邻得分表示为D_i＝{d₁,d₂,...,d_k}；其中，k为与所述新簇的邻近的老簇的数量；

近邻得分d₁,d₂,...,d_k中低于阈值的则表明新簇与相应的邻近的老簇匹配失败；

当所述新簇C的第i个场景簇表示为Y_i、相应的近邻得分大于或等于所述阈值的最相似的老簇的第i个场景簇表示为Y′_i，则计算的第二相似度为第i个场景的相似度Y_i ^TY_i'；

将新簇与选取出的老簇合并，输出合并后的簇表示，具体为：

具有c个图像数据样本的新簇C的中心簇表示X与合并入的具有c’个图像数据样本的最优的老簇C’的中心簇表示X’，更新的最优的老簇的中心簇表示的为：

所述新簇C的具有n个图像数据样本的第i个场景的场景簇表示为Y_i与合并入的最优的老簇C’的具有n’个图像数据样本的第i个场景的场景簇表示为Y_i′，更新的最优的老簇的场景簇表示为：

6.根据权利要求4所述的方法，其特征在于：

所述全量聚类采用的算法为K-means、DBSCAN、或层次聚类算法；并且/或者

所述向量相似度检索算法为采用暴力检索、Hash检索、IVFFlat、IVFPQ、HNSW中的任一种算法；并且/或者

所述向量相似度采用向量内积计算、L1距离计算、L2距离计算中的任一种方式进行计算；并且/或者

所述分类器包括随机森林、xgboost、逻辑回归中的任一种；并且/或者

所述场景簇表示包括人脸中的人脸角度、模糊程度、光照强弱以及人体状态中的站姿、坐姿和躺姿中的至少一种场景下的场景簇表示。

7.一种图像增量聚类系统，其特征在于，包括：

生成模块，用于在原图像数据样本中新增加图像数据样本后，对新增加的图像数据样本进行全量聚类而获得一个或多个新簇，并为每个新簇生成簇表示；

检索模块，用于根据新簇的簇表示在所有老簇的簇表示中进行向量相似度检索，确定与所述新簇相似的老簇，其中所述老簇基于所述原图像数据样本进行聚类而获得；

匹配模块，用于在所述相似的老簇中选取一个或多个老簇；

合并更新模块，用于将新簇与选取出的老簇合并，输出合并后的簇表示；

所述簇表示包括：中心簇表示和场景簇表示；

所述检索模块具体用于：以新簇的簇表示作为查询向量，以所有老簇的簇表示作为底库向量，通过向量相似度检索算法来确定与所述新簇相似的老簇；

所述匹配模块具体用于：在将新簇和与其相似的老簇进行匹配时，将所述新簇的簇表示和与其相似的老簇的簇表示进行相似度匹配以获得最优的老簇；

“进行相似度匹配”包括：以所述场景簇表示进行匹配；

8.如权利要求7所述的系统，其特征在于，所述检索模块还具体用于：

通过向量相似度检索算法获得所述新簇的近邻信息；

9.如权利要求8所述的系统，其特征在于，所述匹配模块包括：

计算模块，用于计算所述新簇的簇表示和与其相似的老簇的簇表示之间的第二相似度；

判断模块，用于根据所述第二相似度，通过分类器判断所述新簇和与其相似的老簇是否属于同一类别；

如果是，则将所述相似的老簇确定为最优的老簇。

10.如权利要求9所述的系统，其特征在于，

所述近邻得分为在向量相似度检索时比对新簇的中心簇表示与老簇的中心簇表示的中心簇表示所获得的相似度；

11.如权利要求10所述的系统，其特征在于，还包括：

12.根据权利要求10所述的系统，其特征在于：

所述全量聚类采用的算法为K-means、DBSCAN、或层次聚类算法；并且/或者，

所述向量相似度检索算法包括采用暴力检索、Hash检索、IVFFlat、IVFPQ、HNSW中的任一种算法；并且/或者，

所述向量相似度采用向量内积计算、L1距离计算、L2距离计算中的任一种方式进行计算；并且/或者，

所述分类器包括随机森林、xgboost、逻辑回归中的任一种；并且/或者，

13.一种计算机可读存储介质，所述计算机可读存储介质中存储有多条程序代码，其特征在于，当处理器加载并运行所述多条程序代码时，实现如权利要求1至6中任一项所述的图像增量聚类方法。

14.一种图像增量聚类装置，包括处理器和存储装置，所述存储装置适于存储多条程序代码，其特征在于，所述程序代码适于由所述处理器加载并运行以执行权利要求1至6中任一项所述的图像增量聚类方法。