WO2019080411A1

WO2019080411A1 - 电子装置、人脸图像聚类搜索方法和计算机可读存储介质

Info

Publication number: WO2019080411A1
Application number: PCT/CN2018/076123
Authority: WO
Inventors: 戴磊
Original assignee: 平安科技（深圳）有限公司
Priority date: 2017-10-23
Filing date: 2018-02-10
Publication date: 2019-05-02
Also published as: CN107766822A

Abstract

一种电子装置、人脸图像聚类搜索方法和计算机可读存储介质，其中，该方法包括：对实时图像进行人脸检测以确定出实时人脸图像，计算出该实时人脸图像的特征向量（S10）；计算所述实时人脸图像的特征向量分别与预先确定的各个图像类别的中心点特征向量的距离，筛选距离小于第一阈值的中心点特征向量，将筛选出的中心点特征向量所对应的图像类别作为候选类别（S20）；在所述候选类别中找出特征向量与所述实时人脸图像的特征向量的距离最近且小于第二阈值的样本图像（S30）。上述技术方案减少了人脸识别过程中样本比对花费的时间，提升人脸识别的实时性。

Description

电子装置、人脸图像聚类搜索方法和计算机可读存储介质

本申请基于巴黎公约申明享有2017年10月23日递交的申请号为CN 201710993380.7、名称为“电子装置、人脸图像聚类搜索方法和计算机可读存储介质”中国专利申请的优先权，该中国专利申请的整体内容以参考的方式结合在本申请中。

技术领域

本申请涉及图像技术领域，特别涉及一种电子装置、人脸图像聚类搜索方法和计算机可读存储介质。

背景技术

目前，在人脸识别的应用中，通常的做法是，对于每个识别目标人脸都会计算出一个特征向量，与样本库中每个人脸的特征向量进行比较，距离最小的作为识别结果。当样本库很大时，逐个样本的比较花费时间较多，会使人脸识别的实时性降低。

发明内容

本申请的主要目的是提供一种电子装置、人脸图像聚类搜索方法和计算机可读存储介质，旨在减少人脸识别过程中样本比对花费的时间，提升人脸识别的实时性。

本申请第一方面提供一种电子装置，所述电子装置包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的人脸图像聚类搜索系统，所述人脸图像聚类搜索系统被所述处理器执行时实现如下步骤：

对实时图像进行人脸检测以确定出实时人脸图像，计算出该实时人脸图像的特征向量；

计算所述实时人脸图像的特征向量分别与预先确定的各个图像类别的中心点特征向量的距离，筛选距离小于第一阈值的中心点特征向量，将筛选出的中心点特征向量所对应的图像类别作为候选类别；

在所述候选类别中找出特征向量与所述实时人脸图像的特征向量的距离最近且小于第二阈值的样本图像。

本申请第二方面提供一种人脸图像聚类搜索方法，该方法包括步骤：

本申请第三方面提供一种计算机可读存储介质，所述计算机可读存储介质存储有人脸图像聚类搜索系统，所述人脸图像聚类搜索系统可被至少一个处理器执行，以使所述至少一个处理器执行如下步骤：

本申请技术方案，采用预先将样本库聚类分成多个图像类别，并计算出各个图像类别的中心点特征向量；当对实时图像进行搜索识别时，先将实时图像中的实时人脸图像的特征向量计算出，再通过计算将该实时人脸图像的特征向量分别与各个图像类别的中心点特征向量的距离，从其中选取距离小于第一阈值(分类阈值)的图像类别作为候选类别，即选出该实时人脸图像较接近的图像类别，然后就在候选类别中找出与所述实时人脸图像的特征向量的距离最近且小于第二阈值的特征向量，则该找出的特征向量所对应的样本图像与该实时人脸图像目标相同，如此，则完成该实时图像的搜索识别。与现有技术相比，本方案先通过从样本库的各个图像类别中筛选出较接近候选类别，再在候选类别中搜索识别结果，如此，大幅降低了对该实时人脸图像的搜索识别范围大幅缩小，从而大幅降低了样本比对耗费的时间，提升了人脸识别的实时性。

附图说明

图1为本申请人脸图像聚类搜索方法一实施例的流程示意图；

图2为本申请人脸图像聚类搜索方法二实施例的流程示意图；

图3为本申请人脸图像聚类搜索系统一实施例的运行环境示意图；

图4为本申请人脸图像聚类搜索系统一实施例的程序模块图；

图5为本申请人脸图像聚类搜索系统二实施例的程序模块图。

具体实施方式

以下结合附图对本申请的原理和特征进行描述，所举实例只用于解释本申请，并非用于限定本申请的范围。

如图1所示，图1为本申请人脸图像聚类搜索方法一实施例的流程示意图。

本实施例中，该人脸图像方法包括：

步骤S10，对实时图像进行人脸检测以确定出实时人脸图像，计算出该实时人脸图像的特征向量；

摄像装置实时拍摄得到的视频通过网络实时传输到系统，并存储在系统的存储设备中，系统实时提取视频中的图像帧以得到实时图像，并对实时图像进行人脸检测以确定出其中的实时人脸图像，再计算出该实时人脸图像的特征向量。本实施例中，计算实时人脸图像的特征向量可以使用卷积神经网络，实时人脸图像作为卷积神经网络的输入，特征向量则为卷积神经网络的输出，卷积神经网络根据输入的实时人脸图像输出一个N维(例如128维)的向量(即实时人脸图像的特征向量)。

步骤S20，计算所述实时人脸图像的特征向量分别与预先确定的各个图像类别的中心点特征向量的距离，筛选距离小于第一阈值的中心点特征向量，将筛选出的中心点特征向量所对应的图像类别作为候选类别；

系统中的样本库预先进行了聚类处理，样本库被分成了多个图像类别，并且分别计算了各个图像类别的中心点特征向量。在得到实时人脸图像的特征向量后，系统分别该特征向量与各个图像类别的中心点特征向量的距离(该距离为欧氏距离或cos距离)，从得到的各个距离中筛选出距离小于第一阈值的中心点特征向量，那么，该筛选出的中心点特征向量所对应的图像类别就是该实时人脸图像的特征向量较接近的图像类别，故将筛选出的中心点特征向量所对应的图像类别作为该实时人脸图像的候选类别；其中，第一阈值为分类阈值，小于第一阈值的中心点特征向量可能为一个，也可能为多个，所以一张实时人脸图像的候选类别可能不只一个。通过筛选出候选类别，使得对该实时人脸图像的搜索识别范围大幅缩小，从而大幅降低了样本比对耗费的时间。

步骤S30，在所述候选类别中找出特征向量与所述实时人脸图像的特征向量的距离最近且小于第二阈值的样本图像。

样本库中所有样本图像的特征向量已经预先计算确定了，在确定了实时人脸图像的候选类别后，分别计算出该实时人脸图像的特征向量与各个候选类别中的每个样本图像的特征向量的距离，从计算得到的所有距离中找到小于第二阈值的最近距离，则确定该最近距离对应的样本图像为与所述实时人脸图像目标相同的样本图像，如此，即识别出当前实时人脸图像。本实施例中，第二阈值为识别阈值，两张图像的相似度越高、则其特征向量的距离越小，当两张图像的距离小于识别阈值时，该两张图像的差异可以忽略不计，可断定为同一个目标的图像。当然，如果出现所述候选类别中不存在与所述实时人脸图像的特征向量的距离小于第二阈值的特征向量的情况，则可能是样本库中缺少该实时人脸图像的人物样本图像，或者样本库太久未更新，该实时人脸图像的人物样貌变化较大等原因。

本实施例技术方案，采用预先将样本库聚类分成多个图像类别，并计算出各个图像类别的中心点特征向量；当对实时图像进行搜索识别时，先将实时图像中的实时人脸图像的特征向量计算出，再通过计算将该实时人脸图像的特征向量分别与各个图像类别的中心点特征向量的距离，从其中选取距离小于第一阈值(分类阈值)的图像类别作为候选类别，即选出该实时人脸图像较接近的图像类别，然后就在候选类别中找出与所述实时人脸图像的特征向量的距离最近且小于第二阈值的特征向量，则该找出的特征向量所对应的样本图像与该实时人脸图像目标相同，如此，则完成该实时图像的搜索识别。与现有技术相比，本方案先通过从样本库的各个图像类别中筛选出较接近候选类别，再在候选类别中搜索识别结果，如此，大幅降低了对该实时人脸图像的搜索识别范围大幅缩小，从而大幅降低了样本比对耗费的时间，提升了人脸识别的实时性。

如图2所示，图2为本申请人脸图像聚类搜索方法二实施例的流程示意图；本实施例的人脸图像聚类搜索方法在所述步骤S30之后，还包括：

步骤S40，根据预先确定的样本图像与人脸ID的映射关系，确定所述搜索到的样本图像对应的人脸ID，将该确定的人脸ID作为识别结果。

本实施例中，样本库中每张样本图像均对应一个人脸ID(例如，姓名)，人脸ID确定了样本图像是属于哪个人的图像，可以多张样本图像对应同一个人脸ID，即该多张样本图像是属于同一个人的图像；系统通过建立样本图像与人脸ID的映射关系表，将每张样本图像与对应的人脸ID关联。在根据特征向量的距离搜索到距离最近且小于第二阈值的样本图像后，通过查询样本图像与人脸ID的映射关系表，确定该搜索到的样本图像的人脸ID，则该确定人脸ID则为该实时人脸图像的识别结果。

进一步地，在上述实施例中，所述预先确定的各个图像类别的中心点特征向量通过以下步骤确定：

步骤1，对样本库中的每张样本图像进行人脸检测，从样本图像中确定人脸图像，并计算出确定的人脸图像的特征向量；

本步骤中，计算出样本库的所有样本图像对应的特征向量；具体的，正对每张样本图像，先从样本图像中确定人脸图像，再计算人脸图像的特征向量。其中，人脸图像的特征向量的计算可以使用卷积神经网络，将确定的人脸图像输入卷积神经网络中，卷积神经网络则根据输入的人脸图像输出一个N维(例如128维)的向量(即该人脸图像的特征向量)。

步骤2，计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类；

本实施例中，进行聚类的具体步骤可以为：

首先，计算每个特征向量与其它特征向量之间的距离；在得到所有样本图像的特征向量后，将所有特征向量两两之间的距离(欧氏距离或cos距离)全部计算出来；例如，有T1～Tn个特征向量，则分别计算|T1-T2|、|T1-T3|、|T1-T4|、…、|T1-Tn|、|T2-T3|、|T2-T4|、…、|T2-Tn|、…|T(n-1)-Tn|。

然后，将距离落入预设的数值范围的特征向量归为相同图像类别；例如，假设|T1-T2|、|T1-T3|落入预设的第一数值范围A，则将T1、T2、T3归为同一图像类别，|T5-T4|、|T5-T(n-1)|落入预设的第二数值范围B，则将T4、T5、T(n-1)归为同一图像类别，依此类推，完成所有特征向量的图像类别划分。

如果在聚类过程中，若有特征向量未归入任意一个已有图像类别，则将该特征向量作为一个新的图像类别追加到已有图像类别，直到将所有的特征向量完成分类。

步骤3，对聚类后得到的各个图像类别分别采用计算公式

进行计算，以得到各个图像类别各自的中心点特征向量，所述计算公式中，n表示类别中特征向量的个数，F ⁽ⁱ⁾表示第i个特征向量，X _k表示特征向量中第k个元素的值。

另外，在其他实施例中，可以采用k-means算法，将上述步骤2替换为以下步骤实现聚类：

a、随机在得到的特征向量中取m(例如m＝3)个特征向量作为种子点；

b、计算所有余下的特征向量分别到这m个种子点的距离(例如欧氏距离或cos距离)，将所有余下的特征向量分别划分到其距离最近的种子点的点群；

例如，特征元素Pi离种子点Si最近，那么Pi被划分到Si点群；其中，点群中的每个点均代表一张样本图片的特征向量。

c、计算每个点群的中心(即中心点特征向量)，将各个种子点移动到其所在点群的中心；

d、重复步骤b和c，直到种子点不再移动，则得到的点群为分类结果。

此外，本申请还提出一种人脸图像聚类搜索系统。

请参阅图3，是本申请人脸图像聚类搜索系统10较佳实施例的运行环境示意图。

在本实施例中，人脸图像聚类搜索系统10安装并运行于电子装置1中。电子装置1可以是桌上型计算机、笔记本、掌上电脑及服务器等计算设备。该电子装置1可包括，但不仅限于，存储器11、处理器12及显示器13。图3仅示出了具有组件11-13的电子装置1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

存储器11在一些实施例中可以是电子装置1的内部存储单元，例如该电子装置1的硬盘或内存。存储器11在另一些实施例中也可以是电子装置1的外部存储设备，例如电子装置1上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，存储器11还可以既包括电子装置1的内部存储单元也包括外部存储设备。存储器11用于存储安装于电子装置1的应用软件及各类数据，例如人脸图像聚类搜索系统10的程序代码等。存储器11还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)，微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行人脸图像聚类搜索系统10等。

显示器13在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。显示器13用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面，例如业务定制界面等。电子装置1的部件11-13通过系统总线相互通信。

请参阅图4，是本申请人脸图像聚类搜索系统10一实施例的程序模块图。在本实施例中，人脸图像聚类搜索系统10可以被分割成一个或多个模块，一个或者多个模块被存储于存储器11中，并由一个或多个处理器(本实施例为处理器12)所执行，以完成本申请。例如，在图4中，人脸图像聚类搜索系统10可以被分割成检测计算模块101、计算筛选模块102及识别模块103。本申请所称的模块是指能够完成特定功能的一系列计算机程序指令段，比程序更适合于描述人脸图像聚类搜索系统10在电子装置1中的执行过程，其中：

检测计算模块101，用于对实时图像进行人脸检测以确定出实时人脸图像，计算出该实时人脸图像的特征向量；

计算筛选模块102，用于计算所述实时人脸图像的特征向量分别与预先确定的各个图像类别的中心点特征向量的距离，筛选距离小于第一阈值的中心点特征向量，将筛选出的中心点特征向量所对应的图像类别作为候选类别；

识别模块103，用于在所述候选类别中找出特征向量与所述实时人脸图像的特征向量的距离最近且小于第二阈值的样本图像。

参阅图5，本实施例的人脸图像聚类搜索系统还包括：

结果确定模块104，用于根据预先确定的样本图像与人脸ID的映射关系，确定所述搜索到的样本图像对应的人脸ID，将该确定的人脸ID作为识别结果。

本实施例中，进行聚类的具体步骤可以为：

步骤3，对聚类后得到的各个图像类别分别采用计算公式

进一步地，本申请还提出一种计算机可读存储介质，所述计算机可读存储介质存储有人脸图像聚类搜索系统，所述人脸图像聚类搜索系统可被至少一个处理器执行，以使所述至少一个处理器执行上述任一实施例中的人脸图像聚类搜索方法。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是在本申请的申请构思下，利用本申请说明书及附图内容所作的等效结构变换，或直接/间接运用在其他相关的技术领域均包括在本申请的专利保护范围内。

Claims

一种电子装置，其特征在于，所述电子装置包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的人脸图像聚类搜索系统，所述人脸图像聚类搜索系统被所述处理器执行时实现如下步骤：

A1、对实时图像进行人脸检测以确定出实时人脸图像，计算出该实时人脸图像的特征向量；

A2、计算所述实时人脸图像的特征向量分别与预先确定的各个图像类别的中心点特征向量的距离，筛选距离小于第一阈值的中心点特征向量，将筛选出的中心点特征向量所对应的图像类别作为候选类别；

A3、在所述候选类别中找出特征向量与所述实时人脸图像的特征向量的距离最近且小于第二阈值的样本图像。
如权利要求1所述的电子装置，其特征在于，所述预先确定的各个图像类别的中心点特征向量通过以下步骤确定：

对样本库中的每张样本图像进行人脸检测，从样本图像中确定人脸图像，并计算出确定的人脸图像的特征向量；

计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类；

对聚类后得到的各个图像类别分别采用计算公式
进行计算，以得到各个图像类别各自的中心点特征向量，所述计算公式中，n表示类别中特征向量的个数，F ⁽ⁱ⁾表示第i个特征向量，X _k表示特征向量中第k个元素的值。
如权利要求2所述的电子装置，其特征在于，所述计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类的步骤包括：

计算每个特征向量与其它特征向量之间的距离；

将距离落入预设的数值范围的特征向量归为相同图像类别；

在聚类过程中，若有特征向量未归入任意一个已有图像类别，则将该特征向量作为一个新的图像类别追加到已有图像类别，直到将所有的特征向量完成分类。
如权利要求2所述的电子装置，其特征在于，所述计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类的步骤替换为：

a、随机在得到的特征向量中取m个特征向量作为种子点；

b、计算所有余下的特征向量分别到这m个种子点的距离，将所有余下的特征向量分别划分到其距离最近的种子点的点群；

c、计算每个点群的中心，将各个种子点移动到其所在点群的中心；

d、重复步骤b和c，直到种子点不再移动，则得到的点群为分类结果。
如权利要求1所述的电子装置，其特征在于，于所述步骤A3之后，所述处理器还用于执行所述人脸图像聚类搜索系统，以实现步骤：

根据预先确定的样本图像与人脸ID的映射关系，确定所述找出的样本图像对应的人脸ID，将该确定的人脸ID作为识别结果。
如权利要求5所述的电子装置，其特征在于，所述预先确定的各个图像类别的中心点特征向量通过以下步骤确定：

对样本库中的每张样本图像进行人脸检测，从样本图像中确定人脸图像，并计算出确定的人脸图像的特征向量；

计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类；

对聚类后得到的各个图像类别分别采用计算公式
进行计算，以得到各个图像类别各自的中心点特征向量，所述计算公式中，n表示类别中特征向量的个数，F ⁽ⁱ⁾表示第i个特征向量，X _k表示特征向量中第k个元素的值。
如权利要求6所述的电子装置，其特征在于，所述计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类的步骤包括：

计算每个特征向量与其它特征向量之间的距离；

将距离落入预设的数值范围的特征向量归为相同图像类别；

在聚类过程中，若有特征向量未归入任意一个已有图像类别，则将该特征向量作为一个新的图像类别追加到已有图像类别，直到将所有的特征向量完成分类。
如权利要求6所述的电子装置，其特征在于，所述计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类的步骤替换为：

a、随机在得到的特征向量中取m个特征向量作为种子点；

b、计算所有余下的特征向量分别到这m个种子点的距离，将所有余下的特征向量分别划分到其距离最近的种子点的点群；

c、计算每个点群的中心，将各个种子点移动到其所在点群的中心；

d、重复步骤b和c，直到种子点不再移动，则得到的点群为分类结果。
一种人脸图像聚类搜索方法，其特征在于，该方法包括步骤：

B1、对实时图像进行人脸检测以确定出实时人脸图像，计算出该实时人脸图像的特征向量；

B2、计算所述实时人脸图像的特征向量分别与预先确定的各个图像类别的中心点特征向量的距离，筛选距离小于第一阈值的中心点特征向量，将筛选出的中心点特征向量所对应的图像类别作为候选类别；

B3、在所述候选类别中找出特征向量与所述实时人脸图像的特征向量的距离最近且小于第二阈值的样本图像。
如权利要求9所述的人脸图像聚类搜索方法，其特征在于，所述预先确定的各个图像类别的中心点特征向量通过以下步骤确定：

对样本库中的每张样本图像进行人脸检测，从样本图像中确定人脸图像，并计算出确定的人脸图像的特征向量；

计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类；

对聚类后得到的各个图像类别分别采用计算公式
进行计算，以得到各个图像类别各自的中心点特征向量，所述计算公式中，n表示类别中特征向量的个数，F ⁽ⁱ⁾表示第i个特征向量，X _k表示特征向量中第k个元素的值。
如权利要求10所述的人脸图像聚类搜索方法，其特征在于，所述计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类的步骤包括：

计算每个特征向量与其它特征向量之间的距离；

将距离落入预设的数值范围的特征向量归为相同图像类别；

在聚类过程中，若有特征向量未归入任意一个已有图像类别，则将该特征向量作为一个新的图像类别追加到已有图像类别，直到将所有的特征向量完成分类。
如权利要求10所述的人脸图像聚类搜索方法，其特征在于，所述计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类的步骤替换为：

a、随机在得到的特征向量中取m个特征向量作为种子点；

b、计算所有余下的特征向量分别到这m个种子点的距离，将所有余下的特征向量分别划分到其距离最近的种子点的点群；

c、计算每个点群的中心，将各个种子点移动到其所在点群的中心；

d、重复步骤b和c，直到种子点不再移动，则得到的点群为分类结果。
如权利要求9所述的人脸图像聚类搜索方法，其特征在于，于所述步骤B3之后，所述方法还包括步骤：

根据预先确定的样本图像与人脸ID的映射关系，确定所述搜索到的样本图像对应的人脸ID，将该确定的人脸ID作为识别结果。
如权利要求13所述的人脸图像聚类搜索方法，其特征在于，所述预先确定的各个图像类别的中心点特征向量通过以下步骤确定：

对样本库中的每张样本图像进行人脸检测，从样本图像中确定人脸图像，并计算出确定的人脸图像的特征向量；

计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类；

对聚类后得到的各个图像类别分别采用计算公式进行计算，以得到各个图像类别各自的中心点特征向量，所述计算公式中，n表示类别中特征向量的个数，F ⁽ⁱ⁾表示第i个特征向量，X _k表示特征向量中第k个元素的值。
如权利要求14所述的人脸图像聚类搜索方法，其特征在于，所述计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类的步骤包括：

计算每个特征向量与其它特征向量之间的距离；

将距离落入预设的数值范围的特征向量归为相同图像类别；

在聚类过程中，若有特征向量未归入任意一个已有图像类别，则将该特征向量作为一个新的图像类别追加到已有图像类别，直到将所有的特征向量完成分类。
如权利要求14所述的人脸图像聚类搜索方法，其特征在于，所述计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类的步骤替换为：

a、随机在得到的特征向量中取m个特征向量作为种子点；

b、计算所有余下的特征向量分别到这m个种子点的距离，将所有余下的特征向量分别划分到其距离最近的种子点的点群；

c、计算每个点群的中心，将各个种子点移动到其所在点群的中心；

d、重复步骤b和c，直到种子点不再移动，则得到的点群为分类结果。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有人脸图像聚类搜索系统，所述人脸图像聚类搜索系统可被至少一个处理器执行，以使所述至少一个处理器执行如下步骤：

C1、对实时图像进行人脸检测以确定出实时人脸图像，计算出该实时人脸图像的特征向量；

C2、计算所述实时人脸图像的特征向量分别与预先确定的各个图像类别的中心点特征向量的距离，筛选距离小于第一阈值的中心点特征向量，将筛选出的中心点特征向量所对应的图像类别作为候选类别；

C3、在所述候选类别中找出特征向量与所述实时人脸图像的特征向量的距离最近且小于第二阈值的样本图像。
如权利要求17所述的人脸图像聚类搜索方法，其特征在于，所述预先确定的各个图像类别的中心点特征向量通过以下步骤确定：

对样本库中的每张样本图像进行人脸检测，从样本图像中确定人脸图像，并计算出确定的人脸图像的特征向量；

计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类；

对聚类后得到的各个图像类别分别采用计算公式
进行计算，以得到各个图像类别各自的中心点特征向量，所述计算公式中，n表示类别中特征向量的个数，F ⁽ⁱ⁾表示第i个特征向量，X _k表示特征向量中第k个元素的值。
如权利要求18所述的人脸图像聚类搜索方法，其特征在于，所述计算各个特征向量之间的距离，根据特征向量之间的距离对所有的特征向量进行聚类的步骤包括：

计算每个特征向量与其它特征向量之间的距离；

将距离落入预设的数值范围的特征向量归为相同图像类别；

在聚类过程中，若有特征向量未归入任意一个已有图像类别，则将该特征向量作为一个新的图像类别追加到已有图像类别，直到将所有的特征向量完成分类。
如权利要求17所述的人脸图像聚类搜索方法，其特征在于，于所述步骤C3之后，所述人脸图像聚类搜索系统还被所述至少一个处理器执行，以实现如下步骤：

根据预先确定的样本图像与人脸ID的映射关系，确定所述搜索到的样本图像对应的人脸ID，将该确定的人脸ID作为识别结果。