WO2020134819A1

WO2020134819A1 - 一种搜索人脸的方法及相关装置

Info

Publication number: WO2020134819A1
Application number: PCT/CN2019/121362
Authority: WO
Inventors: 魏新明; 胡文泽; 王孝宇
Original assignee: 深圳云天励飞技术有限公司
Priority date: 2018-12-29
Filing date: 2019-11-27
Publication date: 2020-07-02
Also published as: CN109753577B; CN109753577A

Abstract

一种搜索人脸的方法及相关装置，其中，所述方法包括：获取预设的α个中心向量，其中，α>0（101）；获取测试样本的测试特征，对所述测试特征与所述α个中心向量进行计算得到α个第一相似度（102）；依据从大到小规则对所述α个第一相似度进行排序得到序列，确定所述序列中的前β个第一相似度为β个第一目标相似度（103）；确定所述β个第一目标相似度对应β个人脸样本子集，获取所述β个人脸样本子集包含的γ个人脸样本特征，对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度（104）；提取所述γ个第二相似度中的最大值，确定所述最大值对应的人脸样本为目标人脸样本（105）。所述方法具有搜索速度快且准确度高的优点。

Description

一种搜索人脸的方法及相关装置

本申请要求于2018年12月29日提交中国专利局，申请号为201811641859.5、发明名称为“一种搜索人脸的方法及相关装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本本申请涉及智能技术领域，具体涉及一种搜索人脸的方法及相关装置。

背景技术

随着科技的发展，人脸技术逐渐成熟，人脸搜索技术的应用逐渐广泛，在许多情况下，需要在海量的照片中搜索出目标照片。现有的在海量照片中搜索出目标照片的方法，不仅速度较慢且准确度也比较低。

发明内容

本申请实施例提供了一种搜索人脸的方法及相关装置，可以提高在海量数据集中搜索目标人脸的搜索速度，并且提高目标人脸搜索的准确度。

本申请实施例第一方面提供了一种搜索人脸的方法，包括：

获取预设的α个中心向量，其中，α>0；

获取测试样本的测试特征，对所述测试特征与所述α个中心向量进行计算得到α个第一相似度；

依据从大到小规则对所述α个第一相似度进行排序得到序列，确定所述序列中的前β个第一相似度为β个第一目标相似度；

确定所述β个第一目标相似度对应β个人脸样本子集，获取所述β个人脸样本子集包含的γ个人脸样本特征，对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度；

提取所述γ个第二相似度中的最大值，确定所述最大值对应的人脸样本为目标人脸样本。

本申请实施例第二方面提供了一种搜索人脸的装置，包括：

获取单元，用于获取预设的α个中心向量，其中，α>0；获取测试人脸的测试特征；

计算单元，用于对所述测试特征与所述α个中心向量进行计算得到α个第一相似度；依据从大到小规则对所述α个第一相似度进行排序得到序列，确定所述序列中的前β个第一相似度为β个第一目标相似度；确定所述β个第一目标相似度对应β个人脸样本子集，获取所述β个人脸样本子集包含的γ个人脸样本特征，对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度；

确定单元，用于提取所述γ个第二相似度中的最大值，确定所述最大值对应的人脸样本为目标人脸样本。

本申请第三方面提供了一种人脸采集装置，包括：处理器和存储器；以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置成由所述处理器执行，所述程序包括用于如第一方面中所描述的部分或全部步骤的指令。

第四方面，本申请实施例提供了一种计算机可读存储介质，其中，所述计算机可读存储介质用于存储计算机程序，其中，所述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤的指令。

第五方面，本申请实施例提供了一种计算机程序产品，其中，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

实施本申请实施例，具有如下有益效果：

可以看出，通过本申请实施例所描述的搜索人脸的方法及相关装置，获取预设的α个中心向量，其中，α>0；获取测试人脸的测试特征，对所述测试特征与所述α个中心向量进行计算得到α个第一相似度；依据从大到小规则对所述α个第一相似度进行排序得到序列，确定所述序列中的前β个第一相似度为β个第一目标相似度；确定所述β个第一目标相似度对应β个人脸样本子集，获取所述β个人脸样本子集包含的γ个人脸样本特征，对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度；提取所述γ个第二相似度中的最大值，确定所述最大值对应的人脸样本为目标人脸样本。如此，可首先与中心向量进行相似度计算，选择相似度较高的人脸样本子集，避免遍历搜索整个样本库，提高一阶近似搜索的搜索速度；通过获取相似度高的人脸样本子集中的人脸样本特征，计算相似度高的人脸样本子集中的人脸样本特征与测试样本的第二相似度，选取第二相似度中的最大值对应的人脸样本为目标人脸样本，实现二阶重排计算，提高了人脸搜索的准确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种搜索人脸方法的实施例流程示意图；

图2是本申请实施例提供的一种针对人脸样本集的处理方法的实施例流程示意图；

图3是本申请实施例提供的一种计算第二相似度的方法的实施例流程示意图；

图4是本申请实施例提供的一种搜索人脸的装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了更好的理解本申请实施例提供的一种搜索人脸的方法及相关装置，下面先对本申请实施例适用的人脸采集方法的系统构架进行描述。参阅图1，图1是本申请实施例提供的一种搜索人脸方法的实施例流程示意图，本实施例中所描述的搜索人脸的方法，包括以下步骤：

步骤101、获取预设的α个中心向量，其中，α>0。

可选的，在获取预设的α个中心向量之前，从数据库中获取人脸样本集，其中，人脸样本集可以包括：预先设定的人脸样本集、通过电子设备采集到的人脸样本数据构成的人脸样本集，在此不作限定，将人脸样本集发送至卷积神经网络模型，该卷积神经网络用于提取人脸样本集的特征，将人脸样本集作为卷积神经网络模型的输入，得到人脸样本集对应的人脸样本特征集，对人脸样本特征集中的人脸样本特征进行乘积量化得到乘积量化后的人脸样本特征，将人脸样本特征更新为乘积量化后的人脸样本特征，乘积量化用于对特征进行压缩。

进一步地，获取预先设置好的人脸样本子集数α，该人脸样本子集数α用于确定人脸样本集被划分的数量，从人脸样本特征集中包含的第一个人脸样本特征开始，对人脸样本特征执行划分循环，直至对人脸样本特征集中的最后一个人脸样本特征执行划分循环结束，得到α个人脸样本子集，获取划分循环结束后的α个聚类中心X _i，确定α个聚类中心X _i为α个人脸样本子集对应的α个中心向量，将α个中心向量与α个中心向量对应的α个人脸样本子集存储至数据库。

可选的，确定α个聚类中心X _i为α个人脸样本子集对应的α个中心向量之后，对α个人脸样本子集执行残差计算动作直至α个人脸样本子集遍历结束，即从α个人脸样本子集中的第一个人脸样本子集中的第一个人脸样本特征开始，直至第α个人脸样本子集中的最后一个人脸样本特征结束，得到α个人脸样本子集对应的α个残差向量集；依据α个人脸样本子集与α个残差向量集，建立人脸样本子集与残差向量的一一映射关系，并将该一一映射关系存储至数据库中。

可选的，从数据库中获取α个中心向量，从数据库中获取α个中心向量对应的α个人脸样本子集。

步骤102、获取测试样本的测试特征，对所述测试特征与所述α个中心向量进行计算得到α个第一相似度。

可选的，获取测试样本，将测试样本发送至卷积神经网络模型，该卷积神经网络用于提取测试样本的特征，将测试样本作为卷积神经网络模型的输入，得到测试样本对应的测试特征，对测试特征进行乘积量化运算得到乘积量化后的测试特征，将测试特征更新为乘积量化后的测试特征，乘积量化运算用于对特征进行压缩，依据测试特征与α个中心向量计算α个第一相似度，在本申请提供的一种实施例中，若测试样本为N维向量，中心向量也为N维向量，测试特征q(x)为测试样本的中心点，q(z)为中心向量的中心点，u _N(x)为测试样本第N维向量的中心点，u _N(z)为残差向量第N维向量的中心点，则第一相似度s的计算可以包括：

在其他实施例中，第一相似度的计算可以为其他计算方法。

步骤103、依据从大到小规则对所述α个第一相似度进行排序得到序列，确定所述序列中的前β个第一相似度为β个第一目标相似度。

可选的，获取预设数值β，其中0<β<α，依据从大到小的规则对α个第一相似度进行排序，得到从大到小排列的第一相似度序列，确定前β个第一相似度为β个第一目标相似度。

步骤104、确定所述β个第一目标相似度对应β个人脸样本子集，获取所述β个人脸样本子集包含的γ个人脸样本特征，对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度。

可选的，获取所述β个人脸样本子集对应的β个中心向量，获取人脸样本子集与残差向量的映射关系，在该映射关系中查询β个人脸样本子集，获取该β个人脸样本子集对应的β个残差向量集，获取β个人脸样本子集中包含的γ个人脸样本特征，将γ个人脸样本特征以β个残差向量中包含的γ个残差向量与γ个残差向量对应的中心向量之和进行表示，获取测试样本的测试特征，计算测试特征与γ个残差向量对应的γ个残差相似度，计算γ个残差相似度与γ个残差相似度对应的中心向量对应的第一相似度的和，得到γ个计算结果，确定γ个计算结果为γ个人脸样本特征对应的γ个第二相似度。

步骤105、提取所述γ个第二相似度中的最大值，确定所述最大值对应的人脸样本为目标人脸样本。

可选的，提取γ个第二相似度中的最大值，确定该最大值对应的人脸样本特征为目标人脸样本特征，确定该目标人脸样本特征对应的人脸样本为目标人脸样本。

可以看出，通过本申请实施例，通过获取预设的α个中心向量，其中，α>0，获取测试样本的测试特征，对所述测试特征与所述α个中心向量进行计算得到α个第一相似度，依据从大到小规则对所述α个第一相似度进行排序得到序列，确定所述序列中的前β个第一相似度为β个第一目标相似度，确定所述β个第一目标相似度对应β个人脸样本子集，获取所述β个人脸样本子集包含的γ个人脸样本特征，对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度，提取所述γ个第二相似度中的最大值，确定所述最大值对应的人脸样本为目标人脸样本，如此，可通过获取样本集中每个区域的中心向量，计算测试样本与中心向量的相似度实现一阶近似搜索，避免了对整个样本集的遍历，然后获取相似度高的中心向量对应的人脸样本子集中的人脸样本特征与测试样本进行相似度计算实现二阶重排，提高人脸搜索的准确性，对高维度的人脸样本特征与测试特征进行乘积量化压缩向量，减小存储空间，并且提高计算速率。

请参阅图2，图2是本申请实施例提供的一种针对人脸样本集的处理方法的实施例流程示意图，如图2所示，该方法包括：

步骤201、获取人脸样本集与所述人脸样本集对应的人脸样本特征集。

可选的，从数据库中获取人脸样本集，其中，人脸样本集可以包括：预先设定的人脸样本集、通过电子设备采集到的人脸样本数据构成的人脸样本集，在此不作限定，将人脸样本集发送至卷积神经网络模型，该卷积神经网络用于提取人脸样本集的特征，将人脸样本集作为卷积神经网络模型的输入，得到人脸样本集对应的人脸样本特征集，对人脸样本特征集中的人脸样本特征进行乘积量化得到乘积量化后的人脸样本特征，将人脸样本特征更新为乘积量化后的人脸样本特征，乘积量化用于对特征进行压缩。

步骤202、获取人脸样本子集数α，其中α>0，对人脸样本特征集中的人脸样本特征执行划分循环至人脸样本特征集遍历结束，得到α个人脸样本子集。

可选的，获取预先设置好的人脸样本子集数α，该人脸样本子集数α用于确定人脸样本集被划分的数量，从人脸样本特征集中包含的第一个人脸样本特征开始，对人脸样本特征执行划分循环，直至对人脸样本特征集中的最后一个人脸样本特征执行划分循环结束，得到α个人脸样本子集。

其中，该划分循环包括：按照预设的条件在所述人脸样本特征集中确定α个特征向量，该α个特征向量为α个聚类中心X _i，其中，i∈{1，2，...，α}；获取该样本特征集中的人脸样本Y，若人脸样本Y为N维向量，α个聚类中心X _i也为N维向量，通过计算人脸样本Y与α个聚类中心X _i对应的α个距离D _i；获取α个距离D _i中的最小值D _min，确定该人脸样本特征Y属于最小值D _min对应的人脸样本子集，则将人脸样本特征Y添加至最小值D _min对应的人脸样本子集中，计算该人脸样本子集的中心向量，将该人脸样本子集对应的聚类中心更新为该中心向量，其中，中心向量的计算方式可以包括：人脸样本子集中包含的人脸样本特征的均值，依据更新后的α个聚类中心X _i对下一个人脸样本进行划分。

步骤203、计算所述α个人脸样本子集对应的α个中心向量。

可选的，获取划分循环结束后的α个聚类中心X _i，确定α个聚类中心X _i为α个人脸样本子集对应的α个中心向量。

步骤204、对所述α个人脸样本子集执行残差计算动作直至所述α个人脸样本子集遍历结束，得到所述α个人脸样本子集对应的α个残差向量集。

可选的，对α个人脸样本子集执行残差计算动作直至α个人脸样本子集遍历结束，即从α个人脸样本子集中的第一个人脸样本子集中的第一个人脸样本特征开始，直至第α个人脸样本子集中的最后一个人脸样本特征结束，得到α个人脸样本子集对应的α个残差向量集。

其中，该残差计算动作包括：获取人脸样本子集包含的人脸样本特征X与人脸样本子集对应的中心向量q _i；将人脸样本特征X与中心向量q代入公式x _r＝x-q _i进行计算结果x _r；确定人脸样本特征X对应的残差向量X _r为计算结果x _r；例如，对第一个人脸样本子集执行残差计算，首先获取第一个人脸样本子集对应的中心向量为q ₁；由第一个人脸样本子集中的第一个人脸样本特征开始，获取第一个人脸样本特征为x ₁，计算x _r1＝x _r-q _r得到计算结果x _r1，即第一个人脸样本特征的残差向量为x _r1，将x _r1存储在第一个残差向量集的第一个位置，接着以同样的方法计算第二个人脸样本特征对应的残差向量，直至将第一个人脸样本子集中的最后一个人脸样本对应的残差向量计算完毕，得到第一个人脸样本子集对应的第一个残差向量集；接着计算第二个人脸样本子集对应的第二个残差向量集，直至第α个人脸样本子集对应的第α个残差向量集计算完毕，残差计算动作执行结束。

步骤205、依据所述α个人脸样本子集与所述α个残差向量集建立人脸样本子集与残差向量的映射关系，将所述人脸样本子集与残差向量的映射关系存储至数据库。

可选的，依据α个人脸样本子集与α个残差向量集，建立人脸样本子集与残差向量的一一映射关系，并将该一一映射关系存储至数据库中。

可以看出，通过获取人脸样本集与所述人脸样本集对应的人脸样本特征集，获取人脸样本子集数α，其中α>0，对人脸样本特征集中的人脸样本特征执行划分循环至人脸样本特征集遍历结束，得到α个人脸样本子集，计算所述α个人脸样本子集对应的α个中心向量，对所述α个人脸样本子集执行残差计算动作直至所述α个人脸样本子集遍历结束，得到所述α个人脸样本子集对应的α个残差向量集，依据所述α个人脸样本子集与所述α个残差向量集建立人脸样本子集与残差向量的映射关系，将所述人脸样本子集与残差向量的映射关系存储至数据库，如此，可通过对人脸样本集进行划分为多个人脸样本子集，计算人脸样本子集的中心向量近似替代人脸样本子集，通过将测试特征与中心向量进行计算得到相似度，避免了令测试特征与整个人脸样本集进行计算，加快了一阶搜索速度，计算每个人脸样本特征的残差向量，通过残差向量与中心向量之和表示人脸样本特征，为二阶重排的快速搜索与无损搜索提供条件。

请参阅图3，图3是本申请实施例提供的一种计算第二相似度的方法的实施例流程示意图，如图3所示，所述方法包括以下步骤：

步骤301、获取所述β个人脸样本子集对应的β个中心向量。

步骤302、依据人脸样本子集与残差向量的映射关系确定所述β个人脸样本子集对应的β个残差向量集。

可选的，获取人脸样本子集与残差向量的映射关系，在该映射关系中查询β个人脸样本子集，获取该β个人脸样本子集对应的β个残差向量集，其中，β个残差向量集与β个中心向量相加得到的值等于β个人脸样本子集的值。

步骤303、确定所述β个人脸样本子集中包含的γ个人脸样本特征为所述β个残差向量中包含的γ个残差向量与所述γ个残差向量对应的中心向量之和。

可选的，获取β个人脸样本子集中包含的γ个人脸样本特征，将γ个人脸样本特征以β个残差向量中包含的γ个残差向量与γ个残差向量对应的中心向量之和进行表示，即假设一个人脸样本特征为x ₁，该人脸样本特征的残差向量为x _r1，该人脸样本特征属于第一人脸样本子集，则该残差向量属于第一残差向量集，则该残差向量对应的中心向量为第一中心向量q ₁，则该人脸样本特征可以表示为x ₁＝x _r1+q ₁。

步骤304、对所述测试样本与所述γ个残差向量进行计算得到γ个残差相似度。

可选的，获取测试样本的测试特征，计算测试特征与γ个残差向量对应的γ个残差相似度，在本申请提供的一种实施例中，若测试样本为N维向量，残差向量也为N维向量，测试特征q(x)为测试样本的中心点，q(y)为残差向量的中心点，u _N(x)为测试样本第N维向量的中心点，u _N(y)为残差向量第N维向量的中心点，则残差相似度d′的计算可以包括：

在其他实施例中，测试特征与残差向量的相似度计算可以为其他计算方法。

步骤305、计算所述γ个残差相似度与所述γ个残差相似度对应的中心向量对应的第一相似度之和得到所述γ个第二相似度。

可选的，计算γ个残差相似度与γ个残差相似度对应的中心向量对应的第一相似度的和，得到γ个计算结果，确定γ个计算结果为γ个人脸样本特征对应的γ个第二相似度；例如，一个残差相似度为d′，该残差相似度对应的中心向量为第一中心向量q ₁，第一中心向量q ₁对应的第一相似度为s ₁，则该人脸样本特征对应的第二相似度o ₁＝s ₁+d′。

由此可见，通过获取所述β个人脸样本子集对应的β个中心向量，依据人脸样本子集与残差向量的映射关系确定所述β个人脸样本子集对应的β个残差向量集，确定所述β个人脸样本子集中包含的γ个人脸样本特征为所述β个残差向量中包含的γ个残差向量与所述γ个残差向量对应的中心向量之和，对所述测试样本与所述γ个残差向量进行计算得到γ个残差相似度，计算所述γ个残差相似度与所述γ个残差相似度对应的中心向量对应的第一相似度之和得到所述γ个第二相似度，如此，通过残差向量与中心向量表示人脸样本特征，用残差相似度与第一相似度相加得到第二相似度，避免了人脸样本特征原始数据与测试样本特征的直接计算，减少了第二相似度的计算量，残差相似度解决了近似搜索中的近似损失问题。

请参阅图4，图4是本申请实施例提供的一种搜索人脸的装置400的结构示意图。本实施例中所描述的搜索人脸的装置，包括：获取单元401、计算单元402、推送单元403。

获取单元401，用于获取预设的α个中心向量，其中，α>0；获取测试人脸的测试特征；

计算单元402，用于对所述测试特征与所述α个中心向量进行计算得到α个第一相似度；依据从大到小规则对所述α个第一相似度进行排序得到序列，确定所述序列中的前β个第一相似度为β个第一目标相似度；确定所述β个第一目标相似度对应β个人脸样本子集，获取所述β 个人脸样本子集包含的γ个人脸样本特征，对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度；

确定单元403，用于提取所述γ个第二相似度中的最大值，确定所述最大值对应的人脸样本为目标人脸样本。

在一可能的示例中，用于获取预设的α个中心向量，其中，α>0；获取测试人脸的测试特征，获取单元401，具体用于：从数据库中获取预设的α个中心向量，从数据库中获取α个中心向量对应的α个人脸样本子集，获取测试样本，将测试样本发送至卷积神经网络模型，该卷积神经网络用于提取测试样本的特征，将测试样本作为卷积神经网络模型的输入，得到测试样本对应的测试特征。

在一可能的示例中，用于对所述测试特征与所述α个中心向量进行计算得到α个第一相似度；依据从大到小规则对所述α个第一相似度进行排序得到序列，确定所述序列中的前β个第一相似度为β个第一目标相似度；确定所述β个第一目标相似度对应β个人脸样本子集，获取所述β个人脸样本子集包含的γ个人脸样本特征，对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度，计算单元402，具体用于：获取预设数值β，其中0<β<α，依据从大到小的规则对α个第一相似度进行排序，得到从大到小排列的第一相似度序列，确定前β个第一相似度为β个第一目标相似度；获取所述β个人脸样本子集对应的β个中心向量，获取人脸样本子集与残差向量的映射关系，在该映射关系中查询β个人脸样本子集，获取该β个人脸样本子集对应的β个残差向量集，获取β个人脸样本子集中包含的γ个人脸样本特征，将γ个人脸样本特征以β个残差向量中包含的γ个残差向量与γ个残差向量对应的中心向量之和进行表示，获取测试样本的测试特征，计算测试特征与γ个残差向量对应的γ个残差相似度，计算γ个残差相似度与γ个残差相似度对应的中心向量对应的第一相似度的和，得到γ个计算结果，确定γ个计算结果为γ个人脸样本特征对应的γ个第二相似度。

在一可能的示例中，用于提取所述γ个第二相似度中的最大值，确定所述最大值对应的人脸样本为目标人脸样本，确定单元403，具体用于：提取γ个第二相似度中的最大值，确定该最大值对应的人脸样本特征为目标人脸样本特征，确定该目标人脸样本特征对应的人脸样本为目标人脸样本。

可以看出，通过本申请实施例所描述的搜索人脸的装置，通过获取预设的α个中心向量，其中，α>0，获取测试样本的测试特征，对所述测试特征与所述α个中心向量进行计算得到α个第一相似度，依据从大到小规则对所述α个第一相似度进行排序得到序列，确定所述序列中的前β个第一相似度为β个第一目标相似度，确定所述β个第一目标相似度对应β个人脸样本子集，获取所述β个人脸样本子集包含的γ个人脸样本特征，对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度，提取所述γ个第二相似度中的最大值，确定所述最大值对应的人脸样本为目标人脸样本，如此，可通过获取样本集中每个区域的中心向量，计算测试样本与中心向量的相似度实现一阶近似搜索，避免了对整个样本集的遍历，然后获取相似度高的中心向量对应的人脸样本子集中的人脸样本特征与测试样本进行相似度计算实现二阶重排，提高人脸搜索的准确性。

本申请实施例还提供一种计算机存储介质，其中，该计算机存储介质可存储有程序，该程序执行时包括上述方法实施例中记载的任何一种搜索人脸的方法的部分或全部步骤。

尽管在此结合各实施例对本申请进行了描述，然而，在实施所要求保护的本申请过程中，本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书，可理解并实现所述公开实施例的其他变化。在权利要求中，“包括”(comprising)一词不排除其他组成部分或步骤，“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施，但这并不表示这些措施不能组合起来产生良好的效果。

本领域技术人员应明白，本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机程序存储/分布在合适的介质中，与其它硬件一起提供或作为硬件的一部分，也可以采用其他分布形式，如通过Internet或其它有线或无线电信系统。

本申请是参照本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

Claims

一种搜索人脸的方法，其特征在于，所述方法包括：

获取预设的α个中心向量，其中，α>0；

获取测试样本的测试特征，对所述测试特征与所述α个中心向量进行计算得到α个第一相似度；

依据从大到小规则对所述α个第一相似度进行排序得到序列，确定所述序列中的前β个第一相似度为β个第一目标相似度；

确定所述β个第一目标相似度对应β个人脸样本子集，获取所述β个人脸样本子集包含的γ个人脸样本特征，对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度；

提取所述γ个第二相似度中的最大值，确定所述最大值对应的人脸样本为目标人脸样本。
根据权利要求1所述的方法，其特征在于，所述获取所述β个人脸样本子集包含的γ个人脸样本特征，对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度包括：

获取所述β个人脸样本子集对应的β个中心向量；

依据人脸样本子集与残差向量的映射关系确定所述β个人脸样本子集对应的β个残差向量集；

确定所述β个人脸样本子集中包含的γ个人脸样本特征为所述β个残差向量集中包含的γ个残差向量与所述γ个残差向量对应的中心向量之和；

依据所述γ个残差向量与所述γ个残差向量对应的中心向量计算所述γ个第二相似度。
根据权利要求2所述的方法，其特征在于，所述依据所述γ个残差向量与所述γ个残差向量对应的中心向量计算所述γ个第二相似度包括：

对所述测试样本与所述γ个残差向量进行计算得到γ个残差相似度；

计算所述γ个残差相似度与所述γ个残差相似度对应的中心向量对应的第一相似度之和得到所述γ个第二相似度。
根据权利要求1所述的方法，其特征在于，所述获取预设的α个中心向量之前还包括：

获取人脸样本集与所述人脸样本集对应的人脸样本特征集，对人脸样本特征集进行划分得到人脸样本子集，计算所述人脸样本子集的中心向量；

获取人脸样本子集数α，其中，α>0；

对人脸样本特征集中的人脸样本特征执行划分循环至人脸样本特征集遍历结束，得到α个人脸样本子集；

所述划分循环包括：

从所述人脸样本特征集中确定α个聚类中心X _i，其中，i∈{1，2，...，α}；

计算所述特征集中的人脸样本特征Y与所述α个聚类中心X _i对应的α个距离D _i；

确定所述α个距离D _i中的最小值D _min，确定所述人脸样本特征Y属于所述最小值D _min对应的人脸样本子集；

依据所述人脸样本特征Y更新所述α个聚类中心。
根据权利要求4所述的方法，其特征在于，所述得到α个人脸样本子集之后还包括：

获取所述α个聚类中心X _i；

确定所述α个聚类中心X _i为所述α个人脸样本子集的中心向量q _i。
根据权利要求5所述的方法，其特征在于，所述方法还包括：

对所述α个人脸样本子集执行残差计算动作直至所述α个人脸样本子集遍历结束，得到所述α个人脸样本子集对应的α个残差向量集；

依据所述α个人脸样本子集与所述α个残差向量集建立人脸样本子集与残差向量的映射关系，将所述人脸样本子集与残差向量的映射关系存储至数据库；

所述残差计算包括：

获取所述人脸样本子集包含的人脸样本特征X与所述人脸样本子集对应的中心向量q _i；

将所述人脸样本特征X与所述中心向量q代入公式x _r＝x-q _i进行计算结果x _r；

确定所述人脸样本特征X对应的残差向量X _r为所述计算结果x _r。
一种搜索人脸的装置，其特征在于，所述装置包括：

获取单元，用于获取预设的α个中心向量，其中，α>0；获取测试人脸的测试特征；

计算单元，用于对所述测试特征与所述α个中心向量进行计算得到α个第一相似度；依据从大到小规则对所述α个第一相似度进行排序得到序列，确定所述序列中的前β个第一相似度为β个第一目标相似度；确定所述β个第一目标相似度对应β个人脸样本子集，获取所述β个人脸样本子集包含的γ个人脸样本特征，对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度；

确定单元，用于提取所述γ个第二相似度中的最大值，确定所述最大值对应的人脸样本为目标人脸样本。
根据权利要求7所述的装置，其特征在于，在所述获取所述β个人脸样本子集包含的γ个人脸样本特征，对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度方面，所述计算单元具体用于：

获取所述β个人脸样本子集对应的β个中心向量；

依据所述人脸样本子集与残差向量的映射关系确定所述β个人脸样本子集对应的β个残差向量集；

确定所述β个人脸样本子集为所述β个残差向量集与所述β个中心向量的和；

确定所述β个人脸样本子集中包含的γ个人脸样本特征为所述β个残差向量；

对所述测试样本与所述γ个残差向量进行计算得到γ个残差相似度；

计算所述γ个残差相似度与所述γ个残差相似度对应的中心向量对应的第一相似度之和得到所述γ个第二相似度。集中包含的γ个残差向量与所述γ个残差向量对应的中心向量之和；

依据所述γ个残差向量与所述γ个残差向量对应的中心向量计算所述γ个第二相似度。
一种搜索人脸的装置，其特征在于，包括处理器、存储器，所述存储器用于存储一个或多个程序，并且被配置由所述处理器执行，所述程序包括用于执行如权利要求1-6任一项所述的方法中的步骤的指令。
一种计算机可读存储介质，其特征在于，存储用于电子数据交换的计算机程序，其中，所述计算机程序使得计算机执行如权利要求1-6任一项所述的方法。