CN109753577B - 一种搜索人脸的方法及相关装置 - Google Patents

一种搜索人脸的方法及相关装置 Download PDF

Info

Publication number
CN109753577B
CN109753577B CN201811641859.5A CN201811641859A CN109753577B CN 109753577 B CN109753577 B CN 109753577B CN 201811641859 A CN201811641859 A CN 201811641859A CN 109753577 B CN109753577 B CN 109753577B
Authority
CN
China
Prior art keywords
face sample
gamma
residual
beta
similarities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811641859.5A
Other languages
English (en)
Other versions
CN109753577A (zh
Inventor
魏新明
胡文泽
王孝宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Intellifusion Technologies Co Ltd
Original Assignee
Shenzhen Intellifusion Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Intellifusion Technologies Co Ltd filed Critical Shenzhen Intellifusion Technologies Co Ltd
Priority to CN201811641859.5A priority Critical patent/CN109753577B/zh
Publication of CN109753577A publication Critical patent/CN109753577A/zh
Priority to PCT/CN2019/121362 priority patent/WO2020134819A1/zh
Application granted granted Critical
Publication of CN109753577B publication Critical patent/CN109753577B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Abstract

本申请实施例提供了一种搜索人脸的方法及相关装置,其中,方法包括:获取预设的α个中心向量,其中,α>0;获取测试样本的测试特征,对所述测试特征与所述α个中心向量进行计算得到α个第一相似度;依据从大到小规则对所述α个第一相似度进行排序得到序列,确定所述序列中的前β个第一相似度为β个第一目标相似度;确定所述β个第一目标相似度对应β个人脸样本子集,获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度;提取所述γ个第二相似度中的最大值,确定所述最大值对应的人脸样本为目标人脸样本。本发明具有搜索速度快的优点。

Description

一种搜索人脸的方法及相关装置
技术领域
本申请涉及智能技术领域,具体涉及一种搜索人脸的方法及相关装置。
背景技术
随着科技的发展,人脸技术逐渐成熟,人脸搜索技术的应用逐渐广泛,在许多情况下,需要在海量的照片中搜索出目标照片。
一般情况下,在人脸数据集中搜索目标人脸采用的是主流的搜索算法,例如:近似近邻搜索、暴力搜索、基于树的搜索、基于哈希的搜素等等,但是近似近邻搜索算法在海量数据中进行搜索的时候得到的结果差,暴力搜索算法在对海量高维数据进行搜索时需要的搜索时间长,基于树的搜索算法在数据维度高的情况下性能较差,基于哈希的搜索算法在数据库样本规模大的情况下性能差,因此,现有的搜索算法中缺少一种能快速在海量人脸数据集中搜索目标人脸的算法。
发明内容
本申请实施例提供了一种搜索人脸的方法及相关装置,可以提高在海量数据集中搜索目标人脸的搜索速度,并且提高目标人脸搜索的准确度。
本申请实施例第一方面提供了一种搜索人脸的方法,包括:
获取预设的α个中心向量,其中,α>0;
获取测试样本的测试特征,对所述测试特征与所述α个中心向量进行计算得到α个第一相似度;
依据从大到小规则对所述α个第一相似度进行排序得到序列,确定所述序列中的前β个第一相似度为β个第一目标相似度;
确定所述β个第一目标相似度对应β个人脸样本子集,获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度;
提取所述γ个第二相似度中的最大值,确定所述最大值对应的人脸样本为目标人脸样本。
本申请实施例第二方面提供了一种搜索人脸的装置,包括:
获取单元,用于获取预设的α个中心向量,其中,α>0;获取测试人脸的测试特征;
计算单元,用于对所述测试特征与所述α个中心向量进行计算得到α个第一相似度;依据从大到小规则对所述α个第一相似度进行排序得到序列,确定所述序列中的前β个第一相似度为β个第一目标相似度;确定所述β个第一目标相似度对应β个人脸样本子集,获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度;
确定单元,用于提取所述γ个第二相似度中的最大值,确定所述最大值对应的人脸样本为目标人脸样本。
本申请第三方面提供了一种人脸采集装置,包括:处理器和存储器;以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置成由所述处理器执行,所述程序包括用于如第一方面中所描述的部分或全部步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,所述计算机可读存储介质用于存储计算机程序,其中,所述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤的指令。
第五方面,本申请实施例提供了一种计算机程序产品,其中,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,具有如下有益效果:
可以看出,通过本申请实施例所描述的搜索人脸的方法及相关装置,获取预设的α个中心向量,其中,α>0;获取测试人脸的测试特征,对所述测试特征与所述α个中心向量进行计算得到α个第一相似度;依据从大到小规则对所述α个第一相似度进行排序得到序列,确定所述序列中的前β个第一相似度为β个第一目标相似度;确定所述β个第一目标相似度对应β个人脸样本子集,获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度;提取所述γ个第二相似度中的最大值,确定所述最大值对应的人脸样本为目标人脸样本。如此,可首先与中心向量进行相似度计算,选择相似度较高的人脸样本子集,避免遍历搜索整个样本库,提高一阶近似搜索的搜索速度;通过获取相似度高的人脸样本子集中的人脸样本特征,计算相似度高的人脸样本子集中的人脸样本特征与测试样本的第二相似度,选取第二相似度中的最大值对应的人脸样本为目标人脸样本,实现二阶重排计算,提高了人脸搜索的准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种搜索人脸方法的实施例流程示意图;
图2是本申请实施例提供的一种针对人脸样本集的处理方法的实施例流程示意图;
图3是本申请实施例提供的一种计算第二相似度的方法的实施例流程示意图;
图4是本申请实施例提供的一种搜索人脸的装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了更好的理解本申请实施例提供的一种搜索人脸的方法及相关装置,下面先对本申请实施例适用的人脸采集方法的系统构架进行描述。参阅图1,图1是本申请实施例提供的一种搜索人脸方法的实施例流程示意图,本实施例中所描述的搜索人脸的方法,包括以下步骤:
步骤101、获取预设的α个中心向量,其中,α>0。
可选的,在获取预设的α个中心向量之前,从数据库中获取人脸样本集,其中,人脸样本集可以包括:预先设定的人脸样本集、通过电子设备采集到的人脸样本数据构成的人脸样本集,在此不作限定,将人脸样本集发送至卷积神经网络模型,该卷积神经网络用于提取人脸样本集的特征,将人脸样本集作为卷积神经网络模型的输入,得到人脸样本集对应的人脸样本特征集,对人脸样本特征集中的人脸样本特征进行乘积量化得到乘积量化后的人脸样本特征,将人脸样本特征更新为乘积量化后的人脸样本特征,乘积量化用于对特征进行压缩。
进一步地,获取预先设置好的人脸样本子集数α,该人脸样本子集数α用于确定人脸样本集被划分的数量,从人脸样本特征集中包含的第一个人脸样本特征开始,对人脸样本特征执行划分循环,直至对人脸样本特征集中的最后一个人脸样本特征执行划分循环结束,得到α个人脸样本子集,获取划分循环结束后的α个聚类中心Xi,确定α个聚类中心Xi为α个人脸样本子集对应的α个中心向量,将α个中心向量与α个中心向量对应的α个人脸样本子集存储至数据库。
可选的,确定α个聚类中心Xi为α个人脸样本子集对应的α个中心向量之后,对α个人脸样本子集执行残差计算动作直至α个人脸样本子集遍历结束,即从α个人脸样本子集中的第一个人脸样本子集中的第一个人脸样本特征开始,直至第α个人脸样本子集中的最后一个人脸样本特征结束,得到α个人脸样本子集对应的α个残差向量集;依据α个人脸样本子集与α个残差向量集,建立人脸样本子集与残差向量的一一映射关系,并将该一一映射关系存储至数据库中。
可选的,从数据库中获取α个中心向量,从数据库中获取α个中心向量对应的α个人脸样本子集。
步骤102、获取测试样本的测试特征,对所述测试特征与所述α个中心向量进行计算得到α个第一相似度。
可选的,获取测试样本,将测试样本发送至卷积神经网络模型,该卷积神经网络用于提取测试样本的特征,将测试样本作为卷积神经网络模型的输入,得到测试样本对应的测试特征,对测试特征进行乘积量化运算得到乘积量化后的测试特征,将测试特征更新为乘积量化后的测试特征,乘积量化运算用于对特征进行压缩,依据测试特征与α个中心向量计算α个第一相似度,在本申请提供的一种实施例中,若测试样本为N维向量,中心向量也为N维向量,测试特征q(x)为测试样本的中心点,q(z)为中心向量的中心点,uN(x)为测试样本第N维向量的中心点,uN(z)为残差向量第N维向量的中心点,则第一相似度s的计算可以包括:
Figure BDA0001931260260000051
在其他实施例中,第一相似度的计算可以为其他计算方法。。
步骤103、依据从大到小规则对所述α个第一相似度进行排序得到序列,确定所述序列中的前β个第一相似度为β个第一目标相似度。
可选的,获取预设数值β,其中0<β<α,依据从大到小的规则对α个第一相似度进行排序,得到从大到小排列的第一相似度序列,确定前β个第一相似度为β个第一目标相似度。
步骤104、确定所述β个第一目标相似度对应β个人脸样本子集,获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度。
可选的,获取所述β个人脸样本子集对应的β个中心向量,获取人脸样本子集与残差向量的映射关系,在该映射关系中查询β个人脸样本子集,获取该β个人脸样本子集对应的β个残差向量集,获取β个人脸样本子集中包含的γ个人脸样本特征,将γ个人脸样本特征以β个残差向量中包含的γ个残差向量与γ个残差向量对应的中心向量之和进行表示,获取测试样本的测试特征,计算测试特征与γ个残差向量对应的γ个残差相似度,计算γ个残差相似度与γ个残差相似度对应的中心向量对应的第一相似度的和,得到γ个计算结果,确定γ个计算结果为γ个人脸样本特征对应的γ个第二相似度。
步骤105、提取所述γ个第二相似度中的最大值,确定所述最大值对应的人脸样本为目标人脸样本。
可选的,提取γ个第二相似度中的最大值,确定该最大值对应的人脸样本特征为目标人脸样本特征,确定该目标人脸样本特征对应的人脸样本为目标人脸样本。
可以看出,通过本申请实施例,通过获取预设的α个中心向量,其中,α>0,获取测试样本的测试特征,对所述测试特征与所述α个中心向量进行计算得到α个第一相似度,依据从大到小规则对所述α个第一相似度进行排序得到序列,确定所述序列中的前β个第一相似度为β个第一目标相似度,确定所述β个第一目标相似度对应β个人脸样本子集,获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度,提取所述γ个第二相似度中的最大值,确定所述最大值对应的人脸样本为目标人脸样本,如此,可通过获取样本集中每个区域的中心向量,计算测试样本与中心向量的相似度实现一阶近似搜索,避免了对整个样本集的遍历,然后获取相似度高的中心向量对应的人脸样本子集中的人脸样本特征与测试样本进行相似度计算实现二阶重排,提高人脸搜索的准确性,对高维度的人脸样本特征与测试特征进行乘积量化压缩向量,减小存储空间,并且提高计算速率。
请参阅图2,图2是本申请实施例提供的一种针对人脸样本集的处理方法的实施例流程示意图,如图2所示,该方法包括:
步骤201、获取人脸样本集与所述人脸样本集对应的人脸样本特征集。
可选的,从数据库中获取人脸样本集,其中,人脸样本集可以包括:预先设定的人脸样本集、通过电子设备采集到的人脸样本数据构成的人脸样本集,在此不作限定,将人脸样本集发送至卷积神经网络模型,该卷积神经网络用于提取人脸样本集的特征,将人脸样本集作为卷积神经网络模型的输入,得到人脸样本集对应的人脸样本特征集,对人脸样本特征集中的人脸样本特征进行乘积量化得到乘积量化后的人脸样本特征,将人脸样本特征更新为乘积量化后的人脸样本特征,乘积量化用于对特征进行压缩。
步骤202、获取人脸样本子集数α,其中α>0,对人脸样本特征集中的人脸样本特征执行划分循环至人脸样本特征集遍历结束,得到α个人脸样本子集。
可选的,获取预先设置好的人脸样本子集数α,该人脸样本子集数α用于确定人脸样本集被划分的数量,从人脸样本特征集中包含的第一个人脸样本特征开始,对人脸样本特征执行划分循环,直至对人脸样本特征集中的最后一个人脸样本特征执行划分循环结束,得到α个人脸样本子集。
其中,该划分循环包括:按照预设的条件在所述人脸样本特征集中确定α个特征向量,该α个特征向量为α个聚类中心Xi,其中,i∈{1,2,…,α};获取该样本特征集中的人脸样本Y,若人脸样本Y为N维向量,α个聚类中心Xi也为N维向量,通过计算人脸样本Y与α个聚类中心Xi对应的α个距离Di;获取α个距离Di中的最小值Dmin,确定该人脸样本特征Y属于最小值Dmin对应的人脸样本子集,则将人脸样本特征Y添加至最小值Dmin对应的人脸样本子集中,计算该人脸样本子集的中心向量,将该人脸样本子集对应的聚类中心更新为该中心向量,其中,中心向量的计算方式可以包括:人脸样本子集中包含的人脸样本特征的均值,依据更新后的α个聚类中心Xi对下一个人脸样本进行划分。
步骤203、计算所述α个人脸样本子集对应的α个中心向量。
可选的,获取划分循环结束后的α个聚类中心Xi,确定α个聚类中心Xi为α个人脸样本子集对应的α个中心向量。
步骤204、对所述α个人脸样本子集执行残差计算动作直至所述α个人脸样本子集遍历结束,得到所述α个人脸样本子集对应的α个残差向量集。
可选的,对α个人脸样本子集执行残差计算动作直至α个人脸样本子集遍历结束,即从α个人脸样本子集中的第一个人脸样本子集中的第一个人脸样本特征开始,直至第α个人脸样本子集中的最后一个人脸样本特征结束,得到α个人脸样本子集对应的α个残差向量集。
其中,该残差计算动作包括:获取人脸样本子集包含的人脸样本特征X与人脸样本子集对应的中心向量qi;将人脸样本特征X与中心向量q代入公式xr=x-qi进行计算结果xr;确定人脸样本特征X对应的残差向量Xr为计算结果xr;例如,对第一个人脸样本子集执行残差计算,首先获取第一个人脸样本子集对应的中心向量为q1;由第一个人脸样本子集中的第一个人脸样本特征开始,获取第一个人脸样本特征为x1,计算xr1=xr-qr得到计算结果xr1,即第一个人脸样本特征的残差向量为xr1,将xr1存储在第一个残差向量集的第一个位置,接着以同样的方法计算第二个人脸样本特征对应的残差向量,直至将第一个人脸样本子集中的最后一个人脸样本对应的残差向量计算完毕,得到第一个人脸样本子集对应的第一个残差向量集;接着计算第二个人脸样本子集对应的第二个残差向量集,直至第α个人脸样本子集对应的第α个残差向量集计算完毕,残差计算动作执行结束。
步骤205、依据所述α个人脸样本子集与所述α个残差向量集建立人脸样本子集与残差向量的映射关系,将所述人脸样本子集与残差向量的映射关系存储至数据库。
可选的,依据α个人脸样本子集与α个残差向量集,建立人脸样本子集与残差向量的一一映射关系,并将该一一映射关系存储至数据库中。
可以看出,通过获取人脸样本集与所述人脸样本集对应的人脸样本特征集,获取人脸样本子集数α,其中α>0,对人脸样本特征集中的人脸样本特征执行划分循环至人脸样本特征集遍历结束,得到α个人脸样本子集,计算所述α个人脸样本子集对应的α个中心向量,对所述α个人脸样本子集执行残差计算动作直至所述α个人脸样本子集遍历结束,得到所述α个人脸样本子集对应的α个残差向量集,依据所述α个人脸样本子集与所述α个残差向量集建立人脸样本子集与残差向量的映射关系,将所述人脸样本子集与残差向量的映射关系存储至数据库,如此,可通过对人脸样本集进行划分为多个人脸样本子集,计算人脸样本子集的中心向量近似替代人脸样本子集,通过将测试特征与中心向量进行计算得到相似度,避免了令测试特征与整个人脸样本集进行计算,加快了一阶搜索速度,计算每个人脸样本特征的残差向量,通过残差向量与中心向量之和表示人脸样本特征,为二阶重排的快速搜索与无损搜索提供条件。
请参阅图3,图3是本申请实施例提供的一种计算第二相似度的方法的实施例流程示意图,如图3所示,所述方法包括以下步骤:
步骤301、获取所述β个人脸样本子集对应的β个中心向量。
步骤302、依据人脸样本子集与残差向量的映射关系确定所述β个人脸样本子集对应的β个残差向量集。
可选的,获取人脸样本子集与残差向量的映射关系,在该映射关系中查询β个人脸样本子集,获取该β个人脸样本子集对应的β个残差向量集,其中,β个残差向量集与β个中心向量相加得到的值等于β个人脸样本子集的值。
步骤303、确定所述β个人脸样本子集中包含的γ个人脸样本特征为所述β个残差向量中包含的γ个残差向量与所述γ个残差向量对应的中心向量之和。
可选的,获取β个人脸样本子集中包含的γ个人脸样本特征,将γ个人脸样本特征以β个残差向量中包含的γ个残差向量与γ个残差向量对应的中心向量之和进行表示,即假设一个人脸样本特征为x1,该人脸样本特征的残差向量为xr1,该人脸样本特征属于第一人脸样本子集,则该残差向量属于第一残差向量集,则该残差向量对应的中心向量为第一中心向量q1,则该人脸样本特征可以表示为x1=xr1+q1
步骤304、对所述测试样本与所述γ个残差向量进行计算得到γ个残差相似度。
可选的,获取测试样本的测试特征,计算测试特征与γ个残差向量对应的γ个残差相似度,在本申请提供的一种实施例中,若测试样本为N维向量,残差向量也为N维向量,测试特征q(x)为测试样本的中心点,q(y)为残差向量的中心点,uN(x)为测试样本第N维向量的中心点,uN(y)为残差向量第N维向量的中心点,则残差相似度d′的计算可以包括:
Figure BDA0001931260260000091
在其他实施例中,测试特征与残差向量的相似度计算可以为其他计算方法。
步骤305、计算所述γ个残差相似度与所述γ个残差相似度对应的中心向量对应的第一相似度之和得到所述γ个第二相似度。
可选的,计算γ个残差相似度与γ个残差相似度对应的中心向量对应的第一相似度的和,得到γ个计算结果,确定γ个计算结果为γ个人脸样本特征对应的γ个第二相似度;例如,一个残差相似度为d′,该残差相似度对应的中心向量为第一中心向量q1,第一中心向量q1对应的第一相似度为s1,则该人脸样本特征对应的第二相似度o1=s1+d′。
由此可见,通过获取所述β个人脸样本子集对应的β个中心向量,依据人脸样本子集与残差向量的映射关系确定所述β个人脸样本子集对应的β个残差向量集,确定所述β个人脸样本子集中包含的γ个人脸样本特征为所述β个残差向量中包含的γ个残差向量与所述γ个残差向量对应的中心向量之和,对所述测试样本与所述γ个残差向量进行计算得到γ个残差相似度,计算所述γ个残差相似度与所述γ个残差相似度对应的中心向量对应的第一相似度之和得到所述γ个第二相似度,如此,通过残差向量与中心向量表示人脸样本特征,用残差相似度与第一相似度相加得到第二相似度,避免了人脸样本特征原始数据与测试样本特征的直接计算,减少了第二相似度的计算量,残差相似度解决了近似搜索中的近似损失问题。
请参阅图4,图4是本申请实施例提供的一种搜索人脸的装置400的结构示意图。本实施例中所描述的搜索人脸的装置,包括:获取单元401、计算单元402、推送单元403。
获取单元401,用于获取预设的α个中心向量,其中,α>0;获取测试人脸的测试特征;
计算单元402,用于对所述测试特征与所述α个中心向量进行计算得到α个第一相似度;依据从大到小规则对所述α个第一相似度进行排序得到序列,确定所述序列中的前β个第一相似度为β个第一目标相似度;确定所述β个第一目标相似度对应β个人脸样本子集,获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度;
确定单元403,用于提取所述γ个第二相似度中的最大值,确定所述最大值对应的人脸样本为目标人脸样本。
在一可能的示例中,用于获取预设的α个中心向量,其中,α>0;获取测试人脸的测试特征,获取单元401,具体用于:从数据库中获取预设的α个中心向量,从数据库中获取α个中心向量对应的α个人脸样本子集,获取测试样本,将测试样本发送至卷积神经网络模型,该卷积神经网络用于提取测试样本的特征,将测试样本作为卷积神经网络模型的输入,得到测试样本对应的测试特征。
在一可能的示例中,用于对所述测试特征与所述α个中心向量进行计算得到α个第一相似度;依据从大到小规则对所述α个第一相似度进行排序得到序列,确定所述序列中的前β个第一相似度为β个第一目标相似度;确定所述β个第一目标相似度对应β个人脸样本子集,获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度,计算单元402,具体用于:获取预设数值β,其中0<β<α,依据从大到小的规则对α个第一相似度进行排序,得到从大到小排列的第一相似度序列,确定前β个第一相似度为β个第一目标相似度;获取所述β个人脸样本子集对应的β个中心向量,获取人脸样本子集与残差向量的映射关系,在该映射关系中查询β个人脸样本子集,获取该β个人脸样本子集对应的β个残差向量集,获取β个人脸样本子集中包含的γ个人脸样本特征,将γ个人脸样本特征以β个残差向量中包含的γ个残差向量与γ个残差向量对应的中心向量之和进行表示,获取测试样本的测试特征,计算测试特征与γ个残差向量对应的γ个残差相似度,计算γ个残差相似度与γ个残差相似度对应的中心向量对应的第一相似度的和,得到γ个计算结果,确定γ个计算结果为γ个人脸样本特征对应的γ个第二相似度。
在一可能的示例中,用于提取所述γ个第二相似度中的最大值,确定所述最大值对应的人脸样本为目标人脸样本,确定单元403,具体用于:提取γ个第二相似度中的最大值,确定该最大值对应的人脸样本特征为目标人脸样本特征,确定该目标人脸样本特征对应的人脸样本为目标人脸样本。
可以看出,通过本申请实施例所描述的搜索人脸的装置,通过获取预设的α个中心向量,其中,α>0,获取测试样本的测试特征,对所述测试特征与所述α个中心向量进行计算得到α个第一相似度,依据从大到小规则对所述α个第一相似度进行排序得到序列,确定所述序列中的前β个第一相似度为β个第一目标相似度,确定所述β个第一目标相似度对应β个人脸样本子集,获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度,提取所述γ个第二相似度中的最大值,确定所述最大值对应的人脸样本为目标人脸样本,如此,可通过获取样本集中每个区域的中心向量,计算测试样本与中心向量的相似度实现一阶近似搜索,避免了对整个样本集的遍历,然后获取相似度高的中心向量对应的人脸样本子集中的人脸样本特征与测试样本进行相似度计算实现二阶重排,提高人脸搜索的准确性。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任何一种搜索人脸的方法的部分或全部步骤。
尽管在此结合各实施例对本申请进行了描述,然而,在实施所要求保护的本申请过程中,本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书,可理解并实现所述公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
本领域技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机程序存储/分布在合适的介质中,与其它硬件一起提供或作为硬件的一部分,也可以采用其他分布形式,如通过Internet或其它有线或无线电信系统。
本申请是参照本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种搜索人脸的方法,其特征在于,所述方法包括:
获取预设的α个中心向量,其中,α>0;
获取测试样本的测试特征,对所述测试特征与所述α个中心向量进行计算得到α个第一相似度;
依据从大到小规则对所述α个第一相似度进行排序得到序列,确定所述序列中的前β个第一相似度为β个第一目标相似度;
确定所述β个第一目标相似度对应β个人脸样本子集,获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度;
提取所述γ个第二相似度中的最大值,确定所述最大值对应的人脸样本为目标人脸样本;
所述对所述测试特征与所述α个中心向量进行计算得到α个第一相似度包括:
对所述测试特征进行乘积量化运算得到乘积量化后的测试特征;
将所述测试特征更新为所述乘积量化后的测试特征,乘积量化运算用于对特征进行压缩;
依据更新后的测试特征与α个中心向量计算α个第一相似度;
所述获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度包括:获取所述β个人脸样本子集对应的β个中心向量,获取人脸样本子集与残差向量的映射关系,在该映射关系中查询β个人脸样本子集,获取该β个人脸样本子集对应的β个残差向量集,获取β个人脸样本子集中包含的γ个人脸样本特征,将γ个人脸样本特征以β个残差向量中包含的γ个残差向量与γ个残差向量对应的中心向量之和进行表示,获取测试样本的测试特征,计算测试特征与γ个残差向量对应的γ个残差相似度,计算γ个残差相似度与γ个残差相似度对应的中心向量对应的第一相似度的和,得到γ个计算结果,确定γ个计算结果为γ个人脸样本特征对应的γ个第二相似度。
2.根据权利要求1所述的方法,其特征在于,所述获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度包括:
获取所述β个人脸样本子集对应的β个中心向量;
依据人脸样本子集与残差向量的映射关系确定所述β个人脸样本子集对应的β个残差向量集;
确定所述β个人脸样本子集中包含的γ个人脸样本特征为所述β个残差向量集中包含的γ个残差向量与所述γ个残差向量对应的中心向量之和;
依据所述γ个残差向量与所述γ个残差向量对应的中心向量计算所述γ个第二相似度。
3.根据权利要求2所述的方法,其特征在于,所述依据所述γ个残差向量与所述γ个残差向量对应的中心向量计算所述γ个第二相似度包括:
对所述测试样本与所述γ个残差向量进行计算得到γ个残差相似度;
计算所述γ个残差相似度与所述γ个残差相似度对应的中心向量对应的第一相似度之和得到所述γ个第二相似度。
4.根据权利要求1所述的方法,其特征在于,所述获取预设的α个中心向量之前还包括:
获取人脸样本集与所述人脸样本集对应的人脸样本特征集,对人脸样本特征集进行划分得到人脸样本子集,计算所述人脸样本子集的中心向量;
获取人脸样本子集数α,其中,α>0;
对人脸样本特征集中的人脸样本特征执行划分循环至人脸样本特征集遍历结束,得到α个人脸样本子集;
所述划分循环包括:
从所述人脸样本特征集中确定α个聚类中心Xi,其中,i∈{1,2,...,α};
计算所述特征集中的人脸样本特征Y与所述α个聚类中心Xi对应的α个距离Di
确定所述α个距离Di中的最小值Dmin,确定所述人脸样本特征Y属于所述最小值Dmin对应的人脸样本子集;
依据所述人脸样本特征Y更新所述α个聚类中心。
5.根据权利要求4所述的方法,其特征在于,所述得到α个人脸样本子集之后还包括:
获取所述α个聚类中心Xi
确定所述α个聚类中心Xi为所述α个人脸样本子集的中心向量qi
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
对所述α个人脸样本子集执行残差计算动作直至所述α个人脸样本子集遍历结束,得到所述α个人脸样本子集对应的α个残差向量集;
依据所述α个人脸样本子集与所述α个残差向量集建立人脸样本子集与残差向量的映射关系,将所述人脸样本子集与残差向量的映射关系存储至数据库;
所述残差计算包括:
获取所述人脸样本子集包含的人脸样本特征x与所述人脸样本子集对应的中心向量qi
将所述人脸样本特征x 与所述中心向量qi代入公式xr=x-qi进行计算而得到结果xr
确定所述人脸样本特征x 对应的残差向量x r为所述计算结果xr
7.一种搜索人脸的装置,其特征在于,所述装置包括:
获取单元,用于获取预设的α个中心向量,其中,α>0;获取测试人脸的测试特征;
计算单元,用于对所述测试特征与所述α个中心向量进行计算得到α个第一相似度;依据从大到小规则对所述α个第一相似度进行排序得到序列,确定所述序列中的前β个第一相似度为β个第一目标相似度;确定所述β个第一目标相似度对应β个人脸样本子集,获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度;
确定单元,用于提取所述γ个第二相似度中的最大值,确定所述最大值对应的人脸样本为目标人脸样本;
所述对所述测试特征与所述α个中心向量进行计算得到α个第一相似度方面,所述计算单元具体用于:
对所述测试特征进行乘积量化运算得到乘积量化后的测试特征;
将所述测试特征更新为所述乘积量化后的测试特征,乘积量化运算用于对特征进行压缩;
依据更新后的测试特征与α个中心向量计算α个第一相似度;
所述获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度方面,上述计算单元具体用于:获取所述β个人脸样本子集对应的β个中心向量,获取人脸样本子集与残差向量的映射关系,在该映射关系中查询β个人脸样本子集,获取该β个人脸样本子集对应的β个残差向量集,获取β个人脸样本子集中包含的γ个人脸样本特征,将γ个人脸样本特征以β个残差向量中包含的γ个残差向量与γ个残差向量对应的中心向量之和进行表示,获取测试样本的测试特征,计算测试特征与γ个残差向量对应的γ个残差相似度,计算γ个残差相似度与γ个残差相似度对应的中心向量对应的第一相似度的和,得到γ个计算结果,确定γ个计算结果为γ个人脸样本特征对应的γ个第二相似度。
8.根据权利要求7所述的装置,其特征在于,在所述获取所述β个人脸样本子集包含的γ个人脸样本特征,对所述测试特征与所述γ个人脸样本特征进行计算得到γ个第二相似度方面,所述计算单元具体用于:
获取所述β个人脸样本子集对应的β个中心向量;
依据所述人脸样本子集与残差向量的映射关系确定所述β个人脸样本子集对应的β个残差向量集;
确定所述β个人脸样本子集为所述β个残差向量集与所述β个中心向量的和;
确定所述β个人脸样本子集中包含的γ个人脸样本特征为所述β个残差向量;
对所述测试样本与所述γ个残差向量进行计算得到γ个残差相似度;
计算所述γ个残差相似度与所述γ个残差相似度对应的中心向量对应的第一相似度之和得到所述γ个第二相似度。
9.一种搜索人脸的装置,其特征在于,包括处理器、存储器,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-6任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-6任一项所述的方法。
CN201811641859.5A 2018-12-29 2018-12-29 一种搜索人脸的方法及相关装置 Active CN109753577B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811641859.5A CN109753577B (zh) 2018-12-29 2018-12-29 一种搜索人脸的方法及相关装置
PCT/CN2019/121362 WO2020134819A1 (zh) 2018-12-29 2019-11-27 一种搜索人脸的方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811641859.5A CN109753577B (zh) 2018-12-29 2018-12-29 一种搜索人脸的方法及相关装置

Publications (2)

Publication Number Publication Date
CN109753577A CN109753577A (zh) 2019-05-14
CN109753577B true CN109753577B (zh) 2021-07-06

Family

ID=66404493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811641859.5A Active CN109753577B (zh) 2018-12-29 2018-12-29 一种搜索人脸的方法及相关装置

Country Status (2)

Country Link
CN (1) CN109753577B (zh)
WO (1) WO2020134819A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109753577B (zh) * 2018-12-29 2021-07-06 深圳云天励飞技术有限公司 一种搜索人脸的方法及相关装置
CN110414452A (zh) * 2019-07-31 2019-11-05 中国工商银行股份有限公司 一种基于面部特征位置信息的人脸搜索方法及系统
CN110472091B (zh) * 2019-08-22 2022-01-11 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
CN110909197A (zh) * 2019-11-04 2020-03-24 深圳力维智联技术有限公司 一种高维特征的处理方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1191459A1 (en) * 2000-09-22 2002-03-27 Nightingale Technologies Ltd. Data clustering methods and applications
CN101859326A (zh) * 2010-06-09 2010-10-13 南京大学 一种图像检索方法
CN104765768A (zh) * 2015-03-09 2015-07-08 深圳云天励飞技术有限公司 海量人脸库的快速准确检索方法
CN105518668A (zh) * 2013-09-04 2016-04-20 沙祖拉公司 基于内容的图像检索

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100571813B1 (ko) * 2003-07-28 2006-04-17 삼성전자주식회사 로컬 선형변환함수를 이용한 특징벡터 추출방법과 이를이용한 영상인식방법 및 장치
US7941442B2 (en) * 2007-04-18 2011-05-10 Microsoft Corporation Object similarity search in high-dimensional vector spaces
CN103235825B (zh) * 2013-05-08 2016-05-25 重庆大学 一种基于Hadoop云计算框架的海量人脸识别搜索引擎设计方法
CN107885778B (zh) * 2017-10-12 2020-08-04 浙江工业大学 一种基于动态临近点谱聚类的个性化推荐方法
CN108319987B (zh) * 2018-02-20 2021-06-29 东北电力大学 一种基于支持向量机的过滤-封装式组合流量特征选择方法
CN109753577B (zh) * 2018-12-29 2021-07-06 深圳云天励飞技术有限公司 一种搜索人脸的方法及相关装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1191459A1 (en) * 2000-09-22 2002-03-27 Nightingale Technologies Ltd. Data clustering methods and applications
CN101859326A (zh) * 2010-06-09 2010-10-13 南京大学 一种图像检索方法
CN105518668A (zh) * 2013-09-04 2016-04-20 沙祖拉公司 基于内容的图像检索
CN104765768A (zh) * 2015-03-09 2015-07-08 深圳云天励飞技术有限公司 海量人脸库的快速准确检索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
大规模人像数据库快速检索算法的研究;李春霞;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20060915;28-30,45-47,54 *

Also Published As

Publication number Publication date
WO2020134819A1 (zh) 2020-07-02
CN109753577A (zh) 2019-05-14

Similar Documents

Publication Publication Date Title
CN109753577B (zh) 一种搜索人脸的方法及相关装置
JP7343568B2 (ja) 機械学習のためのハイパーパラメータの識別および適用
US9442929B2 (en) Determining documents that match a query
CN107391554B (zh) 高效分布式局部敏感哈希方法
CN111368133B (zh) 一种视频库的索引表建立方法、装置、服务器及存储介质
WO2018166273A1 (zh) 高维图像特征匹配方法和装置
CN111429980A (zh) 一种材料晶体结构特征的自动化获取方法
CN110825894A (zh) 数据索引建立、数据检索方法、装置、设备和存储介质
WO2016184159A1 (zh) 大数据计算的方法及系统
CN116431837B (zh) 基于大型语言模型和图网络模型的文档检索方法和装置
JP5518856B2 (ja) 改良された画像認識用の支援装置
CN108733694B (zh) 检索推荐方法和装置
CN108549696B (zh) 一种基于内存计算的时间序列数据相似性查询方法
CN113536020B (zh) 数据查询的方法、存储介质和计算机程序产品
CN110209895B (zh) 向量检索方法、装置和设备
CN111143587B (zh) 一种数据检索方法、装置及电子设备
CN110442749B (zh) 视频帧处理方法及装置
CN110795469B (zh) 基于Spark的高维序列数据相似性查询方法及系统
CN108170664B (zh) 基于重点关键词的关键词拓展方法和装置
CN111198847A (zh) 一种适用于大数据集的数据并行处理方法、装置及系统
CN116127121A (zh) 一种图像检索模型的训练方法及基于此的图像检索算法
CN114547286A (zh) 一种信息搜索方法、装置及电子设备
CN103678545A (zh) 进行网络资源聚类的方法及装置
CN117648495B (zh) 一种基于云原生向量数据的数据推送方法及系统
Xie et al. Data-dependent locality sensitive hashing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant