CN104866818A

CN104866818A - 一种用于搜索包含人脸的图片的方法和装置

Info

Publication number: CN104866818A
Application number: CN201510213317.8A
Authority: CN
Inventors: 宁京; 张雯; 王璐; 高巍; 李睿; 刘友斌
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2015-04-29
Filing date: 2015-04-29
Publication date: 2015-08-26
Anticipated expiration: 2035-04-29
Also published as: CN104866818B

Abstract

本发明提供了一种用于在计算机设备中搜索包含人脸的图片的方法，其中，该方法包括：获取样本人脸的多维特征向量到基准点的距离长度；根据所述距离长度以及多个图片中的人脸的多维特征向量到基准点的距离长度，在所述多个图片中搜索包含与所述样本人脸相匹配的人脸的图片。根据本发明的方案，能够大大提高搜索效率以及搜索的准确性，且能够减少网络资源的消耗，大大节约了存储空间和搜索时间。

Description

一种用于搜索包含人脸的图片的方法和装置

技术领域

本发明计算机技术领域，尤其涉及一种用于在计算机设备中搜索包含人脸的图片的方法和装置。

背景技术

现有技术中，通常仅能简单地通过图像中的人脸直接比对，来进行人脸搜索。然而，这种直接比对人脸的方式，需要消耗大量的计算资源，且比对准确性很低。因此，若采用该种现有技术来进行人脸搜索的方案，则搜索准确性极低，且搜索成本较高，每次搜索需要消耗的网络资源较多。

发明内容

本发明的目的是提供一种用于在计算机设备中搜索包含人脸的图片的方法和装置。

根据本发明的一个方面，提供一种获取样本人脸的多维特征向量到基准点的距离长度；

根据所述距离长度以及多个图片中的人脸的多维特征向量到基准点的距离长度，在所述多个图片中搜索包含与所述样本人脸相匹配的人脸的图片。

根据本发明的另一个方面，还提供了一种用于在计算机设备中搜索包含人脸的图片的装置，其中，该装置包括：

获取装置，用于获取样本人脸的多维特征向量到基准点的距离长度；

搜索装置，用于根据所述距离长度以及多个图片中的人脸的多维特征向量到基准点的距离长度，在所述多个图片中搜索包含与所述样本人脸相匹配的人脸的图片。

与现有技术相比，本发明具有以下优点：1)能够基于样本人脸的多维特征向量到基准点的距离长度，以及多个图片中的人脸的多维特征向量到基准点的距离长度，来对多个图片进行过滤，由于样本人脸的多维特征向量能够全面且准确地指示样本人脸的大量特征(如数百个特征)，故使得该基于距离长度进行图片过滤的方案能够有效地从多个图片中准确地搜索到包含与样本人脸较为相似的人脸的图片，从而大大增加了搜索结果的准确性；2)可在用户任意指定的多个图片中来搜索包含与样本人脸相匹配的人脸的图片，从而不需要在网络上共享的所有图片中进行搜索，也无需用户手动在多个图片中进行查找，进而大大提高了搜索效率，且大大减少了网络资源的浪费；3)可针对多个样本人脸(如用户在样本图片中指定的多个样本人脸)，来搜索包含与该多个样本人脸中的每个相匹配的人脸的图片，从而能够更好的满意用户的需求，而不限于仅能针对单个样本人脸进行搜索；4)能够将多维特征向量以及多维特征向量到基准点的距离长度转换为二进制进行存储，从而大大节省了存储空间，且图片的数量越多，该效果越明显；5)每次完成搜索之后，能够缓存本次搜索对应的样本人脸以及搜索得到的图片，以当用户针对相同的样本人脸进行再次搜索时，能够直接获取缓存的图片，从而能够加快搜索速度，且大大减少由于对同一个样本人脸进行重复搜索而带来的资源(如计算资源、网络带宽等)消耗；6)能够通过从多个图片中选择所包含的人脸的多为特征向量到及基准点的距离长度在距离范围内的至少一个图片，来搜索得到包含与样本人脸相匹配的人脸的图片，且该距离范围可以进行调整，从而满足不同的准确性要求；7)能够基于较小的距离范围选择第一部分图片，且基于较大的距离范围选择第二部分图片，并进一步从该第一部分图片和第二部分图片中确定准确性较高的图片，从而在保证准确性的同时，避免有较为准确的图片被遗漏。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明一个实施例的用于在计算机设备中搜索包含人脸的图片的方法的流程示意图；

图2为本发明另一个实施例的用于在计算机设备中搜索包含人脸的图片的方法的流程示意图；

图3为本发明一个实施例的用于在计算机设备中搜索包含人脸的图片的装置的结构示意图；

图4为本发明另一个实施例的用于在计算机设备中搜索包含人脸的图片的装置的结构示意图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

图1为本发明一个实施例的用于在计算机设备中搜索包含人脸的图片的方法的流程示意图。

其中，本实施例的方法主要通过计算机设备来实现；所述计算机设备包括网络设备和用户设；所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量计算机或网络服务器构成的云，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机；所述网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。所述用户设备包括但不限于PC机、平板电脑、智能手机、PDA、IPTV等。

需要说明的是，所述计算机设备仅为举例，其他现有的或今后可能出现的计算机设备如可适用于本发明，也应包含在本发明保护范围以内，并以引用方式包含于此。

根据本实施例的方法包括步骤S1和步骤S2。

在步骤S1中，计算机设备获取样本人脸的多维特征向量到基准点的距离长度。

其中，所述样本人脸用于表示在搜索图片时被作为样本的人脸；优选地，样本人脸为多个，且每个样本人脸均对应一个多维特征向量。

其中，所述多维特征向量用于指示与样本人脸对应的多个特征，多维特征向量所述特征包括任何与样本人脸相关的特征，如样本人脸中的五官的位置特征(如样本人脸的唇所在的像素点位置等)和形状特征(如样本人脸的唇的轮廓、上下唇的厚度、唇开高度和宽度等)等。

优选地，所述多维特征向量的维数表示样本人脸的特征数量，也即，多维特征向量的每个维度用于指示样本人脸的一个特征。例如，样本人脸对应的多维特征向量为(x₁，x₂，…，x₂₀₀)，其中，x_i(i＝0，…，200)用于表示样本人脸的第i个特征。

其中，所述基准点包括多维空间中的任何能够作为基准的点。优选地，所述基准点为多维空间(该多维空间的维数与多维特征向量的维数相同)中的原点。优选地，当基准点为多维空间中的原点时，样本人脸的多维特征向量到基准点的距离长度为该多维特征向量的模。

作为一个示例，样本人脸对应的多维特征向量为(x₁，x₂，…，x₂₀₀)，其中，x_i(i＝0，…，200)；基准点对应的多维特征向量为(y₁，y₂，…，y₂₀₀)，其中，y_i(i＝0，…，200)；则可基于以下公式计算样本人脸的多维特征向量到基准点的距离长度L：

L = \sqrt{{(x_{1} - y_{1})}^{2} + . . . + {(x_{i} - y_{i})}^{2} + . . . + {(x_{200} - y_{200})}^{2}}

具体地，计算机设备获取样本人脸的多维特征向量到基准点的距离长度的实现方式包括但不限于：

1)计算机设备直接获取来自用户或其他设备的、样本人脸的多维特征向量到基准点的距离长度。

2)步骤S1进一步包括步骤S11和步骤S12。

在步骤S11中，计算机设备从样本图片中提取样本人脸。

其中，所述样本图片为用户指定的、包含样本人脸的图片。

其中，计算机设备可采用多种方式获取样本图片。

例如，计算机设备为网络设备，该网络设备接收用户通过用户设备所上传的样本图片，或者，该网络设备接收用户通过用户设备发送的指示信息，并根据该指示信息从本地获取样本图片。

又例如，计算机设备为用户设备，该用户设备获取用户上传的样本图片，或者，根据用户指示从用户存储在该用户设备的多个图片中获取样本图片。

需要说明的是，优选地，计算机设备获取样本图片之后，先对该样本图片进行检测，来确定该样本图片中是否包含人脸；若样本图片中包含人脸，则提取该样本图片中的样本人脸，若该样本图片中不包含人脸，则停止搜索。

具体地，计算机设备从样本图片中提取样本人脸的实现方式包括但不限于：

1)计算机设备直接提取样本图片中所包含的所有人脸，并将所提取的所有人脸均作为样本人脸。

例如，样本图片中具有一个人脸，计算机设备提取该人脸，并将该人脸作为样本人脸。

例如，样本图片中具有三个人脸，计算机设备提取该三个人脸，并将该三个人脸均作为样本人脸。

2)样本图片中具有多个人脸，计算机设备从该多个人脸中提取用户指定的至少一个人脸。

例如，样本图片中具有三个人脸，计算机设备从用户在该样本图片中标记的位置区域内提取用户指定的一个人脸，并将该提取出的人脸作为样本人脸。

在步骤S12中，计算机设备获取样本人脸的多维特征向量到基准点的距离长度。

具体地，计算机设备可采用多种方式获取样本人脸的多维特征向量到基准点的距离长度。

例如，计算机设备通过提取出该样本人脸的多个特征，获得该样本人脸的多维特征向量，接着，计算机设备计算该多维特征向量到基准点的距离长度。

又例如，当计算机设备中预先存储有该样本人脸的多维特征向量到基准点的距离长度时，计算机设备可直接从本地读取该距离长度。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何获取样本人脸的多维特征向量到基准点的距离长度的实现方式，均应包含在本发明的范围内。

作为一种优选方案，在步骤S1中，计算机设备获取样本人脸的多维特征向量，以及该多维特征向量到基准点的距离长度。

具体地，计算机设备获取样本人脸的多维特征向量，以及该多维特征向量到基准点的距离长度的实现方式与前述计算机设备获取样本人脸的多维特征向量到基准点的距离长度的实现方式相同或者相似，在此不再赘述。

在步骤S2中，计算机设备根据所述距离长度以及多个图片中的人脸的多维特征向量到基准点的距离长度，在所述多个图片中搜索包含与所述样本人脸相匹配的人脸的图片。

其中，所述多个图片包括但不限于：计算机设备中本地存储的多个图片、网络中的多个图片等。优选地，所述多个图片为用户在该计算机设备的、用于该用户的存储空间中所存储的多个UGC(UserGenerated Content，用户生成内容)图片。更优选地，样本人脸为多个图片中的一个人脸。

需要说明的是，优选地，所述计算机设备中预先存储有该多个图片中的人脸对应的多维特征向量以及多维特征向量到基准点的距离长度。优选地，该多个图片中的每个图片均对应有用于唯一标识该图片的标识信息；更优选地，图片中的每个人脸均对应有用于唯一标识该人脸的标识信息；则计算机设备可根据图片或人脸对应的标识信息，来读取相应的多维特征向量或距离长度。其中，所述标识信息包括任何用于表示图片或人脸的信息，如图片对应的MD5(MessageDigest Algorithm MD5，消息摘要算法5)值、人脸对应的索引值等。

具体地，计算机设备根据所述距离长度以及多个图片中的人脸的多维特征向量到基准点的距离长度，在该多个图片中搜索包含与样本人脸相匹配的人脸的图片的实现方式包括但不限于：

1)对于多个图片中的每个人脸的多维特征向量到基准点的距离长度，计算机设备计算该距离长度与样本人脸的多维特征向量到基准点的距离长度之间的差值；之后，计算机设备根据计算得到的差值确定该多个图片中包含与样本人脸相匹配的人脸的图片。

作为一个示例，多个图片中的5个人脸的多维特征向量到基准点的距离长度分别为：L1、L2、L3、L4、L5。在步骤S1中，计算机设备获取样本人脸的多维特征向量到基准点的距离长度L0。在步骤S2中，计算机设备计算得到L1与L0之间的差值为1.0，L2与L0之间的差值为1.9，L3与L0之间的差值为3.5，L4与L0之间的差值为4.2，L5与L0之间的差值为0.2；则计算机设备根据最小的两个差值0.2和1.0，将包含L5对应的人脸的图片，以及包含L1对应的人脸的图片，确定为包含与样本人脸相匹配的人脸的图片。

2)计算机设备根据所述样本人脸对应的距离长度，确定第一距离范围；并且，计算机设备通过从所述多个图片中选择所包含的人脸的多维特征向量到基准点的距离长度在所述第一距离范围内的至少一个图片，获得包含与所述样本人脸相匹配的人脸的图片。本实现方式将在后续实施例中予以详述，在此不再赘述。

作为一种优选方案，样本人脸为多个，且每个样本人脸均对应一个多维特征向量；在步骤S1中，计算机设备获取该多个样本人脸中的每个样本人脸的多维特征向量到基准点的距离长度；步骤S2进一步包括以下步骤：计算机设备根据该多个样本人脸中的每个样本人脸的多维特征向量到基准点的距离长度，以及多个图片中的人脸的多维特征向量到基准点的距离长度，在所述多个图片中搜索包含与各个样本人脸分别匹配的多个人脸的图片。

其中，所述包含与各个样本人脸分别匹配的多个人脸的图片用于指示：该多个样本人脸中的每个样本人脸均匹配该图片中的一个人脸，且每个样本人脸所匹配的人脸不同。

例如，对于多个样本人脸中的每个样本人脸的多维特征向量到基准点的距离长度，计算机设备根据该距离长度以及多个图片中的人脸的多维特征向量到基准点的距离长度，在该多个图片中搜索包含与该样本人脸相匹配的人脸的图片；之后，计算机设备将与每个样本人脸对应的、搜索得到的图片，进行交集处理，获得包含与各个样本人脸分别匹配的多个人脸的图片。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何根据所述距离长度以及多个图片中的人脸的多维特征向量到基准点的距离长度，在所述多个图片中搜索包含与所述样本人脸相匹配的人脸的图片的实现方式，均应包含在本发明的范围内。

需要说明的是，优选地，每次完成搜索之后，计算机设备缓存本次搜索对应的样本人脸以及搜索得到的图片，以当用户针对相同的样本人脸进行再次搜索时，能够直接获取缓存的图片，从而能够加快搜索速度，且大大减少由于对同一个样本人脸进行重复搜索而带来的资源(如计算资源、网络带宽等)消耗。

作为本实施例的一种优选方案，根据本实施例的方法还包括步骤S3。

在步骤S3中，计算机设备向用户反馈搜索得到的图片。

其中，所述用户为基于样本人脸来搜索图片的用户。

例如，在步骤S1中，计算机设备获取样本人脸的多维特征向量到基准点的距离长度L0；在步骤S2中，计算机设备根据L0，以及500个图片中的人脸的多维特征向量到基准点的距离长度，在该500个图片中搜索得到包含与样本人脸相匹配的人脸的50个图片；在步骤S3中，计算机设备向用户反馈该50个图片。

具体地，计算机设备可采用多种方式向用户反馈搜索得到的图片。

例如，计算机设备为网络设备，该网络设备将搜索得到的图片提供给用户设备，以在用户设备中向用户呈现该等图片。

又例如，计算机设备为用户设备，该用户设备直接将搜索得到的图片呈现给用户。

优选地，步骤S3进一步包括步骤S31。

在步骤S31中，计算机设备向用户反馈搜索得到的图片以及搜索得到的图片的图片属性信息。

其中，搜索得到的图片的图片属性信息包括任何与搜索得到的图片的属性相关的信息。优选地，所述图片属性信息包括：

1)搜索得到的图片的数量。

2)与所述样本人脸相匹配的人脸在搜索得到的图片中的位置信息。

其中，所述位置信息包括任何与相匹配的人脸在该人脸所在图片中的位置相关的信息。优选地，所述位置信息包括但不限于：用于指示相匹配的人脸在该人脸所在图片中所位于的像素点的信息，用于指示相匹配的人脸在该人脸所在图片中的粗略区域的信息等。

需要说明的是，所述位置信息可用于在该等搜索得到的图片中标记出与样本人脸相匹配的人脸。

3)搜索得到的图片中的相匹配的人脸与所述样本人脸的相似度信息。

其中，所述相似度信息可用于对该等搜索得到的图片进行排序。

4)搜索得到的图片的时间信息。

其中，所述时间信息包括任何与搜索得到的图片相关的时间信息，如图片的拍摄时间、上传时间等。

其中，所述时间信息可用于对该等搜索得到的图片进行排序。

需要说明的是，上述图片属性信息仅为举例，本领域技术人员应能理解，任何与搜索得到的图片的属性相关的信息，均应包含在本发明所述的图片属性信息的范围内。

具体地，计算机设备向用户反馈搜索得到的图片以及搜索得到的图片的图片属性信息的实现方式，与计算机设备向用户反馈搜索得到的图片的实现方式相同或者相似，在此不再赘述。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何向用户反馈搜索得到的图片的实现方式，均应包含在本发明的范围内。

作为本实施例的一种优选方案，本实施例的方案还包括以下步骤：对于多个图片中的每个人脸，计算机设备获得并存储该人脸的多维特征向量到基准点的距离长度，或获得并存储该人脸的多维特征向量以及该多维特征向量到基准点的距离长度。

具体地，对于该多个图片中的每个人脸，计算机设备提取该人脸的多个特征，生成相应的多维特征向量，并计算该多维特征向量到基准点的距离长度；并且，计算机设备存储该多维特征向量，或者存储该多维特征向量以及该多维特征向量到基准点的距离长度。

优选地，所述多个图片为用户在该计算机设备的、用于该用户的存储空间中所存储的多个图片。且优选地，一旦用户在该存储空间中存储图片，计算机设备便获得并存储该图片中的每个人脸的多维特征向量，或者获得并存储该图片中的每个人脸的多维特征向量到基准点的距离长度。

作为一种优选方案，存储多维特征向量或存储多维特征向量以及距离长度的操作进一步包括：将人脸的多维特征向量到基准点的距离长度，或人脸的多维特征向量以及该多维特征向量到基准点的距离长度，转换为二进制数据，并存储该二进制数据。

优选地，计算机设备基于base64算法将人脸的多维特征向量到基准点的距离长度，或人脸的多维特征向量以及该多维特征向量到基准点的距离长度，转换为二进制数据，并将转换后的二进制数据存储至结构化数据库中。需要说明的是，该优选方案与直接存储人脸的多维特征向量到基准点的距离长度，或人脸的多维特征向量以及该多维特征向量到基准点的距离长度的方案相比，能够节省大约三分之一的存储空间。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何对于多个图片中的每个人脸，获得并存储该人脸的多维特征向量到基准点的距离长度，或获得并存储该人脸的多维特征向量以及该多维特征向量到基准点的距离长度的实现方式，均应包含在本发明的范围内。

本发明发现了现有技术中存在的以下问题：1)现有技术中只能在网络上共享的所有图片中来搜索的方案，然而，用户通常仅希望在特定的多个图片(如其个人存储空间中的多个图片)中来搜索包含与样本人脸相匹配的人脸的图片，若采用现有技术的方案则需要消耗大量的网络资源，且搜索准确率极低；2)现有技术中仅限于针对单个样本人脸进行搜索；3)现有技术中仅能简单地比对该所有图片中的人脸与样本人脸的相似程度，无法有效地搜索得到较为准确的图片。

根据本实施例的方案，能够基于样本人脸的多维特征向量到基准点的距离长度，以及多个图片中的人脸的多维特征向量到基准点的距离长度，来对多个图片进行过滤，由于样本人脸的多维特征向量能够全面且准确地指示样本人脸的大量特征(如数百个特征)，故使得该基于距离长度进行图片过滤的方案能够有效地从多个图片中准确地搜索到包含与样本人脸较为相似的人脸的图片，从而大大增加了搜索结果的准确性；并且，可在用户任意指定的多个图片中来搜索包含与样本人脸相匹配的人脸的图片，从而不需要在网络上共享的所有图片中进行搜索，也无需用户手动在多个图片中进行查找，进而大大提高了搜索效率，且大大减少了网络资源的浪费；此外，可针对多个样本人脸(如用户在样本图片中指定的多个样本人脸)，来搜索包含与该多个样本人脸中的每个相匹配的人脸的图片，从而能够更好的满意用户的需求，而不限于仅能针对单个样本人脸进行搜索。

此外，本实施例的方案能够将多维特征向量以及多维特征向量到基准点的距离长度转换为二进制进行存储，从而大大节省了存储空间，且图片的数量越多，该效果越明显；并且，每次完成搜索之后，能够缓存本次搜索对应的样本人脸以及搜索得到的图片，以当用户针对相同的样本人脸进行再次搜索时，能够直接获取缓存的图片，从而能够加快搜索速度，且大大减少由于对同一个样本人脸进行重复搜索而带来的资源(如计算资源、网络带宽等)消耗。

图2为本发明另一个实施例的用于在计算机设备中搜索包含人脸的图片的方法的流程示意图。其中，本实施例的方法主要由计算机设备来实现，参照图1中对计算机设备所作的任何说明，均已引用的方式包含于此。

根据本实施例的方法包括步骤S1和步骤S2，所述步骤S2进一步包括步骤S21和步骤S22。其中，所述步骤S1已在参照图1中予以详述，在此不再赘述。

在步骤S21中，计算机设备根据样本人脸对应的距离长度，确定第一距离范围。

具体地，计算机设备根据样本人脸对应的距离长度，确定第一距离范围的实现方式包括但不限于：

1)计算机设备根据样本人脸对应的距离长度以及预定比例系数，确定第一距离范围。

例如，计算机设备基于以下公式计算距离范围Range：

Range＝(L-L/M，L+L/N)

其中，L为样本人脸对应的距离长度，M和N均为预定比例系数，优选地，M＝N。

2)计算机设备根据样本人脸对应的距离长度，以及预定距离阈值，确定第一距离范围。

例如，计算机设备基于以下公式计算距离范围Range：

Range＝(|L-L_m|，|L+L_n|)

其中，L为样本人脸对应的距离长度，L_m和L_n均为预定距离阈值，优选地，L_m＝L_n。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何根据样本人脸对应的距离长度，确定第一距离范围的实现方式，均应包含在本发明的范围内。

在步骤S22中，计算机设备通过从该多个图片中选择所包含的人脸的多维特征向量到基准点的距离长度在第一距离范围内的至少一个图片，获得包含与所述样本人脸相匹配的人脸的图片。

具体地，计算机设备通过从该多个图片中选择所包含的人脸的多维特征向量到基准点的距离长度在第一距离范围内的至少一个图片，获得包含与所述样本人脸相匹配的人脸的图片的实现方式包括但不限于：

1)计算机设备从该多个图片中，选择所包含的人脸的多维特征向量到基准点的距离长度在第一距离范围内的至少一个图片；接着，计算机设备通过将样本人脸的多维特征向量，与所述至少一个图片中的人脸的多维特征向量进行匹配，获得包含与样本人脸相匹配的人脸的图片。

例如，在步骤S21中，计算机设备根据样本人脸对应的距离长度，确定第一距离范围为(2.99，3.01)；在步骤S22中，计算机设备从多个图片中，选择所包含的人脸的多维特征向量到基准点的距离长度在(2.99，3.01)范围内的300个图片，接着，计算机设备将样本人脸的多维特征向量，与该300个图片中的人脸的多维特征向量进行匹配，从该300个图片中选择所包含的人脸与样本人脸相似度较高的50个图片。

2)步骤S22进一步包括步骤S22-1、步骤S22-2和步骤S22-3。

在步骤S22-1中，计算机设备根据所述样本人脸对应的距离长度，确定第二距离范围。

其中，所述第二距离范围大于所述第一距离范围。

具体地，计算机设备根据所述样本人脸对应的距离长度，确定第二距离范围的实现方式与步骤S1中确定第一距离范围的实现方式相同或者相似。

例如，在步骤S21中，计算机设备根据该距离长度3以及较小的预定距离阈值0.01，确定第一距离范围为(3-0.01，3+0.01)；在步骤S22-1中，计算机设备根据较大的预定距离阈值0.1，确定第二距离范围为(3-0.1，3+0.1)。

在步骤S22-2中，计算机设备从多个图片中，选择所包含的人脸的多维特征向量到基准点的距离长度在第一距离范围内的第一部分图片，以及，选择所包含的人脸的多维特征向量到基准点的距离长度在第二距离范围内的第二部分图片。

优选地，所述第一部分图片的数量少于所述第二部分图片的数量。

需要说明的是，当第一部分图片的数量超过预定数量时，计算机设备继续从该第一部分图片中选择(如随机选择，或者按照拍摄时间来选择等)预定数量的图片，作为最终的第一部分图片。同理，当第二部分图片的数量超过预定数量时，计算机设备继续从该第二部分图片中选择(如随机选择、按照拍摄时间选择等)预定数量的图片，作为最终的第二部分图片。

在步骤S22-3中，计算机设备通过将样本人脸的多维特征向量，与所述第一部分图片和第二部分图片中的人脸的多维特征向量进行匹配，获得包含与样本人脸相匹配的人脸的图片。

优选地，计算机设备通过将样本人脸的多维特征向量，与所述第一部分图片和第二部分图片中的人脸的多维特征向量进行匹配，从第一部分图片中获取第一预定数量个图片，以及从第二部分图片中获取第二预定数量个图片，且将所述第一预定数量个图片与所述第二预定数量个图片进行并集处理所得到的图片作为包含与样本人脸相匹配的人脸的图片。优选地，所述第一预定数量小于所述第二预定数量。

例如，在步骤S21中，计算机设备确定第一距离范围为(2.99，3.01)。在步骤S22-1中，计算机设备根据较大的预定距离阈值0.1，确定第二距离范围为(2.9，3.1)。在步骤S22-2中，计算机设备在10000个图片中，选择所包含的人脸的多维特征向量到基准点的距离长度在(2.99，3.01)内的300个图片，以及包含的人脸的多维特征向量到基准点的距离长度在(2.9，3.1)内的1000个图片。在步骤S22-3中，计算机设备通过将样本人脸的多维特征向量，与该300个图片中的人脸的多维特征向量进行匹配，从该300个图片中确定所包含的人脸与样本人脸相似度最高的50张图片；并且，计算机设备通过将样本人脸的多维特征向量，与该1000个图片中的人脸的多维特征向量进行匹配，从该1000个图片中确定所包含的人脸与样本人脸相似度最高的100张图片；之后，计算机设备对该50张图片和该100张图片进行并集处理，获得包含与样本人脸相匹配的人脸的140个图片。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何通过从该多个图片中选择所包含的人脸的多维特征向量到基准点的距离长度在所述第一距离范围内的至少一个图片，获得包含与所述样本人脸相匹配的人脸的图片的实现方式，均应包含在本发明的范围内。

根据本实施例的方案，能够通过从多个图片中选择所包含的人脸的多为特征向量到及基准点的距离长度在距离范围内的至少一个图片，来搜索得到包含与样本人脸相匹配的人脸的图片，且该距离范围可以进行调整，从而满足不同的准确性要求；此外，能够基于较小的距离范围选择第一部分图片，且基于较大的距离范围选择第二部分图片，并进一步从该第一部分图片和第二部分图片中确定准确性较高的图片，从而在保证准确性的同时，避免有较为准确的图片被遗漏。

图3为本发明一个实施例的用于在计算机设备中搜索包含人脸的图片的装置的结构示意图。该用于搜索包含人脸的图片的装置(以下简称为“人脸搜索装置”)包括获取装置1和搜索装置2。

获取装置1获取样本人脸的多维特征向量到基准点的距离长度。

L = \sqrt{{(x_{1} - y_{1})}^{2} + . . . + {(x_{i} - y_{i})}^{2} + . . . + {(x_{200} - y_{200})}^{2}}

具体地，获取装置1获取样本人脸的多维特征向量到基准点的距离长度的实现方式包括但不限于：

1)获取装置1直接获取来自用户或其他设备的、样本人脸的多维特征向量到基准点的距离长度。

2)获取装置1进一步包括提取装置(图未示)和子获取装置(图未示)。

提取装置从样本图片中提取样本人脸。

其中，所述样本图片为用户指定的、包含样本人脸的图片。

其中，提取装置可采用多种方式获取样本图片。

例如，计算机设备为网络设备，该网络设备的提取装置接收用户通过用户设备所上传的样本图片，或者，该网络设备接收用户通过用户设备发送的指示信息，并根据该指示信息从本地获取样本图片。

又例如，计算机设备为用户设备，该用户设备的提取装置获取用户上传的样本图片，或者，根据用户指示从用户存储在该用户设备的多个图片中获取样本图片。

需要说明的是，优选地，提取装置获取样本图片之后，先对该样本图片进行检测，来确定该样本图片中是否包含人脸；若样本图片中包含人脸，则提取该样本图片中的样本人脸，若该样本图片中不包含人脸，则停止搜索。

具体地，提取装置从样本图片中提取样本人脸的实现方式包括但不限于：

1)提取装置直接提取样本图片中所包含的所有人脸，并将所提取的所有人脸均作为样本人脸。

例如，样本图片中具有一个人脸，提取装置提取该人脸，并将该人脸作为样本人脸。

2)样本图片中具有多个人脸，提取装置从该多个人脸中提取用户指定的至少一个人脸。

子获取装置获取样本人脸的多维特征向量到基准点的距离长度。

具体地，子获取装置可采用多种方式获取样本人脸的多维特征向量到基准点的距离长度。

例如，子获取装置通过提取出该样本人脸的多个特征，获得该样本人脸的多维特征向量，接着，子获取装置计算该多维特征向量到基准点的距离长度。

又例如，当计算机设备中预先存储有该样本人脸的多维特征向量到基准点的距离长度时，子获取装置可直接从本地读取该距离长度。

作为一种优选方案，获取装置1获取样本人脸的多维特征向量，以及该多维特征向量到基准点的距离长度。

具体地，获取装置1获取样本人脸的多维特征向量，以及该多维特征向量到基准点的距离长度的实现方式与前述获取装置1获取样本人脸的多维特征向量到基准点的距离长度的实现方式相同或者相似，在此不再赘述。

搜索装置2根据所述距离长度以及多个图片中的人脸的多维特征向量到基准点的距离长度，在所述多个图片中搜索包含与所述样本人脸相匹配的人脸的图片。

具体地，搜索装置2根据所述距离长度以及多个图片中的人脸的多维特征向量到基准点的距离长度，在该多个图片中搜索包含与样本人脸相匹配的人脸的图片的实现方式包括但不限于：

1)对于多个图片中的每个人脸的多维特征向量到基准点的距离长度，搜索装置2计算该距离长度与样本人脸的多维特征向量到基准点的距离长度之间的差值；之后，搜索装置2根据计算得到的差值确定该多个图片中包含与样本人脸相匹配的人脸的图片。

作为一个示例，多个图片中的5个人脸的多维特征向量到基准点的距离长度分别为：L1、L2、L3、L4、L5。获取装置1获取样本人脸的多维特征向量到基准点的距离长度L0。搜索装置2计算得到L1与L0之间的差值为1.0，L2与L0之间的差值为1.9，L3与L0之间的差值为3.5，L4与L0之间的差值为4.2，L5与L0之间的差值为0.2；则搜索装置2根据最小的两个差值0.2和1.0，将包含L5对应的人脸的图片，以及包含L1对应的人脸的图片，确定为包含与样本人脸相匹配的人脸的图片。

2)搜索装置2根据所述样本人脸对应的距离长度，确定第一距离范围；并且，搜索装置2通过从所述多个图片中选择所包含的人脸的多维特征向量到基准点的距离长度在所述第一距离范围内的至少一个图片，获得包含与所述样本人脸相匹配的人脸的图片。本实现方式将在后续实施例中予以详述，在此不再赘述。

作为一种优选方案，样本人脸为多个，且每个样本人脸均对应一个多维特征向量；获取装置1获取该多个样本人脸中的每个样本人脸的多维特征向量到基准点的距离长度；搜索装置2进一步包括以下操作：搜索装置2根据该多个样本人脸中的每个样本人脸的多维特征向量到基准点的距离长度，以及多个图片中的人脸的多维特征向量到基准点的距离长度，在所述多个图片中搜索包含与各个样本人脸分别匹配的多个人脸的图片。

例如，对于多个样本人脸中的每个样本人脸的多维特征向量到基准点的距离长度，搜索装置2根据该距离长度以及多个图片中的人脸的多维特征向量到基准点的距离长度，在该多个图片中搜索包含与该样本人脸相匹配的人脸的图片；之后，计算机设备将与每个样本人脸对应的、搜索得到的图片，进行交集处理，获得包含与各个样本人脸分别匹配的多个人脸的图片。

作为本实施例的一种优选方案，根据本实施例的人脸搜索装置还包括反馈装置(图未示)。

反馈装置向用户反馈搜索得到的图片。

其中，所述用户为基于样本人脸来搜索图片的用户。

例如，获取装置1获取样本人脸的多维特征向量到基准点的距离长度L0；搜索装置2根据L0，以及500个图片中的人脸的多维特征向量到基准点的距离长度，在该500个图片中搜索得到包含与样本人脸相匹配的人脸的50个图片；反馈装置向用户反馈该50个图片。

具体地，反馈装置可采用多种方式向用户反馈搜索得到的图片。

例如，计算机设备为网络设备，该网络设备的反馈装置将搜索得到的图片提供给用户设备，以在用户设备中向用户呈现该等图片。

又例如，计算机设备为用户设备，该用户设备的反馈装置直接将搜索得到的图片呈现给用户。

优选地，反馈装置进一步包括子反馈装置(图未示)。

子反馈装置向用户反馈搜索得到的图片以及搜索得到的图片的图片属性信息。

1)搜索得到的图片的数量。

4)搜索得到的图片的时间信息。

具体地，子反馈装置向用户反馈搜索得到的图片以及搜索得到的图片的图片属性信息的实现方式，与反馈装置向用户反馈搜索得到的图片的实现方式相同或者相似，在此不再赘述。

作为本实施例的一种优选方案，本实施例的人脸搜索装置还包括存储装置(图未示)。对于多个图片中的每个人脸，存储装置获得并存储该人脸的多维特征向量到基准点的距离长度，或获得并存储该人脸的多维特征向量以及该多维特征向量到基准点的距离长度。

具体地，对于该多个图片中的每个人脸，存储装置提取该人脸的多个特征，生成相应的多维特征向量，并计算该多维特征向量到基准点的距离长度；并且，存储装置存储该多维特征向量，或者存储该多维特征向量以及该多维特征向量到基准点的距离长度。

优选地，所述多个图片为用户在该计算机设备的、用于该用户的存储空间中所存储的多个图片。且优选地，一旦用户在该存储空间中存储图片，存储装置便获得并存储该图片中的每个人脸的多维特征向量，或者获得并存储该图片中的每个人脸的多维特征向量到基准点的距离长度。

优选地，存储装置基于base64算法将人脸的多维特征向量到基准点的距离长度，或人脸的多维特征向量以及该多维特征向量到基准点的距离长度，转换为二进制数据，并将转换后的二进制数据存储至结构化数据库中。需要说明的是，该优选方案与直接存储人脸的多维特征向量到基准点的距离长度，或人脸的多维特征向量以及该多维特征向量到基准点的距离长度的方案相比，能够节省大约三分之一的存储空间。

图4为本发明另一个实施例的用于在计算机设备中搜索包含人脸的图片的装置的结构示意图。根据本实施例的人脸搜索装置包括获取装置1和搜索装置2；其中，所述搜索装置2进一步包括第一确定装置21和获得装置22。其中，所述获取装置1已在参照图3中予以详述，在此不再赘述。

第一确定装置2根据样本人脸对应的距离长度，确定第一距离范围。

具体地，第一确定装置2根据样本人脸对应的距离长度，确定第一距离范围的实现方式包括但不限于：

1)第一确定装置2根据样本人脸对应的距离长度以及预定比例系数，确定第一距离范围。

例如，第一确定装置2基于以下公式计算距离范围Range：

Range＝(L-L/M，L+L/N)

2)第一确定装置2根据样本人脸对应的距离长度，以及预定距离阈值，确定第一距离范围。

例如，第一确定装置2基于以下公式计算距离范围Range：

Range＝(|L-L_m|，|L+L_n|)

获得装置22通过从该多个图片中选择所包含的人脸的多维特征向量到基准点的距离长度在第一距离范围内的至少一个图片，获得包含与所述样本人脸相匹配的人脸的图片。

具体地，获得装置22通过从该多个图片中选择所包含的人脸的多维特征向量到基准点的距离长度在第一距离范围内的至少一个图片，获得包含与所述样本人脸相匹配的人脸的图片的实现方式包括但不限于：

1)获得装置22进一步包括第一选择装置(图未示)和第一子获得装置(图未示)。第一选择装置从该多个图片中，选择所包含的人脸的多维特征向量到基准点的距离长度在第一距离范围内的至少一个图片；接着，第一子获得装置通过将样本人脸的多维特征向量，与所述至少一个图片中的人脸的多维特征向量进行匹配，获得包含与样本人脸相匹配的人脸的图片。

例如，第一确定装置21根据样本人脸对应的距离长度，确定第一距离范围为(2.99，3.01)；第一选择装置从多个图片中，选择所包含的人脸的多维特征向量到基准点的距离长度在(2.99，3.01)范围内的300个图片，接着，第一子获得装置将样本人脸的多维特征向量，与该300个图片中的人脸的多维特征向量进行匹配，从该300个图片中选择所包含的人脸与样本人脸相似度较高的50个图片。

2)获得装置22进一步包括第二确定装置(图未示)、第二选择装置(图未示)以及第二子获得装置(图未示)。

第二确定装置根据所述样本人脸对应的距离长度，确定第二距离范围。

其中，所述第二距离范围大于所述第一距离范围。

具体地，第二确定装置根据所述样本人脸对应的距离长度，确定第二距离范围的实现方式与第一确定装置21确定第一距离范围的实现方式相同或者相似。

例如，第一确定装置21根据该距离长度3以及较小的预定距离阈值0.01，确定第一距离范围为(3-0.01，3+0.01)；第二确定装置根据较大的预定距离阈值0.1，确定第二距离范围为(3-0.1，3+0.1)。

第二选择装置从多个图片中，选择所包含的人脸的多维特征向量到基准点的距离长度在第一距离范围内的第一部分图片，以及，选择所包含的人脸的多维特征向量到基准点的距离长度在第二距离范围内的第二部分图片。

需要说明的是，当第一部分图片的数量超过预定数量时，第二选择装置继续从该第一部分图片中选择(如随机选择，或者按照拍摄时间来选择等)预定数量的图片，作为最终的第一部分图片。同理，当第二部分图片的数量超过预定数量时，第二选择装置继续从该第二部分图片中选择(如随机选择、按照拍摄时间选择等)预定数量的图片，作为最终的第二部分图片。

第二子获得装置通过将样本人脸的多维特征向量，与所述第一部分图片和第二部分图片中的人脸的多维特征向量进行匹配，获得包含与样本人脸相匹配的人脸的图片。

优选地，第二子获得装置通过将样本人脸的多维特征向量，与所述第一部分图片和第二部分图片中的人脸的多维特征向量进行匹配，从第一部分图片中获取第一预定数量个图片，以及从第二部分图片中获取第二预定数量个图片，且将所述第一预定数量个图片与所述第二预定数量个图片进行并集处理所得到的图片作为包含与样本人脸相匹配的人脸的图片。优选地，所述第一预定数量小于所述第二预定数量。

例如，第一确定装置21确定第一距离范围为(2.99，3.01)。第二确定装置根据较大的预定距离阈值0.1，确定第二距离范围为(2.9，3.1)。第二选择装置在10000个图片中，选择所包含的人脸的多维特征向量到基准点的距离长度在(2.99，3.01)内的300个图片，以及包含的人脸的多维特征向量到基准点的距离长度在(2.9，3.1)内的1000个图片。第二子获得装置通过将样本人脸的多维特征向量，与该300个图片中的人脸的多维特征向量进行匹配，从该300个图片中确定所包含的人脸与样本人脸相似度最高的50张图片；并且，第二子获得装置通过将样本人脸的多维特征向量，与该1000个图片中的人脸的多维特征向量进行匹配，从该1000个图片中确定所包含的人脸与样本人脸相似度最高的100张图片；之后，第二子获得装置对该50张图片和该100张图片进行并集处理，获得包含与样本人脸相匹配的人脸的140个图片。

需要注意的是，本发明可在软件和/或软件与硬件的组合体中被实施，例如，本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中，本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地，本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本发明的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

1.一种用于在计算机设备中搜索包含人脸的图片的方法，其中，该方法包括：

获取样本人脸的多维特征向量到基准点的距离长度；

2.根据权利要求1所述的方法，其中，搜索包含与样本人脸相匹配的人脸的图片的步骤包括：

根据所述样本人脸对应的距离长度，确定第一距离范围；

通过从所述多个图片中选择所包含的人脸的多维特征向量到基准点的距离长度在所述第一距离范围内的至少一个图片，获得包含与所述样本人脸相匹配的人脸的图片。

3.根据权利要求2所述的方法，其中，通过从所述多个图片中选择至少一个图片获得包含相匹配的人脸的图片的步骤包括：

从所述多个图片中，选择所包含的人脸的多维特征向量到基准点的距离长度在所述第一距离范围内的至少一个图片；

通过将样本人脸的多维特征向量，与所述至少一个图片中的人脸的多维特征向量进行匹配，获得包含与所述样本人脸相匹配的人脸的图片。

4.根据权利要求2所述的方法，其中，通过从所述多个图片中选择至少一个图片获得包含相匹配的人脸的图片的步骤包括：

根据所述样本人脸对应的距离长度，确定第二距离范围，其中，所述第二距离范围大于所述第一距离范围；

从所述多个图片中，选择所包含的人脸的多维特征向量到基准点的距离长度在所述第一距离范围内的第一部分图片，以及，选择所包含的人脸的多维特征向量到基准点的距离长度在所述第二距离范围内的第二部分图片；

通过将样本人脸的多维特征向量，与所述第一部分图片和第二部分图片中的人脸的多维特征向量进行匹配，获得包含与所述样本人脸相匹配的人脸的图片。

5.根据权利要求1至4中任一项所述的方法，其中，获取样本人脸的距离长度的步骤包括：

从样本图片中提取样本人脸；

获取样本人脸的多维特征向量到基准点的距离长度。

6.根据权利要求1至5中任一项所述的方法，其中，该方法还包括：

向用户反馈搜索得到的图片。

7.根据权利要求6所述的方法，其中，向所述用户反馈搜索得到的图片的步骤包括：

向所述用户反馈搜索得到的图片以及搜索得到的图片的图片属性信息。

8.根据权利要求7所述的方法，其中，所述图片属性信息包括：

-搜索得到的图片的数量；

-与所述样本人脸相匹配的人脸在搜索得到的图片中的位置信息；

-搜索得到的图片中的相匹配的人脸与所述样本人脸的相似度信息；

-搜索得到的图片的时间信息。

9.根据权利要求1至8中任一项所述的方法，其中，该方法还包括：

对于多个图片中的每个人脸，获得并存储该人脸的多维特征向量到基准点的距离长度，或获得并存储该人脸的多维特征向量以及该多维特征向量到基准点的距离长度。

10.根据权利要求9所述的方法，其中，存储多维特征向量或存储多维特征向量以及距离长度的操作包括：

将人脸的多维特征向量到基准点的距离长度，或人脸的多维特征向量以及该多维特征向量到基准点的距离长度，转换为二进制数据，并存储该二进制数据。

11.一种用于在计算机设备中搜索包含人脸的图片的装置，其中，该装置包括：

12.根据权利要求11所述的装置，其中，所述搜索装置包括：

第一确定装置，用于根据所述样本人脸对应的距离长度，确定第一距离范围；

获得装置，用于通过从所述多个图片中选择所包含的人脸的多维特征向量到基准点的距离长度在所述第一距离范围内的至少一个图片，获得包含与所述样本人脸相匹配的人脸的图片。

13.根据权利要求12所述的装置，其中，所述获得装置包括：

第一选择装置，用于从所述多个图片中，选择所包含的人脸的多维特征向量到基准点的距离长度在所述第一距离范围内的至少一个图片；

第一子获得装置，用于通过将样本人脸的多维特征向量，与所述至少一个图片中的人脸的多维特征向量进行匹配，获得包含与所述样本人脸相匹配的人脸的图片。

14.根据权利要求12所述的装置，其中，所述获得装置包括：

第二确定装置，用于根据所述样本人脸对应的距离长度，确定第二距离范围，其中，所述第二距离范围大于所述第一距离范围；

第二选择装置，用于从所述多个图片中，选择所包含的人脸的多维特征向量到基准点的距离长度在所述第一距离范围内的第一部分图片，以及，选择所包含的人脸的多维特征向量到基准点的距离长度在所述第二距离范围内的第二部分图片；

第二子获得装置，用于通过将样本人脸的多维特征向量，与所述第一部分图片和第二部分图片中的人脸的多维特征向量进行匹配，获得包含与所述样本人脸相匹配的人脸的图片。

15.根据权利要求11至14中任一项所述的装置，其中，所述获取装置包括：

提取装置，用于从样本图片中提取样本人脸；

子获取装置，用于获取样本人脸的多维特征向量到基准点的距离长度。

16.根据权利要求11至15中任一项所述的装置，其中，该装置还包括：

反馈装置，用于向用户反馈搜索得到的图片。

17.根据权利要求16所述的装置，其中，所述反馈装置包括：

子反馈装置，用于向所述用户反馈搜索得到的图片以及搜索得到的图片的图片属性信息。

18.根据权利要求17所述的装置，其中，所述图片属性信息包括：

-搜索得到的图片的数量；

-搜索得到的图片的时间信息。

19.根据权利要求11至18中任一项所述的装置，其中，该装置还包括：

存储装置，用于对于多个图片中的每个人脸，获得并存储该人脸的多维特征向量到基准点的距离长度，或获得并存储该人脸的多维特征向量以及该多维特征向量到基准点的距离长度。

20.根据权利要求19所述的装置，其中，存储多维特征向量或存储多维特征向量以及距离长度的操作包括：