CN110287361B

CN110287361B - 一种人物图片筛选方法及装置

Info

Publication number: CN110287361B
Application number: CN201910576454.6A
Authority: CN
Inventors: 韩冰
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2019-06-28
Filing date: 2019-06-28
Publication date: 2021-06-22
Anticipated expiration: 2039-06-28
Also published as: CN110287361A

Abstract

本发明实施例提供了一种人物图片筛选方法及装置，其中，该方法包括：针对待筛选的多个人物图片中的每个人物图片，对该人物图片进行人脸置信度检测，得到该人物图片的人脸置信度，人脸置信度表示该人物图片中具有人脸区域的程度，当人脸置信度大于预设置信度阈值时，获取该人物图片中人脸区域的人脸长度和人脸宽度，基于人脸长度与预设长度阈值的比较结果，以及人脸宽度与预设宽度阈值的比较结果，确定该人物图片是否作为待选择的人物图片，从所述多个人物图片中的全部待选择的人物图片中，筛选出待标注的人物图片；本发明实施例可以过滤掉不存在人脸区域的图片，也可以过滤掉人脸形状不满足要求的图片，从而减少了标注的工作量。

Description

一种人物图片筛选方法及装置

技术领域

本发明涉及多媒体识别技术领域，特别是涉及一种人物图片筛选方法及装置。

背景技术

目前，需要对与人物身份匹配的图片标注人名，而现有常用的方式一般是依据人名从互联网爬取大量的图片，得到指定人物对应的图片库，然后再对指定人物对应的图片库中的图片进行人工标注；其中，标注的具体过程如下：先对指定人物对应的图片库中的图片进行逐一筛选审核，然后对筛选审核后得到的与指定人物相匹配的标准图进行标注。

发明人在实现本发明的过程中发现，现有技术至少存在如下问题：

由于爬取的原始数据比较粗糙，爬取得到的指定人物对应的图片中有很多不适合作为标准图或者与指定人物不匹配的图片，直接进行人工标注，导致标注工作量比较大，标注效率比较低。

发明内容

本发明实施例的目的在于提供一种人物图片筛选方法及装置，用以解决标注工作量比较大以及标注效率比较低的问题。具体技术方案如下：

本发明实施例提供了一种人物图片筛选方法，其包括：

针对待筛选的多个人物图片中的每个人物图片，对该人物图片进行人脸置信度检测，得到该人物图片的人脸置信度，所述人脸置信度表示该人物图片中具有人脸区域的程度；

当所述人脸置信度大于预设置信度阈值时，获取该人物图片中人脸区域的人脸长度和人脸宽度；

基于所述人脸长度与预设长度阈值的比较结果，以及所述人脸宽度与预设宽度阈值的比较结果，确定该人物图片是否作为待选择的人物图片；

从所述多个人物图片中的全部待选择的人物图片中，筛选出待标注的人物图片。

可选的，所述基于所述人脸长度与预设长度阈值的比较结果，以及所述人脸宽度与所述预设宽度阈值的比较结果，确定该人物图片是否作为待选择的人物图片，包括：

当所述人脸长度不大于预设长度阈值，且所述人脸宽度不大于预设宽度阈值时，确定该人物图片作为待选择的人物图片。

当所述人脸长度不大于预设长度阈值，且所述人脸宽度不大于预设宽度阈值时，提取该人物图片的人脸特征，得到该人物图片的人脸特征向量；

计算所述人脸特征向量的二范数，所述人脸特征向量的二范数表示该人物图片的清晰程度；

基于所述人脸特征向量的二范数与预设二范数阈值的比较结果，确定该人物图片是否作为待选择的人物图片。

可选的，所述基于所述人脸特征向量的二范数与预设二范数阈值的比较结果，确定该人物图片是否作为待选择的人物图片，包括：

当所述人脸特征向量的二范数大于所述预设二范数阈值时，确定该人物图片作为待选择的人物图片。

当所述人脸特征向量的二范数大于所述预设二范数阈值时，计算该人物图片中人脸的转向角度；

当所述转向角度不大于所述预设角度阈值时，确定该人物图片作为待选择的人物图片。

可选的，所述从所述多个人物图片中的全部待选择的人物图片中，筛选出待标注的人物图片，包括：

获取所述多个人物图片中的全部待选择的人物图片的人脸特征；

基于获取的全部待选择的人物图片的人脸特征进行聚类，得到聚类中心点；

从全部待选择的人物图片中，选择距离所述聚类中心点最近的前预设数量的人物图片，作为待标注的人物图片。

本发明实施例还提供了一种人物图片筛选装置，其包括：

人脸置信度检测模块，用于针对待筛选的多个人物图片中的每个人物图片，对该人物图片进行人脸置信度检测，得到该人物图片的人脸置信度，所述人脸置信度表示该人物图片中具有人脸区域的程度；

人脸区域检测模块，用于当所述人脸置信度大于预设置信度阈值时，获取该人物图片中人脸区域的人脸长度和人脸宽度；

人脸图片确定模块，用于基于所述人脸长度与预设长度阈值的比较结果，以及所述人脸宽度与预设宽度阈值的比较结果，确定该人物图片是否作为待选择的人物图片；

人脸图片筛选模块，用于从所述多个人物图片中的全部待选择的人物图片中，筛选出待标注的人物图片。

可选的，所述人脸图片确定模块，具体用于当所述人脸长度不大于预设长度阈值，且所述人脸宽度不大于预设宽度阈值时，确定该人物图片作为待选择的人物图片。

可选的，所述人脸图片确定模块，包括：

人脸特征提取子模块，用于当所述人脸长度不大于预设长度阈值，且所述人脸宽度不大于预设宽度阈值时，提取该人物图片的人脸特征，得到该人物图片的人脸特征向量；

计算子模块，用于计算所述人脸特征向量的二范数；

人脸图片确定子模块，用于基于所述人脸特征向量的二范数与预设二范数阈值的比较结果，确定该人物图片是否作为待选择的人物图片。

可选的，所述人脸图片确定子模块，具体用于当所述人脸特征向量的二范数大于所述预设二范数阈值时，确定该人物图片作为待选择的人物图片。

可选的，所述人脸图片确定子模块，具体用于当所述人脸特征向量的二范数大于所述预设二范数阈值时，计算该人物图片中人脸的转向角度；以及当所述转向角度不大于所述预设角度阈值时，确定该人物图片作为待选择的人物图片。

可选的，所述人脸图片筛选模块，具体用于获取所述多个人物图片中的全部待选择的人物图片的人脸特征；并基于获取的全部待选择的人物图片的人脸特征进行聚类，得到聚类中心点；以及从全部待选择的人物图片中，选择距离所述聚类中心点最近的前预设数量的人物图片，作为待标注的人物图片。

本发明实施例还提供了一种电子设备，其包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述任一所述的图片筛选方法步骤。

本发明实施还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一所述的图片筛选方法的步骤。

本发明实施例还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一所述的图片筛选方法。

本发明实施例有益效果：

本发明实施例提供的一种人物图片筛选方法及装置，通过针对待筛选的多个人物图片中的每个人物图片，对该人物图片进行人脸置信度检测，得到该人物图片的人脸置信度，人脸置信度表示该人物图片中具有人脸区域的程度，当人脸置信度大于预设置信度阈值时，获取该人物图片中人脸区域的人脸长度和人脸宽度，然后基于人脸长度与预设长度阈值的比较结果，以及人脸宽度与预设宽度阈值的比较结果，确定该人物图片是否作为待选择的人物图片，再从上述多个人物图片中的全部待选择的人物图片中，筛选出待标注的人物图片。采用该方案，可以过滤掉不存在人脸区域的图片，并且，由于人脸长度和人脸宽度能够表示人脸的形状，所以，也可以过滤掉人脸形状不满足要求的图片，即减少了后续需要进行标注的人物图片，从而减少了标注的工作量，提高了标注效率。

当然，实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种人物图片筛选方法的流程图；

图2为本发明实施例提供的另一种人物图片筛选方法的流程图；

图3为本发明实施例提供的另一种人物图片筛选方法的流程图；

图4为本发明实施例提供的另一种人物图片筛选方法的流程图；

图5为本发明实施例提供的对待选择的人物图片进行筛选的流程图；

图6为本发明实施例提供的人物图片筛选装置的一种结构图；

图7为本发明实施例提供的电子设备的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供一种人物图片筛选方法，如图1所示，具体可以包括如下步骤：

S101，针对待筛选的多个人物图片中的每个人物图片，对该人物图片进行人脸置信度检测，得到该人物图片的人脸置信度。

S102，当人脸置信度大于预设置信度阈值时，获取该人物图片中人脸区域的人脸长度和人脸宽度。

S103，基于人脸长度与预设长度阈值的比较结果，以及人脸宽度与预设宽度阈值的比较结果，确定该人物图片是否作为待选择的人物图片。

S104，从多个人物图片中的全部待选择的人物图片中，筛选出待标注的人物图片。

采用本发明实施例提供的上述人物图片筛选方法，可以过滤掉不存在人脸区域的图片，并且，由于人脸长度和人脸宽度能够表示人脸的形状，所以，也可以过滤掉人脸形状不满足要求的图片，即减少了后续需要进行标注的人物图片，从而减少了标注的工作量，提高了标注效率。

下面对本发明实施例提供的人物图片筛选方法进行详细说明：

参见图2，图2为本发明实施例提供的一种人物图片筛选方法的流程图，可以包括如下步骤：

S201，针对待筛选的多个人物图片中的每个人物图片，对该人物图片进行人脸置信度检测，得到该人物图片的人脸置信度。

其中，人脸置信度可以表示该人物图片中具有人脸区域的程度，也可以理解为该人物图片中具有人脸区域的可能性，人脸置信度越高，表示具有人脸区域的可能性越大。

在一个实施例中，可以通过预先训练的人脸检测模型对该人物图片进行人脸置信度检测，人脸检测模型可以通过对已知具有人脸特征的人脸图片进行训练得到。

本步骤中待筛选的多个人物图片，可以为针对同一个人物的多个人物图片，也可以为针对不同的多个人物的多个人物图片。

在一个实施例中，可以针对一个指定人物，按照该指定人物的人名在网络上进行图片爬取，得到多个人物图片，作为上述待筛选的多个人物图片。

具体的，可以按照该指定人物的人名在网络上进行图片爬取，得到该指定人物对应的图片数据，然后再对图片数据进行解码，得到指定人物对应的多个人物图片。当然，多个人物图片也可以为通过其他途径获得的人物图片，在此不再举例进行描述。

S202，判断得到的该人物图片的人脸置信度是否大于预设置信度阈值，如果大于，进入步骤S203，如果不大于，进入步骤S206。

本步骤中的预设置信度阈值，可以根据实际应用的需要，进行设置。

示例性的，本发明实施例的预设置信度阈值可以为0.6，通过预先训练的人脸检测模型对该人物图片进行人脸置信度检测，如果得到该人物图片的人脸置信度为0.65，则判定该人物图片中具有人脸区域，然后进入步骤S203；如果得到该人物图片的人脸置信度为0.55，则判定该人物图片中不具有人脸区域，则进入步骤S206。

S203，当人脸置信度大于预设置信度阈值时，获取该人物图片中人脸区域的人脸长度和人脸宽度。

具体的，当人脸置信度大于预设置信度阈值时，可以确定该人物图片中具有人脸区域，基于此，可以计算人物图片中人脸区域的人脸长度和人脸宽度。

S204，将人脸长度与预设长度阈值进行比较，以及将人脸宽度与预设宽度阈值进行比较。

S205，当人脸长度不大于预设长度阈值，且人脸宽度不大于预设宽度阈值时，进入步骤S207，否则，进入步骤S206。

本步骤中的预设长度阈值和预设宽度阈值，可以根据实际应用的需要，进行设置。

示例性的，本发明实施例的预设长度阈值可以为50，预设宽度阈值可以为40，如果获取该人物图片中人脸区域的人脸长度为48以及人脸宽度为42，则进入步骤S206；如果获取该人物图片中人脸区域的人脸长度为52以及人脸宽度为38，则进入步骤S206；如果获取该人物图片中人脸区域的人脸长度为55以及人脸宽度为45，则进入步骤S206；如果获取该人物图片中人脸区域的人脸长度为48以及人脸宽度为36，则将该人物图片作为待选择的人物图片，然后进入步骤S207。

S206，将该人物图片过滤掉，即确定该人物图片不作为待标注的人物图片。

也就是说，当人脸置信度不大于预设置信度阈值时，将该人物图片过滤掉，当不满足人脸长度不大于预设长度阈值，且人脸宽度不大于预设宽度阈值时，也将该人物图片过滤掉。

在针对上述多个人物图片中的每个人物图片，执行上述S201-S206之后，进入步骤S207。

S207，从上述多个人物图片中的全部待选择的人物图片中，筛选出待标注的人物图片。

本步骤中，可以将全部待选择的人物图片，确定为待标注的人物图片。

本步骤中，也可以基于全部待选择的人物图片的人脸特征进行聚类，并基于聚类结果，筛选出待标注的人物图片，后面对此进行详细描述。

采用本发明实施例提供的上述图2所示的人物图片筛选方法，可以过滤掉不存在人脸区域的图片，并且，由于人脸长度和人脸宽度能够表示人脸的形状，所以，也可以过滤掉人脸形状不满足要求的图片，即减少了后续需要进行标注的人物图片，从而减少了标注的工作量，提高了标注效率。

在本发明的另一个实施例中，参见图3，图3为本发明实施例提供的另一种人物图片筛选方法的流程图，可以包括如下步骤：

S301，针对待筛选的多个人物图片中的每个人物图片，对该人物图片进行人脸置信度检测，得到该人物图片的人脸置信度。

本步骤与图2实施例S201中获取人物图片的人脸置信度的方法相同，在此不再详述。

S302，判断得到的该人物图片的人脸置信度是否大于预设置信度阈值，如果大于，进入步骤S303，如果不大于，进入步骤S309。

本步骤与图2实施例S202中判断得到的该人物图片的人脸置信度是否大于预设置信度阈值的方法相同，在此不再详述。

示例性的，本发明实施例的预设置信度阈值可以为0.6，通过预先训练的人脸检测模型对该人物图片进行人脸置信度检测，如果得到该人物图片的人脸置信度为0.65，则判定该人物图片中具有人脸区域，然后进入步骤S303；如果得到该人物图片的人脸置信度为0.55，则判定该人物图片中不具有人脸区域，则进入步骤S309。

S303，当人脸置信度大于预设置信度阈值时，获取该人物图片中人脸区域的人脸长度和人脸宽度。

本步骤与图2实施例S203中获取该人物图片中人脸区域的人脸长度和人脸宽度的方法相同，在此不再详述。

S304，将人脸长度与预设长度阈值进行比较，以及将人脸宽度与预设宽度阈值进行比较。

S305，当人脸长度不大于预设长度阈值，且人脸宽度不大于预设宽度阈值时，进入步骤S306，否则，进入步骤S309。

示例性的，本发明实施例的预设长度阈值可以为50，预设宽度阈值可以为40，如果获取该人物图片中人脸区域的人脸长度为48以及人脸宽度为42，则进入步骤S309；如果获取该人物图片中人脸区域的人脸长度为52以及人脸宽度为38，则进入步骤S309；如果获取该人物图片中人脸区域的人脸长度为55以及人脸宽度为45，则进入步骤S309；如果获取该人物图片中人脸区域的人脸长度为48以及人脸宽度为36，则进入步骤S307。

S306，提取该人物图片的人脸特征，得到该人物图片的人脸特征向量；

在一个实施例中，可以通过预先训练的特征提取模型提取该人物图片的人脸特征，特征提取模型可以通过对已知具有人脸特征的人脸图片进行训练得到。

S307，计算该人脸特征向量的二范数。

本实施例中，该二范数未进行归一化处理，该人脸特征向量的二范数表示该人物图片的清晰程度。

S308，判断该人脸特征向量的二范数是否大于预设二范数阈值时，如果大于，则进入步骤S310，如果不大于，则进入步骤S309。

本步骤中的预设二范数阈值，可以根据实际应用的需要，进行设置。

示例性的，本发明实施例的预设二范数阈值可以为8，当该人物图片的人脸特征向量的二范数为10时，则该人物图片的人脸清晰度满足要求，将该人物图片作为待选择的人物图片，然后进入步骤S310；当该人物图片的人脸特征向量的二范数为7时，则该人物图片的人脸清晰度不满足要求，然后进入步骤S309。

S309，将该人物图片过滤掉，即确定该人物图片不作为待标注的人物图片。

也就是说，当人脸置信度不大于预设置信度阈值时，将该人物图片过滤掉，当不满足人脸长度不大于预设长度阈值，且人脸宽度不大于预设宽度阈值时，也将该人物图片过滤掉，当人脸特征向量的二范数不大于预设二范数阈值时，也将该人物图片过滤掉。

在针对上述多个人物图片中的每个人物图片，执行上述S301-S309之后，进入步骤S310。

S310，从上述多个人物图片中的全部待选择的人物图片中，筛选出待标注的人物图片。

本步骤与图2实施例S207中筛选出待标注的人物图片的方法相同，在此不再详述。

采用本发明实施例提供的上述图3所示的人物图片筛选方法，可以过滤掉不存在人脸区域的图片，也可以过滤掉人脸形状不满足要求的图片，并且，人脸特征向量的二范数能够表示该人物图片的清晰程度，所以，也可以过滤掉人脸清晰度不满足要求的图片，即进一步减少了后续需要进行标注的人物图片，从而进一步减少标注的工作量，提高了标注效率。

在本发明的另一个实施例中，参见图4，图4为本发明实施例提供的另一种人物图片筛选方法的流程图，可以包括如下步骤：

S401，针对待筛选的多个人物图片中的每个人物图片，对该人物图片进行人脸置信度检测，得到该人物图片的人脸置信度。

S402，判断得到的该人物图片的人脸置信度是否大于预设置信度阈值，如果大于，进入步骤S403，如果不大于，进入步骤S411。

示例性的，本发明实施例的预设置信度阈值可以为0.6，通过预先训练的人脸检测模型对该人物图片进行人脸置信度检测，如果得到该人物图片的人脸置信度为0.65，则判定该人物图片中具有人脸区域，然后进入步骤S403；如果得到该人物图片的人脸置信度为0.55，则判定该人物图片中不具有人脸区域，则进入步骤S411。

S403，当人脸置信度大于预设置信度阈值时，获取该人物图片中人脸区域的人脸长度和人脸宽度。

S404，将人脸长度与预设长度阈值进行比较，以及将人脸宽度与预设宽度阈值进行比较。

S405，当人脸长度不大于预设长度阈值，且人脸宽度不大于预设宽度阈值时，进入步骤S406，否则，进入步骤S411。

示例性的，本发明实施例的预设长度阈值可以为50，预设宽度阈值可以为40，如果获取该人物图片中人脸区域的人脸长度为48以及人脸宽度为42，则进入步骤S411；如果获取该人物图片中人脸区域的人脸长度为52以及人脸宽度为38，则进入步骤S411；如果获取该人物图片中人脸区域的人脸长度为55以及人脸宽度为45，则进入步骤S411；如果获取该人物图片中人脸区域的人脸长度为48以及人脸宽度为36，则进入步骤S406。

S406，提取该人物图片的人脸特征，得到该人物图片的人脸特征向量。

S407，计算该人脸特征向量的二范数。

S408，当该人脸特征向量的二范数大于预设二范数阈值时，则进入步骤S409，否则，进入步骤S411。

示例性的，本发明实施例的预设二范数阈值可以为8，当该人物图片的人脸特征向量的二范数为7时，则该人物图片的人脸清晰度不满足要求，然后进入步骤S411；当该人物图片的人脸特征向量的二范数为10时，则该人物图片的人脸清晰度满足要求，然后进入步骤S409。

S409，计算该人物图片中人脸的转向角度。

在一个实施例中，可以通过预先训练的人脸角度检测模型对该人物图片进行人脸角度检测，得到该人物图片中人脸的转向角度，人脸角度检测模型可以通过对已知具有人脸特征的人脸图片进行训练得到。

S410，判断该人脸的转向角度是否大于预设角度阈值，如果不大于，进入步骤S412，如果大于，进入步骤S411。

本步骤中的预设角度阈值，可以根据实际应用的需要，进行设置。

示例性的，本发明实施例的预设角度阈值可以为45°，当该人物图片中人脸的转向角度为38°时，则该人物图片的人脸的转向角度满足要求，将该人物图片作为待选择的人物图片，然后进入步骤S412；当该人物图片中人脸的转向角度为46°时，则该人物图片的人脸转向角度不满足要求，然后进入步骤S411。

S411，将该人物图片过滤掉，即确定该人物图片不作为待标注的人物图片。

也就是说，当人脸置信度不大于预设置信度阈值时，将该人物图片过滤掉，当不满足人脸长度不大于预设长度阈值，且人脸宽度不大于预设宽度阈值时，也将该人物图片过滤掉，当人脸特征向量的二范数不大于预设二范数阈值时，也将该人物图片过滤掉，当人脸的转向角度大于预设角度阈值时，也将该人物图片过滤掉。

在针对上述多个人物图片中的每个人物图片，执行上述S401-S411之后，进入步骤S412。

S412，从上述多个人物图片中的全部待选择的人物图片中，筛选出待标注的人物图片。

采用本发明实施例提供的上述图4所示的人物图片筛选方法，可以过滤掉不存在人脸区域的图片，也可以过滤掉人脸形状不满足要求的图片，也可以过滤掉人脸清晰度不满足要求的图片，此外，也可以过滤掉人脸转向角度不满足要求的图片，即进一步减少了后续需要进行标注的人物图片，进一步减少标注的工作量，提高了标注效率。

本发明的一个实施例中，步骤S207的具体步骤可以如下：参见图5，图5为本发明实施例提供的对待选择的人物图片进行筛选的流程图，具体步骤可以为：

S501，获取上述多个人物图片中的全部待选择的人物图片的人脸特征。

本步骤中，可以采用上述步骤S306提取的人物图片的人脸特征，也可以通过其他方式获取上述多个人物图片中的全部待选择的人物图片的人脸特征，现有技术均能实现，在此不做过多说明。

S502，基于获取的全部待选择的人物图片的人脸特征进行聚类，得到聚类中心点。

相应的，如果多个人物图片为针对同一个人物的多个人物图片，聚类数可以为1，得到一个聚类集合，选出该聚类集合的中心点，得到该聚类集合的中心图片；如果多个人物图片为针对不同的多个人物的多个人物图片，其中人物数量为N，则聚类数可以为N，得到N个聚类集合，选出各个聚类集合的中心点，得到各个聚类集合的中心图片；如果多个人物图片为针对不同的多个人物的多个人物图片，并且每个人物的多个人物图片为同一组，可以基于获取的同一组的全部待选择的人物图片的人脸特征进行聚类，聚类数可以为1，得到一个聚类集合，选出该聚类集合的中心点，得到该聚类集合的中心图片；当然，也可以基于获取的全部待选择的人物图片的人脸特征进行聚类，聚类数可以为N，其中，N为人物的数量，得到N个聚类集合，选出各个聚类集合的中心点，得到各个聚类集合的中心图片。

S503，从全部待选择的人物图片中，选择距离聚类中心点最近的前预设数量的人物图片，作为待标注的人物图片。

本步骤中的预设数量，可以根据实际应用的需要，进行设置。

本实施例中，针对上述得到的每个聚类集合，计算该聚类集合内的人物图片的人脸特征与该聚类集合的中心图片的人脸特征的距离，根据该距离确定距离聚类中心点最近的前预设数量的人物图片。

示例性的，本发明实施例中的预设数量可以为15，计算聚类集合内的人物图片的人脸特征与该聚类集合的中心图片的人脸特征的欧式距离，基于每个人物图片的人脸特征与中心图片的人脸特征的欧式距离的比较结果，选取最小的15个欧氏距离对应的15个人物图片，作为待标注的人物图片。

采用本发明实施例提供的上述图5所示的对待选择的人物图片进行筛选的方法，能够过滤掉与指定人物不匹配的人物图片，进一步减少标注的工作量，也提高了标注效率。

相应于上述方法实施例，本发明实施例还提供了一种人物图片筛选装置，参考图6，图6为本发明实施例提供的一种人物图片筛选装置，其包括：

人脸置信度检测模块601，用于针对待筛选的多个人物图片中的每个人物图片，对该人物图片进行人脸置信度检测，得到该人物图片的人脸置信度，其中，人脸置信度表示该人物图片中具有人脸区域的程度；

人脸区域检测模块602，用于当该人脸置信度大于预设置信度阈值时，获取该人物图片中人脸区域的人脸长度和人脸宽度；

人脸图片确定模块603，用于基于该人物图片的人脸长度与预设长度阈值的比较结果，以及该人物图片的人脸宽度与预设宽度阈值的比较结果，确定该人物图片是否作为待选择的人物图片；

人脸图片筛选模块604，用于从上述多个人物图片中的全部待选择的人物图片中，筛选出待标注的人物图片。

本发明实施例提供的如图6所示的人物图片筛选装置，可以过滤掉不存在人脸区域的图片，并且，由于人脸长度和人脸宽度能够表示人脸的形状，所以，也可以过滤掉人脸形状不满足要求的图片，即减少了后续需要进行标注的人物图片，从而减少了标注的工作量，提高了标注效率。

可选的，人脸图片确定模块603，具体用于当该人物图片的人脸长度不大于预设长度阈值，且该人物图片的人脸宽度不大于预设宽度阈值时，确定该人物图片作为待选择的人物图片。

可选的，人脸图片确定模块603，包括：

人脸特征提取子模块，用于当该人物图片的人脸长度不大于预设长度阈值，且该人物图片的人脸宽度不大于预设宽度阈值时，提取该人物图片的人脸特征，得到该人物图片的人脸特征向量；

计算子模块，用于计算该人物图片的人脸特征向量的二范数；

人脸图片确定子模块，用于基于该人物图片的人脸特征向量的二范数与预设二范数阈值的比较结果，确定该人物图片是否作为待选择的人物图片。

可选的，人脸图片确定子模块，具体用于当该人物图片的人脸特征向量的二范数大于预设二范数阈值时，确定该人物图片作为待选择的人物图片。

可选的，人脸图片确定子模块，具体用于当该人物图片的人脸特征向量的二范数大于预设二范数阈值时，计算该人物图片中人脸的转向角度；以及当该转向角度不大于预设角度阈值时，确定该人物图片作为待选择的人物图片。

本发明的一个实施例中，人脸图片筛选模块604，具体用于获取多个人物图片中的全部待选择的人物图片的人脸特征；并基于获取的全部待选择的人物图片的人脸特征进行聚类，得到聚类中心点；以及从全部待选择的人物图片中，选择距离该聚类中心点最近的前预设数量的人物图片，作为待标注的人物图片。

采用本实施例提供的人脸图片筛选模块604，能够过滤掉与指定人物不匹配的人物图片，进一步减少标注的工作量，也提高了标注效率。

本发明实施例还提供了一种电子设备，如图7所示，包括处理器701、通信接口702、存储器703和通信总线704，其中，处理器701，通信接口702，存储器703通过通信总线704完成相互间的通信，

存储器703，用于存放计算机程序；

处理器701，用于执行存储器703上所存放的程序时，实现上述实施例中任一人物图片筛选方法的步骤。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述实施例中任一人物图片筛选方法的步骤。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一人物图片筛选方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、电子设备和计算机可读存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种人物图片筛选方法，其特征在于，包括：

从所述多个人物图片中的全部待选择的人物图片中，筛选出待标注的人物图片；

所述从所述多个人物图片中的全部待选择的人物图片中，筛选出待标注的人物图片，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述人脸长度与预设长度阈值的比较结果，以及所述人脸宽度与所述预设宽度阈值的比较结果，确定该人物图片是否作为待选择的人物图片，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于所述人脸长度与预设长度阈值的比较结果，以及所述人脸宽度与所述预设宽度阈值的比较结果，确定该人物图片是否作为待选择的人物图片，包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述人脸特征向量的二范数与预设二范数阈值的比较结果，确定该人物图片是否作为待选择的人物图片，包括：

5.根据权利要求3所述的方法，其特征在于，所述基于所述人脸特征向量的二范数与预设二范数阈值的比较结果，确定该人物图片是否作为待选择的人物图片，包括：

当所述转向角度不大于预设角度阈值时，确定该人物图片作为待选择的人物图片。

6.一种人物图片筛选装置，其特征在于，包括：

人脸图片筛选模块，用于从所述多个人物图片中的全部待选择的人物图片中，筛选出待标注的人物图片；

所述人脸图片筛选模块，具体用于获取所述多个人物图片中的全部待选择的人物图片的人脸特征；并基于获取的全部待选择的人物图片的人脸特征进行聚类，得到聚类中心点；以及从全部待选择的人物图片中，选择距离所述聚类中心点最近的前预设数量的人物图片，作为待标注的人物图片。

7.根据权利要求6所述的装置，其特征在于，所述人脸图片确定模块，具体用于当所述人脸长度不大于预设长度阈值，且所述人脸宽度不大于预设宽度阈值时，确定该人物图片作为待选择的人物图片。

8.根据权利要求6所述的装置，其特征在于，所述人脸图片确定模块，包括：

计算子模块，用于计算所述人脸特征向量的二范数；

9.根据权利要求8所述的装置，其特征在于，所述人脸图片确定子模块，具体用于当所述人脸特征向量的二范数大于所述预设二范数阈值时，确定该人物图片作为待选择的人物图片。

10.根据权利要求8所述的装置，其特征在于，所述人脸图片确定子模块，具体用于当所述人脸特征向量的二范数大于所述预设二范数阈值时，计算该人物图片中人脸的转向角度；以及当所述转向角度不大于预设角度阈值时，确定该人物图片作为待选择的人物图片。

11.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-5任一所述的方法步骤。