CN110084130B

CN110084130B - 基于多目标跟踪的人脸筛选方法、装置、设备及存储介质

Info

Publication number: CN110084130B
Application number: CN201910264378.5A
Authority: CN
Inventors: 孟勇; 牛昕宇; 蔡权雄; 熊超
Original assignee: Shenzhen Corerain Technologies Co Ltd
Current assignee: Shenzhen Corerain Technologies Co Ltd
Priority date: 2019-04-03
Filing date: 2019-04-03
Publication date: 2023-07-25
Anticipated expiration: 2039-04-03
Also published as: CN110084130A

Abstract

本发明实施例提供一种基于多目标跟踪的人脸筛选方法、装置、电子设备和存储介质，该方法包括：获取多目标跟踪算法输出的人脸跟踪结果，所述人脸跟踪结果包括置信度；根据所述置信度对第一预设时间内的多个人脸跟踪结果进行去重处理，得到待筛选人脸特征；将在第二预设时间内获取到的多个待筛选人脸特征输入预先训练好的卷积神经网络，得到目标人脸预测值，其中，所述第二预设时间为所述第一预设时间的大于1的整数倍；基于所述目标人脸预测值对目标人脸进行筛选。通过第一预设时间、第二预设时间获取待筛选人脸特征并输入预先训练好的卷积神经网络分类得到目标人脸预测值，最后根据目标人脸预测值筛选出目标人脸，从而提高人脸筛选的效率。

Description

基于多目标跟踪的人脸筛选方法、装置、设备及存储介质

技术领域

本发明涉及人工智能领域，尤其涉及一种基于多目标跟踪的人脸筛选方法、装置、设备及存储介质。

背景技术

人脸识别被认为是一种可广泛使用的生物特征识别技术，它在安全防范领域如刑侦破案、证件验证、视频监控等有着广阔的应用前景。人脸识别可分为基于静态图像的人脸识别和基于图像序列的人脸识别这两种方式。目前大部分有关人脸识别的研究也是基于图像序列的。基于图像序列的人脸识别方式中，自动人脸识别系统需要从采集到的图像序列中检测并截取出人脸图像并用于后续的人脸识别过程。在现有的人脸识别系统中，识别阶段需要利用已经采集到的人脸图像，因此人脸图像质量的好坏将直接影响到人脸识别系统的性能，模糊的人脸图像将导致识别错误率的上升。

然而，在现实环境中采集到的人脸图像的质量往往变化很大，例如可能会出现运动模糊、离焦模糊等情况。因此，为了保证人脸识别的准确性，在进入识别阶段之前，都有必要对得到的人脸图像进行筛选，将达到一定质量要求的图像进行后续的处理过程。

目前，人脸图像筛选的方法为：针对人脸图像组中的每一人脸图像，计算该人脸图像的清晰度、人脸大小以及人眼开合度这三个人脸属性，然后基于上述三个人脸属性确定该人脸图像的综合评价分数并将其中评分最高的确定为目标人脸图像。类似的方法是通过计算得到人脸属性，计算耗费时间长且过于粗糙，不适合人脸识别实时性和准确性要求，特别是在安防领域的实时视频监控。

发明内容

本发明实施例提供一种基于多目标跟踪的人脸筛选方法、装置、电子设备、和存储介质，能够提高人脸筛选的效率。

第一方面，本发明实施例提供一种基于多目标跟踪的人脸筛选方法，包括：

获取多目标跟踪算法输出的人脸跟踪结果，所述人脸跟踪结果包括置信度；

根据所述置信度对第一预设时间内的多个人脸跟踪结果进行去重处理，得到待筛选人脸特征；

将在第二预设时间内获取到的多个待筛选人脸特征输入预先训练好的卷积神经网络，得到目标人脸预测值，其中，所述第二预设时间为所述第一预设时间的大于1的整数倍；

基于所述目标人脸预测值对目标人脸进行筛选。

可选的，所述获取多目标跟踪算法输出的人脸跟踪结果，包括：

获取连续输入所述多目标跟踪算法的多帧图像的对应多个人脸跟踪结果，所述人脸跟踪结果还包括人脸标识。

可选的，所述根据所述置信度对第一预设时间内的多个人脸跟踪结果进行去重处理，得到待筛选人脸特征，包括：

在所述第一预设时间内，从具有相同人脸标识的人脸跟踪结果中选出置信度最大的一个人脸跟踪结果作为所述待筛选人脸特征，多个所述待筛选人脸特征组成一个具有相同人脸标识的待筛选人脸特征集。

可选的，所述将在第二预设时间内获取到的多个待筛选人脸特征输入预先训练好的卷积神经网络，得到目标人脸预测值，包括：

在第二预设时间内，从所述具有相同人脸标识的待筛选人脸特征集中获取待筛选人脸特征；

对所述第二预设时间内获取到的待筛选人脸特征进行预处理；

将所述预处理后的待筛选人脸特征输入预先训练好的卷积神经网络中进行分类，得到所述目标人脸预测值，所述目标人脸预测值包括人脸概率、人脸角度、人脸清晰度。

可选的，所述基于所述目标人脸预测值对目标人脸进行筛选，包括：

将所述目标人脸的人脸预测值中的人脸概率和预先设置的人脸概率阈值进行比较，如果所述人脸预测值中的人脸概率小于所述人脸概率阈值，则丢弃对应的目标人脸，得到第一目标人脸集；

在第一目标人脸集中，将所述目标人脸的人脸预测值中的人脸清晰度和预先设置的清晰度阈值进行比较，如果所述人脸预测值中的人脸清晰度小于所述清晰度阈值，则丢弃对应的目标人脸，得到第二目标人脸集；

根据所述人脸预测值中的人脸角度，对第二目标人脸集进行筛选，得到最优的目标人脸。

可选的，所述根据所述人脸预测值中的人脸角度，对第二目标人脸集进行筛选，得到最优的目标人脸，包括：

在所述第二目标人脸集中，基于所述目标人脸的人脸预测值中的人脸角度计算每个目标人脸的角度分数；

比较所述第二目标人脸集的每个目标人脸的角度分数，筛选出其中角度分数最小的目标人脸作为所述最优的目标人脸。

可选的，所述卷积神经网络的训练步骤，包括：

获取训练数据集；

对所述训练数据集进行标注、打标签、加噪声处理后输入所述卷积神经网络模型进行训练。

第二方面，本发明实施例提供一种基于多目标跟踪的人脸筛选装置，包括：

获取模块，用于获取多目标跟踪算法输出的人脸跟踪结果，所述人脸跟踪结果包括置信度；

去重模块，用于根据所述置信度对第一预设时间内的多个人脸跟踪结果进行去重处理，得到待筛选人脸特征；

输入模块，用于将在第二预设时间内获取到的多个待筛选人脸特征输入预先训练好的卷积神经网络，得到目标人脸预测值，其中，所述第二预设时间为所述第一预设时间的大于1的整数倍；

筛选模块，用于基于所述目标人脸预测值对目标人脸进行筛选。

第三方面，本发明实施例提供一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本发明实施例提供的基于多目标跟踪的人脸筛选方法中的步骤。

第四方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现本发明实施例提供的的基于多目标跟踪的人脸筛选方法中的步骤。

本发明实施例中，获取多目标跟踪算法输出的人脸跟踪结果，所述人脸跟踪结果包括置信度；根据所述置信度对第一预设时间内的多个人脸跟踪结果进行去重处理，得到待筛选人脸特征；将在第二预设时间内获取到的多个待筛选人脸特征输入预先训练好的卷积神经网络，得到目标人脸预测值，其中，所述第二预设时间为所述第一预设时间的大于1的整数倍；基于所述目标人脸预测值对目标人脸进行筛选。通过第一预设时间对上述多目标跟踪算法输出的人脸跟踪结果进行初步去重，然后在第二预设时间内获取待筛选人脸特征并输入预先训练好的卷积神经网络分类得到目标人脸预测值，最后根据目标人脸预测值筛选出目标人脸，从而提高人脸筛选的效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1是本发明实施例提供的一种基于多目标跟踪的人脸筛选方法的流程示意图；

图2是本发明实施例提供的提供的一种基于多目标跟踪的人脸筛选装置的结构示意图；

图3是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

如图1所示，本发明实施例提供了一种基于多目标跟踪的人脸筛选方法，包括以下步骤：

101、获取多目标跟踪算法输出的人脸跟踪结果，所述人脸跟踪结果包括置信度。

其中，在上述多目标跟踪算法执行之前，需要向人脸检测系统输入连续帧图像以得到人脸检测结果，然后将该人脸检测结果以人脸框的形式输出到上述多目标跟踪算法进行人脸跟踪并输出人脸跟踪结果，即判定连续帧图像之间，人脸框组是否同属于一个人，如果属于同一个人，则该组人脸框有唯一的人脸标识，否则，不同人脸框有不同的人脸标识。

102、根据所述置信度对第一预设时间内的多个人脸跟踪结果进行去重处理，得到待筛选人脸特征。

其中，上述第一预设时间可以是人为设定的固定值(如1秒)，也可以是每隔一定图像帧数(如10帧)的时间。在上述第一预设时间内，获取上述对应时间内的多个人脸跟踪结果，对于其中具有相同人脸标识的人脸跟踪结果进行初步去重，即取出每个人脸跟踪结果中的置信度并比较大小，将置信度最大的一个人脸跟踪结果作为上述待筛选人脸特征；重复上述初步去重步骤即可得到具有相同人脸标识的一组待筛选人脸特征。

进一步的，还可以重复该步骤以获得多个具有不同人脸标识的多组待筛选人脸特征。

103、将在第二预设时间内获取到的多个待筛选人脸特征输入预先训练好的卷积神经网络，得到目标人脸预测值，其中，所述第二预设时间为所述第一预设时间的大于1的整数倍。

其中，上述第二预设时间可以人为设定为上述第一预设时间的大于1的整数倍(如2秒)，也可以是上述第一预设时间的间隔的图像帧数的两倍以上(如30帧)的时间。在上述第二预设时间内，从上述步骤102得到的多组待筛选人脸特征中获取对应时间内的具有相同人脸标识的多个待筛选人脸特征，并将上述多个待筛选人脸特征进行预处理后依次输入上述预先训练好的卷积神经网络，进行特征提取和分类后得到对应多个目标人脸预测值，上述目标人脸预测值包括人脸概率、人脸角度、人脸清晰度。

进一步的，还可以重复该步骤以获得多个具有不同人脸标识的多组目标人脸预测值。

104、基于所述目标人脸预测值对目标人脸进行筛选。

首先，基于上述目标人脸预测值包括的人脸概率、人脸清晰度，预先设置对应的阈值，即人脸概率阈值(如0.5)、人脸清晰度阈值(如0.6)；然后将上述具有相同人脸标识的待筛选的目标人脸预测值的人脸概率、人脸清晰度和上述预先设置对应的阈值进行比较，将比较结果为小于的待筛选的目标人脸丢弃；最后通过计算剩余待筛选的目标人脸的预测值中的人脸角度得分并进行比较，选择其中人脸角度得分最小的一个作为最终的目标人脸，即最优的目标人脸。

进一步的，还可以重复该步骤以获得多个具有不同人脸标识的最终的最优的目标人脸。

在连续视频帧序列中，帧图像依次被送入到目标检测算法中，算法检测出图中的人脸；接着将人脸送到上述多目标跟踪算法中，输出对应多个人脸跟踪结果(trackedFace)。上述人脸跟踪结果的构成为{frameID,FaceID,FaceImage,p}，其中frameID为一帧图像的序号，FaceID是人脸标识，FaceImage为该FaceID对应的人脸图像，p为人脸存在的置信度。

其中，上述第一预设时间可以是每隔K帧图像的时间(如K设定为10)；在上述第一预设时间内对人脸进行粗略筛选，即从start(起始)帧到start+K帧的时间段内(即frameID从start变化到start+K)，对于具有相同人脸标识FaceID的人脸跟踪结果trackedFace组中，比较其中每个trackedFace的置信度p的大小，并从中筛选出p值最大的trackedFace作为上述待筛选人脸特征，直到图像的最后一帧，这样可以将筛选的trackedFace总数降低到1/K，并得到一个具有相同人脸标识的待筛选人脸特征集。例如，K设定为10，有连续视频帧10000帧图像，则可以获得一组具有相同人脸标识的1000个trackedFace。

进一步的，更换上述人脸标识并重复该步骤，以获得多个具有不同人脸标识的待筛选人脸特征集。

其中，上述第二预设时间可以是每隔M帧图像的时间，但应是上述第一预设时间的两倍以上，即M应大于2K(如M设定为100)；在该第二预设时间内，从上述具有相同人脸标识的待筛选人脸特征集中取出对应多个待筛选人脸特征。例如，若K设定为10，有连续视频帧10000帧图像，则首先可以获得一组具有相同人脸标识的1000个trackedFace；然后若M设定为100，则可以从上述1000个trackedFace中获得10个具有相同人脸标识的待筛选人脸特征，待筛选人脸特征包括人脸图像(FaceImage)。

接着，按照上述预先训练好的卷积神经网络的输入格式对上述获取到的多个待筛选人脸特征中的人脸图像进行预处理，比如输入格式要求是分辨率为96x 96的灰度图像，则需要将上述人脸图像缩放到相应大小，并转换为灰度图像然后作为上述卷积神经网络的输入；上述卷积神经网络可以通过六个卷积核对上述预处理后的人脸图像进行卷积和池化操作后提取图像的特征，然后通过一个全连接层对提取到的特征进行三分类，得到上述目标人脸的预测值，包括人脸概率、人脸角度、人脸清晰度。其中，人脸概率用以判定该图像是否是人脸，值为0到1的范围，值越大代表是人脸的可能性越大；人脸角度(pose)，用以判定人脸的角度，有三个角度：翻滚(roll)角度，俯仰(pitch)角度，偏航(yaw)角度，每个角度从0到180度，值越小则人脸越正；人脸清晰度(clarity)，值为0到1的范围，值越大则人脸图像越清晰。

通过上述轻量卷积神经网络可以快速、准确地获得目标人脸预测值。

首先，基于上述目标人脸预测值包括的人脸概率、人脸清晰度，预先设置对应的阈值，如人脸概率阈值0.5、人脸清晰度阈值0.6。

将通过上述卷积神经网络分类得到的目标人脸预测值中的人脸概率与上述人脸概率阈值进行比较，如果大于，则可以判定该图像是人脸；否则可以判定该图像不是人脸，并将该图像对应的待筛选人脸特征丢弃掉，剩余的待筛选人脸特征组成上述第一目标人脸集。

在上述第一目标人脸集中，将通过上述卷积神经网络分类得到的目标人脸预测值中的人脸清晰度与上述人脸清晰度阈值进行比较，如果大于，则可以认定该张人脸图像是相对清晰的；否则可以判定该人脸图像是模糊的，并将该该图像对应的待筛选人脸特征丢弃掉，剩余的待筛选人脸特征组成上述第二目标人脸集。

其中，上述人脸预测值中的人脸角度包括三个角度：roll(翻滚)，pitch(俯仰)，yaw(偏航)；上述人脸预测值中的人脸角度分数的计算可以通过如下公式：

poseScore＝a*|roll|+b*|pitch|+c*|yaw| (式1-1)

式中，a、b、c为对应项的权重值(可以根据经验调整)，poseScore即为人脸角度分数。

通过上述公式1-1可以得到第二目标人脸集中每个目标人脸的角度分数，选出其中角度分数最小的一个来作为最终的目标人脸，即在所有的帧图像中具有相同人脸标识的最优(最清晰、角度最正)的一帧人脸图像。

进一步的，还可以重复该实施例的两个步骤以获得多个具有不同人脸标识的最优的目标人脸，将上述最优的目标人脸作为人脸识别系统的输入，可以提高人脸识别系统的识别准确率。

可选的，所述卷积神经网络的训练步骤，包括：

获取训练数据集；

如上所述，其中上述卷积神经网络可以是包括输入层、六个卷积层、一个全连接层的深度网络，输入层用来获取输入该网络的经过预处理的人脸图像，然后通过全连接层输出上述三个人脸特性值。对上述卷积神经网络的预训练，首先可以从一些网站获取公开的数据集，也可以通过摄像装置获取图像数据集；其次对采集到的数据集进行处理，即标注图像中是人脸的为1不是人脸的为0、对人脸的角度打上标签(上述三个人脸角度)以及对一部分图像加噪声并标注为不清晰；然后将上述处理后的数据集中心化、归一化后输入上述卷积神经网络进行训练，以便让训练易于收敛。

以上可选的实施例为图1中基于多目标跟踪的人脸筛选方法的补充实施例，执行上述可选的实施列中的方法均能达到相应的有益效果，为避免重复，这里不再赘述。

请参见图2，图2是本发明实施例提供的一种基于多目标跟踪的人脸筛选装置的结构示意图，如图2所示，所述装置包括：

获取模块201，用于获取多目标跟踪算法输出的人脸跟踪结果，所述人脸跟踪结果包括置信度；

去重模块202，用于根据所述置信度对第一预设时间内的多个人脸跟踪结果进行去重处理，得到待筛选人脸特征；

输入模块203，用于将在第二预设时间内获取到的多个待筛选人脸特征输入预先训练好的卷积神经网络，得到目标人脸预测值，其中，所述第二预设时间为所述第一预设时间的大于1的整数倍；

筛选模块204，用于基于所述目标人脸预测值对目标人脸进行筛选。

可选的，所述获取模块201包括：

获取子模块2011，用于获取连续输入所述多目标跟踪算法的多帧图像的对应多个人脸跟踪结果，所述人脸跟踪结果还包括人脸标识。

可选的，所述去重模块202包括：

选出子模块2021，用于在所述第一预设时间内，从具有相同人脸标识的人脸跟踪结果中选出置信度最大的一个人脸跟踪结果作为所述待筛选人脸特征，多个所述待筛选人脸特征组成一个具有相同人脸标识的待筛选人脸特征集。

可选的，所述输入模块203包括：

获取子模块2031，用于在第二预设时间内，从所述具有相同人脸标识的待筛选人脸特征集中获取待筛选人脸特征；

预处理子模块2032，用于对所述第二预设时间内获取到的待筛选人脸特征进行预处理；

输入子模块2033，将所述预处理后的待筛选人脸特征输入预先训练好的卷积神经网络中进行分类，得到所述目标人脸预测值，所述目标人脸预测值包括人脸概率、人脸角度、人脸清晰度。

可选的，所述筛选模块204包括：

第一比较子模块2041，用于将所述目标人脸的人脸预测值中的人脸概率和预先设置的人脸概率阈值进行比较，如果所述人脸预测值中的人脸概率小于所述人脸概率阈值，则丢弃对应的目标人脸，得到第一目标人脸集；

第二比较子模块2042，用于在第一目标人脸集中，将所述目标人脸的人脸预测值中的人脸清晰度和预先设置的清晰度阈值进行比较，如果所述人脸预测值中的人脸清晰度小于所述清晰度阈值，则丢弃对应的目标人脸，得到第二目标人脸集；

筛选子模块2043，用于根据所述人脸预测值中的人脸角度，对第二目标人脸集进行筛选，得到最优的目标人脸。

进一步的，上述筛选子模块2043包括：

计算单元20431，用于在所述第二目标人脸集中，基于所述目标人脸的人脸预测值中的人脸角度计算每个目标人脸的角度分数；

筛选单元20432，用于比较所述第二目标人脸集的每个目标人脸的角度分数，筛选出其中角度分数最小的目标人脸作为所述最优的目标人脸。

本发明实施例提供的一种基于多目标跟踪的人脸筛选装置能够实现上述实施例，具有相应的有益效果，为避免重复，这里不再赘述。

参见图3，图3是本发明实施例提供的一种电子设备的结构示意图，如图3所示，包括：存储器302、处理器301及存储在所述存储器302上并可在所述处理器301上运行的计算机程序，其中：

处理器301用于调用存储器302存储的计算机程序，执行上述基于多目标跟踪的人脸筛选方法的所有实施列的各步骤。

上述处理器301在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片等。

需要说明的是，由于上述处理器301执行计存储于上述存储器302内的计算机程序时可实现上述的基于多目标跟踪的人脸筛选方法的步骤，因此上述基于多目标跟踪的人脸筛选方法的所有实施例均适用于上述电子设备，且均能达到相同或相似的有益效果。

此外，本发明的具体实施例还提供了一种计算机可读存储介质302，计算机可读存储介质302存储有计算机程序，该计算机程序被处理器执行时实现上述的基于多目标跟踪的人脸筛选方法的步骤。

即，在本发明的具体实施例中，计算机可读存储介质的计算机程序被处理器执行时实现上述的基于多目标跟踪的人脸筛选方法的步骤，能提高人脸筛选的效率。

示例性的，计算机可读存储介质的计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。

需要说明的是，由于计算机可读存储介质的计算机程序被处理器执行时实现上述的基于多目标跟踪的人脸筛选方法的步骤，因此上述基于多目标跟踪的人脸筛选方法的所有实施例均适用于该计算机可读存储介质，且均能达到相同或相似的有益效果。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件程序模块的形式实现。

所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器(英文：Read-Only Memory，简称：ROM)、随机存取器(英文：Random Access Memory，简称：RAM)、磁盘或光盘等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种基于多目标跟踪的人脸筛选方法，其特征在于，包括下述步骤：

获取多目标跟踪算法输出的人脸跟踪结果，所述人脸跟踪结果包括置信度，所述人脸跟踪结果包括：第一预设时间的人脸跟踪结果和第二预设时间的人脸跟踪结果；

将在第二预设时间内获取到的多个待筛选人脸特征输入预先训练好的卷积神经网络，得到目标人脸预测值，其中，所述第二预设时间为所述第一预设时间的大于1的整数倍，或者所述第二预设时间为所述第一预设时间的间隔的图像帧数的两倍以上的时间；

基于所述目标人脸预测值对目标人脸进行筛选；

其中，所述根据所述置信度对第一预设时间内的多个人脸跟踪结果进行去重处理，得到待筛选人脸特征的步骤具体包括：

2.如权利要求1所述方法，其特征在于，所述获取多目标跟踪算法输出的人脸跟踪结果的步骤具体包括：

3.如权利要求1所述方法，其特征在于，所述将在第二预设时间内获取到的多个待筛选人脸特征输入预先训练好的卷积神经网络，得到目标人脸预测值的步骤具体包括：

4.如权利要求3所述方法，其特征在于，所述基于所述目标人脸预测值对目标人脸进行筛选的步骤具体包括：

5.如权利要求4所述方法，其特征在于，所述根据所述人脸预测值中的人脸角度，对第二目标人脸集进行筛选，得到最优的目标人脸的步骤具体包括：

6.如权利要求5所述方法，其特征在于，所述卷积神经网络的训练步骤包括：

获取训练数据集；

7.一种基于多目标跟踪的人脸筛选装置，其特征在于，包括：

获取模块，用于获取多目标跟踪算法输出的人脸跟踪结果，所述人脸跟踪结果包括置信度，所述人脸跟踪结果包括：第一预设时间的人脸跟踪结果和第二预设时间的人脸跟踪结果；

输入模块，用于将在第二预设时间内获取到的多个待筛选人脸特征输入预先训练好的卷积神经网络，得到目标人脸预测值，其中，所述第二预设时间为所述第一预设时间的大于1的整数倍，或者所述第二预设时间为所述第一预设时间的间隔的图像帧数的两倍以上的时筛选模块，用于基于所述目标人脸预测值对目标人脸进行筛选；

8.一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的基于多目标跟踪的人脸筛选方法的步骤。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的基于多目标跟踪的人脸筛选方法的步骤。