CN111104897A

CN111104897A - 儿童人脸识别模型的训练方法、装置以及存储介质

Info

Publication number: CN111104897A
Application number: CN201911310453.3A
Authority: CN
Inventors: 唐健; 石伟; 陶昆; 王志元
Original assignee: Shenzhen Jieshun Science and Technology Industry Co Ltd
Current assignee: Shenzhen Jieshun Science and Technology Industry Co Ltd
Priority date: 2019-12-18
Filing date: 2019-12-18
Publication date: 2020-05-05

Abstract

本申请实施例公开了一种儿童人脸识别模型的训练方法和对应装置，用于进行儿童人脸识别模型的训练。本申请实施例提供的方法包括：获取预先训练好的成人人脸识别模型；获取儿童人脸图像样本集；获得初始图像分类层，并根据儿童人脸图像的身份标签设置初始图像分类层，得到目标人脸图像分类层；使用目标人脸图像分类层替换成人人脸识别模型的分类层，得到初始儿童人脸识别模型；冻结初始儿童人脸识别模型的分类层之前的多层神经网络，使得训练时分类层之前的多层神经网络的参数不变；对过渡儿童人脸识别模型中的分类层之前的多层神经网络进行解冻；使用儿童人脸图像样本集对儿童人脸识别模型进行训练，得到目标儿童人脸识别模型。

Description

儿童人脸识别模型的训练方法、装置以及存储介质

技术领域

本申请实施例涉及人脸识别领域，具体涉及一种儿童人脸识别模型的训练方法、装置以及存储介质。

背景技术

人脸识别作为身份识别的重要方式，目前广泛应用于公安、金融、机场、地铁、边防口岸等需要对人员身份进行识别的重要领域中。

人脸识别技术，主要是采集个人的人脸图像进行对比分析，通过人脸图像确认个人身份，目前较优的方式是通过神经网络对人脸图像进行识别。常见的人脸识别模型是按照成人的标准训练的，但是儿童的人脸图像与成人的人脸图像相差较大，不易准确识别。通常提高神经网络对儿童人脸图像识别率的方法是，使用大量对应的儿童人脸图像样本对神经网络进行训练，改善神经网络的参数。

但是，网络上的儿童人脸图像样本数量较少，使用数量较少的儿童人脸图像样本训练人脸识别模型，会由于样本数量不足，导致训练出的人脸识别模型的对儿童的识别准确率不够高。

发明内容

本申请提供了儿童人脸识别模型的训练方法、装置以及存储介质，能够通过有限的儿童人脸图像样本，得到可以准确识别儿童人脸图像的人脸识别模型。

本申请第一方面提供了儿童人脸识别模型的训练方法，包括：

获取预先训练好的成人人脸识别模型，所述成人人脸识别模型使用成人人脸图像样本集训练得到；

获取儿童人脸图像样本集，所述儿童人脸图像样本集包括多个具有身份标签的儿童人脸图像；

获取初始图像分类层，并根据儿童人脸图像的身份标签设置所述初始图像分类层，得到目标人脸图像分类层，其中所述目标人脸图像分类层的输出结果与所述儿童人脸图像样本集的身份标签对应；

使用所述目标人脸图像分类层替换所述成人人脸识别模型的分类层，得到初始儿童人脸识别模型；

冻结所述初始儿童人脸识别模型的分类层之前的多层神经网络，使得训练时所述分类层之前的多层神经网络的参数不变；

使用所述儿童人脸图像样本集训练所述到初始儿童人脸识别模型，得到过渡儿童人脸识别模型；

对所述过渡儿童人脸识别模型中的分类层之前的多层神经网络进行解冻；

使用所述儿童人脸图像样本集对所述儿童人脸识别模型进行训练，得到目标儿童人脸识别模型。

基于本申请实施例第一方面，本申请实施例第一方面的第一种实施方式中，所述使用所述儿童人脸图像样本集训练所述初始儿童人脸识别模型，包括：

从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述初始儿童人脸识别模型得到识别结果；

根据所述识别结果计算所述初始儿童人脸识别模型的损失函数；

判断所述初始儿童识别模型的损失函数是否小于预设值；

若小于所述预设值，确认所述儿童人脸识别模型训练完成；

若大于或等于所述预设值，使用反向传播算法对所述儿童人脸识别模型的分类层进行优化后，则返回从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述初始儿童人脸识别模型得到识别结果的步骤。

基于本申请实施例第一方面的第一种实施方式，本申请实施例第一方面的第二种实施方式中，所述使用所述儿童人脸图像样本集作为训练样本对所述儿童人脸识别模型进行完整训练，包括：

从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述过渡儿童人脸识别模型得到识别结果；

根据所述识别结果判断所述儿童识别模型是否收敛；

若收敛，确认所述儿童人脸识别模型训练完成；

若不收敛，使用反向传播算法对所述儿童人脸识别模型的分类层进行优化后，返回从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述过渡儿童人脸识别模型得到识别结果。

基于本申请实施例第一方面的第一种实施方式，本申请实施例第一方面的第三种实施方式中，所述预设值是所述损失函数的初始值的千分之一。

本申请实施例第二方面提供了一种儿童人脸识别模型的训练装置，包括：

第一获取单元，用于获取预先训练好的成人人脸识别模型，所述成人人脸识别模型使用成人人脸图像样本集训练得到；

第二获取单元，用于获取儿童人脸图像样本集，所述儿童人脸图像样本集包括多个具有身份标签的儿童人脸图像；

第三获取单元，用于获得初始图像分类层，并根据儿童人脸图像的身份标签设置所述初始图像分类层，得到目标人脸图像分类层，其中所述目标人脸图像分类层的输出结果与所述儿童人脸图像样本集的身份标签对应；

替换单元，用于使用所述目标人脸图像分类层替换所述成人人脸识别模型的分类层，得到初始儿童人脸识别模型；

冻结单元，用于冻结所述初始儿童人脸识别模型的分类层之前的多层神经网络，使得训练时所述分类层之前的多层神经网络的参数不变；

第一训练单元，用于使用所述儿童人脸图像样本集训练所述到初始儿童人脸识别模型，得到过渡儿童人脸识别模型；

解冻单元，用于对所述过渡儿童人脸识别模型中的分类层之前的多层神经网络进行解冻；

第二训练单元，用于使用所述儿童人脸图像样本集对所述儿童人脸识别模型进行训练，得到目标儿童人脸识别模型。

基于本申请实施例第一方面，本申请实施例第一方面的第一种实施方式中，所述第一训练单元具体用于：

判断所述初始儿童识别模型的损失函数是否小于预设值；

若小于所述预设值，确认所述儿童人脸识别模型训练完成；

基于本申请实施例第一方面，本申请实施例第一方面的第二种实施方式中，所述第二训练单元具体用于：

根据所述识别结果判断所述儿童识别模型是否收敛；

若收敛，确认所述儿童人脸识别模型训练完成；

基于本申请实施例第一方面的第一种实施方式，本申请实施例第一方面的第三种实施方式中，所述第二训练单元在执行判断所述初始儿童识别模型的损失函数是否小于预设值时，具体用于判断所述初始儿童识别模型的损失函数是否小于损失函数的初始值的千分之一。

本申请实施例第三方面提供了另一儿童人脸识别模型训练装置，包括中央处理器和存储器，所述存储器为短暂存储存储器或持久存储存储器，所述中央处理器配置为与所述存储器通信，在所述计算机设备上执行所述存储器中的指令操作以实现前述第一方面的任意一种方法。

本申请实施例第四方面提供了一种计算机存储介质，该计算机存储介质中存储有指令，该指令在计算机上执行时，使得计算机执行前述第一方面的方法。

从以上技术方案可以看出，本申请实施例具有以下优点：在儿童人脸图像较少、样本难以获得的情况下，基于成人人脸识别模型进行训练，利用较少的儿童人脸图像大幅提高了人脸识别模型对儿童人脸图像的识别率，解决了模型训练中儿童人脸图像样本较少，导致人脸识别模型对儿童识别率不高的问题。

附图说明

图1为本申请实施例儿童人脸识别模型的训练方法的一个实施例示意图；

图2为本申请实施例儿童人脸识别模型的装置方法的一个实施例示意图；

图3为本申请实施例儿童人脸识别模型的装置方法的另一实施例示意图。

具体实施方式

本申请实施例提供了儿童人脸识别模型的训练方法、装置以及存储介质，能够通过有限的儿童人脸图像样本，得到可以准确识别儿童人脸图像的人脸识别模型，降低儿童人脸识别模型的训练成本，且提高了对儿童人脸图像的识别率。

请参阅图1，本申请实施例中儿童人脸识别模型的训练方法的一个实施例包括：

101、获取预先训练好的成人人脸识别模型；

获取一个经过成人人脸图像样本集训练完成的成人人脸识别模型作为基准模型在此基础上进行本方法。在一个具体的实施方式中，可以采用开源大规模人脸数据集VggFace2共9131个人、特征维度为512的深度网络sphereface20和损失函数AM-softmax训练一个基准的人脸识别模型，该模型训练结束后人脸识别测试集LFW上有较高的准确率，达到99.7％。可以理解的是，本申请实施例提供的方法可以基于多种人脸识别模型，前提条件是该基准模型在当前主流的开源人脸识别测试集上有较高的准确率。因此该人脸识别模型的具体架构可以是当前主流人脸识别模型的任意一种，对模型的具体类型和具体的训练样本也可以不作限定，泛用性较高。

102、获取儿童人脸图像样本集，儿童人脸图像样本集包括多个具有身份标签的儿童人脸图像；

获取儿童人脸图像样本集，该样本集内应当包括多个具有身份标签的儿童人脸图像作为训练样本使用。例如，采集100个3至6岁儿童的共20000张图像构成新的训练数据集，在每个图像中的儿童人脸图像中标注上对应的身份标签。相比于成人人脸图像，儿童的人脸图像资源较少，且难以获取，因此该儿童人脸图像样本集相比于步骤101中的成人人脸图像样本集样本量也较少。

103、获得初始图像分类层，并根据儿童人脸图像样本集设置初始图像分类层，得到目标人脸图像分类层；

获取一个该成人人脸识别模型的对应的初始的图像分类层，并根据儿童人脸图像样本集设置该分类层的类别数量，在分类层里建立对应于儿童人脸图像样本集中的儿童人脸图像的身份标签的输出结果，其中分类层的参数通过随机初始化确定。例如，对应实施例中的例子，当深度神经网络采用特征维度为512的深度网络sphereface20时，为该神经网络对应配置一个sphereface20的分类层，并将分类层的分类也调整到对应于儿童人脸图像样本集的100个儿童的身份标签，并为分类层随机赋予参数值。可以理解的是，本方法适用于目前的大多数人脸识别模型，但是初始分类层的类型应当与作为基准人脸识别模型的成人人脸识别模型适配，即成人人脸识别模型和目标人脸图像分类层类型相同。

104、使用目标人脸图像分类层替换成人人脸识别模型的分类层，得到初始儿童人脸识别模型；

将作为基准人脸识别模型的成人人脸识别模型中网络的分类层移除，接上目标人脸图像分类层后作为初始儿童人脸识别模型。该初始儿童人脸识别模型的分类层分类结果与儿童人脸图像样本集对应，其他各层神经网络与步骤101中的成人人脸识别模型相同。

105、冻结初始儿童人脸识别模型的分类层之前的多层神经网络；

将初始儿童人脸识别模型的分类层之前的各层神经网络学习率置为零，以冻结分类层之前的各层神经网络，使得除了分类层以外的其他层的神经网络参数暂时锁定。可以理解的是，步骤104和步骤105之间并不存在必然的先后顺序，在实际过程中可以按照任意顺序或者同时执行步骤104和步骤105。

106、使用儿童人脸图像样本集训练初始儿童人脸识别模型，得到过渡儿童人脸识别模型；

使用获取的儿童人脸图像样本集对初始儿童人脸识别模型进行训练，并将训练好的模型作为过渡儿童人脸识别模型。一种优选的实施方式是，采用随机梯度下降的优化算法对模型进行优化，每次从儿童人脸图像样本集中随机选择指定数量的儿童人脸图像作为训练样本，送入初始儿童人脸识别模型中进行训练，并监测训练中初始儿童人脸识别模型的损失函数下降情况。在一个较佳的实施方式中，对初始儿童人脸识别模型进行训练，直到模型的损失函数降到初始损失函数的千分之一以下时，认定初始儿童人脸识别模型的训练可以结束，将训练后的初始儿童人脸识别模型作为过渡儿童人脸识别模型，此时的过渡儿童人脸识别模型已经具有一定的儿童面部图像识别能力。

107、解冻过渡儿童人脸识别模型中的分类层之前的多层神经网络；

将步骤105中冻结的分类层之前的各层神经网络解冻，解冻的方式可以是将各层神经网络的学习率置为1或者其他大于0的值，过渡儿童人脸识别模型各层具体的学习率可以设置为与步骤101中的成人人脸识别模型相同，也可以根据具体的模型训练情况设置为其他合适的值。

108、使用儿童人脸图像样本集对过渡儿童人脸识别模型进行训练，得到目标儿童人脸识别模型。

使用儿童人脸图像样本集对过渡儿童人脸识别模型再次进行监督训练，并在训练中对模型的各层都进行优化。优选的实施方式是，采用随机梯度下降的优化算法对模型进行优化，每次从儿童人脸图像样本集中随机选择指定数量的儿童人脸图像作为训练样本，对过渡儿童人脸识别模型进行训练，直至过渡儿童人脸识别模型收敛，可以认为整个训练过程结束。将训练完成后的模型作为目标儿童人脸识别模型，该目标儿童人脸识别模型就是最终训练出的儿童人脸识别模型，能够准确识别儿童的人脸图像，并为其匹配对应的身份标签。

请参阅图2，本申请实施例中人脸识别模型的一个实施例包括：

第一获取单元201，用于获取预先训练好的成人人脸识别模型，成人人脸识别模型使用成人人脸图像样本集训练得到；

第二获取单元202，用于获取儿童人脸图像样本集，儿童人脸图像样本集包括多个具有身份标签的儿童人脸图像；

第三获取单元203，用于获得初始图像分类层，并根据儿童人脸图像的身份标签设置初始图像分类层，得到目标人脸图像分类层，其中目标人脸图像分类层的输出结果与儿童人脸图像样本集的身份标签对应；

替换单元204，用于使用目标人脸图像分类层替换成人人脸识别模型的分类层，得到初始儿童人脸识别模型；

冻结单元205，用于冻结初始儿童人脸识别模型的分类层之前的多层神经网络，使得训练时分类层之前的多层神经网络的参数不变；

第一训练单元206，用于使用儿童人脸图像样本集训练到初始儿童人脸识别模型，得到过渡儿童人脸识别模型；

解冻单元207，用于对过渡儿童人脸识别模型中的分类层之前的多层神经网络进行解冻；

第二训练单元208，用于使用儿童人脸图像样本集对书记是儿童人脸识别模型进行训练，得到目标儿童人脸识别模型。

优选的，第一训练单元206可以用于：

从儿童人脸图像样本集中随机选择儿童人脸图像输入初始儿童人脸识别模型得到识别结果；

根据识别结果计算初始儿童人脸识别模型的损失函数；

判断初始儿童识别模型的损失函数是否小于预设值；

若小于预设值，确认儿童人脸识别模型训练完成；

若大于或等于预设值，使用反向传播算法对初始儿童人脸识别模型的分类层进行优化后，则返回从儿童人脸图像样本集中随机选择儿童人脸图像输入初始儿童人脸识别模型得到识别结果的步骤。

优选的，第二训练单元208还可以用于：

从儿童人脸图像样本集中随机选择儿童人脸图像输入过渡儿童人脸识别模型得到识别结果；

根据识别结果判断儿童人脸识别模型是否收敛；

若收敛，确认儿童人脸识别模型训练完成；

若不收敛，使用反向传播算法对儿童人脸识别模型的分类层进行优化后，返回从儿童人脸图像样本集中随机选择儿童人脸图像输入过渡儿童人脸识别模型得到识别结果。

优选的，第二训练单元208还可以具体用于：

根据识别结果计算初始儿童人脸识别模型的损失函数；

判断初始儿童识别模型的损失函数是否小于初始损失函数初始值的千分之一；

若小于损失函数初始值的千分之一，确认初始儿童人脸识别模型训练完成；

若大于损失函数初始值的千分之一，使用反向传播算法对初始儿童人脸识别模型的分类层进行优化后，则返回从儿童人脸图像样本集中随机选择儿童人脸图像输入初始儿童人脸识别模型得到识别结果的步骤。

本实施例中，儿童人脸识别模型的训练装置中各单元所执行的流程与前述图1所示的实施例中描述的方法流程类似，此处不再赘述。

请参阅图3，本申请实施例中儿童人脸识别模型的训练装置的另一个实施例包括：

该儿童人脸识别模型的训练装置300可以包括一个或一个以上中央处理器(central processing units，CPU)301和存储器305，该存储器305中存储有一个或一个以上的应用程序或数据。

其中，存储器305可以是易失性存储或持久存储。存储在存储器305的程序可以包括一个或一个以上模块，每个模块可以包括对儿童人脸识别模型的训练装置中的一系列指令操作。更进一步地，中央处理器301可以设置为与存储器305通信，儿童人脸识别模型的训练装置300上执行存储器305中的一系列指令操作。

儿童人脸识别模型的训练装置300还可以包括一个或一个以上电源302，一个或一个以上有线或无线网络接口303，一个或一个以上输入输出接口304，和/或，一个或一个以上操作系统，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等。

该中央处理器301可以执行前述图1所示实施例中的操作，具体此处不再赘述。

本申请实施例还提供了一种计算机存储介质，该计算机存储介质用于储存为上述儿童人脸识别模型的训练装置所用的计算机软件指令，其包括用于执行为儿童人脸识别模型的训练装置所设计的程序，当计算机执行该程序时，可以实现如图1所示的儿童人脸识别模型的训练方法。

可以看出，本申请实施例通过在成熟的成人人脸识别模型的基础上，使用少量的儿童人脸图像样本就能训练出对针对儿童人脸图像识别率较高的人脸识别模型，避免了收集大量儿童人脸图像样本的带来繁琐工作，降低了人脸识别模型的训练成本，提高了识别率。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，read-onlymemory)、随机存取存储器(RAM，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

1.一种儿童人脸识别模型的训练方法，其特征在于，包括：

冻结所述初始儿童人脸识别模型中分类层之前的多层神经网络，使得训练时所述分类层之前的多层神经网络的参数不变；

使用所述儿童人脸图像样本集对所述过渡儿童人脸识别模型进行训练，得到目标儿童人脸识别模型。

2.根据权利要求1所述的方法，其特征在于，所述使用所述儿童人脸图像样本集训练所述初始儿童人脸识别模型，包括：

判断所述初始儿童识别模型的损失函数是否小于预设值；

若小于所述预设值，确认所述儿童人脸识别模型训练完成；

3.根据权利要求2所述的方法，其特征在于，所述预设值是所述损失函数的初始值的千分之一。

4.根据权利要求1所述的方法，其特征在于，所述使用所述儿童人脸图像样本集作为训练样本对所述过渡儿童人脸识别模型进行完整训练，包括：

根据所述识别结果判断所述过渡儿童人脸识别模型是否收敛；

若收敛，确认所述过渡儿童人脸识别模型训练完成；

5.一种儿童人脸识别模型的训练装置，其特征在于，包括：

第三获取单元，用于获取初始图像分类层，并根据儿童人脸图像的身份标签设置所述初始图像分类层，得到目标人脸图像分类层，其中所述目标人脸图像分类层的输出结果与所述儿童人脸图像样本集的身份标签对应；

6.根据权利要求5所述的儿童人脸识别模型的训练装置，其特征在于，所述第一训练单元具体用于：

判断所述初始儿童识别模型的损失函数是否小于预设值；

若小于所述预设值，确认所述儿童人脸识别模型训练完成；

7.根据权利要求6所述的儿童人脸识别模型的训练装置，其特征在于，所述第二训练单元在执行判断所述初始儿童识别模型的损失函数是否小于预设值时，具体用于判断所述初始儿童识别模型的损失函数是否小于损失函数的初始值的千分之一。

8.根据权利要求5所述的儿童人脸识别模型的训练装置，其特征在于，所述第二训练单元具体用于：

根据所述识别结果判断所述儿童识别模型是否收敛；

若收敛，确认所述儿童人脸识别模型训练完成；

9.一种儿童人脸识别模型的训练装置，其特征在于，包括中央处理器和存储器，所述存储器为短暂存储存储器或持久存储存储器，所述中央处理器配置为与所述存储器通信，在所述计算机设备上执行所述存储器中的指令操作以执行权利要求1至8中任意一项所述的方法。

10.一种计算机存储介质，其特征在于，所述计算机存储介质中存储有指令，所述指令在计算机上执行时，使得所述计算机执行如权利要求1至4中任一项所述的方法。