CN111104897A - 儿童人脸识别模型的训练方法、装置以及存储介质 - Google Patents
儿童人脸识别模型的训练方法、装置以及存储介质 Download PDFInfo
- Publication number
- CN111104897A CN111104897A CN201911310453.3A CN201911310453A CN111104897A CN 111104897 A CN111104897 A CN 111104897A CN 201911310453 A CN201911310453 A CN 201911310453A CN 111104897 A CN111104897 A CN 111104897A
- Authority
- CN
- China
- Prior art keywords
- recognition model
- child
- child face
- face recognition
- face image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 101
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000013528 artificial neural network Methods 0.000 claims abstract description 31
- 230000008014 freezing Effects 0.000 claims abstract description 9
- 238000007710 freezing Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 27
- 230000007704 transition Effects 0.000 claims description 20
- 230000002085 persistent effect Effects 0.000 claims description 3
- 230000001052 transient effect Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种儿童人脸识别模型的训练方法和对应装置,用于进行儿童人脸识别模型的训练。本申请实施例提供的方法包括:获取预先训练好的成人人脸识别模型;获取儿童人脸图像样本集;获得初始图像分类层,并根据儿童人脸图像的身份标签设置初始图像分类层,得到目标人脸图像分类层;使用目标人脸图像分类层替换成人人脸识别模型的分类层,得到初始儿童人脸识别模型;冻结初始儿童人脸识别模型的分类层之前的多层神经网络,使得训练时分类层之前的多层神经网络的参数不变;对过渡儿童人脸识别模型中的分类层之前的多层神经网络进行解冻;使用儿童人脸图像样本集对儿童人脸识别模型进行训练,得到目标儿童人脸识别模型。
Description
技术领域
本申请实施例涉及人脸识别领域,具体涉及一种儿童人脸识别模型的训练方法、装置以及存储介质。
背景技术
人脸识别作为身份识别的重要方式,目前广泛应用于公安、金融、机场、地铁、边防口岸等需要对人员身份进行识别的重要领域中。
人脸识别技术,主要是采集个人的人脸图像进行对比分析,通过人脸图像确认个人身份,目前较优的方式是通过神经网络对人脸图像进行识别。常见的人脸识别模型是按照成人的标准训练的,但是儿童的人脸图像与成人的人脸图像相差较大,不易准确识别。通常提高神经网络对儿童人脸图像识别率的方法是,使用大量对应的儿童人脸图像样本对神经网络进行训练,改善神经网络的参数。
但是,网络上的儿童人脸图像样本数量较少,使用数量较少的儿童人脸图像样本训练人脸识别模型,会由于样本数量不足,导致训练出的人脸识别模型的对儿童的识别准确率不够高。
发明内容
本申请提供了儿童人脸识别模型的训练方法、装置以及存储介质,能够通过有限的儿童人脸图像样本,得到可以准确识别儿童人脸图像的人脸识别模型。
本申请第一方面提供了儿童人脸识别模型的训练方法,包括:
获取预先训练好的成人人脸识别模型,所述成人人脸识别模型使用成人人脸图像样本集训练得到;
获取儿童人脸图像样本集,所述儿童人脸图像样本集包括多个具有身份标签的儿童人脸图像;
获取初始图像分类层,并根据儿童人脸图像的身份标签设置所述初始图像分类层,得到目标人脸图像分类层,其中所述目标人脸图像分类层的输出结果与所述儿童人脸图像样本集的身份标签对应;
使用所述目标人脸图像分类层替换所述成人人脸识别模型的分类层,得到初始儿童人脸识别模型;
冻结所述初始儿童人脸识别模型的分类层之前的多层神经网络,使得训练时所述分类层之前的多层神经网络的参数不变;
使用所述儿童人脸图像样本集训练所述到初始儿童人脸识别模型,得到过渡儿童人脸识别模型;
对所述过渡儿童人脸识别模型中的分类层之前的多层神经网络进行解冻;
使用所述儿童人脸图像样本集对所述儿童人脸识别模型进行训练,得到目标儿童人脸识别模型。
基于本申请实施例第一方面,本申请实施例第一方面的第一种实施方式中,所述使用所述儿童人脸图像样本集训练所述初始儿童人脸识别模型,包括:
从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述初始儿童人脸识别模型得到识别结果;
根据所述识别结果计算所述初始儿童人脸识别模型的损失函数;
判断所述初始儿童识别模型的损失函数是否小于预设值;
若小于所述预设值,确认所述儿童人脸识别模型训练完成;
若大于或等于所述预设值,使用反向传播算法对所述儿童人脸识别模型的分类层进行优化后,则返回从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述初始儿童人脸识别模型得到识别结果的步骤。
基于本申请实施例第一方面的第一种实施方式,本申请实施例第一方面的第二种实施方式中,所述使用所述儿童人脸图像样本集作为训练样本对所述儿童人脸识别模型进行完整训练,包括:
从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述过渡儿童人脸识别模型得到识别结果;
根据所述识别结果判断所述儿童识别模型是否收敛;
若收敛,确认所述儿童人脸识别模型训练完成;
若不收敛,使用反向传播算法对所述儿童人脸识别模型的分类层进行优化后,返回从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述过渡儿童人脸识别模型得到识别结果。
基于本申请实施例第一方面的第一种实施方式,本申请实施例第一方面的第三种实施方式中,所述预设值是所述损失函数的初始值的千分之一。
本申请实施例第二方面提供了一种儿童人脸识别模型的训练装置,包括:
第一获取单元,用于获取预先训练好的成人人脸识别模型,所述成人人脸识别模型使用成人人脸图像样本集训练得到;
第二获取单元,用于获取儿童人脸图像样本集,所述儿童人脸图像样本集包括多个具有身份标签的儿童人脸图像;
第三获取单元,用于获得初始图像分类层,并根据儿童人脸图像的身份标签设置所述初始图像分类层,得到目标人脸图像分类层,其中所述目标人脸图像分类层的输出结果与所述儿童人脸图像样本集的身份标签对应;
替换单元,用于使用所述目标人脸图像分类层替换所述成人人脸识别模型的分类层,得到初始儿童人脸识别模型;
冻结单元,用于冻结所述初始儿童人脸识别模型的分类层之前的多层神经网络,使得训练时所述分类层之前的多层神经网络的参数不变;
第一训练单元,用于使用所述儿童人脸图像样本集训练所述到初始儿童人脸识别模型,得到过渡儿童人脸识别模型;
解冻单元,用于对所述过渡儿童人脸识别模型中的分类层之前的多层神经网络进行解冻;
第二训练单元,用于使用所述儿童人脸图像样本集对所述儿童人脸识别模型进行训练,得到目标儿童人脸识别模型。
基于本申请实施例第一方面,本申请实施例第一方面的第一种实施方式中,所述第一训练单元具体用于:
从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述初始儿童人脸识别模型得到识别结果;
根据所述识别结果计算所述初始儿童人脸识别模型的损失函数;
判断所述初始儿童识别模型的损失函数是否小于预设值;
若小于所述预设值,确认所述儿童人脸识别模型训练完成;
若大于或等于所述预设值,使用反向传播算法对所述儿童人脸识别模型的分类层进行优化后,则返回从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述初始儿童人脸识别模型得到识别结果的步骤。
基于本申请实施例第一方面,本申请实施例第一方面的第二种实施方式中,所述第二训练单元具体用于:
从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述过渡儿童人脸识别模型得到识别结果;
根据所述识别结果判断所述儿童识别模型是否收敛;
若收敛,确认所述儿童人脸识别模型训练完成;
若不收敛,使用反向传播算法对所述儿童人脸识别模型的分类层进行优化后,返回从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述过渡儿童人脸识别模型得到识别结果。
基于本申请实施例第一方面的第一种实施方式,本申请实施例第一方面的第三种实施方式中,所述第二训练单元在执行判断所述初始儿童识别模型的损失函数是否小于预设值时,具体用于判断所述初始儿童识别模型的损失函数是否小于损失函数的初始值的千分之一。
本申请实施例第三方面提供了另一儿童人脸识别模型训练装置,包括中央处理器和存储器,所述存储器为短暂存储存储器或持久存储存储器,所述中央处理器配置为与所述存储器通信,在所述计算机设备上执行所述存储器中的指令操作以实现前述第一方面的任意一种方法。
本申请实施例第四方面提供了一种计算机存储介质,该计算机存储介质中存储有指令,该指令在计算机上执行时,使得计算机执行前述第一方面的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:在儿童人脸图像较少、样本难以获得的情况下,基于成人人脸识别模型进行训练,利用较少的儿童人脸图像大幅提高了人脸识别模型对儿童人脸图像的识别率,解决了模型训练中儿童人脸图像样本较少,导致人脸识别模型对儿童识别率不高的问题。
附图说明
图1为本申请实施例儿童人脸识别模型的训练方法的一个实施例示意图;
图2为本申请实施例儿童人脸识别模型的装置方法的一个实施例示意图;
图3为本申请实施例儿童人脸识别模型的装置方法的另一实施例示意图。
具体实施方式
本申请实施例提供了儿童人脸识别模型的训练方法、装置以及存储介质,能够通过有限的儿童人脸图像样本,得到可以准确识别儿童人脸图像的人脸识别模型,降低儿童人脸识别模型的训练成本,且提高了对儿童人脸图像的识别率。
请参阅图1,本申请实施例中儿童人脸识别模型的训练方法的一个实施例包括:
101、获取预先训练好的成人人脸识别模型;
获取一个经过成人人脸图像样本集训练完成的成人人脸识别模型作为基准模型在此基础上进行本方法。在一个具体的实施方式中,可以采用开源大规模人脸数据集VggFace2共9131个人、特征维度为512的深度网络sphereface20和损失函数AM-softmax训练一个基准的人脸识别模型,该模型训练结束后人脸识别测试集LFW上有较高的准确率,达到99.7%。可以理解的是,本申请实施例提供的方法可以基于多种人脸识别模型,前提条件是该基准模型在当前主流的开源人脸识别测试集上有较高的准确率。因此该人脸识别模型的具体架构可以是当前主流人脸识别模型的任意一种,对模型的具体类型和具体的训练样本也可以不作限定,泛用性较高。
102、获取儿童人脸图像样本集,儿童人脸图像样本集包括多个具有身份标签的儿童人脸图像;
获取儿童人脸图像样本集,该样本集内应当包括多个具有身份标签的儿童人脸图像作为训练样本使用。例如,采集100个3至6岁儿童的共20000张图像构成新的训练数据集,在每个图像中的儿童人脸图像中标注上对应的身份标签。相比于成人人脸图像,儿童的人脸图像资源较少,且难以获取,因此该儿童人脸图像样本集相比于步骤101中的成人人脸图像样本集样本量也较少。
103、获得初始图像分类层,并根据儿童人脸图像样本集设置初始图像分类层,得到目标人脸图像分类层;
获取一个该成人人脸识别模型的对应的初始的图像分类层,并根据儿童人脸图像样本集设置该分类层的类别数量,在分类层里建立对应于儿童人脸图像样本集中的儿童人脸图像的身份标签的输出结果,其中分类层的参数通过随机初始化确定。例如,对应实施例中的例子,当深度神经网络采用特征维度为512的深度网络sphereface20时,为该神经网络对应配置一个sphereface20的分类层,并将分类层的分类也调整到对应于儿童人脸图像样本集的100个儿童的身份标签,并为分类层随机赋予参数值。可以理解的是,本方法适用于目前的大多数人脸识别模型,但是初始分类层的类型应当与作为基准人脸识别模型的成人人脸识别模型适配,即成人人脸识别模型和目标人脸图像分类层类型相同。
104、使用目标人脸图像分类层替换成人人脸识别模型的分类层,得到初始儿童人脸识别模型;
将作为基准人脸识别模型的成人人脸识别模型中网络的分类层移除,接上目标人脸图像分类层后作为初始儿童人脸识别模型。该初始儿童人脸识别模型的分类层分类结果与儿童人脸图像样本集对应,其他各层神经网络与步骤101中的成人人脸识别模型相同。
105、冻结初始儿童人脸识别模型的分类层之前的多层神经网络;
将初始儿童人脸识别模型的分类层之前的各层神经网络学习率置为零,以冻结分类层之前的各层神经网络,使得除了分类层以外的其他层的神经网络参数暂时锁定。可以理解的是,步骤104和步骤105之间并不存在必然的先后顺序,在实际过程中可以按照任意顺序或者同时执行步骤104和步骤105。
106、使用儿童人脸图像样本集训练初始儿童人脸识别模型,得到过渡儿童人脸识别模型;
使用获取的儿童人脸图像样本集对初始儿童人脸识别模型进行训练,并将训练好的模型作为过渡儿童人脸识别模型。一种优选的实施方式是,采用随机梯度下降的优化算法对模型进行优化,每次从儿童人脸图像样本集中随机选择指定数量的儿童人脸图像作为训练样本,送入初始儿童人脸识别模型中进行训练,并监测训练中初始儿童人脸识别模型的损失函数下降情况。在一个较佳的实施方式中,对初始儿童人脸识别模型进行训练,直到模型的损失函数降到初始损失函数的千分之一以下时,认定初始儿童人脸识别模型的训练可以结束,将训练后的初始儿童人脸识别模型作为过渡儿童人脸识别模型,此时的过渡儿童人脸识别模型已经具有一定的儿童面部图像识别能力。
107、解冻过渡儿童人脸识别模型中的分类层之前的多层神经网络;
将步骤105中冻结的分类层之前的各层神经网络解冻,解冻的方式可以是将各层神经网络的学习率置为1或者其他大于0的值,过渡儿童人脸识别模型各层具体的学习率可以设置为与步骤101中的成人人脸识别模型相同,也可以根据具体的模型训练情况设置为其他合适的值。
108、使用儿童人脸图像样本集对过渡儿童人脸识别模型进行训练,得到目标儿童人脸识别模型。
使用儿童人脸图像样本集对过渡儿童人脸识别模型再次进行监督训练,并在训练中对模型的各层都进行优化。优选的实施方式是,采用随机梯度下降的优化算法对模型进行优化,每次从儿童人脸图像样本集中随机选择指定数量的儿童人脸图像作为训练样本,对过渡儿童人脸识别模型进行训练,直至过渡儿童人脸识别模型收敛,可以认为整个训练过程结束。将训练完成后的模型作为目标儿童人脸识别模型,该目标儿童人脸识别模型就是最终训练出的儿童人脸识别模型,能够准确识别儿童的人脸图像,并为其匹配对应的身份标签。
请参阅图2,本申请实施例中人脸识别模型的一个实施例包括:
第一获取单元201,用于获取预先训练好的成人人脸识别模型,成人人脸识别模型使用成人人脸图像样本集训练得到;
第二获取单元202,用于获取儿童人脸图像样本集,儿童人脸图像样本集包括多个具有身份标签的儿童人脸图像;
第三获取单元203,用于获得初始图像分类层,并根据儿童人脸图像的身份标签设置初始图像分类层,得到目标人脸图像分类层,其中目标人脸图像分类层的输出结果与儿童人脸图像样本集的身份标签对应;
替换单元204,用于使用目标人脸图像分类层替换成人人脸识别模型的分类层,得到初始儿童人脸识别模型;
冻结单元205,用于冻结初始儿童人脸识别模型的分类层之前的多层神经网络,使得训练时分类层之前的多层神经网络的参数不变;
第一训练单元206,用于使用儿童人脸图像样本集训练到初始儿童人脸识别模型,得到过渡儿童人脸识别模型;
解冻单元207,用于对过渡儿童人脸识别模型中的分类层之前的多层神经网络进行解冻;
第二训练单元208,用于使用儿童人脸图像样本集对书记是儿童人脸识别模型进行训练,得到目标儿童人脸识别模型。
优选的,第一训练单元206可以用于:
从儿童人脸图像样本集中随机选择儿童人脸图像输入初始儿童人脸识别模型得到识别结果;
根据识别结果计算初始儿童人脸识别模型的损失函数;
判断初始儿童识别模型的损失函数是否小于预设值;
若小于预设值,确认儿童人脸识别模型训练完成;
若大于或等于预设值,使用反向传播算法对初始儿童人脸识别模型的分类层进行优化后,则返回从儿童人脸图像样本集中随机选择儿童人脸图像输入初始儿童人脸识别模型得到识别结果的步骤。
优选的,第二训练单元208还可以用于:
从儿童人脸图像样本集中随机选择儿童人脸图像输入过渡儿童人脸识别模型得到识别结果;
根据识别结果判断儿童人脸识别模型是否收敛;
若收敛,确认儿童人脸识别模型训练完成;
若不收敛,使用反向传播算法对儿童人脸识别模型的分类层进行优化后,返回从儿童人脸图像样本集中随机选择儿童人脸图像输入过渡儿童人脸识别模型得到识别结果。
优选的,第二训练单元208还可以具体用于:
从儿童人脸图像样本集中随机选择儿童人脸图像输入初始儿童人脸识别模型得到识别结果;
根据识别结果计算初始儿童人脸识别模型的损失函数;
判断初始儿童识别模型的损失函数是否小于初始损失函数初始值的千分之一;
若小于损失函数初始值的千分之一,确认初始儿童人脸识别模型训练完成;
若大于损失函数初始值的千分之一,使用反向传播算法对初始儿童人脸识别模型的分类层进行优化后,则返回从儿童人脸图像样本集中随机选择儿童人脸图像输入初始儿童人脸识别模型得到识别结果的步骤。
本实施例中,儿童人脸识别模型的训练装置中各单元所执行的流程与前述图1所示的实施例中描述的方法流程类似,此处不再赘述。
请参阅图3,本申请实施例中儿童人脸识别模型的训练装置的另一个实施例包括:
该儿童人脸识别模型的训练装置300可以包括一个或一个以上中央处理器(central processing units,CPU)301和存储器305,该存储器305中存储有一个或一个以上的应用程序或数据。
其中,存储器305可以是易失性存储或持久存储。存储在存储器305的程序可以包括一个或一个以上模块,每个模块可以包括对儿童人脸识别模型的训练装置中的一系列指令操作。更进一步地,中央处理器301可以设置为与存储器305通信,儿童人脸识别模型的训练装置300上执行存储器305中的一系列指令操作。
儿童人脸识别模型的训练装置300还可以包括一个或一个以上电源302,一个或一个以上有线或无线网络接口303,一个或一个以上输入输出接口304,和/或,一个或一个以上操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等。
该中央处理器301可以执行前述图1所示实施例中的操作,具体此处不再赘述。
本申请实施例还提供了一种计算机存储介质,该计算机存储介质用于储存为上述儿童人脸识别模型的训练装置所用的计算机软件指令,其包括用于执行为儿童人脸识别模型的训练装置所设计的程序,当计算机执行该程序时,可以实现如图1所示的儿童人脸识别模型的训练方法。
可以看出,本申请实施例通过在成熟的成人人脸识别模型的基础上,使用少量的儿童人脸图像样本就能训练出对针对儿童人脸图像识别率较高的人脸识别模型,避免了收集大量儿童人脸图像样本的带来繁琐工作,降低了人脸识别模型的训练成本,提高了识别率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,read-onlymemory)、随机存取存储器(RAM,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (10)
1.一种儿童人脸识别模型的训练方法,其特征在于,包括:
获取预先训练好的成人人脸识别模型,所述成人人脸识别模型使用成人人脸图像样本集训练得到;
获取儿童人脸图像样本集,所述儿童人脸图像样本集包括多个具有身份标签的儿童人脸图像;
获取初始图像分类层,并根据儿童人脸图像的身份标签设置所述初始图像分类层,得到目标人脸图像分类层,其中所述目标人脸图像分类层的输出结果与所述儿童人脸图像样本集的身份标签对应;
使用所述目标人脸图像分类层替换所述成人人脸识别模型的分类层,得到初始儿童人脸识别模型;
冻结所述初始儿童人脸识别模型中分类层之前的多层神经网络,使得训练时所述分类层之前的多层神经网络的参数不变;
使用所述儿童人脸图像样本集训练所述到初始儿童人脸识别模型,得到过渡儿童人脸识别模型;
对所述过渡儿童人脸识别模型中的分类层之前的多层神经网络进行解冻;
使用所述儿童人脸图像样本集对所述过渡儿童人脸识别模型进行训练,得到目标儿童人脸识别模型。
2.根据权利要求1所述的方法,其特征在于,所述使用所述儿童人脸图像样本集训练所述初始儿童人脸识别模型,包括:
从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述初始儿童人脸识别模型得到识别结果;
根据所述识别结果计算所述初始儿童人脸识别模型的损失函数;
判断所述初始儿童识别模型的损失函数是否小于预设值;
若小于所述预设值,确认所述儿童人脸识别模型训练完成;
若大于或等于所述预设值,使用反向传播算法对所述儿童人脸识别模型的分类层进行优化后,则返回从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述初始儿童人脸识别模型得到识别结果的步骤。
3.根据权利要求2所述的方法,其特征在于,所述预设值是所述损失函数的初始值的千分之一。
4.根据权利要求1所述的方法,其特征在于,所述使用所述儿童人脸图像样本集作为训练样本对所述过渡儿童人脸识别模型进行完整训练,包括:
从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述过渡儿童人脸识别模型得到识别结果;
根据所述识别结果判断所述过渡儿童人脸识别模型是否收敛;
若收敛,确认所述过渡儿童人脸识别模型训练完成;
若不收敛,使用反向传播算法对所述儿童人脸识别模型的分类层进行优化后,返回从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述过渡儿童人脸识别模型得到识别结果。
5.一种儿童人脸识别模型的训练装置,其特征在于,包括:
第一获取单元,用于获取预先训练好的成人人脸识别模型,所述成人人脸识别模型使用成人人脸图像样本集训练得到;
第二获取单元,用于获取儿童人脸图像样本集,所述儿童人脸图像样本集包括多个具有身份标签的儿童人脸图像;
第三获取单元,用于获取初始图像分类层,并根据儿童人脸图像的身份标签设置所述初始图像分类层,得到目标人脸图像分类层,其中所述目标人脸图像分类层的输出结果与所述儿童人脸图像样本集的身份标签对应;
替换单元,用于使用所述目标人脸图像分类层替换所述成人人脸识别模型的分类层,得到初始儿童人脸识别模型;
冻结单元,用于冻结所述初始儿童人脸识别模型的分类层之前的多层神经网络,使得训练时所述分类层之前的多层神经网络的参数不变;
第一训练单元,用于使用所述儿童人脸图像样本集训练所述到初始儿童人脸识别模型,得到过渡儿童人脸识别模型;
解冻单元,用于对所述过渡儿童人脸识别模型中的分类层之前的多层神经网络进行解冻;
第二训练单元,用于使用所述儿童人脸图像样本集对所述儿童人脸识别模型进行训练,得到目标儿童人脸识别模型。
6.根据权利要求5所述的儿童人脸识别模型的训练装置,其特征在于,所述第一训练单元具体用于:
从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述初始儿童人脸识别模型得到识别结果;
根据所述识别结果计算所述初始儿童人脸识别模型的损失函数;
判断所述初始儿童识别模型的损失函数是否小于预设值;
若小于所述预设值,确认所述儿童人脸识别模型训练完成;
若大于或等于所述预设值,使用反向传播算法对所述儿童人脸识别模型的分类层进行优化后,则返回从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述初始儿童人脸识别模型得到识别结果的步骤。
7.根据权利要求6所述的儿童人脸识别模型的训练装置,其特征在于,所述第二训练单元在执行判断所述初始儿童识别模型的损失函数是否小于预设值时,具体用于判断所述初始儿童识别模型的损失函数是否小于损失函数的初始值的千分之一。
8.根据权利要求5所述的儿童人脸识别模型的训练装置,其特征在于,所述第二训练单元具体用于:
从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述过渡儿童人脸识别模型得到识别结果;
根据所述识别结果判断所述儿童识别模型是否收敛;
若收敛,确认所述儿童人脸识别模型训练完成;
若不收敛,使用反向传播算法对所述儿童人脸识别模型的分类层进行优化后,返回从所述儿童人脸图像样本集中随机选择儿童人脸图像输入所述过渡儿童人脸识别模型得到识别结果。
9.一种儿童人脸识别模型的训练装置,其特征在于,包括中央处理器和存储器,所述存储器为短暂存储存储器或持久存储存储器,所述中央处理器配置为与所述存储器通信,在所述计算机设备上执行所述存储器中的指令操作以执行权利要求1至8中任意一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有指令,所述指令在计算机上执行时,使得所述计算机执行如权利要求1至4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911310453.3A CN111104897A (zh) | 2019-12-18 | 2019-12-18 | 儿童人脸识别模型的训练方法、装置以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911310453.3A CN111104897A (zh) | 2019-12-18 | 2019-12-18 | 儿童人脸识别模型的训练方法、装置以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111104897A true CN111104897A (zh) | 2020-05-05 |
Family
ID=70423099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911310453.3A Pending CN111104897A (zh) | 2019-12-18 | 2019-12-18 | 儿童人脸识别模型的训练方法、装置以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111104897A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111860333A (zh) * | 2020-07-22 | 2020-10-30 | 安徽兰臣信息科技有限公司 | 一种跨年龄识别的儿童人脸识别算法 |
CN113688710A (zh) * | 2021-08-17 | 2021-11-23 | 哈尔滨医科大学 | 儿童孤独症训练系统及其方法 |
CN114758530A (zh) * | 2022-04-28 | 2022-07-15 | 浙江理工大学 | 一种婴幼儿面孔能力训练程序及训练方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030033535A1 (en) * | 2000-01-27 | 2003-02-13 | Gwyn Fisher | Method and system for implementing a common user logon to multiple applications |
CN108710974A (zh) * | 2018-05-18 | 2018-10-26 | 中国农业大学 | 一种基于深度置信网络的水体氨氮预测方法及装置 |
CN108875486A (zh) * | 2017-09-28 | 2018-11-23 | 北京旷视科技有限公司 | 目标对象识别方法、装置、系统和计算机可读介质 |
CN109299716A (zh) * | 2018-08-07 | 2019-02-01 | 北京市商汤科技开发有限公司 | 神经网络的训练方法、图像分割方法、装置、设备及介质 |
CN109325527A (zh) * | 2018-09-05 | 2019-02-12 | 哈尔滨工程大学 | 一种基于迁移学习与深度学习的侧扫声呐图像目标自动分类方法 |
CN110197099A (zh) * | 2018-02-26 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 跨年龄人脸识别及其模型训练的方法和装置 |
CN110415238A (zh) * | 2019-07-31 | 2019-11-05 | 河海大学常州校区 | 基于反向瓶颈结构深度卷积网络的膜片瑕点检测方法 |
CN110427846A (zh) * | 2019-07-19 | 2019-11-08 | 西安工业大学 | 一种利用卷积神经网络对不平衡小样本的人脸识别方法 |
CN110543815A (zh) * | 2019-07-22 | 2019-12-06 | 平安科技(深圳)有限公司 | 人脸识别模型的训练方法、人脸识别方法、装置、设备及存储介质 |
-
2019
- 2019-12-18 CN CN201911310453.3A patent/CN111104897A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030033535A1 (en) * | 2000-01-27 | 2003-02-13 | Gwyn Fisher | Method and system for implementing a common user logon to multiple applications |
CN108875486A (zh) * | 2017-09-28 | 2018-11-23 | 北京旷视科技有限公司 | 目标对象识别方法、装置、系统和计算机可读介质 |
CN110197099A (zh) * | 2018-02-26 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 跨年龄人脸识别及其模型训练的方法和装置 |
CN108710974A (zh) * | 2018-05-18 | 2018-10-26 | 中国农业大学 | 一种基于深度置信网络的水体氨氮预测方法及装置 |
CN109299716A (zh) * | 2018-08-07 | 2019-02-01 | 北京市商汤科技开发有限公司 | 神经网络的训练方法、图像分割方法、装置、设备及介质 |
CN109325527A (zh) * | 2018-09-05 | 2019-02-12 | 哈尔滨工程大学 | 一种基于迁移学习与深度学习的侧扫声呐图像目标自动分类方法 |
CN110427846A (zh) * | 2019-07-19 | 2019-11-08 | 西安工业大学 | 一种利用卷积神经网络对不平衡小样本的人脸识别方法 |
CN110543815A (zh) * | 2019-07-22 | 2019-12-06 | 平安科技(深圳)有限公司 | 人脸识别模型的训练方法、人脸识别方法、装置、设备及存储介质 |
CN110415238A (zh) * | 2019-07-31 | 2019-11-05 | 河海大学常州校区 | 基于反向瓶颈结构深度卷积网络的膜片瑕点检测方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111860333A (zh) * | 2020-07-22 | 2020-10-30 | 安徽兰臣信息科技有限公司 | 一种跨年龄识别的儿童人脸识别算法 |
CN113688710A (zh) * | 2021-08-17 | 2021-11-23 | 哈尔滨医科大学 | 儿童孤独症训练系统及其方法 |
CN114758530A (zh) * | 2022-04-28 | 2022-07-15 | 浙江理工大学 | 一种婴幼儿面孔能力训练程序及训练方法 |
CN114758530B (zh) * | 2022-04-28 | 2023-08-08 | 浙江理工大学 | 一种婴幼儿面孔能力训练程序及训练方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108737406B (zh) | 一种异常流量数据的检测方法及系统 | |
CN108235770A (zh) | 图像识别方法及云端系统 | |
CN111104897A (zh) | 儿童人脸识别模型的训练方法、装置以及存储介质 | |
CN110070029B (zh) | 一种步态识别方法及装置 | |
CN105117692A (zh) | 一种基于深度学习的实时人脸识别方法及系统 | |
JP2022141931A (ja) | 生体検出モデルのトレーニング方法及び装置、生体検出の方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム | |
CN108229262B (zh) | 一种色情视频检测方法及装置 | |
CN110287889A (zh) | 一种身份识别的方法及装置 | |
CN104239858A (zh) | 一种人脸特征验证的方法和装置 | |
CN106778851B (zh) | 基于手机取证数据的社交关系预测系统及其方法 | |
CN110809768B (zh) | 数据清洗系统和方法 | |
CN112905997B (zh) | 面向深度学习模型中毒攻击的检测方法、装置及系统 | |
CN111401105B (zh) | 一种视频表情识别方法、装置及设备 | |
CN111814832A (zh) | 一种目标检测方法、装置及存储介质 | |
CN111582358A (zh) | 户型识别模型的训练方法及装置、户型判重的方法及装置 | |
CN112200862B (zh) | 目标检测模型的训练方法、目标检测方法及装置 | |
CN113192028B (zh) | 人脸图像的质量评价方法、装置、电子设备及存储介质 | |
CN116450671B (zh) | 智能交互会话大数据分析方法及大数据服务器 | |
CN110555007B (zh) | 盗号行为判别方法、装置、计算设备及存储介质 | |
CN116977834A (zh) | 一种开放条件下分布内外图像识别方法 | |
CN117056842A (zh) | 构建设备异常监测模型的方法、装置、设备、介质及产品 | |
CN115249377A (zh) | 一种微表情的识别方法及装置 | |
CN114049126A (zh) | 安全认证方法及装置 | |
CN110942081B (zh) | 图像处理方法、装置、电子设备及可读存储介质 | |
CN113420824A (zh) | 针对工业视觉应用的预训练数据筛选及训练方法、系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200505 |
|
RJ01 | Rejection of invention patent application after publication |