CN114360008A - 人脸认证模型的生成方法、认证方法、设备及存储介质 - Google Patents
人脸认证模型的生成方法、认证方法、设备及存储介质 Download PDFInfo
- Publication number
- CN114360008A CN114360008A CN202111591243.3A CN202111591243A CN114360008A CN 114360008 A CN114360008 A CN 114360008A CN 202111591243 A CN202111591243 A CN 202111591243A CN 114360008 A CN114360008 A CN 114360008A
- Authority
- CN
- China
- Prior art keywords
- face
- face authentication
- training
- authentication model
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Collating Specific Patterns (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种人脸认证模型的生成方法、认证方法、设备及存储介质,生成方法包括:获取第一人脸认证模型;获取第一训练集;通过第一训练集训练第一人脸认证模型以获取第二人脸认证模型,且在训练的过程中调整第一分类矩阵参数以获取第二分类矩阵模块;通过第一训练集训练第二人脸认证模型以获取目标人脸认证模型,且在训练的过程中调整第一人脸特征提取参数以获取第二人脸特征提取模块,调整第二分类矩阵参数以获取第三分类矩阵模块。本发明相对使用高成本构建大型人脸数据集的方式而言,可以针对特定场景采集包括少量人脸样本的人脸数据集,进行集成训练,降低了模型构建成本,提升了特定场景下人脸认证模型的性能,降低了误识别率。
Description
技术领域
本发明涉及人脸认证领域,特别涉及一种人脸认证模型的生成方法、认证方法、设备及存储介质。
背景技术
随着计算机计算能力的提高,特别是GPU(graphics processing unit,图形处理器)显卡的特定浮点运算加速,以及互联网发展带来的海量训练数据,使用基于神经网络的机器学习方式得到了充足的发展,在计算机视觉、自然语言处理、语音识别等方面取得了一定的效果。其中人脸识别作为一个重要应用,采用深度卷积神经网络的方式,也取得了比传统人工特征方式要更好的效果。在人脸比对检测的场景中,有1:1和1:N两种比对需求。在1:N比对中,要求找出待比对的人脸是否在有N个人脸的底库中,这是通过待比对人脸和底库中的N个人脸逐个对比以计算相似度,在N比较大时,容易出现误识别,即误检测某两张不同人脸为相同的人。
要降低误识别率,需要进一步提升基于深度学习的人脸认证模型的性能,其中一种方法是提供更大更好的数据集进行训练。人脸认证是一种基于分类的度量学习,在训练过程中,要求训练集中的人脸ID(标识符)不能重复,否则得到的验证模型容易出现误识别人脸的情况,而收集一个丰富的人脸数据集是一项成本很高的任务。现有的数据集,无论公开的或私有的,规模各异,数量众多,由于各数据集不能确定是否有人脸ID重复,基于这样的数据集难以训练出能够准确识别人脸的人脸认证模型,即训练出来了的模型容易错将不同的人脸识别为相同的人。
发明内容
本发明要解决的技术问题是为了克服现有技术中难以以低成本的方式构建能够准确识别人脸的人脸认证模型的缺陷,提供一种能够以低成本的方式构建能够准确识别人脸的人脸认证模型的人脸认证模型的生成方法、认证方法、设备及存储介质。
本发明是通过下述技术方案来解决上述技术问题:
本发明提供了一种人脸认证模型的生成方法,所述生成方法包括以下步骤:
获取第一人脸认证模型,所述第一人脸认证模型包括第一人脸特征提取模块及第一分类矩阵模块,数据从所述第一人脸特征提取模块输入,所述第一人脸特征提取模块的输出作为所述第一分类矩阵模块的输入,所述第一人脸特征提取模块包括第一人脸特征提取参数,所述第一分类矩阵模块包括第一分类矩阵参数;
获取第一训练集,所述第一训练集包括若干人脸图像;
通过所述第一训练集训练所述第一人脸认证模型以获取第二人脸认证模型,且在训练的过程中调整所述第一分类矩阵参数以获取第二分类矩阵模块,所述第二分类矩阵模块包括第二分类矩阵参数,所述第二人脸认证模型包括所述第一人脸特征提取模块及所述第二分类矩阵模块;
通过所述第一训练集训练所述第二人脸认证模型以获取目标人脸认证模型,且在训练的过程中调整所述第一人脸特征提取参数以获取第二人脸特征提取模块,调整所述第二分类矩阵参数以获取第三分类矩阵模块,所述目标人脸认证模型包括所述第二人脸特征提取模块及所述第三分类矩阵模块。
较佳地,所述训练所述第一人脸认证模型的步骤包括:使用第一学习率训练所述第一人脸认证模型;
所述训练所述第二人脸认证模型的步骤包括:使用第二学习率训练所述第二人脸认证模型;
所述第二学习率小于所述第一学习率;和/或,
所述训练所述第一人脸认证模型以获取第二人脸认证模型的步骤包括:
训练所述第一人脸认证模型;
当目标损失函数收敛且损失值小于第一预设值时完成训练,获得第二人脸认证模型;
所述训练所述第二人脸认证模型以获取目标人脸认证模型的步骤包括:
训练所述第二人脸认证模型;
当目标损失函数收敛且损失值小于第二预设值时完成训练,获得目标人脸认证模型,所述第二预设值小于所述第一预设值。
较佳地,所述第一训练集包括目标场景下的若干人脸图像。
较佳地,所述获取第一人脸认证模型的步骤包括:
通过第二训练集训练人脸认证算法以获取第一人脸认证模型,所述人脸认证算法包括初始人脸特征提取模块及初始分类矩阵模块,所述人脸特征提取模块包括初始人脸特征提取参数,所述初始分类矩阵模块包括初始分类矩阵参数。
较佳地,所述训练人脸认证算法的步骤包括:
使用第三学习率训练人脸认证算法,所述第三学习率大于第二学习率;和/或,
所述第一训练集中人脸图像的数量小于所述第二训练集中人脸图像的数量。
本发明还提供了一种人脸认证方法,所述人脸认证方法包括以下步骤:
获取待检测人脸图像;
将所述待检测人脸图像输入至目标人脸认证模型以获取人脸认证信息,所述目标人脸认证模型为根据如上所述的人脸认证模型的生成方法得到的模型。
本发明还提供了一种人脸认证模型的生成装置,所述生成装置包括:模型获取模块、训练集获取模块、第一训练模块及第二训练模块;
所述模型获取模块用于获取第一人脸认证模型,所述第一人脸认证模型包括第一人脸特征提取模块及第一分类矩阵模块,数据从所述第一人脸特征提取模块输入,所述第一人脸特征提取模块的输出作为所述第一分类矩阵模块的输入,所述第一人脸特征提取模块包括第一人脸特征提取参数,所述第一分类矩阵模块包括第一分类矩阵参数;
所述训练集获取模块用于获取第一训练集,所述第一训练集包括若干人脸图像;
所述第一训练模块用于通过所述第一训练集训练所述第一人脸认证模型以获取第二人脸认证模型,且在训练的过程中调整所述第一分类矩阵参数以获取第二分类矩阵模块,所述第二分类矩阵模块包括第二分类矩阵参数,所述第二人脸认证模型包括所述第一人脸特征提取模块及所述第二分类矩阵模块;
所述第一训练模块用于通过所述第一训练集训练所述第二人脸认证模型以获取目标人脸认证模型,且在训练的过程中调整所述第一人脸特征提取参数以获取第二人脸特征提取模块,调整所述第二分类矩阵参数以获取第三分类矩阵模块,所述目标人脸认证模型包括所述第二人脸特征提取模块及所述第三分类矩阵模块。
本发明还提供了一种人脸认证装置,所述人脸认证装置包括:图像获取模块及人脸认证模块;
所述图像获取模块用于获取待检测人脸图像;
所述人脸认证模块用于将所述待检测人脸图像输入至目标人脸认证模型以获取人脸认证信息,所述目标人脸认证模型为根据如上所述的人脸认证模型的生成方法得到的模型。
本发明还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的人脸认证模型的生成方法或如上所述的人脸认证方法。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的人脸认证模型的生成方法或如上所述的人脸认证方法。
本发明的积极进步效果在于:本发明中,不需要以高成本的代价构建精确的训练集,即训练集中包括大量的且不重复的人脸ID,而是将第一人脸认证模型作为基础模型,第一人脸认证模型中的模型参数分两部分进行区分来迭代学习,具体而言,通过与在获取第一人脸认证模型的过程中所使用的第二训练集不同的第一训练集先训练第一人脸认证模型中第一分类矩阵模块的第一分类矩阵参数,而将第一人脸认证模型中的第一人脸特征提取模块的第一人脸特征参数提取固定不动,在对第一人脸认证模型训练完成后得到第二人脸认证模型,再对第二人脸认证模型中第一人脸特征提取模块及第二分类矩阵模块进行同步训练,来调节对应的参数,以得到目标人脸认证模型。本发明在训练过的人脸认证模型(即第一人脸认证模型)的基础上,对该模型进行调整,分为两个阶段,第一个阶段先训练分类矩阵参数,第二个阶段再同步训练人脸特征提取参数及分类矩阵参数,从而在降低数据采集的成本(即不需要特别多且不重复的样本)的前提下,可以得到能够精确识别人脸的目标人脸认证模型。
本发明相对使用高成本构建大型人脸数据集的方法而言,可以针对特定场景采集包括少量人脸样本的人脸数据集,进行集成训练,降低了模型构建成本,提升了特定场景下人脸认证模型的性能,降低了误识别率。
本发明尤其适用于在数据集中的数据量不够大、数据集中的数据量有缺陷(如有重复的人脸ID)或某些特定场景(如难以获取到足够丰富的人脸样本数据,比如说:验证小孩、老人的人脸,验证黑夜场景的人脸)的人脸认证模型的训练,在上述情况下,基于少量的数据集可以以低成本的方式提高训练效果,进而提高训练出来的目标人脸认证模型对人脸验证的准确度。
附图说明
图1为本发明实施例1中人脸认证模型的生成方法的流程图。
图2为本发明实施例1中步骤103的实现方式的示意图。
图3为本发明实施例1中步骤104的实现方式的示意图。
图4为本发明实施例1中整体实现流程的举例示意图。
图5为本发明实施例2中人脸认证方法的流程图。
图6为本发明实施例3中人脸认证模型的生成装置的模块示意图。
图7为本发明实施例4中人脸认证装置的模块示意图。
图8为本发明实施例5中电子设备的模块示意图。
具体实施方式
为了便于理解,下面先对实施例中常出现的术语进行解释:
【包括的定义】如这里所使用的术语“具有”、“可以具有”、“包括”或“可以包括”指示本公开的相应功能、操作、元件等的存在,并且不限制其它的一个或多个功能、操作、元件等的存在。此外应当理解到,如这里所使用的术语“包括”或“具有”是指示在说明书中所描述的特点、数字、步骤、操作、元件、部件或其组合的存在,而不排除一个或多个其它特点、数字、步骤、操作、元件、部件或其组合的存在或增加。
【和/或的定义】如这里所使用的术语“A或B”、“A和/或B的至少之一”或“A和/或B的一个或多个”包括与其一起列举的单词的任意和所有组合。例如,“A或B”、“A和B的至少之一”或“A或B的至少之一”意味着(1)包括至少一个A,(2)包括至少一个B,或(3)包括至少一个A和至少一个B两者。
【第一、第二的定义】本申请实施例中出现的第一、第二等描述,仅作示意与区分描述对象之用,没有次序之分,也不表示本申请实施例中对设备个数的特别限定,不能构成对本申请实施例的任何限制。例如,可以将第一元件称为第二元件,而没脱离本公开的范围,类似地,可以将第二元件称为第一元件。
为了更好地理解下面的实施例,先对人脸认证算法进行说明:
基于深度学习的人脸认证,是一个开集的认证任务,即待认证的人脸,不一定在训练时的人脸数据集里,开集的人脸认证任务,更多的是一种度量学习,即学习到人脸特征的提取方式,使得相同人脸提取出的特征之间相似度高,不同人脸提取出的特征之间相似度低。基于深度学习的人脸认证网络模型,其人脸特征提取的方式一般是基于(DCNN)深度卷积神经网络,用卷积来提取图像空间特征,常用的网络骨干有ResNet(一种网络结构)等。人脸认证算法的关键在于对提取特征的网络进行参数更新迭代,以及其损失函数的定义方式。人脸认证的损失函数的设计目标要适应为度量学习,还要尽量缩小类内距离和增大类间距离。
可以使用基于正负例对比来设计损失函数,这种损失函数定义对正负例采样的方式和数量都比较麻烦,因此目前主流还是使用基于分类和加间隔的方式,来定义损失函数。基于分类的损失方式,其网络模型在训练和使用时,尾部有区别,前半部分网络一般是人脸特征提取,后半部分网络一般是分类矩阵,具体而言训练时是用人脸特征和一个包含所有分类中心特征的矩阵做分类判别,然后用softmax(一种归一化指数函数)和交叉熵计算损失。使用时,是用提取出的人脸特征做向量的距离计算相似度。在分类矩阵里,为了缩小类内距离,增大类间距离,在softmax计算分类概率值时,一般强制给类内距离增加一个间隔,让类内的特征聚集更近。加间隔的方式一般有SphereFace,CosFace,ArcFace等,SphereFace对距离的角度做乘性放大,CosFace对距离的余弦值加间隔,ArcFace对余弦距离的角度加间隔。这些方式让基于深度学习的人脸认证性能得到了很大的提高,也方便了模型的训练。促进了人脸识别在各个场景的应用和落地。
但是基于深度学习的人脸认证模型的性能,对数据集的大小和质量,有很强的依赖,一般而言,数据集越大,涵盖相应场景的人脸越丰富,识别认证模型的准确性更高。但人脸的数据集采集获取是一项成本很高的任务,特别的,某些特定场景,比如小孩、老人或黑夜场景的人脸数据更是难以获取到足够丰富的样本数量,导致在这些场景的人脸认证的效果有所降低,特别的,会导致误识别率提高。
为进一步提升人脸认证模型在特定场景下识别人脸的准确率,降低误识别率,充分利用已有的数据集,降低数据采集的成本,本发明实施例提供了一种人脸认证模型的生成方法、认证方法、设备及存储介质。
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
本实施例提供了一种人脸认证模型的生成方法,如图1所示,该生成方法包括以下步骤:
步骤101、获取第一人脸认证模型。
其中,第一人脸认证模型包括第一人脸特征提取模块及第一分类矩阵模块。数据从第一人脸特征提取模块输入,第一人脸特征提取模块的输出作为第一分类矩阵模块的输入,第一人脸特征提取模块包括第一人脸特征提取参数,第一分类矩阵模块包括第一分类矩阵参数。
具体而言,第一人脸认证模型既可以是已有的人脸认证模型,也可以是自己基于算法训练出来的人脸认证模型。无论是哪种人脸认证模型,均包括至少两个部分,一部分是用于提取人脸特征的人脸特征提取模块,第二部分是用于对数据进行分类的分类矩阵模块,一般来说,训练人脸认证模型也主要是训练这两个模块所对应的参数,如用于人脸特征提取的具体为DCNN中的参数以及用于分类的具体为类中心特征矩阵的参数,这两部分参数在一个数据集训练时一般是协同一致更新的。
步骤102、获取第一训练集。
其中,第一训练集包括若干人脸图像,第一训练集可以使用已有的人脸数据集,也可以是自行构建的人脸数据集,需要注意的是,第一训练集需要与获取第一人脸认证模型的过程中所使用的第二训练集不同,以在第一人脸认证模型的基础上,利用不同的数据训练出精确度更高的模型。
步骤103、通过第一训练集训练第一人脸认证模型以获取第二人脸认证模型,且在训练的过程中调整第一分类矩阵参数以获取第二分类矩阵模块。
应当理解,步骤103中,在训练第一人脸认证模型时,由于第一训练集中类别数量和类别分类的矩阵信息与第二训练集是不同的,因此需先保留固定住人脸特征提取参数,不进行更新,而只更新迭代类别的分类矩阵参数,即,保持第一人脸特征提取参数不变,仅学习并更新用于分类的参数,在学习完成后(如第一人脸认证模型的损失函数的损失值降到较低且稳定的水平后),第一分类矩阵参数调整为第二矩阵分类参数,即与第二分类矩阵模块对应的参数。
本实施例中,第二人脸认证模型包括第一人脸特征提取模块及第二分类矩阵模块。
步骤104、通过第一训练集训练第二人脸认证模型以获取目标人脸认证模型,且在训练的过程中调整第一人脸特征提取参数以获取第二人脸特征提取模块,调整第二分类矩阵参数以获取第三分类矩阵模块。
本实施例中,步骤104中修改模型训练设置,同步更新第一人脸特征提取参数和第二分类矩阵参数,在第二人脸认证模型的损失函数的损失值更新到一个较稳定的值后得到第二人脸特征提取参数以及第三分类矩阵参数,模型训练完成,得到目标人脸认证模型,该目标人脸认证模型包括第二人脸特征提取模块及第三分类矩阵模块,第二人脸特征提取模块对应第二人脸特征提取参数,第三分类矩阵模块对应第三分类矩阵参数。
本实施例中,不需要以高成本的代价构建精确的训练集,即训练集中包括大量的且不重复的人脸ID,而是将第一人脸认证模型作为基础模型,第一人脸认证模型中的模型参数分两部分进行区分来迭代学习,具体而言,通过与在获取第一人脸认证模型的过程中所使用的第二训练集不同的第一训练集先训练第一人脸认证模型中第一分类矩阵模块的第一分类矩阵参数,而将第一人脸认证模型中的第一人脸特征提取模块的第一人脸特征参数提取固定不动,在对第一人脸认证模型训练完成后得到第二人脸认证模型,再对第二人脸认证模型中第一人脸特征提取模块及第二分类矩阵模块进行同步训练,来调节对应的参数,以得到目标人脸认证模型。本实施例在训练过的人脸认证模型(即第一人脸认证模型)的基础上,对该模型进行调整,分为两个阶段,第一个阶段先训练分类矩阵参数,第二个阶段再同步训练人脸特征提取参数及分类矩阵参数,从而在降低数据采集的成本(即不需要特别多的样本)的前提下,可以得到能够精确识别人脸的目标人脸认证模型。
本实施例相对使用高成本构建大型人脸数据集的方法而言,可以针对特定场景采集包括少量人脸样本的人脸数据集,进行集成训练,降低了模型构建成本,提升了特定场景下人脸认证模型的性能,降低了误识别率。
本实施例尤其适用于数据集中的数据量不够大、数据集中的数据量有缺陷(如有重复的人脸ID)或某些特定场景下(如难以获取到足够丰富的人脸样本数据,比如说:验证小孩、老人的人脸,验证黑夜场景的人脸)的人脸认证模型的训练,在上述情况下,基于少量的数据集可以以低成本的方式提高训练效果,进而提高训练出来的目标人脸认证模型对人脸验证的准确度。
在一种优选的实施方式中,步骤103中训练第一人脸认证模型的步骤具体包括:使用第一学习率训练训练第一人脸认证模型,步骤104中训练第二人脸认证模型的步骤包括:使用第二学习率训练第二人脸认证模型。
并且,第二学习率小于第一学习率。
本实施例中,模型训练的第二阶段(即训练第二人脸认证模型),与模型训练的第一阶段(即训练第一人脸认证模型)相比,使用较小的学习率进行误差反向传播更新,对参数进行微调,以在避免影响第一阶段的学习效果的同时,提高模型的整体训练效果,进一步提高了目标人脸认证模型对人脸验证的准确度。
在一种优选的实施方式中,如图2所示,步骤103中训练第一人脸认证模型以获取第二人脸认证模型的步骤包括:
步骤1031、训练第一人脸认证模型;
步骤1032、当目标损失函数收敛且损失值小于第一预设值时完成训练,获得第二人脸认证模型。
如图3所示,步骤104中训练第二人脸认证模型以获取目标人脸认证模型的步骤包括:
步骤1041、训练第二人脸认证模型;
步骤1042、当目标损失函数收敛且损失值小于第二预设值时完成训练,获得目标人脸认证模型。
并且,第二预设值小于第一预设值。
其中,步骤104与步骤103相比,较佳地采用较小的学习率进行学习,对人脸特征提取参数及分类矩阵参数均进行微调,一定轮次后,在新的训练集上损失会进一步降低,进而得到更为精确的人脸认证模型。本实施例根据人脸认证的网络模型,对参数的更新以及训练的学习率进行精细控制,使得模型参数可以保留多个数据集的训练结果。
本实施例中,当第一人验证脸模型为自行训练出来的模型时,具体可以通过以下步骤进行模型训练:
通过第二训练集训练人脸认证算法以获取第一人脸认证模型。
其中可以基于已有的人脸数据集,将其分为第一训练集及第二训练集,通过第二训练集来得到基础模型,即第一人脸认证模型,以及通过第一训练集来得到最终的模型,即目标人脸认证模型;也可以通过已有的人脸数据集构建第二训练集,而自行收集少量的人脸样本来构建第一训练集。后者尤其适用于一些目标场景下的人脸认证(一些特殊的场景:比如说如黑夜场景、又比如说识别老人或小孩的场景),因为在这些场景下一般难以找到现成的人脸数据集,而基于已有的人脸认证模型来验证这些特殊场景下的人脸的效果又欠佳,并且又难以获取较多的人脸数据的样本;而前者更适用于由于数据集中存在重复人脸ID,导致训练出来的模型误识别率高的情况。
其中,人脸认证算法包括初始人脸特征提取模块及初始分类矩阵模块,人脸特征提取模块(如DCNN)包括初始人脸特征提取参数,初始分类矩阵模块包括初始分类矩阵参数。在对第二训练集进行训练时,依照正常模式训练,即读取第二数据集中的人脸图像,由初始人脸特征提取模块输入,用DCNN深度卷积网络提取人脸特征向量,与训练总类别的分类矩阵的每类别的特征中心向量做内积,得到该人脸与每个类别的当前相似度,再使用softmax和交叉熵得到本次样本分类的当前损失,然后进行误差反向传播,对初始人脸特征提取参数和初始分类矩阵参数一致协同更新以得到第一人脸特征提取参数和第一分类矩阵参数,学习率也可以从较大的值开始,训练到一定轮次,得到一个基础模型。
应当理解,对人脸认证算法的训练方式,可以根据需要,采用不同形式的人脸特征提取模块以及分类矩阵模块,以上方式不应成为对本实施例的限制。
本实施例中对包括不同的人脸图像的数据集进行多次集成训练,在分次训练时,通过对网络模型中的参数分步骤差异化精细控制更新,使得多个不同数据集的训练结果信息得以保留和叠加,使得模型提高了性能。
在一种优选的实施方式中,训练人脸认证算法的步骤具体包括:
使用第三学习率训练人脸认证算法,第三学习率大于第二学习率。
本实施例中,模型训练的第二阶段(即训练第二人脸认证模型的阶段),与基础模型的训练阶段(即训练人脸认证算法的阶段)相比,使用较小的学习率进行误差反向传播更新,对参数进行微调,以在避免影响基础模型的学习效果的同时,提高模型的整体训练效果,进一步提高了目标人脸认证模型对人脸验证的准确度。
在一种具体的实施方式中,第一训练集中人脸图像的数量小于第二训练集中人脸图像的数量。
本实施例中,通过将第一训练集中人脸图像的数量设置为小于第二训练集中人脸图像的数量的方式,可以降低数据采集成本,可以保留第一人脸认证模型的模型训练效果,在第一人脸认证模型的基础上,通过较少的人脸样本可以进一步针对特定人群进行微调训练,降低误识别率。
本实施例中,在得到目标人脸认证模型后,可以直接对训练好的模型进行应用,也可以进一步在测试集上对训练好的模型进行评估和验证,根据已进行的实验中的评估结果,目标人脸认证模型相对于通过传统的人脸认证模型(即通过人脸数据集直接训练的人脸认证模型),在更高的相似度阈值下,召回率有了更大的提升,ROC(receiver operatingcharacteristic curve,受试者工作特征曲线)下面积更大,并且相近人脸的特征距离区分的效果更好。
在一种优选的实施方式中,无论是对第一训练集还是对第二训练集,都可以对人脸图像进行预处理以提高模型训练的效果,如通过人脸检测算法获取到具体人脸的区域,还可以对人脸进行对齐操作,之后再对预处理后的训练集进行后续处理。
本实施例中,在训练模型时,对各个阶段,即基础训练阶段、第一训练阶段及第二训练阶段各个参数的更新、训练的学习率等进行精细控制,使得目标人脸认证模型参数可以保留多个数据集训练时学习到的结果,可以在降低学习成本的同时提高人脸识别的准确度。
为了更好地理解本实施例,下面通过一实例对本实施例进行说明:
将数据集分成数据集A(即第二训练集)与数据集B(即第一训练集),如果需要生成对特殊场景下进行人脸验证的模型,可以利用已有的数据来构建数据集A,收集少量在特殊场景下的人脸图像以构成数据集B。如果是由于已有的数据存在缺陷,如存在重复的人脸ID,则可以充分利用已有的数据,将其划分为数据集A与数据集B两部分。
如图4所示,首先对数据集A进行正常训练(即进行常规的模型训练,来得到基础模型)。具体而言对一个较大的基础数据集A,进行常规训练,随机初始化网络所有参数,较大学习率开始,训练轮次较多,损失稳定到一个较小的值后,得到第一人脸认证模型的网络,包括第一人脸特征提取的参数和第一分类矩阵参数。
之后通过数据集B对第一人脸认证模型进行进一步训练(即便步骤103及步骤104),具体而言:网络先加载数据集A训练后得到人脸特征提取参数(即第一人脸特征提取参数),随机初始化新训练集对应的分类矩阵参数;固定住第一人脸特征提取网络的参数,不参与损失计算后的误差反向传播和更新,只更新分类矩阵参数,使用较大的学习率,进行分类矩阵参数的学习。
训练一定轮次后,若损失值较为稳定,即便损失值可能相对较大一点,也视为分类矩阵的参数学习已为稳定,得到第二人脸认证模型。
之后,配置网络训练方式,一致协同更新网络所有参数,包括人脸特征提取参数和分类矩阵参数,使用较小的学习率进行误差反向传播更新,仅对网络参数进行微调,在较低的学习率设置下,损失会进一步下降,下降幅度较低,稳定后得到一个模型,即目标人脸认证模型,该模型包含了数据集A和数据集B的共同学习结果。
后续可以对训练好的模型进行应用,以及在测试集上进行评估和验证,评估在更高的相似度阈值下,召回率是否有提升,ROC曲线下面积是否更大,相近人脸的特征距离是否区分更好等。
实施例2
本实施例提供了一种人脸认证方法,如图5所示,该人脸认证方法包括以下步骤:
步骤201、获取待检测人脸图像。
其中,可以进一步对待检测人脸图像进行预处理,具体预处理的方式可以参考实施例1中对应的方式,此处便不再赘述。
步骤202、将待检测人脸图像输入至目标人脸认证模型以获取人脸认证信息。
其中,该目标人脸认证模型为根据实施例1中的人脸认证模型的生成方法得到的模型。
本实施例中,可以基于目标人脸认证模型获取到准确的人脸认证信息,大大提高了人脸识别的准确度,特别是对于某些特定场景,比如说:验证小孩人脸的场景、验证老人人脸的场景、验证黑夜场景的人脸等场景),利用基于少量的对应场景下的第一数据集训练的目标人脸认证模型,可以在降低构建数据集成本的情况下,提高人脸验证的准确性。
实施例3
本发明还提供了一种人脸认证模型的生成装置,如图6所示,该生成装置包括:模型获取模块301、训练集获取模块302、第一训练模块303及第二训练模块304。
模型获取模块301用于获取第一人脸认证模型,第一人脸认证模型包括第一人脸特征提取模块及第一分类矩阵模块,数据从第一人脸特征提取模块输入,第一人脸特征提取模块的输出作为第一分类矩阵模块的输入,第一人脸特征提取模块包括第一人脸特征提取参数,第一分类矩阵模块包括第一分类矩阵参数;
训练集获取模块302用于获取第一训练集,第一训练集包括若干人脸图像;
第一训练模块303用于通过第一训练集训练第一人脸认证模型以获取第二人脸认证模型,且在训练的过程中调整第一分类矩阵参数以获取第二分类矩阵模块,第二分类矩阵模块包括第二分类矩阵参数,第二人脸认证模型包括第一人脸特征提取模块及第二分类矩阵模块;
第二训练模块304用于通过第一训练集训练第二人脸认证模型以获取目标人脸认证模型,且在训练的过程中调整第一人脸特征提取参数以获取第二人脸特征提取模块,调整第二分类矩阵参数以获取第三分类矩阵模块,目标人脸认证模型包括第二人脸特征提取模块及第三分类矩阵模块。
本实施例中各个模块的实现方式可以参考实施例1中的具体实现方式,此处便不再赘述。
本实施例中,不需要以高成本的代价构建精确的训练集,即训练集中包括大量的且不重复的人脸ID,而是将模型获取模块获取的第一人脸认证模型作为基础模型,第一人脸认证模型中的模型参数分两部分进行区分来迭代学习,具体而言,训练集获取模块通过与在获取第一人脸认证模型的过程中所使用的第二训练集不同的第一训练集,第一训练模块先训练第一人脸认证模型中第一分类矩阵模块的第一分类矩阵参数,而将第一人脸认证模型中的第一人脸特征提取模块的第一人脸特征参数提取固定不动,在对第一人脸认证模型训练完成后得到第二人脸认证模型,第二训练模块再对第二人脸认证模型中第一人脸特征提取模块及第二分类矩阵模块进行同步训练,来调节对应的参数,以得到目标人脸认证模型。本实施例在训练过的人脸认证模型(即第一人脸认证模型)的基础上,对该模型进行调整,分为两个阶段,第一个阶段先训练分类矩阵参数,第二个阶段再同步训练人脸特征提取参数及分类矩阵参数,从而在降低数据采集的成本(即不需要特别多的样本)的前提下,可以得到能够精确识别人脸的目标人脸认证模型。
本实施例相对使用高成本构建大型人脸数据集的方法而言,可以针对特定场景采集包括少量人脸样本的人脸数据集,进行集成训练,降低了模型构建成本,提升了特定场景下人脸认证模型的性能,降低了误识别率。
本实施例尤其适用于数据集中的数据量不够大、数据集中的数据量有缺陷(如有重复的人脸ID)或某些特定场景下(如难以获取到足够丰富的人脸样本数据,比如说:验证小孩、老人的人脸,验证黑夜场景的人脸)的人脸认证模型的训练,在上述情况下,基于少量的数据集可以以低成本的方式提高训练效果,进而提高训练出来的目标人脸认证模型对人脸验证的准确度。
实施例4
本实施例还提供了一种人脸认证装置,如图7所示,该人脸认证装置包括:图像获取模块401及人脸认证模块402。
图像获取模块401用于获取待检测人脸图像;
人脸认证模块402用于将待检测人脸图像输入至目标人脸认证模型以获取人脸认证信息,目标人脸认证模型为根据实施例3中人脸认证模型的生成装置所得到的模型。
本实施例中各个模块的实现方式可以参考实施例2中的具体实现方式,此处便不再赘述。
本实施例中,人脸认证模块可以基于目标人脸认证模型获取到准确的人脸认证信息,大大提高了人脸识别的准确度,特别是对于某些特定场景,比如说:验证小孩人脸的场景、验证老人人脸的场景、验证黑夜场景的人脸等场景),利用基于少量的对应场景下的第一数据集训练的目标人脸认证模型,可以在降低构建数据集成本的情况下,提高人脸验证的准确性。
实施例5
本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例1中的人脸认证模型的生成方法或实施例2中的人脸认证方法。
图8示出了本实施例的硬件结构示意图,如图8所示,电子设备9具体包括:
至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93,其中:
总线93包括数据总线、地址总线和控制总线。
存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1中的人脸认证模型的生成方法或实施例2中的人脸认证方法。
电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例6
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1中的人脸认证模型的生成方法或实施例2中的人脸认证方法。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1中的人脸认证模型的生成方法或实施例2中的人脸认证方法。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
Claims (10)
1.一种人脸认证模型的生成方法,其特征在于,所述生成方法包括以下步骤:
获取第一人脸认证模型,所述第一人脸认证模型包括第一人脸特征提取模块及第一分类矩阵模块,数据从所述第一人脸特征提取模块输入,所述第一人脸特征提取模块的输出作为所述第一分类矩阵模块的输入,所述第一人脸特征提取模块包括第一人脸特征提取参数,所述第一分类矩阵模块包括第一分类矩阵参数;
获取第一训练集,所述第一训练集包括若干人脸图像;
通过所述第一训练集训练所述第一人脸认证模型以获取第二人脸认证模型,且在训练的过程中调整所述第一分类矩阵参数以获取第二分类矩阵模块,所述第二分类矩阵模块包括第二分类矩阵参数,所述第二人脸认证模型包括所述第一人脸特征提取模块及所述第二分类矩阵模块;
通过所述第一训练集训练所述第二人脸认证模型以获取目标人脸认证模型,且在训练的过程中调整所述第一人脸特征提取参数以获取第二人脸特征提取模块,调整所述第二分类矩阵参数以获取第三分类矩阵模块,所述目标人脸认证模型包括所述第二人脸特征提取模块及所述第三分类矩阵模块。
2.如权利要求1所述的人脸认证模型的生成方法,其特征在于,所述训练所述第一人脸认证模型的步骤包括:使用第一学习率训练所述第一人脸认证模型;
所述训练所述第二人脸认证模型的步骤包括:使用第二学习率训练所述第二人脸认证模型;
所述第二学习率小于所述第一学习率;和/或,
所述训练所述第一人脸认证模型以获取第二人脸认证模型的步骤包括:
训练所述第一人脸认证模型;
当目标损失函数收敛且损失值小于第一预设值时完成训练,获得第二人脸认证模型;
所述训练所述第二人脸认证模型以获取目标人脸认证模型的步骤包括:
训练所述第二人脸认证模型;
当目标损失函数收敛且损失值小于第二预设值时完成训练,获得目标人脸认证模型,所述第二预设值小于所述第一预设值。
3.如权利要求1所述的人脸认证模型的生成方法,其特征在于,所述第一训练集包括目标场景下的若干人脸图像。
4.如权利要求1所述的人脸认证模型的生成方法,其特征在于,所述获取第一人脸认证模型的步骤包括:
通过第二训练集训练人脸认证算法以获取第一人脸认证模型,所述人脸认证算法包括初始人脸特征提取模块及初始分类矩阵模块,所述人脸特征提取模块包括初始人脸特征提取参数,所述初始分类矩阵模块包括初始分类矩阵参数。
5.如权利要求4所述的人脸认证模型的生成方法,其特征在于,所述训练人脸认证算法的步骤包括:
使用第三学习率训练人脸认证算法,所述第三学习率大于第二学习率;和/或,
所述第一训练集中人脸图像的数量小于所述第二训练集中人脸图像的数量。
6.一种人脸认证方法,其特征在于,所述人脸认证方法包括以下步骤:
获取待检测人脸图像;
将所述待检测人脸图像输入至目标人脸认证模型以获取人脸认证信息,所述目标人脸认证模型为根据权利要求1-5中任意一项所述的人脸认证模型的生成方法得到的模型。
7.一种人脸认证模型的生成装置,其特征在于,所述生成装置包括:模型获取模块、训练集获取模块、第一训练模块及第二训练模块;
所述模型获取模块用于获取第一人脸认证模型,所述第一人脸认证模型包括第一人脸特征提取模块及第一分类矩阵模块,数据从所述第一人脸特征提取模块输入,所述第一人脸特征提取模块的输出作为所述第一分类矩阵模块的输入,所述第一人脸特征提取模块包括第一人脸特征提取参数,所述第一分类矩阵模块包括第一分类矩阵参数;
所述训练集获取模块用于获取第一训练集,所述第一训练集包括若干人脸图像;
所述第一训练模块用于通过所述第一训练集训练所述第一人脸认证模型以获取第二人脸认证模型,且在训练的过程中调整所述第一分类矩阵参数以获取第二分类矩阵模块,所述第二分类矩阵模块包括第二分类矩阵参数,所述第二人脸认证模型包括所述第一人脸特征提取模块及所述第二分类矩阵模块;
所述第一训练模块用于通过所述第一训练集训练所述第二人脸认证模型以获取目标人脸认证模型,且在训练的过程中调整所述第一人脸特征提取参数以获取第二人脸特征提取模块,调整所述第二分类矩阵参数以获取第三分类矩阵模块,所述目标人脸认证模型包括所述第二人脸特征提取模块及所述第三分类矩阵模块。
8.一种人脸认证装置,其特征在于,所述人脸认证装置包括:图像获取模块及人脸认证模块;
所述图像获取模块用于获取待检测人脸图像;
所述人脸认证模块用于将所述待检测人脸图像输入至目标人脸认证模型以获取人脸认证信息,所述目标人脸认证模型为根据权利要求1-5中任意一项所述的人脸认证模型的生成方法得到的模型。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一项所述的人脸认证模型的生成方法或权利要求7所述的人脸认证方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6任一项所述的人脸认证模型的生成方法或权利要求7所述的人脸认证方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111591243.3A CN114360008B (zh) | 2021-12-23 | 2021-12-23 | 人脸认证模型的生成方法、认证方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111591243.3A CN114360008B (zh) | 2021-12-23 | 2021-12-23 | 人脸认证模型的生成方法、认证方法、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114360008A true CN114360008A (zh) | 2022-04-15 |
CN114360008B CN114360008B (zh) | 2023-06-20 |
Family
ID=81100953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111591243.3A Active CN114360008B (zh) | 2021-12-23 | 2021-12-23 | 人脸认证模型的生成方法、认证方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114360008B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109697457A (zh) * | 2018-11-26 | 2019-04-30 | 上海图森未来人工智能科技有限公司 | 物体重识别系统的训练方法、物体重识别方法及相关设备 |
CN109871835A (zh) * | 2019-03-27 | 2019-06-11 | 南开大学 | 一种基于互斥正则化技术的人脸识别方法 |
CN110110126A (zh) * | 2019-04-29 | 2019-08-09 | 北京达佳互联信息技术有限公司 | 查询人物的面部图像的方法、装置和服务器 |
CN110659690A (zh) * | 2019-09-25 | 2020-01-07 | 深圳市商汤科技有限公司 | 神经网络的构建方法及装置、电子设备和存储介质 |
WO2020224403A1 (zh) * | 2019-05-07 | 2020-11-12 | 腾讯科技(深圳)有限公司 | 分类任务模型的训练方法、装置、设备及存储介质 |
CN112069898A (zh) * | 2020-08-05 | 2020-12-11 | 中国电子科技集团公司电子科学研究院 | 基于迁移学习人脸族群属性的识别方法及装置 |
US10990852B1 (en) * | 2019-10-23 | 2021-04-27 | Samsung Sds Co., Ltd | Method and apparatus for training model for object classification and detection |
CN112801054A (zh) * | 2021-04-01 | 2021-05-14 | 腾讯科技(深圳)有限公司 | 人脸识别模型的处理方法、人脸识别方法及装置 |
CN113298102A (zh) * | 2020-02-23 | 2021-08-24 | 初速度(苏州)科技有限公司 | 一种目标分类模型的训练方法及装置 |
-
2021
- 2021-12-23 CN CN202111591243.3A patent/CN114360008B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109697457A (zh) * | 2018-11-26 | 2019-04-30 | 上海图森未来人工智能科技有限公司 | 物体重识别系统的训练方法、物体重识别方法及相关设备 |
CN109871835A (zh) * | 2019-03-27 | 2019-06-11 | 南开大学 | 一种基于互斥正则化技术的人脸识别方法 |
CN110110126A (zh) * | 2019-04-29 | 2019-08-09 | 北京达佳互联信息技术有限公司 | 查询人物的面部图像的方法、装置和服务器 |
WO2020224403A1 (zh) * | 2019-05-07 | 2020-11-12 | 腾讯科技(深圳)有限公司 | 分类任务模型的训练方法、装置、设备及存储介质 |
CN110659690A (zh) * | 2019-09-25 | 2020-01-07 | 深圳市商汤科技有限公司 | 神经网络的构建方法及装置、电子设备和存储介质 |
US10990852B1 (en) * | 2019-10-23 | 2021-04-27 | Samsung Sds Co., Ltd | Method and apparatus for training model for object classification and detection |
CN113298102A (zh) * | 2020-02-23 | 2021-08-24 | 初速度(苏州)科技有限公司 | 一种目标分类模型的训练方法及装置 |
CN112069898A (zh) * | 2020-08-05 | 2020-12-11 | 中国电子科技集团公司电子科学研究院 | 基于迁移学习人脸族群属性的识别方法及装置 |
CN112801054A (zh) * | 2021-04-01 | 2021-05-14 | 腾讯科技(深圳)有限公司 | 人脸识别模型的处理方法、人脸识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114360008B (zh) | 2023-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113378632B (zh) | 一种基于伪标签优化的无监督域适应行人重识别方法 | |
CN110472675B (zh) | 图像分类方法、图像分类装置、存储介质与电子设备 | |
US10380332B2 (en) | Voiceprint login method and apparatus based on artificial intelligence | |
CN110362677B (zh) | 文本数据类别的识别方法及装置、存储介质、计算机设备 | |
Bigun et al. | Multimodal biometric authentication using quality signals in mobile communications | |
CN109978893A (zh) | 图像语义分割网络的训练方法、装置、设备及存储介质 | |
US20230087657A1 (en) | Assessing face image quality for application of facial recognition | |
CN103605972A (zh) | 一种基于分块深度神经网络的非限制环境人脸验证方法 | |
CN110414299B (zh) | 一种基于计算机视觉的猴脸亲缘关系分析方法 | |
CN111291817B (zh) | 图像识别方法、装置、电子设备和计算机可读介质 | |
US20190205331A1 (en) | Image search system, image search method, and program | |
CN111428557A (zh) | 基于神经网络模型的手写签名的自动校验的方法和装置 | |
CN109389098B (zh) | 一种基于唇语识别的验证方法以及系统 | |
CN106991312B (zh) | 基于声纹识别的互联网反欺诈认证方法 | |
CN112016553A (zh) | 光学字符识别(ocr)系统、自动ocr更正系统、方法 | |
US10423817B2 (en) | Latent fingerprint ridge flow map improvement | |
CN113221086B (zh) | 离线人脸认证方法、装置、电子设备及存储介质 | |
CN112560710B (zh) | 一种用于构建指静脉识别系统的方法及指静脉识别系统 | |
Qin et al. | Finger-vein quality assessment based on deep features from grayscale and binary images | |
CN116305076A (zh) | 基于签名的身份信息注册样本在线更新方法、系统及存储介质 | |
US10755074B2 (en) | Latent fingerprint pattern estimation | |
CN112489089B (zh) | 一种微型固定翼无人机机载地面运动目标识别与跟踪方法 | |
KR100876786B1 (ko) | 조명 마스크를 이용하는 사용자 얼굴 검증 시스템 및 방법 | |
CN116363712B (zh) | 一种基于模态信息度评估策略的掌纹掌静脉识别方法 | |
CN116645683A (zh) | 基于提示学习的签名笔迹鉴别方法、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |