CN115862103A - 一种小样本人脸识别方法及系统 - Google Patents
一种小样本人脸识别方法及系统 Download PDFInfo
- Publication number
- CN115862103A CN115862103A CN202211517539.5A CN202211517539A CN115862103A CN 115862103 A CN115862103 A CN 115862103A CN 202211517539 A CN202211517539 A CN 202211517539A CN 115862103 A CN115862103 A CN 115862103A
- Authority
- CN
- China
- Prior art keywords
- face
- network
- data set
- sample
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 239000013598 vector Substances 0.000 claims abstract description 125
- 238000012549 training Methods 0.000 claims abstract description 38
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 239000011159 matrix material Substances 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 8
- 238000013526 transfer learning Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 210000001525 retina Anatomy 0.000 claims description 3
- 230000006872 improvement Effects 0.000 description 8
- 238000005457 optimization Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 210000000887 face Anatomy 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种小样本人脸识别方法及系统,属于人脸识别技术领域,解决了现有人脸样本数量小时识别结果偏差大的问题。包括获取人脸图片,将人脸图片输入至训练好的人脸识别网络,得到人脸特征向量,构建人脸图像库;人脸识别网络通过训练编码网络和解码网络提取公开的人脸数据集的特征,并将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征中训练细粒度网络而得到;检测并预处理实时采集的视频图片,得到待识别人脸图片,输入至训练好的人脸识别网络,得到待识别特征向量;基于欧式距离,获取人脸图像库中与待识别特征向量的欧式距离最小且小于阈值的人脸特征向量对应的人脸图片,作为识别结果。提高了小样本人脸识别的准确率。
Description
技术领域
本发明涉及人脸识别技术领域,尤其涉及一种小样本人脸识别方法及系统。
背景技术
人脸识别技术是计算机视觉任务中基本而悠久的研究课题之一。随着深度卷积神经网络和大规模数据集的发展,基于深度学习的人脸识别技术得到前所未有的进步,并且广泛应用到实际生活需求之中。对于给定一对图像或者视频帧为输入,通过人脸识别神经网络输出人脸特征,从而实现人脸识别。
目前基于神经网路模型的人脸方法虽可以达到一个较好的检测效果,但是训练模型所得权重文件较大,模型的参数量和计算量巨大,耗时长。并且以往深度神经网络的人脸识别算法需要利用大量人脸数据集样本进行训练才能得到较好的识别效果。但当单个类别训练样本数量很少时,模型缺乏对少量人脸图片的表征能力,降低了识别精度,现今大多数人脸公开数据集例如WiderFace、MegaFace、LFW、MS1MV2等存在严重的类分布不平衡,即存在长尾效应,从人种类别角度划分数据集,白种人和大高加索人种占了主导地位约占数据集72%,东亚人种和非洲黑色人种约占8%。从年龄类别划分数据集,17~46岁年龄段的数据占了主导地位约占65%。从人脸图像视角划分数据集,正脸视角数据约占52%,半脸视角数据约占16%,斜侧脸视角数据约占32%。上述种种的数据类别分布不平衡导致基于这些数据的Arcface模型是一个有偏估计模型。
而且,大多人脸识别模型基于softmax代价函数附加一个正则化因子的方式来优化和训练模型,此类方式优化模型存在两个缺陷,1)对数据集数据量级以及每个人脸id中人脸样本个数要求较大,否则训练出来的模型很难具有良好泛化能力;2)当数据中存在大量类别不均衡时,以此种方式训练的出来的模型常常具有很大偏差,导致模型类别较少的数据上精度表现较差,使得人脸识别结果不准确。
发明内容
鉴于上述的分析,本发明实施例旨在提供一种人脸识别方法及系统,用以解决现有人脸样本数量小时识别结果偏差大的问题。
一方面,本发明实施例提供了一种小样本人脸识别方法,包括如下步骤:
获取人脸图片,将人脸图片输入至训练好的人脸识别网络,得到人脸特征向量,根据人脸特征向量及其对应的人脸图片,构建人脸图像库;人脸识别网络通过训练编码网络和解码网络提取公开的人脸数据集的特征,并将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征中训练细粒度网络而得到;
检测并预处理实时采集的视频图片,得到待识别人脸图片,输入至训练好的人脸识别网络,得到待识别特征向量;基于欧式距离,获取人脸图像库中与待识别特征向量的欧式距离最小且小于阈值的人脸特征向量对应的人脸图片,作为识别结果。
基于上述方法的进一步改进,基于欧式距离,获取人脸图像库中与待识别特征向量的欧式距离最小且小于阈值的人脸特征向量对应的人脸图片,包括:
对人脸图像库中的人脸特征向量进行聚类分析,得到各向量类别;
计算待识别特征向量分别与各向量类别的聚类中心的欧式距离,取最小欧式距离对应的向量类别为待比对类别,再计算待识别特征向量分别与待比对类别中人脸特征向量的欧式距离,获取最小欧式距离且小于阈值的人脸特征向量对应的人脸图片。
基于上述方法的进一步改进,人脸识别网络通过训练编码网络和解码网络提取公开的人脸数据集的特征,并将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征中训练细粒度网络而得到,包括:
预处理公开的人脸数据集,根据各类别中同一个人的人脸图片数量,划分为大样本数据集和小样本数据集;
根据大样本数据集,训练编码网络和解码网络后,再根据编码网络提取出公开的人脸数据集的特征,放入特征集合;将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征,更新特征集合;
根据更新后的特征集合,构建三元组特征样本,以triple三元函数为损失函数训练细粒度网络。
基于上述方法的进一步改进,预处理公开的人脸数据集,包括:
使用RetinaFace人脸关键点检测模型,对公开的人脸数据集中的人脸图片进行关键点检测,得到关键点坐标;关键点包括:左眼、右眼、左嘴角、右嘴角和鼻子;
通过水平翻转人脸图片,得到翻转后关键点坐标;
计算每张人脸图片中每个关键点坐标与对应的翻转后关键点坐标的绝对值距离,求和得到每张人脸图片翻转前后的差异值;
过滤掉差异值大于差异阈值的人脸图片,得到预处理后的公开的人脸数据集。
基于上述方法的进一步改进,根据大样本数据集,训练编码网络和解码网络,包括:
构建编码网络和解码网络,分别设置初始网络参数,得到重构网络;
基于大样本数据集,以L2回归函数作为损失函数,使用SGD随机梯度下降法优化重构网络参数,训练结束得到确定的编码网络模型参数。
基于上述方法的进一步改进,编码网络包括多层bottleneck层、1层flatten层和1层全连接层,其中,第1层bottleneck层包括3个卷积层,其它bottleneck层包括4个卷积层,每个卷积层依次包括1个卷积操作、1个批归一化和1个线性整流器;解码网络包括1层全连接层、1层Reshape层和多层上采样层,其中,解码网络中的上采样层数量与编码网络的bottleneck层数量相同,每层上采样层包括:1个转置卷积层和3个卷积层;细粒度网络为多层结构,每层结构包括1个全连接层、1个批归一化和1个线性整流器。
基于上述方法的进一步改进,编码网络的输入是M×M×3格式的样本数据,96≤M≤168;编码网络的输出是N×1的特征向量,256≤N≤320。
基于上述方法的进一步改进,将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征,包括:
根据大样本人脸数据集的特征,计算每类样本的特征向量均值,构建大样本的协方差矩阵;
对协方差矩阵进行PCA降维,取前S个特征向量得到特征矩阵;
根据特征矩阵和大样本人脸数据集的特征,使用下式对每个小样本人脸数据集的特征进行迁移学习:
zjk=ujp+QQT(zlq-ulr)
其中,zjk为小样本数据集中第j类样本中第k个样本的特征向量,ujp为小样本数据集中第j类样本向量均值,zlq为大样本数据集中随机选取的第l类样本中第q个样本的特征向量,ulr为大样本数据集中随机选取的第l类样本向量均值,Q为特征矩阵。
基于上述方法的进一步改进,根据更新后的特征集合,构建三元组特征样本,包括:
依次从特征集合中取一个特征向量作为锚点,再依次取出一个与当前锚点属于同一类样本的特征向量,作为正例,与锚点组成二元组,最后遍历取出一个与当前锚点属于不同类样本的特征向量,当同一类的特征向量间的距离与不同类的特征向量间的距离之差的绝对值小于距离阈值时,该特征向量作为反例,加入当前二元组中,构建得到一个三元组向量样本。
另一方面,本发明实施例提供了一种小样本人脸识别系统,包括:
人脸图像库构建模块,用于获取人脸图片,将人脸图片输入至训练好的人脸识别网络,得到人脸特征向量,根据人脸特征向量及其对应的人脸图片,构建人脸图像库;人脸识别网络通过训练编码网络和解码网络提取公开的人脸数据集的特征,并将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征中训练细粒度网络而得到;
人脸识别模块,用于检测并预处理实时采集的视频图片,得到待识别人脸图片,输入至训练好的人脸识别网络,得到待识别特征向量;基于欧式距离,获取人脸图像库中到待识别特征向量的欧式距离最小且小于阈值的人脸特征向量对应的人脸图片,作为识别结果。
与现有技术相比,本发明至少可实现如下有益效果之一:
1、通过编解码的方式使用重构回归方式以及自适应梯度下降优化方法优化编码网络参数,使得根据编码网络提取的人脸图片特征具有丰富图像语义特征;
2、通过迁移学习,丰富小样本的图像语义,减小因数据不平衡导致的误差,使得人脸识别网络根据小样本正脸的图片正确匹配识别出同人的侧脸人脸图片,提高识别准确度;
3、通过训练编码网络和解密网络,固化编码网络参数,再根据编码网络的输出,训练细粒度网络,通过重复这两阶段的方式优化整体人脸识别网络,使人脸识别网络具有良好的泛化能力和较高的识别精度。
本发明中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本发明的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为本发明实施例1中一种小样本人脸识别方法流程图;
图2为本发明实施例1中人脸识别网络的结构示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理,并非用于限定本发明的范围。
实施例1
本发明的一个具体实施例,公开了一种小样本人脸识别方法,如图1所示,包括如下步骤:
S11:获取人脸图片,将人脸图片输入至训练好的人脸识别网络,得到人脸特征向量,根据人脸特征向量及其对应的人脸图片,构建人脸图像库;人脸识别网络通过训练编码网络和解码网络提取公开的人脸数据集的特征,并将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征中训练细粒度网络而得到。
需要说明的是,根据预设应用场景获取人脸图片,可以通过检测历史视频图片,获取其中包含人脸的视频图片,可以收集人员的证件照片等方式。对获取的人脸图片使用RetinaFace人脸关键点检测模型,检测出人脸的五个关键点:左眼、右眼、左嘴角、右嘴角和鼻子,使用仿射变化,对人脸进行校正,对校正后的图片进行尺寸缩放和截取,使其符合人脸识别网络的输入尺寸。
将预处理好的人脸图片输入至训练好的人脸识别网络,输出的人脸特征向量具有丰富的语义特征,存储至人脸图像库中,用于实时人脸识别时与其进行比对。人脸特征向量对应的人脸图片作为比对一致时的输出结果。
本实施例的人脸识别网络包括编码网络、解码网络和细粒度网络,在构建人脸图像库之前,预先构建和训练好,其中编码网络用于提取人脸图片的特征,解码网络用于与编码网络一起,使用重构回归方式以及自适应梯度下降优化方法优化编码网络参数,使得编码网络输出的参数具有丰富图像语义特征;细粒度网络用于使输出的特征具备分离不同类别人脸的能力,使得相同人的人脸特征向量之间欧式距离较小,不同人的人脸特征向量之间欧式距离较大。
基于公开的人脸数据集训练时,先训练编码网络和解码网络,训练结束后固化编码网络参数,再训练细粒度网络。由于在实际应用场景中采集到的人脸图片存在类别不均衡、人脸角度单一的情况,为了使训练的人脸识别网络能适应应用场景,具备识别精度高,误差小的特点,在训练时,根据公开的人脸数据集的各类别数量,进行大样本和小样本的划分,并将大样本丰富的图像语义特征迁移至小样本的特征中,提高细粒度网络的区分能力。
具体来说,人脸识别网络的训练过程包括:
1)预处理公开的人脸数据集,根据各类别中同一个人的人脸图片数量,划分为大样本数据集和小样本数据集。
需要说明的是,公开的人脸数据集包括:WiderFace、MegaFace、LFW、MS1MV2等,预处理公开的人脸数据集,包括:
使用RetinaFace人脸关键点检测模型,对公开的人脸数据集中的人脸图片进行关键点检测,得到关键点坐标;关键点包括:左眼、右眼、左嘴角、右嘴角和鼻子;
通过水平翻转人脸图片,得到翻转后关键点坐标;
计算每张人脸图片中每个关键点坐标与对应的翻转后关键点坐标的绝对值距离,求和得到每张人脸图片翻转前后的差异值;
过滤掉差异值大于差异阈值的人脸图片,得到预处理后的公开的人脸数据集。
需要说明的是,在很多情况下一张完全侧面人脸去识别人脸ID很容易造成混淆,并且人工进行辨别都有很大几率误识别,本实施例通过这种方式筛选过滤掉大多数较为偏斜的人脸图像,极大减少了网络因这些异常数据而导致训练过程中无法收敛的情况。
公开的人脸数据集预处理后,根据各类别中同一个人的人脸图片数量,划分为大样本数据集和小样本数据集,具体的人脸类别和划分规则根据实际情况确定。示例性地,人脸类别包括:人种类别、年龄类别、人脸图像视角等,如果选择人种类别,则选取各人种类别中同一个人的人脸图片数量>=50的数据构成大样本数据集,即每个人脸ID包含50张以上不同角度的人脸图片,选取与大样本数据集不同的人种类别,且同一个人的人脸图片数量<5的数据构成小样本数据集,即每个人脸ID至多有4张大多正脸的人脸图片。
需要说明的是,对大样本数据集和小样本数据集可以进一步地划分为训练集和测试集,其中训练集用于对网络进行训练,测试集用于对网络进行性能测试,以防止网络对训练数据集的过拟合以及欠训练。本实施例中训练网络包括训练集和测试集的使用,这些属于常规用法,不再分别进行阐述。
2)根据大样本数据集,训练编码网络和解码网络后,再根据编码网络提取出公开的人脸数据集的特征,放入特征集合;将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征,更新特征集合。
具体来说,构建编码网络和解码网络,分别设置初始网络参数,得到重构网络。其中,编码网络的输入是整个人脸识别网络的输入,编码网络的目的在于将高维度图片数据编码压缩成一个具有丰富图像语义的低维度向量特征。
本实施例中编码网络的输入是M×M×3格式的人脸图像数据,96≤M≤168,输出是N×1的特征向量,256≤N≤320。
需要说明的是,当人脸尺寸超过168更多的人脸像素并不会提高模型特征向量的表示能力,反而会增加模型参数数量导致模型推断速度的性能,而低于96会导致模型识别精度降低。由于需要输出一个低维度的向量特征,所以N的维度不能太高,不然就失去的压缩的意义了。当模型维度低于256的特征向量统计量方差会开始变小,从而降低特征向量包含的人脸特征的丰富性,所以N的值选择320作为上界,256作为下界。
优选地,由于卷积算子中卷积核尺寸通常选择7或3,因此,M选择数值区间(96,168)内能被7或3整除的数。
编码网络包括多层bottleneck层、1层flatten层和1层全连接层dense,其中,第1层bottleneck层包括3个卷积层,其它bottleneck层包括4个卷积层,每个卷积层依次包括1个卷积操作conv、1个批归一化batchnorm和1个线性整流器relu。
优选地,如图2所示,编码网络包括4层bottleneck层,第1层bottleneck层中第1个卷积层的卷积核大小设置为7,其它bottleneck层的4个卷积层的卷积核大小设置为3且均只有第1层卷积做1/2的下采样。
解码网络目的在于将编码网络的输出反向解码成原图输出,最终输出的特征向量与编码网络输入相同。虽然经过训练,解码网络的输出不能完完全全恢复原始图像的信息,但是目的不是在于恢复原始图像信息,而在于通过编解码这样方式使用重构回归方式以及自适应梯度下降优化方法去优化编码网络参数,使得编码网络输出特征具有丰富图像语义特征。
解码网络包括1层全连接层dense、1层Reshape层和多层上采样层,其中,解码网络中的上采样层数量与编码网络的bottleneck层数量相同,每层上采样层包括:1个转置卷积层和3个卷积层。
示例性地,在图2中,构建6层编码网络和6层解码网络,编码网络的输入是112×112×3,其中112,112分别表示图片高和宽,3表示图片色域通道数,即RGB图片;输出是320×1;解码网络的输出是112×112×3。
基于大样本数据集,以L2回归函数作为损失函数,使用SGD随机梯度下降法优化重构网络参数,训练结束得到确定的编码网络模型参数。将预处理后的公开的人脸数据集输入至训练好的编码网络,得到的特征向量作为对应的大样本人脸数据集的特征或小样本人脸数据集的特征,放入特征集合。
由于大样本中同一个人脸有多种角度拍摄的图片,以及不同发型,年龄段和光照等多种因素,数据样本具有多样性,因此通过迁移学习,将大样本数据的特征迁移至小样本的特征中,减少因数据不平衡导致的识别偏差,使得能够根据正脸的图片正确匹配识别出同一个人的侧脸人脸图片。具体来说,将大样本人脸数据集的特征迁移至小样本人脸数据集的特征,包括:
①根据大样本人脸数据集的特征,计算每类样本的特征向量均值,构建大样本的协方差矩阵。
需要说明的是,本实施例假设特征向量服从高斯分布,对每类样本的特征向量各分量进行求算术平均,获取得到每类样本的特征向量均值,并根据如下公式构建大样本的协方差矩阵:
其中,uir为大样本数据集中第i类样本向量均值,zik为大样本数据集中第i类样本中第k个样本的特征向量,m为大样本数据集中第i类样本的总数量,n为大样本数据集中样本类别的总数量。
②对协方差矩阵进行PCA降维,取前S个特征向量得到特征矩阵。
示例性地,每个样本特征向量为320×1,设置S为100,则得到的特征矩阵为320×100。
③根据特征矩阵和大样本人脸数据集的特征,使用下式对每个小样本人脸数据集的特征进行迁移学习:
zjk=ujp+QQT(zlq-ulr) 公式(2)
其中,zjk为小样本数据集中第j类样本中第k个样本的特征向量,ujp为小样本数据集中第j类样本向量均值,zlq为大样本数据集中随机选取的第l类样本中第q个样本的特征向量,ulr为大样本数据集中随机选取的第l类样本向量均值,Q为特征矩阵。
小样本人脸数据集的每个特征迁移学习后,更新特征集合。
3)根据更新后的特征集合,构建三元组特征样本,以triple三元函数为损失函数训练细粒度网络。
需要说明的是,更新后的特征集合中包括:大样本人脸数据集的特征和迁移学习后的小样本人脸数据集的特征,根据更新后的特征集合,构建三元组特征样本,包括:
依次从特征集合中取一个特征向量作为锚点,再依次取出一个与当前锚点属于同一类样本的特征向量,作为正例,与锚点组成二元组,最后遍历取出一个与当前锚点属于不同类样本的特征向量,当同一类的特征向量间的距离与不同类的特征向量间的距离之差的绝对值小于距离阈值时,该特征向量作为反例,加入当前二元组中,构建得到一个三元组向量样本。
具体来说,通过如下公式表示同一类的特征向量间的距离与不同类的特征向量间的距离之差的绝对值小于距离阈值:
其中,za为当前锚点,zp为当前正例,zn为当前反例,α表示距离阈值,α>0,norm(z)表示将特征z归一化为单位向量。
细粒度网络为多层结构,每层结构包括1个全连接层dense、1个批归一化batchnorm和1个线性整流器relu。
示例性地,在图2中,细粒度网络为2层结构,第一层包括:全连接层dense,紧随其后是批归一化batchnorm以及线性整流器relu;第二层与第一层相同,输出用于人脸识别的特征向量。
构建得到三元组特征样本后,按照锚点、正例和反例的顺序,以每一个批次中数据量为3的整数倍,输入到细粒度网络中,分别得到三元组特征样本对应的人脸特征向量,以triple三元函数为损失函数训练细粒度网络,优化细粒度网络参数。
具体来说,损失函数如下式所示:
S12:检测并预处理实时采集的视频图片,得到待识别人脸图片,输入至训练好的人脸识别网络,得到待识别特征向量;基于欧式距离,获取人脸图像库中与待识别特征向量的欧式距离最小且小于阈值的人脸特征向量对应的人脸图片,作为识别结果。
需要说明的是,对实时采集的视频图片按照步骤S11中的方法将其预处理成人脸识别网络的输入尺寸,输入至训练好的人脸识别网络,经过其中的编码网络和细粒度网络,得到待识别特征向量。与人脸图像库中的特征向量进行比对识别,包括:
对人脸图像库中的人脸特征向量进行聚类分析,得到各向量类别;
计算待识别特征向量分别与各向量类别的聚类中心的欧式距离,取最小欧式距离对应的向量类别为待比对类别,再计算待识别特征向量分别与待比对类别中人脸特征向量的欧式距离,获取最小欧式距离且小于阈值的人脸特征向量对应的人脸图片。
需要说明的是,实际人脸识别时的阈值根据实际场景中要求的精度进行设置。
与现有技术相比,本实施例提供的一种小样本人脸识别方法,通过编解码的方式使用重构回归方式以及自适应梯度下降优化方法优化编码网络参数,使得根据编码网络提取的人脸图片特征具有丰富图像语义特征;通过迁移学习,丰富小样本的图像语义,减小因数据不平衡导致的误差,使得人脸识别网络根据小样本正脸的图片正确匹配识别出同人的侧脸人脸图片,提高识别准确度;通过训练编码网络和解密网络,固化编码网络参数,再根据编码网络的输出,训练细粒度网络,通过重复这两阶段的方式优化整体人脸识别网络,使人脸识别网络具有良好的泛化能力和较高的识别精度。
实施例2
本发明的另一个实施例,公开了一种小样本人脸识别系统,从而实现实施例1中的人脸识别方法。各模块的具体实现方式参照实施例1中的相应描述。该系统包括:
人脸图像库构建模块,用于获取人脸图片,将人脸图片输入至训练好的人脸识别网络,得到人脸特征向量,根据人脸特征向量及其对应的人脸图片,构建人脸图像库;人脸识别网络通过训练编码网络和解码网络提取公开的人脸数据集的特征,并将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征中训练细粒度网络而得到;
人脸识别模块,用于检测并预处理实时采集的视频图片,得到待识别人脸图片,输入至训练好的人脸识别网络,得到待识别特征向量;基于欧式距离,获取人脸图像库中到待识别特征向量的欧式距离最小且小于阈值的人脸特征向量对应的人脸图片,作为识别结果。
由于本实施例一种小样本人脸识别系统与前述人脸识别方法相关之处可相互借鉴,此处为重复描述,故这里不再赘述。由于本系统实施例与上述方法实施例原理相同,所以本系统实施例也具有上述方法实施例相应的技术效果。
本领域技术人员可以理解,实现上述实施例方法的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读存储介质中。其中,所述计算机可读存储介质为磁盘、光盘、只读存储记忆体或随机存储记忆体等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种小样本人脸识别方法,其特征在于,包括如下步骤:
获取人脸图片,将人脸图片输入至训练好的人脸识别网络,得到人脸特征向量,根据所述人脸特征向量及其对应的人脸图片,构建人脸图像库;所述人脸识别网络通过训练编码网络和解码网络提取公开的人脸数据集的特征,并将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征中训练细粒度网络而得到;
检测并预处理实时采集的视频图片,得到待识别人脸图片,输入至训练好的人脸识别网络,得到待识别特征向量;基于欧式距离,获取人脸图像库中与所述待识别特征向量的欧式距离最小且小于阈值的人脸特征向量对应的人脸图片,作为识别结果。
2.根据权利要求1所述的小样本人脸识别方法,其特征在于,所述基于欧式距离,获取人脸图像库中与所述待识别特征向量的欧式距离最小且小于阈值的人脸特征向量对应的人脸图片,包括:
对人脸图像库中的人脸特征向量进行聚类分析,得到各向量类别;
计算所述待识别特征向量分别与各向量类别的聚类中心的欧式距离,取最小欧式距离对应的向量类别为待比对类别,再计算所述待识别特征向量分别与待比对类别中人脸特征向量的欧式距离,获取最小欧式距离且小于阈值的人脸特征向量对应的人脸图片。
3.根据权利要求2所述的小样本人脸识别方法,其特征在于,所述人脸识别网络通过训练编码网络和解码网络提取公开的人脸数据集的特征,并将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征中训练细粒度网络而得到,包括:
预处理公开的人脸数据集,根据各类别中同一个人的人脸图片数量,划分为大样本数据集和小样本数据集;
根据大样本数据集,训练编码网络和解码网络后,再根据编码网络提取出公开的人脸数据集的特征,放入特征集合;将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征,更新特征集合;
根据更新后的特征集合,构建三元组特征样本,以triple三元函数为损失函数训练细粒度网络。
4.根据权利要求3所述的小样本人脸识别方法,其特征在于,所述预处理公开的人脸数据集,包括:
使用RetinaFace人脸关键点检测模型,对公开的人脸数据集中的人脸图片进行关键点检测,得到关键点坐标;所述关键点包括:左眼、右眼、左嘴角、右嘴角和鼻子;
通过水平翻转人脸图片,得到翻转后关键点坐标;
计算每张人脸图片中每个关键点坐标与对应的翻转后关键点坐标的绝对值距离,求和得到每张人脸图片翻转前后的差异值;
过滤掉差异值大于差异阈值的人脸图片,得到预处理后的公开的人脸数据集。
5.根据权利要求3所述的小样本人脸识别方法,其特征在于,所述根据大样本数据集,训练编码网络和解码网络,包括:
构建编码网络和解码网络,分别设置初始网络参数,得到重构网络;
基于大样本数据集,以L2回归函数作为损失函数,使用SGD随机梯度下降法优化重构网络参数,训练结束得到确定的编码网络模型参数。
6.根据权利要求3所述的小样本人脸识别方法,其特征在于,所述编码网络包括多层bottleneck层、1层flatten层和1层全连接层,其中,第1层bottleneck层包括3个卷积层,其它bottleneck层包括4个卷积层,每个卷积层依次包括1个卷积操作、1个批归一化和1个线性整流器;所述解码网络包括1层全连接层、1层Reshape层和多层上采样层,其中,解码网络中的上采样层数量与编码网络的bottleneck层数量相同,每层上采样层包括:1个转置卷积层和3个卷积层;细粒度网络为多层结构,每层结构包括1个全连接层、1个批归一化和1个线性整流器。
7.根据权利要求5所述的小样本人脸识别方法,其特征在于,所述编码网络的输入是M×M×3格式的样本数据,96≤M≤168;编码网络的输出是N×1的特征向量,256≤N≤320。
8.根据权利要求3所述的小样本人脸识别方法,其特征在于,所述将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征,包括:
根据大样本人脸数据集的特征,计算每类样本的特征向量均值,构建大样本的协方差矩阵;
对所述协方差矩阵进行PCA降维,取前S个特征向量得到特征矩阵;
根据特征矩阵和大样本人脸数据集的特征,使用下式对每个小样本人脸数据集的特征进行迁移学习:
zjk=ujp+QQT(zlq-ulr)
其中,zjk为小样本数据集中第j类样本中第k个样本的特征向量,ujp为小样本数据集中第j类样本向量均值,zlq为大样本数据集中随机选取的第l类样本中第q个样本的特征向量,ulr为大样本数据集中随机选取的第l类样本向量均值,Q为特征矩阵。
9.根据权利要求3所述的小样本人脸识别方法,其特征在于,所述根据更新后的特征集合,构建三元组特征样本,包括:
依次从特征集合中取一个特征向量作为锚点,再依次取出一个与当前锚点属于同一类样本的特征向量,作为正例,与锚点组成二元组,最后遍历取出一个与当前锚点属于不同类样本的特征向量,当同一类的特征向量间的距离与不同类的特征向量间的距离之差的绝对值小于距离阈值时,该特征向量作为反例,加入当前二元组中,构建得到一个三元组向量样本。
10.一种小样本人脸识别系统,其特征在于,包括:
人脸图像库构建模块,用于获取人脸图片,将人脸图片输入至训练好的人脸识别网络,得到人脸特征向量,根据所述人脸特征向量及其对应的人脸图片,构建人脸图像库;所述人脸识别网络通过训练编码网络和解码网络提取公开的人脸数据集的特征,并将其中大样本人脸数据集的特征迁移至小样本人脸数据集的特征中训练细粒度网络而得到;
人脸识别模块,用于检测并预处理实时采集的视频图片,得到待识别人脸图片,输入至训练好的人脸识别网络,得到待识别特征向量;基于欧式距离,获取人脸图像库中到所述待识别特征向量的欧式距离最小且小于阈值的人脸特征向量对应的人脸图片,作为识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211517539.5A CN115862103A (zh) | 2022-11-30 | 2022-11-30 | 一种小样本人脸识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211517539.5A CN115862103A (zh) | 2022-11-30 | 2022-11-30 | 一种小样本人脸识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115862103A true CN115862103A (zh) | 2023-03-28 |
Family
ID=85668113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211517539.5A Pending CN115862103A (zh) | 2022-11-30 | 2022-11-30 | 一种小样本人脸识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115862103A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116206355A (zh) * | 2023-04-25 | 2023-06-02 | 鹏城实验室 | 人脸识别模型训练、图像注册、人脸识别方法及装置 |
CN117894059A (zh) * | 2024-03-15 | 2024-04-16 | 国网江西省电力有限公司信息通信分公司 | 一种3d人脸识别方法 |
-
2022
- 2022-11-30 CN CN202211517539.5A patent/CN115862103A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116206355A (zh) * | 2023-04-25 | 2023-06-02 | 鹏城实验室 | 人脸识别模型训练、图像注册、人脸识别方法及装置 |
CN117894059A (zh) * | 2024-03-15 | 2024-04-16 | 国网江西省电力有限公司信息通信分公司 | 一种3d人脸识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022111236A1 (zh) | 一种结合注意力机制的面部表情识别方法及系统 | |
CN110222668B (zh) | 基于生成对抗网络的多姿态面部表情识别方法 | |
CN106599854B (zh) | 基于多特征融合的人脸表情自动识别方法 | |
CN103605972B (zh) | 一种基于分块深度神经网络的非限制环境人脸验证方法 | |
CN115862103A (zh) | 一种小样本人脸识别方法及系统 | |
CN111444881A (zh) | 伪造人脸视频检测方法和装置 | |
CN112766160A (zh) | 基于多级属性编码器和注意力机制的人脸替换方法 | |
CN109359541A (zh) | 一种基于深度迁移学习的素描人脸识别方法 | |
CN109948692B (zh) | 基于多颜色空间卷积神经网络及随机森林的计算机生成图片检测方法 | |
CN111652273B (zh) | 一种基于深度学习的rgb-d图像分类方法 | |
CN109492610B (zh) | 一种行人重识别方法、装置及可读存储介质 | |
CN113205002B (zh) | 非受限视频监控的低清人脸识别方法、装置、设备及介质 | |
CN111738054A (zh) | 一种基于时空自编码器网络和时空cnn的行为异常检测方法 | |
CN113392711A (zh) | 一种基于高层语义与噪声抑制的烟雾语义分割方法及系统 | |
CN114387641A (zh) | 基于多尺度卷积网络和ViT的虚假视频检测方法及系统 | |
CN115240259A (zh) | 一种基于yolo深度网络的课堂环境下人脸检测方法及其检测系统 | |
Jiang et al. | Face recognition method based on sparse representation and feature fusion | |
CN111767842B (zh) | 基于迁移学习和自编码器数据增强的微表情种类判别方法 | |
CN113489958A (zh) | 一种基于视频编码数据多特征融合的动态手势识别方法及系统 | |
CN111950452A (zh) | 一种人脸识别方法 | |
CN115471901B (zh) | 基于生成对抗网络的多姿态人脸正面化方法及系统 | |
CN116597503A (zh) | 一种基于时空特征的课堂行为检测方法 | |
CN113536843A (zh) | 基于多模态融合卷积神经网络的防伪人脸识别系统 | |
CN111126173A (zh) | 一种高精度人脸检测方法 | |
CN114387553B (zh) | 一种基于帧结构感知聚合的视频人脸识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |