CN111985310A - 一种用于人脸识别的深度卷积神经网络的训练方法 - Google Patents

一种用于人脸识别的深度卷积神经网络的训练方法 Download PDF

Info

Publication number
CN111985310A
CN111985310A CN202010649598.2A CN202010649598A CN111985310A CN 111985310 A CN111985310 A CN 111985310A CN 202010649598 A CN202010649598 A CN 202010649598A CN 111985310 A CN111985310 A CN 111985310A
Authority
CN
China
Prior art keywords
loss
training
face
model
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010649598.2A
Other languages
English (en)
Other versions
CN111985310B (zh
Inventor
田联房
孙峥峥
杜启亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Zhuhai Institute of Modern Industrial Innovation of South China University of Technology
Original Assignee
South China University of Technology SCUT
Zhuhai Institute of Modern Industrial Innovation of South China University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT, Zhuhai Institute of Modern Industrial Innovation of South China University of Technology filed Critical South China University of Technology SCUT
Priority to CN202010649598.2A priority Critical patent/CN111985310B/zh
Publication of CN111985310A publication Critical patent/CN111985310A/zh
Application granted granted Critical
Publication of CN111985310B publication Critical patent/CN111985310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Biophysics (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种用于人脸识别的深度卷积神经网络的训练方法,包括步骤:1)准备好人脸图像数据集,并划分有训练集和验证集,根据训练集的规模、复杂程度和应达到的人脸识别的性能指标,选择深度卷积神经网络模型的类型、结构、超参数和量级;2)利用模型对训练集输入的人脸图片提取特征,作为步骤3)输入;3)构建损失层,并对本次训练迭代计算损失值;4)将步骤3)计算得到的损失值与预先设定的阈值相比较,判断是停止训练还是计算梯度并更新模型参数;5)模型性能验证以及判断是否停止训练。本发明使得在训练时可以从欧式空间和角度空间两方面出发,用一种多元的作用力约束人脸特征,使深度卷积神经网络模型可以学习到更具区别力和鲁棒性的人脸特征。

Description

一种用于人脸识别的深度卷积神经网络的训练方法
技术领域
本发明涉及人脸识别的技术领域,尤其是指一种用于人脸识别的深度卷积神经网络的训练方法。
背景技术
人脸识别是基于人的面部图像信息进行身份识别的一种生物识别技术。与指纹、瞳孔等识别技术相比,具有非接触式、采集信息门槛低、识别率高等显著优势。进行人脸验证时,由于采集过程是非接触式的,不仅可以降低被采集人的抵触心理,也可以保证采集过程的卫生安全,特别是对于疫情期间防疫检查,可以有效降低病毒传染的可能性。另外人脸识别的应用场景十分广泛,如大厦门禁系统、监控系统、重要通道出入管理系统、金融支付验证系统、移动设备解锁验证等。由于人脸识别技术的显著优势和广泛应用前景,其越来越受到学术界和工业界的研究和重视。
目前实现人脸识别的方法有很多种,其中一种是基于深度卷积神经网络模型的特征提取方法。与传统的手工提取人脸特征的方法不同,通过神经网络可以自动地学习并提取有效的人脸特征。接着通过对比输入人脸特征与数据库存储的人脸特征的相似程度判断输入人脸图像的身份。设计合适的人脸损失函数是训练神经网络模型的一个极其重要的环节,它直接决定了模型提取人脸特征的性能。目前,现有的人脸损失函数主要通过两个方面约束人脸特征。一种是欧式空间类损失函数,其中典型的有中心损失、对比损失和三元组损失函数,这些损失通过限制特征点之间的距离,实现“类内聚合、类间分散”的特征分布。在训练时,其产生的是一种“点对点”的约束力;另一种是角度空间类损失函数,其中典型的有ArcFace、SphereFace、CosFace损失函数,这些损失目的在于从角度的方面限制特征点分布,即最小化类内特征点之间的夹角、最大化类间特征点之间的夹角。在训练时,其产生的是一种沿圆弧的切向的约束力。然而,这些损失函数产生的约束力存在作用类型单一的问题,不能有效、灵活地驱动特征点达到一个更良好的分布。另外,训练时仍有一些特征点分布在空间原点附近,而这些特征点是很难聚集到各自的类中心的,这使得整个训练过程变得难以收敛。
综合以上论述,发明一种用于人脸识别中深度卷积神经网络的训练方法,具有较高的实际应用价值。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种用于人脸识别的深度卷积神经网络的训练方法,使得在训练时可以从欧式空间和角度空间两方面出发,用一种多元的作用力约束人脸特征,使深度卷积神经网络模型可以学习到更具区别力和鲁棒性的人脸特征,从而大大提高了模型的人脸识别准确率。
为实现上述目的,本发明所提供的技术方案为:一种用于人脸识别的深度卷积神经网络的训练方法,包括以下步骤:
1)准备好人脸图像数据集,并划分有训练集和验证集,然后根据训练集的规模、复杂程度和应达到的人脸识别的性能指标,选择深度卷积神经网络模型的类型、结构、超参数和量级;
2)利用选择好的深度卷积神经网络模型对训练集输入的人脸图片提取特征,提取的特征作为步骤3)的输入;
3)构建损失层,并对本次训练迭代计算损失值,作为步骤4)的输入;
4)将步骤3)计算得到的损失值与预先设定的阈值相比较,判断是停止训练还是计算梯度并更新模型参数;
5)模型性能验证以及判断是否停止训练。
在步骤1)中,需要对人脸图像数据集进行预处理,包括人脸检测和对齐、图像像素值归一化、图像大小归一化、图像增强和数据集清洗。
在步骤1)中,需要设置深度卷积神经网络模型的输入图片大小和输出特征的维度。
在步骤2)中,在每次训练迭代开始时,从训练集中随机抽取一批固定数量的人脸图像,将其输入深度卷积神经网络模型中进行前向传播,模型输出的特征作为步骤3)的输入。
在步骤3)中,构建损失层以及计算损失值的步骤如下:
3.1)准备损失函数的输入,包括本次训练迭代模型输出的本批次人脸特征x以及其对应的人脸身份标签y;设置损失层各部分的超参数:Center loss权重系数α、ArcFaceloss权重系数β,ArcFace loss中内置的超参数s和m,Inner origin loss权重系数γ和Inner origin loss内置的超参数η;其中,s为特征缩放因子,m为角度间隔,η为排斥圆有效半径;
3.2)对于训练过程中首次计算损失值,用设定的权重初始化方法对类中心权重参数W进行初始化;对于非首次计算损失值,则使用已初始化的类中心权重参数W;其中,Center loss部分和ArcFace loss部分共享同一组类中心权重参数W;
3.3)计算Center loss部分的损失值LC,公式如下:
Figure BDA0002574413550000031
式中,N为本批次训练样本的数目,i为这批样本中第i个样本的序号,xi为输入人脸特征x的第i行;cyi为xi对应人脸身份标签yi所对应的类中心权重向量,即W的第yi列;
3.4)计算ArcFace loss部分的损失值LA,公式如下:
Figure BDA0002574413550000041
式中,θyi为输入人脸特征xi与对应人脸身份标签yi所对应的类中心权重向量cyi的夹角;θj则是输入人脸特征xi与其它非本类的类中心权重向量cj的夹角;n为训练集中所有样本的类别数目,j为这n个类中第j个类的序号;夹角θ为一个二维矩阵,θyi和θj为其各个位置上的元素值,其计算公式如下:
Figure BDA0002574413550000042
式中,||·||2为L2范数;
3.5)计算Inner origin loss部分的损失值Linnerorigin,其计算步骤如下:
3.5.1)计算输入特征x与特征空间原点的平均距离D,计算公式如下:
Figure BDA0002574413550000043
3.5.2)计算削弱后的负距离d,计算公式如下:
d=-D+η
3.5.3)计算激活后Inner origin loss,计算公式如下:
Linnerorigin=Relu(d)
式中,Relu(d)=max(d,0);
3.6)对步骤3.3)、3.4)、3.5)中计算的三部分损失加权累加,得到损失层的输出结果,计算公式如下:
L=αLA+βLC+γLinnerorigin
式中,L为步骤3)输出的损失值。
在步骤4)中,根据步骤3)计算得到的损失值,判断损失值是否低于预先设定的阈值:若是,则停止训练;若否,则根据该损失值计算模型中可训练参数的梯度值,并按照预先定义参数优化方法对模型参数进行更新。
在步骤5)中,根据预先设定的验证间隔步数,判断是否需要进行模型性能验证:若否,则返回到步骤2);若是,则使用验证集测试模型性能;然后根据测得的模型性能,判断其是否达到预先设定的性能指标:若是,则停止训练;若否,则返回步骤2)。
本发明与现有技术相比,具有如下优点与有益效果:
1、根据数据集的复杂度和规模,以及要达到人脸识别性能,有针对性地选择合适大小和特定结构的深度卷积神经网络模型,既可以有效节省训练模型的成本,又可以使得模型更好地拟合训练数据集。
2、构建损失层时,Center loss部分和ArcFace loss部分共享同一组类中心权重,其优势在于,更新模型参数时由此两种损失传递而来的梯度可以同时作用于这组类中心权重,使得模型更快、更准确地学习到训练数据集的各个类中心向量,有利于损失函数加快收敛,从而提升模型的人脸识别性能。
3、使用了新型的损失函数,不仅弥补了欧式空间类损失函数的只能产生点对点约束力的缺点,也弥补了角度空间类损失函数只能产生沿圆弧的约束力的缺点,提高了对人脸特征约束力的自由度,使得训练时产生的多元约束力更有效低驱动人脸特征达到“类内特征更加紧聚,类间特征更加分散”的分布状态。最终使得模型学习到更加鲁棒的人脸特征。
4、使用了新型的损失函数,其中增加了Inner origin loss,在训练时同时产生了一种径向的排斥力,将特征推离空间原点,有利于特征向各自的类中心聚集,如此进一步提升了对人脸特征的约束力,加快模型收敛速度并提升了模型的收敛程度,从而解决了现有角度空间类损失函数收敛慢的问题。
附图说明
图1为本发明方法的训练流程图。
图2为损失层的构建与前向传播流程图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
如图1所示,本实例所提供的用于人脸识别的深度卷积神经网络的训练方法,包括以下步骤:
1)准备好人脸图像数据集,包括训练集和验证集。在训练或验证之前,需要对数据集中的人脸图像数据进行若干预处理步骤,包括人脸检测和对齐、图像像素值归一化、图像大小归一化、图像增强和数据集清洗等。其中本实例将图像像素值归一化到32位浮点数0到1之间,将图像大小归一化为112×112×3(分别代表输入图片的长、宽和色彩通道数),使用的图像增强方法包括灰度线性变换、直方图均衡变换、像素色彩抖动等。验证集的准备有两种方案:<1>将数据集划分为训练集和验证集两部分,划分比例为9:1;<2>使用人脸识别领域常用的人脸验证集,如LFW,Age DB 30,CFP-FP,MegaFace等。本实例采用MS-Celeb-1M(约5.8M张图像,包含93431个不同类别)作为训练数据集,使用LFW,Age DB 30,CFP-FP作为验证数据集。
设定人脸识别性能指标并选择合适的深度卷积神经网络模型。预设人脸识别性能指标为:损失值阈值为9.0;在LFW上达到准确率99%,在Age DB30上达到准确率95%,CFP-FP上达到准确率95%。根据数据集的规模和组成,选择ResNet50作为提取特征的模型。设定网络输入大小为112×112×3,输出特征维度为512。因为原ResNet50模型输出大小为1000,因此需要将其最后一个全连接层替换为新的输出层。
原模型倒数第二层的输出形状为:4×4×2048
新的输出层结构下:
一个BatchNormalization层,输出形状为4×4×2048;
一个Dropout层,输出形状为4×4×2048;
一个Flatten层,输出形状为32768;
一个全连接层,输出形状为512;
一个BatchNormalization层,输出形状为512。
此层的输出则为模型提取的人脸特征。在训练阶段,此特征作为损失层输入;在测试阶段,此特征直接作为模型输出。
2)在每次训练迭代开始时,从训练集中随机抽取一批数量为128的人脸图像,将其输入模型中进行前向传播,模型输出的特征作为步骤3)的输入。
3)构建损失层,并对本次训练迭代计算损失值,作为步骤4)的输入。如图2所示,构建损失层以及计算损失值的步骤如下:
3.1)准备损失函数的输入,包括本次训练迭代模型输出的本批次人脸特征x(形状为128×512)以及其对应的人脸身份标签y(形状为128×1);设置损失层各部分的超参数为:Center loss权重系数α=1.0,ArcFace loss权重系数β=0.001,ArcFace loss中内置的超参数s=64和m=0.5,Inner origin loss权重系数γ=1.0,Inner origin loss内置的超参数η=12.0;其中,s为特征缩放因子,m为角度间隔,η为排斥圆有效半径;
3.2)对于训练过程中首次计算损失值,应用glorot uniform方法对类中心权重参数W进行初始化;对于非首次计算损失值,则使用已初始化的类中心权重参数W。其中,Center loss部分和ArcFace loss部分共享同一组类中心权重参数W。其中W的形状为512×93431。
3.3)计算Center loss部分的损失值LC,公式如下:
Figure BDA0002574413550000081
其中,N=128为本批次训练样本的数目,i为这批样本中第i个样本的序号,xi(形状为1×512)为输入人脸特征x的第i行。cyi(形状为512×1)为xi对应人脸身份标签yi所对应的类中心权重向量,即W的第yi列。
3.4)计算ArcFace loss部分的损失值LA,公式如下:
Figure BDA0002574413550000082
其中,θyi为输入人脸特征xi与对应人脸身份标签yi所对应的类中心权重向量cyi的夹角;θj则是输入人脸特征xi与其它非本类的类中心权重向量cj的夹角。n为训练集中所有样本的类别数目,j为这n个类中第j个类的序号。夹角θ为一个二维矩阵(形状为128×93431),θyi和θj为其各个位置上的元素值,其计算公式如下:
Figure BDA0002574413550000083
其中,||·||2为L2范数。
3.5)计算Inner origin loss部分的损失值Linnerorigin,其计算步骤如下:
3.5.1)计算输入特征x与特征空间原点的平均距离D,计算公式如下:
Figure BDA0002574413550000091
3.5.2)计算削弱后的负距离d,计算公式如下:
d=-D+η
3-5-3)计算激活后Inner origin loss,计算公式如下:
Linnerorigin=Relu(d)
其中,Relu(d)=max(d,0);
3.6)对步骤3.3)、3.4)、3.5)中计算的三部分损失加权累加,得到损失层的输出结果,计算公式如下:
L=αLA+βLC+γLinnerorigin
此L即为步骤3)输出的损失值。该值为一标量。
4)根据步骤3)计算得到的损失值,判断损失值是否低于9.0:若是,则停止训练;若否,则通过现有的深度学习框架(Tensorflow、PyTorch、MxNet等)自动完成对梯度的计算和对模型参数的更新。本实例所述的参数优化方法为,使用初始学习率为0.01的SGD优化器,在训练迭代步数分别为100000,160000和220000时,学习率以0.1的衰减率衰减;当训练迭代步数达到300000时,将学习率策略更改为SGDR,其中SGDR学习率曲线的最大值为0.001,最小值为0.00001。
5)预先设定的验证间隔步数为2000,判断训练迭代步数是否为2000的整数倍:若否,则返回到步骤2);若是,则使用验证集测试模型性能。然后根据测得的模型性能,判断其是否达到预先设定的性能指标(在LFW上准确率大于99%,在Age DB30上准确率大于95%,在CFP-FP上准确率大于95%,):若是,则停止训练;若否,则返回步骤2)。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

Claims (7)

1.一种用于人脸识别的深度卷积神经网络的训练方法,其特征在于,包括以下步骤:
1)准备好人脸图像数据集,并划分有训练集和验证集,然后根据训练集的规模、复杂程度和应达到的人脸识别的性能指标,选择深度卷积神经网络模型的类型、结构、超参数和量级;
2)利用选择好的深度卷积神经网络模型对训练集输入的人脸图片提取特征,提取的特征作为步骤3)的输入;
3)构建损失层,并对本次训练迭代计算损失值,作为步骤4)的输入;
4)将步骤3)计算得到的损失值与预先设定的阈值相比较,判断是停止训练还是计算梯度并更新模型参数;
5)模型性能验证以及判断是否停止训练。
2.根据权利要求1所述的一种用于人脸识别的深度卷积神经网络的训练方法,特征在于,在步骤1)中,需要对人脸图像数据集进行预处理,包括人脸检测和对齐、图像像素值归一化、图像大小归一化、图像增强和数据集清洗。
3.根据权利要求1所述的一种用于人脸识别的深度卷积神经网络的训练方法,特征在于,在步骤1)中,需要设置深度卷积神经网络模型的输入图片大小和输出特征的维度。
4.根据权利要求1所述的一种用于人脸识别的深度卷积神经网络的训练方法,特征在于,在步骤2)中,在每次训练迭代开始时,从训练集中随机抽取一批固定数量的人脸图像,将其输入深度卷积神经网络模型中进行前向传播,模型输出的特征作为步骤3)的输入。
5.根据权利要求1所述的一种用于人脸识别的深度卷积神经网络的训练方法,特征在于,在步骤3)中,构建损失层以及计算损失值的步骤如下:
3.1)准备损失函数的输入,包括本次训练迭代模型输出的本批次人脸特征x以及其对应的人脸身份标签y;设置损失层各部分的超参数:Center loss权重系数α、ArcFace loss权重系数β,ArcFace loss中内置的超参数s和m,Inner origin loss权重系数γ和Innerorigin loss内置的超参数η;其中,s为特征缩放因子,m为角度间隔,η为排斥圆有效半径;
3.2)对于训练过程中首次计算损失值,用设定的权重初始化方法对类中心权重参数W进行初始化;对于非首次计算损失值,则使用已初始化的类中心权重参数W;其中,Centerloss部分和ArcFace loss部分共享同一组类中心权重参数W;
3.3)计算Center loss部分的损失值LC,公式如下:
Figure FDA0002574413540000021
式中,N为本批次训练样本的数目,i为这批样本中第i个样本的序号,xi为输入人脸特征x的第i行;
Figure FDA0002574413540000025
为xi对应人脸身份标签yi所对应的类中心权重向量,即W的第yi列;
3.4)计算ArcFace loss部分的损失值LA,公式如下:
Figure FDA0002574413540000022
式中,
Figure FDA0002574413540000023
为输入人脸特征xi与对应人脸身份标签yi所对应的类中心权重向量
Figure FDA0002574413540000024
的夹角;θj则是输入人脸特征xi与其它非本类的类中心权重向量cj的夹角;n为训练集中所有样本的类别数目,j为这n个类中第j个类的序号;夹角θ为一个二维矩阵,
Figure FDA0002574413540000031
和θj为其各个位置上的元素值,其计算公式如下:
Figure FDA0002574413540000032
式中,||·||2为L2范数;
3.5)计算Inner origin loss部分的损失值Linnerorigin,其计算步骤如下:
3.5.1)计算输入特征x与特征空间原点的平均距离D,计算公式如下:
Figure FDA0002574413540000033
3.5.2)计算削弱后的负距离d,计算公式如下:
d=-D+η
3.5.3)计算激活后Inner origin loss,计算公式如下:
Linnerorigin=Relu(d)
式中,Relu(d)=max(d,0);
3.6)对步骤3.3)、3.4)、3.5)中计算的三部分损失加权累加,得到损失层的输出结果,计算公式如下:
L=αLA+βLC+γLinnerorigin
式中,L为步骤3)输出的损失值。
6.根据权利要求1所述的一种用于人脸识别的深度卷积神经网络的训练方法,特征在于,在步骤4)中,根据步骤3)计算得到的损失值,判断损失值是否低于预先设定的阈值:若是,则停止训练;若否,则根据该损失值计算模型中可训练参数的梯度值,并按照预先定义参数优化方法对模型参数进行更新。
7.根据权利要求1所述的一种用于人脸识别的深度卷积神经网络的训练方法,特征在于,在步骤5)中,根据预先设定的验证间隔步数,判断是否需要进行模型性能验证:若否,则返回到步骤2);若是,则使用验证集测试模型性能;然后根据测得的模型性能,判断其是否达到预先设定的性能指标:若是,则停止训练;若否,则返回步骤2)。
CN202010649598.2A 2020-07-08 2020-07-08 一种用于人脸识别的深度卷积神经网络的训练方法 Active CN111985310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010649598.2A CN111985310B (zh) 2020-07-08 2020-07-08 一种用于人脸识别的深度卷积神经网络的训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010649598.2A CN111985310B (zh) 2020-07-08 2020-07-08 一种用于人脸识别的深度卷积神经网络的训练方法

Publications (2)

Publication Number Publication Date
CN111985310A true CN111985310A (zh) 2020-11-24
CN111985310B CN111985310B (zh) 2023-06-30

Family

ID=73439203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010649598.2A Active CN111985310B (zh) 2020-07-08 2020-07-08 一种用于人脸识别的深度卷积神经网络的训练方法

Country Status (1)

Country Link
CN (1) CN111985310B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112464916A (zh) * 2020-12-31 2021-03-09 上海齐感电子信息科技有限公司 人脸识别方法及其模型训练方法
CN112800959A (zh) * 2021-01-28 2021-05-14 华南理工大学 一种用于人脸识别中数据拟合估计的困难样本发掘方法
CN112819984A (zh) * 2021-01-13 2021-05-18 华南理工大学 一种基于人脸识别的课堂多人点名签到方法
CN112836629A (zh) * 2021-02-01 2021-05-25 清华大学深圳国际研究生院 一种图像分类方法
CN113069080A (zh) * 2021-03-22 2021-07-06 上海交通大学医学院附属第九人民医院 一种基于人工智能的困难气道评估方法及装置
CN113205058A (zh) * 2021-05-18 2021-08-03 中国科学院计算技术研究所厦门数据智能研究院 一种防止非活体攻击的人脸识别方法
CN113361346A (zh) * 2021-05-25 2021-09-07 天津大学 一种替换调节参数的尺度参数自适应的人脸识别方法
CN113505692A (zh) * 2021-07-09 2021-10-15 西北工业大学 基于受试者工作特征曲线下部分面积优化的人脸识别方法
CN113591637A (zh) * 2021-07-20 2021-11-02 北京爱笔科技有限公司 对齐模型的训练方法、装置、计算机设备以及存储介质
CN115410265A (zh) * 2022-11-01 2022-11-29 合肥的卢深视科技有限公司 模型训练方法、人脸识别方法、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106203533A (zh) * 2016-07-26 2016-12-07 厦门大学 基于混合训练的深度学习人脸验证方法
CN108647583A (zh) * 2018-04-19 2018-10-12 浙江大承机器人科技有限公司 一种基于多目标学习的人脸识别算法训练方法
CN109165566A (zh) * 2018-08-01 2019-01-08 中国计量大学 一种基于新型损失函数的人脸识别卷积神经网络训练方法
CN109902757A (zh) * 2019-03-08 2019-06-18 山东领能电子科技有限公司 一种基于Center Loss改进的人脸模型训练方法
CN110348319A (zh) * 2019-06-18 2019-10-18 武汉大学 一种基于人脸深度信息和边缘图像融合的人脸防伪方法
CN111340013A (zh) * 2020-05-22 2020-06-26 腾讯科技(深圳)有限公司 人脸识别方法、装置、计算机设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106203533A (zh) * 2016-07-26 2016-12-07 厦门大学 基于混合训练的深度学习人脸验证方法
CN108647583A (zh) * 2018-04-19 2018-10-12 浙江大承机器人科技有限公司 一种基于多目标学习的人脸识别算法训练方法
CN109165566A (zh) * 2018-08-01 2019-01-08 中国计量大学 一种基于新型损失函数的人脸识别卷积神经网络训练方法
CN109902757A (zh) * 2019-03-08 2019-06-18 山东领能电子科技有限公司 一种基于Center Loss改进的人脸模型训练方法
CN110348319A (zh) * 2019-06-18 2019-10-18 武汉大学 一种基于人脸深度信息和边缘图像融合的人脸防伪方法
CN111340013A (zh) * 2020-05-22 2020-06-26 腾讯科技(深圳)有限公司 人脸识别方法、装置、计算机设备及存储介质

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112464916A (zh) * 2020-12-31 2021-03-09 上海齐感电子信息科技有限公司 人脸识别方法及其模型训练方法
CN112464916B (zh) * 2020-12-31 2023-09-19 上海齐感电子信息科技有限公司 人脸识别方法及其模型训练方法
CN112819984A (zh) * 2021-01-13 2021-05-18 华南理工大学 一种基于人脸识别的课堂多人点名签到方法
CN112819984B (zh) * 2021-01-13 2022-01-18 华南理工大学 一种基于人脸识别的课堂多人点名签到方法
CN112800959A (zh) * 2021-01-28 2021-05-14 华南理工大学 一种用于人脸识别中数据拟合估计的困难样本发掘方法
CN112800959B (zh) * 2021-01-28 2023-06-06 华南理工大学 一种用于人脸识别中数据拟合估计的困难样本发掘方法
CN112836629A (zh) * 2021-02-01 2021-05-25 清华大学深圳国际研究生院 一种图像分类方法
CN112836629B (zh) * 2021-02-01 2024-03-08 清华大学深圳国际研究生院 一种图像分类方法
CN113069080A (zh) * 2021-03-22 2021-07-06 上海交通大学医学院附属第九人民医院 一种基于人工智能的困难气道评估方法及装置
CN113205058A (zh) * 2021-05-18 2021-08-03 中国科学院计算技术研究所厦门数据智能研究院 一种防止非活体攻击的人脸识别方法
CN113361346A (zh) * 2021-05-25 2021-09-07 天津大学 一种替换调节参数的尺度参数自适应的人脸识别方法
CN113361346B (zh) * 2021-05-25 2022-12-23 天津大学 一种替换调节参数的尺度参数自适应的人脸识别方法
CN113505692A (zh) * 2021-07-09 2021-10-15 西北工业大学 基于受试者工作特征曲线下部分面积优化的人脸识别方法
CN113505692B (zh) * 2021-07-09 2024-05-24 西北工业大学 基于受试者工作特征曲线下部分面积优化的人脸识别方法
CN113591637A (zh) * 2021-07-20 2021-11-02 北京爱笔科技有限公司 对齐模型的训练方法、装置、计算机设备以及存储介质
CN115410265B (zh) * 2022-11-01 2023-01-31 合肥的卢深视科技有限公司 模型训练方法、人脸识别方法、电子设备及存储介质
CN115410265A (zh) * 2022-11-01 2022-11-29 合肥的卢深视科技有限公司 模型训练方法、人脸识别方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN111985310B (zh) 2023-06-30

Similar Documents

Publication Publication Date Title
CN111985310A (zh) 一种用于人脸识别的深度卷积神经网络的训练方法
CN110084216B (zh) 人脸识别模型训练和人脸识别方法、系统、设备及介质
CN108596258B (zh) 一种基于卷积神经网络随机池化的图像分类方法
El-Sawy et al. Arabic handwritten characters recognition using convolutional neural network
CN110472533B (zh) 一种基于半监督训练的人脸识别方法
CN108427921A (zh) 一种基于卷积神经网络的人脸识别方法
CN109711426B (zh) 一种基于gan和迁移学习的病理图片分类装置及方法
CN105138998B (zh) 基于视角自适应子空间学习算法的行人重识别方法及系统
CN109359608B (zh) 一种基于深度学习模型的人脸识别方法
CN111915437B (zh) 基于rnn的反洗钱模型的训练方法、装置、设备及介质
CN109344759A (zh) 一种基于角度损失神经网络的亲属识别方法
CN110738242B (zh) 一种深度神经网络的贝叶斯结构学习方法及装置
CN111401156B (zh) 基于Gabor卷积神经网络的图像识别方法
JP2022141931A (ja) 生体検出モデルのトレーニング方法及び装置、生体検出の方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
CN110532880B (zh) 样本筛选及表情识别方法、神经网络、设备及存储介质
CN113593661B (zh) 临床术语标准化方法、装置、电子设备及存储介质
CN107491729B (zh) 基于余弦相似度激活的卷积神经网络的手写数字识别方法
CN112084891B (zh) 基于多模态特征与对抗学习的跨域人体动作识别方法
CN106096517A (zh) 一种基于低秩矩阵与特征脸的人脸识别方法
CN109190698B (zh) 一种网络数字虚拟资产的分类识别系统及方法
CN110334715A (zh) 一种基于残差注意网络的sar目标识别方法
CN110110724A (zh) 基于指数型挤压函数驱动胶囊神经网络的文本验证码识别方法
CN113283524A (zh) 一种基于对抗攻击的深度神经网络近似模型分析方法
AU2022392233A1 (en) Method and system for analysing medical images to generate a medical report
CN108520201A (zh) 一种基于加权混合范数回归的鲁棒人脸识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant