CN110674714A - 基于迁移学习的人脸和人脸关键点联合检测方法 - Google Patents

基于迁移学习的人脸和人脸关键点联合检测方法 Download PDF

Info

Publication number
CN110674714A
CN110674714A CN201910867602.XA CN201910867602A CN110674714A CN 110674714 A CN110674714 A CN 110674714A CN 201910867602 A CN201910867602 A CN 201910867602A CN 110674714 A CN110674714 A CN 110674714A
Authority
CN
China
Prior art keywords
face
training
network
loss function
anchor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910867602.XA
Other languages
English (en)
Other versions
CN110674714B (zh
Inventor
杨万扣
葛涌涛
郑文明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201910867602.XA priority Critical patent/CN110674714B/zh
Publication of CN110674714A publication Critical patent/CN110674714A/zh
Application granted granted Critical
Publication of CN110674714B publication Critical patent/CN110674714B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种快速人脸和人脸关键点联合检测方法,包括如下步骤:步骤1,构建教师网络和学生网络;步骤2,输入一批训练图像,进行数据增强;步骤3,根据自适应尺度匹配策略,划分正负锚点框样本;步骤4,挖掘正负样本,计算多任务损失函数,更新网络参数;步骤5,转至步骤2,直至训练收敛,得到教师网络模型;步骤6,重复步骤2到步骤5,利用教师网络模型,加入迁移学习损失函数,训练得到学生网络模型;步骤7,在测试阶段,输入测试图像到学生网络模型,得到检测结果。本发明可以同时得到人脸和关键点检测结果,加快了人脸识别预处理流程的速度。本发明提出的轻量网络推理速度快,能够部署在算力受限的嵌入式设备。

Description

基于迁移学习的人脸和人脸关键点联合检测方法
技术领域
本发明属于图像处理与模式识别技术领域,具体涉及到一种基于迁移学习的的人脸和人脸关键点联合检测方法,可以应用到视频监控,身份识别和人机交互等诸多领域。
背景技术
人脸检测是一种在任意图像中自动搜索人脸的位置和大小的技术,人脸关键点检测是一种在任意图像中自动搜索定义好的人脸特征点(如瞳孔,鼻子,嘴角等)的位置的技术。人脸检测和人脸关键点检测在计算机视觉、模式识别应用中占有很重要的地位,例如视频监控和门禁系统等。对于人脸识别来说,人脸检测和人脸关键点检测是必不可少的两个预处理步骤。
目前大多数人脸识别方法的流程都需要以人脸检测和人脸关键点的结果作为基础来进行人脸对齐,运用最为广泛的是MTCNN。但是随着人脸尺度的变小,MTCNN的检测性能会急剧下降。随着图图像中人脸的增多,MTCNN的检测耗时也会急剧增加。总的来说,设计嵌入式端人脸检测和人脸关键点检测网络的挑战主要有以下三个方面:首先,传统的检测方法中网络参数存在着很大冗余,这是不符合嵌入式设备功耗要求的,嵌入式端网络的主体结构要短小精干,这样才能保证网络的运算量和推理速度。其次,传统的锚点框与人脸标注框匹配的策略不够完善,有些尺度的人脸标注框不能匹配到足够多的锚点框,导致它们有着较低的召回率,覆盖的人脸尺度范围不够广泛。最后,在轻量网络框架下进行多任务学习会往往会带来一定的精度损失,因为轻量网络的参数冗余度小,网络容量不够大。
发明内容
为了解决现有技术中的上述问题,本发明提出了一种轻量型人脸和人脸关键点联合检测方法,尺度覆盖范围足够大,并且与MTCNN相比,关键点检测精度更高。
该方法包括如下步骤:
步骤1,构建教师网络和学生网络的主体框架并设计锚点框的关联层以及大小;
步骤2,输入一批训练图像,运用数据増广技术,扩充训练样本,以增强模型泛化能力;
步骤3,根据自适应尺度匹配策略,把所有锚点框划分为正样本和负样本并匹配人脸关键点的标注;
步骤4,应用困难负样本挖掘方法,选出部分负样本,与所有的正样本一起,计算分类,回归,关键点和注意力损失函数,以更新网络参数,完成一次网络训练;
步骤5,转至步骤2,直至训练收敛,得到最终的教师网络模型;
步骤6,重复步骤2到步骤5,利用训练好的教师网络模型,加入迁移学习损失函数,训练得到学生网络模型;
步骤7,在测试阶段,把测试图像输入最终的学生网络模型,进行人脸和人脸关键点检测。
作为本发明的优选,步骤1中教师网络和学生网络的网络结构仅在每一层的通道数量上存在区别,教师网络每一层的通道数量设置为学生网络的4倍,教师网络和学生网络均采用了快速下采样策略。
作为本发明的优选,所述步骤2中具体的步骤为:
(2-1)随机旋转操作:如果一张图像中人脸尺度均大于48,则对其以图像中心为原点,在[-20°,20°]的角度范围内随机旋转;
(2-2)颜色抖动操作:分别以0.5的概率,随机地调整训练图像的亮度、对比度、饱和度;
(2-3)随机裁剪操作:在这张训练图像上,随机地裁剪出5张正方形子图像,其中1个是其最大的正方形子图像,另外4张正方形子图像的边长是训练图像短边的0.3~1.0倍,在这5张正方形子图像中,随机地选取1张作为最终的训练样本;
(2-4)水平翻转操作:对于这张选中的训练样本,以0.5的概率随机地进行水平翻转操作;
(2-5)尺度变换操作:把经过上述操作得到的训练样本,以0.5的概率缩放到640×640大小或1024×1024大小,送入网络用于训练。
作为本发明的优选,所述步骤3中基于多尺度自适应的锚点框匹配策略包括以下步骤:
(3-1)根据数据集中的人脸尺度分布情况,将人脸尺度划分为N组;
(3-2)根据标准的锚点框匹配策略,根据数据集中的人脸尺度分布确定网络各个输出层的检测尺度,各个输出层的阈值随着人脸尺度的增长而线性递增,阈值设置公式如下式所示,
Figure BDA0002201722330000031
其中,numstride是网络输出层数,θmin代表第一个尺度的阈值,θmax代表最后一个尺度的阈值,一般numstride=5,θmin=0.35,θmax=0.5。
然后对人脸标注框和锚点框进行配对,
[a1,a2,a3,...,aN]
其中ai包括锚点框的位置和大小,根据它们与该人脸标注框的交除并重叠比大小,进行降序排序得到:
[A1,A2,A3,...,AN]
最后,选取前Np个锚点框,作为该人脸标注框匹配到的锚点框,其中Np为可调参数,默认设为上述第一步中人脸标注框的平均匹配数量。
作为本发明的优选,所述步骤4的具体步骤为:
对于所有的负样本,计算出他们分类预测所带来的误差值,并根据误差值进行降序排序,选取前Nneg个负样本参与训练,使得:
Nneg=3Npos
其中Npos为正样本的数量,经过困难负样本挖掘之后,正样本与负样本的数量比例为1∶3,两者有着比较平衡数量,用于计算如下的损失函数:
其中,i是mini-batch中一个锚点框的标号,pi是i号锚点框被预测是人脸的概率,如果锚点框是正样本的话,训练标注
Figure BDA0002201722330000042
是1,如果锚点框是负样本的话,训练标注是0,ti是一个4维的向量,参数化了预测人脸边界框的坐标,
Figure BDA0002201722330000044
是与正锚点框关联的ti的标注,l*是注意力损失中中心点到人脸标注框左侧的距离,t*是注意力损失中中心点到人脸标注框上侧的距离,r*是注意力损失中中心点到人脸标注框右侧的距离,b*是注意力损失中中心点到人脸标注框下侧的距离,
Figure BDA0002201722330000045
是教师网络的分类输出,参数化方法为:
tx=(x-xa)/wa,ty=(y-ya)/ha,tw=log(w/wa),th=log(h/ha)
Figure BDA0002201722330000047
Figure BDA0002201722330000048
其中x,u,w和h分别表示框中心的坐标和它的宽长,x,xa以及x*分别代表人脸预测框、锚点框和人脸标注框,
Figure BDA0002201722330000049
表示关键点的标注,
Figure BDA00022017223300000410
表示人脸标注框左上角坐标,
Figure BDA00022017223300000411
表示人脸标注框右下角坐标;
损失函数中的分类损失Lcls项是基于两类分类(人脸vs.背景)的对数损失:
Figure BDA00022017223300000412
对于回归损失函数Lreg,采用鲁棒回归损失函数(smooth L1):
其中:
Figure BDA0002201722330000051
对于关键点回归损失函数,采用改进的L1损失函数(Wing L1):
对于注意力损失函数,计算方式如下:
对centerness*采用二类交叉熵损失函数训练;
对于知识蒸馏损失函数,采用自适应KL散度函数来度量教师网络和学生分类输出概率的相似性,其中,q是教师网络的分类输出概率,p是教师网络的分类输出概率:
Figure BDA0002201722330000053
对于迁移学习训练来说,采用了一种自适应的迁移损失函数ADL:
aptweight=(1-e-(KL+βT(q)))γ
T(q)=-q(qlog(q)+(1-q)log(1-q))
Ldistillation=aptweight·KL
四项损失函数分别被Ncls,Nreg和Nldmk归一化,并由系数λ做加权平衡。其中:
Ncls=Nneg+Npos,Nreg=Npos,Nldmk=Nldmkpos
其中正负样本比例为1∶3,因此加权系数λ1默认设为4,以使Lcls和Lreg拥有大体相同水平的权重。λ2默认设为1,λ3默认设为1,λ4默认设为1;
损失函数计算完成后,利用随机梯度下降法,反向传播误差,更新网络参数,完成一次训练。
有益效果:
本发明解决了人脸检测效率低,速度慢的技术问题。通过本发明的方法,可以利用单个轻量型学生网络同时得到鲁棒的人脸和关键点检测结果,加快了人脸识别预处理流程的速度。本发明提出的方法检测精度高,适应范围广,在网络参数量极小的情况下,仍然能够保证人脸检测和关键点精度,能够部署在计算力受限的嵌入式设备。
附图说明
图1为本发明所提供的基于多尺度锚点框的人脸检测方法的流程示意图;
图2为本发明所构建的多尺度人脸检测网络架构示意图。
图3为本发明所构建的注意力机制标注示意图。
图4为本发明所构建的迁移学习过程示意图。
具体实施方式
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
本发明公开了一种轻量型人脸和人脸关键点联合检测方法,如图1所示,包括如下步骤:
步骤1,构建网络框架,设计锚点框的关联层和大小。通过一个步长为2的5×5卷积核和一个步长为2的3×3最大池化操作,保证了小尺度特征层的感受野和极大降低了网络的运算量。同时,为了让教师网络获得更高的推理精度,将教师网络每一层的卷积核通道数设置为学生网络的4倍。在本发明中,对5个锚点框关联层按照
Figure BDA0002201722330000061
的间隔,每层铺设3个宽高比为1的锚点框。具体设置如下表。
表1.特征图锚点设置
Figure BDA0002201722330000062
步骤2,输入一批训练图像,运用数据増广技术。
对于输入的每张训练图像,依次按照如下操作,进行数据的増广:
(1)随机旋转操作:如果一张图像中人脸尺度均大于48,则对其以图像中心为原点,在[-20°,20°]的角度范围内随机旋转。
(2)颜色抖动操作:分别以0.5的概率,随机地调整训练图像的亮度、对比度、饱和度等参数。
(3)随机裁剪操作:在这张训练图像上,随机地裁剪出5张正方形子图像。其中1个是其最大的正方形子图像,另外4张正方形子图像的边长是训练图像短边的0.3~1.0倍。在这5张正方形子图像中,随机地选取1张作为最终的训练样本。
(4)水平翻转操作:对于这张选中的训练样本,以0.5的概率随机地进行水平翻转操作。
(5)尺度变换操作:把经过上述操作得到的训练样本,以0.5的概率缩放到640×640大小或1024×1024大小,送入网络用于训练。
输入的每张训练图像依次经过上述5个操作,最终得到1张大小为640×640或1024×1024的训练样本。通过数据增广操作极大地丰富了训练样本,能够显著地提高模型的泛化能力。
步骤3,根据自适应尺度匹配策略,把锚点框分为正负样本并匹配正确的关键点样本。
为了解决现有的匹配策略下,小尺度人脸不能匹配到充足的锚点框这一问题,本发明提出尺度自适应锚点框匹配策略。该策略由两个步骤组成:第一步,根据数据集中的人脸尺度分布情况,将人脸尺度划分为N组,第二步,根据标准的锚点框匹配策略,根据数据集中的人脸尺度分布确定网络各个输出层的检测尺度,各个输出层的阈值随着人脸尺度的增长而线性递增,阈值设置公式如下式所示,
Figure BDA0002201722330000071
然后对人脸标注框和锚点框进行配对,
[a1,a2,a3,...,aN]
其中ai包括锚点框的位置和大小。根据它们与该人脸标注框的交除并重叠比大小,进行降序排序得到:
[A1,A2,A3,...,AN]
最后,选取前Np个锚点框,作为该人脸标注框匹配到的锚点框。其中Np为可调参数,默认设为上述第一步中人脸标注框的平均匹配数量。
步骤5,困难负样本挖掘,计算损失函数,更新网络参数。
经过步骤4之后,所有的锚点框被分为正样本和负样本,但是负样本的数量远远大于正样本的数量。为了使训练过程更加稳定,收敛速度更加快,我们使用困难负样本挖掘技术,选出部分负样本参与训练。具体操作为:对于所有的负样本,计算出他们分类预测所带来的误差值,并根据误差值进行降序排序,选取前Nneg个负样本参与训练,使得:
Nneg=3Npos
其中Npos为正样本的数量。经过困难负样本挖掘之后,正样本与负样本的数量比例为1∶3,两者有着比较平衡数量,用于计算如下的损失函数:
Figure BDA0002201722330000081
其中,i是mini-batch中一个锚点框的标号,pi是i号锚点框被预测是人脸的概率。如果锚点框是正样本的话,训练标注是1,如果锚点框是负样本的话,训练标注
Figure BDA0002201722330000083
是0。ti是一个4维的向量,参数化了预测人脸边界框的坐标,
Figure BDA0002201722330000084
是与正锚点框关联的ti的标注。l*是注意力损失中中心点到人脸标注框左侧的距离,t*是注意力损失中中心点到人脸标注框上侧的距离,r*是注意力损失中中心点到人脸标注框右侧的距离,b*是注意力损失中中心点到人脸标注框下侧的距离。
Figure BDA0002201722330000085
是教师网络的分类输出。参数化方法为:
tx=(x-xa)/wa,ty=(y-ya)/ha,tw=log(w/wa),th=log(h/ha)
Figure BDA0002201722330000086
Figure BDA0002201722330000091
Figure BDA0002201722330000092
其中x,u,w和h分别表示框中心的坐标和它的宽长。x,xa以及x*分别代表人脸预测框、锚点框和人脸标注框。
Figure BDA0002201722330000093
表示关键点的标注,
Figure BDA0002201722330000094
表示人脸标注框左上角坐标,表示人脸标注框右下角坐标。
损失函数中的分类损失Lcls项是基于两类分类(人脸vs.背景)的对数损失:
Figure BDA0002201722330000096
对于回归损失函数Lreg,我们采用鲁棒回归损失函数(smooth L1):
Figure BDA0002201722330000097
其中:
Figure BDA0002201722330000098
对于关键点回归损失函数,我们采用改进的L1损失函数(Wing L1):
对于注意力损失函数,计算方式如下:
Figure BDA0002201722330000099
对centerness*采用二类交叉熵损失函数训练。
对于知识蒸馏损失函数,我们采用自适应KL散度函数来度量教师网络和学生分类输出概率的相似性,其中,q是教师网络的分类输出概率,p是教师网络的分类输出概率:
对于迁移学习训练来说,人脸检测中的困难样本分为两类,一类是教师网络和学生网络输出概率间隔比较大的样本(hard-to-mimic),另一类是教师网络输出不确定度比较大的样本(hard-to-learn)。如果不把这些样本和简单样本区分开来,那么在迁移学习的过程中,简单样本的损失将统治整个训练过程,这不利于有效地传递在教师网络和学生网络之间传递信息。因此,本发明采用了一种自适应的迁移损失函数ADL:
aptweight=(1-e-(KL+βT(q)))γ
T(q)=-q(qlog(q)+(1-q)log(1-q))
Ldistillation=aptweight·KL
四项损失函数分别被Ncls,Nreg和Nldmk归一化,并由系数λ做加权平衡。其中:
Ncls=Nneg+Npos,Nreg=Npos,Nldmk=Nldmkpos
其中正负样本比例为1∶3,因此加权系数λ1默认设为4,以使Lcls和Lrea拥有大体相同水平的权重。λ2默认设为1,λ3默认设为1,λ4默认设为1。
损失函数计算完成后,利用随机梯度下降法,反向传播误差,更新网络参数,完成一次训练。
步骤6,转至步骤3,直至网络收敛,得到最终的网络模型。
步骤7,在测试阶段,把测试图像输入训练好的学生网络模型进行人脸检测,输出检测结果框。由于输出的检测框的数量非常多,首先通过置信度阈值T=0.1,筛掉大部分的检测框,接着根据置信度选出前Na=500个检测框。然后使用非极大值抑制去除重复的检测框,并根据置信度选出前Nb=250个检测框,即得到最终的检测结果。
本发明提出了一种基于迁移学习的的人脸和人脸关键点联合检测方法。该方法仅仅利用一个端到端的卷积神经网络实现了人脸和人脸关键点的联合检测,提高了人脸检测的精度,极大地降低了人脸识别预处理的耗时。在训练卷积神经网络时,需要匹配人脸标注框和锚点框,但如果对所有尺度采用同一个阈值来匹配人脸标注框,小尺度的人脸标注框不能匹配到足够多的锚点框,本发明提出了尺度自适应锚点框匹配策略,很好地解决了这个问题。此外,为了让网络的注意力更加集中在图像中的目标,本发明设计了基于注意力损失函数,让人脸检测网络在有人脸目标的区域拥有更高的响应。同时,本发明提出了基于迁移学习的人脸检测训练方法,通过设计一个轻量型的学生网络和重量型的教师网络,先单独训练教师网络,训练完成后,固定教师网络的权重,迁移教师网络的知识,提高了学生网络的预测精度。最终本发明实现了基于迁移学习的的人脸和人脸关键点联合检测方法,能精确地检测到各种尺度的人脸和人脸关键点。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims (5)

1.一种基于迁移学习的快速人脸和人脸关键点联合检测方法,其特征在于,该方法包括以下步骤:
步骤1,构建教师网络和学生网络的主体框架,两种网络结构上除卷积核的通道数并设计锚点框的关联层以及大小;
步骤2,输入一批训练图像,运用数据増广技术,扩充训练样本,以增强模型泛化能力;
步骤3,根据自适应尺度匹配策略,把所有锚点框划分为正样本和负样本并匹配人脸关键点的标注;
步骤4,应用困难负样本挖掘方法,选出部分负样本,与所有的正样本一起,计算分类,回归,关键点和注意力损失函数,以更新网络参数,完成一次网络训练;
步骤5,转至步骤2,直至训练收敛,得到最终的教师网络模型;
步骤6,重复步骤2到步骤5,利用训练好的教师网络模型,加入迁移学习损失函数,训练得到学生网络模型;
步骤7,在测试阶段,把测试图像输入最终的学生网络模型,进行人脸和人脸关键点检测。
2.根据权利要求1所述的一种基于迁移学习的快速人脸和人脸关键点联合检测方法,其特征在于,教师网络和学生网络的网络结构仅在每一层的通道数量上存在区别,教师网络每一层的通道数量设置为学生网络的4倍,教师网络和学生网络均采用了快速下采样策略。
3.根据权利要求1所述的一种基于迁移学习的快速人脸和人脸关键点联合检测方法,其特征在于,所述步骤2中具体的步骤为:
(2-1)随机旋转操作:如果一张图像中人脸尺度均大于48,则对其以图像中心为原点,在[-20°,20°]的角度范围内随机旋转;
(2-2)颜色抖动操作:分别以0.5的概率,随机地调整训练图像的亮度、对比度、饱和度;
(2-3)随机裁剪操作:在这张训练图像上,随机地裁剪出5张正方形子图像,其中1个是其最大的正方形子图像,另外4张正方形子图像的边长是训练图像短边的0.3~1.0倍,在这5张正方形子图像中,随机地选取1张作为最终的训练样本;
(2-4)水平翻转操作:对于这张选中的训练样本,以0.5的概率随机地进行水平翻转操作;
(2-5)尺度变换操作:把经过上述操作得到的训练样本,以0.5的概率缩放到640×640大小或1024×1024大小,送入网络用于训练。
4.根据权利要求1所述的一种基于迁移学习的快速人脸和人脸关键点联合检测方法,其特征在于,所述步骤3中基于多尺度自适应的锚点框匹配策略包括以下步骤:
(3-1)根据数据集中的人脸尺度分布情况,将人脸尺度划分为N组;
(3-2)根据标准的锚点框匹配策略,根据数据集中的人脸尺度分布确定网络各个输出层的检测尺度,各个输出层的阈值随着人脸尺度的增长而线性递增,阈值设置公式如下式所示,
Figure FDA0002201722320000021
其中,numstride是网络输出层数,θmin代表第一个尺度的阈值,θmax代表最后一个尺度的阈值,然后对人脸标注框和锚点框进行配对,
[a1,a2,a3,...,aN]
其中ai包括锚点框的位置和大小,根据它们与该人脸标注框的交除并重叠比大小,进行降序排序得到:
[A1,A2,A3,...,AN]
最后,选取前Np个锚点框,作为该人脸标注框匹配到的锚点框,其中Np为可调参数,默认设为上述第一步中人脸标注框的平均匹配数量。
5.根据权利要求1所述的一种基于迁移学习的快速人脸和人脸关键点联合检测方法,其特征在于,所述步骤4的具体步骤为:
对于所有的负样本,计算出他们分类预测所带来的误差值,并根据误差值进行降序排序,选取前Nneg个负样本参与训练,使得:
Nneg=3Npos
其中Npos为正样本的数量,经过困难负样本挖掘之后,正样本与负样本的数量比例为1∶3,两者有着比较平衡数量,用于计算如下的损失函数:
Figure FDA0002201722320000031
其中,i是mini-batch中一个锚点框的标号,pi是i号锚点框被预测是人脸的概率,如果锚点框是正样本的话,训练标注
Figure FDA0002201722320000032
是1,如果锚点框是负样本的话,训练标注
Figure FDA0002201722320000033
是0,ti是一个4维的向量,参数化了预测人脸边界框的坐标,
Figure FDA0002201722320000034
是与正锚点框关联的ti的标注,l*是注意力损失中中心点到人脸标注框左侧的距离,t*是注意力损失中中心点到人脸标注框上侧的距离,r*是注意力损失中中心点到人脸标注框右侧的距离,b*是注意力损失中中心点到人脸标注框下侧的距离,
Figure FDA0002201722320000035
是教师网络的分类输出,参数化方法为:
tx=(x-xa)/wa,ty=(y-ya)/ha,tw=log(w/wa),th=log(h/ha)
Figure FDA0002201722320000036
其中x,u,w和h分别表示框中心的坐标和它的宽长,x,xa以及x*分别代表人脸预测框、锚点框和人脸标注框,
Figure FDA0002201722320000039
Figure FDA00022017223200000310
表示关键点的标注,
Figure FDA00022017223200000312
表示人脸标注框左上角坐标,
Figure FDA00022017223200000313
表示人脸标注框右下角坐标;
损失函数中的分类损失Lcls项是基于两类分类(人脸vs.背景)的对数损失:
Figure FDA00022017223200000315
对于回归损失函数Lreg,采用鲁棒回归损失函数(smooth L1):
Figure FDA00022017223200000316
其中:
Figure FDA0002201722320000041
对于关键点回归损失函数,采用改进的L1损失函数(Wing L1):
对于注意力损失函数,计算方式如下:
对centerness*采用二类交叉熵损失函数训练;
对于知识蒸馏损失函数,采用自适应KL散度函数来度量教师网络和学生分类输出概率的相似性,其中,q是教师网络的分类输出概率,p是教师网络的分类输出概率:
对于迁移学习训练来说,采用了一种自适应的迁移损失函数ADL:
T(q)=-q(qlog(q)+(1-q)log(1-q))
Ldistillation=aptweight·KL
四项损失函数分别被Ncls,Nreg和Nldmk归一化,并由系数λ做加权平衡。其中:
Ncls=Nneg+Npos,Nreg=Npos,Nldmk=Nldmkpos
其中正负样本比例为1∶3,因此加权系数λ1默认设为4,以使Lcls和Lreg拥有大体相同水平的权重。λ2默认设为1,λ3默认设为1,λ4默认设为1;
损失函数计算完成后,利用随机梯度下降法,反向传播误差,更新网络参数,完成一次训练。
CN201910867602.XA 2019-09-13 2019-09-13 基于迁移学习的人脸和人脸关键点联合检测方法 Active CN110674714B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910867602.XA CN110674714B (zh) 2019-09-13 2019-09-13 基于迁移学习的人脸和人脸关键点联合检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910867602.XA CN110674714B (zh) 2019-09-13 2019-09-13 基于迁移学习的人脸和人脸关键点联合检测方法

Publications (2)

Publication Number Publication Date
CN110674714A true CN110674714A (zh) 2020-01-10
CN110674714B CN110674714B (zh) 2022-06-14

Family

ID=69078172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910867602.XA Active CN110674714B (zh) 2019-09-13 2019-09-13 基于迁移学习的人脸和人脸关键点联合检测方法

Country Status (1)

Country Link
CN (1) CN110674714B (zh)

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111242303A (zh) * 2020-01-14 2020-06-05 北京市商汤科技开发有限公司 网络训练方法及装置、图像处理方法及装置
CN111274981A (zh) * 2020-02-03 2020-06-12 中国人民解放军国防科技大学 目标检测网络构建方法及装置、目标检测方法
CN111325107A (zh) * 2020-01-22 2020-06-23 广州虎牙科技有限公司 检测模型训练方法、装置、电子设备和可读存储介质
CN111369535A (zh) * 2020-03-05 2020-07-03 四川大学华西医院 一种细胞检测方法
CN111489803A (zh) * 2020-03-31 2020-08-04 重庆金域医学检验所有限公司 基于自回归模型的报告单编码模型生成方法、系统和设备
CN111539222A (zh) * 2020-05-20 2020-08-14 北京百度网讯科技有限公司 语义相似度任务模型的训练方法、装置、电子设备及存储介质
CN111553230A (zh) * 2020-04-21 2020-08-18 东南大学 无约束场景下的基于特征强化的渐进式级联人脸检测方法
CN111709336A (zh) * 2020-06-08 2020-09-25 杭州像素元科技有限公司 一种高速公路行人检测方法、设备及可读存储介质
CN111709497A (zh) * 2020-08-20 2020-09-25 腾讯科技(深圳)有限公司 一种信息处理方法、装置及计算机可读存储介质
CN111767906A (zh) * 2020-09-01 2020-10-13 腾讯科技(深圳)有限公司 人脸检测模型训练方法、人脸检测方法、装置及电子设备
CN111914727A (zh) * 2020-07-28 2020-11-10 联芯智能(南京)科技有限公司 基于平衡采样与非线性特征融合的小目标人体检测方法
CN112115783A (zh) * 2020-08-12 2020-12-22 中国科学院大学 基于深度知识迁移的人脸特征点检测方法、装置及设备
CN112150821A (zh) * 2020-10-14 2020-12-29 清华大学 轻量化车辆检测模型构建方法、系统及装置
CN112232205A (zh) * 2020-10-16 2021-01-15 中科智云科技有限公司 移动端cpu实时多功能人脸检测方法
CN112508126A (zh) * 2020-12-22 2021-03-16 北京百度网讯科技有限公司 深度学习模型训练方法、装置、电子设备及可读存储介质
CN112633406A (zh) * 2020-12-31 2021-04-09 天津大学 一种基于知识蒸馏的少样本目标检测方法
CN112668440A (zh) * 2020-12-24 2021-04-16 西安电子科技大学 基于平衡样本回归损失的sar舰船目标检测方法
CN112926506A (zh) * 2021-03-24 2021-06-08 重庆邮电大学 一种基于卷积神经网络的非受控人脸检测方法及系统
CN112990298A (zh) * 2021-03-11 2021-06-18 北京中科虹霸科技有限公司 关键点检测模型训练方法、关键点检测方法及装置
CN113052144A (zh) * 2021-04-30 2021-06-29 平安科技(深圳)有限公司 活体人脸检测模型的训练方法、装置、设备及存储介质
CN113111804A (zh) * 2021-04-16 2021-07-13 北京房江湖科技有限公司 一种人脸检测的方法、装置、电子设备及存储介质
CN113255899A (zh) * 2021-06-17 2021-08-13 之江实验室 一种通道自关联的知识蒸馏方法与系统
CN113269117A (zh) * 2021-06-04 2021-08-17 重庆大学 一种基于知识蒸馏的行人重识别方法
CN113361381A (zh) * 2021-06-03 2021-09-07 上海哔哩哔哩科技有限公司 人体关键点检测模型训练方法、检测方法及装置
CN113490947A (zh) * 2020-07-27 2021-10-08 深圳市大疆创新科技有限公司 检测模型训练方法、装置、检测模型使用方法及存储介质
CN113657411A (zh) * 2021-08-23 2021-11-16 北京达佳互联信息技术有限公司 神经网络模型的训练方法、图像特征提取方法及相关装置
CN113763373A (zh) * 2021-09-17 2021-12-07 上海交通大学 域泛化的尺度对齐翻拍图片检测系统
CN113807214A (zh) * 2021-08-31 2021-12-17 中国科学院上海微系统与信息技术研究所 基于deit附属网络知识蒸馏的小目标人脸识别方法
CN113869462A (zh) * 2021-12-02 2021-12-31 之江实验室 一种基于双路结构对比嵌入学习的小样本对象分类方法
CN114648803A (zh) * 2022-05-20 2022-06-21 中国科学技术大学 自然场景下人脸表情识别方法、系统、设备及存储介质
WO2022141859A1 (zh) * 2020-12-31 2022-07-07 平安科技(深圳)有限公司 图像检测方法、装置、电子设备及存储介质
CN117835329A (zh) * 2024-03-04 2024-04-05 东北大学 车载边缘计算中基于移动性预测的服务迁移方法
CN113111804B (zh) * 2021-04-16 2024-06-04 贝壳找房(北京)科技有限公司 一种人脸检测的方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403141A (zh) * 2017-07-05 2017-11-28 中国科学院自动化研究所 人脸检测方法及装置、计算机可读存储介质、设备
CN108664893A (zh) * 2018-04-03 2018-10-16 福州海景科技开发有限公司 一种人脸检测方法及存储介质
CN109919097A (zh) * 2019-03-08 2019-06-21 中国科学院自动化研究所 基于多任务学习的人脸和关键点联合检测系统、方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403141A (zh) * 2017-07-05 2017-11-28 中国科学院自动化研究所 人脸检测方法及装置、计算机可读存储介质、设备
CN108664893A (zh) * 2018-04-03 2018-10-16 福州海景科技开发有限公司 一种人脸检测方法及存储介质
CN109919097A (zh) * 2019-03-08 2019-06-21 中国科学院自动化研究所 基于多任务学习的人脸和关键点联合检测系统、方法

Cited By (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111242303A (zh) * 2020-01-14 2020-06-05 北京市商汤科技开发有限公司 网络训练方法及装置、图像处理方法及装置
CN111242303B (zh) * 2020-01-14 2023-12-01 北京市商汤科技开发有限公司 网络训练方法及装置、图像处理方法及装置
CN111325107A (zh) * 2020-01-22 2020-06-23 广州虎牙科技有限公司 检测模型训练方法、装置、电子设备和可读存储介质
CN111274981A (zh) * 2020-02-03 2020-06-12 中国人民解放军国防科技大学 目标检测网络构建方法及装置、目标检测方法
CN111369535A (zh) * 2020-03-05 2020-07-03 四川大学华西医院 一种细胞检测方法
CN111489803A (zh) * 2020-03-31 2020-08-04 重庆金域医学检验所有限公司 基于自回归模型的报告单编码模型生成方法、系统和设备
CN111489803B (zh) * 2020-03-31 2023-07-21 重庆金域医学检验所有限公司 基于自回归模型的报告单编码模型生成方法、系统和设备
CN111553230A (zh) * 2020-04-21 2020-08-18 东南大学 无约束场景下的基于特征强化的渐进式级联人脸检测方法
CN111539222A (zh) * 2020-05-20 2020-08-14 北京百度网讯科技有限公司 语义相似度任务模型的训练方法、装置、电子设备及存储介质
CN111539222B (zh) * 2020-05-20 2023-05-23 北京百度网讯科技有限公司 语义相似度任务模型的训练方法、装置、设备及存储介质
CN111709336A (zh) * 2020-06-08 2020-09-25 杭州像素元科技有限公司 一种高速公路行人检测方法、设备及可读存储介质
CN111709336B (zh) * 2020-06-08 2024-04-26 杭州像素元科技有限公司 一种高速公路行人检测方法、设备及可读存储介质
WO2022021029A1 (zh) * 2020-07-27 2022-02-03 深圳市大疆创新科技有限公司 检测模型训练方法、装置、检测模型使用方法及存储介质
CN113490947A (zh) * 2020-07-27 2021-10-08 深圳市大疆创新科技有限公司 检测模型训练方法、装置、检测模型使用方法及存储介质
CN111914727A (zh) * 2020-07-28 2020-11-10 联芯智能(南京)科技有限公司 基于平衡采样与非线性特征融合的小目标人体检测方法
CN111914727B (zh) * 2020-07-28 2024-04-26 联芯智能(南京)科技有限公司 基于平衡采样与非线性特征融合的小目标人体检测方法
CN112115783A (zh) * 2020-08-12 2020-12-22 中国科学院大学 基于深度知识迁移的人脸特征点检测方法、装置及设备
CN112115783B (zh) * 2020-08-12 2023-11-14 中国科学院大学 基于深度知识迁移的人脸特征点检测方法、装置及设备
CN111709497A (zh) * 2020-08-20 2020-09-25 腾讯科技(深圳)有限公司 一种信息处理方法、装置及计算机可读存储介质
CN111709497B (zh) * 2020-08-20 2020-11-20 腾讯科技(深圳)有限公司 一种信息处理方法、装置及计算机可读存储介质
CN111767906A (zh) * 2020-09-01 2020-10-13 腾讯科技(深圳)有限公司 人脸检测模型训练方法、人脸检测方法、装置及电子设备
CN112150821A (zh) * 2020-10-14 2020-12-29 清华大学 轻量化车辆检测模型构建方法、系统及装置
CN112232205B (zh) * 2020-10-16 2022-05-27 中科智云科技有限公司 移动端cpu实时多功能人脸检测方法
CN112232205A (zh) * 2020-10-16 2021-01-15 中科智云科技有限公司 移动端cpu实时多功能人脸检测方法
CN112508126B (zh) * 2020-12-22 2023-08-01 北京百度网讯科技有限公司 深度学习模型训练方法、装置、电子设备及可读存储介质
CN112508126A (zh) * 2020-12-22 2021-03-16 北京百度网讯科技有限公司 深度学习模型训练方法、装置、电子设备及可读存储介质
CN112668440B (zh) * 2020-12-24 2023-02-10 西安电子科技大学 基于平衡样本回归损失的sar舰船目标检测方法
CN112668440A (zh) * 2020-12-24 2021-04-16 西安电子科技大学 基于平衡样本回归损失的sar舰船目标检测方法
CN112633406A (zh) * 2020-12-31 2021-04-09 天津大学 一种基于知识蒸馏的少样本目标检测方法
WO2022141859A1 (zh) * 2020-12-31 2022-07-07 平安科技(深圳)有限公司 图像检测方法、装置、电子设备及存储介质
CN112990298B (zh) * 2021-03-11 2023-11-24 北京中科虹霸科技有限公司 关键点检测模型训练方法、关键点检测方法及装置
CN112990298A (zh) * 2021-03-11 2021-06-18 北京中科虹霸科技有限公司 关键点检测模型训练方法、关键点检测方法及装置
CN112926506A (zh) * 2021-03-24 2021-06-08 重庆邮电大学 一种基于卷积神经网络的非受控人脸检测方法及系统
CN112926506B (zh) * 2021-03-24 2022-08-12 重庆邮电大学 一种基于卷积神经网络的非受控人脸检测方法及系统
CN113111804A (zh) * 2021-04-16 2021-07-13 北京房江湖科技有限公司 一种人脸检测的方法、装置、电子设备及存储介质
CN113111804B (zh) * 2021-04-16 2024-06-04 贝壳找房(北京)科技有限公司 一种人脸检测的方法、装置、电子设备及存储介质
CN113052144B (zh) * 2021-04-30 2023-02-28 平安科技(深圳)有限公司 活体人脸检测模型的训练方法、装置、设备及存储介质
CN113052144A (zh) * 2021-04-30 2021-06-29 平安科技(深圳)有限公司 活体人脸检测模型的训练方法、装置、设备及存储介质
CN113361381B (zh) * 2021-06-03 2022-12-23 上海哔哩哔哩科技有限公司 人体关键点检测模型训练方法、检测方法及装置
CN113361381A (zh) * 2021-06-03 2021-09-07 上海哔哩哔哩科技有限公司 人体关键点检测模型训练方法、检测方法及装置
CN113269117A (zh) * 2021-06-04 2021-08-17 重庆大学 一种基于知识蒸馏的行人重识别方法
CN113255899A (zh) * 2021-06-17 2021-08-13 之江实验室 一种通道自关联的知识蒸馏方法与系统
CN113255899B (zh) * 2021-06-17 2021-10-12 之江实验室 一种通道自关联的知识蒸馏方法与系统
CN113657411A (zh) * 2021-08-23 2021-11-16 北京达佳互联信息技术有限公司 神经网络模型的训练方法、图像特征提取方法及相关装置
CN113807214B (zh) * 2021-08-31 2024-01-05 中国科学院上海微系统与信息技术研究所 基于deit附属网络知识蒸馏的小目标人脸识别方法
CN113807214A (zh) * 2021-08-31 2021-12-17 中国科学院上海微系统与信息技术研究所 基于deit附属网络知识蒸馏的小目标人脸识别方法
CN113763373A (zh) * 2021-09-17 2021-12-07 上海交通大学 域泛化的尺度对齐翻拍图片检测系统
CN113763373B (zh) * 2021-09-17 2023-10-13 上海交通大学 域泛化的尺度对齐翻拍图片检测系统
CN113869462A (zh) * 2021-12-02 2021-12-31 之江实验室 一种基于双路结构对比嵌入学习的小样本对象分类方法
CN113869462B (zh) * 2021-12-02 2022-06-10 之江实验室 一种基于双路结构对比嵌入学习的小样本对象分类方法
CN114648803B (zh) * 2022-05-20 2022-09-06 中国科学技术大学 自然场景下人脸表情识别方法、系统、设备及存储介质
CN114648803A (zh) * 2022-05-20 2022-06-21 中国科学技术大学 自然场景下人脸表情识别方法、系统、设备及存储介质
CN117835329A (zh) * 2024-03-04 2024-04-05 东北大学 车载边缘计算中基于移动性预测的服务迁移方法

Also Published As

Publication number Publication date
CN110674714B (zh) 2022-06-14

Similar Documents

Publication Publication Date Title
CN110674714B (zh) 基于迁移学习的人脸和人脸关键点联合检测方法
CN107945204B (zh) 一种基于生成对抗网络的像素级人像抠图方法
CN107909101B (zh) 基于卷积神经网络的半监督迁移学习字符识别方法及系统
CN108229647A (zh) 神经网络结构的生成方法和装置、电子设备、存储介质
CN111079674B (zh) 一种基于全局和局部信息融合的目标检测方法
CN113158862B (zh) 一种基于多任务的轻量级实时人脸检测方法
CN110837870A (zh) 基于主动学习的声呐图像目标识别方法
CN110889446A (zh) 人脸图像识别模型训练及人脸图像识别方法和装置
CN110619059B (zh) 一种基于迁移学习的建筑物标定方法
CN113221787A (zh) 基于多元差异性融合的行人多目标跟踪方法
CN109558902A (zh) 一种快速目标检测方法
CN111368935B (zh) 一种基于生成对抗网络的sar时敏目标样本增广方法
CN110543906B (zh) 基于Mask R-CNN模型的肤质自动识别方法
CN107292352A (zh) 基于卷积神经网络的图像分类方法和装置
CN111160350A (zh) 人像分割方法、模型训练方法、装置、介质及电子设备
CN110135446B (zh) 文本检测方法及计算机存储介质
CN112990298B (zh) 关键点检测模型训练方法、关键点检测方法及装置
CN112800955A (zh) 基于加权双向特征金字塔的遥感影像旋转目标检测方法及系统
US20230137337A1 (en) Enhanced machine learning model for joint detection and multi person pose estimation
CN111104831B (zh) 一种视觉追踪方法、装置、计算机设备以及介质
CN112434618A (zh) 基于稀疏前景先验的视频目标检测方法、存储介质及设备
Zhang et al. A framework of an intelligent education system for higher education based on deep learning
CN113159215A (zh) 一种基于Faster Rcnn的小目标检测识别方法
CN115937552A (zh) 一种基于融合手工特征与深度特征的图像匹配方法
CN115240259A (zh) 一种基于yolo深度网络的课堂环境下人脸检测方法及其检测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant