CN112818969A - 一种基于知识蒸馏的人脸姿态估计方法及系统 - Google Patents
一种基于知识蒸馏的人脸姿态估计方法及系统 Download PDFInfo
- Publication number
- CN112818969A CN112818969A CN202110418010.7A CN202110418010A CN112818969A CN 112818969 A CN112818969 A CN 112818969A CN 202110418010 A CN202110418010 A CN 202110418010A CN 112818969 A CN112818969 A CN 112818969A
- Authority
- CN
- China
- Prior art keywords
- angle direction
- classification network
- face
- characteristic
- student
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种基于知识蒸馏的人脸姿态估计方法及系统,能够在保证准确度的前提下,应用特征蒸馏方法对人脸姿态估计模型进行压缩,特征蒸馏后的模型参数量少,对人脸姿态的推理速度更快,降低了资源消耗,解决了人脸姿态估计应用深层网络结构资源消耗多、浅层网络准确率低的问题,同时根据当前应用场景需求,提高对大角度、模糊以及戴口罩人脸图像的姿态估计准确度,提高了模型的鲁棒性,提升了模型的人脸姿态角度预测效果,实际应用中,对于复杂场景下人脸姿态角度预测结果更加准确,以ResNet18的基础网络实现了超过ResNet50网络结构的预测效果。
Description
技术领域
本发明涉及一种基于知识蒸馏的人脸姿态估计方法,属于人脸图像识别技术领域。
背景技术
在人脸对齐、人脸跟踪、人脸识别等研究工作中,人脸姿态角度具有重要的影响,姿态估计在很多面部分析任务中是必不可少的一部分。人脸姿态估计是指计算出人脸或头部在三维空间的具体方向,欧拉角(Yaw, Pitch, Roll)是一种常用的人脸姿态表示。
目前人脸姿态估计方法主要分为两种:一种是由面部关键点以及图像到三维坐标的对应关系计算获得,姿态结果取决于关键点检测是否准确,且依赖于标准的头部模型和相机参数矩阵;另一种是根据人脸图像回归三维姿态欧拉角,不需要检测关键点的过程。随着深度学习网络和公开数据集的不断提出,根据图像特征回归角度的方法也是目前较为常用的人脸姿态估计方法,它对不同场景的姿态角度估计具有较强的鲁棒性。
在实际场景中,存在大量遮挡、模糊和侧脸的情况,图像中面部关键点坐标难以精准检测,由关键点获得的姿态角度可能存在较大误差,而本次使用一种无需关键点的姿态角度回归方法,更能适用于复杂场景下的姿态估计问题。
目前人脸姿态估计方法存在着以下缺陷:
1)深层网络结构复杂,参数量大
在人脸姿态估计的众多方法中,无需关键点检测的HopeNet方法获得了相对准确的姿态评估效果,它采用Resnet50作为特征提取的骨干网络。由于模型参数量大,在推理阶段,计算资源占用较多,推理速度还有待提升。
2)浅层网络模型预测姿态角度误差较大
在实际应用场景中,既要保证姿态评估结果的准确,又要要求模型推理速度快,减少计算资源占用。采用一些相对简单的特征提取网络,则会影响到姿态评估效果,增大角度误差。
3)对大角度姿态、模糊以及戴口罩的图像姿态估计误差较大
人脸姿态的训练数据大多使用300W或300W-LP公开数据集,对大角度、模糊图像姿态估计误差较大,且在当前应用场景中,对带口罩的人脸姿态估计结果鲁棒性较差。
发明内容
本发明所要解决的技术问题是提供一种基于知识蒸馏的人脸姿态估计方法,采用全新逻辑设计,能够在保证准确度的前提下,有效进行模型压缩,降低资源消耗。
本发明为了解决上述技术问题采用以下技术方案:本发明设计了一种基于知识蒸馏的人脸姿态估计方法,用于实现目标分类网络对图像人脸姿态的估计,针对目标分类网络中最后全连接层,替换为三个分别对应偏航角方向、俯仰角方向、翻滚角方向的分支全连接层,各分支全连接层的输入端共同对接目标分类网络中最后一级特征提取模块的输出端,并且各分支全连接层分别对接一个分支分类层,构建学生分类网络;
步骤A. 收集预设数量的人脸姿态样本图像,并确定各幅人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向的真实角度值,然后进入步骤B;
步骤B. 选择结构大于学生分类网络结构的教师初始分类网络;然后以人脸姿态样本图像为输入,人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向上预设所划分各角度区间的概率为输出,针对教师初始分类网络进行训练,获得教师分类网络,然后进入步骤C;
步骤C. 以学生分类网络中各级特征提取模块中最后归一化层输出特征分别与教师分类网络中对应特征提取模块中最后归一化层输出特征之间特征距离,构建特征蒸馏损失函数;并且以学生分类网络中各分支全连接层的输出,结合人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向的真实角度值所对应的角度区间,构建角度分类损失;以及基于学生分类网络输出人脸分别对应偏航角方向、俯仰角方向、翻滚角方向上预设所划分各角度区间的概率,通过各角度区间类别概率计算数学期望,获得各方向上对应角度连续值作为预测角度,构建角度回归损失;然后进入步骤D,其中,,表示学生分类网络中特征提取模块的数量;
步骤D. 按如下公式:
构建分别对应偏航角方向、俯仰角方向、翻滚角方向的损失函数,然后进入步骤E;其中,和分别为预设损失权重系数,、、分别为学生分类网络中分别对应偏航角方向、俯仰角方向、翻滚角方向的分支全连接层的输出值,分别为人脸姿态分别对应偏航角方向、俯仰角方向、翻滚角方向的真实角度所对应的区间类别,分别为基于学生分类网络所获对应偏航角方向、俯仰角方向、翻滚角方向的预测角度连续值,分别为人脸姿态对应偏航角方向、俯仰角方向、翻滚角方向的真实角度值;
步骤E. 以人脸姿态样本图像同时输入教师分类网络与学生分类网络,人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向上预设所划分各角度区间的概率为输出,结合分别对应偏航角方向、俯仰角方向、翻滚角方向的损失函数,针对学生分类网络进行训练,获得人脸姿态估计模型;
步骤 . 根据目标人脸图像中人脸姿态分别对应偏航角方向、俯仰角方向、翻滚角方向上预设所划分各角度区间的概率,通过各角度区间类别概率计算数学期望,获得各方向上对应角度连续值作为预测角度,即目标人脸图像中人脸姿态分别对应偏航角方向、俯仰角方向、翻滚角方向的预测角度,实现对图像人脸姿态中人脸姿态的估计。
作为本发明的一种优选技术方案:所述步骤A中,还包括分别针对各幅人脸姿态样本图像,采用预设数据增广方式、以及预设图像增强方式,获得人脸姿态样本图像所对应的各幅变换样本图像,并建立该各幅变换样本图像分别与该人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向的真实角度值的对应关系,再将该各幅变换样本图像作为各幅人脸姿态样本图像;然后进入步骤B。
作为本发明的一种优选技术方案:所述预设数据增广方式为人脸框外扩处理、以及采用3D旋转人脸的方法生成大角度的人脸图像,所述预设图像增强方式包括图像水平翻转、图像模糊。
作为本发明的一种优选技术方案:所述各特征距离的获得过程中,首先调整学生分类网络中各级特征提取模块中最后归一化层输出特征所对应特征通道数、与教师分类网络中对应特征提取模块中最后归一化层输出特征所对应特征通道数一致,然后获得学生分类网络中各级特征提取模块中最后归一化层输出特征分别与教师分类网络中对应特征提取模块中最后归一化层输出特征之间特征距离。
作为本发明的一种优选技术方案:所述各特征距离的获得过程中,首先教师分类网络中各级特征提取模块中最后归一化层输出特征分别经用于保留正特征、且抑制负特征的margin ReLU模块,获得各教师待比较特征;学生分类网络中各级特征提取模块中最后归一化层输出特征分别依次对接经过1x1卷积回归层与归一化层,获得特征通道数与教师分类网络中对应特征提取模块中最后归一化层输出特征所对应特征通道数一致的各学生待比较特征;然后获得学生分类网络中各学生待比较特征分别与教师分类网络中各对应教师待比较特征之间特征距离。
其中,分别表示学生分类网络、教师分类网络分别所对应人脸姿态样本统一尺寸后的宽、高、通道数,表示学生分类网络中特征提取模块中最后归一化层所输出图像经统一尺寸后中第位置特征,表示教师分类网络中特征提取模块中最后归一化层所输出图像经统一尺寸后中第位置特征,。
作为本发明的一种优选技术方案:所述目标分类网络为残差网络,则教师分类网络与学生分类网络分别均包含四级残差模块,分别构成各级特征提取模块,并按如下公式:
构建特征蒸馏损失函数,其中,依次表示学生分类网络中自输入端至输出端方向各级特征提取模块分别与教师分类网络中对应特征提取模块中最后归一化层输出特征之间特征距离,依次表示学生分类网络与教师初始分类网中自输入端至输出端方向各级特征提取模块分别所对应权重。
作为本发明的一种优选技术方案:所述偏航角方向、俯仰角方向、翻滚角方向上,分别均按每3度作为一个角度区间,分隔出第0个至第65个角度区间,即偏航角方向、俯仰角方向、翻滚角方向上分别对应66个角度区间;
与上述所设计基于知识蒸馏的人脸姿态估计方法相对应,本发明进一步设计了一种基于知识蒸馏的人脸姿态估计方法的系统,包括特征提取模块、特征蒸馏模块、角度回归模块、角度损失模块、角度估计模块;
所述教师分类网络与学生分类网络构成特征提取模块;
本发明所述一种基于知识蒸馏的人脸姿态估计方法,采用以上技术方案与现有技术相比,具有以下技术效果:
本发明所设计一种基于知识蒸馏的人脸姿态估计方法,能够在保证准确度的前提下,应用特征蒸馏方法对人脸姿态估计模型进行压缩,特征蒸馏后的模型参数量少,对人脸姿态的推理速度更快,降低了资源消耗,解决了人脸姿态估计应用深层网络结构资源消耗多、浅层网络准确率低的问题,同时根据当前应用场景需求,提高对大角度、模糊以及戴口罩人脸图像的姿态估计准确度,提高了模型的鲁棒性,提升了模型的人脸姿态角度预测效果,实际应用中,对于复杂场景下人脸姿态角度预测结果更加准确,以ResNet18的基础网络实现了超过ResNet50网络结构的预测效果。
附图说明
图1是本发明所设计基于知识蒸馏的人脸姿态估计方法及系统的架构图;
图2是本发明所设计中特征蒸馏应用示意图;
图3是本发明所设计中margin ReLU方法应用示意图。
具体实施方式
下面结合说明书附图对本发明的具体实施方式作进一步详细的说明。
本发明设计了一种基于知识蒸馏的人脸姿态估计方法,如图1所示,用于实现目标分类网络对图像人脸姿态的估计,针对目标分类网络中最后全连接层,替换为三个分别对应偏航角方向yaw、俯仰角方向pitch、翻滚角方向roll的分支全连接层,各分支全连接层的输入端共同对接目标分类网络中最后一级特征提取模块的输出端,并且各分支全连接层分别对接一个分支分类层,构建学生分类网络,如此能够对三个方向角度结果进行独立的损失计算。
基于学生分类网络,执行如下步骤A至步骤E,获得人脸姿态估计模型。
步骤A. 收集预设数量的人脸姿态样本图像,并确定各幅人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向的真实角度值,然后进入步骤B。
实际应用当中,上述步骤A中,还包括分别针对各幅人脸姿态样本图像,采用预设数据增广方式、以及预设图像增强方式,获得人脸姿态样本图像所对应的各幅变换样本图像,并建立该各幅变换样本图像分别与该人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向的真实角度值的对应关系,再将该各幅变换样本图像作为各幅人脸姿态样本图像;然后进入步骤B。
这里在应用中,所述预设数据增广方式为人脸框外扩处理、以及采用3D旋转人脸的方法生成大角度的人脸图像,诸如对大角度姿态、模糊和戴口罩的人脸图像训练样本进行数据增广处理,裁剪方式为选取人脸框最长边的1.4倍并外扩处理为正方形的人脸图像。
为了提高模型对不同场景下的鲁棒性,将训练数据进行随机增强,所述预设图像增强方式包括图像水平翻转、图像模糊。
步骤B. 选择结构大于学生分类网络结构的教师初始分类网络;然后以人脸姿态样本图像为输入,人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向上预设所划分各角度区间的概率为输出,针对教师初始分类网络进行训练,获得教师分类网络,然后进入步骤C。
实际应用当中,诸如目标分类网络选择Resnet18网络,教师初始分类网络基于Resnet50网络,对应结构大于学生分类网络结构,即选择了相对于学生网络更加复杂,且具有较好性能和泛化能力的教师初始分类网络。
步骤C. 以学生分类网络中各级特征提取模块中最后归一化层输出特征分别与教师分类网络中对应特征提取模块中最后归一化层输出特征之间特征距离,构建特征蒸馏损失函数;并且以学生分类网络中各分支全连接层的输出,结合人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向的真实角度值所对应的角度区间,构建角度分类损失;以及基于学生分类网络输出人脸分别对应偏航角方向、俯仰角方向、翻滚角方向上预设所划分各角度区间的概率,通过各角度区间类别概率计算数学期望,获得各方向上对应角度连续值作为预测角度,构建角度回归损失;然后进入步骤D,其中,,表示学生分类网络中特征提取模块的数量。
上述步骤C中关于各特征距离的获得过程中,首先调整学生分类网络中各级特征提取模块中最后归一化层输出特征所对应特征通道数、与教师分类网络中对应特征提取模块中最后归一化层输出特征所对应特征通道数一致,然后获得学生分类网络中各级特征提取模块中最后归一化层输出特征分别与教师分类网络中对应特征提取模块中最后归一化层输出特征之间特征距离。
具体来讲,各特征距离的获得过程中,如图2所示,首先教师分类网络中各级特征提取模块中最后归一化层输出特征分别经用于保留正特征、且抑制负特征的margin ReLU模块,获得各教师待比较特征;学生分类网络中各级特征提取模块中最后归一化层输出特征分别依次对接经过1x1卷积回归层与归一化层,获得特征通道数与教师分类网络中对应特征提取模块中最后归一化层输出特征所对应特征通道数一致的各学生待比较特征;然后获得学生分类网络中各学生待比较特征分别与教师分类网络中各对应教师待比较特征之间特征距离。
实际应用中,基于ResNet50与ResNet18,当输入为224x224尺寸时,教师网络及学生网络的蒸馏特征尺度如下表1所示:
表1
如表中所示,ResNet50与ResNet18因其网络结构差异,在4个阶段layer群组的残差网络输出的特征通道相差4倍,单通道的特征图尺度相同。针对两者的非对称结构特征,将对学生网络蒸馏特征进行结构转换。
特征转换的目的是使得教师网络和学生网络的对应特征转换为易于学习的结构。
教师特征转换部分采用margin ReLU方法,保留特征为正的信息,且抑制负的特征,不会造成教师网络的特征丢失。
学生网络转换方法为先后经过1x1的卷积回归和BN层,转换为与教师网络具有相同的特征通道数的学生网络蒸馏特征。
其中,分别表示学生分类网络、教师分类网络分别所对应人脸姿态样本统一尺寸后的宽、高、通道数,表示学生分类网络中特征提取模块中最后归一化层所输出图像经统一尺寸后中第位置特征,表示教师分类网络中特征提取模块中最后归一化层所输出图像经统一尺寸后中第位置特征,。
步骤D. 按如下公式:
构建分别对应偏航角方向、俯仰角方向、翻滚角方向的损失函数,然后进入步骤E;其中,和分别为预设损失权重系数,、、分别为学生分类网络中分别对应偏航角方向、俯仰角方向、翻滚角方向的分支全连接层的输出值,分别为人脸姿态分别对应偏航角方向、俯仰角方向、翻滚角方向的真实角度所对应的区间类别,分别为基于学生分类网络所获对应偏航角方向、俯仰角方向、翻滚角方向的预测角度连续值,分别为人脸姿态对应偏航角方向、俯仰角方向、翻滚角方向的真实角度值。
当上述设计应用到实际当中,诸如目标分类网络为残差网络,则教师分类网络与学生分类网络分别均包含四级残差模块,分别构成各级特征提取模块,并按如下公式:
构建特征蒸馏损失函数,其中,依次表示学生分类网络中自输入端至输出端方向各级特征提取模块分别与教师分类网络中对应特征提取模块中最后归一化层输出特征之间特征距离,依次表示学生分类网络与教师初始分类网中自输入端至输出端方向各级特征提取模块分别所对应权重。
并且在实际实施应用中,
偏航角方向、俯仰角方向、翻滚角方向上,分别均按每3度作为一个角度区间,分隔出第0个至第65个角度区间,即偏航角方向、俯仰角方向、翻滚角方向上分别对应66个角度区间;
步骤E. 以人脸姿态样本图像同时输入教师分类网络与学生分类网络,人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向上预设所划分各角度区间的概率为输出,结合分别对应偏航角方向、俯仰角方向、翻滚角方向的损失函数,针对学生分类网络进行训练,获得人脸姿态估计模型。
步骤 . 根据目标人脸图像中人脸姿态分别对应偏航角方向、俯仰角方向、翻滚角方向上预设所划分各角度区间的概率,通过各角度区间类别概率计算数学期望,获得各方向上对应角度连续值作为预测角度,即目标人脸图像中人脸姿态分别对应偏航角方向、俯仰角方向、翻滚角方向的预测角度,实现对图像人脸姿态中人脸姿态的估计。
当将上述所设计基于知识蒸馏的人脸姿态估计方法,应用于具体的实际当中时,设计了执行此方法的系统,如图1所示,具体包括特征提取模块、特征蒸馏模块、角度回归模块、角度损失模块、角度估计模块。
所述教师分类网络与学生分类网络构成特征提取模块。
将本发明所设计基于知识蒸馏的人脸姿态估计方法及系统,应用于实际当中,测试表明,设计相对于原模型推理速度更快,计算资源更少,模型性能更好,推理结果更加准确,并且实际应用中,实现人脸姿态模型从ResNet50到ResNet18基础网络结构的模型压缩和效果提升;特征蒸馏部分由教师特征激活函数、学生特征变换网络和特征蒸馏损失函数组成,使用margin ReLU作为教师特征激活函数,在教师网络特征迁移过程中,不会造成ResNet50的特征信息丢失。
并且对学生网络ResNet18和学生特征变换网络采用不同的参数优化方法和学习率,在训练过程中,模型收敛效果更好。在网络的角度损失计算部分,联合特征蒸馏损失、角度分类损失以及角度回归损失,使得ResNet18的角度预测结果更加拟合于ResNet50。采用多重损失方法监督模型中三个角度的FC层的输出,并在训练过程中,为角度回归损失和特征蒸馏损失选择合适的权重系数,平衡联合损失计算结果。
除公开训练集外,还采取半监督学习方法使用教师模型对大角度、模糊和戴口罩样本进行姿态角度预测,并经过人工筛选作为代理标签,增强模型在复杂场景下人脸姿态估计的鲁棒性。
并且在实际应用中,在特征提取网络部分,除以采用Resnet基础网络,还可以尝试MobileNet等其它轻量级网络结构进行特征蒸馏。
除了把图像特征当作一个整体进行分类计算外,还有一种方法是采用细粒度分类,更加关注空间上的联系,比如采用FSA-Net作为特征学习网络,同样可以达到比较准确的姿态估计效果。
上述技术方案所设计基于知识蒸馏的人脸姿态估计方法,能够在保证准确度的前提下,应用特征蒸馏方法对人脸姿态估计模型进行压缩,特征蒸馏后的模型参数量少,对人脸姿态的推理速度更快,降低了资源消耗,解决了人脸姿态估计应用深层网络结构资源消耗多、浅层网络准确率低的问题,同时根据当前应用场景需求,提高对大角度、模糊以及戴口罩人脸图像的姿态估计准确度,提高了模型的鲁棒性,提升了模型的人脸姿态角度预测效果,实际应用中,对于复杂场景下人脸姿态角度预测结果更加准确,以ResNet18的基础网络实现了超过ResNet50网络结构的预测效果。
上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
Claims (10)
1.一种基于知识蒸馏的人脸姿态估计方法,用于实现目标分类网络对图像人脸姿态的估计,其特征在于:针对目标分类网络中最后全连接层,替换为三个分别对应偏航角方向、俯仰角方向、翻滚角方向的分支全连接层,各分支全连接层的输入端共同对接目标分类网络中最后一级特征提取模块的输出端,并且各分支全连接层分别对接一个分支分类层,构建学生分类网络;
步骤A. 收集预设数量的人脸姿态样本图像,并确定各幅人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向的真实角度值,然后进入步骤B;
步骤B. 选择结构大于学生分类网络结构的教师初始分类网络;然后以人脸姿态样本图像为输入,人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向上预设所划分各角度区间的概率为输出,针对教师初始分类网络进行训练,获得教师分类网络,然后进入步骤C;
步骤C. 以学生分类网络中各级特征提取模块中最后归一化层输出特征分别与教师分类网络中对应特征提取模块中最后归一化层输出特征之间特征距离,构建特征蒸馏损失函数;并且以学生分类网络中各分支全连接层的输出,结合人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向的真实角度值所对应的角度区间,构建角度分类损失;以及基于学生分类网络输出人脸分别对应偏航角方向、俯仰角方向、翻滚角方向上预设所划分各角度区间的概率,通过各角度区间类别概率计算数学期望,获得各方向上对应角度连续值作为预测角度,构建角度回归损失;然后进入步骤D,其中,,表示学生分类网络中特征提取模块的数量;
步骤D. 按如下公式:
构建分别对应偏航角方向、俯仰角方向、翻滚角方向的损失函数,然后进入步骤E;其中,和分别为预设损失权重系数,、、分别为学生分类网络中分别对应偏航角方向、俯仰角方向、翻滚角方向的分支全连接层的输出值,分别为人脸姿态分别对应偏航角方向、俯仰角方向、翻滚角方向的真实角度所对应的区间类别,分别为基于学生分类网络所获对应偏航角方向、俯仰角方向、翻滚角方向的预测角度连续值,分别为人脸姿态对应偏航角方向、俯仰角方向、翻滚角方向的真实角度值;
步骤E. 以人脸姿态样本图像同时输入教师分类网络与学生分类网络,人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向上预设所划分各角度区间的概率为输出,结合分别对应偏航角方向、俯仰角方向、翻滚角方向的损失函数,针对学生分类网络进行训练,获得人脸姿态估计模型;
2.根据权利要求1所述一种基于知识蒸馏的人脸姿态估计方法,其特征在于:所述步骤A中,还包括分别针对各幅人脸姿态样本图像,采用预设数据增广方式、以及预设图像增强方式,获得人脸姿态样本图像所对应的各幅变换样本图像,并建立该各幅变换样本图像分别与该人脸姿态样本图像中人脸分别对应偏航角方向、俯仰角方向、翻滚角方向的真实角度值的对应关系,再将该各幅变换样本图像作为各幅人脸姿态样本图像;然后进入步骤B。
3.根据权利要求2所述一种基于知识蒸馏的人脸姿态估计方法,其特征在于:所述预设数据增广方式为人脸框外扩处理、以及采用3D旋转人脸的方法生成大角度的人脸图像,所述预设图像增强方式包括图像水平翻转、图像模糊。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110418010.7A CN112818969B (zh) | 2021-04-19 | 2021-04-19 | 一种基于知识蒸馏的人脸姿态估计方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110418010.7A CN112818969B (zh) | 2021-04-19 | 2021-04-19 | 一种基于知识蒸馏的人脸姿态估计方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112818969A true CN112818969A (zh) | 2021-05-18 |
CN112818969B CN112818969B (zh) | 2021-07-06 |
Family
ID=75863697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110418010.7A Active CN112818969B (zh) | 2021-04-19 | 2021-04-19 | 一种基于知识蒸馏的人脸姿态估计方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112818969B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113688785A (zh) * | 2021-09-10 | 2021-11-23 | 深圳市同为数码科技股份有限公司 | 基于多监督的人脸识别方法、装置、计算机设备及存储介质 |
CN114298224A (zh) * | 2021-12-29 | 2022-04-08 | 云从科技集团股份有限公司 | 图像分类方法、装置以及计算机可读存储介质 |
CN114743243A (zh) * | 2022-04-06 | 2022-07-12 | 平安科技(深圳)有限公司 | 基于人工智能的人脸识别方法、装置、设备及存储介质 |
CN114973156A (zh) * | 2022-08-02 | 2022-08-30 | 松立控股集团股份有限公司 | 一种基于知识蒸馏的夜间渣土车检测方法 |
CN115620082A (zh) * | 2022-09-29 | 2023-01-17 | 北京的卢深视科技有限公司 | 模型训练方法、头部姿态估计方法、电子设备及存储介质 |
CN116264016A (zh) * | 2021-12-10 | 2023-06-16 | 中国科学院软件研究所 | 一种轻量的实时人脸检测和头部姿态估计方法及系统 |
CN116452794A (zh) * | 2023-04-14 | 2023-07-18 | 中国矿业大学 | 一种基于半监督学习的有向目标检测方法 |
WO2023231400A1 (zh) * | 2022-05-31 | 2023-12-07 | 青岛云天励飞科技有限公司 | 人脸角度预测方法、装置、设备及可读存储介质 |
CN114743243B (zh) * | 2022-04-06 | 2024-05-31 | 平安科技(深圳)有限公司 | 基于人工智能的人脸识别方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107392159A (zh) * | 2017-07-27 | 2017-11-24 | 竹间智能科技(上海)有限公司 | 一种面部专注度检测系统及方法 |
CN112668480A (zh) * | 2020-12-29 | 2021-04-16 | 上海高德威智能交通系统有限公司 | 头部姿态角检测方法、装置、电子设备及存储介质 |
-
2021
- 2021-04-19 CN CN202110418010.7A patent/CN112818969B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107392159A (zh) * | 2017-07-27 | 2017-11-24 | 竹间智能科技(上海)有限公司 | 一种面部专注度检测系统及方法 |
CN112668480A (zh) * | 2020-12-29 | 2021-04-16 | 上海高德威智能交通系统有限公司 | 头部姿态角检测方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
BAOYUN PENG等: "Correlation Congruence for Knowledge Distillation", 《ICCV2019》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113688785A (zh) * | 2021-09-10 | 2021-11-23 | 深圳市同为数码科技股份有限公司 | 基于多监督的人脸识别方法、装置、计算机设备及存储介质 |
CN116264016A (zh) * | 2021-12-10 | 2023-06-16 | 中国科学院软件研究所 | 一种轻量的实时人脸检测和头部姿态估计方法及系统 |
CN114298224A (zh) * | 2021-12-29 | 2022-04-08 | 云从科技集团股份有限公司 | 图像分类方法、装置以及计算机可读存储介质 |
CN114743243A (zh) * | 2022-04-06 | 2022-07-12 | 平安科技(深圳)有限公司 | 基于人工智能的人脸识别方法、装置、设备及存储介质 |
CN114743243B (zh) * | 2022-04-06 | 2024-05-31 | 平安科技(深圳)有限公司 | 基于人工智能的人脸识别方法、装置、设备及存储介质 |
WO2023231400A1 (zh) * | 2022-05-31 | 2023-12-07 | 青岛云天励飞科技有限公司 | 人脸角度预测方法、装置、设备及可读存储介质 |
CN114973156A (zh) * | 2022-08-02 | 2022-08-30 | 松立控股集团股份有限公司 | 一种基于知识蒸馏的夜间渣土车检测方法 |
CN114973156B (zh) * | 2022-08-02 | 2022-10-25 | 松立控股集团股份有限公司 | 一种基于知识蒸馏的夜间渣土车检测方法 |
CN115620082A (zh) * | 2022-09-29 | 2023-01-17 | 北京的卢深视科技有限公司 | 模型训练方法、头部姿态估计方法、电子设备及存储介质 |
CN115620082B (zh) * | 2022-09-29 | 2023-09-01 | 合肥的卢深视科技有限公司 | 模型训练方法、头部姿态估计方法、电子设备及存储介质 |
CN116452794A (zh) * | 2023-04-14 | 2023-07-18 | 中国矿业大学 | 一种基于半监督学习的有向目标检测方法 |
CN116452794B (zh) * | 2023-04-14 | 2023-11-03 | 中国矿业大学 | 一种基于半监督学习的有向目标检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112818969B (zh) | 2021-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112818969B (zh) | 一种基于知识蒸馏的人脸姿态估计方法及系统 | |
CN109543606B (zh) | 一种加入注意力机制的人脸识别方法 | |
CN108961235B (zh) | 一种基于YOLOv3网络和粒子滤波算法的缺陷绝缘子识别方法 | |
CN111639692B (zh) | 一种基于注意力机制的阴影检测方法 | |
CN113673590B (zh) | 基于多尺度沙漏密集连接网络的去雨方法、系统和介质 | |
CN109872305B (zh) | 一种基于质量图生成网络的无参考立体图像质量评价方法 | |
CN113591968A (zh) | 一种基于非对称注意力特征融合的红外弱小目标检测方法 | |
CN114266977B (zh) | 基于超分辨可选择网络的多auv的水下目标识别方法 | |
CN113609896A (zh) | 基于对偶相关注意力的对象级遥感变化检测方法及系统 | |
CN110246171B (zh) | 一种实时单目视频深度估计方法 | |
CN114898284B (zh) | 一种基于特征金字塔局部差异注意力机制的人群计数方法 | |
CN111414954A (zh) | 一种岩石图像检索方法及其系统 | |
CN112257741B (zh) | 一种基于复数神经网络的生成性对抗虚假图片的检测方法 | |
CN115861210B (zh) | 一种基于孪生网络的变电站设备异常检测方法和系统 | |
CN111062423A (zh) | 基于自适应特征融合的点云图神经网络的点云分类方法 | |
CN115131747A (zh) | 基于知识蒸馏的输电通道工程车辆目标检测方法及系统 | |
CN115240259A (zh) | 一种基于yolo深度网络的课堂环境下人脸检测方法及其检测系统 | |
CN115830514B (zh) | 一种适用于带弯曲河道的全河段表面流速计算方法及系统 | |
CN110136098B (zh) | 一种基于深度学习的线缆顺序检测方法 | |
CN115797684A (zh) | 一种基于上下文信息的红外小目标检测方法及系统 | |
CN115223033A (zh) | 一种合成孔径声呐图像目标分类方法及系统 | |
CN112990336B (zh) | 基于竞争注意力融合的深度三维点云分类网络构建方法 | |
CN114708434A (zh) | 基于迭代域内适应和自训练的跨域遥感图像语义分割方法 | |
Pang et al. | PTRSegNet: A Patch-to-Region Bottom-Up Pyramid Framework for the Semantic Segmentation of Large-Format Remote Sensing Images | |
CN112132835A (zh) | 基于SeFa和人工智能的光伏轨道相机果冻效应分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |