CN115862118A - 基于高斯分布假设和mse损失的人脸年龄估计方法及装置 - Google Patents
基于高斯分布假设和mse损失的人脸年龄估计方法及装置 Download PDFInfo
- Publication number
- CN115862118A CN115862118A CN202310043823.1A CN202310043823A CN115862118A CN 115862118 A CN115862118 A CN 115862118A CN 202310043823 A CN202310043823 A CN 202310043823A CN 115862118 A CN115862118 A CN 115862118A
- Authority
- CN
- China
- Prior art keywords
- face
- age
- gaussian distribution
- age estimation
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提出基于高斯分布假设和MSE损失的人脸年龄估计方法及装置,所述年龄估计方法搭建了基于高斯分布假设和MSE损失的人脸年龄估计模型,优化了损失函数的设计,采用了基于高斯分布假设的高斯损失函数与MAE loss进行联合训练,解决了训练目标与评价目标不一致而导致的次优化(sub‑optimal)问题,提高了模型的准确性。
Description
技术领域
本发明涉及人脸识别技术领域,具体涉及一种基于高斯分布假设和MSE损失的人脸年龄估计方法及装置。
背景技术
人脸年龄估计是指机器根据面部图像推测出人的大概年龄或者所属年龄范围(年龄段)。目前主流的人脸年龄估计方法之一是标签分布学习(LDL)法,但是,该方法的缺陷在于:通常情况下,标签分布不是明确可用的,而是将逻辑标签转换为以逻辑标签为均值的高斯分布问题,但是高斯分布的方差是不确定的,只能粗略的表示为以真实标签为中心的离散化高斯标签分布。这种方式所采用的评估指标与训练目标之间缺乏一致性,单纯的使用标签分布方法往往会引起评价指标偏低,无法客观的反映该方法的优劣。
发明内容
发明目的:为克服以上技术问题,本发明提出一种基于高斯分布假设和MSE损失的人脸年龄估计方法及装置。该方法搭建了基于高斯分布假设和MSE损失的人脸年龄估计模型,并优化了损失函数的设计,采用了基于高斯分布假设的高斯损失函数与MAE loss进行联合训练,解决了训练目标与评价目标不一致而导致的次优化(sub-optimal)问题,提高了模型的准确性。
技术方案:第一方面,本公开实施例提出一种基于高斯分布假设和MSE损失的人脸年龄估计方法,包括步骤:
S1、构建训练样本;
S2、搭建基于高斯分布假设和MSE损失的人脸年龄估计模型;所述人脸年龄估计模型包括特征提取网络和标签分布学习网络;所述特征提取网络用于提取输入图像的人脸特征,所述标签分布学习网络用于基于所述人脸特征进行年龄估计;
S3、将所述训练样本输入所述人脸年龄估计模型,在所述标签分布学习网络中进行全连接处理和基于损失函数的训练,所述损失函数为:;其中,/>为高斯损失函数,/>,/>表示样本图像/>的真实年龄标签,/>为年龄估计值,/>表示高斯分布的标准差;/>为期望回归损失函数,/>;是平衡高斯分布损失/>和期望回归损失函数/>之间重要性的权重参数;
S4、基于训练好的所述人脸年龄估计模型对输入的人脸图像进行年龄估计。
作为本公开实施例所述人脸年龄估计方法的一种可选实施方式,所述训练样本的构建方法为包括步骤:
S11、首先收集包含人脸的图像,采用人脸识别及检测模型提取人脸图像;
S12、将所述人脸图像进行对齐处理;
作为本公开实施例所述人脸年龄估计方法的一种可选实施方式,所述步骤S11中可以采用MTCNN模型提取所述人脸图像,得到人脸的5个关键点。
作为本公开实施例所述人脸年龄估计方法的一种可选实施方式,所述步骤S12中,可以基于所述5个关键点对提取出的所述人脸图像进行仿射变换处理,将所述人脸图像归一化为统一的尺寸,实现人脸对齐。
第二方面,本公开实施例提出一种基于高斯分布假设和MSE损失的人脸年龄估计装置,包括处理器和存储器;所述存储器存储有计算机程序,而所述处理器执行所述计算机程序,以实现所述的基于高斯分布假设和MSE损失的人脸年龄估计方法。
第三方面,本公开实施例还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序能够被处理器执行,以实现所述的基于高斯分布假设和MSE损失的人脸年龄估计方法。
有益效果:与现有技术相比,本发明具有以下优势:
1.新的损失函数Guass loss采用了基于高斯分布假设的设计,与MAE loss进行联合训练,解决了训练目标与评价目标不一致而导致的次优化(sub-optimal)问题;
2.轻量化网络引入了1*1卷积来降低计算量,使用新的非线性激活函数EvoNorm-B0替代常见的Relu,取得了更好的训练效果;
3.新的损失函数与我们设计的轻量化网络结构相结合,仅有36.4K的网络参数和220K的模型大小,在rk3399芯片上的推理速度可以稳定在20fps(50ms左右)。与其他紧凑型模型相比,本发明在公开数据集和私有数据集都达到了业内领先的性能指标。
附图说明
图1为本公开实施例涉及的基于高斯分布假设和MSE损失的人脸年龄估计模型的结构图;
图2为本公开实施例涉及的人脸年龄估计模型完成一次估计的示意图;
图3为本公开实施例涉及的基于高斯分布假设和MSE损失的人脸年龄估计装置的结构图。
具体实施方式
下面将结合附图和具体实施例对本发明作更进一步的说明。但应当理解的是,本发明可以以各种形式实施,以下在附图中出示并且在下文中描述的一些示例性和非限制性实施例,并不意图将本发明限制于所说明的具体实施例。
应当理解的是,在技术上可行的情况下,以上针对不同实施例所列举的技术特征可以相互组合,从而形成本发明范围内的另外的实施例。此外,本发明所述的特定示例和实施例是非限制性的,并且可以对以上所阐述的结构、步骤、顺序做出相应修改而不脱离本发明的保护范围。
现有的基于标签分布学习的年龄估计方法,其具有评价指标偏低的缺陷。有鉴于此,本实施例提出基于高斯分布假设和MSE损失的人脸年龄估计方法。该方法包括以下步骤:
步骤S1、构建人脸图像样本
S11、首先收集包含人脸的图像,采用人脸识别及检测算法提取人脸图像。目前,用于实现人脸识别及检测的方法有多种,本实施例中仅示意性地采用MTCNN(Multi-taskCascaded Convolutional Neural Networks)模型实现这一目的,MTCNN是一种多任务级联卷积神经网络,用以同时处理人脸检测和人脸关键点定位问题,能够实现人脸检测和5个特征点的标定。
S12、人脸对齐。检测到的人脸,可能角度不是很正,需要使其对齐,将人脸变换到一个统一的状态。常见的人脸对齐操作有翻转、旋转、裁剪、缩放、平移、抖动等仿射变换处理。本实施例基于步骤S11中提取的人脸5个关键点,对提取出的人脸图像进行仿射变换处理,将人脸图像归一化为统一的尺寸,并实现人脸对齐。
步骤S2、用步骤S1构建好的训练样本训练基于高斯分布假设和MSE损失的人脸年龄估计模型。
请参考图1,图1为本公开实施例涉及的基于高斯分布假设和MSE损失的人脸年龄估计模型的结构图。人脸年龄估计模型主要包括特征提取网络和标签分布学习网络。
继续参考图1,本公开实施例示意性地给出一种轻量化CNN(ConvolutionalNeural Network)网络,用于从输入的图像中提取人脸特征。该CNN网络包含 5 个 3*3标准卷积层、3个1*1卷积层、以及 2 个全连接层,1*1卷积用来降低计算量。然后,对于每一层卷积层,使用激活函数EvoNorm-B0进行归一化和非线性处理,并使用SE(Squeeze-and-Excitation )注意力模块进行全局平均池化和激励操作来进一步降低计算量。最后,将处理后的人脸特征送入标签分布学习网络(Distribution Learning),进行全连接处理和高斯损失函数(Guass Loss)拟合,并与MAE Loss联合训练,得到验证误差最小的训练模型。
本公开实施例中,提供了损失函数的设计方法,其设计原理如下。
(1)高斯损失函数的构建
标签分布学习网络在对样本子集中的每个样本进行学习时,其softmax层都会输出一个年龄分布。因为标签分布学习网络对每一张图片的估计行为是独立的,因此可以将每个样本对应的估计结果(年龄分布)假设成高斯分布,那么标签分布学习网络每次的估计行为实际上相当于对习得的年龄分布进行一次采样,如图2所示。基于此,我们可以计算出年龄分布的概率密度函数:
此时,可以基于年龄分布的概率密度函数构建高斯损失函数。我们计算年龄标签与年龄估计值所对应的高斯分布概率的差值:
(2)MAE损失函数的构建
假设在一个batch 中,我们有一组个样本组成的集合/>,由未知的脸部图像特征生成,/>表示一张年龄未知的脸部图像特征,/>。样本的真值标签矩阵为/>。LDL算法中,通过距离映射矩阵/>描述/>与/>之间的映射关系。因此,当给定训练样本集合后,年龄预测模型习得距离映射矩阵/>,并通过距离映射矩阵/>计算出预测标签分布矩阵/>,则年龄预测模型可以表示为最大熵形式:/>。
我们采用KL散度来描述年龄预测模型预测标签分布与真实标签分布之间的差异,并构建基于KL散度的KL损失函数来约束上述差异。
在连续属性的回归方法中,为了使误差尽量小,一般会将均方误差MSE(所有误差的平方和)作为评价误差的方法,即最小化均方误差就等同于最小化误差。我们用表示样本个数,/>表示真实标签,/>表示预测值,则年龄估计分布结果的均方误差的计算公式为:/>
(3)构建损失函数
在使用高斯损失进行学习训练时,由于对误差取了平方,损失对异常样本数据比较敏感,异常点会分配更大的权重,影响模型整体性能,不适合单独使用。因此,我们把/>和期望回归损失/>结合起来训练,可以有效减少异常样本的干扰,同时取得更精确的结果。
步骤S3、获取脸部图像,并将脸部图像输入训练好的年龄估计模型,得到年龄估计结果。
为实现上述基于高斯分布假设和MSE损失的人脸年龄估计方法,本工开实施例还提出一种人脸年龄估计装置,其结构请参考图3,包括处理器和存储器。存储器存储有计算机程序,而处理器执行所述计算机程序,以实现本工开实施例所述的基于高斯分布假设和MSE损失的人脸年龄估计方法。
具体来说,存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态性计算机可执行程序以及模块,如本申请实施例中的人脸年龄估计模型的训练方法和人脸年龄估计方法对应的程序指令/模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,可以实现本工开实施例中的人脸年龄估计方法。存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)、硬件芯片或者其任意组合;还可以是数字信号处理器(DigitalSignal Processing,DSP)、专用集成电路(Application SpecificIntegratedCircut,ASIC)、可编程逻辑器件(programmable logic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complexprogrammable logic device,CPLD),现场可编程逻辑门阵列(field-programmablegate array,FPGA),通用阵列逻辑(genericarray logic,GAL)或其任意组合。
本公开实施例还提供了一种计算机可读存储介质,例如包括程序代码的存储器,上述程序代码可由处理器执行以完成上述实施例中的人脸年龄估计模型的训练和人脸年龄估计方法。例如,该计算机可读存储介质可以是只读存储器(Read-Only Memory ,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact DiscRead-OnlyMemory,CDROM)、磁带、软盘和光数据存储设备等。
本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括一条或多条程序代码,该程序代码存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该程序代码,处理器执行该程序代码,以完成上述实施例中提供的人脸年龄估计模型的训练步骤和人脸年龄估计方法的实现步骤。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (6)
S1、构建训练样本;
S2、搭建基于高斯分布假设和MSE损失的人脸年龄估计模型;所述人脸年龄估计模型包括特征提取网络和标签分布学习网络;所述特征提取网络用于提取输入图像的人脸特征,所述标签分布学习网络用于基于所述人脸特征进行年龄估计;
S3、将所述训练样本输入所述人脸年龄估计模型,在所述标签分布学习网络中进行全连接处理和基于损失函数的训练,所述损失函数为:;其中,/>为高斯损失函数,/>,/>表示样本图像/>的真实年龄标签,/>为年龄估计值,/>表示高斯分布的标准差;/>为期望回归损失函数,/>;/>是平衡高斯分布损失/>和期望回归损失函数/>之间重要性的权重参数;
S4、基于训练好的所述人脸年龄估计模型对输入的人脸图像进行年龄估计。
3.根据权利要求2所述的人脸年龄估计方法,其特征在于,所述步骤S11中采用MTCNN模型提取所述人脸图像,得到人脸的5个关键点。
4.根据权利要求3所述的人脸年龄估计方法,其特征在于,所述步骤S12中,基于所述5个关键点,对提取出的所述人脸图像进行仿射变换处理,将所述人脸图像归一化为统一的尺寸,实现人脸对齐。
5.基于高斯分布假设和MSE损失的人脸年龄估计装置,其特征在于,包括处理器和存储器;所述存储器存储有计算机程序,而所述处理器执行所述计算机程序,以实现权利要求1至4任意一项所述的基于高斯分布假设和MSE损失的人脸年龄估计方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序能够被处理器执行,以实现权利要求1至4任意一项所述的基于高斯分布假设和MSE损失的人脸年龄估计方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310043823.1A CN115862118B (zh) | 2023-01-29 | 2023-01-29 | 基于高斯分布假设和mae损失的人脸年龄估计方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310043823.1A CN115862118B (zh) | 2023-01-29 | 2023-01-29 | 基于高斯分布假设和mae损失的人脸年龄估计方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115862118A true CN115862118A (zh) | 2023-03-28 |
CN115862118B CN115862118B (zh) | 2023-05-23 |
Family
ID=85657336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310043823.1A Active CN115862118B (zh) | 2023-01-29 | 2023-01-29 | 基于高斯分布假设和mae损失的人脸年龄估计方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115862118B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006029297A2 (en) * | 2004-09-10 | 2006-03-16 | Hoftberg Steven | Game theoretic prioritization scheme for mobile ad hoc networks permitting hierarchal deference |
CN111339810A (zh) * | 2019-04-25 | 2020-06-26 | 南京特沃斯高科技有限公司 | 一种基于高斯分布的低分辨率大角度人脸识别方法 |
WO2021012383A1 (zh) * | 2019-07-24 | 2021-01-28 | 初速度(苏州)科技有限公司 | 一种用于红外图像的年龄预测方法及装置 |
CN108256482B (zh) * | 2018-01-18 | 2021-06-25 | 中科视拓(北京)科技有限公司 | 一种基于卷积神经网络进行分布学习的人脸年龄估计方法 |
CN113076969A (zh) * | 2021-02-24 | 2021-07-06 | 上海辛玮智能科技有限公司 | 基于混合高斯损失函数的图像目标检测方法 |
CN110516537B (zh) * | 2019-07-15 | 2022-03-15 | 电子科技大学 | 一种基于自步学习的人脸年龄估计方法 |
CN115862119A (zh) * | 2023-02-15 | 2023-03-28 | 南京开为网络科技有限公司 | 基于注意力机制的人脸年龄估计方法及装置 |
-
2023
- 2023-01-29 CN CN202310043823.1A patent/CN115862118B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006029297A2 (en) * | 2004-09-10 | 2006-03-16 | Hoftberg Steven | Game theoretic prioritization scheme for mobile ad hoc networks permitting hierarchal deference |
CN108256482B (zh) * | 2018-01-18 | 2021-06-25 | 中科视拓(北京)科技有限公司 | 一种基于卷积神经网络进行分布学习的人脸年龄估计方法 |
CN111339810A (zh) * | 2019-04-25 | 2020-06-26 | 南京特沃斯高科技有限公司 | 一种基于高斯分布的低分辨率大角度人脸识别方法 |
CN110516537B (zh) * | 2019-07-15 | 2022-03-15 | 电子科技大学 | 一种基于自步学习的人脸年龄估计方法 |
WO2021012383A1 (zh) * | 2019-07-24 | 2021-01-28 | 初速度(苏州)科技有限公司 | 一种用于红外图像的年龄预测方法及装置 |
CN113076969A (zh) * | 2021-02-24 | 2021-07-06 | 上海辛玮智能科技有限公司 | 基于混合高斯损失函数的图像目标检测方法 |
CN115862119A (zh) * | 2023-02-15 | 2023-03-28 | 南京开为网络科技有限公司 | 基于注意力机制的人脸年龄估计方法及装置 |
Non-Patent Citations (2)
Title |
---|
吴奇等: "基于具有高斯损失函数支持向量机的预测模型", 《计算机集成制造系统》 * |
梁超: "我国黄金期货价格波动率预测研究:来自模型缩减方法的新证据", 《中国管理科学》 * |
Also Published As
Publication number | Publication date |
---|---|
CN115862118B (zh) | 2023-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230186476A1 (en) | Object detection and instance segmentation of 3d point clouds based on deep learning | |
CN110472675B (zh) | 图像分类方法、图像分类装置、存储介质与电子设备 | |
EP3171332B1 (en) | Methods and systems for inspecting goods | |
WO2018108129A1 (zh) | 用于识别物体类别的方法及装置、电子设备 | |
CN112541458B (zh) | 基于元学习的域自适应的人脸识别方法、系统、装置 | |
CN110738235B (zh) | 肺结核判定方法、装置、计算机设备及存储介质 | |
CN113065525B (zh) | 年龄识别模型训练方法、人脸年龄识别方法及相关装置 | |
CN115170934B (zh) | 一种图像分割方法、系统、设备及存储介质 | |
CN112948155B (zh) | 模型训练方法、状态预测方法、装置、设备及存储介质 | |
CN111127364A (zh) | 图像数据增强策略选择方法及人脸识别图像数据增强方法 | |
CN111340226B (zh) | 一种量化神经网络模型的训练及测试方法、装置及设备 | |
CN111881722A (zh) | 一种跨年龄人脸识别方法、系统、装置及存储介质 | |
CN112602155A (zh) | 生成针对经训练的模型的元数据 | |
CN114722958A (zh) | 网络训练及目标检测方法、装置、电子设备和存储介质 | |
CN117237733A (zh) | 一种结合自监督和弱监督学习的乳腺癌全切片图像分类方法 | |
CN112651467B (zh) | 卷积神经网络的训练方法和系统以及预测方法和系统 | |
CN113469167A (zh) | 仪表读数识别方法、装置、设备及存储介质 | |
CN112949947A (zh) | 一种基于卷积长短期记忆网络的电力故障预警方法及系统 | |
US20200279148A1 (en) | Material structure analysis method and material structure analyzer | |
CN110414562B (zh) | X光片的分类方法、装置、终端及存储介质 | |
CN117079017A (zh) | 可信的小样本图像识别分类方法 | |
CN112464172A (zh) | 生长参数主被动遥感反演方法及装置 | |
CN115862118A (zh) | 基于高斯分布假设和mse损失的人脸年龄估计方法及装置 | |
Ma et al. | Weakly supervised deep soft clustering for flood identification in SAR images | |
CN115862119A (zh) | 基于注意力机制的人脸年龄估计方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |