CN114399808A - 一种人脸年龄估计方法、系统、电子设备及存储介质 - Google Patents

一种人脸年龄估计方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN114399808A
CN114399808A CN202111538375.XA CN202111538375A CN114399808A CN 114399808 A CN114399808 A CN 114399808A CN 202111538375 A CN202111538375 A CN 202111538375A CN 114399808 A CN114399808 A CN 114399808A
Authority
CN
China
Prior art keywords
face age
face
age estimation
image set
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111538375.XA
Other languages
English (en)
Inventor
曹志诚
张开拓
赵恒�
庞辽军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202111538375.XA priority Critical patent/CN114399808A/zh
Publication of CN114399808A publication Critical patent/CN114399808A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明于模式识别、数字图像处理技术领域,公开了一种人脸年龄估计方法、系统、电子设备及存储介质,所述人脸年龄估计方法包括:获取人脸年龄图像集并进行预处理得到预处理后的人脸年龄图像集;构建人脸年龄估计模型;构建包含基于排序标签的误差压缩排序损失和属性指导分类损失的复合损失函数;根据人脸预处理图像集对人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型;根据测试数据集对所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计。本发明通过引入高性能的多尺度注意力机制残差卷积单元、属性指导模块及包含误差压缩排序损失的复合损失函数,实现鲁棒高效且估计性能指标高的人脸年龄估计目标。

Description

一种人脸年龄估计方法、系统、电子设备及存储介质
技术领域
本发明属于模式识别、数字图像处理技术领域,尤其涉及一种人脸年龄估计方法、系统、电子设备及存储介质。
背景技术
目前,人脸年龄估计是基于人的面部特征信息进行人的年龄信息推测的一种生物特征识别技术。随着大数据相关技术的不断发展,人脸年龄估计在辅助身份认证、人机交互、人口学等领域得到了广泛应用。在这些任务中,基于人脸图像的年龄估计逐渐成为一个重要且有挑战性的课题。
从目前研究来看,根据提取特征方式的不同,人脸年龄估计可以分为两大类:基于传统机器学习的方法和基于深度学习的方法。由于传统机器学习方法的手动特征提取方式受限于单一面部姿势、脸部特征点的准确定位等条件,其鲁棒性远没有大数据支持下的深度学习方法高。深度学习的方法早期将年龄估计视作一类模式识别问题,由于年龄值的增长是一个有序数的变化过程,同时每个年龄值又可以单独看作是一个类,因此年龄估计可以被认为是一种回归问题或一种分类问题。同时,基于对年龄增长的动态性的表达,最近的研究将排序模型(Ranking Model)引入年龄估计问题当中,取得了较好的结果。
两种估计模式都有其局限性,对于年龄增长的两大特性:非线性和连续性,分类和回归模型只能倾向表达一种,排序模型一定程度上改进了这个问题,但排序模型的应用方式仍有发展空间。另一方面,年龄信息与性别、种族等标签信息高相关,这一点在年龄估计领域中没有得到考虑和研究。
通过上述分析,现有技术存在的问题及缺陷为:
(1)由于传统机器学习方法的手动特征提取方式受限于单一面部姿势、脸部特征点的准确定位等条件,其鲁棒性远没有大数据支持下的深度学习方法高。
(2)现有年龄估计模式中,对于年龄增长的两大特性:非线性和连续性,分类和回归模型只能倾向表达一种,且排序模型的应用方式仍有发展空间。
(3)现有年龄估计模式中,年龄信息与性别、种族等标签信息高相关,这一点在年龄估计领域中没有得到考虑和研究。
解决以上问题及缺陷的难度为:
(1)年龄特性(非线性和连续性)的表达存在一定冲突,往往不能很好地同时进行表达,需要一个尽可能满足两者的损失函数;
(2)如何在神经网络中利用性别、种族等与年龄高度相关的信息是一个难点和创新点。
解决以上问题及缺陷的意义为:
使用贴近年龄变化特性的损失函数来进行年龄值计算,更有利于年龄的精确估计;将受属性约束的信息用于年龄值的计算,可以使得年龄学习的过程更具确定性,有利于结果的精确表达和提高网络的鲁棒性。
发明内容
针对现有技术存在的问题,本发明提供了一种人脸年龄估计方法、系统、电子设备及存储介质,尤其涉及一种基于属性指导的人脸年龄估计方法、系统、电子设备及存储介质。
本发明是这样实现的,一种人脸年龄估计方法,所述人脸年龄估计方法,包括以下步骤:
步骤一,获取人脸年龄图像集并进行预处理,得到预处理后的人脸年龄图像集。预处理的目的是使人脸图像拥有相近的图像尺寸,并尽可能排除背景的干扰;
步骤二,构建人脸年龄估计模型。具体包括通过构建基于排序标签的误差压缩排序损失来表达年龄的特性、构建特征提取模块进行卷积运算、构建属性指导模块和属性指导分类损失建立全连接层与相应属性的联系;
步骤三,根据人脸预处理图像集对人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型;
步骤四,根据测试数据集对所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计。
进一步,所述步骤一中的对人脸年龄图像集进行预处理,得到预处理后的人脸年龄图像集包括:
对所述人脸年龄图像集进行人脸检测、裁剪和缩放,得到所述预处理后的人脸年龄图像集;
对所述预处理后的人脸年龄图像集按比例随机将图像划分为训练集、验证集和测试集。
进一步,所述步骤二中的构建人脸年龄估计模型包括特征提取模块和属性指导模块;
其中,所述特征提取模块包括依次以不同次数重复连接的基本卷积单元,即多尺度注意力机制残差卷积单元;其中,所述基本卷积单元包括依次连接的多尺度卷积机制和通道注意力机制;所述多尺度卷积机制包括不同卷积核大小和不同输出通道数的卷积层;所述通道注意力机制包括全局池化层、全连接层和激活层。
所述属性指导模块包括第一属性全连接层、第二属性全连接层和全局全连接层;其中,所述第一属性全连接层连接对应数量输出神经元,所述第一属性全连接层与所述第二属性全连接层进行连接,所述第二属性全连接层与所述全局全连接层进行拼接;
所述特征提取模块的输入为人脸图像,所述特征提取模块的输出为所述属性指导模块的输入;所述属性指导模块的输出为单个年龄值结果。
进一步,所述步骤三中的根据人脸预处理图像集对人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型包括:
构建包括基于排序标签的误差压缩排序损失和属性指导分类损失的复合损失函数;根据所述预处理后的人脸年龄图像集并利用所述复合损失函数对所述人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型。
其中,所述构建包括基于排序标签的误差压缩排序损失和属性指导分类损失的复合损失函数包括:
Ltotal=Lecr+Lattr
其中,所述基于排序标签的误差压缩排序损失为:
Figure BDA0003413604140000041
式中,xi为第i个输入样本图像,h(xi)为网络模型输出的单值年龄值,bk为第k个年龄区间起始端点,K为年龄总类别数,N为总样本数,yi为真实排序标签,σ(·)为S型激活函数;
所述属性指导分类损失用于建立属性与真实标签之间的联系,计算方式为:
Figure BDA0003413604140000042
式中,α、β和γ为权重系数,a(xi)为计算的年龄段分类,ai为图像年龄段标签,g(xi)为计算的性别分类,gi为图像性别标签,e(xi)为计算的种族分类,ei为图像种族标签。
进一步,所述步骤四中的根据测试数据集对所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计包括:
使用所述训练好的人脸年龄估计模型对测试集图像进行人脸年龄估计,通过计算其结果与真实标签之间的平均绝对误差MAE值,以实现人脸年龄估计,并将MAE值作为模型优劣的评价指标。
其中,所述MAE值的计算方式为:
Figure BDA0003413604140000051
本发明的另一目的在于提供一种应用所述的人脸年龄估计方法的人脸年龄估计系统,所述人脸年龄估计系统包括:
图像集获取及预处理模块,用于获取人脸年龄图像集并进行预处理,得到预处理后的人脸年龄图像集;
年龄估计模型构建模块,用于构建人脸年龄估计模型;
年龄估计模型训练模块,用于根据人脸预处理图像集对人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型;
人脸年龄估计模块,用于根据测试数据集对所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计。
本发明的另一目的在于提供一种应用所述的人脸年龄估计方法的人脸年龄估计电子设备,所述人脸年龄估计电子设备包括图像采集仪、显示器、图形处理器、通信接口、存储器、中央处理器和通信总线。
其中,所述图像采集仪、所述显示器、所述图形处理器、所述通信接口、所处存储器和所述中央处理器通过所述通信总线完成相互间的通信;
所述图像采集仪,用于采集图像数据;
所述显示器,用于显示图像识别数据;
所述图形处理器,用于计算图像数据;
所述存储器,用于存放计算机程序;
所述中央处理器,用于执行所述存储器上存放的所述计算机程序时,实现所述的人脸年龄估计方法。
本发明的另一目的在于提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
获取人脸年龄图像集并进行预处理,得到预处理后的人脸年龄图像集;构建人脸年龄估计模型;根据人脸预处理图像集对人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型;根据测试数据集对所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
获取人脸年龄图像集并进行预处理,得到预处理后的人脸年龄图像集;构建人脸年龄估计模型;根据人脸预处理图像集对人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型;根据测试数据集对所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的人脸年龄估计系统。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明提供的人脸年龄估计方法,通过引入高性能的多尺度注意力机制残差卷积单元、属性指导模块、及包含误差压缩排序损失的复合损失函数,实现了鲁棒高效且估计性能指标高的人脸年龄估计这一目标。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的人脸年龄估计方法流程图。
图2是本发明实施例提供的人脸年龄估计方法原理图。
图3是本发明实施例提供的人脸年龄估计系统结构框图;
图中:1、图像集获取及预处理模块;2、年龄估计模型构建模块;3、年龄估计模型训练模块;4、人脸年龄估计模块。
图4是本发明实施例提供的人脸年龄估计方法整体网络的结构示意图。
图5是本发明实施例提供的人脸年龄估计方法中特征提取模块的基本卷积单元结构示意图。
图6是本发明实施例提供的基于排序标签的误差压缩排序损失所对应的年龄段点设计示意图。
图7是本发明实施例提供的人脸年龄估计方法中属性指导模块结构示意图。
图8是本发明实施例提供的人脸年龄估计电子设备的结构示意图。
图9是本发明实施例提供的人脸年龄估计计算机可读存储介质的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种人脸年龄估计方法、系统、电子设备及存储介质,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的人脸年龄估计方法包括以下步骤:
S101,获取人脸年龄图像集并进行预处理得到预处理后的人脸年龄图像集;
S102,构建人脸年龄估计模型;
S103,根据人脸预处理图像集对人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型;
S104,根据测试数据集对所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计。
本发明实施例提供的人脸年龄估计方法原理图如图2所示。
如图3所示,本发明实施例提供的人脸年龄估计系统包括:
图像集获取及预处理模块1,用于获取人脸年龄图像集并进行预处理,得到预处理后的人脸年龄图像集;
年龄估计模型构建模块2,用于构建人脸年龄估计模型;
年龄估计模型训练模块3,用于根据人脸预处理图像集对人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型;
人脸年龄估计模块4,用于根据测试数据集对所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计。
下面结合具体实施例对本发明的技术方案作进一步描述。
实施例1
目前人脸年龄估计领域围绕年龄估计发展了一系列的研究,由于现有流行估计模型仅倾向于表达年龄特性中的一种,即回归算法倾向表现连续性信息,分类算法倾向表现非线性信息。两种特性不能很好地同时表达,使得这些算法都存在一定的局限性。
基于上述存在的问题,请参见图2,图2是本发明实施例提供的基于属性指导的人脸年龄估计方法的流程示意图,本实施例提供了一种基于属性指导的人脸年龄估计方法,该方法包括以下步骤:
步骤1、获取人脸年龄图像集并进行预处理,得到预处理后的人脸年龄图像集。
具体而言,本实施例选用两个通用人脸年龄图像集作为人脸年龄图像集,分别为Morph和UTKFace人脸年龄图像集。其中,Morph数据集为目前最流行的年龄估计数据集之一,包括了13000人的55134张图像,包含人物的年龄、性别信息;UTKFace数据集包含0到116的2万余张人脸图像,包含任务的年龄、性别、种族信息,在本实施例中,仅保留1至100的年龄图像用于实验。
为了实现更好地实现人脸年龄估计,本实施例在进行年龄估计之前,先对人脸年龄图像集做人脸检测、裁剪和缩放,同时以8:1:1的比例随机将图像划分为训练集、验证集和测试集。
其中,对于人脸检测和裁剪,本实施例采用图像处理领域的开源库dlib中的检测函数和裁剪函数,仅保留检测人脸个数为1的图像,并将检测到的人脸进行裁剪。
对于裁剪后的图像进行缩放,本实施例将图像统一缩放至256×256的图像尺寸。
本实施例对人脸年龄图像集中的每一幅人脸图像通过上述处理,进而得到预处理后的人脸年龄图像集的训练集、验证集和测试集。
步骤2、构建特征提取模块、属性指导模块等以得到人脸年龄估计模型。
具体而言,由于当前人脸年龄估计的分类算法和排序算法各自存在相应缺陷,同时与年龄强相关的属性信息没有得到有效利用,因此本实施例提出了基于属性指导的人脸年龄估计模型。具体地,请参见图4,图4是本发明实施例提供的基于属性指导的人脸年龄估计方法的总体模型架构,可见,构建的人脸年龄估计模型包括依次连接的特征提取模块和属性指导模块。
其中,所述特征提取模块由基本卷积单元(即多尺度注意力机制残差卷积单元)分别以次数[6,8,12,6]重复连接而成。该基本卷积单元的具体结构如图5所示。其中,所述基本卷积单元包括多尺度卷积机制和通道注意力机制;其中,所述多尺度卷积机制包括输出1/4通道数的1×1卷积、输出1/2通道数的3×3卷积和输出1/4通道数的5×5卷积;所述通道注意力机制包括全局池化层、全连接层和激活层。全局池化层通过一维卷积得到相同维度数的全连接层,经过激活层激活之后作为原特征图各通道的权重,并逐元素相乘得到新的特征图。
所述属性指导模块如图6所示,其中,Gender_FC、Age_Group_FC和Ethnicity_FC为第一属性全连接层,Attribute_FC为第二属性全连接层。第一属性全连接层连接对应的输出神经元,计算属性损失,同时第一属性全连接层经过级联之后通过一维卷积,得到第二属性全连接层;第二属性全连接层与全局全连接层进行拼接,计算最后的年龄值,并以基于排序标签的误差压缩排序损失计算损失。
步骤3、构建基于排序标签的误差压缩排序损失和属性指导分类损失的复合损失函数;
具体而言,本实施例将步骤2得到的预处理后的人脸年龄图像集随机裁剪出224×224大小,输入至步骤3所构建的人脸年龄估计模型进行训练。具体地,训练过程将预处理后的人脸年龄图像集划分为训练集、验证集、测试集三部分,其训练集与验证集及测试集均不重合。然后使用训练集、验证集进行训练,同时构建包括基于排序标签的误差压缩排序损失和属性指导分类损失的复合损失函数,其具体设计如下:
Ltotal=Lecr+Lattr (1)
其中,基于排序标签的误差压缩排序损失为:
Figure BDA0003413604140000101
上式中,xi为第i个输入样本图像,h(xi)为网络模型输出的单值年龄值,bk为第k个年龄区间起始端点,K为年龄总类别数,N为总样本数,yi为真实排序标签,σ(·)为S型激活函数。Lecr为输出值h(xi)减去bk后通过S型函数激活得到的二值化矢量与真实标签的交叉熵。经过反向传播和链式求导法则,最后的年龄回归值会收敛至真实值±0.5的范围内。这样的优势在于使用排序标签可以利用年龄的连续性信息,使用1/0之间对应的段点可以利用年龄的非线性信息。另外,排序算法的标签矢量维度一般为K-1,而本发明提出的标签矢量维度为K,这样可以利用起始年龄值的信息。
属性指导分类损失用于建立属性与真实标签之间的联系,其计算方式如下:
Figure BDA0003413604140000102
其中α、β和γ为权重系数,a(xi)为计算的年龄段分类,ai为图像年龄段标签,g(xi)为计算的性别分类,gi为图像性别标签,e(xi)为计算的种族分类,ei为图像种族标签。
由于本实施例中使用的不同人脸年龄数据集所包含的具体属性不同,对应的属性指导损失权重的取值也有所不同。具体而言,Morph数据集包含人脸的年龄与性别标签,因此其应用网络中α与β设置为1,γ设置为0;而UTKFace数据集包含人脸的年龄、性别与种族标签,因此其应用网络中α、β和γ均设置为1。
步骤4、使用所述人脸预处理图像集对所述人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型;
具体而谈,本实施例使用包括属性指导分类损失和基于排序标签的误差压缩排序损失的复合损失函数对上述人脸年龄估计模型进行训练,训练过程同时使用预处理后的人脸年龄图像集中的训练集、验证集,训练中优选的优化器为Adam,学习率固定为0.0005,批大小为64,通过不断保存使验证集损失最小的模型来获取最终训练成功的人脸年龄估计模型。
步骤5、使用测试数据集对步骤4所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计。
具体而言,为了比较本实例与其他主流人脸年龄估计方法,本实施例对步骤4得到的训练好的人脸年龄估计模型在训练集上进行年龄估计,得到估计年龄值结果,并将其与真实值之间的MAE值作为评估指标,进行了结果对比。MAE计算方式为:
Figure BDA0003413604140000111
综上所述,本发明针对人脸年龄估计问题引入属性指导思想,并通过设计基于排序标签的误差压缩排序损失和加入了多尺度特征提取和通道注意力的特征提取模块来逐步提升最终年龄估计的准确率。具体来说:首先,在进行人脸年龄估计之前先对人脸图像做检测、裁剪和缩放;然后利用本发明所提出的特征提取模块进行特征提取;之后利用属性指导的思想对一部分特征全连接层与属性信息建立联系,最后将卷积后的特征全连接层与全局全连接层进行拼接,利用本发明所提出的基于排序标签的回归任务损失计算图像的年龄值,以实现人脸年龄估计。
本实施例验证过程中人脸年龄估计网络模型中特征提取模块的每一层参数设计具体参见表1。在基本卷积单元(即多尺度注意力机制残差卷积单元)的通道注意力机制中,为了有效利用相邻通道之间的关系,在3~16层的基本卷积单元中,一维卷积核尺寸为1×3,而在17~34层则为1×5。
表1.本发明人脸年龄估计网络模型中特征提取模块的参数设计
Figure BDA0003413604140000121
由于本实施例验证过程所使用的人脸年龄数据集所包含的属性不同,人脸年龄估计网络模型中属性指导模块分别采用了不同维数的属性全连接层。具体而言,Morph数据集的应用网络中,Gender_FC、Age_Group_FC、Ethnicity_FC、Attribute_FC和Global_FC的维数分别为512、512、0、1024和1024;而在UTKFace数据集的应用网络中,对应的全连接层维数分别为256、256、256、768和1024。
本实施例设计的实验从以下三个方面进行对比论证:
(1)为说明本发明的人脸年龄估计网络模型中基于排序标签的误差压缩排序损失的有效性,构建ResNet34为特征提取网络,以该损失函数输出单值年龄值的对比网络,与现阶段年龄估计主流方法进行对比,其结果如表2所示。
表2.本实施例年龄估计方法采用误差压缩排序损失项后与其他公开方法的平均绝对误差(MAE)对比
Figure BDA0003413604140000131
由表2对比结果表明,在保持相同特征提取网络输出年龄值时,采用本发明的包含误差压缩排序损失项的复合损失函数,在测试集上估计结果与真实标签的MAE值在两个数据集分别达到了最优和次优,具体为在UTKFace上达到3.61和在Morph上达到2.42。因此,本实验证实了本发明提出的误差压缩排序损失项以及包含该损失项的复合损失函数对提高人脸年龄估计的有效性。
(2)为说明本发明的人脸年龄估计网络模型中特征提取模块的有效性,保留上述以基于排序标签的误差压缩排序损失作为损失函数的计算方式,以本发明提出的基本卷积单元构建34层的重复连接网络模型,用于对比ResNet34的结果,另外,本实施例设计的实验提供了使用经典特征作为提取网络模型的结果,具体请参见表3。
表3.本实施例年龄估计方法采用的特征提取模块与其他主流特征提取模块的平均绝对误差(MAE)对比
Figure BDA0003413604140000141
表3的结果表明,本发明提出的方法,即使用前述包含误差压缩排序损失的复合损失函数、并采用我们的基于多尺度注意力机制残差单元的特征提取模块,相对于表2中仅使用误差压缩排序损失但不加我们特征提取模块的方法,在两个公开数据集Morph和UTKFace上的测试结果均有提升;同时,该结果也显示,保留本发明的误差压缩排序损失作为损失函数、并采用本发明特征提取模块的方法均超过了多个现有主流年龄估计网络模型所采用的特征提取模块(如VGG19、DenseNet、ResNet50、ResNet34等)的结果,MAE误差全都更小。因此,本实验证实了本发明提出的基于多尺度注意力机制残差单元的特征提取模块对提高人脸年龄估计的有效性。
(3)为说明本发明提出的人脸年龄估计网络模型中属性指导模块的有效性,在上述结构的基础上增加属性指导模块进行实验,其结果如表4所示。
表4.本实施例年龄估计方法有无属性指导模块的前后平均绝对误差(MAE)对比
Figure BDA0003413604140000151
表4的结果表明,采用本发明提出的属性指导模块,两个数据集测试集的MAE结果均有提升,达到最优,具体为在Morph上达到2.36和在UTKFace上达到3.51。因此,本实验证实了本发明提出的属性指导模块对提高人脸年龄估计的有效性。
从以上三个人脸年龄估计实验结果来看,本发明人脸年龄估计方法所提出的基于排序标签的误差压缩排序损失、基于多尺度注意力机制残差卷积单元的特征提取模块、以及属性指导模块均有利于模型性能的提升,使最终的年龄估计结果显著优于现有的多个主流人脸年龄估计网络模型。
可见,本实施例针对传统人脸年龄估计方法中分类偏向表现年龄的非线性、回归偏向表现年龄的连续性的这一局限性,提出了基于排序标签的误差压缩排序损失,有效利用了年龄的连续性信息和非线性信息;本实施例针对特征提取网络性能的问题,设计了具有多尺度卷积机制和通道注意力机制的残差式基本卷积单元,并以ResNet34的构建结构搭建网络,得到特征提取模块;本实施例针对人脸年龄估计问题中,与年龄强相关的信息没有得到有效利用的问题,设计了属性指导模块,通过利用与属性相关的全连接层的信息,使最终的年龄结果有相关标签的表达,达到提升最终人脸年龄估计的性能。
本实施例提出了一套完整的基于属性指导的人脸年龄估计技术,可以解决传统人脸年龄估计技术无法同时有效利用年龄的连续性和非线性、没有利用与年龄强相关的属性信息、特征提取网络性能不高等诸多缺陷;本实施例为年龄估计的实用化提供了新理论和新算法支持,使得人脸年龄估计技术变得更加实用、可靠和普及化;本实施例可以广泛应用于户外、室内、网络等环境下的辅助身份识别、人口学等等应用场合。
实施例二
在上述实施例一的基础上,请参见图8,图8是本发明实施例提供的一种基于属性指导的人脸年龄估计电子设备的结构示意图。本实施例提供了一种基于属性指导的人脸年龄估计电子设备,该电子设备包括图像采集仪、显示器、图形处理器、通信接口、存储器、中央处理器和通信总线,其中,图像采集仪、显示器、图形处理器、通信接口、存储器和中央处理器通过通信总线完成相互间的通信;
图像采集仪用于采集人脸图像数据;
显示器用于显示人脸图像识别数据;
图形处理器用于计算人脸图像数据;
存储器,用于存放计算机程序;
中央处理器,用于执行存储器上所存放的计算机程序时,该计算机程序被处理器执行时实现以下步骤:
步骤1、控制图像采集仪进行人脸图像采集,获取人脸年龄图像集,并进行预处理得到预处理后的人脸年龄图像集。
具体而言,本实施例步骤1中对人脸年龄图像集进行预处理得到预处理后的人脸年龄图像集,包括:
对人脸年龄图像集进行人脸检测、裁剪、缩放得到预处理后的人脸年龄图像集。
对所述预处理后的人脸年龄图像集以8:1:1的比例随机将图像划分为训练集、验证集和测试集。
步骤2、构建人脸年龄估计网络模型,并进行训练,保存训练模型参数。
具体而言,本实施例的步骤2包括:
(1)构建人脸年龄人脸估计模型,包括依次连接的特征提取模块和属性指导模块,特征提取部分包括依次以[6,8,12,6]次数重复连接的基本卷积单元,每个基本卷积单元包括多尺度卷积机制和通道注意力机制,多尺度卷积机制包括输出1/4通道数的1×1卷积、输出1/2通道数的3×3卷积和输出1/4通道数的5×5卷积,通道注意力机制包括全局池化层、全连接层和激活层;属性指导模块包括第一属性全连接层、第二属性全连接层、全局全连接层,所述第一属性全连接层连接对应数量输出神经元,所述第一属性全连接层与所述第二属性全连接层进行连接、所述第二属性全连接层与全局全连接层进行拼接。
(2)构建基于排序标签的误差压缩排序损失和属性分类损失的复合损失函数;
(3)使用人脸年龄图像集训练集并利用包括基于排序标签的误差压缩排序损失和属性分类损失的复合损失函数对人脸年龄估计网络模型进行训练,得到训练好的人脸年龄估计模型,保留在验证集上与真实标签MAE最小的模型参数;
步骤3、使用训练好的网络模型进行人脸年龄估计。
具体而言,本实施例的步骤3将人脸年龄预处理测试图像输入至已训练好的人脸年龄估计网络模型进行人脸年龄估计,得到对应的年龄值和与真实标签之间的MAE。
本实施例提供的一种基于属性指导的人脸年龄估计电子设备,可以执行上述人脸年龄估计实施例,其实现原理和技术效果类似,在此不再赘述。
实施例三
在上述实施例二的基础上,请参见图9,图9是本发明实施例提供的一种计算机可读存储介质的结构示意图。本实施例提供的一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现以下步骤:
步骤1、获取人脸年龄图像集并进行预处理得到预处理后的人脸年龄图像集。
具体而言,本实施例步骤1中对人脸年龄图像集进行预处理得到预处理后的人脸年龄图像集,包括:
对人脸年龄图像集进行人脸检测、裁剪、缩放得到预处理后的人脸年龄图像集。
对所述预处理后的人脸年龄图像集以8:1:1的比例随机将图像划分为训练集、验证集和测试集。
步骤2、构建人脸年龄估计网络模型,并进行训练,保存训练模型参数。
具体而言,本实施例的步骤2包括:
构建人脸年龄人脸估计模型,包括依次连接的特征提取模块和属性指导模块,特征提取部分包括依次以[6,8,12,6]次数重复连接的基本卷积单元,每个基本卷积单元包括多尺度卷积机制和通道注意力机制,多尺度卷积机制包括输出1/4通道数的1×1卷积、输出1/2通道数的3×3卷积和输出1/4通道数的5×5卷积,通道注意力机制包括全局池化层、全连接层和激活层;属性指导模块包括第一属性全连接层、第二属性全连接层、全局全连接层,第一属性全连接层连接对应数量输出神经元,第一属性全连接层与第二属性全连接层进行连接、第二属性全连接层与全局全连接层进行拼接。
构建基于排序标签的误差压缩排序损失和属性分类损失的复合损失函数;
使用人脸年龄预处理训练图像集的训练集并利用基于排序标签的误差压缩排序损失和属性分类损失的复合损失函数对人脸年龄估计网络模型进行训练,得到训练好的人脸年龄估计模型,保留在验证集上与真实标签MAE最小的模型参数;
步骤3、使用训练好的网络模型进行人脸年龄估计。
具体而言,本实施例的步骤3将人脸年龄预处理测试图像输入至已训练好的人脸年龄估计网络模型进行人脸年龄估计,得到对应的年龄值和与真实标签之间的MAE。
本实施例提供的一种计算机可读存储介质,可以执行上述人脸年龄估计方法实施例和上述人脸年龄估计电子设备实施例,其实现原理和技术效果类似,在此不再赘述。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘Solid StateDisk(SSD))等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种人脸年龄估计方法,其特征在于,所述人脸年龄估计方法包括以下步骤:
步骤一,获取人脸年龄图像集并进行预处理,得到预处理后的人脸年龄图像集;
步骤二,构建人脸年龄估计模型;
步骤三,根据人脸预处理图像集对人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型;
步骤四,根据测试数据集对所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计。
2.如权利要求1所述的人脸年龄估计方法,其特征在于,所述步骤一中的对人脸年龄图像集进行预处理,得到预处理后的人脸年龄图像集包括:
对所述人脸年龄图像集进行人脸检测、裁剪和缩放,得到所述预处理后的人脸年龄图像集;
对所述预处理后的人脸年龄图像集按比例随机将图像划分为训练集、验证集和测试集。
3.如权利要求1所述的人脸年龄估计方法,其特征在于,所述步骤二中的构建人脸年龄估计模型包括特征提取模块和属性指导模块;
其中,所述特征提取模块包括依次以不同次数重复连接的基本卷积单元,即多尺度注意力机制残差卷积单元;其中,所述基本卷积单元包括依次连接的多尺度卷积机制和通道注意力机制;所述多尺度卷积机制包括不同卷积核大小和不同输出通道数的卷积层;所述通道注意力机制包括全局池化层、全连接层和激活层;
所述属性指导模块包括第一属性全连接层、第二属性全连接层和全局全连接层;其中,所述第一属性全连接层连接对应数量输出神经元,所述第一属性全连接层与所述第二属性全连接层进行连接,所述第二属性全连接层与所述全局全连接层进行拼接;
所述特征提取模块的输入为人脸图像,所述特征提取模块的输出为所述属性指导模块的输入;所述属性指导模块的输出为单个年龄值结果。
4.如权利要求1所述的人脸年龄估计方法,其特征在于,所述步骤三中的根据人脸预处理图像集对人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型包括:
构建包括基于排序标签的误差压缩排序损失和属性指导分类损失的复合损失函数;根据所述预处理后的人脸年龄图像集并利用所述复合损失函数对所述人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型;
其中,所述构建包括基于排序标签的误差压缩排序损失和属性指导分类损失的复合损失函数为:
Ltotal=Lecr+Lattr
其中,所述基于排序标签的误差压缩排序损失为:
Figure FDA0003413604130000021
式中,xi为第i个输入样本图像,h(xi)为网络模型输出的单值年龄值,bk为第k个年龄区间起始端点,K为年龄总类别数,N为总样本数,yi为真实排序标签,σ(·)为S型激活函数;
所述属性指导分类损失用于建立属性与真实标签之间的联系,计算方式为:
Figure FDA0003413604130000022
式中,α、β和γ为权重系数,a(xi)为计算的年龄段分类,ai为图像年龄段标签,g(xi)为计算的性别分类,gi为图像性别标签,e(xi)为计算的种族分类,ei为图像种族标签。
5.如权利要求1所述的人脸年龄估计方法,其特征在于,所述步骤四中的根据测试数据集对所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计包括:
使用所述训练好的人脸年龄估计模型对测试集图像进行人脸年龄估计,通过计算其结果与真实标签之间的平均绝对误差值(MAE),以实现人脸年龄估计,并将MAE值作为模型优劣的评价指标。
6.一种实施权利要求1~5任意一项所述的人脸年龄估计方法的人脸年龄估计系统,其特征在于,所述人脸年龄估计系统包括:
图像集获取及预处理模块,用于获取人脸年龄图像集并进行预处理,得到预处理后的人脸年龄图像集;
年龄估计模型构建模块,用于构建人脸年龄估计模型;
年龄估计模型训练模块,用于根据人脸预处理图像集对人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型;
人脸年龄估计模块,用于根据测试数据集对所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计。
7.一种应用如权利要求1~5任意一项所述的人脸年龄估计方法的人脸年龄估计电子设备,其特征在于,所述人脸年龄估计电子设备包括图像采集仪、显示器、图形处理器、通信接口、存储器、中央处理器和通信总线;
其中,所述图像采集仪、所述显示器、所述图形处理器、所述通信接口、所处存储器和所述中央处理器通过所述通信总线完成相互间的通信;
所述图像采集仪,用于采集图像数据;
所述显示器,用于显示图像识别数据;
所述图形处理器,用于计算图像数据;
所述存储器,用于存放计算机程序;
所述中央处理器,用于执行所述存储器上存放的所述计算机程序时,实现所述的人脸年龄估计方法。
8.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
获取人脸年龄图像集并进行预处理,得到预处理后的人脸年龄图像集;构建人脸年龄估计模型;根据人脸预处理图像集对人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型;根据测试数据集对所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
获取人脸年龄图像集并进行预处理,得到预处理后的人脸年龄图像集;构建人脸年龄估计模型;根据人脸预处理图像集对人脸年龄估计模型进行训练得到训练好的人脸年龄估计模型;根据测试数据集对所述训练好的人脸年龄估计模型进行测试,得到人脸年龄估计结果以实现人脸年龄估计。
10.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现如权利要求6所述的人脸年龄估计系统。
CN202111538375.XA 2021-12-15 2021-12-15 一种人脸年龄估计方法、系统、电子设备及存储介质 Pending CN114399808A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111538375.XA CN114399808A (zh) 2021-12-15 2021-12-15 一种人脸年龄估计方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111538375.XA CN114399808A (zh) 2021-12-15 2021-12-15 一种人脸年龄估计方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114399808A true CN114399808A (zh) 2022-04-26

Family

ID=81226952

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111538375.XA Pending CN114399808A (zh) 2021-12-15 2021-12-15 一种人脸年龄估计方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114399808A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115100709A (zh) * 2022-06-23 2022-09-23 北京邮电大学 一种特征分离的图像人脸识别与年龄估计方法
CN115147381A (zh) * 2022-07-08 2022-10-04 烟台大学 基于图像分割的路面裂缝检测方法
CN115862119A (zh) * 2023-02-15 2023-03-28 南京开为网络科技有限公司 基于注意力机制的人脸年龄估计方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115100709A (zh) * 2022-06-23 2022-09-23 北京邮电大学 一种特征分离的图像人脸识别与年龄估计方法
CN115147381A (zh) * 2022-07-08 2022-10-04 烟台大学 基于图像分割的路面裂缝检测方法
CN115862119A (zh) * 2023-02-15 2023-03-28 南京开为网络科技有限公司 基于注意力机制的人脸年龄估计方法及装置
CN115862119B (zh) * 2023-02-15 2023-06-13 南京开为网络科技有限公司 基于注意力机制的人脸年龄估计方法及装置

Similar Documents

Publication Publication Date Title
CN111860573B (zh) 模型训练方法、图像类别检测方法、装置和电子设备
CN109214343B (zh) 用于生成人脸关键点检测模型的方法和装置
CN110197099B (zh) 跨年龄人脸识别及其模型训练的方法和装置
CN108351984B (zh) 硬件高效的深度卷积神经网络
CN112613581B (zh) 一种图像识别方法、系统、计算机设备和存储介质
CN114399808A (zh) 一种人脸年龄估计方法、系统、电子设备及存储介质
CN111178458B (zh) 分类模型的训练、对象分类方法及装置
Boussaad et al. Deep-learning based descriptors in application to aging problem in face recognition
CN112784778B (zh) 生成模型并识别年龄和性别的方法、装置、设备和介质
CN108197592B (zh) 信息获取方法和装置
CN109522872A (zh) 一种人脸识别方法、装置、计算机设备及存储介质
CN110222607B (zh) 人脸关键点检测的方法、装置及系统
CN112561060B (zh) 神经网络训练方法及装置、图像识别方法及装置和设备
CN111931002B (zh) 一种匹配方法以及相关设备
CN112418059B (zh) 一种情绪识别的方法、装置、计算机设备及存储介质
CN111325190A (zh) 一种表情识别方法、装置、计算机设备及可读存储介质
CN112395979A (zh) 基于图像的健康状态识别方法、装置、设备及存储介质
CN111401339A (zh) 识别人脸图像中的人的年龄的方法、装置及电子设备
CN116580257A (zh) 特征融合模型训练及样本检索方法、装置和计算机设备
Passalis et al. Deep supervised hashing using quadratic spherical mutual information for efficient image retrieval
Aufar et al. Face recognition based on Siamese convolutional neural network using Kivy framework
CN114120454A (zh) 活体检测模型的训练方法、装置、电子设备及存储介质
CN111931841A (zh) 基于深度学习的树状处理方法、终端、芯片及存储介质
CN113378866B (zh) 图像分类方法、系统、存储介质及电子设备
CN115392361A (zh) 一种智能排序方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination