CN114694215A - 年龄估计模型的训练及估计方法、装置、设备及存储介质 - Google Patents

年龄估计模型的训练及估计方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114694215A
CN114694215A CN202210260388.3A CN202210260388A CN114694215A CN 114694215 A CN114694215 A CN 114694215A CN 202210260388 A CN202210260388 A CN 202210260388A CN 114694215 A CN114694215 A CN 114694215A
Authority
CN
China
Prior art keywords
gender
age
face image
training
age estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210260388.3A
Other languages
English (en)
Inventor
刘弘也
苏驰
李凯
王育林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Cloud Network Technology Co Ltd
Original Assignee
Beijing Kingsoft Cloud Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Cloud Network Technology Co Ltd filed Critical Beijing Kingsoft Cloud Network Technology Co Ltd
Priority to CN202210260388.3A priority Critical patent/CN114694215A/zh
Publication of CN114694215A publication Critical patent/CN114694215A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种年龄估计模型的训练及估计方法、装置、设备及存储介质;其中,所述年龄估计模型的训练方法包括:获取训练集;其中,所述训练集包括:多张人脸图像,且每张所述人脸图像标注有年龄标签和性别标签;将每张所述人脸图像输入到预设神经网络模型中,得到每张所述人脸图像各自对应的人脸图像特征和年龄估计结果;获取与每个所述人脸图像特征各自对应的性别输出结果;基于各张人脸图像对应的所述年龄估计结果、所述性别输出结果、所述年龄标签和所述性别标签,对所述预设神经网络模型进行年龄估计准确度和性别预测准确度之间的对抗训练,得到所述年龄估计模型。本申请用以解决现有技术年龄估计模型的鲁棒性较差的问题。

Description

年龄估计模型的训练及估计方法、装置、设备及存储介质
技术领域
本申请涉及图像处理技术领域,尤其涉及一种年龄估计模型的训练及估计方法、装置、设备及存储介质。
背景技术
年龄作为一种重要的人脸属性,在人机交互、智能商务、安全监控和娱乐等领域都有着广阔的应用前景。人脸年龄估计作为一种重要的生物特征识别技术,目前已经成为模式识别和计算机视觉领域内一个热门的研究课题。人脸年龄估计问题的定义是指采用计算机视觉等技术根据输入的人脸图像自动估计出其真实年龄。虽然大量的研究者为解决年龄估计问题付出了艰辛的努力,但该问题远远没有得到解决且仍然面临着许多严峻的困难和挑战,其中性别等因素的干扰就是一个典型的例子。具体来说,男女的年龄成长模式是不同的,这大大增加了年龄估计的难度,训练得到的年龄估计模型很容易在不同性别上的表现差异巨大,导致算法鲁棒性较差。
发明内容
本申请提供了一种年龄估计模型的训练及估计方法、装置、设备及存储介质,用以解决现有技术中,年龄估计模型的鲁棒性较差的问题。
第一方面,本申请实施例提供了一种年龄估计模型的训练方法,包括:
获取训练集;其中,所述训练集包括:多张人脸图像,且每张所述人脸图像标注有年龄标签和性别标签;
将每张所述人脸图像输入到预设神经网络模型中,得到每张所述人脸图像各自对应的人脸图像特征和年龄估计结果;
获取与每个所述人脸图像特征各自对应的性别输出结果;
基于各张人脸图像对应的所述年龄估计结果、所述性别输出结果、所述年龄标签和所述性别标签,对所述预设神经网络模型进行年龄估计准确度和性别预测准确度之间的对抗训练,得到所述年龄估计模型。
可选的,所述基于各张人脸图像对应的所述年龄估计结果、所述性别输出结果、所述年龄标签和所述性别标签,对所述预设神经网络模型进行年龄估计准确度和性别预测准确度之间的对抗训练,得到所述年龄估计模型,包括:
利用每一张所述人脸图像的所述年龄估计结果、所述性别输出结果,所述年龄标签和所述性别标签,对所述预设神经网络模型进行一次训练的过程,包括:
基于所述性别输出结果和所述性别标签计算性别准确度参数值;其中,所述性别准确度参数值用于表征性别预测的准确度;
计算所述年龄估计结果与所述年龄标签的差值的绝对值,作为年龄准确度参数值;其中,所述年龄准确度参数值用于表征年龄估计的准确度;
利用所述性别准确度参数值和所述年龄准确度参数值,对所述预设神经网络模型进行对抗训练,以更新所述预设神经网络模型中的第一参数的第一参数值;
若判定所述预设神经网络模型不收敛,则按照更新所述第一参数值后的预设神经网络模型执行下一次训练过程;
否则,将更新所述第一参数值后的预设神经网络模型作为所述年龄估计模型。
可选的,所述利用所述性别准确度参数值和所述年龄准确度参数值,对所述预设神经网络模型进行对抗训练,以更新所述预设神经网络模型中的第一参数的第一参数值,包括:
计算所述年龄准确度参数值与所述性别准确度参数值之间的差值,将所述差值作为所述预设神经网络模型的损失函数;
利用所述损失函数对所述第一参数值进行更新。
可选的,所述利用所述损失函数对所述第一参数值进行更新,包括:
求所述损失函数对所述第一参数的导数,得到第一求导结果;并基于所述第一求导结果对所述第一参数的第一参数值进行更新。
可选的,所述基于所述性别输出结果和所述性别标签计算性别准确度参数值,包括:
将所述性别输出结果输入到预测函数中,得到性别预测向量;
基于所述性别预测向量和所述性别标签,计算性别分类损失函数值,将所述性别分类损失函数值作为所述性别准确度参数值。
可选的,所述基于所述性别预测向量和所述性别标签,计算性别分类损失函数值,包括:
从所述性别预测向量中,获取与所述性别标签对应的向量元素值;
对所述向量元素值取负对数,得到所述性别分类损失函数值。
可选的,所述获取与每个所述人脸图像特征各自对应的性别输出结果,包括:
通过判别器,确定每个所述人脸图像特征各自对应的性别输出结果。
可选的,所述基于所述性别输出结果和所述性别标签计算性别准确度参数值之后,还包括:
计算所述年龄准确度参数值对所述判别器中第二参数的第二导数,得到第二求导结果,并基于所述第二求导结果,对所述第二参数的第二参数值进行更新,以在下一次训练过程中,通过更新后的判别器获取所述人脸图像特征对应的性别输出结果。
可选的,所述获取训练集,包括:
获取多张人脸图像;
对于每一张所述人脸图像,获取针对所述人脸图像的年龄的至少一个标注结果,计算所述至少一个标注结果的平均值,并对所述平均值向下取整,得到取整结果;将所述取整结果作为所述人脸图像的年龄标签,并获取所述人脸图像的性别标签,得到标注好的人脸图像;
将各张所述标注好的人脸图像作为所述训练集。
第二方面,本申请实施例提供了一种年龄估计方法,包括:
获取待估计的目标人脸图像;
将所述目标人脸图像输入到预先训练好的年龄估计模型中,得到估计的目标年龄;其中,所述年龄估计模型基于第一方面所述的年龄估计模型的训练方法训练而成。
第三方面,本申请实施例提供了一种年龄估计模型的训练装置,包括:
第一获取模块,用于获取训练集;其中,所述训练集包括:多张人脸图像,且每张所述人脸图像标注有年龄标签和性别标签;
处理模块,用于将每张所述人脸图像输入到预设神经网络模型中,得到每张所述人脸图像各自对应的人脸图像特征和年龄估计结果;
第二获取模块,用于获取与每个所述人脸图像特征各自对应的性别输出结果;
训练模块,用于基于各张人脸图像对应的所述年龄估计结果、所述性别输出结果、所述年龄标签和所述性别标签,对所述预设神经网络模型进行年龄估计准确度和性别预测准确度之间的对抗训练,得到所述年龄估计模型。
第四方面,本申请实施例提供了一种年龄估计装置,包括:
第三获取模块,用于获取待估计的目标人脸图像;
估计模块,用于将所述目标人脸图像输入到预先训练好的年龄估计模型中,得到估计的目标年龄;其中,所述年龄估计模型基于第一方面所述的年龄估计模型的训练方法训练而成。
第五方面,本申请实施例提供了一种电子设备,包括:处理器、存储器和通信总线,其中,处理器和存储器通过通信总线完成相互间的通信;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器中所存储的程序,实现第一方面所述的年龄估计模型的训练方法或者第二方面所述的年龄估计方法。
第六方面,本申请实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的年龄估计模型的训练方法或者第二方面所述的年龄估计方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的该方法,获取训练集;其中,训练集包括:多张人脸图像,且每张人脸图像标注有年龄标签和性别标签;将每张人脸图像输入到预设神经网络模型中,得到每张人脸图像各自对应的人脸图像特征和年龄估计结果;获取与每个人脸图像特征各自对应的性别输出结果;基于各张人脸图像对应的年龄估计结果、性别输出结果、年龄标签和性别标签,对预设神经网络模型进行年龄估计准确度和性别预测准确度之间的对抗训练,得到年龄估计模型。在训练年龄估计模型的过程中,引入人脸图像对应的性别输出结果进行模型训练,考虑到了男女年龄模式之间的差异,提高了模型在面对不同性别时的预测鲁棒性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种年龄估计模型的训练方法的流程示意图;
图2为本申请实施例提供的训练模型的网络架构的示意图;
图3为本申请实施例提供的对所述预设神经网络模型进行训练的方法流程示意图;
图4为本申请实施例提供的一种年龄估计方法的流程示意图;
图5为本申请实施例提供的一种年龄估计模型的训练装置的结构示意图;
图6为本申请实施例提供的一种年龄估计装置的结构示意图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了解决现有技术中,年龄估计模型的鲁棒性较差的问题,本申请实施例提供了一种年龄估计模型的训练方法,如图1所示,具体包括如下步骤:
步骤101,获取训练集;其中,训练集包括:多张人脸图像,且每张人脸图像标注有年龄标签和性别标签;
在获取训练集时,可以先获取多张人脸图像,然后对每一张人脸图像进行标注,得到训练集。具体的,获取多张人脸图像;对于每一张人脸图像,获取针对人脸图像的年龄的至少一个标注结果,计算至少一个标注结果的平均值,并对平均值向下取整,得到取整结果;将取整结果作为人脸图像的年龄标签,并获取人脸图像的性别标签,得到标注好的人脸图像;将各张标注好的人脸图像作为训练集。
为了便于理解,这里举例说明,收集大量人脸图像数据,每张人脸图像用X表示,X∈RH×W×3;其中,H代表高度,W代表宽度,3代表RGB三个通道。
对每一张人脸图像X,分别获取n个人对同一张人脸图像的年龄进行标注,得到n个标注结果
Figure BDA0003549918510000071
其中,n为正整数,且每一个标注结果
Figure BDA0003549918510000072
是0到100之间的整数,分别代表0到100岁。取
Figure BDA0003549918510000073
的平均值,并对平均值向下取值,作为人脸图像X最终的年龄标注结果,即年龄标签a:
Figure BDA0003549918510000074
其中,
Figure BDA0003549918510000075
代表对*进行向下取整操作。在标注过程中,还需要标注人脸图像的性别j,其中,j∈{1,2},其中,1代表男性,2代表女性。
在具体实现时,可以将所有标注好的人脸图像分成两部分,例如:按照9:1的比例分成两部分,其中一部分作为训练集Data1,另一部分作为测试集Data2。其中,训练集Data1用于模型训练;而测试集Data2用于在模型训练好后,来验证训练模型的好坏。
步骤102,将每张人脸图像输入到预设神经网络模型中,得到每张人脸图像各自对应的人脸图像特征和年龄估计结果;
如图2所示,本申请实施例提供了一种可行的预设神经网络模型,该预设神经网络模型主要包括两部分:特征提取部分和年龄估计部分;特征提取部分可以由两个卷积块BLOCK(BLOCK1和BLOCK2)和一个全连接层FC1级联而成,其中,每个BLOCK包含卷积层和激活函数,例如:卷积层为3层,且每个卷积层采用3*3的卷积核,激活函数可以采用ReLu函数。其中,ReLu函数的全称为线性整流函数(Rectified Linear Unit,简称ReLU),又称修正线性单元,是一种人工神经网络中常用的激活函数(activation function)。年龄估计部分可以由两个全连接层(FC3和FC_a)级联而成。
在具体实现时,将每张人脸图像输入到特征提取部分,得到人脸图像特征,将人脸图像特征输入到年龄估计部分,得到年龄估计结果。
此外,还需要说明的是,本申请实施例仅示例性的给出了一种可行的预设神经网络模型,还可以采用其他结构的预设神经网络模型。而对于卷积块中卷积层的个数和大小和全连接层的个数以及大小可以根据具体应用的速度和精度需求决定,一般来说,个数越多网络整体越深,性能越好,速度则越慢。
步骤103,获取与每个人脸图像特征各自对应的性别输出结果;
具体的,可以将人脸图像特征输入到性别分类模型中,得到与人脸图像特征对应的性别输出结果
Figure BDA0003549918510000081
在具体实现时,可以选用判别器来获取到人脸图像特征各自对应的性别输出结果
Figure BDA0003549918510000082
其中,性别输出结果中包含两个元素,这两个元素分别代表该人脸图像为男性以及女性各自的概率。
在训练阶段,可以将判别器级联在特征提取部分之后,且与年龄估计部分并联,如图2所示,判别器可以由两个级联的全连接层(FC2和FC_g)实现。
预设神经网络模型的输入是一张H×W×3大小的人脸图像X,人脸图像X通过特征提取部分,也就是图中两个Block(Block1和Block2)以及一个全连接层FC1得到一个长度为c的人脸图像特征(特征向量)f∈Rc,该人脸图像特征f不仅包含了年龄信息,还包含了性别信息,不利于进行性别鲁棒的年龄估计。接下来的目的是弱化性别信息对年龄估计的影响。
将人脸图像特征f送入判别器,判别器的目的是准确地进行性别分类。具体来说,人脸图像特征f通过判别器的两个全连接层(FC2和FC_g),得到性别输出结果
Figure BDA0003549918510000083
将人脸图像特征f送入年龄估计部分,(同样包含两个全连接层FC3与FC_a),得到年龄估计结果
Figure BDA0003549918510000084
为了便于描述,将神经网络模型的特征提取部分和年龄估计部分统称为N1,判别器称作N2。在训练阶段,需要基于判别器N2输出的性别输出结果去训练N1,但是,当神经网络模型训练好后,在识别时,只用到N1。N2的目的是通过共享的人脸图像特征f尽可能准确地判断性别,而N1的目的是在极小化年龄估计误差的同时,降低N2的分类准确率,通过N1与N2之间的对抗训练,共享的人脸图像特征f中包含的性别信息被弱化,进而得到更为鲁棒的年龄估计的神经网络模型N1。
步骤104,基于各张人脸图像对应的年龄估计结果、性别输出结果、年龄标签和性别标签,对预设神经网络模型进行年龄估计准确度和性别预测准确度之间的对抗训练,得到年龄估计模型。
在本申请实施例中,获取训练集;其中,训练集包括:多张人脸图像,且每张人脸图像标注有年龄标签和性别标签;将每张人脸图像输入到预设神经网络模型中,得到每张人脸图像各自对应的人脸图像特征和年龄估计结果;获取与每个人脸图像特征各自对应的性别输出结果;基于各张人脸图像对应的年龄估计结果、性别输出结果、年龄标签和性别标签,对预设神经网络模型进行年龄估计准确度和性别预测准确度之间的对抗训练,得到年龄估计模型。在训练年龄估计模型的过程中,引入人脸图像对应的性别输出结果进行模型训练,考虑到了男女年龄模式之间的差异,提高了模型在面对不同性别时的预测鲁棒性。
在一个可选的实施例中,如图3所示,基于各张人脸图像对应的年龄估计结果、性别输出结果、年龄标签和性别标签,对预设神经网络模型进行年龄估计准确度和性别预测准确度之间的对抗训练,得到年龄估计模型,包括:
利用每一张人脸图像的年龄估计结果、性别输出结果,年龄标签和性别标签,对预设神经网络模型进行一次训练的过程,包括:
步骤301,基于性别输出结果和性别标签计算性别准确度参数值;其中,性别准确度参数值用于表征性别预测的准确度;
在上述实施例中提到可以利用判别器得到性别输出结果,在计算性别准确度参数值时,可以通过确定判别器的性别分类损失函数值来表征性别预测的准确度,即将判别器的性别分类损失函数作为性别准确度参数值。
在一个具体实施例中,可以将性别输出结果输入到预测函数中,得到性别预测向量;基于性别预测向量和性别标签,计算性别分类损失函数值,将性别分类损失函数值作为性别准确度参数值。
其中,在具体实现时,预测函数可以是归一化指数函数(softmax函数),当然也可以是其他预测函数。将性别输出结果送入softmax函数,得到性别预测向量
Figure BDA0003549918510000101
Figure BDA0003549918510000102
其中,
Figure BDA0003549918510000103
代表
Figure BDA0003549918510000104
的第j个元素,j为1或2;
Figure BDA0003549918510000105
代表
Figure BDA0003549918510000106
的第j个元素,j为1或2。m代表性别预测向量中的元素的索引,例如:
Figure BDA0003549918510000107
中有两个元素,其中,第一个元素代表男性,第二个元素代表女性,则当m=1时,
Figure BDA0003549918510000108
代表第一个元素,即男性对应的向量元素,m=2时,
Figure BDA0003549918510000109
代表第二个元素,即女性代表的向量元素。
Figure BDA00035499185100001010
代表:两个元素分别以e为底,再求和。
之后,再通过性别预测向量
Figure BDA00035499185100001011
和性别标签j∈{1,2}(例如:1代表男性,2代表女性)来计算性别分类损失函数Lgender
Figure BDA00035499185100001012
如果性别标签为1,即标注的性别为男性,则在计算性别分类损失函数时,以男性对应的元素来计算;反之,以女生对应的元素来计算。
此外,在基于性别输出结果和性别标签计算性别准确度参数值之后,还包括:
计算年龄准确度参数值对判别器中第二参数的第二导数,得到第二求导结果,并基于第二求导结果,对第二参数的第二参数值进行更新,以在下一次训练过程中,通过更新后的判别器获取人脸图像特征对应的性别输出结果。
在用判别器实现时,判别器的目的是通过人脸图像特征f尽可能准确的判别性别,即判别器的目标是极小化Lgender,通过反向传播算法求性别分类损失函数Lgender对N2所有参数W2的导数
Figure BDA0003549918510000111
(即第二求导结果),接下来通过随机梯度下降算法更新N2的各个参数:
Figure BDA0003549918510000112
其中,α是学习率,是一个预先设定的超参数,常见的取值为0.01,0.001等。
在一次训练过程中,更新一下判别器的第二参数值,使得在下一次训练的过程中,性别输出结果更加准确,保证了年龄估计模型的训练结果更加准确。
步骤302,计算年龄估计结果与年龄标签的差值的绝对值,作为年龄准确度参数值;其中,年龄准确度参数值用于表征年龄估计的准确度;
在模型训练时,可以将年龄准确度参数值作为年龄估计损失函数。通过人脸图像X的年龄估计结果
Figure BDA0003549918510000113
与年龄标签a来计算年龄估计损失函数Lage:
Figure BDA0003549918510000114
其中,|*|代表*的绝对值。
步骤303,利用性别准确度参数值和年龄准确度参数值,对预设神经网络模型进行对抗训练,以更新预设神经网络模型中的第一参数的第一参数值;
具体的,计算年龄准确度参数值与性别准确度参数值之间的差值,将差值作为预设神经网络模型的损失函数;利用损失函数对第一参数值进行更新。
利用对抗的思想进行训练,其目的是极小化年龄估计误差的同时降低N2的性别分类准确率,通过N1与N2之间的对抗训练,使得人脸图像特征f中包含的性别信息被弱化,进而得到更为鲁棒的年龄估计模型N1。
在具体实现时,在设计预设神经网络模型的损失函数时,将年龄准确度参数值与性别准确度参数值之间的差值,作为损失函数,即N1的目的是极小化年龄估计损失函数Lage,同时极大化Lgender,所以N1的损失函数为Lage与-Lgender之和:
L=-Lgender+Lage
通过反向传播算法求损失函数L对N1所有参数(即第一参数)的导数,接下来通过随机梯度下降算法更新N1的参数:
Figure BDA0003549918510000121
其中,α是学习率,是一个预先设定的超参数,常见的取值为0.01,0.001等。
步骤304,判断预设神经网络模型是否收敛,如果不收敛,则执行步骤305;否则,执行步骤306;
通常,判断模型是否收敛,可以通过比较几次训练的损失函数是不是趋于稳定,即若损失函数稳定在某个值或者某个范围内,则可认为模型收敛;否则,则判定模型不收敛。但是,在实际应用过程中,并不容易达到收敛,则还可以用训练次数来表征,若达到了预设的训练次数,也可以认为模型收敛,例如,预设的训练次数为10000次。否则,则判定模型不收敛。
步骤305,按照更新第一参数值后的预设神经网络模型执行下一次训练过程;
如果不收敛,还需要继续训练,则按照更新第一参数的第一参数值后的预设神经网络模型进行训练,以在每次训练中不断完善网络参数。
步骤306,将更新第一参数值后的预设神经网络模型作为年龄估计模型。
如果模型收敛,则可以结束训练,将当前更新第一参数值后的预设神经网络模型作为年龄估计模型。
在本申请实施例中,显式地考虑男女年龄模式之间的差异,在训练年龄估计模型(年龄估计模型)时,引入性别输出结果,并利用年龄准确度参数值和性别准确度参数值对模型进行对抗训练,具体的,为深度年龄估计模型引入一个判别器,判别器(N2)的目标是根据年龄估计模型得到的人脸图像特征来准确地识别性别,而年龄估计模型(N1)的目标是极小化年龄估计误差的同时,降低判别器的性别分类准确率,通过这样的对抗训练,可以极小化年龄估计模型提取到的人脸图像特征中包含的性别信息,提高了模型在面对不同性别时的预测鲁棒性。
利用上述方法训练好模型后,可以从测试集Data2中选择一个测试样本X,送入训练好的模型N1中,得到年龄估计结果
Figure BDA0003549918510000131
最终的预测年龄为
Figure BDA0003549918510000132
其中,
Figure BDA0003549918510000133
代表对*进行向下取整操作。
上述实施例重点介绍了在模型训练阶段的具体步骤,当模型训练好后可用于实际测试中。如图4所示,本申请实施例还提供了一种年龄估计方法,包括:
步骤401,获取待估计的目标人脸图像;
步骤402,将所述目标人脸图像输入到预先训练好的年龄估计模型中,得到估计的目标年龄;其中,所述年龄估计模型基于上述的年龄估计模型的训练方法训练而成。
本申请实施例提供的年龄估计方法,通过上述训练好的模型识别得到,能够保证模型在面对不同性别时的预测鲁棒性,因此,年龄估计结果更加准确。
基于同一构思,本申请实施例中提供了一种年龄估计模型的训练装置,该装置的具体实施可参见方法实施例部分的描述,重复之处不再赘述,如图5所示,该装置主要包括:
第一获取模块501,用于获取训练集;其中,所述训练集包括:多张人脸图像,且每张所述人脸图像标注有年龄标签和性别标签;
处理模块502,用于将每张所述人脸图像输入到预设神经网络模型中,得到每张所述人脸图像各自对应的人脸图像特征和年龄估计结果;
第二获取模块503,用于获取与每个所述人脸图像特征各自对应的性别输出结果;
训练模块504,用于基于各张人脸图像对应的所述年龄估计结果、所述性别输出结果、所述年龄标签和所述性别标签,对所述预设神经网络模型进行年龄估计准确度和性别预测准确度之间的对抗训练,得到所述年龄估计模型。
在一个具体的实施例中,训练模块504,用于基于所述性别输出结果和所述性别标签计算性别准确度参数值;其中,所述性别准确度参数值用于表征性别预测的准确度;计算所述年龄估计结果与所述年龄标签的差值的绝对值,作为年龄准确度参数值;其中,所述年龄准确度参数值用于表征年龄估计的准确;利用所述性别准确度参数值和所述年龄准确度参数值,对所述预设神经网络模型进行对抗训练,以更新所述预设神经网络模型中的第一参数的第一参数值;若判定所述预设神经网络模型不收敛,则按照更新所述第一参数值后的预设神经网络模型执行下一次训练过程;否则,将更新所述第一参数值后的预设神经网络模型作为所述年龄估计模型。
在一个具体的实施例中,训练模块504,用于计算所述年龄准确度参数值与所述性别准确度参数值之间的差值,将所述差值作为所述预设神经网络模型的损失函数;利用所述损失函数对所述第一参数值进行更新。
在一个具体的实施例中,训练模块504,用于求所述损失函数对所述第一参数的导数,得到第一求导结果;并基于所述第一求导结果对所述第一参数的第一参数值进行更新。
在一个具体的实施例中,训练模块504,用于将所述性别输出结果输入到预测函数中,得到性别预测向量;基于所述性别预测向量和所述性别标签,计算性别分类损失函数值,将所述性别分类损失函数值作为所述性别准确度参数值。
在一个具体的实施例中,训练模块504,用于从所述性别预测向量中,获取与所述性别标签对应的向量元素值;对所述向量元素值取负对数,得到所述性别分类损失函数值。
在一个具体的实施例中,训练模块504,用于通过判别器,确定每个所述人脸图像特征各自对应的性别输出结果。
在一个具体的实施例中,在本申请实施例中提供的一种年龄估计模型的训练装置中,还包括:更新模块,用于在基于所述性别输出结果和所述性别标签计算性别准确度参数值之后,计算所述年龄准确度参数值对所述判别器中第二参数的第二导数,得到第二求导结果,并基于所述第二求导结果,对所述第二参数的第二参数值进行更新,以在下一次训练过程中,通过更新后的判别器获取所述人脸图像特征对应的性别输出结果。
在一个具体的实施例中,第一获取模块501,用于获取多张人脸图像;对于每一张所述人脸图像,获取针对所述人脸图像的年龄的至少一个标注结果,计算所述至少一个标注结果的平均值,并对所述平均值向下取整,得到取整结果;将所述取整结果作为所述人脸图像的年龄标签,并获取所述人脸图像的性别标签,得到标注好的人脸图像;将各张所述标注好的人脸图像作为所述训练集。
此外,本申请实施例还提供了一种年龄估计装置,该装置的具体实施可参见方法实施例部分的描述,重复之处不再赘述,如图6所示,该装置主要包括:
第三获取模块601,用于获取待估计的目标人脸图像;
估计模块602,用于将所述目标人脸图像输入到预先训练好的年龄估计模型中,得到估计的目标年龄;其中,所述年龄估计模型基于上述的年龄估计模型的训练方法训练而成。
基于同一构思,本申请实施例中还提供了一种电子设备,如图7所示,该电子设备主要包括:处理器701、存储器702和通信总线703,其中,处理器701和存储器702通过通信总线703完成相互间的通信。其中,存储器702中存储有可被处理器701执行的程序,处理器701执行存储器702中存储的程序,实现如下步骤:
获取训练集;其中,所述训练集包括:多张人脸图像,且每张所述人脸图像标注有年龄标签和性别标签;
将每张所述人脸图像输入到预设神经网络模型中,得到每张所述人脸图像各自对应的人脸图像特征和年龄估计结果;
获取与每个所述人脸图像特征各自对应的性别输出结果;
基于各张人脸图像对应的所述年龄估计结果、所述性别输出结果、所述年龄标签和所述性别标签,对所述预设神经网络模型进行年龄估计准确度和性别预测准确度之间的对抗训练,得到所述年龄估计模型;
或者,
获取待估计的目标人脸图像;
将所述目标人脸图像输入到预先训练好的年龄估计模型中,得到估计的目标年龄;其中,所述年龄估计模型基于上述的年龄估计模型的训练方法训练而成。
上述电子设备中提到的通信总线703可以是外设部件互连标准(PeripheralComponent Interconnect,简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture,简称EISA)总线等。该通信总线703可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器702可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器701的存储装置。
上述的处理器701可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等,还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当该计算机程序在计算机上运行时,使得计算机执行上述实施例中所描述的一种年龄估计模型的训练方法或一种年龄估计方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、微波等)方式向另外一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如DVD)或者半导体介质(例如固态硬盘)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (14)

1.一种年龄估计模型的训练方法,其特征在于,包括:
获取训练集;其中,所述训练集包括:多张人脸图像,且每张所述人脸图像标注有年龄标签和性别标签;
将每张所述人脸图像输入到预设神经网络模型中,得到每张所述人脸图像各自对应的人脸图像特征和年龄估计结果;
获取与每个所述人脸图像特征各自对应的性别输出结果;
基于各张人脸图像对应的所述年龄估计结果、所述性别输出结果、所述年龄标签和所述性别标签,对所述预设神经网络模型进行年龄估计准确度和性别预测准确度之间的对抗训练,得到所述年龄估计模型。
2.根据权利要求1所述的年龄估计模型的训练方法,其特征在于,所述基于各张人脸图像对应的所述年龄估计结果、所述性别输出结果、所述年龄标签和所述性别标签,对所述预设神经网络模型进行年龄估计准确度和性别预测准确度之间的对抗训练,得到所述年龄估计模型,包括:
利用每一张所述人脸图像的所述年龄估计结果、所述性别输出结果,所述年龄标签和所述性别标签,对所述预设神经网络模型进行一次训练的过程,包括:
基于所述性别输出结果和所述性别标签计算性别准确度参数值;其中,所述性别准确度参数值用于表征性别预测的准确度;
计算所述年龄估计结果与所述年龄标签的差值的绝对值,作为年龄准确度参数值;其中,所述年龄准确度参数值用于表征年龄估计的准确度;
利用所述性别准确度参数值和所述年龄准确度参数值,对所述预设神经网络模型进行对抗训练,以更新所述预设神经网络模型中的第一参数的第一参数值;
若判定所述预设神经网络模型不收敛,则按照更新所述第一参数值后的预设神经网络模型执行下一次训练过程;
否则,将更新所述第一参数值后的预设神经网络模型作为所述年龄估计模型。
3.根据权利要求2所述的年龄估计模型的训练方法,其特征在于,所述利用所述性别准确度参数值和所述年龄准确度参数值,对所述预设神经网络模型进行对抗训练,以更新所述预设神经网络模型中的第一参数的第一参数值,包括:
计算所述年龄准确度参数值与所述性别准确度参数值之间的差值,将所述差值作为所述预设神经网络模型的损失函数;
利用所述损失函数对所述第一参数值进行更新。
4.根据权利要求3所述的年龄估计模型的训练方法,其特征在于,所述利用所述损失函数对所述第一参数值进行更新,包括:
求所述损失函数对所述第一参数的导数,得到第一求导结果;并基于所述第一求导结果对所述第一参数的第一参数值进行更新。
5.根据权利要求2所述的年龄估计模型的训练方法,其特征在于,所述基于所述性别输出结果和所述性别标签计算性别准确度参数值,包括:
将所述性别输出结果输入到预测函数中,得到性别预测向量;
基于所述性别预测向量和所述性别标签,计算性别分类损失函数值,将所述性别分类损失函数值作为所述性别准确度参数值。
6.根据权利要求5所述的年龄估计模型的训练方法,其特征在于,所述基于所述性别预测向量和所述性别标签,计算性别分类损失函数值,包括:
从所述性别预测向量中,获取与所述性别标签对应的向量元素值;
对所述向量元素值取负对数,得到所述性别分类损失函数值。
7.根据权利要求2~6任意一项所述的年龄估计模型的训练方法,其特征在于,所述获取与每个所述人脸图像特征各自对应的性别输出结果,包括:
通过判别器,确定每个所述人脸图像特征各自对应的性别输出结果。
8.根据权利要求7所述的年龄估计模型的训练方法,其特征在于,所述基于所述性别输出结果和所述性别标签计算性别准确度参数值之后,还包括:
计算所述年龄准确度参数值对所述判别器中第二参数的第二导数,得到第二求导结果,并基于所述第二求导结果,对所述第二参数的第二参数值进行更新,以在下一次训练过程中,通过更新后的判别器获取所述人脸图像特征对应的性别输出结果。
9.根据权利要求1所述的年龄估计模型的训练方法,其特征在于,所述获取训练集,包括:
获取多张人脸图像;
对于每一张所述人脸图像,获取针对所述人脸图像的年龄的至少一个标注结果,计算所述至少一个标注结果的平均值,并对所述平均值向下取整,得到取整结果;将所述取整结果作为所述人脸图像的年龄标签,并获取所述人脸图像的性别标签,得到标注好的人脸图像;
将各张所述标注好的人脸图像作为所述训练集。
10.一种年龄估计方法,其特征在于,包括:
获取待估计的目标人脸图像;
将所述目标人脸图像输入到预先训练好的年龄估计模型中,得到估计的目标年龄;其中,所述年龄估计模型基于权利要求1~9任意一项所述的年龄估计模型的训练方法训练而成。
11.一种年龄估计模型的训练装置,其特征在于,包括:
第一获取模块,用于获取训练集;其中,所述训练集包括:多张人脸图像,且每张所述人脸图像标注有年龄标签和性别标签;
处理模块,用于将每张所述人脸图像输入到预设神经网络模型中,得到每张所述人脸图像各自对应的人脸图像特征和年龄估计结果;
第二获取模块,用于获取与每个所述人脸图像特征各自对应的性别输出结果;
训练模块,用于基于各张人脸图像对应的所述年龄估计结果、所述性别输出结果、所述年龄标签和所述性别标签,对所述预设神经网络模型进行年龄估计准确度和性别预测准确度之间的对抗训练,得到所述年龄估计模型。
12.一种年龄估计装置,其特征在于,包括:
第三获取模块,用于获取待估计的目标人脸图像;
估计模块,用于将所述目标人脸图像输入到预先训练好的年龄估计模型中,得到估计的目标年龄;其中,所述年龄估计模型基于权利要求1~9任意一项所述的年龄估计模型的训练方法训练而成。
13.一种电子设备,其特征在于,包括:处理器、存储器和通信总线,其中,处理器和存储器通过通信总线完成相互间的通信;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器中所存储的程序,实现权利要求1~9任意一项所述的年龄估计模型的训练方法或者权利要求10所述的年龄估计方法。
14.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~9任意一项所述的年龄估计模型的训练方法或者权利要求10所述的年龄估计方法。
CN202210260388.3A 2022-03-16 2022-03-16 年龄估计模型的训练及估计方法、装置、设备及存储介质 Pending CN114694215A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210260388.3A CN114694215A (zh) 2022-03-16 2022-03-16 年龄估计模型的训练及估计方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210260388.3A CN114694215A (zh) 2022-03-16 2022-03-16 年龄估计模型的训练及估计方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114694215A true CN114694215A (zh) 2022-07-01

Family

ID=82138329

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210260388.3A Pending CN114694215A (zh) 2022-03-16 2022-03-16 年龄估计模型的训练及估计方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114694215A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114998978A (zh) * 2022-07-29 2022-09-02 杭州魔点科技有限公司 一种人脸图像质量分析的方法和系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114998978A (zh) * 2022-07-29 2022-09-02 杭州魔点科技有限公司 一种人脸图像质量分析的方法和系统

Similar Documents

Publication Publication Date Title
CN108280477B (zh) 用于聚类图像的方法和装置
CN109583332B (zh) 人脸识别方法、人脸识别系统、介质及电子设备
CN111126574B (zh) 基于内镜图像对机器学习模型进行训练的方法、装置和存储介质
US20200134506A1 (en) Model training method, data identification method and data identification device
EP3968179A1 (en) Place recognition method and apparatus, model training method and apparatus for place recognition, and electronic device
CN110276406B (zh) 表情分类方法、装置、计算机设备及存储介质
CN109145245A (zh) 预测点击率的方法、装置、计算机设备及存储介质
WO2022022233A1 (zh) Ai模型更新的方法、装置、计算设备和存储介质
CN112784778B (zh) 生成模型并识别年龄和性别的方法、装置、设备和介质
CN114694215A (zh) 年龄估计模型的训练及估计方法、装置、设备及存储介质
CN113191478A (zh) 神经网络模型的训练方法、装置和系统
CN111161238A (zh) 图像质量评价方法及装置、电子设备、存储介质
CN115982597A (zh) 语义相似度模型训练方法及装置、语义匹配方法及装置
CN112861962B (zh) 样本处理方法、装置、电子设备和存储介质
CN115631008B (zh) 商品推荐方法、装置、设备及介质
CN114639044A (zh) 标签确定方法、装置、电子设备及存储介质
CN111611981A (zh) 信息识别方法和装置及信息识别神经网络训练方法和装置
CN113255701A (zh) 一种基于绝对-相对学习架构的小样本学习方法和系统
CN115062783B (zh) 实体对齐方法及相关装置、电子设备、存储介质
CN112529038B (zh) 一种主板物料的识别方法、装置及存储介质
CN116071628B (zh) 图像处理方法、装置、电子设备和存储介质
CN112115996B (zh) 图像数据的处理方法、装置、设备及存储介质
CN114241411B (zh) 基于目标检测的计数模型处理方法、装置及计算机设备
CN114998607B (zh) 超声图像的特征提取方法、装置、电子设备及存储介质
CN114694216A (zh) 神经网络模型的训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination