CN111104874A - 人脸年龄预测方法及模型的训练方法、装置及电子设备 - Google Patents
人脸年龄预测方法及模型的训练方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111104874A CN111104874A CN201911222270.6A CN201911222270A CN111104874A CN 111104874 A CN111104874 A CN 111104874A CN 201911222270 A CN201911222270 A CN 201911222270A CN 111104874 A CN111104874 A CN 111104874A
- Authority
- CN
- China
- Prior art keywords
- network
- parameter
- face age
- age prediction
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 147
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000004927 fusion Effects 0.000 claims abstract description 40
- 238000004422 calculation algorithm Methods 0.000 claims description 40
- 230000006870 function Effects 0.000 claims description 32
- 238000009826 distribution Methods 0.000 claims description 26
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000010606 normalization Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 17
- 238000003860 storage Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/178—Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供一种人脸年龄预测模型的训练方法、装置及电子设备。该方法包括:获取训练样本集和预设的初始模型;利用训练样本集训练共享网络和性别分类网络,直至共享网络的第一参数和性别分类网络的第二参数收敛;利用男性集训练收敛的共享网络和男性人脸年龄预测网络,直至男性人脸年龄预测网络的第三参数收敛;利用女性集训练收敛的共享网络和女性人脸年龄预测网络,直至女性人脸年龄预测网络的第四参数收敛;根据收敛的共享网络,收敛的性别分类网络,收敛的男性人脸年龄预测网络和收敛的女性人脸年龄预测网络,以及结果融合网络,得到人脸年龄预测模型。根据本发明实施例,可以消除性别因素对人脸年龄预测任务带来的干扰。
Description
技术领域
本发明涉及计算机识别技术领域,更具体地,涉及一种人脸年龄预测模型的训练方法、一种人脸年龄预测方法、一种人脸年龄预测模型的训练装置、一种人脸年龄预测装置以及一种电子设备。
背景技术
年龄作为一种重要的人脸属性,在人机交互、智能商务、安全监控以及娱乐等领域都有着广阔的应用前景。自动人脸年龄预测技术是一项重要的生物特征识别技术,其采用计算机视觉等技术,可以根据输入的脸部图像自动预测出人脸的真实年龄。
现有的基于深度学习的人脸年龄预测算法通常直接训练一个卷积神经网络,建立输入的脸部图像和年龄之间的映射,从而实现较高精度的人脸年龄预测。但由于不同性别的脸部图像在相同年龄的样本具有不同的年龄模式,从而导致训练得到的人脸年龄预测模型的泛化能力比较差。
因此,有必要提供一种新的人脸年龄预测方法来消除性别因素对人脸年龄预测的干扰。
发明内容
本发明实施例的一个目的是提供一种用于人脸年龄预测模型的训练的新的技术方案。
根据本发明的第一方面,提供了一种人脸年龄预测模型的训练方法,所述方法包括:
获取训练样本集和预设的初始模型;其中,所述训练样本集包括男性集和女性集,所述男性集包括多个男性脸部图像和与每个男性脸部图像对应的标签,所述女性集包括多个女性脸部图像和与每个女性脸部图像对应的标签,所述标签包括年龄值和性别值;所述初始模型包括共享网络、性别分类网络、男性人脸年龄预测网络、女性人脸年龄预测网络和结果融合网络;
利用所述训练样本集训练共享网络和性别分类网络,直至所述共享网络的第一参数和所述性别分类网络的第二参数收敛;
利用所述男性集训练收敛的共享网络和男性人脸年龄预测网络,直至所述男性人脸年龄预测网络的第三参数收敛;
利用所述女性集训练收敛的共享网络和女性人脸年龄预测网络,直至所述女性人脸年龄预测网络的第四参数收敛;
根据收敛的共享网络,收敛的性别分类网络,收敛的男性人脸年龄预测网络和收敛的女性人脸年龄预测网络,以及结果融合网络,得到人脸年龄预测模型。
可选地,所述方法还包括:
利用所述训练样本集训练所述人脸年龄预测模型,对所述第一参数、第二参数、第三参数以及第四参数进行更新直至收敛,得到收敛的人脸年龄预测模型。
可选地,所述利用所述训练样本集训练共享网络和性别分类网络,直至所述共享网络的第一参数和所述性别分类网络的第二参数收敛,包括:
基于所述共享网络及所述性别分类网络对所述训练样本集中的样本进行计算,得到每个样本对应的概率分布向量;
将所述概率分布向量代入预设的损失函数进行计算,得到所述训练样本集中每个样本的分类损失;
基于所述分类损失对所述共享网络的第一参数和所述性别分类网络的第二参数进行更新,得到收敛的共享网络和收敛的性别分类网络。
可选地,所述基于所述共享网络及所述性别分类网络对所述训练样本集中的样本进行预测,得到所述训练样本集中每个样本对应的预测结果,包括:
从所述训练样本集中选取一个样本输入所述共享网络及所述性别分类网络,得到第一输出结果;
将所述第一输出结果输入归一化函数,得到所述概率分布向量。
可选地,所述基于所述分类损失对所述共享网络的第一参数和所述性别分类网络的第二参数进行更新,得到收敛的共享网络和收敛的性别分类网络,包括:
基于所述分类损失和预设的反向传播算法计算所述共享网络中第一参数的第一导数,以及所述性别分类网络中第二参数的第二导数;
基于所述第一导数和梯度下降算法对所述共享网络中的所述第一参数进行更新,并基于所述第二导数和梯度下降算法对所述性别分类网络中的所述第二参数进行更新;
基于所述训练样本集中多个样本的分类损失对所述共享网络中的第一参数以及所述性别分类网络中的第二参数进行多次更新,直到收敛,得到收敛的共享网络和收敛的性别分类网络。
可选地,所述利用男性集训练收敛的共享网络和男性人脸年龄预测网络,直至所述男性人脸年龄预测网络的第三参数收敛,包括:
基于所述收敛的共享网络和所述男性人脸年龄预测网络对所述男性集中的每个样本进行预测,得到第一预测结果;
将所述第一预测结果代入预设的人脸年龄预测损失函数进行计算,得到每个样本的第一损失;
基于所述第一损失对所述男性人脸年龄预测网络的第三参数进行更新,直至所述第三参数收敛。
可选地,所述利用女性集训练收敛的共享网络和女性人脸年龄预测网络,直至所述女性人脸年龄预测网络的第四参数收敛,包括:
基于所述收敛的共享网络和所述女性人脸年龄预测网络对所述女性集中的每个样本进行预测,得到第二预测结果;
将所述第二预测结果代入预设的人脸年龄预测损失函数进行计算,得到每个样本的第二损失;
基于所述第二损失对所述女性人脸年龄预测网络的第四参数进行更新,直至所述第四参数收敛。
可选地,所述基于所述第一损失对所述男性人脸年龄预测网络的第三参数进行更新,直至所述第三参数收敛,包括:
基于所述第一损失和预设的反向传播算法计算所述第三参数的第三导数;
基于所述第三导数和梯度下降算法对所述男性人脸年龄预测网络中的第三参数进行更新;
基于所述男性集中多个样本的第一损失对所述男性人脸年龄预测网络中的第三参数进行多次更新,直到收敛,得到收敛的男性人脸年龄预测网络。
可选地,所述基于所述第二损失对所述女性人脸年龄预测网络的第四参数进行更新,直至所述第四参数收敛。
基于所述第二损失和预设的反向传播算法计算所述第四参数的第四导数;
基于所述第四导数和梯度下降算法对所述女性人脸年龄预测网络中的第四参数进行更新;
基于所述女性集中多个样本的第二损失对所述女性人脸年龄预测网络中的第四参数进行多次更新,直到收敛,得到收敛的女性人脸年龄预测网络。
可选地,所述利用所述训练样本集训练所述人脸年龄预测模型,对所述第一参数、第二参数、第三参数以及第四参数进行更新直至收敛,得到收敛的人脸年龄预测模型,包括:
基于所述人脸年龄预测模型对所述训练样本集中的样本进行预测,得到每个所述样本对应的概率分布向量、第一预测结果和第二预测结果;
将所述概率分布向量、所述第一预测结果和所述第二预测结果输入所述结果融合网络,得到第三预测结果;
将所述第三预测结果代入预设的人脸年龄预测损失函数进行计算,到每个样本的第三损失;
基于所述训练样本集中多个样本的第三损失对所述人脸年龄预测模型的第一参数、第二参数、第三参数和第四参数进行多次更新,直到收敛,得到收敛的人脸年龄预测模型。
根据本发明实施例的第二方面,还提供一种人脸年龄预测方法,所述方法包括:
获取待预测图像;
将所述待预测图像输入人脸年龄预测模型中,输出预测结果;其中,所述人脸年龄预测模型包括共享网络、性别分类网络、男性人脸年龄预测网络、女性人脸年龄预测网络和结果融合网络;
所述共享网络,用于对待预测图像进行特征提取,输出图像特征;
所述性别分类网络,用于根据所述图像特征对待预测图像进行性别识别,输出性别概率;
所述男性人脸年龄预测网络,用于根据所述图像特征对待预测图像进行年龄预测,输出第一预测结果;
所述女性人脸年龄预测网络,用于根据所述图像特征对待预测图像进行年龄预测,输出第二预测结果;
所述结果融合网络,用于根据所述性别概率对所述第一预测结果和第二预测结果进行加权平均计算,得到所述预测结果。
可选地,所述结果融合网络,用于根据所述性别概率对所述第一预测结果和第二预测结果进行加权平均计算,得到所述预测结果,包括:
所述结果融合网络,用于将计算得到的所述性别概率中的男性概率与所述第一预测结果的乘积与所述性别概率中的女性概率与所述第二预测结果的乘积之和作为所述预测结果。
根据本发明实施例的第三方面,还提供一种人脸年龄预测模型的训练装置,所述装置包括:
获取模块,用于获取训练样本集和预设的初始模型;其中,所述训练样本集包括男性集和女性集,所述男性集包括多个男性脸部图像和与每个男性脸部图像对应的标签,所述女性集包括多个女性脸部图像和与每个女性脸部图像对应的标签,所述标签包括年龄值和性别值;所述初始模型包括共享网络、性别分类网络、男性人脸年龄预测网络、女性人脸年龄预测网络和结果融合网络;
模型训练模块,用于利用所述训练样本集训练共享网络和性别分类网络,直至所述共享网络的第一参数和所述性别分类网络的第二参数收敛;利用所述男性集训练收敛的共享网络和男性人脸年龄预测网络,直至所述男性人脸年龄预测网络的第三参数收敛;利用所述女性集训练收敛的共享网络和女性人脸年龄预测网络,直至所述女性人脸年龄预测网络的第四参数收敛;根据收敛的共享网络,收敛的性别分类网络,收敛的男性人脸年龄预测网络和收敛的女性人脸年龄预测网络,以及结果融合网络,得到人脸年龄预测模型。
根据本发明实施例的第四方面,还提供一种人脸年龄预测装置,所述装置包括:
获取模块,用于获取待预测图像;
预测模块,用于将所述待预测图像输入人脸年龄预测模型中,输出预测结果;其中,所述人脸年龄预测模型包括共享网络、性别分类网络、男性人脸年龄预测网络、女性人脸年龄预测网络和结果融合网络;
所述共享网络,用于对待预测图像进行特征提取,输出图像特征;
所述性别分类网络,用于根据所述图像特征对待预测图像进行性别识别,输出性别概率;
所述男性人脸年龄预测网络,用于根据所述图像特征对待预测图像进行年龄预测,输出第一预测结果;
所述女性人脸年龄预测网络,用于根据所述图像特征对待预测图像进行年龄预测,输出第二预测结果;
所述结果融合网络,用于根据所述性别概率对所述第一预测结果和第二预测结果进行加权平均计算,得到所述预测结果。
根据本发明实施例的第五方面,还提供一种电子设备,包括处理器和存储器;所述存储器存储有能够被所述处理器执行的机器可执行指令;所述处理器执行所述机器可执行指令以实现本发明实施例第一方面中任一项所述的人脸年龄预测模型的训练方法。
根据本发明实施例的第六方面,还提供一种电子设备,包括处理器和存储器;所述存储器存储有能够被所述处理器执行的机器可执行指令;所述处理器执行所述机器可执行指令以实现本发明实施例第二方面中任一项所述的人脸年龄预测方法。
根据本发明的一个实施例,可以消除性别因素对人脸年龄预测任务带来的干扰,从而提升人脸年龄预测模型的泛化能力,提升人脸年龄预测的准确率。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1为可以应用根据本发明实施例的人脸年龄预测模型的训练方法的一种电子设备的结构示意图;
图2是根据本发明实施例的人脸年龄预测模型的网络架构示意图;
图3是根据本发明实施例的人脸年龄预测模型的训练方法的流程示意图;
图4是根据本发明实施例的人脸年龄预测模型的训练装置的结构示意图;
图5根据本发明第一实施例的电子设备的原理框图;
图6是根据本发明实施例的人脸年龄预测方法的流程示意图;
图7是根据本发明实施例的人脸年龄预测装置的结构示意图;
图8根据本发明第二实施例的电子设备的原理框图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人物已知的技术、方法和设备可能不作详细讨论,但在适当情况下,该技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<硬件配置>
图1为可以应用根据本发明实施例的人脸年龄预测模型的训练方法的电子设备的组成结构示意图。
如图1所示,本实施例的电子设备1000可以包括处理器1010、存储器1020、接口装置1030、通信装置1040、显示装置1050、输入装置1060、扬声器1070、麦克风1080,等等。
其中,处理器1010可以是中央处理器CPU、微处理器MCU等。存储器1020例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1030例如包括USB接口、耳机接口等。通信装置1040例如能够进行有线或无线通信。显示装置1050例如是液晶显示屏、触摸显示屏等。输入装置1060例如可以包括触摸屏、键盘等。
电子设备1000可以通过扬声器1070输出音频信息。电子设备1000可以通过麦克风1080拾取用户输入的语音信息。
电子设备1000可以是智能手机、便携式电脑、台式计算机、平板电脑等设备。
本实施例中,电子设备1000可以获取训练样本集和预设的初始模型;利用所述训练样本集训练共享网络和性别分类网络,直至所述共享网络的第一参数和所述性别分类网络的第二参数收敛;利用所述男性集训练收敛的共享网络和男性人脸年龄预测网络,直至所述男性人脸年龄预测网络的第三参数收敛;利用所述女性集训练收敛的共享网络和女性人脸年龄预测网络,直至所述女性人脸年龄预测网络的第四参数收敛;根据收敛的共享网络,收敛的性别分类网络,收敛的男性人脸年龄预测网络和收敛的女性人脸年龄预测网络,以及结果融合网络,得到人脸年龄预测模型。
在本实施例中,电子设备1000的存储器1020用于存储指令,该指令用于控制该处理器1010进行操作以支持实现根据本说明书任意实施例的人脸年龄预测模型的训练方法。
本领域技术人员应当理解,尽管在图1中示出了电子设备1000的多个装置,但是,本说明书实施例的电子设备1000可以仅涉及其中的部分装置,例如,只涉及处理器1010、存储器1020、显示装置1050、输入装置1060等。
技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
<第一实施例>
<方法>
本实施例提供了一种人脸年龄预测模型的训练方法,该方法例如可以由电子设备实施,该电子设备可以是如图1所示的电子设备1000。
如图2所示,在本实施例中,人脸年龄预测模型Net的网络架构可以包括共享网络、性别分类网络、男性人脸年龄预测网络、女性人脸年龄预测网络以及结果融合网络。首先由性别分类网络来判断输入的脸部图像的性别,男性人脸年龄预测网络和女性人脸年龄预测网络分别对该脸部图像的年龄进行预测,最后,由结果融合网络将性别分类网络、男性人脸年龄预测网络和女性人脸年龄预测网络的输出结果进行融合,得出最终的人脸年龄预测结果。
其中,该人脸年龄预测模型Net输入的脸部图像可以是224×224的图像。共享网络可以由一系列的“卷积+批归一化+激活函数”组成。性别分类网络可以由一系列的“卷积+批归一化+激活函数”、全局平均池化层和全连接层组成。男性人脸年龄预测网络和女性人脸年龄预测网络可以由一系列的“卷积+批归一化+激活函数”、全局平均池化层和全连接层组成。结果融合网络将性别分类网络、男性人脸年龄预测网络和女性人脸年龄预测网络的输出结果进行融合,得出最终的人脸年龄预测结果。这样,可以消除性别因素对人脸年龄预测任务带来的干扰。
具体的,如图3所示,该方法包括以下步骤3100~3500:
步骤3100,获取训练样本集和预设的初始模型。
其中,所述训练样本集包括男性集和女性集,所述男性集包括多个男性脸部图像和与每个男性脸部图像对应的标签,所述女性集包括多个女性脸部图像和与每个女性脸部图像对应的标签,所述标签包括年龄值和性别值;所述初始模型包括共享网络、性别分类网络、男性人脸年龄预测网络、女性人脸年龄预测网络和结果融合网络。
本步骤中,该电子设备1000在获取训练样本集时,具体的,获取多张脸部图像N为该脸部图像的数量,Xi表示第i张该脸部图像。对该脸部图像Xi的年龄值和性别值分别进行标注,得到该训练样本集其中,ai表示该脸部图像Xi的年龄值,gi表示该脸部图像Xi的性别值。
在一个例子中,对于每一张脸部图像Xi,可以雇佣n个标注人员对年龄值和性别值进行标注,得到年龄值的n个标注结果其中,每个标注是0到100之间的整数,分别代表0到100岁。取的平均ai作为Xi最终的年龄值的标注结果:标注Xi的性别值gi∈{男性,女性},得到最终的训练样本集
在获取到训练样本集和预设的初始模型后,进入步骤3200:
在步骤3200,利用该训练样本集训练共享网络和性别分类网络,直至该共享网络的第一参数和该性别分类网络的第二参数收敛。
本步骤中,该电子设备1000在利用该训练样本集训练共享网络和性别分类网络时,可以基于所述共享网络及所述性别分类网络对所述训练样本集中的样本进行计算,得到每个样本对应的概率分布向量。
具体的,该电子设备1000可以从所述训练样本集中选取一个样本输入所述共享网络及所述性别分类网络,得到第一输出结果,然后将所述第一输出结果输入归一化函数,得到所述概率分布向量。
例如,分别随机初始化该共享网络的第一参数W1,以及该性别分类网络的第二参数W2。然后,该电子设备1000将该训练样本集D中的样本Xi输入该共享网络及该性别分类网络,得到第一输出结果zi∈R2。将zi输入归一化函数softmax函数中,得到概率分布向量其中,表示pi的第j个元素,表示zi的第j个元素。
在得到分类损失后,该电子设备1000基于所述分类损失对所述共享网络的第一参数和所述性别分类网络的第二参数进行更新,得到收敛的共享网络和收敛的性别分类网络。
具体的,该电子设备1000可以基于所述分类损失和预设的反向传播算法计算所述共享网络中第一参数的第一导数,以及所述性别分类网络中第二参数的第二导数;基于所述第一导数和梯度下降算法对所述共享网络中的所述第一参数进行更新,并基于所述第二导数和梯度下降算法对所述性别分类网络中的所述第二参数进行更新;基于所述训练样本集中多个样本的分类损失对所述共享网络中的第一参数以及所述性别分类网络中的第二参数进行多次更新,直到收敛,得到收敛的共享网络和收敛的性别分类网络。
例如,该电子设备1000基于分类损失L和预设的反向传播算法计算该第一参数W1的第一导数并计算得到该第二参数W2的第二导数然后基于第一导数和随机梯度下降算法对该共享网络中的第一参数进行更新;并基于第二导数和该随机梯度下降算法对该性别分类网络中的第二参数进行更新。
该电子设备1000不断迭代地对该第一参数W1和该第二参数W2进行更新,直至收敛,得到收敛的共享网络和收敛的性别分类网络。然后进入步骤3300:
在步骤3300,利用男性集训练收敛的共享网络和男性人脸年龄预测网络,直至该男性人脸年龄预测网络的第三参数收敛。
本步骤中,共享网络的第一参数W1已固定,该电子设备1000随机初始化男性人脸年龄预测网络的第三参数W3。
具体的,该电子设备1000可以基于所述收敛的共享网络和所述男性人脸年龄预测网络对所述男性集中的每个样本进行预测,得到第一预测结果;将所述第一预测结果代入预设的人脸年龄预测损失函数进行计算,得到每个样本的第一损失;基于所述第一损失对所述男性人脸年龄预测网络的第三参数进行更新,直至所述第三参数收敛。
其中,该电子设备1000在基于所述第一损失对所述男性人脸年龄预测网络的第三参数进行更新时,可以基于所述第一损失和预设的反向传播算法计算所述第三参数的第三导数;基于所述第三导数和梯度下降算法对所述男性人脸年龄预测网络中的第三参数进行更新;基于所述男性集中多个样本的第一损失对所述男性人脸年龄预测网络中的第三参数进行多次更新,直到收敛,得到收敛的男性人脸年龄预测网络。
例如,该电子设备1000基于所述收敛的共享网络和所述男性人脸年龄预测网络对所述男性集D1中的每个样本进行预测,得到第一预测结果将该第一预测结果代入预设的人脸年龄预测损失函数进行计算,得到每个样本的第一损失L1;其中,ai表示该样本的年龄值。
然后,该电子设备1000基于该第一损失L1和预设的反向传播算法计算所述第三参数W3的第三导数并基于所述第三导数和随机梯度下降算法对所述男性人脸年龄预测网络中的第三参数进行更新。最后,该电子设备1000基于所述男性集中多个样本的第一损失对所述男性人脸年龄预测网络中的第三参数进行多次更新,直到收敛,得到收敛的男性人脸年龄预测网络。
步骤3400,利用女性集训练收敛的共享网络和女性人脸年龄预测网络,直至该女性人脸年龄预测网络的第四参数收敛。
本步骤中,共享网络的第一参数W1已固定,该电子设备1000随机初始化女性人脸年龄预测网络的第四参数W4。
具体的,该电子设备1000可以基于所述收敛的共享网络和所述女性人脸年龄预测网络对所述女性集中的每个样本进行预测,得到第二预测结果;将所述第二预测结果代入预设的人脸年龄预测损失函数进行计算,得到每个样本的第二损失;基于所述第二损失对所述女性人脸年龄预测网络的第四参数进行更新,直至所述第四参数收敛。
其中,该电子设备1000在基于所述第二损失对所述女性人脸年龄预测网络的第四参数进行更新时,可以基于所述第二损失和预设的反向传播算法计算所述第四参数的第四导数;基于所述第四导数和梯度下降算法对所述女性人脸年龄预测网络中的第四参数进行更新;基于所述女性集中多个样本的第二损失对所述女性人脸年龄预测网络中的第四参数进行多次更新,直到收敛,得到收敛的女性人脸年龄预测网络。
例如,该电子设备1000基于所述收敛的共享网络和所述女性人脸年龄预测网络对所述女性集D2中的每个样本进行预测,得到第二预测结果将该第二预测结果代入预设的人脸年龄预测损失函数进行计算,得到每个样本的第二损失L2;其中,ai表示该样本的年龄值。
然后,该电子设备1000基于第二损失L2和预设的反向传播算法计算所述第四参数W4的第四导数并基于所述第四导数和随机梯度下降算法对所述女性人脸年龄预测网络中的第四参数进行更新。最后,该电子设备1000基于所述女性集中多个样本的第二损失对所述女性人脸年龄预测网络中的第四参数进行多次更新,直到收敛,得到收敛的女性人脸年龄预测网络。
步骤3500,根据收敛的共享网络,收敛的性别分类网络,收敛的男性人脸年龄预测网络和收敛的女性人脸年龄预测网络,以及结果融合网络,得到人脸年龄预测模型。
在实际应用中,该电子设备1000在得到人脸年龄预测模型后,还可以对第一参数W1、第二参数W2、第三参数W3和第四参数W4进行微调。即,该电子设备1000可以利用该训练样本集训练该人脸年龄预测模型,对该第一参数、第二参数、第三参数以及第四参数进行更新直至收敛,得到收敛的人脸年龄预测模型。
具体的,该电子设备1000可以基于所述人脸年龄预测模型对所述训练样本集中的样本进行预测,得到每个所述样本对应的概率分布向量、第一预测结果和第二预测结果;将所述概率分布向量、所述第一预测结果和所述第二预测结果输入所述结果融合网络,得到第三预测结果;将所述第三预测结果代入预设的人脸年龄预测损失函数进行计算,到每个样本的第三损失;基于所述训练样本集中多个样本的第三损失对所述人脸年龄预测模型的第一参数、第二参数、第三参数和第四参数进行多次更新,直到收敛,得到收敛的人脸年龄预测模型。
该电子设备1000通过不断迭代地对该第一参数W1,该第二参数W2,该第三参数W3以及该第四参数W4进行更新,直至收敛,得到该收敛的人脸年龄预测模型。
以上已结合附图和例子对本实施例的人脸年龄预测模型的训练方法进行了说明。本实施例的方法通过获取训练样本集和预设的初始模型;利用训练样本集训练共享网络和性别分类网络,直至共享网络的第一参数和性别分类网络的第二参数收敛;利用男性集训练收敛的共享网络和男性人脸年龄预测网络,直至男性人脸年龄预测网络的第三参数收敛;利用女性集训练收敛的共享网络和女性人脸年龄预测网络,直至女性人脸年龄预测网络的第四参数收敛;根据收敛的共享网络,收敛的性别分类网络,收敛的男性人脸年龄预测网络和收敛的女性人脸年龄预测网络,以及结果融合网络,得到人脸年龄预测模型。根据本实施例的方法训练的人脸年龄预测模型消除了性别因素对人脸年龄预测任务带来的干扰,从而提升人脸年龄预测模型的泛化能力,提升人脸年龄预测的准确率。
<装置>
本实施例提供一种人脸年龄预测模型的训练装置,该装置例如是图4所示的人脸年龄预测模型的训练装置4000。
如图4所示,该人脸年龄预测模型的训练装置4000可以包括获取模块4100,模型训练模块4200。
其中,获取模块4100用于获取训练样本集和预设的初始模型;其中,所述训练样本集包括男性集和女性集,所述男性集包括多个男性脸部图像和与每个男性脸部图像对应的标签,所述女性集包括多个女性脸部图像和与每个女性脸部图像对应的标签,所述标签包括年龄值和性别值;所述初始模型包括共享网络、性别分类网络、男性人脸年龄预测网络、女性人脸年龄预测网络和结果融合网络.
模型训练模块4200用于利用所述训练样本集训练共享网络和性别分类网络,直至所述共享网络的第一参数和所述性别分类网络的第二参数收敛;利用所述男性集训练收敛的共享网络和男性人脸年龄预测网络,直至所述男性人脸年龄预测网络的第三参数收敛;利用所述女性集训练收敛的共享网络和女性人脸年龄预测网络,直至所述女性人脸年龄预测网络的第四参数收敛;根据收敛的共享网络,收敛的性别分类网络,收敛的男性人脸年龄预测网络和收敛的女性人脸年龄预测网络,以及结果融合网络,得到人脸年龄预测模型。
进一步地,所述模型训练模块4200还可以用于:利用所述训练样本集训练所述人脸年龄预测模型,对所述第一参数、第二参数、第三参数以及第四参数进行更新直至收敛,得到收敛的人脸年龄预测模型。
具体的,所述模型训练模块4200可以基于所述共享网络及所述性别分类网络对所述训练样本集中的样本进行计算,得到每个样本对应的概率分布向量;将所述概率分布向量代入预设的损失函数进行计算,得到所述训练样本集中每个样本的分类损失;基于所述分类损失对所述共享网络的第一参数和所述性别分类网络的第二参数进行更新,得到收敛的共享网络和收敛的性别分类网络。
在一个例子中,所述模型训练模块4200在基于所述共享网络及所述性别分类网络对所述训练样本集中的样本进行计算,得到每个样本对应的概率分布向量时,具体可以从所述训练样本集中选取一个样本输入所述共享网络及所述性别分类网络,得到第一输出结果;将所述第一输出结果输入归一化函数,得到所述概率分布向量。
在一个例子中,所述模型训练模块4200在基于所述分类损失对所述共享网络的第一参数和所述性别分类网络的第二参数进行更新,得到收敛的共享网络和收敛的性别分类网络时,具体可以基于所述分类损失和预设的反向传播算法计算所述共享网络中第一参数的第一导数,以及所述性别分类网络中第二参数的第二导数;基于所述第一导数和梯度下降算法对所述共享网络中的所述第一参数进行更新,并基于所述第二导数和梯度下降算法对所述性别分类网络中的所述第二参数进行更新;基于所述训练样本集中多个样本的分类损失对所述共享网络中的第一参数以及所述性别分类网络中的第二参数进行多次更新,直到收敛,得到收敛的共享网络和收敛的性别分类网络。
具体的,所述模型训练模块4200在利用男性集训练收敛的共享网络和男性人脸年龄预测网络,直至所述男性人脸年龄预测网络的第三参数收敛时,具体可以基于所述收敛的共享网络和所述男性人脸年龄预测网络对所述男性集中的每个样本进行预测,得到第一预测结果;将所述第一预测结果代入预设的人脸年龄预测损失函数进行计算,得到每个样本的第一损失;基于所述第一损失对所述男性人脸年龄预测网络的第三参数进行更新,直至所述第三参数收敛。
其中,所述模型训练模块4200在更新第三参数时,基于所述第一损失和预设的反向传播算法计算所述第三参数的第三导数;基于所述第三导数和梯度下降算法对所述男性人脸年龄预测网络中的第三参数进行更新;基于所述男性集中多个样本的第一损失对所述男性人脸年龄预测网络中的第三参数进行多次更新,直到收敛,得到收敛的男性人脸年龄预测网络。
具体的,所述模型训练模块4200在利用女性集训练收敛的共享网络和女性人脸年龄预测网络,直至所述女性人脸年龄预测网络的第四参数收敛时,具体可以基于所述收敛的共享网络和所述女性人脸年龄预测网络对所述女性集中的每个样本进行预测,得到第二预测结果;将所述第二预测结果代入预设的人脸年龄预测损失函数进行计算,得到每个样本的第二损失;基于所述第二损失对所述女性人脸年龄预测网络的第四参数进行更新,直至所述第四参数收敛。
其中,所述模型训练模块4200在更新第四参数时,基于所述第二损失和预设的反向传播算法计算所述第四参数的第四导数;基于所述第四导数和梯度下降算法对所述女性人脸年龄预测网络中的第四参数进行更新;基于所述女性集中多个样本的第二损失对所述女性人脸年龄预测网络中的第四参数进行多次更新,直到收敛,得到收敛的女性人脸年龄预测网络。
进一步地,所述模型训练模块4200在利用所述训练样本集训练所述人脸年龄预测模型,对所述第一参数、第二参数、第三参数以及第四参数进行更新直至收敛,得到收敛的人脸年龄预测模型时,具体包括:
基于所述人脸年龄预测模型对所述训练样本集中的样本进行预测,得到每个所述样本对应的概率分布向量、第一预测结果和第二预测结果;将所述概率分布向量、所述第一预测结果和所述第二预测结果输入所述结果融合网络,得到第三预测结果;将所述第三预测结果代入预设的人脸年龄预测损失函数进行计算,到每个样本的第三损失;基于所述训练样本集中多个样本的第三损失对所述人脸年龄预测模型的第一参数、第二参数、第三参数和第四参数进行多次更新,直到收敛,得到收敛的人脸年龄预测模型。
本实施例的人脸年龄预测模型的训练装置,可用于执行本实施例的方法技术方案,其实现原理和技术效果类似,此处不再赘述。
<设备>
本实施例中,还提供一种电子设备,该电子设备包括本发明装置实施例中描述的人脸年龄预测模型的训练装置4000;或者,该电子设备为图5所示的电子设备5000,包括处理器5200和存储器5100:
存储器5100存储有能够被所述处理器执行的机器可执行指令;处理器5200,执行所述机器可执行指令以实现如本实施例中任一项所述的人脸年龄预测模型的训练方法。
<第二实施例>
<方法>
本实施例提供了一种人脸年龄预测方法,该方法通过应用上述实施例训练得到的人脸年龄预测模型对待预测图像的人脸年龄进行预测。
具体的,如图6所示,该方法包括以下步骤6100~步骤6200:
步骤6100,获取待预测图像。
其中,所述待预测图像具体可以是脸部图像。
步骤6200,将所述待预测图像输入人脸年龄预测模型中,输出预测结果。
其中,所述人脸年龄预测模型包括共享网络、性别分类网络、男性人脸年龄预测网络、女性人脸年龄预测网络和结果融合网络;所述共享网络,用于对待预测图像进行特征提取,输出图像特征;所述性别分类网络,用于根据所述图像特征对待预测图像进行性别识别,输出性别概率;所述男性人脸年龄预测网络,用于根据所述图像特征对待预测图像进行年龄预测,输出第一预测结果;所述女性人脸年龄预测网络,用于根据所述图像特征对待预测图像进行年龄预测,输出第二预测结果;所述结果融合网络,用于根据所述性别概率对所述第一预测结果和第二预测结果进行加权平均计算,得到所述预测结果。
具体的,在将脸部图像输入人脸年龄预测模型后,该人脸年龄预测模型中的性别分类网络判断输入的脸部图像的性别分别是男性的概率以及时女性的概率,男性人脸年龄预测网络对该脸部图像的年龄进行预测,得到第一预测结果,女性人脸年龄预测网络对该脸部图像的年龄进行预测,得到第二预测结果。然后,由结果融合网络将计算得到的所述性别概率中的男性概率与所述第一预测结果的乘积与所述性别概率中的女性概率与所述第二预测结果的乘积之和作为所述预测结果进行输出,得出对应于该待预测图像的年龄的预测结果。
本实施例的人脸年龄预测方法,利用预先训练好的人脸年龄预测模型对待预测图像的年龄进行预测,可以消除性别因素对人脸年龄预测任务带来的干扰,从而提升人脸年龄预测模型的泛化能力,提升人脸年龄预测的准确率。
<装置>
本实施例提供一种人脸年龄预测装置,该装置例如是图7所示的人脸年龄预测装置7000。
如图7所示,该人脸年龄预测装置7000可以包括获取模块7100和预测模块7200。
其中,该获取模块7100用于获取待预测图像。预测模块7200将所述待预测图像输入人脸年龄预测模型中,输出预测结果。
其中,所述人脸年龄预测模型包括共享网络、性别分类网络、男性人脸年龄预测网络、女性人脸年龄预测网络和结果融合网络;所述共享网络,用于对待预测图像进行特征提取,输出图像特征;所述性别分类网络,用于根据所述图像特征对待预测图像进行性别识别,输出性别概率;所述男性人脸年龄预测网络,用于根据所述图像特征对待预测图像进行年龄预测,输出第一预测结果;所述女性人脸年龄预测网络,用于根据所述图像特征对待预测图像进行年龄预测,输出第二预测结果;所述结果融合网络,用于根据所述性别概率对所述第一预测结果和第二预测结果进行加权平均计算,得到所述预测结果。
具体的,所述结果融合网络用于将计算得到的所述性别概率中的男性概率与所述第一预测结果的乘积与所述性别概率中的女性概率与所述第二预测结果的乘积之和作为所述预测结果。
本实施例的人脸年龄预测装置,可用于执行本实施例的方法技术方案,其实现原理和技术效果类似,此处不再赘述。
<设备>
本实施例中,还提供一种电子设备,该电子设备包括本发明装置实施例中描述的人脸年龄预测装置7000;或者,该电子设备为图8所示的电子设备8000,包括处理器8200和存储器8100:
存储器8100存储有能够被所述处理器执行的机器可执行指令;处理器8200,执行所述机器可执行指令以实现如本实施例中任一项所述的人脸年龄预测方法。
<计算机可读存储介质实施例>
本实施例提供一种计算机可读存储介质,该存储介质中存储有可执行命令,该可执行命令被处理器执行时,执行本发明任意方法实施例中描述的方法。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人物来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人物来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人物能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。
Claims (16)
1.一种人脸年龄预测模型的训练方法,其特征在于,所述方法包括:
获取训练样本集和预设的初始模型;其中,所述训练样本集包括男性集和女性集,所述男性集包括多个男性脸部图像和与每个男性脸部图像对应的标签,所述女性集包括多个女性脸部图像和与每个女性脸部图像对应的标签,所述标签包括年龄值和性别值;所述初始模型包括共享网络、性别分类网络、男性人脸年龄预测网络、女性人脸年龄预测网络和结果融合网络;
利用所述训练样本集训练共享网络和性别分类网络,直至所述共享网络的第一参数和所述性别分类网络的第二参数收敛;
利用所述男性集训练收敛的共享网络和男性人脸年龄预测网络,直至所述男性人脸年龄预测网络的第三参数收敛;
利用所述女性集训练收敛的共享网络和女性人脸年龄预测网络,直至所述女性人脸年龄预测网络的第四参数收敛;
根据收敛的共享网络,收敛的性别分类网络,收敛的男性人脸年龄预测网络和收敛的女性人脸年龄预测网络,以及结果融合网络,得到人脸年龄预测模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用所述训练样本集训练所述人脸年龄预测模型,对所述第一参数、第二参数、第三参数以及第四参数进行更新直至收敛,得到收敛的人脸年龄预测模型。
3.根据权利要求2所述的方法,其特征在于,所述利用所述训练样本集训练共享网络和性别分类网络,直至所述共享网络的第一参数和所述性别分类网络的第二参数收敛,包括:
基于所述共享网络及所述性别分类网络对所述训练样本集中的样本进行计算,得到每个样本对应的概率分布向量;
将所述概率分布向量代入预设的损失函数进行计算,得到所述训练样本集中每个样本的分类损失;
基于所述分类损失对所述共享网络的第一参数和所述性别分类网络的第二参数进行更新,得到收敛的共享网络和收敛的性别分类网络。
4.根据权利要求3所述的方法,其特征在于,所述基于所述共享网络及所述性别分类网络对所述训练样本集中的样本进行计算,得到每个样本对应的概率分布向量,包括:
从所述训练样本集中选取一个样本输入所述共享网络及所述性别分类网络,得到第一输出结果;
将所述第一输出结果输入归一化函数,得到所述概率分布向量。
5.根据权利要求3所述的方法,其特征在于,所述基于所述分类损失对所述共享网络的第一参数和所述性别分类网络的第二参数进行更新,得到收敛的共享网络和收敛的性别分类网络,包括:
基于所述分类损失和预设的反向传播算法计算所述共享网络中第一参数的第一导数,以及所述性别分类网络中第二参数的第二导数;
基于所述第一导数和梯度下降算法对所述共享网络中的所述第一参数进行更新,并基于所述第二导数和梯度下降算法对所述性别分类网络中的所述第二参数进行更新;
基于所述训练样本集中多个样本的分类损失对所述共享网络中的第一参数以及所述性别分类网络中的第二参数进行多次更新,直到收敛,得到收敛的共享网络和收敛的性别分类网络。
6.根据权利要求2所述的方法,其特征在于,所述利用男性集训练收敛的共享网络和男性人脸年龄预测网络,直至所述男性人脸年龄预测网络的第三参数收敛,包括:
基于所述收敛的共享网络和所述男性人脸年龄预测网络对所述男性集中的每个样本进行预测,得到第一预测结果;
将所述第一预测结果代入预设的人脸年龄预测损失函数进行计算,得到每个样本的第一损失;
基于所述第一损失对所述男性人脸年龄预测网络的第三参数进行更新,直至所述第三参数收敛。
7.根据权利要求2所述的方法,其特征在于,所述利用女性集训练收敛的共享网络和女性人脸年龄预测网络,直至所述女性人脸年龄预测网络的第四参数收敛,包括:
基于所述收敛的共享网络和所述女性人脸年龄预测网络对所述女性集中的每个样本进行预测,得到第二预测结果;
将所述第二预测结果代入预设的人脸年龄预测损失函数进行计算,得到每个样本的第二损失;
基于所述第二损失对所述女性人脸年龄预测网络的第四参数进行更新,直至所述第四参数收敛。
8.根据权利要求6所述的方法,其特征在于,所述基于所述第一损失对所述男性人脸年龄预测网络的第三参数进行更新,直至所述第三参数收敛,包括:
基于所述第一损失和预设的反向传播算法计算所述第三参数的第三导数;
基于所述第三导数和梯度下降算法对所述男性人脸年龄预测网络中的第三参数进行更新;
基于所述男性集中多个样本的第一损失对所述男性人脸年龄预测网络中的第三参数进行多次更新,直到收敛,得到收敛的男性人脸年龄预测网络。
9.根据权利要求7所述的方法,其特征在于,所述基于所述第二损失对所述女性人脸年龄预测网络的第四参数进行更新,直至所述第四参数收敛。
基于所述第二损失和预设的反向传播算法计算所述第四参数的第四导数;
基于所述第四导数和梯度下降算法对所述女性人脸年龄预测网络中的第四参数进行更新;
基于所述女性集中多个样本的第二损失对所述女性人脸年龄预测网络中的第四参数进行多次更新,直到收敛,得到收敛的女性人脸年龄预测网络。
10.根据权利要求2所述的方法,其特征在于,所述利用所述训练样本集训练所述人脸年龄预测模型,对所述第一参数、第二参数、第三参数以及第四参数进行更新直至收敛,得到收敛的人脸年龄预测模型,包括:
基于所述人脸年龄预测模型对所述训练样本集中的样本进行预测,得到每个所述样本对应的概率分布向量、第一预测结果和第二预测结果;
将所述概率分布向量、所述第一预测结果和所述第二预测结果输入所述结果融合网络,得到第三预测结果;
将所述第三预测结果代入预设的人脸年龄预测损失函数进行计算,到每个样本的第三损失;
基于所述训练样本集中多个样本的第三损失对所述人脸年龄预测模型的第一参数、第二参数、第三参数和第四参数进行多次更新,直到收敛,得到收敛的人脸年龄预测模型。
11.一种人脸年龄预测方法,其特征在于,所述方法包括:
获取待预测图像;
将所述待预测图像输入人脸年龄预测模型中,输出预测结果;其中,所述人脸年龄预测模型包括共享网络、性别分类网络、男性人脸年龄预测网络、女性人脸年龄预测网络和结果融合网络;
所述共享网络,用于对待预测图像进行特征提取,输出图像特征;
所述性别分类网络,用于根据所述图像特征对待预测图像进行性别识别,输出性别概率;
所述男性人脸年龄预测网络,用于根据所述图像特征对待预测图像进行年龄预测,输出第一预测结果;
所述女性人脸年龄预测网络,用于根据所述图像特征对待预测图像进行年龄预测,输出第二预测结果;
所述结果融合网络,用于根据所述性别概率对所述第一预测结果和第二预测结果进行加权平均计算,得到所述预测结果。
12.根据权利要求11所述的方法,其特征在于,所述结果融合网络,用于根据所述性别概率对所述第一预测结果和第二预测结果进行加权平均计算,得到所述预测结果,包括:
所述结果融合网络,用于将计算得到的所述性别概率中的男性概率与所述第一预测结果的乘积与所述性别概率中的女性概率与所述第二预测结果的乘积之和作为所述预测结果。
13.一种人脸年龄预测模型的训练装置,其特征在于,所述装置包括:
获取模块,用于获取训练样本集和预设的初始模型;其中,所述训练样本集包括男性集和女性集,所述男性集包括多个男性脸部图像和与每个男性脸部图像对应的标签,所述女性集包括多个女性脸部图像和与每个女性脸部图像对应的标签,所述标签包括年龄值和性别值;所述初始模型包括共享网络、性别分类网络、男性人脸年龄预测网络、女性人脸年龄预测网络和结果融合网络;
模型训练模块,用于利用所述训练样本集训练共享网络和性别分类网络,直至所述共享网络的第一参数和所述性别分类网络的第二参数收敛;利用所述男性集训练收敛的共享网络和男性人脸年龄预测网络,直至所述男性人脸年龄预测网络的第三参数收敛;利用所述女性集训练收敛的共享网络和女性人脸年龄预测网络,直至所述女性人脸年龄预测网络的第四参数收敛;根据收敛的共享网络,收敛的性别分类网络,收敛的男性人脸年龄预测网络和收敛的女性人脸年龄预测网络,以及结果融合网络,得到人脸年龄预测模型。
14.一种人脸年龄预测装置,其特征在于,所述装置包括:
获取模块,用于获取待预测图像;
预测模块,用于将所述待预测图像输入人脸年龄预测模型中,输出预测结果;其中,所述人脸年龄预测模型包括共享网络、性别分类网络、男性人脸年龄预测网络、女性人脸年龄预测网络和结果融合网络;
所述共享网络,用于对待预测图像进行特征提取,输出图像特征;
所述性别分类网络,用于根据所述图像特征对待预测图像进行性别识别,输出性别概率;
所述男性人脸年龄预测网络,用于根据所述图像特征对待预测图像进行年龄预测,输出第一预测结果;
所述女性人脸年龄预测网络,用于根据所述图像特征对待预测图像进行年龄预测,输出第二预测结果;
所述结果融合网络,用于根据所述性别概率对所述第一预测结果和第二预测结果进行加权平均计算,得到所述预测结果。
15.一种电子设备,其特征在于,包括处理器和存储器;所述存储器存储有能够被所述处理器执行的机器可执行指令;所述处理器执行所述机器可执行指令以实现权利要求1-10中任一项所述的人脸年龄预测模型的训练方法。
16.一种电子设备,其特征在于,包括处理器和存储器;所述存储器存储有能够被所述处理器执行的机器可执行指令;所述处理器执行所述机器可执行指令以实现权利要求11或12所述的人脸年龄预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911222270.6A CN111104874B (zh) | 2019-12-03 | 2019-12-03 | 人脸年龄预测方法及模型的训练方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911222270.6A CN111104874B (zh) | 2019-12-03 | 2019-12-03 | 人脸年龄预测方法及模型的训练方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111104874A true CN111104874A (zh) | 2020-05-05 |
CN111104874B CN111104874B (zh) | 2024-02-20 |
Family
ID=70421027
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911222270.6A Active CN111104874B (zh) | 2019-12-03 | 2019-12-03 | 人脸年龄预测方法及模型的训练方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111104874B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898547A (zh) * | 2020-07-31 | 2020-11-06 | 平安科技(深圳)有限公司 | 人脸识别模型的训练方法、装置、设备及存储介质 |
CN111914772A (zh) * | 2020-08-06 | 2020-11-10 | 北京金山云网络技术有限公司 | 识别年龄的方法、年龄识别模型的训练方法和装置 |
CN112052789A (zh) * | 2020-09-03 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 人脸识别方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460334A (zh) * | 2018-01-23 | 2018-08-28 | 北京易智能科技有限公司 | 一种基于声纹和人脸图像特征融合的年龄预测系统及方法 |
CN109376615A (zh) * | 2018-09-29 | 2019-02-22 | 苏州科达科技股份有限公司 | 用于提升深度学习网络预测性能的方法、装置及存储介质 |
CN109886072A (zh) * | 2018-12-25 | 2019-06-14 | 中国科学院自动化研究所 | 基于双向Ladder结构的人脸属性分类系统 |
CN110163300A (zh) * | 2019-05-31 | 2019-08-23 | 北京金山云网络技术有限公司 | 一种图像分类方法、装置、电子设备及存储介质 |
-
2019
- 2019-12-03 CN CN201911222270.6A patent/CN111104874B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460334A (zh) * | 2018-01-23 | 2018-08-28 | 北京易智能科技有限公司 | 一种基于声纹和人脸图像特征融合的年龄预测系统及方法 |
CN109376615A (zh) * | 2018-09-29 | 2019-02-22 | 苏州科达科技股份有限公司 | 用于提升深度学习网络预测性能的方法、装置及存储介质 |
CN109886072A (zh) * | 2018-12-25 | 2019-06-14 | 中国科学院自动化研究所 | 基于双向Ladder结构的人脸属性分类系统 |
CN110163300A (zh) * | 2019-05-31 | 2019-08-23 | 北京金山云网络技术有限公司 | 一种图像分类方法、装置、电子设备及存储介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898547A (zh) * | 2020-07-31 | 2020-11-06 | 平安科技(深圳)有限公司 | 人脸识别模型的训练方法、装置、设备及存储介质 |
WO2021139309A1 (zh) * | 2020-07-31 | 2021-07-15 | 平安科技(深圳)有限公司 | 人脸识别模型的训练方法、装置、设备及存储介质 |
CN111898547B (zh) * | 2020-07-31 | 2024-04-16 | 平安科技(深圳)有限公司 | 人脸识别模型的训练方法、装置、设备及存储介质 |
CN111914772A (zh) * | 2020-08-06 | 2020-11-10 | 北京金山云网络技术有限公司 | 识别年龄的方法、年龄识别模型的训练方法和装置 |
CN111914772B (zh) * | 2020-08-06 | 2024-05-03 | 北京金山云网络技术有限公司 | 识别年龄的方法、年龄识别模型的训练方法和装置 |
CN112052789A (zh) * | 2020-09-03 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 人脸识别方法、装置、电子设备及存储介质 |
CN112052789B (zh) * | 2020-09-03 | 2024-05-14 | 腾讯科技(深圳)有限公司 | 人脸识别方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111104874B (zh) | 2024-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111090987B (zh) | 用于输出信息的方法和装置 | |
CN110807515A (zh) | 模型生成方法和装置 | |
CN111523640B (zh) | 神经网络模型的训练方法和装置 | |
CN110766142A (zh) | 模型生成方法和装置 | |
CN111090756B (zh) | 基于人工智能的多目标推荐模型的训练方法及装置 | |
US11741398B2 (en) | Multi-layered machine learning system to support ensemble learning | |
CN112036509A (zh) | 用于训练图像识别模型的方法和装置 | |
US20210217409A1 (en) | Electronic device and control method therefor | |
CN111104874A (zh) | 人脸年龄预测方法及模型的训练方法、装置及电子设备 | |
CN110084317B (zh) | 用于识别图像的方法和装置 | |
US11880754B2 (en) | Electronic apparatus and control method thereof | |
US10162879B2 (en) | Label filters for large scale multi-label classification | |
CN111539903B (zh) | 训练人脸图像合成模型的方法和装置 | |
EP4113376A1 (en) | Image classification model training method and apparatus, computer device, and storage medium | |
CN111738010A (zh) | 用于生成语义匹配模型的方法和装置 | |
JP2024509014A (ja) | ソーティング方法、ソーティングモデルのトレーニング方法、装置、電子機器及び記憶媒体 | |
CN110580648A (zh) | 基于人工智能的金融理财信息处理方法及装置 | |
CN112685996B (zh) | 文本标点预测方法、装置、可读介质和电子设备 | |
CN111767290B (zh) | 用于更新用户画像的方法和装置 | |
CN111709784B (zh) | 用于生成用户留存时间的方法、装置、设备和介质 | |
CN114548407A (zh) | 层级目标定向因果发现方法、装置及电子设备 | |
CN110942232B (zh) | 一种模型快速容灾方法、装置及电子设备 | |
US11163964B2 (en) | Configurable conversational agent generator | |
CN113806541A (zh) | 情感分类的方法和情感分类模型的训练方法、装置 | |
CN111860214A (zh) | 人脸检测方法及其模型的训练方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |