CN111881737A - 年龄预测模型的训练方法及装置、年龄预测方法及装置 - Google Patents
年龄预测模型的训练方法及装置、年龄预测方法及装置 Download PDFInfo
- Publication number
- CN111881737A CN111881737A CN202010564237.8A CN202010564237A CN111881737A CN 111881737 A CN111881737 A CN 111881737A CN 202010564237 A CN202010564237 A CN 202010564237A CN 111881737 A CN111881737 A CN 111881737A
- Authority
- CN
- China
- Prior art keywords
- age
- prediction model
- layer
- prediction
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 159
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000000605 extraction Methods 0.000 claims abstract description 107
- 238000004590 computer program Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 15
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 5
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 230000001815 facial effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 230000004913 activation Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 101100321992 Drosophila melanogaster ABCD gene Proteins 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/178—Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Biophysics (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本申请实施例公开了一种年龄预测模型的训练方法及装置、年龄预测方法及装置,通过使用包含人脸图像对应的年龄层标签及年龄标签对年龄预测模型进行训练,及通过设置年龄预测模型包含第一特征提取模块及第一全连接层模块,使得能够实现对年龄层特征的提取,及基于年龄层特征输出人脸图像的年龄层预测值,充分考虑到了相近年龄之间的相似特征,且进一步的设置年龄预测模型包含第二特征提取模块及第二全连接层模块,使得能够实现基于年龄层特征实现年龄特征的提取及基于年龄特征确定人脸图像在单位年龄层对应的预测数据,使得能够实现先预测年龄层再在预测的年龄层内预测年龄的方式,也能够进一步的提高人脸图像的年龄预测的准确性。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种年龄预测模型的训练方法及装置、年龄预测方法及装置。
背景技术
人脸图像通常包含很多人脸特征信息,其中,年龄作为一项很重要的人脸特征信息,在人脸识别领域得到的了广泛的应用。
目前,在人脸图像的年龄预测技术中,通常将年龄作为一个单独的类别,在训练用于预测人脸图像的年龄的模型时,是将已知年龄的训练图像和年龄之间建立一对一的映射关系作为训练数据对模型进行训练的。
然而,使用通过上述方法得到的模型进行年龄预测,存在预测的准确性较差的问题。
发明内容
本申请实施例提供一种年龄预测模型的训练方法及装置、年龄预测方法及装置,可以有效提高对人脸图像进行年龄预测的准确性。
本申请第一方面提供一种年龄预测模型的训练方法,其中,所述年龄预测模型包括第一特征提取模块、第一全连接层模块、第二特征提取模块及第二全连接层模块,所述第一特征提取模块,所述第二特征提取模块及所述第二全连接层模块依次级联,所述第一全连接层模块还与所述第一特征提取模块级联;
所述第一特征提取模块用于提取输入至所述年龄预测模型的人脸图像的年龄层特征,所述第一全连接层模块用于基于所述年龄层特征输出所述人脸图像的年龄层预测值;所述第二特征提取模块用于基于所述年龄层特征提取所述人脸图像的年龄特征,所述第二全连接层模块用于基于所述年龄特征输出所述人脸图像在单位年龄层对应的各个年龄的预测数据,所述预测数据用于指示所述人脸图像属于所述各个年龄的可能性;
所述训练方法包括:
获取训练数据,所述训练数据包含人脸样本图像、所述人脸样本图像对应的年龄标签及所述人脸样本图像对应的年龄层标签;
利用所述人脸样本图像对所述年龄预测模型进行迭代训练,直至基于所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述年龄预测模型收敛。
可选地,利用所述人脸样本图像对所述年龄预测模型进行迭代训练,直至基于所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述年龄预测模型收敛,包括:
将所述人脸样本图像输入第i年龄预测模型,获取所述第一全连接层输出的所述年龄层预测值及所述第二全连接层输出的所述预测数据;所述i的初始值为1,且i为正整数;
根据所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述第i年龄预测模型的总损失值;
若基于所述总损失值确定所述第i年龄预测模型收敛,则确定所述第i年龄预测模型为训练完成后的年龄预测模型,结束训练;
若基于所述总损失值确定所述第i年龄预测模型不收敛,则根据所述总损失值对所述第i年龄预测模型进行参数优化,得到第i+1年龄预测模型,令i=i+1,返回执行所述将所述人脸图像输入第i年龄预测模型的步骤。
可选地,所述根据所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述第i年龄预测模型的总损失值,包括:
根据所述年龄层预测值及所述年龄层标签确定所述第i年龄预测模型的第一损失值,根据所述年龄层预测值、所述预测数据及所述年龄标签确定所述第i年龄预测模型的第二损失值;
根据所述第一损失值及所述第二损失值,得到所述第i年龄预测模型的总损失值。
可选地,所述根据所述第一损失值及所述第二损失值,得到所述年龄预测模型的总损失值,包括:
获取所述第一损失值对应的第一损失权重,及所述第二损失值对应的第二损失权重;
利用所述第一损失值、所述第二损失值、所述第一损失权重及所述第二损失权重,得到所述年龄预测模型的总损失值。
可选地,所述根据所述总损失值对所述第i年龄预测模型进行参数优化,得到第i+1年龄预测模型,包括:
利用所述i的值对自适应矩估计adam算法的学习率进行更新,得到更新后的学习率;
利用所述总损失值、所述更新后的学习率及所述adam算法对所述第i年龄预测模型进行参数优化,得到第i+1年龄预测模型。
可选地,所述获取训练数据,之后还包括:
按照年龄层标签或者年龄标签将所述训练数据划分成与各年龄层标签或各年龄标签对应的子训练数据;
利用数据增强方式对所述子训练数据进行数据均衡处理,得到增强后的训练数据。
可选地,所述第一特征提取模块包括依次级联的多层卷积层,所述第二特征提取模块包括依次级联的多层卷积层;
所述第一特征提取模块的最后一层卷积层的输出数据的上采样数据,与所述第一特征提取模块的倒数第二层卷积层的输出数据进行融合得到的数据,作为所述第二特征提取模块的第一层卷积层的输入数据。
本申请实施例第二方面提供一种年龄预测方法,该方法包括:
获取待预测人脸图像;
将所述待预测人脸图像输入年龄预测模型,其中,所述年龄预测模型通过如第一方面所述的年龄预测模型的训练方法训练得到;
获取所述年龄预测模型输出的所述人脸图像的目标年龄层预测值及目标预测数据;
根据所述目标年龄层预测值及所述目标预测数据确定所述人脸图像的预测年龄。
本申请第三方面提供一种年龄预测模型的训练装置,所述年龄预测模型包括第一特征提取模块、第一全连接层模块、第二特征提取模块及第二全连接层模块,所述第一特征提取模块,所述第二特征提取模块及所述第二全连接层模块依次级联,所述第一全连接层模块还与所述第一特征提取模块级联;
所述第一特征提取模块用于提取输入至所述年龄预测模型的人脸图像的年龄层特征,所述第一全连接层模块用于基于所述年龄层特征输出所述人脸图像的年龄层预测值;所述第二特征提取模块用于基于所述年龄层特征提取所述人脸图像的年龄特征,所述第二全连接层模块用于基于所述年龄特征输出所述人脸图像在单位年龄层对应的各个年龄的预测数据,所述预测数据用于指示所述人脸图像属于所述各个年龄的可能性;
所述训练装置包括:
数据获取模块,用于获取训练数据,所述训练数据包含人脸样本图像、所述人脸样本图像对应的年龄标签及所述人脸样本图像对应的年龄层标签;
训练模块,用于利用所述人脸样本图像对所述年龄预测模型进行迭代训练,直至基于所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述年龄预测模型收敛。
本申请实施例第四方面提供一种年龄预测装置,包括:
第一获取模块,用于获取待预测人脸图像;
输入模块,用于将所述待预测人脸图像输入年龄预测模型,其中,所述年龄预测模型通过如第一方面所述的年龄预测模型的训练方法训练得到;
第二获取模块,用于获取所述年龄预测模型输出的所述人脸图像的目标年龄层预测值及目标预测数据;
预测模块,用于根据所述目标年龄层预测值及所述目标预测数据确定所述人脸图像的预测年龄。
本申请实施例第五方面提供一种计算机存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得处理器执行第一方面所述的年龄预测模型的训练方法中的各个步骤。
本申请实施例第六方面提供一种计算机存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得处理器执行第二方面所述的年龄预测方法中的各个步骤。
本申请实施例第七方面提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如第一方面所述的年龄预测模型的训练方法中的各个步骤。
本申请实施例第八方面提供一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该计算机程序被处理器执行时,使得所述处理器执行如第二方面所述的年龄预测方法中的各个步骤。
本申请实施例提供的年龄预测模型的训练方法及使用该年龄预测模型进行年龄预测的方法,其中,年龄预测模型包括第一特征提取模块、第一全连接层模块、第二特征提取模块及第二全连接层模块,第一特征提取模块,第二特征提取模块及第二全连接层模块依次级联,第一全连接层模块还与第一特征提取模块级联;第一特征提取模块用于提取输入至年龄预测模型的人脸图像的年龄层特征,第一全连接层模块用于基于年龄层特征输出人脸图像的年龄层预测值;第二特征提取模块用于基于年龄层特征提取人脸图像的年龄特征,第二全连接层模块用于基于年龄特征输出人脸图像在单位年龄层对应的各个年龄的预测数据,预测数据用于指示人脸图像属于各个年龄的可能性,训练方法包括:获取训练数据,该训练数据包含人脸样本图像、人脸样本图像对应的年龄标签及人脸样本图像对应的年龄层标签,利用该人脸样本图像对年龄预测模型进行迭代训练,直至基于年龄标签、年龄层标签、上述的年龄层预测值及预测数据确定年龄预测模型进行收敛,且该年龄预测模型可用于对待预测人脸图像进行年龄预测。通过使用包含人脸图像对应的年龄层标签及年龄标签对年龄预测模型进行训练,且通过设置年龄预测模型包含第一特征提取模块及第一全连接层模块,使得能够实现对年龄层特征的提取,及基于年龄层特征输出人脸图像的年龄层预测值,充分考虑到了相近年龄之间的相似特征,有效提高人脸图像的年龄预测的准确性,且进一步的设置年龄预测模型包含第二特征提取模块及第二全连接层模块,使得能够实现基于年龄层特征实现年龄特征的提取及基于年龄特征确定人脸图像在单位年龄层对应的预测数据,使得能够实现先预测年龄层再在预测的年龄层内预测年龄的方式,也能够进一步的提高人脸图像的年龄预测的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为本申请实施例中年龄预测模型的结构示意图;
图2为本申请实施例中年龄预测模型的训练方法的一流程示意图;
图3为本申请实施例中年龄预测模型的训练方法的另一流程示意图;
图4为本申请实施例中年龄预测模型的另一结构示意图;
图5为本申请实施例中上采样的示意图;
图6为本申请实施例中年龄预测方法的流程示意图
图7为本申请实施例中年龄预测模型的的训练装置的结构示意图;
图8为本申请实施例中年龄预测装置的结构示意图;
图9为本申请实施例中计算机设备的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施中,将使用到年龄预测模型,请参阅图1,为本申请实施例中年龄预测模型的结构示意图,包括:第一特征提取模块101、第一全连接层模块102、第二特征提取模块103、及第二全连接层模块104,其中,第一特征提取模块101、第二特征提取模块103及第二全连接层模块104依次级联,该第一全连接层模块102还与第一特征提取模块101级联。
其中,第一特征提取模块101用于提取输入至年龄预测模型的人脸图像的年龄层特征,第一全连接层模块102用于基于年龄层特征输出人脸图像的年龄层预测值;第二特征提取模块103用于基于年龄层特征提取人脸图像的年龄特征,第二全连接层模块104用于基于年龄特征输出人脸图像在单位年龄层对应的各个年龄的预测数据,该预测数据用于指示人脸图像属于各个年龄的可能性。
其中,年龄层的划分可以有多种方式,在一种可行的实现方式中,年龄层可以按10年为一层进行划分,并设置相应的年龄层标签,以最低年龄为0,最高年龄为100为年龄范围划分年龄层,可以得到的年龄层包括:(0,10],(10,20],(20,30],(30,40],(40,50],(50,60],(60,70],(70,80],(80,90]及(90,100],则年龄层标签可以分别设置为0,1,2,3,4,5,6,7,8及9。
进一步的,本申请实施例中还设置单位年龄层,该单位年龄层的设置与年龄层划分使用的步长有关,该单位年龄层具体用于表示年龄层划分时使用到的步长对应的各个年龄值,若如上所述,年龄层划分是按照每10年为一层进行划分,则单位年龄层的矩阵则可以表示为[0,1,2,3,4,5,6,7,8,9],不论对于哪个年龄层,其单位年龄层都是一样的。在实际应用中,可以基于具体的需要设置划分年龄层使用到的步长及单位年龄层,此处不做限定。
基于图1所示的年龄预测模型,请参阅图2,为本申请实施例中年龄预测模型的训练方法的流程示意图,该方法包括:
步骤201、获取训练数据,所述训练数据包含人脸样本图像、所述人脸样本图像对应的年龄标签及所述人脸样本图像对应的年龄层标签;
在本申请实施例中,上述年龄预测模型的训练方法由年龄预测模型的训练装置(以下简称:训练装置)实现,该训练装置为程序模块,存储于计算机设备的计算机可读存储介质中,计算机设备中的处理器可以调用该训练装置以实现上述的年龄预测模型的训练方法,完成对年龄预测模型的训练。
在本申请实施例中,将先获取到训练数据,该训练数据用于对年龄预测模型进行训练,且该训练数据包括多组样本数据,每一组样本数据中均包含人脸样本图像,该人脸样本图像对应的年龄标签及年龄层标签。其中,年龄标签则为具体的年龄值,例如,若人脸样本图像对应的年龄值为25岁,则该人脸样本图像的年龄标签为25,且进一步的,其年龄层标签则可以为2,表示其所处的年龄层为(20,30]。
步骤202、利用所述人脸样本图像对所述年龄预测模型进行迭代训练,直至基于所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述年龄预测模型收敛。
在本申请实施例中,将训练数据中的人脸样本图像输入至年龄预测模型进行训练,且每一次训练之后,都将基于输入的人脸样本图像对应的年龄标签、年龄层标签,及训练输出的年龄层预测值及预测数据确定年龄层预测模型是否收敛,若未收敛,则继续训练,若已收敛,则将确定收敛时的年龄预测模型作为训练完成的可以用于进行年龄预测的年龄预测模型。
其中,对于每一次训练,人脸样本图像都将从年龄预测模型的第一特征提取模块101输入至年龄预测模型中,该第一特征提取模块101将提取输入的人脸样本图像的年龄层特征,且提取的年龄层特征将分别输入至第一全连接层模块102及第二特征提取模块103,第一全连接层模块102将基于年龄层特征提取人脸样本图像的年龄层预测值,第二特征提取模块103则将基于年龄层特征提取人脸样本图像的年龄特征,并将提取的年龄特征输入至第二全连接层模块104,该第二全连接层模块则将基于输入的年龄特征输出人脸图像在单位年龄层对应的各个年龄的预测数据,该预测数据用于指示人脸样本图像属于各个年龄的可能性。
在本申请实施例中,通过使用包含人脸图像对应的年龄层标签及年龄标签对年龄预测模型进行训练,且通过设置年龄预测模型包含第一特征提取模块及第一全连接层模块,使得能够实现对年龄层特征的提取,及基于年龄层特征输出人脸图像的年龄层预测值,充分考虑到了相近年龄之间的相似特征,有效提高人脸图像的年龄预测的准确性,且进一步的设置年龄预测模型包含第二特征提取模块及第二全连接层模块,使得能够实现基于年龄层特征实现年龄特征的提取及基于年龄特征确定人脸图像在单位年龄层对应的预测数据,使得能够实现先预测年龄层再在预测的年龄层内预测年龄的方式,也能够进一步的提高人脸图像的年龄预测的准确性。
为了更好的理解本申请实施例中的技术方案,基于图1所示的年龄预测模型,请参阅图3,为本申请实施例中年龄预测模型的训练方法的另一流程图,该方法包括:
步骤301、获取训练数据,训练数据包含人脸样本图像、人脸样本图像对应的年龄标签及年龄层标签;
上述步骤301与图2所示实施例中的步骤201描述的内容相似,此处不做赘述。进一步的,在一种可行的实现方式中,可先获取初始训练数据,该初始训练数据也包含多组数据,每一组数据都包含人脸样本图像,及该人脸样本图像对应的年龄标签。为了能够使用到相似年龄之间人脸特征的相似性进行模型训练,可进一步的为该初始训练数据配置年龄层标签,具体可利用人脸样本图像对应的年龄标签与已划分的年龄层进行匹配,设置该人脸样本图像对应的年龄层标签,以得到上述的训练数据。
在另一种可行的实现方式中,还可以通过对训练数据进行数据增强的方式,进一步提高利用该训练数据进行训练得到的年龄预测模型的适用性及鲁棒性,具体的:本申请的发明人经过创造性的劳动发现现有技术中对人脸图像的年龄进行预测的模型存在问题,即其预测的准确定不稳定,例如,对于某一个年龄的预测的准确性较高,对于另一个年龄的预测的准确性较低。针对该问题,本申请实施例中可通过对训练数据进行增强的方式达到各年龄或者各年龄层的训练数据均衡,使得基于该训练数据训练得到的年龄预测模型能够适用于各个年龄层或者各个年龄的预测,避免出现预测的准确性不稳定的问题,进一步提高年龄预测模型的适用性及鲁棒性。具体的,可以在步骤301之后,且步骤302之前执行以下步骤:步骤A:按照年龄层标签或者年龄标签将训练数据划分成各年龄层标签或者各年龄标签对应的子训练数据;
步骤B:利用数据增强方式对上述的子训练数据进行数据均衡处理,得到增强后的训练数据。
在本申请实施例中,对训练数据进行增强有多种可实现的方式,包括但不限于基于年龄层标签的增强方式,及基于年龄标签的增强方式,下面将分别进行介绍:
(1)基于年龄层标签的增强方式:遍历上述的训练数据,获取遍历到的人脸样本图像的年龄层标签,并进行归类,使得具有相同年龄层标签的人脸样本图像在同一子训练数据中,具有不通过年龄层标签的人脸样本图像则在不同的子训练数据中。进一步的,利用数据增强方式对各个年龄层标签对应的子训练数据进行数据均衡处理,且数据均衡处理后的子训练数据则构成了增强后的训练数据。在一种可行的实现方式中,数据均衡处理具体可以包括:统计各个年龄层标签对应的子训练数据中包含的人脸样本图像的数量,并确定最大数量为均衡时的目标数量,对于人脸样本图像的数量未达到该目标数量的子训练数据,将采用数据增强的方式对该子训练数据进行处理,使得该子训练数据中包含的人脸样本图像的数量达到上述目标数量。其中,数据增强的方式有多种,例如,可以通过对人脸样本图像进行亮度不变,且进行角度旋转的方式,则可利用一张人脸样本图像得到不同角度的多张人脸样本图像,以使得人脸样本图像的数量增加。可以理解的是,通过数据增强方式对人脸样本图像A进行处理,得到的多张人脸样本图像B,则该多张人脸样本图像B的年龄标签及年龄层标签,均与人脸样本图像A的相同。
(2)基于年龄标签的增强方式:遍历上述的训练数据,获取遍历到的人脸样本图像的年龄标签,并进行归类,使得具有相同年龄标签的人脸样本图像在同一子训练数据中,具有不通过年龄标签的人脸样本图像则在不同的子训练数据中。进一步的,利用数据增强方式对各个年龄标签对应的子训练数据进行数据均衡处理,且数据均衡处理后的子训练数据则构成了增强后的训练数据。在一种可行的实现方式中,数据均衡处理具体可以包括:统计各个年龄标签对应的子训练数据中包含的人脸样本图像的数量,并确定最大数量为均衡时的目标数量,对于人脸样本图像的数量未达到该目标数量的子训练数据,将采用数据增强的方式对该子训练数据进行处理,使得该子训练数据中包含的人脸样本图像的数量达到上述目标数量。其中,数据增强的方式有多种,例如,可以通过对人脸样本图像进行亮度不变,且进行角度旋转的方式,则可利用一张人脸样本图像得到不同角度的多张人脸样本图像,以使得人脸样本图像的数量增加。可以理解的是,通过数据增强方式对人脸样本图像C进行处理,得到的多张人脸样本图像D,则该多张人脸样本图像D的年龄标签及年龄层标签,均与人脸样本图像C的相同。
在本申请实施例中,可以通过上述方式实现对训练数据的增强,使得训练数据更加均衡,且使用该增强后的训练数据训练得到的年龄预测模型对各个年龄层或各个年龄的预测的准确性相似,能够有效提高年龄预测模型的适用性及鲁棒性更强。
步骤302、将人脸样本图像输入第i年龄预测模型,获取第一全连接层模块输出的年龄层预测值,及第二全连接层模块输出的预测数据;
其中,i的初始值为1,i为正整数,且第1年龄预测模型则为初始预测模型,该初始预测模型中的参数均为初始值,且经过多次迭代训练不断地对模型中的参数进行调整,直至收敛得到可以用于年龄预测的年龄预测模型。
在一种可行的实现方式中,第一特征提取模块101包含多层依次级联的卷积层,第一全连接层模块102则包含多层依次级联的全连接层,第一特征提取模块101的最后一层卷积层与第一全连接层模块102连接,使得第一特征提取模块101提取的年龄层特征能够输入至第一全连接层模块102。第二特征提取模块103包括依次级联的多层卷积层,且第一特征提取模块101的最后一层卷积层的输出数据的上采样数据,与第一特征提取模块101的倒数第二层卷积层的输出数据进行融合得到的数据,作为第二特征提取模块103的第一层卷积层的输入数据。
具体地,请参阅图4,为本申请实施例中年龄预测模型的另一结构示意图,该年龄预测模型为一种可行的结构。
在图4中,针对训练数据包含的224*224*3人脸样本图像,该人脸样本图像将输入至第一特征提取模块101,在图4中,该第一特征提取模块101包含4层依次级联的卷积层,且该四层卷积层均采用3*3大小的卷积核,步长设置为2,激活函数设置为relu,其中,卷积核表示对输入的图像进行卷积处理时,每次从图像中提取的区域大小,步长则是指在利用卷积核提取区域时,每次移动的像素点的个数,激活函数的作用则是给训练模型加入非线性因素,使得训练得到的年龄预测模型能够更好的解决年龄预测的问题。
人脸样本图像经过第一特征提取模块101的卷积运算之后,将得到14*14*64大小的特征图像,该特征图像将输入至第一全连接层模块102,第一全连接层模块102包含两层全连接层,输入的14*14*64的特征图像在经过该两层全连接层之后,将输出人脸样本图像的年龄层预测值,此外,对于第一特征提取模块101的最后一层卷积层输出的14*14*64的特征图像,将通过上采样的方式,得到28*28*64的特征图像,并将该上采样得到的28*28*64的特征图像与第一特征提取模块101的倒数第二层卷积层得到的28*28*64的特征图像进行融合,融合得到28*28*128的特征图像作为第二特征提取模块103的输入,其中,28*28*64表示图像的大小为28*28,输出通道数为64,融合的方式主要是将图像的输出通道数相加。
其中,第二特征提取模块103包含两层卷积层,采用卷积核3*3大小,步长设置为2,激活函数设置为relu。其输入的数据即为上述融合得到的28*28*128的特征图像,且将输出7*7*256的特征图像,该特征图像则将输入第二全连接层模块104,该第二全连接层模块104包含两层全连接层,且将输出人脸样本图像在单位年龄层对应的各个年龄的预测数据。
为了更好地理解上采样,请参阅图5,为本申请实施例中上采样的一个示意图,其中ABCD均为特征图像中的像素点,通过上采样的方式,对ABCD的像素值进行复制,分别得到A’,B’,C’及D’,完成了采样过程,其中,A’像素点的像素值与A像素点的像素值是一样的,其他B’,C’及D’同理。
在本申请实施例中,考虑到卷积层越多,就越能够得到高层特征,然而,同时会带来丢失的特征也越多的问题,为了减少特征的丢失,通过采用上采样及融合的方式,使得能够更好融合浅层特征和高层特征,通过融合的方式能够减少特征的丢失,以便训练得到的年龄预测模型具有较好的准确性。
步骤303、根据年龄标签、年龄层标签、年龄层预测值及预测数据确定第i年龄预测模型的总损失值;
在本申请实施例中,上述的步骤303具体包含以下步骤:
步骤a1、根据年龄层预测值及年龄层标签确定第i年龄预测模型的第一损失值,根据年龄层预测值、预测数据及年龄层标签确定第i年龄预测模型的第二损失值。
其中,第一损失值和第二损失值的确定均需要使用到损失函数,下面将分别进行介绍:
在第一全连接层模块102输出人脸图像的年龄层预测值Yc={yc1,yc2,yc3,...,ycn}之后,将利用预设的多分类损失函数得到上述的第一损失值,多分类损失函数如下:
pi=log(yci)i∈(1,2,...,n)
其中,Lc表示多分类损失函数得到的第一损失值,n表示年龄层预测值的数目,yci表示年龄层预测值中的第i个数,YTi表示真实的年龄层标签(训练数据中人脸样本图像对应的年龄层标签)。pi则表示计算第一损失值的中间数值,用于将年龄层预测值转换成与真实的年龄标签值相同类型的数值。
在第二全连接层模块104输出人脸图像在单位年龄层对应的各个年龄的预测数据之后,将利用回归损失函数得到第二损失值,该回归损失函数如下:
Lr=|max(log(Yr))+m×K|-YT K={max(yc1,yc2,yc3,...,ycn)}
其中,Lr表示回归损失函数得到的第二损失值,(yc1,yc2,yc3,...,ycn)表示第一全连接层模块102输出的人脸样本图像的年龄层预测值,max表示年龄层预测值中最大值对应的年龄层标签,即K表示确定的年龄层标签,m为常数,具体是指年龄层划分时的步长,Yr表示第二全连接层模块104输出的人脸样本图像在单位年龄层对应的各个年龄的预测数据,max(log(Yr))则表示取该预测数据中的最大值对应的年龄值,YT表示真实的年龄值(即人脸样本图像对应的年龄标签)。
例如,以m为10为例(即年龄层是按照10年一层进行划分的),则年龄层包括:(0,10],(10,20],(20,30],(30,40],(40,50],(50,60],(60,70],(70,80],(80,90]及(90,100],则年龄层标签可以分别设置为0,1,2,3,4,5,6,7,8及9,且单位年龄层则为[0,1,2,3,4,5,6,7,8,9]。
将人脸样本图像C输入至第i年龄预测模型,则可以得到年龄层预测值及预测数据,其中,该人脸样本图像C对应的年龄层标签为3,年龄标签为29。
若年龄层预测值(yc1,yc2,yc3,...,ycn)=(a0,a1,a2,a3,a4,a5,a6,a7,a8,a9),该年龄层预测值中的最大值为a3,则K=a3。
若预测数据Yr=(b0,b1,b2,b3,b4,b5,b6,b7,b8,b9),其中的最大数据为b4,则max(log(Yr))=logb4。将确定的值代入上述的回归损失函数,则可以得到:
Lr=|logb4+10×a3|-29
需要说明的是,在实际计算过程中,logb4的取值为b4在单位年龄层中对应的年龄值,即4,a3取值为a3对应的年龄层标签,即3。
步骤a2、根据第一损失值及所述第二损失值,得到第i年龄预测模型的总损失值。
在本申请实施例中,在得到第一损失值及第二损失值之后,将利用该两个损失值得到第i年龄预测模型的总损失值。
具体的,可以获取第一损失值对应的第一损失权重,及第二损失值对应的第二损失权重,利用第一损失值、第二损失值、第一损失值权重及第二损失值权重,得到年龄预测模型的总损失值,其中,第一损失权重及第二损失权重是用于对年龄预测模型中的第一特征提取模块101和第二特征提取模块103提取的特征的权重进行调整的,可以达到第i年龄预测模型的损失函数最小化。
在一种可行的实现方式中,上述的总损失值可以使用以下公式得到:
L=α×Lc+β×Lr
其中,L表示总损失值,Lc表示第一损失值,Lr表示第二损失值,α表示第一损失值对应的第一损失权重,β表示第二损失值对应的第二损失权重。
上述的第一损失权重和第二损失权重可以根据实际情况进行灵活的设置,例如,可以设置第一损失值为0.6,第二损失值为0.4,通过设置不同部分的损失值的权重的方式,可以有效提高训练得到的年龄预测模型进行年龄预测的准确性。
在本申请实施例中,在一次训练过程中,在得到总损失值之后,可根据该总损失值确定第i年龄预测模型是否收敛。
进一步的,根据总损失值确定第i年龄预测模型是否收敛的一种可行的实现方式为:确定第i年龄预测模型的总损失值与第i-1年龄预测模型的总损失值的差值是否小于预设值,若小于预设值,则第i年龄预测模型收敛,若大于预设值,则第i年龄预测模型不收敛。
步骤304、若基于所述总损失值确定所述第i年龄预测模型收敛,则确定第i年龄预测模型为训练完成后的年龄预测模型;
步骤305、若基于所述总损失值确定所述第i年龄预测模型不收敛,则根据总损失值对第i年龄预测模型进行参数优化,得到第i+1年龄预测模型,令i=i+1,返回执行步骤302。
在本申请实施例中,在确定第i年龄预测模型收敛的情况下,则可确定第i年龄预测模型为训练完成后得到的年龄预测模型,该年龄预测模型可以用于对待预测人脸图像进行年龄预测。
此外,若确定第i年龄预测模型不收敛,则可以根据第一损失值及第二损失值对第i年龄预测模型的参数进行优化,得到第i+1年龄预测模型,并进行下一次的训练,且通过多次迭代训练的方式,直至收敛。
在进行参数优化时,可以利用该i的值对自适应矩估计(Adaptive momentestimation,adam)算法的学习率进行更新,得到更新后的学习率,并利用总损失值、更新后的学习率及adam算法对第i年龄预测模型进行参数优化,得到第i+1年龄预测模型。
需要说明的是,使用adam算法需要预先配置参数,包括迭代次数的设置,初始学习率,学习率的权重衰减等等,每一次迭代训练,都需要更新adam算法的学习率。例如,迭代次数可以设置为500次,初始化学习率设置为0.001,学习率的权重衰减设置为0.0005,经过50次迭代,学习率将衰减成原来的1/10,其中,可以将学习率、总损失值输入adam算法中,得到adam输出的调整参数,利用该调整参数实现第i年龄预测模型的参数优化。
在本申请实施例中,通过使用包含人脸样本图像的年龄层标签及年龄标签的训练数据对年龄预测模型进行训练,且由于该年龄预测模型包含第一特征提取模块、第二特征提取模块、第一全连接层模块及第二全连接层模块,使得能够充分利用相近年龄阶段特征的相似性完成年龄预测模型的训练,且使用该年龄预测模型可以先进行不同年龄层的预测,并在预测到的年龄层的范围内进行年龄的预测,该方式能够有效的提升年龄预测的准确性。
请参阅图6,为本申请实施例中年龄预测方法的流程示意图,该年龄预测方法将使用到前面所述的实施例中训练得到的年龄预测模型,该方法包括:
步骤601、获取待预测人脸图像;
步骤602、将所述待预测人脸图像输入年龄预测模型;
步骤603、获取所述年龄预测模型输出的所述人脸图像的目标年龄层预测值及目标预测数据;
步骤604、根据所述目标年龄层预测值及所述目标预测数据确定所述待预测人脸图像的预测年龄。
在本申请实施例中,将获取待预测人脸图像,并将该待预测人脸图像输入至年龄预测模型,该年龄预测模型即为基于本申请实施例中的年龄预测模型的训练方法训练得到的模型,待预测人脸图像将从年龄预测模型的第一特征提取模块输入至年龄预测模型,该第一特征提取模块将提取该待预测人脸图像的年龄层特征,且该年龄层特征将输入至第一全连接层模块,第一全连接层模块则基于该年龄层特征输出人脸图像的目标年龄层预测值,此外,对第一特征提取模块的最后一层卷积层的输出数据进行上采样得到的上采样数据,将与第一特征提取模块的倒数第二层卷积层得到的数据进行融合,融合后的数据作为第二特征提取模块的输入数据,此数据也为年龄层特征,第二特征提取模块将基于输入的年龄层特征提取待预测人脸图像的年龄特征,且该年龄特征将输入至第二全连接层模块,该第二全连接层模块将基于该年龄特征输出人脸图像在单位年龄层对应的各个年龄的目标预测数据,该目标预测数据用于指示人脸图像属于各个年龄的可能性。
在得到年龄预测模型输出的目标年龄层预测值及目标预测数据之后,将根据该目标年龄层预测值及目标预测数据得到待预测人脸图像的预测年龄,以实现年龄预测。
其中,根据目标年龄层预测值及目标预测数据得到待预测人脸图像的预测年龄具体可以包括:确定该目标年龄层预测值中的最大值对应的目标年龄层标签,确定目标预测数据中的最大值在单位年龄层中对应的目标单位年龄值;将该年龄层标签与预设的年龄层划分步长相乘,并将乘积加上单位年龄值,得到待预测人脸图像的预测年龄,且该预测年龄可以通过如下公式得到:
F=max(log(Yr))+m×K K={max(yc1,yc2,yc3,...,ycn)}
其中,F表示待预测人脸图像的预测年龄,Yr表示第二全连接层模块输出的待预测人脸图像在单位年龄层对应的各个年龄的目标预测数据,max(log(Yr))则表示取该目标预测数据中的最大值对应的年龄值,(yc1,yc2,yc3,...,ycn)表示第一全连接层模块输出的待预测人脸图像的目标年龄层预测值,max表示目标年龄层预测值中最大值对应的目标年龄层标签,m表示年龄层划分时使用的步长。
例如,以m为10为例(即年龄层是按照10年一层为步长进行划分的),则年龄层包括:(0,10],(10,20],(20,30],(30,40],(40,50],(50,60],(60,70],(70,80],(80,90]及(90,100],则年龄层标签可以分别设置为0,1,2,3,4,5,6,7,8及9,且单位年龄层则为[0,1,2,3,4,5,6,7,8,9]。
将待预测人脸样本图像E输入至训练完成后的年龄预测模型,则可以得到该年龄预测模型输出的目标年龄层预测值及目标预测数据。
在本申请实施例中,由于该年龄预测模型包含第一特征提取模块、第二特征提取模块、第一全连接层模块及第二全连接层模块,且使用到包含年龄层标签和年龄标签的训练数据进行训练,因此,使用该年龄预测模型对待预测人脸图像进行年龄预测,可充分考虑到相近年龄阶段特征的相似性,且使用该年龄预测模型可以先进行不同年龄层的预测,并在预测到的年龄层的范围内进行年龄的预测,该方式能够有效的提升年龄预测的准确性。
请参阅图7,为本申请实施例中年龄预测模型的训练装置的结构示意图,该年龄预测模型如图1及图5所示,包含第一特征提取模块101、第一全连接层模块102、第二特征提取模块103、及第二全连接层模块104,其中,第一特征提取模块101、第二特征提取模块103及第二全连接层模块104依次级联,该第一全连接层模块102还与第一特征提取模块101级联。
其中,第一特征提取模块101用于提取输入至年龄预测模型的人脸图像的年龄层特征,第一全连接层模块102用于基于年龄层特征输出人脸图像的年龄层预测值;第二特征提取模块103用于基于年龄层特征提取人脸图像的年龄特征,第二全连接层模块104用于基于年龄特征输出人脸图像在单位年龄层对应的各个年龄的预测数据,该预测数据用于指示人脸图像属于各个年龄的可能性。
在本申请实施例中,年龄预测模型的训练装置包括:
数据获取模块701,用于获取训练数据,所述训练数据包含人脸样本图像、所述人脸样本图像对应的年龄标签及所述人脸样本图像对应的年龄层标签;
训练模块702,用于利用所述人脸样本图像对所述年龄预测模型进行迭代训练,直至基于所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述年龄预测模型收敛。
在本申请实施例中,上述的年龄预测模型的训练装置中的数据获取模块701及训练模块702的相关内容可以参阅上述方法实施例中的年龄预测模型的训练方法中的相关描述,此处不做赘述。
在本申请实施例中,通过设置年龄预测模型包含第一特征提取模块及第一全连接层模块,使得能够实现对年龄层特征的提取,及基于年龄层特征输出人脸图像的年龄层预测值,充分考虑到了相近年龄之间的相似特征,有效提高人脸图像的年龄预测的准确性,且进一步的设置年龄预测模型包含第二特征提取模块及第二全连接层模块,使得能够实现基于年龄层特征实现年龄特征的提取及基于年龄特征确定人脸图像在单位年龄层对应的预测数据,使得能够实现先预测年龄层再在预测的年龄层内预测年龄的方式,也能够进一步的提高人脸图像的年龄预测的准确性。
请参阅图8,为本申请实施例中年龄预测装置的结构示意图,该年龄预测装置将使用基于本申请实施例中的年龄预测模型的训练方法训练得到的年龄预测模型,该装置包括:
第一获取模块801,用于获取待预测人脸图像;
输入模块802,用于将所述待预测人脸图像输入年龄预测模型;
第二获取模块803,用于获取所述年龄预测模型输出的所述待预测人脸图像的目标年龄层预测值及目标预测数据;
预测模块804,用于根据所述目标年龄层预测值及所述目标预测数据确定所述人脸图像的预测年龄。
在本申请实施例中,年龄预测装置中的第一获取模块801、输入模块802、第二获取模块803及预测模块804的相关内容可以参阅本申请方法实施例中年龄预测方法中的相关描述,此处不做赘述。
在本申请实施例中,由于该年龄预测模型包含第一特征提取模块、第二特征提取模块、第一全连接层模块及第二全连接层模块,且使用到包含年龄层标签和年龄标签的训练数据进行训练,因此,使用该年龄预测模型对待预测人脸图像进行年龄预测,可充分考虑到相近年龄阶段特征的相似性,且使用该年龄预测模型可以先进行不同年龄层的预测,并在预测到的年龄层的范围内进行年龄的预测,该方式能够有效的提升年龄预测的准确性。
图9示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图9所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现年龄预测模型的训练方法,和/或实现年龄预测方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行年龄预测模型的训练方法,和/或实现年龄预测方法。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取训练数据,所述训练数据包含人脸样本图像、所述人脸样本图像对应的年龄标签及所述人脸样本图像对应的年龄层标签;
利用所述人脸样本图像对所述年龄预测模型进行迭代训练,直至基于所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述年龄预测模型收敛。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取训练数据,所述训练数据包含人脸样本图像、所述人脸样本图像对应的年龄标签及所述人脸样本图像对应的年龄层标签;
利用所述人脸样本图像对所述年龄预测模型进行迭代训练,直至基于所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述年龄预测模型收敛。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取待预测人脸图像;
将所述待预测人脸图像输入年龄预测模型;
获取所述年龄预测模型输出的所述人脸图像的目标年龄层预测值及目标预测数据;
根据所述目标年龄层预测值及所述目标预测数据确定所述待预测人脸图像的预测年龄。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取待预测人脸图像;
将所述待预测人脸图像输入年龄预测模型;
获取所述年龄预测模型输出的所述人脸图像的目标年龄层预测值及目标预测数据;
根据所述目标年龄层预测值及所述目标预测数据确定所述待预测人脸图像的预测年龄。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。本申请专利的保护范围应以所附权利要求为准。
Claims (12)
1.一种年龄预测模型的训练方法,其特征在于,所述年龄预测模型包括第一特征提取模块、第一全连接层模块、第二特征提取模块及第二全连接层模块,所述第一特征提取模块,所述第二特征提取模块及所述第二全连接层模块依次级联,所述第一全连接层模块还与所述第一特征提取模块级联;
所述第一特征提取模块用于提取输入至所述年龄预测模型的人脸图像的年龄层特征,所述第一全连接层模块用于基于所述年龄层特征输出所述人脸图像的年龄层预测值;所述第二特征提取模块用于基于所述年龄层特征提取所述人脸图像的年龄特征,所述第二全连接层模块用于基于所述年龄特征输出所述人脸图像在单位年龄层对应的各个年龄的预测数据,所述预测数据用于指示所述人脸图像属于所述各个年龄的可能性;
所述训练方法包括:
获取训练数据,所述训练数据包含人脸样本图像、所述人脸样本图像对应的年龄标签及所述人脸样本图像对应的年龄层标签;
利用所述人脸样本图像对所述年龄预测模型进行迭代训练,直至基于所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述年龄预测模型收敛。
2.根据权利要求1所述的方法,其特征在于,所述利用所述人脸样本图像对所述年龄预测模型进行迭代训练,直至基于所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述年龄预测模型收敛,包括:
将所述人脸样本图像输入第i年龄预测模型,获取所述第一全连接层模块输出的所述年龄层预测值及所述第二全连接层模块输出的所述预测数据;所述i的初始值为1,且i为正整数;
根据所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述第i年龄预测模型的总损失值;
若基于所述总损失值确定所述第i年龄预测模型收敛,则确定所述第i年龄预测模型为训练完成后的年龄预测模型,结束训练;
若基于所述总损失值确定所述第i年龄预测模型不收敛,则根据所述总损失值对所述第i年龄预测模型进行参数优化,得到第i+1年龄预测模型,令i=i+1,返回执行所述将所述人脸图像输入第i年龄预测模型的步骤。
3.根据权利要求2所述的方法,其特征在于,所述根据所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述第i年龄预测模型的总损失值,包括:
根据所述年龄层预测值及所述年龄层标签确定所述第i年龄预测模型的第一损失值,根据所述年龄层预测值、所述预测数据及所述年龄标签确定所述第i年龄预测模型的第二损失值;
根据所述第一损失值及所述第二损失值,得到所述第i年龄预测模型的总损失值。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一损失值及所述第二损失值,得到所述年龄预测模型的总损失值,包括:
获取所述第一损失值对应的第一损失权重,及所述第二损失值对应的第二损失权重;
利用所述第一损失值、所述第二损失值、所述第一损失权重及所述第二损失权重,得到所述年龄预测模型的总损失值。
5.根据权利要求2所述的方法,其特征在于,所述根据所述总损失值对所述第i年龄预测模型进行参数优化,得到第i+1年龄预测模型,包括:
利用所述i的值对自适应矩估计adam算法的学习率进行更新,得到更新后的学习率;
利用所述总损失值、所述更新后的学习率及所述adam算法对所述第i年龄预测模型进行参数优化,得到第i+1年龄预测模型。
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述获取训练数据,之后还包括:
按照年龄层标签或者年龄标签将所述训练数据划分成与各年龄层标签或各年龄标签对应的子训练数据;
利用数据增强方式对所述子训练数据进行数据均衡处理,得到增强后的训练数据。
7.根据权利要求1至5任意一项所述的方法,其特征在于,所述第一特征提取模块包括依次级联的多层卷积层,所述第二特征提取模块包括依次级联的多层卷积层;
所述第一特征提取模块的最后一层卷积层的输出数据的上采样数据,与所述第一特征提取模块的倒数第二层卷积层的输出数据进行融合得到的数据,作为所述第二特征提取模块的第一层卷积层的输入数据。
8.一种年龄预测方法,其特征在于,所述方法包括:
获取待预测人脸图像;
将所述待预测人脸图像输入年龄预测模型,其中,所述年龄预测模型通过如权利要求1-7任一项所述的年龄预测模型的训练方法训练得到;
获取所述年龄预测模型输出的所述人脸图像的目标年龄层预测值及目标预测数据;
根据所述目标年龄层预测值及所述目标预测数据确定所述待预测人脸图像的预测年龄。
9.一种年龄预测模型的训练装置,其特征在于,所述年龄预测模型包括第一特征提取模块、第一全连接层模块、第二特征提取模块及第二全连接层模块,所述第一特征提取模块,所述第二特征提取模块及所述第二全连接层模块依次级联,所述第一全连接层模块还与所述第一特征提取模块级联;
所述第一特征提取模块用于提取输入至所述年龄预测模型的人脸图像的年龄层特征,所述第一全连接层模块用于基于所述年龄层特征输出所述人脸图像的年龄层预测值;所述第二特征提取模块用于基于所述年龄层特征提取所述人脸图像的年龄特征,所述第二全连接层模块用于基于所述年龄特征输出所述人脸图像在单位年龄层对应的各个年龄的预测数据,所述预测数据用于指示所述人脸图像属于所述各个年龄的可能性;
所述训练装置包括:
数据获取模块,用于获取训练数据,所述训练数据包含人脸样本图像、所述人脸样本图像对应的年龄标签及所述人脸样本图像对应的年龄层标签;
训练模块,用于利用所述人脸样本图像对所述年龄预测模型进行迭代训练,直至基于所述年龄标签、所述年龄层标签、所述年龄层预测值及所述预测数据确定所述年龄预测模型收敛。
10.一种年龄预测装置,其特征在于,所述装置包括:
第一获取模块,用于获取待预测人脸图像;
输入模块,用于将所述待预测人脸图像输入年龄预测模型,其中,所述年龄预测模型通过如权利要求1-7任一项所述的年龄预测模型的训练方法训练得到;
第二获取模块,用于获取所述年龄预测模型输出的所述待预测人脸图像的目标年龄层预测值及目标预测数据;
预测模块,用于根据所述目标年龄层预测值及所述目标预测数据确定所述人脸图像的预测年龄。
11.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项或权利要求8所述的方法中的各个步骤。
12.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项或权利要求8所述的方法中的各个步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010564237.8A CN111881737B (zh) | 2020-06-18 | 2020-06-18 | 年龄预测模型的训练方法及装置、年龄预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010564237.8A CN111881737B (zh) | 2020-06-18 | 2020-06-18 | 年龄预测模型的训练方法及装置、年龄预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111881737A true CN111881737A (zh) | 2020-11-03 |
CN111881737B CN111881737B (zh) | 2023-12-08 |
Family
ID=73157709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010564237.8A Active CN111881737B (zh) | 2020-06-18 | 2020-06-18 | 年龄预测模型的训练方法及装置、年龄预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111881737B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112766238A (zh) * | 2021-03-15 | 2021-05-07 | 电子科技大学中山学院 | 年龄预测方法及装置 |
CN113076823A (zh) * | 2021-03-18 | 2021-07-06 | 深圳数联天下智能科技有限公司 | 一种年龄预测模型的训练方法、年龄预测方法及相关装置 |
CN113221645A (zh) * | 2021-04-07 | 2021-08-06 | 深圳数联天下智能科技有限公司 | 目标模型训练方法、人脸图像生成方法以及相关装置 |
CN113920562A (zh) * | 2021-09-24 | 2022-01-11 | 深圳数联天下智能科技有限公司 | 年龄预测模型的训练方法、年龄预测方法及装置 |
CN115171204A (zh) * | 2022-09-06 | 2022-10-11 | 北京鹰瞳科技发展股份有限公司 | 对预测视网膜年龄的预测模型进行训练的方法和相关产品 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107169454A (zh) * | 2017-05-16 | 2017-09-15 | 中国科学院深圳先进技术研究院 | 一种人脸图像年龄估算方法、装置及其终端设备 |
CN108573209A (zh) * | 2018-02-28 | 2018-09-25 | 天眼智通(香港)有限公司 | 一种基于人脸的单模型多输出的年龄性别识别方法及系统 |
WO2019109526A1 (zh) * | 2017-12-06 | 2019-06-13 | 平安科技(深圳)有限公司 | 人脸图像的年龄识别方法、装置及存储介质 |
CN110287942A (zh) * | 2019-07-03 | 2019-09-27 | 成都旷视金智科技有限公司 | 年龄估计模型的训练方法、年龄估计方法以及对应的装置 |
KR20200010993A (ko) * | 2018-07-11 | 2020-01-31 | 삼성전자주식회사 | 보완된 cnn을 통해 이미지 속 얼굴의 속성 및 신원을 인식하는 전자 장치. |
-
2020
- 2020-06-18 CN CN202010564237.8A patent/CN111881737B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107169454A (zh) * | 2017-05-16 | 2017-09-15 | 中国科学院深圳先进技术研究院 | 一种人脸图像年龄估算方法、装置及其终端设备 |
WO2019109526A1 (zh) * | 2017-12-06 | 2019-06-13 | 平安科技(深圳)有限公司 | 人脸图像的年龄识别方法、装置及存储介质 |
CN108573209A (zh) * | 2018-02-28 | 2018-09-25 | 天眼智通(香港)有限公司 | 一种基于人脸的单模型多输出的年龄性别识别方法及系统 |
KR20200010993A (ko) * | 2018-07-11 | 2020-01-31 | 삼성전자주식회사 | 보완된 cnn을 통해 이미지 속 얼굴의 속성 및 신원을 인식하는 전자 장치. |
CN110287942A (zh) * | 2019-07-03 | 2019-09-27 | 成都旷视金智科技有限公司 | 年龄估计模型的训练方法、年龄估计方法以及对应的装置 |
Non-Patent Citations (2)
Title |
---|
李大湘;马宣;任娅琼;刘颖;: "基于深度代价敏感CNN的年龄估计算法", 模式识别与人工智能, no. 02 * |
赵一丁;田森平;: "基于分类与回归混合模型的人脸年龄估计方法", 计算机应用, no. 07 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112766238A (zh) * | 2021-03-15 | 2021-05-07 | 电子科技大学中山学院 | 年龄预测方法及装置 |
CN112766238B (zh) * | 2021-03-15 | 2023-09-26 | 电子科技大学中山学院 | 年龄预测方法及装置 |
CN113076823A (zh) * | 2021-03-18 | 2021-07-06 | 深圳数联天下智能科技有限公司 | 一种年龄预测模型的训练方法、年龄预测方法及相关装置 |
CN113076823B (zh) * | 2021-03-18 | 2023-12-12 | 深圳数联天下智能科技有限公司 | 一种年龄预测模型的训练方法、年龄预测方法及相关装置 |
CN113221645A (zh) * | 2021-04-07 | 2021-08-06 | 深圳数联天下智能科技有限公司 | 目标模型训练方法、人脸图像生成方法以及相关装置 |
CN113221645B (zh) * | 2021-04-07 | 2023-12-12 | 深圳数联天下智能科技有限公司 | 目标模型训练方法、人脸图像生成方法以及相关装置 |
CN113920562A (zh) * | 2021-09-24 | 2022-01-11 | 深圳数联天下智能科技有限公司 | 年龄预测模型的训练方法、年龄预测方法及装置 |
CN113920562B (zh) * | 2021-09-24 | 2024-04-30 | 深圳数联天下智能科技有限公司 | 年龄预测模型的训练方法、年龄预测方法及装置 |
CN115171204A (zh) * | 2022-09-06 | 2022-10-11 | 北京鹰瞳科技发展股份有限公司 | 对预测视网膜年龄的预测模型进行训练的方法和相关产品 |
Also Published As
Publication number | Publication date |
---|---|
CN111881737B (zh) | 2023-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111881737B (zh) | 年龄预测模型的训练方法及装置、年龄预测方法及装置 | |
US20200372243A1 (en) | Image processing method and apparatus, facial recognition method and apparatus, and computer device | |
CN109063742B (zh) | 蝴蝶识别网络构建方法、装置、计算机设备及存储介质 | |
CN110516541B (zh) | 文本定位方法、装置、计算机可读存储介质和计算机设备 | |
US20230022387A1 (en) | Method and apparatus for image segmentation model training and for image segmentation | |
CN112259247B (zh) | 对抗网络训练、医疗数据补充方法、装置、设备及介质 | |
CN112149797B (zh) | 神经网络结构优化方法和装置、电子设备 | |
CN111368937A (zh) | 图像分类方法、装置、及其训练方法、装置、设备、介质 | |
CN113807353B (zh) | 图像转换模型训练方法、装置、设备及存储介质 | |
CN113221645B (zh) | 目标模型训练方法、人脸图像生成方法以及相关装置 | |
CN109711381B (zh) | 遥感图像的目标识别方法、装置和计算机设备 | |
CN110942067A (zh) | 文本识别方法、装置、计算机设备和存储介质 | |
CN113850263A (zh) | 基于图像识别的车型预测方法、装置、设备及介质 | |
CN113434648A (zh) | 文本分类模型的元学习方法、装置、设备及存储介质 | |
CN111178162B (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN113011532A (zh) | 分类模型训练方法、装置、计算设备及存储介质 | |
CN113076823B (zh) | 一种年龄预测模型的训练方法、年龄预测方法及相关装置 | |
CN112183525A (zh) | 一种文本识别模型的构建及文本识别方法和装置 | |
CN115169334A (zh) | 意图识别模型训练方法、装置、计算机设备及存储介质 | |
CN113221662B (zh) | 人脸识别模型的训练方法及装置、存储介质、终端 | |
CN113077379B (zh) | 特征潜码的提取方法及装置、设备及存储介质 | |
CN115374278A (zh) | 文本处理模型蒸馏方法、装置、计算机设备及介质 | |
CN114419691A (zh) | 人脸衰老图像的生成方法、模型训练方法、设备和介质 | |
CN114782758B (zh) | 图像处理模型训练方法、系统、计算机设备及存储介质 | |
CN113011555B (zh) | 一种数据处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |