CN112329693A - 性别年龄识别模型的训练方法、识别方法、介质及设备 - Google Patents
性别年龄识别模型的训练方法、识别方法、介质及设备 Download PDFInfo
- Publication number
- CN112329693A CN112329693A CN202011289018.XA CN202011289018A CN112329693A CN 112329693 A CN112329693 A CN 112329693A CN 202011289018 A CN202011289018 A CN 202011289018A CN 112329693 A CN112329693 A CN 112329693A
- Authority
- CN
- China
- Prior art keywords
- age
- gender
- training
- identification model
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 161
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000002372 labelling Methods 0.000 claims abstract description 23
- 230000001815 facial effect Effects 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000036548 skin texture Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/178—Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种性别年龄识别模型的训练方法、识别方法、介质及设备;所述性别年龄识别模型的训练方法包括:获取多张训练图像;其中,所述训练图像包含人的面部区域;对各所述训练图像进行标注,以获取各所述训练图像对应的年龄标签和性别标签;其中,所述性别标签包括男性和女性,所述年龄标签为一服从高斯分布的年龄标签;利用所述训练图像及其标注结果,对所述性别年龄识别模型进行训练。训练完成后的性别年龄识别模型即可实现对人脸图像中人物的性别和年龄进行识别。
Description
技术领域
本发明属于数据识别领域,涉及一种识别方法,特别是涉及一种性别年龄识别模型的训练方法、识别方法、介质及设备。
背景技术
人脸年龄性别因为具有语义特征明显且短期不变的特性而成为描述一个行人身份的重要特征。人脸性别识别和年龄估计在智能商业、视频监控、社交媒体、推荐系统、人口统计等领域中都有着极大的优势和广泛的应用前景。例如在智能商业常见的商场客流分析系统中,依据被动式摄像头抓取的顾客人脸图像,分析识别顾客的年龄性别,统计出顾客群体的年龄性别信息,再配合客流量统计可以分析得到各店铺到店顾客的年龄性别分布,年龄性别信息更加丰富了顾客画像数据,依据这些精准的顾客画像可以推出更符合用户关注和需求的产品,也可以为商场的运营决策提供重要的数据支撑、甚至盈利变现。然而,发明人在应用中发现,现有的识别技术很难实现对人物的性别和年龄进行识别,因此,有必要设计一种性别年龄识别模型并对其进行训练,以便实现对人脸图像中人物的性别和年龄进行识别。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种性别年龄识别模型的训练方法、识别方法、介质及设备,用于解决现有技术中难以实现对人脸图像中人物的性别和年龄进行识别的问题。
为实现上述目的及其他相关目的,本发明的第一方面提供一种性别年龄识别模型的训练方法,用于对一性别年龄识别模型进行训练;所述性别年龄识别模型为一分类器模型,用于对输入的人脸图像进行识别以获取该人脸图像中人物的年龄和性别;所述性别年龄识别模型的训练方法包括:获取多张训练图像;其中,所述训练图像包含人的面部区域;对各所述训练图像进行标注,以获取各所述训练图像对应的年龄标签和性别标签;其中,所述性别标签包括男性和女性,所述年龄标签为一服从高斯分布的年龄标签;利用所述训练图像及其标注结果,对所述性别年龄识别模型进行训练。
于所述第一方面的一实施例中,所述性别年龄识别模型包括:输入层;共享特征获取子网络,与所述输入层相连,用于获取年龄分类子网络和性别分类子网络的共享特征;年龄分类子网络,与所述共享特征获取子网络相连,用于根据所述共享特征获取年龄识别结果;性别分类子网络,与所述共享特征获取子网络相连,用于根据所述共享特征获取性别识别结果。
于所述第一方面的一实施例中,在对所述性别年龄识别模型进行训练的过程中所采用的损失函数为:losstotal=α×lossage+β×lossgender;其中,lossage和lossgender分别为所述年龄分类子网络和所述性别分类子网络的损失函数,且所述年龄标签总共有n类,xi表示所述年龄分类子网络输出的第i类年龄标签的概率,yi表示第i类年龄标签的真实概率,C表示男性和女性两类性别标签,ai表示所述性别分类子网络输出的第i类性别标签的概率,bi表示第i类性别标签的真实概率,α和β分别为年龄权重参数和性别权重参数。
于所述第一方面的一实施例中,获取任一所述训练图像对应的年龄标签的实现方法包括:标注所述人脸图像对应的年龄;根据所述人脸图像对应的年龄,计算一服从高斯分布的年龄概率序列;所述年龄概率序列即为所述人脸图像对应的年龄标签。
于所述第一方面的一实施例中,在对所述性别年龄识别模型进行训练的过程中,使用自适应矩估计优化器对所述性别年龄识别模型进行训练,并采用梯度反向传播算法使损失下降,直到损失不再下降或者分类精度达到预设要求时停止训练。
于所述第一方面的一实施例中,在获取多张训练图像以后,所述性别年龄识别模型的训练方法还包括:对所述训练图像进行预处理。
本发明的第二方面提供一种性别年龄识别方法,所述性别年龄识别方法包括:获取待识别的人脸图像;利用一性别年龄识别模型对所述待识别的人脸图像进行识别,以获取其中人物的年龄和性别;其中,所述性别年龄识别模型采用本发明第一方面任一项所述性别年龄识别模型的训练方法进行训练得到。
本发明的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明第一方面任一项所述性别年龄识别模型的训练方法,和/或本发明第二方面所述的性别年龄识别方法。
本发明的第四方面提供一种电子设备,其特征在于,所述电子设备包括:存储器,存储有一计算机程序;处理器,与所述存储器通信相连,调用所述计算机程序时执行本发明第一方面任一项所述性别年龄识别模型的训练方法,和/或本发明第二方面所述的性别年龄识别方法;显示器,与所述处理器和所述存储器通信相连,用于显示所述性别年龄识别模型的训练方法,和/或所述性别年龄识别方法的相关GUI交互界面。
如上所述,本发明所述性别年龄识别模型的训练方法、识别方法、介质及设备的一个技术方案具有以下有益效果:
所述性别年龄识别模型的训练方法用于对一性别年龄识别模型进行训练,通过获取多张训练图像并对各所述训练图像进行标注来获取各训练图像对应的年龄标签和性别标签,在此基础上,所述性别年龄识别模型的训练方法能够利用所述训练图像及其标注结果对所述性别年龄识别模型进行训练。训练完成后的性别年龄识别模型即可实现对人脸图像中人物的性别和年龄进行识别。
附图说明
图1A显示为本发明所述性别年龄识别模型的训练方法于一具体实施例中的流程图。
图1B显示为本发明所述性别年龄识别模型的训练方法于一具体实施例中获取的年龄标签的示例图。
图1C显示为本发明所述性别年龄识别模型的训练方法于一具体实施例中获取的又一年龄标签的示例图。
图2A显示为本发明所述性别年龄识别模型的训练方法于一具体实施例中的性别年龄识别模型的结构图。
图2B显示为本发明所述性别年龄识别模型的训练方法于一具体实施例中的Resnet18网络的结构图。
图2C显示为本发明所述性别年龄识别模型的训练方法于一具体实施例中的年龄分类子网络的结构图。
图2D显示为本发明所述性别年龄识别模型的训练方法于一具体实施例中的性别分类子网络的结构图。
图3显示为本发明所述性别年龄识别模型的训练方法于一具体实施例中获取年龄标签的流程图。
图4显示为本发明所述性别年龄识别模型的训练方法于一具体实施例中的流程图。
图5显示为本发明所述性别年龄识别方法于一具体实施例中的流程图。
图6显示为本发明所述电子设备于一具体实施例中的结构示意图。
元件标号说明
2 性别年龄识别模型
21 输入层
22 共享特征获取子网络
23 年龄分类子网络
231 全连接层
232 输出层
24 性别分类子网络
241 全连接层
242 输出层
600 电子设备
610 存储器
620 处理器
630 显示器
S11~S13 步骤
S31~S32 步骤
S41~S46 步骤
S51~S52 步骤
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,图示中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。此外,此外,在本文中,诸如“第一”、“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
现有的识别技术很难实现对人物的性别和年龄进行识别,因此,有必要设计一种性别年龄识别模型并对其进行训练,以便实现对人脸图像中人物的性别和年龄进行识别。针对这一问题,本发明提供一种性别年龄识别模型的训练方法,所述性别年龄识别模型的训练方法用于对一性别年龄识别模型进行训练,通过获取多张训练图像并对各所述训练图像进行标注来获取各训练图像对应的年龄标签和性别标签,在此基础上,所述性别年龄识别模型的训练方法能够利用所述训练图像及其标注结果对所述性别年龄识别模型进行训练。训练完成后的性别年龄识别模型即可实现对人脸图像中人物的性别和年龄进行识别。
于本发明的一实施例中,所述性别年龄识别模型的训练方法用于对一性别年龄识别模型进行训练,所述性别年龄识别模型为一分类器模型,用于对输入的人脸图像进行识别以获取该人脸图像中人物的年龄和性别。具体地,请参阅图1A,本实施例中所述性别年龄识别模型的训练方法包括:
S11,获取多张训练图像;其中,各所述训练图像均包含人的面部区域。所述训练图像可以为同一用户的图像,也可以为不同用户的图像;所述训练图像可以包含完整的面部区域,也可以包含部分面部区域。
S12,对各所述训练图像进行标注,以获取各所述训练图像对应的年龄标签和性别标签;其中,所述性别标签包括男性和女性,所述年龄标签为一服从高斯分布的年龄标签。在具体应用中,可以采用人工标注的方式获取所述年龄标签和所述性别标签。
本实施例中,所述训练图像对应的性别标签用于标识所述训练图像中人物的性别,例如:所述性别标签可以为0和1,其中,0表示所述训练图像中人物的性别为男性,1表示所述训练图像中人物的性别为女性。
所述训练图像对应的年龄标签用于标识所述训练图像中人物的年龄。所述服从高斯分布的年龄标签是指该年龄标签并非一特定的年龄,而是一服从高斯分布的年龄概率序列;例如,请参阅图1B和图1C,分别显示为本实施例中涉及的两个年龄标签,其中,第1个年龄标签是以1岁为中心的服从高斯分布的年龄概率序列,第2个年龄标签是以30岁为中心的服从高斯分布的年龄概率序列。需要说明的是,由于服从高斯分布的序列是左右对称的,因此,本实施例在获取所述训练图像对应的年龄标签时需要对超出年龄范围的数值进行删除,以使所述年龄概率序列在一个合理的范围内,例如:可以删除[0,100]以外的所有数据。此外,为便于数据处理,所述服从高斯分布的年龄概率序列优选为归一化到[0,1]的区间范围内。
S13,利用所述训练图像及其标注结果,对所述性别年龄识别模型进行训练。其中,所述训练图像的标注结果包括所述训练图像对应的年龄标签和性别标签。具体地,步骤S13可以将所有的训练图像及其标注结果划分为训练数据集和测试数据集,其中,所述训练数据集用于训练所述性别年龄识别模型,所述测试数据集用于测试训练后的所述性别年龄识别模型。
在步骤S13中对所述性别年龄识别模型的训练完成以后,所述性别年龄识别模型即可用于对人脸图像中人物的年龄和性别进行识别。
根据以上描述可知,本实施例所述性别年龄识别模型的训练方法用于对一性别年龄识别模型进行训练,通过获取多张训练图像并对各所述训练图像进行标注来获取各训练图像对应的年龄标签和性别标签,在此基础上,所述性别年龄识别模型的训练方法能够利用所述训练图像及其标注结果对所述性别年龄识别模型进行训练。训练完成后的性别年龄识别模型即可实现对人脸图像中人物的性别和年龄进行识别。
在一些实施例中,通过将人脸年龄性别识别任务分成年龄和性别两个分类任务,分别设计两个网络模型进行训练学习,并针对年龄和性别属性进行单独的数据调优,然而这种方式忽略了人脸年龄和性别属性之间的相互依赖关系,而且计算性能和效率也低。针对这一问题,请参阅图2A,于本发明的一实施例中,所述性别年龄识别模型2包括输入层21、共享特征获取子网络22、年龄分类子网络23和性别分类子网络24。
在训练过程中,所述输入层21用于输入训练图像;在实际应用中,所述输入层21用于输入待识别的图像。
所述共享特征获取子网络22与所述输入层21的输出端相连,用于获取年龄分类子网络23和性别分类子网络24的共享特征。人物的年龄与性别两个属性之间存在关联,因此,所述年龄分类子网络23和性别分类子网络24之间存在共同的低层特征(即:共享特征),基于此,本实施例采用所述共享特征获取子网络22来获取该共享特征。
在具体应用中,所述共享特征获取子网络22可以通过CNN网络实现。优选地,为了提高所述性别年龄识别模型的运行速度,可以采用轻量级的神经网络来实现所述共享特征获取子网络22,例如:Resnet18、Mobilenet等。请参阅图2B,显示为可用于本实施例的一种Resnet18网络结构,该网络通过对输入层21输入的图像进行处理来获取512维的共享特征数据。在具体应用中,也可以根据实际需求设置共享特征数据的维度,而非局限于上述512维。
所述年龄分类子网络23与所述共享特征获取子网络22相连,用于根据所述共享特征获取年龄识别结果,其中,所述年龄识别结果包括一个年龄段以及该年龄段中各个年龄所对应的概率。例如,请参阅图2C,所述年龄分类子网络23由两个全连接层(FC)231和1个输出层232组成;此时,所述年龄分类子网络23的输出为一100维的数据,分别表示年龄1岁到100岁的概率值。需要说明的是,在具体应用中可以根据需求设置所述年龄分类子网络23输出的数据的维度。
所述性别分类子网络24与所述共享特征获取子网络22相连,用于根据所述共享特征获取所述性别识别结果,其中,所述性别识别结果为一个2维的数据,分别表示性别为男性和女性的概率。例如,请参阅图2D,所述性别分类子网络24由两个全连接层(FC)241和1个输出层242组成。
根据以上描述可知,本实施例所述性别年龄识别模型可以采用所述共享特征获取子网络来获取年龄分类子网络和性别分类子网络共享的低层特征,通过这种方式能够使得模型建立年龄属性和性别属性的相关性来提升模型性能。在此基础上,本实施例分别采用年龄分类子网络和性别分类子网络来获取年龄识别结果和性别识别结果。因此,用户只需设计并训练一个模型即可同时实现年龄和性别的识别,有利于降低工作量;此外,本实施例可以选取Resnet18等轻量级网络来获取所述共享特征,有利于进一步提升计算性能和效率。
此外,在一些实施例中采用softmax交叉熵损失函数来训练年龄分类和性别分类。在性别识别过程中,男性和女性两个类别是互斥的(即一张人脸图像只能是男性或者女性),因而可以采用softmax交叉熵损失函数来处理这种互斥的分类问题。然而,在年龄识别过程中,识别一张人脸图像中的人物的年龄,人的主观意识往往会从人脸的稚嫩成熟衰老、肤质纹理、妆容打扮等多方面综合区判断,从而估算出一个年龄段,在此过程中很难得到一个准确的年龄数字。然而,softmax交叉熵损失函数仅适用于互斥的分类问题,因此,如果采用softmax交叉熵损失函数来训练年龄分类,则模型会朝着互斥的年龄标签去收敛,这必然会带来一些年龄分类精度上的损失。
针对这一问题,于本发明的一实施例中,将所述年龄标签配置为一符合高斯分布的年龄概率序列,并在对所述性别年龄识别模型进行训练的过程中采用以下损失函数:losstotal=α×lossage+β×lossgender;其中,α和β分别为年龄权重参数和性别权重参数,其取值可以根据实际需求设置,lossage和lossgender分别为年龄分类子网络和性别分类子网络的损失函数,且所述年龄标签总共有n类,xi表示所述年龄分类子网络输出的第i类年龄标签的概率,yi表示第i类年龄标签的真实概率,C表示男性和女性两类性别标签,ai表示所述性别分类子网络输出的第i类性别标签的概率,bi表示第i类性别标签的真实概率。
在本实施例中,第i类年龄标签的真实概率和第i类性别标签的真实概率可以通过人工标注获取。例如,对于一张训练图像,采用人工方式对其性别进行标注的结果为男性,则男性这一性别标签的真实概率为1,女性这一性别标签的真实概率为0。
根据以上描述可以看出,本实施例在所述性别分类子网络中采用softmax交叉熵损失函数方式训练,在所述年龄分类子网络中基于服从高斯分布的年龄标签并采用sigmoid二进制交叉熵损失函数方式进行训练,并通过年龄权重参数和性别权重参数调节二者在整体模型中所占的权重。因此,本实施例可以采用所述服从高斯分布的年龄标签来加强人脸图像中各年龄特征之间的相关性,从而去除因使用互斥年龄标签而导致的精度损失。
从人眼的角度判断人脸图像的性别往往要比判断年龄更加容易,因此,对于所述性别年龄识别模型来说,对年龄属性和性别属性的训练难度是不同的。在一些实施例中往往依据经验来设置固定的年龄权重参数和性别权重参数从而调节所述性别年龄识别模型对年龄属性和性别属性的关注程度,提升网络对困难任务(年龄估计)的学习,避免简单任务(性别估计)的过拟合,但是根据经验来设置权重参数这种方式无法准确量化两种任务的训练难以程度,且手动设置权重参数也过度依赖于经验,很可能会因为人的主观判断失误而导致误差。针对这一问题,于本发明的一实施例中,所述年龄权重参数和所述性别权重参数根据所述年龄分类子网络和所述性别分类子网络的损失函数自适应调整,且 其中,lossavg为lossage和lossgender的平均值。
本实施例通过采用自适应调整的权重参数,使得所述性别年龄识别模型能够自适应地训练年龄和性别两个不同难度的任务,并使得该模型在实现在对年龄估计这一困难任务进行挖掘的同时,提升性别识别这一简单任务的泛化能力,进而提升总体性别年龄识别的进度。
请参阅图3,于本发明的一实施例中,获取任一所述训练图像对应的年龄标签的实现方法包括:
S31,标注所述人脸图像对应的年龄;该标注过程可以通过人工方式实现。
S32,根据所述人脸图像对应的年龄,计算一服从高斯分布的年龄概率序列;所述年龄概率序列即为所述人脸图像对应的年龄标签。其中,所述年龄概率序列的一种计算方法为:其中,age是步骤S31中标注的年龄,var表示年龄分布的幅度,该幅度值可以根据经验设置。
于本发明的一实施例中,在对所述性别年龄识别模型进行训练的过程中,使用自适应矩估计(Adam)优化器对所述性别年龄识别模型进行训练,并采用梯度反向传播(BackPropagation,BP)算法使损失下降,直到损失不再下降或者分类精度达到预设要求时停止训练。其中,Adam是一种对随机目标函数执行一阶梯度优化的算法,该算法基于适应性低阶矩估计,并且具有容易实现、很高的计算效率和较低的内存需求等优点。
于本发明的一实施例中,在获取多张训练图像以后,所述性别年龄识别模型的训练方法还包括对所述训练图像进行预处理。
可选的,所述预处理操作包括从所述训练图像中提取人脸区域,并对人脸进行矫正。
可选的,所述预处理操作包括将所述训练图像缩放成固定尺寸,所述固定尺寸例如为112×112像素;和/或将所述训练图像中的各像素点的像素值减去像素均值并归一化到[-1,1]的区间范围。
请参阅图4,于本发明的一实施例中,所述性别年龄识别模型的训练方法包括:
S41,获取训练数据集和测试数据集。具体地,该步骤包括获取包含人脸区域的训练图像,使用人脸检测工具提取训练图像中的人脸区域,并对人脸进行矫正,人工标注图像年龄性别,依据标注的年龄计算服从高斯分布的年龄标签,建立人脸图像性别年龄识别模型的训练数据集和测试数据集。
S42,图像预处理操作。所述图像预处理操作例如将所述训练图像缩放成固定尺寸,并将其中各像素点的像素值减去像素均值并归一化到[-1,1]的区间内。
S43,定义年龄性别模型中的损失函数。其中,性别的损失函数使用softmax交叉熵损失函数,年龄的损失函数采用sigmoid二进制交叉熵损失函数,并采用自适应权重的方式动态调整两种训练任务的比重。
S44,构建性别年龄识别模型并对其进行参数初始化。具体地,载入Resnet18网络作为获取年龄性别低层共享特征的共享特征获取子网络,初始权重值参数为Resnet18在ImageNet上的预训练权重;分别使用两层全连接网络构建年龄分类子网络和性别分类子网络,其中权重采用均值为0、均方差为0.01的正态分布进行初始化,偏差采用0进行初始化。
S45,使用Adam优化器训练所述性别年龄识别模型,计算网络损失,每次梯度反向传播使损失下降,直到损失不再下降或者精度达到要求时停止训练。
S46,采用步骤S41中获取的测试数据及对所述性别年龄识别模型进行评估,并挑选最优模型作为最终的识别模型,该最终的识别模型能够对实际中的人脸图像进行性别识别和年龄识别。
根据以上描述可知,本实施例所述性别年龄识别模型的训练方法为一基于高斯分布的年龄标签和损失自适应权重的训练方法,该方法能够在不明显增加计算量的前提下,有效地提升人脸图像性别年龄识别的准确率。一方面,采用高斯分布的年龄标签并使用sigmoid二进制交叉熵损失函数训练年龄分类子网络,而非采用互斥的年龄标签并使用softmax交叉熵损失函数来训练年龄分类子网络,能够加强人脸图像各年龄之间的相关性,使得网络能够最大化的利用各年龄之间的关系提升网络性能,因而可以去除使用互斥年龄标签训练带来的精度损失。另一方面,在一些实施例中可以采用自适应权重参数的方法让网络在训练过程中动态调整两种识别任务在前向过程中所占的损失权重,而非采用固定权重方式,能够实现自适应地训练不同难度的任务,使得所述性别年龄识别模型在实现困难任务(年龄估计)挖掘的同时,能够提升简单任务(性别识别)的泛化能力。
基于以上对所述性别年龄识别的训练方法的描述,本发明还提供一种性别年龄识别方法。请参阅图5,于本发明的一实施例中,所述性别年龄识别方法包括:
S51,获取待识别的人脸图像。优选地,所述待识别的人脸图像包括完整的人脸区域。需要说明的是,所述待识别的人脸图像中也可以包括人脸区域之外的图像,例如可以为人物的半身像或者全身像。
S52,利用一性别年龄识别模型对所述待识别的人脸图像进行识别,以获取其中人物的年龄和性别;其中,所述性别年龄识别模型可以通过图1A所示的性别年龄识别模型的训练方法进行训练得到。
优选地,在步骤S52以前,所述性别年龄识别方法还包括对所述待识别的人脸图像进行预处理。其中,所述预处理可以包括:使用人脸检测工具获取所述待识别的人脸图像中的人脸区域、进行人脸矫正、将所述待识别的人脸图像缩放成固定尺寸和/或将所述待识别的人脸图像中的像素点的像素值归一化。
基于以上对所述性别年龄识别模型的训练方法的描述,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明所述性别年龄识别模型的训练方法,和/或本发明所述的性别年龄识别方法。
基于以上对所述性别年龄识别模型的训练方法的描述,本发明还提供一种电子设备。请参阅图6,于本发明的一实施例中,所述电子设备600包括:存储器610,存储有一计算机程序;处理器620,与所述存储器610通信相连,调用所述计算机程序时执行本发明所述性别年龄识别模型的训练方法,和/或本发明所述的性别年龄识别方法;显示器630,与所述处理器620和所述存储器610通信相连,用于显示所述性别年龄识别模型的训练方法,和/或所述性别年龄识别方法的相关GUI交互界面。
本发明所述的性别年龄识别模型的训练方法和所述性别年龄识别方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本发明的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本发明的保护范围内。
本发明所述性别年龄识别模型的训练方法用于对一性别年龄识别模型进行训练,通过获取多张训练图像并对各所述训练图像进行标注来获取各训练图像对应的年龄标签和性别标签,在此基础上,所述性别年龄识别模型的训练方法能够利用所述训练图像及其标注结果对所述性别年龄识别模型进行训练。训练完成后的性别年龄识别模型即可实现对人脸图像中人物的性别和年龄进行识别。
综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (10)
1.一种性别年龄识别模型的训练方法,其特征在于,用于对一性别年龄识别模型进行训练;所述性别年龄识别模型为一分类器模型,用于对输入的人脸图像进行识别以获取该人脸图像中人物的年龄和性别;所述性别年龄识别模型的训练方法包括:
获取多张训练图像;其中,所述训练图像包含人的面部区域;
对各所述训练图像进行标注,以获取各所述训练图像对应的年龄标签和性别标签;其中,所述性别标签包括男性和女性,所述年龄标签为一服从高斯分布的年龄标签;
利用所述训练图像及其标注结果,对所述性别年龄识别模型进行训练。
2.根据权利要求1所述的性别年龄识别模型的训练方法,其特征在于,所述性别年龄识别模型包括:
输入层;
共享特征获取子网络,与所述输入层相连,用于获取年龄分类子网络和性别分类子网络的共享特征;
年龄分类子网络,与所述共享特征获取子网络相连,用于根据所述共享特征获取年龄识别结果;
性别分类子网络,与所述共享特征获取子网络相连,用于根据所述共享特征获取性别识别结果。
5.根据权利要求1所述的性别年龄识别模型的训练方法,其特征在于,获取任一所述训练图像对应的年龄标签的实现方法包括:
标注所述人脸图像对应的年龄;
根据所述人脸图像对应的年龄,计算一服从高斯分布的年龄概率序列;所述年龄概率序列即为所述人脸图像对应的年龄标签。
6.根据权利要求1所述的性别年龄识别模型的训练方法,其特征在于在:在对所述性别年龄识别模型进行训练的过程中,使用自适应矩估计优化器对所述性别年龄识别模型进行训练,并采用梯度反向传播算法使损失下降,直到损失不再下降或者分类精度达到预设要求时停止训练。
7.根据权利要求1所述的性别年龄识别模型的训练方法,其特征在于,在获取多张训练图像以后,所述性别年龄识别模型的训练方法还包括:对所述训练图像进行预处理。
8.一种性别年龄识别方法,其特征在于,所述性别年龄识别方法包括:
获取待识别的人脸图像;
利用一性别年龄识别模型对所述待识别的人脸图像进行识别,以获取其中人物的年龄和性别;其中,所述性别年龄识别模型采用权利要求1-7任一项所述性别年龄识别模型的训练方法进行训练得到。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:该程序被处理器执行时实现权利要求1至7任一项所述性别年龄识别模型的训练方法,和/或权利要求8所述的性别年龄识别方法。
10.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储有一计算机程序;
处理器,与所述存储器通信相连,调用所述计算机程序时执行权利要求1-7任一项所述性别年龄识别模型的训练方法,和/或权利要求8所述的性别年龄识别方法;
显示器,与所述处理器和所述存储器通信相连,用于显示所述性别年龄识别模型的训练方法,和/或所述性别年龄识别方法的相关GUI交互界面。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011289018.XA CN112329693B (zh) | 2020-11-17 | 2020-11-17 | 性别年龄识别模型的训练方法、识别方法、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011289018.XA CN112329693B (zh) | 2020-11-17 | 2020-11-17 | 性别年龄识别模型的训练方法、识别方法、介质及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112329693A true CN112329693A (zh) | 2021-02-05 |
CN112329693B CN112329693B (zh) | 2024-01-19 |
Family
ID=74322538
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011289018.XA Active CN112329693B (zh) | 2020-11-17 | 2020-11-17 | 性别年龄识别模型的训练方法、识别方法、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112329693B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140099029A1 (en) * | 2012-10-05 | 2014-04-10 | Carnegie Mellon University | Face Age-Estimation and Methods, Systems, and Software Therefor |
CN106960181A (zh) * | 2017-02-28 | 2017-07-18 | 中科唯实科技(北京)有限公司 | 一种基于rgbd数据的行人属性识别方法 |
CN107844781A (zh) * | 2017-11-28 | 2018-03-27 | 腾讯科技(深圳)有限公司 | 人脸属性识别方法及装置、电子设备及存储介质 |
CN108573209A (zh) * | 2018-02-28 | 2018-09-25 | 天眼智通(香港)有限公司 | 一种基于人脸的单模型多输出的年龄性别识别方法及系统 |
CN109034078A (zh) * | 2018-08-01 | 2018-12-18 | 腾讯科技(深圳)有限公司 | 年龄识别模型的训练方法、年龄识别方法及相关设备 |
CN109670437A (zh) * | 2018-12-14 | 2019-04-23 | 腾讯科技(深圳)有限公司 | 年龄预估模型训练方法、面部图像识别方法及装置 |
WO2019109526A1 (zh) * | 2017-12-06 | 2019-06-13 | 平安科技(深圳)有限公司 | 人脸图像的年龄识别方法、装置及存储介质 |
CN111126207A (zh) * | 2019-12-12 | 2020-05-08 | 北京金山云网络技术有限公司 | 年龄估计模型的训练方法、装置及电子设备 |
CN111191526A (zh) * | 2019-12-16 | 2020-05-22 | 汇纳科技股份有限公司 | 行人属性识别网络训练方法、系统、介质及终端 |
CN111242091A (zh) * | 2020-02-13 | 2020-06-05 | 京东方科技集团股份有限公司 | 年龄识别模型训练方法、装置及电子设备 |
CN111626303A (zh) * | 2020-05-29 | 2020-09-04 | 南京甄视智能科技有限公司 | 性别和年龄的识别方法、装置、存储介质及服务器 |
CN111695415A (zh) * | 2020-04-28 | 2020-09-22 | 平安科技(深圳)有限公司 | 图像识别模型的构建方法、识别方法及相关设备 |
CN111914772A (zh) * | 2020-08-06 | 2020-11-10 | 北京金山云网络技术有限公司 | 识别年龄的方法、年龄识别模型的训练方法和装置 |
-
2020
- 2020-11-17 CN CN202011289018.XA patent/CN112329693B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140099029A1 (en) * | 2012-10-05 | 2014-04-10 | Carnegie Mellon University | Face Age-Estimation and Methods, Systems, and Software Therefor |
CN106960181A (zh) * | 2017-02-28 | 2017-07-18 | 中科唯实科技(北京)有限公司 | 一种基于rgbd数据的行人属性识别方法 |
CN107844781A (zh) * | 2017-11-28 | 2018-03-27 | 腾讯科技(深圳)有限公司 | 人脸属性识别方法及装置、电子设备及存储介质 |
WO2019109526A1 (zh) * | 2017-12-06 | 2019-06-13 | 平安科技(深圳)有限公司 | 人脸图像的年龄识别方法、装置及存储介质 |
CN108573209A (zh) * | 2018-02-28 | 2018-09-25 | 天眼智通(香港)有限公司 | 一种基于人脸的单模型多输出的年龄性别识别方法及系统 |
CN109034078A (zh) * | 2018-08-01 | 2018-12-18 | 腾讯科技(深圳)有限公司 | 年龄识别模型的训练方法、年龄识别方法及相关设备 |
CN109670437A (zh) * | 2018-12-14 | 2019-04-23 | 腾讯科技(深圳)有限公司 | 年龄预估模型训练方法、面部图像识别方法及装置 |
CN111126207A (zh) * | 2019-12-12 | 2020-05-08 | 北京金山云网络技术有限公司 | 年龄估计模型的训练方法、装置及电子设备 |
CN111191526A (zh) * | 2019-12-16 | 2020-05-22 | 汇纳科技股份有限公司 | 行人属性识别网络训练方法、系统、介质及终端 |
CN111242091A (zh) * | 2020-02-13 | 2020-06-05 | 京东方科技集团股份有限公司 | 年龄识别模型训练方法、装置及电子设备 |
CN111695415A (zh) * | 2020-04-28 | 2020-09-22 | 平安科技(深圳)有限公司 | 图像识别模型的构建方法、识别方法及相关设备 |
CN111626303A (zh) * | 2020-05-29 | 2020-09-04 | 南京甄视智能科技有限公司 | 性别和年龄的识别方法、装置、存储介质及服务器 |
CN111914772A (zh) * | 2020-08-06 | 2020-11-10 | 北京金山云网络技术有限公司 | 识别年龄的方法、年龄识别模型的训练方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112329693B (zh) | 2024-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111898547B (zh) | 人脸识别模型的训练方法、装置、设备及存储介质 | |
CN110532900B (zh) | 基于U-Net和LS-CNN的人脸表情识别方法 | |
CN104298682B (zh) | 一种基于人脸表情图像的信息推荐效果的评价方法及手机 | |
CN109919830B (zh) | 一种基于美学评价的带参考人眼图像修复方法 | |
CN105046272B (zh) | 一种基于简洁非监督式卷积网络的图像分类方法 | |
CN110363084A (zh) | 一种上课状态检测方法、装置、存储介质及电子 | |
CN109740539B (zh) | 基于超限学习机和融合卷积网络的3d物体识别方法 | |
CN112668638A (zh) | 一种图像美学质量评估和语义识别联合分类方法及系统 | |
CN113011253B (zh) | 基于ResNeXt网络的人脸表情识别方法、装置、设备及存储介质 | |
CN106897706B (zh) | 一种情绪识别装置 | |
CN113011243A (zh) | 基于胶囊网络的面部表情分析方法 | |
CN110674716A (zh) | 图像识别方法、装置和存储介质 | |
CN112800979B (zh) | 一种基于表征流嵌入网络的动态表情识别方法及系统 | |
CN116993760A (zh) | 一种基于图卷积和注意力机制的手势分割方法、系统、设备及介质 | |
Anggoro et al. | Classification of Solo Batik patterns using deep learning convolutional neural networks algorithm | |
CN110795995A (zh) | 数据处理方法、装置及计算机可读存储介质 | |
Cao | Face recognition robot system based on intelligent machine vision image recognition | |
CN112329693B (zh) | 性别年龄识别模型的训练方法、识别方法、介质及设备 | |
CN113723093B (zh) | 人员管理策略推荐方法、装置、计算机设备及存储介质 | |
Jin et al. | Blind image quality assessment for multiple distortion image | |
CN113568983B (zh) | 场景图生成方法、装置、计算机可读介质及电子设备 | |
CN114219977A (zh) | 一种年龄估计方法、系统、电子设备及存储介质 | |
Siddhartha | Digit recognition of MNIST handwritten using convolutional neural networks (CNN) | |
CN114692715A (zh) | 一种样本标注方法及装置 | |
CN111967513B (zh) | 一种基于注意力的零样本图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 201203 No. 6, Lane 55, Chuanhe Road, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai Applicant after: Winner Technology Co.,Ltd. Address before: 201505 Room 216, 333 Tingfeng Highway, Tinglin Town, Jinshan District, Shanghai Applicant before: Winner Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |