CN110717401A

CN110717401A - 年龄估计方法及装置、设备、存储介质

Info

Publication number: CN110717401A
Application number: CN201910866534.5A
Authority: CN
Inventors: 孙莹莹
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2019-09-12
Filing date: 2019-09-12
Publication date: 2020-01-21

Abstract

本申请实施例公开了年龄估计方法及装置、设备、存储介质，其中，所述方法包括：对待处理图像中的待预测对象进行面部区域处理，得到目标面部图像；将所述目标面部图像输入至已训练的目标模型的分类器中，得到所述待预测对象属于每一年龄类别的估计概率；通过所述目标模型中的加权器，将每一所述年龄类别与对应的估计概率之间的乘积进行累加，得到所述待预测对象的年龄估计值。

Description

年龄估计方法及装置、设备、存储介质

技术领域

本申请实施例涉及电子技术，涉及但不限于年龄估计方法及装置、设备、存储介质。

背景技术

人脸年龄估计的任务是对于给定的一张人脸图片，自动估计出准确的年龄值。人脸年龄估计在视频监控、人机交互、社交媒体与人脸检索等方面都有着广泛的应用。虽然这一问题已经被研究多年，但是给出一个准确的年龄估计值仍然具有较大的挑战。

发明内容

本申请实施例提供年龄估计方法及装置、设备、存储介质。本申请实施例的技术方案是这样实现的：

第一方面，本申请实施例提供一种年龄估计方法，所述方法包括：对待处理图像中的待预测对象进行面部区域处理，得到目标面部图像；将所述目标面部图像输入至已训练的目标模型的分类器中，得到所述待预测对象属于每一年龄类别的估计概率；通过所述目标模型中的加权器，将每一所述年龄类别与对应的估计概率之间的乘积进行累加，得到所述待预测对象的年龄估计值。

第二方面，本申请实施例提供一种年龄估计装置，包括：预处理模块，配置为对待处理图像中的待预测对象进行面部区域处理，得到目标面部图像；年龄估计模块，配置为将所述目标面部图像输入至已训练的目标模型的分类器中，得到所述待预测对象属于每一年龄类别的估计概率；所述年龄估计模块，配置为通过所述目标模型中的加权器，将每一所述年龄类别与对应的估计概率之间的乘积进行累加，得到所述待预测对象的年龄估计值。

第三方面，本申请实施例提供一种电子设备，包括存储器和处理器，所述存储器存储有可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述年龄估计方法中的步骤。

第四方面，本申请实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述年龄估计方法中的步骤。

本申请实施例中，在得到所述待预测对象的年龄分别是每一年龄类别的估计概率之后，充分利用了年龄的有序性和年龄之间的面部特征的关联性和相似性，通过所述目标模型中的加权器，将每一所述年龄类别与对应的估计概率之间的乘积进行累加，得到所述待预测对象的年龄估计值；如此，可以提高年龄估计精度，获得较高准确度的年龄估计值。

附图说明

图1为本申请实施例年龄估计方法的实现流程示意图；

图2为本申请实施例面部朝向与预设方向的关系示意图；

图3为本申请实施例模型训练阶段的实现流程示意图；

图4为本申请实施例年龄估计阶段的实现流程示意图；

图5A为本申请实施例年龄估计装置的组成结构示意图；

图5B为本申请实施例年龄估计装置的组成结构示意图；

图6为本申请实施例电子设备的一种硬件实体示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请的具体技术方案做进一步详细描述。以下实施例用于说明本申请，但不用来限制本申请的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

需要指出，本申请实施例所涉及的术语“第一\第二\第三”仅仅是为了区别不同的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

本申请实施例提供一种年龄估计方法，所述方法应用于电子设备，所述电子设备可以是智能手机、平板电脑、笔记本电脑、台式机、电视机、智能手表、机器人等具有信息处理能力的设备。所述年龄估计方法所实现的功能可以通过所述电子设备中的处理器调用程序代码来实现，当然程序代码可以保存在计算机存储介质中，可见，所述电子设备至少包括处理器和存储介质。

图1为本申请实施例年龄估计方法的实现流程示意图，如图1所示，所述方法至少包括以下步骤S101至步骤S103：

步骤S101，对待处理图像中的待预测对象进行面部区域处理，得到目标面部图像。

这里对于待预测对象的类型不做限定，待预测对象可以是任一人种的个体，例如待预测对象为黄种人、白种人或者黑种人；待预测对象还可以是动物，例如待预测对象为猿类等。以待预测对象是人类为例，得到的目标面部图像为人脸图像。在另一示例中，目标面部图像包括脸部区域和颈部区域。

所述电子设备还可以通过如下实施例中的步骤S201至步骤S203获得所述目标面部图像。

步骤S102，将所述目标面部图像输入至已训练的目标模型的分类器中，得到所述待预测对象属于每一年龄类别的估计概率。

需要说明的是，通常以年龄值来表示年龄类别，例如，通过步骤S102得到待预测对象分别是0岁、1岁、······、100岁的估计概率。

在相关技术中，对于年龄估计问题，常常被看作分类问题，即，通过分类器得到待预测对象属于每一预设年龄段的估计概率之后，直接将最大估计概率对应的年龄段作为最终的年龄估计结果输出。然而，这种基于分类的年龄估计方法，却忽视了年龄类别标签之间的关联性。也就是说，人脸衰老的过程是一个连续的过程，人脸是随着年龄增长而逐渐变化的。如果将年龄估计问题仅作为分类问题来做，无法得到一个准确的年龄估计值。

基于此，在本申请实施例中，所述电子设备在通过步骤S102得到所述待预测对象的年龄分别是每一年龄类别的估计概率之后，不是直接将最大估计概率对应的年龄类别作为最终的年龄估计结果输出，而是，执行步骤S103，通过目标模型中的加权器，将每一年龄类别与对应的估计概率之间的乘积进行累加，将累加和作为最终的年龄估计结果，如此就充分利用了年龄之间的关联性，从而得到一个较为准确的年龄估计值。

步骤S103，通过所述目标模型中的加权器，将每一所述年龄类别与对应的估计概率之间的乘积进行累加，得到所述待预测对象的年龄估计值。

需要说明的是，所述年龄估计值指的是具体的年龄，而不是年龄范围，例如，所述年龄估计值为29岁。在实现时，年龄类别可以被设置为0至100岁，从而通过如下公式(1)即可求得待预测对象的年龄估计值：

式中，E(O)表示加权器，o_i表示待预测对象的年龄是第i个年龄类别y_i的估计概率。

在本申请实施例中，在得到所述待预测对象属于每一年龄类别的估计概率之后，充分利用了年龄的有序性和年龄之间的面部特征的关联性和相似性，通过所述目标模型中的加权器，将每一所述年龄类别与对应的估计概率之间的乘积进行累加，得到所述待预测对象的年龄估计值；如此，可以提高年龄估计精度，获得较高准确度的年龄估计值。

本申请实施例再提供一种年龄估计方法，所述方法至少包括以下步骤S201至步骤S205：

步骤S201，识别待处理图像中的待预测对象的面部区域。

在实现时，可以通过预设的人脸检测算法，检测待处理图像中的待预测对象的面部区域。例如，人脸检测算法为Adaboost算法、基于彩色信息的人脸检测方法、基于人脸形状的人脸检测方法、或基于人脸关键点的人脸检测方法。

步骤S202，从所述待处理图像中截取所述面部区域，得到样本面部图像。

步骤S203，对所述样本面部图像中的面部朝向进行矫正处理，得到目标面部图像。

可以理解地，同一待预测对象的不同姿态的面部朝向，提取的面部特征是不同的，这样就会影响年龄估计值的准确度。相比于其他姿态的面部朝向，面部为正面朝向时，获得的面部特征更为接近待预测对象的实际情况，如此可以提高年龄估计值的准确度。因此，在本申请实施例中，对样本面部图像中的面部朝向进行矫正处理，例如，将面部朝向矫正为正面朝向。

步骤S204，将所述目标面部图像输入至已训练的目标模型的分类器中，得到所述待预测对象属于每一年龄类别的估计概率。

步骤S205，通过所述目标模型中的加权器，将每一所述年龄类别与对应的估计概率之间的乘积进行累加，得到所述待预测对象的年龄估计值。

在本申请实施例中，不是直接将样本面部图像输入至已训练的目标模型中进行年龄估计，而是对样本面部图像中的面部朝向进行矫正处理，将矫正处理后得到的目标面部图像输入至已训练的目标模型中；这样，有利于目标模型提取更加准确的面部特征，从而提高年龄估计值的准确度。

在其他实施例中，还提供一种所述目标模型的获得方法，所述方法至少包括以下步骤S301至步骤S303：

步骤S301，获取样本面部图像集合。

在实现时，可以从预先采集的每一样本图像中截取样本对象的面部区域，从而得到样本面部图像集合。以基于人脸的年龄估计为例，样本面部图像集合中可以包括一个人种的面部图像，例如，包括多张黄种人的人脸图像；样本面部图像集合中还可以包括两个或两个以上人种的面部图像，例如包括白种人、黄种人、黑种人、棕种人的人脸图像。另外，样本面部图像集合中包括不同年龄的人的人脸图像，例如，包括0至100岁的人的人脸图像。

步骤S302，对所述样本面部图像集合中的样本面部图像进行预处理，得到第一训练样本集；其中，所述预处理至少包括矫正所述样本面部图像的面部朝向，以使每一样本面部图像中的面部朝向满足同一条件。

例如，矫正处理后每一样本面部图像中的面部朝向都为正面朝向。这样，可以提高目标模型的辨识能力，获得更为准确的年龄估计值。在其他实施例中，所述电子设备可以通过如下实施例中的步骤S402至步骤S404获得所述第一训练样本集。

在其他实施例中，所述预处理至少包括以下之一：归一化处理、数据增强处理、面部朝向的矫正处理。需要说明的是，在实现时，每一预处理都是在前一预处理得到的图像的基础上进行的。例如，对样本面部图像A0进行矫正处理，得到图像A1；对图像A1进行归一化处理，得到图像A2；对图像A2进行数据增强处理，得到多个训练样本。

步骤S303，利用所述第一训练样本集对N级初始化后的预设模型进行训练，得到所述目标模型，N为大于等于0的整数。

所谓初始化，指的是在执行步骤S303之前，利用其他训练样本集预先对预设模型进行训练，以使训练后的预设模型具有一定的辨识能力，这样可以提高步骤S303的收敛速度。

在训练时，通过预设模型中的分类器输出每一年龄类别的估计概率，然后将每一年龄类别的估计概率和对应的年龄类别输入至预设模型的加权器，以将每一年龄类别和对应的估计概率之间的乘积进行累加，将累加和作为当前预测年龄值，将当前预测年龄值和训练样本对应的年龄类别标签之间的误差反向传播给预设模型，以调整该模型的模型参数。

需要说明的是，对于有监督训练来讲，所述第一训练样本集中的每一训练样本和对应的年龄类别标签；对于半监督训练来讲，所述第一训练样本集中的部分训练样本携带有对应的年龄类别标签。对于无监督训练来讲，所述第一训练样本集中的每一训练样本没有携带对应的年龄类别标签。

在实现时，所述预设模型为轻量级的卷积神经网络Mobilenet v2，所述Mobilenetv2的分类器的最后一层包括预设数目的神经元，每个神经元输出对应的年龄类别的估计概率，相邻年龄类别之间的差值为1。也就是说，由年龄类别组成的序列是等差序列，公差为1。在其他实施例中，所述公差还可以大于1的整数，例如，公差为2或者3等。

可以理解地，卷积神经网络Mobilenet v2具有网络性能好、精度高和识别速度快等特点；因此将该网络应用于年龄估计中，利于部署在电子设备中，例如部署在智能手机、平板电脑中等。另外，通过卷积神经网络Mobilenet v2可以更加快速地估计待预测对象的年龄。

在本申请实施例中，利用矫正处理后的样本面部图像对所述N级初始化后的预设模型进行训练，这样可以提高目标模型的识别准确度，从而提高年龄估计精度。

本申请实施例再提供一种所述目标模型的获得方法，所述方法至少包括以下步骤S401至步骤S405：

步骤S401，获取样本面部图像集合，所述样本面部图像集合中包括多张不同的样本面部图像。

步骤S402，确定每一所述样本面部图像中的面部朝向与预设方向之间的夹角。在实现时，可以将垂直于样本面部图像的正面且向外发射的射线方向为预设方向。例如，图2所示，通过面部朝向检测算法，检测到的面部朝向为方向为

预设方向为

步骤S403，将所述夹角大于第一阈值的样本面部图像中的面部朝向，矫正至预设方向，得到矫正样本图像。

可以理解地，仅将面部朝向满足条件的样本面部图像，进行矫正处理，这样，可以大大降低图像预处理所花费的时长。举例来说，假设样本面部图像集合中有20万张图像，如果对每一张图像都进行面部朝向的矫正处理，将会大大增加图像预处理所花费的时长，增加电子设备的数据处理负荷；如果仅对20万张图像中面部朝向满足条件的3万张图像进行矫正处理，可以大大降低图像预处理的时长，减轻电子设备的数据处理负荷。

步骤S404，将每一所述矫正样本图像更新至所述样本面部图像集合中，得到所述第一训练样本。

在实现时，可以将每一所述矫正样本图像覆盖对应的矫正前的样本面部图像；或者还可以将每一所述矫正样本图像直接添加至所述样本面部图像集合中。

步骤S405，利用所述第一训练样本集对N级初始化后的预设模型进行训练，得到所述目标模型，N为大于等于0的整数。

在本申请实施例中，仅对样本面部图像集合中，面部朝向与预设方向之间的夹角大于第一阈值的样本图像进行矫正；这样，可以大大降低样本图像的矫正处理时长。

本申请实施例再提供一种所述目标模型的获得方法，所述方法至少包括以下步骤S501至步骤S506：

步骤S501，获取样本面部图像集合。

步骤S502，在所述样本面部图像集合中的图像数目小于第二阈值的情况下，对所述样本面部图像集合中的每一样本面部图像进行数据增强处理，得到第一训练样本集。

可以理解地，在样本面部图像集合中的图像数目较少的情况下，如果直接利用该集合中的图像数据对预设模型进行训练，这样得到的目标模型的泛化能力较差，在对待预测对象进行年龄估计时，可能会获得误差较大的年龄估计值。因此，在样本面部图像集合中的图像数目小于第二阈值的情况下，对样本面部图像集合中的每一样本面部图像进行数据增强处理。例如，根据预设亮度区间变换每一样本面部图像的亮度，得到亮度在所述预设亮度区间随机分布的多张图像；或者，根据预设对比度区间变换每一样本面部图像的对比度，得到每一样本面部图像的对比度在所述预设对比度区间随机分布的多张图像；或者，根据预设随机裁剪比例裁剪每一样本面部图像，并将裁剪得到的图像的大小调整为224*224；或者，复制每一样本面部图像，并将复制的样本面部图像按水平方向翻转。这样可以增加样本面部图像集合中的样本数量，从而弥补样本面部图像数量不足所带来的缺陷，使得训练得到的目标模型具有更好的泛化能力。

步骤S503，利用所述第一训练样本集对N级初始化后的预设模型进行训练，得到所述目标模型，N为大于等于0的整数。

在本申请实施例中，在样本面部图像数目不足的情况下，对样本面部图像进行数据增强处理，这样可以是得到的样本面部图像集合中的图像内容更加丰富，也更接近真实环境，从而提高模型的泛化能力。

本申请实施例再提供一种所述目标模型的获得方法，所述方法还至少包括以下步骤S601至步骤S606：

步骤S601，获取第二训练样本集和第三训练样本集，所述第二训练样本集包括不具有面部特征的图像，所述第三训练样本集包括具有面部特征的图像，所述第三训练样本集与所述第一训练样本集不同。

在实现时，第二训练样本集为ImageNet数据集，第三训练样本集为IMDB-WIKI数据集，第一训练样本集中包括亚洲人的人脸图像。

步骤S602，利用所述第二训练样本集对预设模型进行训练，得到一级初始化后的预设模型。

这里，先利用第二训练样本集对预设模型进行训练目的是为了使得预设模型具备基本的分类能力，在此基础上再利用第三训练样本集和第一训练样本集对预设模型进行训练；这样既可以使得后续的训练过程快速收敛，也可以使得训练后的目标模型具有更好的分类能力，从而获得较准确的年龄估计值。

步骤S603，利用所述第三训练样本集对所述一级初始化后的预设模型进行训练，得到的预设模型。

步骤S604，获取样本面部图像集合。

步骤S605，对所述样本面部图像集合中的样本面部图像进行预处理，得到第一训练样本集。

步骤S606，利用所述第一训练样本集对所述二级初始化后的预设模型进行训练，得到所述目标模型，N为大于等于0的整数。

在其他实施例中，还可以将第三训练样本集和第一训练样本集合并后，输入至一级初始化的预设模型中，以获得所述目标模型。

在本申请实施例中，先用不含面部特征的图像对预设模型进行预训练，使得一级初始化后的预设模型具有分类能力，基于此，再用含有面部特征的图像对预设模型进行训练，使得二级初始化后的预设模型具有基本的年龄估计能力；这样，使得后续的训练过程快速收敛，还可以提高目标模型的泛化能力和辨识能力。

相关年龄估计中，利用深度学习技术，端到端地实现特征提取和目标函数优化的整个任务。由于年龄是一个连续的值，常常直接把这个任务当成回归任务来做，但由于真实年龄和表观年龄的巨大差异导致常常存在很大的过拟合现象。因此，通过利用年龄的有序性，将回归问题转化为分类问题进行求解，但是该方法忽略了年龄的有序性以及年龄之间存在的关联。

基于此，下面将说明本申请实施例在一个实际的应用场景中的示例性应用。

本申请实施例提供一种基于深度学习的实时人脸年龄估计算法，所述算法包括模型训练阶段和年龄估计阶段；其中，模型训练阶段，如图3所示，至少包括以下步骤S11至步骤S18：

步骤S11：获取包含人脸图像的待预测样本集。

步骤S12：从每一待预测样本中获取样本对象的人脸区域图像，裁剪面部区域，对所述样本对象进行人脸矫正，例如，通过人脸关键点的定位，如眼睛、鼻子、嘴巴等，按预设方向调整所述样本对象的人脸朝向，保证每个样本对象的人脸朝向一致，并向面部区域添加预定比例的边距，保证图像大小为224*224。

步骤S13：对得到的224*224大小的图像进行归一化处理，将其像素值从[0，255]归一化到[0，1]，去除224*224大小的图像中包含的冗余信息。

步骤S14：对归一化处理后的图像进行数据增强；例如，根据预设亮度区间变换每个归一化处理后的图像的亮度，得到每个归一化处理后的图像的亮度在所述预设亮度区间随机分布的数据；根据预设对比度区间变换每个归一化处理后的图像的对比度，得到每个归一化处理后的图像的对比度在所述预设对比度区间随机分布的数据；根据预设随机裁剪比例裁剪每个归一化处理后的图像，并将裁剪得到的图像的大小调整为224*224；按水平方向翻转每个归一化处理后的图像。

步骤S15：对数据增强后的图像集合按比例随机划分为训练集和测试集，划分比例为8:2，其中训练集用于年龄估计模型(即所述预设模型)的训练，测试集用于年龄估计模型的测试，在划分时保证同一个人的图像数据仅出现在一个集合中。

步骤S16：将训练集输入至年龄估计模型进行训练，以生成训练完成的年龄估计模型。在实现时，年龄估计模型为卷积神经网络模型。

在执行步骤S6之前，利用大规模数据对年龄估计模型进行预训练，确保该模型具有一定的识别能力；例如，首先，利用ImageNet数据集对年龄估计模型进行预训练，使得预训练后的年龄估计模型具有一定的分类能力；然后，再利用IMDB-WIKI数据集对该模型进行进一步地预训练，使得该模型具有一定的年龄估计能力。最后，在执行步骤S6，利用划分得到的训练集对该模型进行训练，以生成训练完成的年龄估计模型。

在本申请实施例中，年龄估计模型为一种轻量级的卷积神经网络，例如Mobilenetv2，它不仅继承了一些大网络性能好、精度高的特点，同时由于其结构精简，所以速度快、利于部署在移动端。Mobilenet v2的结构基于反向残块(Inverted residual block)，该网络本质是一个残差网络设计，传统残差块(Residual block)是块(block)的两端通道数多，中间少，而在本申请实施例中，该网络的反省残差(inverted residual)是块的两端通道数少，块内通道数多，同时在该网络中还体现出了线性瓶颈(Linear Bottlenecks)的思想，即，将最后输出的激活函数ReLU6去掉，直接线性输出，这样做的原因是：ReLU变换后保留非0区域对应于一个线性变换，仅当输入低维时ReLU能保留所有完整信息。

需要说明的是，在本申请实施例中，利用所述训练集对年龄估计模型进行训练；其中年龄估计模型的结构包括分类器和加权器，在实现时，可以将分类器的最后一层(例如Mobilenet v2的全连接层)的神经元数目改为101，从而获得0至100岁分别对应的预测估计概率，然后，如公式(2)所示，将分类器输出的0至100岁分别对应的预测估计概率输入到加权器E(O)中，从而将分类器输出的0至100岁分别对应的预测估计概率乘以对应的年龄，得到预测年龄。

式中，O表示分类器的输出层的101个维度，o_i表示分类器输出的第i个年龄y_i对应的估计概率。

在对年龄估计模型进行训练时，采用Adam梯度下降算法，Adam是一种高效计算方法，可以提高梯度下降收敛速度。训练过程中将训练集输入卷积神经网络模型并迭代预设次数(epochs)，例如将epochs设置为90次。每一次迭代计算过程中使用Adam梯度下降算法优化目标函数，Adam梯度下降算法需设置批处理样本大小(batch_size)，例如将batch_size设置为64。

步骤S17，将所述测试集输入至训练完成的年龄估计模型中，以测试该模型的准确性。

在其他实施例中，将上述测试集中判断错误的测试样本再次送入该模型中，以微调(fine-tuning)该模型的参数值，从而提高模型的泛化性。

步骤S18，在模型的准确性满足条件的情况下，输出训练完成的年龄估计模型。

为了验证本申请实施例的年龄估计方法相比于回归器能够获得更好的年龄估计精度，可以利用所述训练集对回归器进行训练。例如，将Mobilenet v2的全连接层的神经元数目改为1个，从而获得回归年龄；然后，获得该回归年龄与待预测对象的真实年龄之间的第一误差，确定预测年龄与待预测对象的真实年龄之间的第二误差，比较第一误差和第二误差之间的大小关系，结果表明所述第二误差小于所述第一误差，说明了本申请实施例的年龄估计方法相比于回归器，能够获得更好的年龄估计精度。

第二方面，年龄估计阶段，如图4所示，至少包括以下步骤S21至步骤S24：

步骤S21：获取待处理图像，所述待处理图像中的待预测对象为人类。

在实现时，电子设备可以通过摄像头采集所述待处理图像；或者，从摄像头采集的视频流中获取所述待处理图像；电子设备还可以直接调用本地图片。

电子设备通过摄像头采集视频流获取所述待处理图像，包括：调用摄像头模块获得视频流，从视频流中获取帧图像，若检测到图像帧中包括人脸，则将该图像帧确定为所述待处理图像。

步骤S22：获取从所述待处理图像中获取所述待预测对象的人脸区域，裁剪所述人脸区域，对所述人脸区域进行人脸矫正，按预设方向标准调整所述人脸区域的人脸朝向，并在矫正后的人脸区域上添加预定比例的边距，保证输入尺寸一致，得到224*224大小的人脸区域。

步骤S23：对所述224*224大小的人脸区域进行归一化处理，去除所述224*224大小的人脸区域中的冗余信息。

S24：通过训练完成的基于Mobilenet V2的年龄估计模型对归一化处理后的人脸区域进行年龄估计。

在本申请实施例中，提供一种基于深度学习的实时人脸年龄估计算法及系统，该方法基于轻量级的卷积网络Mobilenet V2，该网络效率高速度快，能够有效提取图像特征，实现人脸年龄估计，同时所述的卷积神经网络模型将普通的卷积操作转化为深度可分离卷积，并且引入了Inverted residual block和Linear Bottlenecks的思想，在不损失精度的前提下有效减少了模型大小，易于云端部署，实现了实时预测的目标。

在本申请实施例中，在进行年龄估计前加入了人脸矫正过程，使得不同环境下各种角度各种姿态的人脸年龄估计的准确率大大提高。

在本申请实施例中，提供了一种实时的人脸年龄估计系统，在基于人脸关键点技术检测出人脸后，加入人脸矫正，解决不同姿态下年龄估计难的问题，并通过数据增强提高模型的泛化性和稳定性，同时以轻量级的卷积神经网络Mobilenet V2为基础网络，可以实时的对人脸实现年龄估计。

当输入的人脸呈现多姿态时，此时获取到的人脸信息是不完善的，因此通过对人脸关键点进行定位实现人脸矫正，弥补缺失的人脸信息。由于人脸特征提取受环境影响较大，在本申请实施例中通过数据增强的方法，变换样本数据的亮度、对比度等模拟真实预测环境，在提高算法稳定性的同时增强了样本数据量。

在本申请实施例中，将年龄回归问题看做是分类-回归问题，结合了分类器和回归器的训练结果，使用分类估计概率乘以对应标签，得到一个预测结果。该结果比单独分类、回归精度高很多。该方法有效地利用了年龄之间相互关联的性质，并且避免了人工引入方差等操作。

本申请实施例所提供的年龄估计方法可以应用于个人计算机(PersonalComputer，PC)端或者手机应用(Application，APP)中的商品推荐或者广告投放中。例如，当PC端或者手机摄像头获取人脸图像后，自动进行年龄估计得到用户的大概年龄，这样可以有针对性地进行信息推送。例如，年龄在5至12岁的儿童，则可以推送一些青少年感兴趣的读物、玩具或者卡通片，20-30岁的青年，则可以推送一些时尚、流行相关的内容等，避免了盲目地进行信息推荐和推广导致的问题。

基于前述的实施例，本申请实施例提供一种年龄估计装置，该装置包括所包括的各模块、以及各模块所包括的各单元，可以通过电子设备中的处理器来实现；当然也可通过具体的逻辑电路实现；在实施的过程中，处理器可以为中央处理器(CPU)、微处理器(MPU)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)等。

图5A为本申请实施例年龄估计装置的组成结构示意图，如图5A所示，所述装置500包括预处理模块501和年龄估计模块502，其中：

预处理模块501，配置为对待处理图像中的待预测对象进行面部区域处理，得到目标面部图像；

年龄估计模块502，配置为将所述目标面部图像输入至已训练的目标模型的分类器中，得到所述待预测对象属于每一年龄类别的估计概率；

所述年龄估计模块502，配置为通过所述目标模型中的加权器，将每一所述年龄类别与对应的估计概率之间的乘积进行累加，得到所述待预测对象的年龄估计值。

在其他实施例中，所述预处理模块501，配置为：识别所述待处理图像中的待预测对象的面部区域；从所述待处理图像中截取所述面部区域，得到样本面部图像；对所述样本面部图像中的面部朝向进行矫正处理，得到所述目标面部图像。

在其他实施例中，如图5B所示，所述装置500还包括数据获取模块503和训练模块504；其中，数据获取模块503，配置为获取样本面部图像集合；预处理模块501，还配置为对所述样本面部图像集合中的样本面部图像进行预处理，得到第一训练样本集；其中，所述预处理至少包括矫正所述样本面部图像的面部朝向，以使每一样本面部图像中的面部朝向满足同一条件；训练模块504，配置为利用所述第一训练样本集对N级初始化后的预设模型进行训练，得到所述目标模型，N为大于等于0的整数。

在其他实施例中，预处理模块501，配置为：确定每一所述样本面部图像中的面部朝向与预设方向之间的夹角；将所述夹角大于第一阈值的样本面部图像中的面部朝向，矫正至预设方向，得到矫正样本图像；将每一所述矫正样本图像更新至所述样本面部图像集合中，得到所述第一训练样本。

在其他实施例中，预处理模块501，配置为：在所述样本面部图像集合中的图像数目小于第二阈值的情况下，对所述样本面部图像集合中的每一样本面部图像进行数据增强处理，得到所述第一训练样本集。

在其他实施例中，所述N级初始化后的预设模型为二级初始化后的预设模型，数据获取模块503，还配置为获取第二训练样本集和第三训练样本集，所述第二训练样本集包括不具有面部特征的图像，所述第三训练样本集包括具有面部特征的图像，所述第三训练样本集与所述第一训练样本集不同；训练模块504，还配置为：利用所述第二训练样本集对所述预设模型进行训练，得到一级初始化后的预设模型；利用所述第三训练样本集对所述一级初始化后的预设模型进行训练，得到所述二级初始化后的预设模型。

在其他实施例中，所述预设模型为轻量级的卷积神经网络Mobilenet v2，所述Mobilenet v2的分类器的最后一层包括预设数目的神经元，每个神经元输出对应的年龄类别的估计概率。

以上装置实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节，请参照本申请方法实施例的描述而理解。

需要说明的是，本申请实施例中，如果以软件功能模块的形式实现上述的年龄估计方法，并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得电子设备(可以是智能手机、平板电脑、笔记本电脑、台式机、电视机、智能手表、机器人等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样，本申请实施例不限制于任何特定的硬件和软件结合。

对应地，本申请实施例提供一种电子设备，图6为本申请实施例电子设备的一种硬件实体示意图，如图6所示，该电子设备600的硬件实体包括：包括存储器601和处理器602，所述存储器601存储有可在处理器602上运行的计算机程序，所述处理器602执行所述程序时实现上述实施例中提供的年龄估计方法中的步骤。

存储器601配置为存储由处理器602可执行的指令和应用，还可以缓存待处理器602以及电子设备600中各模块待处理或已经处理的数据(例如，图像数据、音频数据、语音通信数据和视频通信数据)，可以通过闪存(FLASH)或随机访问存储器(Random AccessMemory，RAM)实现。

对应地，本申请实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中提供的年龄估计方法中的步骤。

这里需要指出的是：以上存储介质和设备实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节，请参照本申请方法实施例的描述而理解。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本申请各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(Read Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得电子设备(可以是智能手机、平板电脑、笔记本电脑、台式机、电视机、智能手表、机器人等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。

本申请所提供的几个方法实施例中所揭露的方法，在不冲突的情况下可以任意组合，得到新的方法实施例。

本申请所提供的几个产品实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的产品实施例。

本申请所提供的几个方法或设备实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的方法实施例或设备实施例。

以上所述，仅为本申请的实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种年龄估计方法，其特征在于，所述方法包括：

对待处理图像中的待预测对象进行面部区域处理，得到目标面部图像；

将所述目标面部图像输入至已训练的目标模型的分类器中，得到所述待预测对象属于每一年龄类别的估计概率；

通过所述目标模型中的加权器，将每一所述年龄类别与对应的估计概率之间的乘积进行累加，得到所述待预测对象的年龄估计值。

2.根据权利要求1所述的方法，其特征在于，所述对待处理图像中的待预测对象进行面部区域处理，得到目标面部图像，包括：

识别所述待处理图像中的待预测对象的面部区域；

从所述待处理图像中截取所述面部区域，得到样本面部图像；

对所述样本面部图像中的面部朝向进行矫正处理，得到所述目标面部图像。

3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

获取样本面部图像集合；

对所述样本面部图像集合中的样本面部图像进行预处理，得到第一训练样本集；其中，所述预处理至少包括矫正所述样本面部图像的面部朝向，以使每一样本面部图像中的面部朝向满足同一条件；

利用所述第一训练样本集对N级初始化后的预设模型进行训练，得到所述目标模型，N为大于等于0的整数。

4.根据权利要求3所述的方法，其特征在于，所述对所述样本面部图像集合中的样本面部图像进行预处理，得到第一训练样本集，包括：

确定每一所述样本面部图像中的面部朝向与预设方向之间的夹角；

将所述夹角大于第一阈值的样本面部图像中的面部朝向，矫正至预设方向，得到矫正样本图像；

将每一所述矫正样本图像更新至所述样本面部图像集合中，得到所述第一训练样本。

5.根据权利要求3所述的方法，其特征在于，所述对所述样本面部图像集合中的样本面部图像进行预处理，得到第一训练样本集，包括：

在所述样本面部图像集合中的图像数目小于第二阈值的情况下，对所述样本面部图像集合中的每一样本面部图像进行数据增强处理，得到所述第一训练样本集。

6.根据权利要求3所述的方法，其特征在于，所述N级初始化后的预设模型为二级初始化后的预设模型，所述方法还包括：

获取第二训练样本集和第三训练样本集，所述第二训练样本集包括不具有面部特征的图像，所述第三训练样本集包括具有面部特征的图像，所述第三训练样本集与所述第一训练样本集不同；

利用所述第二训练样本集对所述预设模型进行训练，得到一级初始化后的预设模型；

利用所述第三训练样本集对所述一级初始化后的预设模型进行训练，得到所述二级初始化后的预设模型。

7.根据权利要求3所述的方法，其特征在于，所述预设模型为卷积神经网络Mobilenetv2，所述Mobilenet v2的分类器的最后一层包括预设数目的神经元，每个神经元输出对应的年龄类别的估计概率。

8.一种年龄估计装置，其特征在于，包括：

预处理模块，配置为对待处理图像中的待预测对象进行面部区域处理，得到目标面部图像；

年龄估计模块，配置为将所述目标面部图像输入至已训练的目标模型的分类器中，得到所述待预测对象属于每一年龄类别的估计概率；

所述年龄估计模块，配置为通过所述目标模型中的加权器，将每一所述年龄类别与对应的估计概率之间的乘积进行累加，得到所述待预测对象的年龄估计值。

9.一种电子设备，包括存储器和处理器，所述存储器存储有可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1至7任一项所述年龄估计方法中的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至7任一项所述年龄估计方法中的步骤。