CN112070060A

CN112070060A - 识别年龄的方法、年龄识别模型的训练方法和装置

Info

Publication number: CN112070060A
Application number: CN202010998630.8A
Authority: CN
Inventors: 苏驰; 李凯; 刘弘也; 王育林
Original assignee: Beijing Kingsoft Cloud Network Technology Co Ltd
Current assignee: Beijing Kingsoft Cloud Network Technology Co Ltd
Priority date: 2020-09-21
Filing date: 2020-09-21
Publication date: 2020-12-11

Abstract

本发明提供了一种识别年龄的方法、年龄识别模型的训练方法和装置，该识别年龄的方法包括：获取包含有目标对象的待识别图像；将待识别图像输入至预先训练完成的年龄识别模型中，得到目标对象的年龄；该方式中的年龄识别模型训练过程为：基于第一数据集训练年龄识别模型的初始模型，得到中间模型；该第一数据集中的训练数据携带有类别标签和/或身份标签；基于第二数据集训练中间模型，得到年龄识别模型；该第二数据集中的训练数据携带有年龄标签。由于该方式中的中间模型已具有图像分类或者身份识别功能，再基于携带有年龄标签的第二数据集训练中间模型时，可以避免第二数据集数据量有限时的模型过拟合问题，从而提升年龄识别模型的泛化能力。

Description

识别年龄的方法、年龄识别模型的训练方法和装置

技术领域

本发明涉及图形处理技术领域，尤其是涉及一种识别年龄的方法、年龄识别模型的训练方法和装置。

背景技术

年龄作为一种重要的人脸属性，在人机交互、智能商务、安全监控和娱乐等领域都有着广泛的应用。相关技术中，通常通过训练好的深度学习模型识别人脸图像中人的年龄，该深度学习模型直接在年龄数据集上训练得到的，但是由于年龄涉及到个人隐私，收集带有年龄标签的人脸样本是非常困难和耗时的，使得年龄数据集的数据量有限，导致在该年龄数据集上训练得到的模型容易过拟合，进而使得模型泛化能力较差。

发明内容

本发明的目的在于提供一种识别年龄的方法、年龄识别模型的训练方法和装置，以提高模型的泛化能力。

第一方面，本发明实施例提供了一种识别年龄的方法，该方法包括：获取包含有目标对象的待识别图像；将该待识别图像输入至预先训练完成的年龄识别模型中，输出识别结果，基于该识别结果确定目标对象的年龄；其中，基于第一数据集训练年龄识别模型的初始模型，得到中间模型；该第一数据集中的训练数据携带有类别标签和/或身份标签；基于第二数据集训练中间模型，得到年龄识别模型；该第二数据集中的训练数据携带有年龄标签。

在可选的实施方式中，上述第一数据集中的训练数据携带有类别标签和身份标签；上述基于第一数据集训练年龄识别模型的初始模型，得到中间模型的步骤，包括：基于携带有类别标签的训练数据训练初始模型，得到第一模型；基于携带有身份标签的训练数据训练第一模型，得到中间模型。

在可选的实施方式中，上述携带有类别标签的训练数据包括多个类别样本，每个类别样本包含有一个类别图像和类别图像对应的类别标签；上述基于携带有类别标签的训练数据训练初始模型，得到第一模型的步骤，包括：从多个类别样本中，确定目标类别图像；将目标类别图像输入至初始模型中，得到分类结果；根据分类结果和目标类别图像的类别标签，确定第一损失量；基于第一损失量调整初始模型的权重参数；继续执行从多个类别样本中，确定目标类别图像的步骤，直到第一损失量收敛或者达到预设的训练次数，得到第一模型。

在可选的实施方式中，上述将目标类别图像输入至初始模型中，得到分类结果的步骤，包括：将目标类别图像输入至初始模型中，输出第一结果；将第一结果输入至预设的第一全连接层中，输出分类结果；其中，所第一全连接层输出数据的维数与类别标签的种类数相同。

在可选的实施方式中，上述携带有身份标签的训练数据包括多个对象样本，每个对象样本包含有一个对象图像和标识对象图像中对象身份的身份标签；上述基于携带有身份标签的训练数据训练第一模型，得到中间模型的步骤，包括：从多个对象样本中，确定目标对象图像；将目标对象图像输入至第一模型中，得到对象识别结果；根据对象识别结果和目标对象图像的身份标签，确定第二损失量；基于第二损失量调整第一模型的权重参数；继续执行从多个对象样本中，确定目标对象图像的步骤，直到第二损失量收敛或者达到预设的训练次数，得到中间模型。

在可选的实施方式中，上述将目标对象图像输入至第一模型中，得到对象识别结果的步骤，包括：将目标对象图像输入至第一模型中，输出第二结果；将第二结果输入至预设的第二全连接层中，输出对象识别结果；其中，第二全连接层输出数据的维数与身份标签的种类数相同。

在可选的实施方式中，上述第二数据集中的每个训练数据均包含有一个样本图像，以及样本图像中对象的年龄标签；上述基于第二数据集训练中间模型，得到年龄识别模型的步骤，包括：基于第二数据集确定目标样本图像；将目标样本图像输入至中间模型中，得到年龄识别结果；根据年龄识别结果和目标样本图像的年龄标签，确定第三损失量；基于第三损失量调整中间模型的权重参数；继续执行基于第二数据集确定目标样本图像的步骤，直到第三损失量收敛或者达到预设的训练次数，得到年龄识别模型。

在可选的实施方式中，上述将目标样本图像输入至中间模型中，得到年龄识别结果的步骤，包括：将目标样本图像输入至中间模型中，输出第三结果；将该第三结果输入至预设的第三全连接层中，输出年龄识别结果；其中，该第三全连接层输出数据的维数为一；上述基于第三损失量调整中间模型的权重参数；继续执行基于第二数据集确定目标样本图像的步骤，直到第三损失量收敛或者达到预设的训练次数，得到年龄识别模型的步骤，包括：基于第三损失量调整中间模型的权重参数，以及第三全连接层的权重参数；继续执行基于第二数据集确定目标样本图像的步骤，直到第三损失量收敛或者达到预设的训练次数，得到训练完成的中间模型和第三全连接层；将训练完成的中间模型和第三全连接层确定为年龄识别模型。

在可选的实施方式中，上述基于识别结果确定目标对象的年龄的步骤，包括：采用向上取整、向下取整或者四舍五入的方式，对识别结果进行处理，得到目标对象的年龄。

第二方面，本发明实施例提供了一种年龄识别模型的训练方法，该训练方法包括：获取第一数据集和第二数据集；该第一数据集中的训练数据携带有类别标签和/或身份标签，第二数据集中的训练数据携带有年龄标签；基于第一数据集训练年龄识别模型的初始模型，得到中间模型；基于第二数据集训练中间模型，得到年龄识别模型。

在可选的实施方式中，第一数据集中的训练数据携带有类别标签和身份标签；上述基于第一数据集训练年龄识别模型的初始模型，得到中间模型的步骤，包括：基于携带有类别标签的训练数据训练初始模型，得到第一模型；基于携带有身份标签的训练数据训练第一模型，得到中间模型。

在可选的实施方式中，上述第二数据集中的每个训练数据均包含有一个样本图像，以及该样本图像中对象的年龄标签；上述基于第二数据集训练中间模型，得到年龄识别模型的步骤，包括：基于第二数据集确定目标样本图像；将目标样本图像输入至中间模型中，得到年龄识别结果；根据年龄识别结果和目标样本图像的年龄标签，确定第三损失量；基于第三损失量调整中间模型的权重参数；继续执行基于第二数据集确定目标样本图像的步骤，直到第三损失量收敛或者达到预设的训练次数，得到年龄识别模型。

第三方面，本发明实施例提供了一种识别年龄的装置，该装置包括：图像获取模块，用于获取包含有目标对象的待识别图像；年龄识别模块，用于将待识别图像输入至预先训练完成的年龄识别模型中，输出识别结果，基于该识别结果确定目标对象的年龄；其中，基于第一数据集训练年龄识别模型的初始模型，得到中间模型；该第一数据集中的训练数据携带有类别标签和/或身份标签；基于第二数据集训练中间模型，得到年龄识别模型；该第二数据集中的训练数据携带有年龄标签。

第四方面，本发明实施例提供了一种年龄识别模型的训练装置，该训练装置包括：数据集获取模块，用于获取第一数据集和第二数据集；该第一数据集中的训练数据携带有类别标签和/或身份标签，该第二数据集中的训练数据携带有年龄标签；中间模型确定模块，用于基于第一数据集训练年龄识别模型的初始模型，得到中间模型；年龄识别模型确定模块，用于基于第二数据集训练中间模型，得到年龄识别模型。

第五方面，本发明实施例提供了一种电子设备，该电子设备包括处理器和存储器，该存储器存储有能够被处理器执行的机器可执行指令，该处理器执行机器可执行指令以上述识别年龄的方法或者上述年龄识别模型的训练方法。

第六方面，本发明实施例提供了一种机器可读存储介质，该机器可读存储介质存储有机器可执行指令，该机器可执行指令在被处理器调用和执行时，该机器可执行指令促使处理器实现上述识别年龄的方法或者上述年龄识别模型的训练方法。

本发明实施例带来了以下有益效果：

本发明提供的一种识别年龄的方法、年龄识别模型的训练方法和装置，首先获取包含有目标对象的待识别图像；将待识别图像输入至预先训练完成的年龄识别模型中，得到目标对象的年龄；其中，基于携带有的类别标签和/或身份标签第一数据集训练年龄识别模型的初始模型，得到中间模型，再基于携带有年龄标签的第二数据集训练中间模型，得到年龄识别模型。由于该方式中的中间模型是通过携带有类别标签或者身份标签的第一数据集训练得到的，所以该中间模型具有图像分类或者身份识别功能，在此基础上，再基于携带有年龄标签的第二数据集训练中间模型时，可以避免第二数据集数据量有限导致的模型过拟合问题，从而提升了年龄识别模型的泛化能力。

本发明的其他特征和优点将在随后的说明书中阐述，或者，部分特征和优点可以从说明书推知或毫无疑义地确定，或者通过实施本发明的上述技术即可得知。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施方式，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种识别年龄的方法的流程图；

图2为本发明实施例提供的另一种识别年龄的方法的流程图；

图3为本发明实施例提供的一种年龄识别模型的初始模型的结构示意图；

图4为本发明实施例提供的一种年龄识别模型的训练方法的流程图；

图5为本发明实施例提供的一种识别年龄的装置的结构示意图；

图6为本发明实施例提供的一种年龄识别模型的训练装置的结构示意图；

图7为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

年龄是一种重要的人脸属性，同时自动人脸年龄识别作为一种重要的生物特征识别技术，目前已经成为模式识别和计算机视觉领域内一个热门的研究课题，人脸年龄识别问题通常被定义为采用计算机视觉等技术根据输入的人脸图像自动估计出图像中人脸的真实年龄。

相关技术中，提供了两种识别年龄的方法，第一种是传统人脸年龄识别算法，一般需要人工提取人脸图像中的人脸特征(如主动外观特征、人体测量学特征、生物启发特征等)，然后训练一个人脸特征到年龄的分类器或者回归器，通过该分类器或者回归器可以识别出人脸图像中人脸的年龄，但是该方式无法提取出人脸的高层语义信息，导致该方式得到的年龄识别结果的精度较低。

为了提取到人脸的高层语义信息，可以采用第二种方式，也即是基于深度学习的人脸年龄识别算法，该算法通过训练好的深度学习模型识别人脸图像中人的年龄，该深度学习模型通常是一个卷积神经网络，该网络可以建立输入人脸与年龄的映射关系，该人脸与年龄的映射关系可以是在年龄数据集上训练得到的，但是由于年龄涉及到个人隐私，收集带有年龄标签的人脸样本是非常困难、昂贵和耗时的，使得年龄数据集的数据量有限(或称为规模较小)，又由于深度学习非常依赖于大数据，这使得在数量有效的年龄数据集上训练得到的深度学习模型非常容易过拟合，进而使得模型的泛化能力较差。

基于上述描述，本发明实施例提供了一种识别年龄的方法、年龄识别模型的训练方法和装置。该技术可以应用于人机交互、智能商务、安全监控和娱乐等领域的年龄识别的场景中。为便于对本实施例进行理解，首先对本发明实施例所公开的一种识别年龄的方法进行详细介绍，如图1所示，该方法包括如下步骤：

步骤S102，获取包含有目标对象的待识别图像。

上述待识别图像可以是通过摄像机或者照相机拍摄的图片或者照片，也可以是某一视频文件中的视频帧；该待识别图像中包含的目标对象可以是人或者人脸，该人脸可以正脸、侧脸、上半脸或者下半脸等。在具体实现时，可以通过通信连接的照相机、摄像头等设备拍摄后传入，或者从存储有已经拍摄完成的待处理的图像的存储设备中获取待识别图像，也可以从视频文件的存储设备中获取待识别图像。

步骤S104，将上述待识别图像输入至预先训练完成的年龄识别模型中，输出识别结果，基于该识别结果确定目标对象的年龄；其中，基于第一数据集训练年龄识别模型的初始模型，得到中间模型；该第一数据集中的训练数据携带有类别标签和/或身份标签；基于第二数据集训练中间模型，得到年龄识别模型；该第二数据集中的训练数据携带有年龄标签。

上述年龄识别模型可以是深度学习模型或者神经网络模型等。年龄识别模型是通过多个数据集进行机器学习训练得到的，每个数据集的训练数据携带的标签类型不同，不同标签类型可以训练得到不同功能的模型，因此，在年龄识别模型训练的过程中，可以先基于第一数据集对年龄识别模型的初始模型进行预训练，得到中间模型，如果该第一数据集的训练数据携带有类别标签，该中间模型将具有图像分类能力；如果该第一数据集的训练数据携带有身份标签，该中间模型将具有身份识别能力；如果该第一数据集中的训练数据既包含有类别标签又包含有身份标签，该中间模型既具有图像识别能力又具有身份识别能力。

然后基于第二数据集对具有一定能力的中间模型进行训练，可以得到训练完成的年龄识别模型，该第二数据集中的训练数据携带有年龄标签，也即是该第二数据集为上述数据量有限的年龄数据集。该年龄识别模型的训练方式可以缓解第二数据集数据集有限时对模型训练的负面影响，可以增加模型的泛化能力。

本发明实施例提供的一种识别年龄的方法，首先获取包含有目标对象的待识别图像；将待识别图像输入至预先训练完成的年龄识别模型中，得到目标对象的年龄；其中，基于携带有的类别标签和/或身份标签第一数据集训练年龄识别模型的初始模型，得到中间模型，再基于携带有年龄标签的第二数据集训练中间模型，得到年龄识别模型。由于该方式中的中间模型是通过携带有类别标签或者身份标签的第一数据集训练得到的，所以该中间模型具有图像分类或者身份识别功能，在此基础上，再基于携带有年龄标签的第二数据集训练中间模型时，可以避免第二数据集数据量有限导致的模型过拟合问题，从而提升了年龄识别模型的泛化能力。

本发明实施例还提供了另一种识别年龄的方法，该方法在上述实施例方法的基础上实现；该方法重点描述基于第一数据集训练年龄识别模型的初始模型，得到中间模型的具体过程(通过下述步骤S202-步骤S206实现)，以及基于识别结果确定目标对象的年龄的具体过程(通过下述步骤S212实现)，如图2所示，该方法包括如下步骤：

步骤S202，获取第一数据集和第二数据集；其中，第一数据集中的训练数据携带有类别标签和身份标签；第二数据集中的训练数据携带有年龄标签。

步骤S204，基于携带有类别标签的训练数据训练初始模型，得到第一模型。

上述初始模型可以是深度学习模型或者神经网络模型等。上述携带有类别标签的训练数据可以是图像识别数据集中的训练数据，该图像识别数据集可以采用ImageNet图像识别数据集，该ImageNet图像识别数据集中包含有千万规模的训练数据，也包含有2万多个类别，例如气球、草莓等类别。该图像识别数据集可以用来学习丰富的图像特征，也即是在图像识别数据集上对初始模型进行训练，得到的第一模型在一定程度上可以捕捉到自然图像的底层和中高层特征，这些特征比较容易迁移到其他训练任务中，从而有助于年龄识别模型的训练。

上述携带有类别标签的训练数据包括多个类别样本，每个类别样本包含有一个类别图像和该类别图像对应的类别标签；该类别标签可以用数字、字符或者字母等形式标识，例如，多个类别样本中的每个类别图像用A表示，A∈R^H×W×3，其中，H表示高度，W表示宽度，3代表RGB(Red、Green、Blue，红绿蓝)三个通道，A的标签用y表示，y∈[1,…M]，M代表多个类别样本中共有M个不同的类别。在具体实现时，上述步骤S204可以通过下述步骤10-13实现：

步骤10，从多个类别样本中，确定目标类别图像。该目标类别图像为多个类别样本中的类别图像中的任意一个，该目标类别图像对应有类别标签。

步骤11，将上述目标类别图像输入至初始模型中，得到分类结果。

在具体实现时，上述初始模型可以包括特征提取层和输出层；其中，特征提取层用于对输入图像进行特征提取，得到该输入图像的特征数据；输出层用于根据特征数据，输出特征处理结果。该特征提取层包括依次连接的卷积层和激活函数层，该特征提取层可以提取输入图像的图像特征，以获得图像特征的高层语义信息，为了提高特征提取层的性能，通常该特征提取层包括多组依次连接的卷积层和激活函数层。特征提取层中的激活函数层可以对卷积层输出的图像特征进行函数变换，该变换过程可打破卷积层输入的线性组合，该激活函数层具体可以为Sigmoid函数、tanh函数、Relu函数等。

上述输出层包括一个全连接层，该全连接层可以得到指定维数的输出结果。在具体实现时，年龄识别模型的初始模型中包含的特征提取层的个数、每个特征提取层中包含的多组依次连接的卷积层和激活函数层的组数，以及输出层中全连接层的个数，可以根据数据处理的速度和精度确定，通常个数越多或者组数越多，模型的网络结构整体会越深，性能也越好，但是计算速度会有所下降。

如图3所示为包含有4个特征提取层和1个全连接层的年龄识别模型的初始模型的结构示意图，图3中4个特征提取层分别为Block1、Block2、Block3和Block4，全连接层为FC1；将输入图像输入至Block1中，依次经过Bloc2、Block3和Block4输出特征数据，将该特征数据输入至FC1中，得到一个维数为c(c的数值根据任务需求设定，通常c值越大效果越好)的特征向量，该特征向量也即是提取到的输入图像的图像特征，为初始模型的输出结果。

在具体实现时，由于初始模型的全连接层输出数据的维数c，与类别标签的种类数M可能不同，为了便于确定分类结果，可以在初始模型的全连接层后面连接一个第一全连接层，该第一全连接层输出数据的维数与类别标签的种类数相同。因此，上述步骤11可以包括：首先随机初始化初始模型和第一全连接层中的所有的权重参数，然后将目标类别图像输入至初始模型中，输出第一结果；将该第一结果输入至预设的第一全连接层中，输出分类结果，该输出结果的维数与类别标签的种类数相同。

步骤12，根据上述分类结果和目标类别图像的类别标签，确定第一损失量。

为了得到分类结果在每个类别上对应的概率值，可以将分类结果

(R表示实数，M表示向量维数，也表示类别标签的种类数)送入softmax函数中，得到类别概率分布向量

其中，

与

分别代表分类结果中的第j个元素，以及类别概率分布向量中的第j个元素；

分别代表分类结果中的第m个元素。

在具体实现时，可以根据类别概率分布向量中目标类别图像的类别标签对应的概率值，确定第一损失量，例如，可通过下述算式计算第一损失量L1：

其中，

表示目标类别图像的类别标签y在类别概率分布向量中对应的概率值，通常该概率值越大，第一损失量越小。

步骤13，基于上述第一损失量调整初始模型的权重参数；继续执行从多个类别样本中，确定目标类别图像的步骤，直到该第一损失量收敛或者达到预设的训练次数，得到第一模型。

通过反向传播算法求第一损失量L1对初始模型中所有权重参数W1的导数

接下来通过随机梯度下降算法更新初始模型中的权重参数：

其中，α表示学习率，是一个人工预先设定的超参数，常见的取值为0.01，0.001等。不断迭代地通过随机梯度下降算法对初始模型中的权重参数进行更新，直到所有权重参数均收敛，得到第一模型。

在一些实施例中，如果将目标类别图像输入至初始模型中，输出第一结果；将该第一结果输入至第一全连接层中，输出分类结果；然后根据该分类结果和目标类别图像的类别标签，确定第一损失量；基于该第一损失量调整初始模型的权重参数和第一全连接层的权重参数，直到该第一损失量收敛，得到训练完成的初始模型和训练完成的第一全连接层；最后将训练完成的初始模型确定为第一模型。

步骤S206，基于携带有身份标签的训练数据训练上述第一模型，得到中间模型。

上述携带有身份标签的训练数据可以是人脸识别数据集中的训练数据，该人脸图像数据集可以采用MSCeleb人脸识别数据集，该MSCeleb人脸识别数据集中包含有一百多万人的人脸图像，该人脸识别数据集可以用来学习丰富的人脸特征，也即是在人脸识别数据集上对第一模型进行训练，得到的之间模型在一定程度上可以捕捉到人脸图像的底层和中高层特征，这些特征比较容易迁移到其他与人脸相关的任务中，从而有助于后续年龄识别模型的训练。

上述携带有身份标签的训练数据包括多个对象样本，每个对象样本包含有一个对象图像和标识该对象图像中对象身份的身份标签；该身份标签可以用数字、字符或者字母等形式标识，例如，多个对象样本中的每个对象图像用B表示，B∈R^H×W×3，其中，H表示高度，W表示宽度，3代表RGB三个通道，B的身份标签用z表示，z∈[1,…N]，N代表多个对象样本中共有N个不同的对象，在一些实施例中该对象可以指代人。在具体实现时，上述步骤S206可以通过下述步骤20-23实现：

步骤20，从多个对象样本中，确定目标对象图像。该目标对象图像为多个对象样本中的对象图像中的任意一个，该目标对象图像对应有身份标签。

步骤21，将上述目标对象图像输入至第一模型中，得到对象识别结果。

由图3可知，该第一模型包括特征提取层和输出层，该输出层输出的数据维数为c，由于第一模型的输出层输出数据的维数与身份标签的种类数可能不同，为了便于确定对象识别结果，可以在第一模型的输出层后面连接一个第二全连接层，该第二全连接层输出数据的维数与身份标签的种类数相同。因此，上述步骤21可以包括：首先随机初始化第二全连接层中的所有的权重参数，然后将目标对象图像输入至第一模型中，输出第二结果；将该第二结果输入至预设的第二全连接层中，输出对象识别结果，该对象识别结果的维数与身份标签的种类数相同。

步骤22，根据上述对象识别结果和目标对象图像的身份标签，确定第二损失量。

为了得到对象识别结果在每个身份类别上对应的概率值，可以将身份识别结果

(R表示实数，N表示向量维数，也表示身份标签的种类数)送入softmax函数中，得到身份概率分布向量

其中，

与

分别代表对象识别结果中的第j个元素，以及身份概率分布向量中的第j个元素；

分别代表对象识别结果中的第m个元素。

在具体实现时，可以根据身份概率分布向量中目标对象图像的身份标签对应的概率值，确定第二损失量，例如，可通过下述算式计算第二损失量L2：

其中，

表示目标对象图像的身份标签z在身份概率分布向量中对应的概率值，通常该概率值越大，第二损失量越小。

步骤23，基于第二损失量调整第一模型的权重参数；继续执行从多个对象样本中，确定目标对象图像的步骤，直到第二损失量收敛或者达到预设的训练次数，得到中间模型。

通过反向传播算法求第二损失量L2对第一模型中所有权重参数W2的导数

接下来通过随机梯度下降算法更新初始模型中的权重参数：

其中，α表示学习率，是一个人工预先设定的超参数，常见的取值为0.01，0.001等。不断迭代地通过随机梯度下降算法对第一模型中的权重参数进行更新，直到所有权重参数均收敛，得到中间模型。

在一些实施例中，如果将目标对象图像输入至第一模型中，输出第二结果；将该第二结果输入至第二全连接层中，输出对象识别结果；然后根据该对象识别结果和目标对象图像的身份标签，确定第二损失量；基于该第二损失量调整第一模型的权重参数和第二全连接层的权重参数，直到该第二损失量收敛，得到训练完成的第一模型和训练完成的第二全连接层；最后将训练完成的第一模型确定为中间模型。

步骤S208，基于携带有年龄标签的第二数据集训练中间模型，得到年龄识别模型。

上述第二数据集可以是数据量有限的年龄数据集中的训练数据，该第二数据集中的每个训练数据均包含有一个样本图像，以及该样本图像中对象的年龄标签，在具体实现时，样本图像的年龄标签可以通过下述步骤30-31确定：

步骤30，获取样本图像对应的多个标注结果；该标注结果用于标识样本图像中对象的年龄值；该标注结果中标注的年龄值为预设的多个年龄值中的一个年龄值。

上述预设的多个年龄值是研发人员根据需求设置的多个年龄值，该年龄值的范围和数量也是根据研发需求设置的，例如，可以设置101个年龄值，年龄值为0至100之间的整数，分别代表0岁到100岁。上述样本图像对应的多个标注结果，可以是预设的n个人分别对样本图像中的对象进行年龄标注后，得到的n个标注结果，这n个人标注的年龄值为预设的多个年龄值中的一个年龄值。

步骤31，计算多个标注结果对应的年龄值的平均值，得到年龄均值；将该年龄均值作为样本图像的年龄标签。

例如，假设预设的多个年龄值为0至100之间的整数，n个人对样本图像中的对象进行年龄标注，得到n个标注结果

其中，k的取值范围为1到n，

表示第k个人对样本图像的标注结果，根据n个标注结果，可以得到年龄均值为：

其中，a表示样本图像的年龄均值，也即是该样本图像的年龄标签；

表示对*进行向下取整。

在具体实现时，上述步骤S208可以通过下述步骤40-43实现：

步骤40，基于第二数据集确定目标样本图像；该目标样本图像为第二数据集中的任意一个样本图像。

步骤41，将目标样本图像输入至中间模型中，得到年龄识别结果。

由图3可知，该中间模型包括特征提取层和输出层，该输出层输出的数据维数为c，由于中间模型的输出层输出数据的维数可能不是一维的，难以确定识别出的年龄值，为了便于确定年龄识别结果，可以在中间模型的输出层后面连接一个第三全连接层，该第三全连接层输出数据的维数为一。因此，上述步骤41可以包括：首先随机初始化第三全连接层中的所有的权重参数，然后将目标样本图像输入至中间模型中，输出第三结果；将第三结果输入至预设的第三全连接层中，输出年龄识别结果。

步骤42，根据年龄识别结果和目标样本图像的年龄标签，确定第三损失量。

在具体实现时，可以将年龄识别结果与目标样本图像的年龄标签的差距，确定为第三损失量。例如，当年龄识别结果为一个一维数时，可以下述算式计算第三损失量L3：

其中，|*|代表*的绝对值，

表示年龄识别结果，a表示年龄标签。

步骤43，基于第三损失量调整中间模型的权重参数；继续执行基于第二数据集确定目标样本图像的步骤，直到第三损失量收敛或者达到预设的训练次数，得到年龄识别模型。

通过反向传播算法求第三损失量L3对第一模型中所有权重参数W3的导数

接下来通过随机梯度下降算法更新中间模型中的权重参数：

其中，α表示学习率，是一个人工预先设定的超参数，常见的取值为0.01，0.001等。不断迭代地通过随机梯度下降算法对中间模型中的权重参数进行更新，直到所有权重参数均收敛，得到年龄识别模型。

在一些实施例中，如果将目标样本图像输入至中间模型中，输出第三结果；将第三结果输入至预设的第三全连接层中，输出年龄识别结果；然后基于第三损失量调整中间模型的权重参数，以及第三全连接层的权重参数；继续执行基于第二数据集确定目标样本图像的步骤，直到第三损失量收敛或者达到预设的训练次数，得到训练完成的中间模型和第三全连接层；将训练完成的中间模型和第三全连接层确定为年龄识别模型，从而该年龄识别模型可以输出一个年龄值。

在具体实现时，可以将第二数据集中的样本图像按照预设比例(例如，10:1)划分为用来训练模型的训练集合，以及用来验证模型的测试集合。通过测试集合可以确定训练后的年龄识别模型的识别精度；通常可以从测试集合中确定测试样本，该测试样本包含有样本图像，以及该样本图像对应的年龄标签，将该测试样本输入至训练完成的年龄识别模型中可以得到年龄识别结果，将该年龄识别结果与年龄标签比对，判定该年龄识别结果是否正确，继续从测试集合中确定测试样本，直到测试集合中的所有样本选取完毕；统计每个测试样本对应的测试结果对应的正确性，得到训练后的年龄识别模型的预测精度。

步骤S210，如果获取到包含有目标对象的待识别图像，将该待识别图像输入至上述年龄识别模型中，输出识别结果。

步骤S212，采用向上取整、向下取整或者四舍五入的方式，对上述识别结果进行处理，得到目标对象的年龄。

年龄通常是一个整数，本申请可以采用向上取整、向下取整或者四舍五入的方式，对识别结果进行取整处理，得到目标对象的年龄值。

上述识别年龄的方法，首先在携带有类别标签的训练数据上对初始模型进行第一次预训练，得到第一模型；进而在携带有身份标签的训练数据上对第一模型进行第二次预训练，得到中间模型；然后在携带有年龄标签的第二数据集上对中间模型进行微调训练，得到最终的年龄识别模型，可以缓解第二数据集数据量有限对年龄识别模型训练带来的负面影响，大大增加了模型的泛化能力；而且该方式中的年龄识别模型可以学习到与年龄有关的多层级语义特征，从而可以提高年龄识别的精度。

针对于上述识别年龄的方法的实施例，本发明实施例还提供了一种年龄识别模型的训练方法，如图4所示，该训练方法包括如下步骤：

步骤S402，获取第一数据集和第二数据集；该第一数据集中的训练数据携带有类别标签和/或身份标签，该第二数据集中的训练数据携带有年龄标签。

步骤S404，基于第一数据集训练年龄识别模型的初始模型，得到中间模型。

步骤S406，基于第二数据集训练中间模型，得到年龄识别模型。

在具体实现时，上述步骤S404可以通过上述步骤S204-S206、步骤10-13以及步骤20-23实现，在此不再赘述。

在具体实现时，上述步骤S406的实现方式可参考上述步骤S208，以及步骤40-43，在此不再赘述。

上述年龄识别模型的训练方法，首先获取第一数据集和第二数据集；该第一数据集中的训练数据携带有类别标签和/或身份标签，该第二数据集中的训练数据携带有年龄标签；进而基于第一数据集训练年龄识别模型的初始模型，得到中间模型；然后基于第二数据集训练中间模型，得到年龄识别模型。由于该方式中的中间模型是通过携带有类别标签或者身份标签的第二数据集训练得到的，所以该中间模型具有图像分类或者身份识别功能，在此次基础上，再基于携带有年龄标签的第二数据集训练中间模型时，可以避免第二数据集数据量有限导致的模型过拟合问题，从而提升了年龄识别模型的泛化能力。

对应于上述识别年龄的方法的实施例，本发明实施例还提供了一种识别年龄的装置，如图5所示，该装置包括：

图像获取模块50，用于获取包含有目标对象的待识别图像。

年龄识别模块51，用于将待识别图像输入至预先训练完成的年龄识别模型中，输出识别结果，基于该识别结果确定目标对象的年龄。

其中，基于第一数据集训练年龄识别模型的初始模型，得到中间模型；该第一数据集中的训练数据携带有类别标签和/或身份标签；基于第二数据集训练中间模型，得到该年龄识别模型；该第二数据集中的训练数据携带有年龄标签。

上述识别年龄的装置，首先获取包含有目标对象的待识别图像；将待识别图像输入至预先训练完成的年龄识别模型中，得到目标对象的年龄；其中，基于携带有的类别标签和/或身份标签第一数据集训练年龄识别模型的初始模型，得到中间模型，再基于携带有年龄标签的第二数据集训练中间模型，得到年龄识别模型。由于该方式中的中间模型是通过携带有类别标签或者身份标签的第一数据集训练得到的，所以该中间模型具有图像分类或者身份识别功能，在此基础上，再基于携带有年龄标签的第二数据集训练中间模型时，可以避免第二数据集数据量有限导致的模型过拟合问题，从而提升了年龄识别模型的泛化能力。

具体地，上述第一数据集中的训练数据携带有类别标签和身份标签；上述装置还包括预训练模块，包括：第一模型训练单元，用于基于携带有类别标签的训练数据训练初始模型，得到第一模型；中间模型训练单元，用于基于携带有身份标签的训练数据训练第一模型，得到中间模型。

在具体实现时，上述携带有类别标签的训练数据包括多个类别样本，每个类别样本包含有一个类别图像和类别图像对应的类别标签；上述第一模型训练单元，用于：从多个类别样本中，确定目标类别图像；将目标类别图像输入至初始模型中，得到分类结果；根据分类结果和目标类别图像的类别标签，确定第一损失量；基于第一损失量调整初始模型的权重参数；继续执行从多个类别样本中，确定目标类别图像的步骤，直到第一损失量收敛或者达到预设的训练次数，得到第一模型。

进一步地，上述第一模型训练单元，还用于：将目标类别图像输入至初始模型中，输出第一结果；将该第一结果输入至预设的第一全连接层中，输出分类结果；其中，第一全连接层输出数据的维数与类别标签的种类数相同。

进一步地，上述携带有身份标签的训练数据包括多个对象样本，每个对象样本包含有一个对象图像和标识对象图像中对象身份的身份标签；上述中间模型训练单元，用于：从多个对象样本中，确定目标对象图像；将该目标对象图像输入至第一模型中，得到对象识别结果；根据对象识别结果和目标对象图像的身份标签，确定第二损失量；基于第二损失量调整第一模型的权重参数；继续执行从多个对象样本中，确定目标对象图像的步骤，直到第二损失量收敛或者达到预设的训练次数，得到中间模型。

具体地，上述中间模型训练单元，还用于：将目标对象图像输入至第一模型中，输出第二结果；将第二结果输入至预设的第二全连接层中，输出对象识别结果；其中，第二全连接层输出数据的维数与身份标签的种类数相同。

进一步地，上述第二数据集中的每个训练数据均包含有一个样本图像，以及该样本图像中对象的年龄标签；上述装置还包括模型确定模块，用于：基于第二数据集确定目标样本图像；将该目标样本图像输入至中间模型中，得到年龄识别结果；根据该年龄识别结果和目标样本图像的年龄标签，确定第三损失量；基于第三损失量调整中间模型的权重参数；继续执行基于第二数据集确定目标样本图像的步骤，直到第三损失量收敛或者达到预设的训练次数，得到年龄识别模型。

具体地，上述模型确定模块，还用于：将目标样本图像输入至中间模型中，输出第三结果；将该第三结果输入至预设的第三全连接层中，输出年龄识别结果；其中，第三全连接层输出数据的维数为一；在具体实现时，上述模型确定模块，还用于：基于第三损失量调整中间模型的权重参数，以及第三全连接层的权重参数；继续执行基于第二数据集确定目标样本图像的步骤，直到第三损失量收敛或者达到预设的训练次数，得到训练完成的中间模型和第三全连接层；将训练完成的中间模型和第三全连接层确定为所述年龄识别模型。

进一步地，上述年龄识别模块51，还用于：采用向上取整、向下取整或者四舍五入的方式，对识别结果进行处理，得到目标对象的年龄。

本发明实施例所提供的识别年龄的装置，其实现原理及产生的技术效果和前述识别年龄的方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

对应于上述年龄识别模型的训练方法实施例，本发明实施例还提供了一种年龄识别模型的训练装置，如图6所示，该训练装置包括：

数据集获取模块60，用于获取第一数据集和第二数据集；该第一数据集中的训练数据携带有类别标签和/或身份标签，第二数据集中的训练数据携带有年龄标签。

中间模型确定模块61，用于基于第一数据集训练年龄识别模型的初始模型，得到中间模型。

年龄识别模型确定模块62，用于基于第二数据集训练中间模型，得到年龄识别模型。

上述年龄识别模型的训练装置，首先获取第一数据集和第二数据集；该第一数据集中的训练数据携带有类别标签和/或身份标签，该第二数据集中的训练数据携带有年龄标签；进而基于第一数据集训练年龄识别模型的初始模型，得到中间模型；然后基于第二数据集训练中间模型，得到年龄识别模型。由于该方式中的中间模型是通过携带有类别标签或者身份标签的第二数据集训练得到的，所以该中间模型具有图像分类或者身份识别功能，在此次基础上，再基于携带有年龄标签的第二数据集训练中间模型时，可以避免第二数据集数据量有限导致的模型过拟合问题，从而提升了年龄识别模型的泛化能力。

具体地，第一数据集中的训练数据携带有类别标签和身份标签；上述中间模型确定模块61，用于：基于携带有类别标签的训练数据训练初始模型，得到第一模型；基于携带有身份标签的训练数据训练第一模型，得到中间模型。

进一步地，第二数据集中的每个训练数据均包含有一个样本图像，以及该样本图像中对象的年龄标签；上述年龄识别模型确定模块62，用于：基于第二数据集确定目标样本图像；将目标样本图像输入至中间模型中，得到年龄识别结果；根据年龄识别结果和目标样本图像的年龄标签，确定第三损失量；基于第三损失量调整中间模型的权重参数；继续执行基于第二数据集确定目标样本图像的步骤，直到第三损失量收敛或者达到预设的训练次数，得到年龄识别模型。

本发明实施例所提供的年龄识别模型的训练装置，其实现原理及产生的技术效果和前述年龄识别模型的训练方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

本发明实施例还提供了一种电子设备，参见图7所示，该电子设备包括处理器101和存储器100，该存储器100存储有能够被处理器101执行的机器可执行指令，该处理器执行机器可执行指令以实现上述识别年龄的方法或者上述年龄识别模型的训练方法。

进一步地，图7所示的电子设备还包括总线102和通信接口103，处理器101、通信接口103和存储器100通过总线102连接。

其中，存储器100可能包含高速随机存取存储器(RAM，Random Access Memory)，也可能还包括非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。通过至少一个通信接口103(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接，可以使用互联网，广域网，本地网，城域网等。总线102可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

处理器101可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器101中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器101可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DigitalSignal Processor，简称DSP)、专用集成电路(Application Specific IntegratedCircuit，简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器100，处理器101读取存储器100中的信息，结合其硬件完成前述实施例的方法的步骤。

本发明实施例还提供一种机器可读存储介质，该机器可读存储介质存储有机器可执行指令，该机器可执行指令在被处理器调用和执行时，该机器可执行指令促使处理器实现上述识别年龄的方法或者上述年龄识别模型的训练方法，具体实现可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置和/或电子设备的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种识别年龄的方法，其特征在于，所述方法包括：

获取包含有目标对象的待识别图像；

将所述待识别图像输入至预先训练完成的年龄识别模型中，输出识别结果，基于所述识别结果确定目标对象的年龄；

其中，基于第一数据集训练所述年龄识别模型的初始模型，得到中间模型；所述第一数据集中的训练数据携带有类别标签和/或身份标签；基于第二数据集训练所述中间模型，得到所述年龄识别模型；所述第二数据集中的训练数据携带有年龄标签。

2.根据权利要求1所述的方法，其特征在于，所述第一数据集中的训练数据携带有所述类别标签和所述身份标签；所述基于第一数据集训练所述年龄识别模型的初始模型，得到中间模型的步骤，包括：

基于携带有所述类别标签的训练数据训练所述初始模型，得到第一模型；

基于携带有所述身份标签的训练数据训练所述第一模型，得到所述中间模型。

3.根据权利要求2所述的方法，其特征在于，携带有所述类别标签的训练数据包括多个类别样本，每个类别样本包含有一个类别图像和所述类别图像对应的类别标签；所述基于携带有所述类别标签的训练数据训练所述初始模型，得到第一模型的步骤，包括：

从所述多个类别样本中，确定目标类别图像；

将所述目标类别图像输入至所述初始模型中，得到分类结果；

根据所述分类结果和所述目标类别图像的类别标签，确定第一损失量；

基于所述第一损失量调整所述初始模型的权重参数；继续执行从所述多个类别样本中，确定目标类别图像的步骤，直到所述第一损失量收敛或者达到预设的训练次数，得到所述第一模型。

4.根据权利要求3所述的方法，其特征在于，所述将所述目标类别图像输入至所述初始模型中，得到分类结果的步骤，包括：

将所述目标类别图像输入至所述初始模型中，输出第一结果；

将所述第一结果输入至预设的第一全连接层中，输出所述分类结果；其中，所述第一全连接层输出数据的维数与所述类别标签的种类数相同。

5.根据权利要求2所述的方法，其特征在于，所述携带有所述身份标签的训练数据包括多个对象样本，每个对象样本包含有一个对象图像和标识所述对象图像中对象身份的身份标签；所述基于携带有所述身份标签的训练数据训练所述第一模型，得到所述中间模型的步骤，包括：

从所述多个对象样本中，确定目标对象图像；

将所述目标对象图像输入至所述第一模型中，得到对象识别结果；

根据所述对象识别结果和所述目标对象图像的身份标签，确定第二损失量；

基于所述第二损失量调整所述第一模型的权重参数；继续执行从所述多个对象样本中，确定目标对象图像的步骤，直到所述第二损失量收敛或者达到预设的训练次数，得到所述中间模型。

6.根据权利要求5所述的方法，其特征在于，所述将所述目标对象图像输入至所述第一模型中，得到对象识别结果的步骤，包括：

将所述目标对象图像输入至所述第一模型中，输出第二结果；

将所述第二结果输入至预设的第二全连接层中，输出所述对象识别结果；其中，所述第二全连接层输出数据的维数与所述身份标签的种类数相同。

7.根据权利要求1所述的方法，其特征在于，所述第二数据集中的每个训练数据均包含有一个样本图像，以及所述样本图像中对象的年龄标签；

所述基于第二数据集训练所述中间模型，得到所述年龄识别模型的步骤，包括：

基于所述第二数据集确定目标样本图像；

将所述目标样本图像输入至所述中间模型中，得到年龄识别结果；

根据所述年龄识别结果和所述目标样本图像的年龄标签，确定第三损失量；

基于所述第三损失量调整所述中间模型的权重参数；继续执行基于所述第二数据集确定目标样本图像的步骤，直到所述第三损失量收敛或者达到预设的训练次数，得到所述年龄识别模型。

8.根据权利要求7所述的方法，其特征在于，所述将所述目标样本图像输入至所述中间模型中，得到年龄识别结果的步骤，包括：

将所述目标样本图像输入至所述中间模型中，输出第三结果；

将所述第三结果输入至预设的第三全连接层中，输出所述年龄识别结果；其中，所述第三全连接层输出数据的维数为一；

所述基于所述第三损失量调整所述中间模型的权重参数；继续执行基于所述第二数据集确定目标样本图像的步骤，直到所述第三损失量收敛或者达到预设的训练次数，得到所述年龄识别模型的步骤，包括：

基于所述第三损失量调整所述中间模型的权重参数，以及所述第三全连接层的权重参数；

继续执行基于所述第二数据集确定目标样本图像的步骤，直到所述第三损失量收敛或者达到预设的训练次数，得到训练完成的中间模型和第三全连接层；将所述训练完成的中间模型和第三全连接层确定为所述年龄识别模型。

9.根据权利要求1所述的方法，其特征在于，所述基于所述识别结果确定目标对象的年龄的步骤，包括：

采用向上取整、向下取整或者四舍五入的方式，对所述识别结果进行处理，得到所述目标对象的年龄。

10.一种年龄识别模型的训练方法，其特征在于，所述训练方法包括：

获取第一数据集和第二数据集；所述第一数据集中的训练数据携带有类别标签和/或身份标签，所述第二数据集中的训练数据携带有年龄标签；

基于所述第一数据集训练年龄识别模型的初始模型，得到中间模型；

基于所述第二数据集训练所述中间模型，得到所述年龄识别模型。

11.根据权利要求10所述的训练方法，其特征在于，所述第一数据集中的训练数据携带有所述类别标签和所述身份标签；所述基于第一数据集训练所述年龄识别模型的初始模型，得到中间模型的步骤，包括：

12.根据权利要求10所述的训练方法，其特征在于，所述第二数据集中的每个训练数据均包含有一个样本图像，以及所述样本图像中对象的年龄标签；所述基于所述第二数据集训练所述中间模型，得到所述年龄识别模型的步骤，包括：

基于所述第二数据集确定目标样本图像；

13.一种识别年龄的装置，其特征在于，所述装置包括：

图像获取模块，用于获取包含有目标对象的待识别图像；

年龄识别模块，用于将所述待识别图像输入至预先训练完成的年龄识别模型中，输出识别结果，基于所述识别结果确定目标对象的年龄；

14.一种年龄识别模型的训练装置，其特征在于，所述训练装置包括：

数据集获取模块，用于获取第一数据集和第二数据集；所述第一数据集中的训练数据携带有类别标签和/或身份标签，所述第二数据集中的训练数据携带有年龄标签；

中间模型确定模块，用于基于所述第一数据集训练年龄识别模型的初始模型，得到中间模型；

年龄识别模型确定模块，用于基于所述第二数据集训练所述中间模型，得到所述年龄识别模型。

15.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的机器可执行指令，所述处理器执行所述机器可执行指令以实现权利要求1至9任一项所述的识别年龄的方法或者权利要求10至12任一项所述的年龄识别模型的训练方法。

16.一种机器可读存储介质，其特征在于，所述机器可读存储介质存储有机器可执行指令，所述机器可执行指令在被处理器调用和执行时，所述机器可执行指令促使处理器实现权利要求1至9任一项所述的识别年龄的方法或者权利要求10至12任一项所述的年龄识别模型的训练方法。