CN107169454B - 一种人脸图像年龄估算方法、装置及其终端设备 - Google Patents

一种人脸图像年龄估算方法、装置及其终端设备 Download PDF

Info

Publication number
CN107169454B
CN107169454B CN201710343857.7A CN201710343857A CN107169454B CN 107169454 B CN107169454 B CN 107169454B CN 201710343857 A CN201710343857 A CN 201710343857A CN 107169454 B CN107169454 B CN 107169454B
Authority
CN
China
Prior art keywords
age
neural network
convolutional neural
face
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710343857.7A
Other languages
English (en)
Other versions
CN107169454A (zh
Inventor
乔宇
谭莲芝
李志锋
杜文斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201710343857.7A priority Critical patent/CN107169454B/zh
Publication of CN107169454A publication Critical patent/CN107169454A/zh
Application granted granted Critical
Publication of CN107169454B publication Critical patent/CN107169454B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明属于卷积神经网络技术领域,提供了一种人脸图像年龄估算方法、装置以及终端设备,所述方法包括:构建包括潜在因子分解层的卷积神经网络模型;初始化所述卷积神经网络模型;将预处理后的图像输入初始化后的卷积神经网络模型,根据所述预处理后的图像基于年龄损失函数通过反向传播法训练所述初始化后的卷积神经网络模型;将待检测人脸图像输入训练后的所述卷积神经网络模型,输出所述待检测人脸图像中人脸的年龄。潜在因子分解层可以将图像的特征分解为需要获取的与年龄相关的分量和与年龄无关的相关分量,所以能够基于与年龄相关的分量进行训练以及检测,使得所述卷积神经网络模型具有较好的鲁棒性。

Description

一种人脸图像年龄估算方法、装置及其终端设备
技术领域
本发明属于卷积神经网络技术领域,尤其涉及一种人脸图像年龄估算方法、装置及其终端设备。
背景技术
人脸年龄估计在安全监控、人机交互、视频检索等领域有着巨大的应用价值。但是人脸年龄估计受到基因、生活环境、健康状况等众多因素的影响。卷积神经网络由于对大型图像处理有出色的表现,近年来成为研究的一个热点。在现有的基于卷积神经网络的人脸年龄估算方法中,主要有主动外观模型(AAM)、特征子空间模型(AGES)、外观模型(以BIF仿生特征为主)、流型模型。
但是主动外观模型将形状和纹理特征分开训练,丢失了形状和纹理特征共有部分的信息,而且主动外观模型依赖于各个关键点,一旦关键点检测不到位将影响最终的性能。特征子空间模型的缺点在于建立特征子空间模型时,需要同一个人多幅不同年龄的图像来建立子空间,因此该模型将不适用于只有单幅年龄图像的数据。流型模型的缺点在于年龄特征的流形学习方法对数据库的数量要求较多,只适合于大型的年龄数据库,且要求每个年龄段的数据分布比较均匀。外观模型是用的最多的模型,然而外观模型提取的特征还只是手工设计特征,人脸年龄估计的性能很有限。现有的基于卷积神经网络模型的人脸年龄估算方法鲁棒性较差,缺乏对人脸特征和其它特征的直接建模,网络模型的学习能力有限。
发明内容
鉴于此,本发明提供一种人脸图像年龄估算方法、装置及其终端设备,提高基于卷积神经网络的人脸图像年龄估算方法的鲁棒性。
本发明的第一方面,提供一种人脸图像年龄估算方法,所述方法包括:
构建包括潜在因子分解层的卷积神经网络模型;
初始化所述卷积神经网络模型;
将预处理后的图像输入初始化后的卷积神经网络模型,根据所述预处理后的图像基于年龄损失函数通过反向传播法训练所述初始化后的卷积神经网络模型;
将待检测人脸图像输入训练后的所述卷积神经网络模型,输出所述待检测人脸图像中人脸的年龄。
本发明的第二方面,提供一种人脸图像年龄估算装置,所述装置包括:
模型构建模块,用于构建包括潜在因子分解层的卷积神经网络模型;
初始化模块,用于初始化所述卷积神经网络模型;
训练模块,用于将预处理后的图像输入初始化后的卷积神经网络模型,根据所述预处理后的图像基于年龄损失函数通过反向传播法训练所述初始化后的卷积神经网络模型;
年龄估算模块,用于将待检测人脸图像输入训练后的所述卷积神经网络模型,输出所述待检测人脸图像中人脸的年龄。
本发明的第三方面,提供一种终端设备,所述终端设备包括:
存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第一方面提供的所述方法的步骤。
本发明的第四方面,提供一种计算机存储介质,所述计算机存储介质可以是非易失性的,所述计算机存储介质上存储有计算机程序,所述计算机程序在被一个或多个处理器读取并执行时可实现上述第一方面提供的所述方法的步骤。
本发明与现有技术相比存在的有益效果是:本发明首先构建包括潜在因子分解层的卷积神经网络模型,然后初始化所述卷积神经网络模型,将预处理后的图片输出所述初始化后的卷积神经网络,根据所述预处理后的图片基于年龄损失函数通过反向传播法训练所述初始化后的卷积神经网络,待所述卷积神经网络训练好后,就可以将待检测人脸图片输入所述卷积神经网络,最终输出所述待检测图像中人脸的年龄。本发明中,潜在因子分解层可以将图像的特征分解为需要获取的与年龄相关的分量,和与年龄无关的相关分量,所以能够基于与年龄相关的分量进行训练以及检测,使得所述卷积神经网络模型具有较好的鲁棒性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明第一实施例提供的人脸图像年龄估算方法的示意流程图;
图2是本发明第一实施例中构建的包括潜在因子分解层的卷积神经网络;
图3是本发明第一实施例中对人脸图像预处理的过程;
图4是本发明第一实施例中人脸图像的年龄标签的处理过程;
图5是本发明第二实施例提供的人脸图像年龄估算装置的示意框图;
图6是本发明第三实施例提供的终端设备的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一:
参见图1,图1是本发明实施例一提供的人脸图像年龄估算方法的示意流程图,如图所示该方法可以包括以下步骤:
步骤S101,构建包括潜在因子分解层的卷积神经网络模型。
在本发明实施例中,所述包括潜在因子分解层的卷积神经网络模型是指在常规的卷积神经网络模型中增加一个潜在因子分解层,所述潜在因子分解层是利用潜在因子算法为基础构建的,可以将输入的图像的特征分为两部分特征:与年龄相关的特征和与年龄无关的特征(身份特征),具体可以通过以下公式表示:
Figure BDA0001295955700000051
其中,
Figure BDA0001295955700000052
是人脸图像上提取的面部通用特征,这里使用深度卷积神经网络提取的特征,
Figure BDA0001295955700000053
是所述面部通用特征的特征均值,
Figure BDA0001295955700000054
代表分解后的身份向量,
Figure BDA0001295955700000055
代表着分解后的年龄向量。U和V是年龄向量和身份向量之间的交叉矩阵。所有其他较不显著的特征由ε表示。
所述常规卷积神经网络模型就是可以从人脸图像上提取面部通用特征的卷积神经网络模型,可以包括至少一个卷积层、至少一个池化层、至少一个全连接层,本发明实施例中采用的常规卷积神经网络包括13个卷积层、多个池化层和一个全连接层,构建包括潜在因子分解层的卷积神经网络模型时将全连接层替换为潜在因子分解层。以VGG-Face为例,通过图2说明构建包括潜在因子分解层的卷积神经网络模型,可以保留VGG-Face中第12个卷积层之前的各层,在第13个卷积层中卷积核大小和步长分别设为4×4和1,然后再连接一个池化层(Pool6),池化层后面本来是VGG-Face中的两个全连接层,将两个全连接层用潜在因子分解层替换,第13个卷积层和后面的池化层(Pool6)的目的是特征降维、减少参数,然后将降低维度和减少参数后的面部通用特征输入潜在因子分解层,就可以将面部通用特征分解为两部分:与年龄相关的特征和与年龄无关的特征(身份特征)。
如图2所示,采用部分VGG-Face卷积神经网络,在VGG-Face的一个卷积层后面增加一个卷积层(Conv6),在增加一个池化层(Pool6),在池化层后面增加潜在因子分解层,潜在因子分解层会将面部通用特征分解为与年龄相关的特征和与年龄无关的特征(身份特征),然后通过年龄损失函数(包括与年龄段相关的损失函数和与年龄值相关的损失函数)计算标签年龄和预测年龄差值。
步骤S102,初始化所述卷积神经网络模型。
在本发明实施例中,所述卷积神经网络模型在建立之后,各层节点的权值需要初始化,可以采用人脸身份识别任务预训练获得所述卷积神经网络模型中除所述潜在因子分解层之外的各层的初始化参数;采用预定的滤波器初始化所述潜因子分解层的参数
Figure BDA0001295955700000061
所述参数U和V用预定的滤波器初始化,所述σ2初始化为0.1,所述
Figure BDA0001295955700000062
初始化为0,其中σ2是ε的分布上的方差,ε服从高斯分布N(0,σ2)。
所述卷积神经网络模型中除所述潜在因子分解层之外的各层参数通过人脸身份识别任务预训练初始化,这是因为人脸身份识别的训练集中的训练样本数量大类别多,通过人脸身份识别任务预训练后的参数作为卷积神经网络模型的初始化参数,有利于在正式训练时提高训练的速度,提升卷积神经网络的性能。所述潜因子分解层的参数由预定的xavier过滤器初始化,激活函数使用ReLU。学习速率初始化为1e-3,并且当误差稳定时学习速率再分别变为1e-4,1e-5
所述潜因子分解层的参数
Figure BDA0001295955700000063
由预定的xavier过滤器初始化具体为:所述参数U和V用预定的xavier滤波器初始化,所述σ2初始化为0.1,所述
Figure BDA0001295955700000064
初始化为0。
步骤S103,将预处理后的图像输入初始化后的卷积神经网络模型,根据所述预处理后的图像基于年龄损失函数通过反向传播法训练所述初始化后的卷积神经网络模型。
在本发明实施例中,在正式训练所述卷积神经网络模型时,需要先将训练集中的人脸图像进行预处理再输入所述卷积神经网络模型,所述预处理过程包括人脸检测和校准,如图3所示,将训练集中的人脸图像(图3中第1个人脸图像)输入级联的卷积神经网络获得包括人脸检测候选框的图像(图3中的第2个人脸图像),所述人脸检测候选框内的图像就是检测到的人脸图像。使用该方法不仅能够得到人脸图像上的候选框,而且还得到了人脸图像上的各个关键点(例如眼睛、鼻子和嘴角五个关键点的坐标),对获得的包含人脸关键点的图像进行仿射变换后固定住人脸各关键点的坐标就是人脸校准的过程,经过人脸检测和校准处理就得到了预处理后的图像(图3中第3个人脸图像)。需要说明的是,人脸各关键点可以选取眼睛、鼻子和/或嘴角,并不限制一定选取5个关键点。
将预处理后的图像输入初始化后的卷积神经网络模型就可以根据输入的预处理后的图像基于年龄损失函数采用反向传播法训练所述卷积神经网络模型。
所述反向传播法与常用的卷积神经网络模型一样都有正向传播和反向传播的过程。通过正向传播提取输入的人脸图像上的特征,根据提取的人脸图像上的特征预测输入的人脸图像的年龄,然后根据预测的人脸图像的年龄与所述输入的人脸图像的年龄标签(真实年龄)计算差值,可以通过年龄损失函数来表征预测年龄和真实年龄之间的不一致性。通过对年龄损失函数反向求导更新所述卷积神经网络中各层节点的参数就是反向传播的过程。当年龄损失函数收敛,就表示训练结束。
本发明实施例中,与常用的卷积神经网络训练过程不同的地方是,构建了基于年龄段和年龄值的年龄损失函数,所述年龄损失函数具体为:
Figure BDA0001295955700000071
其中,在k∈[1,Kgroup]中,pk指预测年龄大于第k个年龄段的概率,在k∈[1,Kage]中,pk指预测年龄大于第k个年龄的概率,Kgroup年龄段,Kage是年龄标签的最大值。L年龄段可以看成Kgroup个二分类输出,每个二分类softmax分类器用于判断当前年龄是否大于某个年龄段的值,L年龄值可以看成Kage个二分类输出,每个二分类softmax分类器用于判断当前年龄是否大于某个年龄的值。
也可以将这种基于年龄段和年龄值的年龄损失函数成为多任务损失函数。
通过图4说明输入图像的年龄标签的处理过程。如图4所示,年龄标签处理为多个0或1的输出,假设,训练集中人脸图片的年龄标签的范围是0-77,Kage就对应78个0或1的输出,可以将训练集中人脸图片的年龄分为多个年龄段,例如,可以将0-77的年龄分为8个年龄段,也就是Kgroup对应8个0或1的输出,Kgroup这8个年龄段并未均等分配。年龄标签会对应处理为一个年龄段的输出和一个年龄值的输出,年龄段的输出也就是对应Kgroup的输出,会是8个0或1的输出;年龄值的输出也就是对应Kage的输出,会对应78个0或1的输出。假如输入的人脸图像的标签年龄为18,在对应Kgroup输出时,首先看18是否大于第一个年龄段的最大值(第一个年龄段为0-19),不大于19,则8个0或1输出的第一位输出为0,后面的输出也为0,若大于第一个年龄段的最大值,则输出为1;继续按照上述方式判断是否大于其它年龄段,若年龄标签大于年龄段中的最大值,则对应这个年龄段的输出为1,否则就为0。按照这种方式可以得出年龄标签18的Kgroup对应的输出为00000000,8个0,因为18不大于任何一个年龄段的最大值。年龄标签18对应的年龄值的输出为,前18个为1,后续的都为0,总共78个输出,判断方法也一样,Kage对应78个输出,对应的分段是0-77分为78个。年龄标签大于哪个值,则对应的输出就为1,小于哪个值则对应的输出就为0。以年龄标签40为例说明,40大于前6个Kgroup的分级中的最大值,则Kgroup前6个输出为1,后面两个输出为0;40大于前40个Kage的分级中的值,则Kage前40个输出为1,后38个输出为0。需要说明的是,可以根据实际情况调节Kgroup的分级,也可以调节Kage的分级。
本发明实施例中,与常用的卷积神经网络训练过程另一个不同的地方是所述通过反向传播法训练所述初始化后的卷积神经网络模型包括:
正向传播过程:将面部通用特征转换为与年龄相关的向量
Figure BDA0001295955700000081
其中,所述
Figure BDA0001295955700000082
是与年龄相关的向量,
Figure BDA0001295955700000083
是人脸图像上提取的面部通用特征,
Figure BDA0001295955700000084
是所述面部通用特征的特征均值,ω=σ2I+UUT+VVT,I是单位矩阵,U和V是年龄向量和身份向量之间的交叉矩阵;
反向传播过程:通过梯度下降法反向求导所述年龄损失函数更新所述卷积神经网络模型中除所述潜因子分解层之外的各层的参数,通过以下公式更新所述潜在因子分解层的参数
Figure BDA0001295955700000091
U=(C-DB-1E)(A-FB-1E)-1
V=(D-CA-1F)(B-EA-1F)-1
Figure BDA0001295955700000092
Figure BDA0001295955700000093
用连接在所述潜在因子分解层之前的最后一个池化层的特征均值来更新,
其中,
Figure BDA0001295955700000094
Figure BDA0001295955700000095
ω=σ2I+UUT+VVT
Figure BDA0001295955700000096
Figure BDA0001295955700000097
Figure BDA0001295955700000098
Mc表示第c个年龄段中的样本数,Nn表示第n个人的样本数,
Figure BDA0001295955700000099
代表分解后的身份向量,
Figure BDA00012959557000000910
代表着分解后的年龄向量,I是单位矩阵,
Figure BDA00012959557000000911
表示在给定
Figure BDA00012959557000000912
的条件下年龄向量
Figure BDA00012959557000000913
的预测分布,
Figure BDA00012959557000000914
表示在给定
Figure BDA00012959557000000915
的条件下身份向量
Figure BDA00012959557000000916
的预测分布。
在本发明实施例中,所述正向传播过程,在潜在因子分解层将面部通用特征转换为与年龄相关的向量
Figure BDA00012959557000000917
在给定
Figure BDA00012959557000000918
的条件下年龄向量
Figure BDA00012959557000000919
的预测分布
Figure BDA00012959557000000920
I是单位矩阵,ω=σ2I+UUT+VVT。潜在因子分解层的输出为
Figure BDA00012959557000000921
需要说明,在给定
Figure BDA00012959557000000922
的条件下年龄向量
Figure BDA00012959557000000923
的预测分布
Figure BDA00012959557000000924
表示为
Figure BDA00012959557000000925
潜在因子分解层代替常用的全连接层后,就可以将提取的面部通用特征分解为与年龄相关的分量和与年龄无关的分量,分解之后仅保留与年龄相关的分量
Figure BDA0001295955700000101
用来做年龄估计,与年龄不相关的信号在送到分类器前过滤掉。
所述反向传播过程是从分类器到卷积神经网络的导数如何穿过潜在因子分解层,以及如何更新潜在因子分解层的过程。潜在因子分解层之外的部分用年龄损失函数反向求导更新各层参数,潜在因子分解层中
Figure BDA0001295955700000102
用连接在所述潜在因子分解层之前的最后一个池化层的特征均值来更新,以前面举例,就是Pool6层的特征均值来更新,而非使用所有训练样本计算特征的均值。这是因为梯度下降法训练时一次仅选择一个批次来计算梯度,因此如果我们使用所有训练样本更新
Figure BDA0001295955700000103
则计算成本将变得非常高。本发明实施例中通过年龄损失函数联合微调卷积神经网络和潜在因子分解层的参数,使用人脸身份识别任务预训练通用卷积神经网络,优化了初始化的参数。潜在因子分解层的训练输入来自通用卷积神经网络最后的输出确定,通用卷积神经网络的反向传播信号又来自潜在因子分解层的影响。因此能够同时优化通用卷积神经网络部分和潜在因子分解层部分。
步骤S104,将待检测人脸图像输入训练后的所述卷积神经网络模型,输出所述待检测人脸图像中人脸的年龄。
在本发明实施例中,所述卷积神经网络训练好后,就可以对待检测人脸图像进行年龄估算。具体的包括:
将所述卷积神经网络模型中的潜在因子分解层转换为全连接层;
将预处理后的待检测人脸图像输入所述卷积神经网络模型,在所述全连接层之前获得人脸图像的面部通用特征;
将所述面部通用特征输入所述全连接层得到与年龄相关的特征和与年龄无关的特征;
将与年龄相关的特征输入所述卷积神经网络模型中最后的分类器根据公式
Figure BDA0001295955700000104
获得待检测人脸图像中人脸的年龄,其中fk(xi')表示对待检测图像xi'多个二分类器的输出,age(xi')是待检测图像的估计年龄,testsamples表示待检测图像,xi'属于待检测图像中的一个。
如前所述,潜在因子分解层的输出
Figure BDA0001295955700000111
从公式可以看出面部通用特征
Figure BDA0001295955700000112
通过潜在因子分解层后的输出
Figure BDA0001295955700000113
是一种线性映射关系,和全连接层时等效的。所以在测试过程中,潜在因子分解层可以转换为全连接层,参数W=VTω-1
Figure BDA0001295955700000114
对应的输出就等于参数W乘以输入值以后再加上参数b。待检测图片输入训练后的卷积神经网络,在经过由潜因子分解层转换的全连接层之前获得面部通用特征,经过潜因子分解层转换的全连接层后可以将面部通用特征分解为与年龄相关的特征和与年龄无关的特征,与年龄无关的特征过滤掉,与年龄相关的特征输入分类器获得人脸图像的估算年龄。
在本发明实施例中,首先构建包括潜在因子分解层的卷积神经网络模型,然后初始化所述卷积神经网络模型,将预处理后的图片输出所述初始化后的卷积神经网络,根据所述预处理后的图片基于年龄损失函数通过反向传播法训练所述初始化后的卷积神经网络,待所述卷积神经网络训练好后,就可以将待检测人脸图片输入所述卷积神经网络,最终输出所述待检测图像中人脸的年龄。本发明中,潜在因子分解层可以将图像的特征分解为需要获取的与年龄相关的分量,和与年龄无关的相关分量,所以能够基于与年龄相关的分量进行训练以及检测,并且有利提升面部通用特征与年龄的相关性,提高最终的年龄估算的结果;另外年龄损失函数将年龄标签分为了与年龄段相关的损失函数和与年龄值相关的损失函数。基于年龄段的有序回归损失函数和基于年龄值的有序回归损失函数一起优化,通过基于年龄段的有序回归损失函数判断年龄是否大于某个年龄段,通过年龄值的有序回归函数判断年龄是否大于某个年龄值,基于年龄段的损失函数对基于年龄值的损失函数分类有帮助。从而使得所述包括潜在因子分解层的卷积神经网络模型具有较好的鲁棒性。
基于上述方法,我们在年龄公开的数据集MORPH Album I、MORPH Album II和FG-NET上做了三组对比实验。
数据库介绍:MORPH人脸数据库分两个子集,MORPH Album I和MORPH Album II,前者是包含1679张灰度图像的早期采集的数据集。后者是包含了一共78207张既有灰度又有彩色图的大型数据库。MORPH Album II是一个用于研究非常著名的年龄识别数据库。包含了多个人群在不同年龄段(包括16岁到77岁)的人脸图片,每个人拥有若干张人脸图片,大小为400x480。FG-NET数据集包含年龄在0至69岁之间的82个多人种族的1002张面部图像。数据集年龄分布不平衡,因为50%的图像是从童年时期拍摄的。
第一个实验是把本发明实施例中的年龄损失函数和以下两种方法对比:(1)Softmax损失函数,其中年龄估计被认为是K个分类问题,其中K是年龄数;(2)单任务损失函数,其中仅使用年龄标签等级损失函数。得到的MAE得分(即平均年龄误差),由公式:
Figure BDA0001295955700000121
其中,
Figure BDA0001295955700000122
是预测的年龄,而yn是实际年龄,N是测试样本总数。MAE的对比结果示于表1中,基于这些结果,我们得出结论:1.对于年龄估计,序数损失函数(单任务损失函数和多任务损失函数)优于Softmax。2.多任务损失函数远远优于相应的单任务损失函数。
表1本发明实施例中的多任务损失函数和Softmax、单任务损失函数对比结果
Figure BDA0001295955700000123
在第二个实验中,我们把LFD-CNN(包括潜在因子分解层的卷积神经网络)与去除了潜在银子分解层的通用卷积神经网络(Generic-CNN)来评估LFD-CNN框架的有效性。除潜在因子分解层之外,通用卷积神经网络具有与LFD-CNN相同的参数设置,除了潜在因子分解层不一样。两种方法都使用多任务损失函数。这两个结果MAE得分显示在下表2中。
表2 LFD-CNN和Generic-CNN在不同数据库上的性能对比
Figure BDA0001295955700000131
在第三个实验中,我们将我们的方法与文献中的其他方法进行比较。我们采用随机选取80%的图片做训练,其余20%做测试。在该实验中,使用MAE和CS度量。CS度量方法指的是Cumulative Score,是描述误差在区间内的错误率。计算公式如下:
Figure BDA0001295955700000132
本文中k={0,2,4,6,8,10}。MAE比较的结果如下表3所示。结果表明,在不同数据库上我们的方法都优于其他方法,这证实了我们方法的有效性。
表3本发明LFD-CNN方法与其他方法结果对比
Figure BDA0001295955700000141
本发明实施例通过构建包括潜在因子分解层的卷积神经网络,所述潜在因子分解层可以将图像的特征分解为需要获取的与年龄相关的分量和与年龄无关的相关分量,所以能够基于与年龄相关的分量进行训练以及检测,使得所述卷积神经网络模型具有较好的鲁棒性;另外通过构建的与年龄段相关的损失函数和与年龄值相关的年龄损失函数的多任务损失函数使得估算的年龄的更准确,鲁棒性更好。
应理解,在上述实施例一中,各步骤的序号的大小并不意味着执行顺序的先后,各步骤的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例二:
参见图5,图5是本发明实施例二提供的一种人脸图像年龄估算装置的示意框图,为了便于说明,仅示出与本发明实施例相关的部分。
该人脸图像年龄估算装置可以是内置于终端设备(例如手机、平板电脑、笔记本、计算机等)内的软件单元、硬件单元或者软硬结合的单元,也可以作为独立的挂件集成到所述终端设备中。
所述一种人脸图像年龄估算装置包括:
模型构建模块21,用于构建包括潜在因子分解层的卷积神经网络模型;
初始化模块22,用于初始化所述卷积神经网络模型;
训练模块23,用于将预处理后的图像输入初始化后的卷积神经网络模型,根据所述预处理后的图像基于年龄损失函数通过反向传播法训练所述初始化后的卷积神经网络模型;
年龄估算模块24,用于将待检测人脸图像输入训练后的所述卷积神经网络模型,输出所述待检测人脸图像中人脸的年龄。
可选的,所述初始化模块22包括:
通用网络初始化单元221,用于采用人脸身份识别任务预训练获得所述卷积神经网络模型中除所述潜在因子分解层之外的各层的初始化参数;
潜在因子分解层初始化单元222,用于采用预定的滤波器初始化所述潜因子分解层的参数
Figure BDA0001295955700000161
所述参数U和V用预定的滤波器初始化,所述σ2初始化为0.1,所述
Figure BDA0001295955700000162
初始化为0。
可选的,所述年龄损失函数为:
Figure BDA0001295955700000163
其中,在k∈[1,Kgroup]中,pk指预测年龄大于第k个年龄段的概率,在k∈[1,Kage]中,pk指预测年龄大于第k个年龄的概率,Kgroup是年龄段,Kage是年龄标签的最大值。
可选的,所述训练模块23包括:
正向传播单元231,用于将面部通用特征转换为与年龄相关的向量
Figure BDA0001295955700000164
其中,所述
Figure BDA0001295955700000165
是与年龄相关的向量,
Figure BDA0001295955700000166
是人脸图像上提取的面部通用特征,
Figure BDA0001295955700000167
是所述面部通用特征的特征均值,ω=σ2I+UUT+VVT,I是单位矩阵,U和V是年龄向量和身份向量之间的交叉矩阵;
反向传播单元232,用于通过梯度下降法反向求导所述年龄损失函数更新所述卷积神经网络模型中除所述潜因子分解层之外的各层的参数,通过以下公式更新所述潜在因子分解层的参数
Figure BDA0001295955700000168
U=(C-DB-1E)(A-FB-1E)-1
V=(D-CA-1F)(B-EA-1F)-1
Figure BDA0001295955700000169
Figure BDA00012959557000001610
用连接在所述潜在因子分解层之前的最后一个池化层的特征均值来更新,
其中,
Figure BDA0001295955700000171
Figure BDA0001295955700000172
ω=σ2I+UUT+VVT
Figure BDA0001295955700000173
Figure BDA0001295955700000174
Figure BDA0001295955700000175
Mc表示第c个年龄段中的样本数,Nn表示第n个人的样本数,
Figure BDA0001295955700000176
代表分解后的身份向量,
Figure BDA0001295955700000177
代表着分解后的年龄向量,I是单位矩阵,
Figure BDA0001295955700000178
表示在给定
Figure BDA0001295955700000179
的条件下年龄向量
Figure BDA00012959557000001710
的预测分布,
Figure BDA00012959557000001711
表示在给定
Figure BDA00012959557000001712
的条件下身份向量
Figure BDA00012959557000001713
的预测分布。
可选的,所述年龄估算模块24包括:
转换单元,用于将所述卷积神经网络模型中的潜在因子分解层转换为全连接层;
面部通用特征获取单元,用于将预处理后的待检测人脸图像输入所述卷积神经网络模型,在所述全连接层之前获得人脸图像的面部通用特征;
分解单元,用于将所述面部通用特征输入所述全连接层得到与年龄相关的特征和与年龄无关的特征;
年龄估算单元,用于将与年龄相关的特征输入所述卷积神经网络模型中最后的分类器根据公式
Figure BDA00012959557000001714
获得待检测人脸图像中人脸的年龄,其中fk(xi')表示对待检测图像xi'多个二分类器的输出,age(xi')是待检测图像的估计年龄。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元或模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元或模块既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例的对应过程,在此不再赘述。
实施例三:
参见图6,图6是本发明实施例三提供的终端设备的示意框图。如图所示的该终端设备可以包括:一个或多个处理器601(图6中仅示出一个);一个或多个输入设备602(图6中仅示出一个),一个或多个输出设备603(图6中仅示出一个)和存储器604。上述处理器601、输入设备602、输出设备603和存储器604通过总线605连接。存储器604用于存储指令,处理器601用于执行存储器604存储的指令。其中:
所述处理器601,用于构建包括潜在因子分解层的卷积神经网络模型;所述处理器601用于初始化所述卷积神经网络模型;所述处理器601用于通过输入设备602将预处理后的图像输入初始化后的卷积神经网络模型,根据所述预处理后的图像基于年龄损失函数通过反向传播法训练所述初始化后的卷积神经网络模型;所述处理器601用于通过输入设备602将待检测人脸图像输入训练后的所述卷积神经网络模型,通过输出设备603输出所述待检测人脸图像中人脸的年龄。
可选的,所述处理器601还用于采用人脸身份识别任务预训练获得所述卷积神经网络模型中除所述潜在因子分解层之外的各层的初始化参数;所述处理器601还用于采用预定的滤波器初始化所述潜因子分解层的参数
Figure BDA0001295955700000181
所述参数U和V用预定的滤波器初始化,所述σ2初始化为0.1,所述
Figure BDA0001295955700000182
初始化为0。
可选的,所述年龄损失函数为:
Figure BDA0001295955700000191
其中,在k∈[1,Kgroup]中,pk指预测年龄大于第k个年龄段的概率,在k∈[1,Kage]中,pk指预测年龄大于第k个年龄的概率,Kgroup是年龄段,Kage是年龄标签的最大值。
可选的,所述处理器601还用于将面部通用特征转换为与年龄相关的向量
Figure BDA0001295955700000192
其中,所述
Figure BDA0001295955700000193
是与年龄相关的向量,
Figure BDA0001295955700000194
是人脸图像上提取的面部通用特征,
Figure BDA0001295955700000195
是所述面部通用特征的特征均值,ω=σ2I+UUT+VVT,I是单位矩阵,U和V是年龄向量和身份向量之间的交叉矩阵;所述处理器601还用于通过梯度下降法反向求导所述年龄损失函数更新所述卷积神经网络模型中除所述潜因子分解层之外的各层的参数,所述处理器601还用于通过以下公式更新所述潜在因子分解层的参数
Figure BDA0001295955700000196
U=(C-DB-1E)(A-FB-1E)-1
V=(D-CA-1F)(B-EA-1F)-1
Figure BDA0001295955700000197
Figure BDA0001295955700000198
用连接在所述潜在因子分解层之前的最后一个池化层的特征均值来更新,
其中,
Figure BDA0001295955700000199
Figure BDA00012959557000001910
ω=σ2I+UUT+VVT
Figure BDA00012959557000001911
Figure BDA0001295955700000201
Figure BDA0001295955700000202
Mc表示第c个年龄段中的样本数,Nn表示第n个人的样本数,
Figure BDA0001295955700000203
代表分解后的身份向量,
Figure BDA0001295955700000204
代表着分解后的年龄向量,I是单位矩阵,
Figure BDA0001295955700000205
表示在给定
Figure BDA0001295955700000206
的条件下年龄向量
Figure BDA0001295955700000207
的预测分布,
Figure BDA0001295955700000208
表示在给定
Figure BDA0001295955700000209
的条件下身份向量
Figure BDA00012959557000002010
的预测分布。
可选,所述处理器601还用于将所述卷积神经网络模型中的潜在因子分解层转换为全连接层;所述处理器601还用于将预处理后的待检测人脸图像输入所述卷积神经网络模型,在所述全连接层之前通过输出设备603获得人脸图像的面部通用特征;所述处理器601还用于将所述面部通用特征通过输入设备602输入所述全连接层通过输出设备603得到与年龄相关的特征和与年龄无关的特征;所述处理器601还用于将与年龄相关的特征通过输入设备602输入所述卷积神经网络模型中最后的分类器根据公式
Figure BDA00012959557000002011
通过输出设备603获得待检测人脸图像中人脸的年龄,其中fk(xi')表示对待检测图像xi'多个二分类器的输出,age(xi')是待检测图像的估计年龄。
所述存储器604,用于存储软件程序、模块、单元以及终端设备中需要的数据信息,所述处理器601通过运行存储在所述存储器604的软件程序、模块以及单元,从而执行各种功能应用以及数据处理,提高基于卷积神经网络的人脸图像年龄估算方法的鲁棒性。
应当理解,在本发明实施例中,所称处理器601可以是中央处理单元(CentralProcessing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备602可以包括触控板、指纹采集传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风、数据采集装置、数据接收装置等,输出设备603可以包括显示器(LCD等)、扬声器、数据发送装置等。
该存储器604可以包括只读存储器和随机存取存储器,并向处理器601提供指令和数据。存储器604的一部分还可以包括非易失性随机存取存储器。例如,存储器604还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器601、输入设备602、输出设备603和存储器604可执行本发明实施例提供的一种人脸图像年龄估算方法的实施例中所描述的实现方式,也可执行一种人脸图像年龄估算装置的实施例二中所描述的实现方式,在此不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的终端设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明实施例各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的精神和范围。

Claims (9)

1.一种人脸图像年龄估算方法,其特征在于,所述方法包括:
构建包括潜在因子分解层的卷积神经网络模型,通过所述潜在因子分解层将图像的特征分解为与年龄相关的分量和与年龄无关的分量;
初始化所述卷积神经网络模型;
将预处理后的图像输入初始化后的卷积神经网络模型,根据所述预处理后的图像基于与年龄相关的分量和年龄损失函数通过反向传播法训练所述初始化后的卷积神经网络模型;
将待检测人脸图像输入训练后的所述卷积神经网络模型,基于与年龄相关的分量进行检测,输出所述待检测人脸图像中人脸的年龄;
所述初始化所述卷积神经网络模型包括:
采用人脸身份识别任务预训练获得所述卷积神经网络模型中除所述潜在因子分解层之外的各层的初始化参数;
采用预定的滤波器初始化所述潜在因子分解层的参数
Figure FDA0002752012950000011
其中,U是人脸向量到身份向量的交叉矩阵,V是人脸向量到年龄向量的交叉矩阵,U=(C-DB-1E)(A-FB-1E)-1,V=(D-CA-1F)(B-EA-1F)-1
Figure FDA0002752012950000012
是所述面部通用特征的特征均值,
Figure FDA0002752012950000013
Figure FDA0002752012950000014
Figure FDA0002752012950000015
ω=σ2I+UUT+VVT
Figure FDA0002752012950000016
Figure FDA0002752012950000017
Figure FDA0002752012950000021
Mc表示第c个年龄段中的样本数,Nn表示第n个人的样本数,
Figure FDA0002752012950000022
代表分解后的身份向量,
Figure FDA0002752012950000023
代表着分解后的年龄向量,I是单位矩阵,
Figure FDA0002752012950000024
表示在给定
Figure FDA0002752012950000025
的条件下年龄向量
Figure FDA0002752012950000026
的预测分布,
Figure FDA0002752012950000027
表示在给定
Figure FDA0002752012950000028
的条件下身份向量
Figure FDA0002752012950000029
的预测分布;
所述参数U和V用预定的滤波器初始化,所述σ2初始化为0.1,所述
Figure FDA00027520129500000210
初始化为0。
2.根据权利要求1所述的方法,其特征在于,所述年龄损失函数为:
Figure FDA00027520129500000211
其中,在k∈[1,Kgroup]中,pk指预测年龄大于第k个年龄段的概率,在k∈[1,Kage]中,pk指预测年龄大于第k个年龄的概率,Kgroup是年龄段,Kage是年龄标签的最大值。
3.根据权利要求1所述的方法,其特征在于,所述通过反向传播法训练所述初始化后的卷积神经网络模型包括:
正向传播过程:将面部通用特征转换为与年龄相关的向量
Figure FDA00027520129500000212
其中,所述
Figure FDA00027520129500000213
是与年龄相关的向量,
Figure FDA00027520129500000214
是人脸图像上提取的面部通用特征,
Figure FDA00027520129500000215
是所述面部通用特征的特征均值,ω=σ2I+UUT+VVT,I是单位矩阵,U和V是年龄向量和身份向量之间的交叉矩阵;
反向传播过程:通过梯度下降法反向求导所述年龄损失函数更新所述卷积神经网络模型中除所述潜在因子分解层之外的各层的参数,通过以下公式更新所述潜在因子分解层的参数
Figure FDA00027520129500000216
U=(C-DB-1E)(A-FB-1E)-1
V=(D-CA-1F)(B-EA-1F)-1
Figure FDA0002752012950000031
Figure FDA0002752012950000032
用连接在所述潜在因子分解层之前的最后一个池化层的特征均值来更新,
其中,
Figure FDA0002752012950000033
Figure FDA0002752012950000034
ω=σ2I+UUT+VVT
Figure FDA0002752012950000035
Figure FDA0002752012950000036
Figure FDA0002752012950000037
Mc表示第c个年龄段中的样本数,Nn表示第n个人的样本数,
Figure FDA0002752012950000038
代表分解后的身份向量,
Figure FDA0002752012950000039
代表着分解后的年龄向量,I是单位矩阵,
Figure FDA00027520129500000310
表示在给定
Figure FDA00027520129500000311
的条件下年龄向量
Figure FDA00027520129500000312
的预测分布,
Figure FDA00027520129500000313
表示在给定
Figure FDA00027520129500000314
的条件下身份向量
Figure FDA00027520129500000315
的预测分布。
4.根据权利要求1所述的方法,其特征在于,所述将待检测人脸图像输入训练后的所述卷积神经网络模型,基于与年龄相关的分量进行检测,输出所述待检测人脸图像中人脸的年龄包括:
将所述卷积神经网络模型中的潜在因子分解层转换为全连接层;
将预处理后的待检测人脸图像输入所述卷积神经网络模型,在所述全连接层之前获得人脸图像的面部通用特征;
将所述面部通用特征输入所述全连接层得到与年龄相关的特征和与年龄无关的特征;
将与年龄相关的特征输入所述卷积神经网络模型中最后的分类器根据公式
Figure FDA00027520129500000316
x′i∈{testsamples}获得待检测人脸图像中人脸的年龄,其中fk(x′i)表示对待检测图像x′i多个二分类器的输出,age(x′i)是待检测图像的估计年龄。
5.一种人脸图像年龄估算装置,其特征在于,所述装置包括:
模型构建模块,用于构建包括潜在因子分解层的卷积神经网络模型;
初始化模块,用于初始化所述卷积神经网络模型;
训练模块,用于将预处理后的图像输入初始化后的卷积神经网络模型,根据所述预处理后的图像基于年龄损失函数通过反向传播法训练所述初始化后的卷积神经网络模型;
年龄估算模块,用于将待检测人脸图像输入训练后的所述卷积神经网络模型,输出所述待检测人脸图像中人脸的年龄;
所述初始化模块包括:
初始化参数训练子单元,用于采用人脸身份识别任务预训练获得所述卷积神经网络模型中除所述潜在因子分解层之外的各层的初始化参数;
分解层参数初始化子单元,用于采用预定的滤波器初始化所述潜在因子分解层的参数
Figure FDA0002752012950000041
其中,U是人脸向量到身份向量的交叉矩阵,V是人脸向量到年龄向量的交叉矩阵,U=(C-DB-1E)(A-FB-1E)-1,V=(D-CA-1F)(B-EA-1F)-1
Figure FDA0002752012950000042
是所述面部通用特征的特征均值,
Figure FDA0002752012950000043
Figure FDA0002752012950000044
ω=σ2I+UUT+VVT
Figure FDA0002752012950000045
Figure FDA0002752012950000046
Figure FDA0002752012950000051
Mc表示第c个年龄段中的样本数,Nn表示第n个人的样本数,
Figure FDA0002752012950000052
代表分解后的身份向量,
Figure FDA0002752012950000053
代表着分解后的年龄向量,I是单位矩阵,
Figure FDA0002752012950000054
表示在给定
Figure FDA0002752012950000055
的条件下年龄向量
Figure FDA0002752012950000056
的预测分布,
Figure FDA0002752012950000057
表示在给定
Figure FDA0002752012950000058
的条件下身份向量
Figure FDA0002752012950000059
的预测分布;
所述参数U和V用预定的滤波器初始化,所述σ2初始化为0.1,所述
Figure FDA00027520129500000510
初始化为0。
6.根据权利要求5所述的装置,其特征在于,所述年龄损失函数为:
Figure FDA00027520129500000511
其中,在k∈[1,Kgroup]中,pk指预测年龄大于第k个年龄段的概率,在k∈[1,Kage]中,pk指预测年龄大于第k个年龄的概率,Kgroup是年龄段,Kage是年龄标签的最大值。
7.根据权利要求5所述的方法,其特征在于,所述训练模块包括:
正向传播单元,用于将面部通用特征转换为与年龄相关的向量
Figure FDA00027520129500000512
其中,所述
Figure FDA00027520129500000513
是与年龄相关的向量,
Figure FDA00027520129500000514
是人脸图像上提取的面部通用特征,
Figure FDA00027520129500000515
是所述面部通用特征的特征均值,ω=σ2I+UUT+VVT,I是单位矩阵,U和V是年龄向量和身份向量之间的交叉矩阵;
反向传播单元,用于通过梯度下降法反向求导所述年龄损失函数更新所述卷积神经网络模型中除所述潜在因子分解层之外的各层的参数,通过以下公式更新所述潜在因子分解层的参数
Figure FDA00027520129500000516
U=(C-DB-1E)(A-FB-1E)-1
V=(D-CA-1F)(B-EA-1F)-1
Figure FDA0002752012950000061
Figure FDA0002752012950000062
用连接在所述潜在因子分解层之前的最后一个池化层的特征均值来更新,
其中,
Figure FDA0002752012950000063
Figure FDA0002752012950000064
ω=σ2I+UUT+VVT
Figure FDA0002752012950000065
Figure FDA0002752012950000066
Figure FDA0002752012950000067
Mc表示第c个年龄段中的样本数,Nn表示第n个人的样本数,
Figure FDA0002752012950000068
代表分解后的身份向量,
Figure FDA0002752012950000069
代表着分解后的年龄向量,I是单位矩阵,
Figure FDA00027520129500000610
表示在给定
Figure FDA00027520129500000611
的条件下年龄向量
Figure FDA00027520129500000612
的预测分布,
Figure FDA00027520129500000613
表示在给定
Figure FDA00027520129500000614
的条件下身份向量
Figure FDA00027520129500000615
的预测分布。
8.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述方法的步骤。
CN201710343857.7A 2017-05-16 2017-05-16 一种人脸图像年龄估算方法、装置及其终端设备 Active CN107169454B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710343857.7A CN107169454B (zh) 2017-05-16 2017-05-16 一种人脸图像年龄估算方法、装置及其终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710343857.7A CN107169454B (zh) 2017-05-16 2017-05-16 一种人脸图像年龄估算方法、装置及其终端设备

Publications (2)

Publication Number Publication Date
CN107169454A CN107169454A (zh) 2017-09-15
CN107169454B true CN107169454B (zh) 2021-01-01

Family

ID=59815795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710343857.7A Active CN107169454B (zh) 2017-05-16 2017-05-16 一种人脸图像年龄估算方法、装置及其终端设备

Country Status (1)

Country Link
CN (1) CN107169454B (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021863B (zh) * 2017-11-01 2022-05-06 平安科技(深圳)有限公司 电子装置、基于图像的年龄分类方法及存储介质
CN107622261A (zh) * 2017-11-03 2018-01-23 北方工业大学 基于深度学习的人脸年龄估计方法及装置
CN107886062B (zh) * 2017-11-03 2019-05-10 北京达佳互联信息技术有限公司 图像处理方法、系统及服务器
CN107968934B (zh) * 2017-11-17 2018-07-31 广东教云实业有限公司 智能化电视机监控平台
CN107818314B (zh) * 2017-11-22 2019-03-19 北京达佳互联信息技术有限公司 脸部图像处理方法、装置及服务器
CN107977633B (zh) * 2017-12-06 2019-04-09 平安科技(深圳)有限公司 人脸图像的年龄识别方法、装置及存储介质
CN108256482B (zh) * 2018-01-18 2021-06-25 中科视拓(北京)科技有限公司 一种基于卷积神经网络进行分布学习的人脸年龄估计方法
CN108985215B (zh) * 2018-07-09 2020-05-22 Oppo(重庆)智能科技有限公司 一种图片处理方法、图片处理装置及终端设备
CN108985222B (zh) * 2018-07-12 2024-02-20 天津艾思科尔科技有限公司 一种用于接打电话识别的深度学习网络模型及系统
CN109523463B (zh) * 2018-11-20 2023-04-07 中山大学 一种基于条件生成对抗网络的人脸老化方法
CN109815770B (zh) * 2019-01-31 2022-09-27 北京旷视科技有限公司 二维码检测方法、装置及系统
CN109934115B (zh) * 2019-02-18 2021-11-02 苏州市科远软件技术开发有限公司 人脸识别模型的构建方法、人脸识别方法及电子设备
CN110008907B (zh) * 2019-04-09 2021-10-01 成都旷视金智科技有限公司 一种年龄的估计方法、装置、电子设备和计算机可读介质
CN110287942B (zh) * 2019-07-03 2021-09-17 成都旷视金智科技有限公司 年龄估计模型的训练方法、年龄估计方法以及对应的装置
CN112307796B (zh) * 2019-07-24 2022-06-24 魔门塔(苏州)科技有限公司 一种用于红外图像的年龄预测方法及装置
CN112836549A (zh) * 2019-11-22 2021-05-25 虹软科技股份有限公司 用户信息的检测方法及系统、电子设备
TWI758665B (zh) * 2019-12-05 2022-03-21 國立中興大學 狀態辨識系統與方法
CN111046786A (zh) * 2019-12-06 2020-04-21 北京金山云网络技术有限公司 年龄估计神经网络的生成方法、装置以及电子设备
TWM600433U (zh) * 2020-02-12 2020-08-21 大江生醫股份有限公司 細胞年齡檢測系統
CN111881737B (zh) * 2020-06-18 2023-12-08 深圳数联天下智能科技有限公司 年龄预测模型的训练方法及装置、年龄预测方法及装置
CN112183283A (zh) * 2020-09-22 2021-01-05 北京金山云网络技术有限公司 一种基于图像的年龄估计方法、装置、设备及存储介质
CN117095434A (zh) * 2023-07-24 2023-11-21 山东睿芯半导体科技有限公司 一种不同年纪人脸识别方法、芯片及终端

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7804999B2 (en) * 2005-03-17 2010-09-28 Siemens Medical Solutions Usa, Inc. Method for performing image based regression using boosting
CN106295506A (zh) * 2016-07-25 2017-01-04 华南理工大学 一种基于集成卷积神经网络的年龄识别方法
CN106408610A (zh) * 2015-04-16 2017-02-15 西门子公司 用边缘空间深度神经网络进行解剖对象检测的方法和系统
CN106446930A (zh) * 2016-06-28 2017-02-22 沈阳工业大学 基于深层卷积神经网络的机器人工作场景识别方法
CN106503623A (zh) * 2016-09-27 2017-03-15 中国科学院自动化研究所 基于卷积神经网络的人脸图像年龄估算方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7804999B2 (en) * 2005-03-17 2010-09-28 Siemens Medical Solutions Usa, Inc. Method for performing image based regression using boosting
CN106408610A (zh) * 2015-04-16 2017-02-15 西门子公司 用边缘空间深度神经网络进行解剖对象检测的方法和系统
CN106446930A (zh) * 2016-06-28 2017-02-22 沈阳工业大学 基于深层卷积神经网络的机器人工作场景识别方法
CN106295506A (zh) * 2016-07-25 2017-01-04 华南理工大学 一种基于集成卷积神经网络的年龄识别方法
CN106503623A (zh) * 2016-09-27 2017-03-15 中国科学院自动化研究所 基于卷积神经网络的人脸图像年龄估算方法

Also Published As

Publication number Publication date
CN107169454A (zh) 2017-09-15

Similar Documents

Publication Publication Date Title
CN107169454B (zh) 一种人脸图像年龄估算方法、装置及其终端设备
CN108875522B (zh) 人脸聚类方法、装置和系统及存储介质
WO2021077984A1 (zh) 对象识别方法、装置、电子设备及可读存储介质
CN111666857B (zh) 基于环境语义理解的人体行为识别方法、装置及存储介质
CN109508688B (zh) 基于骨架的行为检测方法、终端设备及计算机存储介质
Singh et al. Image classification: a survey
CN106372581B (zh) 构建及训练人脸识别特征提取网络的方法
CN110363081B (zh) 人脸识别方法、装置、设备及计算机可读存储介质
CN107958230B (zh) 人脸表情识别方法及装置
CN112395979B (zh) 基于图像的健康状态识别方法、装置、设备及存储介质
CN111401339B (zh) 识别人脸图像中的人的年龄的方法、装置及电子设备
CN112464865A (zh) 一种基于像素和几何混合特征的人脸表情识别方法
Santhalingam et al. Sign language recognition analysis using multimodal data
CN110414550B (zh) 人脸识别模型的训练方法、装置、系统和计算机可读介质
CN111954250B (zh) 一种轻量级Wi-Fi行为感知方法和系统
CN112257578A (zh) 人脸关键点检测方法、装置、电子设备及存储介质
Zeng et al. Gait recognition across different walking speeds via deterministic learning
CN112749737A (zh) 图像分类方法及装置、电子设备、存储介质
CN110390307B (zh) 表情识别方法、表情识别模型训练方法及装置
CN111860056B (zh) 基于眨眼的活体检测方法、装置、可读存储介质及设备
CN110717407A (zh) 基于唇语密码的人脸识别方法、装置及存储介质
CN111241961A (zh) 人脸检测方法、装置及电子设备
CN114386981A (zh) 风险识别方法、装置、计算机设备及存储介质
Luwe et al. Wearable sensor-based human activity recognition with ensemble learning: a comparison study.
Boncolmo et al. Gender Identification Using Keras Model Through Detection of Face

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant