CN105975916A - 基于多输出卷积神经网络和有序回归的年龄估计方法 - Google Patents

基于多输出卷积神经网络和有序回归的年龄估计方法 Download PDF

Info

Publication number
CN105975916A
CN105975916A CN201610273524.7A CN201610273524A CN105975916A CN 105975916 A CN105975916 A CN 105975916A CN 201610273524 A CN201610273524 A CN 201610273524A CN 105975916 A CN105975916 A CN 105975916A
Authority
CN
China
Prior art keywords
age
output
convolutional neural
neural networks
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610273524.7A
Other languages
English (en)
Other versions
CN105975916B (zh
Inventor
牛振兴
魏雪
周默
袁博
高新波
华刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Huimou Yifang Intelligent Technology Co ltd
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201610273524.7A priority Critical patent/CN105975916B/zh
Publication of CN105975916A publication Critical patent/CN105975916A/zh
Application granted granted Critical
Publication of CN105975916B publication Critical patent/CN105975916B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于多输出卷积神经网络和有序回归的年龄估计方法,其实现是:1.建立亚洲人脸年龄数据集(AFAD);2.建立用于二分类的训练数据;3.训练深度卷积神经网络;4.将测试样本输入到训练好的卷积神经网络;5.得到测试样本的年龄估计。本发明提出了一种对年龄进行排序的方法,将有序回归和深度学习方法相结合,显著地提升了年龄预测性能的准确度。本发明解决了现有年龄估计方法中特征提取和回归建模是独立进行与优化的不足,能充分利用年龄标签的序列关系将年龄估计有序回归,提高了年龄估计准确率,还为亚洲人脸的年龄估计建立了一个大规模数据库,为人脸年龄估计研究提供了数据库基础。能广泛用于对人脸图像的年龄估计。

Description

基于多输出卷积神经网络和有序回归的年龄估计方法
技术领域
本发明属于计算机视觉技术领域,主要涉及人脸图像的年龄估计方法,具体是一种基于多输出卷积神经网络和有序回归的年龄估计方法,可用于对人脸图像进行年龄估计。
背景技术
对人脸图像进行人类年龄估计是一个较新的研究方向,在现实生活中有着广泛的应用。例如在安全监控方面,通过监控摄像机输入图像,年龄估计系统可以警告或阻止未成年人进入网吧或进入酒吧饮酒;在商业用户管理方面,广告商可以根据行人的年龄为不同的潜在客户提供特定的广告;在生物特征识别方面,可以进行长时间跨度的人脸识别。
G.Guo,G.Mu,Y.Fu and T.Huang在文章“Human age estimation using bio-inspired features”(CVPR,2009)中将生物启发式方法引入到年龄估计领域,在小波变换的基础上通过简单层和复杂层的处理得到人脸图像的纹理特征,生物启发式方法是年龄估计领域表现最好的特征提取方法之一。然后生物启发式特征被输入另一个回归器或分类器用于年龄估计。
D.Yi,Z.Lei,and S.Li在文章“Age estimation by multi-scale convolutionalnetwork”(CVPR,2014)中首次将深度卷积神经网络应用于年龄估计,它包括1层卷积层、1层池化层、1层局部层和1层全链接层。随后,深度卷积神经网络提取到的特征被输入另一个回归器用于年龄估计。
以上两种方法的不足之处在于将基于人脸图像的年龄估计方法分为独立的两步:特征的提取和或者度量回归或者多分类。这两个步骤是分离进行、独立优化的。另一方面,人类面部在不同年龄段有不同的老化表现,在童年时期表现为人脸形状的变化,在成年时期则表现为皮肤纹理的变化。由于老化模式形成的随机过程的非平稳性,人工选取的特征并不能适用于所有的年龄范围。
发明内容
本发明的目的在于针对上述现有技术分为两步优化的不足,提出一种经过排序准确估计年龄的基于多输出卷积神经网络和有序回归的年龄估计方法。
本发明是一种基于多输出卷积神经网络和有序回归的年龄估计方法,其特征在于,包括有如下步骤:
(1)建立亚洲人脸年龄数据集(AFAD),其中包含了16万张亚洲人脸图像,每一张人脸图像都有年龄标签,这是目前为止,最大的公开年龄数据集,解决了大规模年龄数据集的缺乏使得年龄估计问题无法取得更大进展的屏障。目前最大的受欢迎的公开数据库有FG-NET数据库包含1002张人脸图片、MORPH I数据库包含1690张人脸图片、MORPH II数据库包含55608张人脸图片,这些数据库并不能满足深度学习算法对巨大的训练样本的需求。此外MORPH II数据库的种族分布是非常不平衡的,例如超过96%的面孔是非洲和欧洲人种,但只有少于1%的面孔来自亚洲。因此,以前年龄估计的方法在亚洲面孔上的性能是未知的。而亚洲人脸年龄数据集包含了16万张亚洲人脸图像,很好的弥补了这个不足。
(2)建立用于二分类的训练数据,输入亚洲人脸年龄数据集中带年龄标签的人脸图像集,将年龄估计问题转化为一系列的二分类子问题,对每一个二分类子问题的二分类器构建相应的训练数据,及根据人脸图像的年龄标签生成一系列的二分类类标,从输入的亚洲人脸年龄数据集中带年龄标签的人脸图像集得到包含人脸图像、二分类类标和权重的训练数据。
(3)训练深度卷积神经网络,根据训练数据,训练多输出深度卷积神经网络,使得每一个输出都是二分类器的一个二分类类标。
(4)将测试样本输入到训练好的卷积神经网络中,将一张步骤(1)中建立的亚洲人脸年龄数据集中的不带年龄标签的人脸图像作为测试样本,将测试图像输入步骤(3)中训练好的多输出深度卷积神经网络,进行多层的卷积、池化等操作。
(5)得到测试样本的年龄估计,得到多输出深度卷积神经网络的输出,每一个输出都是二分类器的一个二分类类标,对所有输出类标进行等级排序,得到测试样本的年龄估计。
实现本发明目的的技术思路是,根据年龄标签的序列关系,将年龄估计问题看作有序回归问题;把有序回归问题转化为一系列的二分类子问题,并用多输出深度卷积神经网络解决这些子问题。
与现有技术比,本发明的技术优势有:
(1)现有的年龄估计方法都分为独立的两步:特征的提取和度量回归或者是多分类,这两个步骤是分离进行、独立优化的,存在两步中均为最优,而最终结果并非出于最优状态的可能性。本发明通过一种端对端的多输出深度卷积神经网络,将特征提取和回归或多分类过程进行融合,使得优化函数在全过程上取得最优解,保证最终结果为最优;
(2)在特征提取阶段,现有的年龄估计的特征提取方法大多采用人脸的形状特征或者纹理特征,而本发明采用深度学习的方法自动的对人脸特征进行学习,与人工选取的特征相比自动学习的特征更好的契合人脸老化的全过程;
(3)在回归或多分类阶段,现有的年龄估计方法大多采用支持向量机或者典型相关性分析方法,而本发明采用有序回归的方法对年龄标签之间的相对顺序进行排序,而不是直接对人脸图像的年龄确切值进行估计,解决了老化模式形成随机过程的非平稳性,提高了年龄估计的准确率;
(4)本发明首次建立了大规模亚洲人脸年龄数据集,与现有的数据库相比,包含了16万张亚洲人脸图像,是目前为止最大的公开年龄数据集,解决了大规模年龄数据集的缺乏使得年龄估计问题无法取得更大进展的屏障。同时,不同于现有数据库大多分布在非洲和欧洲人种上的不均衡性,亚洲人脸年龄数据集中的大部分人脸图像为亚洲人种。
附图说明
图1为本发明的实现流程图;
图2为建立亚洲人脸年龄数据集的实现流程图;
图3为亚洲人脸年龄数据集部分样本示例图,图3(a)为亚洲人脸年龄数据集中不同年龄的女性图像示例,图3(b)为亚洲人脸年龄数据集中不同年龄的男性图像示例;
图4为多输出深度卷积神经网络结构图;
图5为本发明在性能评价指标累计指数上与其他技术的对比图。
具体实施方式
下面结合附图,对本发明详细描述。
实施例1
对人脸图像进行人类年龄估计在现实生活中有着广泛的应用。例如在安全监控方面,通过对监控摄像机中人脸图像进行年龄估计,可以警告或阻止未成年人进入网吧或酒吧饮酒;在商业用户管理方面,广告商可以根据行人的年龄为不同的潜在客户提供特定的广告;在生物特征识别方面,可以进行长时间跨度的人脸识别。但是现有的年龄估计技术存在很多的不足,例如特征提取和回归或多分类分离进行、训练数据不足并且分布不均匀。这些不足严重影响了现有年龄估计技术的预测准确度。
本发明一直在计算机视觉领域进行探索与研究,针对现有年龄估计技术的不足,提出了一种基于多输出卷积神经网络和有序回归的年龄估计方法,参见图1,包括有如下步骤:
(1)建立亚洲人脸年龄数据集(AFAD),其中包含了16万张亚洲人脸图像,每一张人脸图像都有年龄标签,这是目前为止,最大的公开年龄数据集。它解决了大规模年龄数据集的缺乏使得年龄估计问题无法取得更大进展的屏障,尤其是为亚洲人脸识别提供了有效的数据基础,在此基础上还可以进一步进行满足需要的数据扩充。目前世界上最大的受欢迎的公开数据库包括FG-NET数据库,该数据仅存1002张人脸图片、MORPH I数据库其中仅存1690张人脸图片、MORPH II数据库其中仅存55608张人脸图片,而本发明的亚洲人脸年龄数据集包含了16万张亚洲人脸图像,这些数据库并不能满足深度学习算法对巨大的训练样本的需求。此外MORPH II数据集的种族分布是非常不平衡的,例如超过96%的面孔是非洲和欧洲的,但只有少于1%的面孔来自亚洲,因此,以前年龄估计的方法在亚洲面孔上的性能是未知的。而亚洲人脸年龄数据集包含了16万张亚洲人脸图像,很好的弥补了这个不足。亚洲人脸年龄数据集的建立过程参见图2。参见图3,本发明亚洲人脸年龄数据集不仅数量多,而且对性别进行了分类,图3(a)为亚洲人脸年龄数据集中不同年龄的女性图像示例,图3(b)为亚洲人脸年龄数据集中不同年龄的男性图像示例。本发明的数据库不仅满足了深度学习算法对巨大训练样本的需求,而且提供了大量的亚洲人脸图像。
(2)建立用于二分类的训练数据,输入亚洲人脸年龄数据集中带年龄标签的人脸图像集,将年龄估计问题转化为一系列的二分类子问题,对每一个二分类子问题的二分类器构建相应的训练数据,根据人脸图像的年龄标签生成一系列的二分类类标,从输入亚洲人脸年龄数据集中带年龄标签的人脸图像集得到包含人脸图像、二分类类标和权重的训练数据。
(3)训练深度卷积神经网络,根据训练数据,训练多输出深度卷积神经网络,使得每一个输出都是二分类器的一个二分类类标。参见图4,本例中多输出深度卷积神经网络包含3层卷积层,3层局部归一化层和2层最大值池化层,之后是80个神经元组成的全连接层。所有的输出共享相同的中间层,经过这3层处理,多输出深度卷积神经网络取得了最好的性能。
(4)将测试样本输入到训练好的卷积神经网络中,将一张步骤(1)中建立的亚洲人脸年龄数据集中的不带年龄标签的人脸图像作为测试样本,将测试图像输入步骤(3)中训练好的多输出深度卷积神经网络,分别进行3层卷积,3层局部归一化和2层最大值池化操作。
本发明在研究与开发的过程中,曾经将图3(a)所示女性图像和图3(b)所示男性图像中的每一幅图像都作为测试样本进行了测试,分别输入到了多输出深度卷积神经网络,取得了较高的年龄准确率。
(5)得到测试样本的年龄估计,得到多输出深度卷积神经网络的输出,每一个输出都是二分类器的一个二分类类标,对所有输出类标进行等级排序,得到测试样本的年龄估计。
现有的年龄估计方法都分为独立的两步:特征的提取和度量回归或者是多分类,这两个步骤是分离进行、独立优化的,这样做不仅分两步进行有两次优化过程,而且存在两步中均为最优,而最终结果并非最优状态的可能性。而本发明基于多输出卷积神经网络的排序回归模型及其在年龄估计中的应用通过一种端对端的多输出深度卷积神经网络,将特征提取和回归或多分类过程进行融合,使得优化过程中不仅学习到了最优的人脸年龄特征,使得优化函数在全过程上取得最优解。
实施例2
基于多输出卷积神经网络和有序回归的年龄估计方法同实施例1,其中步骤(1)中建立亚洲人脸年龄数据集,参见图2,包括有如下步骤:
(1a)通过在特定的社交网络人人网上收集人脸图像建立这个数据集,人人网是一个社交网络,学生在上面可以与他人建立联系,上传照片,发表评论等等,在包括中学生、高中生、本科生和研究生在内的许多亚洲学生中有着广泛的应用。即使在毕业之后,有些人仍旧登录他们的人人网账号来与老同学进行联系。因此,人人网用户的年龄跨越了从15岁到超过40岁一个很长的范围,这有利于建立一个广泛年龄跨度的数据集。人人网上有一个特殊的相册头像相册用于每一个用户上传自己的照片,所以亚洲人脸年龄数据集中的图像来自人人网上用户的头像相册。
(1b)用户在人人网上创建一个账户时,需要提供出生日期和性别等信息。通过用户头像相册中图片的上传日期与该用户所提供的出生日期得到该张图像的年龄,以此年龄作为标签。通过该用户所提供的性别信息作为性别标签。
(1c)通过OpenCV对所得到的所有图像进行人脸识别和剪裁,删除不含人脸的图像如物品甚至标志物图像和人脸图像中的背景如人的全身照,得到人脸图像;
(1d)利用人工手动滤除卡通头像、观测年龄明显与年龄标签不符的图像、观测性别明显与性别标签不符的图像等噪声数据。最后,一共收集了164,432张有年龄标签的人脸图像,其中包含63,680张女性人脸图像和100,752张男性人脸图像,年龄范围从15到40岁,以此作为亚洲人脸年龄数据集。
亚洲人脸年龄数据集的建立过程参见图2。参见图3,为亚洲人脸年龄数据集部分样本示例图,图3(a)为亚洲人脸年龄数据集中不同年龄的女性图像示例,图3(b)为亚洲人脸年龄数据集中不同年龄的男性图像示例。
本发明首次建立了大规模亚洲人脸年龄数据集,与现有的数据库相比,包含了16万张亚洲人脸图像,是目前为止,最大的公开年龄数据集,解决了大规模年龄数据集的缺乏使得年龄估计问题无法取得更大进展的屏障。同时,不同于现有数据库大多分布在非洲和欧洲人种上,亚洲人脸年龄数据集中的大部分人脸图像为亚洲人种,解决了以前的年龄估计方法在亚洲面孔上的性能是未知的困境。
实施例3
基于多输出卷积神经网络和有序回归的年龄估计方法同实施例1-2,其中步骤(2)所述建立用于二分类的训练数据包括如下步骤:
(2a)把年龄估计转化为年龄排序用一系列的二分类器处理,对亚洲人脸年龄数据集图像的每一个二分类器构建相应的训练数据,给定有序的训练数据其中,xi∈χ为第i幅图像的输入空间,yi∈γ={r1,r2,...,rK}为有序序列的输出空间,rK>rK-1>…>r1,K为等级总数,符号>表示不同等级之间的排序,N为训练数据的总数。
(2b)对于第k个二分类器,其二分类类标表示第i个样本的序标号yi是否比rk大,定义如下:
当于yi>rk时,二分类类标为1,否则为0,便于以后对年龄进行排序。
(2c)一个具体的训练数据构造为其中是一个二分类类标,是第i个样本的权重,采用绝对代价矩阵取值为
本发明采用有序回归的方法对年龄标签之间的相对顺序进行排序,而不是单纯对人脸图像的年龄确切值进行估计,解决了老化模式形成随机过程的非平稳性。根据年龄标签的序列关系,将年龄估计问题看作有序回归问题,把有序回归问题转化为一系列的二分类子问题,克服了回归问题在训练过程中的过拟合现象。
实施例4
基于多输出卷积神经网络和有序回归的年龄估计方法同实施例1-3,步骤(3)所述训练深度卷积神经网络包括有如下步骤:
(3a)定义多输出深度卷积神经网络的损失函数Em写为:
E m = - 1 N Σ i = 1 N Σ t = 1 T λ t 1 { o i t = y i t } w i t l o g ( p ( o i t | x i , W t ) )
其中,N为输入训练样本数目,T为输出数目,λt表示第t个输出的重要性系数,1{·}为布尔测试,内部条件为真则其为1,否则为0,表示第i个图像的第t个输出,表示第i幅图像的第t个子问题对应类标,第i幅图像的第t个输出的权重,xi∈χ表示第i幅图像的输入,Wt为第t个输出的权重。
(3b)对损失函数进行优化,对于多输出深度卷积神经网络的第t个输出,从L-1层第j个神经元到L层第k个神经元权重的梯度计算如下:
∂ E m ∂ W L - 1 t ( j , k ) = δ L t ( k ) o ( j )
δ L t ( k ) = p ( o t ( k ) | x k , W L - 1 t ) - 1 { o t = y t }
其中,Em是卷积神经网络的损失函数,o(j)是L-1层第j个神经元的输出,是输出层第k个神经元的误差。
(3c)从L-2层第i个神经元到L-1层第j个神经元权重的梯度计算如下:
∂ E m ∂ W L - 2 ( i , j ) = δ L - 1 ( k ) o ( i )
δ L - 1 ( j ) = Σ t = 1 T λ t ( Σ k ∈ L t δ L t ( k ) W L - 1 t ( j , k ) )
其中,o(i)是L-2层第i个神经元的输出,δL-1(j)是L-1层第j个神经元的误差。
(3d)反复执行步骤(3b)-(3c),直至多输出深度卷积神经网络的损失函数Em取得最小值。
(3f)输出损失函数Em取得最小值时的最优权重参数Wt,使得每一个输出都是二分类器的一个二分类类标。
多输出卷积神经网络结构参见图4,多输出深度卷积神经网络包含3层卷积层,3层局部归一化层和2层最大值池化层,之后是80个神经元组成的全连接层。所有的输出共享相同的中间层。
本发明通过采用深度神经网络的方法,避免了人工选取特征所带来的误差。同时,深度神经网络方法的使用,将特征提取与回归或多分类两个阶段融合了起来,使得优化函数在全过程上取得最优解。
实施例5
基于多输出卷积神经网络和有序回归的年龄估计方法同实施例1-4,步骤(4)所述将测试样本输入到训练好的卷积神经网络中包括有如下步骤:
(4a)从亚洲人脸年龄数据集中选择一张不带年龄标签的人脸图像作为测试样本,测试图像数据为x′;
(4b)将测试图像输入训练好的多输出深度卷积神经网络进行多层的卷积、池化操作,其中使用到的权重参数Wt为步骤(3f)得到的最优参数。
将测试图像直接输入训练好的多输出深度卷积神经网络,其中使用到的权重参数都来自训练过程,因此本发明得到的特征将最契合年龄估计这一应用。
实施例6
基于多输出卷积神经网络和有序回归的年龄估计方法同实施例1-5,步骤(5)所述得到测试样本的年龄估计包括有如下步骤:
(5a)得到测试图像数据x′的多个输出fk(x′)∈{0,1},k=1,2,…,K-1,在本发明中设置最小的年龄数是1,年龄取值原则上都为整数,输出fk(x′)为第k个分类器的二分类类标。
(5b)由多个二分类类标根据下面的公式预测训练数据x′的等级h(x′)
h(x′)=rq
其中,
(5c)输出测试图像的估计年龄,测试图像的估计年龄是等级h(x′),h(x′)是1,2,…,K-1其中的一个。
本发明采用以上方案,解决了现有的年龄数据库数据量小不适用于训练深度学习模型且人种分布不均衡的问题。本发明使用多输出卷积神经网络和有序回归技术也解决了现有的年龄估计问题存在的很多不足,提高了年龄估计的准确率。
实施例7
基于多输出卷积神经网络和有序回归的年龄估计方法同实施例1-6,下面在给出一个例子进一步说明本发明的实现和技术优势:
步骤1,建立亚洲人脸年龄数据集(AFAD)
本发明采用MORPH II人脸图像数据集和AFAD数据库,其中,MORPH II包含55,608幅人脸图像,其中42,589幅为非洲人脸图像(77%),10,559为欧洲人脸图像(19%),1,769为西班牙裔美国人人脸图像(3%),只有154幅亚洲人脸图像(0.2%),年龄跨度从16岁到77岁,年龄中位数为33,每个人的平均图像张数为4;AFAD包含164,432张有年龄标签的人脸图片,分为63,680张女性图片和100,752张男性图片,年龄范围从15岁到40岁。亚洲人脸年龄数据集的建立过程参见图2,步骤如下:
(1a)通过在特定的社交网络人人网上收集人脸图像建立这个数据集,人人网是一个社交网络,学生在上面可以与他人建立联系,上传照片,发表评论等等,在包括中学生、高中生、本科生和研究生在内的许多亚洲学生中有着广泛的应用。即使在毕业之后,有些人仍旧登录他们的人人网账号来与老同学进行联系。因此,人人网用户的年龄跨越了从15岁到超过40岁一个很长的范围,这有利于建立一个广泛年龄跨度的数据集。人人网上有一个特殊的相册头像相册用于每一个用户上传自己的照片,所以亚洲人脸年龄数据集中的图像来自人人网上用户的头像相册。
(1b)用户在人人网上创建一个账户时,需要提供出生日期和性别等信息。通过用户头像相册中图片的上传日期与该用户所提供的出生日期得到该张图像的年龄,以此年龄作为标签。通过该用户所提供的性别信息作为性别标签。
(1c)通过OpenCV对所得到的所有图像进行人脸识别和剪裁,删除不含人脸的图像如物品甚至标志物图像和人脸图像中的背景如人的全身照,得到人脸图像。
(1d)利用人工手动滤除卡通头像、观测年龄明显与年龄标签不符的图像、观测性别明显与性别标签不符的图像等噪声数据。最后,一共收集了164,432张有年龄标签的人脸图像,其中包含63,680张女性人脸图像和100,752张男性人脸图像,年龄范围从15到40岁,以此作为亚洲人脸年龄数据集。
参见图3,为亚洲人脸年龄数据集部分样本示例图,图3(a)为亚洲人脸年龄数据集中不同年龄的女性图像示例,图3(b)为亚洲人脸年龄数据集中不同年龄的男性图像示例。
步骤2,建立用于二分类的训练数据
(2a)把年龄估计转化为年龄排序用一系列的二分类器处理,对亚洲人脸年龄数据集图像的每一个二分类器构建相应的训练数据,给定有序的训练数据其中,xi∈χ为第i幅图像的输入空间,yi∈γ={r1,r2,...,rK}为有序序列的输出空间,rK>rK-1>...>r1,K为等级总数,符号>表示不同等级之间的排序,N为训练数据的总数。
(2b)对于第k个二分类器,其二分类类标表示第i个样本的序标号yi是否比rk大,定义如下:
本发明定义了二分类器的类标,当于yi>r时,二分类类标为1,否则为0,便于以后对年龄进行排序。
(2c)一个具体的训练数据构造为其中是一个二分类类标,是第i个样本的权重,采用绝对代价矩阵取值为
步骤3,训练深度卷积神经网络
多输出深度卷积神经网络有一个多输出结构,每一个输出对应一个二分类器。这些二分类器在深度卷积神经网络中联合训练。具体步骤如下:
(3a)定义多输出深度卷积神经网络的损失函数Em写为:
E m = - 1 N Σ i = 1 N Σ t = 1 T λ t 1 { o i t = y i t } w i t l o g ( p ( o i t | x i , W t ) )
其中,N为输入训练样本数目,T为输出数目,λt表示第t个输出的重要性系数,1{·}为布尔测试,内部条件为真则其为1,否则为0,表示第i个图像的第t个输出,表示第i幅图像的第t个子问题对应类标,第i幅图像的第t个输出的权重,xi∈χ表示第i幅图像的输入,Wt为第t个输出的权重。
(3b)对损失函数进行优化,对于多输出深度卷积神经网络的第t个输出,从L-1层第j个神经元到L层第k个神经元权重的梯度计算如下:
∂ E m ∂ W L - 1 t ( j , k ) = δ L t ( k ) o ( j )
δ L t ( k ) = p ( o t ( k ) | x k , W L - 1 t ) - 1 { o t = y t }
其中,Em是卷积神经网络的损失函数,o(j)是L-1层第j个神经元的输出,是输出层第k个神经元的误差。
(3c)从L-2层第i个神经元到L-1层第j个神经元权重的梯度计算如下:
∂ E m ∂ W L - 2 ( i , j ) = δ L - 1 ( k ) o ( i )
δ L - 1 ( j ) = Σ t = 1 T λ t ( Σ k ∈ L t δ L t ( k ) W L - 1 t ( j , k ) )
其中,o(i)是L-2层第i个神经元的输出,δL-1(j)是L-1层第j个神经元的误差。
(3d)反复执行步骤(3b)-(3c),直至多输出深度卷积神经网络的损失函数Em取得最小值。
(3f)输出损失函数Em取得最小值时的最优权重参数Wt,使得每一个输出都是二分类器的一个二分类类标。
利用步骤3所建立多输出深度卷积神经网络结构参见图4,网络包含3层卷积,3层局部归一化层和2层最大值池化层,之后是80个神经元组成的全连接层。所有的输出共享相同的中间层。
步骤4,将测试样本输入到训练好的卷积神经网络
(4a)从亚洲人脸年龄数据集中选择一张不带年龄标签的人脸图像作为测试样本,测试图像数据为x′。
(4b)将测试图像输入训练好的多输出深度卷积神经网络进行多层的卷积、池化等操作,其中使用到的权重参数Wt为步骤(3f)得到的最优参数。
步骤5,得到测试样本的年龄估计
(5a)得到测试图像数据x′的多个输出fk(x′)∈{0,1},k=1,2,…,K-1,其中K为年龄等级数,输出fk(x′)为第k个分类器的二分类类标。
(5b)由多个二分类类标根据下面的公式预测训练数据x′的等级h(x′)
h(x′)=rq
其中,
(5c)输出测试图像的估计年龄,测试图像的估计年龄是等级h(x′)。
本发明的效果可以通过以下仿真实验进一步的说明:
实施例8
基于多输出卷积神经网络和有序回归的年龄估计方法同实施例1-7,
1.仿真条件
本发明是在中央处理器为Intel(R)Core i3-530 2.93GHZ、内存4G、WINDOWS 7操作系统上,运用MATLAB软件进行的仿真,发明在Caffe上实现。
2.仿真内容
本发明在MORPH II人脸图像数据集和AFAD数据库上进行基于人脸图像的年龄估计仿真实验。
本发明以平均绝对误差和累计指数为指标对方法性能进行评测,仿真对比了不同图像识别方法对图像进行年龄估计的准确率。对比的多种年龄估计方法包括生物启发式特征+线性支持向量机回归器、生物启发式特征+典型相关分析、深度卷积神经网络+线性支持向量机回归器。本发明在同样的条件下与两个经典的有序回归相比较,平均绝对误差的对比实验结果如表1所示。累计指数的对比实验结果见图5。
表1.不同方法下年龄估计的准确率
由表1可见,一般来说有序回归优于度量回归;更重要的是,本发明在有序回归的基础上又增加了深度学习,或者说本发明将有序回归和深度学习方法结合,显著地提升了年龄预测性能的准确度。与度量回归4-5的平均绝对误差相比,发明将平均绝对误差分别降到了3.27岁和3.34岁,年龄估计的准确率提高了1岁左右。
对于累积指数,本发明方法在MORPH II和AFAD数据集上也取得了最好的性能,参见图5,当年龄误差在2-12岁时,本发明方法的准确率远高于之前的方法。
综上所述,本发明的基于多输出卷积神经网络和有序回归的年龄估计方法,其实现是:1.建立亚洲人脸年龄数据集(AFAD);2.建立用于二分类的训练数据;3.训练深度卷积神经网络;4.将测试样本输入到训练好的卷积神经网络;5.得到测试样本的年龄估计。本发明提出了一种对年龄进行排序的方法,将有序回归和深度学习方法结合,显著地提升了年龄预测性能的准确度。本发明解决了现有年龄估计方法中特征学习和回归建模是独立处理与优化的不足,能充分利用年龄标签的序列关系将年龄估计有序回归,提高了年龄估计准确率,还为亚洲人脸的年龄估计建立了一个大规模数据库,为人脸年龄估计研究提供了数据库基础。本发明能广泛用于对人脸图像的年龄估计。

Claims (6)

1.一种基于多输出卷积神经网络和有序回归的年龄估计方法,其特征在于,包括有如下步骤:
(1)建立亚洲人脸年龄数据集,其中包含了16万张亚洲人脸图像,每一张人脸图像都有年龄标签;
(2)建立用于二分类的训练数据,输入亚洲人脸年龄数据集中带年龄标签的人脸图像集,根据人脸图像的年龄标签生成一系列的二分类类标,得到包含人脸图像、二分类类标和权重的训练数据;
(3)训练深度卷积神经网络,根据训练数据,训练多输出深度卷积神经网络,使得每一个输出都是二分类器的一个二分类类标;
(4)将测试样本输入到训练好的卷积神经网络中,将一张亚洲人脸年龄数据集中的不带年龄标签的人脸图像作为测试样本,将测试样本输入训练好的多输出深度卷积神经网络,进行多层的卷积、池化操作;
(5)得到测试样本的年龄估计,得到多输出深度卷积神经网络的输出,每一个输出都是二分类器的一个二分类类标,对所有输出类标进行等级排序,得到测试样本的年龄估计。
2.根据权利要求1所述的基于多输出卷积神经网络和有序回归的年龄估计方法,其特征在于,步骤(1)所述建立亚洲人脸年龄数据集包括有如下步骤:
(1a)通过在特定的社交网络人人网上收集人脸图像建立这个数据集,图像来自人人网上用户的头像相册;
(1b)通过用户头像相册中图像的上传日期与该用户所提供的出生日期得到该张图像的年龄,以此年龄作为标签;
(1c)通过OpenCV对所得到的所有图像进行人脸识别和剪裁,删除不含人脸的图像,得到人脸图像;
(1d)利用人工手动滤除卡通头像、明显与年龄不符图像等噪声数据,得到亚洲人脸年龄数据集。
3.根据权利要求1所述的基于多输出卷积神经网络和有序回归的年龄估计方法,其特征在于,步骤(2)所述建立用于二分类的训练数据包括如下步骤:
(2a)把年龄估计转化为年龄排序用一系列的二分类器处理,对亚洲人脸年龄数据集图像的每一个二分类器构建相应的训练数据,给定有序的训练数据其中,xi∈χ为第i幅图像在输入空间的,yi∈γ={r1,r2,...,rK}为有序序列的输出空间,rK>rK-1>...>r1,K为等级总数,符号>表示不同等级之间的排序,N为训练数据的总数;
(2b)对于第k个二分类器,其二分类类标表示第i个样本的序标号yi是否比rk大,定义如下:
当于yi>rk时,二分类类标为1,否则为0;
(2c)一个具体的第k个二分类器的训练数据构造为其中是一个二分类类标,是第i个样本的权重,采用绝对代价矩阵取值为
4.根据权利要求1所述的基于多输出卷积神经网络和有序回归的年龄估计方法,其特征在于,步骤(3)所述训练深度卷积神经网络包括有如下步骤:
(3a)定义多输出深度卷积神经网络的损失函数Em写为:
E m = - 1 N Σ i = 1 N Σ t = 1 T λ t 1 { o i t = y i t } w i t l o g ( p ( o i t | x i , W t ) )
其中,N为输入训练样本数目,T为输出数目,λt表示第t个输出的重要性系数,1{·}为布尔测试,内部条件为真则其为1,否则为0,表示第i个图像的第t个输出,表示第i幅图像的第t个子问题对应类标,第i幅图像的第t个输出的权重,xi∈χ表示第i幅图像的输入,Wt为第t个输出的权重;
(3b)对损失函数进行优化,对于多输出深度卷积神经网络的第t个输出,从L-1层第j个神经元到L层第k个神经元权重的梯度计算如下:
∂ E m ∂ W L - 1 t ( j , k ) = δ L t ( k ) o ( j )
δ L t ( k ) = p ( o t ( k ) | x k , W L - 1 t ) - 1 { o t = y t }
其中,Em是卷积神经网络的损失函数,o(j)是L-1层第j个神经元的输出,是输出层第k个神经元的误差;
(3c)从L-2层第i个神经元到L-1层第j个神经元权重的梯度计算如下:
∂ E m ∂ W L - 2 ( i , j ) = δ L - 1 ( k ) o ( i )
δ L - 1 ( j ) = Σ t = 1 T λ t ( Σ k ∈ L t δ L t ( k ) W L - 1 t ( j , k ) )
其中,o(i)是L-2层第i个神经元的输出,δL-1(j)是L-1层第j个神经元的误差;
(3d)反复执行步骤(3b)-(3c),直至多输出深度卷积神经网络的损失函数Em取得最小值;
(3f)输出损失函数Em取得最小值时的最优权重参数Wt,使得每一个输出都是二分类器的一个二分类类标。
5.根据权利要求1所述的基于多输出卷积神经网络和有序回归的年龄估计方法,其特征在于,步骤(4)所述将测试样本输入到训练好的卷积神经网络中包括有如下步骤:
(4a)从亚洲人脸年龄数据集中选择一张不带年龄标签的人脸图像作为测试样本,测试样本数据为x′;
(4b)将测试图像输入训练好的多输出深度卷积神经网络进行多层的卷积、池化操作,其中使用到的权重参数Wt为步骤(3f)得到的最优参数。
6.根据权利要求1所述的基于多输出卷积神经网络和有序回归的年龄估计方法,其特征在于,步骤(5)所述得到测试样本的年龄估计包括有如下步骤:
(5a)得到测试图像数据x′的多个输出fk(x′)∈{0,1},k=1,2,…,K-1,其中K为年龄等级数,输出fk(x′)为第k个分类器的二分类类标;
(5b)由多个二分类类标根据下面的公式预测训练数据x′的等级h(x′)
h(x′)=rq
其中,
(5c)输出测试图像的估计年龄,测试图像的估计年龄是等级h(x′)。
CN201610273524.7A 2016-04-28 2016-04-28 基于多输出卷积神经网络和有序回归的年龄估计方法 Active CN105975916B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610273524.7A CN105975916B (zh) 2016-04-28 2016-04-28 基于多输出卷积神经网络和有序回归的年龄估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610273524.7A CN105975916B (zh) 2016-04-28 2016-04-28 基于多输出卷积神经网络和有序回归的年龄估计方法

Publications (2)

Publication Number Publication Date
CN105975916A true CN105975916A (zh) 2016-09-28
CN105975916B CN105975916B (zh) 2019-10-11

Family

ID=56993742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610273524.7A Active CN105975916B (zh) 2016-04-28 2016-04-28 基于多输出卷积神经网络和有序回归的年龄估计方法

Country Status (1)

Country Link
CN (1) CN105975916B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485235A (zh) * 2016-10-24 2017-03-08 厦门美图之家科技有限公司 一种卷积神经网络生成方法、年龄识别方法及相关装置
CN106778558A (zh) * 2016-12-02 2017-05-31 电子科技大学 一种基于深度分类网络的面部年龄估计方法
CN106778584A (zh) * 2016-12-08 2017-05-31 南京邮电大学 一种基于深层特征与浅层特征融合的人脸年龄估计方法
CN106919897A (zh) * 2016-12-30 2017-07-04 华北电力大学(保定) 一种基于三级残差网络的人脸图像年龄估计方法
CN107045622A (zh) * 2016-12-30 2017-08-15 浙江大学 基于自适应年龄分布学习的人脸年龄估计方法
CN107203780A (zh) * 2017-05-11 2017-09-26 南京瑞麒凰电子科技有限公司 基于深度学习的玻璃清洁度的检测方法及装置
CN107545245A (zh) * 2017-08-14 2018-01-05 中国科学院半导体研究所 一种年龄估计方法及设备
CN108833713A (zh) * 2018-06-28 2018-11-16 Oppo广东移动通信有限公司 睡眠时天线控制方法及相关产品
CN109101938A (zh) * 2018-08-23 2018-12-28 武汉嫦娥医学抗衰机器人股份有限公司 一种基于卷积神经网络的多标签年龄估计方法
CN109543546A (zh) * 2018-10-26 2019-03-29 复旦大学 基于深度序分布回归的步态年龄估计方法
CN109657586A (zh) * 2018-12-10 2019-04-19 华中师范大学 一种基于排序卷积神经网络的人脸表情分析方法及系统
CN109730637A (zh) * 2018-12-29 2019-05-10 中国科学院半导体研究所 一种人脸面部图像定量分析系统及方法
CN110188703A (zh) * 2019-05-31 2019-08-30 广州软盈科技有限公司 一种基于人脸识别的信息推送及引流方法
CN110378280A (zh) * 2019-07-17 2019-10-25 南京信息工程大学 基于特征约束的有序卷积神经网络人脸年龄估计方法
CN111079474A (zh) * 2018-10-19 2020-04-28 上海商汤智能科技有限公司 乘客状态分析方法和装置、车辆、电子设备、存储介质
CN111178285A (zh) * 2019-12-31 2020-05-19 上海昌投网络科技有限公司 一种基于深度学习框架的自然场景用户头像年龄预测方法
CN112950631A (zh) * 2021-04-13 2021-06-11 西安交通大学口腔医院 基于显著图约束和x光头颅定位侧位图像的年龄估计方法
CN113689324A (zh) * 2021-07-06 2021-11-23 清华大学 一种基于二分类标签的人像物件的自动增删方法及装置
US11966453B2 (en) 2021-02-15 2024-04-23 International Business Machines Corporation Ordering annotation sets for machine learning

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8582807B2 (en) * 2010-03-15 2013-11-12 Nec Laboratories America, Inc. Systems and methods for determining personal characteristics
CN104504376A (zh) * 2014-12-22 2015-04-08 厦门美图之家科技有限公司 一种人脸图像的年龄分类方法和系统
CN105095833A (zh) * 2014-05-08 2015-11-25 中国科学院声学研究所 用于人脸识别的网络构建方法、识别方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8582807B2 (en) * 2010-03-15 2013-11-12 Nec Laboratories America, Inc. Systems and methods for determining personal characteristics
CN105095833A (zh) * 2014-05-08 2015-11-25 中国科学院声学研究所 用于人脸识别的网络构建方法、识别方法及系统
CN104504376A (zh) * 2014-12-22 2015-04-08 厦门美图之家科技有限公司 一种人脸图像的年龄分类方法和系统

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485235B (zh) * 2016-10-24 2019-05-03 厦门美图之家科技有限公司 一种卷积神经网络生成方法、年龄识别方法及相关装置
CN106485235A (zh) * 2016-10-24 2017-03-08 厦门美图之家科技有限公司 一种卷积神经网络生成方法、年龄识别方法及相关装置
CN106778558A (zh) * 2016-12-02 2017-05-31 电子科技大学 一种基于深度分类网络的面部年龄估计方法
CN106778558B (zh) * 2016-12-02 2019-12-10 电子科技大学 一种基于深度分类网络的面部年龄估计方法
CN106778584A (zh) * 2016-12-08 2017-05-31 南京邮电大学 一种基于深层特征与浅层特征融合的人脸年龄估计方法
CN106778584B (zh) * 2016-12-08 2019-07-16 南京邮电大学 一种基于深层特征与浅层特征融合的人脸年龄估计方法
CN107045622B (zh) * 2016-12-30 2020-06-02 浙江大学 基于自适应年龄分布学习的人脸年龄估计方法
CN107045622A (zh) * 2016-12-30 2017-08-15 浙江大学 基于自适应年龄分布学习的人脸年龄估计方法
CN106919897A (zh) * 2016-12-30 2017-07-04 华北电力大学(保定) 一种基于三级残差网络的人脸图像年龄估计方法
CN107203780A (zh) * 2017-05-11 2017-09-26 南京瑞麒凰电子科技有限公司 基于深度学习的玻璃清洁度的检测方法及装置
CN107545245A (zh) * 2017-08-14 2018-01-05 中国科学院半导体研究所 一种年龄估计方法及设备
CN108833713A (zh) * 2018-06-28 2018-11-16 Oppo广东移动通信有限公司 睡眠时天线控制方法及相关产品
CN109101938A (zh) * 2018-08-23 2018-12-28 武汉嫦娥医学抗衰机器人股份有限公司 一种基于卷积神经网络的多标签年龄估计方法
CN109101938B (zh) * 2018-08-23 2021-01-15 武汉嫦娥医学抗衰机器人股份有限公司 一种基于卷积神经网络的多标签年龄估计方法
CN111079474A (zh) * 2018-10-19 2020-04-28 上海商汤智能科技有限公司 乘客状态分析方法和装置、车辆、电子设备、存储介质
CN109543546B (zh) * 2018-10-26 2022-12-20 复旦大学 基于深度序分布回归的步态年龄估计方法
CN109543546A (zh) * 2018-10-26 2019-03-29 复旦大学 基于深度序分布回归的步态年龄估计方法
CN109657586A (zh) * 2018-12-10 2019-04-19 华中师范大学 一种基于排序卷积神经网络的人脸表情分析方法及系统
CN109657586B (zh) * 2018-12-10 2022-02-18 华中师范大学 一种基于排序卷积神经网络的人脸表情分析方法及系统
CN109730637A (zh) * 2018-12-29 2019-05-10 中国科学院半导体研究所 一种人脸面部图像定量分析系统及方法
CN110188703A (zh) * 2019-05-31 2019-08-30 广州软盈科技有限公司 一种基于人脸识别的信息推送及引流方法
CN110378280A (zh) * 2019-07-17 2019-10-25 南京信息工程大学 基于特征约束的有序卷积神经网络人脸年龄估计方法
CN111178285A (zh) * 2019-12-31 2020-05-19 上海昌投网络科技有限公司 一种基于深度学习框架的自然场景用户头像年龄预测方法
US11966453B2 (en) 2021-02-15 2024-04-23 International Business Machines Corporation Ordering annotation sets for machine learning
CN112950631A (zh) * 2021-04-13 2021-06-11 西安交通大学口腔医院 基于显著图约束和x光头颅定位侧位图像的年龄估计方法
CN112950631B (zh) * 2021-04-13 2023-06-30 西安交通大学口腔医院 基于显著图约束和x光头颅定位侧位图像的年龄估计方法
CN113689324A (zh) * 2021-07-06 2021-11-23 清华大学 一种基于二分类标签的人像物件的自动增删方法及装置
CN113689324B (zh) * 2021-07-06 2024-04-26 清华大学 一种基于二分类标签的人像物件的自动增删方法及装置

Also Published As

Publication number Publication date
CN105975916B (zh) 2019-10-11

Similar Documents

Publication Publication Date Title
CN105975916B (zh) 基于多输出卷积神经网络和有序回归的年龄估计方法
CN104143079B (zh) 人脸属性识别的方法和系统
CN108171209A (zh) 一种基于卷积神经网络进行度量学习的人脸年龄估计方法
CN107341506A (zh) 一种基于多方面深度学习表达的图像情感分类方法
CN104239858B (zh) 一种人脸特征验证的方法和装置
CN101794396B (zh) 基于迁移网络学习的遥感图像目标识别系统及方法
CN106951825A (zh) 一种人脸图像质量评估系统以及实现方法
CN103632168B (zh) 一种机器学习中的分类器集成方法
CN107977671A (zh) 一种基于多任务卷积神经网络的舌象分类方法
CN106096561A (zh) 基于图像块深度学习特征的红外行人检测方法
CN110532900A (zh) 基于U-Net和LS-CNN的人脸表情识别方法
CN104240256B (zh) 一种基于层次化稀疏建模的图像显著性检测方法
CN102810161B (zh) 一种用于拥挤场景下的多个行人检测方法
CN110991532B (zh) 基于关系视觉注意机制的场景图产生方法
CN106096654A (zh) 一种基于深度学习和结合策略的细胞异型性自动分级方法
CN109711426A (zh) 一种基于gan和迁移学习的病理图片分类装置及方法
CN109544518A (zh) 一种应用于骨骼成熟度评估的方法及其系统
CN104966105A (zh) 一种鲁棒机器错误检索方法与系统
CN110197729A (zh) 基于深度学习的静息态fMRI数据分类方法和装置
CN109993230A (zh) 一种面向脑功能磁共振图像分类的tsk模糊系统建模方法
CN107292259A (zh) 基于AdaRank的深度特征和传统特征的集成方法
CN106127197A (zh) 一种基于显著标签排序的图像显著性目标检测方法
CN107203740A (zh) 一种基于深度学习的人脸年龄估计方法
CN105469117B (zh) 一种基于鲁棒特征提取的图像识别方法与装置
CN109102498A (zh) 一种宫颈涂片图像中簇型细胞核分割的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211217

Address after: 710086 room 040, F2001, 20 / F, block 4-A, Xixian financial port, Fengdong new town energy Jinmao District, Xixian New District, Xi'an City, Shaanxi Province

Patentee after: Shaanxi huimou Yifang Intelligent Technology Co.,Ltd.

Address before: 710071 No. 2 Taibai South Road, Shaanxi, Xi'an

Patentee before: XIDIAN University