CN107330412A - 一种基于深度稀疏表示的人脸年龄估计方法 - Google Patents

一种基于深度稀疏表示的人脸年龄估计方法 Download PDF

Info

Publication number
CN107330412A
CN107330412A CN201710546450.4A CN201710546450A CN107330412A CN 107330412 A CN107330412 A CN 107330412A CN 201710546450 A CN201710546450 A CN 201710546450A CN 107330412 A CN107330412 A CN 107330412A
Authority
CN
China
Prior art keywords
age
face
mrow
dictionary
rarefaction representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710546450.4A
Other languages
English (en)
Other versions
CN107330412B (zh
Inventor
廖海斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei Dacheng Medical Technology Co ltd
Original Assignee
Hubei University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Science and Technology filed Critical Hubei University of Science and Technology
Priority to CN201710546450.4A priority Critical patent/CN107330412B/zh
Publication of CN107330412A publication Critical patent/CN107330412A/zh
Application granted granted Critical
Publication of CN107330412B publication Critical patent/CN107330412B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种基于深度稀疏表示的年龄估计方法,属于图像处理与模式识别技术领域。它解决了现存人脸年龄估计方法不稳定的问题。其主要包括如下步骤:A、构建鉴别字典学习模型;B、基于鉴别字典建立深度稀疏表示模型;C、构建两因子分析模型进行身份因子去除;D、提取鲁棒性年龄特征;E、构建分层年龄估计模型进行年龄估计。本发明具有抗干扰能力强、准确度高等优点。

Description

一种基于深度稀疏表示的人脸年龄估计方法
技术领域
本发明属于图像处理与模式识别技术领域,涉及一种基于深度稀疏表示的人脸年龄估计方法。
背景技术
在医学界,人们主要通过分析胆固醇、高密度胆固醇、白蛋白等血检指标来测定一个人的“生理年龄”并以此研究人体衰老的程度。但遗憾的是这套指标体系目前还很不完善,且使用不方便。如果能利用计算机和图像处理技术,通过分析人脸表观图像能精准预测一个人的“生理年龄”,将“生理年龄”与“实际年龄”对比,就可以知道你究竟是“青春常驻”还是“未老先衰”。那么将极大地提高研究效率和降低研究成本。通过看“脸”来估计年龄不仅可用于量化衰老,还可以应用于智慧城市和平安城市建设中。如,基于年龄分析的强制、控制、商业分析,广告投递和人机交互等应用。在日常的语言交谈中,谈话内容与方式往往受对方性别和年龄等因素影响。例如,在面对年长者时,谈话的语言显然会正式些。更一般地,人类会通过对方人脸外观迅速估计对方性别、年龄和身份等信息以便选择不同社交方式。
相对人脸识别问题,年龄分析所受到的关注要少得多。然而,这并不表明年龄分析没有人脸身份识别重要。人脸年龄分析最容易想到是在人脸识别、法医学方面的应用。近年来关于人脸年龄分析的研究吸引了更多心理学、美学,刑侦学、计算机图形学、计算机视觉等领域的研究兴趣。可以肯定,未来年龄自动分析的应用并不亚于人脸识别,并将广泛应用于智能广告投递,生物鉴定学,生物统计学,电子客户关系管理,人脸识别、美容,法律实施,安全控制、人口统计与普查、人机交互等领域。
在人脸年龄自动估计系统中,通常分为两个阶段,第一个阶段是提取年龄特征,第二个阶段是估计年龄,通常研究的重点是如何提取到最佳的年龄特征。目前人脸年龄特征提取方法大致可以分为经典传统和基于深度学习的两大类方法。第一类方法理论成熟、实现简单,但鲁棒性不高。其中典型代表有主动表观模型(AAM), 局部二元模式(LBP),Gabor和仿生特征(Bio-inspired Features, BIF)等。每种方法都有各自的特点和应用场合。例如,AAM特征综合了人脸纹理和形状信息具有全局性,适用于人脸年龄粗估计。 LBP主要是提取人脸局部纹理特征,具有局部细节性,在区分相近的年龄比较有效,但由于缺乏全局信息容易出现大区域跨年龄段估计错误。BIF特征考虑了人类分类识别物体的思维方式,所以取得了比较好的效果,但其人类物体识别思维方式并没有充分利用。因此,如何有效地综合利用以上特征并充分挖掘人类思维方式是年龄估计未来的重要研究方向。本发明朝此方向作有益的探讨与研究,提出基于深度稀疏表达的人脸特征提取方法。该方法融合了AAM、LBP和BIF特征的各自特点。
最近,由于深度学习的研究与应用不断深入与发展,出现了不少基于深度学习的人脸年龄估计方法。如,文章“Dong Yi,Zhen Lei,Stan Z.Li.Age Estimation byMulti-scale Convolutional Network[C].In Proceedings of 12th Asian Conference onComputer Vision,Singapore,2014.”和专利“一种人脸图像的年龄估计方法(专利号:CNIO5956571A)”等将深度卷积神经网络应用于年龄估计。深度学习是目前研究的热门,基于深度学习的年龄估计虽然取得了显著的效果。但其应用面临着深度网络的优化设计和人脸图像优化处理技巧等问题;其次,现有的深度学习结构当隐层数增多时参数急剧增加,对运算性能提出了较高的要求;最后,面临海量年龄训练样本缺乏和工程应用等问题。而本发明提出的深度稀疏表示人脸年龄估计方法具有计算复杂度低,不需要海理量训练样本和鲁棒性高等优点。
发明内容
本发明的目的是针对现有的技术存在的上述问题,提供一种基于深度稀疏表示的人脸年龄估计方法,本发明所要解决的技术问题是如何通过人脸特征估计人的年龄。
本发明目的通过如下技术方案来实现:一种基于深度稀疏表示的人脸年龄估计方法,其特征在于,本方法包括如下步骤:
A、构建鉴别字典学习模型:
其中,r(Ai,D,Xi)为人脸重构保真项,||X||1为稀疏约束项以保证求解系数的稀疏性,
f(X)为鉴别约束项,L(Di)=||Di||*为低秩(Low-rank)正定化噪声处理项,λ1,λ2,γ为平衡因子参数。式(1)字典学习模型的目标函数求解可以通过交替迭代的方法进行求解。
B、根据AAM特征对年龄进行粗分类(第一层)
首先,利用步骤A介绍的字典学习方法求得的完备字典DAAM对测试人脸y进行稀疏表示求取稀疏表示系数xAAM
其中,γ为常量平衡因子。重写稀疏表示系数其中,系数向量对应于子字典
然后,根据定义每类的残差:
其中,第一项为第i类的重构误差项,第二项为稀疏表示系数与第i类系数均值的距离,w为预设的平衡权值。对ei进行排序,选取前k个最小的ei(最相近的前一半)作为下层字典类别。
C、根据BIF特征对年龄进行分类(第二层)
根据步骤A获得完备字典DBIF,使用步骤B得到的类别对其进行提炼得到精简后的字典D′BIF。对测试人脸y利用D′BIF再次进行稀疏表示求取稀疏表示系数
然后,根据式(3)求取ei,并选取前k类别(最相近的前一半)确认下层字典类别。
D、根据Gabor特征和LBP特征年龄进行分类(第三层)
根据步骤A获得完备字典DGL,使用步骤C得到的类别对其进行提炼得到精简后的字典D′GL。进一步对字典D′GL的类别进行聚类,去除奇异类别(边缘类)。对测试人脸y利用去除奇异类后的D′GL第三次进行稀疏表示求取稀疏表示系数
优选的,经过步骤B和步骤C,留下来的类别都是与测试年龄相邻的类别。此时,字典D′GL内的年龄特征比较相近,而身份特征的干扰逐渐增强,加大了对年龄进一步细分的难度。因此,对于年龄的进一步细分问题,如果能去除身份信息的干扰,无疑是“雪中送炭”。本发明利用两因子分析模型进行人脸年龄与身份分离,并利用加性模型进行身份因子去除,来提高特征的年龄细分能力。
E、提取最终人脸年龄特征(融合层)
将第一层求取的系数置0,并将第三层求取的系数代入其相应的类别位置得到最终的人脸特征。
F、通过年龄估计模块对年龄自动估计
年龄估计分为模型训练和年龄估计两个阶段
模型训练阶段:将人脸年龄(0-80岁)以10岁为间隔分成8 组,如图2所示。每组利用支持向量回归(SVR)单独训练一个估计模型,总共得到8个不同的年龄估计器。
年龄估计阶段:首先,根据深度稀疏表达模型对待估人脸进行分组;然后,根据第一步的分组情况,选择相应的SVR模型进行年龄估计。
本方法还包括一个基于因子分析的人脸身份信息去除的步骤,方法如下:
其中,为进行人脸身份因子去除后的人脸年龄特征向量; ysc为原始的人脸特征向量;是只与人脸身份信息有关的身份因子向量。
综上所述,本发明提出的一种基于深度稀疏表示的人脸年龄估计方法,具有如下优点:
1)为了提取鲁棒性人脸年龄特征,同时克服人脸年龄的相邻相似性和次序性问题,本发明利用不同特征提取方法的优缺点和分层稀疏表达的特点,提出深度稀疏表达的人脸年龄特征提取模型。在此深度模型中,根据年龄变化特点,在不同层次使用了不同特征的稀疏表达;层次间具有严格的递进关系,使得提取的特征具有很强的位置信息。因此,深度稀疏表达特征不但具有很强鉴别性能,同时还具有年龄组信息,便于后期分层年龄估计模型的设计。
2)为了降低基于人脸图像的年龄估计中人脸身份信息的干扰,本发明提出两因子分析模型进行人脸年龄与身份因子分析。基于此模型,采用加性模型去除人脸身份因子的干扰以加强年龄细分的能力。
附图说明
图1是一种基于深度稀疏表示的人脸年龄特征提取方法流程图。
图2是基于分层支持向量回归模型的人脸年龄估计方法流程图。
具体实施方式
以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
本发明提出的一种基于深度稀疏表示的人脸年龄估计方法,主要包括:人脸年龄特征提取和人脸年龄估计两大模块:
S1人脸年龄特征提取模块
此模块为主要是提取具有鉴别性和鲁棒性的人脸年龄特征。由于人脸年龄的特殊性,导致目前的人脸年龄特征提取算法各具特色。因此,如何利用一种结构框架同时融合不同算法优点提取高鉴别性的年龄特征是整个人脸年龄估计方法的关键。本发明从基础理论和应用设计两方面着手研究信号稀疏表达的数学模型和字典优化方法,并分析目前经典主流的AAM、LBP、Gabor和BIF 等人脸特征提取的年龄特性。据此,提出一种深度稀疏表示的人脸年龄特征提取方法(Deep_SRC),如图1所示Deep_SRC总共分为三层,每层采用不同特征和字典。其中,每层的原始超完备字典在后台训练得出;系数特征竖状长方形中白色部分表示为全 0项,灰色部分表示非0系数项。Deep_SRC的实施步骤如下:
①鉴别字典学习
收集0-80岁的人脸样本,每岁作为一类,每类包含500幅人脸图像。据此,组成年龄人脸训练集A=[A1,A2,L,A80],其中为第i类中第j个样本的特征向量。一般的,可以直接使用上述训练集作为人脸年龄完备字典。但这种方式构建的字典并非最优,同时可能导致字典矩阵过大。假设训练样本集A 由完备字典D线性组合表示,其稀疏表示系数矩阵为X。则X可以改写为X=[X1,X2,L,X80],其中Xi为子集Ai的系数矩阵。为了使求取的完备字典D不但对样本集A具有很好的稀疏重建能力,同时还具有很强的鉴别和噪声处理能力,本发明构建如下的字典学习模型:
其中,r(Ai,D,Xi)为人脸重构保真项,||X||1为稀疏约束项以保证求解系数的稀疏性,
f(X)为鉴别约束项,L(Di)=||Di||*为低秩(Low-rank)正定化噪声处理项,λ1,λ2,γ为平衡因子参数。式(1)字典学习模型的目标函数求解可以通过交替迭代的方法进行求解。
②第一层设计
由于AAM特征综合了人脸纹理和形状信息具有全局性,适用于人脸年龄粗估计。因此,第一层采用AAM特征。首先,利用①介绍的字典学习方法求得的完备字典DAAM对测试人脸y进行稀疏表示求取稀疏表示系数xAAM
其中,γ为常量平衡因子。重写稀疏表示系数其中,系数向量对应于子字典
然后,根据定义每类的残差:
其中,第一项为第i类的重构误差项,第二项为稀疏表示系数与第i类系数均值的距离,w为预设的平衡权值。对ei进行排序,选取前k个最小的ei(最相近的前一半)作为下层字典类别。
③第二层设计
由于BIF特征考虑了人类识别物体的思维方式,取得了比较好的效果。因此,第二层采用BIF特征。
首先,对完备字典DBIF(利用①介绍的字典学习在后台训练得到),使用上层得到的类别对其进行提炼得到精简后的字典 D′BIF。对测试人脸y利用D′BIF再次进行稀疏表示求取稀疏表示系数
然后,根据式(3)求取ei,并选取前k类别(最相近的前一半)确认下层字典类别。
④第三层设计
由于Gabor滤波器具有多尺度和方向性,同时LBP特征具有局部细节性。因此,第三层采用Gabor+LBP特征。
对完备字典DGL(利用①介绍的字典学习在后台训练得到),使用上层得到的类别对其进行提炼得到精简后的字典D′GL。进一步对字典D′GL的类别进行聚类,去除奇异类别(边缘类)。对测试人脸y利用去除奇异类后的D′GL第三次进行稀疏表示求取稀疏表示系数
优选的,经过前两层,留下来的类别都是与测试年龄相邻的类别。此时,字典D′GL内的年龄特征比较相近,而身份特征的干扰逐渐增强,加大了对年龄进一步细分的难度。因此,对于年龄的进一步细分问题,如果能去除身份信息的干扰,无疑是“雪中送炭”。本发明利用两因子分析模型进行人脸年龄与身份分离,并利用加性模型进行身份因子去除,来提高特征的年龄细分能力。
⑤融合层设计
将第一层求取的系数置0,并将第三层求取的系数代入其相应的类别位置得到最终的人脸特征。
S2人脸年龄估计模块
此模块利用上模块提取的人脸年龄特征进行年龄估计器的训练和学习。现有的年龄估计算法中,研究人员对年龄估计这个问题只是单纯的视作单一的分类问题或者回归问题。将年龄视作回归问题,就相当于建立特征与年龄的全局函数,然而人的年龄老化过程存在一定的可变性,全局函数并不能确切的拟合年龄随着特征的变化。考虑以上因素,为了获得更佳的估计结果,本发明采用分层方案进行年龄估计,如图2所示。人脸年龄估计分为模型训练和年龄估计两个阶段。
模型训练阶段:将人脸年龄(0-80岁)以10岁为间隔分成8 组,如图2所示。每组利用支持向量回归(SVR)单独训练一个估计模型,总共得到8个不同的年龄估计器。
年龄估计阶段:首先,根据深度稀疏表达模型对待估人脸进行分组;然后,根据第一步的分组情况,选择相应的SVR模型进行年龄估计。
实施例1:
本发明提出的一种基于深度稀疏表示的人脸年龄估计方法主要包括字典训练、深度稀疏表示模型构建、特征提取和年龄估计四大步骤。
步骤1:字典训练
本步骤可以在后台离线完成。首先,收集0-80岁的人脸样本,每岁作为一类,每类包含500幅人脸图像。据此,组成年龄人脸训练集A=[A1,A2,L,A80],其中为第i类中第j个样本人脸。然后,对人脸训练集A进行AAM、BIF和Gabor+LBP 特征提取。最后,利用鉴别字典学习方法训练出基于AAM、BIF 和Gabor+LBP的完备字典DAAM,DBIF,DGL
步骤2:深度稀疏表示模型构建
利用上步训练得到的完备字典构建深度稀疏表示模型,如图 1所示模型包含有四层。
第一层利用字典DAMM对测试人脸进行稀疏表示,求解稀疏表示系数;然后,根据稀疏表示系数求解出重建误差最小的k类(年龄类别)作为下一层稀疏表示类别。
第二层利用第一层得到的k类别对字典DBIF进行精减得到 D′BIF,对测试人脸利用精减后的字典D′BIF进行重新稀疏表示,求解稀疏表示系数;然后,根据稀疏表示系数求解出重建误差最小的k′类作为下一层稀疏表示类别。
第三层利用第二层得到的k′类别对字典DGL进行精减得到 D′GL,对测试人脸利用精减后的字典D′GL进行重新稀疏表示,求解稀疏表示系数。
融合层将第一层求取的稀疏表示系数置0,并将第三层求取的系数代入其相应的类别位置得到一组新的系数向量。
优选的,为了提高模型对人脸年龄的细分能力,本发明在第三层进行稀疏表示之前,先进行人脸身份因子去除。年龄估计就是要从人脸样本图像中提取年龄信息。在年龄相差大于10岁情况下,年龄信息在人脸样本中占主要地位。然而,在年龄相差小于 10岁情况下,身份信息在人脸样本中所占地位逐渐增强成为主导。因此,本发明将进行人脸年龄和身份因子分析,并利用加性模型去除人脸身份因子的干扰。
步骤3:人脸特征提取
对输入的人脸图像,进行AMM、BIF和Gabor+LBP特征提取,并进行因子分析求解出人脸身份因子去除后的人脸。然后,将以上得到的人脸特征和处理后人脸代入深度稀疏表示模型提取人脸年龄特征。
步骤4:人脸年龄估计
根据步骤3得到的人脸年龄特征,确定输入人脸所属的年龄组。然后,将人脸年龄特征代入其相应的年龄组SVR模型进行年龄估计。
优选的,本发明将年龄(0-80岁)按10岁为间隔分成8组,在后台利用收集的人脸训练样本为每个分组训练出一个最优的基于SVR的年龄估计模型。
实施例2:
一种基于深度稀疏表示的人脸年龄估计方法同实施例1,其中步骤1中的鉴别字典学习方法包括如下步骤:
(1a)收集0-80岁的人脸样本,每岁作为一类,每类包含 500幅人脸图像。据此,组成年龄人脸训练集A=[A1,A2,L,A80],其中为第i类中第j个样本的特征向量。假设训练样本集A由完备字典D线性组合表示,其稀疏表示系数矩阵为X。则X可以改写为X=[X1,X2,L,X80],其中Xi为子集Ai的系数矩阵。
(1b)为了使求取的完备字典D不但对样本集A具有很好的稀疏重建能力,同时还具有很强的鉴别和噪声处理能力,本发明构建如下的字典学习模型:
其中,r(Ai,D,Xi)为人脸重构保真项,其定义如下:
其中,为子集Ai的系数矩阵中与第i类对应的系数项,为子集Ai的系数矩阵中与第j类对应的系数项。
||X||1为稀疏约束项以保证求解系数的稀疏性。
f(X)为鉴别约束项,本文采用经典Fisher准则,并对其类间与类内散布矩阵(SB,SW)加权改进以达到更佳效果,其定义如下:
L(Di)=||Di||*为低秩(Low-rank)正定化噪声处理项,||·||*代表核范数,表示矩阵的奇异值之和。由于Low-rank正定化能够分离信息噪声,因此它可使得学习得到的字典更纯净和紧凑;λ1,λ2,γ为平衡因子参数。
(1c)式(1)字典学习模型的目标函数求解可以通过交替迭代的方法分成两个子问题求解:①固定字典D,优化匹配得到系数矩阵X;②固定系数矩阵X,优化匹配得到字典D。如此交替迭代直到收敛为止。
更新系数矩阵X:
假定D已知,则目标函数式(1)简化为稀疏表示问题。可以通过逐个更新Xi而固定所有的Xj(j≠i)的方式求解最终的X,其求解目标函数为:
其求解可以通过迭代投影法进行求解。
更新字典D:
当X已知时,可以通过逐个更新Di而固定所有的Dj(j≠i)的方式求解最终的D,其求解目标函数为:
根据Low-rank学习方法(5) 式可以转换成如下的优化问题:
其中,Ei为训练子集Ai误差矩阵,||·||2,1为l2,1-norm范数被用于测量指定样本的腐蚀和噪声。(6)式可以通过不确定增广拉格朗日乘子求解。
实施例3:
一种基于深度稀疏表示的人脸年龄估计方法同实施例1-2,其中步骤2中的深度稀疏表示模型构建方法包括如下步骤:
(2a)第一层设计:由于AAM特征综合了人脸纹理和形状信息具有全局性,适用于人脸年龄粗估计。因此,第一层采用AAM 特征。首先,利用步骤1介绍的字典学习方法求得的完备字典DAAM对测试人脸y进行稀疏表示求取稀疏表示系数xAAM
其中,γ为常量平衡因子。重写稀疏表示系数其中,系数向量对应于子字典
然后,根据定义每类的残差:
其中,第一项为第i类的重构误差项,第二项为稀疏表示系数与第i类系数均值的距离,w为预设的平衡权值。对ei进行排序,选取前k个最小的ei(最相近的前一半)作为下层字典类别。
(2b)第二层设计:由于BIF特征考虑了人类识别物体的思维方式,取得了比较好的效果。因此,第二层采用BIF特征。
首先,对完备字典DBIF(利用步骤1介绍的字典学习在后台训练得到),使用上层得到的类别对其进行提炼得到精简后的字典 D′BIF。对测试人脸y利用D′BIF再次进行稀疏表示求取稀疏表示系数
然后,根据式(2)求取ei,并选取前k类别(最相近的前一半)确认下层字典类别。
(2c)第三层设计:由于Gabor滤波器具有多尺度和方向性,同时LBP特征具有局部细节性。因此,第三层采用Gabor+LBP 特征。
对完备字典DGL(利用步骤1介绍的字典学习在后台训练得到),使用上层得到的类别对其进行提炼得到精简后的字典D′GL。进一步对字典D′GL的类别进行聚类,去除奇异类别(边缘类)。对测试人脸y利用去除奇异类后的D′GL第三次进行稀疏表示求取稀疏表示系数
(2d)融合层设计:将第一层求取的系数置0,并将第三层求取的系数代入其相应的类别位置得到最终的人脸特征。
实施例4:
一种基于深度稀疏表示的人脸年龄估计方法同实施例1-3,其中步骤2中的人脸身份因子去除方法包括如下步骤:
(2e)因子分析模型:把内容和风格看作影响一个事物的两个互相独立的因素,它们决定了事物的观测。比如:在人脸年龄分析中,人脸年龄信息是风格,而人脸的身份信息是内容。人脸年龄估计的任务就是根据人脸风格信息估计出不同的年龄。
如果人脸内容bj具有风格ai,那么人脸样本的观测可以表示成:
其中,k∈[1,K]表示人脸观察向量中第k维特征,符号s和c分别标记风格和内容,wijk表示内容与风格的交互作用关系,这里的观测可以看作原始图像。为了使模型更具灵活性,假定交互作用项wijk随着风格变化而变化,设则式(1)变为:
ysc=Asbc (2)
其中,是由所有的组成的矩阵,bc为全体内容组成的矩阵。因此,可以将As看作指定风格的投影矩阵,负责将内容空间投影到观察空间。
(2f)模型匹配求解:模型匹配的目标是使用训练集去拟合模型使平方误差最小。因此,因子分析模型的目标函数为:
其中,hsc(t)表示指示器,当y(t)属于风格s和内容c时,其值为1,否则为0。收集0-80岁的训练样本,以相差20岁作为分水岭,将年龄风格分为4类。当训练集中每个人在每种风格下包含相同数量的人脸训练样本时,重写式(1)为:
其中,是指定风格和内容类别下的样本均值;因此,式(4)可以通过奇异值分解(SVD)的方法进行求解:
经过SVD变换,风格参数矩阵A为US的前J列(与前J个最大奇异值对应),内容参数矩阵B为VT的前J行。
(2j)基于加性模型的身份因子去除:因子分离的目的是要降低观察样本ysc中受内容信息影响的部分,让同一风格下的内容差异对ysc差异影响最小。从Deep_SRC模型可以看出当到第三层时,已经可以确定测试人脸的年龄分组情况,即因子分析模型中的风格类别As。根据式(1),已知ysc和As可以求出人脸内容bc。设平均风格因子为其中,As是利用训练样本与SVD求解的风格因子。那么可以定义只与人脸内容相关的平均人脸:
从式(6)可以看出只与观察样本的内容信息有关,即随着观察样本的身份变化而变化。因此,可以构建如下的加性模型进行因子分离:
加性模型就是从原始特征向量ysc中去掉并获得新的与内容无关的向量表示的方法。
优势分析:两因子分析方法由斯坦福大学的Joshua B. Tenenbaum最先提出,随后的多因子分析、张量分解和非线性因子分析方法都是其变种。并已成功应用于手写笔迹、人脸、姿态和步态识别。在实际应用中,一般只知道输入对象的观察,而并不知道其风格与内容信息。往往通过采用最大期望算法(EM)求解近似的风格和内容信息,并进行相应识别任务。然而,EM算法有一定误差,影响了后续的分类任务。由于在Deep_SRC的第三层已经知道了人脸的风格信息(人脸年龄段),因此本发明方法成功避免了EM估计误差问题。
本文提及的词语均为本领域技术人员公知的术语,为便于理解,特对其进行简单定义和解读,如下:
AAM:主动外观模型(AAM,Active Appearance Model)是广泛应用于模式识别领域的一种特征点提取方法。基于AAM的人脸特征定位方法在建立人脸模型过程中,不但考虑局部特征信息,而且综合考虑到全局形状和纹理信息,通过对人脸形状特征和纹理特征进行统计分析,建立人脸混合模型,即为最终对应的 AAM模型。
BIF:仿生特征(Bio-inspired Features,BIF)是一种模仿人类观察和判断事物方式的一种纹理特征提取算法,同时它也是一种改进的Gabor特征提取方法。
Gabor:Gabor特征是一种可以用来描述图像纹理信息的特征,Gabor滤波器的频率和方向与人类的视觉系统类似,特别适合于纹理表示与判别。Gabor特征主要依靠Gabor核在频率域上对信号进行加窗,从而能描述信号的局部频率信息。
LBP:LBP指局部二值模式,英文全称:Local Binary Pattern,是一种用来描述图像局部特征的算子,LBP特征具有灰度不变性和旋转不变性等显著优点。它是由T.Ojala,M.和D. Harwood在1994年提出,由于LBP特征计算简单、效果较好,因此LBP特征在计算机视觉的许多领域都得到了广泛的应用。
SVR:支持向量加归(SVR)的本质是支持向量机(SVM) 原理,只不过SVM主要用于分类问题,而SVR是用于具体值的估计预测问题。
本发明中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (3)

1.一种基于深度稀疏表示的人脸年龄估计方法,其特征在于,本方法包括如下步骤:
A、构建鉴别字典学习模型:
<mrow> <msub> <mi>J</mi> <mrow> <mo>(</mo> <mi>D</mi> <mo>,</mo> <mi>X</mi> <mo>)</mo> </mrow> </msub> <mo>=</mo> <munder> <mrow> <mi>arg</mi> <mi>min</mi> </mrow> <mrow> <mo>(</mo> <mi>D</mi> <mo>,</mo> <mi>X</mi> <mo>)</mo> </mrow> </munder> <mo>{</mo> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>80</mn> </munderover> <mi>r</mi> <mrow> <mo>(</mo> <msub> <mi>A</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>D</mi> <mo>,</mo> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>&amp;lambda;</mi> <mn>1</mn> </msub> <mo>|</mo> <mo>|</mo> <mi>X</mi> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> <mo>+</mo> <msub> <mi>&amp;lambda;</mi> <mn>2</mn> </msub> <mi>f</mi> <mrow> <mo>(</mo> <mi>X</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>&amp;gamma;</mi> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mn>80</mn> </munderover> <mi>L</mi> <mrow> <mo>(</mo> <msub> <mi>D</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>}</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
其中,r(Ai,D,Xi)为人脸重构保真项,||X||1为稀疏约束项以保证求解系数的稀疏性,
f(X)为鉴别约束项,L(Di)=||Di||*为低秩(Low-rank)正定化噪声处理项,λ1,λ2,γ为平衡因子参数;
式(1)字典学习模型的目标函数求解可以通过交替迭代的方法进行求解。
B、根据AAM特征对年龄进行粗估计
首先,利用步骤A介绍的字典学习方法求得的完备字典DAAM对测试人脸y进行稀疏表示求取稀疏表示系数xAAM
其中,γ为常量平衡因子。重写稀疏表示系数其中,系数向量对应于子字典
然后,根据定义每类的残差:
其中,第一项为第i类的重构误差项,第二项为稀疏表示系数与第i类系数均值的距离,w为预设的平衡权值。对ei进行排序,选取前k个较小的ei作为下一步骤的字典类别。
C、根据BIF特征对年龄进行估计
根据步骤A获得完备字典DBIF,使用步骤B得到的类别对其进行提炼得到精简后的字典D′BIF;对测试人脸y利用D′BIF再次进行稀疏表示求取稀疏表示系数
然后,根据式(3)求取ei,并选取前较小的k类别作为下一步骤的字典类别。
D、根据Gabor特征和LBP特征年龄进行估计
根据步骤A获得完备字典DGL,使用步骤C得到的类别对其进行提炼得到精简后的字典D′GL;对测试人脸y利用去除奇异类后的D′GL第三次进行稀疏表示求取稀疏表示系数
E、通过年龄估计模块对年龄自动估计
年龄估计分为模型训练和年龄估计两个阶段
模型训练阶段:将人脸年龄(0-80岁)以10岁为间隔分成8组;每组利用支持向量回归(SVR)单独训练一个估计模型,总共得到8个不同的年龄估计器。
年龄估计阶段:首先,根据深度稀疏表达模型对待估人脸进行分组;然后,根据第一步的分组情况,选择相应的SVR模型进行年龄估计。
2.根据权利要求1所述一种基于深度稀疏表示的人脸年龄估计方法,其特征在于,本方法还包括一个最终年龄特征提取的步骤,方法如下:将步骤B求取的系数置0,并将步骤D求取的系数代入其相应的类别位置得到最终的人脸特征。
3.根据权利要求1所述一种基于深度稀疏表示的人脸年龄估计方法,其特征在于,本方法还包括一个基于因子分析的人脸身份信息去除的步骤,方法如下:
其中,为进行人脸身份因子去除后的人脸年龄特征向量;ysc为原始的人脸特征向量;是只与人脸身份信息有关的身份因子向量。
CN201710546450.4A 2017-07-06 2017-07-06 一种基于深度稀疏表示的人脸年龄估计方法 Active CN107330412B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710546450.4A CN107330412B (zh) 2017-07-06 2017-07-06 一种基于深度稀疏表示的人脸年龄估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710546450.4A CN107330412B (zh) 2017-07-06 2017-07-06 一种基于深度稀疏表示的人脸年龄估计方法

Publications (2)

Publication Number Publication Date
CN107330412A true CN107330412A (zh) 2017-11-07
CN107330412B CN107330412B (zh) 2021-03-26

Family

ID=60196191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710546450.4A Active CN107330412B (zh) 2017-07-06 2017-07-06 一种基于深度稀疏表示的人脸年龄估计方法

Country Status (1)

Country Link
CN (1) CN107330412B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255289A (zh) * 2018-07-27 2019-01-22 电子科技大学 一种基于统一式生成模型的跨衰老人脸识别方法
CN109543546A (zh) * 2018-10-26 2019-03-29 复旦大学 基于深度序分布回归的步态年龄估计方法
CN109886099A (zh) * 2019-01-11 2019-06-14 西安电子科技大学 一种年龄评估评判标准模型的建立方法
CN111444787A (zh) * 2020-03-12 2020-07-24 江西赣鄱云新型智慧城市技术研究有限公司 一种性别约束的全智能化人脸表情识别方法及系统
CN111523367A (zh) * 2020-01-22 2020-08-11 湖北科技学院 基于人脸属性分析的智能化人脸表情识别方法与系统
CN111611877A (zh) * 2020-04-30 2020-09-01 杭州电子科技大学 基于多时空信息融合的抗年龄干扰的人脸识别方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323507A (ja) * 2005-05-17 2006-11-30 Yamaha Motor Co Ltd 属性識別システムおよび属性識別方法
CN101819628A (zh) * 2010-04-02 2010-09-01 清华大学 结合形状特征的稀疏表示人脸识别方法
TW201430722A (zh) * 2013-01-30 2014-08-01 Nat Univ Tainan 年齡評估系統與方法
WO2015074157A1 (en) * 2013-11-25 2015-05-28 Ehsan Fazl Ersi System and method for face recognition
CN104992151A (zh) * 2015-06-29 2015-10-21 华侨大学 一种基于tfidf的人脸图像年龄的估计方法
CN105069400A (zh) * 2015-07-16 2015-11-18 北京工业大学 基于栈式稀疏自编码的人脸图像性别识别系统
CN105550634A (zh) * 2015-11-18 2016-05-04 广东微模式软件股份有限公司 基于Gabor特征与字典学习的人脸姿态识别方法
CN105718898A (zh) * 2016-01-22 2016-06-29 东南大学 基于稀疏无向概率图模型的人脸年龄估计方法、系统
CN106022287A (zh) * 2016-05-27 2016-10-12 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于深度学习与字典表示的跨年龄人脸验证方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323507A (ja) * 2005-05-17 2006-11-30 Yamaha Motor Co Ltd 属性識別システムおよび属性識別方法
CN101819628A (zh) * 2010-04-02 2010-09-01 清华大学 结合形状特征的稀疏表示人脸识别方法
TW201430722A (zh) * 2013-01-30 2014-08-01 Nat Univ Tainan 年齡評估系統與方法
WO2015074157A1 (en) * 2013-11-25 2015-05-28 Ehsan Fazl Ersi System and method for face recognition
CN104992151A (zh) * 2015-06-29 2015-10-21 华侨大学 一种基于tfidf的人脸图像年龄的估计方法
CN105069400A (zh) * 2015-07-16 2015-11-18 北京工业大学 基于栈式稀疏自编码的人脸图像性别识别系统
CN105550634A (zh) * 2015-11-18 2016-05-04 广东微模式软件股份有限公司 基于Gabor特征与字典学习的人脸姿态识别方法
CN105718898A (zh) * 2016-01-22 2016-06-29 东南大学 基于稀疏无向概率图模型的人脸年龄估计方法、系统
CN106022287A (zh) * 2016-05-27 2016-10-12 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于深度学习与字典表示的跨年龄人脸验证方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
闫陈静: "《人脸年龄估计算法的设计与实现》", <中国优秀硕士学位论文全文数据库 信息科技辑> *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255289A (zh) * 2018-07-27 2019-01-22 电子科技大学 一种基于统一式生成模型的跨衰老人脸识别方法
CN109255289B (zh) * 2018-07-27 2021-10-26 电子科技大学 一种基于统一式生成模型的跨衰老人脸识别方法
CN109543546A (zh) * 2018-10-26 2019-03-29 复旦大学 基于深度序分布回归的步态年龄估计方法
CN109543546B (zh) * 2018-10-26 2022-12-20 复旦大学 基于深度序分布回归的步态年龄估计方法
CN109886099A (zh) * 2019-01-11 2019-06-14 西安电子科技大学 一种年龄评估评判标准模型的建立方法
CN109886099B (zh) * 2019-01-11 2020-11-10 西安电子科技大学 一种年龄评估评判标准模型的建立方法
CN111523367A (zh) * 2020-01-22 2020-08-11 湖北科技学院 基于人脸属性分析的智能化人脸表情识别方法与系统
CN111523367B (zh) * 2020-01-22 2022-07-22 湖北科技学院 基于人脸属性分析的智能化人脸表情识别方法与系统
CN111444787A (zh) * 2020-03-12 2020-07-24 江西赣鄱云新型智慧城市技术研究有限公司 一种性别约束的全智能化人脸表情识别方法及系统
CN111444787B (zh) * 2020-03-12 2023-04-07 江西赣鄱云新型智慧城市技术研究有限公司 一种性别约束的全智能化人脸表情识别方法及系统
CN111611877A (zh) * 2020-04-30 2020-09-01 杭州电子科技大学 基于多时空信息融合的抗年龄干扰的人脸识别方法

Also Published As

Publication number Publication date
CN107330412B (zh) 2021-03-26

Similar Documents

Publication Publication Date Title
CN107330412A (zh) 一种基于深度稀疏表示的人脸年龄估计方法
CN103824054B (zh) 一种基于级联深度神经网络的人脸属性识别方法
CN110084156A (zh) 一种步态特征提取方法及基于步态特征的行人身份识别方法
Hammal et al. Facial expression classification: An approach based on the fusion of facial deformations using the transferable belief model
CN103440513B (zh) 基于稀疏非负张量分解的大脑特定视觉认知状态判定方法
CN106650806A (zh) 一种用于行人检测的协同式深度网络模型方法
CN109101108B (zh) 基于三支决策优化智能座舱人机交互界面的方法及系统
CN105975932B (zh) 基于时间序列shapelet的步态识别分类方法
CN106909938B (zh) 基于深度学习网络的视角无关性行为识别方法
CN103123619A (zh) 基于情感上下文的视觉语音多模态协同分析方法及系统
CN109993100A (zh) 基于深层特征聚类的人脸表情识别的实现方法
CN110033007A (zh) 基于深度姿态预估和多特征融合的行人衣着属性识别方法
CN103632147A (zh) 实现面部特征标准化语义描述的系统及方法
CN103955671B (zh) 基于快速判别公共向量算法的人体行为识别方法
de Arruda et al. A complex networks approach for data clustering
CN104182621A (zh) 基于深度信念网络的adhd判别分析方法
CN103077378A (zh) 基于扩展八邻域局部纹理特征的非接触式人脸识别算法和签到系统
CN108416795B (zh) 基于排序池化融合空间特征的视频动作识别方法
CN110334584A (zh) 一种基于区域全卷积网络的手势识别方法
CN110889335B (zh) 基于多通道时空融合网络人体骨架双人交互行为识别方法
CN104361339B (zh) 掌形图形提取及识别方法
CN107045624A (zh) 一种基于最大加权团的脑电信号预处理与分类方法
CN104751461A (zh) 一种基于直方图阈值及低秩表示的白细胞细胞核分割方法
Tan et al. An emotion index estimation based on facial action unit prediction
Lu et al. Multimode gesture recognition algorithm based on convolutional long short-term memory network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231110

Address after: 437000 Building 5, Nanlin Innovation and Entrepreneurship Industrial Park, Nanlinqiao Town, Tongshan County, Xianning, Hubei Province

Patentee after: Hubei Dacheng Medical Technology Co.,Ltd.

Address before: No.88 Xianning Avenue, Xian'an District, Xianning City, Hubei Province, 437100

Patentee before: HUBEI University OF SCIENCE AND TECHNOLOGY