CN110263620A - 一种基于l2,1偏标记学习的年龄估计方法 - Google Patents

一种基于l2,1偏标记学习的年龄估计方法 Download PDF

Info

Publication number
CN110263620A
CN110263620A CN201910371349.9A CN201910371349A CN110263620A CN 110263620 A CN110263620 A CN 110263620A CN 201910371349 A CN201910371349 A CN 201910371349A CN 110263620 A CN110263620 A CN 110263620A
Authority
CN
China
Prior art keywords
sample
label
matrix
objective function
age
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910371349.9A
Other languages
English (en)
Other versions
CN110263620B (zh
Inventor
夏思雨
甘海涛
郭丽
厉振华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201910371349.9A priority Critical patent/CN110263620B/zh
Publication of CN110263620A publication Critical patent/CN110263620A/zh
Application granted granted Critical
Publication of CN110263620B publication Critical patent/CN110263620B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于L2,1偏标记学习的年龄估计方法。首先获取人脸数据集的特征矩阵和标签矩阵,然后构建该方法的目标函数。为了使样本的标签分布尽可能稀疏并且求解更加简单,在目标函数中嵌入了L2,1范数;为了使相邻样本的标签分布尽可能相似,采用了流形假设的思想,在目标函数中嵌入图正则项。接着利用交替迭代方法求解优化问题,得到判别系数A(t)。最后,利用判别系数A(t)估计给定的人脸测试样本的标签分布,依据概率最大原则判定其年龄。本发明一方面充分利用了特征空间潜在的有用信息,使相邻样本的标签分布尽可能接近,有效提高了方法的准确性和鲁棒性;另一方面能够实现对候选标记集合进行消歧,准确地估计出样本的标签。

Description

一种基于L2,1偏标记学习的年龄估计方法
技术领域
本发明涉及一种基于L2,1偏标记学习的年龄估计方法,属于计算机视觉领域。
背景技术
近年来,随着计算机视觉的发展,人脸识别技术成为模式识别领域非常热门的一个研究课题。人脸是人类非常重要的生物学特征之一,人脸中包含了很多重要的信息,例如身份、性别、年龄、表情、种族等等。在这所有的信息中,人脸显示出的年龄信息是人类身份识别的重要依据,并且人脸图像的年龄估计在人机交互、计算机视觉、智慧商业等领域有着非常不错的应用前景。因此,人脸年龄估计引起了越来越多的学者的关注。
现有的人脸年龄估计的算法主要从人脸特征与估计方法两方面解决人脸图像的年龄问题。特征方面,Gabor特征,LBP(Local Binary Patterns)特征等基本人脸纹理特征,以及针对人脸的AAM(Active Appearence Model)特征等都是人脸年龄估计的常用特征。但是现有的人脸年龄估计方法大都在监督学习框架下进行的,然而受外部环境、成本以及问题特性等原因,这样获取一个对象真实标记所需的成本非常大或很难获取对象的真实标记,往往只能获取对象有限的类别标记信息,即弱监督(weakly supervised)信息。因此,如何在弱监督信息框架下进行学习研究已经引起相关领域研究者的关注。其中偏标记(partial label learning)是一种重要的弱监督学习框架。在该框架下,每个对象的性质在输入空间由单个示例来描述,而在输出空间该示例与多个语义标记相关联,多个语义标记的集合构成候选标记集合(candidate label set)但其中只有一个标记为其真实标记。偏标记学习的这种学习场景在现实世界中具有广泛应用且作为一个比较新的概念,已经成功应用在计算机视觉,互联网,生态信息学等领域。比如:在医疗诊断中,医生有时可以排除病人患有某些疾病,但很难从若干相似的疾病中对病人进行确诊。现在偏标记学习已经引起机器学习相关领域的广泛关注。
偏标记学习的主要困难在于对象的真实标记隐藏在候选标记集合中且未知,解决这类问题最直观想法是对偏标记对象的候选标记给予消歧(disambiguation),即消除候选标记中的伪标记。将现有的偏标记学习分为基于辨识(identification-based)和基于平均(averaging-based)的消歧。在单纯的自训练方法中,早期的错误标签预测可能会严重误导模型;并且由于自训练隐含了标签之间是互斥的假设,生成的错误标签会直接导致真正的标签信息完全没有被利用。为了解决这个问题,Lei Feng和Bo An提出了SURE (Self-Guided Retraining)方法,该方法采用无穷范数求解最优的标签分布。但该方法没有考虑到样本的局部特性,并且无穷范数的求解过于复杂。为了克服以上不足,本发明提出了基于L2,1偏标记学习方法,并成功应用在年龄估计上。
发明内容
本发明公开一种基于L2,1偏标记学习的年龄估计方法。首先获取人脸数据集的特征矩阵和标签矩阵,然后构建该方法的目标函数。为了使样本的标签分布尽可能稀疏并且求解更加简单,在目标函数中嵌入了L2,1范数;为了使相邻样本的标签分布尽可能相似,采用了流形假设的思想,在目标函数中嵌入图正则项。接着利用交替迭代方法求解优化问题,得到判别系数A(t)。最后,利用判别系数A(t)估计给定的人脸测试样本的标签分布,依据概率最大原则判定其年龄。本发明一方面充分利用了特征空间潜在的有用信息,使相邻样本的标签分布尽可能接近,有效提高了方法的准确性和鲁棒性;另一方面能够实现对候选标记集合进行消歧,准确地估计出样本的标签。
技术方案:一种基于L2,1偏标记学习的年龄估计方法,包含以下步骤:
步骤一:获取人脸数据集的特征矩阵和标签矩阵,并映射到核空间上处理;
步骤二:构建目标函数,在目标函数中嵌入L2,1正则项和图正则项;
步骤三:采用交替迭代方法求解优化问题,得到判别系数A(t)和样本标签分布矩阵Z(t+1)
步骤四:给定人脸测试样本,利用判别系数A(t)估计样本的年龄。
本发明提出的方法利用L2,1范数来约束标签分布矩阵,使得求解更简单;同时采用流形假设的思想,充分考虑到样本的局部性,使相邻样本的标签分布尽可能相似。
附图说明
图1为本发明具体实施流程图;
具体实施方式
结合说明书附图进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,本发明的实施主要包含四个步骤:(1)获取人脸数据集的特征矩阵和标签矩阵,并映射到核空间上处理;(2)构建基于L2,1范数和流形假设的偏标记学习方法的目标函数;(3)采用交替迭代方法求解优化问题,得到样本标签分布矩阵Z(t+1)和判别系数A(t);(4)给定人脸测试样本,利用判别系数A(t)估计样本的年龄。
步骤一:获取人脸数据集的特征矩阵和标签矩阵,并映射到核空间上处理;
获取样本的特征矩阵X和标签矩阵Y,并将样本的特征映射到核空间上进行处理,选择核函数的类型是高斯核,其中xi,xj为第i,j个样本的特征向量,其中σ为宽度参数,得到K矩阵,于是
Ω(f)=tr(ATKA) (2)
其中f(x)为给定样本向量x经过训练后的模型的输出,A为判别系数矩阵,Ai为第i个样本的判别系数向量,Ω(f)为模型的复杂度,k(xi,xj)为第i个样本和第j个样本之间的核内积。。
步骤二:构建目标函数,在目标函数中嵌入L2,1正则项和图正则项;
本发明设计的目标函数为:
其中L(xi,zi,f)为损失函数,Ω(f)为模型的复杂度,Z为标签分布矩阵,为样本的k近邻图,λ1,λ2,λ3,β为正则化系数。
转换到核空间中,目标函数为:
其中D=diag(d11,d22......,dmm),L=D-W,rii=1/(2||zi||2)
步骤三:采用迭代求解交替迭代方法求解优化问题,得到判别系数A(t)和样本标签分布矩阵Z(t+1)
(1)初始化Z(0)=Y;
(2)求解A(t):
A(t)=(K+βI)-1Z(t) (5)
(3)求解Z(t+1):
Z(t+1)=(I+λ1R(t)2L+λ3I)-13Y+KA(t)) (7)
Z(t+1)=max{Z(t+1),0} (8)
其中
(4)计算如果其中ε>0为事先设定的阈值,则停止迭代,否则继续回到第(2)步中继续迭代。
步骤四:给定人脸测试样本x,利用判别系数A(t)估计样本的年龄y
根据判别系数A(t),估计给定人脸测试样本的标签分布,然后依据概率最大原则判定其年龄,判别公式如下:
其中l为对于每个样本的l个候选年龄标签集合,aij为第i个样本属于第j个标签的判别系数。

Claims (2)

1.一种基于L2,1偏标记学习的年龄估计方法,其特征在于,该方法具体包括以下步骤:
步骤一:获取人脸数据集的特征矩阵X和标签矩阵Y,并映射到核空间上处理;
步骤二:构建目标函数,在目标函数中嵌入L2,1正则项和图正则项;
设计的目标函数为:
其中L(xi,zi,f)为损失函数,Ω(f)为模型的复杂度,Z为标签分布矩阵,zi表示第i个样本的标签分布向量,zj表示第j个样本的标签分布向量,为样本的k近邻图,λ1,λ2,λ3,β为正则化系数;
转换到核空间中,目标函数为:
其中D=diag(d11,d22......,dmm),L=D-W,rii=1/(2||zi||2),A为判别系数矩阵;
步骤三:采用迭代求解交替迭代方法求解优化问题,得到训练后的判别系数矩阵A(t)和训练后的样本标签分布矩阵Z(t+1)
(1)初始化Z(0)=Y;
(2)求解A(t):
A(t)=(K+βI)-1Z(t) (5)
其中I为与K矩阵同行数同列数的单位矩阵;
(3)求解Z(t+1):
Z(t+1)=(I+λ1R(t)2L+λ3I)-13Y+KA(t)) (7)
Z(t+1)=max{Z(t+1),0} (8)
其中
(4)计算如果其中ε>0为事先设定的阈值,则停止迭代,否则继续回到第(2)步中继续迭代;
步骤四:给定人脸测试样本x,利用判别系数A(t)估计样本的年龄y;
根据判别系数A(t),估计给定人脸测试样本的标签分布,然后依据概率最大原则判定其年龄,判别公式如下:
其中l为对于每个样本的l个候选年龄标签集合,aij为第i个样本属于第j个标签的判别系数。
2.根据权利要求1所述的一种基于L2,1偏标记学习的年龄估计方法,其特征映射到核空间之后:
步骤一是获取人脸数据集的特征矩阵X和标签矩阵Y,并将样本的特征映射到核空间上进行处理,具体为:选择核函数的类型是高斯核,其中xi,xj为第i,j个样本的特征向量,其中σ为宽度参数,得到K矩阵,于是
Ω(f)=tr(ATKA) (2)
其中f(x)为给定样本向量x经过训练后的模型的输出,A为判别系数矩阵,Ai为第i个样本的判别系数向量,Ω(f)为模型的复杂度,k(xi,xj)为第i个样本和第j个样本之间的核内积。
CN201910371349.9A 2019-05-06 2019-05-06 一种基于l2,1偏标记学习的年龄估计方法 Active CN110263620B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910371349.9A CN110263620B (zh) 2019-05-06 2019-05-06 一种基于l2,1偏标记学习的年龄估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910371349.9A CN110263620B (zh) 2019-05-06 2019-05-06 一种基于l2,1偏标记学习的年龄估计方法

Publications (2)

Publication Number Publication Date
CN110263620A true CN110263620A (zh) 2019-09-20
CN110263620B CN110263620B (zh) 2021-06-01

Family

ID=67914187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910371349.9A Active CN110263620B (zh) 2019-05-06 2019-05-06 一种基于l2,1偏标记学习的年龄估计方法

Country Status (1)

Country Link
CN (1) CN110263620B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110867250A (zh) * 2019-10-28 2020-03-06 西安交通大学 一种基于强鲁棒性特征选择的社交媒体自残行为检测方法
CN117454154A (zh) * 2023-12-22 2024-01-26 江西农业大学 一种面向偏标记数据的鲁棒特征选择方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8520906B1 (en) * 2007-09-24 2013-08-27 Videomining Corporation Method and system for age estimation based on relative ages of pairwise facial images of people
US20140099029A1 (en) * 2012-10-05 2014-04-10 Carnegie Mellon University Face Age-Estimation and Methods, Systems, and Software Therefor
US20150046131A1 (en) * 2013-08-07 2015-02-12 International Business Machines Corporation Detecting appliances in a building from coarse grained meter data with partial label
CN104463249A (zh) * 2014-12-09 2015-03-25 西北工业大学 一种基于弱监督学习框架的遥感图像机场检测方法
CN104484562A (zh) * 2014-12-10 2015-04-01 山东中弘信息科技有限公司 一种基于模糊神经网络的体域网健康信息监测、交互系统
CN106384125A (zh) * 2016-09-05 2017-02-08 东南大学 面向偏标记数据的数字图像分类方法
CN109242039A (zh) * 2018-09-27 2019-01-18 东南大学 一种基于候选标记估计的未标记数据利用方法
CN109255790A (zh) * 2018-07-27 2019-01-22 北京工业大学 一种弱监督语义分割的自动图像标注方法
CN109582782A (zh) * 2018-10-26 2019-04-05 杭州电子科技大学 一种基于用弱监督深度学习的文本聚类方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8520906B1 (en) * 2007-09-24 2013-08-27 Videomining Corporation Method and system for age estimation based on relative ages of pairwise facial images of people
US20140099029A1 (en) * 2012-10-05 2014-04-10 Carnegie Mellon University Face Age-Estimation and Methods, Systems, and Software Therefor
US20150046131A1 (en) * 2013-08-07 2015-02-12 International Business Machines Corporation Detecting appliances in a building from coarse grained meter data with partial label
CN104463249A (zh) * 2014-12-09 2015-03-25 西北工业大学 一种基于弱监督学习框架的遥感图像机场检测方法
CN104484562A (zh) * 2014-12-10 2015-04-01 山东中弘信息科技有限公司 一种基于模糊神经网络的体域网健康信息监测、交互系统
CN106384125A (zh) * 2016-09-05 2017-02-08 东南大学 面向偏标记数据的数字图像分类方法
CN109255790A (zh) * 2018-07-27 2019-01-22 北京工业大学 一种弱监督语义分割的自动图像标注方法
CN109242039A (zh) * 2018-09-27 2019-01-18 东南大学 一种基于候选标记估计的未标记数据利用方法
CN109582782A (zh) * 2018-10-26 2019-04-05 杭州电子科技大学 一种基于用弱监督深度学习的文本聚类方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
KAI LI 等: "D2C: Deep cumulatively and comparatively learning for human age estimation", 《PATTERN RECOGNITION》 *
YU ZHOU 等: "Partial Label Learning via Gaussian Processes", 《IEEE TRANSACTIONS ON CYBERNETICS》 *
余庆 等: "基于一种改进NMF算法的人脸年龄估计方法", 《中国图象图形学报》 *
周瑜 等: "一种基于最大值损失函数的快速偏标记学习算法", 《计算机研究与发展》 *
张敏灵: "偏标记学习研究综述", 《JOURNAL OF DATA ACQUISITION AND PROCESSING》 *
曾雪强 等: "基于偏最小二乘的人脸年龄估计", 《南昌大学学报(工科版)》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110867250A (zh) * 2019-10-28 2020-03-06 西安交通大学 一种基于强鲁棒性特征选择的社交媒体自残行为检测方法
CN110867250B (zh) * 2019-10-28 2022-10-25 西安交通大学 一种基于强鲁棒性特征选择的社交媒体自残行为检测方法
CN117454154A (zh) * 2023-12-22 2024-01-26 江西农业大学 一种面向偏标记数据的鲁棒特征选择方法

Also Published As

Publication number Publication date
CN110263620B (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
Xu et al. Weighted multi-view clustering with feature selection
Jiang et al. A survey on artificial intelligence in Chinese sign language recognition
Zha et al. Boosting few-shot fine-grained recognition with background suppression and foreground alignment
Deng et al. Saliency detection via a multiple self-weighted graph-based manifold ranking
Tamen et al. An efficient multiple classifier system for Arabic handwritten words recognition
Li et al. Adaptive metric learning for saliency detection
Feng et al. Transductive multi-instance multi-label learning algorithm with application to automatic image annotation
Zheng et al. Static Hand Gesture Recognition Based on Gaussian Mixture Model and Partial Differential Equation.
Mhiri et al. Word spotting and recognition via a joint deep embedding of image and text
CN110598022A (zh) 一种基于鲁棒深度哈希网络的图像检索系统与方法
CN110263620A (zh) 一种基于l2,1偏标记学习的年龄估计方法
Zhang et al. Learning deep discriminative face features by customized weighted constraint
Felci Rajam et al. Region-based image retrieval using the semantic cluster matrix and adaptive learning
Ren et al. Deep metric learning via subtype fuzzy clustering
Jin et al. A cross-modal deep metric learning model for disease diagnosis based on chest x-ray images
CN117393098A (zh) 基于视觉先验和跨模态对齐网络的医疗影像报告生成方法
Lin et al. Radical-based extract and recognition networks for Oracle character recognition
He et al. Laplacian optimal design for image retrieval
Liu et al. Iterative deep neighborhood: a deep learning model which involves both input data points and their neighbors
Yu et al. Graph based transductive learning for cartoon correspondence construction
Lu et al. A survey of object co-segmentation
CN111144469B (zh) 基于多维关联时序分类神经网络的端到端多序列文本识别方法
Wang et al. Zero-shot learning based on multitask extended attribute groups
Yang et al. Robust visual tracking based on deep convolutional neural networks and kernelized correlation filters
CN117036288A (zh) 一种面向全切片病理图像的肿瘤亚型诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant