CN110263620A - 一种基于l2,1偏标记学习的年龄估计方法 - Google Patents
一种基于l2,1偏标记学习的年龄估计方法 Download PDFInfo
- Publication number
- CN110263620A CN110263620A CN201910371349.9A CN201910371349A CN110263620A CN 110263620 A CN110263620 A CN 110263620A CN 201910371349 A CN201910371349 A CN 201910371349A CN 110263620 A CN110263620 A CN 110263620A
- Authority
- CN
- China
- Prior art keywords
- sample
- label
- matrix
- objective function
- age
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/178—Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于L2,1偏标记学习的年龄估计方法。首先获取人脸数据集的特征矩阵和标签矩阵,然后构建该方法的目标函数。为了使样本的标签分布尽可能稀疏并且求解更加简单,在目标函数中嵌入了L2,1范数;为了使相邻样本的标签分布尽可能相似,采用了流形假设的思想,在目标函数中嵌入图正则项。接着利用交替迭代方法求解优化问题,得到判别系数A(t)。最后,利用判别系数A(t)估计给定的人脸测试样本的标签分布,依据概率最大原则判定其年龄。本发明一方面充分利用了特征空间潜在的有用信息,使相邻样本的标签分布尽可能接近,有效提高了方法的准确性和鲁棒性;另一方面能够实现对候选标记集合进行消歧,准确地估计出样本的标签。
Description
技术领域
本发明涉及一种基于L2,1偏标记学习的年龄估计方法,属于计算机视觉领域。
背景技术
近年来,随着计算机视觉的发展,人脸识别技术成为模式识别领域非常热门的一个研究课题。人脸是人类非常重要的生物学特征之一,人脸中包含了很多重要的信息,例如身份、性别、年龄、表情、种族等等。在这所有的信息中,人脸显示出的年龄信息是人类身份识别的重要依据,并且人脸图像的年龄估计在人机交互、计算机视觉、智慧商业等领域有着非常不错的应用前景。因此,人脸年龄估计引起了越来越多的学者的关注。
现有的人脸年龄估计的算法主要从人脸特征与估计方法两方面解决人脸图像的年龄问题。特征方面,Gabor特征,LBP(Local Binary Patterns)特征等基本人脸纹理特征,以及针对人脸的AAM(Active Appearence Model)特征等都是人脸年龄估计的常用特征。但是现有的人脸年龄估计方法大都在监督学习框架下进行的,然而受外部环境、成本以及问题特性等原因,这样获取一个对象真实标记所需的成本非常大或很难获取对象的真实标记,往往只能获取对象有限的类别标记信息,即弱监督(weakly supervised)信息。因此,如何在弱监督信息框架下进行学习研究已经引起相关领域研究者的关注。其中偏标记(partial label learning)是一种重要的弱监督学习框架。在该框架下,每个对象的性质在输入空间由单个示例来描述,而在输出空间该示例与多个语义标记相关联,多个语义标记的集合构成候选标记集合(candidate label set)但其中只有一个标记为其真实标记。偏标记学习的这种学习场景在现实世界中具有广泛应用且作为一个比较新的概念,已经成功应用在计算机视觉,互联网,生态信息学等领域。比如:在医疗诊断中,医生有时可以排除病人患有某些疾病,但很难从若干相似的疾病中对病人进行确诊。现在偏标记学习已经引起机器学习相关领域的广泛关注。
偏标记学习的主要困难在于对象的真实标记隐藏在候选标记集合中且未知,解决这类问题最直观想法是对偏标记对象的候选标记给予消歧(disambiguation),即消除候选标记中的伪标记。将现有的偏标记学习分为基于辨识(identification-based)和基于平均(averaging-based)的消歧。在单纯的自训练方法中,早期的错误标签预测可能会严重误导模型;并且由于自训练隐含了标签之间是互斥的假设,生成的错误标签会直接导致真正的标签信息完全没有被利用。为了解决这个问题,Lei Feng和Bo An提出了SURE (Self-Guided Retraining)方法,该方法采用无穷范数求解最优的标签分布。但该方法没有考虑到样本的局部特性,并且无穷范数的求解过于复杂。为了克服以上不足,本发明提出了基于L2,1偏标记学习方法,并成功应用在年龄估计上。
发明内容
本发明公开一种基于L2,1偏标记学习的年龄估计方法。首先获取人脸数据集的特征矩阵和标签矩阵,然后构建该方法的目标函数。为了使样本的标签分布尽可能稀疏并且求解更加简单,在目标函数中嵌入了L2,1范数;为了使相邻样本的标签分布尽可能相似,采用了流形假设的思想,在目标函数中嵌入图正则项。接着利用交替迭代方法求解优化问题,得到判别系数A(t)。最后,利用判别系数A(t)估计给定的人脸测试样本的标签分布,依据概率最大原则判定其年龄。本发明一方面充分利用了特征空间潜在的有用信息,使相邻样本的标签分布尽可能接近,有效提高了方法的准确性和鲁棒性;另一方面能够实现对候选标记集合进行消歧,准确地估计出样本的标签。
技术方案:一种基于L2,1偏标记学习的年龄估计方法,包含以下步骤:
步骤一:获取人脸数据集的特征矩阵和标签矩阵,并映射到核空间上处理;
步骤二:构建目标函数,在目标函数中嵌入L2,1正则项和图正则项;
步骤三:采用交替迭代方法求解优化问题,得到判别系数A(t)和样本标签分布矩阵Z(t+1);
步骤四:给定人脸测试样本,利用判别系数A(t)估计样本的年龄。
本发明提出的方法利用L2,1范数来约束标签分布矩阵,使得求解更简单;同时采用流形假设的思想,充分考虑到样本的局部性,使相邻样本的标签分布尽可能相似。
附图说明
图1为本发明具体实施流程图;
具体实施方式
结合说明书附图进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,本发明的实施主要包含四个步骤:(1)获取人脸数据集的特征矩阵和标签矩阵,并映射到核空间上处理;(2)构建基于L2,1范数和流形假设的偏标记学习方法的目标函数;(3)采用交替迭代方法求解优化问题,得到样本标签分布矩阵Z(t+1)和判别系数A(t);(4)给定人脸测试样本,利用判别系数A(t)估计样本的年龄。
步骤一:获取人脸数据集的特征矩阵和标签矩阵,并映射到核空间上处理;
获取样本的特征矩阵X和标签矩阵Y,并将样本的特征映射到核空间上进行处理,选择核函数的类型是高斯核,其中xi,xj为第i,j个样本的特征向量,其中σ为宽度参数,得到K矩阵,于是
Ω(f)=tr(ATKA) (2)
其中f(x)为给定样本向量x经过训练后的模型的输出,A为判别系数矩阵,Ai为第i个样本的判别系数向量,Ω(f)为模型的复杂度,k(xi,xj)为第i个样本和第j个样本之间的核内积。。
步骤二:构建目标函数,在目标函数中嵌入L2,1正则项和图正则项;
本发明设计的目标函数为:
其中L(xi,zi,f)为损失函数,Ω(f)为模型的复杂度,Z为标签分布矩阵,为样本的k近邻图,λ1,λ2,λ3,β为正则化系数。
转换到核空间中,目标函数为:
其中D=diag(d11,d22......,dmm),L=D-W,rii=1/(2||zi||2)
步骤三:采用迭代求解交替迭代方法求解优化问题,得到判别系数A(t)和样本标签分布矩阵Z(t+1);
(1)初始化Z(0)=Y;
(2)求解A(t):
A(t)=(K+βI)-1Z(t) (5)
(3)求解Z(t+1):
Z(t+1)=(I+λ1R(t)+λ2L+λ3I)-1(λ3Y+KA(t)) (7)
Z(t+1)=max{Z(t+1),0} (8)
其中
(4)计算如果其中ε>0为事先设定的阈值,则停止迭代,否则继续回到第(2)步中继续迭代。
步骤四:给定人脸测试样本x,利用判别系数A(t)估计样本的年龄y
根据判别系数A(t),估计给定人脸测试样本的标签分布,然后依据概率最大原则判定其年龄,判别公式如下:
其中l为对于每个样本的l个候选年龄标签集合,aij为第i个样本属于第j个标签的判别系数。
Claims (2)
1.一种基于L2,1偏标记学习的年龄估计方法,其特征在于,该方法具体包括以下步骤:
步骤一:获取人脸数据集的特征矩阵X和标签矩阵Y,并映射到核空间上处理;
步骤二:构建目标函数,在目标函数中嵌入L2,1正则项和图正则项;
设计的目标函数为:
其中L(xi,zi,f)为损失函数,Ω(f)为模型的复杂度,Z为标签分布矩阵,zi表示第i个样本的标签分布向量,zj表示第j个样本的标签分布向量,为样本的k近邻图,λ1,λ2,λ3,β为正则化系数;
转换到核空间中,目标函数为:
其中D=diag(d11,d22......,dmm),L=D-W,rii=1/(2||zi||2),A为判别系数矩阵;
步骤三:采用迭代求解交替迭代方法求解优化问题,得到训练后的判别系数矩阵A(t)和训练后的样本标签分布矩阵Z(t+1);
(1)初始化Z(0)=Y;
(2)求解A(t):
A(t)=(K+βI)-1Z(t) (5)
其中I为与K矩阵同行数同列数的单位矩阵;
(3)求解Z(t+1):
Z(t+1)=(I+λ1R(t)+λ2L+λ3I)-1(λ3Y+KA(t)) (7)
Z(t+1)=max{Z(t+1),0} (8)
其中
(4)计算如果其中ε>0为事先设定的阈值,则停止迭代,否则继续回到第(2)步中继续迭代;
步骤四:给定人脸测试样本x,利用判别系数A(t)估计样本的年龄y;
根据判别系数A(t),估计给定人脸测试样本的标签分布,然后依据概率最大原则判定其年龄,判别公式如下:
其中l为对于每个样本的l个候选年龄标签集合,aij为第i个样本属于第j个标签的判别系数。
2.根据权利要求1所述的一种基于L2,1偏标记学习的年龄估计方法,其特征映射到核空间之后:
步骤一是获取人脸数据集的特征矩阵X和标签矩阵Y,并将样本的特征映射到核空间上进行处理,具体为:选择核函数的类型是高斯核,其中xi,xj为第i,j个样本的特征向量,其中σ为宽度参数,得到K矩阵,于是
Ω(f)=tr(ATKA) (2)
其中f(x)为给定样本向量x经过训练后的模型的输出,A为判别系数矩阵,Ai为第i个样本的判别系数向量,Ω(f)为模型的复杂度,k(xi,xj)为第i个样本和第j个样本之间的核内积。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910371349.9A CN110263620B (zh) | 2019-05-06 | 2019-05-06 | 一种基于l2,1偏标记学习的年龄估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910371349.9A CN110263620B (zh) | 2019-05-06 | 2019-05-06 | 一种基于l2,1偏标记学习的年龄估计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110263620A true CN110263620A (zh) | 2019-09-20 |
CN110263620B CN110263620B (zh) | 2021-06-01 |
Family
ID=67914187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910371349.9A Active CN110263620B (zh) | 2019-05-06 | 2019-05-06 | 一种基于l2,1偏标记学习的年龄估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110263620B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110867250A (zh) * | 2019-10-28 | 2020-03-06 | 西安交通大学 | 一种基于强鲁棒性特征选择的社交媒体自残行为检测方法 |
CN117454154A (zh) * | 2023-12-22 | 2024-01-26 | 江西农业大学 | 一种面向偏标记数据的鲁棒特征选择方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8520906B1 (en) * | 2007-09-24 | 2013-08-27 | Videomining Corporation | Method and system for age estimation based on relative ages of pairwise facial images of people |
US20140099029A1 (en) * | 2012-10-05 | 2014-04-10 | Carnegie Mellon University | Face Age-Estimation and Methods, Systems, and Software Therefor |
US20150046131A1 (en) * | 2013-08-07 | 2015-02-12 | International Business Machines Corporation | Detecting appliances in a building from coarse grained meter data with partial label |
CN104463249A (zh) * | 2014-12-09 | 2015-03-25 | 西北工业大学 | 一种基于弱监督学习框架的遥感图像机场检测方法 |
CN104484562A (zh) * | 2014-12-10 | 2015-04-01 | 山东中弘信息科技有限公司 | 一种基于模糊神经网络的体域网健康信息监测、交互系统 |
CN106384125A (zh) * | 2016-09-05 | 2017-02-08 | 东南大学 | 面向偏标记数据的数字图像分类方法 |
CN109242039A (zh) * | 2018-09-27 | 2019-01-18 | 东南大学 | 一种基于候选标记估计的未标记数据利用方法 |
CN109255790A (zh) * | 2018-07-27 | 2019-01-22 | 北京工业大学 | 一种弱监督语义分割的自动图像标注方法 |
CN109582782A (zh) * | 2018-10-26 | 2019-04-05 | 杭州电子科技大学 | 一种基于用弱监督深度学习的文本聚类方法 |
-
2019
- 2019-05-06 CN CN201910371349.9A patent/CN110263620B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8520906B1 (en) * | 2007-09-24 | 2013-08-27 | Videomining Corporation | Method and system for age estimation based on relative ages of pairwise facial images of people |
US20140099029A1 (en) * | 2012-10-05 | 2014-04-10 | Carnegie Mellon University | Face Age-Estimation and Methods, Systems, and Software Therefor |
US20150046131A1 (en) * | 2013-08-07 | 2015-02-12 | International Business Machines Corporation | Detecting appliances in a building from coarse grained meter data with partial label |
CN104463249A (zh) * | 2014-12-09 | 2015-03-25 | 西北工业大学 | 一种基于弱监督学习框架的遥感图像机场检测方法 |
CN104484562A (zh) * | 2014-12-10 | 2015-04-01 | 山东中弘信息科技有限公司 | 一种基于模糊神经网络的体域网健康信息监测、交互系统 |
CN106384125A (zh) * | 2016-09-05 | 2017-02-08 | 东南大学 | 面向偏标记数据的数字图像分类方法 |
CN109255790A (zh) * | 2018-07-27 | 2019-01-22 | 北京工业大学 | 一种弱监督语义分割的自动图像标注方法 |
CN109242039A (zh) * | 2018-09-27 | 2019-01-18 | 东南大学 | 一种基于候选标记估计的未标记数据利用方法 |
CN109582782A (zh) * | 2018-10-26 | 2019-04-05 | 杭州电子科技大学 | 一种基于用弱监督深度学习的文本聚类方法 |
Non-Patent Citations (6)
Title |
---|
KAI LI 等: "D2C: Deep cumulatively and comparatively learning for human age estimation", 《PATTERN RECOGNITION》 * |
YU ZHOU 等: "Partial Label Learning via Gaussian Processes", 《IEEE TRANSACTIONS ON CYBERNETICS》 * |
余庆 等: "基于一种改进NMF算法的人脸年龄估计方法", 《中国图象图形学报》 * |
周瑜 等: "一种基于最大值损失函数的快速偏标记学习算法", 《计算机研究与发展》 * |
张敏灵: "偏标记学习研究综述", 《JOURNAL OF DATA ACQUISITION AND PROCESSING》 * |
曾雪强 等: "基于偏最小二乘的人脸年龄估计", 《南昌大学学报(工科版)》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110867250A (zh) * | 2019-10-28 | 2020-03-06 | 西安交通大学 | 一种基于强鲁棒性特征选择的社交媒体自残行为检测方法 |
CN110867250B (zh) * | 2019-10-28 | 2022-10-25 | 西安交通大学 | 一种基于强鲁棒性特征选择的社交媒体自残行为检测方法 |
CN117454154A (zh) * | 2023-12-22 | 2024-01-26 | 江西农业大学 | 一种面向偏标记数据的鲁棒特征选择方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110263620B (zh) | 2021-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xu et al. | Weighted multi-view clustering with feature selection | |
Jiang et al. | A survey on artificial intelligence in Chinese sign language recognition | |
Zha et al. | Boosting few-shot fine-grained recognition with background suppression and foreground alignment | |
Deng et al. | Saliency detection via a multiple self-weighted graph-based manifold ranking | |
Tamen et al. | An efficient multiple classifier system for Arabic handwritten words recognition | |
Li et al. | Adaptive metric learning for saliency detection | |
Feng et al. | Transductive multi-instance multi-label learning algorithm with application to automatic image annotation | |
Zheng et al. | Static Hand Gesture Recognition Based on Gaussian Mixture Model and Partial Differential Equation. | |
Mhiri et al. | Word spotting and recognition via a joint deep embedding of image and text | |
CN110598022A (zh) | 一种基于鲁棒深度哈希网络的图像检索系统与方法 | |
CN110263620A (zh) | 一种基于l2,1偏标记学习的年龄估计方法 | |
Zhang et al. | Learning deep discriminative face features by customized weighted constraint | |
Felci Rajam et al. | Region-based image retrieval using the semantic cluster matrix and adaptive learning | |
Ren et al. | Deep metric learning via subtype fuzzy clustering | |
Jin et al. | A cross-modal deep metric learning model for disease diagnosis based on chest x-ray images | |
CN117393098A (zh) | 基于视觉先验和跨模态对齐网络的医疗影像报告生成方法 | |
Lin et al. | Radical-based extract and recognition networks for Oracle character recognition | |
He et al. | Laplacian optimal design for image retrieval | |
Liu et al. | Iterative deep neighborhood: a deep learning model which involves both input data points and their neighbors | |
Yu et al. | Graph based transductive learning for cartoon correspondence construction | |
Lu et al. | A survey of object co-segmentation | |
CN111144469B (zh) | 基于多维关联时序分类神经网络的端到端多序列文本识别方法 | |
Wang et al. | Zero-shot learning based on multitask extended attribute groups | |
Yang et al. | Robust visual tracking based on deep convolutional neural networks and kernelized correlation filters | |
CN117036288A (zh) | 一种面向全切片病理图像的肿瘤亚型诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |