CN110263620A

CN110263620A - 一种基于l2,1偏标记学习的年龄估计方法

Info

Publication number: CN110263620A
Application number: CN201910371349.9A
Authority: CN
Inventors: 夏思雨; 甘海涛; 郭丽; 厉振华
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2019-05-06
Filing date: 2019-05-06
Publication date: 2019-09-20
Anticipated expiration: 2039-05-06
Also published as: CN110263620B

Abstract

本发明公开一种基于L_2,1偏标记学习的年龄估计方法。首先获取人脸数据集的特征矩阵和标签矩阵，然后构建该方法的目标函数。为了使样本的标签分布尽可能稀疏并且求解更加简单，在目标函数中嵌入了L_2,1范数；为了使相邻样本的标签分布尽可能相似，采用了流形假设的思想，在目标函数中嵌入图正则项。接着利用交替迭代方法求解优化问题，得到判别系数A^(t)。最后，利用判别系数A^(t)估计给定的人脸测试样本的标签分布，依据概率最大原则判定其年龄。本发明一方面充分利用了特征空间潜在的有用信息，使相邻样本的标签分布尽可能接近，有效提高了方法的准确性和鲁棒性；另一方面能够实现对候选标记集合进行消歧，准确地估计出样本的标签。

Description

一种基于L2,1偏标记学习的年龄估计方法

技术领域

本发明涉及一种基于L_2,1偏标记学习的年龄估计方法，属于计算机视觉领域。

背景技术

近年来，随着计算机视觉的发展，人脸识别技术成为模式识别领域非常热门的一个研究课题。人脸是人类非常重要的生物学特征之一，人脸中包含了很多重要的信息，例如身份、性别、年龄、表情、种族等等。在这所有的信息中，人脸显示出的年龄信息是人类身份识别的重要依据，并且人脸图像的年龄估计在人机交互、计算机视觉、智慧商业等领域有着非常不错的应用前景。因此，人脸年龄估计引起了越来越多的学者的关注。

现有的人脸年龄估计的算法主要从人脸特征与估计方法两方面解决人脸图像的年龄问题。特征方面，Gabor特征，LBP(Local Binary Patterns)特征等基本人脸纹理特征，以及针对人脸的AAM(Active Appearence Model)特征等都是人脸年龄估计的常用特征。但是现有的人脸年龄估计方法大都在监督学习框架下进行的，然而受外部环境、成本以及问题特性等原因，这样获取一个对象真实标记所需的成本非常大或很难获取对象的真实标记，往往只能获取对象有限的类别标记信息，即弱监督(weakly supervised)信息。因此，如何在弱监督信息框架下进行学习研究已经引起相关领域研究者的关注。其中偏标记(partial label learning)是一种重要的弱监督学习框架。在该框架下，每个对象的性质在输入空间由单个示例来描述，而在输出空间该示例与多个语义标记相关联，多个语义标记的集合构成候选标记集合(candidate label set)但其中只有一个标记为其真实标记。偏标记学习的这种学习场景在现实世界中具有广泛应用且作为一个比较新的概念，已经成功应用在计算机视觉，互联网，生态信息学等领域。比如：在医疗诊断中，医生有时可以排除病人患有某些疾病，但很难从若干相似的疾病中对病人进行确诊。现在偏标记学习已经引起机器学习相关领域的广泛关注。

偏标记学习的主要困难在于对象的真实标记隐藏在候选标记集合中且未知，解决这类问题最直观想法是对偏标记对象的候选标记给予消歧(disambiguation)，即消除候选标记中的伪标记。将现有的偏标记学习分为基于辨识(identification-based)和基于平均(averaging-based)的消歧。在单纯的自训练方法中，早期的错误标签预测可能会严重误导模型；并且由于自训练隐含了标签之间是互斥的假设，生成的错误标签会直接导致真正的标签信息完全没有被利用。为了解决这个问题，Lei Feng和Bo An提出了SURE (Self-Guided Retraining)方法，该方法采用无穷范数求解最优的标签分布。但该方法没有考虑到样本的局部特性，并且无穷范数的求解过于复杂。为了克服以上不足，本发明提出了基于L_2,1偏标记学习方法，并成功应用在年龄估计上。

发明内容

技术方案：一种基于L_2,1偏标记学习的年龄估计方法，包含以下步骤：

步骤一：获取人脸数据集的特征矩阵和标签矩阵，并映射到核空间上处理；

步骤二：构建目标函数，在目标函数中嵌入L_2,1正则项和图正则项；

步骤三：采用交替迭代方法求解优化问题，得到判别系数A^(t)和样本标签分布矩阵Z^(t+1)；

步骤四：给定人脸测试样本，利用判别系数A^(t)估计样本的年龄。

本发明提出的方法利用L_2,1范数来约束标签分布矩阵，使得求解更简单；同时采用流形假设的思想，充分考虑到样本的局部性，使相邻样本的标签分布尽可能相似。

附图说明

图1为本发明具体实施流程图；

具体实施方式

结合说明书附图进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

如图1所示，本发明的实施主要包含四个步骤：(1)获取人脸数据集的特征矩阵和标签矩阵，并映射到核空间上处理；(2)构建基于L_2,1范数和流形假设的偏标记学习方法的目标函数；(3)采用交替迭代方法求解优化问题，得到样本标签分布矩阵Z^(t+1)和判别系数A^(t)；(4)给定人脸测试样本，利用判别系数A^(t)估计样本的年龄。

获取样本的特征矩阵X和标签矩阵Y，并将样本的特征映射到核空间上进行处理，选择核函数的类型是高斯核，其中x_i，x_j为第i，j个样本的特征向量，其中σ为宽度参数，得到K矩阵，于是

Ω(f)＝tr(A^TKA) (2)

其中f(x)为给定样本向量x经过训练后的模型的输出，A为判别系数矩阵，A_i为第i个样本的判别系数向量，Ω(f)为模型的复杂度，k(xi,xj)为第i个样本和第j个样本之间的核内积。。

本发明设计的目标函数为：

其中L(x_i,zi,f)为损失函数，Ω(f)为模型的复杂度，Z为标签分布矩阵，为样本的k近邻图，λ₁，λ₂，λ₃，β为正则化系数。

转换到核空间中，目标函数为：

其中D＝diag(d₁₁,d₂₂......,d_mm)，L＝D-W，r_ii＝1/(2||z_i||₂)

步骤三：采用迭代求解交替迭代方法求解优化问题，得到判别系数A^(t)和样本标签分布矩阵Z^(t+1)；

(1)初始化Z⁽⁰⁾＝Y；

(2)求解A^(t):

A^(t)＝(K+βI)^-1Z^(t) (5)

(3)求解Z^(t+1):

Z^(t+1)＝(I+λ₁R^(t)+λ₂L+λ₃I)^-1(λ₃Y+KA^(t)) (7)

Z^(t+1)＝max{Z^(t+1),0} (8)

其中

(4)计算如果其中ε＞0为事先设定的阈值，则停止迭代，否则继续回到第(2)步中继续迭代。

步骤四：给定人脸测试样本x，利用判别系数A^(t)估计样本的年龄y

根据判别系数A^(t),估计给定人脸测试样本的标签分布，然后依据概率最大原则判定其年龄，判别公式如下：

其中l为对于每个样本的l个候选年龄标签集合，a_ij为第i个样本属于第j个标签的判别系数。

Claims

1.一种基于L_2,1偏标记学习的年龄估计方法，其特征在于，该方法具体包括以下步骤：

步骤一：获取人脸数据集的特征矩阵X和标签矩阵Y，并映射到核空间上处理；

设计的目标函数为：

其中L(x_i,z_i,f)为损失函数，Ω(f)为模型的复杂度，Z为标签分布矩阵，z_i表示第i个样本的标签分布向量，z_j表示第j个样本的标签分布向量，为样本的k近邻图，λ₁，λ₂，λ₃，β为正则化系数；

转换到核空间中，目标函数为：

其中D＝diag(d₁₁,d₂₂......,d_mm)，L＝D-W，r_ii＝1/(2||z_i||₂)，A为判别系数矩阵；

步骤三：采用迭代求解交替迭代方法求解优化问题，得到训练后的判别系数矩阵A^(t)和训练后的样本标签分布矩阵Z^(t+1)；

(1)初始化Z⁽⁰⁾＝Y；

(2)求解A^(t):

A^(t)＝(K+βI)^-1Z^(t) (5)

其中I为与K矩阵同行数同列数的单位矩阵；

(3)求解Z^(t+1):

Z^(t+1)＝(I+λ₁R^(t)+λ₂L+λ₃I)^-1(λ₃Y+KA^(t)) (7)

Z^(t+1)＝max{Z^(t+1),0} (8)

其中

(4)计算如果其中ε＞0为事先设定的阈值，则停止迭代，否则继续回到第(2)步中继续迭代；

步骤四：给定人脸测试样本x，利用判别系数A^(t)估计样本的年龄y；

2.根据权利要求1所述的一种基于L_2,1偏标记学习的年龄估计方法，其特征映射到核空间之后：

步骤一是获取人脸数据集的特征矩阵X和标签矩阵Y，并将样本的特征映射到核空间上进行处理，具体为：选择核函数的类型是高斯核，其中x_i，x_j为第i，j个样本的特征向量，其中σ为宽度参数，得到K矩阵，于是

Ω(f)＝tr(A^TKA) (2)

其中f(x)为给定样本向量x经过训练后的模型的输出，A为判别系数矩阵，A_i为第i个样本的判别系数向量，Ω(f)为模型的复杂度，k(x_i,x_j)为第i个样本和第j个样本之间的核内积。