背景技术
为了店铺营销等目的,对来到店铺的顾客的年龄段进行分析并且基于该分析管理商品的种类和数量。
例如,在便利店或类似店铺中,采用的分析顾客年龄段的方法是由雇员在结账时估计顾客的年龄组,并输入估计结果。
然而,人工年龄估计的结果影响了客观性,因为它在很大程度上包括估计者的个人观点。因此,存在对人类年龄的机械估计的需求,该机械估计使用识别装置或类似装置基于面部图像数据进行。
使用识别装置或类似装置基于面部图像数据机械地估计人类年龄的方法可以大致地被分成两种方法。一种是识别年龄类别(比如小孩、成人和老人)的方法,是将年龄估计为离散量的方法(在该方法中将年龄估计作为识别问题来实现)。另一种是识别年龄本身的方法,是将年龄估计为连续量的方法(在该方法中将年龄估计作为回归问题来实现)。
例如,在专利文献1中公开的发明中的识别年龄类别的方法中,还尝试通过以10岁为基础再细分来识别年龄类别。然而,在将年龄问题作为识别问题来解决的情况下,存在下面的问题:
想要相互分开的数据被相互拉近,而想要相互接近的数据被相互分隔开;并且
不能表达连续年龄的关系。
这些问题导致年龄识别准确率降低。
举例而言,以10岁为基础识别年龄类别时,提供了例如10到19岁和20到29岁的年龄类别,在这种情况下产生了这样的矛盾:相差1岁的年龄(比如19岁和20岁)会被相互分隔开,而相差9岁的年龄(比如10岁和19岁)会被拉近。
进一步地,当将一个类别与其他类别分隔开时,这些类别之间的距离不能改变。例如,当将十几岁的类别与其他年龄组分离开时,十几岁与二十几岁之间的距离与十几岁与五十几岁之间的距离相同。也就是说,相距远的年龄组之间的距离不能被延长,而相距近的年龄组之间的距离不能被缩短。
相反,在如非专利文献1中将年龄估计作为回归问题实现的情况下,由于可以表示出连续年龄,实验表明与将年龄估计作为识别问题来实现的情况相比,此时产生了较少的矛盾并且可以以高准确度识别出年龄。
通过将估计年龄与正确年龄之间的差作为最小化问题来解决,可以得到该回归问题。具体示例包括多重线性回归分析和(内核)岭回归。使用这些方法执行学习,从而减少估计年龄和正确年龄之间的均方误差或平均绝对误差。
图9显示了将年龄估计作为回归问题来实现的年龄估计设备的示例。通常而言,输入的图像数据是高维数据,例如像素数或3倍像素数(R、G和B的颜色值)。因此,在维度压缩器61中,从图像数据中提取出特征,从而强调年龄信息并删除不必要的信息(光照条件、面部角度、及类似的信息)。例如,使用例如基本元素分析(PCA)、线性辨别分析(LDA)和局部保持投影(LPP)的方法。这个过程也被称为“特征选择”和“维度压缩”。
然后,识别装置62基于提取的特征来估计年龄。
为了使用年龄估计设备60基于图像数据来估计年龄,需要维度压缩器61和识别装置62进行学习。
也就是说,将已知正确年龄(实际年龄或感知年龄)的人们的多个图像数据输入到维度估计器61,而且使用例如N重交叉验证和留一法(leave-one-out)交叉验证的方法评估每个数据。基于评估结果调整识别装置62的输出,从而减小了误差(估计年龄和正确年龄之间的差)。对于识别装置62的学习,采用诸如线性回归、多重回归、岭回归和神经网络的方法。
通过改变类型和特征组合、提取方法(即用于维度压缩的参数)等并重复相似的过程,选择参数和模型从而减少误差。
相关领域文献
[专利文献]
专利文献1:JP 2005-148880A
[非专利文献]
非专利文献1:Y.Fu,Y.Xu,和T.S.Huang,Estimating human ageby manifold analysis of face pictures and regression on aging features,Proceedings of the IEEE Multimedia and Expo,第1383-1386页,2007年。
发明内容
本发明要解决的技术问题
然而,由于年龄之间的距离根据预期年龄而不同,所以使用估计年龄和正确年龄之间的均方误差和平均绝对误差导致了年龄识别的准确性降低。
例如,在正确年龄和识别年龄之间的差(误差)为10年的情况下,将5岁误认为15岁和将35岁误认为45岁这两种情况的严重程度不同。换言之,即使同样是10岁差距的误差,将5岁误认为15岁意味着将幼儿园儿童误认为初中生或高中生,在人类感觉中这是非常严重的错误。另一方面,由于35岁的人的面部特征与45岁的非常近似,即使是人类也常常不能辨别他们之间的差别。因此,将35岁误认为45岁不像将5岁误认为15岁那么严重。
人类外表在青少年阶段(比如成长阶段)急剧变化,在成年后细微变化。因此,即使具有相同年龄差的误差,如果使用相同的指示符来进行评估会产生问题。
图10显示了通过估计器基于脸部图像对每个年龄进行评估的结果的示例。该图表显示了这样情况下的“估计年龄的标准偏差(变化程度)”,在该情况下针对每个年龄对已知正确年龄的人的年龄估计结果进行分类。水平轴指示对象的正确年龄(真实年龄),垂直轴显示估计误差的标准偏差。这里,正确年龄(真实年龄)是估计器估计的年龄的平均值。由于青少年的标准偏差较小,可以理解大多数估计器将青少年估计为近似的年龄。
因此,如果在年龄估计设备中青少年的数据被错误地识别为成年人,这与人类感知的结果有很大的不同。
如上所述,没有一种能够获得与人类感觉密切匹配的识别结果的年龄估计设备和年龄估计方法。
鉴于前述的问题做出本发明,其意在提供一种能够获得与人类感知的结果密切匹配的识别结果的年龄估计设备和年龄估计方法。
解决问题的手段
为了实现前面提及的目的,作为第一个方面,本发明提供一种用于基于图像数据估计人的年龄的年龄估计设备,包括:维度压缩单元,用于将维度压缩应用于图像数据,以输出低维数据;以及识别单元,用于基于使用包含在低维数据中的特征量的学习结果来估计人的年龄;其中,维度压缩单元使用的用于维度压缩的参数和识别单元使用的用于年龄估计的特征量,是基于使用加权函数的泛化能力的评估结果来设置的,加权函数显示了对于每个年龄的年龄估计误差的严重程度。
进一步地,为了获得前面提及的目的,作为第二个方面,本发明提供了一种用于基于图像数据估计人的年龄的年龄估计设备,包括:维度压缩单元,用于将维度压缩应用于图像数据,以输出低维数据;以及识别单元,用于基于使用包含在低维数据中的特征量的学习结果来估计人的年龄;其中,识别单元的学习是基于加权函数执行的,加权函数显示了对于每个年龄的估计年龄误差的严重程度。
进一步地,为了获得前面提及的目的,作为第三方面,本发明提出了一种用于基于图像数据估计人的年龄的年龄估计方法,包括:维度压缩步骤,用于将维度压缩应用于图像数据,以输出低维数据;以及识别步骤,用于基于使用包含在低维数据中的特征量的学习结果来估计人的年龄;其中,用于维度压缩步骤中的维度压缩的参数和用于识别步骤中的年龄估计的特征量是基于加权函数设置的,加权函数显示了对于每个年龄的年龄估计误差的严重程度。
进一步地,为了获得前面提及的目的,作为第四个方面,本发明提供了一种用于基于图像数据估计人的年龄的年龄估计方法,包括:维度压缩步骤,用于将维度压缩应用于图像数据,以输出低维数据;以及识别步骤,用于基于使用包含在低维数据中的特征量的学习结果来估计人的年龄;其中,执行识别步骤的识别装置基于加权函数来进行学习,加权函数显示了对于每个年龄的估计年龄误差的严重程度。
进一步地,为了获得前面提及的目的,作为第五方面,本发明提出了一种年龄估计程序,使计算机执行用于基于图像数据估计人的年龄的年龄估计处理,其中,该计算机作为维度压缩单元,用于将维度压缩应用于图像数据,以输出低维数据;并且作为识别单元,用于基于使用包含在低维数据中的特征量的学习结果来估计人的年龄;以及使该计算机基于使用加权函数的泛化能力的评估结果来设置由维度压缩单元使用的用于维度压缩的参数和由识别单元使用的用于年龄估计的特征量,加权函数显示了对于每个年龄的估计年龄误差的严重程度。
进一步地,为了获得前面提及的目的,作为第六个方面,本发明提供了一种年龄估计程序,使计算机执行用于基于图像数据估计人的年龄的年龄估计处理,其中,该计算机作为维度压缩单元,用于将维度压缩应用于图像数据,以输出低维数据;并且作为识别单元,用于基于使用包含在低维数据中的特征量的学习结果来估计人的年龄;以及使该计算机基于加权函数执行识别单元的学习,加权函数显示了对于每个年龄的估计年龄误差的严重程度。
发明效果
根据本发明,提供了一种能够获得与人类感知的结果密切匹配的识别结果的年龄估计设备、年龄估计方法和年龄估计程序。
具体实施方式
[第一实施方式]
将描述适当地实现了本发明的第一实施方式。
图1显示了根据本实施方式的年龄估计设备的配置。年龄估计设备10包括维度压缩器11和识别装置12。通常来说,输入年龄估计设备10的图像数据是高维数据,例如像素数或者3倍像素数(R、G和B的颜色值)。维度压缩器11从图像数据中提取年龄数据,从而强调年龄信息并删除不必要信息(光照条件、面部角度及类似的信息)。例如,使用诸如PCA、LDA、及LPP的方法提取特征。识别装置12基于维度压缩器11提取的特征估计年龄。
可以使用具有常见配置的那些设备来作为维度压缩器11和识别装置12。然而,基于考虑了显示估计年龄误差的严重程度的“权重”所获得的评估结果,来确定维度压缩器11中的特征提取方法(用于维度压缩的参数)和识别装置12的类型。进一步地,通过将权重的概念引入到识别装置12的学习内容中,可以实现可获得与人类识别结果密切匹配的估计结果的特征提取。
应用以n标记的训练数据(xi,yi),其中xi是一个解释变量(如面部特征,也可以被称为特征向量),yi是一个目标变量(年龄),i取值从1到n。在这种情况下,在用y*=f(x)对测试数据(其是特征矢量x的提取源)的真实年龄y*进行预测的监督式回归问题中,当使用向内核函数的正则化最小二乘赋予权重(内核正则化加权最小二乘KRWLS)的方法、由正定内核k(x,x’)的线性组合对年龄估计函数f(x)建模时,可以用下式(1)来表达。
在训练数据的数量n较大的情况下,可以不使用所有的内核函数k(xi,x)(i为从1到n),而是使用其子集。在识别装置12中,执行下式(2)(n行1列的矩阵,α1到αn是其分量)中所示的参数学习,以使得下式(3)最小。
α=(α1,...,αn)T …(2)
其中w(y)是加权函数,‖·‖是Rn的欧几里德范数。
式(3)中的λ(>0)是为了防止过度拟合所引入的正则化参数,式(3)的第二项是为了防止过度拟合的修正项。加权函数w(y)是表示对每个年龄的估计年龄误差的严重程度的函数。w(y)的值(权重)越大,则估计年龄误差越严重。在这个实施方式中,将取图10的标准偏差值的函数作为w(y)。也就是说,将图2A所示的权重函数应用于女性,将图2B所示的权重函数应用于男性。
式(3)的最优解可由下式(4)给出。
最优求解:
K:内核矩阵,其将k(xi,xi)作为(i,j)-分量;
KT:K的转置矩阵;
In:n维单元矩阵;
y:n维矢量,其将yi作为i分量。
在训练数据量n较大的情况下,由于式(4)中括号内的部分计算很困难,因此最优解可以通过减少用到的内核函数的数量或者利用梯度法进行数值计算来获得。
通过将用上述方式得到的最优解作为参数,预测m个测试数据的年龄。
这里,测试数据及其真实年龄,可以用下式表达:
测试数据:
根据下式(5)基于加权均方误差(WMSE)进行泛化能力的评估。
在确定维度压缩器11中的特征提取方法以及确定识别装置12的类型时,通过用学习数据和测试数据进行N-重交叉验证以及留一交叉验证,基于式(5)中的WMSE进行评估;选择获得测试数据中的最高准确度的方法和类型(该方法和类型产生的误差最小)。
这里,考虑如下情况:被标记的训练数据的数量n取2000,测试数据的数量m取1500,从被标记的训练数据中随机选择并且从每个年龄组中平等地选择出200个数据,以便各个年龄组的数据数量相等,这200个数据是内核函数的中心,使用下式(6)所示的高斯内核作为内核函数。确定内核宽度σ以及正则化参数λ,使得测试误差最小。
图3显示了不使用权重的内核正则化最小二乘法(KRLS)和使用图2A和图2B的加权函数的KRWLS之间的识别准确度的比较结果。在图3中,“不使用权重”是指通过向式(1)中的值w(y)应用一个常数值(在本情况下取1)来执行学习的情况下的WMSE的值,“使用权重”是指通过向式(1)中的值w(y)应用图2A和2B中示出的值来执行学习的情况下的WMSE的值。从图3中可以明显看出,在使用式(5)中的WMSE进行泛化能力评估的情况下,采用KRWLS比采用KRLS的WMSE值更小。
为了显示如何通过赋予权重来改变学习结果,图4A和图4B显示了对测试数据的每个真实年龄进行估计误差评估的结果。图4A显示了女性的评估结果,图4B显示了男性的评估结果。在图4中,垂直轴指示未被赋予估计年龄权重的平均绝对误差(MAE)。这里,估计年龄的MAE可由下式(7)计算。
估计年龄的MAE描述了估计年龄和真实年龄之间的平均距离。在图4A中,10岁以下年龄(水平轴为“-9”)的“不使用权重”的MAE为4.5,这表示真实年龄在10岁以下的女性的测试数据被估计为与真实年龄平均相差4.5岁。从图4A、4B可以明显看出,通过赋予权重,在人们可以敏锐地感知出错误的较年轻年龄段,男性和女性的MAE都减小了。因此,可以确定可以更准确地划分人们可以敏锐地感知出错误的那些数据。
通过这种方式,通过使用WMSE作为评估标准,可以选择出其输出年龄与人类感知年龄密切匹配的特征提取方法和识别装置。
由于所选择的特征提取方法和识别装置使得输出年龄与人类感知年龄密切匹配,所以基于本实施方式的年龄估计设备可以输出与人类感觉密切匹配的估计结果。
进一步地,由于使用执行与人类感觉密切匹配的学习的识别装置进行年龄估计,所以可以估计出密切匹配感知年龄的年龄。
这里,在本实施方式中,将特征提取方法和识别装置的选择以及识别装置的学习都考虑了权重的情况作为一个示例进行描述。但是,即使只执行选择和学习中的一种,也可以降低年龄估计误差。
[第二实施方式]
将描述适当地实现了本发明的第二实施方式。根据本实施方式的年龄估计设备具有与第一实施方式中的年龄估计设备相似的配置,包括维度压缩器11和识别装置12。
与第一实施方式一样,可以使用那些具有常用配置的设备作为维度压缩器11和识别装置12。进一步地,与第一实施方式一样,使用加权概念执行识别装置12的学习,并且基于考虑“权重”得到的评估结果来确定维度压缩器11中的特征提取方法和识别装置12的类型。
然而,本实施方式与第一实施方式的不同之处在于,第一实施方式中使用基于实际测量数据的加权函数,而在本实施方式中,将人为构造的加权函数应用于式(3)到(5)。
图5显示了一个加权函数示例,其中错误识别的灵敏度在较年轻年龄段和较年长年龄段被人为提高(即,在较年轻年龄段和较年长年龄段设置较小权重)。在本实施方式中,对于男性和女性应用相同的加权函数。进一步地,图6A和6B显示了使用图5中示出的加权函数,通过WMSE对测试数据的每个真实年龄进行估计误差评估的结果。图6A显示了女性的评估结果,图6B显示了男性的评估结果。从图6A和6B可以明显看出,对于男性和女性两者来说,权重量和MAE值之间存在相关性,而且存在MAE值随着权重的减小而减小的趋势。换言之,图5中赋予小权重的较年轻年龄段和较年长年龄段的MAE减小,而图5中赋予大权重的处于较年轻年龄段和较年长年龄段之间的年龄段的MAE增加。
对于任意年龄,当赋予的权重减小时,因为式(5)中∑中的分母的值减小,WMSE值增加。WMSE值大的事实意味着,在那一年龄重点地进行了估计年龄误差的严重程度的评估。因此,在期望特定年龄组的估计误差减小的情况下,通过设置加权函数使得期望的年龄组中的权重较小,以及通过基于大值的WMSE确定维度压缩器11中的特征提取方法和识别装置12的类型,可以减小期望的年龄组的估计误差。
由于除了上述内容以外,本实施方式与第一实施方式类似,因此将省略重复描述。
[第三实施方式]
将描述适当地实现了本发明的第三实施方式。根据本实施方式,年龄估计设备10具有类似于第一和第二实施方式的年龄估计设备的配置,并且包括维度压缩器11和识别装置12。
与第一和第二实施方式一样,可以使用那些具有常用配置的设备作为维度压缩器11和识别装置12。进一步地,与第一和第二实施方式一样,使用加权概念执行识别装置12的学习,并且基于考虑“权重”得到的评估结果来确定维度压缩器11中的特征提取方法和识别装置12的类型。
然而,本实施方式与第二实施方式的不同之处在于,第二实施方式中只使用一个加权函数,而本实施方式使用多个加权函数。
如第二实施方式中描述的,通过使用将一个年龄组的权重设置得小于其他年龄组的权重的加权函数,可以减小该年龄组的MAE,而且可以提高年龄估计的准确性。
因此,如果测试数据可以被大致初步地分类为一些年龄段,则认为通过单独地评估泛化能力使得每个年龄段的估计误差减小,可以减小所有年龄段的估计误差。在本实施方式中,针对每个年龄段,基于年龄段之间不同的加权函数确定维度压缩器11中的特征提取方法和识别装置12的类型。
具体而言,在测试数据被分类为较年轻年龄段和中年年龄段的情况下,当对于较年轻年龄段的测试数据,使用其中较年轻年龄段的权重值较小、而中年年龄段的权重值较大的加权函数(图7A)执行泛化能力的评估和识别装置12的学习;对于中年年龄段的测试数据,使用其中较年轻年龄段的权重值较大、而中年年龄段的权重值较小的加权函数(图7B)执行泛化能力的评估和识别装置12的学习,并且在其结果被整合时,可以减小所有年龄段的估计误差。
这里,在测试数据被分类为三个或更多的年龄段,并且针对每个年龄段基于在年龄段之间不同的加权函数,来执行对维度压缩器11中的特征提取方法和识别装置12的类型的确定以及识别装置12的学习时,在这种情况下,也可以应用与上述将测试数据分类为两个年龄段的示例相同的示例。
由于除了上述内容以外,本实施方式与第一实施方式类似,因此将省略重复描述。
上述的实施方式仅是适当地实现了本发明的示例,本发明并不局限于此。
例如,如图8所示,通过设置加权函数使得20岁附近的权重值较小,20岁附近的分离程度增加,并且识别程度可以增加。使用这样的加权函数可以改善成年人和未成年人之间的识别准确性。
通过这种方式,本发明中可以进行各种变化。
上文参考实施方式描述了本申请的发明。然而,本申请的发明不局限为上述的实施方式。在本申请的发明的范围内可以对发明的配置和细节进行本领域技术人员可理解的各种改变。
本申请要求2009年4月28日提交的日本专利申请No.2009-109613的优先权。该日本专利申请的全部发明的主题通过引用被合并在本发明中。
参考数值的注释
10年龄估计设备
11维度压缩器
12识别装置