CN111160161B - 一种基于噪声剔除的自步学习人脸年龄估计方法 - Google Patents

一种基于噪声剔除的自步学习人脸年龄估计方法 Download PDF

Info

Publication number
CN111160161B
CN111160161B CN201911308841.8A CN201911308841A CN111160161B CN 111160161 B CN111160161 B CN 111160161B CN 201911308841 A CN201911308841 A CN 201911308841A CN 111160161 B CN111160161 B CN 111160161B
Authority
CN
China
Prior art keywords
age
image
images
training
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911308841.8A
Other languages
English (en)
Other versions
CN111160161A (zh
Inventor
潘力立
艾仕杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201911308841.8A priority Critical patent/CN111160161B/zh
Publication of CN111160161A publication Critical patent/CN111160161A/zh
Application granted granted Critical
Publication of CN111160161B publication Critical patent/CN111160161B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

该发明公开了一种基于噪声剔除的自步学习人脸年龄估计方法,属于计算机视觉和机器学习领域。由于人脸图像经常带有姿势、照明、表情、遮挡和错位等变化,将人脸图片划分为简单图片(预测年龄与实际年龄之间的绝对误差小)和困难图片(预测年龄与实际年龄之间的绝对误差大),并在自步学习框架下,采取“从简单图片到困难图片”的策略去训练深度回归网络来建立人脸面部特征与目标年龄的非线性映射关系,同时本发明提出的cap()函数将会剔除训练样本中的噪声图像,从而去除噪声图像对模型的影响,该方法充分利用了cap()函数、自步学习和深度回归森林,这保证了提取的面部特征具有强大的表示能力,提高了现有方法的准确度和鲁棒性。该方法可以应用于人机交互、基于年龄的安全性控制、社交网络娱乐以及年龄差异化广告等方面。

Description

一种基于噪声剔除的自步学习人脸年龄估计方法
技术领域
本发明属于计算机视觉技术领域,涉及人脸年龄估计技术,主要应用于人机交互、基于年龄的安全性控制、社交网络娱乐以及年龄差异化广告等方面。
背景技术
人脸年龄估计技术是指通过计算机算法分析人脸特征后,自动估计人脸年龄的技术。由于这项技术可广泛应用在人机交互、基于年龄的安全性控制、社交网络娱乐以及年龄差异化广告等方面,因此它是近年来计算机视觉和机器学习领域研究的热门问题。现有的人脸年龄估计算法,主要分为基于浅层模型的方法和基于深度学习的方法。
基于浅层模型的方法的基本原理是将任务分解为面部特征提取和年龄估计模型设计两个独立的步骤。第一个步骤是从人脸图像中提取有效的年龄特征,第二个步骤则是根据获得的年龄特征去设计有效的年龄估计模型。由于这类方法只有从输入图像特征到预测年龄之间的单层映射函数,因此该方法的优点在于模型简单,不受训练样本数量的影响;而其缺点在于估计的精确性较差,原因是单层映射函数很难描述面部特征和年龄之间的复杂性。参考文献:A.Lanitis,C.J.Taylor,and T.F.Cootes,Automatic Interpretationand Coding of Face Images using Flexible Models,IEEE Transactions on PatternAnalysis and Machine Intelligence,vol.19,no.7,pp.743–756,1997。
基于深度学习的方法是人脸年龄估计领域近年来研究的热点,其基本原理是将人脸图像通过卷积神经网络学习适合于人脸年龄估计的面部特征,再根据实际任务设计具体的损失函数,损失函数产生的残差通过梯度反向传导对神经网络中的参数进行更新优化。卷积神经网络将原本相对独立的面部特征提取与任务学习有机地结合在一起,使得产生的面部特征包含的信息更加丰富,与任务更加契合。基于深度学习的这类算法的优点在于能更好地拟合已有面部特征和对应的人脸年龄之间的映射关系,最终预测精准性高,并且是端对端的模型,不需要复杂的图像归一化矫正。其缺点在于训练时间过长,需要较高的硬件配置要求,如GPU服务器等,并且对于小规模数据集的预测效果较差。参考文献:Z.Niu,M.Zhou,L.Wang,X.Gao,and G.Hua,Ordinal Regression with Multiple Output CNN forAge Estimation,IEEE Conference on Computer Vision and Pattern Recognition,pp.4920-4928,2016。
近年来,基于深度学习的人脸年龄估计方法在深度学习理论发展的基础上,有了新的突破。借助于深度网络的多样性,可以更好的拟合已有图像特征和对应的人脸年龄之间的映射关系,这种改进大大提高了基于浅层模型的方法的精确度和鲁棒性,深度网络在人脸年龄估计中还有很多值得挖掘改进的地方。显然在年龄估计任务的训练过程中,带有噪声的人脸图像(带有姿势、照明、表情、遮挡和错位等变化)对整个模型的影响是巨大的,但至今还未出现如何减轻这种影响的方法,本发明将围绕这个角度开展工作。
发明内容
本发明是一种基于噪声剔除的自步学习人脸年龄估计方法。该方法首先对人脸图像进行简单的矫正并归一化到224*224*3像素,由于人脸面部特征和年龄之间的关系是很复杂的,它们之间的映射不是一种均匀映射,人脸图像经常带有姿势、照明、表情、遮挡和错位等变化,所以将人脸图片划分为简单图片(预测年龄与实际年龄之间的绝对误差小)和困难图片(预测年龄与实际年龄之间的绝对误差大),在自步学习框架下,采取“从简单图片到困难图片”的策略去训练深度回归森林来建立人脸面部特征与目标年龄的非线性映射关系,同时本发明提出的cap()函数将会剔除训练样本中的噪声图像,从而去除噪声图像对模型的影响,最后由训练好的网络模型对实际人脸图像进行年龄估计。通过上述方法,充分利用了cap()函数、自步学习和深度回归森林,提高了现有方法的准确度和鲁棒性,算法示意图参见图1。
为了方便地描述本发明内容,首先对一些术语进行定义。
定义1:面部特征点。人为定义人面部的一些特殊点,例如嘴角点,眼角点等。
定义2:鲁棒性。是指控制系统在一定(结构,大小)的参数摄动下,维持其它某些性能的特性。
定义3:RGB图像。RGB图像是指色彩模式是RGB模型的图像。RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的。R、G、B即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色系统之一。
定义4:MTCNN。一种级联的卷积神经网络结构,将人脸检测和面部特征点检测同时进行。
定义5:归一化。利用面部特征点的相对位置以消除尺度,旋转变化对图像影响的方法。
定义6:决策树。是一种常见的机器学习模型,通过树的结构表示了对象属性与结果之间的一种映射关系。决策树是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,它代表的是对象属性与对象值之间的一种映射关系。
定义7:叶节点。一棵树当中没有子结点的结点称为叶节点。
定义8:分离节点。一棵树当中有子结点的结点称为分离节点。
定义9:VGG-16。VGG-16的结构图如图2所示,输入为224*224*3的图片,经过64个卷积核的两次卷积后,采用一次池化;之后又经过两次128的卷积核卷积之后,采用一次池化;再经过三次256的卷积核的卷积之后,采用池化;重复两次三个512的卷积核卷积之后再池化,最后经过三个全连接层。
定义10:Sigmoid函数。Sigmoid函数一般可以表示为σ(·),其表达式为
Figure BDA0002323947390000031
定义11:指示函数。若
Figure BDA0002323947390000032
为指示函数,则当
Figure BDA0002323947390000033
为真时,
Figure BDA0002323947390000034
Figure BDA0002323947390000035
为假时,
Figure BDA0002323947390000036
定义12:高斯分布。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量x,其概率密度函数满足
Figure BDA0002323947390000037
其中μ为正态分布的数学期望,σ2为正态分布的方差,则称其满足高斯分布,常记作
Figure BDA0002323947390000038
定义13:混合高斯模型。指将多个高斯分布子模型混合得到的结果。
定义14:梯度下降法。梯度下降法是一个最优化算法,为求解函数f(x)取极值时,自变量的取值可以迭代求解,即:
Figure BDA0002323947390000039
直到梯度值为零,得到解。
定义15:变分边界法。当损失函数的参数很难优化时,可以构建一组可微分的上边界去解决优化问题。
定义16:梯度。当函数y=f(x)的自变量x的维数为D时,梯度定义为
Figure BDA00023239473900000310
Figure BDA00023239473900000311
Figure BDA00023239473900000312
为函数f(x)关于变量xd的偏导数。
定义17:Jensen不等式。若f(x)是区间(a,b)上的凹函数,则对任意的x1,x2,x3,...,xn∈(a,b),且c1+c2+c3+…+cn=1,则有f(c1x1+c2x2+c3x3+…+cnxn)≤c1f(x1)+c2f(x2)+…+cnf(xn)。
定义18:自步学习。自步学习(SPL)在每次迭代过程中倾向于从所有样本中选择具有很小的训练误差、高似然值的样本,然后更新模型参数。每次迭代选择样本的数量由权重参数确定,该参数通过逐次衰减实现引入更多的样本,当所有样本已被选择或者代价函数无法再降低则停止迭代。SPL倾向于更鲁棒地探索数据,优势在于可以针对特定任务设计不同的自步正则项,用于表征和定义“简单”样本。
定义19:caffemodel模型。是一个数据集在Caffe深度学习框架下训练好后得到的一个模型。
定义20:二元自步正则。自步学习在传统机器学习目标函数中引入二分变量vi,用于表征每个样本是否被选择送入深度回归网络训练,隐变量vi只有0和1两个取值,0代表着该样本不被送入深度回归网络训练,1代表该图像被送入深度回归网络训练。
定义21:max函数。max(x,y):比较x和y的大小,返回x和y中较大的一个值。
本发明技术方案为一种基于噪声剔除的自步学习人脸年龄估计方法,该方法包括:
步骤1:对数据集进行预处理;
获取人脸数据集,并标定对应的实际年龄;再对所有的人脸图像利用MTCNN进行人脸检测、对齐,并根据人脸大小及位置将输入图像归一化为224*224*3大小的RGB图像;最后得到经过预处理后的带有年龄标签的人脸数据集图像;
步骤2:构建深度回归森林;
Figure BDA0002323947390000041
Figure BDA0002323947390000042
分别表示深度回归森林的输入和输出空间,η表示该卷积神经网络结构的参数信息,f(x;η)表示输入x经过该卷积神经网络后得到的特征值,
Figure BDA0002323947390000043
表示决策树,该决策树由叶节点
Figure BDA0002323947390000044
和分离节点
Figure BDA0002323947390000045
组成,σ是Sigmoid函数,
Figure BDA0002323947390000046
是索引函数,使函数f(x;η)的第
Figure BDA0002323947390000047
个输出与分离节点n对应,这个对应关系是随机获取的,gn(x;η)确定了样本x送入到该分离节点的左子树的概率,
Figure BDA0002323947390000048
为叶节点
Figure BDA0002323947390000049
在输出空间的高斯分布,其中
Figure BDA00023239473900000410
Figure BDA00023239473900000411
分别表示均值矩阵和协方差矩阵;
Figure BDA00023239473900000412
表示以分离节点n为根节点的树,nl和nr分别表示分离节点n的左右孩子,
Figure BDA00023239473900000413
Figure BDA00023239473900000414
分别表示以nl和nr为根节点的左右子树,
Figure BDA00023239473900000415
Figure BDA00023239473900000416
分别表示左右子树
Figure BDA00023239473900000417
Figure BDA00023239473900000418
的叶节点的集合;
1)分离节点函数gn(x;η):采用VGG-16结构作为深度回归森林的前端部分来提取特征;将卷积神经网络最后的全连接层输出的特征值通过一个sigmoid函数归一化到0~1之间,然后随机分配到各个树的分离节点上作为分裂概率gn(x;η),对于每一个分离节点
Figure BDA00023239473900000419
都有一个分离节点函数:
Figure BDA00023239473900000420
2)输入样本x被送到某一个叶节点
Figure BDA00023239473900000421
的概率
Figure BDA00023239473900000422
每张人脸图像在每棵树的分离节点处以分裂概率被划分到左右子树,最终落入叶节点中;再将人脸图像所经过路径上的各个概率相乘,得到了一个输入样本x被送到某一个叶节点
Figure BDA00023239473900000423
的概率为:
Figure BDA00023239473900000424
其中
Figure BDA0002323947390000051
表示指示函数,当
Figure BDA0002323947390000052
为真时,
Figure BDA0002323947390000053
Figure BDA0002323947390000054
为假时,
Figure BDA0002323947390000055
3)叶节点的高斯分布
Figure BDA0002323947390000056
落入到各个叶节点中的人脸图像对应的年龄数据符合不同的高斯分布
Figure BDA0002323947390000057
表示不同的年龄分布结构,N代表数据集中总的图像数量,对于每一个叶节点
Figure BDA0002323947390000058
在输出空间都拥有一个高斯分布的概率密度函数:
Figure BDA0002323947390000059
4)在决策树
Figure BDA00023239473900000510
下的条件概率函数
Figure BDA00023239473900000511
叶节点中的高斯分布与输入样本x被送到某一个叶节点
Figure BDA00023239473900000512
的概率
Figure BDA00023239473900000513
构成一个混合高斯模型的结构:
Figure BDA00023239473900000514
5)
Figure BDA00023239473900000515
Figure BDA00023239473900000516
表示为输入图片x基于该深度回归网络的估计年龄:决策树的输出由各个高斯分布与概率
Figure BDA00023239473900000517
加权得到,再对多棵决策树产生的结果进行平均得到最后的年龄估计
Figure BDA00023239473900000518
所以x和y之间的映射函数表示为:
Figure BDA00023239473900000519
6)训练过程:给定一个经过预处理后的人脸数据集图像
Figure BDA00023239473900000520
xi表示第i张图像,yi表示其对应的年龄标签,则深度回归森林的损失函数为:
Figure BDA00023239473900000521
①固定叶节点的参数p(即固定参数
Figure BDA00023239473900000522
Figure BDA00023239473900000523
),此时损失函数对CNN的参数η的偏导数为:
Figure BDA00023239473900000524
其中第一项为:
Figure BDA00023239473900000525
根据上面推导可知,通过梯度下降法学习参数η;
②固定CNN的参数η,去优化叶节点的参数p,令
Figure BDA00023239473900000526
然后通过变分边界法来解决这个优化问题;
在变分边界法中,原始目标函数被一系列迭代最小化的边界代替;为了得到
Figure BDA0002323947390000061
的上界,运用Jensen不等式得:
Figure BDA0002323947390000062
其中:
Figure BDA0002323947390000063
Figure BDA0002323947390000064
表示一定值,对于
Figure BDA0002323947390000065
有以下性质,能够满足Jensen不等式的条件:
Figure BDA0002323947390000066
Figure BDA0002323947390000067
定义:
Figure BDA0002323947390000068
所以
Figure BDA0002323947390000069
就成了
Figure BDA00023239473900000610
的上界,对于任何的p和
Figure BDA00023239473900000611
有如下性质:
Figure BDA00023239473900000612
Figure BDA0002323947390000071
这两条性质构成了满足变分边界法的条件;
Figure BDA0002323947390000072
是由均值矩阵
Figure BDA0002323947390000073
和协方差矩阵
Figure BDA0002323947390000074
这两部分参数构成,令μ和Σ表示由所有叶节点
Figure BDA0002323947390000075
控制这两个参数;固定Σ时,定义:
Figure BDA0002323947390000076
则有:
Figure BDA0002323947390000077
这说明了
Figure BDA0002323947390000078
也是
Figure BDA0002323947390000079
的一个上界,令μ(t)为μ第t次迭代的值,所以ψ(μ,μ(t))是
Figure BDA00023239473900000710
的一个上界;在下一次迭代中,选择使不等式
Figure BDA00023239473900000711
成立的μ值μ(t+1),这说明了
Figure BDA00023239473900000712
在确保
Figure BDA00023239473900000713
后,通过最小化
Figure BDA00023239473900000714
去代替最小化
Figure BDA00023239473900000715
则得:
Figure BDA00023239473900000716
ψ(μ,μ(t))关于
Figure BDA00023239473900000717
的偏导数为:
Figure BDA00023239473900000718
Figure BDA00023239473900000719
其中0表示零矢量或矩阵,可得:
Figure BDA00023239473900000720
同理,固定μ时,定义:
Figure BDA00023239473900000721
Figure BDA00023239473900000722
则得:
Figure BDA00023239473900000723
ξ(Σ,Σ(t))关于
Figure BDA00023239473900000724
的偏导数为:
Figure BDA0002323947390000081
Figure BDA0002323947390000082
得:
Figure BDA0002323947390000083
在得到
Figure BDA0002323947390000084
Figure BDA0002323947390000085
的更新规则后,在
Figure BDA0002323947390000086
上进行k-均值聚类,以获得叶节点
Figure BDA0002323947390000087
子集,Ii表示分配给yi的聚类值,根据聚类结果得到初始值
Figure BDA0002323947390000088
Figure BDA0002323947390000089
即:
Figure BDA00023239473900000810
Figure BDA00023239473900000811
通过变分边界法学习参数p;
两个学习步骤①和②交替执行,共同优化特征学习和年龄估计的模型,当达到规定迭代次数时停止迭代;
7)最后,数据集的平均绝对误差为:
Figure BDA00023239473900000812
其中
Figure BDA00023239473900000813
第i张人脸图片的预测年龄,yi是第i张人脸图片的实际年龄;
步骤3:将所有的经过步骤1后的训练图片根据步骤2训练;
假设共有N张训练图像,全都经过步骤1处理,随后将这N张训练图像输入步骤2中训练,将得到每张图像的绝对误差
Figure BDA00023239473900000814
按从小到大进行排序;
步骤4:基于噪声剔除的自步学习框架下的目标损失函数;
根据步骤3得到的绝对误差AE由小到大的顺序对训练集重新排列,
Figure BDA00023239473900000815
表示重新排序后的训练集,xi′表示第i张图像,yi′表示其对应的年龄标签,令
Figure BDA00023239473900000816
表示深度回归森林的损失函数,其中
Figure BDA00023239473900000817
表示对第i张的图像xi′的估计年龄,
则对第i张图像的损失函数Li()表示为:
Figure BDA0002323947390000091
则深度回归森林的损失函数L()表示为:
Figure BDA0002323947390000092
cap()表示基于剔除噪声样本的函数,∈为设定阈值:
Figure BDA0002323947390000093
则对第i张图像基于剔除噪声样本的深度回归森林的损失函数Li c()表示为:
Figure BDA0002323947390000094
由于噪声图像的损失函数也较大,则通过上式可以剔除损失函数大于设定阈值∈的一部分噪声图像,因此避免了噪声样本的干扰;
m()是二元自步正则项,参数λ控制每次加入网络训练的数量,m()表示为:
Figure BDA0002323947390000095
隐变量v只有0和1两个取值,0代表着该图像不被送入深度回归网络训练,1代表该图像被送入深度回归网络训练,则基于噪声剔除的自步学习框架下的目标损失函数为:
Figure BDA0002323947390000096
即是:
Figure BDA0002323947390000097
其中,对于Li<∈,有:
Figure BDA0002323947390000098
可得:
Figure BDA0002323947390000099
而对于Li≥∈,有:
Figure BDA00023239473900000910
可得:
vi=0
步骤5:根据步骤4得到的目标损失函数建立基于噪声剔除的自步学习人脸年龄估计模型;
步骤6:根据步骤3得到的重新排序后的数据集图像对步骤5得到的人脸年龄估计模型进行训练;
1)取训练集
Figure BDA0002323947390000101
中的前10%N数量的图像进行训练,得到一个caffemodel_1模型,再将剩余90%N的图像经过步骤3在caffemodel_1模型的基础上重新排序;
2)然后再取前10%N数量的图像与已取出的10%N数量的图像混合,一起在caffemodel_1模型的基础上进行训练,得到一个caffemodel_2模型,再将剩余80%N的图像经过步骤3在caffemodel_2的基础上重新排序;
3)然后再取前10%N数量的图像与已取出的20%N数量的图像混合,一起在caffemodel_2模型的基础上进行训练,得到一个caffemodel_3模型,再将剩余70%N的图像经过步骤3在caffemodel_3的基础上重新排序;
4)以此类推,直到80%N数量的图像送入训练,此时得到caffemodel_8模型,同时丢弃了训练集
Figure BDA0002323947390000102
中质量最差的20%N数量的噪声图像;
步骤7:根据最后训练好的caffemodol_8模型对实际人脸图像的年龄进行预测,完成人脸图像的年龄预测过程,同时去除了噪声图像的影响。
本发明的创新之处在于:
解决人脸年龄估计的关键是学习人脸面部特征和真实生物学年龄之间的非线性映射函数,由于人脸图像经常带有姿势、照明、表情、遮挡和错位等变化,所以将人脸图片划分为简单图片和困难图片,引入了自步学习,在自步学习框架下,采取“从简单图片到困难图片”的策略去训练深度回归森林来建立人脸面部特征与目标年龄的非线性映射关系,同时本发明提出的cap()函数将会剔除训练样本中的噪声图像,从而去除噪声图像对模型的影响,该方法充分利用了cap()函数、自步学习和深度回归森林,这保证了提取的面部特征具有强大的表示能力,并且可以一步一步地提高深度回归森林的学习鲁棒性。
附图说明
图1为本发明算法模型示意图。
图2为VGG-16结构示意图。
图3为本发明深度回归森林示意图。
图4为一颗树的具体结构示意图。
具体实施方式
本发明是基于噪声剔除的自步学习人脸年龄估计方法,它的实现包含以下步骤:
步骤1:对数据集进行预处理;
对Moprh II(http://www.faceaginggroup.com/morph/)人脸数据库利用MTCNN进行人脸特征点检测,得到5个面部特征点;根据得到的5个面部特征点定位结果对图像进行归一化到224*224*3的RGB图像;最后得到经过预处理后的带有年龄标签的55130张人脸图像。
步骤2:构建深度回归森林;
图3表示深度回归森林的大致结构,其中圆圈表示卷积神经网络最后的全连接层输出的特征值,矩形框表示各个树的分离节点,菱形框表示各个树的叶节点;
Figure BDA0002323947390000111
Figure BDA0002323947390000112
分别表示深度回归森林的输入和输出空间,η表示该卷积神经网络结构的参数信息,f(x;η)表示输入x经过该卷积神经网络后得到的特征值,
Figure BDA0002323947390000113
表示决策树,该决策树由叶节点
Figure BDA0002323947390000114
和分离节点
Figure BDA0002323947390000115
组成,σ是Sigmoid函数,
Figure BDA0002323947390000116
是索引函数,使函数f(x;η)的第
Figure BDA0002323947390000117
个输出与分离节点n对应,这个对应关系是随机获取的,gn(x;η)确定了样本x送入到该分离节点的左子树的概率,
Figure BDA0002323947390000118
为叶节点
Figure BDA0002323947390000119
在输出空间的高斯分布,其中
Figure BDA00023239473900001110
Figure BDA00023239473900001111
分别表示均值矩阵和协方差矩阵;如图4所示,
Figure BDA00023239473900001112
表示以分离节点n为根节点的树,nl和nr分别表示分离节点n的左右孩子,
Figure BDA00023239473900001113
Figure BDA00023239473900001114
分别表示以nl和nr为根节点的左右子树,
Figure BDA00023239473900001115
Figure BDA00023239473900001116
分别表示左右子树
Figure BDA00023239473900001117
Figure BDA00023239473900001118
的叶节点的集合;
1)分离节点函数gn(x;η):我们采用VGG-16结构作为深度回归森林的前端部分来提取特征;图3圆圈表示卷积神经网络最后的全连接层输出的特征值,将该特征值通过一个sigmoid函数归一化到0~1之间,然后随机分配到各个树的分离节点(图3矩形框)上作为分裂概率gn(x;η),对于每一个分离节点
Figure BDA00023239473900001119
都有一个分离节点函数:
Figure BDA00023239473900001120
2)输入样本x被送到某一个叶节点
Figure BDA00023239473900001121
的概率
Figure BDA00023239473900001122
每张人脸图像在每棵树的分离节点处以分裂概率被划分到左右子树,最终落入叶节点(图3菱形框)中;再将人脸图像所经过路径上的各个概率相乘,得到了一个输入样本x被送到某一个叶节点
Figure BDA00023239473900001123
的概率为:
Figure BDA00023239473900001124
其中
Figure BDA00023239473900001125
表示指示函数,当
Figure BDA00023239473900001126
为真时,
Figure BDA00023239473900001127
Figure BDA00023239473900001128
为假时,
Figure BDA00023239473900001129
3)叶节点的高斯分布
Figure BDA00023239473900001130
落入到各个叶节点中的人脸图像对应的年龄数据符合不同的高斯分布
Figure BDA00023239473900001131
表示不同的年龄分布结构,N代表数据集中总的图像数量,对于每一个叶节点
Figure BDA0002323947390000121
在输出空间都拥有一个高斯分布的概率密度函数:
Figure BDA0002323947390000122
4)在决策树
Figure BDA0002323947390000123
下的条件概率函数
Figure BDA0002323947390000124
叶节点中的高斯分布与输入样本x被送到某一个叶节点
Figure BDA0002323947390000125
的概率
Figure BDA0002323947390000126
构成一个混合高斯模型的结构:
Figure BDA0002323947390000127
5)
Figure BDA0002323947390000128
Figure BDA0002323947390000129
表示为输入图片x基于该深度回归网络的估计年龄:决策树的输出由各个高斯分布与概率
Figure BDA00023239473900001210
加权得到,再对多棵决策树产生的结果进行平均得到最后的年龄估计
Figure BDA00023239473900001211
所以x和y之间的映射函数表示为:
Figure BDA00023239473900001212
6)训练过程:给定经过预处理后的人脸数据集Morph II,令
Figure BDA00023239473900001213
xi表示第i张图像,yi表示其对应的年龄标签,N=55130,则深度回归森林的损失函数为:
Figure BDA00023239473900001214
①固定叶节点的参数p(即固定参数
Figure BDA00023239473900001215
Figure BDA00023239473900001216
,此时损失函数对CNN的参数η的偏导数为:
Figure BDA00023239473900001217
其中第一项为:
Figure BDA00023239473900001218
根据上面推导可知,参数η可以通过梯度下降法来学习;
②固定CNN的参数η,去优化叶节点的参数p,令
Figure BDA00023239473900001219
然后通过变分边界法来解决这个优化问题;
在变分边界法中,原始目标函数被一系列迭代最小化的边界代替;为了得到
Figure BDA00023239473900001220
的上界,运用Jensen不等式得:
Figure BDA0002323947390000131
其中:
Figure BDA0002323947390000132
Figure BDA0002323947390000133
表示一定值(即固定参数
Figure BDA0002323947390000134
Figure BDA0002323947390000135
),对于
Figure BDA0002323947390000136
有以下性质,能够满足Jensen不等式的条件:
Figure BDA0002323947390000137
Figure BDA0002323947390000138
定义:
Figure BDA0002323947390000139
所以
Figure BDA00023239473900001310
就成了
Figure BDA00023239473900001311
的上界,对于任何的p和
Figure BDA00023239473900001312
有如下性质:
Figure BDA00023239473900001313
Figure BDA00023239473900001314
这两条性质构成了满足变分边界法的条件;
Figure BDA0002323947390000141
是由均值矩阵
Figure BDA0002323947390000142
和协方差矩阵
Figure BDA0002323947390000143
这两部分参数构成,令μ和Σ表示由所有叶节点
Figure BDA0002323947390000144
控制这两个参数;固定Σ时,定义:
Figure BDA0002323947390000145
则有:
Figure BDA0002323947390000146
这说明了
Figure BDA0002323947390000147
也是
Figure BDA0002323947390000148
的一个上界,令μ(t)为μ第t次迭代的值,所以ψ(μ,μ(t))是
Figure BDA0002323947390000149
的一个上界;在下一次迭代中,选择使不等式
Figure BDA00023239473900001410
成立的μ值μ(t+1),这说明了
Figure BDA00023239473900001411
在确保
Figure BDA00023239473900001412
后,我们可以通过最小化
Figure BDA00023239473900001413
去代替最小化
Figure BDA00023239473900001414
则可得:
Figure BDA00023239473900001415
ψ(μ,μ(t))关于
Figure BDA00023239473900001416
的偏导数为:
Figure BDA00023239473900001417
Figure BDA00023239473900001418
其中0表示零矢量或矩阵,可得:
Figure BDA00023239473900001419
同理,固定μ时,定义:
Figure BDA00023239473900001420
Figure BDA00023239473900001421
则可得:
Figure BDA00023239473900001422
ξ(Σ,Σ(t))关于
Figure BDA00023239473900001423
的偏导数为:
Figure BDA0002323947390000151
Figure BDA0002323947390000152
可得:
Figure BDA0002323947390000153
在得到
Figure BDA0002323947390000154
Figure BDA0002323947390000155
的更新规则后,在
Figure BDA0002323947390000156
上进行k-均值聚类,以获得叶节点
Figure BDA0002323947390000157
子集,Ii表示分配给yi的聚类值,根据聚类结果得到初始值
Figure BDA0002323947390000158
Figure BDA0002323947390000159
即:
Figure BDA00023239473900001510
Figure BDA00023239473900001511
根据上面推导可知,参数p可以通过变分边界法来学习;
两个学习步骤①和②交替执行,并进行代码实现,本发明实在Caffe深度学习框架下实现的,实验平台使用的是GTX1080Ti,共同优化特征学习和年龄估计的模型,当达到规定迭代次数t=80000时停止迭代,训练时长约为16~18小时;
7)最后,数据集的平均绝对误差为:
Figure BDA00023239473900001512
其中
Figure BDA00023239473900001513
是第i张人脸图片的预测年龄,yi是第i张人脸图片的实际年龄;
步骤3:将所有的经过步骤1后的训练图片根据步骤2训练;
Morph II数据集共有N=55130张图像,全都经过步骤1处理,随后将这N张训练图像输入步骤2中训练,将得到每张图像的绝对误差
Figure BDA00023239473900001514
按从小到大进行排序;
步骤4:基于噪声剔除的自步学习框架下的目标损失函数;
根据步骤3得到的绝对误差AE由小到大的顺序对训练集重新排列,
Figure BDA00023239473900001515
表示重新排序后的训练集,xi′表示第i张图像,yi′表示其对应的年龄标签,令
Figure BDA00023239473900001516
表示深度回归森林的损失函数,其中
Figure BDA0002323947390000161
表示对第i张的图像xi′的估计年龄,
则对第i张图像的损失函数Li()表示为:
Figure BDA0002323947390000162
则深度回归森林的损失函数L()表示为:
Figure BDA0002323947390000163
为了剔除噪声样本,本发明提出基于剔除噪声样本的cap()函数,∈为设定阈值:
Figure BDA0002323947390000164
则对第i张图像基于剔除噪声样本的深度回归森林的损失函数Li c()表示为:
Figure BDA0002323947390000165
由于噪声图像的损失函数也较大,则通过上式可以剔除损失函数大于设定阈值∈的一部分噪声图像,因此避免了噪声样本的干扰。
m()是二元自步正则项,参数λ控制每次加入网络训练的数量,m()表示为:
Figure BDA0002323947390000166
隐变量v只有0和1两个取值,0代表着该图像不被送入深度回归网络训练,1代表该图像被送入深度回归网络训练,则基于噪声剔除的自步学习框架下的目标损失函数为:
Figure BDA0002323947390000167
即是:
Figure BDA0002323947390000168
其中,对于Li<∈,有:
Figure BDA0002323947390000169
可得:
Figure BDA00023239473900001610
而对于Li≥∈,有:
Figure BDA00023239473900001611
可得:
vi=0
步骤5:根据步骤4得到的目标损失函数建立基于噪声剔除的自步学习人脸年龄估计模型;
步骤6:根据步骤3得到的重新排序后的Morph II数据集图像对步骤5得到的人脸年龄估计模型进行训练;
1)取训练集
Figure BDA0002323947390000171
中的前10%N数量的图像进行训练,得到一个caffemodel_1模型,再将剩余90%N的图像经过步骤3在caffemodel_1模型的基础上重新排序;
2)然后再取前100%N数量的图像与已取出的10%N数量的图像混合,一起在caffemodel_1模型的基础上进行训练,得到一个caffemodel_2模型,再将剩余80%N的图像经过步骤3在caffemodel_2的基础上重新排序;
3)然后再取前10%N数量的图像与已取出的20%N数量的图像混合,一起在caffemodel_2模型的基础上进行训练,得到一个caffemodel_3模型,再将剩余70%N的图像经过步骤3在caffemodel_3的基础上重新排序;
4)以此类推,直到80%N数量的图像送入训练,此时得到caffemodel_8模型,同时丢弃了训练集
Figure BDA0002323947390000172
中质量最差的20%N数量的噪声图像。
步骤7:根据最后训练好的caffemodol_8模型对实际人脸图像的年龄进行预测,完成人脸图像的年龄预测过程,同时去除了噪声图像的影响。实验结果:得到的人脸年龄平均绝对误差值MAE=0.95,较之前基于数据集Morph II的最好人脸年龄平均绝对误差值1.97降低了约51.78%。具体的实验参数如下:
图片大小:224*224*3
训练批次大小:32
随机森林中树的数量:5
每棵树的深度:6
学习率:0.1
迭代次数:80000。

Claims (1)

1.一种基于噪声剔除的自步学习人脸年龄估计方法,该方法包括:
步骤1:对数据集进行预处理;
获取人脸数据集,并标定对应的实际年龄;再对所有的人脸图像利用MTCNN进行人脸检测、对齐,并根据人脸大小及位置将输入图像归一化为224*224*3大小的RGB图像;最后得到经过预处理后的带有年龄标签的人脸数据集图像;
步骤2:构建深度回归森林;
Figure FDA0003407415000000011
Figure FDA0003407415000000012
分别表示深度回归森林的输入和输出空间,η表示卷积神经网络结构的参数信息,f(x;η)表示输入x经过该卷积神经网络后得到的特征值,
Figure FDA0003407415000000013
表示决策树,该决策树由叶节点
Figure FDA0003407415000000014
和分离节点
Figure FDA0003407415000000015
组成,σ是Sigmoid函数,
Figure FDA0003407415000000016
是索引函数,使函数f(x;η)的第
Figure FDA0003407415000000017
个输出与分离节点n对应,这个对应关系是随机获取的,gn(x;η)确定了样本x送入到该分离节点的左子树的概率,pl(y)为叶节点
Figure FDA0003407415000000018
在输出空间的高斯分布,其中μl和Σl分别表示均值矩阵和协方差矩阵;
Figure FDA0003407415000000019
表示以分离节点n为根节点的树,nl和nr分别表示分离节点n的左右孩子,
Figure FDA00034074150000000110
Figure FDA00034074150000000111
分别表示以nl和nr为根节点的左右子树,
Figure FDA00034074150000000112
Figure FDA00034074150000000113
分别表示左右子树
Figure FDA00034074150000000114
Figure FDA00034074150000000115
的叶节点的集合;
1)分离节点函数gn(x;η):采用VGG-16结构作为深度回归森林的前端部分来提取特征;将卷积神经网络最后的全连接层输出的特征值通过一个sigmoid函数归一化到0~1之间,然后随机分配到各个树的分离节点上作为分裂概率gn(x;η),对于每一个分离节点
Figure FDA00034074150000000116
都有一个分离节点函数:
Figure FDA00034074150000000117
2)输入x被送到某一个叶节点l的概率w(l|x;η):每张人脸图像在每棵树的分离节点处以分裂概率被划分到左右子树,最终落入叶节点中;再将人脸图像所经过路径上的各个概率相乘,得到了一个输入x被送到某一个叶节点l的概率为:
Figure FDA00034074150000000118
其中
Figure FDA00034074150000000119
表示指示函数,当
Figure FDA00034074150000000120
为真时,
Figure FDA00034074150000000121
Figure FDA00034074150000000122
为假时,
Figure FDA00034074150000000123
3)叶节点的高斯分布pl(y):落入到各个叶节点中的人脸图像对应的年龄数据符合不同的高斯分布pl(y),表示不同的年龄分布结构,N代表数据集中总的图像数量,对于每一个叶节点
Figure FDA00034074150000000124
在输出空间都拥有一个高斯分布的概率密度函数:
Figure FDA0003407415000000021
4)在决策树
Figure FDA0003407415000000022
下的条件概率函数
Figure FDA0003407415000000023
叶节点中的高斯分布与输入x被送到某一个叶节点l的概率w(l|x;η)构成一个混合高斯模型的结构:
Figure FDA0003407415000000024
5)
Figure FDA0003407415000000025
Figure FDA0003407415000000026
表示为输入x基于该深度回归网络的估计年龄:决策树的输出由各个高斯分布与概率w(l|x;η)加权得到,再对多棵决策树产生的结果进行平均得到最后的年龄估计
Figure FDA0003407415000000027
所以x和y之间的映射函数表示为:
Figure FDA0003407415000000028
6)训练过程:给定一个经过预处理后的人脸数据集图像
Figure FDA0003407415000000029
xi表示第i张图像,yi表示其对应的年龄标签,则深度回归森林的损失函数为:
Figure FDA00034074150000000210
①固定叶节点的参数p(即固定参数μl和Σl),此时损失函数对CNN的参数η的偏导数为:
Figure FDA00034074150000000211
其中第一项为:
Figure FDA00034074150000000212
根据上面推导可知,通过梯度下降法学习参数η;
②固定CNN的参数η,去优化叶节点的参数p,令
Figure FDA00034074150000000213
然后通过变分边界法来解决这个优化问题;
在变分边界法中,原始目标函数被一系列迭代最小化的边界代替;为了得到
Figure FDA00034074150000000214
的上界,运用Jensen不等式得:
Figure FDA0003407415000000031
其中:
Figure FDA0003407415000000032
Figure FDA0003407415000000033
表示一定值,对于ζl(p;xi,yi)有以下性质,能够满足Jensen不等式的条件:
ζl(p;xi,yi)∈[0,1]
Figure FDA0003407415000000034
定义:
Figure FDA0003407415000000035
所以
Figure FDA0003407415000000036
就成了
Figure FDA0003407415000000037
的上界,对于任何的p和
Figure FDA0003407415000000038
有如下性质:
Figure FDA0003407415000000039
Figure FDA00034074150000000310
这两条性质构成了满足变分边界法的条件;pl(y)是由均值矩阵μl和协方差矩阵Σl这两部分参数构成,令μ和Σ表示由所有叶节点
Figure FDA00034074150000000311
控制这两个参数;固定Σ时,定义:
Figure FDA0003407415000000041
则有:
Figure FDA0003407415000000042
这说明
Figure FDA0003407415000000043
也是
Figure FDA0003407415000000044
的一个上界,令μ(t)为μ第t次迭代的值,所以ψ(μ,μ(t))是
Figure FDA0003407415000000045
的一个上界;在下一次迭代中,选择使不等式
Figure FDA0003407415000000046
成立的μ值μ(t+1),这说明了
Figure FDA0003407415000000047
在确保
Figure FDA0003407415000000048
后,通过最小化
Figure FDA0003407415000000049
去代替最小化
Figure FDA00034074150000000410
则得:
Figure FDA00034074150000000411
ψ(μ,μ(t))关于μl的偏导数为:
Figure FDA00034074150000000412
Figure FDA00034074150000000413
其中0表示零矢量或矩阵,可得:
Figure FDA00034074150000000414
同理,固定μ时,定义:
Figure FDA00034074150000000415
Figure FDA00034074150000000416
则得:
Figure FDA00034074150000000417
ξ(Σ,Σ(t))关于Σl的偏导数为:
Figure FDA0003407415000000051
Figure FDA0003407415000000052
得:
Figure FDA0003407415000000053
在得到μl和Σl的更新规则后,在
Figure FDA0003407415000000054
上进行k-均值聚类,以获得叶节点
Figure FDA0003407415000000055
子集,Ii表示分配给yi的聚类值,根据聚类结果得到初始值
Figure FDA0003407415000000056
Figure FDA0003407415000000057
即:
Figure FDA0003407415000000058
Figure FDA0003407415000000059
通过变分边界法学习参数p;
两个学习步骤①和②交替执行,共同优化特征学习和年龄估计的模型,当达到规定迭代次数时停止迭代;
7)最后,数据集的平均绝对误差为:
Figure FDA00034074150000000510
其中
Figure FDA00034074150000000511
是第i张人脸图片的预测年龄,yi是第i张人脸图片的实际年龄;
步骤3:将所有的经过步骤1后的训练图片根据步骤2训练;
假设共有N张训练图像,全都经过步骤1处理,随后将这N张训练图像输入步骤2中训练,将得到每张图像的绝对误差
Figure FDA00034074150000000512
按从小到大进行排序;
步骤4:基于噪声剔除的自步学习框架下的目标损失函数;
根据步骤3得到的绝对误差AE由小到大的顺序对训练集重新排列,
Figure FDA00034074150000000513
表示重新排序后的训练集,xi′表示第i张图像,yi′表示其对应的年龄标签,令
Figure FDA00034074150000000514
表示深度回归森林的损失函数,其中
Figure FDA00034074150000000515
表示对第i张的图像xi′的估计年龄,
则对第i张图像的损失函数Li()表示为:
Figure FDA0003407415000000061
则深度回归森林的损失函数L()表示为:
Figure FDA0003407415000000062
cap()表示基于剔除噪声样本的函数,∈为设定阈值:
Figure FDA0003407415000000063
则对第i张图像基于剔除噪声样本的深度回归森林的损失函数Li c()表示为:
Figure FDA0003407415000000064
由于噪声图像的损失函数也较大,则通过上式可以剔除损失函数大于设定阈值∈的一部分噪声图像,因此避免了噪声样本的干扰;
m()是二元自步正则项,参数λ控制每次加入网络训练的数量,m()表示为:
Figure FDA0003407415000000065
隐变量v只有0和1两个取值,0代表着该图像不被送入深度回归网络训练,1代表该图像被送入深度回归网络训练,则基于噪声剔除的自步学习框架下的目标损失函数为:
Figure FDA0003407415000000066
即是:
Figure FDA0003407415000000067
其中,对于Li<∈,有:
Figure FDA0003407415000000068
可得:
Figure FDA0003407415000000069
而对于Li≥∈,有:
Figure FDA00034074150000000610
可得:
vu=0
步骤5:根据步骤4得到的目标损失函数建立基于噪声剔除的自步学习人脸年龄估计模型;
步骤6:根据步骤3得到的重新排序后的数据集图像对步骤5得到的人脸年龄估计模型进行训练;
1)取训练集
Figure FDA0003407415000000071
中的前10%N数量的图像进行训练,得到一个caffemodel_1模型,再将剩余90%N的图像经过步骤3在caffemodel_1模型的基础上重新排序;
2)然后再取前10%N数量的图像与已取出的10%N数量的图像混合,一起在caffemodel_1模型的基础上进行训练,得到一个caffemodel_2模型,再将剩余80%N的图像经过步骤3在caffemodel_2的基础上重新排序;
3)然后再取前10%N数量的图像与已取出的20%N数量的图像混合,一起在caffemodel_2模型的基础上进行训练,得到一个caffemodel_3模型,再将剩余70%N的图像经过步骤3在caffemodel_3的基础上重新排序;
4)以此类推,直到80%N数量的图像送入训练,此时得到caffemodel_8模型,同时丢弃了训练集
Figure FDA0003407415000000072
中质量最差的20%N数量的噪声图像;
步骤7:根据最后训练好的caffemodol_8模型对实际人脸图像的年龄进行预测,完成人脸图像的年龄预测过程,同时去除了噪声图像的影响。
CN201911308841.8A 2019-12-18 2019-12-18 一种基于噪声剔除的自步学习人脸年龄估计方法 Active CN111160161B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911308841.8A CN111160161B (zh) 2019-12-18 2019-12-18 一种基于噪声剔除的自步学习人脸年龄估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911308841.8A CN111160161B (zh) 2019-12-18 2019-12-18 一种基于噪声剔除的自步学习人脸年龄估计方法

Publications (2)

Publication Number Publication Date
CN111160161A CN111160161A (zh) 2020-05-15
CN111160161B true CN111160161B (zh) 2022-03-15

Family

ID=70557624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911308841.8A Active CN111160161B (zh) 2019-12-18 2019-12-18 一种基于噪声剔除的自步学习人脸年龄估计方法

Country Status (1)

Country Link
CN (1) CN111160161B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111709305B (zh) * 2020-05-22 2023-08-11 东南大学 一种基于局部图像块的人脸年龄识别方法
CN112633515A (zh) * 2020-12-16 2021-04-09 上海眼控科技股份有限公司 基于样本剔除的模型训练方法及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273659A (zh) * 2017-05-17 2017-10-20 中国科学院光电技术研究所 一种基于ransac算法改进的用于空间碎片光电跟踪的轨迹预测方法
CN108985334A (zh) * 2018-06-15 2018-12-11 广州深域信息科技有限公司 基于自监督过程改进主动学习的通用物体检测系统及方法
CN109359677A (zh) * 2018-10-09 2019-02-19 中国石油大学(华东) 一种耐噪在线多分类核学习算法
CN110070541A (zh) * 2019-04-30 2019-07-30 合肥工业大学 一种适用于小样本数据的图像质量评价方法
CN110516537A (zh) * 2019-07-15 2019-11-29 电子科技大学 一种基于自步学习的人脸年龄估计方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10755082B2 (en) * 2016-10-25 2020-08-25 Deep North, Inc. Point to set similarity comparison and deep feature learning for visual recognition
JP7228510B2 (ja) * 2016-11-08 2023-02-24 ベクトン・ディキンソン・アンド・カンパニー 細胞標識分類の方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273659A (zh) * 2017-05-17 2017-10-20 中国科学院光电技术研究所 一种基于ransac算法改进的用于空间碎片光电跟踪的轨迹预测方法
CN108985334A (zh) * 2018-06-15 2018-12-11 广州深域信息科技有限公司 基于自监督过程改进主动学习的通用物体检测系统及方法
CN109359677A (zh) * 2018-10-09 2019-02-19 中国石油大学(华东) 一种耐噪在线多分类核学习算法
CN110070541A (zh) * 2019-04-30 2019-07-30 合肥工业大学 一种适用于小样本数据的图像质量评价方法
CN110516537A (zh) * 2019-07-15 2019-11-29 电子科技大学 一种基于自步学习的人脸年龄估计方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《Self:Learning to Filter Noisy Labels With Self-Ensembling》;Duc TN et al;《arXiv.org》;20191004;全文 *
《标签噪声的集成学习研究》;苑成成;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170315;全文 *

Also Published As

Publication number Publication date
CN111160161A (zh) 2020-05-15

Similar Documents

Publication Publication Date Title
CN110516537B (zh) 一种基于自步学习的人脸年龄估计方法
CN110458844B (zh) 一种低光照场景的语义分割方法
CN107203753B (zh) 一种基于模糊神经网络和图模型推理的动作识别方法
CN108171209B (zh) 一种基于卷积神经网络进行度量学习的人脸年龄估计方法
Liu et al. Multi-objective convolutional learning for face labeling
CN105069400B (zh) 基于栈式稀疏自编码的人脸图像性别识别系统
CN107590432A (zh) 一种基于循环三维卷积神经网络的手势识别方法
CN113076994B (zh) 一种开集域自适应图像分类方法及系统
CN105631398A (zh) 识别对象的方法和设备以及训练识别器的方法和设备
CN108446676B (zh) 基于有序编码及多层随机投影的人脸图像年龄判别方法
CN112784929B (zh) 一种基于双元组扩充的小样本图像分类方法及装置
CN109033978B (zh) 一种基于纠错策略的cnn-svm混合模型手势识别方法
CN113111979B (zh) 模型训练方法、图像检测方法及检测装置
US11093800B2 (en) Method and device for identifying object and computer readable storage medium
CN112395442A (zh) 移动互联网上的低俗图片自动识别与内容过滤方法
López-Rubio Probabilistic self-organizing maps for continuous data
CN111160161B (zh) 一种基于噪声剔除的自步学习人脸年龄估计方法
CN110046544A (zh) 基于卷积神经网络的数字手势识别方法
CN116740384B (zh) 洗地机的智能控制方法及系统
CN110516512B (zh) 行人属性分析模型的训练方法、行人属性识别方法及装置
CN113743474A (zh) 基于协同半监督卷积神经网络的数字图片分类方法与系统
CN112418032A (zh) 一种人体行为识别方法、装置、电子设备及存储介质
CN115115828A (zh) 数据处理方法、装置、程序产品、计算机设备和介质
CN107993311B (zh) 一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法
CN109145749B (zh) 一种跨数据集的面部表情识别模型构建及识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant