CN108399379B - 用于识别面部年龄的方法、装置和电子设备 - Google Patents

用于识别面部年龄的方法、装置和电子设备 Download PDF

Info

Publication number
CN108399379B
CN108399379B CN201810136268.6A CN201810136268A CN108399379B CN 108399379 B CN108399379 B CN 108399379B CN 201810136268 A CN201810136268 A CN 201810136268A CN 108399379 B CN108399379 B CN 108399379B
Authority
CN
China
Prior art keywords
age
probability distribution
face
image
facial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810136268.6A
Other languages
English (en)
Other versions
CN108399379A (zh
Inventor
张韵璇
李�诚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sensetime Technology Development Co Ltd
Original Assignee
Beijing Sensetime Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sensetime Technology Development Co Ltd filed Critical Beijing Sensetime Technology Development Co Ltd
Priority to PCT/CN2018/098665 priority Critical patent/WO2019029459A1/zh
Publication of CN108399379A publication Critical patent/CN108399379A/zh
Priority to US16/236,292 priority patent/US11003890B2/en
Application granted granted Critical
Publication of CN108399379B publication Critical patent/CN108399379B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24143Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Abstract

本申请实施方式公开了一种用于识别面部年龄的方法、装置、电子设备以及计算机可读介质,其中的方法包括:获取待识别图像的预估年龄;根据所述预估年龄以及预先设定的两个或者以上年龄差距从已知年龄的图像样本集合中选取N幅图像样本,所述N不小于2;获取所述待识别图像与选取的所述N幅图像样本之间的年龄大小比较结果;根据所述比较结果形成的统计信息获得用于确定人的面部年龄属性信息的概率信息。

Description

用于识别面部年龄的方法、装置和电子设备
技术领域
本申请涉及计算机视觉技术,尤其是一种用于识别面部年龄的方法、介质、用于识别面部年龄的装置以及电子设备。
背景技术
人脸属性信息识别即识别图像中的人的面部所呈现出的性别、年龄、表情以及种族等信息。
人脸属性信息识别是计算机视觉领域的一个研究课题,而识别图像中的面部年龄是人脸属性信息识别中的一个重要分支。
目前,用于识别面部年龄的网络模型,通常是采用深度学习的方式根据额头、嘴角以及眼角的皱纹等面部特征来识别面部年龄。在对网络模型进行训练时,用于训练的图像大多需要进行预处理,以便于使用于训练的图像所包含的人脸通常为正脸且五官清晰。
然而,在现实环境中,很多图像中的人脸会存在各种角度的偏转,且图像中的人脸也会存在各种不同程度的模糊,由于上述网络模型通常不能很好的适用于针对这样的图像进行面部年龄识别,因此,在很多情况下需要通过相关人员(如标注人员等)的人为判断,来识别出图像中的面部年龄。
由此可知,如何快速且准确的识别出图像中的面部年龄是一个值得关注的技术问题。
发明内容
本申请实施方式提供一种用于识别面部年龄的技术方案。
根据本申请实施方式的其中一个方面,提供了一种用于识别面部年龄的方法,该方法包括:获取待识别图像的预估年龄;根据所述预估年龄以及预先设定的两个或者以上年龄差距,从已知年龄的图像样本集合中选取N幅图像样本,所述N不小于2;获取所述待识别图像与选取的所述N幅图像样本之间的年龄大小比较结果;根据所述比较结果形成的统计信息获得用于确定人的面部年龄属性信息的概率信息。
在本发明一个实施方式中,所述根据所述比较结果形成的统计信息获得用于确定人的面部年龄属性信息的概率信息包括:根据预设的面部年龄的第一先验概率分布和基于所述比较结果形成的第一似然函数获得面部年龄的第一后验概率分布;其中,所述面部年龄后验概率分布用于确定人的面部年龄属性信息。
在本发明又一个实施方式中,所述获取待识别图像的预估年龄包括:
将所述待识别图像输入神经网络模型,根据所述神经网络模型的输出信息确定待识别图像的预估年龄。
在本发明再一个实施方式中,所述神经网络模型的输出信息包括:面部年龄的第二后验概率分布。
在本发明再一个实施方式中,所述神经网络模型针对输入的待识别图像所执行的处理操作包括:获取待识别图像中的人的面部特征;针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率,且所有概率形成第二似然函数的似然值;根据预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数生成面部年龄的第二后验概率分布。
在本发明再一个实施方式中,所述针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率包括:针对预先设定的每一个年龄类别,利用第一全连接层对所述面部特征进行分类处理;利用sigmoid函数将所述分类处理结果进行归一化处理,获得所述面部特征属于超过该年龄类别的面部特征的概率。
在本发明再一个实施方式中,所述根据预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数生成面部年龄的第二后验概率分布包括:根据贝叶斯公式对预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数进行计算,以生成所述面部年龄的第二后验概率分布。
在本发明再一个实施方式中,所述根据贝叶斯公式对预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数进行计算,以生成所述面部年龄的第二后验概率分布包括:利用第二全连接层基于取对数后的贝叶斯公式对预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数进行计算;利用softmax函数将所述第二全连接层输出的计算结果还原为面部年龄的第二后验概率分布。
在本发明再一个实施方式中,所述根据所述神经网络模型的输出信息确定待识别图像的预估年龄包括:确定所述面部年龄的第二后验概率分布的中位数,并将所述中位数作为预估年龄;或者,针对所述面部年龄的第二后验概率分布进行加权计算,并根据所述加权计算结果确定预估年龄;或者,将所述面部年龄的第二后验概率分布中的最大概率对应的年龄作为预估年龄;或者,针对所述面部年龄的第二后验概率分布进行置信度计算,并根据所述置信度计算结果确定年龄区间,从所述年龄区间中选取一年龄作为预估年龄。
在本发明再一个实施方式中,所述神经网络模型的训练过程包括:根据输入图像样本的已知面部年龄以及预先设定的两个或者以上年龄差距从图像样本集合中选取已知面部年龄的M幅图像样本,所述M不小于2;获取所述输入图像样本与选取的M幅图像样本之间的年龄大小比较结果;根据预设的面部年龄的第二先验概率分布和基于所述比较结果形成的第三似然函数获得面部年龄的第三后验概率分布;根据所述面部年龄的第三后验概率分布对神经网络模型进行监督学习。
在本发明再一个实施方式中,所述训练过程还包括:根据所述输入图像样本的已知面部年龄对神经网络模型进行监督学习。
在本发明再一个实施方式中,所述N幅图像样本包括:年龄大于预测年龄的N1幅图像样本以及年龄小于预估年龄的N2幅图像样本,其中,所述N1与N2之和为N。
在本发明再一个实施方式中,所述N为偶数时,所述N1与N2相等,且针对年龄大于预估年龄的N1幅图像样本中的任一幅图像样本,年龄小于预估年龄的N2幅图像样本中存在年龄差距相同且年龄差距相反的一幅图像样本。
在本发明再一个实施方式中,所述获取所述待识别图像与选取的所述N幅图像样本之间的年龄大小比较结果包括:通过接收输入信息的形式获获取所述待识别图像与选取的所述N幅图像样本之间的年龄大小比较结果;其中,所述输入信息包括:人工针对所述待识别图像与选取的所述N幅图像样本之间的年龄大小进行比较而形成比较结果。
在本发明再一个实施方式中,所述根据预设的面部年龄的第一先验概率分布和基于所述比较结果形成的第一似然函数获得面部年龄的第一后验概率分布包括:根据贝叶斯公式对预设的面部年龄的第一先验概率分布以及基于所述比较结果形成的第一似然函数进行计算,生成所述面部年龄的第一后验概率分布。
在本发明再一个实施方式中,所述面部年龄的第一先验概率分布包括:针对预先设定的每一个年龄类别的均匀概率分布。
在本发明再一个实施方式中,所述方法还包括:滤除无效的面部年龄的第一后验概率分布;其中,所述无效的面部年龄的第一后验概率分布包括:形成开口向下的抛物线形状的面部年龄的第一后验概率分布。
在本发明再一个实施方式中,所述方法还包括:根据面部年龄的第一后验概率分布确定人的面部年龄属性信息;根据所述面部年龄属性信息标注所述待识别图像的年龄属性信息。
在本发明再一个实施方式中,所述根据面部年龄的第一后验概率分布确定人的面部年龄属性信息包括:确定所述面部年龄的第一后验概率分布的中位数,并将所述中位数作为所述待识别图像的面部年龄;或者,针对所述面部年龄的第一后验概率分布进行加权计算,并根据所述加权计算结果确定所述待识别图像的面部年龄;或者,将所述面部年龄的第一后验概率分布中的最大概率对应的年龄作为所述待识别图像的面部年龄;或者,针对所述面部年龄的第二后验概率分布进行置信度计算,并根据所述置信度计算结果确定所述待识别图像的面部年龄所属的年龄区间。
在本发明再一个实施方式中,所述第一似然函数和/或第二似然函数的斜率为0.1-0.6之间的数值。
根据本申请实施方式的其中另一个方面,提供了一种用于识别面部年龄的方法,所述方法由神经网络模型执行,且所述神经网络模型所执行的处理操作包括:获取待识别图像中的人的面部特征;针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率,且所有概率形成第二似然函数的似然值;根据预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数生成面部年龄的第二后验概率分布。
在本发明一个实施方式中,所述针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率包括:针对预先设定的每一个年龄类别,利用第一全连接层对所述面部特征进行分类处理;利用sigmoid函数将所述分类处理结果进行归一化处理,获得所述面部特征属于超过该年龄类别的面部特征的概率。
在本发明又一个实施方式中,所述根据预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数生成面部年龄的第二后验概率分布包括:根据贝叶斯公式对预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数进行计算,以生成所述面部年龄的第二后验概率分布。
在本发明再一个实施方式中,所述根据贝叶斯公式对预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数进行计算,以生成所述面部年龄的第二后验概率分布包括:利用第二全连接层基于取对数后的贝叶斯公式对预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数进行计算;利用softmax函数将所述第二全连接层输出的计算结果还原为面部年龄的第二后验概率分布。
在本发明再一个实施方式中,所述神经网络模型的训练过程包括:根据输入图像样本的已知面部年龄以及预先设定的两个或者以上年龄差距从图像样本集合中选取已知面部年龄的M幅图像样本,所述M不小于2;获取所述输入图像样本与选取的M幅图像样本之间的年龄大小比较结果;根据预设的面部年龄的第二先验概率分布和基于所述比较结果形成的第三似然函数获得面部年龄的第三后验概率分布;根据所述面部年龄的第三后验概率分布对神经网络模型进行监督学习。
在本发明再一个实施方式中,所述训练过程还包括:滤除无效的面部年龄的第三后验概率分布;且所述根据所述面部年龄的第三后验概率分布对神经网络模型进行监督学习包括:根据滤除后的面部年龄的第三后验概率分布对神经网络模型进行监督学习;其中,所述无效的面部年龄的第三后验概率分布包括:形成开口向下的抛物线形状的面部年龄的第三后验概率分布。
在本发明再一个实施方式中,所述训练过程还包括:根据所述输入图像样本的已知面部年龄对神经网络模型进行监督学习。
根据本申请实施方式的其中另一个方面,提供了一种用于识别面部年龄的装置,且该装置包括:获取预估年龄模块,用于获取待识别图像的预估年龄;选取图像样本模块,用于根据所述预估年龄以及预先设定的两个或者以上年龄差距从已知年龄的图像样本集合中选取N幅图像样本,所述N不小于2;获取比较结果模块,用于获取所述待识别图像与选取的所述N幅图像样本之间的年龄大小比较结果;生成概率信息模块,用于根据所述比较结果形成的统计信息获得用于确定人的面部年龄属性信息的概率信息。
在本发明一个实施方式中,所述生成概率信息模块具体用于,根据预设的面部年龄的第一先验概率分布和基于所述比较结果形成的第一似然函数获得面部年龄的第一后验概率分布;其中,所述面部年龄后验概率分布用于确定人的面部年龄属性信息。
在本发明又一个实施方式中,所述装置还包括:第一滤除模块,用于滤除无效的面部年龄的第一后验概率分布;其中,所述无效的面部年龄的第一后验概率分布包括:形成开口向下的抛物线形状的面部年龄的第一后验概率分布。
在本发明再一个实施方式中,所述装置还包括:确定年龄属性模块,用于根据面部年龄的第一后验概率分布确定人的面部年龄属性信息;标注模块,用于根据所述面部年龄属性信息标注所述待识别图像的年龄属性信息。
根据本申请实施方式的其中另一个方面,提供了一种用于识别面部年龄的装置,所述装置用于实现神经网络模型,且所述装置包括:获取面部特征模块,用于获取待识别图像中的人的面部特征;判断概率模块,用于针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率,且所有概率形成第二似然函数的似然值;形成后验概率分布模块,用于根据预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数生成面部年龄的第二后验概率分布。
在本发明一个实施方式中,所述装置还包括:训练模块,用于:根据输入图像样本的已知面部年龄以及预先设定的两个或者以上年龄差距从图像样本集合中选取已知面部年龄的M幅图像样本,所述M不小于2;获取所述输入图像样本与选取的M幅图像样本之间的年龄大小比较结果;根据预设的面部年龄的第二先验概率分布和基于所述比较结果形成的第三似然函数获得面部年龄的第三后验概率分布;根据所述面部年龄的第三后验概率分布对神经网络模型进行监督学习。
在本发明又一个实施方式中,所述装置还包括:第二滤除模块,用于滤除无效的面部年龄的第三后验概率分布;且所述训练模块根据滤除后的面部年龄的第三后验概率分布对神经网络模型进行监督学习;其中,所述无效的面部年龄的第三后验概率分布包括:形成开口向下的抛物线形状的面部年龄的第三后验概率分布。
根据本申请实施方式的其中另一个方面,提供了一种电子设备,该电子设备包括:存储器,用于存储计算机程序;处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,下述指令被运行:用于获取待识别图像的预估年龄的指令;用于根据所述预估年龄以及预先设定的两个或者以上年龄差距从已知年龄的图像样本集合中选取N幅图像样本的指令,所述N不小于2;用于获取所述待识别图像与选取的所述N幅图像样本之间的年龄大小比较结果的指令;用于根据所述比较结果形成的统计信息获得用于确定人的面部年龄属性信息的概率信息的指令。
在本发明一个实施方式中,所述用于根据所述比较结果形成的统计信息获得用于确定人的面部年龄属性信息的概率信息的指令包括:用于根据预设的面部年龄的第一先验概率分布和基于所述比较结果形成的第一似然函数获得面部年龄的第一后验概率分布的指令;其中,所述面部年龄后验概率分布用于确定人的面部年龄属性信息。
在本发明又一个实施方式中,被运行的指令还包括:用于滤除无效的面部年龄的第一后验概率分布的指令;其中,所述无效的面部年龄的第一后验概率分布包括:形成开口向下的抛物线形状的面部年龄的第一后验概率分布。
在本发明再一个实施方式中,被运行的指令还包括:用于根据面部年龄的第一后验概率分布确定人的面部年龄属性信息的指令;以及,用于根据所述面部年龄属性信息标注所述待识别图像的年龄属性信息的指令。
根据本申请实施方式的其中另一个方面,提供了一种电子设备,该电子设备包括:存储器,用于存储计算机程序;处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,下述指令被神经网络模型执行:用于获取待识别图像中的人的面部特征的指令;用于针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率的指令,且所有概率形成第二似然函数的似然值;用于根据预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数生成面部年龄的第二后验概率分布的指令。
在本发明一个实施方式中,所述计算机程序被执行时,还执行用于训练神经网络模型的指令,且所述用于训练神经网络模型的指令包括:用于根据输入图像样本的已知面部年龄以及预先设定的两个或者以上年龄差距从图像样本集合中选取已知面部年龄的M幅图像样本的指令,所述M不小于2;用于获取所述输入图像样本与选取的M幅图像样本之间的年龄大小比较结果的指令;用于根据预设的面部年龄的第二先验概率分布和基于所述比较结果形成的第三似然函数获得面部年龄的第三后验概率分布的指令;用于根据所述面部年龄的第三后验概率分布对神经网络模型进行监督学习的指令。
在本发明一个实施方式中,所述计算机程序被执行时,还执行:用于滤除基于所述比较结果形成的无效的第三似然函数的指令;所述用于根据所述面部年龄的第三后验概率分布对神经网络模型进行监督学习的指令具体为:用于根据滤除后的面部年龄的第三后验概率分布对神经网络模型进行监督学习的指令;其中,所述无效的第三似然函数包括:形成开口向下的抛物线形状的第三似然函数。
根据本申请实施方式的其中另一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法。
基于本申请提供的用于识别面部年龄的方法、用于识别面部年龄的装置、电子设备以及计算机存储介质,本申请通过利用待识别图像(如待标注的图像)的预估年龄来选取与该预估年龄具有一定年龄差距的图像样本,并获取待识别图像与各图像样本之间的年龄大小比较结果,由于根据年龄大小比较结果所形成的统计信息是客观统计的结果,因此,利用该统计信息能够客观合理的推断出面部年龄属性信息;更具体而言,年龄大小比较结果以及待识别图像的预估年龄与选取出的图像样本之间的年龄差距符合似然函数(例如,logistic函数),因此,本申请可以利用年龄大小比较结果形成似然函数,从而本申请可以利用全概率公式使似然函数和面部年龄先验概率分布形成面部年龄后验概率分布;进而本申请可以基于面部年龄后验概率分布客观合理的推断出待识别图像中的人的面部年龄或者面部年龄所属的年龄段等面部年龄属性信息。
下面通过附图和实施方式,对本申请的技术方案做进一步的详细描述。
附图说明
构成说明书的一部分的附图描述了本申请的实施方式,并且连同描述一起用于解释本申请的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本申请,其中:
图1为本申请的一个应用场景示意图;
图2为本发明的另一个应用场景示意图;
图3为人为识别图像中的人的面部年龄的识别结果统计图;
图4为实现本申请实施方式的一示例性设备的框图;
图5为本申请方法一个实施方式的流程图;
图6为本申请方法另一个实施方式的流程图;
图7为本申请的生成面部年龄的第一后验概率分布的示意图;
图8为本申请的各待识别图像的面部年龄的第一后验概率分布示意图;
图9为本申请的神经网络模型的示意图;
图10为本申请的两个图像样本各自对应的似然函数和面部年龄后验概率分布的示意图;
图11为本申请装置一个实施方式的结构示意图;
图12为本申请装置另一个实施方式的结构示意图。
具体实施方式
现在将参照附图来详细描述本申请的各种示例性实施方式。应该注意到:除非另外具体说明,否则在这些实施方式中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施方式的描述实际上仅仅是说明性的,决不作为对本申请及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本申请实施方式可以应用于计算机系统/服务器,其可与众多其它通用或者专用计算系统环境或配置一起操作。适于与计算机系统/服务器一起使用的众所周知的计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
计算机系统/服务器可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑以及数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或者远程计算系统存储介质上。
首先参考图1,示意性地示出了根据本申请实施方式的可以在其中实现的一个应用场景。
图1中,图像1、图像2、......以及图像Z均为图像集合中的年龄未知的图像,且图像1、图像2、......以及图像Z均为包含有人脸的图像,图像中的人脸可能为正脸,也可能存在各种角度的偏转,另外,图像中的人脸的清晰程度也存在一定的差异。标注人员100需要对图像1、图像2、......以及图像Z分别进行面部年龄标注,从而使图像集合中的图像1、图像2、......以及图像Z分别为标注有面部年龄信息的图像,例如,标注人员为图像1标注的面部年龄为Y1,为图像2标注的面部年龄为Y2,......,为图像Z标注的面部年龄为Yz。
其次参考图2,示意性地示出了根据本申请实施方式的可以在其中实现的另一个应用场景。
图2中,图像1、图像2、......以及图像Z均为图像集合中的年龄未知的图像,且图像1、图像2、......以及图像Z均为包含有人脸的图像,图像中的人脸可能为正脸,也可能存在各种角度的偏转,另外,图像中的人脸的清晰程度也存在一定的差异。通过预先训练好的神经网络模型200可以实现针对图像1、图像2、......以及图像Z的面部年龄预测,即根据神经网络模型200的输出信息预测出图像1、图像2、......以及图像Z分别对应的面部年龄,例如,将图像1、图像2、......以及图像Z分别输入神经网络模型200,通过对神经网络模型200输出的信息进行处理,可以获得图像1对应的预测面部年龄Y11、图像2对应的预测面部年龄Y22、......以及图像Z对应的预测面部年龄Yzz。
然而,本领域技术人员完全可以理解,本申请实施方式的适用场景不受到该框架任何方面的限制。
如果向任意一位志愿者出示一副包含有人的面部的图像,让其判断图像中的人的面部年龄(即面部所展现出的年龄,且人的面部年龄也可以简称为人的年龄),则志愿者通常会通过额头、嘴角以及眼角的皱纹等面部特征来判断面部年龄。尽管可以用于判断面部年龄的细节有很多,但是,针对面部细节的主观猜测,外加上图像质量的限制等因素,往往会导致志愿者估计出的面部年龄与真实的面部年龄相差较大;而且,不同志愿者估计出的面部年龄有时也会存在较大差异。
一个实际的用户调查,预先从图像样本集合中选取出1000副包含有人的面部的图像,且每一幅图像都标注有真实的面部年龄,即图像中的人的真实年龄是已知的,请30位志愿者做如下两个实验:
实验a、请30位志愿者直接估计1000幅图像中人的面部年龄,并将各位志愿者分别估计的面部年龄与图像的真实面部年龄的差距利用如图3所示的二维坐标图体现。在图3所示的二维坐标图中,横坐标表示针对图像标注的真实年龄,纵坐标表示志愿者估计的面部年龄。
由图3可以看出,志愿者直接估计出的年龄与真实年龄存在一定的差距,且有的差距会达到20-30岁。
如果利用实验a的方式对图像样本集合中的图像进行面部年龄标注,则图像样本集合中的图像的标注信息的可信度会受到较大的挑战;而如果利用实验a的方式进行年龄预测,则预测的准确度会受到较大的挑战。
实验b、每次从1000幅图像中每次随机选取出两幅图像,请30位志愿者判断两幅图像中哪一幅图像中的人的面部年龄更大/更小。对所有志愿者的比较结果进行总结可以得出:在两幅图像的真实年龄相差越大的情况下,志愿者的判断准确率也就越高,且针对比较结果进行进一步的数据挖掘处理可以得出:志愿者的判断准确率与两幅图像中的人的年龄差之间的函数关系满足logistic(逻辑)函数,例如,图4中的曲线为logistic函数的曲线,而图4中的圆点为根据志愿者的判断结果而形成的离散点,根据所有的离散点可以拟合出logistic函数,即似然函数。
本申请提供的用于识别面部年龄的技术方案,通过利用待识别图像(如待标注的图像)的预估年龄,来选取与该预估年龄具有一定年龄差距的图像样本,并获取待识别图像与各图像样本之间的年龄大小比较结果,由于年龄大小比较结果以及待识别图像的预估年龄与选取出的图像样本之间的年龄差距符合似然函数(例如,logistic函数),因此,本申请的年龄大小比较结果可以形成似然函数,从而本申请可以利用全概率公式使似然函数和面部年龄先验概率分布形成面部年龄后验概率分布;进而本申请可以基于面部年龄后验概率分布客观合理的推断出待识别图像中的人的面部年龄或者面部年龄所属的年龄段等面部年龄属性信息。
如果利用这样的面部年龄属性信息对图像样本集合中的图像进行面部年龄标注,一方面由于相对于要求标注人员直接估计出图像中的人的面部年龄而言,标注人员判断两幅图像中哪一幅图像中的人的面部年龄更老/更年轻所需要的时间往往会更少,另一方面,由于相对于要求标注人员直接估计出图像中的人的面部年龄而言,标注人员判断两幅图像中哪一幅图像中的人的面部年龄更大/更小的结果往往会更准确,因此,本申请有利于提高标注的效率,并有利于提高图像样本集合中的图像的标注信息的可信度。
另外,本申请可以利用神经网络模型来获取待识别图像中的人的面部特征,并针对预先设定的每一个年龄(例如,1-70岁中的每一整数年龄,再例如,1-100岁中的每一整数年龄等)类别,来判断该面部特征属于超过该年龄类别的面部特征的概率,则神经网络模型可以使其获得的概率形成似然函数,进而神经网络模型可以利用预先设置的面部年龄先验概率分布以及上述似然函数生成面部年龄后验概率分布;如果利用这样的面部年龄后验概率分布来确定待识别图像中的人的面部年龄,则可以实现基于神经网络模型的年龄预估,并有利于提高年龄预估的准确度;进一步的,如果利用基于神经网络模型确定出的面部年龄作为上述标注过程中的预估年龄,则由于基于神经网络模型而确定出的面部年龄往往会更准确,因此,从图像样本集合中选取出的与待识别图像具有一定年龄差距的图像样本往往会更贴近客观情况,从而有利于进一步提高图像样本集合中的图像的标注信息的可信度。
示例性设备
图5示出了适于实现本申请的示例性设备500,设备500可以是移动终端(例如,智能移动电话等)、个人计算机(PC,例如,台式计算机或者笔记型计算机等)、平板电脑以及服务器等。图5中,设备500包括一个或者多个处理器、通信部等,所述一个或者多个处理器可以为:一个或者多个中央处理单元(CPU)501,和/或,一个或者多个图像处理器(GPU)513等,处理器可以根据存储在只读存储器(ROM)502中的可执行指令或者从存储部分508加载到随机访问存储器(RAM)503中的可执行指令而执行各种适当的动作和处理。通信部512可以包括但不限于网卡,所述网卡可以包括但不限于IB(Infiniband)网卡。处理器可与只读存储器502和/或随机访问存储器530中通信以执行可执行指令,通过总线504与通信部512相连、并经通信部512与其他目标设备通信,从而完成本申请中的相应步骤。在一个可选的示例中,处理器所执行的步骤包括:获取待识别图像的预估年龄;根据预估年龄以及预先设定的两个或者以上年龄差距从已知年龄的图像样本集合中选取N幅图像样本,其中的N不小于2;获取待识别图像与选取的各图像样本之间的年龄大小比较结果;根据预设的面部年龄的第一先验概率分布和基于比较结果形成的第一似然函数获得面部年龄的第一后验概率分布;其中,面部年龄的第一后验概率分布用于确定人的面部年龄属性信息。在另一个可选的示例中,处理器通过神经网络模型针对输入的待识别图像执行相应的处理操作,该处理操作包括:获取待识别图像中的人的面部特征;针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率,且所有概率形成似然函数的似然值;根据预设的面部年龄的第二先验概率分布以及基于似然值形成的第二似然函数生成面部年龄的第二后验概率分布。本申请中的面部年龄的第一先验概率分布可以指在看到待识别图像之前,根据先验知识而预先设置的面部年龄属于各年龄类别的概率值。
此外,在RAM 503中,还可以存储有装置操作所需的各种程序以及数据。CPU501、ROM502以及RAM503通过总线504彼此相连。在有RAM503的情况下,ROM502为可选模块。RAM503存储可执行指令,或在运行时向ROM502中写入可执行指令,可执行指令使中央处理单元501执行上述物体分割方法所包括的步骤。输入/输出(I/O)接口505也连接至总线504。通信部512可以集成设置,也可以设置为具有多个子模块(例如,多个IB网卡),并分别与总线连接。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装在存储部分508中。
需要特别说明的是,如图5所示的架构仅为一种可选实现方式,在具体实践过程中,可根据实际需要对上述图5的部件数量和类型进行选择、删减、增加或替换;在不同功能部件设置上,也可采用分离设置或集成设置等实现方式,例如,GPU和CPU可分离设置,再如理,可将GPU集成在CPU上,通信部可分离设置,也可集成设置在CPU或GPU上等。这些可替换的实施方式均落入本申请的保护范围。
特别地,根据本申请的实施方式,下文参考流程图描述的过程可以被实现为计算机软件程序,例如,本申请实施方式包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行流程图所示的步骤的程序代码,程序代码可包括对应执行本申请提供的步骤对应的指令,程序代码所包括的指令的一个具体的例子为:用于获取待识别图像的预估年龄的指令;用于根据预估年龄以及预先设定的两个或者以上年龄差距从已知年龄的图像样本集合中选取N幅图像样本的指令,其中的N不小于2;用于获取待识别图像与选取的各图像样本之间的年龄大小比较结果的指令;用于根据预设的面部年龄的第一先验概率分布和基于比较结果形成的第一似然函数获得面部年龄的第一后验概率分布的指令;其中的面部年龄后验概率分布用于确定人的面部年龄属性信息;程序代码所包括的指令的另一个具体的例子为:用于获取待识别图像中的人的面部特征的指令;用于针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率的指令,且所有概率形成第二似然函数的似然值;用于根据预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数生成面部年龄的第二后验概率分布的指令。
在这样的实施方式中,该计算机程序可以通过通信部分509从网络上被下载及安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请中记载的上述指令。
示例性实施例
本申请提供的用于识别面部年龄的技术方案可以由智能移动电话、台式计算机、笔记型计算机、平板电脑或者服务器等能够运行计算机程序(也可以称为程序代码)的电子设备实现,且该计算机程序可以存储于闪存、缓存、硬盘或者光盘等计算机可读存储介质中。
下面结合图6至图12对本申请提供的用于识别面部年龄的技术方案进行说明。
图6中,S600、获取待识别图像的预估年龄。
在一个可选示例中,本申请中的步骤S600可以由处理器调用存储器中存储的用于获取待识别图像的预估年龄的指令执行,也可以由被处理器运行的获取预估年龄模块1100执行。
本申请中的待识别图像可以为图片、照片或者视频中的视频帧等。该待识别图像应为包含有人脸的图像,且该待识别图像中的人脸可以为正脸,也可能会存在各种角度的偏转;另外,该待识别图像中的人脸的清晰程度可以非常好,也可以存在一定程度的欠缺。
在一个可选示例中,获取预估年龄模块1100所获取到的待识别图像的预估年龄可以是利用现有的预估年龄方式确定出的,下面以两个具体的例子进行说明:
具体例子a、设定预先针对1-Y岁(例如,1-70岁或者1-80岁或者1-100岁等)设置有Y个分类器,且每一个分类器对应1-Y岁中的一个整数年龄(即第k个分类器对应k岁),使用Y个分类器分别对待识别图像进行分类处理,每一个分类器会输出一个概率值,且任一分类器所输出的概率值用于表示待识别图像中的人的年龄为该分类器所对应的年龄的概率,从而获取预估年龄模块1100通过Y个分类器可以获得Y个概率,获取预估年龄模块1100可以将Y个概率中的最大概率所对应的年龄作为待识别图像的预估年龄。
具体例子b、设定预先针对1-Y岁(例如,1-70岁或者1-80岁或者1-100岁等)设置有Y个分类器,且每一个分类器对应1-Y岁中的一个整数年龄,使用Y个分类器分别对待识别图像进行分类处理,每一个分类器输出一个概率值,且任一分类器所输出的概率值用于表示待识别图像中的人的年龄大于该分类器所对应的年龄的概率,从而获取预估年龄模块1100通过Y个分类器可以获得Y个概率,获取预估年龄模块1100可以针对Y个概率进行求和计算,并根据计算结果获得待识别图像的预估年龄。
在一个可选示例中,获取预估年龄模块1100也可以采用不同于上述现有的预测年龄方式来确定待识别图像的预估年龄,例如,获取预估年龄模块1100将待识别图像作为输入图像输入本申请的神经网络模型,且获取预估年龄模块1100根据该神经网络模型输出的一面部年龄后验概率分布确定待识别图像的预估年龄;下面对本申请提供的神经网络模型所执行操作的一个具体例子进行详细说明:
操作a、本申请中的神经网络模型获取待识别图像中的人的面部特征。
在一个可选示例中,本申请中的操作a可以由处理器调用存储器中存储的用于获取待识别图像中的人的面部特征的指令执行,也可以由被处理器运行的获取面部特征模块1200执行。
在一个可选示例中,神经网络模型(如获取面部特征模块1200)可以通过其所包含的CNN(Convolutional Neural Networks,卷积神经网络)来获取待识别图像中的人的面部特征,例如,神经网络模型通过一CNN(即获取面部特征模块1200可以具体为CNN)可以获取到128维的面部特征等。
操作b、针对预先设定的每一个年龄类别,判断上述获取到的面部特征属于超过该年龄类别的面部特征的概率,且所有概率即为第二似然函数的似然值。
在一个可选示例中,本申请中的操作b可以由处理器调用存储器中存储的用于针对预先设定的每一个年龄类别,判断面部特征属于超过该年龄类别的面部特征的概率的指令执行,也可以由被处理器运行的判断概率模块1210执行。
在一个可选示例中,神经网络模型可以利用其所包含的第一全连接层和sigmoid函数(即判断概率模块1210可以具体为第一全连接层和sigmoid函数),针对预先设定的年龄区间中的每一个整数年龄,对获取面部特征模块1200获取到的面部特征进行分类处理,从而获得待处理图像中的人超过每一个整数岁的概率值,所有的概率值即可形成待处理图像中的人针对预先设定的各年龄的似然值;例如,针对0-70岁而言,神经网络模型可以利用第一全连接层和sigmoid函数一起获得待处理图像中的人超过0岁的概率值、超过1岁的概率值、超过2岁的概率值、......以及超过70岁的概率值,这70个概率值即形成一个70维的似然值。
操作c、根据预设的面部年龄的第二先验概率分布以及由操作b获得的似然值而形成的第二似然函数生成面部年龄的第二后验概率分布。
在一个可选示例中,本申请中的操作c可以由处理器调用存储器中存储的用于根据预设的面部年龄的第二先验概率分布以及基于概率形成的第二似然函数生成面部年龄的第二后验概率分布的指令执行,也可以由被处理器运行的形成后验概率分布模块1220执行。
在一个可选示例中,神经网络模型(例如,形成后验概率分布模块1220)可以利用贝叶斯公式(例如,下述公式(1)所示的贝叶斯公式),对预设的面部年龄的第二先验概率分布以及第二似然函数进行计算,从而神经网络模型可以生成面部年龄的第二后验概率分布并输出;具体的,神经网络模型可以利用其所包含的第二全连接层根据取对数后的贝叶斯公式(例如,下述公式(2))对预设的面部年龄的第二先验概率分布以及上述似然值形成的第二似然函数进行计算,并利用softmax函数将第二全连接层输出的计算结果进行归一化处理,形成面部年龄的第二后验概率分布并输出;即第二全连接层和softmax函数(即形成后验概率分布模块1220可以具体包括第二全连接层和softmax函数)一起实现了根据贝叶斯公式对预设的面部年龄的第二先验概率分布以及第二似然函数进行计算获得面部年龄后验概率分布的过程。
Figure GDA0002380823300000161
log P(a∣I)=-log Z+log P(a)+Σkfk(I)logP(Ek=1∣a)+(1-fk(I))log P(Ek=0∣a)
(2)
在上述公式(1)和公式(2)中,p(a∣I)和p(a∣Ek)均表示基于年龄a(即给定年龄/真实年龄/已知年龄)的待识别图像I的面部年龄后验概率分布,k为年龄区间中的一个整数年龄,K为年龄区间中的年龄数量(如70或者80或者100等),K通常也可以为年龄区间中的最大年龄,P(Ek∣a)表示在年龄a和年龄k情况下的第二似然函数,Z为系数,例如,Z=P(Ek=0∣a)+P(Ek=1∣a),P(a)表示预先设定的面部年龄先验概率分布,且该面部年龄先验概率分布可以是针对年龄区间中的每一个年龄类别的均匀概率分布,例如,针对1-100或者1-70中的每一个整数年龄的均匀概率分布,Ek=1表示待识别图像的面部年龄比k岁大,而Ek=0表示待识别图像的面部年龄比k岁小,P(Ek=1∣a)表示待识别图像的面部年龄比k岁大的概率,P(Ek=0∣a)表示待识别图像的面部年龄比k岁小的概率,fk(I)表示针对待识别图像I的第k个分类器的输出信息,即第k岁所对应的似然值。
在一个可选示例中,本申请中的第二似然函数的斜率可以为0.1-0.6中的任一数值,例如,第二似然函数的斜率为0.36,第二似然函数的斜率决定了第二全连接层的参数。
获取预估年龄模块1100可以采用现有的多种实现方式,在神经网络模型输出的一面部年龄后验概率分布的基础上确定出待识别图像的预估年龄,一个具体的例子,获取预估年龄模块1100确定神经网络模型输出的面部年龄后验概率分布的中位数,并将该中位数作为预测出的人的面部年龄;再一个具体的例子,获取预估年龄模块1100针对神经网络模型输出的面部年龄后验概率分布进行加权计算,并根据加权计算结果确定预测出的人的面部年龄;再一个具体的例子,获取预估年龄模块1100将神经网络模型输出的面部年龄后验概率分布中的最大概率对应的年龄作为预测出的人的面部年龄;再一个具体的例子,获取预估年龄模块1100针对神经网络模型输出的面部年龄后验概率分布进行置信度计算,并根据该置信度计算结果确定预测出的人的面部年龄所属的年龄区间,之后,获取预估年龄模块1100可以从该年龄区间中选取一个年龄作为预估年龄,例如,从该年龄区间中选取中间年龄作为预估年龄。本申请不限制获取预估年龄模块1100基于面部年龄后验概率分布而确定待识别图像的预估年龄的具体实现方式。
本申请中的神经网络模型的训练过程如下述训练实施例中的记载。
S610、根据预估年龄以及预先设定的两个或者以上年龄差距从已知年龄的图像样本集合中选取N幅图像样本。
在一个可选示例中,本申请中的步骤S610可以由处理器调用存储器中存储的用于从图像样本集合中选取图像样本的指令执行,也可以由被处理器运行的选取图像样本模块1110执行。
在一个可选示例中,本申请的图像样本集合中设置有多幅图像样本,通常情况下每一幅图像样本均应包含有人脸,且图像样本中的人脸可以为正脸,也可能会存在各种角度的偏转;另外,图像样本中的人脸的清晰程度可以非常好,也可以存在一定程度的欠缺。还有,图像样本集合中的各图像样本通常为已知年龄的图像样本,例如,图像样本集合中的所有图像样本通常被标注了真实年龄。选取图像样本模块1110根据预估年龄从图像样本集合中所选取出的图像样本的数量通常不小于2;例如,选取图像样本模块1110根据预估年龄从图像样本集合中选取出6幅图像样本等。
需要特别说明的是,选取图像样本模块1110从图像样本集合中选取出的图像样本的数量越多,则获得的面部年龄后验概率分布所呈现出的曲线的尖峰部分的宽度会越窄,从而会有利于提高预估年龄的准确度;然而,选取图像样本模块1110从图像样本集合中选取出的图像样本的数量越多,则有可能会导致判断待识别图像与所有图像样本之间的年龄大小比较结果所需的时间越长,本申请可以通过平衡识别面部年龄的效率以及识别面部年龄的准确度来确定从图像样本集合中选取出的图像样本的数量。
在一个可选示例中,选取图像样本模块1110从图像样本集合中选取出的所有图像样本,在应该包括年龄大于预估年龄的N1幅图像样本的同时,还应包括年龄小于预估年龄的N2幅图像样本,且N1与N2之和为N。
在一个可选示例中,在选取图像样本模块1110从图像样本集合中选取出的所有图像样本的数量为偶数的情况下,年龄大于预估年龄的图像样本的数量N1与年龄小于预估年龄的图像样本的数量N2相等。另外,针对年龄大于预估年龄的N1幅图像样本中的任一幅图像样本,年龄小于预估年龄的N2幅图像样本中应存在年龄差距相同且年龄差距相反的一幅图像样本,例如,在选取图像样本模块1110需要从图像样本集合中选取6幅图像的情况下,选取图像样本模块1110可以按照预估年龄–10、预估年龄–6、预估年龄–5、预估年龄+10、预估年龄+6以及预估年龄+5的年龄差距设定从图像样本集合中选取6幅图像样本。
在一些应用场景中,会出现图像样本集合中不存在符合预先设定的年龄差距的图像样本的情况,例如,在预估年龄为4岁时,选取图像样本模块1110无法根据预先设定的预估年龄–10、预估年龄–6以及预估年龄–5的图像样本选取策略从图像样本集合中选取出相应的图像样本,此时,选取图像样本模块1110应尽量的从图像样本集合中的最小年龄至预估年龄的图像样本中选取(例如,随机选取)出具有不同年龄差距的3幅图像,例如,选取图像样本模块1110根据预估年龄–3、预估年龄–2以及预估年龄–1的图像样本选取策略从图像样本集合中选取出3幅图像样本,而如果预估年龄为2岁,则选取图像样本模块1110选取出的3幅图像样本的年龄与预估年龄的差距会存在相同的情况;再例如,在预估年龄为64岁而图像样本集合中的图像样本的年龄最大为70岁的情况下,选取图像样本模块1110无法根据预估年龄+10、预估年龄+6以及预估年龄+5的图像样本选取策略从图像样本集合中选取出相应的图像样本,此时,选取图像样本模块1110应尽量的从预估年龄至最大年龄(例如,70岁)的图像样本中选取(例如,随机选取)出具有不同年龄差距的3幅图像,例如,选取图像样本模块1110根据预估年龄+3、预估年龄+2以及预估年龄+1的图像样本选取策略从图像样本集合中选取出3幅图像样本,而如果预估年龄为68岁,则选取图像样本模块1110选取出的3幅图像样本的年龄与预估年龄的差距会存在相同的情况。
选取图像样本模块1110从图像样本集合中选取图像样本的图像样本选取策略可以根据实际需求灵活变化,本申请不限制选取图像样本模块1110从图像样本集合中选取图像样本的具体实现方式。
S620、获取待识别图像与选取的N幅图像样本之间的年龄大小比较结果。
在一个可选示例中,本申请中的步骤S620可以由处理器调用存储器中存储的用于获取待识别图像与选取的N幅图像样本之间的年龄大小比较结果的指令执行,也可以由被处理器运行的获取比较结果模块1120执行。
在一个可选示例中,获取比较结果模块1120可以通过接收输入信息的形式获取待识别图像与选取的N幅图像样本之间的年龄大小比较结果;该比较结果可以是人工针对待识别图像与选取的N幅图像样本之间的年龄大小进行比较而形成比较结果。
在一个可选示例中,选取图像样本模块1110从图像样本集合中选取出的6幅图像样本被展示给标注人员,例如,在图像比较界面中显示选取图像样本模块1110选取出的6幅图像样本;标注人员针对每一幅图像样本,均判断该图像样本中的人的面部年龄是否超过待识别图像中的人的面部年龄,从而标注人员会给出6个判断结果,通过输入这6个判断结果(例如,标注人员在图像比较界面中点选相应的选项等),使获取比较结果模块1120成功获取到待识别图像与选取的6幅图像样本之间的年龄大小比较结果。本申请不限制获取比较结果模块1120获取年龄大小比较结果的具体实现方式。
S630、根据比较结果形成的统计信息获得用于确定人的面部年龄属性信息的概率信息,例如,根据预设的面部年龄的第一先验概率分布和基于比较结果形成的第一似然函数获得面部年龄的第一后验概率分布。
在一个可选示例中,本申请中的步骤S630可以由处理器调用存储器中存储的用于根据比较结果形成的统计信息获得用于确定人的面部年龄属性信息的概率信息的指令执行,也可以由被处理器运行的生成概率信息模块1130执行,且生成概率信息模块1130生成的概率信息(如面部年龄后验概率分布)可以用于确定待识别图像中的人的面部年龄属性信息。
在一个可选示例中,本申请中的第一似然函数的斜率可以为0.1-0.6中的任一数值,例如,第一似然函数的斜率为0.36。
在一个可选示例中,生成概率信息模块1130可以根据贝叶斯公式对预设的面部年龄的第一先验概率分布以及基于比较结果形成的第一似然函数进行计算,从而生成面部年龄的第一后验概率分布。
在一个可选示例中,生成概率信息模块1130可以利用下述公式(3)来生成面部年龄的第一后验概率分布:
Figure GDA0002380823300000201
在上述公式(3)中,a表示预估年龄,P(a∣{Ckm})表示在预估年龄a的情况下,针对第m幅图像样本的年龄k的面部年龄的第一后验概率分布,P(a)表示针对预估年龄a的面部年龄的第一先验概率分布,且P(a)可以是针对预先设定的年龄区间中的每一个年龄类别的均匀概率分布,例如,针对年龄区间1-100或者1-70或者1-80等中的每一个整数年龄的均匀概率分布,M表示从图像样本集合中选取出的图像样本的数量,m表示从图像样本集合中选取出的第m幅图像样本,k表示选取出的图像样本的已知年龄/真实年龄,P(Ckm∣a)表示在预估年龄a的情况下,基于已知年龄k的第m幅图像样本所对应的似然值,Ckm为待识别图像与第m幅图像样本的已知年龄k相比的比较结果;
在Ckm=1(即第m幅图像样本的真实年龄比预估年龄a大)的情况下,Ckm所对应的第一似然函数可以表示为下述公式(4)的形式:
P(Ckm∣a)=σ(β(a-k))/Z (4)
在Ckm=0(即第m幅图像样本的真实年龄比预估年龄a小)的情况下,Ckm所对应的第一似然函数可以表示为下述公式(5)的形式:
P(Ckm∣a)=σ(β(k-a))/Z (5)
在上述公式(4)和公式(5)中,σ(*)表示logistic函数,即σ(*)=1/(1+e-bx),其中的b为logistic函数的斜率,且b的取值范围可以为0.1-0.6,如b=0.36;β表示第一似然函数的斜率,例如,β=0.36,β(a-k)和β(k-a)分别表示第一似然函数的斜率β与(a-k)的乘积以及斜率β与(k-a)的乘积;且β(k-a)和β(a-k)可以认为是带权值的年龄差;Z为系数,例如,Z=P(Ek=0∣a)+P(Ek=1∣a)。
在从图像样本集合中选取6幅图像样本的情况下,上述公式(3)的一个具体例子可以如图7所示。图7中,上侧最左边的图像为待识别图像,由于篇幅等因素,图7中仅示出了选取图像样本模块1110从图像样本集合中选取出的6幅图像样本中的4幅图像样本(如图7中上侧最右边的4幅图像),且4幅图像中的最左边的两幅图像的已知年龄小于待识别图像的预估年龄,而4幅图像中的最右边的两幅图像的已知年龄大于待识别图像的预估年龄;上侧最右边的4幅图像中的每一幅图像各自对应的似然函数可以表示为图7下侧最右边的4个曲线图,生成概率信息模块1130将所有的6个似然函数与预先设定的面部年龄先验概率分布进行相乘运算后,获得待识别图像的面部年龄的第一后验概率分布,该面部年龄的第一后验概率分布可以表示为如图7下侧最左边的带有尖峰的曲线。
在一个可选示例中,生成概率信息模块1130会针对每一个待识别图像生成一个面部年龄的第一后验概率分布,然而,在标注人员针对待识别图像与选取出的图像样本进行比较的过程中,由于比较结果输入错误或者主观认知错误等原因,会导致比较结果出现相互矛盾的现象,例如,标注人员在针对待识别图像与预估年龄-6的图像样本进行判断时,认为待识别图像比该图像样本更年轻,在针对待识别图像与预估年龄+6的图像样本进行判断时,认为待识别图像比该图像样本更老;存在相互矛盾的判断结果会导致生成概率信息模块1130所生成的面部年龄的第一后验概率分布不能呈现出带有尖峰的曲线;例如,图8中,生成概率信息模块1130针对6幅待识别图像均生成了面部年龄的第一后验概率分布,且其中的5幅待识别图像所对应的面部年龄的第一后验概率分布均为带有尖峰的曲线,而最后1幅待识别图像所对应的面部年龄的第一后验概率分布呈现为开口向下的抛物线,该面部年龄的第一后验概率分布为无效的面部年龄后验概率分布,应由第一滤除模块1140或者相应的用于滤除无效的面部年龄的第一后验概率分布的指令滤除这样的面部年龄的第一后验概率分布,即确定年龄属性模块1150或者相应的用于确定年龄属性信息的指令不应使用这样的面部年龄的第一后验概率分布来确定待识别图像中的人的年龄属性信息。确定年龄属性模块1150根据有效的面部年龄的第一后验概率分布确定出人的面部年龄属性信息,会经由标注模块1160或者用于标注待识别图像的年龄属性信息的指令为待识别图像进行标注操作。确定年龄属性模块1150根据有效的面部年龄的第一后验概率分布确定人的面部年龄属性信息的具体实现方式可以参考上述获取预估年龄模块1100根据神经网络模型输出的一面部年龄后验概率分布确定待识别图像的预估年龄的具体实现方式,在此不再重复说明。
在一个可选示例中,本申请中的神经网络模型的训练过程可以由处理器调用存储器中存储的用于训练神经网络模型的指令执行,也可以由被处理器运行的训练模块1240执行,且神经网络模型的一个训练过程可以包括如下操作:
设定本申请中的神经网络模型如图9所示,包括:CNN、第一全连接层、sigmoid层、第二全连接层以及softmax层;且设定本申请中的图像样本集合中设置有多幅图像样本,通常情况下,每一幅图像样本均应包含有人脸,且图像样本中的人脸可以为正脸,也可能会存在各种角度的偏转;另外,图像样本中的人脸的清晰程度可以非常好,也可以存在一定程度的欠缺。还有,图像样本集合中的各图像样本通常为已知年龄的图像样本,例如,图像样本集合中的所有图像样本通常被标注了真实年龄。
首先,训练模块1240从图像样本集合中选取一幅图像样本作为输入图像样本输入神经网络模型,神经网络模型中的CNN获取输入图像样本中的人的面部特征,从而CNN输出具有一定维数的面部特征,例如,CNN输出128维的面部特征。另外,训练模块1240应根据该输入图像样本的已知面部年龄以及预先设定的两个或者以上年龄差距(下述以6个年龄差距为例进行说明)从图像样本集合中选取已知面部年龄的M幅图像样本(下述以6幅图像样本为例进行说明);
其次,神经网络模型中的第一全连接层和sigmoid层,针对预先设定的年龄区间(例如,1-70)中的每一个整数年龄,对CNN输出的面部特征进行分类处理,从而sigmoid层输出输入图像样本中的人超过每一个整数岁的概率值,例如,针对1-70岁而言,sigmoid层输出输入图像样本中的人超过1岁的概率值、超过2岁的概率值、超过3岁的概率值、......以及超过70岁的概率值,这70个概率值即形成一个70维的似然值,如图9中的Hyperplanerespouse(超平面响应);
再次,神经网络模型中的第二全连接层和softmax层一起利用贝叶斯公式对预设的面部年龄的第二先验概率分布以及上述似然值形成的第三似然函数进行计算,从而softmax层输出面部年龄的第三后验概率分布;其中第二全连接层中的各参数通常根据第三似然函数的斜率确定,且第三似然函数的斜率可以为0.1-0.6之间的一个数值,如第三似然函数的斜率为0.36;
最后,训练模块1240可以利用上述选取出的6幅图像样本以及上述输入图像样本形成的真实的面部年龄的第三后验概率分布,并利用面部年龄的第三后验概率分布使神经网络模型进行监督学习;具体的,训练模块1240可以将面部年龄的第二后验概率分布和面部年龄的第三后验概率分布提供给损失函数,从而实现基于面部年龄后验概率分布的监督学习;上述面部年龄的第三后验概率分布应该为经第二滤除模块1230或者相应的用于滤除无效的面部年龄的第三后验概率分布的指令执行滤除操作后的有效的面部年龄的第三后验概率分布,即训练模块1240不应利用这样的面部年龄的第三后验概率分布进行监督学习。
该损失函数可以如下述公式(6)所示:
LKL=DKL(Pgt(a)||P(a∣I))=-ΣaPgt(a)log P(a∣I)-Const (6)
在上述公式(6)中,LKL表示损失函数,DKL(*)表示cross entropy loss(交叉熵),a为输入图像样本的真实年龄,Pgt(a)表示面部年龄的第三后验概率分布,P(a∣I)表示面部年龄的第二后验概率分布,Const为常数值。
由于相对于一个具体的年龄或者年龄段而言,面部年龄后验概率分布所包含的信息往往更多,因此,通过利用面部年龄后验概率分布对神经网络模型进行监督学习,往往会使神经网络模型所能够学习到的内容更多,从而可以使训练成功的神经网络模型输出的面部年龄后验概率分布更接近真实的面部年龄后验概率分布;进而在利用这样的面部年龄后验概率分布进行年龄预估/预测时,有利于提高年龄预估/预测的准确性。
另外,由于输入图像样本标注有真实的年龄,因此,训练模块1240还可以利用基于该真实的年龄与选取的图像样本的真实的年龄的比较结果(即似然值)对神经网络模型进行监督学习,具体的,训练模块1240可以将真实的年龄与选取的图像样本的真实的年龄的比较结果和基于第一全连接层和sigmoid层输出的似然值分别提供给损失函数,从而实现真实年龄的监督学习;该损失函数可以如下述公式(7)所示:
Figure GDA0002380823300000241
在上述公式(7)中,Costk(agt)函数可以定义为如果|agt-k|<L,则函数值为0,否则,函数值为1,k表示第一全连接层中的第k个分类器,k也可以理解为k岁,L可以设置为3,fk(I)=<wk,φ(I)>,wk为第一全连接层和sigmoid层中针对第k个分类器的权值,φ(I)表示输入图像样本的面部特征,即面部特征向量,agt为输入图像样本中的人的真实年龄。
本申请通过利用输入图像样本的真实年龄与选取的图像样本的真实年龄的比较结果(即似然值)对神经网络模型进行监督学习,有利于提高神经网络模型形成似然值的准确性,从而有利于使第二全连接层和softmax层所形成的面部年龄后验概率分布更接近于真实的面部年龄后验概率分布。
在训练模块1240对神经网络模型成功训练后,该神经网络模型针对如图10最左侧的上下两幅输入图像样本所形成的似然函数可以展示为如图10中间位置的上下两个曲线图所示,而图10中最左侧的上下两幅输入图像样本的真实的似然函数可以展示为如图10中最左侧的上下两个曲线图所示,且该神经网络模型最后所形成的面部年龄后验概率分布可以展示为如图10最右侧的上下两个曲线图所示。由图10可以得知,虽然图10中最左侧上面的一幅输入图像样本中的人脸有一定的转动角度,且图10中最左侧下面的一幅输入图像样本中的人脸有些模糊,然而,如果利用该神经网络模型输出的面部年龄后验概率分布来预估两幅输入图像样本中的人的面部年龄,则能够与输入图像样本中的人的真实年龄基本相吻合。
可能以许多方式来实现本申请的方法和装置、电子设备以及计算机可读存储介质。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本申请的方法和装置、电子设备以及计算机可读存储介质。用于方法的步骤的上述顺序仅是为了进行说明,本申请的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施方式中,还可将本申请实施为记录在记录介质中的程序,这些程序包括用于实现根据本申请的方法的机器可读指令。因而,本申请还覆盖存储用于执行根据本申请的方法的程序的记录介质。
本申请的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本申请限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施方式是为了更好说明本申请的原理和实际应用,并且使本领域的普通技术人员能够理解本申请从而设计适于特定用途的带有各种修改的各种实施方式。

Claims (42)

1.一种用于识别面部年龄的方法,其特征在于,包括:
获取待识别图像的预估年龄;
根据所述预估年龄以及预先设定的两个或者以上年龄差距,从已知年龄的图像样本集合中选取N幅图像样本,所述N不小于2;
获取所述待识别图像与选取的所述N幅图像样本之间的年龄大小比较结果;
根据所述比较结果形成的统计信息获得用于确定人的面部年龄属性信息的概率信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述比较结果形成的统计信息获得用于确定人的面部年龄属性信息的概率信息包括:
根据预设的面部年龄的第一先验概率分布和基于所述比较结果形成的第一似然函数获得面部年龄的第一后验概率分布;
其中,所述面部年龄后验概率分布用于确定人的面部年龄属性信息。
3.根据权利要求1所述的方法,其特征在于,所述获取待识别图像的预估年龄包括:
将所述待识别图像输入神经网络模型,根据所述神经网络模型的输出信息确定待识别图像的预估年龄。
4.根据权利要求3所述的方法,其特征在于,所述神经网络模型的输出信息包括:面部年龄的第二后验概率分布。
5.根据权利要求4所述的方法,其特征在于,所述神经网络模型针对输入的待识别图像所执行的处理操作包括:
获取待识别图像中的人的面部特征;
针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率,且所有概率形成第二似然函数的似然值;
根据预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数生成面部年龄的第二后验概率分布。
6.根据权利要求5所述的方法,其特征在于,所述针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率包括:
针对预先设定的每一个年龄类别,利用第一全连接层对所述面部特征进行分类处理;
利用sigmoid函数将所述分类处理结果进行归一化处理,获得所述面部特征属于超过该年龄类别的面部特征的概率。
7.根据权利要求5所述的方法,其特征在于,所述根据预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数生成面部年龄的第二后验概率分布包括:
根据贝叶斯公式对预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数进行计算,以生成所述面部年龄的第二后验概率分布。
8.根据权利要求7所述的方法,其特征在于,所述根据贝叶斯公式对预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数进行计算,以生成所述面部年龄的第二后验概率分布包括:
利用第二全连接层基于取对数后的贝叶斯公式对预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数进行计算;
利用softmax函数将所述第二全连接层输出的计算结果还原为面部年龄的第二后验概率分布。
9.根据权利要求4所述的方法,其特征在于,所述根据所述神经网络模型的输出信息确定待识别图像的预估年龄包括:
确定所述面部年龄的第二后验概率分布的中位数,并将所述中位数作为预估年龄;或者
针对所述面部年龄的第二后验概率分布进行加权计算,并根据所述加权计算结果确定预估年龄;或者
将所述面部年龄的第二后验概率分布中的最大概率对应的年龄作为预估年龄;或者
针对所述面部年龄的第二后验概率分布进行置信度计算,并根据所述置信度计算结果确定年龄区间,从所述年龄区间中选取一年龄作为预估年龄。
10.根据权利要求3所述的方法,其特征在于,所述神经网络模型的训练过程包括:
根据输入图像样本的已知面部年龄以及预先设定的两个或者以上年龄差距从图像样本集合中选取已知面部年龄的M幅图像样本,所述M不小于2;
获取所述输入图像样本与选取的M幅图像样本之间的年龄大小比较结果;
根据预设的面部年龄的第二先验概率分布和基于所述比较结果形成的第三似然函数获得面部年龄的第三后验概率分布;
根据所述面部年龄的第三后验概率分布对神经网络模型进行监督学习。
11.根据权利要求10所述的方法,其特征在于,所述训练过程还包括:
根据所述输入图像样本的已知面部年龄对神经网络模型进行监督学习。
12.根据权利要求1至11中任一项所述的方法,其特征在于,所述N幅图像样本包括:年龄大于预测年龄的N1幅图像样本以及年龄小于预估年龄的N2幅图像样本,其中,所述N1与N2之和为N。
13.根据权利要求12所述的方法,其特征在于,所述N为偶数时,所述N1与N2相等,且针对年龄大于预估年龄的N1幅图像样本中的任一幅图像样本,年龄小于预估年龄的N2幅图像样本中存在年龄差距相同且年龄差距相反的一幅图像样本。
14.根据权利要求1至11中任一项所述的方法,其特征在于,所述获取所述待识别图像与选取的所述N幅图像样本之间的年龄大小比较结果包括:
通过接收输入信息的形式获获取所述待识别图像与选取的所述N幅图像样本之间的年龄大小比较结果;
其中,所述输入信息包括:人工针对所述待识别图像与选取的所述N幅图像样本之间的年龄大小进行比较而形成比较结果。
15.根据权利要求2至11中任一项所述的方法,其特征在于,所述根据预设的面部年龄的第一先验概率分布和基于所述比较结果形成的第一似然函数获得面部年龄的第一后验概率分布包括:
根据贝叶斯公式对预设的面部年龄的第一先验概率分布以及基于所述比较结果形成的第一似然函数进行计算,生成所述面部年龄的第一后验概率分布。
16.根据权利要求2至11中任一项所述的方法,其特征在于,所述面部年龄的第一先验概率分布包括:针对预先设定的每一个年龄类别的均匀概率分布。
17.根据权利要求2至11中任一项所述的方法,其特征在于,所述方法还包括:
滤除无效的面部年龄的第一后验概率分布;
其中,所述无效的面部年龄的第一后验概率分布包括:形成开口向下的抛物线形状的面部年龄的第一后验概率分布。
18.根据权利要求2至11中任一项所述的方法,其特征在于,所述方法还包括:
根据面部年龄的第一后验概率分布确定人的面部年龄属性信息;
根据所述面部年龄属性信息标注所述待识别图像的年龄属性信息。
19.根据权利要求18所述的方法,其特征在于,所述根据面部年龄的第一后验概率分布确定人的面部年龄属性信息包括:
确定所述面部年龄的第一后验概率分布的中位数,并将所述中位数作为所述待识别图像的面部年龄;或者
针对所述面部年龄的第一后验概率分布进行加权计算,并根据所述加权计算结果确定所述待识别图像的面部年龄;或者
将所述面部年龄的第一后验概率分布中的最大概率对应的年龄作为所述待识别图像的面部年龄;或者
针对所述面部年龄的第二后验概率分布进行置信度计算,并根据所述置信度计算结果确定所述待识别图像的面部年龄所属的年龄区间。
20.根据权利要求2至11中任一项所述的方法,其特征在于,所述第一似然函数和/或第二似然函数的斜率为0.1-0.6之间的数值。
21.一种用于识别面部年龄的方法,其特征在于,所述方法由神经网络模型执行,且所述神经网络模型所执行的处理操作包括:
获取待识别图像中的人的面部特征;
针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率,且所有概率形成第二似然函数的似然值;
根据预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数生成面部年龄的第二后验概率分布。
22.根据权利要求21所述的方法,其特征在于,所述针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率包括:
针对预先设定的每一个年龄类别,利用第一全连接层对所述面部特征进行分类处理;
利用sigmoid函数将所述分类处理结果进行归一化处理,获得所述面部特征属于超过该年龄类别的面部特征的概率。
23.根据权利要求21所述的方法,其特征在于,所述根据预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数生成面部年龄的第二后验概率分布包括:
根据贝叶斯公式对预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数进行计算,以生成所述面部年龄的第二后验概率分布。
24.根据权利要求23所述的方法,其特征在于,所述根据贝叶斯公式对预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数进行计算,以生成所述面部年龄的第二后验概率分布包括:
利用第二全连接层基于取对数后的贝叶斯公式对预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数进行计算;
利用softmax函数将所述第二全连接层输出的计算结果还原为面部年龄的第二后验概率分布。
25.根据权利要求21至24中任一项所述的方法,其特征在于,所述神经网络模型的训练过程包括:
根据输入图像样本的已知面部年龄以及预先设定的两个或者以上年龄差距从图像样本集合中选取已知面部年龄的M幅图像样本,所述M不小于2;
获取所述输入图像样本与选取的M幅图像样本之间的年龄大小比较结果;
根据预设的面部年龄的第二先验概率分布和基于所述比较结果形成的第三似然函数获得面部年龄的第三后验概率分布;
根据所述面部年龄的第三后验概率分布对神经网络模型进行监督学习。
26.根据权利要求25所述的方法,其特征在于,所述训练过程还包括:
滤除无效的面部年龄的第三后验概率分布;
且所述根据所述面部年龄的第三后验概率分布对神经网络模型进行监督学习包括:
根据滤除后的面部年龄的第三后验概率分布对神经网络模型进行监督学习;
其中,所述无效的面部年龄的第三后验概率分布包括:形成开口向下的抛物线形状的面部年龄的第三后验概率分布。
27.根据权利要求25所述的方法,其特征在于,所述训练过程还包括:
根据所述输入图像样本的已知面部年龄对神经网络模型进行监督学习。
28.一种用于识别面部年龄的装置,其特征在于,包括:
获取预估年龄模块,用于获取待识别图像的预估年龄;
选取图像样本模块,用于根据所述预估年龄以及预先设定的两个或者以上年龄差距从已知年龄的图像样本集合中选取N幅图像样本,所述N不小于2;
获取比较结果模块,用于获取所述待识别图像与选取的所述N幅图像样本之间的年龄大小比较结果;
生成概率信息模块,用于根据所述比较结果形成的统计信息获得用于确定人的面部年龄属性信息的概率信息。
29.根据权利要求28所述的装置,其特征在于,所述生成概率信息模块具体用于,根据预设的面部年龄的第一先验概率分布和基于所述比较结果形成的第一似然函数获得面部年龄的第一后验概率分布;
其中,所述面部年龄后验概率分布用于确定人的面部年龄属性信息。
30.根据权利要求29所述的装置,其特征在于,所述装置还包括:
第一滤除模块,用于滤除无效的面部年龄的第一后验概率分布;
其中,所述无效的面部年龄的第一后验概率分布包括:形成开口向下的抛物线形状的面部年龄的第一后验概率分布。
31.根据权利要求29至30中任一项所述的装置,其特征在于,所述装置还包括:
确定年龄属性模块,用于根据面部年龄的第一后验概率分布确定人的面部年龄属性信息;
标注模块,用于根据所述面部年龄属性信息标注所述待识别图像的年龄属性信息。
32.一种用于识别面部年龄的装置,其特征在于,所述装置用于实现神经网络模型,且所述装置包括:
获取面部特征模块,用于获取待识别图像中的人的面部特征;
判断概率模块,用于针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率,且所有概率形成第二似然函数的似然值;
形成后验概率分布模块,用于根据预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数生成面部年龄的第二后验概率分布。
33.根据权利要求32所述的装置,其特征在于,所述装置还包括:训练模块,用于:
根据输入图像样本的已知面部年龄以及预先设定的两个或者以上年龄差距从图像样本集合中选取已知面部年龄的M幅图像样本,所述M不小于2;
获取所述输入图像样本与选取的M幅图像样本之间的年龄大小比较结果;
根据预设的面部年龄的第二先验概率分布和基于所述比较结果形成的第三似然函数获得面部年龄的第三后验概率分布;
根据所述面部年龄的第三后验概率分布对神经网络模型进行监督学习。
34.根据权利要求33所述的装置,其特征在于,所述装置还包括:
第二滤除模块,用于滤除无效的面部年龄的第三后验概率分布;
且所述训练模块根据滤除后的面部年龄的第三后验概率分布对神经网络模型进行监督学习;
其中,所述无效的面部年龄的第三后验概率分布包括:形成开口向下的抛物线形状的面部年龄的第三后验概率分布。
35.一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,下述指令被运行:
用于获取待识别图像的预估年龄的指令;
用于根据所述预估年龄以及预先设定的两个或者以上年龄差距从已知年龄的图像样本集合中选取N幅图像样本的指令,所述N不小于2;
用于获取所述待识别图像与选取的所述N幅图像样本之间的年龄大小比较结果的指令;
用于根据所述比较结果形成的统计信息获得用于确定人的面部年龄属性信息的概率信息的指令。
36.根据权利要求35所述的电子设备,其特征在于,所述用于根据所述比较结果形成的统计信息获得用于确定人的面部年龄属性信息的概率信息的指令包括:
用于根据预设的面部年龄的第一先验概率分布和基于所述比较结果形成的第一似然函数获得面部年龄的第一后验概率分布的指令;
其中,所述面部年龄后验概率分布用于确定人的面部年龄属性信息。
37.根据权利要求36所述的电子设备,其特征在于,被运行的指令还包括:
用于滤除无效的面部年龄的第一后验概率分布的指令;
其中,所述无效的面部年龄的第一后验概率分布包括:形成开口向下的抛物线形状的面部年龄的第一后验概率分布。
38.根据权利要求36至37中任一项所述的电子设备,其特征在于,被运行的指令还包括:
用于根据面部年龄的第一后验概率分布确定人的面部年龄属性信息的指令;以及,用于根据所述面部年龄属性信息标注所述待识别图像的年龄属性信息的指令。
39.一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,下述指令被神经网络模型执行:
用于获取待识别图像中的人的面部特征的指令;
用于针对预先设定的每一个年龄类别,判断所述面部特征属于超过该年龄类别的面部特征的概率的指令,且所有概率形成第二似然函数的似然值;
用于根据预设的面部年龄的第二先验概率分布以及基于所述概率形成的第二似然函数生成面部年龄的第二后验概率分布的指令。
40.根据权利要求39所述的电子设备,其特征在于,所述计算机程序被执行时,还执行用于训练神经网络模型的指令,且所述用于训练神经网络模型的指令包括:
用于根据输入图像样本的已知面部年龄以及预先设定的两个或者以上年龄差距从图像样本集合中选取已知面部年龄的M幅图像样本的指令,所述M不小于2;
用于获取所述输入图像样本与选取的M幅图像样本之间的年龄大小比较结果的指令;
用于根据预设的面部年龄的第二先验概率分布和基于所述比较结果形成的第三似然函数获得面部年龄的第三后验概率分布的指令;
用于根据所述面部年龄的第三后验概率分布对神经网络模型进行监督学习的指令。
41.根据权利要求40所述的电子设备,其特征在于,所述计算机程序被执行时,还执行:
用于滤除基于所述比较结果形成的无效的第三似然函数的指令;
且所述用于根据所述面部年龄的第三后验概率分布对神经网络模型进行监督学习的指令具体为:
用于根据滤除后的面部年龄的第三后验概率分布对神经网络模型进行监督学习的指令;
其中,所述无效的第三似然函数包括:形成开口向下的抛物线形状的第三似然函数。
42.一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述权利要求1-27中任一项所述的方法。
CN201810136268.6A 2017-08-11 2018-02-09 用于识别面部年龄的方法、装置和电子设备 Active CN108399379B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/CN2018/098665 WO2019029459A1 (zh) 2017-08-11 2018-08-03 用于识别面部年龄的方法、装置和电子设备
US16/236,292 US11003890B2 (en) 2017-08-11 2018-12-28 Method and apparatus for facial age identification, and electronic device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710687587 2017-08-11
CN2017106875871 2017-08-11

Publications (2)

Publication Number Publication Date
CN108399379A CN108399379A (zh) 2018-08-14
CN108399379B true CN108399379B (zh) 2021-02-12

Family

ID=63096452

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810136268.6A Active CN108399379B (zh) 2017-08-11 2018-02-09 用于识别面部年龄的方法、装置和电子设备

Country Status (3)

Country Link
US (1) US11003890B2 (zh)
CN (1) CN108399379B (zh)
WO (1) WO2019029459A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10949649B2 (en) * 2019-02-22 2021-03-16 Image Metrics, Ltd. Real-time tracking of facial features in unconstrained video
CN109947510A (zh) * 2019-03-15 2019-06-28 北京市商汤科技开发有限公司 一种界面推荐方法及装置、计算机设备
CN110321778B (zh) * 2019-04-26 2022-04-05 北京市商汤科技开发有限公司 一种人脸图像处理方法、装置和存储介质
CN110287942B (zh) * 2019-07-03 2021-09-17 成都旷视金智科技有限公司 年龄估计模型的训练方法、年龄估计方法以及对应的装置
CN110532970B (zh) * 2019-09-02 2022-06-24 厦门瑞为信息技术有限公司 人脸2d图像的年龄性别属性分析方法、系统、设备和介质
CN113128278A (zh) * 2019-12-31 2021-07-16 华为技术有限公司 一种图像识别方法及装置
US11687778B2 (en) 2020-01-06 2023-06-27 The Research Foundation For The State University Of New York Fakecatcher: detection of synthetic portrait videos using biological signals
CN111553838A (zh) * 2020-05-08 2020-08-18 深圳前海微众银行股份有限公司 模型参数的更新方法、装置、设备及存储介质
CN112163462A (zh) * 2020-09-08 2021-01-01 北京数美时代科技有限公司 基于人脸的未成年人识别方法、装置、计算机设备
CN112651372A (zh) * 2020-12-31 2021-04-13 北京眼神智能科技有限公司 基于人脸图像的年龄判断方法及装置、电子设备、存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567719A (zh) * 2011-12-26 2012-07-11 东南大学 基于后验概率神经网络的人类年龄自动估计方法
US9514356B2 (en) * 2014-09-05 2016-12-06 Huawei Technologies Co., Ltd. Method and apparatus for generating facial feature verification model

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8121618B2 (en) * 2009-10-28 2012-02-21 Digimarc Corporation Intuitive computing methods and systems
US10401860B2 (en) * 2010-06-07 2019-09-03 Affectiva, Inc. Image analysis for two-sided data hub
US11430260B2 (en) * 2010-06-07 2022-08-30 Affectiva, Inc. Electronic display viewing verification
CN103649987B (zh) * 2011-07-07 2018-05-25 花王株式会社 脸印象分析方法、美容信息提供方法和脸图像生成方法
US9311564B2 (en) * 2012-10-05 2016-04-12 Carnegie Mellon University Face age-estimation and methods, systems, and software therefor
US20150359483A1 (en) * 2013-09-13 2015-12-17 Genocosmetics Lab Sl Methods and systems for improving perceived age based on phenotypic and genetic features of the skin
US9426040B2 (en) * 2014-01-06 2016-08-23 Cisco Technology, Inc. Mixed distributed/centralized routing techniques based on closed-loop feedback from a learning machine to avoid dark zones
CN105096304B (zh) * 2014-05-22 2018-01-02 华为技术有限公司 一种图像特征的估计方法和设备
WO2017000300A1 (en) * 2015-07-02 2017-01-05 Xiaoou Tang Methods and systems for social relation identification
CN106384080A (zh) * 2016-08-31 2017-02-08 广州精点计算机科技有限公司 一种基于卷积神经网络的表观年龄估计方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567719A (zh) * 2011-12-26 2012-07-11 东南大学 基于后验概率神经网络的人类年龄自动估计方法
US9514356B2 (en) * 2014-09-05 2016-12-06 Huawei Technologies Co., Ltd. Method and apparatus for generating facial feature verification model

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Cross-Age Face Verification by Coordinating with Cross-Face Age Verification";Du, Liang;《Proc of the IEEE Computer Society》;20151231;全文 *

Also Published As

Publication number Publication date
WO2019029459A1 (zh) 2019-02-14
US20190138787A1 (en) 2019-05-09
US11003890B2 (en) 2021-05-11
CN108399379A (zh) 2018-08-14

Similar Documents

Publication Publication Date Title
CN108399379B (zh) 用于识别面部年龄的方法、装置和电子设备
CN108229322B (zh) 基于视频的人脸识别方法、装置、电子设备及存储介质
CN108229296B (zh) 人脸皮肤属性识别方法和装置、电子设备、存储介质
US9449432B2 (en) System and method for identifying faces in unconstrained media
CN108399383B (zh) 表情迁移方法、装置存储介质及程序
WO2018121690A1 (zh) 对象属性检测、神经网络训练、区域检测方法和装置
CN108229297B (zh) 人脸识别方法和装置、电子设备、计算机存储介质
WO2017215668A1 (zh) 姿势估计方法和装置、计算机系统
US9311564B2 (en) Face age-estimation and methods, systems, and software therefor
WO2018219180A1 (zh) 确定人脸图像质量的方法和装置、电子设备和计算机存储介质
JP2020522285A (ja) 全身測定値抽出のためのシステムおよび方法
WO2020019765A1 (zh) 双目图像的深度估计方法及装置、设备、程序及介质
US8599255B2 (en) Video surveillance system based on Gaussian mixture modeling with two-type learning rate control scheme
WO2021196721A1 (zh) 一种舱内环境的调整方法及装置
CN108985190B (zh) 目标识别方法和装置、电子设备、存储介质
CN108228684B (zh) 聚类模型的训练方法、装置、电子设备和计算机存储介质
CN108491872B (zh) 目标再识别方法和装置、电子设备、程序和存储介质
CN114612743A (zh) 深度学习模型的训练方法、目标对象识别方法和装置
JP2007048172A (ja) 情報分類装置
Lin et al. A gender classification scheme based on multi-region feature extraction and information fusion for unconstrained images
CN111814653A (zh) 一种视频中异常行为的检测方法、装置、设备及存储介质
RU2768797C1 (ru) Способ и система для определения синтетически измененных изображений лиц на видео
US11676161B2 (en) Combined light and heavy models for image filtering
CN110232407B (zh) 图像处理方法和装置、电子设备和计算机存储介质
Khan et al. Critical Evaluation of Frontal Image-Based Gender Classification Techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: Room 1101-1117, 11 / F, No. 58, Beisihuan West Road, Haidian District, Beijing 100080

Patentee after: BEIJING SENSETIME TECHNOLOGY DEVELOPMENT Co.,Ltd.

Address before: Room 710-712, 7th floor, No. 1 Courtyard, Zhongguancun East Road, Haidian District, Beijing

Patentee before: BEIJING SENSETIME TECHNOLOGY DEVELOPMENT Co.,Ltd.

CP02 Change in the address of a patent holder