CN109271884A - 人脸属性识别方法、装置、终端设备和存储介质 - Google Patents

人脸属性识别方法、装置、终端设备和存储介质 Download PDF

Info

Publication number
CN109271884A
CN109271884A CN201810994638.XA CN201810994638A CN109271884A CN 109271884 A CN109271884 A CN 109271884A CN 201810994638 A CN201810994638 A CN 201810994638A CN 109271884 A CN109271884 A CN 109271884A
Authority
CN
China
Prior art keywords
age
convolutional neural
neural networks
recognition methods
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810994638.XA
Other languages
English (en)
Inventor
庄礼鸿
郭泽桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University of Technology
Original Assignee
Xiamen University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University of Technology filed Critical Xiamen University of Technology
Priority to CN201810994638.XA priority Critical patent/CN109271884A/zh
Publication of CN109271884A publication Critical patent/CN109271884A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K9/00Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
    • G06K9/00221Acquiring or recognising human faces, facial parts, facial sketches, facial expressions
    • G06K9/00228Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K9/00Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
    • G06K9/00221Acquiring or recognising human faces, facial parts, facial sketches, facial expressions
    • G06K9/00288Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computer systems based on biological models
    • G06N3/02Computer systems based on biological models using neural network models
    • G06N3/04Architectures, e.g. interconnection topology
    • G06N3/0454Architectures, e.g. interconnection topology using a combination of multiple neural nets
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K9/00Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
    • G06K9/00221Acquiring or recognising human faces, facial parts, facial sketches, facial expressions
    • G06K2009/00322Acquiring or recognising human faces, facial parts, facial sketches, facial expressions estimating age from face image; using age information for improving recognition

Abstract

本发明公开了一种人脸属性识别方法、装置、终端设备和存储介质,方法包括:获取视频流中的当前数据帧,从当前数据帧中捕捉人脸,并获取人脸区域图像。根据人脸区域图像提取人脸的特征信息,并将特征信息输入卷积神经网络模型。其中,所述卷积神经网络模型基于ResNet体系结构。根据所述卷积神经网络模型的输出结果获取人脸所对应的年龄以及性别。本发明能够在环境影响较大时,减少对年龄估计和性别检测误差。

Description

人脸属性识别方法、装置、终端设备和存储介质
技术领域
本发明涉及计算机领域,特别是涉及一种人脸属性识别方法、装置、终端设备和存储介质。
背景技术
社会日益进步的今天,随着科技日益发展,人工智能在我们身边扮演越来越重要的角色。为了能是人类的生活更加便利,人工智能机器人越来越广泛地使用到生活中。而人脸属性识别就是人工智能中的一类大项。人脸属性识别中的年龄估计和性别检测是人工智能和计算机视觉的重要方向。它有许多应用,例如公安取证,抓捕犯罪嫌疑人,人口统计等方面。年龄估计与性别测试与其他生物特征和面部属性识别密切相关,如种族分类、头发颜色辨别和表情识别。
现有技术中,大量的人脸属性识别研究,已经获得一些成果,并且有了fg-net,Adience,Groups等几个可靠性较强的人脸数据库。有一些标准数据集为人脸属性分析提供了分析方法,例如cross-age reference coding(跨年龄人脸识别编码),Morph等。由于人脸特征提取受环境影响较大,所以在高亮度和低亮度条件下对于明显的年龄估计和性别检测误差较大。
发明内容
本发明目的在于克服现有技术的不足,提供一种人脸属性识别方法、装置、终端设备和存储介质,能够在环境影响较大时,减少对年龄估计和性别检测误差。
第一方面,本发明提供一种人脸属性识别方法,包括:
获取视频流中的当前数据帧;
从所述当前数据帧中捕捉人脸,并获取人脸区域图像;
根据所述人脸区域图像提取人脸的特征信息;并将所述特征信息输入卷积神经网络模型;其中,所述卷积神经网络模型基于ResNet体系结构;
根据所述卷积神经网络模型的输出结果获取所述人脸所对应的年龄以及性别。
进一步地,从所述当前数据帧中捕捉人脸,并获取人脸区域图像,具体包括:
将人脸区域图像转换为灰度图;
检测灰度图中的人脸及其坐标;
裁剪面部区域,并向面部区域添加预定比例的边距。
进一步地,在获取视频流中的当前数据帧之前还包括:
构建基于ResNet体系结构的卷积神经网络模型;
利用具有年龄和性别标签的面部图像数据集对所述卷积神经网络模型进行训练;其中,所述面部图像数据集包括IMDB-WIKI数据集。
进一步地,所述卷积神经网络模型对年龄的分类包括N类;则通过将每类的年龄值乘以对应的每类的概率后求和计算以识别年龄。
进一步地,对预测年龄通过平均绝对误差算法以获取预测年龄。
第二方面,本发明提供一种机器人对人脸属性识别装置,其特征在于,包括:
获取模块,用于获取视频流中的当前数据帧;
捕捉模块,用于从所述当前数据帧中捕捉人脸,并获取人脸区域图像;
提取模块,用于根据所述人脸区域图像提取人脸的特征信息;并将所述特征信息输入卷积神经网络模型;其中,所述卷积神经网络模型基于ResNet体系结构;
输出模块,用于根据所述卷积神经网络模型的输出结果获取所述人脸所对应的年龄以及性别。
进一步地,所述捕捉模块,具体包括:
转换模块,用于将人脸区域图像转换为灰度图;
检测模块,用于检测灰度图中的人脸及其坐标;
裁剪模块,用于裁剪面部区域,并向面部区域添加预定比例的边距。
第三方面,本发明提供一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置由所述处理执行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的一种人脸属性识别方法。
进一步地,所述终端设备为NAO机器人。
第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如第一方面所述的人脸属性识别方法。
本发明采用上述技术方案,具有如下有益效果:
通过基于ResNet体系结构的卷积神经网络模型对人脸属性(性别和年龄)进行识别,能够在环境影响较大时,提高对年龄估计和性别检测度。所述ResNet体系结构的卷积神经网络模型,因为其准确率相对其他模型较高,能解决随着深度增加所带来的退化问题。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明第一实施例提供的一种人脸属性识别方法的流程示意图。
图2为本发明第二实施例提供的一种人脸属性识别装置的结构示意图。
图3为本发明实施例提供的卷积神经网络模型结构示意图。
图4为本发明实施例提供的黄种人人脸属性识别样本示意图。
图5为本发明实施例提供的黑种人人脸属性识别样本示意图。
图6为本发明实施例提供的白种人人脸属性识别样本示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明第一实施例:
参见图1,图1为本发明第一实施例提供的一种人脸属性识别方法的流程示意图。本发明提供一种人脸属性识别方法,具体包括:
S10,获取视频流中的当前数据帧。
在本实施例中,所述视频流是由一张张连续的图片组成的,每幅图片就是一帧,简单地说,帧数就是在1秒钟时间里传输的图片的帧数,也可以理解为图形处理器每秒钟能够刷新几次,通常用fps(Frames Per Second)表示。每一帧都是静止的图象,快速连续地显示帧便形成了运动的假象。在本实施例中,采用普通CMOS摄像头进行视频采集,使用opencv从摄像头提取图像,并作跟踪测试,图像分辨率采用CIF格式(352*288)24Bit真彩,长度为1-3min的30帧/s不同的视频流。
S20,当前数据帧中捕捉人脸,并获取人脸区域图像。
在本实施例中,所述捕捉人脸是指在一幅图像或视频流的一帧中检测出人像并将人像从背景中分离出来,并自动地将其保存。具体地,从所述当前数据帧中捕捉人脸,并获取人脸区域图像,具体包括:将人脸区域图像转换为灰度图,检测灰度图中的人脸及其坐标,裁剪面部区域,并向面部区域添加预定比例的边距。在本实施例中使用Dlib模块来检测图像中的人脸及其坐标,Dlib模块是一个包含机器学习算法的C++开源工具包。Dlib模块可以帮助您创建大量复杂的机器学习软件来解决实际问题。目前,Dlib模块广泛应用于工业和学术领域,包括机器人,嵌入式设备,手机和大型高性能计算环境所述预定比例的边距为添加40%的边距,用于可以框出整个头部。
当然,需要说明的是,由于灰度的差异,人脸图像中在人脸眼、嘴、头发、轮廓等处灰度较低,灰度与周围部分有一较大的梯度,灰度特征非常明显。基于此,我们会在转换为灰度图之前先对图像进行预处理,所述预处理包括:平滑处理去除图像中的噪声等、锐化处理对图像进行边缘增强等,二值化处理等。
S30,根据人脸区域图像提取人脸的特征信息;并将特征信息输入卷积神经网络模型;其中,卷积神经网络模型基于ResNet体系结构。
在本实施例中,所述特征信息包括:形状、运动、颜色、纹理和空间结构。所述ResNet体系结构的卷积神经网络,它比其他的体系结构要宽得多。它可以通过3x3像素的小卷积滤波器进行表征。因此,ResNet中的每个滤波器都可以捕捉到更简单的几何图形结构,相比其他算法,通过增加宽度可以进行更复杂的推理,减小学习损失,提高性能。
本实施例中,在获取视频流中的当前数据帧之前还包括:构建基于ResNet体系结构的卷积神经网络模型,利用具有年龄和性别标签的面部图像数据集对所述卷积神经网络模型进行训练;其中,所述面部图像数据集包括IMDB-WIKI数据集。IMDB-WIKI数据集,这是具有年龄和性别标签的面部图像的最大公共数据集。所述卷积神经网络(ConvolutionalNeural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。它包括卷积层(convolutional layer)和池化层(pooling layer)。CNN的基本结构包括两层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层,这种特有的两次特征提取结构减小了特征分辨率。
参见图3,本实施例中,所述卷积神经网络是一个成熟且强大的深度学习方法,其中包含着大量的运算,也有着大量的运算公式,每个卷积层有着自己的功能,本实施例中,使用的公式有Feedforward Pass前向传播公式,如这里表示第n个样本对应的标签的第k维。指示对应于第n个样本的网络输出的第k个输出。对于许多类型的问题,输出通常以“one-of-c”的形式组织,即只有与输入对应的类的输出节点为正。其他类的位或节点可以是0或负数,具体取决于输出层的激活函数。sigmoid就是0,tanh就是-1。是子采样层子采样层公式。有N个输出映射,但每个输出映射变小,而向下down(.)代表一个下采样函数。典型的操作通常是对输入图像的不同n×n块的所有像素求和。这样,输出图像在两个维度上都减少了n倍。每个输出映射对应于它自己的乘法偏差β和加性偏差b。而在卷积神经网络中,有一个比较重要且用处多多的公式,即近邻归一化(Local Response Normalization)的归一化方法公式,如式它主要发生在不同的相邻的卷积核(经过ReLu之后)的输出之间,即输入是发生在不同的经过ReLu之后的feature map中。其中:a(i,x,y)表示第ii个卷积核的输出(经过ReLu层)的feature map上的(x,y)位置的值;b(i,x,y)表示a(i,x,y)经LRN后的输出;N表示卷积核的数量,即输入的feature map的个数;n表示近邻的卷积核(或feature map)个数,由自己来决定;k,α,β是超参数,由用户自己调整或决定。
S40,根据卷积神经网络模型的输出结果获取所人脸所对应的年龄以及性别。
在本实施例中,所述卷积神经网络模型对年龄的分类包括N类;则通过将每类的年龄值乘以对应的每类的概率后求和计算以识别年龄。对于年龄的识别:卷积神经网络模型模型的输出是101个值的概率分布(年龄范围从0到100),所有101个值的概率合计为1(softmax)。因此,我们将每个年龄值乘以它的概率,然后加起来得到最终的识别年龄。而性别识别是二分类任务,卷积神经网络模型模型的输出值在0和1之间,输出值越高,卷积神经网络模型识别人脸为男性信心越强。
在本实施例中,对预测年龄通过平均绝对误差算法以获取预测年龄。需要说明的是,在本实施例中,在所述卷积神经网络模型训练中提取了一个平均绝对误差(MAE),这是估计的年龄与真实年龄之间绝对误差的平均值。MAE是文献中最常用的测量方法,是年龄估计的事实标准。其测量算法为:ε作为一个量化项来表示误差水平,ε适用于没有真实年龄和性别的数据集,去猜测他们真实年龄和性别的情况。它考虑了标记图像的人设定的年龄的标准偏差σ。因此,如果图像的标记年龄在测试中差异很大,那么错误的预测就会受到较少的训练。最终的错误是所有图像的平均值,他的数值为0到1之间的某个数字,如果为0,则为完全完全精准估计;如果为1,则为完全错误的估计。值越小,检测越精。用于图像网络分类任务的预训练的CNN(具有ResNet架构)具有1000个softmax标准化神经元的输出层,每个对象类别一个。相反,年龄估计是一个回归而不是分类问题,因为年龄是连续的而不是一组离散的类。
对于回归问题,我们用仅有1个输出神经元替换最后一层,并使用欧几里德损失函数。不幸的是,直接训练CNN用于回归是相对不稳定的,因为异常值会导致大的误差项。这导致非常大的梯度,这使网络难以收敛并导致不稳定的预测。取而代之,我们将预测问题转化分类问题,其中年龄值被离散化为年龄|Y|范围。每个年龄范围Yi涵盖从的一系列年龄。我在这个年龄范围内的所有训练样本的平均值Yi进行操作。在本实施例中,我们考虑:a)相同的范围,每个年龄范围涵盖相同的年数,b)平衡范围,使得每个年龄范围涵盖大约相同数量的训练样本,从而适合数据分布。年龄段的数量取决于训练集的大小,即每个年龄段需要足够多的训练样本,因此更精细的离散化需要更多的样本。通过这种方式,我们训练CNN进行分类,并且在测试时间,我们计算|Y|的softmax归一化输出概率的期望值:其中O={1,2,...,|Y|}是|Y|维输出层,oi∈O是神经元i的softmax归一化输出概率。
在本实施例中,性别检测则是一个纯粹的二分类问题,它需要用到大量的二分类器进行训练,误差情况相对与年龄估计要小许多,在性别检测中,我们一次使用每个分支的块大小和显示具有不同参数。现在块大小为M×M,所以局部映射函数为:通过直方图Hist(i)是CDF(i)的导数,可以得到公式:为了干扰,直方图必须满足以下公式:
参见图4至图6,具体地,本实施例中所述的测试结果如下:
如图4为本实验黄种人人脸属性识别样本,图5为黑种人样本,图6为白种人样本。在本实施例中提取22个样本作为参考,其中包括不同性别和年龄段的人群,同时由于各种种族人种人脸构造有些许差别,样本测试数据下表所示:
在本实施例中,误差统计表下表所示,在有限的样本内,性别检测的正确率达到了90%,而五岁以内年龄的正确率也能达到90%,还是一个较为不错的结果,但三岁以内年龄误差率达到了25%,是一个较大的误差率,还有许多需要改进的地方,通过使用实时检测时,往往会比较准,而由于样本年龄段范围不够大,通过使用了一部分的照片作为样本,照片比较大的问题第一个是像素不够,第二个是当足够高清的照片进行识别时,因为照片为光滑平面,所以会有一定的反光,导致识别出现误差,特别是当识别老年群体时,主要依据皱纹模型来提取人脸特征,由于像素和反光问题,皱纹太过细微,难以提取,导致误差过大总的来说,对于人脸属性识别,稳定的环境还是一个比骄傲重要的条件,因为人脸特征往往比较细微,难以提取,这时受环境影响往往较大。
本发明第二实施例:
本发明第二实施例提供一种机器人对人脸属性识别装置,包括:
获取模块10,用于获取视频流中的当前数据帧;
捕捉模块20,用于从所述当前数据帧中捕捉人脸,并获取人脸区域图像;
提取模块30,用于根据所述人脸区域图像提取人脸的特征信息;并将所述特征信息输入卷积神经网络模型;其中,所述卷积神经网络模型基于ResNet体系结构;
输出模块40,用于根据所述卷积神经网络模型的输出结果获取所述人脸所对应的年龄以及性别。
进一步地,所述捕捉模块20,具体包括:
转换模块,用于将人脸区域图像转换为灰度图;
检测模块,用于检测灰度图中的人脸及其坐标;
裁剪模块,用于裁剪面部区域,并向面部区域添加预定比例的边距。
优选地,在获取视频流中的当前数据帧之前还包括:
构建模块,用于构建基于ResNet体系结构的卷积神经网络模型;
利用模块,用于利用具有年龄和性别标签的面部图像数据集对所述卷积神经网络模型进行训练;其中,所述面部图像数据集包括IMDB-WIKI数据集。
优选地,所述卷积神经网络模型对年龄的分类包括N类;则通过将每类的年龄值乘以对应的每类的概率后求和计算以识别年龄。
优选地,对预测年龄通过平均绝对误差算法以获取预测年龄。
本发明第三实施例:
本发明第三实施例提供一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置由所述处理执行的计算机程序,所述处理器执行所述计算机程序时实现如本发明上述第一实施例中所述的人脸属性识别方法。
本发明第四实施例:
本发明第四实施例提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,例如一种人脸表情识别方法的程序。其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述第一实施例中所述的一种人脸属性识别方法。
示例性地,本发明第三实施例和第四实施例中所述的计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述实现服务器设备中的执行过程。例如,本发明第二实施例中所述的装置。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(APPlication Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述人脸属性识别方法的控制中心,利用各种接口和线路连接整个所述实现一种人脸属性识别方法的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现人脸属性识别方法的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、文字转换功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、文字消息数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述实现服务设备的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种人脸属性识别方法,其特征在于,包括:
获取视频流中的当前数据帧;
从所述当前数据帧中捕捉人脸,并获取人脸区域图像;
根据所述人脸区域图像提取人脸的特征信息;并将所述特征信息输入卷积神经网络模型;其中,所述卷积神经网络模型基于ResNet体系结构;
根据所述卷积神经网络模型的输出结果获取所述人脸所对应的年龄以及性别。
2.根据权利要求1所述的人脸属性识别方法,其特征在于,从所述当前数据帧中捕捉人脸,并获取人脸区域图像,具体包括:
将人脸区域图像转换为灰度图;
检测灰度图中的人脸及其坐标;
裁剪面部区域,并向面部区域添加预定比例的边距。
3.根据权利要求1所述的人脸属性识别方法,其特征在于,在获取视频流中的当前数据帧之前还包括:
构建基于ResNet体系结构的卷积神经网络模型;
利用具有年龄和性别标签的面部图像数据集对所述卷积神经网络模型进行训练;其中,所述面部图像数据集包括IMDB-WIKI数据集。
4.根据权利要求1所述的人脸属性识别方法,其特征在于,所述卷积神经网络模型对年龄的分类包括N类;则通过将每类的年龄值乘以对应的每类的概率后求和计算以识别年龄。
5.根据权利要求1所述的人脸属性识别方法,其特征在于,对预测年龄通过平均绝对误差算法以获取预测年龄。
6.一种机器人对人脸属性识别装置,其特征在于,包括:
获取模块,用于获取视频流中的当前数据帧;
捕捉模块,用于从所述当前数据帧中捕捉人脸,并获取人脸区域图像;
提取模块,用于根据所述人脸区域图像提取人脸的特征信息;并将所述特征信息输入卷积神经网络模型;其中,所述卷积神经网络模型基于ResNet体系结构;
输出模块,用于根据所述卷积神经网络模型的输出结果获取所述人脸所对应的年龄以及性别。
7.根据权利要求1所述的人脸属性识别装置,其特征在于,所述捕捉模块,具体包括:
转换模块,用于将人脸区域图像转换为灰度图;
检测模块,用于检测灰度图中的人脸及其坐标;
裁剪模块,用于裁剪面部区域,并向面部区域添加预定比例的边距。
8.一种终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置由所述处理执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的一种人脸属性识别方法。
9.根据权利要求8所述的终端设备,其特征在于,所述终端设备为NAO机器人。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至5中任意一项所述的人脸属性识别方法。
CN201810994638.XA 2018-08-29 2018-08-29 人脸属性识别方法、装置、终端设备和存储介质 Pending CN109271884A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810994638.XA CN109271884A (zh) 2018-08-29 2018-08-29 人脸属性识别方法、装置、终端设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810994638.XA CN109271884A (zh) 2018-08-29 2018-08-29 人脸属性识别方法、装置、终端设备和存储介质

Publications (1)

Publication Number Publication Date
CN109271884A true CN109271884A (zh) 2019-01-25

Family

ID=65154747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810994638.XA Pending CN109271884A (zh) 2018-08-29 2018-08-29 人脸属性识别方法、装置、终端设备和存储介质

Country Status (1)

Country Link
CN (1) CN109271884A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977781A (zh) * 2019-02-26 2019-07-05 上海上湖信息技术有限公司 人脸检测方法及装置、可读存储介质
CN110084216A (zh) * 2019-05-06 2019-08-02 苏州科达科技股份有限公司 人脸识别模型训练和人脸识别方法、系统、设备及介质
CN110111246A (zh) * 2019-05-15 2019-08-09 北京市商汤科技开发有限公司 一种虚拟头像生成方法及装置、存储介质
CN110472611A (zh) * 2019-08-21 2019-11-19 图谱未来(南京)人工智能研究院有限公司 人物属性识别的方法、装置、电子设备及可读存储介质
CN111626303A (zh) * 2020-05-29 2020-09-04 南京甄视智能科技有限公司 性别和年龄的识别方法、装置、存储介质及服务器
CN110084216B (zh) * 2019-05-06 2021-11-09 苏州科达科技股份有限公司 人脸识别模型训练和人脸识别方法、系统、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919897A (zh) * 2016-12-30 2017-07-04 华北电力大学(保定) 一种基于三级残差网络的人脸图像年龄估计方法
CN107766787A (zh) * 2016-08-16 2018-03-06 深圳云天励飞技术有限公司 人脸属性识别方法、装置、终端及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766787A (zh) * 2016-08-16 2018-03-06 深圳云天励飞技术有限公司 人脸属性识别方法、装置、终端及存储介质
CN106919897A (zh) * 2016-12-30 2017-07-04 华北电力大学(保定) 一种基于三级残差网络的人脸图像年龄估计方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RASMUS ROTHE ET AL;: "《Deep Expectation of Real and Apparent Age from a Single Image Without Facial Landmarks》", 《INTERNATIONAL JOURNAL OF COMPUTER VISION》 *
张珂 等;: "《非受限条件下多级残差网络人脸图像年龄估计》", 《计算机辅助设计与图形学学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977781A (zh) * 2019-02-26 2019-07-05 上海上湖信息技术有限公司 人脸检测方法及装置、可读存储介质
CN110084216A (zh) * 2019-05-06 2019-08-02 苏州科达科技股份有限公司 人脸识别模型训练和人脸识别方法、系统、设备及介质
CN110084216B (zh) * 2019-05-06 2021-11-09 苏州科达科技股份有限公司 人脸识别模型训练和人脸识别方法、系统、设备及介质
CN110111246A (zh) * 2019-05-15 2019-08-09 北京市商汤科技开发有限公司 一种虚拟头像生成方法及装置、存储介质
CN110472611A (zh) * 2019-08-21 2019-11-19 图谱未来(南京)人工智能研究院有限公司 人物属性识别的方法、装置、电子设备及可读存储介质
CN111626303A (zh) * 2020-05-29 2020-09-04 南京甄视智能科技有限公司 性别和年龄的识别方法、装置、存储介质及服务器
CN111626303B (zh) * 2020-05-29 2021-04-13 南京甄视智能科技有限公司 性别和年龄的识别方法、装置、存储介质及服务器

Similar Documents

Publication Publication Date Title
Lu et al. Dense and sparse reconstruction error based saliency descriptor
US10282589B2 (en) Method and system for detection and classification of cells using convolutional neural networks
CN105447473B (zh) 一种基于PCANet-CNN的任意姿态人脸表情识别方法
CN109271884A (zh) 人脸属性识别方法、装置、终端设备和存储介质
Shao et al. Performance evaluation of deep feature learning for RGB-D image/video classification
US8805018B2 (en) Method of detecting facial attributes
CN104992223A (zh) 基于深度学习的密集人数估计方法
CN107292298A (zh) 基于卷积神经网络和分类器模型的牛脸识别方法
CN108108807B (zh) 学习型图像处理方法、系统及服务器
Banan et al. Deep learning-based appearance features extraction for automated carp species identification
CN104504395A (zh) 基于神经网络实现人车分类的方法和系统
CN110135319A (zh) 一种异常行为检测方法及其系统
CN111091109A (zh) 基于人脸图像进行年龄和性别预测的方法、系统和设备
CN109145837A (zh) 人脸情感识别方法、装置、终端设备和存储介质
Kishore et al. Selfie sign language recognition with convolutional neural networks
Salunke et al. A new approach for automatic face emotion recognition and classification based on deep networks
CN112598713A (zh) 一种基于深度学习的近岸海底鱼类检测、跟踪统计方法
CN109101938B (zh) 一种基于卷积神经网络的多标签年龄估计方法
Hsueh et al. Human behavior recognition from multiview videos
Lu et al. Multi-object detection method based on YOLO and resNet hybrid networks
CN111340051A (zh) 图片处理方法、装置及存储介质
CN110163095A (zh) 回环检测方法、回环检测装置及终端设备
Gowda Age estimation by LS-SVM regression on facial images
Niu et al. Automatic localization of optic disc based on deep learning in fundus images
CN112613341A (zh) 训练方法及装置、指纹识别方法及装置、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination