CN112257503A - 一种性别年龄识别方法、装置及存储介质 - Google Patents
一种性别年龄识别方法、装置及存储介质 Download PDFInfo
- Publication number
- CN112257503A CN112257503A CN202010975955.4A CN202010975955A CN112257503A CN 112257503 A CN112257503 A CN 112257503A CN 202010975955 A CN202010975955 A CN 202010975955A CN 112257503 A CN112257503 A CN 112257503A
- Authority
- CN
- China
- Prior art keywords
- neural network
- gender
- image
- face detection
- convolutional neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000001514 detection method Methods 0.000 claims abstract description 83
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 76
- 238000012549 training Methods 0.000 claims abstract description 37
- 238000013528 artificial neural network Methods 0.000 claims abstract description 23
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000005286 illumination Methods 0.000 claims description 18
- 238000003062 neural network model Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 10
- 238000011176 pooling Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 5
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims 2
- 230000008034 disappearance Effects 0.000 abstract description 7
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 235000019504 cigarettes Nutrition 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 208000016615 Central areolar choroidal dystrophy Diseases 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000004709 eyebrow Anatomy 0.000 description 1
- 210000000887 face Anatomy 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种性别年龄识别方法、装置及存储介质,方法包括:构建并训练用于性别年龄识别的卷积神经网络,其中,所述卷积神经网络中包含有残差模块;获取待识别图像,通过预先训练的级联神经网络对所述待识别图像进行人脸检测获得人脸检测图像;对所述人脸检测图像进行预处理,获得预处理后的人脸检测图像;将预处理后的人脸检测图像输入至已训练完成的所述用于性别年龄识别的卷积神经网络中,输出所述人脸检测图像中的性别判断结果和年龄估计结果。本发明实施例通过采用具有残差模块的卷积神经网络对目标人脸进行性别年龄识别,解决了网络加深导致的梯度消失问题,克服了传统算法的局限性,使得性别年龄识别更为快速、准确、可靠。
Description
技术领域
本发明涉及人脸属性识别技术领域,尤其涉及一种性别年龄识别方法、装置及存储介质。
背景技术
基于人脸图像的研究,包括人脸检测、身份认证、人脸属性等识别问题成为人机交互等领域的研究热点,其中性别识别与年龄估计技术在人机交互领域有着广泛的应用需求,例如购物网站可根据性别年龄识别结果推送相应的商品提高成交率,烟酒自动售卖机可根据年龄估计结果拒绝向未成人出售烟酒等等。
目前,对于性别年龄的识别一般通过人物的面部图像或肢体图像来进行,通过识别人脸面部器官之间的距离来对年龄和性别进行识别,但是由于图像数据较大、所采用的神经网络深度加深,可能导致在识别过程中出现梯度消失的问题,严重影响了性别年龄识别的准确性和可靠性。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种性别年龄识别方法、装置及存储介质,旨在解决现有技术中由于梯度消失导致的性别年龄识别效率以及准确率较低的问题。
本发明的技术方案如下:
一种性别年龄识别方法,其包括如下步骤:
构建并训练用于性别年龄识别的卷积神经网络,其中,所述卷积神经网络中包含有残差模块;
获取待识别图像,通过预先训练的级联神经网络对所述待识别图像进行人脸检测获得人脸检测图像;
对所述人脸检测图像进行预处理,获得预处理后的人脸检测图像;
将预处理后的人脸检测图像输入至已训练完成的所述用于性别年龄识别的卷积神经网络中,输出所述人脸检测图像中的性别判断结果和年龄估计结果。
所述的性别年龄识别方法中,所述用于性别年龄识别的卷积神经网络包括依次连接的卷积层、池化层、残差模块、全局平均池化层、全连接层以及分类层。
所述的性别年龄识别方法中,所述残差模块包括依次连接的第一残差子模块、第二残差子模块、第三残差子模块和第四残差子模块,每个子模块各自均包括依次连接的第一残差块和第二残差块。
所述的性别年龄识别方法中,所述构建并训练用于性别年龄识别的卷积神经网络,包括:
获取多个年龄段均衡分布的训练样本,且对所述训练样本进行性别标记;
构造所述用于性别年龄识别的卷积神经网络并获得初始权重参数,并将所述训练样本输入至所述卷积神经网络中;
通过预设损失函数对所述卷积神经网络的输出值进行误差评价,根据误差结果反向传播调节所述卷积神经网络的权重参数,直到所述卷积神经网络的输出值达到期望值,得到训练完成后的用于性别年龄识别的卷积神经网络。
所述的性别年龄识别方法中,所述构造所述用于性别年龄识别的卷积神经网络并获得初始权重参数,具体包括:
构造所述用于性别年龄识别的卷积神经网络,在Imagenet数据集上对所述用于性别年龄识别的卷积神经网络进行预训练,使所述用于性别年龄识别的卷积神经网络具有图像特征提取能力,获得初始权重参数。
所述的性别年龄识别方法中,所述获取待识别图像,通过预先训练的级联神经网络对所述待识别图像进行人脸检测获得人脸检测图像,包括:
获取待识别图像,将所述待识别图像输入至预先训练的MobileNet级联神经网络模型中,其中所述MobileNet级联神经网络模型的卷积层为Depthwise SeparableConvolution;
通过所述预先训练的MobileNet级联神经网络模型中的第一神经网络对所述待识别图像中的人脸位置进行定位,根据定位结果对所述待识别图像进行裁剪获得人脸区域图像;
通过所述预先训练的MobileNet级联神经网络模型中的第二神经网络对所述人脸区域图像中的人脸关键点进行定位,输出人脸检测图像。
所述的性别年龄识别方法中,所述对所述人脸检测图像进行预处理,获得预处理后的人脸检测图像,包括:
预先定义标准人脸的关键点位置和光照条件;
通过预设的图像变换算法将当前所述人脸检测图像的关键点位置对齐至标准人脸的关键点位置,获得对齐后的人脸检测图像;
根据所述标准人脸的光照条件对所述对齐后的人脸检测图像进行光线校正处理,得到光照条件与标准人脸一致的人脸检测图像;
对经光线校正处理后的人脸检测图像依次进行图像灰度化和图像归一化处理。
本发明又一实施例还提供了一种性别年龄识别装置,所述装置包括至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述性别年龄识别方法。
本发明的另一实施例还提供了一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行上述的性别年龄识别方法。
本发明的另一实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,使所述处理器执行上述的性别年龄识别方法。
有益效果:本发明公开了一种性别年龄识别方法、装置及存储介质,相比于现有技术,本发明实施例通过采用具有残差模块的卷积神经网络对目标人脸进行性别年龄识别,解决了网络加深导致的梯度消失问题,克服了传统算法的局限性,使得性别年龄识别更为快速、准确、可靠。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明提供的性别年龄识别方法较佳实施例的流程图;
图2为本发明提供的性别年龄识别装置较佳实施例的硬件结构示意图。
具体实施方式
为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。以下结合附图对本发明实施例进行介绍。
请参阅图1,图1为本发明提供的性别年龄识别方法较佳实施例的流程图。如图1所示,其包括如下步骤:
S100、构建并训练用于性别年龄识别的卷积神经网络,其中,所述卷积神经网络中包含有残差模块;
S200、获取待识别图像,通过预先训练的级联神经网络对所述待识别图像进行人脸检测获得人脸检测图像;
S300、对所述人脸检测图像进行预处理,获得预处理后的人脸检测图像;
S400、将预处理后的人脸检测图像输入至已训练完成的所述用于性别年龄识别的卷积神经网络中,输出所述人脸检测图像中的性别判断结果和年龄估计结果。
本实施例中,首先构建并训练用于性别年龄识别的卷积神经网络,通过该卷积神经网络实现后续的性别年龄识别,之后获取待识别图像,通过预先训练的级联神经网络对所述待识别图像进行人脸检测获得人脸检测图像,之后对所述人脸检测图像进行预处理,获得预处理后的人脸检测图像,将预处理后的人脸检测图像输入至已经训练完成的所述用于性别年龄识别的卷积神经网络进行性别年龄识别处理,输出所述人脸检测图像中的性别分类以及年龄段估计结果。特别地,本发明提供的性别年龄识别方法中,所述卷积神经网络中包含有残差模块,通过所述残差模块进行特征提取可有效解决梯度消失的问题,有效克服了传统方法的局限性,同时在进行人脸检测获取人脸检测图像后,先对该人脸检测图像进行预处理后再输入至卷积神经网络进行性别年龄识别,进一步消除待识别图像中由于姿势、光照等信息的干扰,使得性别年龄识别结果更加准确可靠。
进一步地,所述用于性别年龄识别的卷积神经网络包括依次连接的卷积层、池化层、残差模块、全局平均池化层、全连接层以及分类层。其中所述卷积层用于对经过预处理后的人脸检测图像进行卷积处理,获得人脸语义特征,所述池化层用于对所述人脸语义特征进行下采样操作,获得降维后的人脸语义特征,所述残差模块用于对所述降维后的人脸语义特征进行特征提取,获得人脸特征向量,所述全局平均池化层用于将所述人脸特征向量转换为预设维数的人脸特征向量,所述全连接层用于对所述预设维数的人脸特征向量进行降维处理,所述分类层用于全连接层输出的人脸特征向量进行性别分类以及年龄估计,输出性别分类结果和年龄段估计结果。
优选地,本发明提供的性别年龄识别方法中,所述卷积神经网络进一步增加了预设网络深度,即采用了加深的卷积神经网络进行特征提取和识别,随着网络深度的增加可有效增大感受野,使得提取出来的特征具有更多的细节,同时由于加入了残差模块,网络深度的加深并不会导致梯度消失,因此可确保特征提取结果的可靠性。具体实施时,所述用于性别年龄识别的卷积神经网络新加入一个卷积核为1*1的卷积层。即本实施例中所采用的卷积神经网络,通过该1*1的卷积层使输入增加了非线性表达,加深了网络深度,可提取更多细节特征,在提高了神经网络表达能力的同时计算量也没有显著增加,不影响原先的计算速度,同时保证了性别年龄识别的效率和准确率。
具体所述残差模块包括依次连接的第一残差子模块、第二残差子模块、第三残差子模块和第四残差子模块,每个子模块各自均包括依次连接的第一残差块和第二残差块,通过多层残差结构解决深层次网络难以收敛到最优解的问题,可充分利用深层次网络更强表达能力的优势,实现高准确率的性别分类与年龄估计。
优选地,所述分类层可采用Softmax分类器,分类过程具体为,将全连接层输出的人脸特征向量作为输入样本输入至分类器,分类器中具有多个神经元以对应不同的性别以及若干个年龄段,年龄段可划分为儿童(0-7岁)、少年(8-15岁)、青年(16-25岁)、壮年(26-35岁)、盛年(36-45岁)、中年(46-60岁)、老年(>60岁),每个神经元输出一个取值在0到1之间的数值,该数值代表了输入样本属于该类的概率,分别选取性别分类以及年龄段分类中输出值最大的神经元所对应的类别,将其作为当前输入样本的性别分类结果以及年龄段估计结果,实现更准确的性别年龄识别。
进一步地,所述构建并训练用于性别年龄识别的卷积神经网络,包括:
获取多个年龄段均衡分布的训练样本,且对所述训练样本进行性别标记;
构造所述用于性别年龄识别的卷积神经网络并获得初始权重参数,并将所述训练样本输入至所述卷积神经网络中;
通过预设损失函数对所述卷积神经网络的输出值进行误差评价,根据误差结果反向传播调节所述卷积神经网络的权重参数,直到所述卷积神经网络的输出值达到期望值,得到训练完成后的用于性别年龄识别的卷积神经网络。
本实施例中,先获取用于训练卷积神经网络的训练数据,该训练数据为多个年龄段均衡分布的训练样本,且对所述训练样本进行性别标记,即提前采集多个年龄段下不同性别的人脸样本,例如每个年龄段内不同性别的人脸分别获取至少100张作为训练样本,具体所述训练样本可采用FGNET数据库、MORPH数据库、CACD数据库等等,大量的训练数据可避免了过度拟合,提高识别准确性;之后构造所述用于性别年龄识别的卷积神经网络并获得初始权重参数,将已知性别分类和年龄段的训练样本输入至所述卷积神经网络中进行学习训练,即通过所述训练样本对加深的卷积神经网络进行训练,通过预设损失函数对所述卷积神经网络的输出值进行误差评价,根据误差结果反向传播调节所述卷积神经网络的权重参数,直到所述卷积神经网络的输出值达到期望值,得到训练完成后的用于性别年龄识别的卷积神经网络,具体所述预设损失函数可采用例如softmax损失函数对卷积神经网络的输出值进行误差评价,通过输入信号的前向传播计算每个节点的值,计算输出误差后进行误差的反向传播,根据误差梯度下降法调节卷积神经网络各层的权重参数,反复调节后使得卷积神经网络的最终输出至达到期望值,从而完成卷积神经网络的训练得到最终用于性别年龄识别的模型。
进一步地,所述构造所述用于性别年龄识别的卷积神经网络并获得初始权重参数,具体包括:
构造所述用于性别年龄识别的卷积神经网络,在Imagenet数据集上对所述用于性别年龄识别的卷积神经网络进行预训练,使所述用于性别年龄识别的卷积神经网络具有图像特征提取能力,获得初始权重参数。
即在训练开始的时候,先在具有150万数据量的Imagenet数据集上进行预训练,通过在Imagenet数据集上进行预训练,使得所构建的卷积神经网络具备对图像特征提取的能力,可以为后续学习训练提供较好的初始权重参数,一个好的初始值可有效提高网络学习训练的效率和准确性,使得所构建的用于性别年龄识别的卷积神经网络可快速收敛获得最优参数,获得最优的特征提取及识别模型。
进一步地,所述获取待识别图像,通过预先训练的级联神经网络对所述待识别图像进行人脸检测获得人脸检测图像,包括:
获取待识别图像,将所述待识别图像输入至预先训练的MobileNet级联神经网络模型中,其中所述MobileNet级联神经网络模型的卷积层为Depthwise SeparableConvolution;
通过所述预先训练的MobileNet级联神经网络模型中的第一神经网络对所述待识别图像中的人脸位置进行定位,根据定位结果对所述待识别图像进行裁剪获得人脸区域图像;
通过所述预先训练的MobileNet级联神经网络模型中的第二神经网络对所述人脸区域图像中的人脸关键点进行定位,输出待识别人脸图像。
本实施例中,在进行人脸区域检测和人脸关键点检测时,预先对级联神经网络模型进行训练,其中所述级联神经网络模型包括第一神经网络和第二神经网络分别用于人脸区域检测和人脸关键点检测,两个神经网络采用级联的方式实现由粗略到精细的人脸检测,通过训练数据集分别对两个神经网络进行训练直到收敛后,获得最终的用于人脸检测的级联神经网络模型,其中,所述级联神经网络模型的卷积层为Mobilenet系列中的Depthwise Separable Convolution(深度可分离卷积结构),即通过Depthwise和Pointwise卷积来代替Pnet、Rnet和Onet中的Sptial卷积,大幅度提升网络计算速度,将获取的待识别图像输入至所述级联神经网络模型中,通过第一神经网络对所述待识别图像中的人脸位置进行定位,根据定位结果对所述待识别图像进行裁剪获得人脸区域图像,其中,所述人脸位置指的是人脸在图像中所处位置的信息,通常包括人脸左上角或中心点在图像中的像素坐标,以及人脸的长度和宽度等,根据这些定位信息对待识别图像进行裁剪,去除不包含人像的区域获得人脸区域图像,之后通过第二神经网络对所述人脸区域图像中的人脸关键点进行定位,输出待识别人脸图像,其中所述人脸关键点包括眼睛、鼻尖、嘴角尖、眉毛以及脸部轮廓的坐标值,这些人脸关键点的位置可以用来指示人脸的姿态、标签,可使用这些信息对人脸图像进行进一步的校正以便后期的人脸特征提取,确保性别年龄识别准确性。
进一步地,所述对所述人脸检测图像进行预处理,获得预处理后的人脸检测图像,包括:
预先定义标准人脸的关键点位置和光照条件;
通过预设的图像变换算法将当前所述人脸检测图像的关键点位置对齐至标准人脸的关键点位置,获得对齐后的人脸检测图像;
根据所述标准人脸的光照条件对所述对齐后的人脸检测图像进行光线校正处理,得到光照条件与标准人脸一致的人脸检测图像;
对经光线校正处理后的人脸检测图像依次进行图像灰度化和图像归一化处理。
本实施例中,在进行性别年龄识别前,先对待识别的人脸检测图像进行预处理,以消除外界环境以及人体姿态对性别年龄识别准确率的影响,具体先预先定义标准人脸的关键点位置和光照条件,例如证件照的关键点位置和光照条件,之后通过预设的图像变换算法将当前所述人脸检测图像的关键点位置对齐至标准人脸的关键点位置,获得对齐后的人脸检测图像,从而达到校正人脸姿态的目的,本实施例中所述图像变换算法可以是相似变换、仿射变换等基本的图像变换方法或组合,或者在其他实施例中,也可直接通过Landmarks对齐实现姿态校正,具体为在检测到的人脸上进行Landmarks检测,获得一系列的Landmarks点,利用检测到的Landmarks点和标准模板姿态的Landmarks点计算仿射矩阵H,然后利用仿射矩阵H直接计算得到对齐后的图像,从而实现人脸姿态的校正,尽量消除人脸姿态对性别年龄识别准确率的影响。
同时,还根据所述标准人脸的光照条件对所述对齐后的人脸检测图像进行光线校正处理,得到光照条件与标准人脸一致的人脸检测图像,即通过光线校正,使得经过对齐处理后的人脸影像的光照条件变换至所述标准人脸具有的光照条件,例如可以使用伽玛值来对图像像素值进行校正调整,使处理后的图像具有合适的对比度,人脸细节清晰可见,需说明的是,姿态校正和光线校正的操作次数不限,直到达到预期效果为止,在进行姿态校正和光线校正后,进一步对所述人脸检测图像依次进行图像灰度化和图像归一化处理,其中图像灰度化为通过例如直方图、灰度变化、正交变换等将R、G、B三维彩色图像转换为以灰度值表示的二维灰度图像,进行图像灰度化处理会大大减小后续工作的计算量,进一步减小图像受光照的影响,提高处理效率;图像归一化则是采用线性归一化算法对所述二维灰度图像进行归一化处理,得到固定像素的图像,进行图像归一化处理可归纳统一图像样本的统计分布性,使具有不同物理意义和量纲的输入能够平等使用,通过图像预处理操作,可弥补待识别的人脸检测图像由于采集的环境不同,如光照、设备性能差异等因素对图像的影响,去除干扰信息提高图像对比度,进而提高性别年龄识别准确率。
本发明另一实施例提供一种性别年龄识别装置,如图2所示,装置10包括:
一个或多个处理器110以及存储器120,图2中以一个处理器110为例进行介绍,处理器110和存储器120可以通过总线或者其他方式连接,图2中以通过总线连接为例。
处理器110用于完成装置10的各种控制逻辑,其可以为通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、单片机、ARM(Acorn RISCMachine)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。还有,处理器110还可以是任何传统处理器、微处理器或状态机。处理器110也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP核、或任何其它这种配置。
存储器120作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的性别年龄识别方法对应的程序指令。处理器110通过运行存储在存储器120中的非易失性软件程序、指令以及单元,从而执行装置10的各种功能应用以及数据处理,即实现上述方法实施例中的性别年龄识别方法。
存储器120可以包括存储程序区和存储数据区,其中,存储程序区可存储操作装置、至少一个功能所需要的应用程序;存储数据区可存储根据装置10使用所创建的数据等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器120可选包括相对于处理器110远程设置的存储器,这些远程存储器可以通过网络连接至装置10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个单元存储在存储器120中,当被一个或者多个处理器110执行时,执行上述任意方法实施例中的性别年龄识别方法,例如,执行以上描述的图1中的方法步骤S100至步骤S400。
本发明实施例提供了一种非易失性计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如,执行以上描述的图1中的方法步骤S100至步骤S400。
作为示例,非易失性存储介质能够包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦ROM(EEPROM)或闪速存储器。易失性存储器能够包括作为外部高速缓存存储器的随机存取存储器(RAM)。通过说明丽非限制,RAM可以以诸如同步RAM(SRAM)、动态RAM、(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、Synchlink DRAM(SLDRAM)以及直接Rambus(兰巴斯)RAM(DRRAM)之类的许多形式得到。本文中所描述的操作环境的所公开的存储器组件或存储器旨在包括这些和/或任何其他适合类型的存储器中的一个或多个。
本发明的另一种实施例提供了一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被处理器执行时,使所述处理器执行上述方法实施例的性别年龄识别方法。例如,执行以上描述的图1中的方法步骤S100至步骤S400。
综上所述,本发明公开的性别年龄识别方法、装置及存储介质中,所述方法包括:构建并训练用于性别年龄识别的卷积神经网络,其中,所述卷积神经网络中包含有残差模块;获取待识别图像,通过预先训练的级联神经网络对所述待识别图像进行人脸检测获得人脸检测图像;对所述人脸检测图像进行预处理,获得预处理后的人脸检测图像;将预处理后的人脸检测图像输入至已训练完成的所述用于性别年龄识别的卷积神经网络中,输出所述人脸检测图像中的性别判断结果和年龄估计结果。本发明实施例通过采用具有残差模块的卷积神经网络对目标人脸进行性别年龄识别,解决了网络加深导致的梯度消失问题,克服了传统算法的局限性,使得性别年龄识别更为快速、准确、可靠。
以上所描述的实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施例的描述,本领域的技术人员可以清楚地了解到各实施例可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件实现。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存在于计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机电子设备(可以是个人计算机,服务器,或者网络电子设备等)执行各个实施例或者实施例的某些部分的方法。
除了其他之外,诸如"能够'、"能"、"可能"或"可以"之类的条件语言除非另外具体地陈述或者在如所使用的上下文内以其他方式理解,否则一般地旨在传达特定实施方式能包括(然而其他实施方式不包括)特定特征、元件和/或操作。因此,这样的条件语言一般地不旨在暗示特征、元件和/或操作对于一个或多个实施方式无论如何都是需要的或者一个或多个实施方式必须包括用于在有或没有学生输入或提示的情况下判定这些特征、元件和/或操作是否被包括或者将在任何特定实施方式中被执行的逻辑。
已经在本文中在本说明书和附图中描述的内容包括能够提供性别年龄识别方法、装置及存储介质的示例。当然,不能够出于描述本公开的各种特征的目的来描述元件和/或方法的每个可以想象的组合,但是可以认识到,所公开的特征的许多另外的组合和置换是可能的。因此,显而易见的是,在不脱离本公开的范围或精神的情况下能够对本公开做出各种修改。此外,或在替代方案中,本公开的其他实施例从对本说明书和附图的考虑以及如本文中所呈现的本公开的实践中可能是显而易见的。意图是,本说明书和附图中所提出的示例在所有方面被认为是说明性的而非限制性的。尽管在本文中采用了特定术语,但是它们在通用和描述性意义上被使用并且不用于限制的目的。
Claims (10)
1.一种性别年龄识别方法,其特征在于,包括如下步骤:
构建并训练用于性别年龄识别的卷积神经网络,其中,所述卷积神经网络中包含有残差模块;
获取待识别图像,通过预先训练的级联神经网络对所述待识别图像进行人脸检测获得人脸检测图像;
对所述人脸检测图像进行预处理,获得预处理后的人脸检测图像;
将预处理后的人脸检测图像输入至已训练完成的所述用于性别年龄识别的卷积神经网络中,输出所述人脸检测图像中的性别判断结果和年龄估计结果。
2.根据权利要求1所述的性别年龄识别方法,其特征在于,所述用于性别年龄识别的卷积神经网络包括依次连接的卷积层、池化层、残差模块、全局平均池化层、全连接层以及分类层。
3.根据权利要求2所述的性别年龄识别方法,其特征在于,所述残差模块包括依次连接的第一残差子模块、第二残差子模块、第三残差子模块和第四残差子模块,每个子模块各自均包括依次连接的第一残差块和第二残差块。
4.根据权利要求1所述的性别年龄识别方法,其特征在于,所述构建并训练用于性别年龄识别的卷积神经网络,包括:
获取多个年龄段均衡分布的训练样本,且对所述训练样本进行性别标记;
构造所述用于性别年龄识别的卷积神经网络并获得初始权重参数,并将所述训练样本输入至所述卷积神经网络中;
通过预设损失函数对所述卷积神经网络的输出值进行误差评价,根据误差结果反向传播调节所述卷积神经网络的权重参数,直到所述卷积神经网络的输出值达到期望值,得到训练完成后的用于性别年龄识别的卷积神经网络。
5.根据权利要求4所述的性别年龄识别方法,其特征在于,所述构造所述用于性别年龄识别的卷积神经网络并获得初始权重参数,具体包括:
构造所述用于性别年龄识别的卷积神经网络,在Imagenet数据集上对所述用于性别年龄识别的卷积神经网络进行预训练,使所述用于性别年龄识别的卷积神经网络具有图像特征提取能力,获得初始权重参数。
6.根据权利要求1所述的性别年龄识别方法,其特征在于,所述获取待识别图像,通过预先训练的级联神经网络对所述待识别图像进行人脸检测获得人脸检测图像,包括:
获取待识别图像,将所述待识别图像输入至预先训练的MobileNet级联神经网络模型中,其中所述MobileNet级联神经网络模型的卷积层为Depthwise SeparableConvolution;
通过所述预先训练的MobileNet级联神经网络模型中的第一神经网络对所述待识别图像中的人脸位置进行定位,根据定位结果对所述待识别图像进行裁剪获得人脸区域图像;
通过所述预先训练的MobileNet级联神经网络模型中的第二神经网络对所述人脸区域图像中的人脸关键点进行定位,输出人脸检测图像。
7.根据权利要求6所述的性别年龄识别方法,其特征在于,所述对所述人脸检测图像进行预处理,获得预处理后的人脸检测图像,包括:
预先定义标准人脸的关键点位置和光照条件;
通过预设的图像变换算法将当前所述人脸检测图像的关键点位置对齐至标准人脸的关键点位置,获得对齐后的人脸检测图像;
根据所述标准人脸的光照条件对所述对齐后的人脸检测图像进行光线校正处理,得到光照条件与标准人脸一致的人脸检测图像;
对经光线校正处理后的人脸检测图像依次进行图像灰度化和图像归一化处理。
8.一种性别年龄识别装置,其特征在于,所述装置包括至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7任一项所述的性别年龄识别方法。
9.一种非易失性计算机可读存储介质,其特征在于,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行权利要求1-7任一项所述的性别年龄识别方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,使所述处理器执行权利要求1-7任一项所述的性别年龄识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010975955.4A CN112257503A (zh) | 2020-09-16 | 2020-09-16 | 一种性别年龄识别方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010975955.4A CN112257503A (zh) | 2020-09-16 | 2020-09-16 | 一种性别年龄识别方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112257503A true CN112257503A (zh) | 2021-01-22 |
Family
ID=74232955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010975955.4A Pending CN112257503A (zh) | 2020-09-16 | 2020-09-16 | 一种性别年龄识别方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112257503A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784778A (zh) * | 2021-01-28 | 2021-05-11 | 北京百度网讯科技有限公司 | 生成模型并识别年龄和性别的方法、装置、设备和介质 |
CN112926478A (zh) * | 2021-03-08 | 2021-06-08 | 新疆爱华盈通信息技术有限公司 | 性别识别方法、系统、电子装置及存储介质 |
CN113033498A (zh) * | 2021-04-30 | 2021-06-25 | 中国工商银行股份有限公司 | 客户身份特征识别方法及装置 |
CN113408804A (zh) * | 2021-06-24 | 2021-09-17 | 广东电网有限责任公司 | 窃电行为检测方法、系统、终端设备及存储介质 |
CN113456031A (zh) * | 2021-08-09 | 2021-10-01 | 首都医科大学附属北京天坛医院 | 一种脑状态预测模型的训练装置、预测装置及电子设备 |
CN113657457A (zh) * | 2021-07-27 | 2021-11-16 | 上海明略人工智能(集团)有限公司 | 局部人脸的匹配方法、系统、存储介质及电子设备 |
CN113743236A (zh) * | 2021-08-11 | 2021-12-03 | 交控科技股份有限公司 | 乘客画像分析方法、装置、电子设备和计算机可读存储介质 |
CN114677724A (zh) * | 2022-03-02 | 2022-06-28 | 南京邮电大学 | 一种基于人脸年龄检测的公交专座语音播报方法与装置 |
CN116524327A (zh) * | 2023-06-25 | 2023-08-01 | 云账户技术(天津)有限公司 | 人脸识别模型的训练方法、装置、电子设备及存储介质 |
WO2024001365A1 (zh) * | 2022-06-28 | 2024-01-04 | 魔门塔(苏州)科技有限公司 | 参数检测方法和设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107247949A (zh) * | 2017-08-02 | 2017-10-13 | 北京智慧眼科技股份有限公司 | 基于深度学习的人脸识别方法、装置和电子设备 |
CN108764139A (zh) * | 2018-05-29 | 2018-11-06 | Oppo(重庆)智能科技有限公司 | 一种人脸检测方法、移动终端及计算机可读存储介质 |
CN109271884A (zh) * | 2018-08-29 | 2019-01-25 | 厦门理工学院 | 人脸属性识别方法、装置、终端设备和存储介质 |
CN109919048A (zh) * | 2019-02-21 | 2019-06-21 | 北京以萨技术股份有限公司 | 一种基于级联MobileNet-V2实现人脸关键点检测的方法 |
CN111027490A (zh) * | 2019-12-12 | 2020-04-17 | 腾讯科技(深圳)有限公司 | 人脸属性识别方法及装置、存储介质 |
CN111339813A (zh) * | 2019-09-30 | 2020-06-26 | 深圳市商汤科技有限公司 | 人脸属性识别方法、装置、电子设备和存储介质 |
-
2020
- 2020-09-16 CN CN202010975955.4A patent/CN112257503A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107247949A (zh) * | 2017-08-02 | 2017-10-13 | 北京智慧眼科技股份有限公司 | 基于深度学习的人脸识别方法、装置和电子设备 |
CN108764139A (zh) * | 2018-05-29 | 2018-11-06 | Oppo(重庆)智能科技有限公司 | 一种人脸检测方法、移动终端及计算机可读存储介质 |
CN109271884A (zh) * | 2018-08-29 | 2019-01-25 | 厦门理工学院 | 人脸属性识别方法、装置、终端设备和存储介质 |
CN109919048A (zh) * | 2019-02-21 | 2019-06-21 | 北京以萨技术股份有限公司 | 一种基于级联MobileNet-V2实现人脸关键点检测的方法 |
CN111339813A (zh) * | 2019-09-30 | 2020-06-26 | 深圳市商汤科技有限公司 | 人脸属性识别方法、装置、电子设备和存储介质 |
CN111027490A (zh) * | 2019-12-12 | 2020-04-17 | 腾讯科技(深圳)有限公司 | 人脸属性识别方法及装置、存储介质 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784778A (zh) * | 2021-01-28 | 2021-05-11 | 北京百度网讯科技有限公司 | 生成模型并识别年龄和性别的方法、装置、设备和介质 |
CN112784778B (zh) * | 2021-01-28 | 2024-04-09 | 北京百度网讯科技有限公司 | 生成模型并识别年龄和性别的方法、装置、设备和介质 |
CN112926478A (zh) * | 2021-03-08 | 2021-06-08 | 新疆爱华盈通信息技术有限公司 | 性别识别方法、系统、电子装置及存储介质 |
CN113033498A (zh) * | 2021-04-30 | 2021-06-25 | 中国工商银行股份有限公司 | 客户身份特征识别方法及装置 |
CN113408804A (zh) * | 2021-06-24 | 2021-09-17 | 广东电网有限责任公司 | 窃电行为检测方法、系统、终端设备及存储介质 |
CN113657457A (zh) * | 2021-07-27 | 2021-11-16 | 上海明略人工智能(集团)有限公司 | 局部人脸的匹配方法、系统、存储介质及电子设备 |
CN113456031A (zh) * | 2021-08-09 | 2021-10-01 | 首都医科大学附属北京天坛医院 | 一种脑状态预测模型的训练装置、预测装置及电子设备 |
CN113743236A (zh) * | 2021-08-11 | 2021-12-03 | 交控科技股份有限公司 | 乘客画像分析方法、装置、电子设备和计算机可读存储介质 |
CN114677724A (zh) * | 2022-03-02 | 2022-06-28 | 南京邮电大学 | 一种基于人脸年龄检测的公交专座语音播报方法与装置 |
WO2024001365A1 (zh) * | 2022-06-28 | 2024-01-04 | 魔门塔(苏州)科技有限公司 | 参数检测方法和设备 |
CN116524327A (zh) * | 2023-06-25 | 2023-08-01 | 云账户技术(天津)有限公司 | 人脸识别模型的训练方法、装置、电子设备及存储介质 |
CN116524327B (zh) * | 2023-06-25 | 2023-08-25 | 云账户技术(天津)有限公司 | 人脸识别模型的训练方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112257503A (zh) | 一种性别年龄识别方法、装置及存储介质 | |
CN112232116A (zh) | 一种人脸表情识别方法、装置及存储介质 | |
US11487995B2 (en) | Method and apparatus for determining image quality | |
CN112232117A (zh) | 一种人脸识别方法、装置及存储介质 | |
CN109409297B (zh) | 一种基于双通道卷积神经网络的身份识别方法 | |
CN106682616B (zh) | 基于双通道特征深度学习的新生儿疼痛表情识别方法 | |
CN109522818B (zh) | 一种表情识别的方法、装置、终端设备及存储介质 | |
CN109657631B (zh) | 人体姿态识别方法及装置 | |
CN108491835B (zh) | 面向面部表情识别的双通道卷积神经网络 | |
CN110569795B (zh) | 一种图像识别方法、装置以及相关设备 | |
CN112257502A (zh) | 一种监控视频行人识别与跟踪方法、装置及存储介质 | |
CN112395979B (zh) | 基于图像的健康状态识别方法、装置、设备及存储介质 | |
CN110909618B (zh) | 一种宠物身份的识别方法及装置 | |
CN111814611B (zh) | 一种嵌入高阶信息的多尺度人脸年龄估计方法及系统 | |
CN106875007A (zh) | 用于语音欺骗检测的基于卷积长短期记忆端对端深度神经网络 | |
CN113887487B (zh) | 一种基于CNN-Transformer的面部表情识别方法及装置 | |
CN111353445A (zh) | 一种基于深度学习的患者援助智能审核系统 | |
CN111353385B (zh) | 一种基于掩膜对齐与注意力机制的行人再识别方法和装置 | |
CN111680550B (zh) | 情感信息识别方法、装置、存储介质及计算机设备 | |
CN111695462A (zh) | 一种人脸识别方法、装置、存储介质和服务器 | |
Ravi et al. | Sign language recognition with multi feature fusion and ANN classifier | |
CN110610138A (zh) | 一种基于卷积神经网络的面部情感分析方法 | |
CN111275005B (zh) | 绘制人脸图像识别方法、计算机可读存储介质和相关设备 | |
CN113159002B (zh) | 一种基于自注意力权重辅助模块的人脸表情识别方法 | |
CN116884067B (zh) | 一种基于改进的隐式语义数据增强的微表情识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |