CN117197861A - 一种性别识别方法、装置、电子设备和可读存储介质 - Google Patents
一种性别识别方法、装置、电子设备和可读存储介质 Download PDFInfo
- Publication number
- CN117197861A CN117197861A CN202310858515.4A CN202310858515A CN117197861A CN 117197861 A CN117197861 A CN 117197861A CN 202310858515 A CN202310858515 A CN 202310858515A CN 117197861 A CN117197861 A CN 117197861A
- Authority
- CN
- China
- Prior art keywords
- image
- person
- face
- detected
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000012545 processing Methods 0.000 claims abstract description 32
- 230000006835 compression Effects 0.000 claims abstract description 30
- 238000007906 compression Methods 0.000 claims abstract description 30
- 230000001815 facial effect Effects 0.000 claims abstract description 17
- 238000013145 classification model Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 46
- 238000012549 training Methods 0.000 claims description 33
- 238000000605 extraction Methods 0.000 claims description 23
- 210000000697 sensory organ Anatomy 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012847 principal component analysis method Methods 0.000 claims description 8
- 238000012790 confirmation Methods 0.000 claims description 4
- 238000000513 principal component analysis Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 238000013527 convolutional neural network Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000037237 body shape Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Landscapes
- Collating Specific Patterns (AREA)
Abstract
本申请实施例提供一种性别识别方法、装置、电子设备和可读存储介质,涉及图像识别领域,其中的方法包括获取待检测人物的第一图像和所述第一图像中的人物正脸图像;对所述第一图像进行特征提取,得到所述待检测人物的第一特征,并对所述人物正脸图像进行特征提取,得到所述待检测人物的正脸特征;基于所述第一特征和所述正脸特征进行特征压缩处理,得到所述待检测人物的第二特征;利用预设的分类模型对所述第二特征进行分类处理,得到所述待检测人物的性别识别结果。通过上述方法,能够获取到相对于侧脸更加完善的面部信息,并且减少与性别弱相关的特征的干扰,提高性别识别的准确率。
Description
技术领域
本申请涉及图像识别领域,尤其涉及一种性别识别方法、装置、电子设备和可读存储介质。
背景技术
人脸识别是一种基于人的相貌特征信息进行身份认证的生物特征识别技术,技术的最大特征是能避免个人信息泄露,并采用非接触的方式进行识别。人脸性别识别就是向计算机输入人脸图像,经过某种方法或运算,得出其性别。
在相关技术中,通常利用行人检测网络首先检测行人,然后通过深度神经网络对行人直接进行人员性别分类;或,通过人脸检测网络直接对监控图像或者一阶段检测到的行人进行人脸检测,然后通过深度神经网络对人脸进行性别分类。
然而,在前者所述的方法中,基于检测到的行人做分类可能会因为人脸检测不全、身形等原因而导致性别识别准确率较低;在后者所述的方法中,神经网络基于整个人物图像做分类时会去拟合图像中的所有信息,可能会存在过多与性别弱相关的一些特征,从而弱化了与性别强相关的一些特征所起的作用,也会导致性别识别准确率降低。
发明内容
本申请实施例提供一种性别识别方法、装置、电子设备和可读存储介质,可以解决现有的性别识别技术中由于与性别弱相关的信息过多所导致的性别识别准确率较低的问题,提高性别识别的准确率。
为了解决上述问题,第一方面,本申请实施例公开了一种性别识别方法,所述方法包括:获取待检测人物的第一图像和所述第一图像中的人物正脸图像;
对所述第一图像进行特征提取,得到所述待检测人物的第一特征,并对所述人物正脸图像进行特征提取,得到所述待检测人物的正脸特征;
基于所述第一特征和所述正脸特征进行特征压缩处理,得到所述待检测人物的第二特征;
利用预设的分类模型对所述第二特征进行分类处理,得到所述待检测人物的性别识别结果。
可选地,所述获取待检测人物的第一图像和所述第一图像中的人物正脸图像,包括:
获取待检测人物的第一图像;
若所述第一图像中所述待检测人物的五官呈现比例小于预设比例,则提取所述第一图像中的人脸区域,并将所述人脸区域输入基于对抗生成网络的人脸生成模型,得到所述第一图像中的人物正脸图像;
若所述第一图像中所述待检测人物的五官呈现比例大于或等于预设比例,则提取所述第一图像中的人脸区域,得到所述第一图像中的人物正脸图像。
可选地,在若所述第一图像中所述待检测人物的五官呈现比例小于预设比例,则提取所述第一图像中的人脸区域,并将所述人脸区域输入基于对抗生成网络的人脸生成模型,得到所述第一图像中的人物正脸图像之前,所述方法还包括:
获取训练样本集,所述训练样本集包括侧脸图像和所述侧脸图像对应的真实正脸图像;
基于所述训练样本集对对抗生成网络模型进行迭代训练,将所述侧脸图像输入所述对抗生成网络模型,得到所述侧脸图像对应的合成人脸图像,基于所述合成人脸图像和所述真实正脸图像按照预设的损失函数计算所述对抗生成网络模型的损失值,直到所述损失值满足预设条件,停止迭代训练,得到人脸生成模型;
其中,所述损失函数包括以下至少一项:
像素损失函数,所述像素损失函数用于衡量所述合成人脸图像与所述人物正脸图像中像素点的像素差值;
对称损失函数,所述对称损失函数用于通过所述合成人脸图像中像素点的像素值衡量人脸的对称程度;
对抗损失函数,所述对抗损失函数用于衡量所述合成人脸图像与所述人物正脸图像中人脸形状的相似程度;
身份确认损失函数,所述身份确认损失函数用于衡量所述合成人脸图像与所述人物正脸图像所表示的人物是否一致。
可选地,所述基于所述第一特征和所述正脸特征进行特征压缩处理,得到所述待检测人物的第二特征,包括:
将所述第一特征和所述正脸特征进行特征拼接,得到所述待检测的第三特征;
利用主成分分析法对所述第三特征进行特征压缩处理,得到所述待检测人物的第二特征。
可选地,所述方法还包括:
获取所述待检测人物的多帧图像的性别识别结果;
基于所述多帧图像的性别识别结果进行投票处理,得到投票结果;
根据所述投票结果确定所述待检测人物的目标性别。
第二方面,本申请实施例公开了一种性别识别装置,所述装置包括:
图像获取模块,用于获取待检测人物的第一图像和所述第一图像中的人物正脸图像;
特征提取模块,用于对所述第一图像进行特征提取,得到所述待检测人物的第一特征,并对所述人物正脸图像进行特征提取,得到所述待检测人物的正脸特征;
特征压缩模块,用于基于所述第一特征和所述正脸特征进行特征压缩处理,得到所述待检测人物的第二特征;
分类模块,用于利用预设的分类模型对所述第二特征进行分类处理,得到所述待检测人物的性别识别结果。
第三方面,本申请实施例公开了一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器可以执行所述计算机程序以实现如前述一个或多个所述的性别识别方法:
第四方面,本申请实施例公开了一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的性别识别方法。
本申请实施例包括以下优点:
本申请实施例提供了一种性别识别方法,在获取待检测人物的第一图像和所述第一图像中的人物正脸图像后,分别对所述第一图像和人物正脸图像进行特征提取,得到所述待检测人物的第一特征和正脸特征,然后基于所述第一特征和所述正脸特征进行特征压缩处理,得到所述待检测人物的第二特征,最后利用预设的分类模型对所述第二特征进行分类处理,得到所述待检测人物的性别识别结果。其中,在性别识别过程中利用第一图像中的人物正脸图像可以获取到相对于侧脸更加完善的面部信息,解决了由于人脸检测不全所导致的性别识别准确率较低的问题;并且,通过特征压缩的方式分析出与性别强关联的特征,有助于减少与性别弱相关的特征的干扰,提高性别识别的准确率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的一种性别识别方法实施例的步骤流程图;
图2是本申请的一种性别识别装置实施例的结构框图;
图3是本申请实施例提出的电子设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
方法实施例
参照图1,示出了本申请的一种性别识别方法实施例的步骤流程图,应用于发送端,所述方法具体可以包括如下步骤:
步骤101、获取待检测人物的第一图像和所述第一图像中的人物正脸图像。
其中,第一图像是指包括待检测人物的图像,具体可以指反映待检测人物的不同人物属性的特征图像,其中,人物属性包括但不限于待检测人物的人脸、衣物、包、鞋子、配饰等属性信息,特征图像包括但不限于人脸特征图、配饰特征图等。人物属性特征图像有助于在后续的特征提取过程中筛选出性别强相关特征,降低性别弱相关特征的比例,减少性别弱相关信息对性别识别的影响,从而提高性别识别准确率。
具体地,在本申请实施例中,可以利用手机、照相机等可拍摄设备记录包含有待检测人物的图像,然后利用YOLOV5、YOLOV7等图像识别方法对图像中的人物进行检测,截取并获得待检测人物的单人图像。在获取到待检测人物的单人图像后,可以利用YOLOV5、YOLOV7等图像识别方法对单人图像中的待检测人物进行检测,并从中提取出不同的人物属性特征图像,即第一图像,例如通过点位标注的面部特征图像、形体特征图像、配饰特征图像等。
当然,本申请并不限定第一图像是指反映待检测人物的不同人物属性的特征图像,第一图像也可以是待检测人物的单人图像。对特征图像进行特征提取,有助于识别性别强相关特征,进而提高性别识别的准确率,而直接对单人进行特征提取则有助于加快性别识别过程,提高性别识别的效率。在性别识别过程中,可以根据具体情况进行选择,本申请对此不作限定。
人物的面部特征是反映人物性别的重要特征,人物面部信息越完善,越有助于提高性别识别的准确率,因此,在获取到第一图像后,还需要基于第一图像获取到待检测人物的正脸特征图像,即人物正脸图像。
可以理解的是,在拍摄角度合适的情况下,可以直接获取到包含人物正脸的第一图像,那么人物正脸图像可以直接从第一图像中提取得到。而在拍摄角度不合适的情况下,获取到的第一图像中可能仅包含有待检测人物的侧脸图,因此,为了充分获取到待检测人物的面部信息,可以基于对抗生成网络(Generative Adversarial Networks,GAN)、扩散模型等网络架构来构建人脸生成模型,然后将侧脸图输入构建好的人脸生成模型得到人物正脸图像,从而获取到较为完善的面部信息,有助于提高性别识别的准确率。
步骤102、对所述第一图像进行特征提取,得到所述待检测人物的第一特征,并对所述人物正脸图像进行特征提取,得到所述待检测人物的正脸特征。
具体地,可以利用卷积神经网络构建的深度神经网络模型对第一图像进行特征提取。其中,卷积神经网络可以采用inception网络架构,例如,inception V1\V2等。该卷积神经网络主要执行过程包括1*1卷积、3*3卷积、5*5卷积、3*3最大池化以及最后对上述四个过程的运算结果进行通道上组合的过程。在inception网络架构中,可以自行调整是否需要池化与哪种卷积核,并且inception网络架构的总体乘积参数较少,有助于更快的提取特征。因此,利用inception网络结构构建的神经网络模型对第一图像进行特征提取,有助于加快特征提取的过程,进而提高性别识别的效率。
作为一种示例,在第一图像包括多个不同的属性特征图像的情况下,依次将属性特征图像输入inception网络架构的NN2模型中进行向量转换,输出为多个64维特征向量,即第一特征。
在对人物正脸图像进行特征提取时,可以利用人脸识别(FaceNet)网络、HOG梯度等方式提取人物正脸图像的特征向量。其中,FaceNet是利用深度卷积神经网络(Convolutional Neural Networks,CNN)学习将图像映射到欧式空间,而空间距离直接和图片相似度相关,因此同一个人的不同图像在空间距离很小,不同人的图像在空间中有较大的距离,可以用于人脸验证、识别和聚类等。HOG梯度提取人脸特征是通过统计图像局部区域的梯度方向信息来作为该局部图像区域的特征。
进一步地,考虑到人物正脸图像具有较高的精度,因此,使用CNN网络进行特征提取对细节的特征提取效果更好。
步骤103、基于所述第一特征和所述正脸特征进行特征压缩处理,得到所述待检测人物的第二特征。
可以理解的是,在传统的性别识别过程中,神经网络对整个图像做分类会去拟合图像中的所有信息,这其中可能存在过多的与性别弱相关或不相关的特征,即性别冗余特征。这些冗余特征会造成对性别识别的误导、干扰,弱化性别强相关的特征在性别识别过程中所起的作用,降低性别识别的准确率。
因此,在本申请实施例中,对第一特征和所述正脸特征进行特征压缩处理,得到第二特征,可以有效去除冗余特征,充分保留与性别强相关的特征,从而提高性别强相关的特征在进行性别识别时所占的比例,提高性别识别的准确率。其中,特征压缩方法包括但不限于主成分分析法(principal components analysis,PCA)、随机化奇异值分解(TheSingular Value Decomposition,SVD)的PCA等方法,具体方式可以根据实际情况进行确定,本申请对此并不限定。
步骤104、利用预设的分类模型对所述第二特征进行分类处理,得到所述待检测人物的性别识别结果。
将步骤103所述的特征压缩处理得到的第二特征输入预设的分类模型进行性别分类,可以充分减少性别冗余特征对性别识别的干扰,从而提高性别识别的准确率。其中,分类模型包括但不限于决策树、支持向量机(support vector machines,SVM)等,具体可以根据实际情况进行选择,本申请对此不做限定
可选地,步骤101所述获取待检测人物的第一图像和所述第一图像中的人物正脸图像,包括:
步骤S11、获取待检测人物的第一图像;
步骤S12、若所述第一图像中所述待检测人物的五官呈现比例小于预设比例,则提取所述第一图像中的人脸区域,并将所述人脸区域输入基于对抗生成网络的人脸生成模型,得到所述第一图像中的人物正脸图像;
步骤S13、若所述第一图像中所述待检测人物的五官呈现比例大于或等于预设比例,则提取所述第一图像中的人脸区域,得到所述第一图像中的人物正脸图像。
可以理解的是,人物的面部特征是反映人物性别的重要特征,人物面部信息越完善,越有助于提高性别识别的准确率,因此,在获取到第一图像后,还需要基于第一图像获取到待检测人物的正脸特征图像,即人物正脸图像。
在本申请实施例中,可以利用五官呈现比例来检测人物的面部完整度。若所述第一图像中所述待检测人物的五官呈现比例大于或等于预设比例,则可以确定第一图像中的人脸为正脸,然后提取第一图像中的人脸区域作为人物正脸图像;若所述第一图像中所述待检测人物的五官呈现比例小于预设比例,则可以确定第一图像中的人脸为侧脸,需要根据人物的侧脸图像生成人物正脸图像后,即提取第一图像中的人脸区域,并将人脸区域输入基于对抗生成网络的人脸生成模型,得到所述第一图像中的人物正脸图像。其中,预设比例可以根据实际情况进行调整,例如0.7、0.8等,本申请对此不做限定。
对抗生成网络由生成器(generator)与判别器(discriminator)构成,其训练过程实质上是生成器与判别器不断对抗的过程,通过生成器与判别器不断对抗进行训练,最终使得判别器难以分辨生成器生成的数据(图片,音频等)与真实的数据的区别。
具体地,考虑到人脸的五官是反映面部信息的重要特征,为了提高生成的人物正脸的还原度,可以利用基于空间融合的对抗生成网络(Spatial Fusion-GenerativeAdversarial Networks,SF-GAN)架构来搭建人脸生成模型。
SF-GAN结合了几何生成器和外观生成器来实现同时生成几何和外观空间。几何生成器通过学习背景图像的上下文内容将前景对象转换放置到背景图像中。外观合成器调整前景对象的颜色,亮度和样式,并将它们和谐地嵌入到背景图像中。基于此,在本申请实施例中,将眼口鼻等五官作为前景对象,将除五官以外的模糊人脸作为背景图像,利用上述SF-GAN架构搭建了包括两个对抗生产网络子模型和一个分类子模型的人脸生成模型。
两个对抗生产网络子模型具体包括五官生成子模型和模糊人脸生成子模型,模糊人脸生成子模型用于全局生成没有具体五官的正脸轮廓图像,五官生成子模型则用于生成左右眼、鼻子嘴巴等五官图像。分类子模型则用于通过一个Light CNN网络进行判别生成的人脸具体标签。
因此,在第一图像中所述待检测人物的五官呈现比例小于预设比例的情况下,可以将提取到的第一图像的人脸区域输入基于SF-GAN架构的人脸生成模型,利用模糊人脸生成子模型生成待检测人物的没有具体五官的正脸轮廓图像,利用五官生成子模型生成待检测人物的左右眼、鼻子嘴巴等五官图像,最后根据分类子模型判别的具体标签将正脸轮廓图像和五官图像进行合并,从而得到待检测人物的人物正脸图像。
当然,除了上述SF-GAN架构,也可以采用DC-GAN、STYLE-GAN等其他对抗生成网络架构搭建人脸生成模型,具体可以根据实际情况进行选择,本申请不做限定。
可选地,在步骤S12所述若所述第一图像中所述待检测人物的五官呈现比例小于预设比例,则提取所述第一图像中的人脸区域,并将所述人脸区域输入基于对抗生成网络的人脸生成模型,得到所述第一图像中的人物正脸图像之前,所述方法还包括:
步骤S21、获取训练样本集,所述训练样本集包括侧脸图像和所述侧脸图像对应的真实正脸图像;
步骤S22、基于所述训练样本集对对抗生成网络模型进行迭代训练,将所述侧脸图像输入所述对抗生成网络模型,得到所述侧脸图像对应的合成人脸图像,基于所述合成人脸图像和所述真实正脸图像按照预设的损失函数计算所述对抗生成网络模型的损失值,直到所述损失值满足预设条件,停止迭代训练,得到人脸生成模型;
其中,所述损失函数包括以下至少一项:
像素损失函数,所述像素损失函数用于衡量所述合成人脸图像与所述人物正脸图像中像素点的像素差值;
对称损失函数,所述对称损失函数用于通过所述合成人脸图像中像素点的像素值衡量人脸的对称程度;
对抗损失函数,所述对抗损失函数用于衡量所述合成人脸图像与所述人物正脸图像中人脸形状的相似程度;
身份确认损失函数,所述身份确认损失函数用于衡量所述合成人脸图像与所述人物正脸图像所表示的人物是否一致。
其中,像素损失函数衡量所述合成人脸图像与所述人物正脸图像中像素点的像素差值,具体可以参照如下公式:
W表示上述合成人脸图像、真实正脸图像等人脸特征图的宽度,H表示人脸特征图的高度,x,y则表示像素点的位置,Ipred表示合成人脸图像中像素点的预测像素值,Igt表示真实正脸图像中像素点的真实像素值。
对称损失函数用于通过所述合成人脸图像中像素点的像素值衡量人脸的对称程度,具体可以参照如下公式:
(x,y)和(W-(x-1),y)则表示两个对称像素点的位置。
对抗损失函数用于衡量所述合成人脸图像与所述人物正脸图像中人脸形状的相似程度,具体可以参照如下公式:
N表示训练样本集的总量,为正整数,表示对抗生产网络模型的生成器,/>表示对抗生产网络模型的判别器,/>表示训练样本集中第n个输入的侧脸图像。
身份确认损失函数用于衡量所述合成人脸图像与所述人物正脸图像所表示的人物是否一致,具体可以参照如下公式:
Wi和Hi表示人物特征图的第i层的空间维度。
以像素损失函数为例,在训练人脸像素模型的过程中,首先获取包括侧脸图像和所述侧脸图像对应的真实正脸图像的训练样本集,基于所述训练样本集对对抗生成网络模型进行迭代训练,将训练样本集中的侧脸图像输入所述对抗生成网络模型,得到侧脸图像对应的合成人脸图像,然后基于合成人脸图像和训练样本集中的真实正脸图像按照上述像素损失函数计算所述对抗生成网络模型的损失值,直到所述损失值满足预设条件,停止迭代训练,得到人脸生成模型。
另外,为了快速收敛得到基于不同侧脸的人脸生成模型,在训练对抗生成网络模型的过程中,可以通过对上述四种损失函数加权求和来约束模型的训练过程,总目标损失函数如下所示:
Lsyn=Lpixel+λ1Lsym+λ2Ladv+λ3Lip, (5)
其中,λ1、λ2、λ3表示预设的权重,均可以根据实际情况进行确定。同时,在上述公式(1)-(5)中,相同的符号均表示相同含义,本申请不做赘述。
可选地,步骤103所述基于所述第一特征和所述正脸特征进行特征压缩处理,得到所述待检测人物的第二特征,包括:
步骤S31、将所述第一特征和所述正脸特征进行特征拼接,得到所述待检测的第三特征;
步骤S32、利用主成分分析法对所述第三特征进行特征压缩处理,得到所述待检测人物的第二特征。
其中,主成分分析法是设法将原来众多具有一定相关性的变量,重新组合成一组新的互相无关的综合变量来代替原来的变量,其目的是用较少的变量来代替原来较多的变量,并可以反映原来多个变量的大部分信息。
在本申请实施例中,为了避免过多的与性别弱相关的特征对性别识别的影响,在讲待检测人物的第一特征和正脸特征进行特征拼接得到第三特征后,通过主成分分析的方法从第三特征中提取出性别的主要影响特征即与性别强相关的特征,去除性别冗余特征,从而提高性别强相关的特征在进行性别识别时所占的比例,提高性别识别的准确率。
以步骤102获取到多个长度为64的特征向量与128维的正脸特征向量为例,将上述多个长度为64的特征向量与128维的正脸特征向量进行向量的拼接,然后采用主成分分析法进行特征压缩和去冗余,在保留60%的特征值后,得到230维的总特征向量,即待检测人物的第二特征。
可选地,所述方法还可以包括:
步骤S41、获取所述待检测人物的多帧图像的性别识别结果;
步骤S42、基于所述多帧图像的性别识别结果进行投票处理,得到投票结果;
步骤S43、根据所述投票结果确定所述待检测人物的目标性别。
其中,投票处理是集成学习里面针对分类问题的一种结合策略,遵循少数服从多数的原则。在本申请实施例中,针对同一个待检测人物的多帧图像的性别识别结果进行投票处理,有助于在前述步骤101-104的基础上进一步提高性别识别的准确率。
具体地,可以将多帧图像的识别结果中所占比例最高的识别结果确定为待检测人物的目标性别,例如在待检测人物的10帧图像中有8帧图像的性别识别结果为男,其余为女,那么可以确定待检测人物的目标性别为男;也可以综合考虑多帧图像的性别识别结果对应识别概率,计算不同的性别识别结果对应的最终概率,即投票结果,然后根据最终概率对应的性别确定目标性别。
作为一种示例,分别基于待检测人物A的三帧图像B、C、D进行性别识别,其中,B对应的性别识别结果为男的概率为99%,C对应的性别识别结果为男的概率为49%,D对应的性别识别结果为男的概率为49%。对上述三个结果进行投票处理,得到的投票结果为:(99%+49%+49%)/3=65.67%,即A的性别识别结果为男的概率为65.67%,A的性别识别结果为女的概率为34.33%,因此,可以确定A的目标性别为男。
综上所述,本申请实施例提供了一种性别识别方法,在获取待检测人物的第一图像和所述第一图像中的人物正脸图像后,分别对所述第一图像和人物正脸图像进行特征提取,得到所述待检测人物的第一特征和正脸特征,然后基于所述第一特征和所述正脸特征进行特征压缩处理,得到所述待检测人物的第二特征,最后利用预设的分类模型对所述第二特征进行分类处理,得到所述待检测人物的性别识别结果。其中,在性别识别过程中利用第一图像中的人物正脸图像可以获取到相对于侧脸更加完善的面部信息,解决了由于人脸检测不全所导致的性别识别准确率较低的问题;并且,通过特征压缩的方式分析出与性别强关联的特征,有助于减少与性别弱相关的特征的干扰,提高性别识别的准确率。另外,通过获取与性别强关联的特征进而进行性别识别的方法,降低了与性别弱相关或不相关的信息对性别识别的干扰,从而有效降低了性别识别人物场景的局限性。
装置实施例
参照图3,示出了本申请的一种性别识别装置实施例的结构框图,应用于发送端,所述装置具体可以包括:
图像获取模块201,用于获取待检测人物的第一图像和所述第一图像中的人物正脸图像;
特征提取模块202,用于对所述第一图像进行特征提取,得到所述待检测人物的第一特征,并对所述人物正脸图像进行特征提取,得到所述待检测人物的正脸特征;
特征压缩模块203,用于基于所述第一特征和所述正脸特征进行特征压缩处理,得到所述待检测人物的第二特征;
分类模块204,用于利用预设的分类模型对所述第二特征进行分类处理,得到所述待检测人物的性别识别结果。
可选地,所述图像获取模块,包括:
第一图像获取子模块,用于获取待检测人物的第一图像;
正脸生成子模块,用于若所述第一图像中所述待检测人物的五官呈现比例小于预设比例,则提取所述第一图像中的人脸区域,并将所述人脸区域输入基于对抗生成网络的人脸生成模型,得到所述第一图像中的人物正脸图像;
正脸提取子模块,用于若所述第一图像中所述待检测人物的五官呈现比例大于或等于预设比例,则提取所述第一图像中的人脸区域,得到所述第一图像中的人物正脸图像。
可选地,所述装置还包括:
样本集获取模块,用于在若所述第一图像中所述待检测人物的五官呈现比例小于预设比例,则提取所述第一图像中的人脸区域,并将所述人脸区域输入基于对抗生成网络的人脸生成模型,得到所述第一图像中的人物正脸图像之前,获取训练样本集,所述训练样本集包括侧脸图像和所述侧脸图像对应的真实正脸图像;
模型训练模块,用于基于所述训练样本集对对抗生成网络模型进行迭代训练,将所述侧脸图像输入所述对抗生成网络模型,得到所述侧脸图像对应的合成人脸图像,基于所述合成人脸图像和所述真实正脸图像按照预设的损失函数计算所述对抗生成网络模型的损失值,直到所述损失值满足预设条件,停止迭代训练,得到人脸生成模型;
其中,所述损失函数包括以下至少一项:
像素损失函数,所述像素损失函数用于衡量所述合成人脸图像与所述人物正脸图像中像素点的像素差值;
对称损失函数,所述对称损失函数用于通过所述合成人脸图像中像素点的像素值衡量人脸的对称程度;
对抗损失函数,所述对抗损失函数用于衡量所述合成人脸图像与所述人物正脸图像中人脸形状的相似程度;
身份确认损失函数,所述身份确认损失函数用于衡量所述合成人脸图像与所述人物正脸图像所表示的人物是否一致。
可选地,所述特征压缩模块,包括:
特征拼接子模块,用于将所述第一特征和所述正脸特征进行特征拼接,得到所述待检测的第三特征;
主成分分析子模块,用于利用主成分分析法对所述第三特征进行特征压缩处理,得到所述待检测人物的第二特征。
可选地,所述装置还包括:
多结果获取模块,用于获取所述待检测人物的多帧图像的性别识别结果;
投票处理模块,用于基于所述多帧图像的性别识别结果进行投票处理,得到投票结果;
目标性别确定模块,用于根据所述投票结果确定所述待检测人物的目标性别。
综上所述,本申请实施例提供了一种性别识别装置,在获取待检测人物的第一图像和所述第一图像中的人物正脸图像后,分别对所述第一图像和人物正脸图像进行特征提取,得到所述待检测人物的第一特征和正脸特征,然后基于所述第一特征和所述正脸特征进行特征压缩处理,得到所述待检测人物的第二特征,最后利用预设的分类模型对所述第二特征进行分类处理,得到所述待检测人物的性别识别结果。其中,在性别识别过程中利用第一图像中的人物正脸图像可以获取到相对于侧脸更加完善的面部信息,解决了由于人脸检测不全所导致的性别识别准确率较低的问题;并且,通过特征压缩的方式分析出与性别强关联的特征,有助于减少与性别弱相关的特征的干扰,提高性别识别的准确率。另外,通过获取与性别强关联的特征进而进行性别识别的方法,降低了与性别弱相关或不相关的信息对性别识别的干扰,从而有效降低了性别识别人物场景的局限性。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于同一发明构思,本申请实施例公开一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现本申请实施例公开的性别识别方法中的步骤。
本申请实施例还提供了另一种用于性别识别的装置,应用于智能合约所在的区块链,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:在智能合约对应的交易申请信息满足申请条件的情况下,向多方安全计算代理服务端发送执行所述智能合约的触发指令,以使所述多方安全计算代理服务端根据所述交易申请信息生成安全计算人物;接收所述多方安全计算代理服务端发送的针对所述安全计算人物的工作量证明;根据所述智能合约的合约规定将所述工作量证明转换为交易内容。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请实施例是参照根据本申请实施例的方法、装置、电子设备和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种性别识别方法、装置、电子设备及存储介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种性别识别方法,其特征在于,所述方法包括:
获取待检测人物的第一图像和所述第一图像中的人物正脸图像;
对所述第一图像进行特征提取,得到所述待检测人物的第一特征,并对所述人物正脸图像进行特征提取,得到所述待检测人物的正脸特征;
基于所述第一特征和所述正脸特征进行特征压缩处理,得到所述待检测人物的第二特征;
利用预设的分类模型对所述第二特征进行分类处理,得到所述待检测人物的性别识别结果。
2.根据权利要求1所述的方法,其特征在于,所述获取待检测人物的第一图像和所述第一图像中的人物正脸图像,包括:
获取待检测人物的第一图像;
若所述第一图像中所述待检测人物的五官呈现比例小于预设比例,则提取所述第一图像中的人脸区域,并将所述人脸区域输入基于对抗生成网络的人脸生成模型,得到所述第一图像中的人物正脸图像;
若所述第一图像中所述待检测人物的五官呈现比例大于或等于预设比例,则提取所述第一图像中的人脸区域,得到所述第一图像中的人物正脸图像。
3.根据权利要求2所述的方法,其特征在于,在若所述第一图像中所述待检测人物的五官呈现比例小于预设比例,则提取所述第一图像中的人脸区域,并将所述人脸区域输入基于对抗生成网络的人脸生成模型,得到所述第一图像中的人物正脸图像之前,所述方法还包括:
获取训练样本集,所述训练样本集包括侧脸图像和所述侧脸图像对应的真实正脸图像;
基于所述训练样本集对对抗生成网络模型进行迭代训练,将所述侧脸图像输入所述对抗生成网络模型,得到所述侧脸图像对应的合成人脸图像,基于所述合成人脸图像和所述真实正脸图像按照预设的损失函数计算所述对抗生成网络模型的损失值,直到所述损失值满足预设条件,停止迭代训练,得到人脸生成模型;
其中,所述损失函数包括以下至少一项:
像素损失函数,所述像素损失函数用于衡量所述合成人脸图像与所述人物正脸图像中像素点的像素差值;
对称损失函数,所述对称损失函数用于通过所述合成人脸图像中像素点的像素值衡量人脸的对称程度;
对抗损失函数,所述对抗损失函数用于衡量所述合成人脸图像与所述人物正脸图像中人脸形状的相似程度;
身份确认损失函数,所述身份确认损失函数用于衡量所述合成人脸图像与所述人物正脸图像所表示的人物是否一致。
4.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征和所述正脸特征进行特征压缩处理,得到所述待检测人物的第二特征,包括:
将所述第一特征和所述正脸特征进行特征拼接,得到所述待检测的第三特征;
利用主成分分析法对所述第三特征进行特征压缩处理,得到所述待检测人物的第二特征。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述待检测人物的多帧图像的性别识别结果;
基于所述多帧图像的性别识别结果进行投票处理,得到投票结果;
根据所述投票结果确定所述待检测人物的目标性别。
6.一种性别识别装置,其特征在于,所述装置包括:
图像获取模块,用于获取待检测人物的第一图像和所述第一图像中的人物正脸图像;
特征提取模块,用于对所述第一图像进行特征提取,得到所述待检测人物的第一特征,并对所述人物正脸图像进行特征提取,得到所述待检测人物的正脸特征;
特征压缩模块,用于基于所述第一特征和所述正脸特征进行特征压缩处理,得到所述待检测人物的第二特征;
分类模块,用于利用预设的分类模型对所述第二特征进行分类处理,得到所述待检测人物的性别识别结果。
7.根据权利要求6所述的装置,其特征在于,所述图像获取模块,包括:
第一图像获取子模块,用于获取待检测人物的第一图像;
正脸生成子模块,用于若所述第一图像中所述待检测人物的五官呈现比例小于预设比例,则提取所述第一图像中的人脸区域,并将所述人脸区域输入基于对抗生成网络的人脸生成模型,得到所述第一图像中的人物正脸图像;
正脸提取子模块,用于若所述第一图像中所述待检测人物的五官呈现比例大于或等于预设比例,则提取所述第一图像中的人脸区域,得到所述第一图像中的人物正脸图像。
8.根据权利要求6所述的装置,其特征在于,所述特征压缩模块,包括:
特征拼接子模块,用于将所述第一特征和所述正脸特征进行特征拼接,得到所述待检测的第三特征;
主成分分析子模块,用于利用主成分分析法对所述第三特征进行特征压缩处理,得到所述待检测人物的第二特征。
9.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现权利要求1-5中任一所述的性别识别方法中的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1-5中任一所述的性别识别方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310858515.4A CN117197861A (zh) | 2023-07-12 | 2023-07-12 | 一种性别识别方法、装置、电子设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310858515.4A CN117197861A (zh) | 2023-07-12 | 2023-07-12 | 一种性别识别方法、装置、电子设备和可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117197861A true CN117197861A (zh) | 2023-12-08 |
Family
ID=88985767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310858515.4A Pending CN117197861A (zh) | 2023-07-12 | 2023-07-12 | 一种性别识别方法、装置、电子设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117197861A (zh) |
-
2023
- 2023-07-12 CN CN202310858515.4A patent/CN117197861A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021036059A1 (zh) | 图像转换模型训练方法、异质人脸识别方法、装置及设备 | |
CN109815826B (zh) | 人脸属性模型的生成方法及装置 | |
CN108829900B (zh) | 一种基于深度学习的人脸图像检索方法、装置及终端 | |
Fu et al. | Multiple feature fusion by subspace learning | |
US11163978B2 (en) | Method and device for face image processing, storage medium, and electronic device | |
CN110728209A (zh) | 一种姿态识别方法、装置、电子设备及存储介质 | |
WO2020103700A1 (zh) | 一种基于微表情的图像识别方法、装置以及相关设备 | |
CN109033940B (zh) | 一种图像识别方法、装置、计算设备及存储介质 | |
CN107463865B (zh) | 人脸检测模型训练方法、人脸检测方法及装置 | |
US10445602B2 (en) | Apparatus and method for recognizing traffic signs | |
CN112446302B (zh) | 一种人体姿态检测方法、系统、电子设备和存储介质 | |
CN111967427A (zh) | 一种伪造人脸视频鉴别方法、系统和可读存储介质 | |
CN111028305A (zh) | 表情生成方法、装置、设备及存储介质 | |
CN110428399B (zh) | 用于检测图像的方法、装置、设备和存储介质 | |
US11216652B1 (en) | Expression recognition method under natural scene | |
CN104778481A (zh) | 一种大规模人脸模式分析样本库的构建方法和装置 | |
CN110991380A (zh) | 人体属性识别方法、装置、电子设备以及存储介质 | |
CN112541422A (zh) | 光照和头部姿态鲁棒的表情识别方法、设备及存储介质 | |
CN113298158B (zh) | 数据检测方法、装置、设备及存储介质 | |
CN110838119A (zh) | 人脸图像质量评估方法、计算机装置及计算机可读存储介质 | |
Zhang et al. | Masked face recognition with mask transfer and self-attention under the COVID-19 pandemic | |
CN114333062B (zh) | 基于异构双网络和特征一致性的行人重识别模型训练方法 | |
CN107895154B (zh) | 面部表情强度计算模型的形成方法及系统 | |
CN110163049B (zh) | 一种人脸属性预测方法、装置及存储介质 | |
Geetha et al. | 3D face recognition using Hadoop |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |