CN111046708A - 基于Wasserstein距离的人脸性别判别算法 - Google Patents
基于Wasserstein距离的人脸性别判别算法 Download PDFInfo
- Publication number
- CN111046708A CN111046708A CN201811195596.XA CN201811195596A CN111046708A CN 111046708 A CN111046708 A CN 111046708A CN 201811195596 A CN201811195596 A CN 201811195596A CN 111046708 A CN111046708 A CN 111046708A
- Authority
- CN
- China
- Prior art keywords
- face
- distribution
- comparison library
- gender
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
- G06V10/507—Summing image-intensity values; Histogram projection analysis
Abstract
基于Wasserstein距离的人脸性别判别算法,分为三个步骤,第一步是构建对比库,选择不同性别构建不同分布的对比库;第二步是对目标人脸进行处理,包括预处理、人脸对齐、像素转换和直方图分布等;第三步是计算Wasserstein距离,计算目标分布与第一步建立的对比库中不同分布的距离,选择与对比库最接近的类型,由此判断性别;该算法采用新的数学方法来解决人脸性别识别问题,针对目前人脸性别识别的需求,拓展了人脸性别识别的思路,提升了人脸性别识别的方案多样性。在理论上,该算法考虑到不同人种之间的差距,合理选择对比库,提升了算法的适用性。
Description
技术领域
本发明涉及模式识别领域,尤其涉及在人脸检测与性别识别应用中,采用Wasserstein距离这一最优化数学方法、寻找两个数据之间的相关关系、推断出目标人脸的性别即基于Wasserstein距离的人脸性别判别算法。
背景技术
随着目前对人脸识别广泛而深入的研究,很多人希望在人脸识别方面,算法不仅能有判断身份的特点,还应该有主观情感的判断,比如美丑。于是性别判断成为了一个研究重点。当前对于性别判断的算法,主要由基于主成分分析(PCA)的人脸性别识别方法,和基于线性投影分析(LDA)的人脸性别识别方法。这两种识别方法都利用了人脸图像数据的相关度进行对比,获得性别信息。但从实际计算结果来看,一般准确率在60%左右,准确度仅略高于随机判断。相对而言,PCA和LDA这两种算法在计算上均为了速度而舍弃了某些信息,针对这一问题,该专利提出一种基于Wasserstein距离的人脸性别判别算法。
Wasserstein距离又叫Earth-Mover距离(EM距离),是概率论中的一个基本理论,该距离函数用于分析两个分布之间的距离,或者说从A分布变换到B分布所需要移动的最短距离。这是一个与最优化相结合的概念,能够巧妙分析不同分布之间的距离,在统计分析中有非常有价值的应用。同时Wasserstein距离是一个包含全局信息的距离函数,其特性也可以应用于人脸性别鉴定,保障了数据的完整性,理论上有很高可靠性。
发明内容
本发明提出了一种基于Wasserstein距离的人脸性别判别算法,该算法采用新的数学方法来解决人脸性别识别问题,针对目前人脸性别识别的需求,拓展了人脸性别识别的思路,提升了人脸性别识别的方案多样性。在理论上,该算法考虑到不同人种之间的差距,合理选择对比库,提升了算法的适用性。
基于Wasserstein距离的人脸性别判别算法,分为三个步骤,第一步是构建对比库,选择不同性别构建不同分布的对比库;第二步是对目标人脸进行处理,包括预处理、人脸对齐、像素转换和直方图分布等;第三步是计算Wasserstein距离,计算目标分布与第一步建立的对比库中不同分布的距离,进而选择与对比库最接近的类型,从而判断性别。
(1)对比库的构建
从人脸判定性别本身来说就极易造成误差,即使是一个经验丰富的人,也不能百分百保证对每一个待测对象的性别都作出精准的判别。但是我们可以通过算法的不断改进,尽量让算法和人的识别效果接近。更细致的判断就必须交给医学手段。鉴于此,根据人类的种族分布和个性差异,在对比库的构建上,选择蒙古人种(黄色人种)、高加索人种(白色人种)、尼格罗人种(黑色人种)这三大主流人种分类,每个人种下包括男性和女性照片各若干张,包含了姿态、光照、年龄等各种因素。
该算法的整体结构如图一所示,示例图片均来自MultiPIE数据集。在数据处理上,首先进行人脸对齐,按照特征提取获得的眼睛和嘴巴部位以及人脸轮廓,向外拓展出一个包含整张人脸的矩形区域,为方便后期对比的一致性,这里将矩形内像素改为128像素*128像素。随后计算该人脸的直方图分布。按照人种-性别-顺序编号,例如,黄种人男性第十五个可以编号为Y-M-15,白种人女性第二十一个可以编号为W-F-21。第一个字母表示人种,第二个字母表示性别,第三个数字表示序号。
(2)获取待检目标人脸及直方图分布
获取的目标人脸可以来自网络,也可以来自摄像头,由于没有统一标准,所以相对于对比库,目标人脸的提取和对齐工作更为重要,所以在其他操作前需对来自真实环境的图像进行白平衡等预处理。考虑到后续统一规格处理,希望的目标的待检人脸像素不要太低。同样根据对比库的构建方案,采用同样的特征提取算法,获得人脸主要器官和轮廓,并拓展出一个包含整张人脸的矩形区域,并降低像素至128像素*128像素。完成上述过程之后,将该矩形区域进行直方图统计,获得直方图分布。在这里基本完成了对于目标待检人脸的准备工作。
在上述两步特征提取可采用ASM(Active Shape Model)算法,这是一种点状分布的人脸特征提取算法。仅供参考。
(3)计算Wasserstein距离并确定性别
式中P为待检目标的直方图分布,为对比库中已知的分布,n即为总对比库数量。分别计算待检分布与对比库分布的Wasserstein距离,即可获得与待检目标分布最接近的对比库,将与待检目标最接近的对比库的人种和性别,做为待检目标所属的人种和性别。
同时为了提高算法的鲁棒性,该算法不以距离最近的第一名作为唯一判断结果,而选取距离最近的前k名进行对比,对前k名进行分类,选取出现次数最多的大类,作为最终判断结果。
基于Wasserstein距离的人脸性别判别算法,根据Wasserstein距离这一统计学、数学概念,设计了一种基于该距离的人脸性别判定算法。Wasserstein距离这一计算方法,本身在统计学和最优化的应用中一直有着较高的认可度,同时相比于传统人脸性别判定的算法,该算法引入范数空间,对于高维数据的处理,细节把握效果更好,更容易得到更加精准的结果。当然,对于利用人脸进行性别判断,本身的难度就要大于其他生物方式,该算法能够一定程度上拓宽人脸性别判断的计算思路。同时在最终判定上,该算法充分考虑了鲁棒性的需求,不以最高分决定目标类别。
附图说明
图1是基于Wasserstein距离的人脸性别判别算法整体结构。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,但本发明所要保护的范围并不限于此。
基于Wasserstein距离的人脸性别判别算法由Wasserstein距离为主题,由于涉及最优化问题,所需的计算量较大,所以对比库的规模不能太大。在对比库的建立上,选取每个人种中每个性别30张照片,共计180个对比样本,基本能够满足识别需求,注意样本选择要包含光照、遮挡、姿态等因素;图像处理上,将人脸图像优先转换为灰度图像,利用ASM算法对人脸的特征进行提取;在计算中,利用Wasserstein距离计算样本分布出与目标分布的距离,并按从小到大排序为W1,W2,W3,…,考虑到设计的样本种类有六类,而类与类之间的差距较大,可以选择与待检目标最接近的前6个进行统计,出现频率最高的大类可以作为最终的性别判定,若选取的数量较多,反而会导致偏差;同时,在最终比对结果上,除了选取前k个进行分类,还可以考虑最终结果排序,例如W1,W2,W3,…Wk,对其进行权重划分,距离越近,权重越大,距离越远权重越小,最后计算每个大类的总权值,总权值最大的作为性别判断类别。
Claims (4)
1.基于Wasserstein距离的人脸性别判别算法,其特征在于:分为三个步骤,第一步是构建对比库,选择不同性别构建不同分布的对比库;第二步是对目标人脸进行处理,包括预处理、人脸对齐、像素转换和直方图分布等;第三步是计算Wasserstein距离,计算目标分布与第一步建立的对比库中不同分布的距离,进而选择与对比库最接近的类型,从而判断性别。
2.根据权利要求1所述基于Wasserstein距离的人脸性别判别算法,其特征在于:对比库的构建,根据人类的种族分布和个性差异,选择蒙古人种、高加索人种、尼格罗人种这三大主流人种分类,每个人种下包括男性和女性照片各若干张,包含了姿态、光照、年龄等各种因素。
3.根据权利要求1所述基于Wasserstein距离的人脸性别判别算法,其特征在于:获取待检目标人脸及直方图分布,根据对比库的构建方案,采用同样的特征提取算法,获得人脸主要器官和轮廓,并拓展出一个包含整张人脸的矩形区域,并降低像素至128像素*128像素,完成上述过程之后,将该矩形区域进行直方图统计,获得直方图分布。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811195596.XA CN111046708A (zh) | 2018-10-15 | 2018-10-15 | 基于Wasserstein距离的人脸性别判别算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811195596.XA CN111046708A (zh) | 2018-10-15 | 2018-10-15 | 基于Wasserstein距离的人脸性别判别算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111046708A true CN111046708A (zh) | 2020-04-21 |
Family
ID=70230047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811195596.XA Pending CN111046708A (zh) | 2018-10-15 | 2018-10-15 | 基于Wasserstein距离的人脸性别判别算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111046708A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104036291A (zh) * | 2014-06-11 | 2014-09-10 | 杭州巨峰科技有限公司 | 基于人种分类的多特征性别判断方法 |
CN104598888A (zh) * | 2015-01-28 | 2015-05-06 | 广州远信网络科技发展有限公司 | 一种人脸性别的识别方法 |
CN104778481A (zh) * | 2014-12-19 | 2015-07-15 | 五邑大学 | 一种大规模人脸模式分析样本库的构建方法和装置 |
WO2016110005A1 (zh) * | 2015-01-07 | 2016-07-14 | 深圳市唯特视科技有限公司 | 基于灰度和深度信息的多层融合的多模态人脸识别装置及方法 |
-
2018
- 2018-10-15 CN CN201811195596.XA patent/CN111046708A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104036291A (zh) * | 2014-06-11 | 2014-09-10 | 杭州巨峰科技有限公司 | 基于人种分类的多特征性别判断方法 |
CN104778481A (zh) * | 2014-12-19 | 2015-07-15 | 五邑大学 | 一种大规模人脸模式分析样本库的构建方法和装置 |
WO2016110005A1 (zh) * | 2015-01-07 | 2016-07-14 | 深圳市唯特视科技有限公司 | 基于灰度和深度信息的多层融合的多模态人脸识别装置及方法 |
CN104598888A (zh) * | 2015-01-28 | 2015-05-06 | 广州远信网络科技发展有限公司 | 一种人脸性别的识别方法 |
Non-Patent Citations (2)
Title |
---|
姚乃明等: "基于生成式对抗网络的鲁棒人脸表情识别" * |
郑昌金等: "基于LBP特征和熵正则化Wasserstein距离的人脸表情识别" * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10891511B1 (en) | Human hairstyle generation method based on multi-feature retrieval and deformation | |
JP2009086901A (ja) | 年齢推定システム及び年齢推定方法 | |
CN104239862B (zh) | 一种人脸识别方法 | |
CN106407958B (zh) | 基于双层级联的面部特征检测方法 | |
JP5633080B2 (ja) | 属性値推定装置、属性値推定方法、プログラム及び記録媒体 | |
CN109145921A (zh) | 一种基于改进的直觉模糊c均值聚类的图像分割方法 | |
CN105139040A (zh) | 一种排队状态信息检测方法及其系统 | |
JP2012160178A (ja) | オブジェクト認識デバイス、オブジェクト認識を実施する方法および動的アピアランスモデルを実施する方法 | |
Križaj et al. | Adaptation of SIFT features for face recognition under varying illumination | |
CN110929687B (zh) | 一种基于关键点检测的多人行为识别系统及工作方法 | |
CN110827432B (zh) | 一种基于人脸识别的课堂考勤方法及系统 | |
WO2013075295A1 (zh) | 低分辨率视频的服装识别方法及系统 | |
KR101326691B1 (ko) | 지역적 특징의 통계적 학습을 통한 강건한 얼굴인식방법 | |
Liu et al. | Automatically face detection based on BP neural network and Bayesian decision | |
CN111652260B (zh) | 一种人脸聚类样本数量的选择方法及系统 | |
CN106529441A (zh) | 基于模糊边界分片的深度动作图人体行为识别方法 | |
CN109344758B (zh) | 基于改进局部二值模式的人脸识别方法 | |
WO2012143939A2 (en) | System and method for demographic analytics based on multimodal information | |
CN114299363A (zh) | 图像处理模型的训练方法、图像分类方法及装置 | |
CN110083724A (zh) | 一种相似图像检索方法、装置及系统 | |
CN113780145A (zh) | 精子形态检测方法、装置、计算机设备和存储介质 | |
CN106326927B (zh) | 一种鞋印新类别检测方法 | |
US20100211622A1 (en) | Data processing device | |
CN111046708A (zh) | 基于Wasserstein距离的人脸性别判别算法 | |
Tang et al. | Real-time head pose estimation using random regression forests |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |