CN104408470A - 基于平均脸预学习的性别检测方法 - Google Patents
基于平均脸预学习的性别检测方法 Download PDFInfo
- Publication number
- CN104408470A CN104408470A CN201410720517.8A CN201410720517A CN104408470A CN 104408470 A CN104408470 A CN 104408470A CN 201410720517 A CN201410720517 A CN 201410720517A CN 104408470 A CN104408470 A CN 104408470A
- Authority
- CN
- China
- Prior art keywords
- layer
- convolutional neural
- face
- neural networks
- sex
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明基于平均脸预学习的性别检测方法,包括学习步骤和检测步骤:学习步骤:A、对人脸图像数据库进行分类,计算各类人脸图像的平均脸;B、将所述各平均脸数据配置为卷积神经网络的输出层、各平均脸所属类别下的人脸数据集中的人脸各位置配置为卷积神经网络的输入层,对卷积神经网络进行预学习;C、用性别分类层替换卷积神经网络的输出层,并对所述卷积神经网络和所述性别分类层进行最终学习;检测步骤:将待检人员的人脸图像输入学习后的卷积神经网络,由性别分类层输出性别。本发明避开一些比较差的次最优解,有效解决深度神经网路无法通过经典的学习方法一次得到比较好的模型的局限,通过预学习的步骤提高性别检测的准确性。
Description
技术领域
本发明涉及电子设备的人脸性别识别领域,特别涉及一种基于平均脸预学习的性别检测方法。
背景技术
现有技术中,性别识别算法大体分为三类,一类是基于语音,一类是基于人的步态,一类是基于人脸图像。由于目前人脸检测的技术比较成熟,基于人脸图像的方案变得更简单、直接。但由于现实环境中复杂的背景、光照和摄像头本身的精度差别以及人脸的角度等等因素,极大的增加了性别识别的难度,导致准确率比较低,稳定性不高。
进一步详细分析,基于人脸图像的性别识别的技术最大的问题是准确率低,不稳定。导致这个问题有多方面的因数:
1.现实环境中光照复杂,摄像头本身的参数和精度千差万别。
2.现实中人脸的角度的变化非常多。
3.不同人种的肤色差异较大。
以上三个因素极大的增加了在人脸图像中性别识别器的识别难度。传统的基于hand-crafted的特征(如LBP,HOG,Gabor等),无法对复杂的各种各样的人脸图像有很好的表达能力。传统的解决光照、角度与肤色的方法可以分为两类:
1、在检测中,对检测图像进行预处理,减少由于光照、角度、不同肤色带来的差异性。
2、基于各种不同的数据集,训练多个分类器。
由于环境的差异导致图像千差万别。预处理的方法无法很好的消除这一影响。方法二将由于环境引起的复杂度在训练时进行解决。由于差异性比较大,训练器的个数与如何组合不同的训练器的结果都难以有个很好的解决方案。最新研究表明深度神经网路拥有很强的模型表达能力(如CNN在很多方面都取得了比较好的成果),但由于深度神经网路的局部极小值很多,导致很难通过经典的学习算法一次得到很好的模型。
发明内容
本申请提供一种基于平均脸预学习的性别检测方法,通过对卷积神经网络的卷积层进行预学习,避开一些比较差的次最优解,有效的解决了深度神经网路在现有的传统技术上无法通过学习得到比较好的模型的局限性,从而提高性别检测的准确性。
所述基于平均脸预学习的性别检测方法包括学习的步骤和检测步骤:
所述学习的步骤包括:
A、对人脸图像数据库进行分类,并计算各类人脸图像的平均脸;
B、将所述各平均脸数据配置为卷积神经网络的输出层、各平均脸所属类别下的人脸数据集中的人脸各位置配置为卷积神经网络的输入层,对卷积神经网络进行预学习;
C、用性别分类层替换卷积神经网络的输出层,并对所述卷积神经网络和所述性别分类层进行最终学习;
所述检测步骤包括:
将输入待检人员的人脸图像输入学习后的卷积神经网络,由性别分类层输出性别。
由上,通过对卷积神经网络的预学习,避开一些比较差的次最优解,有效的解决了深度神经网路在现有的传统技术上无法通过学习得到比较好的模型的局限性。
可选的,步骤A所述对人脸图像数据库进行分类包括:依据人脸对应的性别和肤色进行分类。
由上,可实现对于不同肤色和性别的人脸进行初级分化,完成原始数据的累计。
可选的,将平均脸的各位置像素表示为(X1、X2,……,Xn),配置为卷积神经网络输出层的各个神经单元;
将对应类别的各人脸的各位置像素表示为(O1、O2,……,On),配置为卷积神经网络输入层的各个神经单元配置;
使所述输入层的各人脸的各位置像素与输出层的平均脸的各位置像素区别最小的方式对卷积神经网络进行学习。
其中,卷积神经网络输入层的各个神经单元与卷积神经网络输出层的各个神经单元数量匹配。
由上,通过人脸数据库数据对于卷积神经网络中的卷基层和隐含层的学习,实现其输出的特征表达。
可选的,所述使所述输入层的各人脸的各位置像素与输出层的平均脸的各位置像素区别最小的方式包括:采用对应各位置像素的最小平方差和的方式。
基于输入层和输出层神经单元的平方差和的约束,对卷积网路进行预学习,使之具有较好的起始值,从而避开一些比较差的次最优解。
可选的,步骤C中,对所述卷积神经网络和所述性别分类层进行最终学习包括:使所述性别分类层输出的性别与卷积神经网络输入层的计算所述平均脸的人脸图像数据库中各个图像的真实性别相匹配。
可选的,使所述性别分类层输出的性别与卷积神经网络输入层的计算所述平均脸的人脸图像数据库中各个图像的真实性别相匹配:采用反向传播算法进行学习,计算 使其结果最小,式中w为所述性别分类层和所述卷积神经网络的卷积层、隐含层的参数,tn为所述人脸图像数据库中第n个样本的真实性别,yn为第n个样本通过模型后的性别,为权重腐蚀。
由上,由于卷积层的参数已经在步骤B中进行了预学习,具有较好的起始值,可以适应不同数据,而性别分类层初始值不定,有可能导致训练出来的网路,只在训练数据上有比较好的结果,拿别的数据来测试时结果就很差。因此进行权重腐蚀,防止其过度拟合。
可选的,所述性别分类层包括softmax分类层。
附图说明
图1为本发明的流程图;
图2为的基于平均脸预学习的性别检测模型的原理示意图。
具体实施方式
本发明所涉及基于平均脸预学习的性别检测方法,通过对卷积神经网络(CNN,Convolutional Neural Networks)的预学习,避开一些比较差的次最优解,有效的解决了深度神经网路无法在经典的学习方法中得到比较好的模型的局限性。
如图1所示,本发明包括以下步骤:
S10:将人脸数据分类,计算不同类别的平均脸。
本实施例中,根据肤色与性别,将人脸数据集进行分类,本实施例采用以下6个类别:白-男、白-女、黑-男、黑-女、黄-男、黄-女。以上每个类别的数据应包含不同的光照与姿势,并将其缩放到统一像素尺寸上。针对于每个类别下的人脸数据集,通过计算该类别数据集中的各个人脸图像数据,即各个人脸图像相同位置的像素平均值,得到每个类别的平均脸。其中,计算出的平均脸可以表示为一数组,如(X1、X2,……,Xn),分别对应该平均脸各个位置像素平均值。本步骤即得到6类的平均脸。
S20:对CNN卷积层进行预学习。
其中,对CNN进行学习时,需配置好输入层、输出层的神经元个数,然后将各平均脸数据作为输出层,对应该平均脸所属类别下的人脸数据集中的人脸各位置作为输入层,对CNN的中间层(本实施例中,中间层是对卷积层、隐含层的统称)进行学习,或称对CNN模型进行训练。下面进行详细说明:
本实施例中,将CNN输出层的神经单元个数配置为与输入层相匹配,并如下配置:
如图2所示,CNN输出层对应平均脸数据,CNN输出层的各个神经单元配置为平均脸的各位置像素,如上表示为(X1、X2,……,Xn)。
CNN输入层各个神经单元配置为与输出层平均脸所属类别下的人脸数据集中的各人脸的各位置像素,表示为(O1、O2,……,On)。
对CNN进行学习时,采用反向传播算法进行CNN模型的预学习,使得每个样本的输入(每个样本的输入即是对应类别的人脸数据集中的每个人脸数据)与其对应的平均脸数据的平方差和最小。具体的,每个样本对应的平方差和计算表示为:E(w)=1/2[(O1-X1)*(O1-X1)+……+(On-Xn)*(On-Xn)]。通过求解使E(w)最小,即,使对应每个样本CNN输入层的人脸图像各位置与输出层的平均脸的各位置的区别最小,以达到对CNN中卷积层和隐含层的学习。
上述反向传播算法主要指由激励传播和权重更新的两个环节反复循环迭代,直到网络对输入的响应达到预定的目标范围为止的过程。通过该过程对卷积层的参数进行预学习,使之具有较好的起始值,从而避开一些比较差的次最优解。
S30:对预学习模型进行最终训练。
本实施例中,固定步骤S20中预学习得到的卷积层参数,并将卷积层后面配置的输出层替换为softmax分类层。所述的神经单元为数据库人脸性别,分为男、女2个。使用传统的反向传播算法,基于交叉熵对预学习模型中的卷积层和softmax分类层进行最终训练,同时优化卷积层的参数。交叉熵的目标函数公式为:
为防止过拟合,对softmax分类层的参数进行权重腐蚀(即在交叉熵损失函数后加一项权重惩罚,见上述公式的第二项而卷积层的参数不进行权重腐蚀。这是由于卷积层的参数已经在步骤S20中进行了预学习,具有较好的起始值,可以适应不同数据,而softmax分类层初始值不定,有可能导致训练出来的网路,只在训练数据上有比较好的结果,拿别的数据来测试时结果就很差。
步骤S40:输入待检人员的头像,检测其性别。
在实际的性别鉴别过程中,向CNN网路的输入层输入待检人员头像,softmax分类层依据CNN网络中卷基层所计算的结果进行性别识别,并输出识别结果。由此避开一些比较差的次最优解,有效的解决了深度网络在现有经典的学习算法中无法得到比较好的模型的局限性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,总之凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于平均脸预学习的性别检测方法,其特征在于,包括学习的步骤和检测步骤:
所述学习的步骤包括:
A、对人脸图像数据库进行分类,并计算各类人脸图像的平均脸;
B、将所述各平均脸数据配置为卷积神经网络的输出层、各平均脸所属类别下的人脸数据集中的人脸各位置配置为卷积神经网络的输入层,对卷积神经网络进行预学习;
C、用性别分类层替换卷积神经网络的输出层,并对所述卷积神经网络和所述性别分类层进行最终学习;
所述检测步骤包括:
将待检人员的人脸图像输入学习后的卷积神经网络,由性别分类层输出性别。
2.根据权利要求1所述的方法,其特征在于,步骤A所述对人脸图像数据库进行分类包括:依据人脸对应的性别和肤色进行分类。
3.根据权利要求1所述的方法,其特征在于,将平均脸的各位置像素表示为(X1、X2,……,Xn),配置为卷积神经网络输出层的各个神经单元;
将对应类别的各人脸的各位置像素表示为(O1、O2,……,On),配置为卷积神经网络输入层的各个神经单元配置;
使所述输入层的各人脸的各位置像素与输出层的平均脸的各位置像素区别最小的方式对卷积神经网络进行学习。
其中,卷积神经网络输出层的各个神经单元与卷积神经网络输入层的各个神经单元数量匹配。
4.根据权利要求3所述的方法,其特征在于,所述使所述输入层的各人脸的各位置像素与输出层的平均脸的各位置像素区别最小的方式包括:采用对应各位置像素的最小平方差和的方式。
5.根据权利要求1所述的方法,其特征在于,步骤C中,对所述卷积神经网络和所述性别分类层进行最终学习包括:使所述性别分类层输出的性别与卷积神经网络输入层的计算所述平均脸的人脸图像数据库中各个图像的真实性别相匹配。
6.根据权利要求5所述的方法,其特征在于,使所述性别分类层输出的性别与卷积神经网络输入层的计算所述平均脸的人脸图像数据库中各个图像的真实性别相匹配包括:采用反向传播算法进行学习,计算 使其结果最小,式中w为所述性别分类层和所述卷积神经网络的卷积层、隐含层的参数,tn为所述人脸图像数据库中第n个样本的真实性别,yn为第n个样本通过模型后的性别,为权重腐蚀。
7.根据权利要求1所述的方法,其特征在于,所述性别分类层包括softmax分类层。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410720517.8A CN104408470B (zh) | 2014-12-01 | 2014-12-01 | 基于平均脸预学习的性别检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410720517.8A CN104408470B (zh) | 2014-12-01 | 2014-12-01 | 基于平均脸预学习的性别检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104408470A true CN104408470A (zh) | 2015-03-11 |
CN104408470B CN104408470B (zh) | 2017-07-25 |
Family
ID=52646101
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410720517.8A Active CN104408470B (zh) | 2014-12-01 | 2014-12-01 | 基于平均脸预学习的性别检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104408470B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104992167A (zh) * | 2015-07-28 | 2015-10-21 | 中国科学院自动化研究所 | 一种基于卷积神经网络的人脸检测方法及装置 |
CN105825191A (zh) * | 2016-03-23 | 2016-08-03 | 厦门美图之家科技有限公司 | 基于人脸多属性信息的性别识别方法、系统及拍摄终端 |
CN107590460A (zh) * | 2017-09-12 | 2018-01-16 | 北京达佳互联信息技术有限公司 | 人脸分类方法、装置及智能终端 |
CN107622274A (zh) * | 2016-07-15 | 2018-01-23 | 北京市商汤科技开发有限公司 | 用于图像处理的神经网络训练方法、装置以及计算机设备 |
CN107766787A (zh) * | 2016-08-16 | 2018-03-06 | 深圳云天励飞技术有限公司 | 人脸属性识别方法、装置、终端及存储介质 |
CN107944363A (zh) * | 2017-11-15 | 2018-04-20 | 北京达佳互联信息技术有限公司 | 人脸图像处理方法、系统及服务器 |
CN109977891A (zh) * | 2019-03-30 | 2019-07-05 | 哈尔滨理工大学 | 一种基于神经网络的目标检测与识别方法 |
CN111126173A (zh) * | 2019-12-04 | 2020-05-08 | 玉林师范学院 | 一种高精度人脸检测方法 |
CN111199208A (zh) * | 2019-12-31 | 2020-05-26 | 上海昌投网络科技有限公司 | 一种基于深度学习框架的头像性别识别方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8027521B1 (en) * | 2008-03-25 | 2011-09-27 | Videomining Corporation | Method and system for robust human gender recognition using facial feature localization |
WO2011119117A1 (en) * | 2010-03-26 | 2011-09-29 | Agency For Science, Technology And Research | Facial gender recognition |
CN103824054A (zh) * | 2014-02-17 | 2014-05-28 | 北京旷视科技有限公司 | 一种基于级联深度神经网络的人脸属性识别方法 |
CN104021373A (zh) * | 2014-05-27 | 2014-09-03 | 江苏大学 | 一种半监督语音特征可变因素分解方法 |
-
2014
- 2014-12-01 CN CN201410720517.8A patent/CN104408470B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8027521B1 (en) * | 2008-03-25 | 2011-09-27 | Videomining Corporation | Method and system for robust human gender recognition using facial feature localization |
WO2011119117A1 (en) * | 2010-03-26 | 2011-09-29 | Agency For Science, Technology And Research | Facial gender recognition |
CN103824054A (zh) * | 2014-02-17 | 2014-05-28 | 北京旷视科技有限公司 | 一种基于级联深度神经网络的人脸属性识别方法 |
CN104021373A (zh) * | 2014-05-27 | 2014-09-03 | 江苏大学 | 一种半监督语音特征可变因素分解方法 |
Non-Patent Citations (2)
Title |
---|
蔡诗威 等: "一种基于卷积神经网络的性别识别方法", 《电视技术》 * |
陆庆庆: "基于人脸图像的性别分类", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104992167A (zh) * | 2015-07-28 | 2015-10-21 | 中国科学院自动化研究所 | 一种基于卷积神经网络的人脸检测方法及装置 |
CN104992167B (zh) * | 2015-07-28 | 2018-09-11 | 中国科学院自动化研究所 | 一种基于卷积神经网络的人脸检测方法及装置 |
CN105825191A (zh) * | 2016-03-23 | 2016-08-03 | 厦门美图之家科技有限公司 | 基于人脸多属性信息的性别识别方法、系统及拍摄终端 |
CN107622274A (zh) * | 2016-07-15 | 2018-01-23 | 北京市商汤科技开发有限公司 | 用于图像处理的神经网络训练方法、装置以及计算机设备 |
CN107622274B (zh) * | 2016-07-15 | 2020-06-02 | 北京市商汤科技开发有限公司 | 用于图像处理的神经网络训练方法、装置以及计算机设备 |
CN107766787A (zh) * | 2016-08-16 | 2018-03-06 | 深圳云天励飞技术有限公司 | 人脸属性识别方法、装置、终端及存储介质 |
CN107590460A (zh) * | 2017-09-12 | 2018-01-16 | 北京达佳互联信息技术有限公司 | 人脸分类方法、装置及智能终端 |
CN107944363A (zh) * | 2017-11-15 | 2018-04-20 | 北京达佳互联信息技术有限公司 | 人脸图像处理方法、系统及服务器 |
CN109977891A (zh) * | 2019-03-30 | 2019-07-05 | 哈尔滨理工大学 | 一种基于神经网络的目标检测与识别方法 |
CN111126173A (zh) * | 2019-12-04 | 2020-05-08 | 玉林师范学院 | 一种高精度人脸检测方法 |
CN111126173B (zh) * | 2019-12-04 | 2023-05-26 | 玉林师范学院 | 一种高精度人脸检测方法 |
CN111199208A (zh) * | 2019-12-31 | 2020-05-26 | 上海昌投网络科技有限公司 | 一种基于深度学习框架的头像性别识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104408470B (zh) | 2017-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104408470A (zh) | 基于平均脸预学习的性别检测方法 | |
CN107273845B (zh) | 一种基于置信区域和多特征加权融合的人脸表情识别方法 | |
CN104615983B (zh) | 基于递归神经网络和人体骨架运动序列的行为识别方法 | |
CN106650806B (zh) | 一种用于行人检测的协同式深度网络模型方法 | |
CN106682616B (zh) | 基于双通道特征深度学习的新生儿疼痛表情识别方法 | |
CN103793718B (zh) | 一种基于深度学习的人脸表情识别方法 | |
CN103824054B (zh) | 一种基于级联深度神经网络的人脸属性识别方法 | |
CN109815826A (zh) | 人脸属性模型的生成方法及装置 | |
CN105825235B (zh) | 一种基于多特征图深度学习的图像识别方法 | |
CN109101938B (zh) | 一种基于卷积神经网络的多标签年龄估计方法 | |
CN107102727B (zh) | 基于elm神经网络的动态手势学习与识别方法 | |
CN107229914B (zh) | 一种基于深度q学习策略的手写数字识别方法 | |
CN104463243A (zh) | 基于平均脸特征的性别检测方法 | |
CN108304826A (zh) | 基于卷积神经网络的人脸表情识别方法 | |
CN104866829A (zh) | 一种基于特征学习的跨年龄人脸验证方法 | |
WO2022062419A1 (zh) | 基于非督导金字塔相似性学习的目标重识别方法及系统 | |
CN107103281A (zh) | 基于聚集损失深度度量学习的人脸识别方法 | |
CN106909938B (zh) | 基于深度学习网络的视角无关性行为识别方法 | |
CN104217214A (zh) | 基于可配置卷积神经网络的rgb-d人物行为识别方法 | |
CN107451594B (zh) | 一种基于多元回归的多视角步态分类方法 | |
Bu | Human motion gesture recognition algorithm in video based on convolutional neural features of training images | |
CN105469376A (zh) | 确定图片相似度的方法和装置 | |
CN107203752A (zh) | 一种联合深度学习和特征二范数约束的人脸识别方法 | |
CN106548194B (zh) | 二维图像人体关节点定位模型的构建方法及定位方法 | |
Cheng et al. | Classification of long sequential data using circular dilated convolutional neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20190429 Address after: No. 1 Dongji Avenue, Jiangning District, Nanjing, Jiangsu Province, 210000 (Jiangning Development Zone) Patentee after: Nanjing Zhongchuang Onsai Software Technology Co., Ltd. Address before: 100191, 4 floor, Thai Xiang business building, 1 Longxiang Road, Haidian District, Beijing. Patentee before: Thunder Software Technology Co., Ltd. |
|
TR01 | Transfer of patent right |