CN103514454A - 基于在线学习支持向量机性别分类的方法 - Google Patents
基于在线学习支持向量机性别分类的方法 Download PDFInfo
- Publication number
- CN103514454A CN103514454A CN201210373327.4A CN201210373327A CN103514454A CN 103514454 A CN103514454 A CN 103514454A CN 201210373327 A CN201210373327 A CN 201210373327A CN 103514454 A CN103514454 A CN 103514454A
- Authority
- CN
- China
- Prior art keywords
- support vector
- face
- face characteristic
- gender
- vector machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
一种基于在线学习支持向量机性别分类的方法,利用支持向量机算法寻找到原始样本集中的性别样本的最优的分类面;获取测试目标的人脸特征,根据最优分类面对当前人脸特征进行估计并给出其所属性别的结果;计算人脸特征偏离最优分类面的偏离值,将该偏离值大于预设的阈值的人脸特征和对该人脸特征得到的性别分类结果加入到原始样本集形成新的原始样本集并重新计算新的最优分类面,对测试目标的人脸特征进行性别分类估计直到结束。本发明利用在线获取的人脸特征样本对原始样本集进行增量扩充,通过定量更新原始样本集,形成新的支持向量机参数和支持向量,提高了原始样本的鲁棒性,新的样本集提高了对外界环境的泛化能力,能够有更好的性别识别能力。
Description
技术领域
本发明涉及智能信息处理技术,尤其涉及基于向量机方法的性别分类的方法,特别是一种基于在线学习支持向量机性别分类的方法。
背景技术
现有技术性别识别分类过程中都是基于统计学原理的统计方法进行的。在统计学习过程中都是利用静态学习方法来实现的,也就是通过已经给定的样本进行学习,然后利用学习到的给定样本对未知环境中的情况进行估计和分析,进而得出分析结果。由于性别学习过程中存在大量的样本,人姿态的变化会造成样本本身的多样性和可变性,使得对样本的学习造成一定的困难,或者说难于用一个规定法则来描述所学习到的性别特征,所以,人们将性别学习确定在一定量的样本中进行,针对一定量的小样本学习,支持向量机(support vector machine,SVM)是目前最有效的方法。现有技术基于SVM方法进行性别识别是根据给定的定量静态性别人脸进行学习,针对定量样本的最优分类参数在实际环境中应用。然而,由于环境的未知性和人脸本身特征、姿态的变化使得这些最优参数在应用过程中难免会出现错误或者无法分类的情况,使性别分类器的泛化性受到影响,在实际环境中的鲁棒性不高。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足之处,本发明为解决现有技术的缺陷和不足,提出一种基于在线学习支持向量机性别分类的方法及系统,能够很好的对外界环境中具有一定变化的性别样本进行选择性学习。
本发明解决技术问题所采用的技术方案如下:
一种基于在线学习支持向量机性别分类的方法,包括如下步骤:
A、将基于性别的人脸特征作为性别样本存储至原始样本集;
B、利用支持向量机算法对原始样本集中的性别样本进行学习和分类,寻找到最优的分类面,并得到原始样本集的支持向量;
C、获取测试目标的人脸并相应提取人脸特征,根据原始样本集的最优分类面对该人脸特征进行估计,同时利用支持向量机算法对该人脸特征进行性别分类;再计算测试目标的人脸特征偏离所述最优分类面的偏离值,并将该偏离值与预设的阈值进行比较,若所述偏离值大于预设的阈值,则将该人脸特征和对该人脸特征得到的性别分类结果作为性别样本加入到原始样本集构成新的样本集,并采用支持向量机算法计算新的样本集的最优分类面,以及得到新的样本集的支持向量;否则进入下一测试目标的人脸特征识别。
所述步骤A中基于性别的人脸特征包括人脸特征及其性别特征标签。
所述基于性别的人脸特征中的人脸特征是通过LBP、IDP、Gabor小波变换、PCA降维或Fisher算法来实现人脸特征的表达。
所述步骤B中寻找最优分类面中对于所形成的低维特征空间是采用RBF函数将低维特征空间映射到相应的高维特征空间实现的。
所述步骤C获取测试目标的人脸并相应提取人脸特征中提取人脸特征是通过LBP、IDP、Gabor小波变换、PCA降维或Fisher算法来实现。
所述步骤C还进一步包括,当测试目标的数量等于原始样本集中样本的数量二分之一时,则将偏离值大于预设阈值的测试目标的人脸特征和对该人脸特征得到的性别分类结果加入到原始样本集更新为新的原始样本集以扩充原始样本集的样本数量,再根据该更新后的新的原始样本集进行下一测试目标的性别分类。
与现有技术相比较,本发明采用在线学习的方法将现有技术性别识别分类的静态学习过程改为动态学习过程,利用在线实时获取的人脸特征样本对原始样本集进行增量扩充,在扩充的过程中采用最优参数来对在线实时获取的人脸特征样本进行学习和分类,扩充的新的样本集获取新的最优参数及支持向量,通过定量更新原始样本集,形成新的支持向量机参数和支持向量,扩充了原始样本的鲁棒性,新的样本集提高了对外界环境的泛化能力,能够有更好的性别识别能力。
附图说明
图1是本发明基于在线学习支持向量机性别分类的方法处理流程图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明方法应用的范围包括在数码产品、智能家庭数字平台以及移动终端中利用摄像设备对人脸进行识别过程中需要进行性别识别的应用场合。利用在线学习的手段将性别识别的静态学习方法改为动态学习,即在进行人脸的性别分类过程中对基于性别的人脸特征的原始样本集进行人脸特征的添加,利用增量的原始样本集来对后续的测试目标的人脸特征进行支持向量机训练,不断提高原始样本集中的样本数量,实现动态学习的功能。本发明中所说的测试目标是指进入产品视域范围的人脸,能够根据人脸进行性别识别。
图1所示为本发明基于在线学习支持向量机性别分类的方法处理流程图,该处理流程图示出了在线学习的基本过程,其实现步骤如下:
步骤S100,将基于性别的人脸特征作为性别样本存储至原始样本集;
步骤S101,利用支持向量机算法对原始样本集中的性别样本进行学习和分类,寻找到最优的分类面,并得到原始样本集的支持向量;
步骤S102,获取测试目标的人脸并相应提取人脸特征,根据原始样本集的最优分类面对该人脸特征进行估计,同时利用支持向量机算法对该人脸特征进行性别分类;
步骤S103,计算测试目标的人脸特征偏离所述最优分类面的偏离值,并将该偏离值与预设的阈值进行比较;
步骤S104,判断偏离值是否大于预设的阈值,如果大于,执行步骤S105,否则执行步骤S106;
步骤S105,将该人脸特征作为性别样本加入到原始样本集构成新的样本集,并采用支持向量机算法计算新的样本集的最优分类面,以及得到新的样本集的支持向量;
步骤S106,判断是否有下一测试目标,如有,返回执行步骤S102,否则执行步骤S107;
步骤S107,结束。
下面对以上步骤结合具体实现中采用的算法进行详细阐述本发明方法的实现过程。
首先如步骤S100存储基于性别的人脸特征的性别样本至原始样本集中,获取原始样本集为 ,其中为每个性别样本的特征表达,R表示x属于一个d维度的空间集合,说明x是一个d维度的向量。原始样本集获取的是基于性别的人脸特征,人脸特征的提取可以有多种不同的方法如:LBP(Local Binary Pattern,局部二值模式)、IDP(Interlaced Derivative Pattern,交错导数模式)、Gabor小波变换、PCA(Principal component analysis,主成分分析)降维、Fisher(费歇尔算法)等,为每个样本特征的性别标签值,用于区分男性和女性(+1表示男性,-1表示女性)。
这里面和值为寻找到最优分类面的数值(属于现有技术方法,对该值进行计算的过程不赘述),为松弛变量,主要是为高维数据线性不可分使用的,通过这个松弛变量的引入,可以解决高维数据中少数不可分的离群点。对于低维空间,采用RBF核函数,把其对应到相应的高纬空间中,这样有利于在高维空间进行线性的可分性,同时,最优分类面的距离为:,为此可建立Lagrange函数用于求解上述最优分类面距离的最小值(式2):
要获取最优分类面可以表示成如下的约束优化问题,也就是在式1的约束下,求函数:
的最小值。在数学中可以建立Lagrange函数来解决:
式1-3
对w和b求取lagrange极小值,通过转化为简单的对偶问题,在约束条件(式3)下
式 3
在式3的约束条件下求取下列式4函数的最大值:
式6
其中,步骤S102中提取人脸特征是采取如步骤S100中的LBP、IDP、Gabor小波变换、PCA降维、Fisher等算法实现;获取到测试目标的人脸特征后,使测试目标的人脸特征作为一个测试目标进入上述分类器时,得到对应的最优分类函数为:
同时,步骤S104中的判断过程是通过设置预设的一定阈值(该阈值的取值范围: ~,其中β根据经验值取值为0.5~2)来衡量一个测试量(即测试目标的人脸特征表达)的偏离程度,从而对该测试目标能否作为最后的样本进行学习进行取舍。SVM自身的算法和训练得到适应于当前测试目标样本Sample的最优参数值(这里的表示的是选取的一组最优值,如:选用RBF核函数则对应最优值c(为支持向量机中指定的某常数,控制对错样本惩罚的对错作用)和g(为径向基内积函数中的参数值)),同时也得到基于该样本条件下的支持向量SVM_sample_only_sv,即为步骤S101中所指的得到原始样本集的支持向量。
具体而言,当需要对一个新的测试目标的人脸face1进行分类(指一个测试目标的人脸进入到产品视域范围内时获取了该人脸的图像,根据该人脸的图像进行分类处理),采用与步骤S100中人脸特征提取的方法对测试目标进行人脸特征的提取,利用已经形成的最优参数值(即上述最优分类面的数值)对当前样本(即人脸face1)进行估计,同时把该样本所属的类别结果给出,对于face1给予SVM算法得到的估计标签(性别标签),对于测试集(测试目标的人脸face1的人脸特征集合),带入式7中得到对应的偏离值,判断该偏离值是否大于指定的阈值(根据实验的经验确定),若不大于指定阈值,则进入下一个人脸测试;若大于指定阈值,则并把该测试集(包括测试目标的人脸特征集合及其性别标签)放入原始样本集中构成新的样本集合,同时对样本集合同样采用SVM算法求取中对应的最优参数和支持向量SVM_1_only_sv。
完成对face1的执行,如果还有后续的测试目标进来,则继续对后续测试目标做与face1进行的相同的计算工作,以进入的下一测试目标的第2幅人脸face2为例,对于测试人脸face2进入时,利用最优参数,同样调用SVM算法对该测试人脸进行分类,得到测试人脸face2的估计结果,同样判断输出是否大于指定阈值,若不大于进入下一个人脸测试;若大于则把测试人脸face2加入到新的样本集中,再得到新的样本集。同样对用SVM算法获取到最优参数和支持向量SVM_2_only_sv。
根据测试目标依照上面的方法依次类推,直到第n个测试目标的人脸,对第n个测试目标的人脸进行类似上面的SVM计算得到估计标签、计算并与预设的阈值做判断,当不大于阈值,进入下一步;若大于阈值则再构成新的集合(其中表示在前n-1次测试过程中每次计算得到的偏离值大于指定阈值所构成的人脸测试集合)并利用SVM算法获取集合下的最优参数和支持向量SVM_n_only_sv。单个性别测试往往对SVM的泛化能力不是很好,通过定量的更新原始样本库,并形成一组新的SVM参数和支持向量,这样对外界的泛化能力会提高很多,所以这里把1至n个中满足大于指定阈值的测试图像与原始样本放在一起,得到新的样本集,再次对样本进行SVM计算得到最优参数和支持向量SVM_S_new1_only_sv。
应当说明的是,作为一种优选的手段,当测试目标的数量等于原始样本集中样本的数量二分之一时,则将偏离值大于预设阈值的测试目标的人脸特征加入到原始样本集的新的样本集更新为新的原始样本集以扩充原始样本集的样本数量,再根据该更新后的新的原始样本集进行下一测试目标的性别分类。这提高了后续分类识别过程的鲁棒性,简言之,新生成的样本集对外界环境有更好的适应能力。
应当理解的是,以上所述仅为本发明的较佳实施例而已,并不足以限制本发明的技术方案,对本领域普通技术人员来说,在本发明的精神和原则之内,可以根据上述说明加以增减、替换、变换或改进,而所有这些增减、替换、变换或改进后的技术方案,都应属于本发明所附权利要求的保护范围。
Claims (6)
1.一种基于在线学习支持向量机性别分类的方法,其特征在于,包括如下步骤:
A、将基于性别的人脸特征作为性别样本存储至原始样本集;
B、利用支持向量机算法对原始样本集中的性别样本进行学习和分类,寻找到最优的分类面,并得到原始样本集的支持向量;
C、获取测试目标的人脸并相应提取人脸特征,根据原始样本集的最优分类面对该人脸特征进行估计,同时利用支持向量机算法对该人脸特征进行性别分类;再计算测试目标的人脸特征偏离所述最优分类面的偏离值,并将该偏离值与预设的阈值进行比较,若所述偏离值大于预设的阈值,则将该人脸特征和对该人脸特征得到的性别分类结果作为性别样本加入到原始样本集构成新的样本集,并采用支持向量机算法计算新的样本集的最优分类面,以及得到新的样本集的支持向量;否则进入下一测试目标的人脸特征识别。
2.根据权利要求1所述的基于在线学习支持向量机性别分类的方法,其特征在于,所述步骤A中基于性别的人脸特征包括人脸特征及其性别特征标签。
3.根据权利要求2所述的基于在线学习支持向量机性别分类的方法,其特征在于,所述基于性别的人脸特征中的人脸特征是通过LBP、IDP、Gabor小波变换、PCA降维或Fisher算法来实现人脸特征的表达。
4.根据权利要求1所述的基于在线学习支持向量机性别分类的方法,其特征在于,所述步骤B中寻找最优分类面中对于所形成的低维特征空间是采用RBF函数将低维特征空间映射到相应的高维特征空间实现的。
5.根据权利要求1所述的基于在线学习支持向量机性别分类的方法,其特征在于,所述步骤C获取测试目标的人脸并相应提取人脸特征中提取人脸特征是通过LBP、IDP、Gabor小波变换、PCA降维或Fisher算法来实现。
6.根据权利要求1所述的基于在线学习支持向量机性别分类的方法,其特征在于,所述步骤C还进一步包括,当测试目标的数量等于原始样本集中样本的数量二分之一时,则将偏离值大于预设阈值的测试目标的人脸特征和对该人脸特征得到的性别分类结果加入到原始样本集更新为新的原始样本集以扩充原始样本集的样本数量,再根据该更新后的新的原始样本集进行下一测试目标的性别分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210373327.4A CN103514454B (zh) | 2012-09-27 | 2012-09-27 | 基于在线学习支持向量机性别分类的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210373327.4A CN103514454B (zh) | 2012-09-27 | 2012-09-27 | 基于在线学习支持向量机性别分类的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103514454A true CN103514454A (zh) | 2014-01-15 |
CN103514454B CN103514454B (zh) | 2016-12-21 |
Family
ID=49897147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210373327.4A Expired - Fee Related CN103514454B (zh) | 2012-09-27 | 2012-09-27 | 基于在线学习支持向量机性别分类的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103514454B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971106A (zh) * | 2014-05-27 | 2014-08-06 | 深圳市赛为智能股份有限公司 | 多视角人脸图像性别识别方法及装置 |
CN104601817A (zh) * | 2015-01-20 | 2015-05-06 | 电子科技大学 | 一种基于智能手机加速度传感器的用户基础属性预测方法 |
CN110363083A (zh) * | 2019-06-06 | 2019-10-22 | 广智微芯(扬州)有限公司 | 一种人脸图像性别识别方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6990217B1 (en) * | 1999-11-22 | 2006-01-24 | Mitsubishi Electric Research Labs. Inc. | Gender classification with support vector machines |
US20090074259A1 (en) * | 2005-07-29 | 2009-03-19 | Madalina Baltatu | Automatic biometric identification based on face recognition and support vector machines |
CN101419671A (zh) * | 2008-11-10 | 2009-04-29 | 北方工业大学 | 基于模糊支持向量机的人脸性别识别方法 |
CN102368294A (zh) * | 2011-09-07 | 2012-03-07 | 常州蓝城信息科技有限公司 | 复杂环境下性别特征的提取方法 |
-
2012
- 2012-09-27 CN CN201210373327.4A patent/CN103514454B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6990217B1 (en) * | 1999-11-22 | 2006-01-24 | Mitsubishi Electric Research Labs. Inc. | Gender classification with support vector machines |
US20090074259A1 (en) * | 2005-07-29 | 2009-03-19 | Madalina Baltatu | Automatic biometric identification based on face recognition and support vector machines |
CN101419671A (zh) * | 2008-11-10 | 2009-04-29 | 北方工业大学 | 基于模糊支持向量机的人脸性别识别方法 |
CN102368294A (zh) * | 2011-09-07 | 2012-03-07 | 常州蓝城信息科技有限公司 | 复杂环境下性别特征的提取方法 |
Non-Patent Citations (3)
Title |
---|
刘文瑶等: "主元子空间中的SVM性别分类算法", 《东北大学学报(自然科学版)》 * |
林辉: "性别、种族人脸识别方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
纪政: "性别分类与分类器信用值研究", 《中国优秀博士学位论文全文数据库信息科技辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971106A (zh) * | 2014-05-27 | 2014-08-06 | 深圳市赛为智能股份有限公司 | 多视角人脸图像性别识别方法及装置 |
CN104601817A (zh) * | 2015-01-20 | 2015-05-06 | 电子科技大学 | 一种基于智能手机加速度传感器的用户基础属性预测方法 |
CN110363083A (zh) * | 2019-06-06 | 2019-10-22 | 广智微芯(扬州)有限公司 | 一种人脸图像性别识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103514454B (zh) | 2016-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10002290B2 (en) | Learning device and learning method for object detection | |
WO2021238455A1 (zh) | 数据处理方法、设备及计算机可读存储介质 | |
CN110633745A (zh) | 一种基于人工智能的图像分类训练方法、装置及存储介质 | |
CN101496035B (zh) | 模式分类方法 | |
CN112183153A (zh) | 一种基于视频分析的对象行为检测方法及装置 | |
US20160275415A1 (en) | Reader learning method and device, data recognition method and device | |
JP2008538041A (ja) | 局所的近傍点ラプラス固有マップに基づくデータ分類の一部学習済学習機械 | |
CN103136504A (zh) | 人脸识别方法及装置 | |
CN107067022B (zh) | 图像分类模型的建立方法、建立装置和设备 | |
CN104951793A (zh) | 一种基于stdf特征的人体行为识别算法 | |
CN107333294A (zh) | 一种结合AdaBoost和支持向量机的链路质量预测方法 | |
CN102103691A (zh) | 一种基于主成分分析人脸的识别方法 | |
WO2011042381A1 (en) | Method of computing global-to-local metrics for recognition | |
Kostavelis et al. | Object recognition using saliency maps and HTM learning | |
CN103514454A (zh) | 基于在线学习支持向量机性别分类的方法 | |
Zam et al. | Energy-efficient face detection and recognition scheme for wireless visual sensor networks | |
Bardeh et al. | New approach for human detection in images using histograms of oriented gradients | |
US20140241638A1 (en) | Visual information processing allocation between a mobile device and a network | |
CN105574494A (zh) | 一种多分类器姿势识别方法及装置 | |
CN112738724B (zh) | 一种区域目标人群的精准识别方法、装置、设备和介质 | |
CN114662568A (zh) | 数据分类方法、装置、设备和存储介质 | |
Kang et al. | Ontology-based inference system for adaptive object recognition | |
Cervantes et al. | Michigan particle swarm optimization for prototype reduction in classification problems | |
Gullapelly et al. | Classification of Rigid and Non-Rigid Objects Using CNN. | |
Hunter et al. | Exploiting sparse representations in very high-dimensional feature spaces obtained from patch-based processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20161221 |
|
CF01 | Termination of patent right due to non-payment of annual fee |