CN102768732B - 融合稀疏保持映射和多类别属性Bagging的人脸识别方法 - Google Patents
融合稀疏保持映射和多类别属性Bagging的人脸识别方法 Download PDFInfo
- Publication number
- CN102768732B CN102768732B CN201210195701.6A CN201210195701A CN102768732B CN 102768732 B CN102768732 B CN 102768732B CN 201210195701 A CN201210195701 A CN 201210195701A CN 102768732 B CN102768732 B CN 102768732B
- Authority
- CN
- China
- Prior art keywords
- sparse
- classification
- signal
- base grader
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Abstract
融合稀疏保持映射和多类别属性Bagging的人脸识别方法属于模式识别技术领域。根据压缩感知理论提出的稀疏保持映射的方法已经应用到了人脸识别中并且取得了较高的识别率。在识别领域中,分类算法的性能对于最终的分类效果具有重要影响,而目前的一些基于稀疏保持映射的方法在分类时基本采用的是单一分类器,为了通过增强分类算法的性能来进一步提高识别率,本发明在实现属性Bagging算法时,本发明以Radon变换的角度作为实例的属性来构建训练样本并在其上进行基分类器的训练。通过在耶鲁和AR人脸库的实验,验证了本发明所提出的方法的可行性和有效性。
Description
技术领域
本发明属于模式识别技术领域,具体涉及一种融合稀疏保持映射和多类别属性Bagging的人脸识别的新方法,是一种利用计算机技术、数字图象处理技术、模式识别等实现人脸的自动分析与判别的方法,是生物特征识别领域中关于人脸特征提取与识别的算法。
背景技术
一、稀疏保持映射
特征提取可以降低模式识别系统的代价,是模式识别领域的关键问题之一,它要使信号在低维空间中能够保持高维空间中的特性。稀疏保持映射是一种有效的特征提取方法,它的基本思想是首先计算出信号的稀疏表示(稀疏权向量),然后通过解决利用稀疏表示重构出的信号逼近原始信号的优化问题找到映射矩阵,并用该矩阵将高维信号投影到低维空间以完成特征提取。
二、两类问题属性Bagging算法
在属性Bagging算法中,共进行T轮训练,每一轮训练对属性集进行有放回的重抽样,根据每一轮抽样出的属性集,对原始训练集中的样本进行改造,即对于每个样本,只使用该轮中抽到的属性重新构成一个样本来代替原始样本,并重新组成每轮训练中的训练集。在每轮的新训练集上用分类算法训练出一个基分类器。最终,对测试集中的样本或未知的样本,根据T个基分类器的输出用投票法决定出最终的分类结果。
三、图像的Radon变换
属性Bagging算法需要进行属性抽取,本文将Radon变换的角度作为实例的属性。
二元函数f(x,y)的Radon变换定义为:
其中x′为投影到的轴,θ为投影角度。Radon变换具有平移和旋转不变性,它的作用是计算图像在某个方向上的投影,并将二维信号转换为一维信号。
发明内容
本发明的内容是提出了一种融合稀疏保持映射和多类别属性Bagging算法的人脸识别方法。在实现属性Bagging算法时,本发明以Radon变换的角度作为实例的属性来构建训练样本,并在其上进行基分类器的训练。通过在耶鲁和AR人脸库的实验,验证了本文所提出的方法的可行性和有效性。
本发明的技术内容如下:
本发明将Radon变换的角度作为实例的属性。Radon变换计算原始信号在指定的角度上的映射,并将二维信号变为一维信号。将Radon变换的角度作为属性,每当抽取到一个角度的时候,就在该角度上对原始信号进行Radon变换。当抽取多个属性时,顺次在这多个属性所对应的角度上进行完Radon变换,并将这些Radon变换后的结果顺次连接起来,形成新的信号来代替原始信号,使用稀疏保持映射的方法进行降维,识别。这样算是一次基分类器的识别结果,整合多次基分类器的识别结果,形成最终集成分类器的识别结果,其中基分类器的分类使用最近邻(1-NN)算法实现。
一个融合稀疏保持映射和多类别属性Bagging的人脸识别方法,该方法的步骤包括:确定原始属性集、确定重抽样属性集、进行降维处理及训练基分类器、用集成分类器对样本进行分类。其具体步骤如下:
步骤一、确定原始属性集
用角度作为原始属性集中的元素,确定原始属性集。
步骤二、确定重抽样属性集合中的个数为N,确定迭代次数T。T取10~50,N取10~25;
从原始属性集中抽取N个属性作为样本新的属性,由于是有放回的抽取,故有些角度会重复出现,有些角度就不会出现。
步骤三、利用稀疏保持映射进行特征提取同时训练基分类器。
对原始图像按抽取的角度依次进行Radon变换,然后将结果顺次连接成为一维信号。并利用稀疏保持映射方法对一维信号进行降维处理:
映射矩阵W要将原本在高维空间中的数据投影到低维空间,而且经过映射以后,原始信号在高维空间中拥有的一些主要特性在低维空间中也要被保存。在稀疏保持映射中,要保存的最主要的特性就是通过稀疏权向量重建出的信号要尽可能的逼近原始信号,即要满足
其中WT为映射矩阵的转置,xi为第i个样本,si为xi的稀疏权向量,n为样本数。
可以推导出W是广义的特征向量问题
XSβXTW=λXXTW
的d个最大特征值所对应的特征向量,其中Sβ=S+ST-STS,X是训练集的集合,S是稀疏权矩阵。利用映射矩阵W将高维数据投影到低维空间,即可进行识别。
用最近邻(1-NN)分类算法对低维空间中的图像信号进行分类,计算基分类器ht对应的权值at:
其中,m为基分类器中训练样本的个数,对于其中第i个样本xi,若该样本在基分类器ht下分类正确,则令f(xi)=1,若分类不正确则令f(xi)=-1,t为迭代次数,取值为1…T。
对T个权值进行归一化处理:
其中a′t为归一化后的基分类器的权值,t为迭代次数,取值为1…T。
步骤四、集成分类器进行分类识别
将所有的基分类器组成最终的综合分类器,对测试样本,用综合分类器进行分类,其最终分类结果如下:
其中,Y为类别集合,y∈Y;t为迭代次数,取值为1…T。当基分类器ht的分类结果与y相同时,‖ht(x)=y‖=1,反之为‖ht(x)=y‖=0。
附图说明
图1是本发明算法的流程图。
图2Yale数据库的识别率。
图3AR数据库的识别率
具体实施方式
下面详细给出该发明技术方案中所涉及的各个细节问题的说明:
我们采用的数据库是Yale人脸数据库和AR人脸数据库,这两个数据库中只包含人脸图像,本发明要做的工作是在这基础上进行特征提取和识别操作。
步骤一、确定重抽样的原始属性集合
将Radon变换的角度作为样本的属性,则待重抽样的原始属性集合包含的是0°~360°之间的角度数,假设原始属性集合Attribute Set={0°,15°,30°,45°,60°,75°,90°,105°,120°,135°,150°,165°,180°,195°,210°,225°,240°,255°,270°,285°,300°,315°,330°,345°,360}。设有15个人的人脸图像,即类别M个数为15,每个人是一类。
步骤二、确定重抽样属性集合中的个数为25,确定迭代次数T=10
步骤三、利用稀疏保持映射进行特征提取同时训练基分类器
For t=1:10,迭代10次。每次迭代,执行以下三步:
第一次迭代,t=1:
Step1:从Attribute Set中有放回地抽样25次,每次抽取一个,得到属性集A1={0°,15°,30°,120°,90°,135°,75°,90°,15°,30°,0°,0°,300°,285°,120°,300°,60°,90°,60°,60°,315°,330°,120°,105°,285°},由于每次都是随机地有放回的抽取,故有些属性可能会出现多次,例如:0°,90°,有些属性可能不会出现,例如:165°,255°。每个训练样本实例Xi只按照属性集A1中的角度进行Radon变换。这里,原始的图像Xi是用二维信号表示的,当Xi在任意角度上进行Radon变换后,都会变成一个一维的信号。对Xi顺次按照A1中的角度进行Radon变换,会形成25个一维的信号,将这25个一维的信号顺次连接起来形成一个一维信号,设为Z1i,则Xi用Z1i来表示。
Step2:用稀疏保持映射的方法进行特征提取。该方法首先计算出训练集中每一个信号的稀疏权向量,计算稀疏权向量的方法是将原始信号用训练集中的全体训练样本组成的变换基进行变换,且要求经过变换以后的信号是所有能够找到的变换信号中最稀疏的一个;然后将所有训练样本的稀疏权向量组合成稀疏权矩阵;最后利用稀疏权向量重构出的信号逼近原始信号的优化问题计算出映射矩阵。使用该映射矩阵将高维数据投影到低维空间,即可完成特征提取。
Step3:对所有信号进行特征提取以后,用1NN算法训练出基分类器h1(x)→M,计算权值:
其中,r1=h1(x)正确分类的个数减去h1(x)错误分类的个数除以h1(x)所分类样本个数之和,M代表类别标号。
第十次迭代,t=10:
Step1:从Attribute Set中有放回地抽样25次,每次抽取一个,得到属性集A10={90°,135°,75°,60°,15°,300°,285°,120°,300°,330°,60°,90°,60°,60°,315°,330°,135°,120°,105°,285°,300°,75°,330°,60°,60°}。对每个样本Xi顺次按照A10中的角度进行Radon变换,会形成25个一维的信号,将这25个一维的信号顺次连接起来形成一个一维信号,设为Z10i,则Xi用Z10i来表示。
Step2:用稀疏保持映射的方法进行特征提取。该方法首先计算出训练集中每一个信号的稀疏权向量,计算稀疏权向量的方法是将原始信号用训练集中的全体训练样本组成的变换基进行变换,且要求经过变换以后的信号是所有能够找到的变换信号中最稀疏的一个;然后将所有训练样本的稀疏权向量组合成稀疏权矩阵;最后利用稀疏权向量重构出的信号逼近原始信号的优化问题计算出映射矩阵。使用该映射矩阵将高维数据投影到低维空间,即可完成特征提取。
Step3:对所有信号进行特征提取以后,用1NN算法训练出基分类器h10(x)→M,计算权值:
其中,r10=h10(x)正确分类的个数减去h10(x)错误分类的个数除以h10(x)所分类样本个数之和,M代表类别标号。
步骤四、进行最终分类
对于任意测试样本x,
其中,M为类别集合,m∈M;t为迭代次数,取值为1…10。
步骤四中公式进一步说明如下:对于样本x,各个基分类器的分类情况如下:
h1(x)->1,h2(x)->2,h3(x)->2,h4(x)->3,h5(x)->1,h6(x)->2,h7(x)->5,h8(x)->10,h9(x)->1,h10(x)->3。
类别1的权值之和为:a1+a5+a9;
类别2的权值之和为:a2+a3+a6;
类别3的权值之和为:a4+a10;
类别5的权值之和为:a7;
类别10的权值之和为:a8;
其余类别标号权值为:0。
最终测试样本的类别标号为:权值之和最大对应的类别标号,
即:max{a1+a5+a9,a2+a3+a6,a4+a10,a7,a8}所对应的类别标号。当有两个或多个最大的权值之和,则给测试样本赋予这几种类别中的任意一个类别标号。
下面详述说明本发明的实验结果:
本发明的实验采用的数据库是Yale人脸数据库和AR人脸数据库。其中Yale数据库包含了15位志愿者,每位志愿者有11张图片,共165张图片,包含光照,表情和姿态的变换,实验中将每幅图像的大小归一化为32×32。AR数据库包括100位志愿者,其中50位男性志愿者和50位女性志愿者。每位志愿者有26张图片,我们从中选取14张无遮挡物的图片,共1400张,该库也包含光照,表情和姿态的变化,实验中将每幅图像的大小归一化为66×48。
为了验证融合稀疏保持映射和多类别分类问题属性Bagging的人脸识别方法,我们在Yale人脸数据库和AR人脸数据上进行了实验。其中在Yale人脸数据库进行实验室每个人选取6张图片作为训练集,剩下的5张作为测试集。在AR人脸数据库进行实验室每个人选取7张图片作为训练集,剩下的7张作为测试集。
图2和图3是取得的识别率的统计图,其中“Yale”是在Yale数据库上进行的实验“AR”是在AR数据库上进行的实验,而且这两个数据库的实验都采用了迭代10次,迭代15次和迭代20次三次实验。表1给出了在不同的迭代次数下在不同维数中的最高识别率。
表1.不同维数中的最高识别率
Claims (1)
1.一种融合稀疏保持映射和多类别属性Bagging的人脸识别方法,其特征在于,其具体步骤如下:
步骤一、确定原始属性集:
用Radon变换的角度作为原始属性集中的元素,确定原始属性集;
步骤二、确定迭代次数T以及重抽样属性个数N,T取10~50,N取10~25;
步骤三、利用稀疏保持映射进行特征提取同时训练基分类器:
首先对原始图像按抽取的角度依次进行Radon变换,将结果顺次连接成为一维信号;其次利用稀疏保持映射方法对一维信号进行降维处理;最后训练基分类器:
用最近邻分类算法对低维空间中的图像信号进行分类,计算基分类器ht对应的权值:
其中,m为基分类器中训练样本的个数,对于其中第i个样本xi,若该样本在基分类器ht下分类正确,则令f(xi)=1,若分类不正确则令f(xi)=-1;
对T个权值进行归一化处理:
其中,at’为归一化后所对应基分类器的权值,t为迭代次数,取值为1…T;
步骤四、集成分类器进行分类识别
将所有的基分类器组成最终的综合分类器,对测试样本,用综合分类器进行分类,其最终分类结果如下:
其中,Y为类别集合,y∈Y;t为迭代次数,取值为1…T;当基分类器ht的分类结果与y相同时,||ht(x)=y||=1;当基分类器ht的分类结果与y不同时,||ht(x)=y||=0;
所述的对一维信号用稀疏保持映射方法进行降维处理的步骤如下:
在稀疏保持映射中,要保存的最主要的特性就是通过稀疏权向量重建出的信号要尽可能的逼近原始信号,即要满足:
其中WT为映射矩阵W的转置,xi为第i个样本,si为xi的稀疏权向量,n为样本个数,X是训练集的集合;
W是广义的特征向量问题
XSβXTW=λXXTW
的d个最大特征值所对应的特征向量,其中Sβ=S+ST-STS,X是训练集的集合,S是稀疏权矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210195701.6A CN102768732B (zh) | 2012-06-13 | 2012-06-13 | 融合稀疏保持映射和多类别属性Bagging的人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210195701.6A CN102768732B (zh) | 2012-06-13 | 2012-06-13 | 融合稀疏保持映射和多类别属性Bagging的人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102768732A CN102768732A (zh) | 2012-11-07 |
CN102768732B true CN102768732B (zh) | 2015-04-29 |
Family
ID=47096126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210195701.6A Expired - Fee Related CN102768732B (zh) | 2012-06-13 | 2012-06-13 | 融合稀疏保持映射和多类别属性Bagging的人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102768732B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103021406B (zh) * | 2012-12-18 | 2014-10-22 | 台州学院 | 基于压缩感知的鲁棒性语音情感识别方法 |
CN103258186A (zh) * | 2013-03-17 | 2013-08-21 | 北京工业大学 | 基于图像分割的集成人脸识别方法 |
CN103246874B (zh) * | 2013-05-03 | 2017-02-15 | 北京工业大学 | 一种基于联合稀疏模型和稀疏保持映射的人脸识别方法 |
CN104008375B (zh) * | 2014-06-04 | 2017-08-25 | 北京工业大学 | 基于特征融合的集成人脸识别方法 |
CN104820825B (zh) * | 2015-04-27 | 2017-12-22 | 北京工业大学 | 基于Adaboost算法的人脸识别优化方法 |
CN106951822B (zh) * | 2017-01-24 | 2020-12-01 | 南京航空航天大学 | 一种基于多尺度稀疏保持投影一维距离像融合识别方法 |
CN107133648B (zh) * | 2017-05-05 | 2020-08-04 | 南京航空航天大学 | 基于自适应多尺度融合稀疏保持投影的一维距离像识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101630364A (zh) * | 2009-08-20 | 2010-01-20 | 天津大学 | 基于融合特征的步态信息处理与身份识别方法 |
CN101807245A (zh) * | 2010-03-02 | 2010-08-18 | 天津大学 | 基于人工神经网络的多源步态特征提取与身份识别方法 |
CN102024030A (zh) * | 2010-11-30 | 2011-04-20 | 辽宁师范大学 | 基于最大期望参数估计的多分类器集成方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030063796A1 (en) * | 2001-09-28 | 2003-04-03 | Koninklijke Philips Electronics N.V. | System and method of face recognition through 1/2 faces |
-
2012
- 2012-06-13 CN CN201210195701.6A patent/CN102768732B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101630364A (zh) * | 2009-08-20 | 2010-01-20 | 天津大学 | 基于融合特征的步态信息处理与身份识别方法 |
CN101807245A (zh) * | 2010-03-02 | 2010-08-18 | 天津大学 | 基于人工神经网络的多源步态特征提取与身份识别方法 |
CN102024030A (zh) * | 2010-11-30 | 2011-04-20 | 辽宁师范大学 | 基于最大期望参数估计的多分类器集成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102768732A (zh) | 2012-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102768732B (zh) | 融合稀疏保持映射和多类别属性Bagging的人脸识别方法 | |
CN103971123B (zh) | 基于线性回归与Fisher判别字典学习的高光谱图像分类方法 | |
CN104008375B (zh) | 基于特征融合的集成人脸识别方法 | |
CN102324047B (zh) | 基于稀疏核编码skr的高光谱图像地物识别方法 | |
CN102968626B (zh) | 一种人脸图像匹配的方法 | |
Hung et al. | Image texture analysis | |
Clément et al. | Learning spatial relations and shapes for structural object description and scene recognition | |
Bonis et al. | Persistence-based pooling for shape pose recognition | |
CN102663374B (zh) | 基于多特征属性的多类别Bagging步态识别方法 | |
CN104599275A (zh) | 基于概率图模型的非参数化的rgb-d场景理解方法 | |
CN101350069A (zh) | 从训练数据构建分类器并使用分类器检测在测试数据中的移动对象的计算机实现方法 | |
CN104268593A (zh) | 一种小样本情况下多稀疏表示的人脸识别方法 | |
CN103514456A (zh) | 基于压缩感知多核学习的图像分类方法及其装置 | |
CN105574475A (zh) | 一种基于共同向量词典的稀疏表示分类方法 | |
Feng et al. | DLANet: a manifold-learning-based discriminative feature learning network for scene classification | |
CN103745200A (zh) | 一种基于词带模型的人脸图像识别方法 | |
CN102194114A (zh) | 一种基于边缘梯度方向金字塔直方图的虹膜识别方法 | |
Zhao et al. | Bisecting k-means clustering based face recognition using block-based bag of words model | |
CN104239856A (zh) | 基于Gabor特征和自适应线性回归的人脸识别方法 | |
Sinha et al. | New color GPHOG descriptors for object and scene image classification | |
CN105608478A (zh) | 一种图像的特征提取与分类联合方法及系统 | |
CN104778482A (zh) | 基于张量半监督标度切维数约减的高光谱图像分类方法 | |
Dong et al. | Finger vein verification based on a personalized best patches map | |
CN103226713A (zh) | 一种多视角行为识别方法 | |
CN103246874A (zh) | 一种基于联合稀疏模型和稀疏保持映射的人脸识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150429 Termination date: 20190613 |