CN104820825A - 基于Adaboost算法的人脸识别优化方法 - Google Patents

基于Adaboost算法的人脸识别优化方法 Download PDF

Info

Publication number
CN104820825A
CN104820825A CN201510203079.2A CN201510203079A CN104820825A CN 104820825 A CN104820825 A CN 104820825A CN 201510203079 A CN201510203079 A CN 201510203079A CN 104820825 A CN104820825 A CN 104820825A
Authority
CN
China
Prior art keywords
weak classifier
classification
algorithm
sample
classifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510203079.2A
Other languages
English (en)
Other versions
CN104820825B (zh
Inventor
杨新武
袁顺
马壮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201510203079.2A priority Critical patent/CN104820825B/zh
Publication of CN104820825A publication Critical patent/CN104820825A/zh
Application granted granted Critical
Publication of CN104820825B publication Critical patent/CN104820825B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

基于Adaboost算法的人脸识别优化方法,首先对人脸图像进行特征提取和降维,用降维后的矩阵数据,使用SAMME.R算法进行识别分类;在训练弱分类器时,判断该弱分类器的结果,在所有同属一类的样本的分类中,正确分类的样本的权值和,是否比分到其他任意一类的权值和大;如果满足该条件则继续进行权值调整和下一次迭代;如果不满足,由于训练出的弱分类器不够好,达不到要求,所以在权值不变的情况下重新训练弱分类器,然后再次判断新的弱分类器是否满足上边所述的条件,如果满足进入下一次调整,不满足继续重新训练弱分类器,不断优化弱分类器的质量,从而逼近最优强分类器;得到最终的强分类器有效提高了人脸识别的准确率。

Description

基于Adaboost算法的人脸识别优化方法
技术领域
本发明属于机器学习和模式识别技术领域,是利用训练数据集成构建一个具有较强泛化能力的预测方法,以期对新的未知对象给出精确估计。
背景技术
人脸识别技术是图像处理方面的重要技术,然而识别率不高是一直妨碍人脸识别技术广泛应用的重要原因。研究发现可以通过集成学习的方法来提高准确率。集成学习使用多个学习机来解决同一问题,它通过调用一些简单的分类算法,以获得多个不同的基学习机,然后采用某种方式将这些学习机组合成一个集成学习机。一般地,一个集成学习机的构建分为两步:基学习机的生成和基学习机的合并,现有的许多集成学习算法主要是在这两方面存在差异。在构建集成学习机时,有效地产生泛化能力强、差异大的基学习机是关键,即基学习机的准确性和它们之间的多样性是两个重要因素。
目前,常见的用于生成基学习机的方法可以粗略地分为两大类:一类是将不同类型的学习算法应用于同一数据集上,这种方法得到的基学习机通常被称为是异质类型的;另一类是将同一学习算法应用于不同的训练集,这种方法得到的机学习机被称为是同质类型的。
根据基分类器提供的信息水平将现有的合并准则分成了三大类:抽象水平、秩水平和置信值水平。抽象水平是指基分类器的输出是类标签,秩水平假定基分类器的输出是根据分类器的预测效果好坏而对它们赋予的秩序列,而置信值水平则假定每个基分类器的输出是一个概率分布。在置信水平类的合并准则中,根据是否需要估计额外的参数,它们又可以分为固定的合并准则和可训练的合并准则。固定的合并准则是基于基分类器的输出对基分类器直接进行合并,常用的有最大值、最小值、中位数、乘机、均值和多数投票准则;而可训练的合并准则是将多个基分类器的输出作为新的特征再构建一个更高水平的分类器,常见的方法有神经网络、决策树、支持向量机、Bayes准则、行为知识空间、Dempster-Shafer理论等。
集成学习中的Boosting算法已被成功应用于二分类问题。Adaboost.M1算法将Boosting算法扩展到多分类问题,但它要求每个弱分类器的正确率要大于1/2。但在多分类问题中寻找正确率大于1/2的弱分类器较为困难。近几年,有学者针对该问题提出了适于多分类问题的SAMME算法,并从理论上证明了新方法符合贝叶斯最佳分类规则。该方法把对弱分类器正确率的要求从大于1/2降低到大于1/k(k为类别数),从而降低了寻找弱分类器的难度。
发明内容
本发明的目的在于针对已有人脸识别技术存在的识别率低的问题,提出一种改进的SAMME算法SAMME.R应用于人脸识别中。
为实现上述目的,本发明采用的技术方案是基于Adaboost算法的人脸识别优化方法,具体而言,
首先对人脸图像进行特征提取和降维,即利用(2D)2PCA算法对图像进行特征提取和降维,同时在行与列上对图像矩阵进行降维,进一步降低特征向量的维数,有效降低问题的时间复杂度。
用降维后的矩阵数据,使用SAMME.R算法进行识别分类。该方法是把对弱分类器(最近邻算法)正确率的要求降低到大于for j=1,...,K 1/k,保证提供足够多的弱分类器参与集成。在训练弱分类器时,判断该弱分类器的结果,在所有同属一类的样本的分类中,正确分类的样本的权值和,是否比分到其他任意一类的权值和大。如果满足该条件则继续进行权值调整和下一次迭代。如果不满足,由于训练出的弱分类器不够好,达不到要求,所以在权值不变的情况下重新训练弱分类器,然后再次判断新的弱分类器是否满足上边所述的条件,如果满足进入下一次调整,不满足继续重新训练弱分类器,不断优化弱分类器的质量,从而逼近最优强分类器;得到最终的强分类器有效提高了人脸识别的准确率。
流程图见图1,其具体步骤如下:
步骤一:数据初始化
1.1)对人脸库中的所有图像进行归一化处理,归一化的操作是指先把图像统一大小为32×32灰度值矩阵,得到大小为1024×1的灰度值矩阵,用(2D)2PCA算法降维得到大小为256×1的矩阵。初始化权值i=1,...,m。其中m是图像个数。
步骤二:循环处理过程
2.1)for 1,...,T,执行以下7步:
①按照权值wt,选择图像样本。
②对样本进行分类识别,ht:X→Y。即将每个样本用最近邻弱分类器进行分类识别,其中X是样本,Y是样本分类结果。
③for k=1,...,K,执行以下2步。进行权值调整。
(1)循环计算各类中,分到各类样本的权值和
for j=1,...,K
       γ tkj = Σ i = 1 m w i t [ y i = k , h t ( x i ) = j ] , (样本权值和)
(2)判断各类中分类正确的样本权值和是否大于分到
       1 - ϵ t = 1 k + r t > 0 = Σ i = 1 m [ h t ( x i ) ≠ y i ] / mx i
其他各类样本的权值和
       γ tkj [ h t ( x i ) = j ] > = ∀ γ tkj [ h t ( x i ) ≠ j ]
若满足,则进行下一次循环。
若不满足,则返回步骤二重新开始计算。
其中K是采样个数。
④计算ht的伪错误率:用于判断算法的的识别效果。
⑤置 a t = ln ϵ t 1 - ϵ t + ln ( k - 1 ) , 算法收敛阈值
⑥计算新的权重向量 w i t + 1 = w i t · exp ( a t · [ h t ( x i ) ≠ y i ] ) , 用于后续图像的选择。
⑦归一化权值使之在0-1范围内。
其中T为迭代次数。
步骤三:最终强分类器
3.1)
       h f ( x ) = arg max y ∈ Y Σ t = 1 T a t · [ h t ( x t ) = y t ]
其中hf(x)为最终生成的强分类器,用于人脸识别分类,输出分类结果。x为输入的人脸头像数据,T为迭代次数,ht(xt)为弱分类器,yi为类别标号。
本发明的有益效果在于:1、提高了弱分类器的质量;2、利用本发明算法进行分类识别可以提高分类准确率即人脸识别率。
附图说明
图1是算法流程。
图2是AdaBoost有效性的分析。
图3是AdaBoost有效性的分析。
图4是AdaBoost有效性的分析。
具体实施方式
下面详细给出该发明技术方案中所涉及的各个细节问题的说明:
在boosting方法中,最终正确率与弱分类器的质量和数量都有关。在两类问题中,第t次得到的弱分类器ht(x)的错误率为 ϵ t = 1 / 2 - γ t = Σ i = 1 m [ h t ( x i ) ≠ y i ] / m , 则正确率为 1 - ϵ t = 1 2 + r t , 若rt>0,采用简单投票法,即最终的强分类器对训练样本集S={(x1,y1),(x2,y1),...,(xm,y2)},由εt的定义,ht(xi)=yi的概率为1/2+rt。T次训练得到T个弱分类器,如果不同ht(x)能够正确分类的样本分布均匀,则随着T的增多,即S中越来越多的xi被超过一半的ht(x)正确分类。当T趋近于无穷,且ht(x)正确分类的样本分布足够均匀,则每个xi都将被超过一半的ht(x)正确分类。大数定理指出频率稳定收敛于概率,任一样本xi能够被ht(x)正确分类的个数占全部T个分类器的个数的比率就是该样本被正确分类的频率。根据该频率大小来决定目标的标签类,这种推断随着T的增加并趋近于无穷大时,强分类器出错的概率就趋于零。
如图2所示,当ht(xi)=yi,就把t行i列标注为空白,则每一行的空白部分代表ht(x)对S分类正确的样本数,第t行空白部分比例就为1/2+rt。T次训练得到T个弱分类器后,图中空白部分比灰色部分多,纵向来看,必然有些样本xi对应的列的空白部分所占比例大于1/2。如果不同ht(x)能够正确分类的样本分布均匀,则随着T的增多,即S中越来越多的xi被超过一半的ht(x)正确分类。当T趋近于无穷,则每个xi都将被超过一半的ht(x)正确分类。最终,强分类器可以投票选出正确的分类。
由两类问题扩展到多类问题,在Adaboost.M1算法中,定义m个样本序列{(x1,y1),(x2,y2),...,(xm,ym)},其中yi为标签且yi∈Y={1,...,k}。
样本权重分布为D,迭代次数T。ht(x)的错误率为 ϵ t = 1 / 2 - r t = Σ i = 1 m [ h t ( x i ) ≠ y i ] / m , 则正确率为 1 - ϵ t = 1 2 + r t , 在Adaboost.M1算法中要求rt>0,采用简单投票法,即T次训练得到T个弱分类器,由于ht(xi)=yi的概率为1/2+rt,如果不同ht(x)能够正确分类的样本分布均匀,则随着T的增多,即S中越来越多的xi被超过一半的ht(x)正确分类。大数定理指出频率稳定收敛于概率,任一样本xi能够被ht(x)正确分类的个数占全部T个分类器的个数的比率就是该样本被正确分类的频率。根据该频率大小来决定目标的标签类,这种推断随着T的增加并趋近于无穷大时,出错的概率就趋于零。
如图3所示,同两类问题一样,在弱分类器训练中,当ht(xi)=yi,就把t行i列标注为空白,则每一行的空白部分代表ht(x)对S分类正确的样本数,第t行空白部分比例就为1/2+rt。T次训练的得到T个弱分类器后,由于每次分类的正确率大于1/2,图中空白部分比灰色部分多,纵向来看,必然有些样本xi对应由于每次分类的正确率大于1/2,空白部分所占比例大于1/2。如果不同ht(x)能够正确分类的样本分布均匀,则随着T的增多,即S中越来越多的xi被超过一半的ht(x)正确分类。在T趋近于无穷的情况下,分类正确的标签一定比分到其他类的标签的数量多,保证最终的强分类器正确。
在SAMME算法中,只要求正确率大于1/k,也就是ht(x)的错误率为 ϵ t = k - 1 k - r t = Σ i = 1 m [ h t ( x i ) ≠ y i ] / m , 则正确率为 1 - ϵ t = 1 k + r t , 且rt>0。采用简单投票法,即若存在样本xi属于第n类,对于弱分类器ht(x)其分到各类的概率分别为且q1+q2+q3+…+qk=0,qn>0,满足SAMME算法要求,若存在qm>qn>0,经过T次投票,在T趋近于无穷的情况下,频率稳定收敛于概率,最终分类结果可能为概率最大的第m类,导致最终分类结果错误。
与Adaboost.M1算法不同,SAMME算法中,由于每次分类的正确率为而不是1/2+rt,T次训练得到T个弱分类器后,不能保证分类正确的样本数量一定大于分到其他任意一类的数量,导致最终的分类错误。而在Adaboost.M1算法中,弱分类器的正确率为1/2+rt,则样本最终分到正确类的数量一定大于分到其他各类的样本的数量之和,从而其分类正确样本数量一定大于分到其他任意一类的数量,保证了当T趋近于无穷时,最终分类结果的错误率趋近于0。
如图4所示,当ht(xi)=yi,就把t行i列标注为空白,则每一行的空白部分代表ht(x)对S分类正确的样本。若对于属于n类的样本xn,若ht(xi),分至k类的概率分别为{q1,q2,…,qk},其中q1+q2+…+qk=1,qm>qn>1/k,则当T趋近于无穷时,强分类器最终会选择n类,导致分类结果错误。
要保证在最后的综合投票中分类正确的样本所占的数量是最多的,仅要求弱分类器的正确率大于1/k是不够的,需要添加一定的限制条件。为此,本文提出在训练弱分类器时,判断该弱分类器的结果,在所有同属一类的样本的分类中,正确分类的样本的权值和,是否比分到其他任意一类的权值和大。如果满足该条件则继续进行权值调整和下一次迭代。如果不满足,可能是由于训练出的弱分类器不够好,达不到要求,所以可以在权值不变的情况下重新训练弱分类器,然后再次判断新的弱分类器是否满足上边所说的条件,如果满足进入下一次调整,不满足继续重新训练弱分类器。经过此条件的限制,当T趋近于无穷时,分类正确的标签一定比分到其他各类的标签的数量多,最终分类器的错误率趋近于0。
若m个样本序列{(x1,y1),(x2,y2),...,(xm,ym)},其中yi为类别,且yi∈Y={1,...,k},弱分类器ht(x)。对于P∈{1,...,k},弱分类器ht(x),在第P类样本的分类中,分到各类的概率为{p1,p2,…,pk},若有a=P,则要求b∈{1,...,a-1,a+1,...,k}。若不满足此条件,则重新训练ht(x),直到训练出的弱分类ht(x)满足上述条件。
在此基础上,本文提出了SAMME.R算法,该算法流程如下:
步骤一:数据初始化
(1)初始化权值 w t 1 = D ( i ) = 1 m , i = 1 , . . . , m .
步骤二:循环处理
for t=1,...,T,执行以下7步:
①按照权值wt,选择训练样本。
②对样本进行分类识别,ht:X→Y。
③for k=1,...,K,执行以下2步。
(1)循环计算各类中,分到各类样本的权值和
for j=1,...,K
       γ tkj = Σ i = 1 m w i t [ y i = k , h t ( x i ) = j ] ,
(2)判断各类中分类正确的样本权值和是否大于分到其他各类样本的权值和 γ tkj [ h t ( x i ) = j ] > = ∀ γ tkj [ h t ( x i ) ≠ j ] .
若满足,则进行下一次循环。
若不满足,则返回步骤二重新开始计算。
④计算ht的伪错误率: ϵ t = Σ i = 1 m w i t [ h t ( x i ) ≠ y i ] .
⑤置 a t = ln ϵ t 1 - ϵ t + ln ( k - 1 )
⑥计算新的权重向量 w i t + 1 = w i t · exp ( a t · [ h t ( x i ) ≠ y i ] )
⑦归一化
步骤三:最终强分类器
       h f ( x ) = arg max y ∈ Y Σ t = 1 T a t · [ h t ( x t ) = y t ]
和SAMME算法一样,SAMME.R算法要求弱分类器ht(x)的性能只要比随机猜测好就可以被接受,而不是Adaboost.M1要求的必须有多于一半的样本被正确分类。在k分类问题中,SAMME算法仅要求弱分类器的正确率大于1/k。而提出SAMME.R算法不仅要求弱分类器的正确率要大于1/k,而且还要大于任意分到其他类的概率Adaboost.M1算法中要求弱分类器的正确率要大于任意分到其他类的概率之和。因此,提出的算法,对弱分类器的要求会比SAMME严格一点,但显然要比Adaboost.M1中对弱分类器的要求松的多。
对SAMME算法的改进,并未影响其满足的向前梯度添加模型。因此,SAMME.R算法同样满足贝叶斯最佳分类规则。
对比实验表明,提出的SAMME.R算法的结果要好于SAMME算法,并达到了不弱于Adaboost.M1算法的效果。不但使其更容易应用到实际应用中,同时提高了其分类的准确性。
1.SAMME.R算法数学分析
针对多分类问题,对Adaboost.M1、SAMME、SAMME.R算法的有效性进行数学分析。
Adaboost.M1算法中,在k分类问题中,若采用简单投票法构成强分类器,即则对任意训练集St,输出一个最大错误率为的分类器ht(x),ht(x):x→{1,...,k},相互独立选取不同的St得到不同的ht(x)。定义随机变量序列Zt
       Z t = + 1 , if h t ( x ) = y - 1 , if h t ( x ) ≠ y
则Zt是一个均值为μt=E(Zt)=1-2εt,方差为的随机变量。记 μ = 1 T Σ t = 1 T μ t , δ 2 = 1 T Σ t = 1 T δ t 2 .
由训练集的独立性可认为Zt是独立的,于是由大数定理,有:
       lim t → ∞ P ( | 1 T Σ t = 1 T ( Z t - μ t ) | ≤ ϵ ) = 1
依概率收敛于 μ = 1 T Σ t = 1 T μ t = 1 T Σ t = 1 T ( 1 - 2 ϵ t ) ≥ 2 γ .
根据Zt的定义,当T→∞,对任意实例x,满足ht(x)=y比ht(x)≠y的ht(x)个数平均多μ个,采取简单投票法,对x的分类错误率将趋于零。
SAMME算法中,在k分类问题中,若采用简单投票法构成强分类器,即则对任意训练集St,输出一个最大错误率为的分类器ht(x),ht(x):x→{1,...k},相互独立选取不同的St得到不同的ht(x)。定义随机变量序列Zt
       Z t = + 1 , if h t ( x ) = y - 1 , if h t ( x ) ≠ y
则Zt是一个均值为μt=E(Zt)=1-2εt,方差为的随机变量。记 μ = 1 T Σ t = 1 T μ t , δ 2 = 1 T Σ t = 1 T δ t 2 .
由训练集的独立性可认为Zt是独立的,于是 δ 2 = 1 T Σ t = 1 T 4 ϵ t ( 1 - ϵ t ) ≤ 4 k - 4 k 2 + 4 k - 8 γ k - 4 γ 2 , 由大数定理,有:
       lim t → ∞ P ( | 1 T Σ t = 1 T ( Z t - μ t ) | ≤ ϵ ) = 1 ,
依概率收敛于 μ = 1 T Σ t = 1 T μ t = 1 T Σ t = 1 T ( 1 - 2 ϵ t ) ≥ - 1 + 2 k + 2 γ .
当k>2时,μ不一定大于0,根据Zt的定义,当T→∞,对任意实例x,满足ht(x)=y的ht(x)个数,不一定比满足ht(x)≠y的ht(x)个数多,采取简单投票法,对x的分类错误率可能不会趋于零。
因此,提出了SAMME.R算法,在k分类问题中,若采用简单投票法构成强分类器,即则对任意训练集St,输出一个最大错误率为的分类器ht(x),ht(x)分类到k类的最小概率分别为且γ12+…+γk=0。SAMME.R算法中要求,若ht(x)=m,m∈{1,2,...,k},则n∈{1,2,...,m-1,m+1,...,k}。设ht(x)=m的概率为p,则ht(x)=n的概率为q,p-q=d,d≥0。
定义随机变量序列Zt
       Z t = + 1 , if h t ( x ) = m 0 , if h t ( x ) ≠ m , n - 1 , if h t ( x ) = n
则Zt是一个均值为μt=E(Zt)=d,方差为的随机变量。记 μ = 1 T Σ t = 1 T μ t , δ 2 = 1 T Σ t = 1 T δ t 2 .
由训练集的独立性可认为Zt是独立的,于是 δ t 2 = 1 T Σ t = 1 T ( - 2 p ( d + d 2 ) + 2 d 2 + d 3 + d ) ≤ 2 ( d + d 2 ) k - 2 γ m ( d + d 2 ) + d 3 + 2 d 2 + d , 由大数定理,有:
       lim t → ∞ P ( | 1 T Σ t = 1 T ( Z t - μ t ) | ≤ ϵ ) = 1
依概率收敛于 μ = 1 T Σ t = 1 T μ t = 1 T Σ t = 1 T ( γ mt - γ nt ) ≥ d . 根据Zt的定义,当T→∞,对任意实例x,满足ht(x)=m比的ht(x)个数平均多d个,采取简单投票法,对x的分类错误率将趋于零。
2.实验
在Yale人脸库和UCI数据集上,对SAMME.R、SAMME、以及AdaboostM1算法进行比较测试。在Yale、Segmentation、Vowel、Balance-scale、Ecoli、Wine、Yeast,这七个数据集上进行了测试。其中,Segmentation数据集和Vowel数据集预先指定了训练集和测试集的内容。其他的数据集,随机挑选一半的样本作为训练集,其余部分作为测试集。数据集的基本情况如下表所示:
      
数据集 训练集 测试集 属性数 类别数
Segmentation 210 2100 19 7
Vowel 528 462 10 11
Balance-scale 105 520 4 3
Ecoli 162 165 7 5
Wine 88 90 13 3
Yeast 740 744 8 10
Yale 90 75 256 15
用最近邻的方法作为弱分类器。在上述数据集上进行的实验中,采用了5次实验取平均值的办法,分别计算了SAMME.R算法、SAMME算法以及Adaboost.M1算法,在200次迭代、400次迭代、和600次迭代时的分类识别的错误率,实验结果如下表所示。
      
在Segmentation、Balance-scale、Ecoli、Wine、Yeast、Yale数据库上,SAMME.R算法得出的结果都要优于SAMME算法和Adaboost.M1算法。只有在Vowel数据集上的表现不如Adaboost.M1算法,但SAMME.R的效果,仍然要比SAMME算法要好。
在这些数据集上的测试外,还在Letter、Nursery、Pendigits、Satimage这几个数据集上进行了实验,由于实验过程中,未出现SAMME.R中需要重新训练弱分类器的情况,所以在这四个数据集上SAMME.R算法相当于SAMME算法。
在人脸库等数据集上的对比实验表明,提出的SAMME.R算法的结果要好于SAMME算法,并且有效的提高了人脸识别准确率。

Claims (1)

1.基于Adaboost算法的人脸识别优化方法,其特征在于:
首先对人脸图像进行特征提取和降维,即利用(2D)2PCA算法对图像进行特征提取和降维,同时在行与列上对图像矩阵进行降维,进一步降低特征向量的维数,有效降低问题的时间复杂度;
用降维后的矩阵数据,使用SAMME.R算法进行识别分类;该方法是把对弱分类器正确率的要求降低到大于for j=1,...,K 1/k,保证提供足够多的弱分类器参与集成;在训练弱分类器时,判断该弱分类器的结果,在所有同属一类的样本的分类中,正确分类的样本的权值和,是否比分到其他任意一类的权值和大;如果满足该条件则继续进行权值调整和下一次迭代;如果不满足,由于训练出的弱分类器不够好,达不到要求,所以在权值不变的情况下重新训练弱分类器,然后再次判断新的弱分类器是否满足上边所述的条件,如果满足进入下一次调整,不满足继续重新训练弱分类器,不断优化弱分类器的质量,从而逼近最优强分类器;得到最终的强分类器有效提高了人脸识别的准确率;
其具体步骤如下:
步骤一:数据初始化
1.1)对人脸库中的所有图像进行归一化处理,归一化的操作是指先把图像统一大小为32×32灰度值矩阵,得到大小为1024×1的灰度值矩阵,用(2D)2PCA算法降维得到大小为256×1的矩阵;初始化权值i=1,...,m;其中m是图像个数;
步骤二:循环处理过程
2.1)for 1,...,T,执行以下7步:
①按照权值wt,选择图像样本;
②对样本进行分类识别,ht:X→Y;即将每个样本用最近邻弱分类器
进行分类识别,其中X是样本,Y是样本分类结果;
③for k=1,...,K,执行以下2步;进行权值调整;
(1)循环计算各类中,分到各类样本的权值和
for j=1,...,K
γ tkj = Σ i = 1 m w i t [ y i = k , h i ( x i ) = j ]
(2)判断各类中分类正确的样本权值和是否大于分到
1 - ϵ t = 1 k + r t > 0 Σ i = 1 m [ h t ( x i ) ≠ y i ] / mx i
其他各类样本的权值和
γ tkj [ h t ( x i ) = j ] > = ∀ γ tkj [ h t ( x i ) ≠ j ]
若满足,则进行下一次循环;
若不满足,则返回步骤二重新开始计算;
其中K是采样个数;
④计算ht的伪错误率:用于判断算法的的识别效果;
⑤置 a t = ln ϵ t 1 - ϵ t + ln ( k - 1 ) , 算法收敛阈值;
⑥计算新的权重向量用于后续图像的选择;
⑦归一化权值使之在0-1范围内;
其中T为迭代次数;
步骤三:最终强分类器
3.1)
h f ( x ) = arg max y ∈ Y Σ t = 1 T a t · [ h t ( x t ) = y t ]
其中hf(x)为最终生成的强分类器,用于人脸识别分类,输出分类结果;x为输入的人脸头像数据,T为迭代次数,ht(xt)为弱分类器,yi为类别标号。
CN201510203079.2A 2015-04-27 2015-04-27 基于Adaboost算法的人脸识别优化方法 Active CN104820825B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510203079.2A CN104820825B (zh) 2015-04-27 2015-04-27 基于Adaboost算法的人脸识别优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510203079.2A CN104820825B (zh) 2015-04-27 2015-04-27 基于Adaboost算法的人脸识别优化方法

Publications (2)

Publication Number Publication Date
CN104820825A true CN104820825A (zh) 2015-08-05
CN104820825B CN104820825B (zh) 2017-12-22

Family

ID=53731115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510203079.2A Active CN104820825B (zh) 2015-04-27 2015-04-27 基于Adaboost算法的人脸识别优化方法

Country Status (1)

Country Link
CN (1) CN104820825B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975902A (zh) * 2016-04-09 2016-09-28 北京工业大学 基于samme.rcw算法的人脸识别优化方法
CN107560850A (zh) * 2017-08-26 2018-01-09 中南大学 基于小波阈值降噪与AdaBoost的轴系故障识别方法
CN107609480A (zh) * 2017-08-10 2018-01-19 青岛萨纳斯新能源科技有限公司 一种基于实时视频检测表情的公共安全视频监测算法
CN107818339A (zh) * 2017-10-18 2018-03-20 桂林电子科技大学 一种人类活动识别的方法
CN107832722A (zh) * 2017-11-17 2018-03-23 江南大学 一种基于AdaBoost的人脸检测分类器构造方法
CN108647621A (zh) * 2017-11-16 2018-10-12 福建师范大学福清分校 一种基于人脸识别的视频分析处理系统及方法
CN109842614A (zh) * 2018-12-29 2019-06-04 杭州电子科技大学 基于数据挖掘的网络入侵检测方法
CN112686456A (zh) * 2020-12-31 2021-04-20 广东电网有限责任公司 一种结合边缘计算与用能识别的电力负荷预测系统和方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102163239A (zh) * 2011-05-11 2011-08-24 中科院成都信息技术有限公司 一种基于浮动分类阈值的分类器集成方法
CN102663374A (zh) * 2012-04-28 2012-09-12 北京工业大学 基于多特征属性的多类别Bagging步态识别方法
CN102768732A (zh) * 2012-06-13 2012-11-07 北京工业大学 融合稀疏保持映射和多类别属性Bagging的人脸识别方法
US8744172B2 (en) * 2011-06-15 2014-06-03 Siemens Aktiengesellschaft Image processing using random forest classifiers

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102163239A (zh) * 2011-05-11 2011-08-24 中科院成都信息技术有限公司 一种基于浮动分类阈值的分类器集成方法
US8744172B2 (en) * 2011-06-15 2014-06-03 Siemens Aktiengesellschaft Image processing using random forest classifiers
CN102663374A (zh) * 2012-04-28 2012-09-12 北京工业大学 基于多特征属性的多类别Bagging步态识别方法
CN102768732A (zh) * 2012-06-13 2012-11-07 北京工业大学 融合稀疏保持映射和多类别属性Bagging的人脸识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHU J ET AL.: "Multi-class adaboost", 《STATISTICS AND ITS INTERFACE》 *
翟飞: "基于集成学习的人脸识别方法研究", 《中国优秀硕士学位论文全文数据库·信息科技辑》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975902A (zh) * 2016-04-09 2016-09-28 北京工业大学 基于samme.rcw算法的人脸识别优化方法
CN105975902B (zh) * 2016-04-09 2019-07-26 北京工业大学 基于samme.rcw算法的人脸识别优化方法
CN107609480A (zh) * 2017-08-10 2018-01-19 青岛萨纳斯新能源科技有限公司 一种基于实时视频检测表情的公共安全视频监测算法
CN107560850A (zh) * 2017-08-26 2018-01-09 中南大学 基于小波阈值降噪与AdaBoost的轴系故障识别方法
CN107560850B (zh) * 2017-08-26 2019-04-12 中南大学 基于小波阈值降噪与AdaBoost的轴系故障识别方法
CN107818339A (zh) * 2017-10-18 2018-03-20 桂林电子科技大学 一种人类活动识别的方法
CN108647621A (zh) * 2017-11-16 2018-10-12 福建师范大学福清分校 一种基于人脸识别的视频分析处理系统及方法
CN107832722A (zh) * 2017-11-17 2018-03-23 江南大学 一种基于AdaBoost的人脸检测分类器构造方法
CN107832722B (zh) * 2017-11-17 2021-05-28 江南大学 一种基于AdaBoost的人脸检测分类器构造方法
CN109842614A (zh) * 2018-12-29 2019-06-04 杭州电子科技大学 基于数据挖掘的网络入侵检测方法
CN112686456A (zh) * 2020-12-31 2021-04-20 广东电网有限责任公司 一种结合边缘计算与用能识别的电力负荷预测系统和方法

Also Published As

Publication number Publication date
CN104820825B (zh) 2017-12-22

Similar Documents

Publication Publication Date Title
CN104820825B (zh) 基于Adaboost算法的人脸识别优化方法
CN109815801A (zh) 基于深度学习的人脸识别方法及装置
CN100595780C (zh) 一种基于模块神经网络的手写体数字自动识别方法
CN107292097B (zh) 基于特征组的中医主症选择方法
CN101256631B (zh) 一种字符识别的方法、装置
CN111311702B (zh) 一种基于BlockGAN的图像生成和识别模块及方法
CN107292225A (zh) 一种人脸识别方法
CN105320967A (zh) 基于标签相关性的多标签AdaBoost集成方法
CN112232395B (zh) 一种基于联合训练生成对抗网络的半监督图像分类方法
CN115578248B (zh) 一种基于风格引导的泛化增强图像分类算法
JP2010039778A (ja) 次元削減方法、パターン認識用辞書生成装置、及びパターン認識装置
CN109558898B (zh) 一种基于深度神经网络的高置信度的多选择学习方法
CN102184422B (zh) 一种平均错分代价最小化的分类器集成方法
CN110110845A (zh) 一种基于并行多级宽度神经网络的学习方法
CN115270752A (zh) 一种基于多层次对比学习的模板句评估方法
CN109409231B (zh) 基于自适应隐马尔可夫的多特征融合手语识别方法
CN105975902B (zh) 基于samme.rcw算法的人脸识别优化方法
CN109948589A (zh) 基于量子深度信念网络的人脸表情识别方法
CN113743443A (zh) 一种图像证据分类和识别方法及装置
US11521427B1 (en) Ear detection method with deep learning pairwise model based on contextual information
Ganebnykh et al. Metric classifier using multilevel network of templates
Aleskerova et al. Handwritten Chinese characters recognition using two-stage hierarchical convolutional neural network
CN111126444A (zh) 分类器集成方法
CN110211123A (zh) 一种深度学习神经网络的优化方法、装置及系统
CN112257787B (zh) 基于生成式双重条件对抗网络结构的图像半监督分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant