CN101937510A - 基于类Haar和AdaBoost分类器的快速增量学习方法 - Google Patents

基于类Haar和AdaBoost分类器的快速增量学习方法 Download PDF

Info

Publication number
CN101937510A
CN101937510A CN 201010280839 CN201010280839A CN101937510A CN 101937510 A CN101937510 A CN 101937510A CN 201010280839 CN201010280839 CN 201010280839 CN 201010280839 A CN201010280839 A CN 201010280839A CN 101937510 A CN101937510 A CN 101937510A
Authority
CN
China
Prior art keywords
sample
class haar
classification
haar feature
union
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010280839
Other languages
English (en)
Other versions
CN101937510B (zh
Inventor
文学志
方巍
郑钰辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN201010280839.7A priority Critical patent/CN101937510B/zh
Publication of CN101937510A publication Critical patent/CN101937510A/zh
Application granted granted Critical
Publication of CN101937510B publication Critical patent/CN101937510B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于类Haar和AdaBoost分类器的快速增量学习方法,属于图像检测技术领域。本发明对于新增加的未正确识别的训练样本集,在不损失已有学习效果的前提下,增加一些关键的类Haar特征信息,而不是重新寻找关键类Haar特征信息,以提高训练的速度。本发明利用所提出的增量学习方法较好地解决了快速提升基于类Haar特征和AdaBoost分类器方法的识别性能问题,将其应用于车辆图像检测实验,与传统增量学习方法相比,在两者提升识别性能相近的情形下,明显减少了学习机的学习时间。

Description

基于类Haar和AdaBoost分类器的快速增量学习方法
技术领域:
本发明涉及一种基于类Haar和AdaBoost分类器的快速增量学习方法,属于图像检测技术领域。
背景技术:
在基于机器学习识别方法中,基于类Haar特征与AdaBoost分类器的识别方法由于其识别性能好、检测速度快、能够满足实时性应用要求在车辆识别、人脸检测等领域获得了成功应用,但AdaBoost分类器相比较SVM(Support Vector Machines,支持向量机)等分类器,其训练过程非常耗时,而学习机的识别性能是一个累积提升的过程,增量学习是提高学习机性能的最直接、最有效的方式,然而,基于类Haar特征与AdaBoost分类器的方法本身具有计算量大、耗时长,其传统增量学习方法是将上一次学习完毕的学习机对新增加的训练样本集进行识别,将未正确识别的样本集与上一次学习所用训练样本集混合在一起作为新的训练样本训练集重新进行学习,使得训练所需时间越来越长,导致学习机不能灵活的扩展,大大限制了该识别方法的应用前景。
发明内容
本发明的所要解决的技术问题是针对现有基于类Haar特征与AdaBoost分类器的方法AdaBoost方法增量学习过程中存在的计算量大、耗时长问题,提出一种快速增量学习方法
本发明为实现上述发明目的采用如下技术方案:
一种基于类Haar和AdaBoost分类器的快速增量学习方法,所述快速增量学习方法对于未正确识别的新增加的训练样本集,采用原始训练样本集所得到的关键类Haar特征集为基础,通过增加新的关键类Haar特征来完成学习机的增量学习,具体步骤如下:
设新增加的未正确识别训练样本集合为Δ,样本集合Δ的样本数量为m,Δ与原始训练样本集合的并集为Ω,样本并集Ω的样本总数为n,基于原始训练样本集合得到的关键类Haar特征集为Γ;样本集合Δ的初始权值为u1(i)=1/m,其中i=1,2,…,m;样本并集Ω的初始权值为v1(i′)=1/(n),其中i′=1,2,…,n;m、n均为自然数;
A、归一化样本并集Ω的权值: v t ( i ′ ) = v t ( i ′ ) / Σ t = 1 n v t ( i ′ ) ;
B、基于样本集合Δ寻找关键特征:
1)归一化样本集合Δ的权值:
Figure BSA00000268539400022
其中t代表迭代次数,t=1,2,…,T,T为自然数;
2)在样本集合Δ上构造弱分类器集合,采用(1)式寻找分类误差最小的弱分类器φi和关键类Haar特征δ,
ϵ t = 1 2 Σ i = 1 m u t ( i ) | φ t ( δ ( x i ) ) - y i | , - - - ( 1 )
其中εt代表分类误差,φt(δ(xi))表示对样本xi上的关键特征δ的分类结果,yi代表样本xi的真实类别;
C、判断关键类Haar特征δ是否属于采用原始训练样本集所得到的关键类Haar特征集;当结果为是,进入下一步骤;当结果为否,则将所述关键类Haar特征δ添加进原始训练样本集所得到的关键类Haar特征集Γ,进入下一步骤;
D、在所述样本并集Ω和C步骤得到的关键类Haar特征集Γ上,构造弱分类器集合,并采用(2)式寻找误差最小的弱分类器ft和关键类Haar特征η,
E t = 1 2 Σ i = 1 m + n v t ( i ′ ) | f t ( η ( x i ′ ) ) - y i ′ | , - - - ( 2 )
其中Et代表分类误差,ft(η(xi′))表示弱分类器ft对样本xi′上的关键特征η的分类结果;
E、在所述样本并集Ω上计算分类权值
Figure BSA00000268539400025
αt代表分类权值;
F、更新样本并集Ω的权值:ft(xi′)表示弱分类器ft对样本xi′的分类结果,e为自然对数底且e为常数;
G、更新样本集合Δ的权值:
ut(i)=exp(-yiψt(xi)),其中ψt(xi)=ptt-δ(xi)),pt∈{-1,+1}表示分类方向,δ(xi)表示样本xi上的关键类Haar特征值,θt为弱分类器在类Haar特征δ上的分类阈值;
H、如果在样本并集Ω上由弱分类器组成的强分类器F(x)=sign(∑αtft(x))对样本并集Ω的识别效果达到期望值,则输出分类器以及所选取的关键类Haar特征集;否则,返回A步骤。
进一步的,本发明的基于类Haar和AdaBoost分类器的快速增量学习方法的步骤B的第1)步中T值为600。
进一步的,本发明的基于类Haar和AdaBoost分类器的快速增量学习方法的步骤H中所述的期望值定义为99%。
进一步的,分类阈值θt的计算方法如下:
为叙述方便,设类Haar特征δ在样本集合Δ上得到的特征值按由小到大排序得到的特征向量为SortVec,设排完序后对应的类别标签向量变为Lab;
1)构造候选分类位置集:从左向右察看所有类别标签出现变化的位置对,判断所述出现变化的位置对所对应的特征值是否相同;
A.若特征值不同,将所述位置对的第一个位置放入候选分类位置集中;
B.若特征值相同,首先向左查找与所述相同特征值不同的第一个特征值,判断该特征值对应的位置是否已包含在候选分类位置集中,若该特征值对应的位置没有包含在候选分类位置集中,则将该特征值对应的位置加入候选分类位置集中;然后再向右查找与所述相同特征值不同的第一个特征值,断该特征值对应的位置是否已包含在候选分类位置集中,若该特征值对应的位置没有包含在候选分类位置集中,则将该特征值对应的位置加入候选分类位置集中;记得到的候选分类位置集为L={l1,l2,…,lk′},其中k′为候选分类位置的个数,每一个候选分类位置用特征值对{SortVec(i-1),SortVec(i)}来表示,记为lj,j=1,2,…,k′;
2)求最佳分类位置:从步骤1)得到的候选分类位置集L中选取一个使得分类错误最小的分类位置作为最佳分类位置τ,τ∈L;
3)设置分类阈值:设当特征值小于等于SortVec[τ-1]时,类别输出为Label;设当特征值大于等于SortVec[τ]时,类别输出为-Label,其中,Label∈{-1,+1};
C.当特征值小于等于SortVec[τ-1]时,类别输出为Label的先验概率P1为:
P 1 ( Label | SortVec [ i ] ≤ SortVec [ τ - 1 ] ) = Σ y i = Label u i Σ i ≤ τ - 1 u i - - - ( 3 )
D.当特征值大于等于SortVec[τ]时,类别输出为-Label的先验概率P2为:
P 2 ( - Label | SortVec [ i ] ≥ SortVec [ τ ] ) = Σ y i = - Label u i Σ i ≥ τ u i - - - ( 4 )
其中,ui为第i个训练样本的权值,yi为第i个训练样本的真实标签;
E.当P1≠0并且P2≠0时,分类阈值θt设置方法如下:
θ i = SortVec [ τ - 1 ] + P 1 * | SortVec [ τ - 1 ] - SortVec [ τ ] | P 1 + P 2 - - - ( 5 )
当P1=0或P2=0时,可以将其理解成这样一个学习过程,即在训练期间弱分类器只学会识别一种类别,而通过实验发现,在特征分布正常的情况下,上面两种极端情况即使出现了,将其用于分类也无法得到最佳分类效果,总能找到比它分类效果更好的情形,因此不用考虑。
本发明采用上述技术方案,具有以下有益效果:
本发明利用所提出的增量学习方法较好地解决了快速提升基于类Haar特征和AdaBoost分类器方法的识别性能问题,将其应用于车辆图像检测实验,与传统增量学习方法相比,在两者提升识别性能相近的情形下,明显减少了学习机的学习时间。
附图说明:
图1是本发明的快速增量学习方法的流程图。
具体实施方案:
下面结合附图对技术方案的实施作进一步的详细描述:
如图1所示,为了便于描述,设新增加的未正确识别训练样本集合为Δ,样本数量为m;新增加的未正确识别训练样本集合与原始训练样本集合的并集为Ω,样本总数为n,基于原始训练样本集得到的特征集合Γ;样本集Δ的初始权值为u1(i)=1/m(i=1,2,…,m),样本集Ω的初始权值为v1(i′)=1/(n)(i′=1,2,…,n)。
下面详细介绍图1中的快速增量学习方法。
1.归一化Ω的权值: v t ( i ′ ) = v t ( i ′ ) / Σ i = 1 n v t ( i ′ ) i=1,2,…,n;
2.基于Δ寻找关键特征:
1)归一化Δ的权值:
Figure BSA00000268539400052
i=1,2,…,m,t=1,2,…,T,其中t代表迭代次数;
2)在样本集合Δ上构造弱分类器集合,寻找分类误差最小的弱分类器φt和特征δ
φ t : ϵ t = 1 2 Σ i = 1 m u t ( i ) | δ ( x i ) - y i | 其中εt代表误差。
3.如果
Figure BSA00000268539400054
则δ→Γ;
4.在样本集合Ω和特征集合Γ上,构造弱分类器集合,寻找误差最小的弱分类器ft和特征η,
f t : E t = 1 2 Σ i ′ = 1 n v t ( i ′ ) | η ( x i ′ ) - y i ′ | 其中Et代表误差。
5.在样本集合Ω上计算 α t = 1 2 ln ( ( 1 - E t ) / E t ) ;
6.更新样本集合Ω的权值
v t + 1 ( i ′ ) = v i ( i ′ ) * e α t * ( 1 - | f t ( x i ′ ) - y i ′ | )
7.更新样本集合Δ的权值:
ut(i)=exp(-yiψt(xi))
其中ψt(xi)=ptt-δ(xi))
8.如果在样本集Ω上由弱分类器组成的强分类器F(x)=sign(∑αtft(x))对Ω的识别效果达到期望值,则输出分类器以及所选取的关键类Haar特征集;否则,返回第1步。
本发明的主要思想是:对于新增加的未正确识别的训练样本集,在不损失已有学习效果的前提下,增加一些关键的类Haar特征信息,而不是重新寻找关键类Haar特征信息,以提高训练的速度。

Claims (3)

1.一种基于类Haar和AdaBoost分类器的快速增量学习方法,其特征在于:所述快速增量学习方法对于未正确识别的新增加的训练样本集,采用原始训练样本集所得到的关键类Haar特征集为基础,通过增加新的关键类Haar特征来完成学习机的增量学习,具体步骤如下:
设新增加的未正确识别训练样本集合为Δ,样本集合Δ的样本数量为m,样本集合Δ与原始训练样本集合的并集为Ω,样本并集Ω的样本总数为n,基于原始训练样本集合得到的关键类Haar特征集为Γ;样本集合Δ的初始权值为u1(i)=1/m,其中i=1,2,…,m;样本并集Ω的初始权值为v1(i′)=1/(n),其中i′=1,2,…,n;m、n均为自然数;
A、归一化样本并集Ω的权值: v t ( i ′ ) = v t ( i ′ ) / Σ t = 1 n v t ( i ′ ) ;
B、基于样本集合Δ寻找关键特征:
1)归一化样本集合Δ的权值:
Figure FSA00000268539300012
其中t代表迭代次数,t=1,2,…,T,T为自然数;
2)在样本集合Δ上构造弱分类器集合,采用(1)式寻找分类误差最小的弱分类器φt和关键类Haar特征δ,
ϵ t = 1 2 Σ i = 1 m u t ( i ) | φ t ( δ ( x i ) ) - y i | , - - - ( 1 )
其中εt代表分类误差,φt(δ(xi))表示对样本xi上的关键特征δ的分类结果,yi代表样本xi的真实类别;
C、若关键类Haar特征δ属于采用原始训练样本集所得到的关键类Haar特征集;直接进入下一步骤;否则,则将所述关键类Haar特征δ添加进基于原始训练样本集所得到的关键类Haar特征集Γ,进入下一步骤;
D、在所述样本并集Ω和C步骤得到的关键类Haar特征集Γ上,构造弱分类器集合,并采用(2)式寻找误差最小的弱分类器ft和关键类Haar特征η,
E t = 1 2 Σ t = 1 m + n v t ( i ′ ) | f t ( η ( x i ′ ) ) - y i ′ | , - - - ( 2 )
其中Et代表分类误差,ft(η(xi′))表示弱分类器ft对样本xi′上的关键特征η的分类结果;
E、在所述样本并集Ω上计算分类权值
Figure FSA00000268539300022
αt代表分类权值;
F、更新样本并集Ω的权值:ft(xi′)表示弱分类器ft对样本xi′的分类结果,e为自然对数底且e为常数;
G、更新样本集合Δ的权值:
ut(i)=exp(-yiψt(xi)),其中ψt(xi)=ptt-δ(xi)),pt∈{-1,+1}表示分类方向,θt为弱分类器在类Haar特征δ上的分类阈值,δ(xi)表示样本xi上的关键类Haar特征;
H、如果在样本并集Ω上由弱分类器组成的强分类器F(x)=sign(∑αtft(x))对样本并集Ω的识别效果达到期望值,则输出分类器以及所选取的关键类Haar特征集;否则,返回A步骤。
2.根据权利要求1所述的基于类Haar和AdaBoost分类器的快速增量学习方法,其特征在于:步骤B的第1)步中T值为600。
3.根据权利要求1所述的基于类Haar和AdaBoost分类器的快速增量学习方法,其特征在于:所述步骤H中所述的期望值定义为99%。
CN201010280839.7A 2010-09-14 2010-09-14 基于类Haar和AdaBoost分类器的快速增量学习方法 Expired - Fee Related CN101937510B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010280839.7A CN101937510B (zh) 2010-09-14 2010-09-14 基于类Haar和AdaBoost分类器的快速增量学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010280839.7A CN101937510B (zh) 2010-09-14 2010-09-14 基于类Haar和AdaBoost分类器的快速增量学习方法

Publications (2)

Publication Number Publication Date
CN101937510A true CN101937510A (zh) 2011-01-05
CN101937510B CN101937510B (zh) 2015-05-20

Family

ID=43390831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010280839.7A Expired - Fee Related CN101937510B (zh) 2010-09-14 2010-09-14 基于类Haar和AdaBoost分类器的快速增量学习方法

Country Status (1)

Country Link
CN (1) CN101937510B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129565A (zh) * 2011-03-01 2011-07-20 北京航空航天大学 基于冗余特征消减AdaBoost分类器的物体检测方法
CN103699907A (zh) * 2014-01-04 2014-04-02 复旦大学 基于机器学习的农药喷洒检测方法
CN103984950A (zh) * 2014-04-22 2014-08-13 北京联合大学 一种适应白天检测的运动车辆刹车灯状态识别方法
CN105144239A (zh) * 2013-04-26 2015-12-09 奥林巴斯株式会社 图像处理装置、程序及图像处理方法
CN105184322A (zh) * 2015-09-14 2015-12-23 哈尔滨工业大学 一种基于增量集成学习的多时相影像分类方法
CN106127257A (zh) * 2016-06-30 2016-11-16 联想(北京)有限公司 一种数据分类方法及电子设备
CN107622283A (zh) * 2017-09-28 2018-01-23 上海理工大学 一种基于深度学习的增量式物体识别方法
CN107977668A (zh) * 2017-07-28 2018-05-01 北京物灵智能科技有限公司 一种机器人图像识别方法及系统
CN109034188A (zh) * 2018-06-15 2018-12-18 北京金山云网络技术有限公司 机器学习模型的获取方法、获取装置、设备及存储介质
CN109190591A (zh) * 2018-09-20 2019-01-11 辽宁工业大学 一种基于摄像头的前车识别预警装置及识别预警方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070036429A1 (en) * 2005-08-09 2007-02-15 Fuji Photo Film Co., Ltd. Method, apparatus, and program for object detection in digital image
CN101488188A (zh) * 2008-11-10 2009-07-22 西安电子科技大学 基于混合核函数的svm分类器的sar图像分类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070036429A1 (en) * 2005-08-09 2007-02-15 Fuji Photo Film Co., Ltd. Method, apparatus, and program for object detection in digital image
CN101488188A (zh) * 2008-11-10 2009-07-22 西安电子科技大学 基于混合核函数的svm分类器的sar图像分类方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129565B (zh) * 2011-03-01 2013-11-13 北京航空航天大学 基于冗余特征消减AdaBoost分类器的物体检测方法
CN102129565A (zh) * 2011-03-01 2011-07-20 北京航空航天大学 基于冗余特征消减AdaBoost分类器的物体检测方法
CN105144239A (zh) * 2013-04-26 2015-12-09 奥林巴斯株式会社 图像处理装置、程序及图像处理方法
CN103699907A (zh) * 2014-01-04 2014-04-02 复旦大学 基于机器学习的农药喷洒检测方法
CN103699907B (zh) * 2014-01-04 2017-02-15 复旦大学 基于机器学习的农药喷洒检测方法
CN103984950A (zh) * 2014-04-22 2014-08-13 北京联合大学 一种适应白天检测的运动车辆刹车灯状态识别方法
CN103984950B (zh) * 2014-04-22 2017-07-14 北京联合大学 一种适应白天检测的运动车辆刹车灯状态识别方法
CN105184322B (zh) * 2015-09-14 2018-11-02 哈尔滨工业大学 一种基于增量集成学习的多时相影像分类方法
CN105184322A (zh) * 2015-09-14 2015-12-23 哈尔滨工业大学 一种基于增量集成学习的多时相影像分类方法
CN106127257A (zh) * 2016-06-30 2016-11-16 联想(北京)有限公司 一种数据分类方法及电子设备
CN107977668A (zh) * 2017-07-28 2018-05-01 北京物灵智能科技有限公司 一种机器人图像识别方法及系统
CN107622283A (zh) * 2017-09-28 2018-01-23 上海理工大学 一种基于深度学习的增量式物体识别方法
CN109034188A (zh) * 2018-06-15 2018-12-18 北京金山云网络技术有限公司 机器学习模型的获取方法、获取装置、设备及存储介质
CN109190591A (zh) * 2018-09-20 2019-01-11 辽宁工业大学 一种基于摄像头的前车识别预警装置及识别预警方法

Also Published As

Publication number Publication date
CN101937510B (zh) 2015-05-20

Similar Documents

Publication Publication Date Title
CN101937510A (zh) 基于类Haar和AdaBoost分类器的快速增量学习方法
CN110414462B (zh) 一种无监督的跨域行人重识别方法及系统
CN110363122B (zh) 一种基于多层特征对齐的跨域目标检测方法
CN104899571B (zh) 一种用于复杂文字识别的随机样本产生方法
CN103761531B (zh) 基于形状轮廓特征的稀疏编码车牌字符识别方法
CN103886330B (zh) 基于半监督svm集成学习的分类方法
CN107316049A (zh) 一种基于半监督自训练的迁移学习分类方法
CN101964063B (zh) 一种改进的AdaBoost分类器构造方法
CN101221623B (zh) 一种物体类型的在线训练和识别方法及其系统
CN105389583A (zh) 图像分类器的生成方法、图像分类方法和装置
CN108875816A (zh) 融合置信度准则和多样性准则的主动学习样本选择策略
CN102663401B (zh) 一种图像特征提取和描述方法
CN101980211A (zh) 一种机器学习模型及其建立方法
CN104809481A (zh) 一种基于自适应色彩聚类的自然场景文本检测的方法
US20060062460A1 (en) Character recognition apparatus and method for recognizing characters in an image
CN104143081A (zh) 基于嘴部特征的笑脸识别系统及方法
CN101980210A (zh) 一种标的词分类分级方法及系统
CN101470802B (zh) 物体检测装置和方法
CN109934203A (zh) 一种基于信息熵选择的代价敏感增量式人脸识别方法
CN107798351B (zh) 一种基于深度学习神经网络的身份识别方法和系统
CN106156805A (zh) 一种样本标签缺失数据的分类器训练方法
CN103186790A (zh) 对象检测系统和方法
CN104504383A (zh) 一种基于肤色和Adaboost算法的人脸检测方法
CN110689091A (zh) 弱监督细粒度物体分类方法
CN102024030A (zh) 基于最大期望参数估计的多分类器集成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150520

Termination date: 20170914