CN100573549C - 特定被摄体检测方法和装置 - Google Patents

特定被摄体检测方法和装置 Download PDF

Info

Publication number
CN100573549C
CN100573549C CNB2006100725764A CN200610072576A CN100573549C CN 100573549 C CN100573549 C CN 100573549C CN B2006100725764 A CNB2006100725764 A CN B2006100725764A CN 200610072576 A CN200610072576 A CN 200610072576A CN 100573549 C CN100573549 C CN 100573549C
Authority
CN
China
Prior art keywords
particle characteristics
feature
sparse
sparse particle
optimum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2006100725764A
Other languages
English (en)
Other versions
CN101051346A (zh
Inventor
艾海舟
黄畅
李源
劳世红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Omron Corp
Original Assignee
Tsinghua University
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, Omron Corp filed Critical Tsinghua University
Priority to CNB2006100725764A priority Critical patent/CN100573549C/zh
Publication of CN101051346A publication Critical patent/CN101051346A/zh
Application granted granted Critical
Publication of CN100573549C publication Critical patent/CN100573549C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种特定被摄体检测方法和装置,所述方法包括特征提取步骤,弱分类步骤,强分类步骤以及特定被摄体检测步骤,其特征在于,所述特征提取步骤为提取所输入的图像的粒度空间内的稀疏粒子特征,所述稀疏粒子特征(见右下式),其中,π为图像的粒度空间,gi(π;x,y,s)为该粒度空间内的一个粒子特征,x,y分别是粒子在图像横坐标和纵坐标轴上的偏移量,s是粒子的尺度,而αi为粒子的组合系数,n为粒子个数。

Description

特定被摄体检测方法和装置
技术领域
本发明涉及特定被摄体检测方法和装置,尤其涉及基于稀疏粒子特征的多视角人脸检测的方法和装置。
背景技术
特定被摄体(例如人脸、汽车、行人,其他物体等)的检测越来越受到人们的关注。其中,人脸检测(face detection)是一项在图片中定位人脸出现区域的技术[1],可以看作是物体检测(object detection)的一种特例。人脸通常具有十分丰富的生物特征信息,可以用于人机交互、跟踪监控、身份识别等领域,而提取人脸相关信息的首要步骤正是定位人脸区域。这使得人脸检测技术具有非同寻常的意义和极为广泛的应用前景。
多视角人脸检测的检测对象不仅包含传统研究领域中的正面直立人脸,还包括了侧面(平面外旋转)和倾斜(平面内旋转)的人脸。它是人脸检测最具有应用价值的一个课题。这是由于在现实应用中,人脸图像往往是在非配合条件下获取的,很难保证处于最佳视角(即正面直立)。与单纯的正面人脸检测相比,多视角人脸检测由于需要检测的视角范围变化更广,其问题的复杂程度也大大加深。
目前比较成功的人脸检测系统大都源于Viola和Jones在2001年提出的人脸检测模型[2]。这一模型采用Haar型特征,通过AdaBoost学习算法将若干基于这些特征的弱分类器组合成为一个强分类器,最终将这些强分类器串联起来构成瀑布型(cascade)检测器结构。与此前的工作相比[3][4][5],Viola和Jones提出的这一检测器模型可以更为有效地处理正面直立人脸检测问题。从体系架构的角度分析,如图1所示,该检测器自上而下可以分为四个层次。这其中尤为值得一提的是,由于Haar型特征能够通过积分图像进行快速计算,使得整个检测系统的运行速度大大提高,可以做到实时检测。
针对这一体系结构(图1),后人在各个方面作出了诸多改进,不仅提高了系统检测的精度和速度,还将检测器扩展成为多视角人脸检测。其中,在检测器结构层次上,为了扩大人脸检测视角,Li提出使用金字塔(pyramid)模型替代瀑布模型[6],Jones和Viola使用的是决策树结构(decision tree)[7],而Huang采用的则是宽度优先搜索树(WFS tree)[8]。另一方面,Xiao的链式Boosting算法(boosting chain)和Wu的嵌入式瀑布结构(nesting cascade)将[2]中原有的组织松散的强分类器更为紧密地联系在一起。在强分类器层次上,目前被广泛采用的是性能更为优异的RealBoost算法和GentleBoost算法。在弱分类器层次上,为了能够对特征空间进行更为细致的分割以便更好地分类([2]中的阈值型仅能将特征空间分为两部份),Wu提出了分段线性函数(piece-wisefunction)[10],而Mita则采用了组合式Haar型特征(joint Haarfeature)[11]。而在特征层次上,Liu的KL特征[12],Lienhart的扩展Haar型特征[13],Baluja的双点特征(pair-wise point)[14],Wang的RNDA算法[15]和Abramson的控制点特征(control point)[16]都是对于原有Haar型特征的有效提高。
以Viola和Jones在[2]中所使用的Haar型特征的复杂度为参照物,这些年来用于人脸检测技术的特征提取手段可以分为三个层次。其中,Liu提取的KL特征是若干Haar型特征的线性组合[12],而Wang所使用的特征是通过RNDA算法求得的线性鉴别特征[15]。与Haar型特征相比,这两种方法都可以训练得到具有强区分性信息的特征,但其特征的稠密性使得计算过程变得更加复杂,不利于实现实时检测系统。另一方面,Li所使用的相对可移动的矩形块特征[6]和Lienhart所使用的扩展Haar型特征都是基于积分图像空间的特征提取方法[13]。这类型的方法扩展并丰富了Viola和Jones所使用的原始的Haar型特征,但仅仅是列举得到了更多的基于矩形块的特征并沿用穷尽法一一尝试不同的特征,无法从根本上解决其特征组合方法所带来的约束(如果不加约束的穷举所有矩形块组合特征,其数目将比后面将描述的粒度空间内的稀疏特征还要多)。为了追求更高的检测速度,Baluja[14]和Abramson[16]分别使用了直接基于像素点的特征。由于这种特征只考虑不同像素点之间亮度的大小逻辑关系,特征的提取结果仅分为三类:大于,等于或小于。这使得这种特征无需进行上述各种特征所必需的均值方差归一化操作,从而大大提高了特征的提取速度。但这类计算迅速的特征也有其不利的一面,这就使得完全基于亮度逻辑关系的判定方式使得其分类性能相对较差,分类结果不够稳定,更容易受到环境条件和噪音的影响。
发明内容
因而,本发明鉴于现有技术的上述的问题而作出,用以克服上述现有技术的一个或更多个缺点,至少提供一种有益的选择。
为了实现本发明的目的,根据本发明的一个方面,提供了一种特定被摄体检测方法,包括特征提取步骤,弱分类步骤,强分类步骤以及特定被摄体检测步骤,其特征在于,所述特征提取步骤为提取所输入的图像的粒度空间内的稀疏粒子特征,所述稀疏粒子特征θ(π)为:
θ ( π ) = Σ i = 1 n α i g i ( π ; x , y , s ) , αi∈{-1,+1}
其中,π为图像的粒度空间,gi(π;x,y,s)为该粒度空间内的一个粒子特征,x,y分别是粒子在图像横坐标和纵坐标轴上的偏移量,s是粒子的尺度,而αi为粒子的组合系数。
优选地,所述特征提取的步骤包括以下的步骤:初始化的步骤,取得所述粒度空间中的符合Haar特征的所述稀疏粒子特征作为初始稀疏粒子特征集合;循环步骤以及最终特征生成步骤,所述循环步骤将以下三个步骤重复预定次数:(1)最合适特征查找步骤,从所述初始稀疏粒子特征集合中找到最合适稀疏粒子特征;(2)调整步骤,对所述最合适稀疏粒子特征进行调整,得到经调整稀疏粒子特征集合;以及(3)特征增加步骤,将所述经调整稀疏粒子特征集合加到所述初始稀疏粒子特征集合中,并去除所述最合适稀疏粒子特征;最终特征生成步骤将所述循环步骤中所得到的全部最合适稀疏粒子特征加到经过所述循环步骤之后的所述初始稀疏粒子特征集合中,生成最终的稀疏粒子特征集合。
优选地,所述调整步骤对所述稀疏粒子特征进行以下操作中一种或更多种:添加、删除和扰动。
优选地,所述强分类步骤采用AdaBoost学习算法,所述最合适特征查找步骤,利用以下公式查找所述最合适稀疏粒子特征:
Fitness(θ)=-log(Z(θ))-β|θ|1
其中,|θ|1为该特征中包含的粒子个数,而β是特征复杂程度的惩罚因子,Z(θ)表示采用特征θ构造的最优弱分类器的归一化因子。
其中,所述特征提取步骤可以随机地或依据特定函数提取所输入的图像的粒度空间内的预定量的稀疏粒子特征。
根据本发明的又一方面,提供了一种特定被摄体检测装置,包括特征提取单元,弱分类单元,强分类单元以及特定被摄体检测单元,其特征在于,所述特征提取单元提取所输入的图像的粒度空间内的稀疏粒子特征,所述稀疏粒子特征θ(π)为:
θ ( π ) = Σ i = 1 n α i g i ( π ; x , y , s ) , αi∈{-1,+1}
其中,π为图像的粒度空间,gi(π;x,y,s)为该粒度空间内的一个粒子特征,x,y分别是粒子在图像横坐标和纵坐标轴上的偏移量,s是粒子的尺度,而αi为粒子的组合系数。
优选地,所述特征提取单元包括以下单元:初始化单元,取得所述粒度空间中的符合Haar特征的所述稀疏粒子特征作为初始稀疏粒子特征集合;循环处理单元以及最终特征生成单元,循环处理单元包括三个单元:(1)最合适特征查找单元,从所述初始稀疏粒子特征集合中找到最合适稀疏粒子特征;(2)调整单元,对所述最合适稀疏粒子特征进行调整,得到经调整稀疏粒子特征集合;以及(3)特征增加步骤,将所述经调整稀疏粒子特征集合加到所述初始稀疏粒子特征集合中,并去除所述最合适稀疏粒子特征。所述最终特征生成单元将经所述循环处理单元处理过程中所得到的全部最合适稀疏粒子特征加到经所述循环处理单元处理之后的所述初始稀疏粒子特征集合中,生成最终的稀疏粒子特征集合。
优选地,所述调整单元对所述稀疏粒子特征进行以下操作中一种或更多种:添加、删除和扰动。
优选地,所述强分类单元为采用AdaBoost算法学习的分类器,所述最合适特征查找单元利用以下公式查找所述最合适稀疏粒子特征:
Fitness(θ)=-log(Z(θ))-β|θ|1
其中,|θ|1为该特征中包含的粒子个数,而β是特征复杂程度的惩罚因子,Z(θ)表示采用特征θ构造的最优弱分类器的归一化因子。
其中,所述特定被摄体可以是人脸或其他物体。
其中,所述特征提取单元可以随机地或依据特定函数提取所输入的图像的粒度空间内的预定量的稀疏粒子特征。
其中,所述特定被摄体检测装置可以包括用于存储所述稀疏粒子特征的存储单元。
附图说明
图1是现有技术的Viola和Jones的检测器体系架构;
图2是本发明的不同粒度的图像;
图3说明了粒子在原图像空间对应的正方形特征;
图4是图像的粒度空间与金字塔空间的比较;
图5是稀疏粒子特征示例;
图6是根据本发明的方法的一个实施例的特征提取的流程图;
图7是粒度空间内的Haar型特征;
图8是三种特征调整手段的图示;
图9是各个视角人脸检测器中的第一个稀疏粒子特征;
图10是Haar型特征与稀疏粒子特征的对比。
具体实施方式
以下,将参照附图,对本发明的实施例进行详细说明。
在人脸的检测领域,传统的特征提取方式是直接基于输入图像本身的,如Rowley的人工神经元网络[4],Schneiderman的小波方法[5]。Viola和Jones在[2]中所取得的成功,很大程度上要归功于他们所使用的Haar型特征。每个Haar型特征由少量矩形特征(通常是2到4个)相加或是相减得到,而每个矩形特征又对应于积分图像空间内的一个稀疏表达(在积分图像中,任意矩形可以通过四个顶点来描述并进行计算)。这使得Haar型特征的计算过程相当简便快捷。然而,即便是利用了积分图像,提取每个矩形特征也还是需要访问4次内存,计算3次加法。如果对Haar型特征的基本单元,即矩形特征进行进一步的约束,则可以得到计算效率更高的特征。为此,本发明引入了粒度空间的概念,如图2所示。
对输入的原图像,我们可以使用大小不同的模板进行平滑操作。具体来说,这些模板的尺度为2的整数幂(即1、2、4和8)。这样就可以得到如图2所示的四幅粒度不同的图像(s为粒度,对应平滑模板的尺度为2s×2s)。而这四幅图像就构成了原图像的粒度空间。实际上,粒度空间中的各个象素对应于与图像中位置或是大小不同的正方形特征,如图3。其中,每个粒子可以通过(x,y,s)三元组来表示:x为水平偏移量,y为垂直偏移量,s则为粒度。
以典型的大小为24×24的样本图像为例,在粒度空间内,共有576个大小为1×1的粒子,529个大小为2×2的粒子,441个大小为4×4的粒子,289个大小为8×8的粒子,一共1835个不同的粒子。与传统的下采样金字塔方法相比,粒度空间维数更高,对原图像的描述更为充分(图4)。
在图像的粒度空间内,稀疏粒子特征定义如下:
θ ( π ) = Σ i = 1 n α i g i ( π ; x , y , s ) , αi∈{-1,+1}    (1)
其中,π为图像的粒度空间,gi(π;x,y,s)为该粒度空间内的一个粒子特征,x,y分别是粒子在图像横坐标和纵坐标轴上的偏移量,s是粒子的尺度,而αi为粒子的组合系数。为了保证该组合特征的稀疏性,通常将粒子个数n限制为一个较小的数值(如n≤8)。基于这一定义,可以得到如图5所示的稀疏粒子特征。其中黑色的方块表示组合系数为-1的负粒子,而白色的方块表示组合系数为+1的正粒子。
与Haar型特征相比,由于这种稀疏粒子特征的定义方式没有限制粒子组合的位置关系,使得这种特征能够更为灵活地匹配复杂特征模式,如多视角人脸检测中的侧面人脸和倾斜人脸。另外,由于每个粒子的提取只需要访问一次图像的粒度空间,而组合的粒子个数又限定为一个较小的数值,如图6所示的稀疏粒子特征具有与Haar型特征相当的计算效率。具体来说,从计算量的角度分析,每4个粒子相当于Haar型特征中的一个矩形特征,这是因为在积分图像中每个矩形需要用4个顶点来表示,需要访问4次内存,计算3次加法。
本领域计数人员应该理解,虽然上面描述了稀疏粒子特征具有的如上所述的诸多优点,但在具体的实施方式中,其也可不具有上述任何的优点而具有本文未说明的其他优点。
Viola和Jones采用了穷尽法进行特征的选取,逐一尝试不同的Haar型特征并挑选出分类性能最好的一个作为特征学习的结果。在本发明中当然也可以采用穷尽法,并进而也可以限制组合的粒子个数。在其他的实施例中,也可以随机抽取或依据一定的函数来抽取一定数量的稀疏粒子特征。另一方面,由于稀疏粒子特征的组合方式十分灵活,为此,本申请又提出了一种基于启发式搜索的特征学习算法,如图6所示。
在这一启发式搜索算法中,首先利用一组特征初始化开列表(openlist),并将闭列表(closed list)置为空,然后在循环迭代过程(此过程可根据需要进行预定的次数)中不断将开列表中最合适的特征取出并放入闭列表,同时生成一个新的特征集合加入开列表。最后输出闭列表和开列表作为最终生成的特征集合。因此,这一算法实质上是根据一组特征的“种子”生成一个更大的特征集合。应该理解,图6中的argmax函数表示将具有最大合适度的特征本身作为其函数值的函数
也就是说,在图6中描述了一种特定被摄体检测方法(该方法具有图1所述的四个层次,也就是说,包括特征提取步骤、弱分类步骤、强分类步骤和检测步骤)中的所述特征提取的步骤。该步骤包括以下的步骤:初始化的步骤,取得所述粒度空间中一些特定稀疏粒子特征作为初始稀疏粒子特征集合;循环步骤和最终特征生成步骤。循环步骤将以下三个步骤重复预定次数:(1)最合适特征查找步骤,从所述初始稀疏粒子特征集合中找到最合适稀疏粒子特征;(2)调整步骤,对所述最合适稀疏粒子特征进行调整,得到经调整稀疏粒子特征集合;以及(3)特征增加步骤,将所述经调整稀疏粒子特征集合加到所述初始稀疏粒子特征集合中,并去除所述最合适稀疏粒子特征。最终特征生成步骤,将所述循环步骤中所得到的全部最合适稀疏粒子特征加到经过所述循环步骤之后的所述初始稀疏粒子特征集合中,生成最终的稀疏粒子特征集合。
下面具体说明根据本发明的具体实施例如何初始化开列表、如何评价特征的合适程度,以及如何根据选择出的特征θ*生成新的特征集合Θ*
初始化开列表
开列表的初始化决定了启发式搜索算法的起点,因此可以看成是这个学习算法的“种子”。对于人脸检测问题,Haar型特征[2]已经被证明十分有效,因而,在一个实施例中,本发明的方法在稀疏粒子特征的定义范围内(公式1),枚举出所有Haar型特征作为启发式搜索算法的“种子”(如图7)。由于粒度空间对粒子的尺度约束(其大小必须为2s×2s),所以粒度空间内不同粒子的个数少于积分图像空间内不同矩形的个数,这使得在稀疏粒子特征定义范围内的可枚举出的Haar型特征数目仅为20000个左右,少于[2]中基于积分图像的Haar型特征。
在其他的实施例中,也可以随机抽取或依据一定的函数来抽取一定数量的稀疏粒子特征。在另外的实施例中,也可以使用粒度空间中的Haar型特征的线性组合,或使用粒度空间中的所有线性鉴别特征、像素点特征等作为初始的种子。
特征的合适度函数
在人脸检测框架[2]中,需要选择合适的特征来构造弱分类器,进而为AdaBoost算法学习强分类器而服务。在AdaBoost算法中,由于采用了贪心策略,最优的弱分类器应当能够最小化当前的归一化因子(详见[17])。如果用Z(θ)表示采用特征θ构造的最优弱分类器的归一化因子,则Z(θ)越小,说明特征θ越适合于AdaBoost算法进行当前的强分类器学习。另一方面,出于降低结构风险和计算复杂度两方面的考虑,一个合适的特征不应当由过多的粒子所组成,因此我们采用了如下的合适度函数:
Fitness(θ)=-log(Z(θ))-β|θ|1    (2)
其中,|θ|1为该特征中包含的粒子个数,而β则是对该特征复杂程度的惩罚因子,该值越大则粒子个数对合适度的影响越大,即倾向于更少的粒子数。通过这样的合适度函数,可以比较全面的衡量一个特征对于AdaBoost算法中整个强分类器学习的贡献程度,从而挑选出最合适的特征用于进一步的新特征构造过程。类似地,本领域技术人员可以根据所采用的强分类器和弱分类器等确定其他的合适度函数。
特征生成方法
在本实施例中,由于选择出来的特征本身具有比较好的分类能力,只需要对它作比较小的调整,便有可能在它的“变种”中寻找得到更好的特征。具体来说,本实施例中引入了三种对稀疏粒子特征的调整操作:增添(add),删除(remove)和扰动(disturb)。其中,增添是在现有特征中加入一个新的粒子,删除是减去一个现有粒子,扰动则是将特征中的一个粒子替换为一个与它相邻的粒子。图8演示了这三种操作对一个Haar型特征的调整结果。
用P表示所有粒子的集合,θ*表示选择出来的特征,P*表示θ*所包含的粒子的集合,则这三种调整手段分别可以生成如下三个新的特征集合。
Θa={θaa=θ*+αp},p∈P,α={-1,+1}             (3)
Θr={θrr=θ*inpin},pin∈P*                    (4)
Θd={θdd=θ*in(pnb+pin)},pin∈P*,pnb∈Nb(pin)(5)
其中,pin为组成特征θ*的某个粒子,而αin为其对应的组合系数,Nb(pin)为与粒子pin相邻的粒子集合。这样,就可以利用公式(2)中的合适度函数,分别选择这三个集合中性能最好的稀疏粒子特征,构成新生成的特征集合。
Θ * = { θ i * | θ i * = arg max θ ∈ Θ i ( Fitness ( θ ) ) , i = a , d , r } - - - ( 6 )
因而,使用如图6所示的启发式搜索算法,可以生成一个数量有限,但分类性能优异的稀疏粒子特征集合。接下来就可以使用最简单的穷尽法选择一个区分性最强的特征来构成最优的弱分类器,为AdaBoost算法学习强分类器服务。需要注意的是,由于在AdaBoost算法迭代的过程中,样本的权重是不断更新变化的。即便是同样的特征θ,同样的样本集合,在AdaBoost算法不同的迭代轮次中,归一化因子Z(θ)的计算结果也是不一样的。由于启发式搜索算法中合适度函数的计算(公式2)主要依赖于这一归一化因子(特征复杂度的惩罚因子通常很小,如0.01),因此虽然在训练各个弱分类器时我们将开列表初始化为同样的Haar型特征集合,启发式搜索算法也会生成不同的更加适应当前样本权重的稀疏粒子特征集合。
因而本发明一方面引入粒度空间,并没有对粒子的组合方式进行很强的约束,同时保留了特征的均值方差归一化操作,另一方面使用启发式搜索算法大大降低了弱分类器训练的空间复杂程度,使得这一特征的组合爆炸问题得以较好的解决。最终所使用的稀疏粒子特征具有与Haar型特征相当的计算效率,更好的分类性能更强的适应能力。
图9给出了对应各个视角人脸的检测器中第一个稀疏粒子特征。可以看到,这些稀疏粒子特征在兼顾计算效率的前提下,都很好的刻画了各个视角的人脸模式类型,并能随着模式的规律变化(旋转)而有规律的变化。而图10进一步显示了稀疏粒子特征相对于Haar型特征在区分能力与适应能力方面的提高。其中列举了对应正面直立和正面倾斜视角人脸的前三个特征。
本发明提出了一种稀疏粒子特征(sparse granular feature)构成方式。在优选实施例中,这种特征是通过启发式搜索(heuristic search)在图像的粒度空间(granular space)内统计学习得到的。与Haar型特征相比,它的组成方式更为灵活,能够更加有效的描述人脸模式的特征,尤其是非直立的或是侧面的人脸模式。另外,由于对这种特征的稀疏性约束,使得它们的计算速度与Haar型特征相比毫不逊色。与传统的基于Haar型特征的系统相比,这种基于稀疏粒子特征的多视角人脸检测器具有相当的运行速度和更高的检测精度。在具体的实施例中,本发明的方法可以不具有上面所述的优点,但却具有其他的优点。
另外,虽然在上面的示例中,本发明提供的方法都是针对人脸进行的,但本发明不限于人脸,其也可应用于其他物体(如汽车、行人等)。
因而,如上所述,根据本发明的一个方面,提供了一种特定被摄体检测方法,包括特征提取步骤,弱分类步骤,强分类步骤以及特定被摄体检测步骤,其特征在于,所述特征提取步骤为提取所输入的图像的粒度空间内的稀疏粒子特征,所述稀疏粒子特征θ(π)为:
θ ( π ) = Σ i = 1 n α i g i ( π ; x , y , s ) , αi∈{-1,+1}
其中,π为图像的粒度空间,gi(π;x,y,s)为该粒度空间内的一个粒子特征,x,y分别是粒子在图像横坐标和纵坐标轴上的偏移量,s是粒子的尺度,而αi为粒子的组合系数。
优选地,所述特征提取的步骤包括以下的步骤:初始化的步骤,取得所述粒度空间中的符合Haar特征的所述稀疏粒子特征作为初始稀疏粒子特征集合;循环步骤以及最终特征生成步骤,所述循环步骤将以下三个步骤重复预定次数:(1)最合适特征查找步骤,从所述初始稀疏粒子特征集合中找到最合适稀疏粒子特征;(2)调整步骤,对所述最合适稀疏粒子特征进行调整,得到经调整稀疏粒子特征集合;以及(3)特征增加步骤,将所述经调整稀疏粒子特征集合加到所述初始稀疏粒子特征集合中,并去除所述最合适稀疏粒子特征;最终特征生成步骤将所述循环步骤中所得到的全部最合适稀疏粒子特征加到经过所述循环步骤之后的所述初始稀疏粒子特征集合中,生成最终的稀疏粒子特征集合。
优选地,所述调整步骤对所述稀疏粒子特征进行以下操作中一种或更多种:添加、删除和扰动。
优选地,所述强分类步骤采用AdaBoost学习算法,所述最合适特征查找步骤,利用以下公式查找所述最合适稀疏粒子特征:
Fitness(θ)=-log(Z(θ))-β|θ|1
其中,|θ|1为该特征中包含的粒子个数,而β是特征复杂程度的惩罚因子,Z(θ)表示采用特征θ构造的最优弱分类器的归一化因子。
其中,所述特征提取步骤可以随机地或依据特定函数提取所输入的图像的粒度空间内的预定量的稀疏粒子特征。
根据本发明的又一方面,提供了一种特定被摄体检测装置,包括特征提取单元,弱分类单元,强分类单元以及特定被摄体检测单元,其特征在于,所述特征提取单元提取所输入的图像的粒度空间内的稀疏粒子特征,所述稀疏粒子特征θ(π)为:
θ ( π ) = Σ i = 1 n α i g i ( π ; x , y , s ) , αi∈{-1,+1}
其中,π为图像的粒度空间,gi(π;x,y,s)为该粒度空间内的一个粒子特征,x,y分别是粒子在图像横坐标和纵坐标轴上的偏移量,s是粒子的尺度,而αi为粒子的组合系数。
优选地,所述特征提取单元包括以下单元:初始化单元,取得所述粒度空间中的符合Haar特征的所述稀疏粒子特征作为初始稀疏粒子特征集合;循环处理单元以及最终特征生成单元,循环处理单元包括三个单元:(1)最合适特征查找单元,从所述初始稀疏粒子特征集合中找到最合适稀疏粒子特征;(2)调整单元,对所述最合适稀疏粒子特征进行调整,得到经调整稀疏粒子特征集合;以及(3)特征增加步骤,将所述经调整稀疏粒子特征集合加到所述初始稀疏粒子特征集合中,并去除所述最合适稀疏粒子特征。所述最终特征生成单元将经所述循环处理单元处理过程中所得到的全部最合适稀疏粒子特征加到经所述循环处理单元处理之后的所述初始稀疏粒子特征集合中,生成最终的稀疏粒子特征集合。
优选地,所述调整单元对所述稀疏粒子特征进行以下操作中一种或更多种:添加、删除和扰动。
优选地,所述强分类单元为采用AdaBoost算法学习的分类器,所述最合适特征查找单元利用以下公式查找所述最合适稀疏粒子特征:
Fitness(θ)=-log(Z(θ))-β|θ|1
其中,|θ|1为该特征中包含的粒子个数,而β是特征复杂程度的惩罚因子,Z(θ)表示采用特征θ构造的最优弱分类器的归一化因子。
其中,所述特定被摄体可以是人脸或其他物体。
其中,所述特征提取单元可以随机地或依据特定函数提取所输入的图像的粒度空间内的预定量的稀疏粒子特征。
其中,所述特定被摄体检测装置可以包括用于存储所述稀疏粒子特征的存储单元。
进一步,根据本发明的实施例,本发明的目的还可以由可以使计算机或单片机等执行上述操作的计算机程序实现。
另外,可以认识到,在各个实施例中,可以通过专门的电路或线路(例如,互连以执行专门功能的离散逻辑门)、通过由一个或更多个处理器执行的程序指令,或者通过两者的组合来执行该各个动作。因此,可以通过多种不同的形式来实施该各个方面,并且所有这些形式都被认为处于所描述内容的范围内。对于该各个方面中的每一个,任何这种形式的实施例在此都可以指“被构造用来执行所述动作的逻辑”,或者另选地,是指“执行或者能够执行所述动作的逻辑”。
进一步,根据本发明的实施例,本发明的目的还可以由计算机可读介质实现,所述介质存储上述的程序。计算机可读介质可以是能够包含、存储、传达、传播、或传送程序,以由指令执行系统、设备或装置使用的或与指令执行系统、设备或装置相结合的任何装置。该计算机可读介质例如可以是但不限于电子、磁、光、电磁、红外或半导体系统、设备、装置或者传播介质。该计算机可读介质的更具体的示例(非穷尽列举)可以包括:具有一根或更多根导线的电连接、便携式计算机磁盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、光纤,以及便携式光盘只读存储器(CDROM)。
本发明实施例的以上说明只用于例示和说明的目的。前述说明并不旨在将本发明穷尽在或限制在所公开的精确形式。很明显,对于本领域的技术人员来说,许多修改和变型是显而易见的。所选择并描述的实施例是为了最好地解释本发明的原理及其实际应用,从而使本领域其他技术人员理解本发明的各种实施例及其各种变型例,以适合于特定的预期使用。应该理解,本发明的范围由权利要求和它们的等同物限定。
参考文献
[1]Ming-Hsuan Yang,David J.Kriegman,and Narendra Ahuja,“DetectingFaces in Images:A Survey”,IEEE Transactions on Pattern Analysis and MachineIntelligence,vol.24,No.1,Jan 2002
[2]P.Viola and M.Jones,“Rapid Object Detection Using a Boosted Cascade ofSimple Features,”Proc.IEEE Conference Computer Vision and Pattern Recognition,Dec.2001.
[3]E.Osuna,R.Freund,and F.Girosi,“Training Support Vector Machines:AnApplication to Face Detection,”Proc.IEEE Conference Computer Vision and PatternRecognition,pp.130-136,1997.
[4]H.Rowley,S.Baluja,and  T.Kanade,“Rotation Invariant NeuralNetwork-Based Face Detection,”Proc.IEEE Conference Computer Vision and PatternRecognition,pp.38-44,1998.
[5]H.Schneiderman and T.Kanade,“A Statistical Method for 3D Object DetectionApplied to Faces and Cars,”Proc.IEEE Conference Computer Vision and PatternRecognition,vol.1,pp.746-751,2000.
[6]S.Z.Li,L.Zhu,Z.Q.Zhang,et al.,“Statistical Learning of Multi-View FaceDetection”.Proc.7th European Conference on Computer Vision,pp.67-81,May 2002,.
[7]Jones and Viola,“Fast Multi-view Face Detection”.MERL-TR2003-96,July2003.
[8]C.Huang,H.Z.Ai,Y.Li and S.H.Lao,“Vector Boosting for Rotation InvariantMulti-View Face Detection”,Proc.10th IEEE Int’l Conf.Computer Vision,,Oct 2005
[9]Rong Xiao,Long Zhu,Hongjiang Zhang,“Boosting Chain Learning for ObjectDetection,”Proc.9th IEEE Int’l Conf.Computer Vision,2003
[10]B.Wu,H.Ai,C.Huang,and S.Lao,“Fast Rotation Invariant Multi-view FaceDetection Based On Real AdaBoost,”Proc.Sixth Int’l Conf.Automatic Face and GestureRecognition,pp.79-84,2004.
[11]Takeshi Mita,Toshimitsu Kaneko,Osamu Hori,“Joint Haar-like Features for FaceDetection”,Proc.10th IEEE Int’l Conf.Computer Vision,Oct 2005
[12]C.Liu and H.Y.Shum,“Kullback-Leibler Boosting”,Proc.IEEE ConferenceComputer Vision and Pattern Recognition,pages 587-594,2003.
[13]Rainer Lienhart and Jochen Maydt,“An Extended Set of Haar-like Features forRapid Object Detection”,Proc.IEEE Int’l Conf.Image Processing,,2002
[14]Shumeet Baluja,Mehran Sahami and Henry A.Rowley,“Efficient FaceOrientation Discrimination”,Proc.IEEE Int’l Conf.Image Processing,2004
[15]P.Wang and Qiang Ji,“Learning Discriminant Features for Multi-View Face andEye Detection”,Proc IEEE Conference Computer Vision and Pattern Recognition,2005.
[16]Yotam Abramson and Bruno Steux,“YEF*Real-Time Object Detection”,International Workshop on Automatic Learning and Real-Time 2005
[17]R.E.Schapire and Y.Singer,“Improved Boosting Algorithms UsingConfidence-rated Predictions”,Machine Learning,37,1999,297-336.

Claims (18)

1.一种特定被摄体检测方法,包括特征提取步骤,弱分类步骤,强分类步骤以及特定被摄体检测步骤,其特征在于,所述特征提取步骤为提取所输入的图像的粒度空间内的稀疏粒子特征,所述稀疏粒子特征θ(π)为:
θ ( π ) = Σ i = 1 n α i g i ( π ; x , y , s ) , αi∈{-1,+1}
其中,π为图像的粒度空间,gi(π;x,y,s)为该粒度空间内的一个粒子特征,x,y分别是粒子在图像横坐标和纵坐标轴上的偏移量,s是粒子的尺度,而αi为粒子的组合系数,n为粒子个数。
2、根据权利要求1所述的特定被摄体检测方法,其特征在于,所述特征提取的步骤包括以下的步骤:
初始化的步骤,取得所述粒度空间中一些特定稀疏粒子特征作为初始稀疏粒子特征集合;
循环步骤,将以下三个步骤重复预定次数:
(1)最合适特征查找步骤,从所述初始稀疏粒子特征集合中找到最合适稀疏粒子特征;
(2)调整步骤,对所述最合适稀疏粒子特征进行调整,得到经调整稀疏粒子特征集合;以及
(3)特征增加步骤,将所述经调整稀疏粒子特征集合加到所述初始稀疏粒子特征集合中,并去除所述最合适稀疏粒子特征;
以及
最终特征生成步骤,将所述循环步骤中所得到的全部最合适稀疏粒子特征加到经过所述循环步骤之后的所述初始稀疏粒子特征集合中,生成最终的稀疏粒子特征集合。
3、根据权利要求2所述的特定被摄体检测方法,其特征在于,所述调整步骤对所述稀疏粒子特征进行以下操作中一种或更多种:添加、删除和扰动。
4、根据权利要求2所述的特定被摄体检测方法,其特征在于,所述强分类步骤采用AdaBoost学习算法,所述最合适特征查找步骤,利用以下公式查找所述最合适稀疏粒子特征:
Fitness(θ)=-log(Z(θ))-β|θ|1
其中,|θ|1为该特征中包含的粒子个数,而β是特征复杂程度的惩罚因子,Z(θ)表示采用特征θ构造的最优弱分类器的归一化因子。
5、根据权利要求1所述的特定被摄体检测方法,其特征在于,所述特定稀疏粒子特征为符合Haar特征的稀疏粒子特征。
6、根据权利要求1所述的特定被摄体检测方法,其特征在于,所述特定稀疏粒子特征为符合Haar特征的稀疏粒子特征的线性组合。
7、根据权利要求1所述的特定被摄体检测方法,其特征在于,所述特征提取步骤为随机地或依据特定函数提取所输入的图像的粒度空间内的预定量的稀疏粒子特征。
8、根据权利要求1所述的特定被摄体检测方法,其特征在于,还包括存储步骤,用于存储所述稀疏粒子特征。
9、根据权利要求1-8任一项所述的特定被摄体检测方法,其特征在于,所述特定被摄体是人脸或其他物体。
10.一种特定被摄体检测装置,包括特征提取单元,弱分类单元,强分类单元以及特定被摄体检测单元,其特征在于,所述特征提取单元提取所输入的图像的粒度空间内的稀疏粒子特征,所述稀疏粒子特征θ(π)为:
θ ( π ) = Σ i = 1 n α i g i ( π ; x , y , s ) , αi∈{-1,+1}
其中,π为图像的粒度空间,gi(π;x,y,s)为该粒度空间内的一个粒子特征,x,y分别是粒子在图像横坐标和纵坐标轴上的偏移量,s是粒子的尺度,而αi为粒子的组合系数,n为粒子个数。
11、根据权利要求10所述的特定被摄体检测装置,其特征在于,所述特征提取单元包括以下单元:
初始化单元,从所述粒度空间取出一些特定稀疏粒子特征作为初始稀疏粒子特征集合;
循环处理单元,包括三个单元:
(1)最合适特征查找单元,从所述初始稀疏粒子特征集合中找到最合适稀疏粒子特征;
(2)调整单元,对所述最合适稀疏粒子特征进行调整,得到经调整稀疏粒子特征集合;以及
(3)特征增加单元,将所述经调整稀疏粒子特征集合加到所述初始稀疏粒子特征集合中,并去除所述最合适稀疏粒子特征;
以及
最终特征生成单元,将所述循环处理单元在处理过程中所得到的全部最合适稀疏粒子特征加到经所述循环处理单元处理之后的所述初始稀疏粒子特征集合中,生成最终的稀疏粒子特征集合。
12、根据权利要求11所述的特定被摄体检测装置,其特征在于,所述调整单元对所述稀疏粒子特征进行以下操作中一种或更多种:添加、删除和扰动。
13、根据权利要求11所述的特定被摄体检测装置,其特征在于,所述强分类单元为采用AdaBoost算法学习的分类器,所述最合适特征查找单元利用以下公式查找所述最合适稀疏粒子特征:
Fitness(θ)=-log(Z(θ))-β|θ|1
其中,|θ|1为该特征中包含的粒子个数,而β是特征复杂程度的惩罚因子,Z(θ)表示采用特征θ构造的最优弱分类器的归一化因子。
14、根据权利要求11所述的特定被摄体检测装置,其特征在于,所述特定稀疏粒子特征为符合Haar特征的稀疏粒子特征。
15、根据权利要求11所述的特定被摄体检测装置,其特征在于,所述特定稀疏粒子特征为符合Haar特征的稀疏粒子特征的线性组合。
16、根据权利要求10所述的特定被摄体检测装置,其特征在于,所述特定被摄体是人脸或其他物体。
17、根据权利要求10-16任一项所述的特定被摄体检测装置,其特征在,所述特征提取单元随机地或依据特定函数提取所输入的图像的粒度空间内的预定量的稀疏粒子特征。
18、根据权利要求10所述的特定被摄体检测装置,其特征在于,还包括存储单元,用于保存所述稀疏粒子特征。
CNB2006100725764A 2006-04-07 2006-04-07 特定被摄体检测方法和装置 Active CN100573549C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100725764A CN100573549C (zh) 2006-04-07 2006-04-07 特定被摄体检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100725764A CN100573549C (zh) 2006-04-07 2006-04-07 特定被摄体检测方法和装置

Publications (2)

Publication Number Publication Date
CN101051346A CN101051346A (zh) 2007-10-10
CN100573549C true CN100573549C (zh) 2009-12-23

Family

ID=38782755

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100725764A Active CN100573549C (zh) 2006-04-07 2006-04-07 特定被摄体检测方法和装置

Country Status (1)

Country Link
CN (1) CN100573549C (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101470802B (zh) * 2007-12-28 2012-05-09 清华大学 物体检测装置和方法
JP2010266983A (ja) * 2009-05-13 2010-11-25 Sony Corp 情報処理装置及び方法、学習装置および方法、プログラム、並びに情報処理システム
CN101833672B (zh) * 2010-04-02 2012-02-29 清华大学 基于约束采样与形状特征的稀疏表示人脸识别方法
CN105930808A (zh) * 2016-04-26 2016-09-07 南京信息工程大学 一种基于vector boosting模板更新的运动目标跟踪方法
CN107368790B (zh) * 2017-06-27 2020-07-28 汇纳科技股份有限公司 行人检测方法、系统、计算机可读存储介质及电子设备
CN110766733B (zh) * 2019-10-28 2022-08-12 广东三维家信息科技有限公司 单空间点云配准方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
图像分割的商空间粒度原理. 刘仁金,黄贤武.计算机学报,第28卷第10期. 2005
图像分割的商空间粒度原理. 刘仁金,黄贤武.计算机学报,第28卷第10期. 2005 *
基于连续Adaboost算法的多视角人脸检测. 武勃,黄畅,艾海舟,劳世竑.计算机研究与发展,第42卷第9期. 2005
基于连续Adaboost算法的多视角人脸检测. 武勃,黄畅,艾海舟,劳世竑.计算机研究与发展,第42卷第9期. 2005 *

Also Published As

Publication number Publication date
CN101051346A (zh) 2007-10-10

Similar Documents

Publication Publication Date Title
Oneata et al. Efficient action localization with approximately normalized fisher vectors
Liao et al. A fast and accurate unconstrained face detector
US7324671B2 (en) System and method for multi-view face detection
Chen et al. Adversarial occlusion-aware face detection
US6671391B1 (en) Pose-adaptive face detection system and process
US7702596B2 (en) Probabilistic boosting tree framework for learning discriminative models
Sahbi et al. A Hierarchy of Support Vector Machines for Pattern Detection.
CN107463920A (zh) 一种消除局部遮挡物影响的人脸识别方法
CN101751551B (zh) 一种基于图像的人脸识别方法、装置、系统及设备
CN100573549C (zh) 特定被摄体检测方法和装置
Kaushal et al. Face detection using neural network & Gabor wavelet transform
CN104268539A (zh) 一种高性能的人脸识别方法及系统
CN106599870A (zh) 一种基于自适应加权局部特征融合的人脸识别方法
CN112784763A (zh) 基于局部与整体特征自适应融合的表情识别方法及系统
Anila et al. Simple and fast face detection system based on edges
CN111368660A (zh) 一种单阶段半监督图像人体目标检测方法
Symeonidis et al. Neural attention-driven non-maximum suppression for person detection
Yang et al. Retrieval based interactive cartoon synthesis via unsupervised bi-distance metric learning
Gupta et al. Analysis of training parameters for classifiers based on Haar-like features to detect human faces
Duffner et al. A neural scheme for robust detection of transparent logos in TV programs
Vural et al. Multi-view fast object detection by using extended haar filters in uncontrolled environments
Chen et al. Expand training set for face detection by GA re-sampling
CN111898473B (zh) 一种基于深度学习的司机状态实时监测方法
Shen et al. A novel distribution-based feature for rapid object detection
Tu et al. Improved pedestrian detection algorithm based on HOG and SVM

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant