CN102216958A - 物体检测装置以及物体检测方法 - Google Patents

物体检测装置以及物体检测方法 Download PDF

Info

Publication number
CN102216958A
CN102216958A CN2010800008446A CN201080000844A CN102216958A CN 102216958 A CN102216958 A CN 102216958A CN 2010800008446 A CN2010800008446 A CN 2010800008446A CN 201080000844 A CN201080000844 A CN 201080000844A CN 102216958 A CN102216958 A CN 102216958A
Authority
CN
China
Prior art keywords
arbiter
strong
target object
chart picture
process decision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010800008446A
Other languages
English (en)
Inventor
泽井省吾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Morpho Inc
Original Assignee
Morpho Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Morpho Inc filed Critical Morpho Inc
Publication of CN102216958A publication Critical patent/CN102216958A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06V10/7747Organisation of the process, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Abstract

一种物体检测装置,基于使用学习图像预先学习的对象物体的特征量,检测出在判定图像中描写的对象物体。其具有检测器(2),以判别精度由低到高的顺序依次使强判别器(21m)执行,在强判别器(21m)判别为在判定图像中描写有对象物体的情况下继续进行处理,在强判别器(21m)判别为在判定图像中未描写有对象物体的情况下,不进行判别精度比该强判别器(21m)高的强判别器(21m)的执行并视为未检测出对象物体,强判别器(21m)输入判别精度比该强判别器(21m)低的前述强判别器(21m)的判别结果,并基于多个推测值以及输入的判别结果来判别判定图像中是否描写有对象物体。

Description

物体检测装置以及物体检测方法
技术领域
本发明涉及物体检测装置以及物体检测方法。
背景技术
一直以来,作为检测物体的装置以及方法,已知有根据图像信息来检测物体的装置以及方法(例如,参照专利文献1)。专利文献1中记载的检测装置,构成学习与包含在图像信息中的检测对象物体(例如,脸)有关的信息(例如特征量)并基于学习结果的多个同次判别器(homogeneous classifier)。多个同次判别器被构成为,例如通过变更特征量的个数从而使检测对象物体的检测精度不同。专利文献1所记载的装置,以各个同次判别器的检测精度随着处理的结束逐渐地变得正确的方式,将多个同次判别器串联结合(cascade)而构成一个检测器。专利文献1所记载的装置,将判定图像的图像信息输入至检测器,使构成检测器的同次判别器以串联顺序执行,仅在全部的同次判别器检测出检测对象物体的情况下,判定为从判定图像信息检测出检测对象物体。这里,专利文献1所记载的装置,在构成检测器的多个同次判别器中的一个同次判别器判定为在判定图像信息中未包含检测对象物体的特征量的情况下,不执行该同次判别器之后进行的处理,并判定为从判定图像信息未检测出检测对象物体。
专利文献1:美国专利第7099510号公报
发明内容
发明所要解决的问题
然而,专利文献1所记载的装置中,因为以构成检测器的同次判别器的检测精度随着串联结合的结束而逐渐地变得正确的方式构成,因此存在随着检测处理的结束同次判别器所判别的特征量增加的趋势。即越到串联结合的后段,各个同次判别器的处理速度越低。因此,专利文献1所记载的装置中,存在物体检测处理的速度降低的情况。
因此,本发明为了解决如上所述的技术问题,以提供能够谋求物体检测处理的高速化的物体检测装置以及物体检测方法为目的。
解决问题的方法
即本发明的一个方式的物体检测装置的特征在于,是基于使用学习图像预先学习的对象物体的特征量,检测出在判定图像中描写的所述对象物体的物体检测装置;其具有:多个弱判别器,其基于所述对象物体的所述特征量,分别算出表示所述判定图像中描写有所述对象物体的可能性的推测值;多个强判别器,其基于多个所述推测值,分别以不同的判别精度判别所述判定图像中是否描写有所述对象物体;以及检测器,以判别精度由低到高的顺序依次使所述强判别器执行,在所述强判别器判别为在所述判定图像中描写有所述对象物体的情况下,继续进行处理,在所述强判别器判别为在所述判定图像中未描写有所述对象物体的情况下,不进行判别精度比该强判别器高的所述强判别器的动作并作为未检测出所述对象物体;所述强判别器输入判别精度比该强判别器低的所述强判别器的判别结果,并基于多个所述推测值以及所输入的判别结果,判别所述判定图像中是否描写有所述对象物体。
根据本发明的一个方式的物体检测装置,构成检测器的强判别器输入判别精度比该强判别器低的强判别器的判别结果,使用所输入的判别结果来判别判定图像中是否描写有对象物体。即该物体检测装置中,强判别器不是分别独立地判别对象物体,强判别器分别利用其他的强判别器的判别结果来判别对象物体。这样,通过强判别器利用其他的强判别器的判别结果,与强判别器分别独立地判别对象物体的情况相比,能够减少各强判别器运算时使用的弱判别器的推测值的个数。因此,即使构成检测器的强判别器的检测精度随着串联结合的结束逐渐地变得正确,也可以提高各个强判别器的处理速度。因此,作为结果,能够使判定图像中是否描写有对象物体的判定高速化。
这里,所述强判别器也可以输入多个所述强判别器中判别精度仅次于该强判别器的所述强判别器的判别结果。
此外,所述强判别器也可以基于使用表示所述弱判别器的识别容易性的程度的权重与该弱判别器的推测值的加权投票的结果以及所输入的判别结果,判别所述判定图像中是否描写有所述对象物体。
此外,所述强判别器也可以输入使用表示所述弱判别器的识别容易性的程度的权重与该弱判别器的推测值的加权投票的结果,以作为判别精度比该强判别器低的所述强判别器的判别结果。
再者,多个所述强判别器分别被赋予对应于判别精度的权重,所述强判别器可以在所输入的加权投票的结果中累积输入源的所述强判别器的权重,并使用累积的值判别所述判定图像中是否描写有所述对象物体。在这样构成的情况下,反映其他的强判别器的判别结果的程度对应于输入源的强判别器的权重而变更。因此,由于能够将其他的强判别器的判别结果适当地反映在自己的判别中,因而可以提高各个强判别器的判别精度。
此外,本发明的一个方式的物体检测方法的特征在于,为物体检测装置的物体检测方法,所述物体检测装置具备:多个弱判别器,基于对象物体的特征量分别算出表示判定图像中描写有对象物体的可能性的推测值;以及多个强判别器,基于多个所述推测值,分别以不同的判别精度判别所述判定图像中是否描写有所述对象物体;所述物体检测方法包含:执行步骤,多个所述强判别器以判别精度由低到高的顺序依次被串联结合,所述强判别器以判别精度由低到高的顺序依次执行判别;以及判别步骤,所述强判别器输入判别精度比该强判别器低的所述强判别器的判别结果,并基于多个所述推测值以及输入的判别结果,判别所述判定图像中是否描写有所述对象物体;所述判别步骤中,在所述强判别器判别为所述判定图像中描写有所述对象物体的情况下,继续所述执行步骤,在所述强判别器判别为所述判定图像中未描写有所述对象物体的情况下,中断所述执行步骤。
此外,所述判别步骤中,所述强判别器也可以输入多个所述强判别器中判别精度仅次于该强判别器的所述强判别器的判别结果。
此外,所述判别步骤中,所述强判别器也可以基于使用表示所述弱判别器的识别容易性的程度的权重与该弱判别器的推测值的加权投票的结果以及输入的判别结果,判别所述判定图像中是否描写有所述对象物体。
此外,所述判别步骤中,所述强判别器也可以输入使用表示所述弱判别器的识别容易性的程度的权重与该弱判别器的推测值的加权投票的结果,以作为判别精度比该强判别器低的所述强判别器的判别结果。
再者,多个所述强判别器分别被赋予与判别精度相对应的权重,所述判别步骤中,所述强判别器也可以在输入的加权投票的结果中累积输入源的所述强判别器的权重,并使用累积的值来判别所述判定图像中是否描写有所述对象物体。
根据本发明的一个方式的物体检测方法,可以实现与上述的本发明的一个方式的物体检测装置同样的效果。
发明的效果
根据本发明的一个方式的物体检测装置以及物体检测方法,能够谋求物体检测处理的高速化。
附图说明
图1为搭载有本发明的一个方式的物体检测装置的手持终端的功能模块图。
图2为搭载有本发明的一个方式的物体检测装置的手持终端的硬件结构图。
图3为本发明的一个方式的物体检测装置使用的特征量的一个例子。
图4为将图3所示的一个特征量应用于图像的一个例子。
图5为说明本发明的一个方式的物体检测装置的动作的流程图。
图6为说明识别对象图像的分割的概要图。
图7为说明本发明的一个方式的物体检测装置的检测动作的概要图。
图8为说明现有的物体检测装置的检测动作的概要图。
符号的说明
1…物体检测装置
2…检测器
20n…弱判别器
21m…强判别器
具体实施方式
以下,参照附图说明本发明的实施方式。此外,在各图中,对相同或者相当的部分标记相同的符号,省略重复的说明。
本实施方式所涉及的物体检测装置为根据图像信息来检测(判别、识别)在图像中描写的物体的装置,例如,在个人电脑、数码相机、移动电话、PDA(Personal Digital Assistant)等中被适当地采用。本实施方式所涉及的物体检测装置在检测处理前学习检测对象物体的特征,并基于已学习的特征进行检测处理。作为进行检测的对象物体,没有特别的限定,例如采用人的脸等。此外,考虑到说明理解的容易性,作为本发明所涉及的物体检测装置的一个例子,以下说明搭载在具备照相功能的手持终端上的脸检测装置。
图1为具备本实施方式所涉及的脸检测装置1的手持终端3的功能模块图。图1所示的手持终端3,例如为用户可携带的移动终端。首先,对手持终端3的硬件结构进行说明。图2为手持终端3的硬件结构图。如图2所示,手持终端3在物理上由包含CPU(Central ProcessingUnit)100、ROM(Read Only Memory)101以及RAM(Random AccessMemory)102等的主存储装置、照相机或者键盘等的输入设备103、显示屏等的输出设备104、硬盘等的辅助存储装置105等的通常的计算机系统而构成。下述的手持终端3以及脸检测装置1的各功能通过如下实现:通过在CPU100、ROM101、RAM102等的硬件上读入规定的计算机软件,从而CPU100作为控制源,使输入设备103以及输出设备104动作,并且进行主存储装置和辅助存储装置105中的数据的读出和写入。此外,以上说明了手持终端3的硬件结构,但脸检测装置1也可以由包含CPU100、ROM101以及RAM102等的主存储装置、输入设备103、输出装置104、辅助存储装置105等的通常的计算机系统而构成。此外,手持终端3也可以具备通信模块。
如图1所示,手持终端3具有照相机30、脸检测装置1、图像合成部31以及显示部32。照相机30具有对图像进行摄像的功能。作为照相机30,例如可采用摄像元件等。照相机30具有将摄像的图像作为判定图像向脸检测装置1输出的功能。图像合成部31具有如下功能:根据脸检测装置1的检测结果,生成使强调判定图像的脸部分的记号或者圈与判定图像重叠的合成图像。显示部32具有显示图像合成部31生成的合成画像的功能。
脸检测装置1具备判定图像输入部10、图像区域分割部11以及检测器2。判定图像输入部10具有将由照相机30所摄像的图像作为判定图像输入的功能。
图像区域分割部11具有将判定图像输入部10所输入的判定画像分割成规定的区域的功能。图像区域分割部11具有将判定图像的图像区域分割成规定大小的多个小区域(即子窗口)的功能。该子窗口的形状可以是矩形,也可以是其他形状。子窗口的位置可以设置为互相重复,也可以设置为互不重复。此外,图像区域分割部11将该子窗口倍率变更为各种尺寸。由此,能够变更对象图像中作为处理对象的范围。倍率变更的方法能够采用现有的方法。
检测器2具有如下功能:输入图像区域分割部11所分割的子窗口,判定子窗口中是否描写有作为检测对象物体的脸。即检测器2具有检测输入的子窗口内所显示的脸的功能。检测器2基于子窗口的图像信息(亮度值等)以及矩形特征(Rectangle features),判定是否描写有脸。矩形特征为局部特征的一种,例如使用Haar-like特征。图3表示矩形特征的一个例子。图3(a)~(d)中,表示了4种矩形特征20a~20d。图3(a)、(b)所示的矩形特征20a、20b为抽出在脸的边缘部出现的特征的特征,图3(c)、(d)所示的矩形特征20c、20d为抽出在脸的线条部出现的特征的特征。各矩形特征20a~20d采用白区域内的像素值(亮度值)的总和(或者平均亮度值)与黑区域内的像素值的总和(或者平均亮度值)的差分来进行评价。例如,在矩形特征20a的情况下,采用白区域20a_B内的亮度值的总和与黑区域20a_A内的亮度值的总和的差分来进行评价。各矩形特征20a~20d可以适用于子窗口内的任意位置。图4为将矩形特征20b适用于子窗口Gn的例子。如图4所示,如果子窗口Gn被赋予检测器2,则检测器2算出矩形特征20b的白区域20b_B内的亮度值的总和与黑区域20b_A内的亮度值的总和的差分。人的脸40,通常包围眼线的黑区域20b_A比其下包围脸颊、鼻、脸颊的白区域20b_B暗。检测器2预先学习这样的人的脸的特征,根据算出的差分是否大于预先学习的阈值来决定判别结果。
为了高效地进行这样的处理,检测器2具备多个弱判别器20n(n:整数)。弱判别器20n为判别能力相对较低的判别器,具有算出推测值的功能,该推测值表示预先学习的脸的特征在子窗口内被显示的可能性。弱判别器20n对应于上述的矩形特征而被准备有多个,且为算出与对应的矩形特征相关的白区域的亮度值的总和与黑区域的亮度值的总和的差分,并根据差分和阈值的大小关系而输出作为推测值的1或者0的阈值函数。例如,弱判别器20n能够以如下的式1来表示。
h j = 1 , if p j f j ( x ) > p j T j 0 , otherwise · · · ( 1 )
这里,x为特征量,fj(x)为弱判别器20n的函数。即f(x)为使用与特征量x对应的矩形特征而算出白区域的亮度值的总和与黑区域的亮度值的总和的差分的函数。pj∈{-1,1}以及阈值Tj为通过机械学习而在弱判别器20n中分别预先设定的常数。在差分f(x)比阈值Tj大时(即在p=1时)、或者在差分f(x)比阈值Tj小时(即在p=-1时),判定子窗口中显示有脸。
检测器2通过组合上述的弱判别器20n而构成判别精度较高的强判别器21m(m:整数)。强判别器21m具有如下功能:基于由多个弱判别器20n算出的多个推测值、以及弱判别器20n分别被赋予的权重,进行加权投票,并利用该结果判定子窗口内是否显示有脸。用于加权投票的弱判别器20n的组合以及个数,根据各个强判别器21m而不同。因此,各个强判别器21m的判别精度分别不同。检测器2利用多个强判别器21m判别一个子窗口,并基于多个强判别器21m的判别结果,最终判别子窗口内是否存在脸。
弱判别器20n的pj∈{-1,1}以及阈值Tj、弱判别器20n的权重、以及强判别器21m所使用的弱判别器20n的组合,可以使用例如AdaBoost算法来事前学习。AdaBoost算法为机械学习方法的一种,且为以利用多个单纯的判别器的组合而能够识别单纯的识别方法中难以识别的图像信息的方式进行学习的算法。作为基础的单纯的判别器对应于弱判别器20n。此外,AdaBoost算法中的最终的判别器为强判别器21m。
对AdaBoost算法中的学习方法的概要进行说明。首先,准备作为检测对象物体的脸被描写的脸图像的集合、作为检测对象物体的脸没有被描写的非脸图像的集合、以及弱判别器20n的集合。然后,使用脸图像的集合以及非脸图像的集合而预决定全部的弱判别器20n的pj、Tj。对脸图像以及非脸图像分别准备权重kj而进行初始化。该权重kj为表示判别中的重要度的权重,且该权重kj越大的图像成为越不能被误识别的重要的图像。之后,对弱判别器20n的pj、Tj进行最优化而使加权误差为最小,从弱判别器20n的集合中采用加权误差最小的弱判别器作为强判别器21m中使用的弱判别器20n。之后,更新脸图像以及非脸图像的权重kj。这样的权重kj在每选择一个弱判别器20n的时候被更新。例如,以增大被选择的弱判别器20n所无法很好识别的学习图像的权重kj的方式进行更新。因此,通过反复进行上述处理,从而易于选择能够更加好地识别仍然难以识别的图像的弱判别器20n。然后,最终决定能够正确地识别全部的学习图像的弱判别器20n的组合。然后,构成了使用每个弱判别器20n被分配的权重与弱判别器20n的函数hj进行加权投票的强判别器21m。例如,以下的式2所表示的强判别器21m根据AdaBoost学习而被构建。
Figure GPA00001143123600081
式2中,弱判别器20n相当于hj(x),强判别器21m相当于S0。弱判别器20n的权重wj是指投票力,表示弱判别器20n的识别容易性的程度(即信赖度)。该权重wj使用基于学习时的加权误差的错误率而被算出。例如,将正确的脸图像大致判定为脸的弱判别器20n的权重wj被设定为较大。此外,将正确的脸图像不大致判定为脸的弱判别器20n,仅仅由于可以将该判断反过来,因而其权重wj也被设定为较大。此外,θ0例如为根据权重wj在学习时算出的值,在S0比θ0大的情况下,判定为脸。这里,进行弱判别器20n的选择·追加,直至S0成为使学习用的脸图像的A%以上通过并且使学习用的非脸图像的不到B%通过。A、B可以任意设定。通过该A、B的变更,能够构建判别精度不同的强判别器21m。
在S0作成之后,接着学习生成作为判别精度良好的强判别器21m的S1。在S1的学习中,为了使S1的判别精度比S0高,A、B被设定得比在S0的学习时更加严格。此外,在S1的学习中,在输入S0的判别结果的状态下,进行弱判别器20n的选择·追加。通过反复该学习,生成以下的式3所示的强判别器Si(i:自然数)。
Figure GPA00001143123600091
这样,强判别器21m成为输入判别精度仅次于该强判别器21m的强判别器21m的判别结果的形式。这里,Wi为每个强判别器21m的Si被设定的权重。例如,在每个强判别器21m的判别精度上被设定。此外,在学习时,在输入判别精度低的强判别器21m的判别结果的状态下,进行弱判别器20n的选择·追加,从而与从头开始选择弱判别器20n而构建判别精度更高的强判别器21m的情况相比,能够抑制进行选择·追加的弱判别器20n的个数。
为了使作为生成的强判别器21m的S0以及Si被串联地执行,检测器2被线形结合。线形结合的各个强判别器21m也被称作级。此时,各强判别器21m以越到线形结合的最后判别精度越高的方式被并列结合。检测器2,如果输入子窗口,则使线形结合的强判别器21m依次执行。检测器2在强判别器21m检测出脸的情况下,接着在判别精度高的强判别器21m中执行检测处理,在强判别器21m未检测出脸的情况下,不进行判别精度比该强判别器21m高的强判别器21m登场以后的处理。此外,除去最初的级,强判别器21m分别输入判别精度仅次于该强判别器21m的强判别器21m的判别结果,并进行自己的检测处理。
其次,说明脸检测装置1的动作。图5为表示脸检测装置1的动作的流程图。图5所示的处理,例如在手持终端3的照相功能打开的时候被执行,并在规定的周期内反复执行。此外,图5所示的S10~S16的处理由脸检测装置1来执行,S18~S22的处理由手持终端3来执行。
如图5所示,最初判定图像输入部10输入判定图像(S10)。图6表示判定图像F的一个例子。接着,图像区域分割部11生成S10的处理中输入的判定图像的积分图像(integral image)(S12)。然后,如图6所示,图像区域分割部11对判定图像F进行扫描而生成多个子窗口Gn(S14)。接着,检测器2选择所生成的子窗口Gn中的一个,进行脸检测处理(S16)。在图7中表示S16的处理的概要。如图7所示,检测器2以判别精度由低到高的顺序使作为强判别器21m的S1~Sn依次串联地执行。S1~Sn对同一子窗口Gn进行处理。检测器2在各级中,在判别为不是脸的情况下,在该时间点结束处理,在判定为脸的情况下,继续处理。如图中箭头所示的那样,S2~Sn输入前级的结果并判别是否为脸。然后,检测器2判别通过全部的级后的子窗口Gn中描写有脸。检测器2对全部的子窗口Gn执行上述处理。如果S16的处理结束,则转移至判定处理(S18)。
S18的处理为图像合成部31判定S16的处理中是否检测出脸的处理。在图像合成部31判定S16的处理中检测出脸的情况下,生成强调子窗口Gn的位置的合成图像(S20)。然后,显示部32显示合成图像(S22)。另一方面,在S18的处理中,在图像合成部31判定S16的处理中未检测出脸的情况下,判定图像按原样显示(S22)。如果S22的处理结束,则结束图5所示的控制处理。
通过执行图5所示的控制处理,从而判定图像F被输入·分割而生成子窗口Gn,并在前级的结果的基础上判断子窗口Gn在各级中是否显示脸。这样,由于前级的判别结果由后级继承,因而在后级中不需要从头开始对子窗口Gn进行评价。此外,有必要使检测精度越到后级越高,但由于输入前级的判别结果,因而能够追加较少的矩形特征而使检测精度提高。因此,能够抑制后级中所产生的处理时间的增加。
这里,为了说明本实施方式所涉及的脸检测装置1的作用效果,使用图8来说明现有技术。如图8所示,现有的脸检测装置中,判别子窗口Gn的检测器以判别精度由低到高的顺序使作为强判别器的S1~Sn依次串联地执行。在该现有的脸检测装置中,S1~Sn全部独立地发挥功能,各级中使用的矩形特征越到后级越复杂化,其结果,各级中的运算处理量也是越到后级越增加。再者,即使直到某一级的强判别器中得出充分的结果,由于根据随后的级中的一个结果而被拒绝,因而也存在检测精度降低的可能性。
与此相对,根据实施方式所涉及的脸检测装置1,构成检测器2的强判别器21m,输入判别精度比该强判别器21m低的强判别器21m的判别结果,并使用所输入的判别结果来判别判定图像中是否描写有脸40。即在该脸检测装置1中,各个强判别器21m并不是分别独立地判别脸40,各个强判别器21m利用其他的强判别器21m的判别结果来判别脸40。这样,由于强判别器21m能够利用其他的强判别器21m的判别结果,与强判别器21m分别独立地判别脸40的情况相比,能够减少该强判别器21m使用的弱判别器20n的推测值的个数。因此,即使在以构成检测器2的强判别器21m的检测精度随着串联结合的结束逐渐地变得正确的方式构成的情况下,也可以加快各个强判别器21m的处理速度。因此,作为结果,能够使判定图像中是否描写有脸40的判定高速化。再者,由于各强判别器反映直到前一级为止的级的结果,因而能够通过累积的信息进行判别。因此,作为结果,能够提高检测精度。
此外,根据实施方式所涉及的脸检测装置1,检测器2能够在输入的加权投票的结果Si-1中累积输入源的强判别器21m的权重Wi-1,并使用所累积的值判别判定图像中是否描写有脸40。因此,由于能够将其他的强判别器21m的判别结果适当地反映到自己的判别中,因而可以提高各个强判别器21m的判别精度。
此外,上述的实施方式表示本发明所涉及的物体检测装置的一个例子。本发明所涉及的物体检测装置并不限于实施方式所涉及的物体检测装置,在不变更各权利要求所记载的要旨的范围内,可以对各实施方式所涉及的物体检测装置进行变形,或者适用其他装置。
例如,在上述的实施方式中,对采用AdaBoost算法进行学习的例子进行了说明,但不限于此。此外,在上述的实施方式中,对将脸检测装置1适用于手持终端3上的例子进行了说明,但不限于此。再者,在上述的实施方式中,对物体检测装置从照相机30输入图像并进行检测处理的例子进行了说明,但物体检测装置的输入图像不限于此。例如,可以为通过通信而获取的图像,也可以为存储介质中存储的图像。

Claims (10)

1.一种物体检测装置,其特征在于,
是基于使用学习图像而预先学习的对象物体的特征量,检测在判定图像中描写的所述对象物体的物体检测装置,
所述物体检测装置具备,
多个弱判别器,其基于所述对象物体的所述特征量,分别算出表示所述判定图像中描写有所述对象物体的可能性的推测值;
多个强判别器,其基于多个所述推测值,分别以不同的判别精度判别所述判定图像中是否描写有所述对象物体;以及
检测器,以判别精度由低到高的顺序依次使所述强判别器执行,在所述强判别器判别为在所述判定图像中描写有所述对象物体的情况下,继续进行处理,在所述强判别器判别为在所述判定图像中未描写有所述对象物体的情况下,不进行判别精度比该强判别器高的所述强判别器的执行并判别为未检测出所述对象物体,
所述强判别器输入判别精度比该强判别器低的所述强判别器的判别结果,并基于多个所述推测值以及输入的判别结果,判别所述判定图像中是否描写有所述对象物体。
2.如权利要求1所述的物体检测装置,其特征在于,
所述强判别器输入多个所述强判别器中判别精度仅次于该强判别器的所述强判别器的判别结果。
3.如权利要求1或者2所述的物体检测装置,其特征在于,
所述强判别器基于加权投票的结果以及所输入的判别结果,判别所述判定图像中是否描写有所述对象物体,该加权投票使用表示所述弱判别器的识别容易性的程度的权重与该弱判别器的推测值。
4.如权利要求1~3中任意一项所述的物体检测装置,其特征在于,
所述强判别器输入加权投票的结果,以作为判别精度比该强判别器低的所述强判别器的判别结果,该加权投票使用表示所述弱判别器的识别容易性的程度的权重与该弱判别器的推测值。
5.如权利要求4所述的物体检测装置,其特征在于,
多个所述强判别器分别被赋予对应于判别精度的权重,
所述强判别器在所输入的加权投票的结果中累积输入源的所述强判别器的权重,并使用累积的值判别所述判定图像中是否描写有所述对象物体。
6.一种物体检测方法,其特征在于。
所述物体检测方法是物体检测装置的物体检测方法,
所述物体检测装置具备,
多个弱判别器,其基于对象物体的特征量,分别算出表示判定图像中描写有对象物体的可能性的推测值;以及
多个强判别器,其基于多个所述推测值,分别以不同的判别精度判别所述判定图像中是否描写有所述对象物体,
所述物体检测方法包括,
执行步骤,多个所述强判别器以判别精度由低到高的顺序依次被串联结合,所述强判别器以判别精度由低到高的顺序依次执行判别;以及
判别步骤,所述强判别器输入判别精度比该强判别器低的所述强判别器的判别结果,并基于多个所述推测值以及输入的判别结果,判别所述判定图像中是否描写有所述对象物体,
所述判别步骤中,在所述强判别器判别为所述判定图像中描写有所述对象物体的情况下,继续所述执行步骤,在所述强判别器判别为所述判定图像中未描写有所述对象物体的情况下,中断所述执行步骤。
7.如权利要求6所述的物体检测方法,其特征在于,
所述判别步骤中,所述强判别器输入多个所述强判别器中判别精度仅次于该强判别器的所述强判别器的判别结果。
8.如权利要求6或者7所述的物体检测方法,其特征在于,
所述判别步骤中,所述强判别器基于加权投票的结果以及输入的判别结果,判别所述判定图像中是否描写有所述对象物体,该加权投票使用表示所述弱判别器的识别容易性的程度的权重与该弱判别器的推测值。
9.如权利要求6~8中任意一项所述的物体检测方法,其特征在于,
所述判别步骤中,所述强判别器输入加权投票的结果,以作为判别精度比该强判别器低的所述强判别器的判别结果,该加权投票使用表示所述弱判别器的识别容易性的程度的权重与该弱判别器的推测值。
10.如权利要求9所述的物体检测方法,其特征在于,
多个所述强判别器分别被赋予与判别精度相对应的权重,
所述判别步骤中,所述强判别器在输入的加权投票的结果中累积输入源的所述强判别器的权重,并使用累积的值来判别所述判定图像中是否描写有所述对象物体。
CN2010800008446A 2010-02-01 2010-02-01 物体检测装置以及物体检测方法 Pending CN102216958A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2010/051355 WO2011092865A1 (ja) 2010-02-01 2010-02-01 物体検出装置及び物体検出方法

Publications (1)

Publication Number Publication Date
CN102216958A true CN102216958A (zh) 2011-10-12

Family

ID=44318872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010800008446A Pending CN102216958A (zh) 2010-02-01 2010-02-01 物体检测装置以及物体检测方法

Country Status (5)

Country Link
US (2) US8693791B2 (zh)
EP (1) EP2397989A1 (zh)
JP (1) JP4806101B2 (zh)
CN (1) CN102216958A (zh)
WO (1) WO2011092865A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577789A (zh) * 2012-07-26 2014-02-12 中兴通讯股份有限公司 检测方法和装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012068948A (ja) * 2010-09-24 2012-04-05 Renesas Electronics Corp 顔属性推定装置およびその方法
KR101175597B1 (ko) * 2011-09-27 2012-08-21 (주)올라웍스 아다부스트 학습 알고리즘을 이용하여 얼굴 특징점 위치를 검출하기 위한 방법, 장치, 및 컴퓨터 판독 가능한 기록 매체
US9449259B1 (en) * 2012-07-25 2016-09-20 Hrl Laboratories, Llc Opportunistic cascade and cascade training, evaluation, and execution for vision-based object detection
US9317768B2 (en) * 2012-09-25 2016-04-19 Intel Corporation Techniques for improved feature detection
JP6111796B2 (ja) * 2013-03-28 2017-04-12 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
KR20150005094A (ko) * 2013-07-04 2015-01-14 삼성전자주식회사 전자 디바이스 및 전자 디바이스에서 눈 영역 검출 방법
JP6532190B2 (ja) * 2014-03-26 2019-06-19 キヤノン株式会社 画像検索装置、画像検索方法
WO2018119684A1 (zh) * 2016-12-27 2018-07-05 深圳前海达闼云端智能科技有限公司 一种图像识别系统及图像识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268825A (ja) * 2005-02-28 2006-10-05 Toshiba Corp オブジェクト検出装置、学習装置、オブジェクト検出システム、方法、およびプログラム
WO2008026414A1 (fr) * 2006-08-31 2008-03-06 Osaka Prefecture University Public Corporation Procédé de reconnaissance d'image, dispositif de reconnaissance d'image et programme de reconnaissance d'image
JP2009087209A (ja) * 2007-10-02 2009-04-23 Sony Corp 画像処理装置、撮像装置、これらにおける処理方法およびプログラム
JP2009116401A (ja) * 2007-11-01 2009-05-28 Canon Inc 画像処理装置および画像処理方法
JP2009151395A (ja) * 2007-12-18 2009-07-09 Canon Inc パターン識別器生成方法、情報処理装置、コンピュータプログラム及び記憶媒体

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7099510B2 (en) 2000-11-29 2006-08-29 Hewlett-Packard Development Company, L.P. Method and system for object detection in digital images
US7769228B2 (en) * 2004-05-10 2010-08-03 Siemens Corporation Method for combining boosted classifiers for efficient multi-class object detection
JP4767595B2 (ja) 2005-06-15 2011-09-07 パナソニック株式会社 対象物検出装置及びその学習装置
KR100813167B1 (ko) * 2006-06-09 2008-03-17 삼성전자주식회사 고속 정확한 얼굴 검출 방법과 얼굴 검출 학습 방법 및이를 구현하는 시스템
JP4980988B2 (ja) 2008-06-13 2012-07-18 トヨタ自動車株式会社 運転者状態推定装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268825A (ja) * 2005-02-28 2006-10-05 Toshiba Corp オブジェクト検出装置、学習装置、オブジェクト検出システム、方法、およびプログラム
WO2008026414A1 (fr) * 2006-08-31 2008-03-06 Osaka Prefecture University Public Corporation Procédé de reconnaissance d'image, dispositif de reconnaissance d'image et programme de reconnaissance d'image
JP2009087209A (ja) * 2007-10-02 2009-04-23 Sony Corp 画像処理装置、撮像装置、これらにおける処理方法およびプログラム
JP2009116401A (ja) * 2007-11-01 2009-05-28 Canon Inc 画像処理装置および画像処理方法
JP2009151395A (ja) * 2007-12-18 2009-07-09 Canon Inc パターン識別器生成方法、情報処理装置、コンピュータプログラム及び記憶媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577789A (zh) * 2012-07-26 2014-02-12 中兴通讯股份有限公司 检测方法和装置
CN103577789B (zh) * 2012-07-26 2018-02-13 中兴通讯股份有限公司 检测方法和装置

Also Published As

Publication number Publication date
JP4806101B2 (ja) 2011-11-02
US8693791B2 (en) 2014-04-08
JPWO2011092865A1 (ja) 2013-05-30
US20140161364A1 (en) 2014-06-12
US20120020514A1 (en) 2012-01-26
EP2397989A1 (en) 2011-12-21
WO2011092865A1 (ja) 2011-08-04

Similar Documents

Publication Publication Date Title
CN102216958A (zh) 物体检测装置以及物体检测方法
US9076030B2 (en) Liveness detection
US7643674B2 (en) Classification methods, classifier determination methods, classifiers, classifier determination devices, and articles of manufacture
CN105144239A (zh) 图像处理装置、程序及图像处理方法
EP2336949A1 (en) Apparatus and method for registering plurality of facial images for face recognition
US20100045432A1 (en) Authentication apparatus, registration apparatus, registration method, registration program, authentication method and authentication program
US20080175447A1 (en) Face view determining apparatus and method, and face detection apparatus and method employing the same
US9704024B2 (en) Object discriminating apparatus and method
US20220375204A1 (en) Learning device, learning method, and recording medium
US20060126940A1 (en) Apparatus and method for detecting eye position
US9483827B2 (en) Method of object orientation detection
WO2021229660A1 (ja) 判定装置、学習方法および記録媒体
WO2022049704A1 (ja) 情報処理システム、情報処理方法、及びコンピュータプログラム
WO2021229662A1 (ja) 判定装置、判定方法および記録媒体
WO2021229654A1 (ja) 判定装置、判定方法および記録媒体
WO2021229661A1 (ja) 判定装置、判定方法および記録媒体
US20230306273A1 (en) Information processing device, information processing method, and recording medium
CN112052723A (zh) 识字卡片、基于图像识别的桌面场景的str方法及装置
CN112052724A (zh) 基于深度卷积神经网络的手指指尖定位方法及装置
Thomas et al. Banknote Object Detection for the Visually Impaired using a CNN
CN105989339B (zh) 用于检测目标的方法和装置
CN114663965B (zh) 一种基于双阶段交替学习的人证比对方法和装置
CN113420689B (zh) 基于概率校准的文字识别方法、装置、计算机设备及介质
Chinapas et al. Personal verification system using thai ID Card and face photo for cross-age face
WO2021229659A1 (ja) 判定装置、判定方法および記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20111012