WO2010111916A1

WO2010111916A1 - 多类目标的检测装置及检测方法

Info

Publication number: WO2010111916A1
Application number: PCT/CN2010/071193
Authority: WO
Inventors: 梅树起; 吴伟国
Original assignee: 索尼公司
Priority date: 2009-04-01
Filing date: 2010-03-23
Publication date: 2010-10-07
Also published as: EP2416278A1; US20120089545A1; JP2012523027A; JP5500242B2; US8843424B2; CN101853389A

Description

- -

多类目标的检测装置及检测方法

技术领域

[01] 本发明涉及目标检测技术。尤其涉及用于对多个类别的目标数据进行检测的检测装置及其检测方法。

背景技术

[02] 运用机器学习方法对图像或其它待检测数据进行目标数据的检测显得越来越重要。尤其是对图像中的物体检测已成为其中一个重要分支。

[03] 同一类物体受光照、视角、姿态等多重因素的影响在图像中可能产生出差异巨大的状态，这给图像中的物测技术带来很大困难。同一类物体因而可能会被划分为多个子类进行处理，但如何既有效利用多个子类之间的共性而又能准确区分其差别仍然是一个需要进一步研究的课题。

[04] 对多类图像物测技术来说，文献【1】提出了一种特征共享技术，通过将多类物体的分类器进行联合训练，在多类之间尽可能共享特征，以达到减少运算成本的目的。单纯的特征共享多类联合训练对减少运算成本十分有效，取得了良好的效果，但其效率较低，且由于共享特征的同时也共享弱分类器导致在强分类器的后段，特征的共享越来越困难。文献【2】在此^ I上进一步提出了一种向量 Boosting树算法测图像中呈现不同视角和不同姿态的人脸。但同样文献【2】所提算法强制在各类之间进行特征共享，这使得当多类中的某一类不能较好的与其他各类共享特征时，强制的特征共享方式给分类器的进一步训练带来了困难。

参考文献

[1】 A. Tor r alb a, K.P. Murphy, and W.T. Freeman. Sharing Features: Efficient Boosting Procedures for Multiclass Object Detection. CVPR 2004.

[2】 C. Huang, H. Ai， Y. Li, and S. Lao. Vector Boosting for Rotation Invariant Multi-View Face Detection. ICCV 2005. - - 发明内容

[05] 本发明的目的是提供一种区别于以上现有技术的、用于对多个类别的目标数据进行检测的检测装置及其检测方法。

[06] 根据本发明的一个方面，提供了一种用于对多个类别的目标数据进行检测的检测装置的训练方法，包括：

确定所述多个类别中进行特征共享的最优特征共享样本类别集合，并通过特征遍历为其挑选最优特征；

使用所述选中的最优特征对所述最优特征共享样本类别集合中的各个类别分别构建弱分类器；以及

通过迭代地进行最优特征得到当前级强分类器的特征列表，同时也为所述多个类别分别构建一组弱分类器，获得包括能处理所述多个类别的相应多个强分类器的检测装置。

[07] 根据本发明的用于对多类目标数据进行检测的检测装置的训练方法使用多类目标的样本进行训练，通过确定所述多个类别中在哪些类别之间进行特征共享误差最小来获得特征共享样本类别集合，使用所述选中的最优特征对所述最优特征共享样本类别集合中的各个类别分别构建弱分类器，由此构建包含弱分类器的检测装置。测装置和检测方法，、其;检测装置包括：输入单元，

数据；联合分类器，包括数量与所述类别数量相对应并用于分别检测对应类别的目标数据的强分类器，其中，每个所述强分类器都由一组弱分类器相加得到，每个弱分类器使用一个特征对所述待检测数据进行弱分类，其中所述联合分类器内包含共享特征列表，所述共享特征列表中的每个特征被分别属于不同强分类器的一个或多个弱分类器共享使用；使用同一特征的分属不同强分类器的弱分类器具有彼此不同的值。这样，在针对各类目标的强分类器之间共享特征以减少计算成本，但各类之间不共享分类器以体现类间差异。

[09] 根据本发明的另一个方面，提供了一种用于对 r个类别的目标数据进行检测的检测装置的训练方法，其中，所述 r个类别可按预定相似性标准由细到粗被逐级合并为预定多层结构，并且所述 r个类别作为划分最细的类别设置在最底层， r为大于 1的自然数，所述训练方法包括：

按照由粗到细的策略从最顶层类别开始训练相应的级分类器，每个级 - - 分类器包括具有与所针对类别数量相对应的数量的强分类器，所述各级分类器串联形成所述检测装置，

其中，针对其中一级准备检测 m个类别的级分类器的训练包括：为该级分类器准备处理的 m个类别分别准备正样本集和负样本集，其中 l<m≤r;

确定所述 m个类别中进行特征共享的最优类别集合，并通过特征遍历为其挑选最优特征；

通过迭代地进行最优特征得到当前级强分类器的特征列表，同时也为所述 m个类别分别构建一组弱分类器，获得包括可处理所述 m个类别的 m个强分类器的级分类器。

[10] 据本发明第二个方面的用于对多个（ r个）类别目标数据进行检测的检测装置及其检测方法，其中，所述多个类别按相似性标准被逐级合并为预定多层结构，并且所述多个类别作为划分最细的类别设置在最底层，所述检测装置包括：

输入单元，被配置成输入待检测数据；以及

级联分类器，所述级联分类器包括由多个串联的级分类器，所述多个级分类器被配置成按照由粗到细的策略对所述预定多层结构中的各层类别进行分类处理，并且每个级分类器都包括数量与所处理类别数量相对应的强分类器，其中，每个所述强分类器包括一组弱分类器，每个弱分类器使用一个特征对所述待检测数据进行弱分类，

其中每个所述级分类器包含一个共享特征列表，所述共享特征列表中的每个特征被分别属于不同强分类器的一个或多个弱分类器共享使用；使用同一特征的分属不同强分类器的弱分类器具有彼此不同的参数值。

[11] 类似地，根据本发明第二个方面，作为级联式分类器的检测装置在各类目标的强分类器之间共享特征以减少计算成本，但各类之间不共享分类器以体现类间差异。同时为有效处理多类目标，在训练各级分类器的过程中按照由粗到细的原则先将多个类别合并处理，而后逐渐拆分类别做细化处理。 - - 附图说明

[12] 结合附图，通过参考下列详细的示例性实施例的描述，将会更好地理解本发明本身、优选的实施方式以及本发明的目标和优点。

图 1 示出了根据本发明第一实施例的用于对多类目标数据进行检测的检测装置的训练方法。

图 2示出了根据本发明第一实施例的训练方法所使用的 Haar-like特征原型。

图 3a和图 3b分别示出了弱分类器和强分类器的结构。

图 4 示出了根据本发明第一实施例的训练方法所获得的检测装置的分类器。

图 5a和 5b分别列举了使用类别树结构 CT表示训练过程中的样本类别变化。

图 6示出了根据本发明第三实施例的训练方法。

图 7 示出了根据本发明第二或第三实施例的训练方法所获得的检测装置的分类器。

图 8 示出了根据本发明的检测装置检测图像或视频中预定多类目标的絲。

图 9是示出其中实现本发明的计算机的示例性结构的框图。

具体实施方式

[13] 下面将结合附图对本发明加以详细说明，应指出的是，所描述的实施例仅旨在便于对本发明的理解，而对其不起任何限定作用。

第一实施例的训练方法

[14] 第一实施例以多类汽车（轿车、巴士和卡车）为待检测的目标。应了解，本发明的实施例并不限于对图像和 /或视频中的汽车进行检测，还可以对图像和 /或视频中的其它物体（如多角度的人脸）、甚至可对对实时网络数据或主机数据进行入侵分类等等进行检测。

[15] 图 1示出了根据本发明第一实施例的用于对多类目标数据进行检测 - - 的检测装置的训练方法 100。

[16] 该方法在步骤 S101开始，首先为所述多个类别分别准备正样本集和负样本集。本实施例中分别为三类汽车（轿车、巴士和卡车）准备一定数量的正样本集和负样本集，其正样本集分别为三类汽车（轿车、巴士和卡车）正面视角的相同尺寸的汽车图像集，尺寸统一为 32x32 (像素）；其负样本集从背景图像集（一组不包含目标物体的图像，尺寸不做任何要求）中抽样得到，尺寸统一缩放到 32x32 (像素）。

[17] 同时准备训练特征池。将 Haar-like特征原形应用于例如 32x32 (像素）的图像，得到数十万具体的训练特征。但应了解本发明的实施例并不限定所使用特征的具体种类，例如可以是 Haar-like特征， HOG (梯度方位直方图）特征， LBP (局部二值模式）特征或其他特征。

[18] 在此，图 2示出了所使用的 Haar-like特征原型。 Haar-like特征为定义在图像中的一个矩形，包括分别在图 2 中以白色和黑色表示的两部分，矩形的方位分为直立和 45度倾斜两种。 Haar-like特征原型具有四个矩形在图像中的位置（x， y )和矩形的尺寸（宽度 w和高度 h )，随着矩形的位置、尺寸和宽高比的变化，可生成数以万计的具体 Haar-like 特征作用于图像。 Haar-like特征的取值为一标量，定义白色区域内所有像素的灰度值总和为 ^画），黑色区域内为 m(fi)，则 Haar-like特征值由

^ ^式 feature i - Sw ^)- 5"w ( )计算。

[19] 从图 1的步骤 S102开始训练。确定所述多个类别中进行特征共享的最优特征共享样本类别集合，并通过特征遍历为其挑选最优特征。例如，以多个待选训练特征为基础，通过使用前向顺序选择法等方法确定所述多个类别（在此为 3个类别）中在哪些类别之间进行特征共享是误差最小的，选择由所确定的类别组成的特征共享样本类别集合 S, 并通过特征遍历选中相应的训练特征。

[20] 在确定特征共享样本类别集合 S及相应的所选最优特征后，使用所述选中的最优特征对所述最优特征共享样本类别集合中的各个类别分别构建弱分类器（图 1中步骤 S103 )。弱分类器的结构如图 3a所示，在本实施例中使用决策树作为弱分类器，每个弱分类器使用一个 Haar-like特征构建，根据输入的特征值与阈值的关系分类器有两个不同的输出。

[21] 图 1的步骤 S104,通过迭代地进行最优特征挑选得到当前级强分类器的特征列表，同时也为所述多个类别（在此 3个类别）分别构建一组弱 - - 分类器，获得包括能处理所述多个类别的相应多个强分类器的检测装置。针对每一类别的强分类器（H(Q分类器）的结构如图 3b所示，其输出为 +1或 -1并且其阈值 Θ可以根据需要进行调节。

[22] 弱分类器 h(C,)使用的这些特征来自于分类器的特征列表 (特征组）。分类器的训练过程就是寻找各 (G)分类器的过程，也就是对每个类别搜索多个弱分类器 h(C,)的过程，最终通过迭代搜索各个弱分类器所使用的特征的过程，即特征^ ^过程。此过程最后得到一组共享特征。

[23] 迭代的步骤可以如本领域技术人员所了解指定迭代次数 T，通过调整样本权重开始下一次迭代分别为所述多个类别（在此 3个类别）再构建弱分类器，在满足迭代次数 Τ之后，获得包括所有弱分类器的检测装置，结束流程 (步骤 S105 )。

[24] 根据本发明，优选地可以采用训练终止判断 ^来进行迭代，对各个类别的分类器 H(C,)分别设定训练所要达到的期望性能，如果某个类别在训练过程中达到了其期望性能，则这个类别将退出该分类器的 c,)联合训练过程。例如，对于所有属于当前特征共享样本类别集合 S的类别（ c, ) 测试误检率 (C' H , ( N_FA为该分类器将负样本集中样本误检为正样本的数量，为负样本的总数量），如果/ (_C,)< /,则类别 C,已经满足训练终止条件，退出该分类器的训练；如果所有样本类别都满足训练终止条件，则结束该分类器的训练。而如果有部分样本不满足训练条件，则对于属于 S 的 d ( C_t S ), 则更新样重： = ₁ (^( (/ ^ , ^) ')，对( , ^则保持样本权重不变；同时使所有样重归一化使得∑H¾ = 1，进行下一次迭代。

[25] 根据本发明的第一实施例，在对分类器的训练过程中，使用前向顺序选择法来确定在参与训练的所有类别中哪些类别之间进行特征共享是整体误差最小的，即由哪些类别组成一个特征共享样本类别集合 S进行特征共享是最优的，同时在特征库中挑选出对集合 S内的类别来说分类性能最优的特征，然后对 S中的每个类别使用最优特征分别构建弱分类器。然而，本发明并不限于前向顺序选择法，而是可以采用其它的顺序选择法（例如后向顺序选择法）来选择由所确定的类别组成的特征共享样本类别集合。

[26] 根据第一实施例的检测装置和检测方法

[27] 在第一实施例中对每个类别都训练一个强分类器，其中所有强分类器的训练是联合进行的，各强分类器中的弱分类器所使用的特征在多类之间进行共享，但各个弱分类器的训练在各类内部分别独立进行；并不限定特征被所有类别共享，某个特征有可能被所有类别共享，也可能只被某些类别共享。

[28] 根据本发明第一实施例的训练方法所获得的检测装置包括被配置成输入待检测数据的输入单元、包括多个强分类器的联合分类器以及判别单元，判别单元被配置成根据多个强分类器的分类结果，对所述待检测数据属于哪个类别的目标数据进行判别。本领域的技术人员应当理解，可以根据实际应用的需求来灵活地设置判别单元的具体判别标准和方式，或者也可以不设置判别单元而直接得到联合分类器的分类结果，其均应在本发明的精神和范围之内。

[29] 其中多个强分类器所组成的联合分类器如图 4所示，包括 m个数量与所述类别数量 m相对应并用于分别检测对应类别的目标数据（在此实施例中 m=3 )的强分类器（在第一实施例中是 Boosting分类器 H(G = ∑hj(Cd) ), 其中每个强分类器包括一个或更多个弱分类器（hj(Q )，其中，每个所述强分类器都由一组弱分类器相加得到，每个弱分类器使用一个特征对所述待检测数据进行弱分类；其中联合分类器包含共享特征列表（即共享特征组），共享特征列表中的每个特征 ( ~ _η )被分别属于不同强分类器的一个或多个弱分类器共享使用（例如 /₃并不为强分类器 H(G)和强分类器 H(C¾所使用 )；使用同一特征的分属不同强分类器的弱分类器具有彼此不同的参数值。这样，在针对各类目标的强分类器之间共享特征以减少计算成本，但各类之间不共享分类器以体现类间差异。

[30] 在该检测装置内部，待检测数据（例如样本图像）分别被所有类别的强分类器进行处理并被判别单元进行判别，因而允许多于一个强分类器的输出被判断为正，而不是规定只有一个判断为正；不同类别的强分类器之间没有互斥关系，某个待检测数据可能被判别为多个类别的目标数据。只要有一个强分类器的输出被判别单元判其为正，则该检测装置的输出为

+1，否则输出为 -1。

第二实施例

[31] 根据本发明的第二实施例，将用于检测多类目标数据的检测装置设计成由多个级分类器串行联结的级联结构（Cascade ) 的分类器。为此，首先将训练级联分类器的各级分类器（SCJ所使用的样本类别人为设计为预定多层结构（本发明中的第一多层结构）。将划分最细的类别（例如 - - r个类别， r为大于 1的自然数）设置在最底层，然后根据预定相似性标准将这些类别合并为较高一层的较少的几个较大的类，而后再逐级次合并至最高层的例如一个大类为止。

[32] 图 5a和 5b示出了使用类别树结构 CT表示训练过程中的样本类别变化。图 5a中，共有 7类物体的样本参与训练，将这 7类设置在树的最底层 Level3并称这 7类为"叶子类 "c," ; 然后根据某种相似性标准将 7类样本中的某些类合并得到树的较高层 Level2的 3类 c," ; 最后将 Level2的 3类合并为最高层 Levell的 1类 c。"；在训练中使用样本时从 CT的 Levell 开始先使用较高层的样本类，即分类器训练的早期目标是整体上区分目标物体和非目标物体；随着训练的进行当整体区分变得困难时再进行样本的类别拆分使用 CT的 Level2的 3类样本，最后使用 CT的 7个叶子类的样本。图 5b仍针对轿车、卡车和巴士 3类，此 3类为 CT的"叶子类，，，三类合并后为 CT的根节点类 c"。相应的训练将从 c。"开始然后适时拆分为 3 个叶子类 c,"。当然在将汽车分为卡车、轿车、巴士等等多个类别后，还可每个类别再继续划分为更细致的多个子类。

[33] 根据本发明的第二实施例，用于对 r个类别的目标数据进行检测的检测装置的训练方法，包括：按照由粗到细的策略从最顶层类别开始训练相应的级分类器，每个级分类器包括具有与所针对类别数量相对应的数量的强分类器，所述各级分类器串联形成所述检测装置。

通过迭代地进行最优特征^ ^得到当前级强分类器的特征列表，同时也为所述 m个类别分别构建一组弱分类器，获得包括可处理所述 m个类别的 m个强分类器的级分类器。

可以理解，级联分类器的某一级分类器 SC_fc是针对此级分类器所要处理的 m类样本训练得到的，包含 m个 (G)分类器，分别对应 m类样本。同样，其中每一个强分类器 (G)是由多个弱分类器/ G)相加得到的。 - - 分类器的结构如图 3b所示，以决策树为例的弱分类器 h(C,)如图 3a所示。

[34] 弱分类器 h(C,)使用的这些特征来自于级分类器 SC_fc的一组共享特征 f 。级分类器 8(^的训练过程就是寻找各分类器的过程，也就是对每个类别搜索多个弱分类器 h(C,)的过程，最终就是搜索各个弱分类器所使用的特征的过程，即特征^^过程，由此得到所述共享特征组。

[35] 与第一实施例类似，共享特征组中的任意一个特征都可能被多个类别用于构建弱分类器，即特征被多类共享；但弱分类器的参数才艮据各类的数据分别计算得到，即弱分类器并不在多类间共享。

[36] 如上所述，在训练中，先使用较高层的样本类别进行训练，并设定样本类别的拆分标准；随着训练的进行，当这个标准得到满足时，将现有类别拆分为较低层的更细致的样本类别继续训练，直至最后拆分至最底层。

[37] 第二实施例所采用的 "设定的样本类别拆分标准" 可以是有监督地为各级指定子类划分，进行强制的人为样本类别拆分。例如为最顶层指定第一级分类器，为较高层指定第二、第三级分类器等等。也可以采用无监督的自动产生子类并延续训练的方法。

[38] 可替代地，第二实施例优选以训练集内的误差作为样本类别拆分的判断标准。即在训练正常进行时，训练集内误差持续减小，当集内误差难以继续降低时，说明当前使用的某些样本类别的类内差异较大阻碍了训练的继续，应当进行样本类别拆分。在这种情况下，由于在训练除针对最底层之外的其他各层类别的各级分类器的过程可能会拆分样本，因此尽管训练时是按照由粗到细的策略针对预定多层结构中的每一层类别分别训练一个或多个相应的级分类器，但是例如当类内差异^ f艮大时针对某一层类别、特别是针对最高层类别有可能并没有训练出对应的级分类器。训练完成后各级分类器实际处理的多层结构类别层次（本发明中的第二多层结构）可能与事先人为定义的预定多层结构（本发明中的第一多层结构）有所区别。

[39] 具体地，针对准备处理除最底层类别之夕卜的其他各层类别的任意一级分类器（即 l≤m<r )，则在每次迭代过程中在为所述类别构建弱分类器后进行有效性度量，以判断是否进行样本类别拆分。

所述进行有效性度量包括： - - 将由目前所构建弱分类器组成的强分类器的阈值设为零，并测试所述强分类器对相应类别的正负样本的分类误差；

判断所述分类误差是否随着逐个迭代过程逐渐降低；和

如果判断所述分类误差不再随着逐个迭代过程逐渐降低、或者降低緩慢，或者发生震荡，则退出该级分类器的训练，并且将样本类别按从粗到细拆分成下一层样品类别后重新开始该级分类器的训练。

[40] 如上所述，所述预定多层结构类别的最高层可以是任意数量的类别，但通常具有 1个类别。根据第二实施例，针对用于检测所述 1个类别的目标数据的级分类器的训练包括：准备正样本集和负样本集；对于所述多个待选训练特征训练弱分类器，选择具有最小分类误差的弱分类器；以及通过迭代构建弱分类器，获得由所获得的弱分类器构成的第一级分类器，通常用于区分目标图像和非目标图像。同样，迭代的次数可以预定，也可以通过采用训练终止判断条件来自动判定。

[41] 类似地，针对其他任意一级分类器迭代训练分类器时，其迭代的次数都可以预定，也可以通过采用训练终止判断条件来自动判定。针对训练终止判断条件的描述如第一实施例中所述，在此不再赘述。

[42] 不仅针对任意一级分类器可以设定训练终止判断条件，还可以整体上对目标各类分别设定其期望训练性能（例如针对最底层类别分别设置总误检率），如果某个类别的训练已经达到了期望性能，则这个类别不再参与后续的各级分类器的训练。

第三实施例

[43] 第三实施例以轿车、巴士和卡车作为待检测的目标，描述了更详细的对级联分类器的分类（训练）方法。

[44] 首先，准备三类正样本集（汽车图像） P ( G ) ( i=l, 2， 3 )分别对应轿车、巴士和卡车，将三类正样本合并为一类正样本集 P ( C。)，样本类别树的结构如图 5b所示；训练从 P ( G ) ( =0 )开始，当需要进行正样本类别拆分时将 P i=0 )拆分为 P ( G ) ( i= 2, 3 )；并设定所有各类的期望训练目标：检测率 A和总误检率 F_i;

[45] 其次准备特征池，将例如 Haar-like特征原形应用于 32x32 (像素）的图像，得到数十万具体特征。 - -

[46] 然后逐级训练各级分类器 SC₇至 S C_{n a} 如图 6所示，尤其示出了训练第级分类器 SC_fc =l， 2， 3，···， n )的步骤：

[47] 在步骤 S601，针对不同的类分别准备正样本集/ : 对应本级所使用的正样本类别（一类或三类），使用前 k-l级分类器对正样本集 P( C 进行筛选，通过去除判别为 -1 的样本得到当前正样本集/ 。为每个正样本賦予标记 +1 ©

同样在步骤 S601 ,对应各正样本集/ 分别准备负样本集 Nf 。可以通过在背景图象中按照某种顺序截取与正样本图像尺寸相同的子图片，为各类准备负样本集。

优选地，针对从第二级分类器开始的各级分类器，为相关类别 G准备负样本集包括：使用前面所有的已有级分类器中的与 G相关的强分类器组成的级联分类器，在背景图像中做窗口遍历搜索，将误判为正样本的窗口图像添加到 G的负样本集 Nf 中。负样本的数量可以根据实际需要确定，例如可以规定某个类别的负样本的数量与其正样本的样本数目成固定比例。为每个负样本赋予标记 = -1。

在此可以整体上对各个样本类别分别设定其期望训练性能。例如定义最底层类别 G的当前误检率为 F_Q = U ( 为搜索得到的负样量，为搜索过的所有窗口图像的数目），如果类别 G的误检率 F 已经小于期望总误检率，则类别 G不再参与后续训练。如果所有类别的误检率都小于其总误检率，则退出全部训练过程。

同样在步骤 S601 , 为每个样本设定权重 = I/M (初始权重为 1/M )， M为样本总数。

在步骤 S601还可以设定级分类器的退出条件，例如指定 T次迭代次数，在此是对各类目标设置期望最小检测率 φ和期望最大误检率 f_io

[48] 从步骤 S602开始^^特征，对每个类别搜索多个弱分类器 h(C,)的过程，最终通过迭代搜索各个弱分类器所使用的特征。

设定 ί=0， 1， ... ，进行第个特征的挑选

a) 在步骤 S602，搜索最优的特征共享样本类别集合 S (在此例如使用前向顺序选择法确定是哪些类别而不一定是所有类别共享该 t个特征 ): i. 对于所有和 Nf ，计算当第 ς类不参与特征共享时所引入的误差 = ； - - 对所有各类独立进行弱分类器训练，即在特征池中 ^一个特征能对当前类的正负样本集做误差最小划分；记录各类所挑选出的最优特征及其分类误差 _e, 对所有类别计算： ( = _ef'₊ ( 当不参与时

_Cj._≠c, c_j≠c, 的误差），取 C^argmin^) (使达到最小值时的 ^的取值）为优先进入特征共享样本类别集合候选 S的第一类，得到特征共享样本类别集合候选 _S1；将 _C;分别与其他各类组合，进行两类联合弱分类器训练，记录各种组合下挑选出的最优特征 f 以及分类误差 _e ；对所有组合计算 e_S2( ) = e - ₊ ∑ ,，取 C₂*=argmin( )作为特征共享样本类别集合候选 S的第二类，得到特征共享样本类别集合候选。

以此类推，直到处理完所有类；

在以上所得的所有中，取特征共享误差最小的集合作为特征共享样本类别集合 S，即 S = argmm₍ ; 记录相应的/ 为最优特征 /,*。

b) 在步骤 S603， ^用 _/为5中的所有各类构建决策树弱分类器 W,Q，其结构如图 3a所示；

c) 在步骤 S604, 为特征共享样本类别集合 S中的所有样本类别更新

H,(C,)分类器： H ^ = HD ₊ f:,_Ci 并根据期望最小检测率确定分类器的阈值 (即在当前阈值下，分类器在当前正样本集的检测率为^)； d) 在步骤 S605，为特征共享样本类别集合 S中各类样本的训练有效性度量：例如通过设置各类样本的 (c)分类器的阈值为零，测试此时的 _H(Q 分类器对各类内部的正负样本的分类误差，并在步骤 S606判断该误差是否随着训练逐渐降低。如果这个误差不再降低、或者降低緩慢、或者发生震荡，则退出第级分类器 SC_fc的训练并将样本类别按从粗到细拆分成下一层样品类别（例如按图 5b所示进行拆分）后重新开始第级分类器 SC_fc的训练

(见步骤 S607 );

e) 在步骤 S608，若步骤 S606的判断结果为否，则进行训练终止判断。在此采用期望最大误检率进行判断。具体地，对所有属于特征共享样本类别集合 S的类别（ c,_e5 )测试误检率 _{/( =}

( 为分类器将负样本 - - 集中样本误检为正样本的数量，为负样本的总数量），如果/ (_C,)< /,则类别 ς已经满足训练终止条件，退出级分类器的训练；如果所有样本类别都满足训练终止条件，则结束第级分类器的训练，通过更新样本集合 G:

(P 进行下一级训练（见步骤 S609和 S610 )。

f) 在步骤 S611，对属于 S的 G ( c^ s ) , 则更新样本权重：

对则保持样本权重不变；同时使所有样本权重归一化使得 Z = 1，重新开始下一次迭代。

[49] 应了解，前几级分类器 SC_fc =l， 2， 3，···， n )、尤其是第 1级分类器 SC₇如果仅对 1个类别进行判别，则对于该级分类器的特征挑选则无需使用例如前向顺序选择法等来搜索特征共享样本类别集合 S o 而对于后几级分类器 SC_fc如果已针对最底层的样品类别进行训练，则无需有效性度量来判断是否需要样本类别拆分。

[50] 另夕卜，应了解对检测装置的训练并不限定具体的 Boosting算法，而可以是 Gentle-Boosting, Real-Boosting等等其它算法。

根据第二和第三实施例的检测装置和检测方法

[51] 根据本发明第二或第三实施例的训练方法所获得的检测装置包括：输入单元，被配置成输入待检测数据；以及级联分类器。其中级联分类器如图 7所示，包括由多个（n个）串联的级分类器。

[52] 在此所述多个（r个）类别可按相似性标准被逐级合并为预定多层结构，并且所述多个类别作为划分最细的类别设置在最底层，相应地，所述多个级分类器被配置成按照由粗到细的策略对所述预定多层结构中的各层类别进行分类处理，并且每个级分类器都包括数量与所处理类别数量相对应的强分类器。

[53] 每个所述强分类器包括一组弱分类器，每个弱分类器使用一个特征对所述待检测数据进行弱分类，其中每个所述级分类器包含一个共享特征列表，所述共享特征列表中的每个特征被分别属于不同强分类器的一个或多个弱分类器共享使用；使用同一特征的分属不同强分类器的弱分类器具有彼此不同的参数值。

[54] 根据第二或第三实施例的检测装置其整体上看是由多个"级分类器" SC串行联结的一个级联结构分类器，但它是为多个类别物体的同时检测设计的，在每个级分类器内部多个类别的强分类器被共享特征列表（即 - - 共享特征组 )结合在一起。

[55] 以第三实施例的检测装置为例，待检测数据逐次输入级联分类器的各级分类器。

[56] 其中，当待检测数据某级分类器时，依次被此级所包含的 m个强分类器判别，如果某个强分类器输出 +1，则此强分类器判别其为属于相应类别的目标，称为被此强分类器通过，否则输出 -1，判别为非对应类别的目标，称为被此强分类器拒绝。

[57] 其中，所述判别过程如下：计算当前级分类器的特征列表中的所有有效特征的值；对此级的 m个强分类器，依次按照对特征列表中各特征的共享情况，根据计算已得的特征值确定各个弱分类器的输出，并相加得到最终的强分类器的输出。

[58] 所述判别过程中，如果待检测数据被某个用于检测类别 c,的强分类器拒绝的情况下，则后续级分类器中的用于检测类别 c,和其子类的相应强分类器不再对所述输入的待检测数据继续判别，此时称所述待检测数据被类别 c,所对应的叶子层类别拒绝。

[59] 所述判别过程中，各级分类器的特征列表中只与所述不再参与判别过程的各强分类器相关的特征视为无效特征，不再参与计算，以节省计算成本。

所述判别过程中，如果待检测数据被所有叶子层类别拒绝，则中止判别过程，称此待检测数据为非目标数据。所述判别过程的最后，如果待检测数据被最后一级分类器的某个强分类器通过，则判别此待检测数据为具有所述强分类器所对应的目标类别属性，如果待检测数据被最后一级的多个强分类器通过，则判别此待检测数据具有相应的多重目标类别属性。

[60] 根据本发明的检测装置可对各种多类目标数据进行检测，而在输入的图像或视频中对多个类别的预定目标进行检测的情况下，根据本发明的检测装置还可包括：被配置成对待检测图像或视频进行窗口遍历的窗口遍历部件、和后处理部件，后处理部件被配置成将所述窗口遍历部件产生的窗口进行合并，并使用预定阈值对合并窗口进行过滤，以获得最终的检测结果。

[61] 图 8示出了根据本发明的检测装置检测图像或视频中预定多类目标的絲。

[62] 窗口遍历过程 810: 对任意给定的待检测图像（步骤 S811 )或从待 - - 检测视频中截取的图像，使用矩形窗口进行图 ^4历（步骤 S812 ), 在步骤 S813依次得到窗口图像（其中遍历的顺序和方式任意，可以是从左到右、从上到下的，也可以是从右到左，从下到上的；遍历时窗口平移的步长任意，可以是逐像素的，也可以是隔多个像素的，或者与当前窗口的尺寸成比例关系）。

[63] 在遍历时，依次对扫描过程中得到的每个窗口应用所述级联分类器，使用训练所得的分类器中的特征通过对窗口图像进行特征计算（步骤 S814 )并应用所述分类器进行分类（步骤 S815 )。如果级联分类器判别此窗口图像为目标类别（具有一种以上的目标类别属性），则记录此窗口在原始图像中的位置和尺寸，以及其所具有的所有目标类别属性（步骤 S816 )o 窗口遍历结束后，按照一定的比例因子将图像缩小，重新进行上述窗口遍历和窗口图像判定过程。重复以上过程，直到当图像缩小到窗口遍历无法进行（图像的高度小于窗口高度，或图像的宽度小于窗口宽度）为止（见步骤 S817和 S818 )。将所有正响应窗口按照其对应的图像与原图像的尺寸比例因子映射到原图像，得到所有正响应在原图像中的位置和尺寸。

[64] 遍历图像时除了采用以上的模式 WinScanModel (即选择固定尺寸的窗口遍历图像，遍历结束后，按一定比例缩小或放大图像的尺寸，使用固定尺寸的窗口重新遍历图像），还可采用模式 WinScanMode2，其中保持图像的尺寸不变，选择第一次遍历时窗口的尺寸，当遍历结束后，按一定比例缩小或放大窗口的尺寸，重新遍历原图像。

[65] 对每个窗口图像使用训练所得级联式分类器进行判别后，如果分类结果为 +1，则：如果选择 WinScanModel , 记录当前窗口的尺寸和位置，并按照缩放图像的比例将当前窗口的尺寸和位置映射回原图像坐标空间，得到当前响应在原图像中的位置和尺寸；如果选择 WinScanMode2，则直接记录当前窗口的尺寸和位置。

[66] 后处理流程 820由后处理部件执行，包括：步骤 S821窗口合并以便合并相邻的正响应结果和步骤 S822阈值过滤以便舍弃弱响应，并将经过窗口合并和阈值过滤后剩余的合并结果作为最终的检测结果（步骤 S830 )„

具体地，在图像中的同一目标（汽车）附近会产生多重响应，将邻近的多重响应合并为一个输出响应。 - - 首先，所述合并过程定义 "临近"为具有相邻的窗口中心位置、相近的尺寸比例和相同的目标类别属性，然后计算临近的一簇目标窗口的平均中心位置、平均窗口尺寸，并将合并的窗口的数量作为合并结果的置信度，其次，所述合并过程对合并后的位置中心相邻和尺寸相近的合并结果进行目标属性合并，即如果图像中某个位置附近有多个具有不同目标属性的合并结果，统计各个目标属性的数量，取数量最大的目标属性为最终目标属性，取各个目标属性的置信度的和为最终合并结果的置信度，

所述合并过程结束后，当合并窗口的置信度大于或等于预设置信度阈值时，接受此合并结果，否则舍弃此合并结果。

技术效果

1、根据本发明的各个实施例，多类目标的分类器之间进行特征共享，但与共享特征相关的弱分类器在各类内部单独构建的方式，使得各类目标间的差异得以有效区分，提高了训练的收敛速度，同时也提高了联合分类器对各类目标间的区分性能。不硬性规定特征在所有类别中进行共享的方式减少了不必要的运算。

2、根据本发明的各个实施例，多类分类器间的特征共享减少了多类分类器的特征计算成本。

例如在本发明的第三实施例中，给定三类汽车（轿车、卡车和巴士）的样本共 17000个，分别训练三个并行的级联分类器和一个特征共享的联合分类器，训练所得分类器使用 Haar-like特征的数量如下表所示：

由上表可见本发明实施例的方法可以大大减少所使用特征的数量。设定开放汽车测试集（集内样本未参与训练，包含三类汽车样本共

2264个）和背景图像测试集（尺寸不统一，提供窗口图像约 5300000个）。并行使用三类汽车的级联分类器处理以上测试集，然后使用特征共享的联合分类器处理以上测试集，测试结果如下表所示：

检测率汽车测试集处理时间误检率背景图像处理时间 - -

由上表可见，两种方案具有类似的分类性能， ^^合分类器具有更高的检测效率。分类器所用特征的计算越复杂，联合分类器的检测效率优势就越明显。

3、根据本发明的第二和第三实施例，联合分类器既要区分（多类）目标图像与非目标图像，又要尽力体现各目标类别间的差异。由粗到精的多层次样本类别使用方式使得联合分类器优先体现目标与非目标之间的整体差异，而后考虑目标类别间的差异，进一步提高了检测的效率。

4、根据本发明的第二和第三实施例，在多类联合训练时，各类独立使用负样本集的方式便于特征共享式的分类器采用 Cascade 结构形式以获得更高的检测效率。

其他实施例

[67] 另外，还应该指出的是，上述系列处理和装置也可以通过软件和固件实现。在通过软件或固件实现的情况下，从存储介质或网络向具有专用硬件结构的计算机,例如图 9所示的通用计算机 900安装构成该软件的程序，该计算机在安装有各种程序时，能够执行各种功能等等。

[68] 在图 9中，中央处理单元 (CPU)901根据只读存储器 (ROM)902中存储的程序或从存储部分 908加载到随机存取存储器 (RAM)903的程序执行各种处理。在 RAM 903中，也根据需要存储当 CPU 901执行各种处理等等时所需的数据。

[69] CPU 901、 ROM 902和 RAM 903经由总线 904彼此连接。输入 /输出接口 905也连接到总线 904。

[70] 下述部件连接到输入 /输出接口 905: 输入部分 906, 包括键盘、鼠标等等；输出部分 907，包括显示器，比如阴极射线管 (CRT)、液晶显示器 (LCD)等等，和扬声器等等；存储部分 908, 包括硬盘等等；和通信部分 909，包括网络接口卡比如 LAN卡、调制解调器等等。通信部分 909经由网络比如因特网执行通信处理。

[71] 根据需要，驱动器 910也连接到输入 /输出接口 905。可拆卸介质 911 比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器 910上，使得从中读出的计算呈序根据需要被安装到存储部分 908中。 - -

[72] 在通过软件实现上述系列处理的情况下，从网络比如因特网或存储介质比如可拆卸介质 911安装构成软件的程序。

[73] 本领域的技术人员应当理解，这种存储介质不局限于图 9所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质 911。可拆卸介质 911的例子包含磁盘 (包含软盘 (注册商标))、光盘 (包含光盘只读存储器 (CD-ROM)和数字通用盘 (DVD))、磁光盘（包含迷你盘 (MD) (注册商标))和半导体存储器。或者，存储介质可以是 ROM 902、存储部分 908中包含的硬盘等等，其中存有程序，并且与包含它们的设备一起被分发给用户。

[74] 以上描述了本发明的优选实施方式。本领域的普通技术人员知道，本发明的保护范围不限于这里所公开的具体细节，而可以具有在本发明的精神实质范围内的各种变化和等效方案。

Claims

权利要求书

1. 一种用于对多个类别目标数据进行检测的检测装置，包括：输入单元，被配置成输入待检测数据；以及

联合分类器，其内部包含数量与所述类别数量相对应并用于分别检测对应类别的目标数据的强分类器，其中，每个所述强分类器都由一组弱分类器相加得到，每个弱分类器使用一个特征对所述待检测数据进行弱分类，

其中所述联合分类器内包含共享特征列表，所述共享特征列表中的每个特征被分别属于不同强分类器的一个或多个弱分类器共享使用；使用同一特征的分属不同强分类器的弱分类器具有彼此不同的参数值。

2.根据权利要求 1所述的检测装置，还包括：判别单元，被配置成根据所述多个强分类器的分类结果，对所述待检测数据属于哪个类别的目标数据进行判别。

3. 一种用于对多个类别目标数据进行检测的检测装置，其中，所述多个类别按相似性标准被逐级合并为预定多层结构，并且所述多个类别作为划分最细的类别设置在最底层，所述检测装置包括：

输入单元，被配置成输入待检测数据；及

级联分类器，所述级联分类器包括多个串联的级分类器，所述多个级分类器被配置成按照由粗到细的策略对所述预定多层结构中的各层类别分别进行分类处理，并且每个级分类器都包括数量与所处理类别数量相对应的强分类器，其中，每个所述强分类器包括一组弱分类器，每个弱分类器使用一个特征对所述待检测数据进行弱分类，

其中每个所述级分类器包含共享特征列表，所述共享特征列表中的每个特征被分别属于不同强分类器的一个或多个弱分类器共享使用；使用同一特征的分属不同强分类器的弱分类器具有彼此不同的参数值。

4. 根据权利要求 3所述的检测装置，其中，每个所述级分类器还被配置成：针对输入的待检测数据，计算其共享特征列表中的各有效特征的特征值；以及，针对所述级分类器中的各个强分类器，根据针对强分类器所使用的特征查询已计算所得的特征值列表从而确定所述强分类器的各个弱分类器的输出，并相加得到最终的强分类器的输出。

5. 根据权利要求 3所述的检测装置，其中，所述级联分类器被配置成：使输入的待检测数据依次被各个级分类器中的各个强分类器判别，并且在输入的待检测数据被其中一个用于检测类别 c,的强分类器判别为非目标数据的情况下，则后续的各级分类器中的用于检测类别 c,和 /或其子类的相应强分类器不再对所述输入的待检测数据继续判别。

6. 根据权利要求 5所述的检测装置，其中，所述级联分类器被配置成：针对每个所述级分类器，判断其共享特征列表中是否存在只与所述不再参与判别过程的各强分类器相关的特征，如果有则标记该特征为无效特征，不再计算其特征值。

7. 根据权利要求 3所述的检测装置，其中，所述级联分类器被配置成：如果待检测数据被任意一级级分类器中的所有强分类器拒绝，则中止分类处理；并且将所述待检测数据判别为非目标数据。

8. 根据权利要求 3所述的检测装置，其中，所述多个级分类器中的最后一级级分类器还包括判别单元，该判别单元被配置成：如果待检测数据被某个强分类器通过，则判别所述待检测数据为具有所述强分类器所对应的目标类别属性；如果待检测数据被所述最后一级级分类器的多个强分类器通过，则判别此待检测数据具有相应的多重目标类别属性。

9. 根据权利要求 3所述的检测装置，用于在输入的图像或视频中对多个类别的预定目标进行检测，其中还包括：被配置成对待检测图像或从待检测视频中截取的图像进行窗口遍历的窗口遍历部件，

所述级联分类器被配置成对所述窗口遍历部件获取的窗口图像进行分类处理，并且在判别窗口图像为目标类别的情况下，记录所述窗口在原始图像中的位置和尺寸及其具有的所有目标类别属性。

10. 根据权利要求 9所述的检测装置，其中还包括后处理部件，被配置成将所述窗口遍历部件产生的具有目标类别属性的窗口进行局部临近合并。

11. 根据权利要求 10所述的检测装置，其中所述后处理部件被进一步配置成：

针对具有相邻的窗口中心位置、相近的尺寸比例和相同的目标类别属性的窗口，计算临近的一簇目标窗口的平均中心位置、平均窗口尺寸，并将合并的窗口的数量作为合并结果的置信度；

对合并后的位置中心相邻和尺寸相近的合并结果进行目标属性合并，即如果所述图像中某个位置附近有多个具有不同目标属性的合并结果，则统计各个目标属性的置信度总和，取置信度总和最大的目标属性为最终目标属性，并取各个目标属性的置信度总和的和为最终合并结果的置信度，当所述最终合并结果的置信度大于或等于预设置信度阈值时，接受所述最终合并结果，否则舍弃所述最终合并结果。

12. 一种用于对多个类别目标数据进行检测的检测方法，包括：输入待检测数据；以及

使用包括多个强分类器的联合分类器对所述待检测数据进行分类，其中所述强分类器具有与所述类别数量相对应的数量并分别用于检测对应类别的目标数据，所述联合分类器内包含共享特征列表，所述共享特征列表中的每个特征被分别属于不同强分类器的一个或多个弱分类器共享使用；使用同一特征的分属不同强分类器的弱分类器具有彼此不同的参数值。

13.根据权利要求 12所述的检测方法，还包括：根据所述多个强分类器各自的分类结果，对所述待检测数据属于哪个类别的目标数据进行判别

14. 一种用于对多个类别目标数据进行检测的检测方法，其中，所述多个类别按相似性标准被逐级合并为预定多层结构，并且所述多个类别作为划分最细的类别设置在最底层，所述检测方法包括：

输入待检测数据；以及

使用包括多个串联的级分类器的级联分类器对所述待检测数据进行分类，其中所述多个级分类器按照由粗到细的策略对所述预定多层结构中的各层类别分别进行分类处理，并且每个级分类器都包括数量与所处理类别数量相对应的强分类器，

所述使用级联分类器进行分类的步骤包括：使输入的待检测数据依次被各个级分类器中的各个强分类器判别，其中每个所述级分类器包含共享特征列表，所述共享特征列表中的每个特征被分别属于不同强分类器的一个或多个弱分类器共享使用，使用同一特征的分属不同强分类器的弱分类器具有彼此不同的^：值。

15. 根据权利要求 14所述的检测方法，其中，所述使输入的待检测数据依次被各个级分类器中的各个强分类器判别的步骤包括：针对输入的待检测数据，计算所述级分类器的共享特征列表中的各有效特征的特征值；以及，针对所述级分类器中的各个强分类器，根据针对强分类器所使用的特征查询已计算所得的特征值列表从而确定此强分类器的各个弱分类器的输出，并相加得到最终的强分类器的输出。

16. 根据权利要求 14所述的检测方法，其中，所述使输入的待检测数据依次被各个级分类器中的各个强分类器判别的步骤包括：在输入的待检测数据被其中一个用于检测类别 c,的强分类器判别为非目标数据的情况下，则后续的各级分类器中的用于检测类别 c,和 /或其子类的相应强分类器不再对所述输入的待检测数据继续判别。

17. 根据权利要求 16所述的检测方法，其中，使输入的待检测数据依次被各个级分类器中的各个强分类器判别的步骤包括：判断所述级分类器的共享特征列表中是否存在只与所述不再参与判别过程的各强分类器相关的特征，如果有则标记该特征为无效特征，不再计算其特征值。

18. 根据权利要求 14所述的检测方法，其中，所述使用级联分类器进行分类的步骤还包括：如果待检测数据被任意一级级分类器中的所有强分类器拒绝，则中止分类处理；并且将所述待检测数据判别为非目标数据。

19. 根据权利要求 14所述的检测方法，其中，在使用最后一级级分类器进行分类处理后，还包括：

如果待检测数据被某个强分类器通过，则判别所述待检测数据为具有所述强分类器所对应的目标类别属性；如果待检测数据被所述最后一级级分类器的多个强分类器通过，则判别此待检测数据具有相应的多重目标类别属性。

20. 根据权利要求 14所述的检测方法，用于在输入的图像或视频中对多个类别的预定目标进行检测，其中还包括：对待检测图像或从待检测视频中截取的图像进行窗口遍历，

使用所述级联分类器对所述待检测数据进行分类的步骤包括：使用所述级联分类器对所述窗口遍历所获取的窗口图像进行分类处理，并且在判别窗口图像为目标类别的情况下，记录所述窗口在原始图像中的位置和尺寸及其具有的所有目标类别属性。

21. 根据权利要求 20所述的检测方法，其中还包括：将所述窗口遍历部件产生的具有目标类别属性的窗口进行局部临近合并。

22. 根据权利要求 21所述的检测方法，其中所述局部临近合并步骤包括：