CN103377370A

CN103377370A - 使用级联分类器进行复杂目标检测

Info

Publication number: CN103377370A
Application number: CN2013101373616A
Authority: CN
Inventors: D.利瓦伊; A.巴希勒尔
Original assignee: GM Global Technology Operations LLC
Current assignee: GM Global Technology Operations LLC
Priority date: 2012-04-20
Filing date: 2013-04-19
Publication date: 2013-10-30
Also published as: DE102013206920A1; US20130279808A1

Abstract

使用级联分类器进行复杂目标检测，用于识别图像中的复杂目标部分，其中，接连分类器在先前分类器的相应判别性特征组已经识别的条件下处理像素小块，且基于概率数据从查询图像选择附加像素小块。

Description

使用级联分类器进行复杂目标检测

背景技术

基于计算机的目标检测系统和方法在需要几乎实时地实现高精度的许多不同应用中使用。这种应用的示例包括主动车辆安全系统、智能监视系统和机器人。

在车辆安全领域，例如，行驶路径中的行人或目标的准确高速识别允许自动安全系统采取必要措施以避免碰撞或者允许自动系统警告驾驶员，从而允许驾驶员采用必要预防措施以避免碰撞。

发明内容

方案1. 一种用于识别查询图像中的复杂目标的方法，所述方法包括：

执行以下计算机支持步骤：

用级联分类器处理来自于查询图像的至少一个像素小块，所述级联中的每个分类器配置成识别表征复杂目标的一部分的至少一个判别性特征，其中，所述级联中的每个接连分类器识别的判别性特征的数量大于所述级联中的先前分类器识别的判别性特征的数量；以及

在所述级联中的最后分类器识别复杂目标的该部分之后，从查询图像选择附加像素小块来处理，所述选择基于概率数据。

方案2. 根据方案1所述的方法，其中，附加像素小块包括考虑所述级联中的最后分类器识别复杂目标的该部分的像素小块具有形成复杂目标的附加部分的最大条件概率的像素。

方案3. 根据方案1所述的方法，还包括：组合查询图像中识别的复杂目标的各部分，以识别整个复杂目标。

方案4. 根据方案1所述的方法，还包括：识别样本复杂图像的一部分的至少一个判别性特征，所述判别性特征表征复杂目标的该部分。

方案5. 根据方案1所述的方法，还包括：随机地选择附加像素小块。

方案6. 根据方案1所述的方法，还包括：当选择未来像素小块时，指定要废弃的搜索像素小块，所述搜索像素小块确定为没有表征复杂目标的一部分的判别性特征。

方案7. 一种用于识别查询图像中的复杂目标的系统，所述系统包括：

处理器，所述处理器配置成：

用级联分类器处理来自于查询图像的至少一个像素小块，所述级联中的每个分类器配置成识别表征复杂目标的一部分的至少一个判别性特征，其中，所述级联中的每个接连分类器使用的判别性特征的数量大于所述级联中的先前分类器使用的判别性特征的数量；以及

方案8. 根据方案7所述的系统，其中，附加像素小块包括考虑所述级联中的最后分类器识别复杂目标的该部分的像素小块具有形成复杂目标的附加部分的最大条件概率的像素。

方案9. 根据方案7所述的系统，还包括：组合查询图像中识别的复杂目标的各部分，以识别整个复杂目标。

方案10. 根据方案7所述的系统，其中，所述处理器还配置成识别样本复杂图像的一部分的判别性特征，所述判别性特征表征复杂目标的该部分。

方案11. 根据方案7所述的系统，其中，所述处理器还配置成随机地选择附加像素小块。

方案12. 根据方案7所述的系统，其中，所述处理器还配置成当选择未来像素小块时，指定要废弃的搜索像素小块，所述搜索像素小块被发现没有表征复杂目标的一部分的特征的判别性特征。

方案13. 一种存储有指令的非临时计算机可读介质，用于识别查询图像中的复杂目标，在由处理器执行时，使得处理器执行如下指令：

用级联分类器处理来自于查询图像的至少一个像素小块，所述级联中的每个分类器配置成识别表征复杂目标的一部分的像素小块中的至少一个判别性特征，其中，所述级联中的每个接连分类器使用的判别性特征的数量大于所述级联中的先前分类器使用的判别性特征的数量；以及

方案14. 根据方案13所述的非临时计算机可读介质，其中，附加像素小块包括考虑所述级联中的最后分类器识别复杂目标的该部分的像素小块具有形成复杂目标的附加部分的最大条件概率的像素。

方案15. 根据方案13所述的非临时计算机可读介质，其中，程序代码还配置成组合查询图像中识别的复杂目标的各部分，以识别整个复杂目标。

方案16. 根据方案13所述的非临时计算机可读介质，其中，程序代码还配置成使得处理器识别样本复杂图像的一部分的判别性特征，所述判别性特征表征复杂目标的该部分。

方案17. 根据方案13所述的非临时计算机可读介质，其中，程序代码还配置成使得处理器当选择未来像素小块时，指定要废弃的搜索像素小块，所述搜索像素小块被发现没有表征复杂目标的一部分的特征的判别性特征。

附图说明

在说明书的结束部分特别指出并且明确地要求保护被作为本发明的主题内容。然而，本发明在其部件、特征、操作方法和优势方面，通过参考下述详细说明和附图能够被最佳地理解，在附图中：

图1是根据本发明实施例的使用级联分类器进行复杂目标检测的系统的示意性框图；

图2是具有要识别的复杂目标的询问图像；

图3是样本复杂目标，其各部分被指定用于学习，以供级联分类器的分类器使用。

图4是根据本发明实施例的特征的图形表示，从所述特征获得判别性特征，以在识别与复杂目标的一部分有关的特征时由级联分类器的三个分类器中的每个使用；

图5示出了根据本发明实施例的三分类器级联分类器，其中，每个分类器识别相应学习判别性特征组，其表征与图2所示复杂目标有关的部分的区别特征；

图6示出了根据本发明实施例的图5的级联分类器用于多个位置的三个目标部分的过程配置，其中，每个接连分类器在先前分类器成功识别其相应判别性特征的条件下处理像素小块；

图7是图示了根据本发明实施例的基于关于所识别部分的学习位置关系来识别可能包含附加复杂目标部分的附加像素小块的方法的流程图；

图8是图示了根据本发明实施例的基于关于所识别部分的计算概率来识别可能包含附加复杂目标部分的附加像素小块的方法的流程图；

图9示出了根据本发明实施例的图2的查询图像（query image，或例子图像），其中，包围像素小块的多个搜索窗口在成功识别复杂目标部分之前的各个位置和在成功识别所述部分之后的第一优选位置扩展；

图10示出了根据本发明实施例的图9的查询图像，其中，包围像素小块的多个搜索窗口在成功识别部分之前的各个位置和在成功识别部分之后的第二优选位置扩展；

图11示出了根据本发明实施例的图2的查询图像，其中，搜索窗口包围从识别相关特征的未来尝试中废弃的像素小块，且搜索窗口在复杂目标部分搜索中基于成功识别两个目标部分在优选位置扩展；

图12示出了根据本发明实施例的图2的查询图像，复杂目标部分遮挡，其中，包围可能包含另一目标部分的像素小块的搜索窗口基于先前识别部分；

图13示出了根据本发明实施例的图2的查询图像，复杂目标处于缩小尺度，其中，包围可能包含另一目标部分的像素小块的搜索窗口基于先前识别部分；和

图14示出了根据本发明实施例的非临时性计算机可读介质，其上存储有指令，用于使用级联分类器识别查询图像中的复杂目标。

将理解的是，为了图示的简要和清楚，附图中示出的元件不一定是按比例绘制的，在不同附图中可能重复使用附图标记以指示相同的、对应的或类似的元件。

具体实施方式

在以下详细说明中，阐述各个细节，以便提供对本发明的透彻理解。然而，本领域技术人员将理解的是，本发明能够在不具有这些具体细节的情况下被实践。此外，公知的方法、过程和部件没有详细描述，从而使得本发明易懂。

应当理解的是，以下术语将在该文件中使用。

“复杂目标”指的是在图像中存在且由于与目标有关的各种复杂性需要多个模板来描述或识别的目标。这些复杂性可包括彼此具有可变人体测量关系的目标部分、具体类别内的大尺寸变化、部分遮挡和多个视图。典型示例尤其包括人、动物和车辆。为了该文件的目的而不影响通用性，人将突出为复杂目标的示例。

“分类器”指的是配置成基于表征与复杂目标有关的部分的判别性特征来识别图像目标部分的功能（例如，计算机可执行功能）。判别性特征通常可以被处理以产生例如输出值，所述输出值与从模型图像类似地获取的阈值进行比较，以确定“匹配性”。这种匹配可例如基于图像参数，例如像素强度、几何元素（geometrical primitives）和/或其它图像参数。

“级联分类器”指的是多个接连分类器。

“像素小块”指的是像素区域。

“判别性特征”指的是诸如强度梯度、平均强度、像素颜色且表征图像内容的特征的图像像素参数。

“人体测量关系”指的是人的身体部分的相对大小、位置和取向。

“协同搜索”（collaborative search）指的是基于至少一个复杂目标部分的先前成功识别或分类来选择查询图像中的像素小块。

根据本发明的实施例，一种使用级联分类器来进行复杂目标检测的方法可包括：识别查询图像中的像素小块以及使用级联分类器处理所述像素小块以搜索已学习判别性特征。如上所述，级联分类器可以具有接连分类器，其中，每个分类器可配置成识别其相应判别性特征组。级联中的每个接连分类器搜索同一目标部分的更大数量的判别性特征且配置成仅仅在先前采用的分类器已经成功识别其相应判别性特征之后才识别其相应判别性特征组。如果这没有实现，每个接连级分类器不处理像素小块且该特定小块被废弃且表示为缺乏所需判别性特征的区域。然后可以随机或半随机地从查询图像选择另一个像素小块。在其它实施例中，相邻小块或任何其它小块可以选择为下一小块来处理。当先前分类器确实识别其相应判别性特征组时，接连分类器处理该像素组，直到识别目标部分。在发现之后，目标部分位置与模型目标图像的目标部分之间的已学习空间关系一起用作扩展查询图像内可能包含附加目标部分的附加像素小块的基础。其它实施例采用数据映射，其中，概率函数的幅角最大值用于选择具有含目标部分的最大概率的附加像素组。

根据本发明的实施例，每个部分的减少数量的分类操作和减少数量的搜索位置提供的总计算节省允许复杂目标的几乎实时高度准确识别。因此，根据本发明的方法和系统在需要准确和快速复杂目标识别的宽范围各种实际应用中具有应用，如主动车辆安全系统、智能监视系统和机器人。

现在参考附图，图1是根据本发明实施例的使用级联分类器进行复杂目标检测的系统的示意图。复杂目标检测系统100可包括一个或多个计算机视觉传感器10（例如，照相机、摄像机、数字照相机或其它图像收集装置）。计算机视觉传感器10可以捕获可包括一个或多个目标和/或特征的图像。图像还可以以其他方式输入系统100，例如，从其它计算机、数据库或系统下载。目标检测系统100可包括一个或多个处理器或控制器20、存储器30、长期非临时存储装置40、输入装置50和输出装置60。输入装置50的非限制性示例可以是例如触摸屏、电容式输入装置、键盘、麦克风、指针装置、按钮、开关或其它装置。输出装置的非限制性示例包括显示屏、音频装置（例如，扬声器或耳机）。输入装置50和输出装置60可以组合成单个装置。

处理器或控制器20可以是例如中央处理单元（CPU）、芯片或任何合适的计算装置。处理器或控制器20可包括多个处理器，并且可包括通用处理器和/或专用处理器，例如图形处理芯片。处理器20可执行例如存储在存储器30或长期存储装置40中的代码或指令，从而执行本发明的实施例。

存储器30可以是随机存取存储器（RAM）、只读存储器（ROM）、动态RAM（DRAM）、同步DRAM（SD-RAM）、双倍数据速率（DDR）存储器芯片、闪存、易失性存储器、非易失性存储器、高速缓冲存储器、缓存、短期存储器单元、长期存储器单元、或其它合适的存储器单元或存储单元。存储器30可以是或可包括多个存储器单元。

长期非临时存储装置40可以是或可包括例如硬盘驱动器、软盘驱动器、光盘（CD）驱动器、CD-可记录（CD-R）驱动器、通用串行总线（USB）装置或其它合适的可移除和/或固定存储单元，且可包括多个这种单元或这种单元的组合。应当理解的是，图像数据、代码和其它相关数据结构存储在上述存储器和/或存储装置中。

图2是具有通过识别各个部分被分类的人的复杂目标220的询问图像210：头部240、背部250和脚部260。应当理解的是，为了该文件目的，人将用作复杂目标的非限制性示例。

图3示出了复杂目标模型330的图像，从其可以提取每个部分的判别性特征组和部分之间的人体测量关系。模型复杂目标330分成含有目标部分的像素小块或图像区域。在图3的非限制性示例中，复杂目标是人330，其中，已经识别三个独立部分：头部340、背部350和脚部360。应当理解的是，宽范围的各种复杂目标是可以用于学习级分类器的合适模型。这种模型包括生物和非生物目标、具有大数量部分的目标、具有彼此几何关系变化的部分的目标、部分遮挡的目标、从上述各个角度或距离看的所有目标。

图4图示了从图像样本（未示出）的前视图获取的特征的三个图形表示405、410和415。根据本发明的实施例，这些特征用于学习级联的接连分类器。特征选择算法可以应用于图像样本，以获得可以进一步处理以识别最表征与样本有关的特征的判别性特征的图形表示405、410和415。例如，特征选择算法可以产生仅仅基于与第一分类器一起使用的两个像素区域406和407的理想判别性特征、还基于与第二分类器一起使用的像素区域411-413的理想判别性特征、以及与第三分类器一起使用的七个附加像素区域（总的表示为414）。由此，三个分类器级联中的每个分类器被允许用增加的精度和清楚性识别与复杂目标有关的目标部分的区别特征。

应当注意的是，存在可以用于提取识别判别性特征的最有效特征的许多像素或图像参数，若干示例包括梯度直方图（HoGs）、积分通道特征（integral channel features）和Haar特征。此外，应当理解的是，在图4的示例中，从样本图像识别正面特征；然而，根据要识别的目标部分的具体视图，特征可以从样本图像的侧视图提取。

图5示出了根据本发明实施例的三分类器级联，其配置成逐级地使用已学习判别性特征以识别复杂目标部分240。

如上所述，每个接连分类器搜索目标部分240以识别其相应判别性特征组。在该非限制性示例中，第一级分类器505检查候选目标部分240从图形表示405获取的判别性特征。如果没有发现，那么所识别像素小块被废弃且系统100扩展查询图像210中的附加搜索区域或者将第一级分类器505应用于队列中的复杂目标部分的附加像素小块。如果第一分类器505识别该第一判别性特征组，那么第二分类器510搜索从图形表示410获取的第二判别性特征组。如果分类器510没有识别它们，那么该像素小块目标也被废弃，如上所述。如果实现匹配，那么第三分类器515应用且试图识别从图形表示415获取的判别性特征。如果未识别匹配，那么所搜索像素小块部分被废弃，而如果识别匹配，那么目标部分240被认为由级联分类器520识别。应当注意的是，在本发明的实施例中，可以考虑包括采用任何数量的判别性特征的任何数量分类器的任何级联分类器。

应当注意的是，在废弃后，发现没有判别性特征的像素小块指定为与该特定目标部分有关的不可见区域，以避免在废弃部分的相同区域中进行不必要搜索。应当注意的是，本发明包括像素小块参考特定部分废弃且可以实际上搜索附加目标部分的实施例。

图6示出了根据本发明实施例的处理五个不同位置I-V的像素小块的分类器的示例，其中，三个分类器1-3的五个独立级联均用于识别三个复杂目标部分1-3。如图所示，分类器1a确定来自于位置I和III的内容缺乏期望特征，从而其余分类器1b和1c不再对来自于这些位置的内容进行进一步处理。分类器2b继续处理来自于其余位置II、IV和V的内容。分类器2b确定来自于位置V的内容也缺乏期望特征，从而分类器1c仅仅继续处理来自于位置II和IV的内容。分类器1c确定来自于位置IV的内容也缺乏期望特征，且处理来自于位置II的内容的分类器1识别期望特征，从而部分1被认为位于位置II。

复杂目标部分2的搜索可以在多个（例如，五个）不同位置继续，其中，来自于位置VI-X的相应像素小块由三个分类器2a-2c的另一级联处理。来自于位置VII和VIII的内容由分类器2a废弃，从而分类器2b继续处理来自于其余位置VI、VIII和X的内容。分类器2b废弃来自于位置VIII的内容，从而分类器2c继续处理从位置VI和X获取的内容。分类器2c废弃从位置VI获取的内容，同时分类器2a识别从位置X获取的内容中的相关特征。由于所有三个分类器2a-2c均识别从位置X获取的内容中的相关特征，因而认为识别部分2。

三个分类器3a-3c的五个级联均继续搜索部分3的从位置VI-X获取的内容。分类器3a废弃从位置XIIII获取的内容，从而继续处理从其余位置XI-XIII和XV获取的像素小块。分类器3b废弃从位置VIII获取的内容，且分类器3c继续处理从其余位置XI-XII和XV获取的内容，且然后废弃从位置XII和XV获取的内容。剩余分类器3c识别从位置XI获取的内容中的相关特征。同样，由于所有三个分类器3a-3c均识别从该位置获取的内容中的相关特征，因而认为在位置XI处识别部分3。

图7是图示上述方法的流程图，带有在目标部分分类之后扩展其余目标部分的附加搜索区域或像素小块。

具体地，在步骤710，根据本发明的实施例，可以根据本发明实施例例如随机地从查询图像210选择第一像素小块。

在步骤715，接连分类器可以在级联的所有先前分类器已经识别其相应判别性特征组的条件下应用于每个部分。在步骤720，如果已经识别所有分类器的所有相应判别性特征组，那么目标部分被认为已经分类或识别，如上所述。然而，如果不是所有相应判别性特征组都被识别，那么该像素小块在步骤721中指定为“废弃”且在步骤710中随机地或者半随机地从查询图像210选择新像素小块。同样，接连分类器处理新选择的像素小块，如步骤715所示。当所有分类器已经成功地识别其相应判别性特征时，那么目标部分已经分类，如步骤725所示，且基于先前识别目标部分（如果有一个）和要识别部分之间的已学习空间关系从查询图像选择附加像素小块，如步骤730所示。在选择可能含有附加目标部分的新像素小块之后，过程通过应用与附加部分有关的接连分类器而重复，如步骤715所示。

图8所示的方法与图7所示的方法类似，具有选择可能含有附加目标部分的附加像素小块的替代方式，其中，采用概率映射，如步骤830所示。

具体地，在0和1之间范围内的概率值响应于处理特定像素小块的每个分类器的输出值分配给每个像素。在识别目标部分之后，概率映射相应地更新，且选择的像素小块通过计算下一目标部分的概率函数的最大幅角（Argmax）或者等价地：

ArgmaxP_n+1Prob(P_n+1|P’_n+1, P₁,….,P_n)，其中：

P_n是检测部分n=1..N的概率映射；

P_n+1是先前概率映射。

概率值小于预定值的区域通过将概率值设定为0而被废弃。

图9和10是图2的查询图像210，带有表示搜索目标部分的区域的叠加搜索窗口。在各个实施例中，根据本发明的实施例，使用级联分类器进行复杂目标检测的系统可配置成扩展包围与已学习目标部分的区域基本上相对应的区域的搜索窗口。通过非限制性示例，搜索窗口970和975分别包围与含有图3的学习头部340和学习背部350的区域相对应的区域。此外，搜索窗口970和975可在多个位置（其中，新搜索区域的一部分与先前搜索区域的一部分重叠，如图所示）或者以对于选择的第一像素小块或者由于缺乏相关判别性特征而被废弃的两个替换小块完全随机的方法扩展。

当识别目标部分时，其用作扩展最可能含有请求目标部分的附加搜索区域的基础，如上所述。一些实施例将已学习人体测量关系应用于所识别部分以将随后搜索区域引导到最可能含有附加部分的像素区域，如上所述。其它实施例使用识别部分的位置作为在确定所有部分的概率函数的“maxarg”时的先验数据，如上所述。窗口980表示头部240（图2）已经定位，因而搜索窗口990和1090（图10）在最可能包含背部250的区域中扩展，因为这些区域表示图3的模型图像330中这些部分的人体测量关系。由于目标220的两侧都满足已学习人体测量关系，因而两个搜索窗口990和1090区域都识别为要搜索的合适像素小块。

在本发明的一些实施例中，在采用概率映射时，窗口990和1090中包围的两个区域可以确定为鉴于更新概率数据具有包含背部250的高概率。应当理解的是，任何多个搜索都包括在本发明范围内。

图11图示了像素小块基于多个目标部分的成功识别或分类扩展的实施例。例如，头部240和脚部260（图3）两者分别在搜索窗口1110和1120中识别。搜索窗口1190基于来自于图3所示的模型图像330的这些部分中的每个之间的已学习人体测量关系或更新概率数据扩展。应当理解的是，附加搜索区域基于任何数量的先前识别目标部分扩展的实施例包括在本发明范围内。

在本发明的一些实施例中，通过减少搜索重复而进一步优化计算效率。窗口1100是表示在级联分类器中任一个确定小块没有判别性特征之后废弃像素小块或区域的窗口。

图12和图13图示了根据本发明实施例的分别用于部分遮挡或尺度缩减的复杂目标的上述级联分类器辅助搜索的应用。具体地，头部240在窗口1210中识别，且窗口1220基于图3的头部340和脚部360之间的已学习人体测量关系或者基于关于识别头部240的概率数据作为脚部260的可能位置扩展，如上所述。

图14图示了根据本发明实施例的非限制性计算机可读介质，包含配置计算机系统以执行图像内的复杂目标的上述级联分类器辅助搜索的可执行代码。

本发明的实施例通过组合在各个像素小块中识别的目标部分而识别整个目标。

应当理解的是，根据特定实施例，搜索区域可以基于任何数量的成功识别目标部分扩展。还应当理解的是，搜索例如圆形、三角形和多边形搜索窗口在本发明的范围内。

虽然在本文图示和描述了本发明的某些特征，但是本领域普通技术人员此时将想到许多修改、替换、改变和等同方式。因此，应该理解，所附权利要求旨在覆盖落入本发明真实精神内的所有这种修改和改变。

Claims

1.一种用于识别查询图像中的复杂目标的方法，所述方法包括：

执行以下计算机支持步骤：

2.根据权利要求1所述的方法，其中，附加像素小块包括考虑所述级联中的最后分类器识别复杂目标的该部分的像素小块具有形成复杂目标的附加部分的最大条件概率的像素。

3.根据权利要求1所述的方法，还包括：组合查询图像中识别的复杂目标的各部分，以识别整个复杂目标。

4.根据权利要求1所述的方法，还包括：识别样本复杂图像的一部分的至少一个判别性特征，所述判别性特征表征复杂目标的该部分。

5.根据权利要求1所述的方法，还包括：随机地选择附加像素小块。

6.根据权利要求1所述的方法，还包括：当选择未来像素小块时，指定要废弃的搜索像素小块，所述搜索像素小块确定为没有表征复杂目标的一部分的判别性特征。

7.一种用于识别查询图像中的复杂目标的系统，所述系统包括：

处理器，所述处理器配置成：

8.根据权利要求7所述的系统，其中，附加像素小块包括考虑所述级联中的最后分类器识别复杂目标的该部分的像素小块具有形成复杂目标的附加部分的最大条件概率的像素。

9.根据权利要求7所述的系统，还包括：组合查询图像中识别的复杂目标的各部分，以识别整个复杂目标。

10.一种存储有指令的非临时计算机可读介质，用于识别查询图像中的复杂目标，在由处理器执行时，使得处理器执行如下指令：