CN104424480B

CN104424480B - 面部识别

Info

Publication number: CN104424480B
Application number: CN201410425757.5A
Authority: CN
Inventors: A·M·斯里帕达劳; B·珀依尔
Original assignee: Analog Devices Technology
Current assignee: Analog Devices Global ULC; Analog Devices International ULC
Priority date: 2013-08-29
Filing date: 2014-08-26
Publication date: 2019-01-18
Anticipated expiration: 2034-08-26
Also published as: CN104424480A; US9177383B2; US20150063708A1; DE102014111748A1

Abstract

本发明涉及面部识别。一方面，本发明公开了一种数字信号处理器和方法，应用它们在精简数目的时钟周期内进行对象检测，包括面部检测。该方法包括使用索贝尔边缘检测来识别多边缘区域并且将这些区域分类为前景候选区域。前景候选区域进一步被检查垂直或水平对称，对称的窗口被分类为面部候选。只有对那些被确定为面部候选窗口进行维奥拉‑琼斯(Viola‑Jones)面部检测。

Description

面部识别

技术领域

本发明涉及图像处理领域，更具体地，涉及一种基于边缘的对象检测系统和方法。

背景技术

2001年由保罗·维奥拉(Paul Viola)和迈克尔·琼斯(Michael Jones)提出的对象检测框架在本领域被熟知。维奥拉-琼斯(Viola-Jones)运算通过计算图像矩形区域像素的总和。Viola-Jones框架在查找图像的水平和垂直特性方面(如边缘)比较精确，在分辨率方面则比较粗糙。

附图说明

查看附图时结合下列详细说明有助于理解本发明。需要强调的是按照行业标准做法，附图中各种特征的绘制仅用于说明。事实上，为了清晰地论述问题，各种特征的一些大小可能被增加或缩减。

图1是灰阶数字图片的图像显示。

图2是使用索贝尔算子计算出图1的边缘检测图像。

图2A是从图2的边缘图像中选择的面部放大图。

图3是依据本说明书的示例硬件平台方框图。

图4是依照本说明书的示例方法的流程图。

图5是使用Viola-Jones检测方法的示例图形特性方框图。

发明内容

一方面，公开了一种对象检测方法，使用数字信号处理器在时钟周期消耗降低的情况下去识别数字图像前景区域内感兴趣的对象，该方法包括将数字图像分割成多个窗口；对每个窗口进行边缘检测；将每个窗口分类为前景候选或背景候选，其中分类包括计算该窗口中的边缘数，仅当窗口的边缘数目大于阈值时将该窗口分类为前景候选，仅在分类为前景候选的那些窗口才进行附加的对象检测。

另一方面，公开了一种存储着数字信号处理器的软件指令集的有形的计算机可读存储介质，该指令集适用于在时钟周期消耗降低的情况下识别数字图像前景区域内感兴趣的对象，该指令集被配置以指导处理器将数字图像分割成多个窗口；对每个窗口进行边缘检测；将每个窗口分类为前景候选或背景候选，其中分类包括计算该窗口中的边缘数，仅当窗口的边缘数目大于阈值时将该窗口划定为前景候选，仅在分类为前景候选的那些窗口进行附加的对象检测。

一种数字信号处理系统被配置以在时钟周期消耗降低的情况下识别数字图像前景区域内感兴趣的对象，该系统包括处理器；和与处理器耦合通信的存储指令集的存储器，当执行时，指令处理器将数字图像分割成多个窗口；对每个窗口进行边缘检测；将每个窗口分类为前景候选或背景候选，其中分类包括计算该窗口中边缘数，仅当窗口边缘数目大于阈值时将窗口分类为前景候选；仅在分类为前景候选的那些窗口进行附加的对象检测。

具体实施方式

下面提供许多不同的实施方案或示例用于实现本发明的不同功能。描述元件和组合的特定示例用以简要地说明本发明。当然，这些仅仅是示例，并不旨在进行限制。进一步地，本发明会在各种示例中重复一些相关的数字和字母或字母。这种重复不是为了决定所讨论的各种实施方案和/或配置之间的关系而是为了简化和明晰其关系。

不同的实施方案中有不同的优势，并没有独特的优势是实施方案所必须的。

示例方法采用灰度位图图像为例。一幅灰度图像可以被表示为一个大型的整型二维数组，其中每个像素被定义了一个介于0(纯黑色，或完全没有亮度)到1(纯白色，所有亮度的总和)范围内的亮度值。亮度值在理论上是一个精确的分数值，然而在实践中分辨率被位深所限制，使用整数值来代表分数值(以16位为例，使用整数I代表十进制数值n，其中因为使用简单的整数来表示亮度，处理器可以使用相对快速的整数指令进行处理。

灰度图像的边缘可能由能计算出的每个像素的梯度向量的索贝尔算子识别出来。单点的衍生物不能被计算，但如果假定灰度图像代表连续亮度函数的一组采样点，那么所述衍生物可以作为亮度采样点的函数被分段计算。索贝尔算子通过围绕每个像素的区域进行取样提供出一个梯度，例如3×3或5×5像素，在计算的基础上取得该点的近似梯度。

索贝尔算子是一种离散微分算子，其结果是使用图像中每个计算出的点的梯度向量来表示。常用的索贝尔算子使用两个3×3的内核，使用该内核与数字图像的某个区域进行卷积运算。卷积产生两个向量，表示水平梯度的幅值和方向，以及垂直梯度的幅值和方向。特别需要指出的是水平梯度被定义为垂直梯度被定义为其中A是源图像，*是二维卷积运算符。该复合梯度幅值的计算公式为梯度方向的计算公式为θ＝atan2(G_y，G_x)。梯度幅值可能超越一个阈值块。梯度幅值大于阈值的像素被标记为边缘像素，其他被标记为非边缘像素。

对象检测是一种可用于在数字图像中定位感兴趣对象的图像处理技术。具体而言，灰度图像能够有效地表征感兴趣的对象，如人、车、脸、动物或其他物体。“感兴趣的对象”是指在本说明描述的系统中能在数字图像中被识别、定位、分类或者检测到的任何对象。这可能是有用的，举例来说，在视频安全境况下，照相机可以提供一个视频流。系统的效用可能通过提供一种处理系统被增强，比如数字信号处理器系统，它能够实时地或接近实时地解析每个帧，并且识别感兴趣的对象，如面部。面部识别之后，该系统可以传递识别出的面部到后处理系统中进一步地执行面部识别，因此既可以识别人是否存在也可以在该帧内识别该人的身份。例如，设计可以分析视频流并识别人的存在的系统，该系统检测出人的存在发出报警，而检测出动物存在时并不提供报警。

一般来说，分析图像所花费的处理资源与识别图像的需求强度是成正比的。在数字图像的每部分上花费大量的处理资源并不总是可行的，特别是处理实时问题。因此，提供可靠地消除数字图像的某些部分的预过滤步骤是很有用的。例如，预过滤步骤可以将数字图像分割成不同大小的N个窗口，在本说明书中“窗口”表示的数字图像的任何部分，直至并包括被选择用于分析的整个图像。虽然本说明书中的示例都是以矩形窗口的方式来举例，而某些应用中其他形状的窗口是有用的，并不旨在本说明书中限定为矩形窗口。N个窗口中的，M个窗口被可靠地分类成不包含感兴趣对象。因此，DSP只需以高可靠性和更密集型处理器技术来检查N-M窗口。一些预过滤技术的有用的特性是漏报的近零率，但误报的容忍度相对较高。换句话说，预过滤技术可以被配置为几乎从未错误过滤掉包含感兴趣对象的窗口，但是它仅仅可以过虑掉60-80％没有包含感兴趣对象的窗口。

对象检测系统的精确度部分取决于由边缘检测操作所产生的边缘的质量。本说明书将通过举例的方式公开“边缘检测”的索贝尔算子，尽管用于识别数字图像中的边缘或类似边缘功能的许多技术已经被本领域的技术人员所熟知，本说明书所用的边缘检测将广泛地涵盖任何技术、方法、算法以及用于识别数字图像中边缘的离散特性的方法。反过来边缘检测的质量依赖于梯度幅值阈值(nSobelThresh)的选择。较低的梯度幅值将导致检测到更多的边缘。在不同的实施方案中阈值的最佳值取决于多种因素，包括环境照明、背景和当前对象的数目。因此，每个实施方案不存在单一的最佳阈值，但本领域有一些熟知的自适应选择阈值的算法，比如“Otsu’s阈值”。这些算法因为计算量太大没有被使用在本说明书的某些实施方案中。

相对于一般的自动对象检测，在具体的实施方案的叙述和附图中本说明书将更容易被理解，特别是涉及到的面部检测。本说明书中的实施方案在分辨率为640×480接近3帧每秒(FPS)的全视频图形阵列(VGA)中进行实时或近实时的面部检测。这意味着如果视频源是30FPS的VGA视频流，大约每十帧中一帧进行对象检测分析，每秒要执行500百万指令(MIPS)。在示例中，检测可以被装载在一个BF609EZ测试板的型号为Blackfin BF609的双核数字信号处理器(DSP)上执行，这两个设备都来自模拟设备公司。BF609包括管道视频处理器(PVP)，该处理器是靠近DSP内核的一组功能硬件模块，用来执行对基础图像的预处理，比如对图像计算索贝尔算子。

上述速度对于某些应用是合适的，例如安全应用，1/3秒的时间分辨率是可以接受的。其他应用程序可能需要更高的时间或视频分辨率(如高清或全30FPS的分辨率)。在这种情况下，附加的处理器内核是必要的。还值得注意的是，在某些情况下图像的背景区域很简单，高分辨率的处理可能在相同的硬件设备上运行。

在示例性实施方案中，图像被划分成24×24像素大小的窗口，每个窗口总共有162,336种可能的特性。对于640×480像素的VGA分辨率的图像，总共有280,896个这样的窗口，共需8770万次特性的计算。在每秒30帧的情况下，将产生每秒实时需要处理约26亿次特征的理论最大值，对于一些嵌入式处理器来说这是不切实际的，因为每个特征计算需要多个时钟周期。另外，前述的仅仅是许多可能的层级中的一个，而在实践中每一帧可能同时处理几个层级。

根据示例的实施方案，Viola-Jones方法提供了高可靠性的对象检测，并只在通过预筛分过程的某些窗口中运行。在示例方法中，灰度图像被分成多个区域，每个区域包括多个矩形。图5是被Viola-Jones框架集所使用特性集合的表示图。通常情况下，一个特性的值被计算为绝对差总和(SAD)，该总和是指阴影区域像素总和与非阴影区域内像素总和的差值。特性510是双矩形特性，对应区域512和514，特性510的值是|∑514-∑512|。类似地，特性520是区域522和524的双矩形特性，特性520的值是|∑524-∑522|。特性530是区域532、534和536的三矩形的特性，特性530的值是|∑534-(∑532+∑536)|。特性540是542、544、546和548的四矩形区域的特性，特性540的值是|(∑544+∑548)-(∑542+∑546)|。

虽然这些SAD能被快速地单独计算，但当SAD的数量过大SAD的单独计算会被阻止。例如，在640×480的VGA图像中，理论上一个窗口可以有介于1×1像素和640×480像素任何矩形大小选择。图像中窗口的数目在307,200个窗口(1×1像素)和1个窗口(640×480像素)之间变动。值得注意的是，在许多应用中这些极端的例子并不能提供用于特征检测的有用窗口。上述是极端的例子。

在一些示例的硬件体系结构中，在完整的数字图像上运行Viola-Jones框架集，实时地在多层级运行每一个可能的窗口是具有挑战性的。缩减计算需求的方法是选择将感兴趣的对象按照期望定位的合适标度，通过值移位窗口。作为基线，有X分量和Y分量，都可被选择为一个像素，但这可能会导致产生过于大量的窗口。因此作为替代，可以根据窗口大小被选定，在该窗口中感兴趣的对象不会在下一个窗口中被找到。例如，640×480像素的图像，面部的预期的范围是24×24和100×100像素之间。在这种情况下，检测器可以在414992不同的窗口中运行。在窗口中运行的检测器在每一棵树发现特性，在每一个串级执行阈值。负载可以被缩减，如果窗口被视为背景窗口每次以width_window/2而不是以一个像素移动每一个窗口。例如，在24×24像素区域，背景窗口的值可以被选择为12个像素，前景窗口的值可以保持在1。

还拥有一个Y分量，在示例中，是基于在特定的行被传递到检测阶段的窗口总数而选择的。如果该行没有前景窗口，的值可能被选为height_window/2。

本发明的方法使用基于索贝尔算子的边缘信息以消除对于感兴趣对象来说比较差候选窗口。边缘可以提供基本模式的有用近似值。本说明书所公开的方法使用边缘信息在选择窗口去接受Viola-Jones分析之前就已经丢弃了许多(有时甚至是大多数)窗口。在示例中，索贝尔算子提供一个梯度矢量，通过专用的硬件诸如管道视频预处理器(PVP)或者通过某些模拟设备公司提供的数字信号处理器(DSP)计算图像中的每个像素。计算出边缘输出的积分总和。

在示例中，分析例如图1中的数字图像100的感兴趣对象，如图像中的面部。数字图像100包括一个前景区域110和背景区域120。一般前景候选窗口包含比背景候选窗口更多的边缘，该分类过滤出有稀疏边缘的背景区域。注意，并不是所有前景的候选窗口都属于前景区域110，也不是所有的背景候选窗口都属于背景区域120。在这个示例中，该方法使用边缘图像的积分总和来查找特定窗口的总像素数。根据图1中的数字图像100，图2A是提供检测后的图像200的边缘图形化表示图。特别是，图2A是窗口210的面部放大图，展示了具有相对大量边缘信息的面部窗口210。这种技术可以减少计算超过一个窗口的边缘像素总和的周期，以得出总计算时间的最小开销。

这种分类并不能也没有被设计成能保证所有的非面部区域被过滤掉。某些复杂的背景特征可能包含许多的边缘，它们不会在该过滤阶段被去除掉。值得注意的是，一些现有技术的方法并不进行同样复杂的前景/背景分类。这种分类会比较粗糙，比起漏报更宽容误报(相对于前景分类)。通常情况下，整个说明书中的术语“分级”或“分类”包括将一个或多个离散项目分成多个可能的分组、名称、命令或类别。整个说明书中的术语“子分级”或“子分类”包括将一个或多个离散项目分成多个可能的从属分组、名称、命令或类别。在该例子中，重点是从Viola-Jones框架中去掉大量的窗口。误报唯一的负面代价是要处理额外的窗口，从而降低处理器的效率。在示例中，在该步骤去除60-80％背景窗口是可以接受的(20-40％的误报率)。

另一层过滤在垂直对称的高度检查剩余的窗口。经过Viola-Jones密集型处理器的分析，只全部传输那些在定义的阈值范围内垂直对称的窗口。该窗口可以被分割成两个垂直的子窗口，并且在每个子窗口的边缘总数和一个阈值进行比较。在每个子窗口中具有足够边缘的窗口被划分为面部(或感兴趣的对象)候选(指定进行额外的处理)，而在每个子窗口中没有足够边缘的窗口将从下一步的处理中被去除掉。在另一个示例实施方案中，窗口在垂直和水平方向上同时被分割，四个子窗口对应着某一阈值都被检测是否具有足够的边缘数。

在示例中，分析了窗口的多模块局部二元模式(MB-LBP)的特点。在该案例中，对于Viola-Jones方法的级联等级的每个树，系统将访问整个图像的16个存储单元，并执行8次比较。这些内容会随机放置在系统内存中。由于缓冲区需求较大，一个嵌入式处理器的L1或者高速缓存无法有效地存储这些内容，因此这种随机访问可能会导致昂贵的高速缓存损失，严重影响进程效率。

实际上访问整个图像200的边缘并不是随机的，DMA可用于带来能分类到快速内部存储器中的所需的数据，从而减少周期开销。具体而言，在一个特定的范围，过滤过程仅需要从两行来取得积分边缘总和的值。使用DMA能够将这些值可以传送到内部存储器中，用于下一步处理。

图1是照片形式的示例数字图像，其中包括前景区域110和背景区域120。本说明书的目的是说明“前景”窗口是在特定应用程序的参数范围内能够找到感兴趣的对象的数字图像中的任何区域、范围或位置。“背景”窗口是在特定应用程序的参数范围内不容易找到感兴趣的对象的数字图像中的任何区域、范围或位置。图2是使用索贝尔算子由数字图像100计算出的边缘图像200的示例表示图。图2A是从整个的图像200检测到的面部窗口210的放大图。从图2A可以看出，脸部窗口210有比较多的边缘。在示例实施方案中，图1和图2中的图像在图4所示的方法中被使用的，在图3中所示的硬件上实现的。

图3公开了用于执行图4方法的示例硬件体系结构。在本例的硬件体系结构中照相机310提供的视频反馈。(例如，用于测试或监控目的)主机320是可选的。多路复用器板330一方面在相机310和主机320之间调解通信，另一方面对嵌入式母板340调解通信。在本实施方案中，主板340是模拟设备公司的BF609EZ评估板。主板340上带有数字信号处理器350。在该示例实施方案中，DSP350是模拟设备公司生产的，Blackfin BF609的双核处理器。BF609配备有两个处理核心310和一个管道视频处理器(PVP)，也就是视频预处理器370。视频预处理器370被配置为对输入帧进行预处理，包括在示例实施方案中进行索贝尔边缘检测以及产生用于图像的相加区域表。

在该实施方案中，NTSC302提供的视频反馈到视频解码器344，该设备可以是模拟设备公司的EI3扩展板。增强型并行外围接口(EPPI)346-1可以是IEEE-1284兼容的设备。输入格式设备IPF0提供了计算整体图像(IIM)IIM0适当的数据。IPF0还提供数据给索贝尔边缘检测器350，其用5×5像素的内核在图像中计算索贝尔算子上的每个像素。特别的是，3次卷积被执行，结果将结合极性幅值角(PMA)，被提供给阈值、直方图和压缩(THC)单元。索贝尔边缘检测器350输出的是检测到的边缘图像，诸如图2和图2A。这将提供给整体图像IIM1。两个输出格式器，连接内核330的OPF1和OPF2接口。整体图像是由PVP370提供给内核310，内核310包括对象检测器330。对象检测器330可以是专用对象检测电路，或通过软件指令编程的通用指令电路用以执行对象检测，如图4中所公开的方法。检测到对象的窗口可以被提供给图形单元332，例如其可以用于创建合成图像，合成图像包括与高亮施加到被测物体的原始图像。图形化的输出被提供给第二个EPPI346-2，它与视频编码器342的相连，例如其可以是E13扩展板。视频编码器342提供了一个实时或近实时的视频流给显示设备380。

用于开发和测试的目的，PC320可以通过IEEE1149.1标准的JTAG连接器接口与主板340相连。

图4是根据本说明书来绘制的示例对象检测方法的流程图。对象检测方法400开始于方框402。在方框410中，用于搜索窗口的X和Y坐标被初始化为零，并且当前窗口CurWin变量(“当前”窗口指正在进行操作的窗口)的宽度和高度被初始化为它们的最小值。越小的窗口尺寸将导致更多的窗口处理，从而消耗更多的计算资源，但会产生更高分辨率的检测。

大方框420表示预过滤阶段，该阶段被配置成从数字图像100总的N个可能的窗口中去除M个窗口。在该示例实施方案中，每个窗口都是J×K像素的矩形，其中J和K不必是变量。在本说明书的一些实施方案中，J或K可动态地由一个值调节，用以选择不包含感兴趣对象最小化的窗口处理。在实施方案中，的水平分量是根据方框420的预过滤阶段的结果动态调整的。例如，经过420的预滤阶段，发现窗口是背景区域120的一部分，选择其中width_window是当前窗口的宽度。该选择是安全的，因为这个窗口不具有足够的边缘像素。另一方面，如果该窗口通过了初始的前景/背景分类，并传递到面部/非面部的对称子分类，在非面部窗口中的值可以选择得更高，在面部窗口中的值可以选择得更低。同样，的垂直分量可以基于当前行的前景窗口的总数来选择。如果在当前行中没有前景窗口，的垂直分量可以安全地选择为其中heigh_window是当前窗口的高度。

预过滤阶段420以循环方式工作，作用于尺寸为J×K像素的能够如上述那样被动态地缩放的窗口。每次迭代后，新的窗口由值以递增的(X_pos，Y_pos)被选中。在实施方案中，被选择为1像素、4像素或者width_window/2，而被选择为1像素或rheight_window/2。

在预过滤阶段420的方框422中，当前窗口的CurWin接收当前的(X_pos，Y_pos)。在方框424中，CurWin中边缘像素的总量被计算并存储在变量nTotEdges中。在方框426，nTotEdges与第一个阈值nEdgeThresh1进行比较，举例来说，这个阈值可以是窗口中总像素的25-30％的值。如果CurWin有太少边缘像素，CurWin被识别为背景候选窗口，CurWin的处理过程完成。

如果CurWin有足够的边缘，它有资格作为前景候选，会被指定做附加的处理。在方框428中，CurWin被分成垂直的两半，并且计算每个垂直一半中的边缘数，将结果存储在nTotEdgesVx中。如果nTotEdgesVx的值大于第二个阈值nEdgeThresh2，该窗口被确定为面部候选。

在预过滤阶段方框的外侧，方框450中，为了确定为背景窗口，被选择为Curwin.width/2。在方框454中，X_pes以递增，在方框450中，X_pos与图像的总宽度进行比较，以查看是否已经到达某行的结尾。如果不是，执行将返回到预过滤阶段420，在该行中处理下一个窗口。在方框460中，Y_pos以递增，在方框470中，Y_pos与图像的总高度进行比较，以查看是否最后一行已经被处理。如果最后一行尚未达到，处理过程返回到预过滤阶段420。

如果已经达到，则在方框480中，窗口大小是由比例因子值来调整，例如由一个指定的因子调整窗口大小。请注意，在一些实施方案中，比例因子可以基于最后扫描的结果被动态地选择。

在方框482中，如果当前窗口的大小超过了最大窗口大小，则不需要做进一步的处理。在实施方案中，最小和最大窗口的大小是基于数字图像100的已知属性，例如，如果数字图像100是来自安全摄像头的640×480像素的图像，摄像头被放置在到感兴趣对象区域的已知距离，一个面部所占据的一个窗口大小可能不大于100×100像素，也不小于24×24像素。因此处理示例范围以外的窗口是低效的。

返回到方框430，如果当前窗口没有分类为面部候选，则在方框444 中，由示例值4递增，并将处理传送至方框454。

如果在方框430中当前窗口被划分为面部候选，则在方框440中，附加的处理被执行以增加分类的可信度。例如，方框440可以包括如上所述的Viola-Jones级联分类技术，或本领域中已知的其他对象检测或分类技术。作为一个示例实施方案的一般命题，设计了引导至方框440的步骤，并选择特定值以确保漏报的近零率，换句话说，以确保在到达方框440之前实际面部窗口未被拒绝。更大的误报率也可以接受。在实施方案中，介于60至80％的误报率是足以满足在图像中可靠地检测所有面部，同时降低处理器所必需时间以便实时地准确地运行面部检测，例如在处理每秒30帧的分辨率为640×480像素的全VGA情况。

在方框440中检测到任何脸部信息被存储在内存中。在方框440之后，以1递增，之所以选择最小的递增值，因为图像的该区域已经被证明是感兴趣的区域，面部信息更容易被检测到。控制传递到如上所述的方框454。

在方框484中，在方框440中检测到的任何面部信息都报告给系统，在方框490该方法结束。

在示例实施方案中，nSobelThresh的基线值是建立在500，它可以在每个视频帧之间调整。第一个完整的帧(即一个640×480的灰度图像)以基线阈值来处理，可以列举在一帧中边缘像素的总数量。该示例算法将在25-30％的范围内调整该阈值用于下一帧以保持的边缘像素的数目。例如，随着照明或其他条件改变，阈值被调整以检测相对恒定的边缘数量。

以500的基线阈值开始，当输入帧被接收时，示例算法使用边缘积分图像来计算总的边缘数，根据公式nNumEdges＝aEdgeIIM[nIMageWidth×nlmageHeight-1]，其中nNumEdges是边缘的数量，aEdgeIIM是积分图像缓冲区，nImageWidth是图像宽度，nImageHeight是图像的高度。边缘的数目在目标范围的25-30％进行比较，该阈值在下一帧之前向所希望的范围，根据需要偏向边缘检测来进行调整。在示例中，该算法使用两种不同的增量偏移，这基于期望的边缘计数与实际边缘计数之间的区别。如果检测到的边缘的数目在期望值的10％以内，会适当地相加或相减更小的±50偏移量。如果边缘计数大于期望值 40％或小于期望值15％，应用较大的±100的偏移量。如果边缘计数是在额定范围的25-30％内，不调整阈值。

在另一个多核示例实施方案中，方框440以上可以平行地运行至该方法的其余部分。例如，DSP350投入两个内核去执行预过滤阶段420的步骤，DSP350投入剩余的两个内核去处理到达方框440的额外的级联窗口分类。因此，在这个示例实施方案中，可以预期一个DSP350将在较大数量窗口执行少密集型处理器的步骤，而另一个DSP350将在较小的数量窗口执行多密集型处理器的步骤。在其它实施方案中，第一个DSP350可用于面部检测，第二个DSP350可用于对第一个DSP350检测到的面部执行面部识别。在又一个示例实施方案中，多个或更快的DSP350一起可实现实时高清晰度图像的人脸检测，例如1280×960像素的16位灰阶图。

在方法400的又一个示例中，通过与一个基准相比较可以辅助背景图像的分类。例如，如果图像来自观察室内的固定安全摄像机，背景将很少改变。因此，在示例性实施方案中，背景的特征与基准图像相似，其后会与已知的背景窗口重复比较。在该窗口基本上匹配的情况下，该区域被确定为背景而不需要做进一步的处理。相比于基线，例如，通过比较求和面积表(SAT)的值可以实现分离背景。在一些实施方案中，求和面积表(SAT)可以通过PVP370产生以节省内核310处理器周期。基准图像与当前窗口可以计算出一个SAT。如果两个SAT之间的差值是低于一个阈值时，该窗口被分类为背景窗口。该阈值可以被选择为相对较低，以达到拒绝与基线相同或接近相同的窗口的目的。在示例实施方案中，在方法400中与基线相比较的步骤可以方框424之前执行。在另一示例实施方案中，相对于一个基准图像，通过比较边缘计数而不是SAT来完成的。在这个例子中，可以假设边数相同在一个标识阈值内的两个窗口是相同的，这并没有检测边缘的放置情况。为帮助证实该比较的实用性，识别阈值是严密的阈值。在另一个实施方案中，相比于基线图像是通过比较被检测到的图像边缘的矩心来完成的。在该例子中，假设在一个标识阈值内的两个窗口具有相同的矩心，那么它们是相同的。为帮助证实该比较的实用性，识别阈值是严密的阈值。

在上述各实施方案的讨论中，任何电容、时钟、DFFs、分频器、电感、电阻、放大器、开关、数字核心、晶体管和/或其他部件可以容易地被替换，取代或以其他方式修改以适应特定的电路需求。此外，应该指出的是，使用互补的电子设备，硬件，软件等对于实现本发明的传授提供了一个同样可行的选择。

在示例实施方案中，附图中任何数量的电路都可以用相关电子设备的电路板来实现。该板可以是普通的电路板，可以安装电子设备内部的电子系统的各种部件，并且可以为其他外围设备提供连接器。更具体地说，电路板可以提供与该系统其它部件进行通信的电路连接。根据特定配置的需求、处理需求、计算机设计等任何合适的处理器(包括数字信号处理器、微处理器、配套芯片组等)，存储器元件等可以适当地耦合到电路板上。其他部件，例如外部存储、额外的传感器、音频/视频显示器的控制器和外围设备可以通过插卡，电缆等连接到电路板上或集成到主板上。

在另一示例实施方案中，附图中的电路可以以单独模块的形式来实现(例如，具有经配置以执行特定应用程序或功能相关的元件和电路的设备)，或者以应用电子设备的特定硬件的插件模块形式实现。需要注意的是，本发明的具体实施方案可以容易地部分或全部包含在系统芯片中(SOC)。SOC表示把计算机或其它电子系统的组件集成到一个芯片上的集成电路。它可以包含数字，模拟，混合信号和射频功能：所有这些都可以由芯片基板来提供。其他实施方案可能包括多芯片模块(MCM)，它具有定位在电子封装里，并能够紧密地通过电子封装相互作用的复合的单独集成电路。在各种其它实施方案中，扩展功能可能由一个或多个硅芯来实现，硅芯里包括专用集成电路(ASIC)，现场可编程门阵列(FPGA)，以及其他的半导体芯片。

此外，还必须要注意的是本说明书所概述的所有的规格、尺寸、关系(例如，处理器、逻辑运算等的数目)只是用于说明示例。这样的信息可以在不偏离本发明或所附权利要求的范围的情况下有一些变化。因此它们应被理解为，规范仅适用于非限制性的例子。在上述的描述中，参照特定的处理器和/或部件的安排已描述了示例实施方案。在不脱离所附权利要求范围的情况下可以对这样的实施方案进行各种修改和改变。相应地，说明书和附图也被认为是说明性的而非限制性的。

请注意，上面参照附图所讨论的方案是适用于任何集成电路，这些集成电路涉及信号处理，特别是那些可以执行特殊的软件程序或算法，其中一些可能与处理数字化的实时数据相关联。某些实施方案也涉及到多DSP信号处理、浮点处理、信号/控制处理、固定功能的处理，微控制器应用等。

本说明书某些段落中所讨论的功能可以适用于医疗系统、科学仪器、无线和有线通信、雷达、工业过程控制、音频和视频设备、电流检测、仪器(可以是高度精确的)和其他数字处理系统。

此外，上述所讨论的一些实施方案可被应用于数字信号处理技术、医疗成像、病人监护、医疗仪器和家庭医疗保健。这包括肺部显示器、加速度计、心脏速率监视器、心脏起搏器等等。其他应用可以涉及汽车技术的安全系统(例如，稳定控制系统、驾驶辅助系统、制动系统、信息娱乐系统和任何形式的内部应用)。此外，动力传动系统(例如，混合动力和电动汽车)可以在电池监测、控制系统、报告控制、维护活动等方面使用高精度的数据转换产品。

在另一些示例方案中，本发明可以适用于工业市场包括过程控制系统，能帮助其提高生产力、能源效率和可靠性。在消费者应用中，上述所讨论的信号处理电路可用于图像处理、自动聚焦、稳定图像(例如，对于数码相机、摄像机等)。其他消费应用可以包括家庭影院系统、DVD刻录机和高清电视的音频和视频处理器。另外其他消费应用可以涉及到先进的触摸屏控制器(例如，对于任何类型的便携式媒体设备)。因此，该技术可以很容易应用于智能手机、平板电脑、安防系统、个人电脑、游戏技术、虚拟现实、模拟训练等。

需要注意的是本说明书所提供的众多实例中，两个、三个、四个或更多个电子部件可以互相交互。该做法为了清晰地说明示例。该系统可以以任何合适的方式被合并。按照类似的设计方案，在本说明书的范围之内的任何组件，模块和附图的元件都可以以各种可能的配置进行组合。在某些情况下，参考一定数量的电子元件，描述一个或多个给定流量的功能是比较容易的。附图及其说明中的电路都是可以扩展，可以容纳大量的部件，也可以进行更为复杂而精密的安排和配置。因此，提供的实施方案不应该限制范围或抑制电路广泛传授，因为其很可能应用到无数其它体系结构中。

注意，在本说明书中，引用的各种特性(例如，元件、结构、模块、组件、步骤、操作、属性等)包含在“实施方案”、“示例实施方案”、“实施方案”、“另一个实施方案”、“一些实施方案”、“各种实施方案”、“其他实施方案”、“替代实施方案”等意指任何这样的特性都包含在本发明的一个或多个实施方案中，但在相同的实施方案中不一定要被组合或不被组合。

许多其它的改变、替换、变化、变动和修改可以被确定为本领域的一项技术，在所附权利要求范围内本发明拥有包括所有这样的改变、替换、变化、变动和修改的专利。为了协助美国专利和商标局(USPTO)，此外，在解释所附权利要求发出此申请任何专利的任何读者，申请人谨指出，申请人：(a)不打算任何所附的权利要求援引美国法典第35第112条第六段，因为它存在于申请日，除非“手段”或“步骤”专门在特定的权利要求中使用；(b)本说明书中的任何陈述不打算以未体现在所附的权利要求的任何方式限制本专利。

其他注意、示例和实现

需要注意的是上述描述的装置的所有可选功能都可在文中所描述的方法或过程中实现，并且具体实施的过程可以在一个或多个实施方案中使用。

第一示例提供了一个系统(其可以包括任何适当的电路、分频器、电容、电阻、电感器、模数转换器、DFFs、逻辑门电路、软件、硬件、链接等)，它可以是任何类型的计算机的一部分，它可以包括耦合上述多个电子部件的电路板。在该系统中从数字内核发出定时数据到一个宏中的第一数据输出端使用第一个时钟，这个时钟就是宏时钟；从宏的第一数据输出端输出数据到物理接口使用的第二时钟，第二时钟为物理接口时钟；从数字内核发出的第一复位信号到宏的一个复位信号输出使用宏时钟，第一复位信号输出作为第二复位信号的宏的复位输出；为了采样使用第三时钟的第二复位信号，它提供了一个比第二时钟速率快的时钟速度，以便产生采样的复位信号；在物理接口中复位第二个时钟到一个预定状态以便响应所述采样复位信号的过渡。

在说明书中“装置”可包括(但不限于)使用本说明书所讨论的任何合适的组件，以及任何合适的软件、电路、集线器、计算机代码、逻辑，算法、硬件控制器、接口、链路、总线、通信通道等。在第二个示例中，该系统包括存储机器可读指令的存储器，当这些指令被执行时，系统可以完成上述所讨论的任何行为。

Claims

1.一种对象检测方法，在数字信号处理器上被执行，用于在时钟周期消耗降低的情况下识别数字图像的前景区域内感兴趣的对象，所述方法包括：

将所述数字图像分割成多个窗口；

对每个窗口进行边缘检测；

将每个窗口分类为前景候选或背景候选，其中，分类包括计算窗口的边缘数目，以及仅当窗口的边缘数目大于阈值时将该窗口分类为前景候选；

将每个前景候选窗口细分类为对象候选窗口或非对象候选窗口，其中细分类包括：

将窗口细拆分为两个垂直的子窗口；

计算每个垂直子窗口中的边缘数目；

将每个垂直子窗口中的边缘数目与第二阈值进行比较；以及

仅在每个垂直子窗口中的边缘数目大于所述第二阈值时将该窗口细分类为对象候选窗口；以及

仅对于对象候选窗口进行附加的对象检测。

2.如权利要求1所述的对象检测方法，其中对每个窗口进行边缘检测包括对数字图像中的每个像素计算索贝尔算子，所述索贝尔算子具有5×5像素核心。

3.如权利要求1中的对象检测方法，其中将所述数字图像分割成多个窗口包括：基于被检测对象的期望的大小范围，选择比例因子、最小窗口大小和最大窗口大小。

4.如权利要求1所述的对象检测方法，其中将所述数字图像分割成多个窗口包括：

对于每个窗口，从前一个窗口动态地选择偏移量

其中被选择为对于被分类为背景候选的窗口的大于对于被分类为前景候选的窗口的

5.如权利要求1所述的对象检测方法，其中将每个窗口分类为前景候选或背景候选包括：

比较所述窗口与基准图像中相应窗口，以及如果所述窗口与所述相应窗口基本相同的话，将所述窗口分类为背景窗口。

6.一种在上面存储数字信号处理器的软件指令集的有形的计算机可读存储介质，所述指令集适用于在时钟周期消耗降低的情况下识别数字图像的前景区域内感兴趣的对象，所述指令集被配置以指导处理器：

将所述数字图像分割成多个窗口；

对每个窗口进行边缘检测；

将窗口细拆分为两个垂直的子窗口；

计算每个垂直子窗口中的边缘数目；

将每个垂直子窗口中的边缘数目与第二阈值进行比较；以及

仅对于对象候选窗口进行附加的对象检测。

7.如权利要求6所述的有形的计算机可读存储介质，其中对每个窗口进行边缘检测包括对数字图像中的每个像素计算索贝尔算子，所述索贝尔算子具有5×5像素核心。

8.如权利要求6所述的有形的计算机可读存储介质，其中将所述数字图像分割成多个窗口包括：基于被检测对象的期望的大小范围，选择比例因子、最小窗口大小和最大窗口大小。

9.如权利要求6所述的有形的计算机可读存储介质，将所述数字图像分割成多个窗口包括：

对于每个窗口，从前一个窗口动态地选择偏移量

其中被选择为对于落到背景窗口的窗口的大于对于落到前景窗口的窗口的

10.如权利要求6所述的有形的计算机可读存储介质，其中将每个窗口分类为前景候选或背景候选包括：

11.一种数字信号处理系统，被配置以在时钟周期消耗降低的情况下识别数字图像的前景区域内感兴趣的对象，所述系统包括：

处理器；以及

与处理器耦合通信的并且在上面存储指令集的存储器，该指令集在被执行时，指导处理器：

将所述数字图像分割成多个窗口；

对每个窗口进行边缘检测；

将每个窗口分类为前景候选或背景候选，其中分类包括计算窗口的边缘数目，以及仅当窗口的边缘数目大于阈值时将窗口分类为前景候选；

将窗口细拆分为两个垂直的子窗口；

计算每个垂直子窗口中的边缘数目；

将每个垂直子窗口中的边缘数目与第二阈值进行比较；以及

仅在每个垂直子窗口中的边缘数目大于所述第二阈值时将该窗口细分类为对象候选窗口；以及仅对于对象候选窗口进行附加的对象检测。

12.如权利要求11所述的数字信号处理系统，其中对每个窗口进行边检测包括对数字图像中的每个像素计算索贝尔算子，所述索贝尔算子具有5×5像素核心。

13.如权利要求11所述的数字信号处理系统，其中将所述数字图像分割成多个窗口包括：基于被检测对象的期望的大小范围，选择比例因子、最小窗口大小和最大窗口大小。

14.如权利要求11所述的数字信号处理系统，其中将所述数字图像分割成多个窗口包括：

从前一个窗口动态地选择偏移量

15.如权利要求11所述的数字信号处理系统，其中将每个窗口分类为前景候选或背景候选包括：