CN105938622A

CN105938622A - 检测运动图像中的物体的方法和装置

Info

Publication number: CN105938622A
Application number: CN201610118359.8A
Authority: CN
Inventors: 矢野光太郎; 梅田郎; 梅田一郎; 郭睦凌; 胥立丰
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2015-03-02
Filing date: 2016-03-02
Publication date: 2016-09-14
Anticipated expiration: 2036-03-02
Also published as: US20160260226A1; KR20160106514A; CN105938622B; JP2016162232A; US10417773B2; EP3065082A1; KR101971866B1; JP6655878B2

Abstract

本发明提供检测运动图像中的物体的方法和装置。所述图像处理设备包括：获得单元，其被构造为获得运动图像；检测单元，其被构造为从所述运动图像中的关注图像帧，对检测对象物体进行检测；追踪单元，其被构造为在所述运动图像中的关注图像帧先前的图像帧中，在所述检测对象物体的检测位置的邻近区域中，对物体进行追踪；以及输出单元，其被构造为通过将由所述检测单元检测到所述物体的位置与由所述追踪单元获得所述物体的位置进行整合，来输出所述关注图像帧中的所述物体的检测位置。

Description

检测运动图像中的物体的方法和装置

技术领域

本发明涉及用于检测运动图像中的预定物体的图像处理方法和装置。

背景技术

近年来，提出了分析由监测摄像机拍摄的视频以检测是否有人侵入监测区域，并且报告检测结果的系统。除了对侵入的检测，还提出了如下的系统，在该系统中，通过追踪在画面上显示的人，来对在预定时段期间经过了监测区域的人计数，或者从计数的人的数量，来检测拥堵的程度。

为了实现上述应用，需要从要追踪的监测摄像机视频，自动检测出人。从图像检测人的方法包括，例如由Dalal and Triggs.提出的方法“Histograms of Oriented Gradients for Human Detection”(IEEE ComputerSociety Conference on Computer Vision and Pattern Recognition,2005)。根据该提出的方法，从图像提取像素值的梯度方向的直方图，并且通过使用直方图作为特征量(HOG特征量)来确定图像中的局部区域是否为人。即，由与像素值的梯度方向相对应的、用于识别的特征量，来表示人物轮廓。

然而，为了将上述人物检测技术应用到实际的监测摄像机视频，需要提高检测率。一般而言，根据由人物检测技术为代表的物体检测技术，如果意图增大检测率，则会发生更多的误检测(检测到不是检测对象的物体，作为错误报告)，这对于实际使用并不理想。因此，需要提高检测率同时抑制误检测的方法。

作为上述问题的解决方案，能构想出如下方法：在后续的时间序列图像中追踪曾检测到的人，并且并行地持续对人物进行检测，以提高表观检测率(apparent detection rate)。将参照图2描述该方法。在图2中，在图像上由实线指示的矩形表示人物检测结果，而由虚线指示的矩形表示追踪结果。如图2中例示，在时刻t检测到的结果在时刻t+1和时刻t+2的图像中被追踪。类似地，在时刻t+1检测到的结果在随后的在时刻t+2的图像中被追踪，此外，在时刻t+2检测到人。在该示例中，检测器从各个图像仅检测5个人中的2个人，但是将检测结果与追踪结果进行整合，最终检测到并追踪到所有人。

根据日本特开2014-48702号公报，在上述的检测和追踪处理的并行使用中，在先前帧中检测到物体的窗口被设置为追踪对象，还在通过对当前帧进行划分而获得的区域的部分中搜索物体，使得将通过搜索而新检测到物体的窗口，添加到追踪对象。

通过使用物体辨识器来处理追踪对象。当将辨识器用于追踪处理时，能够可靠地追踪曾检测到的对象，而不会追丢了对象。

然而，即使在通过使用日本特开2014-48702号公报中公开的方法来进行人物追踪的情况下，也需要进一步提高检测率。例如，还可以想到改变人物检测器中的辨识器的阈值，来提高检测率。在这种情况下，发生如下的问题：误检测的数量增大，并且保持追踪错误地检测到的对象。

发明内容

本发明提供了从视频检测物体并且追踪物体的高精度的图像处理装置。

根据本发明的方面，提供一种图像处理装置，所述图像处理装置包括：获得单元，其被构造为获得运动图像；检测单元，其被构造为从所述运动图像中的关注图像帧，对检测对象物体进行检测；追踪单元，其被构造为在所述运动图像中的关注图像帧先前的图像帧中，在所述检测对象物体的检测位置的邻近区域中，获得追踪物体；以及确定单元，其被构造为通过将由所述检测单元检测到所述检测对象物体的位置与由所述追踪单元获得所述追踪物体的位置进行整合，来确定所述追踪物体是否对应于所述检测对象物体。

通过以下参照附图对示例性实施例的描述，本发明的其他特征将变得清楚。

附图说明

图1例示了根据第一示例性实施例的图像识别装置的构造。

图2是用于描述检测和追踪的协作处理的说明图。

图3是根据第一示例性实施例的处理流程图。

图4A、图4B和图4C例示了示例检测结果。

图5例示了在检测结果存储单元中的示例存储格式。

图6例示了在物体信息存储单元中的示例存储格式。

图7例示了在初始状态下的追踪结果存储单元中的示例存储格式。

图8例示了在物体追踪期间，追踪结果存储单元中的示例存储格式。

图9例示了追踪结果的示例图像输出。

图10例示了根据第二示例性实施例的图像识别装置的构造。

具体实施方式

在下文中，将参照附图描述本发明的示例性实施例。

第一示例性实施例

图1例示了根据第一示例性实施例的图像识别装置的构造。如图1中例示，根据本示例性实施例的图像识别装置包括：图像获得单元100、物体辨识单元200、物体检测单元300、第一物体追踪单元400、第二物体追踪单元500、检测结果整合单元600、追踪物体确定单元700、追踪结果输出单元800、检测结果存储单元910、物体信息存储单元920以及追踪结果存储单元930。

图像获得单元100从由诸如视频摄像机等的摄像单元摄取的运动图像，获得图像帧数据。在此获得的图像帧数据是RGB图像。物体辨识单元200计算并输出由图像获得单元100获得的图像帧数据(在下文中，也将被简称为图像)的局部区域包括被设置为检测对象的物体的似然度。根据本示例性实施例，人被设置为检测对象。即，由物体辨识单元200输出的似然度是表示局部区域图像有多大可能为人的值。

物体检测单元300从由图像获得单元100获得的图像，扫描局部区域，并且针对依次设置的局部区域的图像数据，即局部区域图像，在由物体辨识单元200输出的似然度的基础上，检测图像中的物体位置。物体检测单元300输出检测到物体的检测位置以及对应的局部区域图像。根据本示例性实施例，物体检测单元300检测人在图像中的位置。

第一物体追踪单元400从由图像获得单元100获得的图像中的区域的部分，扫描局部区域，并且针对依次设置的局部区域图像，在由物体辨识单元200输出的似然度的基础上，追踪由物体检测单元300检测到的物体。在此，由第一物体追踪单元400扫描的区域的部分是在由物体获得单元100在先前时刻获得的图像中，物体检测单元300检测到物体的位置的邻近区域。根据本示例性实施例，第一物体追踪单元400追踪人在图像中的位置。

第二物体追踪单元500从由图像获得单元100获得的图像中的区域的部分，扫描局部区域，并且针对依次设置的局部区域图像，通过使用由物体检测单元300检测到的局部区域图像，来追踪物体。在此，由第二物体追踪单元500扫描的区域的部分是由物体检测单元300检测到的物体位置的邻近区域。由第二物体追踪单元500追踪的要输出的物体位置，相当于对由物体检测单元300检测到的物体的检测结束时的位置。一般而言，由于物体检测需要时间，因此不是针对各个帧的所有区域进行物体检测，而是通过花费几个帧的时间，对几个帧中的一个帧进行物体检测。由于这个原因，在检测结束时的帧与在检测开始时的帧不同，并且由第二物体追踪单元500进行追踪。

检测结果整合单元600在位置信息的基础上，将由物体检测单元300检测到的物体与由第一物体追踪单元400追踪到的物体相关联。追踪物体确定单元700在由物体辨识单元200输出的、由第一物体追踪单元400追踪到的物体的似然度的基础上，确定当前追踪的物体是否是被设置为检测和追踪对象的物体。根据本示例性实施例，追踪物体确定单元700确定当前追踪的物体是否为人。

追踪结果输出单元800输出追踪结果。例如，表示被确定为人的局部区域图像的矩形，叠加在由图像获得单元100获得的、要显示在显示器上的图像数据上。检测结果存储单元910存储与由物体检测单元300检测到的物体位置相对应的局部区域图像，作为检测结果。

物体信息存储单元920将由第一物体追踪单元400和第二物体追踪单元500追踪到的物体位置在与图像数据的摄像时间相关联的同时，作为物体信息进行存储。

追踪结果存储单元930存储由第一物体追踪单元400和第二物体追踪单元500进行的追踪的结果。针对各个追踪物体，将追踪结果与在不同时刻的物体信息相关联，并且根据该结果，能够再现物体的移动轨迹。

在下文中，将按照图3中例示的处理流程图，描述根据本示例性实施例的操作。图像获得单元100获得摄取的图像数据。所获得的图像数据中的各个被存储在图像获得单元100的存储器中(步骤S100)。物体检测单元300从在步骤S100中获得的图像扫描局部区域，并且检测图像中的物体位置(步骤S200)。针对从图像切出的局部区域图像，物体检测单元300获得局部区域图像包括通过使用物体辨识单元200而设置为检测对象的物体的似然度。然后，物体检测单元300确定具有比预定阈值高的似然度的局部区域为检测对象物体，并输出其位置。作为由物体检测单元300进行的检测方法，例如，能够采用上述的由达拉尔(Dalal)及其他人的论文中描述的方法。根据该方法，当位置在图像中逐步移位的同时，从图像扫描具有预定大小和形状的局部区域，并且针对切出的局部区域图像获得HOG特征量，以通过支持向量机(SVM)来检测人。

在此，SVM的输出相当于似然度。为了从图像检测具有不同大小的人，对图像预先进行缩小处理以具有预定倍率(例如，0.8的倍率或与其平方根相对应的0.82的倍率)，并且还对缩小后的图像中的各个进行检测处理。在下文中，为了简单起见，将描述仅对一个大小进行检测的情况作为示例。因此，在此输出的检测结果是在图像中的在水平方向和垂直方向上的位置，并且对应于例如在图像上的局部区域的左上边缘处的坐标。

在步骤S210中，确定从图像是否检测到对象物体(根据本示例性实施例为人)。在未检测到对象物体的情况下，处理转移到步骤S900。在步骤S900中，为了处理在下一时刻(例如0.03秒后等的预定时间)的图像，处理转移到步骤S100。应当注意，在步骤S210中“未检测到对象物体的情况”包括在步骤S200中的检测处理在预定时间中未结束的情况，以及进行了物体检测处理但最终未检测到物体的情况二者。另一方面，在步骤S210中，在检测到对象物体的情况下，处理转移到步骤S220。

检测结果存储单元910存储由物体检测单元300检测到的物体位置，以及与其物体位置相对应的局部区域图像，作为检测结果(步骤S220)。例如，如图4A中例示，从图像检测到2个人。在这种情况下，存储图4A中的、点P1和点P2在水平方向和垂直方向上的位置坐标。同时，存储如图4B和4C中例示的局部区域图像的多条图像数据。将这些结果分别与识别号相关联。图5例示了在检测结果存储单元910中的示例存储格式。(x1,y1)和(x2,y2)分别表示点P1和点P2的在水平和垂直方向上的位置坐标，并且{p11,p12,...,p1N}和{p21,p22,...,p2N}分别表示局部区域图像的像素值。然而，应当注意，N为局部区域图像的像素的数量。类似地，在从1个图像检测到L个人的情况下，针对识别号1至L存储这些结果。

检测结果整合单元600在其位置信息的基础上，将由物体检测单元300检测到的检测结果与由第一物体追踪单元400追踪到的追踪结果相关联(步骤S230)。将针对在步骤S220中存储的检测结果中的各个的位置坐标，与针对由第一物体追踪单元400进行的追踪的结果的位置坐标进行比较，以确定位置坐标是否彼此匹配。然而，应当注意，在坐标值之间的差在预定范围内的情况下，位置坐标也可以被视为彼此匹配。由第一物体追踪单元400进行的追踪的结果被存储在物体信息存储单元920中。下面将描述第一物体追踪单元400中的追踪处理以及追踪结果的详情。

在步骤S240中，在与由物体检测单元300检测到的所有检测结果相对应的物体，已经存在于物体信息存储单元920中的情况下，处理转移到步骤S900。在步骤S900中，为了处理在下一时刻的图像，处理转移到步骤S100。另一方面，在步骤S240中，在与由物体检测单元300检测到的检测结果相对应的物体，未存在于物体信息存储单元920中的情况下，即检测结果包括新的物体的情况，处理转移到步骤S250。

第二物体追踪单元500从在步骤S100中获得的图像中的区域的部分，扫描局部区域，并且针对依次设置的局部区域图像，通过使用由物体检测单元300在步骤S200中检测到的局部区域图像来追踪物体(步骤S250)。在此，由第二物体追踪单元500追踪到的对象是在步骤S240中被确定为新的物体的物体，并且扫描在检测结果存储单元910中存储的物体位置的邻近区域。要扫描的邻近区域的范围，根据如下要被拍摄场景而被预先设置，该要被拍摄的场景以覆盖从获得图像直到物体检测处理结束为止的物体移动的范围。由于物体检测单元300的处理时间依赖于要处理的图像，因此也可以根据处理时间适当地设置要扫描的邻近区域的范围。

第二物体追踪单元500将在步骤S100中获得的图像的局部区域图像与在检测结果存储单元910中存储的局部区域图像彼此关联，并且输出图像之间具有最高的相似程度的物体位置，作为追踪结果。可以从图像数据的相关性或差的绝对值之和，来获得图像之间的相似程度，或者可以通过从各个图像提取图像特征量并获得图像特征量的相似程度，来获得图像之间的相似程度。例如，HOG特征量或颜色直方图能够被用作图像特征量。在此输出的物体位置相当于由物体检测单元300检测到的物体检测结束时的位置，并且第二物体追踪单元500从图像之间的相似程度来估计位置。

由第二物体追踪单元500追踪到的结果被添加到物体信息存储单元920和追踪结果存储单元930中(步骤S260)。由第二物体追踪单元500追踪到的物体位置在与图像数据的摄像时间相关联的同时，作为物体信息被存储在物体信息存储单元920中。存储的摄像时间可以是实际的摄像时间，或者是与摄像时间相对应的帧编号。将这些结果分别与识别号相关联。图6例示了在物体信息存储单元920中的例示存储格式。(x1,y1)和(x2,y2)分别表示追踪到的物体的位置坐标，并且f1和f2分别表示追踪到的图像的帧编号。在从1个图像追踪到2个物体的情况下，f1和f2就变为相同的编号。

在物体信息存储单元920中存储的、由第二物体追踪单元500追踪到的物体的物体信息的识别号，被存储在追踪结果存储单元930中，以便针对各个追踪对象，在不同的时刻被关联。将这些结果分别与追踪结果的识别号相关联。在步骤S260中，由于第一次存储新检测到的物体的追踪结果，因此存在物体信息的一个识别号。此外，表示状态的标识符被分配给各个追踪结果。图7例示了在追踪结果存储单元930中的示例存储格式。

图7的示例涉及通过由物体检测单元300检测2个物体并且由第二物体追踪单元500追踪各个物体而获得的结果，作为新检测到的物体。ID1和ID2分别表示在物体信息存储单元920中存储的、与追踪结果的识别号相对应的物体信息的识别号。“检测”表示“新检测到物体”的状态。根据本示例性实施例，包括“检测”、“追踪”及“识别”的三种状态被用作表示追踪结果的状态的标识符。“追踪”和“识别”分别表示“追踪进行中”和“识别为对象物体”。下面将描述状态更新的详情。

在步骤S900中，为了获得在下一时刻的图像，处理转移到步骤S100。根据本示例性实施例，从在步骤S100中获得的图像追踪检测到的物体的处理，与在步骤S200至S260中的处理并行地进行。在步骤S300中，参照在物体信息存储单元920中存储的物体信息，以搜索被设置为追踪对象的物体是否存在于在先前时刻的图像中。例如，在获得在时刻t的图像的情况下，检查是否存在具有相当于时刻t-1的帧编号的物体信息。在不存在被设置为追踪对象的物体的情况下，处理转移到步骤S900。在步骤S900中，为了获得在下一时刻的图像，处理转移到步骤S100。另一方面，在存在被设置为追踪对象的物体的情况下，获得物体信息的相关的识别号，并且处理转移到步骤S400。

第一物体追踪单元400从在步骤S100中获得的图像中的区域的部分，扫描局部区域，并且针对依次设置的局部区域图像，在由物体辨识单元200输出的似然度的基础上，追踪物体(步骤S400)。在此，由第一物体追踪单元400追踪到的物体，是在物体信息存储单元920中存储的物体，并且扫描在物体信息存储单元920中存储的物体位置的邻近区域。按照要拍摄的场景，预先设置要扫描的邻近区域的范围，以便覆盖物体在先前帧和下一帧的图像获得时段期间移动的范围。因此，第一物体追踪单元400扫描比由第二物体追踪单元500扫描的范围更窄的范围。第一物体追踪单元400针对通过使用物体辨识单元200在步骤S100中获得的图像的局部区域图像，获得局部区域图像包括被设置为检测对象的物体的似然度。然后，在扫描的邻近区域中具有最高似然度的物体位置被输出为追踪结果。重复进行在步骤S400中的处理，次数为在步骤S300中获得的物体信息的数量。

由第一物体追踪单元400进行的追踪的结果，被添加到物体信息存储单元920和追踪结果存储单元930中(步骤S410)。由第一物体追踪单元400追踪到的物体位置在与图像数据的摄像时间相关联的同时，作为物体信息被存储在物体信息存储单元920中。以如图6例示的格式存储物体信息。在物体信息存储单元920中存储的、由第一物体追踪单元400追踪到的物体的物体信息的识别号，在针对各个追踪物体被在不同的时刻之间相关联的同时，被存储在追踪结果存储单元930中。将这些结果分别与追踪结果的识别号相关联。

从追踪结果存储单元930，搜索在步骤S300中获得的物体信息的识别号，并且将由第一物体追踪单元400追踪到的物体识别号，添加到保持有匹配的识别号的检测结果。此外，追踪结果的状态更新为“追踪”。图8例示了此时在追踪结果存储单元930中存储的示例追踪结果。{ID11,ID12}和{ID21,ID22}分别表示在物体信息存储单元920中存储的、与追踪结果的识别号相对应的物体信息的识别号。“追踪”表示“追踪进行中”的状态。在该示例中，由第二物体追踪单元500在先前时刻开始追踪的、具有识别号ID11和ID21的物体，与由第一物体追踪单元400追踪的、具有识别号ID12和ID22的物体相关联。例如，在N帧期间追踪物体的情况下，物体信息的N识别号被一起存储在检测结果中。重复进行步骤S410中的处理，次数为在步骤S300中获得的物体信息的数量。

追踪物体确定单元700在由物体辨识单元200输出的、由第一物体追踪单元400追踪到的物体的似然度的基础上，确定当前追踪的物体是否是被设置为检测和追踪对象的物体(步骤S420)。确定由物体辨识单元200输出的、在步骤S400中获得的追踪结果中的各个的似然度是否高于预定阈值，在似然度高于预定值的情况下，当前追踪的物体被确认为对象物体。此时，追踪结果的状态更新为“识别”。根据本示例性实施例，将相对低的值设置为物体检测单元300在步骤S200中使用的阈值，以提高检测率。即，由物体检测单元300检测到的物体，处于未被确认为被设置为追踪物体的物体的状态，并且是要被追踪物体确定单元700确认为追踪物体的候选。另一方面，将比步骤S200中的值高的值，设置为追踪物体确定单元700在步骤S420中使用的阈值，以抑制误检测。

应当注意，根据本示例性实施例，在当前追踪的物体的似然度高于预定值的情况下，物体被确认为对象物体，但是可以通过从当前追踪的物体在不同时刻的多个似然度获得统计量，来确认物体为对象物体。例如，似然度取大于预定值的值的频数或相对频数(似然度取大于预定值的值的频数与作为统计对象的总频数的比)被设置为统计量。当通过如上述从多个似然度获得统计量来进行确定时，确定结果的精度提高，并且能够获得更加可靠的结果。为了通过获得统计量来进行确定处理，在步骤S200中的物体检测处理中获得的似然度和在步骤S400中的物体追踪处理中获得的似然度，与物体位置一起被分别存储在检测结果存储单元910和物体信息存储单元920中。重复进行在步骤S420中的处理，次数为在步骤S300中获得的物体信息的数量。

追踪结果输出单元800输出在步骤S420中被确认为对象物体的追踪结果(步骤S430)。图9例示了示例图像输出。在图9中，由矩形表示被确认为对象物体的局部区域(根据本示例性实施例为人)，并且由虚线表示物体被追踪的轨迹。从在追踪结果存储单元930中存储的追踪结果之中提取“识别”状态下的结果，从物体信息识别号获得在物体信息存储单元920中存储的物体信息的位置坐标，以绘制矩形和轨迹。通过将在过去的时间的局部区域的中心位置彼此连接，来获得轨迹。在步骤S900中，为了获得在下一时刻的图像，处理转移到步骤S100。

如上所述，根据第一示例性实施例，当在随后的时间序列图像中追踪曾检测到的人时，并行地持续进行人物检测。然后，第一物体追踪单元400通过使用物体辨识单元200来追踪人，并且针对各个获得的图像，在追踪物体确定单元700中基于由物体辨识单元200输出的似然度，确定追踪对象是否为人。其结果是，由于能够以比检测处理的频数更高的频数并且还基于严格的阈值，来确定追踪对象是否为人，因此能够在抑制误检测的同时提高检测率。

此外，虽然在追踪物体确定单元700中使用的低于阈值的值被设置为在物体检测单元300中使用的阈值，但是准备了更多的追踪对象候选，并且能够提高检测率。此外，根据上述示例性实施例，第二物体追踪单元500追踪由物体检测单元300新检测到的物体，并且估计在检测处理结束时的位置。其结果是，即使在检测处理需要时间并且物体大幅移动的情况下，也能够精确地追踪物体。

第二示例性实施例

在能够以高速执行检测处理，或者被设置为检测对象的物体的移动速度相对缓慢的情况下，由于不需要估计检测物体在检测期间的移动之后的位置，因此能够通过省略第二物体追踪单元500来采用更为简单的构造。图10例示了该构造。在图10中，具有与图1的附图标记相同的附图标记的组件具有同等功能。操作与图3中例示的处理流程一致，但不包括在步骤S250中由第二物体追踪单元500进行的物体追踪处理。

根据上述示例性实施例，已经给出了在假设从整个图像扫描局部区域以进行检测处理的情况下的描述，但是扫描区域可以是图像中的区域的部分。能够将区域限制为人可以从图像出现的区域，诸如，例如相当于图像的端部的区域或者在拍摄场景中人的出入口的区域等。

此外，根据上述示例性实施例，已经给出了在假设检测到出现在图像中的、具有预定大小的人的情况下的描述，但是可以检测具有不同大小的人。在这种情况下，不仅位置坐标，还有大小也可以被存储在检测结果或物体信息中。

此外，为了提高人的检测精度，能够采用物体辨识单元200配设有多个人物模型的构造。例如，分别地配设有包括正面模型、背面模型、左侧模型及右侧模型的4个人物模型，并且获得各自的似然度。然后，物体检测单元300从具有最高似然度的结果，进行检测处理。通过根据与由物体检测单元300检测到的物体相对应的模型，选择物体辨识单元200的模型，能够有效地追踪第一物体追踪单元400中的物体。例如，在物体检测单元300以正面模型检测人的情况下，通过将人物模型限制为包括正面模型、左侧模型及右侧模型的3个人物模型，来进行物体追踪处理。

上面已描述了将本发明的示例性实施例应用到从图像检测人的情况的示例，但是本发明的实施例可以被广泛应用到除人之外的物体被设置为检测对象的情况。

根据上述示例性实施例，在从物体辨识单元输出的似然度的基础上，确定当前追踪的物体是否是被设置为检测对象的物体。因此，即使检测器进行误检测，由于当正在追踪对象的同时，确定物体是否为人，所以能够精确地检测并追踪人。

其他实施例

还可以通过读出并执行记录在存储介质(例如“非暂时性计算机可读存储介质”)上的计算机可执行指令(例如，一个或更多个程序)以执行上述实施例中的一个或更多个的功能，并且，可以利用通过由系统或装置的计算机例如读出并执行来自存储介质的计算机可执行指令以执行上述实施例中的一个或更多个的功能的方法，来实现本发明的实施例。计算机可以包括中央处理单元(CPU)、微处理单元(MPU)或其他电路中的一个或更多个，并且可以包括分开的计算机或分开的计算机处理器的网络。计算机可执行指令可以例如从网络或存储介质被提供给计算机。存储介质可以包括例如硬盘、随机存取存储器(RAM)、只读存储器(ROM)、分布式计算系统的存储器、光盘(诸如压缩光盘(CD)、数字通用光盘(DVD)或蓝光光盘(BD)^TM)、闪存装置以及存储卡等中的一个或更多个。

本发明的实施例还可以通过如下的方法来实现，即，通过网络或者各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或装置，该系统或装置的计算机或是中央处理单元(CPU)、微处理单元(MPU)读出并执行程序的方法。

虽然参照示例性实施例对本发明进行了描述，但是应当理解，本发明不限于所公开的示例性实施例。应当对所附权利要求的范围给予最宽的解释，以使其涵盖所有这些变型例以及等同的结构和功能。

Claims

1.一种图像处理装置，所述图像处理装置包括：

获得单元，其被构造为获得运动图像；

检测单元，其被构造为从所述运动图像中的关注图像帧，对检测对象物体进行检测；

追踪单元，其被构造为在所述运动图像中的所述关注图像帧先前的图像帧中，在所述检测对象物体的检测位置的邻近区域中，获得追踪物体；以及

确定单元，其被构造为通过将由所述检测单元检测到所述检测对象物体的位置与由所述追踪单元获得所述追踪物体的位置进行整合，来确定所述追踪物体是否对应于所述检测对象物体。

2.根据权利要求1所述的图像处理装置，所述图像处理装置还包括：

输出单元，其被构造为输出基于所述确定单元确定所述追踪物体是否对应于所述检测对象物体的结果。

3.根据权利要求1所述的图像处理装置，其中，所述检测单元计算所述关注图像帧包括所述检测对象物体的似然度，并且基于该似然度来检测所述检测对象物体。

4.根据权利要求1所述的图像处理装置，其中，所述追踪单元计算所述检测位置的所述邻近区域包括所述检测对象物体的似然度，并且基于该似然度来获得所述追踪物体。

5.根据权利要求4所述的图像处理装置，其中，在所述似然度高于第一阈值的情况下，所述追踪单元确认所述追踪物体为所述检测对象物体。

6.根据权利要求5所述的图像处理装置，其中，所述追踪单元针对所述追踪物体，从在不同时刻的多个似然度获得统计量，并且基于该统计量，确认所述追踪物体为所述检测对象物体。

7.根据权利要求6所述的图像处理装置，其中，所述统计量为所述多个似然度取高于所述第一阈值的值的频数或相对频数。

8.根据权利要求6所述的图像处理装置，其中，在所述似然度高于第二阈值的情况下，所述检测单元检测所述物体。

9.根据权利要求8所述的图像处理装置，其中，所述第二阈值低于所述第一阈值。

10.根据权利要求1所述的图像处理装置，其中，所述检测单元在所述关注图像帧中设置多个局部区域，并且针对各个局部区域检测所述检测对象物体。

11.根据权利要求1所述的图像处理装置，所述图像处理装置还包括：

又一追踪单元，其被构造为估计所述检测单元检测到的所述检测对象物体的位置。

12.根据权利要求11所述的图像处理装置，其中，所述又一追踪单元被构造为通过扫描所述运动图像中的图像帧中的区域的部分，来获得所述检测对象物体，并且该扫描的范围比所述追踪单元的扫描范围更广。

13.根据权利要求1所述的图像处理装置，其中，所述检测单元针对所述运动图像中的图像帧的部分，进行检测。

14.根据权利要求13所述的图像处理装置，其中，所述检测单元针对所述运动图像中的每预定数量的图像帧，进行所述检测。

15.一种图像处理方法，所述图像处理方法包括如下的步骤：

获得步骤，获得运动图像；

检测步骤，从所述运动图像中的关注图像帧，对检测对象物体进行检测；

获得步骤，在所述运动图像中的所述关注图像帧先前的图像帧中，在所述检测对象物体的检测位置的邻近区域中，获得追踪物体；以及

确定步骤，通过将检测到所述检测对象物体的位置与获得的所述追踪物体的位置进行整合，来确定所述追踪物体是否对应于所述检测对象物体。

16.根据权利要求15所述的图像处理方法，所述图像处理方法还包括如下的步骤：

输出步骤，输出基于所述确定步骤确定所述追踪物体是否对应于所述检测对象物体的结果。