CN105989608B

CN105989608B - 一种面向智能机器人的视觉捕捉方法及装置

Info

Publication number: CN105989608B
Application number: CN201610261376.7A
Authority: CN
Inventors: 陆羽皓
Original assignee: Beijing Guangnian Wuxian Technology Co Ltd
Current assignee: Beijing Guangnian Wuxian Technology Co Ltd
Priority date: 2016-04-25
Filing date: 2016-04-25
Publication date: 2019-03-26
Anticipated expiration: 2036-04-25
Also published as: CN105989608A

Abstract

一种面向智能机器人的视觉捕捉方法及装置，该方法包括：原始图片缩放步骤，对智能机器人获取到的原始图片进行图像缩小处理，得到第二图片；目标物体检测步骤，检测第二图片中是否存在目标物体；目标物体位置获取步骤，根据目标物体检测步骤的检测结果采用不同的处理模型确定目标物体的位置信息，包括：当检测到第二图片中存在目标物体时，获取目标物体的位置信息；当检测到在第二图片中不存在目标物体时，通过设定感兴趣区域并根据原始图片在感兴趣区域内的信息来确定目标物体的位置信息。该方法可以有效地减小所需要处理的像素的数量，从而有助于减少视觉捕捉所耗费的时间。

Description

一种面向智能机器人的视觉捕捉方法及装置

技术领域

本发明涉及图像处理技术领域，具体地说，涉及一种面向智能机器人的视觉捕捉方法及装置。

背景技术

视觉机器人将视觉处理与机器人技术相结合，使得机器人具有了与周围环境相交互的能力，加强了机器人在抓取、搬运、跟踪、装配以及危险环境作业等领域的应用。

对于传统的视觉机器人来说，其在进行人脸识别过程中，当人脸与摄像头之间的距离增加一倍，物体的像的面积将会是之前的四分之一。同时，对于该是视觉机器人来说，在进行人脸检测时程序的运行时间主要取决于特征提取所需的时间，该时间与图片的像素基本呈严格线性关系，这样也就使得程序运行时间与人脸到摄像头的距离的平方呈正比。

对于现有的人脸检测算法来说，为了能够准确识别出图片中的人脸，就需要人脸在图像中达到一定占比，即人脸与摄像头的距离不能超过一定距离。而为了缩短人脸检测程序的运行时间，则需要人脸与摄像头的距离不能过大。

由此可以看出，现有的面向智能机器人的视觉捕捉方法存在处理速度缓慢、可识别距离短的缺陷。

发明内容

为解决上述问题，本发明提供了一种面向智能机器人的视觉捕捉方法，包括：

原始图片缩放步骤，对智能机器人获取到的原始图片进行图像缩小处理，得到第二图片；

目标物体检测步骤，检测所述第二图片中是否存在目标物体；

目标物体位置获取步骤，根据所述目标物体检测步骤的检测结果采用不同的处理模型确定所述目标物体的位置信息，包括：

当检测到所述第二图片中存在所述目标物体时，获取所述目标物体的位置信息；

当检测到在所述第二图片中不存在所述目标物体时，通过设定感兴趣区域并根据所述原始图片在所述感兴趣区域内的信息来确定所述目标物体的位置信息。

根据本发明的一个实施例，当在所述目标物体检测步骤中检测到在所述第二图片中不存在所述目标物体时，在所述目标物体位置获取步骤中，

从所述原始图片中截取所述感兴趣区域所对应的图像区域，得到第三图片；

检测所述第三图片中是否存在目标物体，如果存在目标物体，则返回所述目标物体的位置信息，否则返回目标物体捕获失败信息。

确定目标图片中是否存在所述目标物体，所述目标图片为所述第二图片所在帧之前预设时长内的图片；

如果所述目标图片内存在所述目标物体，则将所述感兴趣区域的中心点位置设置为所述目标图片内的目标物体的中心位置。

根据本发明的一个实施例，如果所述目标图片内不存在所述目标物体，

对所述目标图片进行运动检测，确定出运动区域；

判断所述运动区域的尺寸是否大于预设尺寸，如果大于，则将所述感兴趣区域的中心位置设置在所述运动区域的中心位置。

根据本发明的一个实施例，如果所述运动区域的尺寸小于或等于预设尺寸，则随机设定所述感兴趣区域的中心位置。

根据本发明的一个实施例，所述方法还包括：

反馈输出步骤，在根据所述目标物体的位置信息定位目标物体的同时，输出与所述目标物体相适应的多模态反馈信息。

本发明还提供了一种面向智能机器人的视觉捕捉装置，包括：

原始图片缩放模块，其用于对智能机器人获取到的原始图片进行图像缩小处理，得到第二图片；

目标物体检测模块，其用于检测所述第二图片中是否存在目标物体；

目标物体位置获取模块，其用于根据所述目标物体检测模块的检测结果采用不同的处理模型确定所述目标物体的位置信息，

当所述目标物体检测模块检测到所述第二图片中存在所述目标物体时，所述目标物体位置获取模块配置为获取所述目标物体的位置信息；

当所述目标物体检测模块检测到在所述第二图片中不存在所述目标物体时，所述目标物体位置获取模块配置为通过设定感兴趣区域并根据所述原始图片在所述感兴趣区域内的信息来确定所述目标物体的位置信息。

根据本发明的一个实施例，当所述目标物体检测模块检测到在所述第二图片中不存在所述目标物体时，所述目标物体位置获取模块配置为：

如果所述目标图片内存在所述目标物体，则将所述感兴趣区域的中心点位置设置为与所述目标图片内的目标物体的中心位置。

根据本发明的一个实施例，如果所述目标图片内不存在所述目标物体，所述目标物体位置获取模块配置为：

对所述目标图片进行运动检测，确定出运动区域；

判断所述运动区域的尺寸大于预设尺寸，如果大于，则将所述感兴趣区域的中心位置设置在所述运动区域的中心位置。

根据本发明的一个实施例，如果所述运动区域的尺寸小于或等于预设尺寸，所述目标物体位置获取模块则配置为随机设定所述感兴趣区域的中心位置。

根据本发明的一个实施例，所述装置还包括：

反馈输出模块，其用于在根据所述目标物体的位置信息定位目标物体的同时，输出与所述目标物体相适应的多模态反馈信息。

相较于现有的智能机器人视觉捕捉方法及装置，本发明所提供的面向智能机器人的视觉捕捉方法及装置通过对原始图片进行缩小处理，并对缩小处理后的图片进行分析，可以有效地减小所需要处理的像素的数量，从而有助于减少视觉捕捉所耗费的时间。同时，当在缩小后的图片中无法检测到目标物体时，该方法通过对原始图片中的感兴趣区域的信息进行二次检测，使得目标检测的运行时间由现有的与距离的平方呈正比，变为与距离的一次方呈正比，这也减少了智能机器人进行视觉捕捉时所耗费的时间。

同时，本发明所提供的面向智能机器人的视觉捕捉方法利用目标图片中目标物体是否存在、目标图片中的运动区域等信息来确定感兴趣区域的位置，这使得本方法能够更加合理、准确地从原始图片中截取出相应的图像，通过这种方式截取出的图像中存在目标物体的概率也将大大增大，从而提高了最终目标物体视觉捕捉的准确性和可靠性。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要的附图做简单的介绍：

图1是根据本发明一个实施例的面向智能机器人的视觉捕捉方法的流程图；

图2是根据本发明另一个实施例的面向智能机器人的视觉捕捉方法的流程图；

图3是根据本发明一个实施例的确定感兴趣区域位置的流程图；

图4是根据本发明一个实施例的面向智能机器人的视觉捕捉装置的结构示意图。

具体实施方式

以下将结合附图及实施例来详细说明本发明的实施方式，借此对本发明如何应用技术手段来解决技术问题，并达成技术效果的实现过程能充分理解并据以实施。需要说明的是，只要不构成冲突，本发明中的各个实施例以及各实施例中的各个特征可以相互结合，所形成的技术方案均在本发明的保护范围之内。

同时，在以下说明中，出于解释的目的而阐述了许多具体细节，以提供对本发明实施例的彻底理解。然而，对本领域的技术人员来说显而易见的是，本发明可以不用这里的具体细节或者所描述的特定方式来实施。

另外，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

在应用于目标检测的一般光学系统中，物体区域在2维图片的像素数通常可以利用如下表达式进行估计：

其中，N表示物体区域在2维图片的像素数，S表示图片的总像素数(即图片分辨率)，d表示物体与镜头之间的距离。

根据表达式(1)可以看出，每当待检测的目标物体(例如人脸)与摄像头之间的距离增大一倍，物体的像的面积将会是之前的1/4。对于现有的目标物体检测方法主要包括：特征提取结合分类器的方法、灰度梯度直方图与支持向量机相结合的方法以及基于卷积神经网络的CNN方法。然而，这些方法在应用的过程中，均要求二维图片中目标物体所占的像素数高于一定阈值K。当二维图片中目标物体所占的像素数小于或等于阈值K时，这些方法将无法从二维图片中检测出目标物体。

同时，目标检测方法在运行需要耗费一定的时间，其所耗费的时间主要取决于特征提取所需的时间，该之间与二维图片的像素数基本呈严格的线性关系，即存在：

T＝C1×S (2)

其中，T表示处理二维图片所耗费的时间，C1表示对二维图片中单位区域进行特征提取所需要的时间。

由此可以看出，为了使得分类器能够检测到人脸，就需要至少满足：

即：

S＝K×d² (4)

而该算法对应的运行时间将为：

T＝C1×K×d² (5)

根据表达式(5)可以看出，算法运行时间T与距离d的平方成正比。假设当前算法检测1米距离内的人脸需要100ms，那么当人脸与物镜之间的距离为4米时所需要的时间则为1600ms。

从上述描述可以看出，对于现有的视觉捕捉方法来说，为了能够从二维图片中检测到目标物体，目标物体与光学系统物镜之间的距离不能过小。而在增大目标物体与光学系统物镜之间的距离的过程中，由于该方法检测目标物体所需要的时间与该距离的平方呈正比，因此该过程将大幅增加检测目标物体所需要的时间。

针对现有技术中所存在的上述问题，本发明首先提供了一种新的面向智能机器人的视觉捕捉方法。该方法通过从原始图片中截取感兴趣区域(Region of Interest，简称ROI)，从而使得对目标物体进行检测所需要的时间与距离的一次方呈正比，从而大幅减小了智能机器人对目标物体进行视觉捕获所需要的时间。

为了更好地阐述本发明所提供的面向智能机器人的视觉捕捉方法的实现原理、实现过程以及优点，以下分别结合不同的实施例来对该方法进行进一步地说明。

实施例一：

图1示出了本实施例所提供的面向智能机器人的视觉捕捉方法的流程图。

如图1所示，该方法首先在步骤S101中对智能机器人获取到的原始图片进行图像缩小处理，得到第二图片。该方法通过对原始图片进行图像缩小，能够缩小原始图片的尺寸，这样有助于减少后续处理中需要处理的像素数。

需要指出的是，在本发明的不同该实施例中，在步骤S101中对原始图片进行图像缩小处理所采用的缩小倍数可以根据实际需要进行设定，本发明不限于此。

在得到第二图片后，该方法在步骤S102中检测第二图片中是否存在目标物体。由于第二图片是通过在步骤S101中对原始图片进行图像缩小处理所得到的图片，因此相较于原始图片，第二图片的尺寸有所减小，其像素数也有所减少。这样，同时对目标物体进行检测，该方法检测第二图片中是否存在目标物体所需要的时间显然要少于检测原始图片中是否存在目标物体所需要的时间。

如图1所示，如果该方法在步骤S102中检测到第二图片中存在目标物体时，此时该方法也就可以在步骤S105中直接获取到目标物体的位置信息。而如果该方法在步骤S102中检测到第二图片中不存在目标物体时，该方法将在步骤S103中设定感兴趣区域，并在步骤S104中根据原始图片在感兴趣区域内的信息来确定目标物体的位置信息。

本实施例中，该方法在步骤S103中所设定的感兴趣区域优选地为尺寸不变的正方形选框。当然，在本发明的其他实施例中，该方法在步骤S103中所设定的感兴趣区域还可以为其他合理形状(例如圆形或矩形等)，本发明不限于此。

根据表达式(1)可知，由于第二图片是对原始图片进行图像缩小处理所得到的，而经过图像缩小处理，第二图片中各个物体的像素数必然将减小。因此该方法在步骤S102中检测到第二图片中不存在目标物体时，并不代表原始图片中必然不存在目标物体，很可能存在由于由原始图片转换为第二图片后，第二图片中目标物体的像素数减少所致。

考虑到上述情况，本实施例所提供的方法通过设定该兴趣区域(即目标物体最为可能存在的区域)来对原始图片进行进一步地分析。

本实施例中，该方法在设定感兴趣区域时，通过提取目标图片并对目标图片进行分析来确定感兴趣区域的位置。其中，目标图片为原始图片所在帧之前预设时长内的图片，其中，目标图片优选地包含四张图片，即目标图片为原始图片所在帧的前4帧的图片。

需要指出是，在本发明的不同实施例中，目标图片中所包含的图片的数量可以根据实际需要进行设定，本发明不限于此。

该方法如果在目标图片中检测到目标物体，那么则将感兴趣区域的中心点位置设置在目标图片内的目标物体的中心位置。由于在各帧图片中，感兴趣区域的大小和位置是不变的，这样在得到感兴趣区域的位置后，该方法便可以利用该感兴趣区域从原始图片中截取相应图片，并通过对截取的图片进行分析来得到目标物体的位置信息，这样也就实现了智能机器人对目标物体的视觉捕捉。

需要说明的是，在本发明的其他实施例中，还可以通过其他合理方式来确定感兴趣区域的位置，本发明不限于此。

从上述描述中可以看出，相较于现有的智能机器人视觉捕捉方法，本实施例所提供的面向智能机器人的视觉捕捉方法通过对原始图片进行缩小处理，并对缩小处理后的图片进行分析，可以有效地减小所需要处理的像素的数量，从而有助于减少视觉捕捉所耗费的时间。同时，当在缩小后的图片中无法检测到目标物体时，该方法通过对原始图片中的感兴趣区域的信息进行二次检测，使得目标检测的运行时间由现有的与距离的平方呈正比，变为与距离的一次方呈正比，这也减少了智能机器人进行视觉捕捉时所耗费的时间。

实施例二：

图2示出了本实施例所提供的面向智能机器人的视觉捕捉方法的流程图。

如图2所示，本实施例所提供的方法首先在步骤S201中对智能机器人获取到的原始图片进行图像缩小处理，得到第二图片。在得到第二图片后，该方法在步骤S202中检测第二图片中是否存在目标物体。如果该方法在步骤S202中检测到第二图片中存在目标物体时，此时该方法也就可以在步骤S203中直接获取到目标物体的位置信息。

需要指出的是，本实施例中步骤S201至步骤S203的实现原理与实现过程分别与实施例一中步骤S101、步骤S102以及步骤S105的实现原理与实现过程类似，故在此不再赘述。

如图2所示，本实施例中，当在步骤S202中检测到第二图片中不存在目标物体时，该方法将在步骤S204中设定感兴趣区域，并在步骤S205中从原始图片中截取感兴趣区域所对应的图像区域，得到第三图片。

本实施例中，该方法在步骤S204中所设定的感兴趣区域优选地为尺寸不变的正方形选框。当然，在本发明的其他实施例中，该方法在步骤S204中所设定的感兴趣区域还可以为其他合理形状(例如圆形或矩形等)，本发明不限于此。

需要指出的是，本实施例中该方法在步骤S204中设定感兴趣的具体方法既可以采用如实施例一所示的方法，也可以采用其他合理的方法，本发明不限于此。

例如，本实施例中，该方法在步骤S204中还可以采用如图3所示的方法来设定感兴趣区域。具体地，如图3所示，该当在步骤S202中检测到第二图片中不存在目标物体时，该方法将在步骤S301中进一步判断目标图片中是否存在目标物体。

本实施例中，目标图片为原始图片所在帧之前预设时长内的图片，其中，目标图片优选地包含四张图片，即目标图片为原始图片所在帧的前4帧的图片。

需要指出的是，在本发明的不同实施例中，目标图片中所包含的图片的数量可以根据实际需要进行设定，本发明不限于此。

如果该方法在步骤S301中检测出目标图片中存在目标物体，那么该方法则会在步骤S302中将感兴趣区域的中心位置设置为目标图片内目标物体的中心位置。

而如果该方法在步骤S301中检测出目标图片中不存在目标物体，那么此时该方法将会在步骤S303中对目标图片进行运动检测，从而确定出运动区域。在确定出运动区域后，该方法会在步骤S304中判断步骤S303中所得到的运动区域的尺寸是否大于预设尺寸。

如果该方法在步骤S303中所得到的运动区域的尺寸大于预设尺寸，那么该方法将在步骤S305中将感兴趣区域的中心位置设置为该运动区域的中心位置。而如果该方法在步骤S303中所得到的运动区域的尺寸小于或等于预设尺寸，那么则表示步骤S303中所得到的运动区域无法用于感兴趣区域的确定，此时该方法则将在步骤S306中随机设定感兴趣区域的中心位置。

需要指出的是，在本发明的其他实施例中，在设定感兴趣区域时，既可以直接通过如图3所示的运动区域来确定感兴趣区域的位置，也可以直接随机设定感兴趣区域的位置，还可以通过其他合理方式来确定感兴趣区域的位置，本发明不限于此。

再次如图2所示，由于在各帧图片中，感兴趣区域的大小和位置是不变的，这样在得到感兴趣区域的位置后，该方法便可以在步骤S205中利用该感兴趣区域从原始图片中截取相应图片，从而得到第三图片。

在得到第三图片后，该方法在步骤S206中检测第三图片中是否存在目标物体。如果在步骤S206中在第三图片中检测到了目标物体，那么此时该方法将会在步骤S207中获取并反回目标物体的位置信息，并在步骤S208中输出与目标物体相应的多模态反馈信息。

本实施例中，该方法在确定出目标物体的位置信息后，还会结合目标物体的位置信息输出相应的语音信息、图片信息或者相应的肢体动作信息，即输出多模态反馈。

当然，在本发明的其他实施例中，该方法在步骤S208中所输出的多模态反馈信息可以是多种多样的，这些多模态反馈信息既可以仅包含以上所列项中的任一项或几项，也可以包含其他未列出的合理项，本发明不限于此。

如图2所示，如果该方法在步骤S206中检测出第三图片中不存在目标物体，那么由于对原始图片的两次检测均未检测到目标物体，因此此时该方法将在步骤S209中返回目标物体检测失败信息，以表示在原始图片中没有正常检测到目标物体。

需要指出的是，本实施例所提供的方法可以应用各种面向智能机器人的视觉捕捉场景，这些场景既可以是对用户人脸的视觉捕捉，也可以是对用户肢体的视觉捕捉，抑或是对其他物体的视觉捕捉，本发明不限于此。

从上述描述中可以看出，本实施例所提供的面向智能机器人的视觉捕捉方法利用目标图片中目标物体是否存在、目标图片中的运动区域等信息来确定感兴趣区域的位置，这使得本实施例所提供的方法在实施例一所提供的方法所具有的优点的基础上，能够更加合理、准确地从原始图片中截取出相应的图像，通过这种方式截取出的图像中存在目标物体的概率也将大大增大，从而提高了最终目标物体视觉捕捉的准确性和可靠性。

本发明还提供了一种面向智能机器人的视觉捕捉装置，图4示出了本实施例中该装置的结构示意图。

如图4所示，本实施例所提供的视觉捕捉装置优选地包括：原始图片缩放模块401、目标物体检测模块402和目标物体位置获取模块403。其中，原始图片缩放模块401用于对智能机器人获取到的原始图片进行图像缩小处理，得到第二图片。该装置通过利用原始图片缩放模块401对原始图片进行图像缩小处理，能够缩小原始图片的尺寸，这样有助于减少后续处理中需要处理的像素数。

需要指出的是，在本发明的不同该实施例中，原始图片缩放模块401对原始图片进行图像缩小处理所采用的缩小倍数可以根据实际需要进行设定，本发明不限于此。

在得到第二图片后，原始图片缩放模块401会将第二图片传输给目标物体检测模块402，以由目标物体检测模块402检测第二图片中是否存在目标物体。由于第二图片是原始图片缩放模块401对原始图片进行图像缩小处理所得到的图片，因此相较于原始图片，第二图片的尺寸有所减小，其像素数也有所减少。这样，同时对目标物体进行检测，该方法检测第二图片中是否存在目标物体所需要的时间显然要少于检测原始图片中是否存在目标物体所需要的时间。

目标物体检测模块402会将第二图片中首付存在目标物体的检测结果传输给目标物体位置获取模块403，以由目标物体位置获取模块403根据目标物体检测模块402的检测结果来采用不同的处理模型确定目标物体的位置信息。

具体地，本实施例中，目标物体检测模块402检测到第二图片中存在目标物体时，那么此时目标物体位置获取模块403可以从第二图片中直接获取到目标物体的位置信息。而如果目标物体检测模块402检测到第二图片中不存在目标物体时，那么此时目标物体位置获取模块403将设定感兴趣区域，并根据原始图片在感兴趣区域内的信息来确定目标物体的位置信息。

其中，目标物体位置获取模块403所设定的感兴趣区域优选地为尺寸不变的正方形选框。当然，在本发明的其他实施例中，目标物体位置获取模块403所设定的感兴趣区域还可以为其他合理形状(例如圆形或矩形等)，本发明不限于此。

本实施例中，目标物体位置获取模块403在设定感兴趣区域时，通过提取目标图片并对目标图片进行分析来确定感兴趣区域的位置。其中，目标图片为原始图片所在帧之前预设时长内的图片，其中，目标图片优选地包含四张图片，即目标图片为原始图片所在帧的前4帧的图片。

需要说明的是，在本发明的其他实施例中，目标物体位置获取模块403还可以通过其他合理方式来确定感兴趣区域的位置，本发明不限于此。

例如在本发明的一个实施例中，当目标物体检测模块402检测到第二图片中不存在目标物体时，目标物体位置获取模块403进一步判断目标图片中是否存在目标物体。

如果此时目标物体位置获取模块403检测出目标图片中存在目标物体，那么目标物体位置获取模块403会将感兴趣区域的中心位置设置为目标图片内目标物体的中心位置。

而如果目标物体位置获取模块403检测出目标图片中不存在目标物体，那么此时目标物体位置获取模块403则会对目标图片进行运动检测，从而确定出运动区域。在确定出运动区域后，目标物体位置获取模块403将进一步判断所得到的运动区域的尺寸是否大于预设尺寸。

如果判断出所得到的运动区域的尺寸大于预设尺寸，那么目标物体位置获取模块403会将感兴趣区域的中心位置这职位该运动区域的中心位置。而如果判断出所得到的运动区域的尺寸小于或等于预设尺寸，那么则表示该运动区域无法用于感兴趣区域的确定，此时目标物体位置获取模块403将随机设定感兴趣区域的中心位置。

需要指出的是，在本发明的其他实施例中，目标物体位置获取模块403在设定感兴趣区域时，既可以直接通过运动区域来确定感兴趣区域的位置，也可以直接随机设定感兴趣区域的位置，还可以通过其他合理方式来确定感兴趣区域的位置，本发明不限于此。

由于在各帧图片中，感兴趣区域的大小和位置是不变的，这样目标物体位置获取模块403在得到感兴趣区域的位置后，便可以利用该感兴趣区域从原始图片中截取相应图片，从而得到第三图片。

在得到第三图片后，目标物体位置获取模块403会检测第三图片中是否存在目标物体。如果在第三图片中检测到了目标物体，那么此时目标物体位置获取模块403将会获取并反回目标物体的位置信息，并利用反馈输出模块404输出与目标物体相应的多模态反馈信息。

本实施例中，在确定出目标物体的位置信息后，该装置还会利用反馈输出模块404结合目标物体的位置信息输出相应的语音信息、图片信息或者相应的肢体动作信息，即输出多模态反馈。

而如果检测出第三图片中不存在目标物体，那么由于对原始图片的两次检测均未检测到目标物体，因此此时目标物体位置获取模块403将返回目标物体检测失败信息，以表示在原始图片中没有正常检测到目标物体。

从上述描述中可以看出，相较于现有的智能机器人视觉捕捉装置，本实施例所提供的面向智能机器人的视觉捕捉装置通过对原始图片进行缩小处理，并对缩小处理后的图片进行分析，可以有效地减小所需要处理的像素的数量，从而有助于减少视觉捕捉所耗费的时间。同时，当在缩小后的图片中无法检测到目标物体时，该装置通过对原始图片中的感兴趣区域的信息进行二次检测，使得目标检测的运行时间由现有的与距离的平方呈正比，变为与距离的一次方呈正比，这也减少了智能机器人进行视觉捕捉时所耗费的时间。

应该理解的是，本发明所公开的实施例不限于这里所公开的特定结构或处理步骤，而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是，在此使用的术语仅用于描述特定实施例的目的，而并不意味着限制。

说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此，说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。

虽然上述示例用于说明本发明在一个或多个应用中的原理，但对于本领域的技术人员来说，在不背离本发明的原理和思想的情况下，明显可以在形式上、用法及实施的细节上作各种修改而不用付出创造性劳动。因此，本发明由所附的权利要求书来限定。

Claims

1.一种面向智能机器人的视觉捕捉方法，其特征在于，包括：

当检测到在所述第二图片中不存在所述目标物体时，分析所述目标物体可能存在的区域，根据分析结果设定感兴趣区域，根据所述原始图片在所述感兴趣区域内的信息来确定所述目标物体的位置信息，其中，

如果所述目标图片内存在所述目标物体，则将所述感兴趣区域的中心点位置设置为所述目标图片内的目标物体的中心位置；

如果所述目标图片内不存在所述目标物体，则对所述目标图片进行运动检测，确定出运动区域，进一步，通过判断所述运动区域的尺寸是否大于预设尺寸确定所述感兴趣区域。

2.如权利要求1所述的方法，其特征在于，当在所述目标物体检测步骤中检测到在所述第二图片中不存在所述目标物体时，在所述目标物体位置获取步骤中，

3.如权利要求2所述的方法，其特征在于，

在判断所述运动区域的尺寸是否大于预设尺寸时，如果大于，则将所述感兴趣区域的中心位置设置在所述运动区域的中心位置。

4.如权利要求3所述的方法，其特征在于，如果所述运动区域的尺寸小于或等于预设尺寸，则随机设定所述感兴趣区域的中心位置。

5.如权利要求1～4中任一项所述的方法，其特征在于，所述方法还包括：

6.一种面向智能机器人的视觉捕捉装置，其特征在于，包括：

当所述目标物体检测模块检测到在所述第二图片中不存在所述目标物体时，所述目标物体位置获取模块配置为分析所述目标物体可能存在的区域，根据分析结果设定感兴趣区域，根据所述原始图片在所述感兴趣区域内的信息来确定所述目标物体的位置信息，其中，

所述目标物体位置获取模块进一步配置为：确定目标图片中是否存在所述目标物体，所述目标图片为所述第二图片所在帧之前预设时长内的图片；

如果所述目标图片内存在所述目标物体，则将所述感兴趣区域的中心点位置设置为与所述目标图片内的目标物体的中心位置；

如果所述目标图片内不存在所述目标物体，所述目标物体位置获取模块还配置为：对所述目标图片进行运动检测，确定出运动区域，进一步，通过判断所述运动区域的尺寸是否大于预设尺寸确定所述感兴趣区域。

7.如权利要求6所述的装置，其特征在于，当所述目标物体检测模块检测到在所述第二图片中不存在所述目标物体时，所述目标物体位置获取模块配置为：

8.如权利要求7所述的装置，其特征在于，如果所述目标图片内不存在所述目标物体，所述目标物体位置获取模块配置为：

9.如权利要求8所述的装置，其特征在于，如果所述运动区域的尺寸小于或等于预设尺寸，所述目标物体位置获取模块则配置为随机设定所述感兴趣区域的中心位置。

10.如权利要求6～9中任一项所述的装置，其特征在于，所述装置还包括：