CN110059678A

CN110059678A - 一种检测方法、装置及计算机可读存储介质

Info

Publication number: CN110059678A
Application number: CN201910306808.5A
Authority: CN
Inventors: 梅嵩; 蔡海蛟; 冯歆鹏; 周骥
Original assignee: Kunshan Zhaoguan Electronic Technology Co Ltd; Shanghai Zhao Ming Electronic Technology Co Ltd
Current assignee: Kunshan Zhaoguan Electronic Technology Co Ltd; Shanghai Zhao Ming Electronic Technology Co Ltd; NextVPU Shanghai Co Ltd
Priority date: 2019-04-17
Filing date: 2019-04-17
Publication date: 2019-07-26

Abstract

本发明提供了一种检测方法、装置及计算机可读存储介质，方法包括：获取待检测对象的至少一帧第一待检测图像，从至少一帧第一待检测图像中检测包含预设指示物的指示物图像区域；由指示物图像区域调整摄像头焦距，并再次获取待检测对象的、与至少一帧第一待检测图像相比具有更高成像放大率的第二待检测图像；由第二待检测图像确定待检测区域。利用上述方法，可以去除了不必要的识别区域、且具有更为清晰的识别区域，使得后续的文字或特定物识别更加高效、准确、且低功耗。

Description

一种检测方法、装置及计算机可读存储介质

技术领域

本申请涉及图像识别技术领域，尤其涉及一种检测方法、装置及计算机可读存储介质。

背景技术

目前，在很多应用领域中存在图像识别需求，比如文字检测需求与特定物识别需求，现有技术中，以文字检测为例，文字检测技术主要包括：基于传统计算机视觉的文字检测，以及基于人工智能的深度学习文字检测。但是，在实际应用中，基于传统计算机视觉的文字检测方式受到光线、噪点、背景图片等因素的影响，文字检测和识别的准确率很低；而基于人工智能的深度学习文字检测方式采用基于卷积神经网络(CNN)，虽然大部分情况下文字检测和识别的准确率较高，但是其运行对硬件资源要求高、运行速度较慢、功耗高，而且文字检测设备需要有图像处理单元(GPU)的支持，然而诸如手机、智能眼镜等便携式电子设备上的硬件资源有限且电池容量有限，使得深度学习文字检测在便携式电子设备上运行的难度较大，用户体验很差。同样地，上述问题同时存在于其他图像识别技术领域中，比如特定物识别领域。

因此，需要一种运行速度快、功耗低、准确率高、尤其适合于在便携式电子设备上运行的检测方法。

发明内容

本申请实施例提供一种用于检测方法和装置、设备和计算机可读存储介质，用以解决现有技术中的如下技术问题：现有的检测方式受到光线、噪点、背景图片等因素的影响，识别的准确率很低，或者对硬件资源要求高、运行速度较慢、功耗高。

本发明提供了以下方案。

一种检测方法，其特征在于，包括：

获取待检测对象的至少一帧第一待检测图像；

从所述至少一帧第一待检测图像中检测包含预设指示物的指示物图像区域；

由所述指示物图像区域调整摄像头焦距，并再次获取所述待检测对象的、与所述至少一帧第一待检测图像相比具有更高成像放大率的第二待检测图像；

由所述第二待检测图像确定待检测区域。

可选地，其中，所述由所述指示物图像区域调整摄像头焦距，包括：

将所述摄像头的焦点调整至所述指示物图像区域，并将所述摄像头焦距调大。

可选地，其中，所述由所述第二待检测图像确定待检测区域，包括：

从所述第二待检测图像中检测到包含所述预设指示物的另一指示物图像区域，确定所述另一指示物图像区域位置上方的区域/或以所述另一指示物图像区域位置为中心的区域为所述待检测区域；或

从所述第二待检测图像中未检测到包含所述预设指示物，则确定所述第二待检测图像的整体区域为所述待检测区域。

可选地，其中，其特征在于，所述预设指示物是带有指示特性的指针、指尖部分或指甲。

可选地，其中，所述方法还包括：

由所确定的待检测区域进行文字识别，并对所识别的文字信息进行语音播报。

可选地，其中，所述方法还包括：

若由所确定的待检测区域并未检测到包含文字信息，则进一步对所述待检测区域进行特定物识别，并对所述特定物识别的识别结果进行语音播报，其中，所述特定物识别包括现金识别、商品种类识别、人脸识别、光照识别、颜色识别中的至少一种。

可选地，其中，所述方法还包括：

在语音播报过程中，获取至少一帧第三待检测图像，并从所述至少一帧第三待检测图像中检测预设手势特征；

由所检测到的预设手势特征触发执行对应的预设语音播报操作。

可选地，其中，所述预设手势特征包括至少一种预定手势形状和/或至少一种预定手势动作。

可选地，其中，所述执行对应的预设语音播报操作，包括以下中的至少一种：

暂停当前播报内容、重复当前播报内容、切换为日期/时间播报、跳转至当前播放内容之前的播放内容、跳转至当前播放内容之后的播放内容；

其中，所述当前播报内容是在检测到所述预设手势特征的时刻正在播报的识别内容。

一种检测装置，其特征在于，包括：

图像获取模块，用于获取待检测对象的至少一帧第一待检测图像；

检测模块，用于从所述至少一帧第一待检测图像中检测包含预设指示物的指示物图像区域；

调整模块，用于由所述指示物图像区域调整摄像头焦距，并再次获取所述待检测对象的、与所述至少一帧第一待检测图像相比具有更高成像放大率的第二待检测图像；

确定模块，用于由所述第二待检测图像确定待检测区域。

可选地，其中，所述调整模块进一步用于：

可选地，其中，所述确定模块进一步用于：

从所述第二待检测图像中检测到包含所述预设指示物的另一指示物图像区域，确定所述另一指示物图像区域位置上方的区域/或以所述另一指示物图像区域位置为中心的区域为所述待检测区域；

可选地，其中，所述预设指示物是带有指示特性的指针、指尖部分或指甲。

可选地，其中，所述装置还包括播报模块，用于：

可选地，其中，所述播报模块还用于：

可选地，其中，所述装置还包括手势控制模块，用于：

可选地，其中，所述执行对应的预设语音播报操作，所述执行对应的预设语音播报操作，包括以下中的至少一种：

一种检测装置，其特征在于，包括：

一个或者多个多核处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或者多个多核处理器执行时，使得所述一个或多个多核处理器实现：

获取待检测对象的至少一帧第一待检测图像；

由所述第二待检测图像确定待检测区域。

一种计算机可读存储介质，所述计算机可读存储介质存储有程序，当所述程序被多核处理器执行时，使得所述多核处理器执行如上所述的方法。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：通过在用户使用指示物(带有指示特性的指针、指尖部分或指甲部分等指示物) 来指示目标区域时，根据识别出的指示物的位置获得由该指示物所指向的区域的局部放大图像，进而可以去除了不必要的识别区域，使得后续的识别(比如文字识别与特定物识别)更加高效且低功耗，并且，由于该局部放大图具有更为清晰的视觉效果，能够更加准确地进行检测识别。

应当理解，上述说明仅是本发明技术方案的概述，以便能够更清楚地了解本发明的技术手段，从而可依照说明书的内容予以实施。为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举说明本发明的具体实施方式。

附图说明

通过阅读下文的示例性实施例的详细描述，本领域普通技术人员将明白本文所述的有点和益处以及其他优点和益处。附图仅用于示出示例性实施例的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的标号表示相同的部件。在附图中：

图1为根据本发明一实施例的检测方法的流程示意图；

图2a为根据本发明一实施例的待检测对象的示意图；

图2b为根据本发明一实施例的待检测区域的示意图；

图2c为根据本发明又一实施例的待检测区域的示意图；

图2d为根据本发明又一实施例的待检测区域的示意图；

图2e为根据本发明又一实施例的待检测区域的示意图；

图2f为根据本发明又一实施例的待检测区域的示意图；

图3为根据本发明一实施例的检测方法的流程示意图；

图4为根据本发明一实施例的检测装置的结构示意图；

图5为根据本发明又一实施例的检测装置的结构示意图；

图6为根据本发明一实施例的可读存储介质的结构示意图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

在本发明中，应理解，诸如“包括”或“具有”等术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在，并且不旨在排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在的可能性。

另外还需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

图1为根据本申请一实施例的检测方法的流程示意图。在该流程中，从设备角度而言，执行主体可以是一个或者多个便携式电子设备，例如可穿戴式智能阅读器、桌面式智能阅读器、智能手机、智能眼镜、智能眼睛等，更具体地可以是与这些设备中的摄像头关联的功能模块；从程序角度而言，执行主体相应地可以是搭载于这些便携式电子设备上的程序，例如语言翻译应用、文字识别应用、文字播报应用等。

图1中的流程可以包括以下步骤S101～S104。

S101：获取待检测对象的至少一帧第一待检测图像；

S102：从至少一帧第一待检测图像中检测包含预设指示物的指示物图像区域；

在本发明中，待检测对象可以是用户希望进行文字识别或特定物识别的任何物体，比如报纸、书籍、指示牌等。该第一待检测图像是由摄像装置取景范围所确定的至少一帧图像，可以通过各种方式获取，例如通过摄像头拍摄获取，可以通过定时拍照获取的多帧图片或者通过录像获取一段视频流数据，当然待检测图像也可以有其它来源，例如来自其它设备，或者也可以是现成的图像，本发明对此不进行限制。另外，这里对该第一待检测图像的分辨率要求可以较低，甚至可以是便携式电子设备通过摄像头拍摄的预览图，因此需要进行图像处理的数据量少，有利于提高处理速度。当然，该待检测图像也可以是摄像头拍摄的图片照片而非预览图。

在一实施例中，该预设指示物优选是带有指示特性的指针、指尖部分或指甲。当检测该预设指示物(例如指甲)时，可以采用现有可用的来自OpenCV 的算法来实现，例如采用OpenCV中的CascadeClassifier函数 (https://docs.opencv.org/3.2.0/d1/de5/classcv_1_1CascadeClassifier. html)来实现。另外，指示物图像区域可以是从待检测图像中确定的包含预设指示物的轮廓区域。

S103：由指示物图像区域调整摄像头焦距，并再次获取待检测对象的、与至少一帧第一待检测图像相比具有更高成像放大率的第二待检测图像；

具体地，在该第一待检测图像中，由该指示物所指向的位置确定局部放大图像作为该第二待检测图像，去除了不必要的识别区域。

在一实施例中，由指示物图像区域调整摄像头焦距优选可以是将摄像头的焦点调整至指示物图像区域，并将摄像头焦距调大。可以理解，摄像头的焦距决定了拍摄的被摄物体在成像平面上所形成影像的大小。假设以相同的距离面对同一被摄体进行拍摄，那么镜头的焦距越长，则被摄体在胶片或影像传感器上所形成的影像的放大倍率就越大，由此在调整摄像头焦距后再次获取的该第二待检测图像相应具有更清晰的视觉效果。

S104：由第二待检测图像确定待检测区域。

举例来说，参见图2a，当用户采用一具有文字识别功能的头戴式智能设备看公交站牌时，可以看出，原始获取的待检测图像中无需进行文字识别的区域占比较大，比如站牌中的线条部分，用户无兴趣的车站内容，此时若采用整图识别的方式，一方面会导致大量额外的识别工作，另一方面由于需要进行文字识别的区域的画面分辨率较低，会导致较低的识别准确率。本实施例中，用户通过手指指向想要阅读的文字位置，进而可以从待检测图像中检测包含手指特征的指示物图像区域A，利用该区域A的位置信息，头戴式智能设备的摄像装置自动调焦至该区域A附近，如图2b所示，当调焦完成后，对该待检测物体重新拍摄一帧具有更高成像放大率的第二待检测图像，并由第二待检测图像确定待检测区域，进而实现精准识别局部文字信息的目的。

本发明中，通过在用户使用指示物(带有指示特性的指针、指尖部分或指甲部分等指示物)来指示目标区域时，能够获得由该指示物所指向的部分区域的局部放大图像，去除了不必要的识别区域，且具有更为清晰的视觉效果，也即更加准确地根据识别出的指示物的位置确定该指示物所指向的图像中精确的内容部分(即目标待检测区域)，这使得后续的识别更加高效。另外，这里对该第二待检测图像的分辨率要求可以比第一待检测图像的分辨率要求更高，因此提供给图像识别处理的数据量多，有利于提高识别准确度。

基于图1的检测方法，本申请的一些实施例还提供了该检测方法的一些具体实施方案，以及扩展方案，下面进行说明。

在一实施例中，步骤S104，由第二待检测图像确定待检测区域，可以对该第二待检测图像再次进行预设指示物的检测，并由所确定的另一预设指示物图像区域的位置确定该待检测区域，具体包括：

其中，若从第二待检测图像中检测到包含预设指示物的另一指示物图像区域，则可以确定另一指示物图像区域位置上方的区域/或以另一指示物图像区域位置为中心的区域为待检测区域。

相反地，若从第二待检测图像中未检测到包含预设指示物，则确定第二待检测图像的整体区域为待检测区域。

在本发明中，该另一指示物图像区域位置上方的区域是指图像中纵坐标大于另一指示物图像区域位置的纵坐标的区域，不仅仅局限于该另一指示物图像区域位置正上方的图像区域，还包括与该正上方的图像区域平行的其它图像区域，也就是说，指示物图像区域位置上方的区域包括图像中所有纵坐标大于指示物图像区域位置的纵坐标的区域。以另一指示物图像区域位置为中心的区域是指在该第二待检测图像中，以该另一指示物图像区域的位置作为几何中心，向外扩展出一预设大小与形状的区域作为该待检测区域，该区域优选为矩形区域。

举例来说，本实施例中，参见图2b与图2c，若对第二待检测图像中再次进行预设指示物检测后发现仍然包含该预设指示物，则可以将该预设指示物的上方一区域(图2c中的区域B)作为待检测区域；参见图2d与图2e，若对第二待检测图像中再次进行预设指示物检测后发现仍然包含该预设指示物，还可以将以该预设指示物为几何中心的一矩形区域作为待检测区域(图2d、图2e 中的区域C)，并再次对所确定的待检测区域摄取至少一张不包含预设指示物的图片(图2e)进行检测，从而可以避免由于该预设指示物遮挡而遗漏识别内容；参见图2f，若该第二待检测图像中不包含该预设指示物，则可以将第二待预测图像的整体区域(图2f中的区域D)作为该待检测区域，从而可以避免由于该预设指示物遮挡而遗漏识别内容。

在一实施例中，进一步地，由于对于视障人员来说，接收文字信息内容的一种较佳方案是采用语音播报，因此，在确定待检测区域之后。该方法还可以包括：由所确定的待检测区域进行文字识别，并对所识别的文字信息进行语音播报。

可选地，除了上述语音播报方式，也可以采用其他方式将该文字信息内容告知该视障人员，比如导出可触摸的盲文信息、或利用预定规则的振动方式，本发明对此不作限制。

在一实施例中，进一步地，当进行如上述的文字识别时，由于用户的指向误差，以及用户可能存在除文字识别之外的其他识别需求，所确定的待检测区域中实际上可能不包含文字信息，基于此，本实施例提出：若由所确定的待检测区域并未检测到包含文字信息，则进一步对待检测区域进行特定物识别，并对特定物识别的识别结果进行语音播报，其中，特定物识别包括现金识别、商品种类识别、人脸识别、光照识别、颜色识别中的至少一种。由此，可以在待检测区域不包含文字信息时，向视障人员传达正确的识别内容。

举例来说，大部分低视力、视弱人士对于辨别现金的金额都普遍存在困难。因此，本发明可以提前对各种金额的现金进行预先特征采集及训练，并通过语音的方式进行命名，进而可以通过上述现金识别功能识别现金后自动播报现金种类及金额。又例如，对于部分低视力用户来说，当碰到熟人时即使离得很近都分不清他/她到底是谁。因此，本发明可以提前对特定人员的肖像信息进行实现采集、训练，并通过语音的方式进行命名。进而可以通过上述人脸识别功能识别特定人后自动播报该特定人的名称/称谓。

在一实施例中，进一步地，由于在实际播报过程中存在很多交互需求，比如，用户想要暂停当前播报内容、用户想要迅速跳转播放至之前或之后的内容，等等。而当前通常采用的语音交互方式在一些特殊场景下极为不便，而若不采用交互操作又需要用户重新指向需要识别的区域或者进行其他额外的操作，基于此，参见图3，本发明还可以包括：

S301：在语音播报过程中，获取摄像头取景范围内的至少一帧第三待检测图像，并从至少一帧第三待检测图像中检测预设手势特征；

S302：由所检测到的预设手势特征触发执行对应的预设语音播报操作。

其中，若S101中的获取待检测对象的至少一帧第一待检测图像这一步骤处于语音播报过程中，则可以将上述至少一帧第一待检测图像作为该至少一帧第三待检测图像进行后续的手势检测。

本发明中，由于该检测方法本身需要由摄像装置获取待检测图像，并进行图像分析，因此本实施例中，无需另外植入语音交互功能，通过对待检测图像进行上述手势识别即可实现更便捷的交互功能。

在一实施例中，预设手势特征包括至少一种预定手势形状和/或至少一种预定手势动作。其中，对上述至少一帧第三待检测图像进行图像分析，通过将每一帧图像中的特征轮廓与至少一种预定手势形状比对后确定预定手势形状；且由于第三待检测图像包括至少一帧，可以对每帧图像的手势进行分析后获得手势的移动轨迹，进而确定预定手势动作。举例来说，预设手势可以是比如握拳手势、张开手掌手势(掌心面向摄像装置)、张开手掌手势(掌心背向摄像装置)等，还可以包括比如伸出食指向上挥动的手势、伸出食指向下挥动的手势等。此外，对于行动不便的用户，该预设手势特征还可以拓展为包括用户所持对象的形状及动作，本申请对此不作具体限制。

在一实施例中，执行对应的预设语音播报操作，包括以下中的至少一种：暂停当前播报内容、重复当前播报内容、切换为日期/时间播报、跳转至当前播放内容之前的播放内容、跳转至当前播放内容之后的播放内容。其中，当前播报内容是在检测到预设手势特征的时刻正在播报的识别内容。

举例来说，当检测到的预设手势特征为张开手掌手势(掌心背向摄像装置)，则所触发执行的对应的预设语音播报操作可以是暂停当前播报内容；当检测到的预设手势特征为张开手掌手势(掌心面向摄像装置)，则所触发执行的对应的预设语音播报操作可以是重复当前播报内容；当检测到的预设手势特征为握拳手势，则所触发执行的对应的预设语音播报操作可以是切换为日期/时间播报；当检测到的预设手势特征为伸出食指向上挥动的手势，则所触发执行的对应的预设语音播报操作可以是跳转至当前播放内容之后的播放内容；当检测到的预设手势特征为伸出食指向下挥动的手势，则所触发执行的对应的预设语音播报操作可以是跳转至当前播放内容之前的播放内容。

其中，该预设手势特征及其对应的需触发执行的预设语音播报操作可以根据用户实际使用需求进行设定，本申请仅以上述手势为例进行描述，但对此不作具体限定。

需要说明的是，上面列举的一些具体示例反映了本申请方案的思想，但是并非是唯一实施形式，基于本申请方案的思想，能够得到更多的类似示例。

基于同样的思路，本申请的一些实施例还提供了上述方法对应的检测装置、设备和非易失性计算机存储介质。

图4示出了一种检测装置的结构示意图，该装置用于执行如图1所示出的检测方法，参见图4，该装置具体包括：

图像获取模块401，用于获取待检测对象的至少一帧第一待检测图像；

检测模块402，用于从通过摄像头捕获的至少一帧第一待检测图像中检测包含预设指示物的指示物图像区域；

调整模块403，用于由指示物图像区域调整摄像头焦距，并再次获取待检测对象的、与至少一帧第一待检测图像相比具有更高成像放大率的第二待检测图像；

具体地，上述调整模块403所调整的摄像头焦距可以是上述图像获取模块 401的摄像头焦距，并由该图像获取模块401再次获取该具有更高成像放大率的第二待检测图像；上述调整模块403所调整的摄像头焦距也可以是除了该图像获取模块401之外的其它摄像装置的摄像头焦距，并由其它摄像装置再次获取该第二待检测图像，本申请对此不作具体限定。

确定模块404，用于由第二待检测图像确定待检测区域。

举例来说，参见图2a，当用户采用一具有文字识别功能的头戴式智能设备阅读报纸时，可以看出，原始获取的待检测图像中无需进行文字识别的区域占比较大，比如报纸中的附图部分，用户无兴趣的广告文字内容，此时若采用整图识别的方式，一方面会导致大量额外的识别工作，另一方面由于需要进行文字识别的区域的画面分辨率较低，会导致较低的识别正确率。本实施例中，用户通过手指指向想要阅读的文字位置，进而可以从待检测图像中检测包含手指特征的指示物图像区域，利用该区域A的位置信息，头戴式智能设备的摄像装置自动调焦至该区域A附近，如图2b所示，当调焦完成后，对该待检测物体重新拍摄一帧具有更高成像放大率的第二待检测图像，并由第二待检测图像确定待检测区域，进而实现精准识别局部文字信息的目的。

本发明中，通过在用户使用指示物(带有指示特性的指针、指尖部分或指甲部分等指示物)来指示目标区域时，能够获得由该指示物所指向的部分区域的局部放大图像，去除了不必要的识别区域，且具有更为清晰的视觉效果，也即更加准确地根据识别出的指示物的位置确定该指示物所指向的图像中精确的内容部分(即目标待检测区域)，这使得后续的图像识别更加高效。另外，这里对该第二待检测图像的分辨率要求可以比第一待检测图像的分辨率要求更高，因此提供给图像识别处理的数据量多，有利于提高识别准确度。

可选地，其中，调整模块403进一步用于：

将摄像头的焦点调整至指示物图像区域，并将摄像头焦距调大。

可选地，其中，确定模块404进一步用于：

从第二待检测图像中检测到包含预设指示物的另一指示物图像区域，确定另一指示物图像区域位置上方的区域/或以另一指示物图像区域位置为中心的区域为待检测区域；

从第二待检测图像中未检测到包含预设指示物，则确定第二待检测图像的整体区域为待检测区域。

可选地，其中，预设指示物是带有指示特性的指针、指尖部分或指甲。

可选地，其中，装置还包括播报模块，用于：

可选地，其中，播报模块还用于：

若由所确定的待检测区域并未检测到包含文字信息，则进一步对待检测区域进行特定物识别，并对特定物识别的识别结果进行语音播报，其中，特定物识别包括现金识别、商品种类识别、人脸识别、光照识别、颜色识别中的至少一种。

可选地，其中，装置还包括手势控制模块，用于：

在语音播报过程中，获取至少一帧第三待检测图像，并从至少一帧第三待检测图像中检测预设手势特征；

可选地，其中，预设手势特征包括至少一种预定手势形状和/或至少一种预定手势动作。

可选地，其中，执行对应的预设语音播报操作，执行对应的预设语音播报操作，包括以下中的至少一种：

其中，当前播报内容是在检测到预设手势特征的时刻正在播报的识别内容。

图5示出了又一种检测装置的结构示意图。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为设备、方法或计算机可读存储介质。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“设备”。

在一些可能的实施方式中，本发明的一种检测装置可以至少包括一个或多个处理器、以及至少一个存储器。其中，所述存储器存储有程序，当所述程序被所述处理器执行时，使得所述处理器执行如图1所示的步骤：

S101：获取待检测对象的至少一帧第一待检测图像；

S102：从所述至少一帧第一待检测图像中检测包含预设指示物的指示物图像区域；

S103：由所述指示物图像区域调整摄像头焦距，并再次获取所述待检测对象的、与所述至少一帧第一待检测图像相比具有更高成像放大率的第二待检测图像；

S104：由所述第二待检测图像确定待检测区域。

下面参照图5来描述根据本发明的这种实施方式的检测装置5。图5显示的装置5仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示，装置5可以以通用计算设备的形式表现，包括但不限于：至少一个处理器10、至少一个存储器20、连接不同设备组件的总线60。

总线60包括数据总线、地址总线和控制总线。

存储器20可以包括易失性存储器，例如随机存取存储器(RAM)21和 /或高速缓存存储器22，还可以进一步包括只读存储器(ROM)23。

存储器20还可以包括程序模块24，这样的程序模块24包括但不限于：操作设备、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

装置5还可以与一个或多个外部设备2(例如键盘、指向设备、蓝牙设备等)通信，也可与一个或者多个其他设备进行通信。这种通信可以通过输入/输出(I/O)接口40进行，并在显示单元30上进行显示。并且，装置5 还可以通过网络适配器50与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器50通过总线60与装置5中的其它模块通信。应当明白，尽管图中未示出，但可以结合装置5使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID设备、磁带驱动器以及数据备份存储设备等。

图6示出了一种计算机可读存储介质，用于执行如上所述的方法。

在一些可能的实施方式中，本发明的各个方面还可以实现为一种计算机可读存储介质的形式，其包括程序代码，当所述程序代码在被处理器执行时，所述程序代码用于使所述处理器执行上面描述的方法。

上面描述的方法包括了上面的附图中示出和未示出的多个操作和步骤，这里将不再赘述。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的设备、设备或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表) 包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器 (RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

如图6所示，描述了根据本发明的实施方式的计算机可读存储介质60，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本发明的计算机可读存储介质不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行设备、设备或者器件使用或者与其结合使用。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

此外，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本发明的精神和原理，但是应该理解，本发明并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims

1.一种检测方法，其特征在于，包括：

获取待检测对象的至少一帧第一待检测图像；

由所述第二待检测图像确定待检测区域。

2.如权利要求1所述的检测方法，其特征在于，所述由所述指示物图像区域调整摄像头焦距，包括：

3.如权利要求1所述的检测方法，其特征在于，所述由所述第二待检测图像确定待检测区域，包括：

4.如权利要求1-3中任一项所述的检测方法，其特征在于，所述预设指示物是带有指示特性的指针、指尖部分或指甲。

5.如权利要求1所述的检测方法，其特征在于，所述方法还包括：

6.如权利要求5所述的检测方法，其特征在于，所述方法还包括：

7.如权利要求1所述的检测方法，其特征在于，所述方法还包括：

8.如权利要求7所述的检测方法，其特征在于，所述预设手势特征包括至少一种预定手势形状和/或至少一种预定手势动作。

9.如权利要求7所述的检测方法，其特征在于，所述执行对应的预设语音播报操作，包括以下中的至少一种：

10.一种检测装置，其特征在于，包括：

确定模块，用于由所述第二待检测图像确定待检测区域。

11.如权利要求10所述的检测装置，其特征在于，所述调整模块进一步用于：

12.如权利要求10所述的检测装置，其特征在于，所述确定模块进一步用于：

13.如权利要求10-12中任一项所述的检测装置，其特征在于，所述预设指示物是带有指示特性的指针、指尖部分或指甲。

14.如权利要求10所述的检测装置，其特征在于，所述装置还包括播报模块，用于：

15.如权利要求14所述的检测装置，其特征在于，所述播报模块还用于：

16.如权利要求10所述的检测装置，其特征在于，所述装置还包括手势控制模块，用于：

17.如权利要求16所述的检测装置，其特征在于，所述预设手势特征包括至少一种预定手势形状和/或至少一种预定手势动作。

18.如权利要求16所述的检测装置，其特征在于，所述执行对应的预设语音播报操作，所述执行对应的预设语音播报操作，包括以下中的至少一种：

19.一种检测装置，其特征在于，包括：

一个或者多个多核处理器；

存储器，用于存储一个或多个程序；

获取待检测对象的至少一帧第一待检测图像；

由所述第二待检测图像确定待检测区域。

20.一种计算机可读存储介质，所述计算机可读存储介质存储有程序，当所述程序被多核处理器执行时，使得所述多核处理器执行如权利要求1-9中任一项所述的方法。