CN106203299A

CN106203299A - 一种可操控设备的控制方法和装置

Info

Publication number: CN106203299A
Application number: CN201610509806.2A
Authority: CN
Inventors: 毛年; 毛一年; 刘新民
Original assignee: Beijing Airlango Technology Co Ltd
Current assignee: Beijing Airlango Technology Co Ltd
Priority date: 2016-06-30
Filing date: 2016-06-30
Publication date: 2016-12-07
Also published as: US10710244B2; WO2018001245A1; US20180001480A1

Abstract

本发明提供一种可操控设备的控制方法和装置，该方法包括：获取操作者的第一人体姿态信息；利用所述第一人体姿态信息查询预先配置的人体姿态信息与操作指令的对应关系，得到所述第一人体姿态信息对应的操作指令；执行所述第一人体姿态信息对应的操作指令。通过本发明的技术方案，可操控设备可以基于操作者的人体姿态信息，自动执行人体姿态信息对应的操作指令，不需要操作者使用手动遥控器控制可操控设备执行相关操作，操作者的操作难度较低，使可操控设备更容易的被消费者接受，可操控设备得到更广泛的使用。

Description

一种可操控设备的控制方法和装置

技术领域

本发明涉及智能技术领域，尤其涉及一种可操控设备的控制方法和装置。

背景技术

近年来，各种类型的机器人(Robot)，如民用无人机、工业类机器人、消费类机器人等，在技术和市场方面发展迅猛，机器人是自动执行工作的机器装置，是依靠自身动力和控制能力来实现各种功能的机器。机器人可以接受人类指挥，也可以运行预先编排的程序，还可以根据以人工智能制定的策略行动。

当前的机器人，都是操作者使用手动遥控器控制机器人执行相关操作。具体的，操作者使用手动遥控器，通过无线方式向机器人下发操作命令，机器人在接收到该操作命令后，执行该操作命令指定的操作，从而完成相关功能。

但是，上述方式对操作者的入门要求很高，操作者的操作难度很高。

发明内容

本发明提供一种可操控设备的控制方法，应用在可操控设备上，包括：

获取操作者的第一人体姿态信息；

利用所述第一人体姿态信息查询预先配置的人体姿态信息与操作指令的对应关系，得到所述第一人体姿态信息对应的操作指令；

执行所述第一人体姿态信息对应的操作指令。

在一个例子中，所述可操控设备上还包括摄像头，所述获取操作者的第一人体姿态信息的过程，具体包括：

通过所述摄像头采集第一图像，并从所述第一图像中定位出待检测人物；

利用所述待检测人物的特征信息，判断所述待检测人物是否为操作者；

如果是，则基于所述第一图像分析出所述操作者的第一人体姿态信息。

在一个例子中，所述利用所述待检测人物的特征信息，判断所述待检测人物是否为操作者的过程，具体包括：

当所述特征信息为所述待检测人物在所述第一图像中的人脸特征信息时，则比较所述待检测人物的人脸特征信息，与预先配置的操作者的人脸特征信息，如果二者的相似度大于预设阈值，则确定所述待检测人物是操作者；或者，

当所述特征信息为所述待检测人物在第二图像中的第二人体姿态信息时，判断所述待检测人物的第二人体姿态信息，是否匹配预先配置的姿态密码；如果是，确定所述待检测人物是操作者；否则，确定所述待检测人物不是操作者。

在一个例子中，所述姿态密码是用于表示操作者的姿态或者手势，且匹配到所述姿态密码表示允许开启操作指令。

在一个例子中，所述基于所述第一图像分析出所述操作者的第一人体姿态信息的过程，具体包括：

从所述第一图像中定位出所述操作者对应的区域；

对所述区域进行特征提取，得到第一特征向量；

比较所述第一特征向量与每个姿态模版的相似度，其中，针对操作者的每个姿态维护一个姿态模版，且所述姿态模版包括所述姿态对应的第二特征向量；

选取相似度最大的姿态模版的姿态为所述操作者的第一人体姿态信息。

所述可操控设备具体为：智能机器人、智能拍摄无人机、智能相机；

所述第一人体姿态信息包括：静态姿态信息和/或动态姿态信息，其中，所述静态姿态信息包括肢体的状态信息，所述动态姿态信息包括肢体的动作信息；所述操作指令包括：行动指令、拍照指令、自动充电指令、回到原点指令。

本发明提供一种可操控设备的控制装置，应用在可操控设备上，包括：

第一获取模块，用于获取操作者的第一人体姿态信息；

第二获取模块，用于利用所述第一人体姿态信息查询预先配置的人体姿态信息与操作指令的对应关系，得到所述第一人体姿态信息对应的操作指令；

操作模块，用于执行所述第一人体姿态信息对应的操作指令。

在一个例子中，所述可操控设备上还包括摄像头；所述第一获取模块，具体用于在获取操作者的第一人体姿态信息的过程中，通过所述摄像头采集第一图像，并从所述第一图像中定位出待检测人物；利用所述待检测人物的特征信息，判断所述待检测人物是否为操作者；如果是，则基于所述第一图像分析出所述操作者的第一人体姿态信息。

在一个例子中，所述第一获取模块，具体用于在利用所述待检测人物的特征信息，判断所述待检测人物是否为操作者的过程中，当所述特征信息为所述待检测人物在所述第一图像中的人脸特征信息时，则比较所述待检测人物的人脸特征信息，与预先配置的操作者的人脸特征信息，如果二者的相似度大于预设阈值，则确定所述待检测人物是操作者；或者，当所述特征信息为所述待检测人物在第二图像中的第二人体姿态信息时，判断所述待检测人物的第二人体姿态信息，是否匹配预先配置的姿态密码；如果是，确定所述待检测人物是操作者；否则，确定所述待检测人物不是操作者。

在一个例子中，所述第一获取模块，具体用于在基于所述第一图像分析出所述操作者的第一人体姿态信息的过程中，从第一图像中定位出所述操作者对应的区域；对所述区域进行特征提取，得到第一特征向量；比较所述第一特征向量与每个姿态模版的相似度，其中，针对操作者的每个姿态维护一个姿态模版，所述姿态模版包括所述姿态对应的第二特征向量；选取相似度最大的姿态模版的姿态为所述操作者的第一人体姿态信息。

本发明提供一种可操控设备的控制方法，应用于包括可操控设备和服务端的网络中，所述可操控设备上包括摄像头，该方法应用在服务端上，包括：

接收所述可操控设备通过所述摄像头采集到的图像；

利用所述图像获取操作者的第一人体姿态信息；

将所述第一人体姿态信息对应的操作指令发送给所述可操控设备，以使所述可操控设备执行所述第一人体姿态信息对应的操作指令。

本发明提供一种可操控设备的控制装置，应用于包括可操控设备和服务端的网络中，所述可操控设备上包括摄像头，该装置应用在服务端上，包括：

接收模块，用于接收所述可操控设备通过所述摄像头采集到的图像；

第一获取模块，用于利用所述图像获取操作者的第一人体姿态信息；

发送模块，用于将所述第一人体姿态信息对应的操作指令发送给所述可操控设备，以使所述可操控设备执行所述第一人体姿态信息对应的操作指令。

基于上述技术方案，本发明实施例中，可操控设备可以基于操作者的人体姿态信息，自动执行该人体姿态信息对应的操作指令，而不需要操作者使用手动遥控器控制可操控设备执行相关操作，对操作者的入门要求较低，且操作者的操作难度较低，使可操控设备能够更容易的被消费者接受，使得可操控设备得到更广泛的使用。而且，可操控设备的执行效果更好，执行准确度很高。

附图说明

为了更加清楚地说明本发明实施例或者现有技术中的技术方案，下面将对本发明实施例或者现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是本发明一种实施方式中的可操控设备的控制方法的流程图；

图2是本发明另一种实施方式中的可操控设备的控制方法的流程图；

图3是本发明另一种实施方式中的可操控设备的控制方法的流程图；

图4是本发明一种实施方式中的可操控设备的硬件结构图；

图5是本发明一种实施方式中的可操控设备的控制装置的结构图；

图6是本发明一种实施方式中的服务端的硬件结构图；

图7是本发明另一种实施方式中的可操控设备的控制装置的结构图。

具体实施方式

在本发明使用的术语仅仅是出于描述特定实施例的目的，而非限制本发明。本发明和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其它含义。还应当理解，本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本发明可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本发明范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，此外，所使用的词语“如果”可以被解释成为“在......时”或“当......时”或“响应于确定”。

针对现有技术中存在的问题，本发明实施例中提出了一种可操控设备的控制方法，该方法可以应用在可操控设备上，该可操控设备具体可以包括但不限于：智能机器人、智能拍摄无人机、智能相机等。其中，该智能机器人可以为工业类机器人、消费类机器人等。该智能机器人是自动执行工作的机器装置，是依靠自身动力和控制能力来实现各种功能的机器，可以接受人类指挥，也可以运行预先编排的程序，还可以根据以人工智能制定的策略行动。在一个例子中，可操控设备可以应用在游戏场景、人像拍照(如航拍)、人机互动等场景。

在上述应用场景下，如图1所示，该可操控设备的控制方法包括以下步骤：

步骤101，获取操作者的第一人体姿态信息。

步骤102，利用该第一人体姿态信息查询预先配置的人体姿态信息与操作指令的对应关系，得到该第一人体姿态信息对应的操作指令。

步骤103，执行该第一人体姿态信息对应的操作指令。

针对步骤101，在一个例子中，该第一人体姿态信息具体可以包括但不限于：静态姿态信息和/或动态姿态信息。其中，该静态姿态信息具体可以包括：肢体的状态信息，例如，一只手的大臂与小臂成90度弯曲。此外，该动态姿态信息具体可以包括：肢体的动作信息，例如，一只手从左向右的挥动。

针对步骤101，可操控设备上还可以包括摄像头，该摄像头可以是单目摄像头，或者双目摄像头，或者非可见光的摄像头(例如红外线感光成像)。

基于此摄像头，在该可操控设备的控制方法中，针对步骤101，如图2所示，获取操作者的第一人体姿态信息的过程，具体可以包括但不限于如下步骤：

步骤201，通过摄像头采集第一图像，并从第一图像中定位出待检测人物。

步骤202，利用该待检测人物的特征信息，判断该待检测人物是否为操作者。如果是，则执行步骤203；如果否，则返回步骤201，继续采集第一图像。

步骤203，基于该第一图像分析出操作者的第一人体姿态信息。

在一个例子中，当第一人体姿态信息为静态姿态信息时，可以通过一个图像就分析出操作者的静态姿态信息，因此，通过摄像头采集的第一图像的数量可以为一个，也可以为多个，并可以基于一个或者多个第一图像分析出操作者的第一人体姿态信息。当第一人体姿态信息为动态姿态信息时，需要通过多个图像才能够分析出操作者的动态姿态信息，因此，通过摄像头采集的第一图像的数量可以为多个，这多个第一图像是一组连续的图像，可以为一个视频，且可以基于这多个第一图像分析出操作者的第一人体姿态信息。

针对步骤201，操作者在控制可操控设备启动之后，可操控设备通过摄像头在目标区域内采集第一图像。如果第一图像中有人物出现，将该人物作为待检测人物，并从第一图像中定位出该待检测人物。如果第一图像中没有人物出现，则在目标区域内采集新的第一图像，以此类推，一直到采集到包含待检测人物的第一图像。其中，可操控设备在目标区域内采集新的第一图像的过程中，可以通过在目标区域内移动和/或转动方向，以在目标区域内采集新的第一图像。

针对可操控设备从第一图像中定位出待检测人物的过程，由于第一图像中除了包含待检测人物，还可能包含其它信息，如待检测人物后面的树木、旁边的花草、小河等，因此，可操控设备需要从第一图像中定位出待检测人物。其中，在从第一图像中定位出待检测人物的过程中，可以通过人体轮廓、人脸识别、或深度学习等方式，对第一图像进行全局人体搜索，以定位出待检测人物。

针对步骤202，利用该待检测人物的特征信息，判断该待检测人物是否为操作者的过程，具体可以包括但不限于如下方式：方式一、当该特征信息为待检测人物在第一图像中的人脸特征信息时，则可以比较待检测人物的人脸特征信息，与预先配置的操作者的人脸特征信息，如果二者的相似度大于预设阈值，则确定该待检测人物是操作者；否则，确定该待检测人物不是操作者。或者，方式二、当该特征信息为待检测人物在第二图像中的第二人体姿态信息时，则可以判断待检测人物的第二人体姿态信息，是否匹配预先配置的姿态密码；如果是，确定该待检测人物是操作者；否则，确定该待检测人物不是操作者。

当然，在实际应用中，并不局限于上述两种方式来确定待检测人物是否为操作者，还可以使用其它特征，如人体特征(体态+步行的姿态)，衣服的颜色+帽子，身高+眉毛等等，来确定待检测人物是否为操作者，对此方式不做限制。

针对方式一，可以在可操控设备上预先配置操作者的人脸特征信息，在从第一图像中定位出待检测人物之后，基于人脸识别技术，比较该待检测人物的人脸特征信息，与预先配置的操作者的人脸特征信息，如果二者的相似度大于预设阈值，则确定该待检测人物是操作者；否则确定该待检测人物不是操作者。

在一个例子中，可以采用特征匹配算法，比较待检测人物的人脸特征信息，与预先配置的操作者的人脸特征信息。在一种可行的特征匹配算法中，从第一图像中提取待检测人物的人脸特征信息，如提取Haar(哈尔)特征、LBP(Local Binary Pattern，局部二值模式)特征、HOG(Histogram of Oriented Gradients，方向梯度直方图)特征等。之后，将提取出的待检测人物的人脸特征信息作为输入发送到分类器，如SVM(Support VectorMachine，支持向量机)分类器、CC(Cascade Classifier，级联分类器)等。分类器对待检测人物的人脸特征信息进行打分评判，得出待检测人物的人脸特征信息与预先配置的操作者的人脸特征信息的相似度，继而基于二者的相似度确定该待检测人物是否是操作者。

针对方式二，为了快速识别出待检测人物是否是操作者，可以在可操控设备上预先配置姿态密码，该姿态密码是用于表示操作者的姿态或者手势(如该姿态密码可以是一个不常用的特殊姿态或者手势)，且匹配到该姿态密码表示允许可操控设备开启操作指令。例如，该姿态密码可以是一只手大臂与小臂成90度弯曲，大臂与肩膀同高，小臂向上，同时另一只手伸直约成45度角斜向下，这样的姿态形成了一个姿态密码，当然，这只是姿态密码的一个示例，实际应用中可以任意配置，本申请实施例中对此姿态密码不做限制。基于此姿态密码，可操控设备可快速识别出操作者，同时家人、办公室同事等其它知道姿态密码的操作者，也可快速识别出操作者，时间效率和准确度都很高。

在通过摄像头采集第一图像之前，还可以通过摄像头采集第二图像，并从第二图像中定位出待检测人物，并基于第二图像分析出待检测人物的第二人体姿态信息。如果待检测人物的第二人体姿态信息匹配预先配置的姿态密码，则认为在之后的预设时间内(如3分钟)，采集到的第一图像中的待检测人物都是操作者，在预设时间之后，则需要重新采集第二图像。如果待检测人物的第二人体姿态信息不匹配预先配置的姿态密码，则需要重新采集第二图像。

在一个例子中，第一图像和第二图像只是为了区分方便，给出的一个示例。第二图像的作用是为了区分出待检测人物的第二人体姿态信息是否匹配预先配置的姿态密码。而第一图像的作用是为了分析出操作者的第一人体姿态信息。

在一个例子中，基于第二图像分析出待检测人物的第二人体姿态信息，并判断第二人体姿态信息是否匹配姿态密码的过程，可以包括但不限于如下方式：从第二图像中定位出待检测人物对应的区域；对该区域进行特征提取，得到第一特征向量，该第一特征向量就是待检测人物的第二人体姿态信息。进一步的，比较该第一特征向量与姿态密码对应的第二特征向量的相似度。如果二者的相似度大于预设阈值，则确定该第二人体姿态信息匹配姿态密码。如果二者的相似度不大于预设阈值，则确定该第二人体姿态信息不匹配姿态密码。

在一个例子中，姿态密码可以是用于识别操作者的一个标识，可以预先配置到可操控设备上(如由厂家直接配置在可操控设备上，也可以由用户自定义到可操控设备上)，也可以由可操控设备主动学习该姿态密码。针对可操控设备主动学习该姿态密码的过程，可以让操作者摆出该姿态密码的姿势或者手势，由可操控设备采集此时的图像，这个图像就是正样本图像。还可以让操作者摆出不是该姿态密码的姿势或者手势，由可操控设备采集此时的图像，这个图像就是负样本图像。可操控设备获得大量的正样本图像和大量的负样本图像后，就可以使用这些正样本图像和负样本图像训练SVM分类器，得到姿态密码对应的第二特征向量，对训练过程不再详加赘述。在将第一特征向量输入到SVM分类器后，SVM分类器就可以比较出第一特征向量与第二特征向量的相似度。

当然，在实际应用中，并不局限于采用上述SVM分类器来训练出姿态密码对应的第二特征向量，例如，还可以采用深度学习网络等其它方式，训练出姿态密码对应的第二特征向量，并使用深度学习网络来比较出第一特征向量与第二特征向量的相似度，本申请实施例中对此方式不做具体限制。

针对步骤202，在利用待检测人物的特征信息，判断待检测人物是否为操作者后，如果该待检测人物不是操作者，则在目标区域通过摄像头采集包含另一待检测人物的第一图像，并从第一图像中定位出待检测人物，继续执行步骤202。

针对步骤203，基于第一图像分析出操作者的第一人体姿态信息的过程，可以包括但不限于如下方式：从第一图像中定位出操作者对应的区域；对该区域进行特征提取，得到第一特征向量；比较第一特征向量与每个姿态模版的相似度，针对操作者的每个姿态维护一个姿态模版，且姿态模版包括姿态对应的第二特征向量；选取相似度最大的姿态模版的姿态为操作者的第一人体姿态信息。

在一个例子中，针对每个姿态(是指需要对应操作指令的每个姿态)，可以让操作者摆出该姿态，由可操控设备采集此时的图像，这个图像就是正样本图像。还可以让操作者不摆出该姿态，由可操控设备采集此时的图像，这个图像就是负样本图像。可操控设备在获得大量的正样本图像和大量的负样本图像后，就可以使用这些正样本图像和负样本图像训练SVM分类器，得到该姿态对应的第二特征向量，对训练过程不再详加赘述。进一步的，维护该姿态的姿态模版，且该姿态模版包括姿态对应的该第二特征向量。姿态模版可以是在用户使用可操控设备之前预先定义的，也可以是用户自身定义的。在将第一特征向量输入到SVM分类器之后，SVM分类器就可以比较出第一特征向量与第二特征向量的相似度，继而可以选取出相似度最大的姿态模版的姿态。针对相似度最大的姿态模版的姿态，如果第一特征向量与该姿态对应的第二特征向量的相似度大于预设阈值，则将该姿态确定为操作者的第一人体姿态信息；如果第一特征向量与该姿态对应的第二特征向量的相似度不大于预设阈值，则该姿态不是操作者的第一人体姿态信息，继续采集图像以分析出第一人体姿态信息。

当然，在实际应用中，并不局限于采用上述SVM分类器来训练出姿态对应的第二特征向量，例如，还可以采用深度学习网络等其它方式，训练出姿态对应的第二特征向量，并使用深度学习网络来比较出第一特征向量与第二特征向量的相似度，本申请实施例中对此方式不做具体限制。

针对步骤102，在利用第一人体姿态信息查询预先配置的人体姿态信息与操作指令的对应关系，得到该第一人体姿态信息对应的操作指令之前，还可以在可操控设备上预先配置人体姿态信息与操作指令的对应关系，即需要首先定义一系列的人体姿态信息(即姿态)，以及每个人体姿态信息对应的操作指令。

在一个例子中，在可操控设备出厂前，可以在可操控设备上预先配置人体姿态信息和操作指令的对应关系。或者，可以在可操控设备出厂后，通过有线方式或者无线方式将人体姿态信息和操作指令的对应关系配置到可操控设备上。或者，在可操控设备出厂前，可以在可操控设备上预先配置人体姿态信息，在可操控设备出厂后，可以通过有线方式或者无线方式将人体姿态信息对应的操作指令配置到可操控设备上。或者，在可操控设备出厂前，可以在可操控设备上预先配置操作指令，在可操控设备出厂后，可以通过有线方式或者无线方式将操作指令对应的人体姿态信息配置到可操控设备上。

针对步骤103，在执行该第一人体姿态信息对应的操作指令的过程中，该操作指令可以包括但不限于：行动指令、拍照指令、自动充电指令、回到原点指令。例如，对于智能拍摄无人机来说，这个操作指令可以是行动指令(例如向某个方向飞行1米)，也可以是拍照指令，还可以是一组复杂动作的总体指令(例如原地转360度拍出多张照片，然后合成全景照片)。此外，对于智能机器人来说，这个操作指令可以是回到充电装置自动充电，还可以是把某个物品放置回到原点等。此外，对于智能相机来说，这个操作指令可以是拍照指令，例如在3秒后进行拍照或者在5秒后进行拍照等。当然，上述过程只是给出了操作指令的几个示例，在实际应用中，并不局限于上述操作指令，对于智能机器人、智能拍摄无人机、智能相机，操作指令等可操控设备，其对应的操作指令可以相同，也可以不同，本申请实施例对此操作指令不做限制。

在一个例子中，还可以在可操控设备上部署处理器，并由处理器完成上述各个步骤，即由处理器获取操作者的第一人体姿态信息；由处理器利用该第一人体姿态信息查询预先配置的人体姿态信息与操作指令的对应关系，得到该第一人体姿态信息对应的操作指令；由处理器执行该第一人体姿态信息对应的操作指令；由处理器从第一图像中定位出待检测人物；由处理器利用该待检测人物的特征信息，判断该待检测人物是否为操作者；由处理器基于该第一图像分析出操作者的第一人体姿态信息等；对于处理器的操作，在此不再重复赘述。

在一个例子中，可操控设备上部署的处理器具体可以包括但不限于：专用处理器ASIC(Application Specific Integrated Circuit，专用集成电路)，半定制处理器FPGA(Field Programmable Gate Array，现场可编程门阵列)，或者通用处理器CPU(CentralProcessing Unit，中央处理器)等。

基于与上述方法同样的发明构思，本发明实施例中还提供了一种可操控设备的控制方法，应用于包括可操控设备和服务端的网络中，可操控设备上包括摄像头，该可操控设备的控制方法可以应用在服务端上，如图3所示，包括：

步骤301，接收所述可操控设备通过所述摄像头采集到的图像。

步骤302，利用所述图像获取操作者的第一人体姿态信息。

步骤303，利用所述第一人体姿态信息查询预先配置的人体姿态信息与操作指令的对应关系，得到所述第一人体姿态信息对应的操作指令。

步骤304，将所述第一人体姿态信息对应的操作指令发送给所述可操控设备，以使所述可操控设备执行所述第一人体姿态信息对应的操作指令。

在一个例子中，服务端可以通过有线方式或者无线方式与可操控设备交互。

在一个例子中，服务端利用图像(后续将其称为第一图像)获取操作者的第一人体姿态信息的过程，可以包括但不限于如下方式：从第一图像中定位出待检测人物；利用所述待检测人物的特征信息，判断所述待检测人物是否为操作者；如果是，则基于所述第一图像分析出所述操作者的第一人体姿态信息。

在一个例子中，服务端利用所述待检测人物的特征信息，判断所述待检测人物是否为操作者的过程，可以包括但不限于如下方式：当所述特征信息为所述待检测人物在所述第一图像中的人脸特征信息时，则服务端比较所述待检测人物的人脸特征信息，与预先配置的操作者的人脸特征信息，如果二者的相似度大于预设阈值，则服务端确定所述待检测人物是操作者；或者，当所述特征信息为所述待检测人物在第二图像中的第二人体姿态信息时，服务端判断所述待检测人物的第二人体姿态信息，是否匹配预先配置的姿态密码；如果是，确定所述待检测人物是操作者；否则，确定所述待检测人物不是操作者。

在一个例子中，服务端基于所述第一图像分析出所述操作者的第一人体姿态信息的过程，可以包括但不限于如下方式：从所述第一图像中定位出所述操作者对应的区域；对所述区域进行特征提取，得到第一特征向量；比较所述第一特征向量与每个姿态模版的相似度，其中，针对操作者的每个姿态维护一个姿态模版，且所述姿态模版包括所述姿态对应的第二特征向量；选取相似度最大的姿态模版的姿态为所述操作者的第一人体姿态信息。

基于与上述方法同样的发明构思，本发明实施例中还提供了一种可操控设备的控制装置，应用在可操控设备上。该可操控设备的控制装置可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在的可操控设备的处理器，读取非易失性存储器中对应的计算机程序指令形成的。从硬件层面而言，如图4所示，为本发明提出的可操控设备的控制装置所在的可操控设备的一种硬件结构图，除了图4所示的处理器、非易失性存储器外，可操控设备还包括其他硬件，如负责处理报文的转发芯片、网络接口、内存等；从硬件结构上来讲，该可操控设备还可能是分布式设备，可能包括多个接口卡，以便在硬件层面进行报文处理的扩展。

如图5所示，为本发明提出的可操控设备的控制装置的结构图，所述可操控设备的控制装置应用在可操控设备上，且所述可操控设备的控制装置包括：

第一获取模块11，用于获取操作者的第一人体姿态信息；

第二获取模块12，用于利用所述第一人体姿态信息查询预先配置的人体姿态信息与操作指令的对应关系，得到所述第一人体姿态信息对应的操作指令；

操作模块13，用于执行所述第一人体姿态信息对应的操作指令。

在一个例子中，所述可操控设备上还包括摄像头；所述第一获取模块11，具体用于在获取操作者的第一人体姿态信息的过程中，通过所述摄像头采集第一图像，并从所述第一图像中定位出待检测人物；利用所述待检测人物的特征信息，判断所述待检测人物是否为操作者；如果是，则基于所述第一图像分析出所述操作者的第一人体姿态信息。

在一个例子中，所述第一获取模块11，具体用于在利用所述待检测人物的特征信息，判断所述待检测人物是否为操作者的过程中，当所述特征信息为所述待检测人物在所述第一图像中的人脸特征信息时，则比较所述待检测人物的人脸特征信息，与预先配置的操作者的人脸特征信息，如果二者的相似度大于预设阈值，则确定所述待检测人物是操作者；或者，当所述特征信息为所述待检测人物在第二图像中的第二人体姿态信息时，判断所述待检测人物的第二人体姿态信息，是否匹配预先配置的姿态密码；如果是，确定所述待检测人物是操作者；否则，确定所述待检测人物不是操作者。

在一个例子中，所述第一获取模块11，具体用于在基于所述第一图像分析出所述操作者的第一人体姿态信息的过程中，从第一图像中定位出所述操作者对应的区域；对所述区域进行特征提取，得到第一特征向量；比较所述第一特征向量与每个姿态模版的相似度，其中，针对操作者的每个姿态维护一个姿态模版，所述姿态模版包括所述姿态对应的第二特征向量；选取相似度最大的姿态模版的姿态为所述操作者的第一人体姿态信息。

其中，本发明装置的各个模块可以集成于一体，也可以分离部署。上述模块可以合并为一个模块，也可以进一步拆分成多个子模块。

基于与上述方法同样的发明构思，本发明实施例中还提供了一种可操控设备的控制装置，该可操控设备的控制装置应用在服务端上。该可操控设备的控制装置可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在的服务端的处理器，读取非易失性存储器中对应的计算机程序指令形成的。从硬件层面而言，如图6所示，为本发明提出的可操控设备的控制装置所在的服务端的一种硬件结构图，除了图6所示的处理器、非易失性存储器外，服务端还包括其他硬件，如负责处理报文的转发芯片、网络接口、内存等；从硬件结构上来讲，该服务端还可能是分布式设备，可能包括多个接口卡，以便在硬件层面进行报文处理的扩展。

如图7所示，为本发明提出的可操控设备的控制装置的结构图，应用于包括可操控设备和服务端的网络中，所述可操控设备上包括摄像头，所述可操控设备的控制装置应用在服务端上，且所述可操控设备的控制装置具体包括：

接收模块21，用于接收所述可操控设备通过所述摄像头采集到的图像；

第一获取模块22，用于利用所述图像获取操作者的第一人体姿态信息；

第二获取模块23，用于利用所述第一人体姿态信息查询预先配置的人体姿态信息与操作指令的对应关系，得到所述第一人体姿态信息对应的操作指令；

发送模块24，用于将所述第一人体姿态信息对应的操作指令发送给所述可操控设备，以使所述可操控设备执行所述第一人体姿态信息对应的操作指令。

在一个例子中，所述第一获取模块22，具体用于在利用所述图像获取操作者的第一人体姿态信息的过程中，从所述图像中定位出待检测人物；利用所述待检测人物的特征信息，判断所述待检测人物是否为操作者；如果是，则基于所述图像(后续将其称为第一图像)分析出所述操作者的第一人体姿态信息。

在一个例子中，所述第一获取模块22，具体用于在利用所述待检测人物的特征信息，判断所述待检测人物是否为操作者的过程中，当所述特征信息为所述待检测人物在所述第一图像中的人脸特征信息时，则比较所述待检测人物的人脸特征信息，与预先配置的操作者的人脸特征信息，如果二者的相似度大于预设阈值，则确定所述待检测人物是操作者；或者，当所述特征信息为所述待检测人物在第二图像中的第二人体姿态信息时，判断所述待检测人物的第二人体姿态信息，是否匹配预先配置的姿态密码；如果是，确定所述待检测人物是操作者；否则，确定所述待检测人物不是操作者。

在一个例子中，所述第一获取模块22，具体用于在基于所述第一图像分析出所述操作者的第一人体姿态信息的过程中，从第一图像中定位出所述操作者对应的区域；对所述区域进行特征提取，得到第一特征向量；比较所述第一特征向量与每个姿态模版的相似度，其中，针对操作者的每个姿态维护一个姿态模版，所述姿态模版包括所述姿态对应的第二特征向量；选取相似度最大的姿态模版的姿态为所述操作者的第一人体姿态信息。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。本领域技术人员可以理解附图只是一个优选实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中，也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块，也可进一步拆分成多个子模块。上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

以上公开的仅为本发明的几个具体实施例，但是，本发明并非局限于此，任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims

1.一种可操控设备的控制方法，其特征在于，应用在可操控设备上，包括：

获取操作者的第一人体姿态信息；

执行所述第一人体姿态信息对应的操作指令。

2.根据权利要求1所述的方法，其特征在于，所述可操控设备上还包括摄像头，所述获取操作者的第一人体姿态信息的过程，具体包括：

3.根据权利要求2所述的方法，其特征在于，所述利用所述待检测人物的特征信息，判断所述待检测人物是否为操作者的过程，具体包括：

4.根据权利要求3所述的方法，其特征在于，所述姿态密码是用于表示操作者的姿态或者手势，且匹配到所述姿态密码表示允许开启操作指令。

5.根据权利要求2所述的方法，其特征在于，所述基于所述第一图像分析出所述操作者的第一人体姿态信息的过程，具体包括：

从所述第一图像中定位出所述操作者对应的区域；

对所述区域进行特征提取，得到第一特征向量；

6.根据权利要求1-5任一项所述的方法，其特征在于，

7.一种可操控设备的控制装置，其特征在于，应用在可操控设备上，包括：

第一获取模块，用于获取操作者的第一人体姿态信息；

8.根据权利要求7所述的装置，其特征在于，所述可操控设备上还包括摄像头；所述第一获取模块，具体用于在获取操作者的第一人体姿态信息的过程中，通过所述摄像头采集第一图像，并从所述第一图像中定位出待检测人物；利用所述待检测人物的特征信息，判断所述待检测人物是否为操作者；如果是，则基于所述第一图像分析出所述操作者的第一人体姿态信息。

9.根据权利要求8所述的装置，其特征在于，所述第一获取模块，具体用于在利用所述待检测人物的特征信息，判断所述待检测人物是否为操作者的过程中，当所述特征信息为所述待检测人物在所述第一图像中的人脸特征信息时，则比较所述待检测人物的人脸特征信息，与预先配置的操作者的人脸特征信息，如果二者的相似度大于预设阈值，则确定所述待检测人物是操作者；或者，当所述特征信息为所述待检测人物在第二图像中的第二人体姿态信息时，判断所述待检测人物的第二人体姿态信息，是否匹配预先配置的姿态密码；如果是，确定所述待检测人物是操作者；否则，确定所述待检测人物不是操作者。

10.根据权利要求9所述的装置，其特征在于，所述姿态密码是用于表示操作者的姿态或者手势，且匹配到所述姿态密码表示允许开启操作指令。

11.根据权利要求8所述的装置，其特征在于，所述第一获取模块，具体用于在基于所述第一图像分析出所述操作者的第一人体姿态信息的过程中，从第一图像中定位出所述操作者对应的区域；对所述区域进行特征提取，得到第一特征向量；比较所述第一特征向量与每个姿态模版的相似度，其中，针对操作者的每个姿态维护一个姿态模版，所述姿态模版包括所述姿态对应的第二特征向量；选取相似度最大的姿态模版的姿态为所述操作者的第一人体姿态信息。

12.根据权利要求7-11任一项所述的装置，其特征在于，

13.一种可操控设备的控制方法，应用于包括可操控设备和服务端的网络中，可操控设备上包括摄像头，其特征在于，该方法应用在服务端上，包括：

接收所述可操控设备通过所述摄像头采集到的图像；

利用所述图像获取操作者的第一人体姿态信息；

14.一种可操控设备的控制装置，应用于包括可操控设备和服务端的网络中，可操控设备上包括摄像头，其特征在于，该装置应用在服务端上，包括：