WO2020073245A1

WO2020073245A1 - 手势识别方法、vr视角控制方法以及vr系统

Info

Publication number: WO2020073245A1
Application number: PCT/CN2018/109698
Authority: WO
Inventors: 郑欣
Original assignee: 深圳市道通智能航空技术有限公司
Priority date: 2018-10-10
Filing date: 2018-10-10
Publication date: 2020-04-16
Also published as: CN113039550A

Abstract

一种手势识别方法、VR视角控制方法及VR系统。该手势识别方法包括：获取深度信息（310）；根据所述深度信息，获取空间点云信息（320）；确定所述空间点云信息中的目标区域，所述目标区域指包含手部点云信息的区域（330）；生成与所述目标区域对应的平面图像（340）；提取所述平面图像中手部的边缘点（350）；根据所述手部的边缘点，确定所述手部中手指的数量（360）；根据所述手指的数量，确定所述手部的手势（370）。该方法通过几何形态分析来实现手势的检测和识别，不需要依靠机器学习等样本学习算法，可以有效的降低手势识别的运算量的同时保证较高的手势识别率，满足低功耗、低时延以及低算力平台的应用要求。

Description

手势识别方法、VR视角控制方法以及VR系统

【技术领域】

本发明涉及虚拟现实技术领域，尤其涉及一种手势识别方法、VR视角控制方法及VR系统。

【背景技术】

虚拟现实(Virtual Reality VR)是一种利用相关设备，产生模拟度极高的模拟环境，通过三维交互、仿真等方式使用户沉浸在模拟环境中，以获得极佳的使用体验的技术。

典型的虚拟现实是通过佩戴在用户头部的VR眼镜等类似设备来实现的。这些VR眼镜需要包覆式的罩套在用户的头部。因此，当佩戴VR眼镜时，用户不方便通过遥控器等传统的操作方式实现VR视野调整。

现有一些通过位置传感器，采集用户头部位置变化来调整VR视野的操作方式。但是，由于佩戴在用户头部的VR眼镜重量和体积较大，通过转头调整视野的操作非常容易令用户感到疲劳并加重用户使用VR眼镜时的眩晕感。

随着技术发展，手势操作可能是一种能够满足使用需要的，较好的控制操作方式。但是，对于手势的检测和识别过程需要耗费非常大的运算量，使得手势操作的应用受到了很大的局限，如何有效的简化手势识别算法的复杂程度是一个迫切需要解决的问题。

【发明内容】

为了解决上述技术问题，本发明实施例提供一种可以降低手势检测所需运算量的手势识别方法、VR视角控制方法及VR系统。

为解决上述技术问题，本发明实施例提供以下技术方案：一种手势识别方法。该手势识别方法包括：获取深度信息；根据所述深度信息，获取空间点云信息；确定所述空间点云信息中的目标区域，所述目标区域指包含手部点云信息的区域；生成与所述目标区域对应的平面图像；提取所述平面图像中手部的边缘点；根据所述手部的边缘点，确定所述手部中手指的数量；根据所述手指的数量，确定所述手部的手势。

可选地，所述获取所述深度信息包括：通过深度传感器获取所述深度信息。

可选地，所述确定所述空间点云信息中的目标区域，包括抽取预设距离之内的点云信息作为所述目标区域。

可选地，所述方法还包括：过滤所述目标区域中的噪点。

可选地，所述过滤所述目标区域中的噪点，包括通过最大连通域算法，过滤所述目标区域中的噪点。

可选地，所述生成与所述目标区域对应的所述平面图像，包括：将所述目标区域中的点云信息映射到二维空间，以生成所述目标区域对应的所述平面图像。

可选地，所述提取所述平面图像中所述手部的所述边缘点，包括：采用摩尔邻域(Moore Neighborhood)法，提取所述平面图像中所述手部的所述边缘点。

可选地，所述根据所述手部的所述边缘点，确定所述手部中所述手指的数量，包括：根据所述手部的所述边缘点，找出凸包(Convec Hull)点；确定所述凸包点为所述手指的指尖；根据所述指尖的数量，确定所述手部中所述手指的数量。

可选地，所述根据所述手部的所述边缘点，找出所述凸包点，包括：利用葛立恒扫描法(Graham's scan)找出所述凸包点。

可选地，所述确定所述凸包点为所述手指的所述指尖，包括：从所述手部的所述边缘点中，选取分别位于所述凸包点两侧且与所述凸包点相邻的第一边缘点和第二边缘点，以计算所述凸包点与所述第一边缘点连成的直线和所述凸包点与所述第二边缘点连成的直线之间的夹角；其中，所述第一边缘点和所述第二边缘点与所述凸包点位于同一根手指，且所述第一边缘点与所述凸包点之间、以及所述第二边缘点与所述凸包点之间间隔预设数量的边缘点；判断所述夹角是否在第一预设范围内；若是，则确定所述凸包点为所述手指的指尖。

可选地，所述判断所述夹角是否在所述第一预设范围内，包括：计算所述夹角：

其中，θ为所述夹角，P _i为所述凸包点，P _l为所述第一边缘点，P _r为所述第二边缘点；判断所述夹角是否小于预设值；若是，则确定所述凸包点为所述手指的指尖。

可选地，所述预设值在20°至60°之间取值。

可选地，所述第一边缘点与所述凸包点之间、以及所述第二边缘点与所述凸包点之间间隔10-50个边缘点。

可选地，所述方法还包括：判断所述平面图像中是否存在手部。

可选地，所述判断所述平面图像中是否存在手部，包括：计算候选点中每一个所述候选点与每一个所述边缘点之间的距离，所述候选点为所述边缘点围合范围内的点；确定最大距离对应的候选点为所述手部的手掌的掌心；计算任意两个相邻的所述指尖与所述掌心的连线形成的夹角；判断所述夹角是否在第二预设范围内；若是，则确定所述平面图像中存在手部。

可选地，所述判断所述平面图像中是否存在手部，包括：计算候选点中每一个所述候选点与每一个所述边缘点之间的距离，所述候选点为所述边缘点围合范围内的点；确定最大距离对应的候选点为所述手部的手掌的掌心；计算任意两个相邻的所述指尖与所述掌心的连线形成的夹角之和；判断所述夹角之和是否超过180°；若是，则确定所述平面图像中存在手部。

可选地，该方法还包括：判断所述平面图像中是否存在手部。

可选地，所述判断所述平面图像中是否存在手部，包括：计算候选点中每一个所述候选点与每一个所述边缘点之间的距离，所述候选点为所述边缘点围合范围内的点；确定最大距离为所述手部的手掌的最大内接圆的半径；判断所述半径是否在第三预设范围内；若是，则确定所述平面图像中存在手部。

可选地，所述判断所述平面图像中是否存在所述手部，包括：根据所述手指的数量，判断所述平面图像中是否存在所述手部。

为解决上述技术问题，本发明实施例还提供以下技术方案：一种VR视角控制方法。其中，所述VR视角控制方法包括：

应用如上所述的手势识别方法，确定用户手部的手势；根据所述用户手部的手指，调整VR视角。

可选地，所述根据所述用户手掌的手指，调整VR视角，包括：根据所述用户手部的手指数量，识别当前用户手部的手势；通过所述用户手部的手势，调整拍摄设备的位置和朝向；跟随所述拍摄设备的位置和朝向变化来改变VR视角。

可选地，该方法还包括：应用如上述所述的手势识别方法，确定所述哟用户手部的掌心位置；根据所述用户手部的掌心位置，调整VR视角。

为解决上述技术问题，本发明实施例还提供以下技术方案：一种VR系统。其中，所述VR系统包括：移动载具、拍摄设备、深度传感器、控制器以及VR显示设备；所述拍摄设备和所述深度传感器均设置在所述移动载具上；

所述VR显示设备与所述拍摄设备通信连接，用于根据所述拍摄设备采集的视频图像信息生成对应的VR场景；

所述控制器用于使用如上所述的手势识别方法，根据所述深度传感器获取的深度信息识别用户的手势，并且根据所述手势，调整所述VR显示设备的VR视角。

可选地，所述控制器具体用于：根据所述手指的数量识别用户手部的手势，并且根据所述手势，控制所述拍摄设备的姿态和所述移动载具的移动。

可选地，所述控制器还用于使用如上述所述的手势识别方法，获取所述用户的掌心位置，并根据所述掌心位置，调整所述VR显示设备的VR视角。

可选地，所述控制器具体用于根据所述掌心位置，确定所述掌心位置与所述移动载具之间的相对位置，以控制所述拍摄设备的姿态和所述移动载具的移动。

可选地，所述拍摄设备搭载于所述移动载具的前部，所述深度传感器搭载于所述移动载具的后部。

可选地，所述移动载具为无人机。

可选地，所述拍摄设备通过云台搭载于所述移动载具。

与现有技术相比较，本发明实施例提供的手势识别方法，通过生成用户手部空间点云和平面图像来提取用户手部的边缘点来实现手势的检测和识别，不需要依靠机器学习等样本学习算法，算法实现的结构简单，有效的降低手势识别的运算量的同时保证较高的手势识别率，可以很好的应用于低功耗、低成本或者对时延较为敏感的平台。

【附图说明】

一个或多个实施例通过与之对应的附图中的图片进行示例性说明，这些示例性说明并不构成对实施例的限定，附图中具有相同参考数字标号的元件表示为类似的元件，除非有特别申明，附图中的图不构成比例限制。

图1为本发明实施例提供的VR系统的应用环境示意图；

图2为本发明实施例提供的控制器的结构框图；

图3为本发明实施例提供的手势识别方法的方法流程图；

图4为本发明实施例提供的手指的指尖识别示意图；

图5为本发明实施例提供的手势数量与手势动作的匹配示意图；

图6为本发明另一实施例提供的手势识别方法的方法流程图；

图7为本发明实施例提供的判断平面图像中是否存在手部的方法流程图；

图8为本发明另一实施例提供的判断平面图像中是否存在手部的方法流程图。

【具体实施方式】

为了便于理解本发明，下面结合附图和具体实施例，对本发明进行更详细的说明。需要说明的是，当元件被表述“固定于”另一个元件，它可以直接在另一个元件上、或者其间可以存在一个或多个居中的元件。当一个元件被表述“连接”另一个元件，它可以是直接连接到另一个元件、或者其间可以存在一个或多个居中的元件。本说明书所使用的术语“上”、“下”、“内”、“外”、“底部”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”“第三”等仅用于描述目的，而不能理解为指示或暗示相对重要性。

除非另有定义，本说明书所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本说明书中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是用于限制本发明。本说明书所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

此外，下面所描述的本发明不同实施例中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

图1为本发明实施例提供的VR系统的应用环境。如图1所示，所述应用环境包括移动载具、设于所述移动载具的控制器20、VR显示设备30、用户40以及无线网络50。

其中，移动载具可以是以任何类型的由动力驱动的装载平台，包括但不限于四轴无人机、固定翼飞行器以及直升机模型等。该移动载具可以根据实际情况的需要，具备相应的体积或者动力，从而提供能够满足使用需要的载重能力、速度以及续航里程等。移动载具上还可以添加有一种或者多种功能模块，令移动载具能够实现对应的功能。

在本实施例中以无人机10为例进行陈述。本实施例中所述的无人机10可以包括机身、与机身相连的机臂和设于机臂的动力装置。机臂可以与机身固定连接、一体成型或可相对于所述机身折叠。动力装置包括电机和与电机相连的螺旋桨，电机的电机轴转动带动螺旋桨旋转以提供无人机飞行所需的拉升力。

例如，该无人机10还可以至少具备一个用于采集图像信息的拍摄设备11。该拍摄设备11可以是高清摄像机、运动相机或者其它类型的图像采集装置。

具体的，无人机10可以通过云台或者类似的抖动消除装置，搭载拍摄设备11，云台允许拍摄设备11相对于无人机10绕至少一个轴转动。

该无人机10还可以设置有用于采集深度信息的深度传感器12。该深度传感器12具体可以是双目相机、TOF相机、结构光相机或者激光雷达等。

在一些实施例中，所述拍摄设备11搭载于所述无人机10的前部，所述深度传感器搭12载于所述无人机的后部。

控制器20是设置在该移动载具10中的控制核心，用于执行一个或者多个逻辑判断步骤，实现对于移动载具10的控制。控制器20可以包括多个功能性单元，如，用于控制无人机飞行姿态的飞行控制单元、用于识别目标的目标识别单元、用于跟踪特定目标的跟踪单元、用于导航飞行器的导航单元(例如GPS(Global Positioning System)、北斗)、以及用于处理相关机载设备(如，拍摄设备11)所获取的环境信息的数据处理单元等。

图2为本发明实施例提供的控制器20的结构框图。如图2所示，该控制器20可以包括：处理器21、存储器22以及通信模块25。所述处理器21、存储器22以及通信模块25之间通过总线的方式，建立任意两者之间的通信连接。

处理器21为任何类型的单线程或者多线程的，具有一个或者多个处理核心的处理器，作为逻辑处理和运算的核心，用于获取数据、执行逻辑运算功能以及下发运算处理结果。

存储器22为非易失性计算机可读存储介质，例如至少一个磁盘存储器件、闪存器件、相对于处理器21远程设置的分布式存储设备或者其他非易失性固态存储器件。

存储器22具有程序存储区，用于存储非易失性软件程序、非易失性计算机可执行程序以及模块，供处理器21调用以使处理器21执行一个或者多个方法步骤。存储器22还可以具有数据存储区，用以存储处理器21下发输出的运算处理结果。

通信模块25是无人机10用于建立通信连接，提供物理信道的功能模块例如WiFi模块、蓝牙模块获取其它的射频传输模块等。

无线网络50可以是用于建立两个节点之间的数据传输信道的无线通信网络，例如位于不同信号频段的蓝牙网络、WiFi网络或无线蜂窝网络。无人机10可以通过通信模块25加入到无线网络50中，通过无线网络50实现与VR显示设备30之间的通信连接。

VR显示设备30是位于用户侧，为用户提供虚拟显示环境的设备。该VR显示设备30具体可以是任何类型，可以实现VR技术的一个或者多个设备的组合。例如，传统的包覆式VR眼镜，头戴式VR设备以及结合VR技术的增强现实(AR)设备。

VR显示设备30与无人机10中的拍摄设备11建立有通信连接，可以接收来自拍摄设备11拍摄采集的视频或者图像信息，并据此生成相应的VR显示图像，提供给用户以实现沉浸式的虚拟现实体验。

用户40是佩戴有VR显示设备30的用户。其使用VR显示设备30来实现诸如无人机10飞行模拟等的服务。用户可以控制无人机10的航向角(或云台的转角)以及无人机的位置(如控制无人机前进或者后退)来改变VR显示设备的视角或者显示界面。

此时，由于用户40佩戴有VR显示设备。因此，难以通过控制遥控器的方式来对无人机进行控制。而采用转头或者移动身体来控制无人机的调整方式则非常容易造成用户的疲劳和眩晕。

在一些操作场景中，为了克服上述VR显示设备视角调整方式存在的问题，可以使用手势操作控制的方式来实现。用户40佩戴着VR显示设备30，无人机10悬停在用户40附近时，用户40可以伸手，通过不同的手势动作发出控制指令。此时，无人机10通过深度传感器，在朝向用户的位置采集相关的深度图像。

搭载在无人机10上的控制器20基于深度传感器采集获得的深度图像，可以分析检测用户的手势动作，解析对应的控制指令以调整无人机10的运行状态(包括移动无人机10的位置，改变拍摄设备11的朝向，焦距或者改变云台转动的角度)来响应用户发出的控制指令。

上述通过手势改变无人机的姿态或运动来改变VR视角的操作方式，与传统的遥控器控制相比，更为直观便捷。操作的同时无需走动或转头，使用户操作更舒适，用户体验更好。

在图1所示的应用环境中，仅以无人机10为例进行描述。本领域技术人员还可以将无人机10替换为任何类型的移动载具，例如遥控车等，用以承载上述的功能模块，为VR显示设备30提供数据源，实现虚拟现实的沉浸式体验。

本发明实施例提供的手势识别方法可以由控制器20的处理器21执行，以降低对于控制器20的运算量要求，有效的降低了控制器20的硬件成本以及功耗等，使其能够满足无人机10在使用上的限制。图3为本发明实施例提供的手势识别方法。如图3所示，该手势识别方法包括：

310、获取深度信息。

在一些实施例中，应用图1所示的深度传感器12可以采集获得相关的深度信息作为手势识别的基础数据。该深度信息是指能够反映拍摄对象的三维信息。

较佳的是，在存在较大噪声信息的情况下，还可以对接收到的深度信息进行预处理，过滤深度信息中的噪点。

320、根据所述深度信息，获取空间点云信息。

空间点云信息是另一种用于表示拍摄对象的三维信息的方式，其可以由深度信息转换得到。例如，深度传感器采集获得深度信息还原为三维的空间点云信息。

330、确定所述空间点云信息中的目标区域，所述目标区域为包含手部点云信息的区域。

该目标区域是在一定深度范围内，包含了手部点云信息的区域。如图1所示，用户40在手势操作时，惯常是通过伸出手掌的方式摆出手势来进行手势操作的。因此，在无遮挡和没有其他异物的前提下，区别于身体的其它部分，手掌将会落在一个特定距离的区域内。结合经验和实验，便可以选定特定距离区域内的点云信息作为包含了手部点云信息的目标区域。

具体的，可以抽取预设距离之内的点云信息作为所述目标区域。如上所述的，该预设距离由手部落入的特定距离所决定的。其表明了手部与身体其它部分相比，更接近于采集深度信息的深度传感器。

该预设距离是一个经验参数，其可以由本领域技术人员根据传感器的检测精度而设置，例如设置为10cm左右。

上述通过空间点云的方式能够有效、快速的选定包含手部点云的目标区域，便于进行后续的操作。

在其他可能的实施例中，还可以通过最大连通域算法过滤目标区域中的噪点，以提高手势识别的精确度。

340、生成与所述目标区域对应的平面图像。

该平面图像是目标区域在平面上的投影结果，反映了手部的平面图像。

在一些实施例中，具体可以将所述目标区域内的点云信息映射到一个二维空间以生成对应的平面图像。将三维信息转换为平面图像是一个简单并且快速的映射过程，可以被快速的执行。

转换为平面图像以后，可以对其采用现有多种成熟或者常规的图像处理算法，从平面图像中提取一个或者多个特征来完成手势识别的任务。

350、提取所述平面图像中手部的边缘点。

该平面图像中手部的边缘点是指区域属性发生突变之处。其通常是由两个区域之间的交界形成。亦即，通过识别出的边缘将平面图像分为若干个不同属性的区域(如手部和背景)。具体可以采用现有任何类型的边缘检测或者提取算法来完成步骤350。

在一些实施例中，可以采用摩尔邻域(Moore Neighborhood)法在图像中提取一系列连续的手部的边缘点。

360、根据所述手部的边缘点，确定所述手部中手指的数量。

手部的边缘勾勒形成的形状可以用于确定或者判断手指的具体数量。该手指的数量可以基于平面图像的边缘特征计算确定。

在一些实施例中，在边缘通过一系列连续的边缘点组成的边缘点集合表示时，所述手指的数量可以通过如下方法计算确定：

首先，通过现有常用的凸包检测算法，例如增量式算法、包裹法(Jarvis步进法)、单调链、分治法、快包法(AKI-Toussaint启发式)、葛立恒扫描算法(Graham scan)等算法在边缘点中找出凸包点。

“凸包”(Convec Hull)是一个图形学上的几何概念，其通常是指围成能够恰好包含所有目标点的凸多边形的点组成的集合。通过凸包点可以反映边缘这一曲折的线段的弯曲部分的曲折程度。

然后，确定所述凸包点为所述手指的指尖。

如图4所示，在平面图像存在手部的情况下，由于手指是整个手部最外围的部分，呈现出相对长而尖的形状。因此，手指对应的指尖都是凸包点(图4中白色正方形所示)，在弯曲程度足够，边缘呈现满足要求的尖端形状的情况下便可以据此判断为手部的指尖。

具体的，所述确定所述凸包点为所述手指的指尖可以通过如下方式判断确定：

对于每个凸包点，分别找到与其左右相邻n个边缘点的第i-n个边缘点为第一检测点，第i+n个边缘点为第二检测点。其中，第i个边缘点为所述凸包点，n为正整数，表示凸包点分别与第一边缘点和第二边缘点之间间隔的边缘点。

n是一个常数，表明第一边缘点与所述凸包点之间，第二边缘点与所述凸包点之间间隔的边缘点数量。其具体可以由手掌的大小和深度传感器的分辨率所确定。在一些实施例中，n可以选择设置为10-50，但不应当超过最短的手指长度。

在本实施例中，由于边缘点集合中的边缘点都是连续的，因此，可以方便的在边缘点集合中根据凸包点的位置，确定在前和在后的n个边缘点作为第一检测点和第二检测点。

最后，基于第一检测点、第二检测点以及凸包点，计算向量

以及

之间的夹角。其中，P _i为所述凸包点，P _r为所述第一检测点，P _l为所述第二检测点。当所述两个向量之间的夹角小于第一预设范围时，表明此部分的边缘呈现出一个足够尖的部分，可以认为该凸包点P _i为手指的指尖，并将相应的区域记录为手指。

该第一预设范围是一个经验数值，用于衡量图像区域长而且尖的程度。考虑到一般使用的深度传感器的精度，可以将第一预设范围设置为20-60°，用于判断图像区域是否满足指尖的形状要求。

具体的，所述夹角θ可以通过如下算式(3)计算获得：

最后，根据指尖的数量，确定所述手部中所述手指的数量。在已知指尖的数量以后，每个指尖与一个手指对应，可以根据指尖的数量来确定手指的数量。

370、根据所述手指的数量，确定所述手部的手势。

在不同的手势下，对应拍摄获得的手指数量也不相同。例如，如图5所示的对应关系图。基于手指的数量可以快速简单的识别不同手势以确定具体的控制指令。

另外，连续采集多个图像帧的情况下，还可以基于识别到的手掌在不同的图像帧之间的位置变化来确定或者识别手掌的相对运动。

每个手势具体对应的控制指令可以根据实际情况的需要，由技术人员进行配置并作为软件计算机程序，存储在所述存储器中。当然，还可以根据用户的个人习惯，进行个性化的设置。以下提供一个具体的配置实例以详细的陈述手势的配置过程。

首先，确定无人机可以根据手势执行的控制指令如下：

1、控制无人机在前后左右方向上移动(即无人机的pitch和roll角)的移动指令；

2、调整无人机的航向角(即无人机的yaw角)的翻转指令；

3、调整无人机的云台在左右上下方向上的转角(即云台的pitch角和yaw角)的云台摆动指令；

4、调整无人机的云台的光轴的转角(即无人机的roll角)的云台旋转指令；

5、控制无人机和云台恢复至调整前的初始位置或者暂停调整的重置指令或者暂停指令。

然后，按照如下的对应方式，为不同手指数量的手势配置对应的控制指令：

1、当识别到手指数量为5时，确定为移动指令，根据手掌在上下左右方向上的位移而相应的调整无人机的pitch和roll角；

2、当识别到手指数量为4时，确定为翻转指令，根据手掌的左右摆动而相应的调整无人机的yaw角；

3、当识别到的手指数量为3时，确定为云台摆动指令，根据手掌在上下左右方向上的位移而相应的改变云台的pitch角和yaw角；

4、当识别到的手指数量为2时，确定为云台旋转指令，根据手掌的左右摆动而相应的控制云台的光轴旋转，调整云台的roll角；

5、当识别到的手指数量为1或者0时，确定为重置或者暂停指令，控制云台和无人机恢复至初始位置(即初始化)或者暂停云台和无人机的位置调整。

通过上述手势识别方法，基于深度信息，可以快速准确的确定包含有手部的目标区域，并且结合使用现有成熟稳定的图像处理算法，从目标区域的平面图中提取凸包点和边缘，创造性的通过几何图形分析的方法来确定手指的数量。该确定手指的方法运算步骤和过程简单，避免了机器学习等的数据训练过程，需要消耗的运算量较少，有利于满足硬件设备低功耗的要求。

在一些实施例中，为了进一步的提高手势检测的准确度，避免错误识别等情况，所述方法还可以包括判断所述平面图像中是否存在手部的步骤。

在判断平面图像中存在手部时，才确认手势分析结果正确，对无人机作出对应的控制指令。

具体的，如图7所示，所述判断平面图像中是否存在手部可以包括如下步骤：

710、计算候选点中每一个所述候选点与每一个所述边缘点之间的距离。

该候选点是指所述平面图像中，位于所述边缘点围合范围内的点。所述候选点与所述边缘点之间的距离是两点之间的最短间距。

720、确定最大距离对应的候选点为所述手部的手掌的掌心。

在计算了所有候选点对应的距离以后，通过比较可以确定距离最大的候选点为手部的手掌最大内接圆的圆心。

在平面图像存在手部的情况下，通常手部的手掌占据的面积是最大的。因此，最大内接圆所在的位置即为手掌所在的位置，最大内接圆的圆心位置可以被认为是掌心。

与惯常使用的，根据平面图像中的边缘划出的内部区域的质心来确定手掌掌心的质心法相比：“质心法”无法区分手臂，质心的位置容易受到手臂的影响，误差很大。

而上述使用最大内接圆的方法可以很好的区分手掌和手臂部分(手臂的面积较小，内接圆的面积很小)，对于手臂也出现在平面图像的情况具有较强的鲁棒性。

具体的，在边缘通过一系列连续的边缘点组成的边缘点集合表示时，所述最大内接圆可以通过如下方法计算获得：

上述方法的两个步骤可以通过如下算式(1)和算式(2)表示：

D _i＝Min{distance(p _i,c _i)|c _i∈C} (1)

D _n＝Max{D _i|i∈H} (2)

其中，C为边缘点集合，c _i为边缘点集合中的第i个边缘点，p _i为第i个候选点，D _i为候选点p _i与所有边缘点之间的距离的最小值；H为所有候选点的集合，D _n为最大内接圆的半径。

730、计算任意两个相邻的所述指尖与所述掌心的连线形成的夹角。

上述指尖与掌心之间的连线形成的夹角可以认为是两个相邻手指之间的夹角。

740、判断所述夹角是否在第二预设范围内。若是，则执行步骤750。若否，则执行步骤760。

750、确定所述平面图像中存在手部。

760、确定所述平面图像中不存在手部。

所述第二预设范围也是一个经验数值，可以由技术人员根据实际的传感器精度等进行设置。

在一些实施例中，指尖与掌心连线的夹角，还可以使用其它不同的判断标准来确定是否存在手部。

例如，计算任意两个相邻的所述指尖与所述掌心的连线形成的夹角之和。并且，判断所述夹角之和是否超过180°。若是，则确定所述平面图像中存在手部。若否，则确定所述平面图像中不存在手部。

当然，应当说明的是，上述夹角之和的极限范围与用户的手指数量是相关的。所述夹角之和的上限还可以进一步的调整和设置，以适应不同的情况。

在另一些实施例中，还可以结合最大内接圆的方式来判断平面图像中是否存在手部。如图8所示，所述判断平面图像中是否存在手部具体可以包括：

810、计算候选点中每一个所述候选点与每一个所述边缘点之间的距离。

该候选点是指所述平面图像中，位于所述边缘内部区域的点。所述候选点与边缘之间的距离是两点之间的最短间距。

820、确定最大距离为所述手部的手掌的最大内接圆的半径。

在计算了所有候选点对应的距离以后，通过比较可以确定距离最大的候选点为最大内接圆的圆心。

在平面图像存在手部的情况下，通常手部的手掌占据的面积是最大的。因此，最大内接圆所在的位置即为手掌所在的位置。

830、判断所述半径是否在第三预设范围内。若是，则执行步骤840，若否，则执行步骤850。

840、确定所述平面图像中存在手部。

850、确定所述平面图像中不存在手部。

在正常状态下，用户40检测到的手部的手掌的最大内接圆会在一定的面积范围内波动。对于大部分用户而言，手掌都具有特定的大小，不容易发生显著的变动。因此，正常检测结果对应的半径通常只处于某个范围内发生波动，超出这个范围的结果具有极大的概率为识别错误。

因此，技术人员可以根据实际情况和/或实验结果，设置对应的第三预设范围，用以作为判断平面图像中是否存在手部的判断标准。该第三预设范围是一个经验数值，可以根据实际情况调整和设置。

在又一实施例中，还可以根据检测获得的所述的手指数量来判断所述平面图像中是否存在手部。亦即，判断上述步骤中计算获得的手指数量是否满足对应的条件。若是，则确定所述平面图像是否存在手部。若否，则确定所述平面图像不存在手部。

例如，在单手控制的情况下，正常用户40的手指数量最大不应当超过5个，或者在双手控制的情况下，正常用户的手指数量不应当超过10个。

因此，在检测到手指的数量超出正常范围时，可以表明出现了检测或者识别错误，确定平面图像中不存在手部，应当纠正并放弃当前的检测结果。

图6为该具备误判纠正能力的手势识别方法的方法流程图。如图6所示，该手势识别方法结合了手掌大小、手指间夹角和手指数量的判断方式。其可以包括如下步骤：

611、接收来自采集设备的深度图。具体的，该深度图为双目相机视差图，包含基线长度以及视差数据来表示图像的深度信息。

612、将所述深度图还原为空间点云信息。

深度图与空间点云信息之间的相互转换是一个非常常用的转换方式。在输入的深度图为双目相机视差图时，每个点(xi，yi，zi)的三维坐标可以表示如下：

其中，baseline为基线长度，disparity为视差数据，px，py，cx，cy，fx， fy为标定参数。

613、抽取预设距离以内的空间点云信息作为目标区域。所述目标区域是指包含了手掌的局部图像区域。

614、将目标区域中的三维空间点云信息映射到二维空间，生成与所述目标区域对应的平面图像。

615、通过预设的边缘提取算法，提取所述平面图像中的边缘点。所述预设的边缘提取算法可以是现有任何类型的边缘提取算法，例如，摩尔邻域(Moore Neighborhood)法所述边缘点是提取获得的一系列连续的边缘点。

616、根据所述边缘点，计算手掌的最大内接圆的半径。

617、判断所述最大内接圆的半径是否在第三预设范围内。若是，执行步骤620。若否，则执行步骤619。

如图5所示，在假设深度图正确采样的情况下，最大内接圆的位置应当是与手掌重合的。因此，通过最大内接圆便可以相应的计算确定手掌的面积。

该第三预设范围是指正常状态下，用户40检测到的手掌可能的半径波动范围。由于对于大部分用户而言，手掌都是具有特定的大小，不容易发生显著的变动。因此，正常检测结果对应的半径通常只处于某个范围内发生波动，超出这个范围的结果具有极大的概率为识别错误。技术人员可以根据实际情况和/或实验结果，设置该第三预设范围。

619、确定所述最大内接圆的圆心为手掌的掌心。

在手掌面积处于正常状况下，可以确认手掌识别没有发生错误，可以将最大内接圆的圆心作为手掌的掌心。

620、确定所述目标区域中不存在手部。

相反地，当超出了第三预设范围时，基本可以认为检测的结果并不是手掌，通常是由于受遮挡等情况造成的检测错误。此时，可以主动报告，并根据实际情况的需要进行相应的纠错过程。例如，提示客户手势无效，令客户重新作出手势以采集新的深度图。

621、搜索所述边缘中的凸包点。所述凸包点可以利用葛立恒扫描法(Graham's scan)找出。

622、对于每个凸包点，分别找到与其左右相邻n个边缘点的第i-n个边缘点为第一检测点，第i+n个边缘点为第二检测点。其中，第i个边缘点为所述凸包点，n为正整数。

623、基于第一检测点、第二检测点以及凸包点，计算向量

和

之间的夹角。

624、判断所述夹角是否在第一预设范围内。若是，则确定所述凸包点为手指的指尖。若否，则确定所述凸包点不是指尖。

每次确认获得一个手指指尖以后，令手指的数量加1，否则维持手指数量维持不变。

625、判断单个手部的手指数量是否大于5。若是，则执行步骤620，若否，则执行步骤626。

显然的，正常用户40的单个手部的手指数量最大不应当超过5个。因此，在检测到数量较多的手指时，基本可以表明出现了检测或者识别错误，应当纠正并放弃当前的检测结果。

626、根据指尖和掌心，依次计算两个相邻的所述指尖与所述掌心的连线形成的夹角之和。该“依次计算”是指按照检测到的手指的顺序，计算两个相邻指尖与掌心连线形成的夹角。

例如，当检测到3个手指以后，依次第一个手指的指尖与第二个手指的指尖与掌心之间的连线的夹角1，第二个手指的指尖与第三个手指的指尖与掌心之间的连线的夹角2。

627、判断所述夹角之和是否大于180°。若是，则执行步骤620。若否，则确定目标区域存在手部(步骤628)。

该夹角之和是所有计算获得的夹角的和。例如，将夹角1和夹角2相加，获得两个夹角之和。可以理解的，手指数量越多的情况下，相加的夹角的数量越多。最多的情况下，检测到5个手指时，需要将四个夹角相加。

显然地，即使在检测到全部的5个手指的情况下，这些夹角之和也不应当超过180°的上限(用户40无法做出该手势动作)。因此，当所述夹角之和是否大于180°时，同样也可以确认为出现了识别错误。

在本实施例中，关于手指的纠错判断部分的判断标准(手指数量以及夹角之和)均采用了最为极端的情况。本领域技术人员可以理解的是，可以根据不同的场景需要，对上述判断标准进行调整、组合或者拆分，获得同样的技术效果。

例如，可以根据手指的数量动态的改变夹角之和的上限值或者是先判断夹角之和再计算手指的数量是否能够符合判断标准。

图1所示的控制器20可以使用软件、硬件或者软硬件结合的方式，根据接收到的深度信息，执行上述方法实施例揭露的手势识别方法，实现对于用户40的手势检测，解析对应的控制指令以实现对无人机10和VR显示设备30的控制。

在一些实施例中，所述控制器20可以控制无人机10在用户40附近悬停，使用户40处于深度传感器的探测范围内。控制器20应用如上所述的手势识别方法，从深度图中确定用户的手部。然后，根据所述用户的手部识别获得的手势，调整VR显示设备的VR视角，实现对于VR视角或者VR场景的手势操作。

上述使用手势控制VR视角的方式，既可以避免头戴VR无法观察遥控器而造成误操作的不便，又可以减少传统的转头控制VR视角带来的疲劳和眩晕感。

具体的，控制器20可以根据所述掌心和无人机之间的相对位置来精确的控制无人机10的移动和VR视角的调整。

例如，使无人机移动到目标位置并调整云台的转角以调整拍摄设备的位置和朝向，最终实现VR视角的改变和调整，为用户40提供更为便利操作方式和更好的沉浸式体验效果。

综上所述，本发明实施例提供的手势识别方法利用深度图来抽取手部，避免了利用平面图像抠出手部的相对繁琐的过程，同时大大减少了计算量。并且，以几何分析的方法替代传统的机器学习识别法，可以在相同的设备上拥有比机器学习法更高的运算帧率，保证了在低功耗低运算能力的设备上的应用。

进一步地，考虑到手臂容易与手部出现在同一平面内，基于深度信息抽取手部区域容易同时提取到手臂，创造性的使用了最大内接圆检测法来区分识别手臂和手部，可以在有手臂的情况下精确的确定掌心。对于手指的识别则由凸包点左右相邻点的夹角检测来完成，具有高效、鲁棒性强的特点。

基于本发明实施例提供的手势识别方法提供的手部的精确空间位置，可以广泛的应用在机器人手掌跟踪、无人机掌上降落、手势识别和体感操作等用途上，提供了更多的控制选择方式。

本领域技术人员应该还可以进一步意识到，结合本文中所公开的实施例描述的示例性的数据传输控制方法的各个步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。

本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。所述的计算机软件可存储于计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；在本发明的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上所述的本发明的不同方面的许多其它变化，为了简明，它们没有在细节中提供；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

一种手势识别方法，其特征在于，包括：

获取深度信息；

根据所述深度信息，获取空间点云信息；

确定所述空间点云信息中的目标区域，所述目标区域指包含手部点云信息的区域；

生成与所述目标区域对应的平面图像；

提取所述平面图像中手部的边缘点；

根据所述手部的边缘点，确定所述手部中手指的数量；

根据所述手指的数量，确定所述手部的手势。
根据权利要求1所述的手势识别方法，其特征在于，所述获取所述深度信息，包括：

通过深度传感器获取所述深度信息。
根据权利要求1或2所述的手势识别方法，其特征在于，所述确定所述空间点云信息中的目标区域，包括：

抽取预设距离之内的点云信息作为所述目标区域。
根据权利要求1-3中任一项所述的手势识别方法，其特征在于，所述方法还包括：

过滤所述目标区域中的噪点。
根据权利要求4所述的手势识别方法，其特征在于，所述过滤所述目标区域中的噪点，包括：

通过最大连通域算法，过滤所述目标区域中的噪点。
根据权利要求1-5中任一项所述的手势识别方法，其特征在于，所述生成与所述目标区域对应的所述平面图像，包括：

将所述目标区域中的点云信息映射到二维空间，以生成所述目标区域对应的所述平面图像。
根据权利要求1-6中任一项所述的手势识别方法，其特征在于，所述提取所述平面图像中所述手部的所述边缘点，包括：

采用摩尔邻域(Moore Neighborhood)法，提取所述平面图像中所述手部的所述边缘点。
根据权利要求1-7中任一项所述的手势识别方法，其特征在于，所述根据所述手部的所述边缘点，确定所述手部中所述手指的数量，包括：

根据所述手部的所述边缘点，找出凸包(Convec Hull)点；

确定所述凸包点为所述手指的指尖；

根据所述指尖的数量，确定所述手部中所述手指的数量。
根据权利要求8所述的手势识别方法，其特征在于，所述根据所述手部的所述边缘点，找出所述凸包点，包括：

利用葛立恒扫描法(Graham's scan)找出所述凸包点。
根据权利要求8或9所述的手势识别方法，其特征在于，所述确定所述凸包点为所述手指的所述指尖，包括：

从所述手部的所述边缘点中，选取分别位于所述凸包点两侧且与所述凸包点相邻的第一边缘点和第二边缘点，以计算所述凸包点与所述第一边缘点连成的直线和所述凸包点与所述第二边缘点连成的直线之间的夹角；其中，所述第一边缘点和所述第二边缘点与所述凸包点位于同一根手指，且所述第一边缘点与所述凸包点之间、以及所述第二边缘点与所述凸包点之间间隔预设数量的边缘点；

判断所述夹角是否在第一预设范围内；

若是，则确定所述凸包点为所述手指的指尖。
根据权利要求10所述的手势识别方法，其特征在于，所述判断所述夹角是否在所述第一预设范围内，包括：

计算所述夹角：

其中，θ为所述夹角，P _i为所述凸包点，P _l为所述第一边缘点，P _r为所述第二边缘点；

判断所述夹角是否小于预设值；

若是，则确定所述凸包点为所述手指的指尖。
根据权利要求11所述的手势识别方法，其特征在于，所述预设值在 20°至60°之间取值。
根据权利要求10-12中任一项所述的手势识别方法，其特征在于，所述第一边缘点与所述凸包点之间、以及所述第二边缘点与所述凸包点之间间隔10-50个边缘点。
根据权利要求7-13中任一项所述的手势识别方法，其特征在于，所述方法还包括：

判断所述平面图像中是否存在手部。
根据权利要求14所述的手势识别方法，其特征在于，所述判断所述平面图像中是否存在手部，包括：

计算候选点中每一个所述候选点与每一个所述边缘点之间的距离，所述候选点为所述边缘点围合范围内的点；

确定最大距离对应的候选点为所述手部的手掌的掌心；

计算任意两个相邻的所述指尖与所述掌心的连线形成的夹角；

判断所述夹角是否在第二预设范围内；

若是，则确定所述平面图像中存在手部。
根据权利要求14所述的手势识别方法，其特征在于，所述判断所述平面图像中是否存在手部，包括：

计算候选点中每一个所述候选点与每一个所述边缘点之间的距离，所述候选点为所述边缘点围合范围内的点；

确定最大距离对应的候选点为所述手部的手掌的掌心；

计算任意两个相邻的所述指尖与所述掌心的连线形成的夹角之和；

判断所述夹角之和是否超过180°；

若是，则确定所述平面图像中存在手部。
根据权利要求1-13中任一项所述的手势识别方法，其特征在于，该方法还包括：

判断所述平面图像中是否存在手部。
根据权利要求17所述的手势识别方法，其特征在于，所述判断所述平面图像中是否存在手部，包括：

计算候选点中每一个所述候选点与每一个所述边缘点之间的距离，所述候选点为所述边缘点围合范围内的点；

确定最大距离为所述手部的手掌的最大内接圆的半径；

判断所述半径是否在第三预设范围内；

若是，则确定所述平面图像中存在手部。
根据权利要求1-13中任一项所述的手势识别方法，其特征在于，该方法还包括：

判断所述平面图像中是否存在手部。
根据权利要求19所述的手势识别方法，其特征在于，所述判断所述平面图像中是否存在所述手部，包括：

根据所述手指的数量，判断所述平面图像中是否存在所述手部。
一种VR视角控制方法，其特征在于，所述方法包括：

应用如权利要求1-20中任一项所述的手势识别方法，确定用户手部的手势；

根据所述用户手部的手势，调整VR视角。
根据权利要求21所述VR视角控制方法，其特征在于，所述根据所述用户手部的手势，调整所述VR视角，包括：

根据所述用户手部的手指数量，识别当前用户手部的手势；

根据所述用户手部的手势，调整拍摄设备的位置和朝向；

根据所述拍摄设备的位置和朝向变化来调整所述VR视角。
根据权利要求21或22所述的VR视角控制方法，其特征在于，该方法还包括：

应用如权利要求1-20中任一项所述的手势识别方法，确定所述用户手部的掌心位置；

根据所述用户手部的掌心位置，调整VR视角。
一种VR系统，其特征在于，包括：

移动载具；

拍摄设备，搭载于所述移动载具；

深度传感器，设置在所述移动载具上；

控制器，设置于所述移动载具内；以及

VR显示设备，所述VR显示设备与所述拍摄设备通信连接，用于根据所述拍摄设备采集的视频图像信息生成对应的VR场景；

所述控制器用于使用如权利要求1-20任一项所述的手势识别方法，根据所述深度传感器获取的深度信息识别用户的手势，并且根据所述手势，调整所述VR显示设备的VR视角。
根据权利要求24所述的VR系统，其特征在于，所述控制器具体用于：根据所述手指的数量识别用户手部的手势，并且根据所述手势，控制所述拍摄设备的姿态和所述移动载具的移动。
根据权利要求24或25所述的VR系统，其特征在于，所述控制器还用于使用如权利要求1-20中任一项所述的手势识别方法，获取所述用户的掌心位置，并根据所述掌心位置，调整所述VR显示设备的VR视角。
根据权利要求26所述的VR系统，其特征在于，所述控制器具体用于根据所述掌心位置，确定所述掌心位置与所述移动载具之间的相对位置，以控制所述拍摄设备的姿态和所述移动载具的移动。
根据权利要求24-27中任一项所述的VR系统，其特征在于，所述拍摄设备搭载于所述移动载具的前部，所述深度传感器搭载于所述移动载具的后部。
根据权利要求24-28所述的VR系统，其特征在于，所述移动载具为无人机。
根据权利要求24-29所述的VR系统，其特征在于，所述拍摄设备通过云台搭载于所述移动载具。