WO2021035646A1

WO2021035646A1 - 可穿戴设备及其控制方法、识别手势的方法和控制系统

Info

Publication number: WO2021035646A1
Application number: PCT/CN2019/103440
Authority: WO
Inventors: 刘志鹏; 李思晋
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2019-08-29
Filing date: 2019-08-29
Publication date: 2021-03-04
Also published as: US20210405763A1; US11782514B2; CN112154402A

Abstract

一种可穿戴设备及其控制方法、识别手势的方法、可移动平台控制系统和存储介质，包括：获取目标用户的手势动作的关键点信息(S110)；根据所述关键点信息识别输入指令(S120)；根据所述输入指令产生控制指令，以根据所述控制指令执行任务操作(S130)。

Description

可穿戴设备及其控制方法、识别手势的方法和控制系统

技术领域

本说明书涉及人机交互技术领域，尤其涉及一种可穿戴设备及其控制方法、识别手势的方法、可移动平台控制系统和存储介质。

背景技术

在可穿戴设备上，传统的交互模式是用户通过触摸可穿戴式设备上的触控板实现的。用户只能将手指放在触控板上进行左右或上下滑动来进行菜单的选择，相当于只能在一维空间中进行选择，并且滑动一次手指只能将菜单滑动一次。此时如果目标按钮比较远，则需要多次滑动手指，过程较为繁琐，不够快捷。虽然一些研究提出根据可穿戴设备的图像获取装置拍摄的用户手势识别控制指令，但是这种识别方式速度较慢、准确性较低。

发明内容

基于此，本说明书提供了一种可穿戴设备及其控制方法、识别手势的方法、可移动平台控制系统和存储介质，旨在解决可穿戴设备的手势识别速度较慢、准确性较低等技术问题。

第一方面，本说明书提供了一种可穿戴设备的控制方法，包括：

获取目标用户的手势动作的关键点信息；

根据所述关键点信息识别输入指令；

根据所述输入指令产生控制指令，以根据所述控制指令执行任务操作。

第二方面，本说明书提供了一种可穿戴设备，包括存储器和处理器；

所述存储器用于存储计算机程序；

所述处理器，用于执行所述计算机程序并在执行所述计算机程序时，实现如下步骤：

获取目标用户的手势动作的关键点信息；

根据所述关键点信息识别输入指令；

第三方面，本说明书提供了一种可移动平台控制系统，包括：

可移动平台，包括图像获取装置，用于将图像获取装置拍摄的图像发送给可穿戴设备；

前述的可穿戴设备，用于显示所述可移动平台发送的图像。

第四方面，本说明书提供了一种识别手势的方法，所述方法包括：

获得所述手势的第一图像；

根据所述第一图像获得所述手势的关键点信息；

当根据所述关键点信息无法判断所述手势类型时，获得所述手势的第二图像；

根据所述第二图像更新所述手势的关键点信息；

根据所述更新后的关键点信息获得所述手势的识别结果。

第五方面，本说明书提供了一种可穿戴设备，包括存储器和处理器；

所述存储器用于存储计算机程序；

所述处理器，用于执行所述计算机程序并在执行所述计算机程序时，实现前述的识别手势的方法。

第六方面，本说明书提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序可被处理器以实现上述的方法。

本说明书实施例提供了一种可穿戴设备及其控制方法、识别手势的方法、可移动平台控制系统和存储介质，通过获取目标用户的手势动作的关键点信息，并根据关键点信息识别输入指令，以及根据输入指令产生控制指令，以根据控制指令执行任务操作；实现用户可以快捷的使用手悬空作出手势动作控制可穿戴设备，且通过关键点信息识别手势动作对应的输入指令，可以排除会干扰手势识别的信息，识别速度更快且更准确，从而方便用户更快捷和更准确的控制可穿戴设备。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书的公开内容。

附图说明

为了更清楚地说明本说明书实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本说明书的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本说明书一实施例提供的控制方法的流程示意图；

图2是手势动作的关键点的示意图；

图3是头戴显示设备的控制方法一实施方式的应用场景示意图；

图4是不同种类手势动作的示意图；

图5是头戴显示设备的控制方法另一实施方式的应用场景示意图；

图6是头戴显示设备的控制方法又一实施方式的应用场景示意图；

图7是图1中获取关键点信息一实施方式的子流程示意图；

图8是头戴显示设备的控制方法再一实施方式的应用场景示意图；

图9是本说明书一实施例提供的一种可穿戴设备的示意性框图。

图10是本说明书一实施例提供的一种识别手势的方法的流程示意图。

图11是本说明书另一实施例提供的一种可穿戴设备的示意性框图。

具体实施方式

下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书保护的范围。

附图中所示的流程图仅是示例说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解、组合或部分合并，因此实际执行的顺序有可能根据实际情况改变。

下面结合附图，对本说明书的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

请参阅图1，图1是本说明书一实施例提供的一种可穿戴设备的控制方法的流程示意图。所述可穿戴设备的控制方法可以应用在可穿戴设备中，用于根据用户的手势实现相应的控制功能等过程。

可穿戴设备例如可以为具有图像获取装置的头盔、手表、眼镜、上衣、腰带、护带等。

示例性的，可穿戴设备可以为头戴显示设备。

头戴显示设备可以为虚拟现实(VR，virtual reality)显示设备或第一人称视角(FPV，first person view)显示设备。头戴显示设备例如可以为眼镜式显示设备或者头盔式显示设备等。

如图1所示，可穿戴设备的控制方法包括步骤S110至步骤S130。

S110、获取目标用户的手势动作的关键点信息。

图2中的三角形用于标识目标用户手上的关键点，关键点例如包括手指关节、手指尖、腕关节等。关键点信息包括关键点的位置信息。

本说明书以控制方法应用于头戴显示设备进行说明，根据本说明书可以理解控制方法应用于各种可穿戴设备的实施方式。

在一些实施方式中，步骤S110获取目标用户的手势动作的关键点信息包括：获取头戴显示设备搭载的图像获取装置拍摄的用户图像；根据所述头戴显示设备搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。

如图3所示为头戴显示设备的控制方法一实施方式的应用场景示意图。

目标用户佩戴头戴显示设备，头戴显示设备自带图像获取装置或者通过通信接口连接图像获取装置。例如，图像获取装置位于头戴显示设备的下侧、上侧、左侧或右侧。图像获取装置例如为独立的摄像头或者为手机、相机等电子设备。

如图3所示，目标用户将手伸出，位于头戴显示设备搭载的图像获取装置的拍摄视野内。从而头戴显示设备可以通过图像获取装置获取目标用户的手部图像。然后头戴显示设备可以根据目标用户的手部图像确定所述手部图像中的关键点，得到如图2所示的手势动作的关键点信息。

示例性的，图像获取装置拍摄的用户图像包括背景区域和手部区域。头戴显示设备可以先识别所述用户图像中的手部区域，然后获取所述手部区域中的关键点信息。

具体的，头戴显示设备获取图像获取装置拍摄的图像之后，在全图范围内进行手部检测，输出手部的具体位置，例如可以用目标框标识手部位置。目标框包括目标框的左上角和右下角在拍摄的图像上的坐标；或者目标框包括目标框的中心在拍摄的图像上的坐标以及目标框的宽和高。

具体的，头戴显示设备的图像获取装置拍摄的图像中可以包括一个手部区域，也可以包括两个或两个以上的手部区域。

之后，头戴显示设备根据手部的具体位置从图像获取装置拍摄的图像中裁剪出手部区域的图片。再将手部区域的图片输入到手部关键点检测神经网络得到图片中手部关键点。

手部关键点检测神经网络可以通过根据手部关键点样本集对深度神经网络进行训练至收敛得到。手部关键点样本集包括多个标注有关键点的手部图片，这些手部图片对应于多种不同手势。因此训练好的手部关键点检测神经网络可以更准确的从手部区域的图片中检测到手部关键点。

在一些实施方式中，所述头戴显示设备搭载的图像获取装置包括彩色摄像头、深度传感器、RGB-D摄像头中的至少一种。

深度传感器或RGB-D摄像头拍摄的图像具有深度特征，根据深度传感器或RGB-D摄像头拍摄的图像可以更加精确的进行手部关键点的检测。

在一些实施例中，所述头戴显示设备搭载至少两个图像获取装置。头戴显示设备根据搭载的至少两个图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。所述至少两个图像获取装置位于头戴显示设备上的不同位置或者虽然位于相同位置但拍摄角度不同。从而可以在不同视角下获取目标用户的用户图像，从而确定不同视角下目标用户的手部图像。可以得到更丰富的手势动作的关键点信息。

示例性的，多个图像获取装置可以分别获取手心和手背上的关键点信息，防止手部关键点部分被遮挡导致的手势识别准确率降低。

S120、根据所述关键点信息识别输入指令。

在一些实施方式中，根据手势动作的关键点信息可以确定手势动作的种类。如图4所示为不同种类手势动作的示意图。

如图4所示，手势动作的种类包括一只手的手势动作，或者两只手的手势动作。

在一些实施方式中，将所述关键点信息发送给手势动作分类模型；基于所述手势动作分类模型对所述关键点信息进行分类，以得到输入指令。

示例性的，手势动作分类模型可以通过根据手势样本集对深度神经网络进行训练至收敛得到。手势样本集包括若干关键点信息和所述关键点信息各自对应的手势标注。这些关键点信息对应于多种不同的手势。因此训练好的手势动作分类模型可以更准确的根据关键点信息识别目标用户的手势动作。

头戴显示设备预先存储了手势动作和输入指令的映射表。该映射表包括若干手势动作和若干输入指令之间的对应关系。从而头戴显示设备可以根据识别出的目标用户的手势动作确定对应的输入指令。

如图3所示，头戴显示设备显示的界面中在右上角包括三种手势动作和三种输入指令的对应关系。用户可以在需要输入指令时，可以根据显示的对应关系，将手在图像获取装置前做出对应的手势动作。

例如，用户将大拇指竖起，其余四个手指握住。头戴显示设备可以是识别出目标用户的手势动作，并根据该手势动作确定输入指令为模式切换指令。

在另一些实施方式中，将所述关键点信息发送给指令分类模型；基于所述指令分类模型对所述关键点信息进行分类，以得到输入指令。

示例性的，指令分类模型可以通过根据手势样本集对深度神经网络进行训练至收敛得到。手势样本集包括若干关键点信息和所述关键点信息各自对应的指令标注。这些关键点信息对应于多种不同的手势。因此训练好的手势动作分类模型可以更准确的根据关键点信息识别目标用户的输入指令。

可以理解的，头戴显示设备可以不识别手势动作，而直接根据所述关键点信息识别输入指令。也可以不存储手势动作和输入指令的映射表。

在一些实施方式中，若根据所述关键点信息识别出的输入指令为模式切换指令，则根据所述模式切换指令开启或关闭肢体交互模式。

所述肢体交互模式用于根据识别出的输入指令产生的控制指令执行任务操作。

示例性的，目标用户在想开启肢体交互模式，以控制头戴显示设备可以根据目标用户作出的手势动作进行交互时，可以作出模式切换指令对应的手势动作。从而头戴显示设备可以根据确定的模式切换指令开启肢体交互模式。

在开启肢体交互模式时，头戴显示设备获取目标用户的手势动作的关键点信息，并根据所述关键点信息识别输入指令。如果再次识别到输入指令为模式切换指令，则关闭肢体交互模式。关闭肢体交互模式后，如果识别的输入指令不是模式切换指令，则不响应该输入指令；如果识别的输入指令是模式切换指令，则开启肢体交互模式。

在开启肢体交互模式时，头戴显示设备响应识别的输入指令。

S130、根据所述输入指令产生控制指令，以根据所述控制指令执行任务操作。

在一些实施方式中，不同的输入指令对应于不同的控制指令。

示例性的，头戴显示设备预先存储有输入指令和控制指令的映射表。该映射表包括若干输入指令和若干控制指令之间的对应关系。

示例性的，用户可以通过设置操作，将输入指令关联于用户指定的功能，如保存头戴显示设备显示的画面的截屏功能等。头戴显示设备可以根据用户的设置操作，调整输入指令和控制指令之间的对应关系，该控制指令对应于用户指定的功能。

从而头戴显示设备可以根据识别出的输入指令确定对应的控制指令。然后根据输入指令产生控制指令，以根据所述控制指令执行任务操作。

在另一些实施方式中，如图3所示，所述头戴显示设备显示交互操作界面。

示例性的，所述根据所述控制指令执行任务操作，包括：根据所述控制指令切换所述头戴显示设备显示的交互操作界面。

示例性的，当所述输入指令为切换至下一个交互操作界面的指令时，则根据当前显示的交互操作界面和该输入指令，生成用于控制头戴显示设备切换至下一个交互操作界面的控制指令，以使所述头戴显示设备切换至下一个交互操作界面。

例如，若输入指令为确认指令，则根据当前显示的交互操作界面和该输入指令，生成用于控制头戴显示设备切换至下一个交互操作界面的控制指令，以使所述头戴显示设备切换至下一个交互操作界面。

例如，若输入指令为返回指令，则根据当前显示的交互操作界面和该输入指令，生成用于控制头戴显示设备切换至上一个交互操作界面的控制指令，以使所述头戴显示设备返回至上一个交互操作界面。

示例性的，所述根据所述输入指令产生控制指令，包括：根据所述头戴显示设备当前显示的交互操作界面和所述输入指令确定操作控制信息；根据所述操作控制信息产生对应的控制指令。

示例性的，头戴显示设备显示某交互界面时，允许根据用户的手势动作保存头戴显示设备显示的画面。当头戴显示设备显示该交互界面时，若根据关键点信息识别出的输入指令为确认指令，则可以根据该输入指令确定操作控制信息对应于截屏功能。根据该操作控制信息产生截屏功能对应的控制指令，以使头戴显示设备保存当前显示的画面。

示例性的，交互操作界面显示一个虚拟按钮或多个虚拟按钮，虚拟按键对应于不同的操作控制信息。

例如，某交互操作界面包括截屏功能对应的虚拟按键。当头戴显示设备显示该交互界面时，若根据关键点信息识别出的输入指令为确认指令，则可以根据该输入指令确定操作控制信息对应于截屏功能。根据该操作控制信息产生截屏功能对应的控制指令，以使头戴显示设备保存当前显示的画面。

示例性的，所述根据所述交互操作界面和所述输入指令确定操作控制信息，包括：确定所述交互操作界面中的功能按钮；根据所述功能按钮和所述输入指令确定操作控制信息。

在一些实施方式中，如图5所示，头戴显示设备通信连接于可移动平台，如无人飞行器。

示例性的，如图3所示，交互操作界面包括多个功能按钮，如对应于控制无人飞行器返航的返航按钮、对应于控制无人飞行器悬停的悬停按钮、对应于截屏功能的截屏按钮和菜单按钮。

例如，确定所述交互操作界面中用户选定的功能按钮，然后根据用户选定的功能按钮和所述输入指令确定操作控制信息。

示例性的，头戴显示设备根据目标用户的手势动作的关键点信息确定目标用户手部的预设部位在所述交互操作界面上的位置；根据所述交互操作界面上的所述位置确定所述功能按钮。

例如，头戴显示设备根据手势动作的关键点信息确定目标用户食指指尖在交互操作界面上的位置。具体的，根据用户食指指尖在戴显示设备搭载的图像获取装置拍摄的用户图像中的位置，确定食指指尖对应的光标在交互操作界面上的位置。

示例性的，用户可以通过左手或者右手的食指的移动来控制交互操作界面中的光标。当光标移动到交互操作界面中的某一功能按钮时，确定该功能按钮为可响应所述输入指令的功能按钮。头戴显示设备可以响应输入指令来触发功能按钮的功能，如控制无人飞行器悬停或返航等。

例如，在某交互操作界面确定的功能按钮为对应于返航指令的功能按钮时，若根据关键点信息识别出的输入指令为确认指令，则可以根据该输入指令确定对应于返航的操作控制信息。根据该操作控制信息产生控制指令，以使头戴显示设备根据控制指令向无人飞行器发送返航指令，从而控制无人飞行器返航。

在一些实施方式中，所述根据所述控制指令执行任务操作，包括：调整所述头戴显示设备当前显示的交互操作界面中的菜单。

示例性的，如图3所示，交互操作界面包括菜单按钮。在交互操作界面确定的功能按钮为该菜单按钮时，若根据关键点信息识别出的输入指令为确认指令，则可以根据该输入指令确定对应于展开该菜单的操作控制信息。根据该操作控制信息产生控制指令，以使头戴显示设备在该交互操作显示界面显示该菜单对应的选项按钮，如选项一和选项二。

例如，头戴显示设备根据目标用户的手势动作的关键点信息确定目标用户手部的预设部位在所述交互操作界面上的位置；根据所述交互操作界面上的所述位置确定选项二对应的功能按钮。若之后根据关键点信息识别出的输入指令为确认指令，则可以根据该输入指令确定对应于选项二的操作控制信息。根据该操作控制信息产生控制指令，以使头戴显示设备实现选项二对应的操作。

在一些实施方式中，所述头戴显示设备通信连接于可移动平台。

示例性的，可移动平台为无人飞行器、无人驾驶车辆或无人驾驶船艇。无人飞行器例如可以为旋翼型无人机，例如四旋翼无人机、六旋翼无人机、八旋翼无人机，也可以是固定翼无人机。

示例性的，所述根据所述控制指令执行任务操作，包括：根据所述控制指令开始存储或者结束存储所述头戴显示设备从可移动平台获取的数据。

示例性的，头戴显示设备通过与可移动平台之间的通信链路从可移动平台获取数据，如可移动平台搭载的图像获取装置拍摄的图像等。头戴显示设备在产生某一控制指令后，根据该控制指令开始存储或者结束存储从所述可移动平台获取的数据。

示例性的，所述根据所述控制指令执行任务操作，包括：根据所述控制指令向可移动平台发送平台控制指令，以控制所述可移动平台。

示例性的，若根据输入指令产生对应于返航的控制指令，则所述头戴显示设备根据该控制指令向所述可移动平台发送用于控制可移动平台返航的平台控制指令。若根据输入指令产生对应于加速移动的控制指令，则所述头戴显示设备根据该控制指令向所述可移动平台发送用于控制可移动平台加速移动的平台控制指令。

在一些实施方式中，控制方法应用于手表，手表包括图像获取装置，例如包括摄像头。

手表通过摄像头获取目标用户的手势动作的关键点信息，然后根据所述关键点信息识别输入指令，并根据所述输入指令产生控制指令，以根据所述控制指令执行任务操作。

可以理解的，手表也可以显示交互操作界面。手表也可以根据所述控制指令切换显示的交互操作界面，可以根据当前显示的交互操作界面和所述输入指令确定操作控制信息并根据所述操作控制信息产生对应的控制指令等。

可以理解的，手表也可以通信连接于可移动平台，手表可以响应输入指令来触发功能按钮的功能，如控制无人飞行器悬停或返航等。

在一些实施方式中，如图5所示，头戴显示设备连接于可移动平台，可移动平台搭载有图像获取装置。例如通过有线方式连接于可移动平台或者通过无线通信方式连接于可移动平台。

可移动平台自带图像获取装置或者通过通信接口连接图像获取装置。图像获取装置包括彩色摄像头、深度传感器、RGB-D摄像头中的至少一种。图像获取装置例如为独立的摄像头或者为手机、相机等电子设备。

示例性的，步骤S110获取目标用户的手势动作的关键点信息，包括：根据可移动平台搭载的图像获取装置拍摄的用户图像和所述头戴显示设备搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。

从而，头戴显示设备可以根据头戴显示设备拍摄的用户图像和可移动平台拍摄的用户图像确定手势动作的关键点信息。从而可以获取在不同视角下目标用户的用户图像，从而确定不同视角下目标用户的手部图像。可以得到更丰富的手势动作的关键点信息，且可以防止手部关键点部分被遮挡导致的手势识别准确率降低。例如，可以根据头戴显示设备拍摄的用户图像和可移动平台拍摄的用户图像确定目标用户手心和手背上的关键点信息。

在一些实施方式中，如图6所示，头戴显示设备连接于手持控制装置，手持控制装置搭载有图像获取装置。例如通过有线方式连接于手持控制装置或者通过无线通信方式连接于手持控制装置。

示例性的，头戴显示设备还可以根据手持控制装置发送的控制指令执行相应的操作或功能，如切换交互操作界面、确定交互操作界面中的功能按钮、开启或关闭肢体交互模式等。

手持控制装置自带图像获取装置或者通过通信接口连接图像获取装置。图像获取装置包括彩色摄像头、深度传感器、RGB-D摄像头中的至少一种。图像获取装置例如为独立的摄像头或者为手机、相机等电子设备。

示例性的，步骤S110获取目标用户的手势动作的关键点信息，包括：根据手持控制装置搭载的图像获取装置拍摄的用户图像和所述头戴显示设备搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。

从而，头戴显示设备可以根据头戴显示设备拍摄的用户图像和手持控制装置拍摄的用户图像确定手势动作的关键点信息。从而可以获取在不同视角下目标用户的用户图像，从而确定不同视角下目标用户的手部图像。可以得到更丰富的手势动作的关键点信息，且可以防止手部关键点部分被遮挡导致的手势识别准确率降低。例如，可以根据头戴显示设备拍摄的用户图像和手持控制装置拍摄的用户图像确定目标用户手心和手背上的关键点信息。

可以理解的，控制方法应用于手表等可穿戴式设备时，手表等可穿戴式设备也可以通信连接于可移动平台和/或手持控制装置。

手表等可穿戴式设备也可以根据可穿戴式设备拍摄的用户图像以及手持控制装置和/或可移动平台拍摄的用户图像确定手势动作的关键点信息。

在一些实施方式中，如图7所示，步骤S110中获取目标用户的手势动作的关键点信息，包括步骤S111至步骤S114。

S111、获取头戴显示设备搭载的图像获取装置拍摄的用户图像。

S112、根据所述头戴显示设备搭载的图像获取装置拍摄的用户图像判断目标用户的手势动作的关键点信息是否被遮挡。

示例性的，根据头戴显示设备搭载的图像获取装置拍摄的用户图像确定手部图像中的关键点，如果关键点的数量小于预设阈值，如22，则判定手势动作的关键点信息被遮挡；如果关键点的数量不小于预设阈值，则判定手势动作的关键点信息未被遮挡。

如果判定手势动作的关键点信息未被遮挡，则根据所述头戴显示设备搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。

S113、若所述关键点信息被遮挡，获取所述手持控制装置搭载的图像获取装置拍摄的用户图像和/或获取所述可移动平台搭载的图像获取装置拍摄的用户图像。

如图5、图6或图8所示，头戴显示设备连接于可移动平台和/或手持控制装置。可移动平台和/或手持控制装置各自搭载有图像获取装置。

如果判定头戴显示设备搭载的图像获取装置拍摄的用户图像中手势动作的关键点信息被遮挡，则请求可移动平台和/或手持控制装置发送可移动平台和/或手持控制装置搭载的图像获取装置拍摄的用户图像。

S114、根据所述头戴显示设备搭载的图像获取装置拍摄的用户图像，以及所述手持控制装置搭载的图像获取装置拍摄的用户图像和/或所述可移动平台搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。

从而，头戴显示设备可以根据头戴显示设备拍摄的用户图像以及可移动平台和/或手持控制装置拍摄的用户图像确定手势动作的关键点信息。从而可以获取在不同视角下目标用户的用户图像，从而确定不同视角下目标用户的手部图像。可以得到更丰富的手势动作的关键点信息，且可以防止手部关键点部分被遮挡导致的手势识别准确率降低。例如，可以确定目标用户手心和手背上的关键点信息。

在一些实施方式中，步骤S110中获取目标用户的手势动作的关键点信息，包括：获取可移动平台搭载的图像获取装置拍摄的用户图像；根据所述可移动平台搭载的图像获取装置拍摄的用户图像判断目标用户的手势动作的关键点信息是否被遮挡。如果判定手势动作的关键点信息未被遮挡，则根据所述可移动平台搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。若所述关键点信息被遮挡，获取可穿戴设备，例如头戴显示设备、智能手表等搭载的图像获取装置拍摄的用户图像。之后根据所述可穿戴设备搭载的图像获取装置拍摄的用户图像，以及所述可移动平台搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。

在一些实施方式中，可移动平台根据手势动作的关键点信息获得所述手势的识别结果，并根据识别结果执行相应的操作，如检测可移动平台搭载的图像获取装置拍摄的图像中的拍摄目标，对拍摄目标进行拍摄等。

可移动平台或者可穿戴设备可以根据可穿戴设备拍摄的用户图像以及可移动平台拍摄的用户图像确定手势动作的关键点信息。从而可以获取在不同视角下目标用户的用户图像，从而确定不同视角下目标用户的手部图像。可以得到更丰富的手势动作的关键点信息，且可以防止手部关键点部分被遮挡导致的手势识别准确率降低。例如，可以确定目标用户手心和手背上的关键点信息。

在一些实施方式中，如图6所示，目标用户手持手持控制装置，并佩戴头戴显示设备；可移动平台可以根据手持控制装置和/或头戴显示设备发送的指令执行相应的动作或功能。用户可以将手稍微离开手持控制装置，作出相应的手势动作，就可以向头戴显示设备输入手势动作相应的指令，以使头戴显示设备根据输入的指令产生控制指令，根据所述控制指令执行任务操作。从而，用户无需将手抬到头上佩戴的头戴显示设备的触控板上进行控制，更加省力。而且基于头戴显示设备显示的交互操作界面，用户可以直接用手在二维上进行菜单的选择和触发，如即可以控制界面上的光标左右或上下移动，还可以控制光标向坐上、右下等不同的方向移动，操作更加快捷，体验更加友好。

本说明书实施例提供的头戴显示设备的控制方法，通过获取目标用户的手势动作的关键点信息，并根据关键点信息识别输入指令，以及根据输入指令产生控制指令，以根据控制指令执行任务操作；实现用户可以快捷的使用手悬空作出手势动作控制头戴显示设备，且通过关键点信息识别手势动作对应的输入指令，可以排除会干扰手势识别的信息，识别速度更快且更准确，从而方便用户更快捷和更准确的控制头戴显示设备。

可以理解的，可以通过头戴显示设备拍摄的用户图像以及可移动平台和/或手持控制装置拍摄的用户图像确定手势动作的关键点信息，得到更丰富的手势动作的关键点信息，且可以防止手部关键点部分被遮挡导致的手势识别准确率降低。

可以理解的，用户可以通过特定的手势来“按下”交互操作界面中的虚拟按键，触发对应按键功能。根据手部关键点得到用户的食指指尖的位置确定交互操作界面中光标的位置，进而可以根据食指指尖的移动来控制菜单；以及将手部关键点信息输入到手势动作分类模型，识别用户的手势，当用户做出特定的手势如“剪刀手”时，可以“按下”光标所处位置的虚拟按钮，控制头戴显示设备或者通过头戴显示设备控制器连接的可移动平台和或手持控制装置。

请结合上述实施例参阅图9，图9是本说明书一实施例提供的可穿戴设备600的示意性框图。

具体的，可穿戴设备600可以为虚拟现实(VR，virtual reality)显示设备或第一人称视角(FPV，first person view)显示设备等。可穿戴设备600例如可以为眼镜式显示设备或者头盔式显示设备等。

该可穿戴设备600包括处理器601和存储器602，处理器601和存储器602通过总线603连接，该总线603比如为I2C(Inter-integrated Circuit)总线。

具体地，处理器601可以是微控制单元(Micro-controller Unit，MCU)、中央处理单元(Central Processing Unit，CPU)或数字信号处理器(Digital Signal Processor，DSP)等。

具体地，存储器602可以是Flash芯片、只读存储器(ROM，Read-Only Memory)磁盘、光盘、U盘或移动硬盘等。

具体的，可穿戴设备600自带图像获取装置604或者通过通信接口连接图像获取装置604。例如，图像获取装置604位于可穿戴设备600的下侧、上侧、左侧或右侧。

其中，所述处理器601用于运行存储在存储器602中的计算机程序，并在执行所述计算机程序时实现前述的控制方法。

本说明书实施例提供的可穿戴设备的具体原理和实现方式均与前述实施例的控制方法类似，此处不再赘述。

请结合上述实施例参阅图5，图5是本说明书一实施例提供的可移动平台控制系统的示意图。

如图5所示，可移动平台控制系统包括可移动平台和可穿戴设备。

其中，可移动平台，包括图像获取装置，用于将图像获取装置拍摄的图像发送给可穿戴设备；可穿戴设备，用于显示所述可移动平台发送的图像。

在一些实施方式中，如图8所示，可移动平台控制系统还包括：手持控制装置，用于向所述可移动平台发送遥控指令。所述可移动平台还用于根据所述遥控指令移动。

本说明书实施例提供的可移动平台控制系统的具体原理和实现方式均与前述实施例的控制方法类似，此处不再赘述。

请结合上述实施例参阅图10，图10是本说明书一实施例提供的识别手势的方法的流程示意图。

识别手势的方法可以应用于搭载图像获取装置的可穿戴设备、可移动平台等。

可穿戴设备例如可以为头戴显示设备、智能手表、上衣、腰带、护带等；头戴显示设备可以为虚拟现实(VR，virtual reality)显示设备或第一人称视角(FPV，first person view)显示设备。头戴显示设备例如可以为眼镜式显示设备或者头盔式显示设备等。

可移动平台例如可以为搭载图像获取装置的无人机、手持云台、移动机器人、车辆等。

如图10所示，识别手势的方法包括步骤S210至步骤S250。

S210、获得所述手势的第一图像。

示例性的，所述第一图像通过可穿戴设备搭载的图像获取装置获得。

示例性的，获取可穿戴设备搭载的图像获取装置拍摄的用户图像。

示例性的，所述可穿戴设备是具有图像获取装置的头盔、手表、眼镜、上衣、腰带、护带。

S220、根据所述第一图像获得所述手势的关键点信息。

示例性的，在全图范围内进行手部检测，输出手部的具体位置。根据手部的具体位置从摄像头拍摄的图像中裁剪出手部区域的图片。再将手部区域的图片输入到手部关键点检测神经网络得到手势的关键点信息，如图片中手部关键点的数目、位置等信息。

S230、当根据所述关键点信息无法判断所述手势类型时，获得所述手势的第二图像。

示例性的，如果手势的关键点信息中关键点的数量小于预设阈值，如22，则判定手势动作的关键点信息被遮挡，判定根据所述关键点信息无法判断所述手势类型。

如果关键点的数量不小于预设阈值，则判定手势动作的关键点信息未被遮挡，可以根据关键点信息获得所述手势的识别结果。

示例性的，所述第二图像通过所述可穿戴设备搭载的另一图像获取装置获得。

在一些实施例中，所述头戴显示设备在不同位置搭载至少两个摄像头。头戴显示设备根据在不同位置搭载的至少两个摄像头拍摄的用户图像确定所述手势动作的关键点信息。从而可以在不同视角下获取目标用户的用户图像，从而确定不同视角下目标用户的手部图像。可以得到更丰富的手势动作的关键点信息。

S240、根据所述第二图像更新所述手势的关键点信息。

示例性的，根据多个摄像头的图像可以分别获取手心和手背上的关键点信息，防止手部关键点部分被遮挡导致的手势识别准确率降低。

示例性的，将第一图像中的关键点的位置信息和第二图像中的关键点的位置信息一起存储为所述手势的关键点信息。

S250、根据所述更新后的关键点信息获得所述手势的识别结果。

根据手势动作的关键点信息可以确定手势动作的种类。例如，将所述关键点信息发送给手势动作分类模型；基于所述手势动作分类模型对所述关键点信息进行分类，得到所述手势的识别结果。

在另一些实施方式中，所述第一图像通过可移动平台搭载的图像获取装置获得。

示例性的，所述可移动平台是带有图像获取装置的无人机、手持云台、移动机器人、车辆。

示例性的，获取可移动平台搭载的图像获取装置拍摄的用户图像；根据所述可移动平台搭载的图像获取装置拍摄的用户图像判断目标用户的手势动作的关键点信息是否被遮挡。如果判定手势动作的关键点信息未被遮挡，则根据所述可移动平台搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。若所述关键点信息被遮挡，获取可穿戴设备，例如头戴显示设备、智能手表等搭载的图像获取装置拍摄的用户图像。之后根据所述可穿戴设备搭载的图像获取装置拍摄的用户图像，以及所述可移动平台搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。

示例性的，所述第二图像通过可穿戴设备搭载的图像获取装置获得。

本说明书实施例提供的识别手势的方法，通过在根据第一图像的关键点信息无法判断手势类型时，获得手势的第二图像，并根据第二图像更新手势的关键点信息，以根据更新后的关键点信息获得所述手势的识别结果。可以得到更丰富的手势动作的关键点信息，且可以防止手部关键点部分被遮挡导致的手势识别准确率降低。

请结合上述实施例参阅图11，图11是本说明书一实施例提供的可穿戴设备70的示意性框图。

如图11所示，可穿戴设备70包括存储器71和处理器72；所述存储器71用于存储计算机程序；所述处理器72，用于执行所述计算机程序并在执行所述计算机程序时，实现前述的识别手势的方法。

示例性的，所述可穿戴设备包括一下至少一种：头戴显示设备、智能手表、上衣、腰带、护带。

本说明书的实施例中还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序中包括程序指令，所述处理器执行所述程序指令，实现上述实施例提供的控制方法的步骤和/或识别手势的方法的步骤。

示例性的，所述计算机可读存储介质可以是前述任一实施例所述的可穿戴设备的内部存储单元，例如所述可穿戴设备的硬盘或内存。所述计算机可读存储介质也可以是所述可穿戴设备的外部存储设备，例如所述可穿戴设备上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。

本说明书上述实施例提供的可穿戴设备、识别手势的方法、可移动平台控制系统、计算机可读存储介质，通过获取目标用户的手势动作的关键点信息，并根据关键点信息识别输入指令，以及根据输入指令产生控制指令，以根据控制指令执行任务操作；实现用户可以快捷的使用手悬空作出手势动作控制可穿戴设备，且通过关键点信息识别手势动作对应的输入指令，可以排除会干扰手势识别的信息，识别速度更快且更准确，从而方便用户更快捷和更准确的控制可穿戴设备。

可以理解的，可以通过可穿戴设备拍摄的用户图像以及可移动平台和/或手持控制装置拍摄的用户图像确定手势动作的关键点信息，得到更丰富的手势动作的关键点信息，且可以防止手部关键点部分被遮挡导致的手势识别准确率降低。

可以理解的，用户可以通过特定的手势来“按下”交互操作界面中的虚拟按键，触发对应按键功能。根据手部关键点得到用户的食指指尖的位置确定交互操作界面中光标的位置，进而可以根据食指指尖的移动来控制菜单；以及将手部关键点信息输入到手势动作分类模型，识别用户的手势，当用户做出特定的手势如“剪刀手”时，可以“按下”光标所处位置的虚拟按钮，控制可穿戴设备或者通过可穿戴设备控制器连接的可移动平台和或手持控制装置。

应当理解，在此本说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本说明书。

还应当理解，在本说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

以上所述，仅为本说明书的具体实施方式，但本说明书的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本说明书揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本说明书的保护范围之内。因此，本说明书的保护范围应以权利要求的保护范围为准。

Claims

一种可穿戴设备的控制方法，其特征在于，包括：

获取目标用户的手势动作的关键点信息；

根据所述关键点信息识别输入指令；

根据所述输入指令产生控制指令，以通过所述控制指令执行任务操作。
根据权利要求1所述的控制方法，其特征在于，所述获取目标用户的手势动作的关键点信息，包括：

获取可穿戴设备搭载的图像获取装置拍摄的用户图像；

根据所述可穿戴设备搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。
根据权利要求2所述的控制方法，其特征在于，所述根据所述可穿戴设备搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息，包括：

根据所述可穿戴设备搭载的至少两个图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。
根据权利要求2所述的控制方法，其特征在于，还包括：

根据手持控制装置搭载的图像获取装置拍摄的用户图像和所述可穿戴设备搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。
根据权利要求2所述的控制方法，其特征在于，还包括：

根据可移动平台搭载的图像获取装置拍摄的用户图像和所述可穿戴设备搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。
根据权利要求2所述的控制方法，其特征在于，还包括：

根据所述可穿戴设备搭载的图像获取装置拍摄的用户图像判断目标用户的手势动作的关键点信息是否被遮挡；

若所述关键点信息被遮挡，获取手持控制装置搭载的图像获取装置拍摄的用户图像和/或获取可移动平台搭载的图像获取装置拍摄的用户图像；

根据所述可穿戴设备搭载的图像获取装置拍摄的用户图像，以及所述手持控制装置搭载的图像获取装置拍摄的用户图像和/或所述可移动平台搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。
根据权利要求2所述的控制方法，其特征在于，所述获取目标用户的手势动作的关键点信息，包括：

识别所述用户图像中的手部区域，并获取所述手部区域中的关键点信息。
根据权利要求1所述的控制方法，其特征在于，所述根据所述关键点信息识别输入指令，包括：

将所述关键点信息发送给手势动作分类模型；

基于所述手势动作分类模型对所述关键点信息进行分类，以得到输入指令。
根据权利要求1所述的控制方法，其特征在于，所述输入指令包括确定指令、返回指令、模式切换指令中的至少一种。
根据权利要求9所述的控制方法，其特征在于，还包括：

若根据所述关键点信息识别出的输入指令为模式切换指令，根据所述模式切换指令开启或关闭肢体交互模式；

所述肢体交互模式用于根据识别出的输入指令产生的控制指令执行任务操作。
根据权利要求1所述的控制方法，其特征在于，所述根据所述输入指令产生控制指令，包括：

根据所述可穿戴设备当前显示的交互操作界面和所述输入指令确定操作控制信息；

根据所述操作控制信息产生对应的控制指令。
根据权利要求11所述的控制方法，其特征在于，所述根据所述交互操作界面和所述输入指令确定操作控制信息，包括：

确定所述交互操作界面中的功能按钮；

根据所述功能按钮和所述输入指令确定操作控制信息。
根据权利要求12所述的控制方法，其特征在于，所述确定所述交互操作界面中的功能按钮，包括：

根据所述关键点信息确定目标用户手部的预设部位在所述交互操作界面上的位置；

根据所述交互操作界面上的所述位置确定所述功能按钮。
根据权利要求11所述的控制方法，其特征在于，所述通过所述控制指令执行任务操作，包括：

根据所述控制指令切换所述可穿戴设备显示的交互操作界面，或者调整所述可穿戴设备当前显示的交互操作界面中的菜单。
根据权利要求1所述的控制方法，其特征在于，所述通过所述控制指令执行任务操作，包括：

根据所述控制指令开始存储或者结束存储所述可穿戴设备从可移动平台获取的数据。
根据权利要求1所述的控制方法，其特征在于，所述通过所述控制指令执行任务操作，包括：

根据所述控制指令向可移动平台发送平台控制指令，以控制所述可移动平台。
根据权利要求5所述的控制方法，其特征在于，所述可移动平台为无人飞行器、无人驾驶车辆或无人驾驶船艇。
根据权利要求1所述的控制方法，其特征在于，所述可穿戴设备为虚拟现实显示设备或第一人称视角显示设备。
根据权利要求2所述的控制方法，其特征在于，所述可穿戴设备搭载的图像获取装置包括彩色摄像头、深度传感器、RGB-D摄像头中的至少一种。
一种可穿戴设备，其特征在于，包括存储器和处理器；

所述存储器用于存储计算机程序；

所述处理器，用于执行所述计算机程序并在执行所述计算机程序时，实现如下步骤：

获取目标用户的手势动作的关键点信息；

根据所述关键点信息识别输入指令；

根据所述输入指令产生控制指令，以根据所述控制指令执行任务操作。
根据权利要求20所述的可穿戴设备，其特征在于，所述获取目标用户的手势动作的关键点信息，包括：

获取可穿戴设备搭载的图像获取装置拍摄的用户图像；

根据所述可穿戴设备搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。
根据权利要求21所述的可穿戴设备，其特征在于，所述根据所述可穿戴设备搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息，包括：

根据所述可穿戴设备搭载的至少两个图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。
根据权利要求21所述的可穿戴设备，其特征在于，所述处理器还实现：

根据手持控制装置搭载的图像获取装置拍摄的用户图像和所述可穿戴设备搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。
根据权利要求21所述的可穿戴设备，其特征在于，所述处理器还实现：

根据可移动平台搭载的图像获取装置拍摄的用户图像和所述可穿戴设备搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。
根据权利要求21所述的可穿戴设备，其特征在于，所述处理器还实现：

根据所述可穿戴设备搭载的图像获取装置拍摄的用户图像判断目标用户的手势动作的关键点信息是否被遮挡；

若所述关键点信息被遮挡，获取手持控制装置搭载的图像获取装置拍摄的用户图像和/或获取可移动平台搭载的图像获取装置拍摄的用户图像；

根据所述可穿戴设备搭载的图像获取装置拍摄的用户图像，以及所述手持控制装置搭载的图像获取装置拍摄的用户图像和/或所述可移动平台搭载的图像获取装置拍摄的用户图像确定所述手势动作的关键点信息。
根据权利要求21所述的可穿戴设备，其特征在于，所述获取目标用户的手势动作的关键点信息，包括：

识别所述用户图像中的手部区域，并获取所述手部区域中的关键点信息。
根据权利要求20所述的可穿戴设备，其特征在于，所述根据所述关键点信息识别输入指令，包括：

将所述关键点信息发送给手势动作分类模型；

基于所述手势动作分类模型对所述关键点信息进行分类，以得到输入指令。
根据权利要求20所述的可穿戴设备，其特征在于，所述输入指令包括确定指令、返回指令、模式切换指令中的至少一种。
根据权利要求28所述的可穿戴设备，其特征在于，还包括：

若根据所述关键点信息识别出的输入指令为模式切换指令，根据所述模式切换指令开启或关闭肢体交互模式；

所述肢体交互模式用于根据识别出的输入指令产生的控制指令执行任务操作。
根据权利要求20所述的可穿戴设备，其特征在于，所述根据所述输入指令产生控制指令，包括：

根据所述可穿戴设备当前显示的交互操作界面和所述输入指令确定操作控制信息；

根据所述操作控制信息产生对应的控制指令。
根据权利要求30所述的可穿戴设备，其特征在于，所述根据所述交互操作界面和所述输入指令确定操作控制信息，包括：

确定所述交互操作界面中的功能按钮；

根据所述功能按钮和所述输入指令确定操作控制信息。
根据权利要求31所述的可穿戴设备，其特征在于，所述确定所述交互操作界面中的功能按钮，包括：

根据所述关键点信息确定目标用户手部的预设部位在所述交互操作界面上的位置；

根据所述交互操作界面上的所述位置确定所述功能按钮。
根据权利要求30所述的可穿戴设备，其特征在于，所述根据所述控制指令执行任务操作，包括：

根据所述控制指令切换所述可穿戴设备显示的交互操作界面，或者调整所述可穿戴设备当前显示的交互操作界面中的菜单。
根据权利要求20所述的可穿戴设备，其特征在于，所述根据所述控制指令执行任务操作，包括：

根据所述控制指令开始存储或者结束存储所述可穿戴设备从可移动平台获取的数据。
根据权利要求20所述的可穿戴设备，其特征在于，所述根据所述控制指令执行任务操作，包括：

根据所述控制指令向可移动平台发送平台控制指令，以控制所述可移动平台。
根据权利要求24所述的可穿戴设备，其特征在于，所述可移动平台为无人飞行器、无人驾驶车辆或无人驾驶船艇。
根据权利要求20所述的可穿戴设备，其特征在于，所述可穿戴设备为虚拟现实显示设备或第一人称视角显示设备。
根据权利要求21所述的可穿戴设备，其特征在于，所述可穿戴设备搭载的图像获取装置包括彩色摄像头、深度传感器、RGB-D摄像头中的至少一种。
一种可移动平台控制系统，其特征在于，包括：

可移动平台，包括图像获取装置，用于将图像获取装置拍摄的图像发送给可穿戴设备；

如权利要求20-38中任一项所述的可穿戴设备，用于显示所述可移动平台发送的图像。
根据权利要求39所述的控制系统，其特征在于，还包括：

手持控制装置，用于向所述可移动平台发送遥控指令；

所述可移动平台还用于根据所述遥控指令移动。
一种识别手势的方法，其特征在于，所述方法包括：

获得所述手势的第一图像；

根据所述第一图像获得所述手势的关键点信息；

当根据所述关键点信息无法判断所述手势类型时，获得所述手势的第二图像；

根据所述第二图像更新所述手势的关键点信息；

根据所述更新后的关键点信息获得所述手势的识别结果。
根据权利要求41所述的方法，其特征在于，所述第一图像通过可穿戴设备搭载的图像获取装置获得。
根据权利要求42所述的方法，其特征在于，所述第二图像通过所述可穿戴设备搭载的另一图像获取装置获得。
根据权利要求41所述的方法，其特征在于，所述第一图像通过可移动平台搭载的图像获取装置获得。
根据权利要求44所述的方法，其特征在于，所述第二图像通过可穿戴设备搭载的图像获取装置获得。
根据权利要求42、43、45中任一项所述的方法，其特征在于，所述可穿戴设备是具有图像获取装置的头盔、手表、眼镜、上衣、腰带、护带。
根据权利要求44所述的方法，其特征在于，所述可移动平台是带有图像获取装置的无人机、手持云台、移动机器人、车辆。
一种可穿戴设备，其特征在于，包括存储器和处理器；

所述存储器用于存储计算机程序；

所述处理器，用于执行所述计算机程序并在执行所述计算机程序时，实现如权利要求41-43、45中任一项所述的方法。
根据权利要求48所述的可穿戴设备，其特征在于，所述可穿戴设备包括一下至少一种：头戴显示设备、智能手表、上衣、腰带、护带。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现：

如权利要求1-19中任一项所述的可穿戴设备的控制方法；和/或

如权利要求41-47中任一项所述的识别手势的方法。