CN109725722A - 有屏设备的手势控制方法和装置 - Google Patents

有屏设备的手势控制方法和装置 Download PDF

Info

Publication number
CN109725722A
CN109725722A CN201811640757.1A CN201811640757A CN109725722A CN 109725722 A CN109725722 A CN 109725722A CN 201811640757 A CN201811640757 A CN 201811640757A CN 109725722 A CN109725722 A CN 109725722A
Authority
CN
China
Prior art keywords
gesture operation
screen equipment
default
instruction
screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811640757.1A
Other languages
English (en)
Other versions
CN109725722B (zh
Inventor
陈果果
钟镭
陈轶博
宋愷晟
李璇
关岱松
张静雅
李思琪
刘星彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Shanghai Xiaodu Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811640757.1A priority Critical patent/CN109725722B/zh
Publication of CN109725722A publication Critical patent/CN109725722A/zh
Application granted granted Critical
Publication of CN109725722B publication Critical patent/CN109725722B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例公开了有屏设备的手势控制方法和装置。该方法的一具体实施方式包括:检测对有屏设备进行控制的手势操作,响应于检测到手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与预设手势操作对应的工作状态控制指令。该实施方式不依赖于附加设备及多轮交互,实现了更灵活的有屏设备工作状态控制。

Description

有屏设备的手势控制方法和装置
技术领域
本申请实施例涉及计算机技术领域,具体涉及人机交互领域,尤其涉及有屏设备的手势控制方法和装置。
背景技术
非接触式人机交互是一种方便、操控灵活性较强的人机交互方式。在非接触式人机交互中,由于用户与电子设备之间的相对位置受限较小,更符合用户的便捷操控需求,被应用在智慧生活、智能办公等各个领域。
有屏设备的人机交互方式包括通过附加的无线发射装置(例如遥控器)的交互和语音交互。基于附加装置的交互方式中按键(包括虚拟按键)较多,依赖于有屏设备界面的设计,操作步长较长,且操作时需要将注意力从有屏设备转移到遥控器,操作效率有待提升。语音交互可以解析出用户意图并直接提供用户希望获取的内容。但语音交互在一些场景中不适用,例如环境声音嘈杂或有屏设备播放的多媒体声音较大的场景。
发明内容
本申请实施例提出了有屏设备的手势控制方法和装置。
第一方面,本申请实施例提供了一种有屏设备的手势控制方法,包括:检测对有屏设备进行控制的手势操作;响应于检测到手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与预设手势操作对应的工作状态控制指令。
在一些实施例中,上述响应于检测到手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与预设手势操作对应的工作状态控制指令,包括:响应于检测到手势操作是指示进入开启状态的第一预设手势操作,生成与第一预设手势操作对应的开启控制指令。
在一些实施例中,上述方法还包括:获取有屏设备的当前设备系统状态;上述响应于检测到手势操作是指示进入开启状态的第一预设手势操作,生成与第一预设手势操作对应的开启控制指令,包括:响应于检测到手势操作是指示进入开启状态的第一预设手势操作,且有屏设备的当前设备系统状态为关机状态,生成用于开启有屏设备的设备系统的开启控制指令;响应于检测到手势操作是指示进入开启状态的第一预设手势操作,且有屏设备的当前设备系统状态为开机状态,生成用于唤醒有屏设备的手势识别系统的开启控制指令。
在一些实施例中,上述第一预设手势操作包括拍掌。
在一些实施例中,上述响应于检测到手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与预设手势操作对应的工作状态控制指令,包括:响应于检测到手势操作是指示进入关闭状态的第二预设手势操作,生成与第二预设手势操作对应的关机控制指令。
在一些实施例中,上述第二预设手势操作包括双手手臂交叉。
第二方面,本申请实施例提供了一种有屏设备的手势控制装置,包括:检测单元,被配置为检测对有屏设备进行控制的手势操作;生成单元,被配置为响应于检测到手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与预设手势操作对应的工作状态控制指令。
在一些实施例中,上述生成单元进一步被配置为:响应于检测到手势操作是指示进入开启状态的第一预设手势操作,生成与第一预设手势操作对应的开启控制指令。
在一些实施例中,上述装置还包括:获取单元,被配置为获取有屏设备的当前设备系统状态;上述生成单元进一步被配置为:响应于检测到手势操作是指示进入开启状态的第一预设手势操作,且有屏设备的当前设备系统状态为关机状态,生成用于开启有屏设备的设备系统的开启控制指令;响应于检测到手势操作是指示进入开启状态的第一预设手势操作,且有屏设备的当前设备系统状态为开机状态,生成用于唤醒有屏设备的手势识别系统的开启控制指令。
在一些实施例中,上述第一预设手势操作包括拍掌。
在一些实施例中,上述生成单元进一步被配置为:响应于检测到手势操作是指示进入关闭状态的第二预设手势操作,生成与第二预设手势操作对应的关机控制指令。
在一些实施例中,上述第二预设手势操作包括双手手臂交叉。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;显示装置;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面提供的有屏设备的手势控制方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现第一方面提供的有屏设备的手势控制方法。
本申请上述实施例的有屏设备的手势控制方法和装置,通过检测对有屏设备进行控制的手势操作,响应于检测到手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与预设手势操作对应的工作状态控制指令,不依赖于附加设备及多轮交互,实现了更灵活的有屏设备工作状态控制。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请实施例可以应用于其中的示例性系统架构图;
图2是根据本申请的有屏设备的手势控制方法的一个实施例的流程图;
图3是根据本申请的有屏设备的手势控制方法的另一个实施例的流程图;
图4A-图4C是图3所示有屏设备的手势控制方法中的一种手势操作的示意图;
图5是根据本申请的有屏设备的手势控制方法的又一个实施例的流程图;
图6A-图6B是图5所示有屏设备的手势控制方法中的一种手势操作的示意图;
图7是本申请的有屏设备的手势控制装置的一个实施例的结构示意图;
图8是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的有屏设备的手势控制方法或有屏设备的手势控制装置的示例性系统架构。
如图1所示,系统架构100可以包括有屏设备110以及服务器120。有屏设备110可以通过网络与服务器120进行交互,以接收或发送消息等。有屏设备110可以是具有显示屏的电子设备,例如智能电视、智能显示屏、带屏智能音箱等。有屏设备上可以安装有各种人机交互应用,例如浏览器应用、搜索应用、多媒体资源播放应用,等等。
用户130可以使用有屏设备110与服务器120交互,以获取服务器120提供的服务。用户130可以采用多种方式控制有屏设备110向服务器120发起服务请求,例如非接触的手势交互方式、语音交互方式、辅助设备(例如遥控器)交互方式等。
有屏设备110上可以设置有人体动作感知设备111,例如基于可见光或红外光的图像采集设备、基于激光、声波等信息的测距设备或用于三维建模的设备。人体动作感知设备111可以采集人体动作信息,将人体动作信息传输至有屏设备110的处理器或与有屏设备110连接的服务器120进行处理。
服务器120可以是为有屏设备110显示的内容提供内容服务器的服务器,也可以是为有屏设备110提供功能服务的服务器。服务器120可以接收有屏设备110发送的请求,对请求进行解析,根据解析结果生成响应信息,并将生成的响应信息返回给有屏设备110。有屏设备110可以输出响应信息。
需要说明的是,本申请实施例所提供的有屏设备的手势控制方法可以由有屏设备110执行,相应地,有屏设备的手势控制装置可以设置于有屏设备110中。在这些场景中,上述系统架构可以不包含服务器120。
在一些场景中,本申请实施例提供的有屏设备的手势控制方法可以由与有屏设备110通信连接的服务器120执行,相应地,有屏设备的手势控制装置可以设置于与有屏设备110连接的服务器120中。
应该理解,图1中的有屏设备、服务器、用户的数目仅仅是示意性的。根据实现需要,可以具有任意数目的有屏设备、服务器、用户。
继续参考图2,其示出了根据本申请的有屏设备的手势控制方法的一个实施例的流程200。该有屏设备的手势控制方法,包括以下步骤:
步骤201,检测对有屏设备进行控制的手势操作。
在本实施例中,有屏设备的手势控制方法的执行主体(例如图1所示的有屏设备110)可以对其控制范围内的手势操作进行检测。具体可以基于设置于有屏设备上的人体动作感知设备获取的手势感知信息确定手势操作。该人体动作感知设备可以是图像采集设备、激光测距设备、超声波测距设备等,手势感知信息可以是可见光图像、红外图像、三维激光点云等信息。
以图像信息为例,上述执行主体可以获取控制范围内的手势图像,并对手势图像进行手势识别,得到手势操作的检测结果。可选地,所获取的图像中可以包含除手势外的其他信息,例如人脸信息。可以对该图像进行图像分割,分离出包含手势图像信息的部分来进行手势识别,以避免其他人体部位(例如人脸)对手势识别结果造成影响。
上述有屏设备可以设置有至少一个摄像头。该至少一个摄像头可以对有屏设备的显示屏前方的一个区域进行成像。当用户在该区域内发起手势操作时,摄像头可以采集手势操作的图像或图像序列,然后可以基于图像或图像序列来识别用户的手势类型。具体可以将手势操作的图像输入已训练的手势识别模型进行手势识别,或者可以将预先设定的各类型手势操作的动作特征作为模板,与从图像中提取出的手势操作的特征进行比对,从而确定手势操作的类型。
需要说明的是,上述摄像头的数量可以为两个以上。两个以上的摄像头可以在与有屏设备的显示屏平行的平面内并排排列。这样,还可以根据不同摄像头所采集到的手势操作的图像对用户的手势进行三维建模,得到手势操作沿与有屏设备的显示屏垂直方向的纵深信息。其中,可以对两个以上的摄像头进行标定,确定两个以上摄像头之间的位置转换参数,以在三维建模时配准两幅以上手势操作的图像。
可以采用如下方式检测对有屏设备进行控制的手势操作:首先基于采集的图像采用目标检测算法检测用户抬手动作,确定初始手部初始位置及初始手部姿态,然后根据连续采集的多幅图像确定手部位置变化轨迹即手部姿态变化特征,并确定手部位置和/或姿态发生变化的持续时间,进而确定出用户的手势操作。
在本实施例的一些可选的实现方式中,可以按照如下方式检测对有屏设备进行控制的手势操作:首先基于肤色等特征,采用边缘检测等算法检测手的位置,具体可以根据肤色特征和人体结构特征从图像中提取出手部区域。然后基于采集的视频跟踪手的位置变化,具体可以采用基于肤色的SIFT(Scale-invariant feature transform,尺度不变特征变换)特征提取算法,结合HOG(Histogram of Oriented Gradient,方向梯度直方图),采用Mean Shift(均值偏移)对视频中的图像帧进行手部位置检测和跟踪,得出手部位置变化轨迹。之后检测手部在每一个位置处的关键点位置,例如手指关节的相对位置,并对手势形状进行分类,识别出手势操作。
进一步地,在识别手势操作时,可以将待识别的手势的特征参数与预先存储的手势模板的特征参数进行匹配,通过计算相似度来进行识别。或者可以采用基于统计分析的方法来识别手势,具体可以采用诸如SVM(Support Vector Machine,支持向量机)等方法,统计样本特征向量来确定手势分类器。还可以采用诸如神经网络、深度学习的方法提取手部区域、定位手部关键点位置,并对手势进行分类。在识别动态的手势操作时,还可以结合时序的图像处理、特征提取和分类技术,例如DTW(Dynamic Time Warping,动态时间规整)、CRF(conditional random field algorithm,条件随机场算法)、HMM(Hidden MarkovModel,隐马尔科夫模型)等进行匹配和识别。
在一些实施例中,可以在有屏设备的有效手势控制区域内检测手势操作。其中,有效手势控制区域可以是预先设定的有屏设备显示屏前方的一个区域。该有效手势控制区域可以是有屏显示设备的观看区域,或者是设置于有屏设备上的人体动作感知设备的可感知区域。例如,有效手势控制区域可以是有屏显示设备前方沿垂直于有屏显示设备的显示屏方向呈辐射状的三维区域。该有效手势控制区域可以是根据有屏设备的显示屏尺寸和/或摄像头的成像范围确定的。
上述手势操作可以包括静态手势操作和动态手势操作。其中,静态手势操作可以是手部姿态和位置不发生变化的手势操作,例如握拳状态的手势、双手比心的手势,等等。动态手势操作可以是手部姿态和/或位置发生变化的手势操作,例如单手食指按压动作的手势,挥手、拍掌等手势。
步骤202,响应于检测到手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与预设手势操作对应的工作状态控制指令。
上述执行主体可以预存手势模板库。该手势模板库包括预设的多个用于指示对有屏设备的工作状态进行控制的手势操作。可以对手势操作进行识别,具体可以对采集到的手势操作的图像信息或其他信息进行特征提取,将提取出的特征与预存的手势模板库中的手势操作的特征进行匹配,得到与步骤201检测到的手势操作匹配的预设手势操作。
接着,可以查找出预设手势操作对应的工作状态控制操作,生成与该预设手势操作对应的工作状态控制指令。在这里,有屏设备的工作状态可以包括设备系统的开启、关闭状态,还可以包括由设备系统参数、内存参数、运行参数等相关的多种不同工作状态,例如手势识别系统的唤醒状态和休眠状态、语音交互系统的唤醒状态和休眠状态,等等。
在本实施例中,上述指示对有屏设备进行工作状态控制的预设手势操作可以是实现对有屏设备的工作状态进行全局控制的手势操作,即将有屏设备整体作为控制对象的全局手势操作。
上述执行主体预存的手势模板库中的手势模板可以用于指示执行预设的工作状态控制操作,手势模板可以与对应的工作状态控制操作关联,例如拍掌的手势可以与开启设备系统的控制操作相对应并关联,双手手臂交叉的手势可以与关闭设备系统的控制操作相对应并关联。则在识别出用户当前的手势操作后,可以获取该手势操作所指示执行的工作状态控制操作,并生成指示执行该工作状态控制操作的指令。这样,通过检测并识别手势操作,可以触发生成控制有屏设备工作状态的操作指令。
本申请上述实施例的应用场景可以为,用户可以通过手势操作来控制有屏设备的工作状态。具体地,用户发起手势操作,有屏设备的图像采集装置等设备可以采集用户的手势图像,然后进行手势识别,根据识别结果生成该手势操作触发的工作状态控制指令。
本申请上述实施例的有屏设备的手势控制方法,通过检测对有屏设备进行控制的手势操作,响应于检测到手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与预设手势操作对应的工作状态控制指令,实现了基于手势对有屏设备全局工作状态的隔空控制,不依赖于附加设备且适用于环境声音较大的场景,提升了有屏设备工作状态控制方式的灵活性和操作效率。
继续参考图3,其示出了根据本申请的有屏设备的手势控制方法的另一个实施例的流程图。如图3所示,本实施例的有屏设备的手势控制方法的流程300,包括以下步骤:
步骤301,检测对有屏设备进行控制的手势操作。
在本实施例中,有屏设备的手势控制方法的执行主体(例如图1所示的有屏设备110)可以对其控制范围内的手势操作进行检测。具体可以基于设置于有屏设备上的人体动作感知设备获取的手势感知信息确定手势操作。该人体动作感知设备可以是图像采集设备、激光测距设备、超声波测距设备等。
以图像信息为例,上述执行主体可以获取控制范围内的手势图像,并对手势图像进行手势识别,得到手势操作的检测结果。
上述有屏设备可以设置有至少一个摄像头。该至少一个摄像头可以对有屏设备的显示屏前方的一个区域进行成像。当用户在该区域内发起手势操作时,摄像头可以采集手势操作的图像或图像序列,然后可以基于图像或图像序列来识别用户的手势类型。具体可以将手势操作的图像输入已训练的手势识别模型进行手势识别,或者可以将预先设定的各类型手势操作的动作特征作为模板,与从图像中提取出的手势操作的特征进行比对,从而确定手势操作的类型。
上述步骤301与前述实施例的步骤201一致,步骤301的具体实现方式还可以参考前述对步骤201的描述,此处不再赘述。
步骤302,响应于检测到手势操作是指示进入开启状态的第一预设手势操作,生成与第一预设手势操作对应的开启控制指令。
在本实施例中,可以预先存储用于指示将有屏设备的工作状态切换为开启状态的第一预设手势操作,并判断步骤301检测到的手势操作是否与该第一预设手势操作一致。具体可以提取获取到的手势操作的特征,并与第一预设手势的特征模板进行匹配,还可以利用已训练的手势识别模型判断步骤301检测到的手势操作是否与第一预设手势操作匹配。
若步骤301检测到的手势操作与第一预设手势操作匹配成功,则可以生成与第一预设手势操作对应的开启控制指令。在这里,开启控制指令可以是控制有屏设备的设备系统、操作系统、手势识别系统、语音系统等功能系统开启的指令。在生成并发出该开启控制指令后,有屏设备可以执行相应的开启控制操作。
在实践中,若当前有屏设备处于关闭状态,且检测到用户发出的手势操作是上述第一预设手势操作,可以生成开启控制指令以控制有屏设备将设备中的功能系统由关闭状态切换为开启状态。若当前有屏设备处于开启状态,且检测到用户发出的手势操作是上述第一预设手势操作,可以生成开启控制指令以控制有屏设备保持设备中的功能系统的开启状态。
通过识别手势操作是否为指示进入开启状态的第一预设手势操作,并在手势操作是第一预设手势操作时生成开启控制指令,实现了不依赖于附加设备的有屏设备非接触式开启状态控制,提升了有屏设备开启控制的灵活性。
在一些实施例中,上述有屏设备的手势控制方法的流程300还可以包括步骤303:获取有屏设备的当前设备系统状态。该步骤303可以在步骤301之前执行,也可以在步骤301和步骤302之间执行。
这时,可以按照如下方式执行上述响应于检测到手势操作是指示进入开启状态的第一预设手势操作,生成与第一预设手势操作对应的开启控制指令的步骤302:
响应于检测到手势操作是指示进入开启状态的第一预设手势操作,且有屏设备的当前设备系统状态为关机状态,生成用于开启有屏设备的设备系统的开启控制指令;响应于检测到手势操作是指示进入开启状态的第一预设手势操作,且有屏设备的当前设备系统状态为开机状态,生成用于唤醒有屏设备的手势识别系统的开启控制指令。
具体来说,可以在生成开启控制指令之前,根据有屏设备当前的设备状态确定开启控制指令的执行对象。在这里,执行对象可以包括设备系统和手势识别系统。若有屏设备当前的设备系统状态为关机状态,且检测到手势操作为上述第一预设手势操作,可以确定该手势操作的执行对象是设备系统,该手势操作用于指示控制开启有屏设备的设备系统。若有屏设备当前的设备系统状态为开机状态,且检测到手势操作为第一预设手势操作,这时可以确定该手势操作的执行对象是手势识别系统,该手势操作用于指示控制唤醒有屏设备的手势识别系统。
上述手势识别系统是有屏设备的中用于实现手势操控逻辑的功能模块。手势识别系统具有唤醒和休眠两种状态。在实践中,可以通过第一预设手势操作唤醒手势识别系统,手势识别系统可以持续检测手势并识别。若未检测到用户手势的时间长度超过预设时长,则可以控制手势识别系统进入休眠状态。在下次通过手势控制有屏设备执行操作之前,可以通过发起预设手势操作来重新唤醒手势识别系统。这样,手势识别系统可以在不需要的情况下进入休眠状态,有助于节约系统资源。
可选地,上述指示进入开启状态的第一预设手势操作可以包括拍掌。图4A、图4B和图4C示出了拍掌手势的示意图。图4A为拍掌手势的手部静态姿势示意图,图4B为拍掌手势动态示意图,图4C为拍掌手势中双掌交叠部分的示意图。如图4A-图4C所示,在拍掌手势中,手腕带动双掌分别沿箭头所示方向合在一起,且双掌有部分区域重叠(如图4C所示的阴影部分)。在检测拍掌手势时,需要采集多幅连续的图像,从多幅连续的图像中检测双手相对位置和姿态的变化。可选地,上述拍掌手势中,双掌在手腕带动下移动的速度小于预设的速度阈值,例如小于0.5米/秒。若检测到用户双掌在手腕带动下相互靠近并合上的速度不小于该速度阈值,则可以确定用户当前的手势操作不是指示进入开启状态的拍掌手势操作。
通过同一个手势操作来控制手势识别系统的唤醒和有屏设备的开机,系统根据当前工作状态自动区分两种指令,实现了更加便捷的手势控制,提升了操作效率。进一步地,通过拍掌操作来控制开机和唤醒手势识别系统,由于该手势操作交自然且不易误操作,有助于提升手势操作识别的准确率。
可选地,上述指示进入开启状态的第一预设手势操作还可以包括以下任意一项:打响指、隔空点击、大拇指向上且其他四指收拢、手心向前手掌由握拳到张开、掌心向外且手部悬停空中等等。其中,隔空点击的手势可以是单指点击(例如食指伸出点击、其他四指合拢)、多个手指共同点击(例如单个手掌五指伸出点击)。
需要说明的是,与拍掌手势类似地,上述手势中同一个手势可以与不同的开启控制操作,例如打响指、隔空点击、大拇指向上且其他四指收拢手势中每个手势均可以与开启设备系统的操作和唤醒手势识别系统的操作相关联。上述各手势也可以与不同的开启控制操作或开启控制指令相关联,例如手心向前手掌由握拳到张开的手势与开启设备系统的操作相关联、与唤醒手势识别系统的操作不关联,掌心向外且手部悬停空中与唤醒手势识别系统的操作相关联、与开启设备系统的操作不关联。
需要说明的是,本申请实施例的第一预设手势操作还可以是其他的手势,本申请对此不作限定。
进一步可选地,上述执行主体可以先获取有屏设备的当前设备系统状态,然后检测手势操作。这样,在确定有屏设备的当前设备系统状态为关机状态时,可以直接将检测到的手势操作与第一预设手势操作进行匹配,而无需与其他手势操作进行匹配,从而更快地识别出用户的开机手势控制操作,同时节约系统计算资源。
继续参考图5,其示出了根据本申请的有屏设备的手势控制方法的又一个实施例的流程图。如图5所示,本实施例的有屏设备的手势控制方法的流程500,包括以下步骤:
步骤501,检测对有屏设备进行控制的手势操作。
在本实施例中,有屏设备的手势控制方法的执行主体(例如图1所示的有屏设备110)可以对其控制范围内的手势操作进行检测。具体可以基于设置于有屏设备上的人体动作感知设备获取的手势感知信息确定手势操作。该人体动作感知设备可以是图像采集设备、激光测距设备、超声波测距设备等。
以图像信息为例,上述执行主体可以获取控制范围内的手势图像,并对手势图像进行手势识别,得到手势操作的检测结果。
上述有屏设备可以设置有至少一个摄像头。该至少一个摄像头可以对有屏设备的显示屏前方的一个区域进行成像。当用户在该区域内发起手势操作时,摄像头可以采集手势操作的图像或图像序列,然后可以基于图像或图像序列来识别用户的手势类型。具体可以将手势操作的图像输入已训练的手势识别模型进行手势识别,或者可以将预先设定的各类型手势操作的动作特征作为模板,与从图像中提取出的手势操作的特征进行比对,从而确定手势操作的类型。
上述步骤501与前述实施例的步骤201一致,步骤501的具体实现方式还可以参考前述对步骤501的描述,此处不再赘述。
步骤502,响应于检测到手势操作是指示进入关闭状态的第二预设手势操作,生成与第二预设手势操作对应的关机控制指令。
在本实施例中,可以预先存储用于指示将有屏设备的工作状态切换为关闭状态的第二预设手势操作,并判断步骤501检测到的手势操作是否与该第二预设手势操作一致。具体可以提取获取到的手势操作的特征,并与第二预设手势的特征模板进行匹配,还可以利用已训练的手势识别模型判断步骤501检测到的手势操作是否与第二预设手势操作匹配。
若步骤501检测到的手势操作与第二预设手势操作匹配成功,则可以生成与第二预设手势操作对应的关闭控制指令。在这里,关闭控制指令可以是控制有屏设备的运行状态切换为关闭的指令。在生成并发出该关闭控制指令后,有屏设备可以执行相应的关闭控制操作。
在实践中,若当前有屏设备处于开启状态,且检测到用户发出的手势操作是上述第二预设手势操作,可以生成关闭控制指令以控制有屏设备将设备中的功能系统由开启状态切换为关闭状态。若当前有屏设备处于关闭状态,且检测到用户发出的手势操作是上述第二预设手势操作,可以生成关闭控制指令以控制有屏设备保持设备中的功能系统的关闭状态。
通过识别手势操作是否为指示进入关闭状态的第二预设手势操作,并在手势操作是第二预设手势操作时生成关闭控制指令,实现了不依赖于附加设备的有屏设备非接触式关闭状态控制,提升了有屏设备关闭控制的灵活性。
可选地,上述第二预设手势操作可以包括双手手臂交叉。如图6A和图6B所示,双手交叉的手势操作中,手臂肘关节弯曲,双手臂交叉,形成“X”形状。可选地,双手交叉的手势操作可以限定双手手臂交叉姿势停留超过预设的时间阈值,例如0.5秒,若双手手臂交叉的姿势维持不超过该时间阈值,则不进行对双手手臂交叉姿势的响应。可选地,可以限定双手交叉的角度在一定范围内,例如30°至150°。当双手手臂交叉的角度在该范围之外时,也不进行响应。
由于双手手臂交叉的手势操作的幅度较大,不易发生误操作,可以避免系统误识别。并且,通过手势姿态的持续时间判断手势操作是否指示有屏设备的系统状态切换为关闭状态,可以进一步避免系统对手势操作所表征的用户操控意图的误识别。
可选地,上述第二预设手势操作还可以是以下任意一项:单手画“X”、拍掌、抓取、招手、隔空点击两次以上,等等。需要说明的是的,这里的隔空点击的手势操作可以是单个手指伸出点击、也可以是多个手指共同点击(例如手掌点击)。
需要说明的是,上述第一预设手势操作与第二预设手势操作不相同,从而在用户发起手势控制后,可以准确判断用户的工作状态的操作意图。
可选地,上述有屏设备的手势控制方法的流程500还可以包括上述流程300中的步骤:响应于检测到手势操作是指示进入开启状态的第一预设手势操作,生成与第一预设手势操作对应的开启控制指令。
进一步可选地,可以按照如下方式执行上述响应于检测到手势操作是指示进入开启状态的第一预设手势操作,生成与第一预设手势操作对应的开启控制指令的步骤302:响应于检测到手势操作是指示进入开启状态的第一预设手势操作,且有屏设备的当前设备系统状态为关机状态,生成用于开启有屏设备的设备系统的开启控制指令;响应于检测到手势操作是指示进入开启状态的第一预设手势操作,且有屏设备的当前设备系统状态为开机状态,生成用于唤醒有屏设备的手势识别系统的开启控制指令。
根据上述实现方式,有屏设备的手势识别系统在唤醒状态下,若检测到用户发出双手交叉的手势操作且维持双手交叉手势的时间超过0.5秒,则可以关闭有屏设备。在一个示例性的场景中,用户在观看有屏设备播放的影片的过程中,想要关闭设备,如果当前有屏设备的手势识别系统处于唤醒状态,则用户双手交叉持续超过0.5秒则可以关闭设备。在观看影片过程中,长时间没有检测到手势操作,则可以退出手势识别系统,若这时希望关闭设备,可以首先通过上述拍掌的手势操作唤醒手势识别系统,而后双手交叉持续超过0.5秒来关闭有屏设备。
进一步参考图6,作为对上述各图所示方法的实现,本申请提供了一种有屏设备的手势控制装置的一个实施例,该装置实施例与图2、图3和图5所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例的有屏设备的手势控制装置600包括检测单元601和生成单元602。其中,检测单元501被配置为检测对有屏设备进行控制的手势操作;生成单元502被配置为响应于检测到手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与预设手势操作对应的工作状态控制指令。
在一些实施例中,上述生成单元602可以进一步被配置为:响应于检测到手势操作是指示进入开启状态的第一预设手势操作,生成与第一预设手势操作对应的开启控制指令。
在一些实施例中,上述装置还包括:获取单元,被配置为获取有屏设备的当前设备系统状态;以及上述生成单元进一步被配置为:响应于检测到手势操作是指示进入开启状态的第一预设手势操作,且有屏设备的当前设备系统状态为关机状态,生成用于开启有屏设备的设备系统的开启控制指令;响应于检测到手势操作是指示进入开启状态的第一预设手势操作,且有屏设备的当前设备系统状态为开机状态,生成用于唤醒有屏设备的手势识别系统的开启控制指令。
在一些实施例中,上述第一预设手势操作包括拍掌。
在一些实施例中,上述生成单元602可以进一步被配置为:响应于检测到手势操作是指示进入关闭状态的第二预设手势操作,生成与第二预设手势操作对应的关机控制指令。
在一些实施例中,上述第二预设手势操作包括双手手臂交叉。
应当理解,装置600中记载的诸单元与参考图2、图3、图5描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于装置600及其中包含的单元,在此不再赘述。
本申请上述实施例的有屏设备的手势控制装置600,通过检测对有屏设备进行控制的手势操作,响应于检测到手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与预设手势操作对应的工作状态控制指令,不依赖于附加设备及多轮交互,实现了更灵活的有屏设备工作状态控制。
本申请实施例还提供了一种电子设备,包括:一个或多个处理器;显示装置;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述实施例的有屏设备的手势控制方法。
下面参考图7,其示出了适于用来实现本申请实施例的电子设备的计算机系统700的结构示意图。图7示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括检测单元和生成单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,检测单元还可以被描述为“检测对有屏设备进行控制的手势操作的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:检测对有屏设备进行控制的手势操作;响应于检测到手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与预设手势操作对应的工作状态控制指令。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (14)

1.一种有屏设备的手势控制方法,包括:
检测对有屏设备进行控制的手势操作;
响应于检测到所述手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与所述预设手势操作对应的工作状态控制指令。
2.根据权利要求1所述的方法,其中,所述响应于检测到所述手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与所述预设手势操作对应的工作状态控制指令,包括:
响应于检测到所述手势操作是指示进入开启状态的第一预设手势操作,生成与第一预设手势操作对应的开启控制指令。
3.根据权利要求2所述的方法,其中,所述方法还包括:
获取所述有屏设备的当前设备系统状态;
所述响应于检测到所述手势操作是指示进入开启状态的第一预设手势操作,生成与第一预设手势操作对应的开启控制指令,包括:
响应于检测到所述手势操作是指示进入开启状态的第一预设手势操作,且所述有屏设备的当前设备系统状态为关机状态,生成用于开启所述有屏设备的设备系统的开启控制指令;
响应于检测到所述手势操作是指示进入开启状态的第一预设手势操作,且所述有屏设备的当前设备系统状态为开机状态,生成用于唤醒所述有屏设备的手势识别系统的开启控制指令。
4.根据权利要求2或3所述的方法,其中,所述第一预设手势操作包括拍掌。
5.根据权利要求1所述的方法,其中,所述响应于检测到所述手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与所述预设手势操作对应的工作状态控制指令,包括:
响应于检测到所述手势操作是指示进入关闭状态的第二预设手势操作,生成与第二预设手势操作对应的关机控制指令。
6.根据权利要求5所述的方法,其中,所述第二预设手势操作包括双手手臂交叉。
7.一种有屏设备的手势控制装置,包括:
检测单元,被配置为检测对有屏设备进行控制的手势操作;
生成单元,被配置为响应于检测到所述手势操作是指示对有屏设备进行工作状态控制的预设手势操作,生成与所述预设手势操作对应的工作状态控制指令。
8.根据权利要求7所述的装置,其中,所述生成单元进一步被配置为:
响应于检测到所述手势操作是指示进入开启状态的第一预设手势操作,生成与第一预设手势操作对应的开启控制指令。
9.根据权利要求8所述的装置,其中,所述装置还包括:
获取单元,被配置为获取所述有屏设备的当前设备系统状态;
所述生成单元进一步被配置为:
响应于检测到所述手势操作是指示进入开启状态的第一预设手势操作,且所述有屏设备的当前设备系统状态为关机状态,生成用于开启所述有屏设备的设备系统的开启控制指令;
响应于检测到所述手势操作是指示进入开启状态的第一预设手势操作,且所述有屏设备的当前设备系统状态为开机状态,生成用于唤醒所述有屏设备的手势识别系统的开启控制指令。
10.根据权利要求8或9所述的装置,其中,所述第一预设手势操作包括拍掌。
11.根据权利要求7所述的装置,其中,所述生成单元进一步被配置为:
响应于检测到所述手势操作是指示进入关闭状态的第二预设手势操作,生成与第二预设手势操作对应的关机控制指令。
12.根据权利要求11所述的装置,其中,所述第二预设手势操作包括双手手臂交叉。
13.一种电子设备,包括:
一个或多个处理器;
显示装置;
存储装置,用于存储一个或多个程序,
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如权利要求1-6中任一的方法。
14.一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现如权利要求1-6中任一的方法。
CN201811640757.1A 2018-12-29 2018-12-29 有屏设备的手势控制方法和装置 Active CN109725722B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811640757.1A CN109725722B (zh) 2018-12-29 2018-12-29 有屏设备的手势控制方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811640757.1A CN109725722B (zh) 2018-12-29 2018-12-29 有屏设备的手势控制方法和装置

Publications (2)

Publication Number Publication Date
CN109725722A true CN109725722A (zh) 2019-05-07
CN109725722B CN109725722B (zh) 2022-03-18

Family

ID=66299352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811640757.1A Active CN109725722B (zh) 2018-12-29 2018-12-29 有屏设备的手势控制方法和装置

Country Status (1)

Country Link
CN (1) CN109725722B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110736117A (zh) * 2019-09-11 2020-01-31 华帝股份有限公司 一种吸油烟机的手势识别控制方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102200830A (zh) * 2010-03-25 2011-09-28 夏普株式会社 基于静态手势识别的非接触控制系统和控制方法
CN102339125A (zh) * 2010-07-23 2012-02-01 夏普株式会社 信息设备及其控制方法和系统
CN102591587A (zh) * 2012-02-06 2012-07-18 广西佳微电子科技有限公司 一种非接触式投影机翻动系统及方法
CN104317391A (zh) * 2014-09-24 2015-01-28 华中科技大学 一种基于立体视觉的三维手掌姿态识别交互方法和系统
CN104795080A (zh) * 2015-04-09 2015-07-22 广东欧珀移动通信有限公司 一种音乐播放控制方法和装置
CN106020478A (zh) * 2016-05-20 2016-10-12 青岛海信电器股份有限公司 一种智能终端操控方法、装置和智能终端
CN107390881A (zh) * 2017-09-14 2017-11-24 西安领讯卓越信息技术有限公司 一种手势控制方法
CN107908277A (zh) * 2017-09-30 2018-04-13 珠海格力电器股份有限公司 一种控制装置、设备以及控制方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102200830A (zh) * 2010-03-25 2011-09-28 夏普株式会社 基于静态手势识别的非接触控制系统和控制方法
CN102339125A (zh) * 2010-07-23 2012-02-01 夏普株式会社 信息设备及其控制方法和系统
CN102591587A (zh) * 2012-02-06 2012-07-18 广西佳微电子科技有限公司 一种非接触式投影机翻动系统及方法
CN104317391A (zh) * 2014-09-24 2015-01-28 华中科技大学 一种基于立体视觉的三维手掌姿态识别交互方法和系统
CN104795080A (zh) * 2015-04-09 2015-07-22 广东欧珀移动通信有限公司 一种音乐播放控制方法和装置
CN106020478A (zh) * 2016-05-20 2016-10-12 青岛海信电器股份有限公司 一种智能终端操控方法、装置和智能终端
CN107390881A (zh) * 2017-09-14 2017-11-24 西安领讯卓越信息技术有限公司 一种手势控制方法
CN107908277A (zh) * 2017-09-30 2018-04-13 珠海格力电器股份有限公司 一种控制装置、设备以及控制方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110736117A (zh) * 2019-09-11 2020-01-31 华帝股份有限公司 一种吸油烟机的手势识别控制方法

Also Published As

Publication number Publication date
CN109725722B (zh) 2022-03-18

Similar Documents

Publication Publication Date Title
US10394334B2 (en) Gesture-based control system
US11526713B2 (en) Embedding human labeler influences in machine learning interfaces in computing environments
US10488939B2 (en) Gesture recognition
JP5887775B2 (ja) ヒューマンコンピュータインタラクションシステム、手と手指示点位置決め方法、及び手指のジェスチャ決定方法
US8606735B2 (en) Apparatus and method for predicting user's intention based on multimodal information
EP2877254B1 (en) Method and apparatus for controlling augmented reality
US10242255B2 (en) Gesture recognition system using depth perceptive sensors
Park et al. Real-time 3D pointing gesture recognition for mobile robots with cascade HMM and particle filter
US8897491B2 (en) System for finger recognition and tracking
CN103809733B (zh) 人机交互系统和方法
CN109725723A (zh) 手势控制方法和装置
CN109725727A (zh) 有屏设备的手势控制方法和装置
Yin et al. Toward natural interaction in the real world: Real-time gesture recognition
LaViola Jr An introduction to 3D gestural interfaces
Dardas et al. Hand gesture interaction with a 3D virtual environment
CN107390881A (zh) 一种手势控制方法
Li et al. Hand gesture tracking and recognition based human-computer interaction system and its applications
KR101652705B1 (ko) 멀티 모달 정보를 이용하는 사용자 의도 추론 장치 및 방법
CN109753154A (zh) 有屏设备的手势控制方法和装置
CN109725722A (zh) 有屏设备的手势控制方法和装置
Ueng et al. Vision based multi-user human computer interaction
CN108628454B (zh) 基于虚拟人的视觉交互方法及系统
Liu et al. Gesture recognition based on Kinect
CN114821630A (zh) 静态手势识别方法及其系统和电子设备
Vančo et al. Gesture identification for system navigation in 3D scene

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210510

Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Applicant after: Shanghai Xiaodu Technology Co.,Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant