CN111062312A - 手势识别方法、手势控制方法、装置、介质与终端设备 - Google Patents
手势识别方法、手势控制方法、装置、介质与终端设备 Download PDFInfo
- Publication number
- CN111062312A CN111062312A CN201911284143.9A CN201911284143A CN111062312A CN 111062312 A CN111062312 A CN 111062312A CN 201911284143 A CN201911284143 A CN 201911284143A CN 111062312 A CN111062312 A CN 111062312A
- Authority
- CN
- China
- Prior art keywords
- hand
- gesture
- gesture recognition
- frames
- camera
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
Abstract
本公开提供了一种手势识别方法、手势控制方法、装置、存储介质与终端设备,涉及计算机视觉技术领域。该手势识别方法应用于具备摄像头的终端设备,包括:获取由所述摄像头采集的多帧原始图像;分别从所述多帧原始图像中提取人脸图像,得到多帧人脸图像;检测每帧人脸图像中的手部关键点,并根据所述手部关键点在所述多帧人脸图像中的位置变化,生成手部轨迹;对所述手部轨迹进行识别,得到手势识别结果。本公开可以降低手势识别中图像处理的数据量,减小过程耗时,提高手势识别的实时性,从而实现快速的手势控制交互响应,用户体验较好。
Description
技术领域
本公开涉及计算机视觉技术领域,尤其涉及一种手势识别方法、手势控制方法、手势识别装置、手势控制装置、计算机可读存储介质与终端设备。
背景技术
手势控制是指在不接触终端设备的情况下,利用计算机视觉、图形学等技术来识别人的操作手势,并转化为对设备的控制指令,是继鼠标、键盘和触控屏之后新的交互方式,其能够摆脱传统交互方式对于输入设备的依赖,提高交互的多样性。
手势识别是手势控制的前提。现有的手势识别方法大多基于摄像头拍摄图像中的手势定位和特征提取。随着终端设备上摄像头的像素数越来越高,图像分辨率越来越高,使得手势识别过程的数据处理量越来越高,耗时越来越长,从而影响了手势识别的实时性,导致手势控制存在一定的延迟,用户体验较差;并且上述方法对硬件的处理性能要求较高,不利于部署在移动终端等场景中。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开提供了一种手势识别方法、手势控制方法、手势识别装置、手势控制装置、计算机可读存储介质与终端设备,进而至少在一定程度上改善现有的手势识别方法数据处理量较高、耗时较长的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供一种手势识别方法,应用于具备摄像头的终端设备,所述方法包括:获取由所述摄像头采集的多帧原始图像;分别从所述多帧原始图像中提取人脸图像,得到多帧人脸图像;检测每帧人脸图像中的手部关键点,并根据所述手部关键点在所述多帧人脸图像中的位置变化,生成手部轨迹;对所述手部轨迹进行识别,得到手势识别结果。
根据本公开的第二方面,提供一种手势控制方法,应用于具备摄像头的终端设备,所述方法包括:当开启手势控制功能时,根据上述手势识别方法得到手势识别结果;执行所述手势识别结果对应的控制指令。
根据本公开的第三方面,提供一种手势识别装置,配置于具备摄像头的终端设备,所述装置包括:原始图像获取模块,用于获取由所述摄像头采集的多帧原始图像;人脸图像提取模块,用于分别从所述多帧原始图像中提取人脸图像,得到多帧人脸图像;手部轨迹生成模块,用于检测每帧人脸图像中的手部关键点,并根据所述手部关键点在所述多帧人脸图像中的位置变化,生成手部轨迹;手部轨迹识别模块,用于对所述手部轨迹进行识别,得到手势识别结果。
根据本公开的第四方面,提供一种手势控制装置,配置于具备摄像头的终端设备,所述装置包括:原始图像获取模块,用于当开启手势控制功能时,获取由所述摄像头采集的多帧原始图像;人脸图像提取模块,用于分别从所述多帧原始图像中提取人脸图像,得到多帧人脸图像;手部轨迹生成模块,用于检测每帧人脸图像中的手部关键点,并根据所述手部关键点在所述多帧人脸图像中的位置变化,生成手部轨迹;手部轨迹识别模块,用于对所述手部轨迹进行识别,得到手势识别结果;控制指令执行模块,用于执行所述手势识别结果对应的控制指令。
根据本公开的第五方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述手势识别方法或手势控制方法。
根据本公开的第六方面,提供一种终端设备,包括:处理器;存储器,用于存储所述处理器的可执行指令;以及摄像头;其中,所述处理器配置为经由执行所述可执行指令来执行上述手势识别方法或手势控制方法。
本公开的技术方案具有以下有益效果:
根据上述手势识别方法、手势控制方法、手势识别装置、手势控制装置、计算机可读存储介质与终端设备,由摄像头采集多帧原始图像,分别提取人脸图像,并从每帧人脸图像中检测手部关键点,再根据手部关键点的位置变化生成手部轨迹,最后对手部轨迹进行识别,得到手势识别结果。由于用户在进行手势操作时,手部一般位于脸部的前方或附近,从原始图像中提取人脸图像以检测手部关键点,相当于对原始图像进行了裁剪,裁减掉了和手势识别无关的区域,从而降低了图像处理的数据量,使系统仅需在人脸图像中进行手势识别,减小了过程耗时,提高了手势识别的实时性,且对硬件的处理性能要求不高,有利于部署在移动终端等轻量化场景中。进一步的,基于实时性较强的手势识别,当用户做出手势操作后,可以立即执行手势识别结果对应的控制指令,从而实现快速的交互响应,改善交互延迟问题,提高用户体验,对于体感游戏等具有较高的实用性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施方式,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本示例性实施方式中一种手势识别方法的流程图;
图2示出本示例性实施方式中一种手势识别方法的子流程图;
图3示出本示例性实施方式中提取手部候选区域的示意性流程图;
图4示出本示例性实施方式中手势识别的示意性流程图;
图5示出本示例性实施方式中一种手势控制方法的流程图;
图6示出本示例性实施方式中一种手势识别装置的结构框图;
图7示出本示例性实施方式中一种手势控制装置的结构框图;
图8示出本示例性实施方式中一种用于实现上述方法的计算机可读存储介质;
图9示出本示例性实施方式中一种用于实现上述方法的终端设备。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
本公开的示例性实施方式提供一种手势识别方法,可以应用于具备摄像头的终端设备,如手机、平板电脑、数码相机、虚拟现实设备等。图1示出了该手势识别方法的一种流程,可以包括以下步骤S110至S140:
步骤S110,获取由摄像头采集的多帧原始图像。
手势是一个动作,需要多帧画面才能完整地记录手势。本示例性实施方式中,当手势识别功能开启时,摄像头可以采集固定帧数的原始图像,例如10帧、50帧等;或者可以通过配套的红外传感器等感应摄像头前方是否存在物体,当感应到物体时(一般默认为手部),启动摄像头采集原始图像,当感应到物体移开时,摄像头停止采集,从而得到多帧原始图像。在一种可选的实施方式中,在采集原始图像后,可以进行适当的丢帧,例如每三帧保留一帧,以减少后续的处理量,且对于手势识别影响较小,具体的丢帧率视摄像头采集原始图像的帧数而定,本公开不做限定。
步骤S120,分别从上述多帧原始图像中提取人脸图像,得到多帧人脸图像。
其中,人脸区域可以通过颜色与形状检测而识别,例如预先设定人脸部分的颜色范围和形状范围,检测原始图像中是否存在同时满足颜色范围和形状范围的局部区域,该局部区域即人脸区域。也可以采用深度学习技术,例如通过YOLO(You Look Only Once,一种实时目标检测的算法框架,包括v1、v2、v3等多个版本,本公开可以采用其中任一个版本)、SSD(Single Shot Multibox Detector,单步多框目标检测)、R-CNN(Region-Convolutional Neural Network,区域卷积神经网络,或Fast R-CNN、Faster R-CNN等改进版本)等神经网络进行人脸区域的检测。当检测到人脸区域时,可以将人脸区域用矩形框进行标注,并提取出来作为人脸图像。为了便于后续处理,可以根据预设尺寸(或分辨率)提取人脸图像或将人脸图像进行采样,使每帧人脸图像的尺寸(或分辨率)相同。
在一种可选的实施方式中,可以在终端设备上设置硬件人脸检测模块(HardwareFace Detection,HWFD),将采集的多帧原始图像输入HWFD后,输出人脸区域坐标,将坐标映射到原始图像中,可以提取出人脸图像。
在一种可选的实施方式中,在步骤S110之后,可以将所采集的多帧原始图像的分辨率调整为预设分辨率,在步骤S120中,可以对调整分辨率后的原始图像执行人脸图像的提取。预设分辨率可以根据步骤S120所采用的算法标准而定。例如:采用YOLO进行人脸检测,YOLO的输入层设置为640*480,则预设分辨率可以采用640*480;如果终端的摄像头为1600万像素,则其采集的原始图像分辨率为4608*3456,系统可以将原始图像进行下采样处理,得到640*480的图像,以输入YOLO进行处理。通常预设分辨率低于原始图像本身的分辨率,这样相当于对原始图像进行了压缩,降低了原始图像的数据量,有利于提高处理效率。
步骤S130,检测每帧人脸图像中的手部关键点,并根据手部关键点在多帧人脸图像中的位置变化,生成手部轨迹。
其中,手部关键点的选取可以根据场景需求以及图像质量情况而定,例如可以选取21个骨骼点为手部关键点,包括每个手指4个关节特征点与手心特征点,或者也可以根据需要仅选取一部分骨骼点,例如在进行食指手势识别时,可以仅将食指的关节特征点或指尖点作为手部关键点。
在一种可选的实施方式中,手部关键点的检测可以通过形状检测而实现。例如:对人脸图像进行指尖形状检测,检测人脸图像中具有弧形的区域,并将这些区域的弧形与预设的标准指尖弧形进行匹配,匹配度较高的区域的弧形顶部即为指尖点(即手部关键点)。或者对人脸图像进行手指形状检测,将与标准手指形状较为相似的区域确定为手指区域,可以指定手指区域的圆形边界点为手部关键点。或者对人脸图像中的图形进行椭圆拟合,并将所拟合的椭圆的长轴端点作为手部关键点。
在一种可选的实施方式中,参考图2所示,可以通过以下步骤S210和S220具体实现手部关键点的检测:
步骤S210,对每帧人脸图像进行区域特征检测,以从每帧人脸图像中提取出手部候选区域;
步骤S220,在手部候选区域中检测手部关键点。
其中,区域特征检测是指从人脸图像中分割出很多局部区域,对每个局部区域的特征进行提取和识别,当检测到包含手部特征的局部区域时,将该局部区域作为手部候选区域。然后在手部候选区域中进一步检测手部关键点,可以提高手部关键点的检测精度。
进一步的,步骤S210可以具体通过以下步骤实现:
通过卷积层从人脸图像中提取特征;
通过RPN(Region Proposal Network,区域生成网络)对所提取的特征进行处理,得到候选框;
通过分类层对候选框进行分类,得到手部候选区域;
通过回归层优化手部候选区域的位置和尺寸。
上述过程可以参考图3所示,整体上可以采用R-CNN(或Fast R-CNN、Faster R-CNN)。将人脸图像输入后,首先经过卷积层进行卷积处理(通常还包括池化层的池化处理),提取出图像特征。特征进入RPN,RPN可以进行候选框的提取,一般提取候选框的数量较多,在此过程中还可以利用NMS(Non-Maximum Suppression,非极大值抑制)算法进行候选框的优化,以得到更准确的候选框。此时提取的候选框包括各个类别,例如不仅有手部候选框,可能还有鼻子、嘴巴、眼镜等部位的候选框,将这些候选框输入分类层,可以对各个候选框进行分类,由此得到手部候选框(即手部候选区域)。分类层可以采用Softmax(归一化指数)函数等,针对于人脸图像中可能存在的目标类别,分别输出概率值,概率值最高的类别为候选框的类别。可以将非手部类别的候选框删除,仅保留手部候选框。最后将手部候选区域输入回归层,回归层可以对手部候选区域的位置和尺寸进行精细调整,得到手部候选区域的坐标数组(x,y,w,h),其中x和y表示手部候选区域的位置坐标(通常是左上角点的坐标),w和h表示手部候选区域的宽和高。
上述R-CNN可以通过大量的人脸图像样本训练得到。将R-CNN设置为图3所示的结构,包括基础网络、卷积层(和池化层)、RPN、分类层、回归层,通过人为在图像中标注手部候选区域得到标签,以图像样本和标签进行训练,更新网络参数,得到可用的R-CNN。
需要说明的是,图2的方法可以对每帧人脸图像使用,在每一帧都检测手部关键点。但是考虑到部分帧可能不存在手部,或者图像质量较差,导致无法检测到手部,在一种可选的实施方式中,如果从当前帧人脸图像中提取的手部候选区域为空值,则以上一帧检测的手部关键点作为当前帧的手部关键点。其中,手部候选区域为空值即检测不到手部的情况,此时可以直接将上一帧的手部关键点复制到当前帧。这样可以提高算法的鲁棒性。
需要补充的是,如果手部候选区域为空值的帧数达到预设阈值,说明检测不到手部的帧数较多,则可以清空之前检测到的数据,重新检测,或者输出手势识别不成功的结果,在用户界面中显示相应信息,如“手势识别失败,请重新做出手势”。
在手部候选区域中检测手部关键点也可以通过R-CNN等模型实现,将手部关键点作为待检测的目标,通过图像特征的提取与处理,可以输出目标所在的区域,从而标记出手部关键点。
通过在每帧人脸图像中确定手部关键点的位置,将该位置在不同帧之间的变化形成手部轨迹,手部轨迹可以是数组、向量或图片等形式,本公开对此不做限定。
步骤S140,对手部轨迹进行识别,得到手势识别结果。
手部轨迹反映了用户的手势操作动作,因而对其进行识别,可以识别出用户所做的手势,得到手势识别结果。
在一种可选的实施方式中,可以将步骤S130中生成的手部轨迹与预设的标准轨迹进行匹配,标准轨迹可以包括左右摇手、左右摇手指、上下滑动手指、张开手部等。如果存在某一标准轨迹和手部轨迹的匹配率达到一定的阈值,则判断手部轨迹为该标准轨迹,输出该标准轨迹所代表的手势作为手部轨迹的手势识别结果。
在一种可选的实施方式中,步骤S140可以具体通过以下步骤实现:
将手部轨迹映射到位图中,得到手部轨迹位图;
通过贝叶斯分类器对手部轨迹位图进行处理,得到手势识别结果。
其中,位图的尺寸可以预先设定,也可以和人脸图像或手部候选区域的尺寸相同。手部轨迹为手部关键点的位置变化,将每帧的位置映射到位图中,并按顺序连接,相当于在位图中表示手部轨迹,将该位图称为手部轨迹位图。
贝叶斯分类器是基于已知的概率和误判损失来选择最优类别,使分类的风险最小化。参考以下公式:
h表示贝叶斯分类器,x是样本,λij是指将cj误分为ci时产生的损失,p(cj|x)是误分类时产生的期望损失,N是样本的个数。将手部轨迹位图输入贝叶斯分类器,可以输出手势识别结果。
图4示出了手势识别方法的一种示意性流程。如图所示,摄像头采集原始图像后,可以按照预设分辨率进行分辨率调整,以缩小图像;然后通过HWFD从调整分辨率后的原始图像中提取人脸图像,使得后续处理集中在原始图像的局部区域中;再从人脸图像中检测并提取手部候选区域,以进一步缩小图像范围;从手部候选区域检测手部关键点,并根据不同帧之间手部关键点的位置变化确定手部轨迹,以映射为手部轨迹位图;将手部轨迹位图输入贝叶斯分类器,通过贝叶斯分类器的处理,输出手势识别结果。
在一种可选的实施方式中,上述终端设备可以包括多个摄像头。在得到手势识别结果后,可以根据手势识别结果在上述多个摄像头之间进行切换。例如手势识别结果为左右摇动手指时,触发终端设备切换到主摄像头,手势识别结果为上下滑动手指时,触发终端设备切换到长焦摄像头等等。这样用户在相距终端设备一定距离的情况下,可以面对摄像头通过手势进行操作,较为方便。
在本示例性实施方式的手势识别方法中,由摄像头采集多帧原始图像,分别提取人脸图像,并从每帧人脸图像中检测手部关键点,再根据手部关键点的位置变化生成手部轨迹,最后对手部轨迹进行识别,得到手势识别结果。由于用户在进行手势操作时,手部一般位于脸部的前方或附近,从原始图像中提取人脸图像以检测手部关键点,相当于对原始图像进行了裁剪,裁减掉了和手势识别无关的区域,从而降低了图像处理的数据量,使系统仅需在人脸图像中进行手势识别,减小了过程耗时,提高了手势识别的实时性,且对硬件的处理性能要求不高,有利于部署在移动终端等轻量化场景中。
本公开的示例性实施方式还提供一种手势控制方法,可以应用于具备摄像头的终端设备。该手势控制方法可以包括:
当开启手势控制功能时,根据本示例性实施方式中的手势识别方法得到手势识别结果;
执行手势识别结果对应的控制指令。
其中,开启手势控制功能包括但不限于:启动具有手势控制功能的游戏程序时,终端自动开启手势控制功能;在拍照或浏览网页等界面中,用户选择开启手势控制功能。程序中可以预先设置手势和控制指令的对应关系,例如挥动手掌对应于截屏指令,向下滑动手指对应于翻页指令等,则在识别出用户的手势时,可以根据手势识别结果快速找到并执行对应的控制指令。特别的,在拍照界面中,可以允许用户通过特定手势控制进行拍照,例如用户做出竖大拇指手势时,触发终端设备自动按下拍照快门键;或者当终端设备配置多个摄像头时,允许用户通过特定手势控制摄像头切换,例如用户摇动手指时,触发终端设备在主摄像头、长焦摄像头、广角摄像头之间切换,从而为用户拍照操作提供便利。
图5示出了手势控制方法的一种流程,可以包括以下步骤S510至S550:
步骤S510,当开启手势控制功能时,获取由摄像头采集的多帧原始图像;
步骤S520,分别从上述多帧原始图像中提取人脸图像,得到多帧人脸图像;
步骤S530,检测每帧人脸图像中的手部关键点,并根据手部关键点在多帧人脸图像中的位置变化,生成手部轨迹;
步骤S540,对手部轨迹进行识别,得到手势识别结果;
步骤S550,执行手势识别结果对应的控制指令。
在本示例性实施方式的手势控制方法中,基于实时性较强的手势识别,当用户做出手势操作后,可以立即执行手势识别结果对应的控制指令,从而实现快速的交互响应,改善交互延迟问题,提高用户体验,对于体感游戏等具有较高的实用性。
本公开的示例性实施方式还提供一种手势识别装置,可以配置于具备摄像头的终端设备。如图6所示,该手势识别装置600可以包括:
原始图像获取模块610,用于获取由摄像头采集的多帧原始图像;
人脸图像提取模块620,用于分别从上述多帧原始图像中提取人脸图像,得到多帧人脸图像;
手部轨迹生成模块630,用于检测每帧人脸图像中的手部关键点,并根据手部关键点在多帧人脸图像中的位置变化,生成手部轨迹;
手部轨迹识别模块640,用于对手部轨迹进行识别,得到手势识别结果。
在一种可选的实施方式中,原始图像获取模块610,还可以用于在获取由摄像头采集的多帧原始图像后,将多帧原始图像的分辨率调整为预设分辨率。
在一种可选的实施方式中,手部轨迹生成模块630,可以用于对每帧人脸图像进行区域特征检测,以从每帧人脸图像中提取出手部候选区域,以及在手部候选区域中检测手部关键点。
在一种可选的实施方式中,手部轨迹生成模块630,还可以用于如果从当前帧人脸图像中提取的手部候选区域为空值,则以上一帧检测的手部关键点作为当前帧的手部关键点。
在一种可选的实施方式中,手部轨迹生成模块630,可以通过执行以下步骤以提取手部候选区域:通过卷积层从人脸图像中提取特征;通过区域生成网络对所提取的特征进行处理,得到候选框;通过分类层对候选框进行分类,得到手部候选区域;通过回归层优化手部候选区域的位置和尺寸。
在一种可选的实施方式中,手部轨迹识别模块640,可以用于将手部轨迹映射到位图中,得到手部轨迹位图,以及通过贝叶斯分类器对手部轨迹位图进行处理,得到手势识别结果。
在一种可选的实施方式中,上述终端设备包括多个摄像头;手部轨迹识别模块640,还用于在得到手势识别结果后,根据手势识别结果在上述多个摄像头之间进行切换。
本公开的示例性实施方式还提供一种手势控制方法,可以配置于具备摄像头的终端设备。如图7所示,该手势控制装置700可以包括:
原始图像获取模块710,用于当开启手势控制功能时,获取由摄像头采集的多帧原始图像;
人脸图像提取模块720,用于分别从上述多帧原始图像中提取人脸图像,得到多帧人脸图像;
手部轨迹生成模块730,用于检测每帧人脸图像中的手部关键点,并根据手部关键点在多帧人脸图像中的位置变化,生成手部轨迹;
手部轨迹识别模块740,用于对手部轨迹进行识别,得到手势识别结果;
控制指令执行模块750,用于执行手势识别结果对应的控制指令。
在一种可选的实施方式中,上述控制指令可以包括摄像头切换指令。
在一种可选的实施方式中,原始图像获取模块710,还可以用于在获取由摄像头采集的多帧原始图像后,将多帧原始图像的分辨率调整为预设分辨率。
在一种可选的实施方式中,手部轨迹生成模块730,可以用于对每帧人脸图像进行区域特征检测,以从每帧人脸图像中提取出手部候选区域,以及在手部候选区域中检测手部关键点。
在一种可选的实施方式中,手部轨迹生成模块730,还可以用于如果从当前帧人脸图像中提取的手部候选区域为空值,则以上一帧检测的手部关键点作为当前帧的手部关键点。
在一种可选的实施方式中,手部轨迹生成模块730,可以通过执行以下步骤以提取手部候选区域:通过卷积层从人脸图像中提取特征;通过区域生成网络对所提取的特征进行处理,得到候选框;通过分类层对候选框进行分类,得到手部候选区域;通过回归层优化手部候选区域的位置和尺寸。
在一种可选的实施方式中,手部轨迹识别模块740,可以用于将手部轨迹映射到位图中,得到手部轨迹位图,以及通过贝叶斯分类器对手部轨迹位图进行处理,得到手势识别结果。
上述手势识别装置和手势控制装置中,各模块的具体细节已经分别在手势识别方法和手势控制方法部分的实施方式中详细说明,未披露的细节内容可以参见方法部分的实施方式相关内容,因而不再赘述。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
本公开的示例性实施方式还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
参考图8所示,描述了根据本公开的示例性实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本公开的示例性实施方式还提供了一种能够实现上述方法的终端设备,该终端设备可以是手机、平板电脑、数码相机等。下面参照图9来描述根据本公开的这种示例性实施方式的终端设备900。图9显示的终端设备900仅仅是一个示例,不应对本公开实施方式的功能和使用范围带来任何限制。
如图9所示,终端设备900可以以通用计算设备的形式表现。终端设备900的组件可以包括但不限于:至少一个处理单元910、至少一个存储单元920、连接不同系统组件(包括存储单元920和处理单元910)的总线930、显示单元940和图像采集单元970,图像采集单元970包括至少一个摄像头。
存储单元920存储有程序代码,程序代码可以被处理单元910执行,使得处理单元910执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,处理单元910可以执行图1、图2或图5所示的方法步骤。
存储单元920可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)921和/或高速缓存存储单元922,还可以进一步包括只读存储单元(ROM)923。
存储单元920还可以包括具有一组(至少一个)程序模块925的程序/实用工具924,这样的程序模块925包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线930可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
终端设备900也可以与一个或多个外部设备1000(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该终端设备900交互的设备通信,和/或与使得该终端设备900能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口950进行。并且,终端设备900还可以通过网络适配器960与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器960通过总线930与终端设备900的其它模块通信。应当明白,尽管图中未示出,可以结合终端设备900使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开示例性实施方式的方法。
此外,上述附图仅是根据本公开示例性实施方式的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的示例性实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施方式。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施方式仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。
Claims (13)
1.一种手势识别方法,应用于具备摄像头的终端设备,其特征在于,所述方法包括:
获取由所述摄像头采集的多帧原始图像;
分别从所述多帧原始图像中提取人脸图像,得到多帧人脸图像;
检测每帧人脸图像中的手部关键点,并根据所述手部关键点在所述多帧人脸图像中的位置变化,生成手部轨迹;
对所述手部轨迹进行识别,得到手势识别结果。
2.根据权利要求1所述的方法,其特征在于,在获取由所述摄像头采集的多帧原始图像后,所述方法还包括:
将所述多帧原始图像的分辨率调整为预设分辨率。
3.根据权利要求1所述的方法,其特征在于,所述检测每帧人脸图像中的手部关键点,包括:
对所述每帧人脸图像进行区域特征检测,以从所述每帧人脸图像中提取出手部候选区域;
在所述手部候选区域中检测手部关键点。
4.根据权利要求3所述的方法,其特征在于,所述检测每帧人脸图像中的手部关键点,还包括:
如果从当前帧人脸图像中提取的手部候选区域为空值,则以上一帧检测的手部关键点作为当前帧的手部关键点。
5.根据权利要求3所述的方法,其特征在于,所述对所述每帧人脸图像进行区域特征检测,以从所述每帧人脸图像中提取出手部候选区域,包括:
通过卷积层从所述人脸图像中提取特征;
通过区域生成网络对所提取的特征进行处理,得到候选框;
通过分类层对所述候选框进行分类,得到手部候选区域;
通过回归层优化所述手部候选区域的位置和尺寸。
6.根据权利要求1所述的方法,其特征在于,对所述手部轨迹进行识别,得到手势识别结果,包括:
将所述手部轨迹映射到位图中,得到手部轨迹位图;
通过贝叶斯分类器对所述手部轨迹位图进行处理,得到手势识别结果。
7.根据权利要求1所述的方法,其特征在于,所述终端设备包括多个摄像头;在得到手势识别结果后,所述方法还包括:
根据所述手势识别结果在所述多个摄像头之间进行切换。
8.一种手势控制方法,应用于具备摄像头的终端设备,其特征在于,所述方法包括:
当开启手势控制功能时,根据权利要求1至7任一项所述的方法得到手势识别结果;
执行所述手势识别结果对应的控制指令。
9.根据权利要求8所述的方法,其特征在于,所述控制指令包括摄像头切换指令。
10.一种手势识别装置,配置于具备摄像头的终端设备,其特征在于,所述装置包括:
原始图像获取模块,用于获取由所述摄像头采集的多帧原始图像;
人脸图像提取模块,用于分别从所述多帧原始图像中提取人脸图像,得到多帧人脸图像;
手部轨迹生成模块,用于检测每帧人脸图像中的手部关键点,并根据所述手部关键点在所述多帧人脸图像中的位置变化,生成手部轨迹;
手部轨迹识别模块,用于对所述手部轨迹进行识别,得到手势识别结果。
11.一种手势控制装置,配置于具备摄像头的终端设备,其特征在于,所述装置包括:
原始图像获取模块,用于当开启手势控制功能时,获取由所述摄像头采集的多帧原始图像;
人脸图像提取模块,用于分别从所述多帧原始图像中提取人脸图像,得到多帧人脸图像;
手部轨迹生成模块,用于检测每帧人脸图像中的手部关键点,并根据所述手部关键点在所述多帧人脸图像中的位置变化,生成手部轨迹;
手部轨迹识别模块,用于对所述手部轨迹进行识别,得到手势识别结果;
控制指令执行模块,用于执行所述手势识别结果对应的控制指令。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的手势识别方法,或权利要求8至9任一项所述的手势控制方法。
13.一种终端设备,其特征在于,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;以及
摄像头;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任一项所述的手势识别方法,或权利要求8至9任一项所述的手势控制方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911284143.9A CN111062312B (zh) | 2019-12-13 | 2019-12-13 | 手势识别方法、手势控制方法、装置、介质与终端设备 |
PCT/CN2020/133410 WO2021115181A1 (zh) | 2019-12-13 | 2020-12-02 | 手势识别方法、手势控制方法、装置、介质与终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911284143.9A CN111062312B (zh) | 2019-12-13 | 2019-12-13 | 手势识别方法、手势控制方法、装置、介质与终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111062312A true CN111062312A (zh) | 2020-04-24 |
CN111062312B CN111062312B (zh) | 2023-10-27 |
Family
ID=70301548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911284143.9A Active CN111062312B (zh) | 2019-12-13 | 2019-12-13 | 手势识别方法、手势控制方法、装置、介质与终端设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111062312B (zh) |
WO (1) | WO2021115181A1 (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111625102A (zh) * | 2020-06-03 | 2020-09-04 | 上海商汤智能科技有限公司 | 一种建筑物展示方法及装置 |
CN111757065A (zh) * | 2020-07-02 | 2020-10-09 | 广州博冠智能科技有限公司 | 进行自动切换镜头的方法、装置、存储介质及监控摄像机 |
CN112100075A (zh) * | 2020-09-24 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 一种用户界面回放方法、装置、设备及存储介质 |
CN112203015A (zh) * | 2020-09-28 | 2021-01-08 | 北京小米松果电子有限公司 | 相机控制方法、装置及介质系统 |
CN112328090A (zh) * | 2020-11-27 | 2021-02-05 | 北京市商汤科技开发有限公司 | 手势识别方法及装置、电子设备和存储介质 |
CN112488059A (zh) * | 2020-12-18 | 2021-03-12 | 哈尔滨拓博科技有限公司 | 一种基于深度学习模型级联的空间手势控制方法 |
CN112527113A (zh) * | 2020-12-09 | 2021-03-19 | 北京地平线信息技术有限公司 | 手势识别及手势识别网络的训练方法和装置、介质和设备 |
CN112866064A (zh) * | 2021-01-04 | 2021-05-28 | 欧普照明电器(中山)有限公司 | 一种控制方法、控制系统及电子设备 |
CN112965604A (zh) * | 2021-03-29 | 2021-06-15 | 深圳市优必选科技股份有限公司 | 手势识别方法、装置、终端设备及计算机可读存储介质 |
CN112965602A (zh) * | 2021-03-22 | 2021-06-15 | 苏州惠显智能科技有限公司 | 一种基于手势的人机交互方法及设备 |
WO2021115181A1 (zh) * | 2019-12-13 | 2021-06-17 | RealMe重庆移动通信有限公司 | 手势识别方法、手势控制方法、装置、介质与终端设备 |
CN113058260A (zh) * | 2021-04-22 | 2021-07-02 | 杭州当贝网络科技有限公司 | 基于玩家画像的体感动作识别方法、系统及存储介质 |
CN113253837A (zh) * | 2021-04-01 | 2021-08-13 | 作业帮教育科技(北京)有限公司 | 空中书写方法、装置、线上直播系统和计算机设备 |
CN113934307A (zh) * | 2021-12-16 | 2022-01-14 | 佛山市霖云艾思科技有限公司 | 一种根据手势和场景开启电子设备的方法 |
CN113936338A (zh) * | 2021-12-15 | 2022-01-14 | 北京亮亮视野科技有限公司 | 手势识别方法、装置及电子设备 |
CN114153308A (zh) * | 2020-09-08 | 2022-03-08 | 阿里巴巴集团控股有限公司 | 手势控制方法、装置、电子设备及计算机可读介质 |
CN114265499A (zh) * | 2021-12-17 | 2022-04-01 | 交控科技股份有限公司 | 应用于客服终端的交互方法和系统 |
CN114327047A (zh) * | 2021-12-01 | 2022-04-12 | 北京小米移动软件有限公司 | 设备控制方法、设备控制装置及存储介质 |
CN115297263A (zh) * | 2022-08-24 | 2022-11-04 | 广州方图科技有限公司 | 适用于拍立方的自动拍照控制方法、系统及拍立方 |
WO2024067468A1 (zh) * | 2022-09-27 | 2024-04-04 | 广州视琨电子科技有限公司 | 基于图像识别的交互控制方法、装置及设备 |
CN114327047B (zh) * | 2021-12-01 | 2024-04-30 | 北京小米移动软件有限公司 | 设备控制方法、设备控制装置及存储介质 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113469017A (zh) * | 2021-06-29 | 2021-10-01 | 北京市商汤科技开发有限公司 | 一种图像处理方法、装置及电子设备 |
CN113808007B (zh) * | 2021-09-16 | 2022-07-19 | 北京百度网讯科技有限公司 | 调整虚拟脸部模型的方法、装置、电子设备及存储介质 |
CN115097936B (zh) * | 2022-06-16 | 2023-03-24 | 慧之安信息技术股份有限公司 | 基于手势动作深度学习的显示屏控制方法 |
CN115565253B (zh) * | 2022-12-08 | 2023-04-18 | 季华实验室 | 一种动态手势实时识别方法、装置、电子设备和存储介质 |
CN115830642B (zh) * | 2023-02-13 | 2024-01-12 | 粤港澳大湾区数字经济研究院(福田) | 2d全身人体关键点标注方法及3d人体网格标注方法 |
Citations (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101324922A (zh) * | 2008-07-30 | 2008-12-17 | 北京中星微电子有限公司 | 手指尖轨迹获取方法和装置 |
EP2365420A2 (en) * | 2010-03-11 | 2011-09-14 | Deutsche Telekom AG | System and method for hand gesture recognition for remote control of an internet protocol TV |
CN102200834A (zh) * | 2011-05-26 | 2011-09-28 | 华南理工大学 | 面向电视控制的指尖鼠标交互方法 |
CN102368290A (zh) * | 2011-09-02 | 2012-03-07 | 华南理工大学 | 一种基于手指高级特征的手势识别方法 |
CN102402680A (zh) * | 2010-09-13 | 2012-04-04 | 株式会社理光 | 人机交互系统中手部、指示点定位方法和手势确定方法 |
CN102467657A (zh) * | 2010-11-16 | 2012-05-23 | 三星电子株式会社 | 手势识别系统和方法 |
CN102854982A (zh) * | 2012-08-01 | 2013-01-02 | 华平信息技术(南昌)有限公司 | 一种识别自定义手势轨迹的方法 |
CN103376895A (zh) * | 2012-04-24 | 2013-10-30 | 纬创资通股份有限公司 | 手势控制方法及手势控制装置 |
WO2014027666A1 (ja) * | 2012-08-17 | 2014-02-20 | Necシステムテクノロジー株式会社 | 入力装置、入力方法、及び記憶媒体 |
US20140168074A1 (en) * | 2011-07-08 | 2014-06-19 | The Dna Co., Ltd. | Method and terminal device for controlling content by sensing head gesture and hand gesture, and computer-readable recording medium |
CN104407694A (zh) * | 2014-10-29 | 2015-03-11 | 山东大学 | 一种结合人脸和手势控制的人机交互方法及装置 |
CN104809387A (zh) * | 2015-03-12 | 2015-07-29 | 山东大学 | 基于视频图像手势识别的非接触式解锁方法及装置 |
CN104992192A (zh) * | 2015-05-12 | 2015-10-21 | 浙江工商大学 | 一种视觉运动跟踪的隔空手写系统 |
CN105046199A (zh) * | 2015-06-17 | 2015-11-11 | 吉林纪元时空动漫游戏科技股份有限公司 | 基于像素分类器和椭圆拟合的指尖点提取方法 |
CN105045399A (zh) * | 2015-09-07 | 2015-11-11 | 哈尔滨市一舍科技有限公司 | 一种具有3d摄像组件的电子设备 |
CN105824406A (zh) * | 2015-11-30 | 2016-08-03 | 维沃移动通信有限公司 | 一种拍照方法和终端 |
CN106682585A (zh) * | 2016-12-02 | 2017-05-17 | 南京理工大学 | 一种基于kinect2的动态手势识别方法 |
CN106971130A (zh) * | 2016-01-14 | 2017-07-21 | 芋头科技(杭州)有限公司 | 一种以人脸为参照的手势识别方法 |
CN107239731A (zh) * | 2017-04-17 | 2017-10-10 | 浙江工业大学 | 一种基于Faster R‑CNN的手势检测和识别方法 |
CN107679860A (zh) * | 2017-08-09 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 一种用户认证的方法、装置、设备和计算机存储介质 |
CN107846555A (zh) * | 2017-11-06 | 2018-03-27 | 深圳慧源创新科技有限公司 | 基于手势识别的自动拍摄方法、装置、用户终端及计算机存储介质 |
CN108229324A (zh) * | 2017-11-30 | 2018-06-29 | 北京市商汤科技开发有限公司 | 手势追踪方法和装置、电子设备、计算机存储介质 |
CN109190461A (zh) * | 2018-07-23 | 2019-01-11 | 中南民族大学 | 一种基于手势关键点的动态手势识别方法和系统 |
CN109977791A (zh) * | 2019-03-04 | 2019-07-05 | 山东海博科技信息系统股份有限公司 | 一种手部生理信息检测方法 |
CN109977906A (zh) * | 2019-04-04 | 2019-07-05 | 睿魔智能科技(深圳)有限公司 | 手势识别方法及系统、计算机设备及存储介质 |
CN110069126A (zh) * | 2018-11-16 | 2019-07-30 | 北京微播视界科技有限公司 | 虚拟对象的控制方法和装置 |
CN110333785A (zh) * | 2019-07-11 | 2019-10-15 | Oppo广东移动通信有限公司 | 信息处理方法、装置、存储介质及增强现实设备 |
CN110490165A (zh) * | 2019-08-26 | 2019-11-22 | 哈尔滨理工大学 | 一种基于卷积神经网络的动态手势跟踪方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2014108820A (ru) * | 2014-03-06 | 2015-09-20 | ЭлЭсАй Корпорейшн | Процессор изображений, содержащий систему распознавания жестов с функциональными возможностями обнаружения и отслеживания пальцев |
CN111062312B (zh) * | 2019-12-13 | 2023-10-27 | RealMe重庆移动通信有限公司 | 手势识别方法、手势控制方法、装置、介质与终端设备 |
-
2019
- 2019-12-13 CN CN201911284143.9A patent/CN111062312B/zh active Active
-
2020
- 2020-12-02 WO PCT/CN2020/133410 patent/WO2021115181A1/zh active Application Filing
Patent Citations (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101324922A (zh) * | 2008-07-30 | 2008-12-17 | 北京中星微电子有限公司 | 手指尖轨迹获取方法和装置 |
EP2365420A2 (en) * | 2010-03-11 | 2011-09-14 | Deutsche Telekom AG | System and method for hand gesture recognition for remote control of an internet protocol TV |
CN102402680A (zh) * | 2010-09-13 | 2012-04-04 | 株式会社理光 | 人机交互系统中手部、指示点定位方法和手势确定方法 |
CN102467657A (zh) * | 2010-11-16 | 2012-05-23 | 三星电子株式会社 | 手势识别系统和方法 |
CN102200834A (zh) * | 2011-05-26 | 2011-09-28 | 华南理工大学 | 面向电视控制的指尖鼠标交互方法 |
US20140168074A1 (en) * | 2011-07-08 | 2014-06-19 | The Dna Co., Ltd. | Method and terminal device for controlling content by sensing head gesture and hand gesture, and computer-readable recording medium |
CN102368290A (zh) * | 2011-09-02 | 2012-03-07 | 华南理工大学 | 一种基于手指高级特征的手势识别方法 |
CN103376895A (zh) * | 2012-04-24 | 2013-10-30 | 纬创资通股份有限公司 | 手势控制方法及手势控制装置 |
CN102854982A (zh) * | 2012-08-01 | 2013-01-02 | 华平信息技术(南昌)有限公司 | 一种识别自定义手势轨迹的方法 |
WO2014027666A1 (ja) * | 2012-08-17 | 2014-02-20 | Necシステムテクノロジー株式会社 | 入力装置、入力方法、及び記憶媒体 |
CN104407694A (zh) * | 2014-10-29 | 2015-03-11 | 山东大学 | 一种结合人脸和手势控制的人机交互方法及装置 |
CN104809387A (zh) * | 2015-03-12 | 2015-07-29 | 山东大学 | 基于视频图像手势识别的非接触式解锁方法及装置 |
CN104992192A (zh) * | 2015-05-12 | 2015-10-21 | 浙江工商大学 | 一种视觉运动跟踪的隔空手写系统 |
CN105046199A (zh) * | 2015-06-17 | 2015-11-11 | 吉林纪元时空动漫游戏科技股份有限公司 | 基于像素分类器和椭圆拟合的指尖点提取方法 |
CN105045399A (zh) * | 2015-09-07 | 2015-11-11 | 哈尔滨市一舍科技有限公司 | 一种具有3d摄像组件的电子设备 |
CN105824406A (zh) * | 2015-11-30 | 2016-08-03 | 维沃移动通信有限公司 | 一种拍照方法和终端 |
CN106971130A (zh) * | 2016-01-14 | 2017-07-21 | 芋头科技(杭州)有限公司 | 一种以人脸为参照的手势识别方法 |
CN106682585A (zh) * | 2016-12-02 | 2017-05-17 | 南京理工大学 | 一种基于kinect2的动态手势识别方法 |
CN107239731A (zh) * | 2017-04-17 | 2017-10-10 | 浙江工业大学 | 一种基于Faster R‑CNN的手势检测和识别方法 |
CN107679860A (zh) * | 2017-08-09 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 一种用户认证的方法、装置、设备和计算机存储介质 |
CN107846555A (zh) * | 2017-11-06 | 2018-03-27 | 深圳慧源创新科技有限公司 | 基于手势识别的自动拍摄方法、装置、用户终端及计算机存储介质 |
CN108229324A (zh) * | 2017-11-30 | 2018-06-29 | 北京市商汤科技开发有限公司 | 手势追踪方法和装置、电子设备、计算机存储介质 |
CN109190461A (zh) * | 2018-07-23 | 2019-01-11 | 中南民族大学 | 一种基于手势关键点的动态手势识别方法和系统 |
CN110069126A (zh) * | 2018-11-16 | 2019-07-30 | 北京微播视界科技有限公司 | 虚拟对象的控制方法和装置 |
CN109977791A (zh) * | 2019-03-04 | 2019-07-05 | 山东海博科技信息系统股份有限公司 | 一种手部生理信息检测方法 |
CN109977906A (zh) * | 2019-04-04 | 2019-07-05 | 睿魔智能科技(深圳)有限公司 | 手势识别方法及系统、计算机设备及存储介质 |
CN110333785A (zh) * | 2019-07-11 | 2019-10-15 | Oppo广东移动通信有限公司 | 信息处理方法、装置、存储介质及增强现实设备 |
CN110490165A (zh) * | 2019-08-26 | 2019-11-22 | 哈尔滨理工大学 | 一种基于卷积神经网络的动态手势跟踪方法 |
Non-Patent Citations (11)
Title |
---|
CHEN-CHIUNG HSIEH 等: "Novel Haar features for real-time hand gesture recognition using SVM", 《JOURNAL OF REAL-TIME IMAGE》 * |
CHEN-CHIUNG HSIEH 等: "Novel Haar features for real-time hand gesture recognition using SVM", 《JOURNAL OF REAL-TIME IMAGE》, 8 November 2012 (2012-11-08), pages 1 - 17 * |
JONG LEE-FERNG 等: "Dynamic Gesture Recognition for Human Robot Interaction", 《LARS 2009》, 18 February 2010 (2010-02-18), pages 1 - 8 * |
JONG LEE-FERNG 等: "Dynamic Gesture Recognition for Human Robot Interaction", 《LARS 2009》, pages 1 - 8 * |
庞雷 等: "人机交互动态手势轮廓提取仿真研究", 《机械设计与制造》 * |
庞雷 等: "人机交互动态手势轮廓提取仿真研究", 《机械设计与制造》, 8 January 2019 (2019-01-08), pages 253 - 256 * |
曹洁 等: "基于RGB-D信息的动态手势识别方法", 《计算机应用研究》, vol. 35, no. 7, pages 2228 - 2232 * |
杨扬 等: "数字家庭环境中双手交互技术研究", 《计算机工程》, vol. 37, no. 4, pages 29 - 30 * |
林海波 等: "基于指尖角度集核密度估计手势特征提取", 《计算机应用与软件》, vol. 33, no. 9, pages 195 - 198 * |
谈家谱 等: "基于 Kinect 的指尖检测与手势识别方法", 《计算机应用》 * |
谈家谱 等: "基于 Kinect 的指尖检测与手势识别方法", 《计算机应用》, vol. 35, no. 6, 10 June 2015 (2015-06-10), pages 1795 - 1800 * |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021115181A1 (zh) * | 2019-12-13 | 2021-06-17 | RealMe重庆移动通信有限公司 | 手势识别方法、手势控制方法、装置、介质与终端设备 |
CN111625102A (zh) * | 2020-06-03 | 2020-09-04 | 上海商汤智能科技有限公司 | 一种建筑物展示方法及装置 |
CN111757065A (zh) * | 2020-07-02 | 2020-10-09 | 广州博冠智能科技有限公司 | 进行自动切换镜头的方法、装置、存储介质及监控摄像机 |
CN114153308A (zh) * | 2020-09-08 | 2022-03-08 | 阿里巴巴集团控股有限公司 | 手势控制方法、装置、电子设备及计算机可读介质 |
CN114153308B (zh) * | 2020-09-08 | 2023-11-21 | 阿里巴巴集团控股有限公司 | 手势控制方法、装置、电子设备及计算机可读介质 |
CN112100075A (zh) * | 2020-09-24 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 一种用户界面回放方法、装置、设备及存储介质 |
CN112100075B (zh) * | 2020-09-24 | 2024-03-15 | 腾讯科技(深圳)有限公司 | 一种用户界面回放方法、装置、设备及存储介质 |
CN112203015A (zh) * | 2020-09-28 | 2021-01-08 | 北京小米松果电子有限公司 | 相机控制方法、装置及介质系统 |
CN112328090A (zh) * | 2020-11-27 | 2021-02-05 | 北京市商汤科技开发有限公司 | 手势识别方法及装置、电子设备和存储介质 |
CN112328090B (zh) * | 2020-11-27 | 2023-01-31 | 北京市商汤科技开发有限公司 | 手势识别方法及装置、电子设备和存储介质 |
CN112527113A (zh) * | 2020-12-09 | 2021-03-19 | 北京地平线信息技术有限公司 | 手势识别及手势识别网络的训练方法和装置、介质和设备 |
CN112488059A (zh) * | 2020-12-18 | 2021-03-12 | 哈尔滨拓博科技有限公司 | 一种基于深度学习模型级联的空间手势控制方法 |
CN112866064A (zh) * | 2021-01-04 | 2021-05-28 | 欧普照明电器(中山)有限公司 | 一种控制方法、控制系统及电子设备 |
CN112965602A (zh) * | 2021-03-22 | 2021-06-15 | 苏州惠显智能科技有限公司 | 一种基于手势的人机交互方法及设备 |
CN112965604A (zh) * | 2021-03-29 | 2021-06-15 | 深圳市优必选科技股份有限公司 | 手势识别方法、装置、终端设备及计算机可读存储介质 |
CN113253837A (zh) * | 2021-04-01 | 2021-08-13 | 作业帮教育科技(北京)有限公司 | 空中书写方法、装置、线上直播系统和计算机设备 |
CN113058260B (zh) * | 2021-04-22 | 2024-02-02 | 杭州当贝网络科技有限公司 | 基于玩家画像的体感动作识别方法、系统及存储介质 |
CN113058260A (zh) * | 2021-04-22 | 2021-07-02 | 杭州当贝网络科技有限公司 | 基于玩家画像的体感动作识别方法、系统及存储介质 |
CN114327047A (zh) * | 2021-12-01 | 2022-04-12 | 北京小米移动软件有限公司 | 设备控制方法、设备控制装置及存储介质 |
CN114327047B (zh) * | 2021-12-01 | 2024-04-30 | 北京小米移动软件有限公司 | 设备控制方法、设备控制装置及存储介质 |
CN113936338A (zh) * | 2021-12-15 | 2022-01-14 | 北京亮亮视野科技有限公司 | 手势识别方法、装置及电子设备 |
CN113934307A (zh) * | 2021-12-16 | 2022-01-14 | 佛山市霖云艾思科技有限公司 | 一种根据手势和场景开启电子设备的方法 |
CN114265499A (zh) * | 2021-12-17 | 2022-04-01 | 交控科技股份有限公司 | 应用于客服终端的交互方法和系统 |
CN115297263A (zh) * | 2022-08-24 | 2022-11-04 | 广州方图科技有限公司 | 适用于拍立方的自动拍照控制方法、系统及拍立方 |
WO2024067468A1 (zh) * | 2022-09-27 | 2024-04-04 | 广州视琨电子科技有限公司 | 基于图像识别的交互控制方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111062312B (zh) | 2023-10-27 |
WO2021115181A1 (zh) | 2021-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111062312B (zh) | 手势识别方法、手势控制方法、装置、介质与终端设备 | |
US10168794B2 (en) | Motion-assisted visual language for human computer interfaces | |
CN110209273B (zh) | 手势识别方法、交互控制方法、装置、介质与电子设备 | |
US9104242B2 (en) | Palm gesture recognition method and device as well as human-machine interaction method and apparatus | |
JP7073522B2 (ja) | 空中手書きを識別するための方法、装置、デバイス及びコンピュータ読み取り可能な記憶媒体 | |
CN104350509B (zh) | 快速姿势检测器 | |
CN106774850B (zh) | 一种移动终端及其交互控制方法 | |
CN112954210B (zh) | 拍照方法、装置、电子设备及介质 | |
US10990226B2 (en) | Inputting information using a virtual canvas | |
CN111399638B (zh) | 一种盲用电脑及适配于盲用电脑的智能手机辅助控制方法 | |
US20210281744A1 (en) | Action recognition method and device for target object, and electronic apparatus | |
US20130177209A1 (en) | Image cache | |
CN111612696B (zh) | 图像拼接方法、装置、介质及电子设备 | |
CN114138121B (zh) | 用户手势识别方法、装置、系统、存储介质及计算设备 | |
EP2615532A2 (en) | Device and method for detecting finger position | |
JP2022536320A (ja) | オブジェクト識別方法と装置、電子機器及び記憶媒体 | |
CN109919128B (zh) | 控制指令的获取方法、装置及电子设备 | |
CN111986229A (zh) | 视频目标检测方法、装置及计算机系统 | |
JP2017120503A (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム | |
CN110222576B (zh) | 拳击动作识别方法、装置和电子设备 | |
KR20200127928A (ko) | 전자장치에서 이미지 내의 특정 객체를 인식하기 위한 방법 및 장치 | |
US20110294522A1 (en) | Character recognizing system and method for the same | |
CN114333056A (zh) | 一种手势控制的方法、系统、设备及存储介质 | |
CN109725722B (zh) | 有屏设备的手势控制方法和装置 | |
US20230350499A1 (en) | Devices and methods for gesture-based selection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |