CN116092176A - 用于检测手势的方法和系统,以及计算机可读存储媒体 - Google Patents

用于检测手势的方法和系统,以及计算机可读存储媒体 Download PDF

Info

Publication number
CN116092176A
CN116092176A CN202211108119.1A CN202211108119A CN116092176A CN 116092176 A CN116092176 A CN 116092176A CN 202211108119 A CN202211108119 A CN 202211108119A CN 116092176 A CN116092176 A CN 116092176A
Authority
CN
China
Prior art keywords
gesture
information
external
hand
gesture information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211108119.1A
Other languages
English (en)
Inventor
刘彦廷
洪御恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HTC Corp
Original Assignee
HTC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HTC Corp filed Critical HTC Corp
Publication of CN116092176A publication Critical patent/CN116092176A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • G06V40/113Recognition of static hand signs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Psychiatry (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • User Interface Of Digital Computer (AREA)
  • Position Input By Displaying (AREA)

Abstract

本发明的实施例提供一种用于检测手势的方法和系统,以及一种计算机可读存储媒体。所述方法包含:判断手部的信息是否足够用于识别手部的手势;响应于判定手部的信息足够用于识别手势,识别手势;接收来自至少一个外部姿势信息提供者的第一手势信息,且基于第一手势信息而校正手势;响应于判定手部的信息不足够用于识别手势,接收来自至少一个外部姿势信息提供者的第二手势信息,获得预测手势,且基于预测手势和第二只手势信息而获得手势。

Description

用于检测手势的方法和系统,以及计算机可读存储媒体
技术领域
本发明大体上涉及一种跟踪机制,特定来说,涉及一种用于检测手势的方法和系统,以及计算机可读存储媒体。
背景技术
参见图1,其绘示手势跟踪的示意图。在图1的左侧部分中,头戴式显示器(head-mounted display;HMD)100可安置有跟踪元件(例如,HMD 100上的跟踪摄像机),且跟踪元件可具有视野(field of view;FOV)199。当待跟踪对象(例如,手部102)处于FOV 199中时,由于HMD 100可取得待跟踪对象的图像,故可跟踪待跟踪对象的姿态(例如,手部102的手势)。
然而,当待跟踪对象离开FOV 199时,如例示性地绘示在图1的右侧部分上,HMD100将因无法取得待跟踪对象的图像而无法跟踪待跟踪对象的姿态。
发明内容
因此,本发明涉及一种用于检测手势的方法和系统及计算机可读存储媒体,其可用于解决以上技术问题。
本发明的实施例提供一种用于检测适用于主机的手势的方法,包含:判断手部的信息是否足够用于识别手部的手势;响应于判定手部的信息足够用于识别手势,识别手势,接收来自至少一个外部姿势信息提供者的第一手势信息,基于第一手势信息而校正手势;响应于判定手部的信息不足够用于识别手势,接收来自至少一个外部姿势信息提供者的第二手势信息,获得预测手势,且基于预测手势和第二手势信息而获得手势。
本发明的实施例提供一种用于检测手势的系统。系统包含主机。主机配置成进行:判断手部的信息是否足够用于识别手部的手势;响应于判定手部的信息足够用于识别手势,识别手势;接收来自至少一个外部姿势信息提供者的第一手势信息,且基于第一手势信息而校正手势;响应于判定手部的信息不足够用于识别手势,接收来自至少一个外部姿势信息提供者的第二手势信息,获得预测手势,且基于预测手势和第二只手势信息而获得手势。
本发明的实施例提供一种非暂时性计算机可读存储媒体,计算机可读存储媒体记录可执行计算机程序,可执行计算机程序由主机加载以进行以下步骤:判断手部的信息是否足够用于识别手部的手势;响应于判定手部的信息足够用于识别手势,识别手势,接收来自至少一个外部姿势信息提供者的第一手势信息,且基于第一手势信息而校正手势;响应于判定手部的信息不足够用于识别手势,接收来自至少一个外部姿势信息提供者的第二手势信息,获得预测手势,且基于预测手势和第二手势信息而获得手势。
附图说明
包含附图以提供对本发明的进一步理解,且并入本说明书中且构成本说明书的一部分。图式示出本发明的实施例,且与描述一起用以解释本发明的原理。
图1绘示手势跟踪的示意图。
图2A为根据本发明的实施例的用于检测手势的系统的功能图。
图2B为图2A的示意图。
图3绘示根据本发明的实施例的用于检测手势的方法的流程图。
附图标号说明
100:HMD
102、O1:手部
199、299:视野
200:系统
21:主机
212:存储电路
214:处理器
221~22N:外部姿势信息提供者
CS1:第一控制信号
CS2:第二控制信号
P1~PN:第一手势信息
C1~CN:第二手势信息
G1:预测手势
G2:先前手势
S310、S321~S323、S331~S333:步骤
具体实施方式
现在将详细参照本发明的优选实施例,在附图中示出所述实施例的实例。在可能的情况下,相同附图标号在图式和描述中用以指代相同或相似部分。
参见图2A及图2B,其中图2A为根据本发明的实施例的用于检测手势的系统的功能图,且图2B为图2A的示意图。
在图2A中,系统200包含主机21和外部姿势信息提供者221到外部姿势信息提供者22N,其中主机21经由例如蓝牙的无线通信协议与各外部姿势信息提供者221到外部姿势信息提供者22N连接。
在各种实施例中,主机21可为能够对FOV 299内的一或多个待跟踪对象(例如,手部O1)进行跟踪功能(例如,由内而外跟踪和/或由外而内跟踪)的任何装置。在本发明的实施例中,FOV 299可为主机21上的一或多个摄像机(例如,跟踪摄像机)的图像撷取范围。当待跟踪对象(例如,手部O1)在FOV 299内时,主机21上的摄像机可撷取待跟踪对象的图像,且主机21可基于所撷取图像而跟踪各待跟踪对象的姿态,但本发明不限于此。
在本发明的实施例中,主机21可为用于向其用户提供现实服务的HMD,其中现实服务包含但不限于虚拟现实(virtual reality;VR)服务、增强现实(augmented reality;AR)服务、扩展现实(extended reality;XR)和/或混合现实(mixed reality;MR)等。在这些情况下,主机21可显示对应的视觉内容供用户查看,例如VR/AR/XR/MR视觉内容。
在图2A中,主机21包含存储电路212和处理器214。存储电路212为静止或移动随机存取存储器(random access memory;RAM)、只读存储器(read-only memory;ROM)、闪存存储器、硬盘或任何其它类似装置中的一个或组合,且所述存储电路212记录可由处理器214执行的多个模块。
处理器214可与存储电路212耦接,且处理器214可能为例如通用处理器、专用处理器、常规处理器、数字信号处理器(digital signal processor;DSP)、多个微处理器、与DSP核相关联的一或多个微处理器、控制器、微控制器、专用集成电路(Application SpecificIntegrated Circuit;ASIC)、现场可编程门阵列(Field Programmable Gate Array;FPGA)电路、任何其它类型的集成电路(integrated circuit;IC)、状态机以及类似物。
在一些实施例中,各外部姿势信息提供者221到外部姿势信息提供者22N可为能够对一或多个待跟踪对象进行跟踪功能的(外部)摄像机,例如主机21外部的跟踪摄像机。外部姿势信息提供者221到外部姿势信息提供者22N可安置在主机21所在的环境或主机21可移动于其中的环境。
在本发明的实施例中,手部O1将用作待跟踪对象的实例,且各外部姿势信息提供者221到外部姿势信息提供者22N可跟踪手部O1的姿态(即,手势)。在一个实施例中,手部O1预定由特定数目(例如,21)个预定关节构成,且各外部姿势信息提供者221到外部姿势信息提供者22N可用于跟踪各预定关节的姿态(例如,3D位置)。
在一个实施例中,主机21可将第一控制信号CS1发送到各外部姿势信息提供者221到外部姿势信息提供者22N以要求各外部姿势信息提供者221到外部姿势信息提供者22N提供手部O1上的预定关节的一些特定关节的姿态。举例来说,主机21可要求各外部姿势信息提供者221到外部姿势信息提供者22N仅向主机21提供手部O1上的指尖关节的姿态。在实施例中,由各外部姿势信息提供者221到外部姿势信息提供者22N响应于第一控制信号CS1而提供的姿态信息可称为第一手势信息。在一个实施例中,第一手势信息可为部分手势信息,其表示各外部姿势信息提供者221到外部姿势信息提供者22N不提供手部O1上的所有预定关节的所跟踪姿态。
举例来说,外部姿势信息提供者221可向主机21提供第一手势信息P1,其中第一手势信息P1可例示性地包含由外部姿势信息提供者221跟踪的手部O1上的指尖关节的姿态。举另一例来说,外部姿势信息提供者222可向主机21提供第一手势信息P2,其中第一手势信息P2可例示性地包含由外部姿势信息提供者222跟踪的手部O1上的指尖关节的姿态。类似地,外部姿势信息提供者22N可向主机21提供第一手势信息PN,其中第一手势信息PN可例示性地包含由外部姿势信息提供者22N跟踪的手部O1上的指尖关节的姿态。
在一个实施例中,主机21可将第二控制信号CS2发送到各外部姿势信息提供者221到外部姿势信息提供者22N以要求各外部姿势信息提供者221到外部姿势信息提供者22N提供手部O1上的所有预定关节的所跟踪姿态。在实施例中,由各外部姿势信息提供者221到外部姿势信息提供者22N响应于第二控制信号CS2而提供的姿态信息可称为第二手势信息。在一个实施例中,第二手势信息可为完整手势信息,其表示各外部姿势信息提供者221到外部姿势信息提供者22N提供手部O1上的所有预定关节的所跟踪姿态。
举例来说,外部姿势信息提供者221可向主机21提供第二手势信息C1,其中第一手势信息P1可例示性地包含由外部姿势信息提供者221跟踪的手部O1上的所有预定关节的姿态。举另一例来说,外部姿势信息提供者222可向主机21提供第一手势信息P2,其中第一手势信息P2可例示性地包含由外部姿势信息提供者222跟踪的手部O1上的所有预定关节的姿态。类似地,外部姿势信息提供者22N可向主机21提供第一手势信息PN,其中第一手势信息PN可例示性地包含由外部姿势信息提供者22N跟踪的手部O1上的所有预定关节的姿态。
在本发明的实施例中,处理器214可存取存储在存储电路212中的模块以实施用于检测本发明中提供的手势的方法,其将在以下进一步论述。
参加图3,其绘示根据本发明的实施例的用于检测手势的方法的流程图。这一实施例的方法可由图2A和图2B中的主机21执行,且下文将用图2A和图2B中所绘示的组件来描述图3中的每一步骤的细节。
首先,在步骤S310中,处理器214判断手部O1的信息是否足够用于识别手部O1的手势。
在一个实施例中,处理器214检测手势上的关节且判断检测到的手势上的关节的数量是否高于数量阈值。在不同实施例中,数量阈值可由设计者判定为足够用于处理器214跟踪手部O1的姿态的数量。
在一个实施例中,响应于判定检测到的手势上的关节的数量高于数量阈值,处理器214判定手部O1的所述信息足够用于识别手势。在这种情况下,即使一些关节因某些原因(例如在主机21的FOV 299外部或在手部O1处于某些角度时受阻挡)而不可跟踪,处理器214可基于可跟踪关节而预测/猜测可跟踪关节的姿态,但本发明不限于此。
另一方面,响应于判定检测到的手势上的关节的数量不高于数量阈值,处理器214判定手部O1的信息不足够用于识别手势。
在一个实施例中,处理器214可基于由跟踪摄像机撷取的手部O1的图像而进行由内而外跟踪以检测手势上的关节,但本发明不限于此。
在另一实施例中,处理器214可判断手部O1是否处于主机21的摄像机(例如,跟踪摄像机)的FOV 299中。在一个实施例中,响应于判定手部O1处于主机21的摄像机的FOV 299中,处理器214判定手部O1的信息足够用于识别手势。另一方面,响应于判定手部O1不在主机21的摄像机的视野FOV 299中,处理器214判定手部O1的信息不足够用于识别手势。
在判定手部O1的信息足够用于识别手部O1(例如,手部O1在FOV 299内)的手势的第一实施例中,处理器214可随后进行步骤S321到步骤S323以获得手部O1的手势。
在步骤S321中,处理器214识别手势。在一个实施例中,处理器214例如可基于常规的由内而外跟踪机制而跟踪手势,以下不作详细论述。
因此,在步骤S321之后,已获得手部O1的手势(例如,6自由度(6degree-of-freedom;6DOF))。
在步骤S322中,处理器214接收来自外部姿势信息提供者221到外部姿势信息提供者22N的第一手势信息P1到第一手势信息PN。如上文所提及,各第一手势信息P1到第一手势信息PN可仅包含手部O1上的一些特定关节(例如,手部O1上的指尖关节)的姿态。为了较好理解,第一手势信息P1到第一手势信息PN中携载的特定关节的姿态将称为第一姿态。
在步骤S323中,处理器214基于第一手势信息P1到第一手势信息PN而校正手势。在一个实施例中,处理器214取得由主机21在步骤S321中检测到的手势中的各特定关节的姿态。举例来说,如果考虑特定关节为手部O1上的指尖关节,那么处理器214可从步骤S321中检测到的手势取得指尖关节的姿态,但本发明不限于此。为了较好理解,从步骤S321中检测到的手势取得的特定关节的姿态将称为第二姿态。
接着,处理器214可经由将各特定关节的第二姿态与对应第一姿态组合来校正步骤S321中所获得的手势。
简单来说,因为处理器214可基于第一手势信息P1到第一手势信息PN而获得特定关节的第一姿态,因此处理器214可基于特定关节的第一姿态而优化步骤S321中所获得的手势上的特定关节的第二姿态。
举例来说,假定手部O1上的拇指的指尖关节为所考虑的特定关节之一,处理器214可从步骤S321中所获得的手势取得拇指的指尖关节的第二姿态。另外,处理器214可从各第一手势信息P1到第一手势信息取得拇指的指尖关节的第一姿态。接着,处理器214可将各第一手势信息P1到第一手势信息PN中携载的拇指的指尖关节的第二姿态与拇指的指尖关节的第一姿态组合为拇指的指尖关节的经校正姿态。在一个实施例中,当组合第一姿态和第二姿态时,处理器214可取得第一姿态和第二姿态的线性或非线性组合,但本发明不限于此。
在对其它特定关节进行类似操作之后,可据以获得其它特定关节的经校正姿态。因此,在步骤S321中所获得的手势可更准确,其原因在于手部O1上的特定关节的姿态已经在步骤S323中校正。
具体来说,当手部O1的信息足够用于识别手部O1(例如,手部O1处于FOV 299中)的手势时,处理器214可能需要以更高帧率显现手势,以用于向用户提供较好视觉体验。在这种情况下,处理器214可能不具有足够资源以接收来自外部姿势信息提供者221到外部姿势信息提供者22N的第二手势信息C1到第二手势信息CN和/或对步骤S321中所获得的手势进行更完整的校正。
因此,当手部O1的信息足够用于识别手部O1的手势时,处理器214可要求外部姿势信息提供者221到外部姿势信息提供者22N仅提供第一手势信息P1到第一手势信息PN,并据以校正一些特定关节(例如,一些重要关节和/或较可能被遮挡的一些关节)的姿态。在这种情况下,处理器214可在不消耗过多额外资源的情况下提供更佳的手势跟踪的结果。
在手部O1的信息经判定为不足够用于识别手部O1(例如,手部O1在FOV 299之外)的手势的第二实施例中,处理器214可接续进行步骤S331到步骤S333以获得手部O1的手势。
在第二实施例中,假定手部O1在FOV 299内且在第i时间点处离开FOV 299,如图2B所示,其中i为索引值。在这种情况下,在第i时间点之前,处理器214可基于步骤S321到步骤S323判定手势。
在第i时间点处,因为手部O1已离开FOV 299,因此处理器214可判定手部O1的信息不足够用于识别手部O1的手势且接续进行步骤S331到步骤S333。
在步骤S331中,处理器214接收来自外部姿势信息提供者221到外部姿势信息提供者22N的第二手势信息C1到第二手势信息CN。
在一个实施例中,响应于判定手部O1的信息从足够用于识别手势改变为不足够用于识别手势,处理器214可将第二控制信号CS2发送到各外部姿势信息提供者221到外部姿势信息提供者22N,以用于请求外部姿势信息提供者221到外部姿势信息提供者22N提供对应第二手势信息C1到第二手势信息,但本发明不限于此。
如上文所提及,各第二手势信息C1到第二手势信息CN包含手部O1上的所有预定关节的姿态。为了较好理解,第二手势信息C1到第二手势信息CN中携载的所有预定关节的姿态将称为第三姿态。
在步骤S332中,处理器214获得预测手势G1。在第二实施例中,响应于判定手部O1的信息在第i时间点处已从足够用于识别手势改变为不足够用于识别手势,处理器214可取得在第(i-k)时间点处识别的先前手势G2,其中k为正整数。接着,处理器214可基于先前手势而预测第i时间点处的手势作为预测手势G1。
在不同实施例中,k可为设计者所要的任何值。为了较好地预测上述预测手势G1,k可判定为1,使得处理器214将恰好在手部O1离开FOV 299之前取得所识别的手势作为先前手势G2,但本发明不限于此。
在第二实施例中,用于基于先前手势G2而预测预测手势G1的机制可参考相关的手势预测技术,其将不在本文中进一步论述。
在步骤S333中,处理器214基于预测手势G1和第二手势信息C1到第二手势信息CN而获得手势。
在一个实施例中,处理器214基于各外部姿势信息提供者221到外部姿势信息提供者22N的第二手势信息C1到第二手势信息CN而获得参考手势。在一个实施例中,处理器214基于对应第二手势信息C1到第二手势信息CN而获得由各外部姿势信息提供者221到外部姿势信息提供者22N检测到的第一手势。举例来说,处理器214可从第二手势信息C1取得各预定关节的第三姿态,并据以通过连接预定关节来构造对应于外部姿势信息提供者221的第一手势。举另一例来说,处理器214可从第二手势信息C2取得各预定关节的第三姿态,并据以通过连接预定关节来构造对应于外部姿势信息提供者222的第一手势。类似地,处理器214可从第二手势信息CN取得各预定关节的第三姿态,并据以通过连接预定关节来构造对应于外部姿势信息提供者22N的第一手势,但本发明不限于此。
接着,处理器214将由各外部姿势信息提供者221到外部姿势信息提供者22N检测到的第一手势组合为参考手势。在一个实施例中,处理器214可将对应于各外部姿势信息提供者221到外部姿势信息提供者22N的第一手势的线性/非线性组合作为参考手势。在一个实施例中,处理器214可将由各外部姿势信息提供者221到外部姿势信息提供者22N检测到的第一手势的第一平均值作为参考手势,但本发明不限于此。
然后,处理器214可将预测手势G1与参考手势组合为手部O1在第i时间点处的手势。
在一个实施例中,处理器214可将预测手势G1与参考手势的线性/非线性组合作为手部O1的手势。在一个实施例中,处理器214可将预测手势与参考手势的第二平均值作为手部O1在第i时间点处的手势。
具体来说,当手部O1的信息不足够用于识别手部O1(例如,手部O1不在FOV 299内)的手势时,处理器214可能需要以较低帧率显示手势,以准备更多资源以供处理第二手势信息C1到第二手势信息CN,使得手部O1的手势可因此优化。因此,本发明的实施例提供的解决方案可用于在手部O1的信息不足够用于识别手部O1(例如,手部O1不在FOV 299内)的手势时判定手部O1的手势。
在第二实施例中,处理器214可在将第一手势组合为参考手势之前进一步至少基于各外部姿势信息提供者221到外部姿势信息提供者22N的校正因子而校正由各外部姿势信息提供者221到外部姿势信息提供者22N检测到的第一手势。
在各外部姿势信息提供者221到外部姿势信息提供者22N为外部摄像机的实施例中,各外部姿势信息提供者221到外部姿势信息提供者22N的考虑校正因子可包含各外部姿势信息提供者221到外部姿势信息提供者22N的外部参数。基于而各外部参数校正由各外部姿势信息提供者221到外部姿势信息提供者22N检测到的第一手势的细节可参考相关技术,其将不在本文中进一步论述。
在一个实施例中,响应于判定手部O1的信息从不足够用于识别手势改变为足够用于识别手势,处理器214可将第一控制信号CS1发送到各外部姿势信息提供者221到外部姿势信息提供者22N,以用于请求外部姿势信息提供者221到外部姿势信息提供者22N提供对应第一手势信息P1到第一手势信息PN,但本发明不限于此。在这种情况下,处理器214可接续进行步骤S321到步骤S323,而其细节可参考以上描述。
在一个实施例中,在手部O1的手势已在步骤S321或步骤S333中判定之后,处理器214可据以基于手部O1的手势而调整现实服务的视觉内容。举例来说,处理器214可在视觉内容中显现手部O1的手势以供用户看到且与现实服务交互,但本发明不限于此。
另外,尽管以上仅用一个手部O1解释本发明的概念,但本发明的实施例可用于同时跟踪多个手部的手势。举例来说,对于FOV 299内的一些手部,处理器214可进行步骤S321到步骤S323以获得其手势。对于FOV 299外部的一些手部,处理器214可进行步骤S331到步骤S333以获得其手势,但本发明不限于此。
本发明进一步提供一种用于执行用于检测手势的方法的计算机可读存储媒体。计算机可读存储媒体由本文中所实施的多个程序指令(例如,设置程序指令和部署程序指令)构成。这些程序指令可加载到主机21中且由其执行,以执行用于检测手势的方法和上文所描述的主机21的功能。
综上所述,本发明的实施例提供一种在待跟踪手部对于主机为不可见时,用于让主机在与一或多个外部姿势信息提供者配合的同时判定手势的机制。另外,当待跟踪手部对于主机为可见时,本发明的实施例提供一种通过考虑由外部姿势信息提供者提供的第一手势信息来实现手势跟踪的更高准确度的机制。
此外,本发明的实施例可用于实施用于多个手部的手势跟踪。因此,可改良手势跟踪的准确度,使得主机可为用户提供更佳的现实服务。
所属领域中具通常知识者将显而易见的是,在不脱离本发明的范围或精神的情况下,可以对本发明的结构进行各种修改和变化。鉴于前述内容,希望本发明涵盖本发明的修改和变化,前提是所述修改和变化落入所附权利要求书和其等效物的范围内。

Claims (20)

1.一种用于检测手势的方法,适用于主机,其特征在于,包括:
判断手部的信息是否足够用于识别所述手部的手势;
响应于判定所述手部的所述信息足够用于识别所述手势,识别所述手势,接收来自至少一个外部姿势信息提供者的第一手势信息,且基于所述第一手势信息而校正所述手势;
响应于判定所述手部的所述信息不足够用于识别所述手势,接收来自所述至少一个外部姿势信息提供者的第二手势信息,获得预测手势,且基于所述预测手势和所述第二手势信息而获得所述手势,其中所述第二手势信息包括比所述第一手势信息更多的手势信息。
2.根据权利要求1所述的用于检测手势的方法,其中判断所述手势的所述信息是否足够用于识别所述手势的步骤包括:
检测所述手势上的关节;
响应于判定所述检测到的所述手势上的所述关节的数量高于数量阈值,判定所述手部的所述信息足够用于识别所述手势;
响应于判定所述检测到的所述手势上的关节的所述数量不高于所述数量阈值,判定所述手部的所述信息不足够用于识别所述手势。
3.根据权利要求1所述的用于检测手势的方法,其中判断所述手势的所述信息是否足够用于识别所述手势的步骤包括:
判断所述手部是否处于所述主机的摄像机的视野中;
响应于判定所述手部处于所述主机的所述摄像机的所述视野中,判定所述手部的所述信息足够用于识别所述手势;
响应于判定所述手部不在所述主机的所述摄像机的所述视野中,判定所述手部的所述信息不足够用于识别所述手势。
4.根据权利要求1所述的用于检测手势的方法,其中所述第一手势信息包括来自各所述外部姿势信息提供者的部分手势信息,所述部分手势信息包括由各所述外部姿势信息提供者检测到的所述手部上的至少一个特定关节的第一姿态。
5.根据权利要求4所述的用于检测手势的方法,其中基于所述第一手势信息而校正所述手势的步骤包括:
取得由所述主机检测到的所述手势中的各所述特定关节的第二姿态;
将各所述特定关节的所述第二姿态与对应的所述第一姿态组合。
6.根据权利要求4所述的用于检测手势的方法,其中所述至少一个特定关节包括所述手部上的指尖关节。
7.根据权利要求1所述的用于检测手势的方法,还包括:
响应于判定所述手部的所述信息从不足够用于识别所述手势改变为足够用于识别所述手势,将第一控制信号发送到各所述外部姿势信息提供者,其中所述第一控制信号控制各所述外部姿势信息提供者提供对应的所述第一手势信息;
响应于判定所述手部的所述信息从足够用于识别所述手势改变为不足够用于识别所述手势,将第二控制信号发送到各所述外部姿势信息提供者,其中所述第二控制信号控制各所述外部姿势信息提供者提供对应的第二手势信息。
8.根据权利要求1所述的用于检测手势的方法,其中获得所述预测手势的步骤包括:
响应于判定所述手部的所述信息在第i时间点处已从足够用于识别所述手势改变为不足够用于识别所述手势,取得在第(i-k)时间点处识别的先前手势,其中i为索引值,k为正整数;
基于所述先前手势而预测所述第i时间点处的所述手势作为所述预测手势。
9.根据权利要求1所述的用于检测手势的方法,其中所述手部预定由特定数目个预定关节构成,且所述第二手势信息包括来自各所述外部姿势信息提供者的完整手势信息,所述完整手势信息包括由各所述外部姿势信息提供者检测到的所述手部上的各所述预定关节的第三姿态。
10.根据权利要求1所述的用于检测手势的方法,其中基于所述预测手势和所述第二手势信息而获得所述手势的步骤包括:
基于各所述外部姿势信息提供者的所述第二手势信息而获得参考手势;以及
将所述预测手势与所述参考手势组合为所述手势。
11.根据权利要求10所述的用于检测手势的方法,其中基于各所述外部姿势信息提供者的所述第二手势信息而获得所述参考手势的步骤包括:
基于对应的所述第二手势信息而获得由各所述外部姿势信息提供者检测到的第一手势;
将由各所述外部姿势信息提供者检测到的所述第一手势组合为所述参考手势。
12.根据权利要求11所述的用于检测手势的方法,其中将由各所述外部姿势信息提供者检测到的所述第一手势组合为所述参考手势的步骤包括:
将由各所述外部姿势信息提供者检测到的所述第一手势的第一平均值作为所述参考手势。
13.根据权利要求11所述的用于检测手势的方法,其中在将由所述相应外部姿势信息提供者检测到的所述第一手势组合为所述参考手势的所述步骤之前,所述方法还包括:
至少基于各所述外部姿势信息提供者的校正因子而校正由各所述外部姿势信息提供者检测到的所述第一手势。
14.根据权利要求13所述的用于检测手势的方法,其中各所述外部姿势信息提供者为外部摄像机,且各所述外部姿势信息提供者的所述校正因子包括各所述外部姿势信息提供者的外部参数。
15.根据权利要求10所述的用于检测手势的方法,其中将所述预测手势与所述参考手势组合为所述手势的步骤包括:
将所述预测手势与所述参考手势的第二平均值作为所述手势。
16.一种用于检测手势的系统,其特征在于,包括:
主机,配置成进行:
判断手部的信息是否足够用于识别所述手部的手势;
响应于判定所述手部的所述信息足够用于识别所述手势,识别所述手势,接收来自至少一个外部姿势信息提供者的第一手势信息,且基于所述第一手势信息而校正所述手势;
响应于判定所述手部的所述信息不足够用于识别所述手势,接收来自所述至少一个外部姿势信息提供者的第二手势信息,获得预测手势,且基于所述预测手势和所述第二手势信息而获得所述手势,其中所述第二手势信息包括比所述第一手势信息更多的手势信息。
17.根据权利要求16所述的用于检测手势的系统,还包括所述至少一个外部姿势信息提供者。
18.根据权利要求17所述的用于检测手势的系统,其中各所述外部姿势信息提供者为外部摄像机。
19.根据权利要求16所述的用于检测手势的系统,其中所述主机进行:
响应于判定所述手部的所述信息从不足够用于识别所述手势改变为足够用于识别所述手势,将第一控制信号发送到各所述外部姿势信息提供者,其中所述第一控制信号控制各所述外部姿势信息提供者提供对应的所述第一手势信息;
响应于判定所述手部的所述信息从足够用于识别所述手势改变为不足够用于识别所述手势,将第二控制信号发送到各所述外部姿势信息提供者,其中所述第二控制信号控制各所述外部姿势信息提供者提供对应的所述第二手势信息。
20.一种计算机可读存储媒体,其特征在于,所述计算机可读存储媒体记录可执行计算机程序,所述可执行计算机程序由主机加载以进行以下步骤:
判断手部的信息是否足够用于识别所述手部的手势;
响应于判定所述手部的所述信息足够用于识别所述手势,识别所述手势,接收来自至少一个外部姿势信息提供者的第一手势信息,且基于所述第一手势信息而校正所述手势;
响应于判定所述手部的所述信息不足够用于识别所述手势,接收来自所述至少一个外部姿势信息提供者的第二手势信息,获得预测手势,且基于所述预测手势和所述第二手势信息而获得所述手势,其中所述第二手势信息包括比所述第一手势信息更多的手势信息。
CN202211108119.1A 2021-11-05 2022-09-13 用于检测手势的方法和系统,以及计算机可读存储媒体 Pending CN116092176A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202163275958P 2021-11-05 2021-11-05
US63/275,958 2021-11-05
US17/852,390 2022-06-29
US17/852,390 US20230145728A1 (en) 2021-11-05 2022-06-29 Method and system for detecting hand gesture, and computer readable storage medium

Publications (1)

Publication Number Publication Date
CN116092176A true CN116092176A (zh) 2023-05-09

Family

ID=86199756

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211108119.1A Pending CN116092176A (zh) 2021-11-05 2022-09-13 用于检测手势的方法和系统,以及计算机可读存储媒体

Country Status (3)

Country Link
US (1) US20230145728A1 (zh)
CN (1) CN116092176A (zh)
TW (1) TWI815593B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9255813B2 (en) * 2011-10-14 2016-02-09 Microsoft Technology Licensing, Llc User controlled real object disappearance in a mixed reality display
US9448636B2 (en) * 2012-04-18 2016-09-20 Arb Labs Inc. Identifying gestures using gesture data compressed by PCA, principal joint variable analysis, and compressed feature matrices
TWI544367B (zh) * 2013-01-29 2016-08-01 緯創資通股份有限公司 手勢辨識與控制方法及其裝置
US10936051B2 (en) * 2018-09-20 2021-03-02 Dell Products, L.P. Power management for gesture recognition in virtual, augmented, and mixed reality (xR) applications
CN111045511B (zh) * 2018-10-15 2022-06-07 华为技术有限公司 基于手势的操控方法及终端设备

Also Published As

Publication number Publication date
US20230145728A1 (en) 2023-05-11
TW202319889A (zh) 2023-05-16
TWI815593B (zh) 2023-09-11

Similar Documents

Publication Publication Date Title
EP3557377B1 (en) Neural network training for three dimensional (3d) gaze prediction with calibration parameters
US10129462B2 (en) Camera augmented reality based activity history tracking
US20200250488A1 (en) Deep learning for three dimensional (3d) gaze prediction
US11386699B2 (en) Image processing method, apparatus, storage medium, and electronic device
CN112506340B (zh) 设备控制方法、装置、电子设备及存储介质
CN108989678B (zh) 一种图像处理方法、移动终端
US10671890B2 (en) Training of a neural network for three dimensional (3D) gaze prediction
JP2017523487A (ja) 適応ホモグラフィ写像に基づく視線追跡
CN109040524B (zh) 伪影消除方法、装置、存储介质及终端
CN106133649A (zh) 使用双目注视约束的眼睛凝视跟踪
CN107852447A (zh) 基于设备运动和场景距离使电子设备处的曝光和增益平衡
CN111290580B (zh) 基于视线追踪的校准方法及相关装置
CN110688002A (zh) 虚拟内容的调整方法、装置、终端设备及存储介质
CN113342157B (zh) 眼球追踪处理方法及相关装置
KR20220044572A (ko) 캘리브레이션 파라미터의 획득 방법, 장치, 프로세서 및 전자기기
US20230043122A1 (en) Electronic device comprising multi-camera, and photographing method
CN116092176A (zh) 用于检测手势的方法和系统,以及计算机可读存储媒体
CN116823869A (zh) 背景替换的方法和电子设备
CN113900519A (zh) 注视点获取方法、装置以及电子设备
CN106101539A (zh) 一种自拍杆角度调节方法及自拍杆
KR20190143287A (ko) 홍채와 촬영 장치간 거리 예측 방법 및 이를 수행하기 위한 단말
CN115278071B (zh) 图像处理方法、装置、电子设备和可读存储介质
KR102094944B1 (ko) 시선 추적 방법 및 이를 수행하기 위한 단말
US20230351632A1 (en) Method for providing visual content, host, and computer readable storage medium
CN117197031A (zh) 确定地板平面的方法及主机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination