CN114167980A - 手势处理方法、装置、电子设备和可读存储介质 - Google Patents
手势处理方法、装置、电子设备和可读存储介质 Download PDFInfo
- Publication number
- CN114167980A CN114167980A CN202111371989.3A CN202111371989A CN114167980A CN 114167980 A CN114167980 A CN 114167980A CN 202111371989 A CN202111371989 A CN 202111371989A CN 114167980 A CN114167980 A CN 114167980A
- Authority
- CN
- China
- Prior art keywords
- hand
- gesture
- moment
- change
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 230000008859 change Effects 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 4
- 238000006073 displacement reaction Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 12
- 230000003993 interaction Effects 0.000 abstract description 17
- 210000004247 hand Anatomy 0.000 description 57
- 230000006870 function Effects 0.000 description 6
- 210000003811 finger Anatomy 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种手势处理方法、装置、电子设备和可读存储介质,该方法包括如下步骤:对图像进行识别,得到图像中的多个手及其手势;若多个手中某个手的手势变化为第一特定手势变化,则将某个手判断为操作手;预测第二时刻操作手所处的预测位置,在以预测位置为基准的设定范围内的预测区域中,将特征与第一时刻操作手的特征相同、和/或手势与第一时刻操作手的手势相同、和/或至预测位置距离最近的手判断为操作手,从而实现对操作手的跟踪;根据操作手的操作手势或操作手势的运动执行对应的操作命令。本发明适用于多个手的应用场景,能提高隔空手势人机交互的用户体验。
Description
技术领域
本发明涉及人机交互技术,特别涉及一种手势处理方法、装置、电子设备和可读存储介质。
背景技术
随着计算机技术的发展,人与机器交互的方式也日新月异,由原先的键盘、鼠标、遥控器等到触摸屏的出现再到如今逐渐兴起的手势控制,可以看出未来人机交互的发展趋势越来越倾向于自然交互的模式,人机交互技术朝着更加人性化、更加自然和便捷、更以人为本的方向发展和演变。
手的姿态,通常称作手势,是一种包含丰富信息的人体姿态。手势控制一般是通过人机交互系统中的图像采集装置(如摄像头)对不同时间的手势进行拍摄,并通过跟踪手势的造型变化和位置移动,以确定人机交互系统需要执行的操作,手势控制可以脱离键盘、鼠标、遥控器等物理设备,还可以避免如触摸屏这样的近距离触控,通过一种隔空的方式即能实现人机交互。
目前,采用手势控制的人机交互系统,其应用场景大多是单个手的手势进行控制或者是近距离的人机交互,例如车载控制系统、虚拟现实应用等。而当应用场景中人与机器之间的距离较远,使得图像采集范围内会存在多个手及其手势,例如智能家居、智能教室、智能会议室等应用领域,传统的单个手的手势控制应用于这些场景时容易出现问题。
发明内容
现有的人机交互系统在面对图像中出现多个手的应用场景时,操作手(如,意图通过手势进行操作控制的手)和其他的非操作手(如,无意进行操作控制的手,又可称为待接入手)同时存在于图像中,人机交互系统往往无法从同一时间的多个手中识别出操作手,并基于操作手的手势变化和位置移动做出正确的判断,因此控制手势的识别率明显下降,使得机器无法理解实际的控制手势所包含的信息,造成隔空手势传递的信息发生错乱,导致人机交互无法正常进行,从而影响用户体验。基于上述现状,本发明的主要目的在于,在多个手共存的的应用场景中,为了使得人机交互系统能够在多个手中区分出正确的操作手,以确保操作手的手势对系统的有效控制,本发明提供了一种手势处理方法、装置、电子设备和计算机可读存储介质。
为实现上述目的,本发明采用的技术方案如下:
一种手势处理方法,包括如下步骤:
对图像进行识别,得到所述图像中的多个手及其手势;
若所述多个手中某个手的手势变化为第一特定手势变化,则将所述某个手判断为操作手,若所述多个手中某个手的手势变化与所述第一特定手势变化不同,则将所述某个手判断为待接入手;
预测第二时刻所述操作手所处的预测位置,在以所述预测位置为基准的设定范围内的预测区域中,将特征与第一时刻所述操作手的特征相同、和/或手势与第一时刻所述操作手的手势相同、和/或至所述预测位置距离最近的手判断为所述操作手,从而实现对所述操作手的跟踪;其中,所述第二时刻为与所述第一时刻相邻的下一时刻;
根据所述操作手的操作手势或操作手势的运动执行对应的操作命令。
在一种可能的实现方式中,所述第一特定手势变化为从第一特定手势变化至第二特定手势;在将所述某个手判断为操作手之前,还包括如下步骤:
若所述多个手中某个手的手势为第一特定手势,预测第四时刻所述某个手所处的预计位置,在以所述预计位置为基准的设定范围内的预计区域中,将特征与第三时刻所述某个手的特征相同、和/或手势与第三时刻所述某个手的手势相同、和/或至所述预计位置距离最近的手判断为所述某个手,从而实现对所述某个手的跟踪;其中,所述第四时刻为与所述第三时刻相邻的下一时刻。
在一种可能的实现方式中,所述图像为实时视频中的图像;所述第二时刻与第一时刻之间的时间间隔等于所述视频中相邻图像之间的时间间隔的N倍,其中N为大于或等于1的正整数。
在一种可能的实现方式中,若所述操作手的手势变化为第二特定手势变化,则将所述操作手设定为待接入手。
在一种可能的实现方式中,在设定时长内若所述操作手的手势保持不变,且所述操作手的位移在设定位移范围内,则将所述操作手设定为待接入手。
在一种可能的实现方式中,若所述操作手离开所述图像确定的区域,则将所述操作手设定为待接入手。
在一种可能的实现方式中,所述第二特定手势变化为从所述第二特定手势变化至所述第一特定手势。
本发明还提供了一种手势处理装置,包括:
识别模块,用于对图像进行识别,得到所述图像中的多个手及其手势;
判断模块,用于若所述多个手中某个手的手势变化为第一特定手势变化,则将所述某个手判断为操作手,若所述多个手中某个手的手势变化与所述第一特定手势变化不同,则将所述某个手判断为待接入手;
跟踪模块,用于预测第二时刻所述操作手所处的预测位置,在以所述预测位置为基准的设定范围内的预测区域中,将特征与第一时刻所述操作手的特征相同、和/或手势与第一时刻所述操作手的手势相同、和/或至所述预测位置距离最近的手判断为所述操作手,从而实现对所述操作手的跟踪;其中,所述第二时刻为与所述第一时刻相邻的下一时刻;
执行命令模块,用于根据所述操作手的操作手势或操作手势的运动执行对应的操作命令。
在一种可能的实现方式中,所述第一特定手势变化为从第一特定手势变化至第二特定手势;所述手势处理装置还包括前置跟踪模块,所述前置跟踪模块用于,在将所述某个手判断为操作手之前,若所述多个手中某个手的手势为第一特定手势,预测第四时刻所述某个手所处的预计位置,在以所述预计位置为基准的设定范围内的预计区域中,将特征与第三时刻所述某个手的特征相同、和/或手势与第三时刻所述某个手的手势相同、和/或至所述预计位置距离最近的手判断为所述某个手,从而实现对所述某个手的跟踪;其中,所述第四时刻为与所述第三时刻相邻的下一时刻。
在一种可能的实现方式中,所述判断模块还用于,若所述操作手的手势变化为第二特定手势变化,则将所述操作手设定为待接入手。
在一种可能的实现方式中,所述判断模块还用于,在设定时长内若所述操作手的手势保持不变,且所述操作手的位移在设定位移范围内,则将所述操作手设定为待接入手。
在一种可能的实现方式中,所述判断模块还用于,若所述操作手离开所述图像确定的区域,则将所述操作手设定为待接入手。
本发明还提供了一种电子设备,包括处理器、存储器和存储在所述存储器上并在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现所述的手势处理方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于运行以实现如所述的手势处理方法。
本发明中,对图像中多个手进行实时检测,当某个手的手势变化为第一特定手势变化,则将所述某个手判断为操作手,而将手势变化与该第一特定手势变化不同的手判断为待接入手,降低了待接入手在后续步骤中对操作手追踪和识别的干扰;另外,通过预测下一个时刻操作手所处的预测位置,在以所述预测位置为基准的设定范围内的区域中,将特征与第一时刻所述操作手的特征相同、和/或手势与第一时刻所述操作手的手势相同、和/或至所述预测位置距离最近的手判断为所述操作手,从而实现对所述操作手的跟踪,进一步提高了对操作手的识别的准确率,进而提高了对该操作手的手势识别的准确性,并减少其他待接入手的手势的干扰,有助于保证人机交互的正常进行。
本发明的其他有益效果,将在具体实施方式中通过具体技术特征和技术方案的介绍来阐述,本领域技术人员通过这些技术特征和技术方案的介绍,应能理解所述技术特征和技术方案带来的有益技术效果。
附图说明
以下将参照附图对根据本发明的手势处理方法的优选实施方式进行描述。
图中:
图1为本发明的手势处理方法的流程示意图;
图2为本发明的跟踪对象满足接入条件的手势造型示意图;
图3为本发明的预测区域的示意图。
附图标记说明:1操作手的实际位置,2操作手的预测位置,3待接入手。
具体实施方式
本发明实施例中,人机交互系统包括电子设备和摄像装置,摄像装置可以是独立于电子设备的设备,也可以作为电子设备的部件。参见图1,本发明提供了一种手势处理方法,用于人机交互系统,所述处理方法包括如下步骤:
摄像装置对预设范围的区域进行实时拍摄,获得连续的图像或者视频。视频是由连续的图像(或称为帧)组成,一般采用每秒传输帧数(fps)(例如30fps,即每秒帧数为30帧)来说明视频的信息数量和流畅程度。在一些实施例中,摄像装置一旦设置好,其拍摄的区域是固定的,换言之,拍摄的图像所覆盖的区域也是固定的,固定设置摄像装置在很多情况下利于后续对手的识别和追踪,能够提高准确度和降低复杂度。
电子设备的处理器从摄像装置获取上述图像,并对图像进行识别,得到所述图像中的多个手及其手势(例如,经过上述手势识别后,处理器获得了图像中同时存在6个手)。在得到图像中的多个手及其手势后,还可以进一步确定每个手在此图像中所处的位置,例如,可以图像的左下角为坐标原点建立直角坐标系,将每个手占据的像素位置作为手在该直角坐标系中所处的位置。每个图像可以具有序号,可以根据拍摄的时间先后依次对每个图像赋予上述序号,因此,该序号代表了图像时间的先后顺序,这样,处理器即可以获得不同时刻每个手所处的位置,为后续对手的追踪提供基础。现有技术中已有众多手势识别算法,利用该手势识别算法可以从图像中提取或识别手及其手势,例如利用人工智能识别(AI)算法对图像识别,可以得到图像中存在的手及其手势。作为常见的原理,手势识别算法通常利用手及其手势的各种模板(包括各种手势的图形模板),当检测到图像中存在与任一模板相同或相似的图形时,则判断该图形所代表的对象是手,而该图形则为这个手的手势。
在获得图像中的多个手后,处理器对所述多个手进行如下判断:若所述多个手中某个手的手势变化为第一特定手势变化,则将所述某个手判断为操作手,即该操作手已经处于接入状态,在后续步骤中,处理器将根据该操作手后续的操作手势执行对应的操作命令(例如控制音量、切换音频等);若所述多个手中某个手的手势变化与所述第一特定手势变化不同,则将所述某个手判断为待接入手(即所述某个手处于非接入状态),处理器并不会根据该待接入手后续的手势直接作出对应的操作命令,除非该待接入手经过前述步骤后被处理器判断为操作手。第一特定手势变化是指从第一特定手势变化至第二特定手势,如图2所示,在一些实施例中,第一特定手势为张开的手掌(例如五只手指并拢伸直;或者,拇指张开远离其余四指且其余四指并拢,或者五只手指均张开伸直),第二特定手势为拇指伸直而其余四指紧握,当检测到某个手的手势变化符合图2所示的手势变化时,则将该手判断为操作手。可以理解,符合第一特定手势变化的操作手代表了该手具有操作控制的意图,可以与其余待接入手的无操作控制意图的手势相区分。
不难理解,由于要确定每个手的手势变化,因此首先要对每个手进行区别,然后再跟踪每个手在前后时刻的图像中所表现出来的手势。在一些实施例中,通过如下方式实现对手的区别和追踪。若所述多个手中某个手的手势为第一特定手势,预测第四时刻T02所述某个手所处的预计位置,在以所述预计位置为基准的设定范围(如图像像素宽度的十分之一)内的预计区域中,将特征与第三时刻T01所述某个手的特征相同、和/或手势与第三时刻T01所述某个手的手势相同、和/或至所述预计位置距离最近的手判断为所述某个手,从而实现对所述某个手的跟踪;其中,所述第四时刻T02为与所述第三时刻T01相邻的下一时刻,由于本实施例是基于拍摄图像进行的手势处理,因此第三时刻T01、第四时刻02是与对应拍摄的图像相对应的,例如第三时刻T01是某一图像的拍摄时刻,而第四时刻02是该图像相邻下一帧(或者下几帧)图像的拍摄时刻,即,第四时刻02与第三时刻T01相邻,并不意味着第四时刻02对应的图像与第三时刻T01对应的图像相邻。在一些实施例中,以预计位置为中心点的设定范围内确定的区域作为上述预计区域。该预计区域的形状可以根据实际需要来选择,可以是矩形,也可以是圆形或椭圆形。在一些情况下,图像中每个手的特征(手的固定特征,不会因手势变化而改变,例如左/右手,手的肤色等)不同,即能够根据手的特征区分不同的手,此时根据手的特征对手进行追踪是高效而准确的,可以不再根据手的预计位置对手进行区分和追踪,例如图像中只出现两个手,一个为左手另一个为右手,如果左手的手势为第一特定手势,只需要对左手进行追踪即可。而在另一些情况下,图像中同时存在了特征相同的多个手,此时,可以根据手的特征和预计位置对手进行区分和追踪,例如将特征与第三时刻T01所述某个手的特征相同、且至所述预计位置距离最近的手判断为所述某个手(实际上,由于手的运动比较灵活,预计位置与第四时刻T02手的实际位置通常会存在一定距离)。在一些情况下,图像中同时存在了特征相同的多个手,此时,需要根据手的特征、前一时刻的手势和预计位置对操作手进行区分和追踪,例如将特征与第三时刻T01操作手的特征相同、且手势与第三时刻T01某个手的手势相同、且至所述预计位置距离最近的手判断为所述某个手(实际上,由于手的运动比较灵活,预计位置与第四时刻T02手的实际位置通常会存在一定距离)。在另外一些情况下,可以只根据预计位置对某个手进行区分和追踪;例如,如果多个手之间的位置隔得很远(例如图像中存在四个手,四个手分别在图像的四个顶点附近,且四个手的运动幅度很小),且手的运动幅度很小,此时只根据预计位置对手进行区分和追踪即可以获得准确的效果;又如,如果图像中不存在特征与第三时刻T01所述某个手的特征相同、且手势与第三时刻T01某个手的手势相同的手的情况下,将至所述预计位置距离最近的手判断为所述某个手。另外,在一些实施例中,只有某个手从第一特定手势和第二特定手势之外的手势变化为第一特定手势(例如张开的手掌),处理器才会对该手进行追踪,然后在该手从第一特定手势变化为第二特定手势后,将该手判断为操作手,这样,可以降低某些手因为无意图的相同手势而被误认为是操作手的概率,提高了手势处理的准确性。
可以通过大量实验统计确定相邻时刻手之间的位移范围,并从中选择一个中位数作为相邻时刻手之间的位移,之后即可基于当前时刻手的位置和该位移预测得到上述预计位置。例如,在某些实施例中,确定得到该位移为手的宽度(在该图像中的像素宽度)的二分之一。
在图像中的手被分类后(即,要么被判断为操作手,要么被判断为待接入手),处理器需要对其中的操作手进行跟踪。具体而言,处理器预测第二时刻T12所述操作手所处的预测位置,在以所述预测位置为基准的设定范围内的预测区域中,将满足以下任一条件的手判断为操作手以实现对所述操作手的跟踪:1.特征与第一时刻T11所述操作手的特征相同的手;2.至所述预测位置距离最近的手;3.手势与第一时刻T11所述操作手的手势相同的手;4.前述条件的任意组合,例如条件1和2,或者条件1和3等;其中,第二时刻T12为与第一时刻T11相邻的下一时刻,由于本实施例是基于拍摄图像进行的手势处理,因此第一时刻T11、第二时刻T12是与对应拍摄的图像相对应的,例如第一时刻T11是某一图像的拍摄时刻,而第二时刻T12是该图像相邻下一帧(或者下几帧)图像的拍摄时刻,即,第二时刻T12与第一时刻T11相邻,并不意味着第二时刻T12对应的图像与第一时刻T11对应的图像相邻。在一些实施例中,以预测位置为中心点的设定范围内确定的区域作为上述预测区域。该预测区域的形状根据实际需要来选择,可以是矩形,也可以是圆形或椭圆形。在一些情况下,图像中每个手的特征(手的固定特征,不会因手势变化而改变,例如左/右手,手的肤色等)不同,即能够根据手的特征区分不同的手,此时根据手的特征对操作手进行追踪是高效而准确的,可以不再根据操作手的预测位置对操作手进行区分和追踪,例如图像中只出现两个手,一个为左手另一个为右手,而操作手为左右,此时,只需要根据操作手为左手这一特征在图像中的两个手中确定该操作手,并进行追踪即可。在一些情况下,图像中同时存在了特征相同的多个手,此时,可以根据手的特征和预测位置对操作手进行区分和追踪,例如将特征与第一时刻T11操作手的特征相同、且至所述预测位置距离最近的手判断为操作手(实际上,由于手的运动比较灵活,预测位置与第二时刻T12手的实际位置通常会存在一定距离)。在一些情况下,图像中同时存在了特征相同的多个手,此时,需要根据手的特征、前一时刻的手势和预测位置对操作手进行区分和追踪,例如将特征与第一时刻T11操作手的特征相同、且手势与第一时刻T11操作手的手势相同、且至所述预测位置距离最近的手判断为操作手(实际上,由于手的运动比较灵活,预测位置与第二时刻T12手的实际位置通常会存在一定距离),在本实施例中,操作手后续指示电子设备进行特定的功能操作的操作手势最好与上述第二手势相同。在另外一些情况下,可以只根据预测位置对操作手进行区分和追踪;例如,如果多个手之间的位置隔得很远(例如图像中存在四个手,四个手分别在图像的四个顶点附近,且四个手的运动幅度很小),且手的运动幅度很小,此时只根据预测位置对操作手进行区分和追踪即可以获得准确的效果;又如,不存在特征与第一时刻T11操作手的特征相同、且手势与第一时刻T11操作手的手势相同的手的情况下,将至预测位置距离最近的手判断为操作手。如图3所示,图像中预测区域内,第四时刻T02操作手的实际位置2与预测位置2具有一定距离,图像中预测区域内出现了两个待接入手3,而另一个待接入手3一部分位于预测区域内,另一部分位于预测区域外。
与预计位置类似,可以通过大量实验统计确定相邻时刻手之间的位移范围,并从中选择一个中位数作为相邻时刻手之间的位移,之后即可基于当前时刻操作手的位置和该位移预测得到上述预测位置。例如,在某些实施例中,确定得到该位移为操作手的宽度(在该图像中的像素宽度)的二分之一。
处理器追踪锁定操作手后,根据所述操作手的后续的操作手势或者操作手势的运动执行对应的操作命令。这些后续的操作手势可以与前述的第一特定手势和第二特定手势不同,这些操作手势代表着指示电子设备进行对应的功能操作,例如指示电子设备增加音量、切换歌曲、切换选择不同窗口、关机等,通常而言,不同的操作手势对应不同的功能操作;当然,在某些情况下,在电子设备不同的界面下,相同的操作手势也可以对应不同的功能操作,例如,在调出音量按钮时,操作手的手势--向下的手掌可以指示处理器执行降低音量的功能操作;在调出歌曲选择的界面,操作手的手势--向下的手掌可以指示处理器执行选择下一首歌曲的功能操作。如前所述,在一些实施例中,后续的操作手势可以与第二特定手势相同,第二特定手势的不同运动可以代表指示电子设备进行对应的功能操作,例如第二特定手势的向下和向上运动分别代表可以指示处理器执行降低和增加音量。
本发明可以允许在图像中存在多个操作手,处理器可以对多个操作手的操作手势进行同时或先后响应。出于某些考虑(例如节省处理器的运算资源,或者让处理器更快响应当前操作手之外的其余操作手,等等),在一些情况下,可以将满足一些条件的当前操作手降级并设定为待接入手,或者称之为操作手退出。例如,若所述操作手的手势变化为第二特定手势变化,则处理器将所述操作手设定为待接入手。优选地,该第二特定手势变化与第一特定手势变化刚好相反,即从第二特定手势变化为第一特定手势,这样,易于用户记忆,提升用户体验。又如,在设定时长内(例如在连续1分钟时长内)若所述操作手的手势保持不变,且所述操作手的位移在设定位移范围(例如图像像素宽度的二十分之一)内,处理器则将所述操作手设定为待接入手;优选地,在该设定时长内,操作手的手势为对于处理器而言不具有特定含义的手势(即,第一特定手势、第二特定手势和操作手势之外的手势)且保持不变,且所述操作手的位移在设定位移范围,处理器才将所述操作手设定为待接入手。再如,若所述操作手离开所述图像确定的区域(即从图像中无法找到该操作手),则将所述操作手设定为待接入手。
所述相邻时刻(如第二时刻T12与第一时刻T11)之间的时间间隔等于所述视频中相邻图像之间的时间间隔的N倍,其中N为大于或等于1的正整数。考虑到应用场景的实际情况和使用要求,如若相邻时刻之间的时间间隔设置为等于视频中相邻图像之间的时间间隔,也就是对每一帧图像进行上述手势识别处理,当每秒传输帧数的数值较大时,手势识别处理所需的计算量将会很大。在每秒传输帧数的数值较大时,相对于手势的变化,连续的几帧图像中的手势变化很小或者几乎没有,因而可将相邻时刻之间的时间间隔设置为等于视频中相邻图像之间的时间间隔的2倍以上(整数倍),这样既能有效提高运行效率,又能降低对系统硬件设备处理能力的要求。
本发明还提供了一种手势处理装置,包括:
识别模块,用于对图像进行识别,得到所述图像中的多个手及其手势;
判断模块,用于若所述多个手中某个手的手势变化为第一特定手势变化,则将所述某个手判断为操作手,若所述多个手中某个手的手势变化与所述第一特定手势变化不同,则将所述某个手判断为待接入手;
跟踪模块,用于预测第二时刻所述操作手所处的预测位置,在以所述预测位置为基准的设定范围内的预测区域中,将特征与第一时刻所述操作手的特征相同、和/或手势与第一时刻所述操作手的手势相同、和/或至所述预测位置距离最近的手判断为所述操作手,从而实现对所述操作手的跟踪;其中,所述第二时刻为与所述第一时刻相邻的下一时刻;
执行命令模块,用于根据所述操作手的操作手势或操作手势的运动执行对应的操作命令。
本发明还提供了一种电子设备,包括处理器、存储器和存储在所述存储器上并在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述实施例所述的手势处理方法。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于运行以实现上述实施例所述的手势处理方法。
本领域的技术人员能够理解的是,在不冲突的前提下,上述各优选方案可以自由地组合、叠加。
应当理解,上述的实施方式仅是示例性的,而非限制性的,在不偏离本发明的基本原理的情况下,本领域的技术人员可以针对上述细节做出的各种明显的或等同的修改或替换,都将包含于本发明的权利要求范围内。
Claims (10)
1.一种手势处理方法,其特征在于,包括如下步骤:
对图像进行识别,得到所述图像中的多个手及其手势;
若所述多个手中某个手的手势变化为第一特定手势变化,则将所述某个手判断为操作手,若所述多个手中某个手的手势变化与所述第一特定手势变化不同,则将所述某个手判断为待接入手;
预测第二时刻所述操作手所处的预测位置,在以所述预测位置为基准的设定范围内的预测区域中,将特征与第一时刻所述操作手的特征相同、和/或手势与所述第一时刻所述操作手的手势相同、和/或至所述预测位置距离最近的手判断为所述操作手,从而实现对所述操作手的跟踪;其中,所述第二时刻为与所述第一时刻相邻的下一时刻;
根据所述操作手的操作手势或操作手势的运动执行对应的操作命令。
2.如权利要求1所述的手势处理方法,其特征在于,
所述第一特定手势变化为从第一特定手势变化至第二特定手势;
在将所述某个手判断为操作手之前,还包括如下步骤:
若所述多个手中某个手的手势为第一特定手势,预测第四时刻所述某个手所处的预计位置,在以所述预计位置为基准的设定范围内的预计区域中,将特征与第三时刻所述某个手的特征相同、和/或手势与第三时刻所述某个手的手势相同、和/或至所述预计位置距离最近的手判断为所述某个手,从而实现对所述某个手的跟踪;其中,所述第四时刻为与所述第三时刻相邻的下一时刻。
3.如权利要求1所述的手势处理方法,其特征在于,
所述图像为实时视频中的图像;
所述第二时刻与第一时刻之间的时间间隔等于所述视频中相邻图像之间的时间间隔的N倍,其中N为大于或等于1的正整数。
4.如权利要求1所述的手势处理方法,其特征在于,
若所述操作手的手势变化为第二特定手势变化,则将所述操作手设定为待接入手。
5.如权利要求1所述的手势处理方法,其特征在于,
在设定时长内若所述操作手的手势保持不变,且所述操作手的位移在设定位移范围内,则将所述操作手设定为待接入手;
或,若所述操作手离开所述图像确定的区域,则将所述操作手设定为待接入手。
6.如权利要求4所述的手势处理方法,其特征在于,
所述第二特定手势变化为从所述第二特定手势变化至所述第一特定手势。
7.一种手势处理装置,其特征在于,包括:
识别模块,用于对图像进行识别,得到所述图像中的多个手及其手势;
判断模块,用于若所述多个手中某个手的手势变化为第一特定手势变化,则将所述某个手判断为操作手,若所述多个手中某个手的手势变化与所述第一特定手势变化不同,则将所述某个手判断为待接入手;
跟踪模块,用于预测第二时刻所述操作手所处的预测位置,在以所述预测位置为基准的设定范围内的预测区域中,将特征与第一时刻所述操作手的特征相同、和/或手势与第一时刻所述操作手的手势相同、和/或至所述预测位置距离最近的手判断为所述操作手,从而实现对所述操作手的跟踪;其中,所述第二时刻为与所述第一时刻相邻的下一时刻;
执行命令模块,用于根据所述操作手的操作手势或操作手势的运动执行对应的操作命令。
8.如权利要求7所述的手势处理装置,其特征在于,所述第一特定手势变化为从第一特定手势变化至第二特定手势;
所述手势处理装置还包括前置跟踪模块,所述前置跟踪模块用于,在将所述某个手判断为操作手之前,若所述多个手中某个手的手势为第一特定手势,预测第四时刻所述某个手所处的预计位置,在以所述预计位置为基准的设定范围内的预计区域中,将特征与第三时刻所述某个手的特征相同、和/或手势与第三时刻所述某个手的手势相同、和/或至所述预计位置距离最近的手判断为所述某个手,从而实现对所述某个手的跟踪;其中,所述第四时刻为与所述第三时刻相邻的下一时刻。
9.一种电子设备,包括处理器、存储器和存储在所述存储器上并在所述处理器上运行的计算机程序,其特征在于,所述计算机程序被所述处理器执行时实现如权利要求1至6任一项所述的手势处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序用于运行以实现如权利要求1至6任一项所述的手势处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111371989.3A CN114167980B (zh) | 2021-11-18 | 2021-11-18 | 手势处理方法、装置、电子设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111371989.3A CN114167980B (zh) | 2021-11-18 | 2021-11-18 | 手势处理方法、装置、电子设备和可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114167980A true CN114167980A (zh) | 2022-03-11 |
CN114167980B CN114167980B (zh) | 2024-05-07 |
Family
ID=80479676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111371989.3A Active CN114167980B (zh) | 2021-11-18 | 2021-11-18 | 手势处理方法、装置、电子设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114167980B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102426480A (zh) * | 2011-11-03 | 2012-04-25 | 康佳集团股份有限公司 | 一种人机交互系统及其实时手势跟踪处理方法 |
JP5024495B1 (ja) * | 2012-04-17 | 2012-09-12 | オムロン株式会社 | ジェスチャ入力装置およびジェスチャ入力装置の制御方法 |
US20140201666A1 (en) * | 2013-01-15 | 2014-07-17 | Raffi Bedikian | Dynamic, free-space user interactions for machine control |
KR101511146B1 (ko) * | 2014-07-29 | 2015-04-17 | 연세대학교 산학협력단 | 스마트 3차원 제스처 인식 장치 및 방법 |
CN104750252A (zh) * | 2015-03-09 | 2015-07-01 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN108205646A (zh) * | 2016-12-19 | 2018-06-26 | 北京数码视讯科技股份有限公司 | 一种手部姿态检测方法及装置 |
CN108268125A (zh) * | 2016-12-31 | 2018-07-10 | 广州映博智能科技有限公司 | 一种基于计算机视觉的运动手势检测及跟踪方法 |
CN108594995A (zh) * | 2018-04-13 | 2018-09-28 | 广东小天才科技有限公司 | 一种基于手势识别的电子设备操作方法及电子设备 |
CN109388228A (zh) * | 2017-08-10 | 2019-02-26 | 智汇有初(广州)科技有限公司 | 手势控制系统和手势控制方法 |
CN112328090A (zh) * | 2020-11-27 | 2021-02-05 | 北京市商汤科技开发有限公司 | 手势识别方法及装置、电子设备和存储介质 |
CN112668506A (zh) * | 2020-12-31 | 2021-04-16 | 咪咕动漫有限公司 | 一种手势跟踪方法、设备及计算机可读存储介质 |
US11112875B1 (en) * | 2020-03-20 | 2021-09-07 | Huawei Technologies Co., Ltd. | Methods and systems for controlling a device using hand gestures in multi-user environment |
-
2021
- 2021-11-18 CN CN202111371989.3A patent/CN114167980B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102426480A (zh) * | 2011-11-03 | 2012-04-25 | 康佳集团股份有限公司 | 一种人机交互系统及其实时手势跟踪处理方法 |
JP5024495B1 (ja) * | 2012-04-17 | 2012-09-12 | オムロン株式会社 | ジェスチャ入力装置およびジェスチャ入力装置の制御方法 |
US20140201666A1 (en) * | 2013-01-15 | 2014-07-17 | Raffi Bedikian | Dynamic, free-space user interactions for machine control |
KR101511146B1 (ko) * | 2014-07-29 | 2015-04-17 | 연세대학교 산학협력단 | 스마트 3차원 제스처 인식 장치 및 방법 |
CN104750252A (zh) * | 2015-03-09 | 2015-07-01 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN108205646A (zh) * | 2016-12-19 | 2018-06-26 | 北京数码视讯科技股份有限公司 | 一种手部姿态检测方法及装置 |
CN108268125A (zh) * | 2016-12-31 | 2018-07-10 | 广州映博智能科技有限公司 | 一种基于计算机视觉的运动手势检测及跟踪方法 |
CN109388228A (zh) * | 2017-08-10 | 2019-02-26 | 智汇有初(广州)科技有限公司 | 手势控制系统和手势控制方法 |
CN108594995A (zh) * | 2018-04-13 | 2018-09-28 | 广东小天才科技有限公司 | 一种基于手势识别的电子设备操作方法及电子设备 |
US11112875B1 (en) * | 2020-03-20 | 2021-09-07 | Huawei Technologies Co., Ltd. | Methods and systems for controlling a device using hand gestures in multi-user environment |
CN112328090A (zh) * | 2020-11-27 | 2021-02-05 | 北京市商汤科技开发有限公司 | 手势识别方法及装置、电子设备和存储介质 |
CN112668506A (zh) * | 2020-12-31 | 2021-04-16 | 咪咕动漫有限公司 | 一种手势跟踪方法、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114167980B (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023517383A (ja) | マルチユーザ環境でハンドジェスチャを用いて装置を制御する方法及びシステム | |
US8897490B2 (en) | Vision-based user interface and related method | |
CN103353935B (zh) | 一种用于智能家居系统的3d动态手势识别方法 | |
US10156909B2 (en) | Gesture recognition device, gesture recognition method, and information processing device | |
CN107765855A (zh) | 一种基于手势识别控制机器人运动的方法和系统 | |
CN102402289B (zh) | 一种基于机器视觉的手势鼠标识别方法 | |
CN102200830A (zh) | 基于静态手势识别的非接触控制系统和控制方法 | |
CN105353634A (zh) | 利用手势识别控制操作的家电设备与方法 | |
CN107357414B (zh) | 一种点击动作的识别方法及点击动作识别装置 | |
CN108616712B (zh) | 一种基于摄像头的界面操作方法、装置、设备及存储介质 | |
CN102270036A (zh) | 影像式手部动作辨识系统及其方法 | |
WO2013078989A1 (zh) | 人机交互操作指令的触发控制方法和系统 | |
CN103135746B (zh) | 基于静态姿势和动态姿势的非接触控制方法、系统和设备 | |
WO2020186826A1 (zh) | 基于智能手环的游戏控制方法、智能手环及存储介质 | |
CN106468993A (zh) | 虚拟现实终端设备的控制方法及装置 | |
US20180260031A1 (en) | Method for controlling distribution of multiple sub-screens and device using the same | |
CN110956124A (zh) | 一种基于手势的显示设备控制方法和显示设备 | |
CN114167980B (zh) | 手势处理方法、装置、电子设备和可读存储介质 | |
CN108989553A (zh) | 场景操控的方法、装置及电子设备 | |
Aggarwal et al. | An Approach to Control the PC with Hand Gesture Recognition using Computer Vision Technique | |
US20230027040A1 (en) | Control Method, Electronic Device, and Storage Medium | |
Zhu et al. | Movement tracking in real-time hand gesture recognition | |
Siam et al. | Human computer interaction using marker based hand gesture recognition | |
Zaletelj et al. | Vision-based human-computer interface using hand gestures | |
Ye et al. | Vics: A modular hci framework using spatiotemporal dynamics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |