CN106155327A - 手势识别方法和系统 - Google Patents

手势识别方法和系统 Download PDF

Info

Publication number
CN106155327A
CN106155327A CN201610621775.XA CN201610621775A CN106155327A CN 106155327 A CN106155327 A CN 106155327A CN 201610621775 A CN201610621775 A CN 201610621775A CN 106155327 A CN106155327 A CN 106155327A
Authority
CN
China
Prior art keywords
gradient
gesture
initial results
convolutional neural
neural networks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610621775.XA
Other languages
English (en)
Inventor
公绪超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Holding Beijing Co Ltd
LeTV Cloud Computing Co Ltd
Original Assignee
LeTV Holding Beijing Co Ltd
LeTV Cloud Computing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Holding Beijing Co Ltd, LeTV Cloud Computing Co Ltd filed Critical LeTV Holding Beijing Co Ltd
Priority to CN201610621775.XA priority Critical patent/CN106155327A/zh
Publication of CN106155327A publication Critical patent/CN106155327A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Psychiatry (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种手势识别方法和系统,涉及计算机视觉技术领域。其中,手势识别方法包括:对输入图像进行多方向梯度提取以形成多个不同的梯度图像;基于卷积神经网络金字塔对所述多个不同的梯度图像进行判别以得出初始结果集;对判别得出的所述初始结果集进行融合以得到手势的最终判别结果。进一步地,由于以描述手势图像的多方向梯度图像为基础,融入神经网络及证据理论联合判别的思想,充分提高了手势识别的精度,即使在外部环境与肤色场景相似、图片质量模糊的情况下都可以有良好的识别效果。

Description

手势识别方法和系统
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种手势识别方法和系统。
背景技术
现在基本是鼠标、键盘和触控的时代,不过另一种手势控制技术正在兴起,这个技术根据的原理很简单,就是摄像头捕捉手势,然后利用手势控制机器运作。可以让人们摆脱键盘、鼠标和触控的空间限制。
在基于图像识别的人机交互场景中,对手势动作的有效识别能够有效的操作机器运作,给用户以良好的操作体验。这对于产品的稳定及广泛推广有非常重要的意义。
目前有很多有关手势识别的研究,也出现了很多相应的方法,其中主要包括模板匹配方法、聚类分类方法、特征比对方法等。发明人发现,现有技术中的这些方法在外部环境与肤色场景相似的情况,以及图片质量模糊的情况下往往识别准确率不高。
发明内容
本发明提供一种手势识别方法和系统,用以解决现有技术中存在的一个或多个问题。
第一方面,本发明实施例提供一种手势识别方法,包括:对输入图像进行多方向梯度提取以形成多个不同的梯度图像;基于卷积神经网络金字塔对多个不同的梯度图像进行判别以得出初始结果集,其中,卷积神经网络金字塔包括基于对多个不同梯度的手势图像进行深度学习得到;对判别得出的初始结果集进行融合以得到手势的最终判别结果。
第二方面,本发明实施例提供一种手势识别系统,包括:多梯度提取模块,配置用于对输入图像进行多方向梯度提取以形成多个不同的梯度图像;判别模块,配置用于基于卷积神经网络金字塔对多个不同的梯度图像进行判别以得出初始结果集,其中,卷积神经网络金字塔包括基于对多个不同梯度的手势图像进行深度学习得到;以及结果融合模块,配置用于对判别得出的初始结果集进行融合以得到手势的最终判别结果。
第三方面,本申请实施例还提供了一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行本申请上述任一项手势识别方法。
第四方面,本申请实施例还提供了一种电子设备,包括:至少一个处理器;以及存储器;其中,所述存储器存储有可被所述至少一个处理器执行的程序,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明上述任一项手势识别方法。
本发明实施例提供的手势识别方法和系统,通过对图像进行多个方向的梯度图像提取,之后再经由卷积神经网络金字塔进行判别得出初始结果集,最后对结果进行融合以得到最终的手势判别结果,可以实现更加精准的手势识别。进一步地,由于以描述手势图像的多方向梯度图像为基础,融入神经网络及证据理论联合判别的思想,充分提高了手势识别的精度,即使在外部环境与肤色场景相似、图片质量模糊的情况下都可以有良好的识别效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明手势识别方法的一个实施例流程图;
图2为本发明手势识别方法的又一个实施例流程图;
图3为本发明手势识别方法的再一个实施例流程图;
图4为本发明手势识别方案的应用实例流程图;
图5为本发明手势识别方案的实施例应用场景示意图;
图6为本发明手势识别系统的实施例结构示意图;
图7是本申请一实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
在本发明中,“组件”、“装置”、“系统”等等指应用于计算机的相关实体,如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说,例如,组件可以、但不限于是运行于处理器的过程、处理器、对象、可执行组件、执行线程、程序和/或计算机。还有,运行于服务器上的应用程序或脚本程序、服务器都可以是组件。一个或多个组件可在执行的过程和/或线程中,并且组件可以在一台计算机上本地化和/或分布在两台或多台计算机之间,并可以由各种计算机可读介质运行。组件还可以根据具有一个或多个数据包的信号,例如,来自一个与本地系统、分布式系统中另一组件交互的,和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。
最后,还需要说明的是,在本文中术语“包括”、“包含”,不仅包括那些已经给出要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本发明的实施例中,识别手势的过程中涉及多种算法和公式,下面先对可能用到的算法和公式进行解释和说明,以使本领域的技术人员能更好的理解本发明。
深度卷积神经网络算法是机器学习算法中发展最快的一种方法,它能够根据相应类别的输入信息,完整而又准确的描述图像的底层纹理边缘与高层形状特征。从而为后续的识别工作提供可靠的描述保证。这种方法的优点是,在样本特征表征全面且样本量充足的条件下能够进行很好的特征提取与分类工作,对于不良数据的容忍力较强,可以适应多种不同的数据环境。因此该算法广泛应用于数据挖掘、图像分类、图像检索、图像物体识别等多个图像处理领域。近年来伴随数据量的不断增加,该技术的应用在很大程度上推动了计算机视觉技术的发展。
梯度图像是根据图像中相邻像素的差值得到,它能有效地反映出图像边缘及纹理走势,对于描述手势动作有积极意义。图像梯度,可以例如把图像看成二维离散函数,图像梯度其实就是这个二维离散函数的求导:图像梯度:G(x,y)=dxi+dyj;dx(i,j)=I(i+1,j)-I(i,j);dy(i,j)=I(i,j+1)-I(i,j);
其中,I是图像像素的值(如:RGB值),(i,j)为像素的坐标。
图像梯度一般也可以用中值差分:
dx(i,j)=[I(i+1,j)-I(i-1,j)]/2;
dy(i,j)=[I(i,j+1)-I(i,j-1)]/2;
图像边缘一般都是通过对图像进行梯度运算来实现的。
上面说的是简单的梯度定义,其实还有更多更复杂的梯度公式。
贝叶斯判别公式又称贝叶斯判别分析方法,真正的贝叶斯公式:P(Bi|A)=P(A|Bi)P(Bi)/[P(A1B1)P(B1)+P(A|B2)P(B2)+…+P(A|Bn)P(Bn)]分母部分表示A事件发生的概率(全概率),它等于A事件在各种Bi事件发生的前提下发生的概率之和;分子部分是A事件在Bi事件发生的前提下发生的概率。到了贝叶判别里面,如有两个总体G1和G2,那么x的全概率为G1总体出现的概率(q1)乘以x在G1中的概率+G2总体出现的概率(q2)乘以x在G2中的概率;x在G1中出现的概率可以表示为G1的分布函数在x处的值,如G1为连续的,则可用G1的概率密度函数f1(x)在x处的值替代。
证据理论是由Dempster于1967年首先提出,由他的学生shafer于1976年进一步发展起来的一种不精确推理理论,也称为Dempster/Shafer证据理论(D-S证据理论),属于人工智能范畴,最早应用于专家系统中,具有处理不确定信息的能力。作为一种不确定推理方法,证据理论的主要特点是:满足比贝叶斯概率论更弱的条件;具有直接表达“不确定”和“不知道”的能力。
参考图1,其示出了本发明手势识别方法的一个实施例流程图。
如图1所示,在步骤101中,对输入图像进行多方向梯度提取以形成多个不同的梯度图像。
在本实施例中,手势识别装置首先对输入的图像进行多个方向的梯度提取,以形成多个不同梯度的图像。例如,可以包括水平方向(X方向)、垂直方向(Y方向)、45度方向(图像区域内与水平方向或者垂直方向呈现45度倾斜角的方向)以及其他角度的方向。通过提取多个不同方向的梯度图像,可以对图像有更加全面的描述,有效地提高手势识别的精确度。
继而,在步骤102中,基于卷积神经网络金字塔对多个不同的梯度图像进行判别以得出初始结果集。
在本实施例中,手势识别装置基于卷积神经网络金字塔对多个不同的梯度图像进行判别,然后即可根据针对不同梯度图像的多个判别结果得出初始结果集。其中,卷积神经网络金字塔包括基于对多个不同梯度的手势图像进行深度学习得到。例如,其中的一层卷积神经网络金字塔可以是对某一个梯度方向,例如水平方向(X方向)的各种手势图像进行深度学习得到的。其中各种手势图像可以包括握拳,平展,五指,“6”的手势,“8”的手势,“2”的手势,“10”的手势等,还可以包括对各种手势的各种场景、各种拍摄角度、各种光照强度等的深度学习得到的。可选的,也可以采用一种级联的卷积神经网络代替上述的神经网络金字塔,以提高处理速度,增强实时性。
之后,在步骤103中,对判别得出的初始结果集进行融合以得到手势的最终判别结果。
在本实施例中,手势识别装置对之前神经网络判别出的结果进行融合,例如使用贝叶斯判别分析方法进行融合,也可以使用其他方法例如证据理论进行融合,以得到手势的最终判别结果。
在本实施例中,通过对图像进行多个方向的梯度图像提取,之后再经由卷积神经网络金字塔进行判别得出初始结果集,最后对结果进行融合以得到最终的手势判别结果,可以实现更加精准的手势识别。
进一步参考图2,其示出了本发明手势识别方法的又一个实施例流程图。
其中,卷积神经网络金字塔还可以包括基于对多种不同手势图像进行深度学习得到,例如基于对9种不同的手势图像的深度学习而得到,该9种不同的手势图像也包括各种不同的角度、光照、肤色、场景等。其中,图1中的步骤102基于卷积神经网络金字塔对多个不同的梯度图像进行判别以得出初始结果集还可以进一步包括:基于卷积神经网络金字塔分别将梯度图像与多种不同手势样本进行相似度判别以得出初始结果集。
图2所示的流程图可以是对以上步骤的进一步细化,是对应于以上描述的步骤(基于卷积神经网络金字塔分别将梯度图像与多种不同手势样本进行相似度判别以得出初始结果集)的一个可选的实施例。
如图2所示,在步骤201中,对每一个梯度图像采用相应的梯度的卷积神经网络与多种不同手势样本进行相似度判别。
在本实施例中,手势识别装置可以对每一个梯度图像采用在该梯度下训练的神经网络进行判别,其中,判别可以是与多种不同手势的相似度判别。另外,每一梯度的卷积神经网络可以包括在相应梯度下对多种不同手势图像进行深度学习得到。相似度判别的一个具体示例可以是将待识别手势分别与多种手势模板进行相似度判别,并给出对应的相似度,例如总共有三个手势,在第一梯度如X方向下,与第一手势的相似度为0.8,与第二手势的相似度为0.1,与第三手势的相似度为0.1;在第二梯度如Y方向下,与第一手势的相似度为0.7,与第二手势的相似度为0.2,与第三手势的相似度为0.1。
之后,在步骤202中,基于多种不同梯度的卷积神经网络金字塔对多个不同梯度图像判别的多个初始结果形成初始结果集。
在本实施例中,手势识别装置根据之前判别形成的对应于多个不同梯度图像和多种手势的初始结果形成初始结果集。例如步骤201中的具体示例中的初始结果集可以表示为:
在本实施例中,神经网络金字塔通过对不同的手势进行分别训练和深度学习,可以使判别的结果更加准确。
进一步参考图3,其示出了本发明手势识别方法的再一个实施例流程图。
其中,图3所示的流程图可以是图1中的步骤103的一个可选实施例。
如图3所示,在步骤301中,判断初始结果集中存在某种手势的一个或多个初始结果大于阈值。在步骤302中,若存在,则确定上述某种手势为最终判别结果;在步骤303中,若不存在时,则结合证据理论对判别得出的初始结果集采用多个结果一致的投票进行融合以得到手势的最终判别结果。例如根据步骤202中表格所示,可以确定第一手势为最终判别结果。其中,阈值可以是人为设定的一个值,例如可以设定为大于0.3,或者也可以设定为大于0.7,以进一步减小误判的概率。具体的阈值设定本发明没有限制。
在一些可选的实施例中,在对输入图像进行多方向梯度提取形成多个不同的梯度图像之前还包括:对原始图像进行滤波和锐化形成输入图像,其中,原始图像包括手轮廓图像。
请参考图4,其示出了本发明手势识别方案的应用实例流程图。
如图4所示,在步骤401中,输入图像及图像预处理。
在本实施例中,从视频或硬件设备采集的图像往往存在不清晰的情况,因此需要进行滤波与图像锐化,保证输入图像的边缘清晰性,为搭建梯度图提供良好的输入。
之后,在步骤402中,梯度图构建。
在本实施例中,为提高识别准确率,将输入图像按照X、Y、四十五度方向分别提取梯度,并组合成相应的梯度图像,充分表征手势在不同梯度场景下的特性。
接着,在步骤403中,神经网络金字塔构建;
在本实施例中,可以分别用不同梯度的图像对神经网络进行训练,以使神经网络对不同梯度的图像有更加准确地判别率。当然,在实际应用中,为保证实时性也可以将三种梯度图公用一种深度级联神经网络,例如我们可以采用五层卷基层、四层池化层和降采样层,并添加归一化操作,使神经网络具有更高的精确度。
然后,在步骤404中,判别产生结果集。
在本实施例中,利用之前构建的神经网络金字塔对不同梯度的图像分别进行检测,形成初始结果集。
之后,在步骤405中,证据理论结果融合。
在本实施例中,将每一梯度的识别结果及相应的相似度,用证据理论进行联合判别,如果有两个一致的结果或者一个结果的相似度特别高将采用对应的手势判别结果,否则采取丢弃操作。得到相应的结果后,进行相似度计算,如果是某一个的结果相似度很高直接将对应的相似度作为最终相似度输出,如果采取的是多个结果一致的投票,则采用平均相似度的方法作为最终的相似度。
最后,步骤406,根据以上计算与融合,得出最终的手势识别结果。
在本实施例中,通过对原始图像进行预处理,之后进行梯度提取,构建神经网络进行判别,结合证据理论进行结果融合,由于加入了多方向的梯度图像和神经网络,以及联合证据理论,可以提高手势识别的准确度,实现更将精确的手势识别。
进一步参考图5,其示出了本发明手势识别方案的实施例应用场景示意图。
如图5,示例性的示出了分别在图像中建立X方向、Y方向和45度方向的梯度图像的应用场景图。具体的,一种经由神经网络判定出来的可能的初始结果集可以如下:
由以上数据可知,拇指对应的三个方向的概率都比其他概率大,因此图像中示出的是拇指。也可以通过证据理论结合判定出该结果,具体公式如下:
M { W } = Σ x ∩ y = { W } M C I A ( x ) × M M I δ ( y ) 1 - Σ x ∩ y = Φ M C I A ( x ) × M M I δ ( y ) = Σ x ∩ y = { W } M C I A ( x ) × M M I δ ( y ) Σ x ∩ y ≠ Φ M C I A ( x ) × M M I δ ( y ) .
本实施例通过对原始图像进行预处理,之后进行梯度提取,构建神经网络进行判别,结合证据理论进行结果融合,由于加入了多方向的梯度图像和神经网络,以及联合证据理论,可以提高手势识别的准确度,实现更加精确的手势识别。
请参考图6,其示出了本发明手势识别系统的实施例结构示意图。
如图6所示,手势识别系统600包括多梯度提取模块601、判别模块602和结果融合模块603。其中,多梯度提取模块601,配置用于对输入图像进行多方向梯度提取以形成多个不同的梯度图像;判别模块602,配置用于基于卷积神经网络金字塔对多个不同的梯度图像进行判别以得出初始结果集,其中,卷积神经网络金字塔包括基于对多个不同梯度的手势图像进行深度学习得到;以及结果融合模块603,配置用于对判别得出的初始结果集进行融合以得到手势的最终判别结果。
在一些可选的实施例中,卷积神经网络金字塔还包括基于对多种不同手势图像进行深度学习得到,判别模块602还包括配置用于:对每一个梯度图像采用相应的梯度的卷积神经网络与多种不同手势样本进行相似度判别,其中,每一梯度的卷积神经网络包括在相应梯度下对多种不同手势图像进行深度学习得到;以及基于多种不同梯度的卷积神经网络金字塔对多个不同梯度图像判别的多个初始结果形成初始结果集。
在另一些可选的实施例中,结果融合模块603包括配置用于:若初始结果集中存在某种手势的一个或多个初始结果大于阈值时,确定某种手势为最终判别结果;以及若不存在时,则结合证据理论对判别得出的初始结果集采用多个结果一致的投票进行融合以得到手势的最终判别结果。
在另一些可选的实施例中,手势识别系统600还包括预处理模块,配置用于对原始图像进行滤波和锐化形成输入图像,其中,原始图像包括手轮廓图像。
在另一些可选的实施例中,多方向梯度提取包括X方向、Y方向和四十五度方向梯度提取。
在本实施例中,手势识别系统通过多梯度提取模块提取多方向梯度构建多个梯度图像,并利用判别模块基于神经网络判别得出初始结果集,之后对初始结果集进行结果融合得到最终判别结果,可以实现更加精准的手势识别。
应当理解,图6中记载的诸模块与参考图1中描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征以及相应的技术效果同样适用于图6中的诸模块,在此不再赘述。
以上所述的系统或装置可以是一个服务器或者服务器集群,相应的各个单元也可以为一个服务器中的相关处理单元或者为服务器集群中的一个或多个服务器。当相关的单元为服务器集群中的一个或多个服务器时,相应的单元之间的交互则表现为服务器之间的交互,本发明在此方面没有限制。
本申请实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的手势识别方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,所述计算机可执行指令设置为:
对输入图像进行多方向梯度提取以形成多个不同的梯度图像;
基于卷积神经网络金字塔对所述多个不同的梯度图像进行判别以得出初始结果集,其中,所述卷积神经网络金字塔包括基于对多个不同梯度的手势图像进行深度学习得到;
对判别得出的所述初始结果集进行融合以得到手势的最终判别结果。
作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的手势识别方法对应的程序指令/模块(例如,附图6所示的图像金字塔形成模块601、检测模块602以及结果融合模块603)。所述一个或者多个模块存储在所述非易失性计算机可读存储介质中,当被处理器执行时,执行上述任意方法实施例中的手势识别方法。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据手势识别装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至存储器的手势识别装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
图7是本申请一实施例提供的电子设备的结构示意图,如图7所示,该设备包括:
一个或多个处理器710以及存储器720,图7中以一个处理器710为例。
存储器的手势识别方法的设备还可以包括:输入装置730和输出装置740。
处理器710、存储器720、输入装置730和输出装置740可以通过总线或者其他方式连接,图7中以通过总线连接为例。
存储器720为上述的非易失性计算机可读存储介质。处理器710通过运行存储在存储器720中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例手势识别方法。
输入装置730可接收输入的数字或字符信息,以及产生与存储器的手势识别装置的用户设置以及功能控制有关的键信号输入。输出装置740可包括显示屏等显示设备。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的方法。
作为一种实施方式,上述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
对输入图像进行多方向梯度提取以形成多个不同的梯度图像;
基于卷积神经网络金字塔对所述多个不同的梯度图像进行判别以得出初始结果集,其中,所述卷积神经网络金字塔包括基于对多个不同梯度的手势图像进行深度学习得到;
对判别得出的所述初始结果集进行融合以得到手势的最终判别结果。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种手势识别方法,包括:
对输入图像进行多方向梯度提取以形成多个不同的梯度图像;
基于卷积神经网络金字塔对所述多个不同的梯度图像进行判别以得出初始结果集,其中,所述卷积神经网络金字塔包括基于对多个不同梯度的手势图像进行深度学习得到;
对判别得出的所述初始结果集进行融合以得到手势的最终判别结果。
2.根据权利要求1所述的方法,所述基于卷积神经网络金字塔对所述多个不同的梯度图像进行判别以得出初始结果集还包括:
对每一个梯度图像采用相应的梯度的卷积神经网络与多种不同手势样本进行相似度判别,其中,每一梯度的卷积神经网络包括在相应梯度下对多种不同手势图像进行深度学习得到;
基于多种不同梯度的卷积神经网络金字塔对所述多个不同的梯度图像判别的多个初始结果形成初始结果集。
3.根据权利要求1或2所述的方法,所述对判别得出的所述初始结果集进行融合以得到手势的最终判别结果包括:
若所述初始结果集中存在某种手势的一个或多个初始结果大于阈值时,确定所述某种手势为最终判别结果;
若不存在时,则结合证据理论对判别得出的所述初始结果集采用多个结果一致的投票进行融合以得到手势的最终判别结果。
4.根据权利要求1或2所述的方法,在所述对输入图像进行多方向梯度提取形成多个不同的梯度图像之前还包括:
对原始图像进行滤波和锐化形成输入图像,其中,所述原始图像包括手轮廓图像。
5.根据权利要求1或2所述的方法,所述多方向梯度提取包括X方向、Y方向和四十五度方向梯度提取。
6.一种手势识别系统,包括:
多梯度提取模块,配置用于对输入图像进行多方向梯度提取以形成多个不同的梯度图像;
判别模块,配置用于基于卷积神经网络金字塔对所述多个不同的梯度图像进行判别以得出初始结果集,其中,所述卷积神经网络金字塔包括基于对多个不同梯度的手势图像进行深度学习得到;
结果融合模块,配置用于对判别得出的所述初始结果集进行融合以得到手势的最终判别结果。
7.根据权利要求6所述的系统,所述判别模块还包括:
对每一个梯度图像采用相应的梯度的卷积神经网络与多种不同手势样本进行相似度判别,其中,每一梯度的卷积神经网络包括在相应梯度下对多种不同手势图像进行深度学习得到;
基于多种不同梯度的卷积神经网络金字塔对所述多种不同的梯度图像判别的多个初始结果形成初始结果集。
8.根据权利要求6或7所述的系统,所述结果融合模块包括配置用于:
若所述初始结果集中存在某种手势的一个或多个初始结果大于阈值时,确定所述某种手势为最终判别结果;
若不存在时,则结合证据理论对判别得出的所述初始结果集采用多个结果一致的投票进行融合以得到手势的最终判别结果。
9.根据权利要求6或7所述的系统,所述系统还包括预处理模块,配置用于对原始图像进行滤波和锐化形成输入图像,其中,所述原始图像包括手轮廓图像。
10.根据权利要求6或7所述的系统,所述多方向梯度提取包括X方向、Y方向和四十五度方向梯度提取。
CN201610621775.XA 2016-08-01 2016-08-01 手势识别方法和系统 Pending CN106155327A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610621775.XA CN106155327A (zh) 2016-08-01 2016-08-01 手势识别方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610621775.XA CN106155327A (zh) 2016-08-01 2016-08-01 手势识别方法和系统

Publications (1)

Publication Number Publication Date
CN106155327A true CN106155327A (zh) 2016-11-23

Family

ID=57327995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610621775.XA Pending CN106155327A (zh) 2016-08-01 2016-08-01 手势识别方法和系统

Country Status (1)

Country Link
CN (1) CN106155327A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220588A (zh) * 2017-04-20 2017-09-29 苏州神罗信息科技有限公司 一种基于级联深度神经网络的实时手势追踪方法
CN107390573A (zh) * 2017-06-28 2017-11-24 长安大学 基于手势控制的智能轮椅系统及控制方法
CN107729948A (zh) * 2017-10-31 2018-02-23 京东方科技集团股份有限公司 图像处理方法及装置、计算机产品和存储介质
CN107945168A (zh) * 2017-11-30 2018-04-20 上海联影医疗科技有限公司 一种医学图像的处理方法及医学图像处理系统
CN108038452A (zh) * 2017-12-15 2018-05-15 厦门瑞为信息技术有限公司 一种基于局部图像增强的家电手势快速检测识别方法
CN108536278A (zh) * 2017-03-03 2018-09-14 财团法人资讯工业策进会 辨识系统及辨识方法
CN108875579A (zh) * 2018-05-15 2018-11-23 厦门大学 一种基于形态学的近景手势识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102750006A (zh) * 2012-06-13 2012-10-24 胡锦云 信息采集方法
US20130285904A1 (en) * 2012-02-22 2013-10-31 Pointgrab Ltd. Computer vision based control of an icon on a display
CN103514444A (zh) * 2013-10-15 2014-01-15 北京联合大学 一种基于轮廓和色彩相似对称分布特征的行人检测方法
CN105488534A (zh) * 2015-12-04 2016-04-13 中国科学院深圳先进技术研究院 交通场景深度解析方法、装置及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130285904A1 (en) * 2012-02-22 2013-10-31 Pointgrab Ltd. Computer vision based control of an icon on a display
CN102750006A (zh) * 2012-06-13 2012-10-24 胡锦云 信息采集方法
CN103514444A (zh) * 2013-10-15 2014-01-15 北京联合大学 一种基于轮廓和色彩相似对称分布特征的行人检测方法
CN105488534A (zh) * 2015-12-04 2016-04-13 中国科学院深圳先进技术研究院 交通场景深度解析方法、装置及系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536278A (zh) * 2017-03-03 2018-09-14 财团法人资讯工业策进会 辨识系统及辨识方法
CN108536278B (zh) * 2017-03-03 2021-03-19 财团法人资讯工业策进会 辨识系统及辨识方法
CN107220588A (zh) * 2017-04-20 2017-09-29 苏州神罗信息科技有限公司 一种基于级联深度神经网络的实时手势追踪方法
CN107390573A (zh) * 2017-06-28 2017-11-24 长安大学 基于手势控制的智能轮椅系统及控制方法
CN107390573B (zh) * 2017-06-28 2020-05-29 长安大学 基于手势控制的智能轮椅系统及控制方法
CN107729948A (zh) * 2017-10-31 2018-02-23 京东方科技集团股份有限公司 图像处理方法及装置、计算机产品和存储介质
US11138738B2 (en) 2017-10-31 2021-10-05 Boe Technology Group Co., Ltd. Image processing method and image processing device
CN107945168A (zh) * 2017-11-30 2018-04-20 上海联影医疗科技有限公司 一种医学图像的处理方法及医学图像处理系统
CN107945168B (zh) * 2017-11-30 2021-12-10 上海联影医疗科技股份有限公司 一种医学图像的处理方法及医学图像处理系统
CN108038452A (zh) * 2017-12-15 2018-05-15 厦门瑞为信息技术有限公司 一种基于局部图像增强的家电手势快速检测识别方法
CN108875579A (zh) * 2018-05-15 2018-11-23 厦门大学 一种基于形态学的近景手势识别方法
CN108875579B (zh) * 2018-05-15 2022-08-05 厦门大学 一种基于形态学的近景手势识别方法

Similar Documents

Publication Publication Date Title
CN106155327A (zh) 手势识别方法和系统
US11830230B2 (en) Living body detection method based on facial recognition, and electronic device and storage medium
US10810870B2 (en) Method of processing passage record and device
Hodges et al. Single image dehazing using deep neural networks
CN108399386A (zh) 饼图中的信息提取方法及装置
CN112639828A (zh) 数据处理的方法、训练神经网络模型的方法及设备
US20120027263A1 (en) Hand gesture detection
CN106250838A (zh) 车辆识别方法及系统
CN110082821B (zh) 一种无标签框微地震信号检测方法及装置
CN104463881B (zh) 一种基于光谱反射率邻域差异图和邻域概率融合的多光谱遥感影像变化检测方法
CN110222780A (zh) 物体检测方法、装置、设备和存储介质
CN112766206B (zh) 一种高位视频车辆检测方法、装置、电子设备和存储介质
CN111738263A (zh) 目标检测方法、装置、电子设备及存储介质
CN109102015A (zh) 一种基于复数神经网络的sar图像变化检测方法
CN114255403A (zh) 基于深度学习的光学遥感图像数据处理方法及系统
US20230060211A1 (en) System and Method for Tracking Moving Objects by Video Data
CN107644105A (zh) 一种搜题方法及装置
CN113850838A (zh) 船舶航行意图获取方法、装置、计算机设备及存储介质
CN111191531A (zh) 一种快速行人检测方法及系统
CN113239914A (zh) 课堂学生表情识别及课堂状态评估方法、装置
CN111104941B (zh) 图像方向纠正方法、装置及电子设备
CN112232311A (zh) 人脸跟踪方法、装置及电子设备
JP7141518B2 (ja) 指静脈照合方法、装置、コンピュータ機器、及び記憶媒体
CN110619280A (zh) 一种基于深度联合判别学习的车辆重识别方法及装置
CN112800932B (zh) 海上背景下显著船舶目标的检测方法及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20161123

WD01 Invention patent application deemed withdrawn after publication