CN104331151A - 基于光流法的手势运动方向识别方法 - Google Patents

基于光流法的手势运动方向识别方法 Download PDF

Info

Publication number
CN104331151A
CN104331151A CN201410535947.2A CN201410535947A CN104331151A CN 104331151 A CN104331151 A CN 104331151A CN 201410535947 A CN201410535947 A CN 201410535947A CN 104331151 A CN104331151 A CN 104331151A
Authority
CN
China
Prior art keywords
pixel
motion
image
optical flow
flow method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410535947.2A
Other languages
English (en)
Other versions
CN104331151B (zh
Inventor
杨盈昀
茹家馨
姜秀华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communication University of China
Original Assignee
Communication University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communication University of China filed Critical Communication University of China
Priority to CN201410535947.2A priority Critical patent/CN104331151B/zh
Publication of CN104331151A publication Critical patent/CN104331151A/zh
Application granted granted Critical
Publication of CN104331151B publication Critical patent/CN104331151B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language

Abstract

基于光流法的手势运动方向识别方法,通过VGA分辨率的普通摄像头获取计算机前的图像序列并进行预处理;肤色样本在CbCr平面上较为集中地分布在近似椭圆的区域中,通过像素点在CbCr平面上是否落在此椭圆域来确定是否肤色;对肤色检测后的二值图像进行形态学重建,采用形态学中的闭运算;对各个白色连通区域进行标记并求面积,然后按照面积从大到小排列,保留三个最大的连通区域;降低图像的分辨率,并使用金字塔LK光流法获取肤色区域的光流运动矢量;对光流运动矢量做方向判断;每隔两帧判断一次方向,两次一致才给出结果;在熟悉并掌握本发明的手势运动操作规律后,在摄像头前进行手势的上下左右四个方向的运动,本发明可以完成实时交互并且手势运动方向识别正确率可在95%以上。

Description

基于光流法的手势运动方向识别方法
技术领域
本发明涉及一种基于光流法的手势运动方向识别方法,属于计算机视觉领域。
背景技术
鼠标、键盘、手写板等简单的机械设备是目前人们最常用的人机交互方式,但是这些人机交互方式都是以计算机为中心,不够人性化并具有很大的局限性,不足以满足人们的需要。手是人最灵活的部位之一,手势在日常的交流与操作中使用非常广泛,方便快捷。手势以人为中心,符合人们的生活习惯,所以手势作为一种新型的人机交互方式非常具有研究价值。
现有的基于计算机视觉的手势识别研究一般是识别手势的不同姿态来赋予不同的意义,比如采用隐马尔可夫模型、形状纹理特征等方法识别手势姿态,或利用特殊的深度摄像头如微软Kinect体感设备等获取深度图像来跟踪识别手势等。但前者的缺点是计算机需要处理的数据复杂,容易存在响应时间长、识别率低等问题,很难在实时交互的前提下达到满意的识别率,而后者采用特殊摄像头,存在价格昂贵、难以普及的问题。
手势的不同姿态可以表现众多不同的意思,而手势的不同的运动方向也可以表现少量不同的意思,但它如果用以控制不需要太多指令的计算机程序是足够胜任的,如播放器的播放、快进、快退等指令。研究手势的运动方向识别可以减少计算机需要处理的数据,不像手势姿态研究那样过于复杂,但目前很少有对手势运动方向的识别展开研究。
发明内容
本发明的主要目的是在使用普通摄像头的前提下提供一种手势运动方向的识别方法,以动态手势运动方向作为计算机识别的目标,使计算机可以针对不同的手势运动方向做出不同的反应,如利用本发明的成果来控制视频播放器的播放暂停、快进快退等操作,提高人机交互的灵活性。
为实现上述目的,本发明采用的技术方案为基于光流法的手势运动方向识别方法,该方法的流程图如图1所示,实施流程如下:
步骤1、通过VGA分辨率的普通摄像头获取计算机前的图像序列并进行预处理,包含GrayWorld彩色均衡处理与高斯平滑操作。GrayWorld彩色均衡处理的作用是:消除彩色偏移,图像更加接近于实际颜色,且高光阴影部分会显著减少,使步骤2的肤色检测能够适应不同的光照与光源的变化。先计算图像的R、G、B三分量各自的平均值avgR、avgG、avgB,获得图像的平均灰度值avgGray=(avgR+avgG+avgB)/3,然后对于图像中的每个像素,调整其R、G、B分量成为R=R·avgGray/avgR,G=G·avgGray/avgG,B=B·avgGray/avgB,最后将各像素的R、G、B值调整到可显示范围,若分量值大于255,调整为255。在GrayWorld处理后,对图像进行高斯平滑操作来消除摄像头采集过程中产生的随机噪声。
步骤2、YCbCr域椭圆肤色检测。肤色样本在CbCr平面上较为集中地分布在近似椭圆的区域中,所以可以通过像素点在CbCr平面上是否落在此椭圆域来确定是否肤色。肤色椭圆区域由式(1)表示,其中cx=109.83,cy=152.02,=2.53,ecx=1.60,ecy=2.41,a=25.39,b=14.03,x与y的取值由式(2)所示。
( x - ec x ) 2 a 2 + ( y - ec y ) 2 b 2 = 1 - - - ( 1 )
x y = cos θ sin θ - sin cos θ C b - c x C r - c y
在计算过程中,由图像像素点的Cb、Cr值算出x与y值,当x与y值落在式(1)所表示的椭圆区域,则令图像像素值为1,否则为0,这样可以得到肤色像素点为白色,非肤色像素点为黑色的二值图。
步骤3、对肤色检测后的二值图像进行形态学重建,采用形态学中的闭运算。在数学形态学中,腐蚀是将边界的像素点缩小至目标物体内部的一个像素点子集,消除图像中目标物体的边界。膨胀是将图像中的目标物体的像素点扩大至周围的一个像素点子集,使周围的像素点的值与该像素点保持一致。单独对图像膨胀或者腐蚀都或多或少对图像造成损害,将膨胀和腐蚀结合在一起可以降低对图像造成的损害,闭运算是对图像进行先膨胀后腐蚀,可以填补图像中的空洞,连接细小的挨在一起的物体。对步骤2得到的二值图像进行闭运算可以得到人脸与人手是两个白色清晰连通区域的图像。
步骤4、对各个白色连通区域进行标记并求面积,即计算各个白色连通区域含有多少个像素点,然后按照面积从大到小排列。如果画面中有较大的类肤色物体,例如与黄种人肤色几乎一致的棕黄色家具,也会形成一个较大的连通区域且其像素数量未知,所以需要保留像素数量排行前三位的连通区域,代表着人脸、人手与面积未知的干扰区域,其余所有连通区域全部作为无关信息进行剔除。
步骤5、降低图像的分辨率,并使用金字塔LK光流法获取肤色区域的光流运动矢量。光流法是运动图像分析的一种重要方法,它利用像素在图像序列中的时间域上的变化与相邻帧之间的相关性来寻求上一帧和当前帧之间的对应关系,计算出相邻帧之间物体的光流运动信息。Lucas-Kanade光流法的公式如式(3)所示:
A = [ ▿ I ( x 1 ) , . . . , ▿ I ( x n ) ] T W = diag [ W ( x 1 ) , . . . , W ( x n ) ] b = - ( I t ( x 1 ) , . . . , I t ( x n ) ) T v = [ A T W 2 A ] - 1 A T W 2 b - - - ( 3 )
其中,W(x)表示窗口权重函数,它使邻域中心部分对光流约束产生的影响比外围部分更大,v=(u,v)T是要求解的光流运动信息,I(x,y,t)是图像点(x,y)在时刻t的照度,u和v是该点光流的水平和垂直分量,代表着运动信息, u = dx dt , v = dy dt , I x = ∂ I ∂ x , I y = ∂ I ∂ y , I t = ∂ I ∂ t , ▿ I ( x ) = ( I x , I y ) T .
金字塔Lucas-Kanade光流法采用常用的LK光流法算法加入如图2所示的高斯金字塔迭代方法,即构造图像序列的一个金字塔,高层是低层图像的下采样形式,图像分解到一定层数时,相邻帧之间的运动量就会变得足够小,满足LK光流法的局部约束条件。在金字塔的最高层计算光流,然后将得到的运动估计结果作为下一层金字塔的起始点,重复迭代这个过程一直到金字塔的底层,即具有原始分辨率的图像,这样可以实现对更快更长的运动跟踪。
本方法使用层数为4层的金字塔LK光流法,将金字塔底层图像的分辨率从VGA级别降低至QVGA级别,可以非常有效的缩短光流法耗时,因为步骤4得到的肤色分割图具有非常好的效果,所以图像分辨率降低一倍不会使光流法运动分析的效果变差。对相邻两帧肤色分割图的连通域像素作为特征点使用金字塔LK光流法,可以得到运动物体的光流运动矢量。
步骤6、对光流运动矢量做方向判断。光流运动矢量可以分为水平运动分量u和垂直运动分量v。对相邻两帧图像做光流法操作获得的各像素的u与v值做这样的判定:式(4)~(7)分别表示像素点向右、左、上、下运动。当运动方向一致的像素数量超过一定的阈值,则可以判定手部的运动方向。
u>10&-10<v<10  (3)
u<-10&-10<v<10  (4)
v>10&-10<u<1  (5)
v<-10&-10<u<10  (6)
将运动方向一致的像素数的阈值设定为图像像素总数的二十分之一,在QVGA分辨率下这个阈值为3840,例如运动方向判定为向左的像素数超过了3840,而其他方向的像素数远少于3840,则判定手部运动方向为左移。
步骤7、每隔两帧判断一次方向,两次一致才给出结果。如果在摄像头开启后每帧都进行光流法判定,那么不仅不会满足实时,而且由于手部完成一次具有固定方向的运动,一般运动距离远且耗时不短,每帧都给出运动判断结果是不可靠的。人手在摄像头前做出一个方向的运动,一般会经历5帧以上,当每隔两帧进行一次光流法判定,比如第1、2帧给出结果A,第3、4帧给出结果B,当A与B代表的方向一致时,才给出最终结果,当A与B不一样时,则表示手部没有进行一次完整的固定方向的运动。经过多次实验验证,这样的设定可以满足实时的手部方向判定,当人手进行杂乱无章的随意运动时,不会给出识别结果。当人在摄像头前进行手势识别时,脸部一般不会做出持续一个方向的长时间运动,所以脸部的随机运动或相邻两帧间脸部肤色分割的差异不会降低手势运动方向判定的准确率。
与现有技术相比,本发明具有如下有益效果。
经过实验论证,在熟悉并掌握本发明的手势运动操作规律后,在摄像头前进行手势的上下左右四个方向的运动,本发明可以完成实时交互并且手势运动方向识别正确率可在95%以上。
附图说明
图1为本发明具体流程图。
图2为高斯金字塔示意图。
图3为椭圆肤色检测结果示意图。
图4为数学形态学闭运算结果示意图。
具体实施方式
本发明的手势运动方向判断基本流程如图1所示,具体包括以下步骤:
1)通过VGA分辨率的普通摄像头获取计算机前的图像序列并进行预处理,先对图像进行GrayWorld彩色均衡处理,再进行高斯平滑操作来消除摄像头采集过程中产生的随机噪声。
2)对图像进行YCbCr域椭圆肤色检测。位于CbCr域的像素点的像素值设置为1,否则为0,这样得到由图3所示的二值图像,白色为具有肤色特征的像素点,黑色为非肤色像素。
3)对肤色检测后的二值图像进行形态学重建,采用形态学中的闭运算。图4所示为对肤色检测后的二值图进行闭运算后的效果,其中人脸与人手会形成两个清晰的连通区域。
4)对各个白色连通区域进行标记并求面积,即计算各个白色连通区域含有多少个像素点,然后按照面积从大到小排列,如果画面中有较大的类肤色物体,例如与黄种人肤色几乎一致的棕黄色家具,也会形成一个较大的连通区域且其像素数量未知,所以需要保留像素数量排行前三位的连通区域,代表着人脸、人手与面积未知的干扰区域,其余所有连通区域全部作为无关信息进行剔除。
5)降低图像的分辨率,并使用金字塔LK光流法获取肤色区域的光流运动矢量。本发明使用层数为4层的金字塔LK光流法,将金字塔底层图像的分辨率从VGA级别降低至QVGA级别,可以非常有效的缩短光流法耗时,因为步骤4得到的肤色分割图具有非常好的效果,所以图像分辨率降低一倍不会使光流法运动分析的效果变差。对相邻两帧肤色分割图的连通域像素作为特征点使用金字塔LK光流法,可以得到运动物体的光流运动矢量。
6)对光流运动矢量做方向判断。光流运动矢量可以分为水平位移分量u和垂直位移分量v。对相邻两帧图像做光流法操作获得的各像素的u与v值做这样的判定:式(4)~(7)分别表示像素点向右、左、上、下运动。当运动方向一致的像素数量超过一定的阈值,则可以判定手部的运动方向。
u>10&-10<v<10  (3)
u<-10&-10<v<10  (4)
v>10&-10<u<1  (5)
v<-10&-10<u<10  (6)
将运动方向一致的像素数的阈值设定为图像像素总数的二十分之一,在QVGA分辨率下这个阈值为3840,例如运动方向判定为向左的像素数超过了3840,而其他方向的像素数远少于3840,则判定手部运动方向为左移。
7)每隔两帧判断一次方向,两次一致才给出结果。如果在摄像头开启后每帧都进行光流法判定,那么不仅不会满足实时,而且由于手部完成一次具有固定方向的运动,一般运动距离远且耗时不短,每帧都给出运动判断结果是不可靠的。人手在摄像头前做出一个方向的运动,一般会经历5帧以上,当每隔两帧进行一次光流法判定,比如第1、2帧给出结果A,第3、4帧给出结果B,当A与B代表的方向一致时,才给出最终结果,当A与B不一样时,则表示手部没有进行一次完整的固定方向的运动。经过多次实验验证,这样的设定可以满足实时的手部方向判定,当人手进行杂乱无章的随意运动时,不会给出识别结果。当人在摄像头前进行手势识别时,脸部一般不会做出持续一个方向的长时间运动,所以脸部的随机运动或相邻两帧间脸部肤色分割的差异不会降低手势运动方向判定的准确率。经过实验论证,在熟悉并掌握本发明的手势运动操作规律后,在摄像头前进行手势的上下左右四个方向的运动,本发明可以完成实时交互并且手势运动方向识别正确率可在95%以上。
8)利用MFC制作Windows Media Player的视频播放器,将步骤7方向判断的四种结果分别赋予不同的命令,可以实现这样的效果:当手势向上运动,视频播放器执行暂停命令,当手势向下运动,视频播放器执行播放命令,当手势向左运动,视频播放器执行快退命令,当手势向右运动,视频播放器执行快进命令。

Claims (4)

1.基于光流法的手势运动方向识别方法,其特征在于该方法的实施流程如下:
步骤1、通过VGA分辨率的普通摄像头获取计算机前的图像序列并进行预处理,包含GrayWorld彩色均衡处理与高斯平滑操作;先计算图像的R、G、B三分量各自的平均值avgR、avgG、avgB,获得图像的平均灰度值avgGray=(avgR+avgG+avgB)/3,然后对于图像中的每个像素,调整其R、G、B分量成为R=R·avgGray/avgR,G=G·avgGray/avgG,B=B·avgGray/avgB,最后将各像素的R、G、B值调整到可显示范围,若分量值大于255,调整为255;在GrayWorld处理后,对图像进行高斯平滑操作来消除摄像头采集过程中产生的随机噪声;
步骤2、YCbCr域椭圆肤色检测;肤色样本在CbCr平面上较为集中地分布在近似椭圆的区域中,所以可以通过像素点在CbCr平面上是否落在此椭圆域来确定是否肤色;肤色椭圆区域由式(1)表示,其中cx=109.83,cy=152.02,=2.53,ecx=1.60,ecy=2.41,a=25.39,b=14.03,x与y的取值由式(2)所示;
( x - ec x ) 2 a 2 + ( y - ec y ) 2 b 2 = 1 - - - ( 1 )
x y = cos &theta; sin &theta; - sin &theta; cos &theta; C b - c x C r - c y - - - ( 2 )
在计算过程中,由图像像素点的Cb、Cr值算出x与y值,当x与y值落在式(1)所表示的椭圆区域,则令图像像素值为1,否则为0,这样可以得到肤色像素点为白色,非肤色像素点为黑色的二值图;
步骤3、对肤色检测后的二值图像进行形态学重建,采用形态学中的闭运算;在数学形态学中,腐蚀是将边界的像素点缩小至目标物体内部的一个像素点子集,消除图像中目标物体的边界;膨胀是将图像中的目标物体的像素点扩大至周围的一个像素点子集,使周围的像素点的值与该像素点保持一致;单独对图像膨胀或者腐蚀都或多或少对图像造成损害,将膨胀和腐蚀结合在一起可以降低对图像造成的损害,闭运算是对图像进行先膨胀后腐蚀,可以填补图像中的空洞,连接细小的挨在一起的物体;对步骤2得到的二值图像进行闭运算可以得到人脸与人手是两个白色清晰连通区域的图像;
步骤4、对各个白色连通区域进行标记并求面积,即计算各个白色连通区域含有多少个像素点,然后按照面积从大到小排列;如果画面中有较大的类肤色物体,例如与黄种人肤色几乎一致的棕黄色家具,也会形成一个较大的连通区域且其像素数量未知,所以需要保留像素数量排行前三位的连通区域,代表着人脸、人手与面积未知的干扰区域,其余所有连通区域全部作为无关信息进行剔除;
步骤5、降低图像的分辨率,并使用金字塔LK光流法获取肤色区域的光流运动矢量;Lucas-Kanade光流法的公式如式(3)所示:
A = [ &dtri; I ( x 1 ) , . . . , &dtri; I ( x n ) ] T W = diag [ W ( x 1 ) , . . . , W ( x n ) ] b = - ( I t ( x 1 ) , . . . , I t ( x n ) ) T v = [ A T W 2 A ] - 1 A T W 2 b - - - ( 3 )
其中,W(x)表示窗口权重函数,它使邻域中心部分对光流约束产生的影响比外围部分更大,v=(u,v)T是要求解的光流运动信息,I(x,y,t)是图像点(x,y)在时刻t的照度,u和v是该点光流的水平和垂直分量,代表着运动信息, u = dx dt , v = dy dt , I x = &PartialD; I &PartialD; x , I y = &PartialD; I &PartialD; y , I t = &PartialD; I &PartialD; t , &dtri; I ( x ) = ( I x , I y ) T ;
金字塔Lucas-Kanade光流法采用常用的LK光流法算法加入高斯金字塔迭代方法,即构造图像序列的一个金字塔,高层是低层图像的下采样形式,图像分解到一定层数时,相邻帧之间的运动量就会变得足够小,满足LK光流法的局部约束条件;在金字塔的最高层计算光流,然后将得到的运动估计结果作为下一层金字塔的起始点,重复迭代这个过程一直到金字塔的底层,即具有原始分辨率的图像,这样可以实现对更快更长的运动跟踪;
步骤6、对光流运动矢量做方向判断;光流运动矢量可以分为水平运动分量u和垂直运动分量v;对相邻两帧图像做光流法操作获得的各像素的u与v值做这样的判定:式(4)~(7)分别表示像素点向右、左、上、下运动;当运动方向一致的像素数量超过一定的阈值,则可以判定手部的运动方向;
u>10 & -10<v<10   (3)
u<-10 & -10<v<10   (4)
v>10 & -10<u<1   (5)
v<-10 & -10<u<10   (6)
将运动方向一致的像素数的阈值设定为图像像素总数的二十分之一,在QVGA分辨率下这个阈值为3840,例如运动方向判定为向左的像素数超过了3840,而其他方向的像素数远少于3840,则判定手部运动方向为左移;
步骤7、每隔两帧判断一次方向,两次一致才给出结果。
2.根据权利要求1所述的基于光流法的手势运动方向识别方法,其特征在于:本方法使用层数为4层的金字塔LK光流法,将金字塔底层图像的分辨率从VGA级别降低至QVGA级别,可以非常有效的缩短光流法耗时,因为步骤4得到的肤色分割图具有非常好的效果,所以图像分辨率降低一倍不会使光流法运动分析的效果变差;对相邻两帧肤色分割图的连通域像素作为特征点使用金字塔LK光流法,可以得到运动物体的光流运动矢量。
3.根据权利要求1所述的基于光流法的手势运动方向识别方法,其特征在于:人手在摄像头前做出一个方向的运动,一般会经历5帧以上,当每隔两帧进行一次光流法判定,比如第1、2帧给出结果A,第3、4帧给出结果B,当A与B代表的方向一致时,才给出最终结果,当A与B不一样时,则表示手部没有进行一次完整的固定方向的运动。
4.根据权利要求1所述的基于光流法的手势运动方向识别方法,其特征在于:本发明的手势运动方向判断基本流程具体包括以下步骤,
1)通过VGA分辨率的普通摄像头获取计算机前的图像序列并进行预处理,先对图像进行GrayWorld彩色均衡处理,再进行高斯平滑操作来消除摄像头采集过程中产生的随机噪声;
2)对图像进行YCbCr域椭圆肤色检测;位于CbCr域的像素点的像素值设置为1,否则为0,这样得到二值图像,白色为具有肤色特征的像素点,黑色为非肤色像素;
3)对肤色检测后的二值图像进行形态学重建,采用形态学中的闭运算;
4)对各个白色连通区域进行标记并求面积,即计算各个白色连通区域含有多少个像素点,然后按照面积从大到小排列,如果画面中有较大的类肤色物体,例如与黄种人肤色几乎一致的棕黄色家具,也会形成一个较大的连通区域且其像素数量未知,所以需要保留像素数量排行前三位的连通区域,代表着人脸、人手与面积未知的干扰区域,其余所有连通区域全部作为无关信息进行剔除;
5)降低图像的分辨率,并使用金字塔LK光流法获取肤色区域的光流运动矢量;本发明使用层数为4层的金字塔LK光流法,将金字塔底层图像的分辨率从VGA级别降低至QVGA级别,可以非常有效的缩短光流法耗时,因为步骤4得到的肤色分割图具有非常好的效果,所以图像分辨率降低一倍不会使光流法运动分析的效果变差;对相邻两帧肤色分割图的连通域像素作为特征点使用金字塔LK光流法,可以得到运动物体的光流运动矢量;
6)对光流运动矢量做方向判断;光流运动矢量可以分为水平位移分量u和垂直位移分量v;对相邻两帧图像做光流法操作获得的各像素的u与v值做这样的判定:式(4)~(7)分别表示像素点向右、左、上、下运动;当运动方向一致的像素数量超过一定的阈值,则可以判定手部的运动方向;
u>10 & -10<v<10   (3)
u<-10 & -10<v<10   (4)
v>10 & -10<u<1   (5)
v<-10 & -10<u<10   (6)
将运动方向一致的像素数的阈值设定为图像像素总数的二十分之一,在QVGA分辨率下这个阈值为3840,例如运动方向判定为向左的像素数超过了3840,而其他方向的像素数远少于3840,则判定手部运动方向为左移;
7)每隔两帧判断一次方向,两次一致才给出结果;如果在摄像头开启后每帧都进行光流法判定,那么不仅不会满足实时,而且由于手部完成一次具有固定方向的运动,一般运动距离远且耗时不短,每帧都给出运动判断结果是不可靠的;人手在摄像头前做出一个方向的运动,一般会经历5帧以上,当每隔两帧进行一次光流法判定,比如第1、2帧给出结果A,第3、4帧给出结果B,当A与B代表的方向一致时,才给出最终结果,当A与B不一样时,则表示手部没有进行一次完整的固定方向的运动;
8)利用MFC制作Windows Media Player的视频播放器,将步骤7方向判断的四种结果分别赋予不同的命令,可以实现这样的效果:当手势向上运动,视频播放器执行暂停命令,当手势向下运动,视频播放器执行播放命令,当手势向左运动,视频播放器执行快退命令,当手势向右运动,视频播放器执行快进命令。
CN201410535947.2A 2014-10-11 2014-10-11 基于光流法的手势运动方向识别方法 Expired - Fee Related CN104331151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410535947.2A CN104331151B (zh) 2014-10-11 2014-10-11 基于光流法的手势运动方向识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410535947.2A CN104331151B (zh) 2014-10-11 2014-10-11 基于光流法的手势运动方向识别方法

Publications (2)

Publication Number Publication Date
CN104331151A true CN104331151A (zh) 2015-02-04
CN104331151B CN104331151B (zh) 2018-02-23

Family

ID=52405894

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410535947.2A Expired - Fee Related CN104331151B (zh) 2014-10-11 2014-10-11 基于光流法的手势运动方向识别方法

Country Status (1)

Country Link
CN (1) CN104331151B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809387A (zh) * 2015-03-12 2015-07-29 山东大学 基于视频图像手势识别的非接触式解锁方法及装置
CN105139439A (zh) * 2015-07-29 2015-12-09 电子科技大学 一种光流场计算方法
CN105184273A (zh) * 2015-09-18 2015-12-23 桂林远望智能通信科技有限公司 一种基于asm的动态图像正面人脸重建系统及方法
CN106204573A (zh) * 2016-07-07 2016-12-07 Tcl集团股份有限公司 一种智能冰箱的食品管理方法及系统
CN106778528A (zh) * 2016-11-24 2017-05-31 四川大学 一种基于高斯金字塔特征的疲劳驾驶检测方法
CN106780311A (zh) * 2016-12-22 2017-05-31 华侨大学 一种结合皮肤粗糙度的快速人脸图像美化方法
CN107194360A (zh) * 2017-05-25 2017-09-22 智慧航安(北京)科技有限公司 逆向通行对象识别方法、装置及系统
CN107589850A (zh) * 2017-09-26 2018-01-16 深圳睛灵科技有限公司 一种手势移动方向的识别方法及系统
CN107845108A (zh) * 2017-09-21 2018-03-27 上海玮舟微电子科技有限公司 一种光流值计算方法、装置及电子设备
CN107958218A (zh) * 2017-11-22 2018-04-24 南京邮电大学 一种实时手势识别的方法
CN108352074A (zh) * 2015-12-04 2018-07-31 德州仪器公司 准参数光学流估计
CN108600640A (zh) * 2018-07-03 2018-09-28 京东方科技集团股份有限公司 图像中手势识别、颜色白平衡调整及曝光调节方法和装置
CN108810317A (zh) * 2017-05-05 2018-11-13 展讯通信(上海)有限公司 真实运动估计方法及装置、计算机可读存储介质、终端
CN109272535A (zh) * 2018-09-07 2019-01-25 广东中粤电力科技有限公司 一种基于图像识别的配电房安全区预警方法
CN109359510A (zh) * 2018-08-27 2019-02-19 广州大学 一种对异常行为的视觉分析处理方法
CN109697387A (zh) * 2017-10-23 2019-04-30 北京京东尚科信息技术有限公司 运动方向预测方法、装置、电子设备及存储介质
CN110287894A (zh) * 2019-06-27 2019-09-27 深圳市优象计算技术有限公司 一种针对超广角视频的手势识别方法及系统
CN111179301A (zh) * 2019-12-23 2020-05-19 北京中广上洋科技股份有限公司 一种基于计算机视频的运动趋势分析方法
CN113093972A (zh) * 2019-12-23 2021-07-09 北京集创北方科技股份有限公司 手势识别方法、系统、存储介质、触屏设备
CN113111738A (zh) * 2021-03-26 2021-07-13 常州工学院 基于视频图像处理的动态手势识别方法和装置
CN113392820A (zh) * 2021-08-17 2021-09-14 南昌虚拟现实研究院股份有限公司 动态手势识别方法、装置、电子设备及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779268A (zh) * 2012-02-06 2012-11-14 西南科技大学 基于方向运动历史图及竞争机制的手挥运动方向判定方法
CN103426172A (zh) * 2013-08-08 2013-12-04 深圳一电科技有限公司 基于视觉的目标跟踪方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779268A (zh) * 2012-02-06 2012-11-14 西南科技大学 基于方向运动历史图及竞争机制的手挥运动方向判定方法
CN103426172A (zh) * 2013-08-08 2013-12-04 深圳一电科技有限公司 基于视觉的目标跟踪方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
储珺等: "基于光流的动态背景运动目标检测算法", 《南昌航空大学学报》 *
卢宗庆: "运动图像分析中的光流计算方法研究", 《中国博士学位论文全文数据库信息科技辑(月刊)》 *
卫保国等: "一种针对大尺度运动的快速光流算法", 《计算机应用研究》 *
李杰等: "一种基于椭圆肤色模型的人脸检测方法", 《计算机测量与控制》 *

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809387A (zh) * 2015-03-12 2015-07-29 山东大学 基于视频图像手势识别的非接触式解锁方法及装置
CN104809387B (zh) * 2015-03-12 2017-08-29 山东大学 基于视频图像手势识别的非接触式解锁方法及装置
CN105139439A (zh) * 2015-07-29 2015-12-09 电子科技大学 一种光流场计算方法
CN105184273A (zh) * 2015-09-18 2015-12-23 桂林远望智能通信科技有限公司 一种基于asm的动态图像正面人脸重建系统及方法
CN105184273B (zh) * 2015-09-18 2018-07-17 桂林远望智能通信科技有限公司 一种基于asm的动态图像正面人脸重建系统及方法
US11341750B2 (en) 2015-12-04 2022-05-24 Texas Instruments Incorporated Quasi-parametric optical flow estimation
CN108352074A (zh) * 2015-12-04 2018-07-31 德州仪器公司 准参数光学流估计
CN108352074B (zh) * 2015-12-04 2021-11-26 德州仪器公司 光学流估计的图像处理系统和方法
CN106204573A (zh) * 2016-07-07 2016-12-07 Tcl集团股份有限公司 一种智能冰箱的食品管理方法及系统
CN106778528A (zh) * 2016-11-24 2017-05-31 四川大学 一种基于高斯金字塔特征的疲劳驾驶检测方法
CN106780311B (zh) * 2016-12-22 2019-12-31 华侨大学 一种结合皮肤粗糙度的快速人脸图像美化方法
CN106780311A (zh) * 2016-12-22 2017-05-31 华侨大学 一种结合皮肤粗糙度的快速人脸图像美化方法
CN108810317B (zh) * 2017-05-05 2021-03-09 展讯通信(上海)有限公司 真实运动估计方法及装置、计算机可读存储介质、终端
CN108810317A (zh) * 2017-05-05 2018-11-13 展讯通信(上海)有限公司 真实运动估计方法及装置、计算机可读存储介质、终端
CN107194360B (zh) * 2017-05-25 2018-07-20 智慧航安(北京)科技有限公司 逆向通行对象识别方法、装置及系统
CN107194360A (zh) * 2017-05-25 2017-09-22 智慧航安(北京)科技有限公司 逆向通行对象识别方法、装置及系统
CN107845108B (zh) * 2017-09-21 2021-10-26 张家港康得新光电材料有限公司 一种光流值计算方法、装置及电子设备
CN107845108A (zh) * 2017-09-21 2018-03-27 上海玮舟微电子科技有限公司 一种光流值计算方法、装置及电子设备
CN107589850A (zh) * 2017-09-26 2018-01-16 深圳睛灵科技有限公司 一种手势移动方向的识别方法及系统
CN109697387A (zh) * 2017-10-23 2019-04-30 北京京东尚科信息技术有限公司 运动方向预测方法、装置、电子设备及存储介质
CN107958218A (zh) * 2017-11-22 2018-04-24 南京邮电大学 一种实时手势识别的方法
CN108600640A (zh) * 2018-07-03 2018-09-28 京东方科技集团股份有限公司 图像中手势识别、颜色白平衡调整及曝光调节方法和装置
CN108600640B (zh) * 2018-07-03 2021-02-02 京东方科技集团股份有限公司 图像中手势识别、颜色白平衡调整及曝光调节方法和装置
CN109359510A (zh) * 2018-08-27 2019-02-19 广州大学 一种对异常行为的视觉分析处理方法
CN109359510B (zh) * 2018-08-27 2022-03-22 广州大学 一种对异常行为的视觉分析处理方法
CN109272535A (zh) * 2018-09-07 2019-01-25 广东中粤电力科技有限公司 一种基于图像识别的配电房安全区预警方法
CN110287894A (zh) * 2019-06-27 2019-09-27 深圳市优象计算技术有限公司 一种针对超广角视频的手势识别方法及系统
CN113093972A (zh) * 2019-12-23 2021-07-09 北京集创北方科技股份有限公司 手势识别方法、系统、存储介质、触屏设备
CN111179301A (zh) * 2019-12-23 2020-05-19 北京中广上洋科技股份有限公司 一种基于计算机视频的运动趋势分析方法
CN111179301B (zh) * 2019-12-23 2023-06-30 北京中广上洋科技股份有限公司 一种基于计算机视频的运动趋势分析方法
CN113111738A (zh) * 2021-03-26 2021-07-13 常州工学院 基于视频图像处理的动态手势识别方法和装置
CN113111738B (zh) * 2021-03-26 2023-12-19 常州工学院 基于视频图像处理的动态手势识别方法和装置
CN113392820A (zh) * 2021-08-17 2021-09-14 南昌虚拟现实研究院股份有限公司 动态手势识别方法、装置、电子设备及可读存储介质
CN113392820B (zh) * 2021-08-17 2021-11-30 南昌虚拟现实研究院股份有限公司 动态手势识别方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN104331151B (zh) 2018-02-23

Similar Documents

Publication Publication Date Title
CN104331151A (zh) 基于光流法的手势运动方向识别方法
US11450146B2 (en) Gesture recognition method, apparatus, and device
CN102324025B (zh) 基于高斯肤色模型和特征分析的人脸检测与跟踪方法
CN103218605B (zh) 一种基于积分投影与边缘检测的快速人眼定位方法
CN102999901B (zh) 基于深度传感器的在线视频分割后的处理方法及系统
CN103310194B (zh) 视频中基于头顶像素点梯度方向的行人头肩部检测方法
CN104123549B (zh) 一种用于疲劳驾驶实时监测的眼睛定位方法
CN102592112B (zh) 基于隐马尔科夫模型判断手势运动方向的方法
CN108256421A (zh) 一种动态手势序列实时识别方法、系统及装置
CN103745468B (zh) 一种基于图结构和边界先验的显著性物体检测方法
CN105046206B (zh) 基于视频中运动先验信息的行人检测方法及装置
CN104050488A (zh) 一种基于切换的卡尔曼滤波模型的手势识别方法
CN104715238A (zh) 一种基于多特征融合的行人检测方法
KR20210028185A (ko) 사람 자세 분석 시스템 및 방법
CN105022982A (zh) 手部运动识别方法和装置
CN103295016A (zh) 基于深度与rgb信息和多尺度多方向等级层次特征的行为识别方法
CN108197534A (zh) 一种人头部姿态检测方法、电子设备及存储介质
CN105224285A (zh) 眼睛开闭状态检测装置和方法
CN105512618B (zh) 视频跟踪方法
CN102880865A (zh) 基于肤色与形态特征的动态手势识别方法
CN108846359A (zh) 一种基于皮肤颜色区域分割和机器学习算法相融合的手势识别方法及其应用
CN103020614B (zh) 基于时空兴趣点检测的人体运动识别方法
Lu et al. Learning attention map from images
CN104102904A (zh) 一种静态手势识别方法
CN105404866B (zh) 一种多模式自动实施人体状态感知的实现方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180223

Termination date: 20201011

CF01 Termination of patent right due to non-payment of annual fee