CN103218601A - 检测手势的方法及装置 - Google Patents

检测手势的方法及装置 Download PDF

Info

Publication number
CN103218601A
CN103218601A CN2013101152469A CN201310115246A CN103218601A CN 103218601 A CN103218601 A CN 103218601A CN 2013101152469 A CN2013101152469 A CN 2013101152469A CN 201310115246 A CN201310115246 A CN 201310115246A CN 103218601 A CN103218601 A CN 103218601A
Authority
CN
China
Prior art keywords
zone
detected
gesture
multiframe
discrepancy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013101152469A
Other languages
English (en)
Other versions
CN103218601B (zh
Inventor
方奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310115246.9A priority Critical patent/CN103218601B/zh
Publication of CN103218601A publication Critical patent/CN103218601A/zh
Application granted granted Critical
Publication of CN103218601B publication Critical patent/CN103218601B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明实施例提供的一种检测手势的方法及装置,应用于人机交互领域,用于解决现有技术中存在的处理视频图像计算量较大,检测手势容易出现错检漏检的问题。本发明实施例提供一种检测手势的方法,包括:对视频进行肤色提取以获得与所述视频对应的多帧肤色图像;根据所述多帧肤色图像确定待检测区域,所述待检测区域能覆盖检测手势中初始动作的动作范围对应的区域;根据所述待检测区域以及形状特征确定手的位置。本发明实施例提供的一种检测手势的方法及装置可以应用于带摄像头的智能终端。

Description

检测手势的方法及装置
技术领域
本发明涉及人机交互领域,尤其涉及一种检测手势的方法及装置。
背景技术
近年来,随着硬件以及软件的不断发展,基于检测手势的人机交互操作方法受到广泛关注,通过检测手势能够实现人与终端之间直接、自然且有效的交互。
目前,终端多是采用深度摄像头、3D摄像头或者普通2D摄像头获取视频图像,并对视频图像进行检测以确定手的位置。其中,通过2D摄像头获取视频图像,并对视频图像进行检测以确定手的位置时,多是根据肤色特征或者形状特征来确定手的位置。
在实现本发明实施例的过程中,发明人发现现有技术中至少存在如下问题:
在运用深度摄像头或3D摄像头实现检测手势时,由于通过深度摄像头或3D摄像头获取的视频图像包含的内容多,信息量较大,使得处理该视频图像时计算量较大;
在运用2D摄像头实现检测手势时,可以根据肤色特征来确定手的位置,然而通过肤色特征来确定手的位置时,易与视频图像中背景中的人脸或者其他类肤色区域等目标混淆;还可以根据形状特征来确定手的位置,然而通过形状特征来确定手的位置时,易于与手的轮廓相似的轮廓混淆。综上所述,上述两种运用2D摄像头实现检测手势都出现漏检错检的情况。
发明内容
本发明的实施例提供检测手势的方法及装置,用于解决现有技术中存在的处理视频图像计算量较大,检测手势容易出现错检漏检的问题。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明实施例提供一种检测手势的方法,包括:对视频进行肤色提取以获得与所述视频对应的多帧肤色图像;根据所述多帧肤色图像确定待检测区域,所述待检测区域能覆盖检测手势中初始动作的动作范围对应的区域;根据所述待检测区域以及形状特征确定手的位置。
在第一种可能的实现方式中,结合第一方面的实现方式,所述根据所述多帧肤色图像确定待检测区域,包括:提取每隔N帧的肤色图像,其中N≥1;对提取出来的相邻两帧肤色图像进行差值比较,得到相邻两帧图像的差异点;对M个差值比较结果进行叠加得到第一叠加结果并根据所述第一叠加结果确定待检测区域,其中M为预先设置的,所述第一叠加结果包括多个差异点以及所述差异点在M个差值比较结果中出现的次数。
在第二种可能的实现方式中,结合第一方面的第一种可能,所述根据所述第一叠加结果确定待检测区域,具体包括:根据所述第一叠加结果中的差异点确定所述待检测区域,所述待检测区域全部覆盖或者大部分覆盖所述第一叠加结果中的差异点。
在第三种可能的实现方式中,结合第一方面的第一种可能,所述根据所述第一叠加结果确定待检测区域,具体包括:对所述第一叠加结果进行筛选,剔除低概率出现的差异点以得到第二叠加结果;根据第二叠加结果中的差异点确定所述待检测区域,所述待检测区域全部覆盖或者大部分覆盖所述第二叠加结果中的差异点。
在第四种可能的实现方式中,结合第一方面的第一种可能,所述对视频进行肤色提取以获得与所述视频对应的多帧肤色图像,包括:对视频进行亮度处理,剔除高于预设值的高像素点,得到多帧待处理图像;通过采集大量现有肤色图像,对现有肤色图像提取的像素训练高斯混合模型;根据所述高斯混合模型对所述多帧待处理图像进行处理得到与所述视频对应的多帧肤色图像。
在第五种可能的实现方式中,结合第一方面的第一种可能,所述根据所述待检测区域以及形状特征确定手的位置,包括:对所述多帧待处理图像中的待检测区域提取手势形状边缘,得到待匹配手势形状;根据预先设置的手静态势模板,采用距离变换方法对所述待匹配手势形状进行匹配,确定手的位置。
第二方面,本发明实施例提供一种检测手势的装置,包括:
提取单元,用于对视频进行肤色提取以获得与所述视频对应的多帧肤色图像;
第一确定单元,用于根据所述提取单元获得的多帧肤色图像确定待检测区域,所述待检测区域能覆盖检测手势中初始动作的动作范围对应的区域;
第二确定单元,用于根据所述第一确定单元确定的待检测区域以及形状特征确定手的位置。
在第一种可能的实现方式中,结合第二方面的实现方式,所述第一确定单元,包括:
第一提取子单元,用于提取每隔N帧的肤色图像,其中N≥1;
比较子单元,用于对所述提取子单元提取出来的相邻两帧肤色图像进行差值比较,得到相邻两帧图像的差异点;
执行子单元,用于对比较子单元得到的M个差值比较结果进行叠加得到第一叠加结果并根据所述第一叠加结果确定待检测区域,其中M为预先设置的,所述第一叠加结果包括多个差异点以及所述差异点在M个差值比较结果中出现的次数。
在第二种可能的实现方式中,结合第二方面的第一种可能,所述执行子单元,包括:
第一确定模块,用于根据第一叠加结果中的差异点确定所述待检测区域,所述待检测区域全部覆盖或者大部分覆盖所述第一叠加结果中的差异点。
在第三种可能的实现方式中,结合第二方面的第一种可能,所述执行子单元,包括:
筛选模块,用于对所述第一叠加结果进行筛选,剔除低概率出现的差异点以得到第二叠加结果;
第二确定模块,用于根据第二叠加结果中的差异点确定所述待检测区域,所述待检测区域全部覆盖或者大部分覆盖所述第二叠加结果中的差异点。
在第四种可能的实现方式中,结合第二方面的第一种可能,其特征在于,所述提取单元,包括:
第一处理子单元,用于对视频进行亮度处理,剔除高于预设值的高像素点,得到多帧待处理图像;
训练子单元,用于通过采集大量现有肤色图像,对现有肤色图像提取的像素训练高斯混合模型;
第二处理子单元,用于根据所述训练子单元训练出的高斯混合模型对所述第一处理子单元得到的多帧待处理图像进行处理得到与所述视频对应的多帧肤色图像。
在第五种可能的实现方式中,结合第二方面的第一种可能,其特征在于,所述第二确定单元,包括:
第二提取子单元,用于对所述多帧待处理图像中的待检测区域提取手势形状边缘,得到待匹配手势形状;
确定子单元,用于根据预先设置的手静态势模板,采用距离变换方法对所述第二提取子单元提取的待匹配手势形状进行匹配,确定手的位置。
本发明实施例提供的一种检测手势的方法及装置,由于通过视频对应的多帧肤色图像进行待检测区域的确定,并根据所述待检测区域以及形状特征确定手的位置,从而使得手的位置是基于待检测区域实现确定,而所述待检测区域是能覆盖检测手势中初始动作的动作范围对应的区域,与现有技术相比,待检测区域中的信息量远小于运用深度摄像头或3D摄像头实现检测手势时获得的视频图像包含的内容,使得处理该待检测区域对应的图像时计算量较小,且待检测区域的检测范围也小于运用2D摄像头实现检测手势时用于检测的视频图像,减小了运用2D摄像头实现检测手势都出现漏检错检的情况。
附图说明
图1为本发明实施例提供的一种检测手势的方法的流程图;
图2为本发明又一实施例提供的一种检测手势的方法的流程图;
图3为图2所示的一种检测手势的方法中步骤201的流程图;
图4为图2所示的一种检测手势的方法中步骤202的流程图;
图5为本发明实施例提供的一种检测手势的装置的结构示意图一;
图6为图5所示的一种检测手势的装置中提取单元的结构示意图;
图7为图5所示的一种检测手势的装置中的第一确定单元的结构示意图;
图8为图7所示的一种检测手势的装置中的第一确定单元的执行子单元的结构示意图;
图9为图5所示的一种检测手势的装置中的第二确定单元的结构示意图;
图10为本发明实施例提供的一种检测手势的装置的结构示意图二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的一种检测手势的方法及装置,用于解决现有技术中进行手势检测时不是处理视频图像时计算量较大就是出现漏检错检的问题。下面结合附图对本发明实施例提供的一种检测手势的方法进行详细描述。
如图1所示,本发明实施例提供的一种检测手势的方法,包括:
步骤101、对视频进行肤色提取以获得与所述视频对应的多帧肤色图像。
其中,所述视频为摄像头采集的多帧视频图像,多帧视频图像通过肤色提取获取与多帧视频图像对应的多帧肤色图像。
步骤102、根据所述多帧肤色图像确定待检测区域。
其中,所述待检测区域能覆盖检测手势中初始动作的动作范围对应的区域。
步骤103、根据所述待检测区域以及形状特征确定手的位置。
本发明实施例提供的一种检测手势的方法,由于通过视频对应的多帧肤色图像进行待检测区域的确定,并根据所述待检测区域以及形状特征确定手的位置,从而使得手的位置是基于待检测区域实现确定,而所述待检测区域是能覆盖检测手势中初始动作的动作范围对应的区域,与现有技术相比,待检测区域中的信息量远小于运用深度摄像头或3D摄像头实现检测手势时获得的视频图像包含的内容,使得处理该待检测区域对应的图像时计算量较小,且待检测区域的检测范围也小于运用2D摄像头实现检测手势时用于检测的视频图像,减小了运用2D摄像头实现检测手势都出现漏检错检的情况。
为了使得本领域技术人员更好的理解本发明实施例提供的技术方案,现对本发明又一实施例提供的一种检测手势的方法进行详细的说明。
如图2所示,本发明又一实施例提供的一种检测手势的方法,应用于具有摄像头的终端,所述方法,可以包括:
步骤201、对视频进行肤色提取以获得与所述视频对应的多帧肤色图像。
在本实施例中,所述视频为摄像头采集的多帧视频图像。
其中,肤色提取的方式有很多种,在现有技术中均有体现,现以一具体实施例为例对肤色提取进行详细的说明。
具体的,如图3所示,所述步骤201,包括:
步骤2011、对所述多帧视频图像进行亮度处理,剔除高于预设值的高像素点,得到多帧待处理图像。
其中,所述剔除高于预设值的高像素点的具体实现方式为:
提取视频图像的亮度信息,去除视频图像的亮度>200的像素点,减小亮度信息对肤色检测的影响,如公式(1)所示;
Y=0.299×R+0.587×G+0.114×B            (1)
其中,R、G、B分别为视频图像中的红、绿、蓝三个通道分量;Y为视频图像的亮度信息;0.299、0.587、0.114三个常数为实验所得的经验值。
步骤2012、通过采集大量现有肤色图像,对现有肤色图像提取的像素训练高斯混合模型(Gaussian Mixture Model,GMM),如公式(2)所示:
p ( x i ) = Σ j = 1 M α j N j ( x j ; μ j , Σ j ) - - - ( 2 )
其中,αj为单高斯模型在GMM中的权值;μj为单高斯模型的均值;Σj为单高斯模型的方差;xj为样本向量;p(xi)为概率分布密度;Nj为单高斯。
步骤2013、根据上述GMM对所述多帧待处理图像进行处理得到与所述视频对应的多帧肤色图像。
步骤202、根据所述多帧肤色图像确定待检测区域,所述待检测区域覆盖检测手势中初始动作的动作范围对应的区域。
其中,如图4所示,步骤202可以包括:
步骤2021、提取每隔N帧的肤色图像。
其中,N≥1,表示间隔帧数的数值,可以根据当前肤色图像的帧数设置,也可以是预先设置的阈值。
步骤2022、对提取出来的相邻两帧肤色图像进行差值比较,得到相邻两帧图像的像素差异点,如公式(3)所示:
Diffi(x,y)=abs(Skini(x,y)-Skinj(x,y))         (3)
其中,Diffi(x,y)为像素差异点集合;Skini(x,y)为相邻两帧肤色图像中后一帧的肤色图像像素点集合;Skinj(x,y)为相邻两帧肤色图像中前一帧的肤色图像像素点集合;(x,y)为像素点在视频图像帧中的坐标信息。若abs()非0,则此刻(x,y)对应的像素点为像素差异点。
步骤2023、对M个差值比较结果进行叠加得到第一叠加结果并根据所述第一叠加结果确定待检测区域。
其中,M为预先设置的,所述第一叠加结果包括多个差异点以及所述像素差异点在M个差值比较结果中出现的次数,如公式(4)所示:
Sum ( x , y ) = Σ k = 0 M Diff i - k ( x , y ) - - - ( 4 )
其中,Sum(x,y)为第一叠加结果;Diffi-k(x,y)为每隔N帧的像素差异点集合。
在本实施例中,所述根据所述第一叠加结果确定待检测区域具体实现可以是,全部覆盖或者大部分覆盖所述第一叠加结果中的差异点。进一步的,为了缩小待检测区域的范围,所述根据所述第一叠加结果确定待检测区域,还可以是对所述第一叠加结果进行筛选,剔除低概率(小于预设阈值τ)出现的差异点以得到第二叠加结果,如公式(5)所示:
MOT i ( x , y ) = 0 if Sum i &tau; ( x , y ) < &tau; 1 otherwise - - - ( 5 )
其中,MOTi(x,y)为第二叠加结果;τ为预先设置的阈值,表示像素差异点在M个差值比较结果中出现的次数;Sumi τ(x,y)为在第一叠加结果中小于预设阈值的部分;otherwise为其它大于及等于预设阈值部分,根据第二叠加结果中的差异点确定所述待检测区域,所述待检测区域全部覆盖或者大部分覆盖所述第二叠加结果中的差异点。其中,待检测区域全部覆盖或者大部分覆盖所述第二叠加结果中的差异点,可以通过以下形式实现:
预先设置对所述第二叠加结果的差异点的提取比例,根据设定的比例对所述第二叠加结果的差异点进行提取,如公式(6)所示:
&Sigma; i < x cen - w j < y cen + h j < y cen - h i < x cen + w R ( i , j ) / &Sigma; i , j MOT ( x , y ) > 0.9 - - - ( 6 )
其中,R(i,j)为所述待检测区域;(xcen,ycen)为所述待检测区域的中心;w为所述待检测区域的长;h为所述待检测区域的宽;
Figure BDA00003007812700083
为所述第二叠加结果;0.9为预设比例。
步骤203、根据所述待检测区域以及形状特征确定手的位置。
其中,通过形状特征确定手的方式有很多种,所述步骤203具体为在所述待检测区域内通过形状特征实现手位置的确定。具体如何通过形状特征确定手的方式在现有技术中均有体现,现以一具体实施例为例对肤色提取进行详细的说明:对多帧待处理图像中的待检测区域提取手势形状边缘,得到待匹配手势形状;根据预先设置的静态手势模板,采用距离变换方法对所述待匹配手势形状进行匹配,得到手的位置。其中,手势模板设置为最常见手势,但不限于此。
本发明实施例提供的一种检测手势的方法,通过对提取的原始视频图像进行亮度处理,根据通过现有肤色像素训练的肤色模型,对亮度处理后的原始视频图像进行进一步处理,使得到的多帧肤色图像中含有的干扰目标减少更清晰易于后续步骤的进行,对多帧肤色图像按预定帧数间隔进行像素提取,得到有一定帧数间隔的肤色图像,对一定帧数间隔的肤色图像进行差值比对,得到相邻两帧图像的像素差异点,对像素差异点进行叠加根据预设定阈值对叠加结果进行筛选,得到待检测区域,通过预先设置静态手势模板对待检测区域中像素进行形状匹配得到手势的位置和距离;与现有技术相比,多帧肤色图像中含有的干扰目标远小于运用2D摄像头时含有的干扰目标,通过多帧肤色图像所确定的待检测区域中的信息量远小于运用深度摄像头或3D摄像头实现检测手势时获得的视频图像包含的内容,使得处理该待检测区域对应的图像时计算量较小,通过距离变换方法得到的手势位置和距离更加准确,避免了运用现有技术实现检测手势时出现错检的情况。
如图5所示,本发明实施例提供的一种检测手势的装置,包括:
提取单元51,用于对视频进行肤色提取以获得与所述视频对应的多帧肤色图像;其具体实现方式与图1所示的步骤101相同,此处不再赘述。
其中,如图6所示,所述提取单元51,包括:
第一处理子单元511,用于对视频进行亮度处理,剔除高于预设值的高像素点,得到多帧待处理图像;其具体实现方式与图2所示的步骤2011相同,此处不再赘述。
训练子单元512,用于通过采集大量现有肤色图像,对现有肤色图像提取的像素训练高斯混合模型;其具体实现方式与图2所示的步骤2012相同,此处不再赘述。
第二处理子单元513,用于根据所述训练子单元512训练出的高斯混合模型对所述第一处理子单元得到的多帧待处理图像进行处理得到与所述视频对应的多帧肤色图像;其具体实现方式与图2所示的步骤2013相同,此处不再赘述。
第一确定单元52,用于根据所述提取单元51获得的多帧肤色图像确定待检测区域,所述待检测区域能覆盖检测手势中初始动作的动作范围对应的区域;其具体实现方式与图1所示的步骤102相同,此处不再赘述。
如图7所示,所述第一确定单元52,包括:
第一提取子单元521,用于提取每隔N帧的肤色图像,其中N≥1;其具体实现方式与图4所示的步骤2021相同,此处不再赘述。
比较子单元522,用于对所述第一提取子单元521提取出来的相邻两帧肤色图像进行差值比较,得到相邻两帧图像的差异点;其具体实现方式与图4所示的步骤2022相同,此处不再赘述。
执行子单元523,用于对比较子单元522得到的M个差值比较结果进行叠加得到第一叠加结果并根据所述第一叠加结果确定待检测区域,其中M为预先设置的,所述第一叠加结果包括多个差异点以及所述差异点在M个差值比较结果中出现的次数;其具体实现方式与图4所示的步骤2023相同,此处不再赘述。
其中,如图8所示,所述执行子单元523,包括:
第一确定模块5231,用于根据第一叠加结果中的差异点确定所述待检测区域,所述待检测区域全部覆盖或者大部分覆盖所述第一叠加结果中的差异点。和/或
筛选模块5232,用于对所述第一叠加结果进行筛选,剔除低概率出现的差异点以得到第二叠加结果。
第二确定模块5233,用于对筛选模块5232得到的所述第二叠加结果中的差异点确定所述待检测区域,所述待检测区域全部覆盖或者大部分覆盖所述第二叠加结果中的差异点。
第二确定单元53,用于根据所述第一确定单元52确定的待检测区域以及形状特征确定手的位置;其具体实现方式与图1所示的步骤103相同,此处不再赘述。
如图9所示,所述第二确定单元53,包括:
第二提取子单元531,用于对所述多帧待处理图像中的待检测区域提取手势形状边缘,得到待匹配手势形状。
确定子单元532,用于根据预先设置的手静态势模板,采用距离变换方法对所述第二提取子单元提取的待匹配手势形状进行匹配,确定手的位置。
如图10所示,本发明实施例还提供一种检测手势的装置,包括存储器110、处理器120以及摄像头130。
所述存储器110用于存储预先设置的静态手势模板。
所述摄像头120用于采集视频,所述视频由多帧视频图像组成。
所述处理器130用于对所述摄像头采集的视频进行肤色提取以获得与所述视频对应的多帧肤色图像;根据所述多帧肤色图像确定待检测区域,所述待检测区域能覆盖检测手势中初始动作的动作范围对应的区域;根据所述待检测区域以及存储器存储的手静态势模板,采用距离变换方法对所述待匹配手势形状进行匹配,确定手的位置。所述处理器的具体实现方式与步骤201-203相同,此处不再一一赘述。
本发明实施例提供的一种检测手势的装置,通过对提取的原始视频图像进行亮度处理,根据通过现有肤色像素训练的肤色模型,对亮度处理后的原始视频图像进行进一步处理,使得到的多帧肤色图像中含有的干扰目标减少更清晰易于后续步骤的进行,对多帧肤色图像按预定帧数间隔进行像素提取,得到有一定帧数间隔的肤色图像,对一定帧数间隔的肤色图像进行差值比对,得到相邻两帧图像的像素差异点,对像素差异点进行叠加根据预设定阈值对叠加结果进行筛选,得到待检测区域,通过预先设置静态手势模板对待检测区域中像素进行形状匹配得到手势的位置和距离;与现有技术相比,多帧肤色图像中含有的干扰目标远小于运用2D摄像头时含有的干扰目标,通过多帧肤色图像所确定的待检测区域中的信息量远小于运用深度摄像头或3D摄像头实现检测手势时获得的视频图像包含的内容,使得处理该待检测区域对应的图像时计算量较小,通过距离变换方法得到的手势位置和距离更加准确,避免了运用现有技术实现检测手势时出现错检的情况。
本发明实施例提供的一种检测手势的方法及装置可以应用于带摄像头的智能终端。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (12)

1.一种检测手势的方法,其特征在于,包括:
对视频进行肤色提取以获得与所述视频对应的多帧肤色图像;
根据所述多帧肤色图像确定待检测区域,所述待检测区域能覆盖检测手势中初始动作的动作范围对应的区域;
根据所述待检测区域以及形状特征确定手的位置。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多帧肤色图像确定待检测区域,包括:
提取每隔N帧的肤色图像,其中N≥1;
对提取出来的相邻两帧肤色图像进行差值比较,得到相邻两帧图像的差异点;
对M个差值比较结果进行叠加得到第一叠加结果并根据所述第一叠加结果确定待检测区域,其中M为预先设置的,所述第一叠加结果包括多个差异点以及所述差异点在M个差值比较结果中出现的次数。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一叠加结果确定待检测区域,具体包括:
根据第一叠加结果中的差异点确定所述待检测区域,所述待检测区域全部覆盖或者大部分覆盖所述第一叠加结果中的差异点。
4.根据权利要求2所述的方法,其特征在于,所述根据所述第一叠加结果确定待检测区域,具体包括:
对所述第一叠加结果进行筛选,剔除低概率出现的差异点以得到第二叠加结果;
根据第二叠加结果中的差异点确定所述待检测区域,所述待检测区域全部覆盖或者大部分覆盖所述第二叠加结果中的差异点。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述对视频进行肤色提取以获得与所述视频对应的多帧肤色图像,包括:
对视频进行亮度处理,剔除高于预设值的高像素点,得到多帧待处理图像;
通过采集大量现有肤色图像,对现有肤色图像提取的像素训练高斯混合模型;
根据所述高斯混合模型对所述多帧待处理图像进行处理得到与所述视频对应的多帧肤色图像。
6.根据权利要求5所述的方法,其特征在于,所述根据所述待检测区域以及形状特征确定手的位置,包括:
对所述多帧待处理图像中的待检测区域提取手势形状边缘,得到待匹配手势形状;
根据预先设置的手静态势模板,采用距离变换方法对所述待匹配手势形状进行匹配,确定手的位置。
7.一种检测手势的装置,其特征在于,包括:
提取单元,用于对视频进行肤色提取以获得与所述视频对应的多帧肤色图像;
第一确定单元,用于根据所述提取单元获得的多帧肤色图像确定待检测区域,所述待检测区域能覆盖检测手势中初始动作的动作范围对应的区域;
第二确定单元,用于根据所述第一确定单元确定的待检测区域以及形状特征确定手的位置。
8.根据权利要求7所述的装置,其特征在于,所述第一确定单元,包括:
第一提取子单元,用于提取每隔N帧的肤色图像,其中N≥1;
比较子单元,用于对所述提取子单元提取出来的相邻两帧肤色图像进行差值比较,得到相邻两帧图像的差异点;
执行子单元,用于对比较子单元得到的M个差值比较结果进行叠加得到第一叠加结果并根据所述第一叠加结果确定待检测区域,其中M为预先设置的,所述第一叠加结果包括多个差异点以及所述差异点在M个差值比较结果中出现的次数。
9.根据权利要求8所述的装置,其特征在于,所述执行子单元,包括:
第一确定模块,用于根据第一叠加结果中的差异点确定所述待检测区域,所述待检测区域全部覆盖或者大部分覆盖所述第一叠加结果中的差异点。
10.根据权利要求8所述的装置,其特征在于,所述执行子单元,包括:
筛选模块,用于对所述第一叠加结果进行筛选,剔除低概率出现的差异点以得到第二叠加结果;
第二确定模块,用于根据第二叠加结果中的差异点确定所述待检测区域,所述待检测区域全部覆盖或者大部分覆盖所述第二叠加结果中的差异点。
11.根据权利要求7-10任一项所述的装置,其特征在于,所述提取单元,包括:
第一处理子单元,用于对视频进行亮度处理,剔除高于预设值的高像素点,得到多帧待处理图像;
训练子单元,用于通过采集大量现有肤色图像,对现有肤色图像提取的像素训练高斯混合模型;
第二处理子单元,用于根据所述训练子单元训练出的高斯混合模型对所述第一处理子单元得到的多帧待处理图像进行处理得到与所述视频对应的多帧肤色图像。
12.根据权利要求11所述的装置,其特征在于,所述第二确定单元,包括:
第二提取子单元,用于对所述多帧待处理图像中的待检测区域提取手势形状边缘,得到待匹配手势形状;
确定子单元,用于根据预先设置的手静态势模板,采用距离变换方法对所述第二提取子单元提取的待匹配手势形状进行匹配,确定手的位置。
CN201310115246.9A 2013-04-03 2013-04-03 检测手势的方法及装置 Expired - Fee Related CN103218601B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310115246.9A CN103218601B (zh) 2013-04-03 2013-04-03 检测手势的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310115246.9A CN103218601B (zh) 2013-04-03 2013-04-03 检测手势的方法及装置

Publications (2)

Publication Number Publication Date
CN103218601A true CN103218601A (zh) 2013-07-24
CN103218601B CN103218601B (zh) 2016-08-03

Family

ID=48816370

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310115246.9A Expired - Fee Related CN103218601B (zh) 2013-04-03 2013-04-03 检测手势的方法及装置

Country Status (1)

Country Link
CN (1) CN103218601B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095838A (zh) * 2014-05-20 2015-11-25 中国移动通信集团广东有限公司 一种目标检测方法及装置
CN105451029A (zh) * 2015-12-02 2016-03-30 广州华多网络科技有限公司 一种视频图像的处理方法及装置
CN106503651A (zh) * 2016-10-21 2017-03-15 上海未来伙伴机器人有限公司 一种手势图像的提取方法及系统
CN108509136A (zh) * 2018-04-12 2018-09-07 山东音为爱智能科技有限公司 一种基于人工智能的儿童绘本辅助阅读方法
CN109977819A (zh) * 2019-03-14 2019-07-05 长沙理工大学 一种应用模板匹配方法的弱监督单个动作定位方法
CN110298314A (zh) * 2019-06-28 2019-10-01 海尔优家智能科技(北京)有限公司 手势区域的识别方法及装置
CN112596605A (zh) * 2020-12-14 2021-04-02 清华大学 一种ar眼镜控制方法、装置、ar眼镜及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719015A (zh) * 2009-11-03 2010-06-02 上海大学 指示手势的手指尖定位方法
CN101853071A (zh) * 2010-05-13 2010-10-06 重庆大学 基于视觉的手势识别方法及系统
CN102508547A (zh) * 2011-11-04 2012-06-20 哈尔滨工业大学深圳研究生院 基于计算机视觉的手势输入法构建方法及系统
CN102938060A (zh) * 2012-12-07 2013-02-20 上海电机学院 动态手势识别系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719015A (zh) * 2009-11-03 2010-06-02 上海大学 指示手势的手指尖定位方法
CN101853071A (zh) * 2010-05-13 2010-10-06 重庆大学 基于视觉的手势识别方法及系统
CN102508547A (zh) * 2011-11-04 2012-06-20 哈尔滨工业大学深圳研究生院 基于计算机视觉的手势输入法构建方法及系统
CN102938060A (zh) * 2012-12-07 2013-02-20 上海电机学院 动态手势识别系统及方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095838A (zh) * 2014-05-20 2015-11-25 中国移动通信集团广东有限公司 一种目标检测方法及装置
CN105095838B (zh) * 2014-05-20 2019-09-17 中国移动通信集团广东有限公司 一种目标检测方法及装置
CN105451029A (zh) * 2015-12-02 2016-03-30 广州华多网络科技有限公司 一种视频图像的处理方法及装置
CN106503651A (zh) * 2016-10-21 2017-03-15 上海未来伙伴机器人有限公司 一种手势图像的提取方法及系统
CN106503651B (zh) * 2016-10-21 2019-09-24 上海未来伙伴机器人有限公司 一种手势图像的提取方法及系统
CN108509136A (zh) * 2018-04-12 2018-09-07 山东音为爱智能科技有限公司 一种基于人工智能的儿童绘本辅助阅读方法
CN109977819A (zh) * 2019-03-14 2019-07-05 长沙理工大学 一种应用模板匹配方法的弱监督单个动作定位方法
CN109977819B (zh) * 2019-03-14 2020-04-24 长沙理工大学 一种应用模板匹配方法的弱监督单个动作定位方法
CN110298314A (zh) * 2019-06-28 2019-10-01 海尔优家智能科技(北京)有限公司 手势区域的识别方法及装置
CN112596605A (zh) * 2020-12-14 2021-04-02 清华大学 一种ar眼镜控制方法、装置、ar眼镜及存储介质

Also Published As

Publication number Publication date
CN103218601B (zh) 2016-08-03

Similar Documents

Publication Publication Date Title
CN103218601A (zh) 检测手势的方法及装置
CN106295502B (zh) 一种人脸检测方法及装置
Shao et al. Car detection from high-resolution aerial imagery using multiple features
CN1276384C (zh) 视频流可分类符号分离的方法与系统
CN107358258B (zh) 基于nsct双cnn通道和选择性注意机制的sar图像目标分类
CN101833771B (zh) 解决多目标交汇遮挡的跟踪装置及方法
CN106296681B (zh) 基于双通道低秩分解的协同学习显著性检测方法
CN107066972B (zh) 基于多通道极值区域的自然场景文本检测方法
CN103020993A (zh) 一种双通道颜色对比度融合的视觉显著性检测方法
CN103955949A (zh) 基于Mean-shift算法的运动目标检测方法
CN112329646A (zh) 一种基于手的质心坐标的手势运动方向识别方法
CN104966054A (zh) 无人机可见光图像中的弱小目标检测方法
CN103336835A (zh) 基于权值color-sift特征字典的图像检索方法
CN103632372B (zh) 一种视频显著图提取方法
CN103218600A (zh) 一种实时人脸检测算法
CN104036272A (zh) 一种文本检测方法及电子设备
CN106682669A (zh) 一种图像处理方法及移动终端
CN111539434B (zh) 基于相似度的红外弱小目标检测方法
CN102968618A (zh) 一种融合BoF模型和谱聚类算法的静态手势识别方法
CN102682291B (zh) 一种场景人数统计方法、装置和系统
CN102929387A (zh) 一种基于普通纸笔的人机交互方法及人机交互系统
CN117523612A (zh) 一种基于Yolov5网络的密集行人检测方法
Azad et al. Novel and tuneable method for skin detection based on hybrid color space and color statistical features
Piérard et al. A probabilistic pixel-based approach to detect humans in video streams
CN102968622A (zh) 一种台标识别方法以及台标识别装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160803

Termination date: 20180403

CF01 Termination of patent right due to non-payment of annual fee