CN103366188B - 一种基于拳头检测作为辅助信息的手势跟踪方法 - Google Patents
一种基于拳头检测作为辅助信息的手势跟踪方法 Download PDFInfo
- Publication number
- CN103366188B CN103366188B CN201310283649.4A CN201310283649A CN103366188B CN 103366188 B CN103366188 B CN 103366188B CN 201310283649 A CN201310283649 A CN 201310283649A CN 103366188 B CN103366188 B CN 103366188B
- Authority
- CN
- China
- Prior art keywords
- fist
- gesture
- image
- detection
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明提供了一种拳头图像的检测方法和手势跟踪方法,包括步骤:step1:根据预设的窗口尺寸和步长扫描图片,将当前窗口里的图像数据作为待定目标输入检测器;step2:检测待定目标,对于每一层,根据学习好的模型里指定的若干特征计算响应值,输入该层的分类器h,得到判决,如果判决为负样本,则检测完成;如果该样本通过了所有层的检测,则为正样本,因此则可以认为这张图里有拳头。通过拳头图像检测,有效的提高手势检测的灵敏度和准确率,还可以改进手势丢失、跟踪恢复等问题。
Description
技术领域
本发明涉及电子设备的手势识别及跟踪领域,特别涉及一种基于拳头检测作为辅助信息的手势跟踪方法。
背景技术
现有技术中,手势识别算法大体分为两类,一类是基于3D模型的,例如Kinect使用红外检测目标深度值,另一类是基于图像。基于3D模型的方案,往往需要特殊硬件设备支持,使用成本高,并且有使用场合上的限制。基于图像的方案只需要有普通摄像头支持,直接根据可见光图像检测某种手势,使用成本较低,使用自然、方便,符合以人为本的要求。但是由于现实环境中复杂的背景、不匀的光照,以及摄像头本身的精度和噪声差别等等因素,极大的增加了手势识别的难度,导致准确率比较低、鲁棒性差等问题。
进一步详细分析可知,基于图像的手势识别相对基于3D模型的最大的问题是准确率低,鲁棒性差,容易丢失目标。导致这个问题主要有两个因素:
1.现实环境中,背景和光照复杂,摄像头本身的参数、精度和噪声强度千差万别。
2.手的关节多,自由度大,姿态很复杂。
第一个因素极大的增加了在图像中检测到手并识别出手势的难度;第二个因素增加了对手势检测和识别器的学习难度。第一个因素随环境变化而不同,是无法做到人为控制的,只能从第二个因素入手。经分析可知,拳头在手的各种姿态中,自由度最少,因此简单而易于识别。本发明将拳头这个特殊的手势用于辅助普通手势的检测、跟踪和识别,可以有效的提高手势检测的灵敏度和准确率,还可以解决跟踪初始化,以改进手势丢失、自动恢复跟踪等问题。
发明内容
有鉴于此,本发明的主要目的在于提供一种基于拳头检测作为辅助信息的手势跟踪方法。总共分三部分:分别为拳头图像训练方法、拳头跟踪方法和拳头作为辅助信息的手势跟踪方法。
1)拳头图像的训练方法,包括如下步骤:
step11:初始化训练样本集合,该集合由若干正样本和负样本图片组成,所谓正样本,即刚好包含着拳头的图片,负样本是不含有拳头的任何图片;
step12:设定训练的参数:Haar特征的类型,检测器层数N,每一层的目标检测率P和误检率R,每一层的最大弱检测器数T;
step13:初始化i,i=1;
step14:训练第i层,训练根据定义好的Haar类型提取特征,用AdaBoost算法进行训练,训练的停止准则是检测率P和误捡率R是否达到,或者弱检测器个数是否达到T;
step15:更新i,i=i+1,如果i>=N,跳转到step17;
step16:更新训练样本集合,用已经训练好的若干层组成的层级检测器对当前正负样本进行检测,将被拒绝的样本从训练集合里剔除,跳转到step14;
step17:训练停止。
2)拳头图像的检测方法,包括如下步骤:
step21:根据预设的窗口尺寸和步长扫描图片,将当前窗口里的图像数据作为待定目标输入检测器;
step22:检测待定目标,对于每一层,根据学习好的模型里指定的若干特征计算响应值,输入该层的分类器h,得到判决,如果判决为负样本,则检测完成;如果该样本通过了所有层的检测,则为正样本,因此则可以认为这张图像里含有拳头。
3)拳头检测作为辅助信息的手势跟踪方法,包括如下步骤:
step30:应用启动拳头检测器;
step31:拳头检测器处于伺候状态,监视每一帧视频图像;
step32:使用2)部分的拳头检测方法对图像进行检测,如果检测到拳头,则提示用户可以开始具体的手势指令,并将监视视频的控制权交给应用程序,应用程序启动普通手势识别器进行手势的跟踪和识别;
step33:如果在某个完整的手势序列完成之前发生了手势丢失的情况,应用程序提示用户发生了跟踪丢失的情况,开始倒计时,并将监视视频的控制权交给拳头检测器,跳转到step35,恢复跟踪;
step34:如果在完整的手势指令完成之后,新的手势指令开始之前发生了丢失,则跳转到step31;
step35:如果用户出示拳头并被检测到,跳转回step32,继续进行检测到拳头后的步骤;
step36:如果超过预设的时间,用户没有出示拳头或者没有被检测到,则视为用户取消了本次手势指令,跳转回step31。
优选的,应用程序通过文字、语音或者图标方式对用户进行提示。
附图说明
图1为本发明实施例拳头检测方法的示意流程图。其中layer表示迭代的索引值,L表示最大迭代层数,x表示输入的一个待测样本,hi(x)表示第i层的判决器,y是判决器的输出值。
图2为本发明实施例基于拳头作为辅助信息的手势跟踪流程图。
具体实施方式
下面结合附图,详细介绍本发明提供的基于拳头检测作为辅助信息的手势跟踪方法及装置。
第一部分,作为识别拳头图像的基础,本发明提供了一种拳头图像的训练方法,本发明的拳头训练属于有监督学习算法。训练流程如下:
step11:初始化训练样本集合,该集合由若干正样本和负样本图片组成。所谓正样本既刚好包含着拳头的图片,负样本是不含有拳头的任何图片,图片大小例如为24×24。
step12:设定训练的参数:Haar特征的类型,检测器层数N,每一层的目标检测率P和误检率R,每一层的最大弱检测器数T。
step13:初始化i,i=1。
step14:训练第i层。训练根据定义好的Haar类型提取特征,用AdaBoost算法进行训练,训练的停止准则是检测率P和误捡率R是否达到,或者弱检测器个数是否达到T。
step15:更新i,i=i+1。如果i>=N,跳转到step17。
step16:更新训练样本集合。用已经训练好的若干层组成的层级检测器对当前正负样本进行检测,将被拒绝的样本从训练集合里剔除。跳转到step14。
step17:训练停止。
第二部分,基于上述对拳头图像的训练,即可完成对拳头图像的检测工作,如图1所示,拳头图像检测方法包括步骤:
step21:根据预设的窗口尺寸和步长扫描图片,将当前窗口里的图像数据作为待定目标输入检测器。
step22:检测待定目标。对于每一层,根据学习好的模型里指定的若干特征计算响应值,输入该层的分类器h,得到判决。如果判决为负样本,则检测完成;如果该样本通过了所有层的检测,则为正样本。因此则可以认为这张图里有拳头,检测过程可以提前中止。
第三部分,基于拳头检测作为辅助信息进行手势跟踪实现流程。
本发明的手势跟踪方法要求用户在发出手势指令之前,首先用拳头告诉识别软件要准备发出手势指令,当识别软件检测到拳头,就告诉用户可以发出手势指令,然后跟踪用户的手势指令进行下一步操作。如果发生手势跟踪丢失,用户可以通过拳头恢复跟踪。本方案可以内嵌到使用手势检测和识别的应用中,帮助该应用提高手势的检测率。具体流程如下:
step30:应用启动拳头检测器。
step31:拳头检测器处于伺候状态,监视每一帧视频图像。
step32:使用前述拳头检测方法对图像进行检测,如果检测到拳头,则以例如文字、语音或者图标等方式提示用户可以开始具体的手势指令,并将监视视频的控制权交给应用程序,应用程序启动普通手势识别器进行手势的跟踪和识别。
step33:如果在某个完整的手势序列完成之前发生了手势丢失的情况,应用程序以例如文字、语音或者图标等方式提示用户发生了跟踪丢失的情况,开始倒计时,并将监视视频的控制权交给拳头检测器,跳转到step35;
step34:如果在完整的手势指令完成之后,新的手势指令开始之前发生了丢失,则跳转到step31。
step35:如果用户出示拳头并被检测到,跳转回step32,继续进行检测到拳头后的步骤。
step36:如果超过预设的时间,用户没有出示拳头或者没有被检测到,则视为用户取消了本次手势指令,跳转回step31。
本发明中,拳头检测器由若干层子检测器级联组成,只有通过所有层的检验的目标才被认为是拳头,该检测器的设计方式提高了拳头检测的正确率。
本领域的技术人员应该理解,本发明的方法和装置可以采用硬件、软件、或硬件和软件相结合的方式,通过微处理器、数字信号处理器、现场可编程逻辑单元、或门阵列等各种方式实现。
综上所述,虽然本发明已以优选实施例披露如上,然而其并非用以限定本发明。本发明所属技术领域的普通技术人员,在不脱离本发明的精神和范围内,可作各种变动与修饰。因此,本发明的保护范围当视后附的权利要求所界定的范围为准。
Claims (1)
1.一种基于拳头检测作为辅助信息的手势跟踪方法,其特征在于,总共分三部分:分别为拳头图像的训练方法、拳头图像的检测方法和拳头检测作为辅助信息的手势跟踪方法,
1)拳头图像的训练方法,包括如下步骤:
step11:初始化训练样本集合,该集合由若干正样本和负样本图像组成,所谓正样本,即刚好包含着拳头的图像,负样本是不含有拳头的任何图像;
step12:设定训练的参数:Haar特征的类型,检测器层数N,每一层的目标检测率P和误检率R,每一层的最大弱检测器数T;
step13:初始化i,i=1;
step14:训练第i层,训练根据定义好的Haar类型提取特征,用AdaBoost算法进行训练,训练的停止准则是检测率P和误捡率R是否达到,或者弱检测器个数是否达到T;
step15:更新i,i=i+1,如果i>=N,跳转到step17;
step16:更新训练样本集合,用已经训练好的若干层组成的层级检测器对当前正负样本进行检测,将被拒绝的样本从训练集合里剔除,跳转到step14;
step17:训练停止;
2)拳头图像的检测方法,包括如下步骤:
step21:根据预设的窗口尺寸和步长扫描图像,将当前窗口里的图像数据作为待定目标输入检测器;
step22:检测待定目标,对于每一层,根据学习好的模型里指定的若干特征计算响应值,输入该层的分类器h,得到判决,如果判决为负样本,则检测完成;如果待定目标通过了所有层的检测,则为正样本,因此则认为这张图像里含有拳头;
3)拳头检测作为辅助信息的手势跟踪方法,包括如下步骤:
step30:应用程序启动拳头检测器;
step31:拳头检测器处于伺候状态,监视每一帧视频图像;
step32:使用步骤2)的拳头图像的检测方法对图像进行检测,如果检测到拳头,提示用户开始具体的手势指令,并将监视视频的控制权交给应用程序,应用程序启动普通手势识别器进行手势的跟踪和识别;
step33:如果在某个完整的手势序列完成之前发生了手势丢失的情况,应用程序提示用户发生了跟踪丢失的情况,开始倒计时,并将监视视频的控制权交给拳头检测器,跳转到step35,恢复跟踪;
step34:如果在完整的手势指令完成之后,新的手势指令开始之前发生了丢失,则跳转到step31;
step35:如果用户出示拳头并被检测到,跳转回step32,继续进行检测到拳头后的步骤;
step36:如果超过预设的时间,用户没有出示拳头或者拳头没有被检测到,则视为用户取消了本次手势指令,跳转回step31;
拳头检测器由若干层子检测器级联组成;
所述基于拳头检测作为辅助信息的手势跟踪方法还包括:当检测到拳头,就告诉用户发出手势指令,然后跟踪用户的指令进行下一步操作;如果发生手势跟踪丢失,用户通过拳头恢复跟踪;
应用程序通过文字、语音或者图标方式对用户进行提示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310283649.4A CN103366188B (zh) | 2013-07-08 | 2013-07-08 | 一种基于拳头检测作为辅助信息的手势跟踪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310283649.4A CN103366188B (zh) | 2013-07-08 | 2013-07-08 | 一种基于拳头检测作为辅助信息的手势跟踪方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103366188A CN103366188A (zh) | 2013-10-23 |
CN103366188B true CN103366188B (zh) | 2017-07-07 |
Family
ID=49367488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310283649.4A Active CN103366188B (zh) | 2013-07-08 | 2013-07-08 | 一种基于拳头检测作为辅助信息的手势跟踪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103366188B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105825170B (zh) * | 2016-03-10 | 2019-07-02 | 浙江生辉照明有限公司 | 往复性手势的检测方法和装置 |
CN112487844A (zh) * | 2019-09-11 | 2021-03-12 | 华为技术有限公司 | 手势识别方法、电子设备、计算机可读存储介质和芯片 |
CN111367415B (zh) * | 2020-03-17 | 2024-01-23 | 北京明略软件系统有限公司 | 一种设备的控制方法、装置、计算机设备和介质 |
CN113449610A (zh) * | 2021-06-08 | 2021-09-28 | 杭州格像科技有限公司 | 一种基于知识蒸馏和注意力机制的手势识别方法和系统 |
CN113569691B (zh) * | 2021-07-19 | 2024-09-27 | 芯算一体(深圳)科技有限公司 | 人头检测模型生成方法、装置、人头检测模型及人头检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101661329A (zh) * | 2009-09-22 | 2010-03-03 | 北京中星微电子有限公司 | 智能终端的操作控制方法及装置 |
CN102855488A (zh) * | 2011-06-30 | 2013-01-02 | 北京三星通信技术研究有限公司 | 三维手势识别方法和系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012139268A1 (en) * | 2011-04-11 | 2012-10-18 | Intel Corporation | Gesture recognition using depth images |
CN102200834B (zh) * | 2011-05-26 | 2012-10-31 | 华南理工大学 | 面向电视控制的指尖鼠标交互方法 |
CN102298443B (zh) * | 2011-06-24 | 2013-09-25 | 华南理工大学 | 结合视频通道的智能家居语音控制系统及其控制方法 |
CN102831439B (zh) * | 2012-08-15 | 2015-09-23 | 深圳先进技术研究院 | 手势跟踪方法及系统 |
CN103017730B (zh) * | 2012-11-30 | 2015-04-01 | 中兴通讯股份有限公司 | 一种单摄像头测距的方法和系统 |
-
2013
- 2013-07-08 CN CN201310283649.4A patent/CN103366188B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101661329A (zh) * | 2009-09-22 | 2010-03-03 | 北京中星微电子有限公司 | 智能终端的操作控制方法及装置 |
CN102855488A (zh) * | 2011-06-30 | 2013-01-02 | 北京三星通信技术研究有限公司 | 三维手势识别方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN103366188A (zh) | 2013-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103366188B (zh) | 一种基于拳头检测作为辅助信息的手势跟踪方法 | |
US10685245B2 (en) | Method and apparatus of obtaining obstacle information, device and computer storage medium | |
CN110706509B (zh) | 车位及其方向角度检测方法、装置、设备及介质 | |
CN110796018B (zh) | 一种基于深度图像和彩色图像的手部运动识别方法 | |
WO2019047596A1 (zh) | 一种用于驾驶模式切换的方法和装置 | |
CN105931263A (zh) | 一种目标跟踪方法及电子设备 | |
WO2016168786A1 (en) | Augmented interface authoring | |
CN103677274A (zh) | 一种基于主动视觉的互动投影方法及系统 | |
CN111783640A (zh) | 检测方法、装置、设备以及存储介质 | |
CN101159018A (zh) | 一种图像特征点定位方法及装置 | |
CN107745711B (zh) | 一种在自动驾驶模式下确定路线的方法和装置 | |
CN103402080A (zh) | 一种楼宇对讲系统 | |
CN117292716B (zh) | 基于声纹与红外特征融合的变压器故障诊断方法与系统 | |
CN111656313A (zh) | 屏幕显示切换方法、显示设备、可移动平台 | |
CN111914667A (zh) | 一种吸烟检测方法及装置 | |
CN110059542A (zh) | 基于改进的Resnet的人脸活体检测的方法及相关设备 | |
CN111435422A (zh) | 动作识别方法、控制方法及装置、电子设备和存储介质 | |
US20230292013A1 (en) | Solar blind imaging | |
US11410474B2 (en) | Vehicle inspection using augmented reality (AR) | |
CN110073364A (zh) | 基于rgbd感测的对象检测系统及其方法 | |
CN114241384A (zh) | 连续帧图片标注方法、电子设备及存储介质 | |
CN108613672A (zh) | 对象定位方法、对象定位系统和电子设备 | |
CN117348773A (zh) | 一种基于空间扫描的设备操作ar模拟考核系统 | |
KR20190119205A (ko) | 전자 장치 및 그 제어 방법 | |
KR102036785B1 (ko) | 엘리베이터의 유지 및 보수의 공정을 제어하기 위한 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20190827 Address after: 401120, Chongqing, Yubei District, Xiantao street, No. 19 East Valley Road Patentee after: Zhongke Chuang Da (Chongqing) Automotive Technology Co., Ltd. Address before: 100191 Beijing Haidian District Lung Cheung Road No. 1 Tai Xiang 4 storey commercial building Patentee before: Thunder Software Technology Co., Ltd. |
|
TR01 | Transfer of patent right |