CN104167006B - 一种任意手形的手势跟踪方法 - Google Patents

一种任意手形的手势跟踪方法 Download PDF

Info

Publication number
CN104167006B
CN104167006B CN201410328149.2A CN201410328149A CN104167006B CN 104167006 B CN104167006 B CN 104167006B CN 201410328149 A CN201410328149 A CN 201410328149A CN 104167006 B CN104167006 B CN 104167006B
Authority
CN
China
Prior art keywords
pixel
image
skin color
type
prospect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410328149.2A
Other languages
English (en)
Other versions
CN104167006A (zh
Inventor
徐向民
罗雅愉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201410328149.2A priority Critical patent/CN104167006B/zh
Publication of CN104167006A publication Critical patent/CN104167006A/zh
Application granted granted Critical
Publication of CN104167006B publication Critical patent/CN104167006B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种任意手形的手势跟踪方法,该方法包括如下步骤:(1)初始化背景模型;(2)初始化手的位置区域;(3)根据手的位置区域得到目标区域的统计直方图;(4)根据统计直方图对当前时刻读入的图像做直方图反向投影,得到肤色概率图;(5)将当前帧分别与前一帧、背景模型做差,得到差分图像;(6)根据差分图像将各像素点标记为不同类型,得到前景概率图;(7)由前景概率图与肤色概率图得到运动肤色概率图;(8)对运动肤色概率图进行聚类,定位人手的精确位置;(9)根据跟踪结果对背景模型进行更新。本发明中的方法能简单有效地进行人手跟踪,对使用者的手形要求不高,且运算复杂度底,更富有人性化。

Description

一种任意手形的手势跟踪方法
技术领域
本发明涉及手势跟踪技术领域,具体涉及一种任意手形的人手跟踪方法。
背景技术
手势跟踪是计算机视觉领域的重要部分,随着智能家居概念的提出,手势交互技术正逐步成为一种重要的人机交互手段。研究人员通过赋予计算机理解人手动作的理解能力,使得计算机通过采集人手图像序列,对图像序列处理,获取对人手动作的识别,并且在交互系统中得到智能响应。
在手势跟踪过程中存在手的非刚性形变、环境变化、背景干扰以及类肤色干扰等问题。目前国内外在手势跟踪这个研究领域也取得了丰富的成果,针对任意手形跟踪,现有的较为广泛使用的跟踪方法主要分为:(1)结合Camshift、卡尔曼滤波的人手跟踪算法;(2)基于压缩感知技术的手势跟踪方法;(3)基于特征提取和粒子滤波的人手跟踪方法。第一种方法对手形的变化要求不高,但是跟踪精度不高,且容易受得背景类肤色干扰;后两种方法在固定手形的前提下跟踪效果良好,精度高,可应付一定的形变,但相对而言人手的形状和运动方法受到约束。这些都使得用户在做手势交互中时无法得到最自然的交互体验,在交互过程中,用户所处的复杂背景影响交互效果,对手形变化和运动的要求又会给用户带来疲劳感。针对这些问题,本发明提出了一种任意手形的手势跟踪算法。采用多种颜色空间相结合的自适应肤色分割,建立背景模型,利用当前帧帧差与背景差的结合得到分割完整的手,并且实时更新背景模型,准确地找到运动的手势目标,排除干扰。实验结果证明,该算法鲁棒性强,实时性高,抗干扰能力强。
发明内容
本发明提供一种任意手形的手势跟踪方法,基于自适应多颜色空间多通道分割和帧差与背景建模相结合的方法,在空间中对任意的自由手形进行跟踪,在跟踪过程当中,手形可以任意形变,算法能对其进行准确定位跟踪,实现自然的手势交互,具体技术方案如下。
一种任意手形的手势跟踪方法,该方法包括如下步骤:
(1)摄像头实时采集用户操作范围以内的视频图像,将摄像头启动后的第一帧作为初始化的背景模型;
(2)根据已训练好的检测五指张开的手掌分类器检测到人手的结果,初始化手的位置区域,并计算出人手的面积大小;
(3)根据初始化手的位置区域得到自适应目标区域的颜色统计直方图;
(4)根据颜色统计直方图对当前时刻摄像头读入的图像做颜色直方图反向投影,得到肤色概率图;
(5)将当前帧图像分别与前一帧图像、背景模型图像做差,得到两幅差分图像;
(6)根据两幅差分图像的灰度图上每个像素点的灰度值大小,将对应的像素点标记为相应类型,所述类型包括前景、背景、空洞或重影,并得到前景概率图;
(7)由前景概率图与肤色概率图中得到运动肤色概率图;
(8)对运动肤色概率图进行聚类,定位人手中心的精确位置,并结合人手的面积大小,得到最终的跟踪结果;根据跟踪结果将整幅图像的像素点所属的目标类型进一步细分,标记目标类型,所述目标类型包括:目标、前景、背景、空洞或重影,跟踪结果所在的区域以外的部分设定为背景;
(9)根据跟踪结果和像素标记类型对背景模型进行更新;
(10)若跟踪未结束,则回到步骤(4)。
在其中一个实施例中,所述的颜色统计直方图和颜色直方图反向投影,所使用的颜色空间是HSV和YCrCb,所使用的颜色通道是H、S、Cr,得到三个颜色通道的反向投影图分别为Sh、Ss、Scr,对三个反射投影图进行加权,Wh、Ws、Wcr是对应三个颜色通道H、S、Cr的权值,再求和,利用公式S=Wh*Sh+Ws* Ss +Wcr* Scr得到肤色概率图S。
在其中一个实施例中,所述根据两幅差分图像的结果得到像素标志和前景概率图包括如下步骤:计算采集到的当前帧图像与前一帧图像的帧间差分图像D;计算采集到的当前帧图像与背景模型图像的差分图像IB。
在其中一个实施例中,所述的设定阈值Th1,Th2,每个位置像素点对应两幅图像上的值分别与两个阈值Th1和Th2的比较,标志每个像素点所属类型;根据每个像素点所属的类型对前景图不同的概率值(p1、p2、p3、p4)。
在其中一个实施例中,所述的根据D(x,y)和IB(x,y)与两个阈值Th1和Th2的比较,标志每个像素点所属类型,分别为:前景、空洞、重影、背景。
在其中一个实施例中,所述的由前景概率图Pb与肤色概率图Ps,利用公式P=Pb *Ps得到概率图P,对运动肤色概率图进行分割阈值和归一化处理后得到运动肤色概率图P。
在其中一个实施例中,所述跟踪结果和像素标记类型对背景模型进行更新,即根据每个像素点所属标记类型进行自适应背景更新,每种标记类型(目标、前景、空洞、重影、背景)的更新率不同。结合前一帧背景模型和当前帧灰度图与对应的更新率,利用如下式子对背景模板进行实时更新,背景更新公式:
本发明与现有技术相比,具有如下优点和技术效果:
(1)本发明实现了在普通单目2D摄像头下,任意可变化手形的人手跟踪;(2)采用自适应多颜色空间多通道分割,提高肤色分割的精确度;(3)采用帧差与背景建模相结合的方法,提高前景分割的完整度;(4)算法简单高效,实时性高,运算复杂度低。
附图说明
图1为任意手形跟踪方法整体流程。
具体实施方式
以下结合附图对本发明的具体实施做进一步的说明。
请参阅图1,实施例提供的一种任意手形的手势跟踪方法,包括以下步骤:
步骤S101:摄像头实时采集视频图像,初始化背景模型。具体的,该步骤采集视频第一帧作为初始化的背景图像B0
步骤S102:根据手掌分类器检测的人手结果,初始化手的位置区域,并计算出人手的面积大小R,在本实施例中,利用人手检测分类器在图像中搜索人手位置,为了降低误检概率,设置连续检测到人手的阈值个数THn,只有当连续N帧(N>THn)在图像上同一敏感区域内检测到人手,人手的初始化才有效,该人手获取控制权。
步骤S103:由初始化的手的位置区域中将得该区域块的颜色空间由RGB分别转为HSV颜色空间和YCrCb颜色空间,选取H、S、Cr通道进行直方图统计,分别得到对应的自适应目标区域的统计直方图HistH、HistS和HistCr。
步骤S104:根据步骤中的统计直方图HistH、HistS和HistCr,得到当前输入图像在三个颜色通道的反向投影图,分别为Sh、Ss、Scr,对三个反射投影图分别进行加权Wh、Ws、Wcr后,求和得,公式S=Wh*Sh+Ws* Ss +Wcr* Scr得到肤色概率图S。
步骤S105:根据两幅差分图像的结果得到像素标志和前景概率图,具体的,根据公式:计算采集到的当前帧图像与前一帧图像的帧间差分图像D,根据公式:计算采集到的当前帧图像与背景模型图像的差分图像IB。
步骤S106:设定阈值Th1,Th2,每个位置像素点对应两幅图像上的值分别为D(x,y)和IB(x,y),根据D(x,y)和B(x,y)与两个阈值Th1和Th2做如下比较:
前景:D(x,y) >= Th1 &&IB(x,y) > Th2;
空洞:D(x,y) < Th1 &&IB(x,y) >= Th2;
重影:D(x,y) >= Th1 &&IB(x,y) < Th2;
背景:D(x,y) < Th1 &&IB(x,y) < Th2;
根据每个像素点所属的类型对前景图不同的概率值(p1、p2、p3、p4)标志每个像素点所属类型。
步骤S107:由前景概率图与肤色概率图得到运动肤色概率图,具体方法:定义前景概率图Pb,肤色概率图Ps,根据公式:P=Pb * Ps计算运动肤色概率图上每个像素点(x,y)对应的概率值大小,然后设置阈值THp,对运动肤色概率图上所有的点,满足P(x,y)<THp的情况,都设置P(x,y)=0。最后将运动肤色概率图P上的每个像素点的概率值做归一化处理,使所有概率值被归一化为0~1之间。
步骤S108:由前景概率图与肤色分割图得到运动肤色概率图P=Pb * Ps,对运动肤色概率图进行多次迭代聚类,定位人手中心的精确位置,并结合人手的面积大小,得到最终的跟踪结果。根据跟踪结果(将整幅图像的像素点所属的目标类型进一步细分,标记目标类型,所述目标类型包括:目标、前景、背景、空洞或重影,跟踪结果所在的区域以外的部分设定为背景。
步骤S109:根据跟踪结果和像素标记类型对背景模型进行更新,即根据每个像素点所属标记类型进行自适应背景更新,每种标记类型的更新率不同。根据实际应用情况,目标、前景、空洞、重影、背景的更新率设置如下:
其中分别代表前景、空洞、重影、背景对应像素点的更新率大小,并且满足。然后根据像素点所属的不同类型,对自适应调整背景模型每个像素点的更新权重w。最后,依据公式:对背景进行实时更新。
步骤S110:若跟踪未结束,则回到步骤S104。
以上仅为本发明的具体实施例,并不以此限定本发明的保护范围;在不违反本发明构思的基础上所作的任何替换与改进,均属于本发明的保护范围。

Claims (4)

1.一种任意手形的手势跟踪方法,其特征在于,该方法包括如下步骤:
(1)摄像头实时采集用户操作范围以内的视频图像,将摄像头启动后的第一帧作为初始化的背景模型;
(2)根据已训练好的检测五指张开的手掌分类器检测到人手的结果,初始化手的位置区域,并计算出人手的面积大小;
(3)根据初始化手的位置区域得到自适应目标区域的颜色统计直方图;所述颜色统计直方图所使用的颜色空间是HSV和YCrCb,所使用的颜色通道是H、S、Cr;
(4)根据颜色统计直方图对当前时刻摄像头读入的图像做颜色直方图反向投影,得到肤色概率图;具体是:三个颜色通道H、S、Cr的颜色直方图反向投影图分别为Sh、Ss、Scr,对三个反向投影图分别进行加权,再求和,得到肤色概率图S,S=Wh*Sh+Ws*Ss+Wcr*Scr,其中Wh、Ws、Wcr是对应三个颜色通道H、S、Cr的权值;
(5)将当前帧图像分别与前一帧图像、背景模型图像做差,得到两幅差分图像;所述的两幅差分图像通过如下步骤获得:
A:计算采集到的当前帧图像灰度图It与前一帧图像灰度图It-1的帧间差分图像;
B:计算采集到的当前帧图像灰度图It与背景模型图像Bt-1的差分图像;
(6)根据两幅差分图像的灰度图上每个像素点的灰度值大小,将对应的像素点标记为相应类型,所述类型包括前景、背景、空洞或重影,并得到前景概率图;标记像素类型和得到前景概率图的过程包括:
A:设定阈值Th1,Th2,每个位置像素点对应两幅图像上的值分别为D(x,y)和IB(x,y),根据D(x,y)、IB(x,y)分别与两个阈值Th1、Th2的比较,标记每个像素点所属类型;
B:根据每个像素点所属的类型对像素点赋予不同的概率值,前景、背景、空洞和重影类型的像素点对应的概率值分别为p1、p2、p3、p4,得到前景概率图;
(7)由前景概率图与肤色概率图中得到运动肤色概率图;
(8)对运动肤色概率图进行聚类,定位人手中心的精确位置,并结合人手的面积大小,得到最终的跟踪结果;根据跟踪结果将整幅图像的像素点所属的目标类型进一步细分,标记目标类型,所述目标类型包括:目标、前景、背景、空洞或重影,跟踪结果所在的区域以外的部分设定为背景;
(9)根据跟踪结果和像素标记类型对背景模型进行更新;
(10)若跟踪未结束,则回到步骤(4)。
2.根据权利要求1所述的一种任意手形的手势跟踪方法,其特征在于根据D(x,y)、IB(x,y)分别与两个阈值Th1、Th2的比较,标记每个像素点所属类型,具体判断依据:
前景:D(x,y)>=Th1&&IB(x,y)>Th2;
空洞:D(x,y)<Th1&&IB(x,y)>=Th2;
重影:D(x,y)>=Th1&&IB(x,y)<Th2;
背景:D(x,y)<Th1&&IB(x,y)<Th2。
3.根据权利要求1所述的一种任意手形的手势跟踪方法,其特征在于,所述步骤(7)由前景概率图与肤色概率图中得到运动肤色概率图的过程包括如下步骤:
A:定义前景概率图Pb,肤色概率图Ps;
B:运动肤色概率图P上每个像素点(x,y)对应的概率值大小为P=Pb*Ps;
C:设置阈值THp,对运动肤色概率图上所有的像素点,当P(x,y)<THp的情况,都设置P(x,y)=0;
D:将运动肤色概率图P上的每个像素点的概率值做归一化处理,使所有概率值被归一化为0~1之间。
4.根据权利要求1所述的一种任意手形的手势跟踪方法,其特征在于,所述步骤(9)根据跟踪结果和像素标记类型对背景模型进行更新,即根据每个像素点所属标记类型进行自适应背景更新,每种标记类型的更新率不同,
A:根据实际应用情况,目标、前景、空洞、重影、背景更新率设置如下:
其中w1,w2,w3,w4分别代表前景、空洞、重影、背景对应像素点的更新率大小,并且满足w1<w2<w3<w4
B:根据像素点所属类型,对背景模型自适应调整像素的更新权重;结合前一帧背景模型Bt-1和当前帧灰度图It与对应的更新率w,利用如下式子对背景模板进行实时更新:
Bt(i,j)=Bt-1(i,j)×w+It(i,j)×(1-w)。
CN201410328149.2A 2014-07-10 2014-07-10 一种任意手形的手势跟踪方法 Active CN104167006B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410328149.2A CN104167006B (zh) 2014-07-10 2014-07-10 一种任意手形的手势跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410328149.2A CN104167006B (zh) 2014-07-10 2014-07-10 一种任意手形的手势跟踪方法

Publications (2)

Publication Number Publication Date
CN104167006A CN104167006A (zh) 2014-11-26
CN104167006B true CN104167006B (zh) 2017-04-19

Family

ID=51910797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410328149.2A Active CN104167006B (zh) 2014-07-10 2014-07-10 一种任意手形的手势跟踪方法

Country Status (1)

Country Link
CN (1) CN104167006B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844096B (zh) * 2016-03-19 2018-10-23 上海大学 基于图像处理技术的手功能评价方法
CN106296676A (zh) * 2016-08-04 2017-01-04 合肥景昇信息科技有限公司 基于视觉交互的对象定位方法
CN107357422B (zh) * 2017-06-28 2023-04-25 深圳先进技术研究院 摄像机-投影交互触控方法、装置及计算机可读存储介质
CN107729823B (zh) * 2017-09-28 2020-03-17 江南大学 一种基于e-soinn网络的在线人机交互方法
CN109977734B (zh) * 2017-12-28 2023-06-06 华为技术有限公司 图像处理方法和装置
CN110458045A (zh) * 2019-07-22 2019-11-15 浙江大华技术股份有限公司 响应概率直方图的获取方法、图像处理方法以及装置
CN111639641B (zh) * 2020-04-30 2022-05-03 中国海洋大学 一种针对未着装于人体的服装区域获取方法及装置
CN112232332B (zh) * 2020-12-17 2021-04-13 四川圣点世纪科技有限公司 一种基于视频序列的非接触式手掌检测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102789568A (zh) * 2012-07-13 2012-11-21 浙江捷尚视觉科技有限公司 一种基于深度信息的手势识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514435A (zh) * 2012-06-29 2014-01-15 富士通株式会社 手检测方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102789568A (zh) * 2012-07-13 2012-11-21 浙江捷尚视觉科技有限公司 一种基于深度信息的手势识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HAND TRAJECTORY-BASED GESTURE SPOTTING AND RECOGNITION USING HMM;Mahmoud Elmezain 等;《2009 16th IEEE International Conference on Image Processing (ICIP)》;20091110;第3577-3580页 *
基于Camshift和Kalman滤波的仿人机器人手势跟踪;彭娟春 等;《上海交通大学学报》;20060728;第40卷(第7期);第1161-1165页,第1节 *
手势识别跟踪系统的硬件架构研究及FPGA实现;黄彬;《中国优秀硕士学位论文全文数据库 信息科技辑》;20140615;2.3.1-2.3.3节,4.2节 *
视频监控系统中运动目标的实时检测;李广伦 等;《计算机工程》;20090905;第35卷(第17期);第217-222页,第2节 *

Also Published As

Publication number Publication date
CN104167006A (zh) 2014-11-26

Similar Documents

Publication Publication Date Title
CN104167006B (zh) 一种任意手形的手势跟踪方法
CN101593022B (zh) 一种基于指端跟踪的快速人机交互方法
CN110688987B (zh) 一种行人位置检测与跟踪方法及系统
CN105740945B (zh) 一种基于视频分析的人群计数方法
CN103514441B (zh) 基于移动平台的人脸特征点定位跟踪方法
CN103020992B (zh) 一种基于运动颜色关联的视频图像显著性检测方法
CN105354791B (zh) 一种改进的自适应混合高斯前景检测方法
CN109063559A (zh) 一种基于改良区域回归的行人检测方法
CN111158467A (zh) 一种手势交互方法和终端
CN105354862A (zh) 一种监控视频中运动目标的阴影检测方法、系统
Žemgulys et al. Recognition of basketball referee signals from real-time videos
CN110688965B (zh) 基于双目视觉的ipt模拟训练手势识别方法
CN102592115B (zh) 一种人手定位方法及系统
CN103098076A (zh) 电视机控制用手势识别系统
CN106340023A (zh) 图像分割的方法和装置
CN103413120A (zh) 基于物体整体性和局部性识别的跟踪方法
CN104821010A (zh) 基于双目视觉的人手三维信息实时提取方法及系统
CN108876820A (zh) 一种基于均值漂移的遮挡条件下移动目标追踪方法
CN103500456A (zh) 一种基于动态贝叶斯模型网络的对象跟踪方法和设备
Gu et al. Hand gesture interface based on improved adaptive hand area detection and contour signature
CN104866826A (zh) 一种基于knn和像素比梯度特征的静态手语识别方法
CN102799855B (zh) 基于视频流的人手定位方法
CN102006462A (zh) 利用运动信息的快速监控视频增强方法及其实现装置
CN109102520A (zh) 基于模糊均值聚类与卡尔曼滤波跟踪相结合的运动目标检测方法
CN103020631B (zh) 基于星型模型的人体运动识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant