CN101901350B - 一种基于特征向量的静态手势识别方法 - Google Patents

一种基于特征向量的静态手势识别方法 Download PDF

Info

Publication number
CN101901350B
CN101901350B CN2010102383683A CN201010238368A CN101901350B CN 101901350 B CN101901350 B CN 101901350B CN 2010102383683 A CN2010102383683 A CN 2010102383683A CN 201010238368 A CN201010238368 A CN 201010238368A CN 101901350 B CN101901350 B CN 101901350B
Authority
CN
China
Prior art keywords
gesture
point
vector
angle
sigma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010102383683A
Other languages
English (en)
Other versions
CN101901350A (zh
Inventor
毛峡
姜磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN2010102383683A priority Critical patent/CN101901350B/zh
Publication of CN101901350A publication Critical patent/CN101901350A/zh
Application granted granted Critical
Publication of CN101901350B publication Critical patent/CN101901350B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明一种基于特征向量的静态手势识别方法,可概括为:首先在YCbCr颜色空间中用肤色特性对手势进行分割处理,然后选取特征向量描述手势,进行长度和角度归一化处理,根据特征向量确定手势中指尖的位置,最终用指尖和手势中心的相对位置对手势进行识别。该方法具有旋转不变性和缩放不变性,有很好的实时性,满足人机交互应用要求。

Description

一种基于特征向量的静态手势识别方法
(一)技术领域:
本发明涉及一种静态手势识别方法,尤其是一种基于特征向量的静态手势识别方法。属于人机交互领域。
(二)背景技术:
随着人机交互技术的发展,自然和谐的人机交互方式日益受到人们的重视。基于视觉的手势识别技术,以其自然性、简洁性和直接性的特点,提供了一个自然的人机交互接口,受到了研究者的重视。由于人手非刚体的特性,传统的具有旋转不变性和缩放不变性的识别方法,例如傅立叶描述子、图像不变矩等,在手势识别的应用中遇到了种种问题,不能满足人机交互对手势识别实时性的要求。
经过对现有的文献资料研究发现,覃文军等2009年在《东北大学学报(自然科学版)》第30卷第9期发表的论文《基于傅立叶描述子-BP神经网络的手势识别方法》中提出了一种基于傅立叶描述子和BP神经网路的手势识别方法,首先通过多特征融合的手势分割方法提取手势区域,然后结合傅立叶描述子较好的轮廓描绘能力和BP神经网络较好的自学习能力,用傅立叶描述子和BP神经网络的方法对手势进行识别。该论文的方法得到了较高的识别率,但是算法计算量大,识别一幅图像需要4.5秒时间,远不能达到实时应用的要求;同时由于傅立叶描述子适用于对刚体的轮廓描述,因此应用于手势识别中,并不能很好的描述不同角度下的同一手势,其算法的鲁棒性差。
(三)发明内容:
本发明的目的在于提出一种基于特征向量的静态手势识别方法,以解决现有技术在手势识别应用中计算量大、识别结果受手势方向影响大的问题,克服现有技术中的缺陷。
本发明的技术方案概括为:首先在YCbCr颜色空间中用肤色特性对手势进行分割处理,然后选取特征向量描述手势,进行长度和角度归一化处理,根据特征向量确定手势中指尖的位置,最终用指尖和手势中心的相对位置对手势进行识别。
本发明一种基于特征向量的静态手势识别方法,其具体步骤如下:
步骤1:手势分割
采用Logitech QuickCam Pro9000摄像头采集图像,获得图像尺寸为320×240,图像格式为JPEG,拍摄背景无类似肤色的区域,被拍摄的用户穿非肤色长袖衣服。对得到的图像,首先从RGB颜色空间转化到YCbCr颜色空间,之后选择Cb、Cr分量的中心值和阈值,其中Cb分量中心值Cbmid=115,Cr分量中心值Crmid=145,阈值lthres=15,对输入图像的各像素计算其Cb、Cr值与中心值的欧式距离dist:
dist = ( Cb - Cb mid ) 2 + ( Cr - Cr mid ) 2 - - - ( 1 )
若dist小于相应的阈值lthres,则将该像素的值设为1,否则将其值设为0,将输入图像转化为二值图像。对得到的二值图像进行一次腐蚀膨胀处理,并假定图像中最大连通区域为手势所在区域。
步骤2:获得手势的中心、方向和边缘
将手势图像转化为二值图像后,通过计算获得手势的中心、方向,并提取手势的边缘。具体方法如下:
由式(2)和式(3)计算手势中心点坐标x和y:
x = Σ i = 1 n Σ j = 1 m jB [ i , j ] Σ i = 1 n Σ j = 1 m B [ i , j ] - - - ( 2 )
y = Σ i = 1 n Σ j = 1 m iB [ i , j ] Σ i = 1 n Σ j = 1 m B [ i , j ] - - - ( 3 )
式中,B[i,j]表示图像中第i行第j列的值,图像的大小为n×m。
手势方向θ的计算式如下:
θ = 1 2 tan - 1 [ 2 μ 11 μ 20 - μ 02 ] - - - ( 4 )
式中,μ11、μ20、μ02为图像的二阶中心矩。
用Canny算子从二值图像中提取手势的边缘。
步骤3:选取特征向量
计算手势中心点和边缘各点连线的角度,找出角度与手势方向角最接近的点,以该点为起始点,对手势边界进行n等分,得边界上的n个点。以手势中心点为起始点,边界上的n个点之一为终止点构造向量,用n个向量来表征该手势。为消除输入图像中手势的尺寸对识别的影响,选取特征向量中长度最长的向量,将其长度设置为100,将其它向量的长度归一化到(0,100)。经实验,采用n=60。
步骤4:定位指尖位置
将步骤3得到的特征向量视为一个首尾相连的向量组,消除起始点选择对向量组的影响,保证特征向量对旋转不敏感。从向量组中求出局部极大值和局部极小值,其中局部极大值对应的点为指尖点候选点,而其相邻的两个局部极小值点的角度差为手指所在区域的角度。选定手指长度阈值lth和角度阈值θth,用指尖到手势中心的长度l和手指所在区域的角度θ与设定阈值相比较来判定指尖候选点是否为指尖。当l>lth且θ<θth时,则该特征向量的终点所在位置为指尖位置,否则该点为非指尖。经实验,采用lth=53,θth=1.87。
步骤5:手势识别
根据步骤2和步骤4得到手势中心点和指尖位置,构造一组以手势中心点为起点,指尖位置为终点的向量。找出这些向量中两两间最大的夹角,以夹角最大的两个向量中的一个为起始向量,将其角度设置为0,在保证各向量相对角度不变的前提下,使其它向量与起始向量的逆时针夹角和之和最小,得到唯一的归一化结果。得到角度归一化的向量组之后,确定手势包含的手指数;根据手指的相对位置和长度信息,对包含相同手指数的不同手势进行区分。
本发明优点及功效在于:对手势的识别具有旋转不变性和缩放不变性,计算简单,满足实时处理要求,适用于不同人手的不同手势的识别。
(四)附图说明:
图1为本发明方法的算法框图。
图2为手势的中心和方向示意图,图中菱形代表手势的中心,图中箭头代表手势的方向。
图3为手势的特征向量示意图。
其中,图3(a)为2手指手势特征向量示意图;
图3(b)为4手指手势特征向量示意图。
图4为指尖位置图,图中菱形为本发明方法定位的指尖位置。
其中,图4(a)为3手指定位结果图;
图4(b)为5手指定位结果图;
(五)具体实施方法:
本发明的技术方案概括为:首先在YCbCr颜色空间中用肤色特性对手势进行分割处理,然后选取特征向量描述手势,进行长度和角度归一化处理,根据特征向量确定手势中指尖的位置,最终用指尖和手势中心的相对位置对手势进行识别。
下面结合附图对本发明的技术方案作进一步的详细描述。主要步骤如下:
步骤1:手势分割
本发明采用Logitech QuickCam Pro9000摄像头采集图像,获得彩色图像尺寸为320×240,图像格式为JPEG,拍摄背景无类似肤色的区域,被拍摄的用户穿非肤色长袖衣服。对得到的手势图像,首先从RGB颜色空间转化到YCbCr颜色空间,之后选择Cb、Cr分量的中心值和阈值,其中Cb分量中心值Cbmid=115,Cr分量中心值Crmid=145,阈值lthres=15,对输入图像的各像素计算其Cb、Cr值与中心值的欧式距离dist:
dist = ( Cb - Cb mid ) 2 + ( Cr - Cr mid ) 2 - - - ( 1 )
若dist小于相应的阈值lthres,则将该像素值设为1,否则将其值设为0,从而将输入图像转化为二值图像。对得到的二值图像进行一次腐蚀膨胀处理,并假定图像中最大连通区域为手势所在区域。
步骤2:获得手势的中心、方向和边缘
将手势图像转化为二值图像后,通过计算获得手势的中心、方向,并提取手势的边缘。
由式(2)和式(3)计算手势中心点坐标x和y:
x = Σ i = 1 n Σ j = 1 m jB [ i , j ] Σ i = 1 n Σ j = 1 m B [ i , j ] - - - ( 2 )
y = Σ i = 1 n Σ j = 1 m iB [ i , j ] Σ i = 1 n Σ j = 1 m B [ i , j ] - - - ( 3 )
式中,B[i,j]表示图像中第i行第j列的值,图像的大小为n×m。
手势方向θ的计算式如下:
θ = 1 2 tan - 1 [ 2 μ 11 μ 20 - μ 02 ] - - - ( 4 )
式中,μ11、μ20、μ02为图像的二阶中心矩。
用Canny算子从二值图像中提取手势的边缘。
图2为手势的中心和方向示意图,图中菱形代表手势的中心,图中箭头代表手势的方向。
步骤3:选取特征向量
计算手势中心点和边缘各点连线的角度,找出角度与手势方向角最接近的点,以该点为起始点,对手势边界进行n等分,得边界上的n个点。以手势中心点为起始点,边界上的n个点之一为终止点构造向量,用n个向量来表征该手势。为消除输入图像中手势的尺寸对识别的影响,选取特征向量中长度最长的向量,将其长度设置为100,将其它向量的长度归一化到[0,100]。经实验,采用n=60。
图3(a)为对2手指手势选取特征向量结果图,图3(b)为对4手指手势选取特征向量结果图,
步骤4:定位指尖位置
将步骤3得到的特征向量视为一个首尾相连的向量组,消除起始点选择对向量组的影响,保证特征向量对旋转不敏感。从向量组中求出局部极大值和局部极小值,其中局部极大值对应的点为指尖点候选点,而其相邻的两个局部极小值点的角度差为手指所在区域的角度。选定手指长度阈值lth和角度阈值θth,用指尖到手势中心的长度l和手指所在区域的角度θ与设定阈值相比较来判定指尖候选点是否为指尖。当l>lth且θ<θth时,则该特征向量的终点所在位置为指尖位置,否则该点为非指尖。经实验,采用lth=53,θth=1.87。
图4(a)为对3手指手势的指尖定位结果图,图4(b)为对5手指手势的指尖定位结果图。
步骤5:手势识别
根据步骤2和步骤4得到手势中心点和指尖位置,构造一组以手势中心点为起点,指尖位置为终点的向量。找出这些向量中两两间最大的夹角,以夹角最大的两个向量中的一个为起始向量,将其角度设置为0,在保证各向量相对角度不变的前提下,使其它向量与起始向量的逆时针夹角和之和最小,得到唯一的归一化结果。得到角度归一化的向量组之后,确定了手势包含的手指数;根据手指的相对位置和长度信息,对包含相同手指数的不同手势进行区分。本发明方法识别一幅手势图像耗时0.4秒左右,而覃文军等的方法识别一幅手势图像耗时在4.5秒左右。在本发明优点及功效在于:对手势的识别具有旋转不变性和缩放不变性,计算简单,满足实时处理要求,有很好的识别率。
说明书附图中出现的英文符号,其含义如下:
l:用指尖到手势中心的长度;
θ:手指所在区域的角度;
lth:手指长度阈值,设为53;
θth:角度阈值,设为1.87。

Claims (1)

1.一种基于特征向量的静态手势识别方法,其特征在于,包括下述几个步骤:
步骤1:手势分割
采用Logitech QuickCam Pro9000摄像头采集图像,获得图像尺寸为320×240,图像格式为JPEG,拍摄背景无类似肤色的区域,被拍摄的用户穿非肤色长袖衣服;对得到的图像,首先从RGB颜色空间转化到YCbCr颜色空间,之后选择Cb、Cr分量的中心值和阈值,其中Cb分量中心值Cbmid=115,Cr分量中心值Crmid=145,阈值lthres=15,对输入图像的各像素计算其Cb、Cr值与中心值的欧式距离dist:
dist = ( Cb - Cb mid ) 2 + ( Cr - Cr mid ) 2 - - - ( 1 )
若dist小于相应的阈值lthres,则将该像素的值设为1,否则将其值设为0,从而将输入图像转化为二值图像;对得到的二值图像进行一次腐蚀膨胀处理,并假定图像中最大连通区域为手势所在区域;
步骤2:获得手势的中心、方向和边缘
将手势图像转化为二值图像后,通过计算获得手势的中心、方向,并提取手势的边缘;
由式(2)和式(3)计算手势中心点坐标x和y:
x = Σ i = 1 n Σ j = 1 m jB [ i , j ] Σ i = 1 n Σ j = 1 m B [ i , j ] - - - ( 2 )
y = Σ i = 1 n Σ j = 1 m iB [ i , j ] Σ i = 1 n Σ j = 1 m B [ i , j ] - - - ( 3 )
式中,B[i,j]表示图像中第i行第j列的值,图像的大小为n×m;
手势方向θ的计算式如下:
θ = 1 2 tan - 1 [ 2 μ 11 μ 20 - μ 02 ] - - - ( 4 )
式中,μ11、μ20、μ02为图像的二阶中心矩;
用Canny算子从二值图像中提取手势的边缘;
步骤3:选取特征向量
计算手势中心点和边缘各点连线的角度,找出角度与手势方向角最接近的点,以该点为起始点,对手势边界进行n等分,得到边界上的n个点;以手势中心点为起始点,边界上的n个点之一为终止点构造向量,用这n个向量来表征该手势;为消除输入图像中手势的尺寸对识别的影响,选取特征向量中长度最长的向量,将其长度设置为100,将其它向量的长度归一化到(0,100);采用n=60;
步骤4:定位指尖位置
将步骤3得到的特征向量视为一个首尾相连的向量组,消除起始点选择对向量组的影响,保证特征向量对旋转不敏感;从向量组中求出局部极大值和局部极小值,其中局部极大值对应的点为指尖点候选点,而其相邻的两个局部极小值点的角度差为手指所在区域的角度;选定手指长度阈值lth和角度阈值θth,用指尖到手势中心的长度l和手指所在区域的角度θ与设定阈值相比较来判定指尖候选点是否为指尖;当l>lth且θ<θth时,则该特征向量的终点所在位置为指尖位置,否则该点为非指尖;采用lth=53,θth=1.87;
步骤5:手势识别
根据步骤2和步骤4得到手势中心点和指尖位置,构造一组以手势中心点为起点,指尖位置为终点的向量;找出这些向量中两两间最大的夹角,以夹角最大的两个向量中的一个为起始向量,将其角度设置为0,在保证各向量相对角度不变的前提下,使其它向量与起始向量的逆时针夹角和之和最小,得到唯一的归一化结果;得到角度归一化的向量组后,则确定了手势包含的手指数;根据手指的相对位置和长度信息,对包含相同手指数的不同手势进行区分。
CN2010102383683A 2010-07-23 2010-07-23 一种基于特征向量的静态手势识别方法 Expired - Fee Related CN101901350B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102383683A CN101901350B (zh) 2010-07-23 2010-07-23 一种基于特征向量的静态手势识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102383683A CN101901350B (zh) 2010-07-23 2010-07-23 一种基于特征向量的静态手势识别方法

Publications (2)

Publication Number Publication Date
CN101901350A CN101901350A (zh) 2010-12-01
CN101901350B true CN101901350B (zh) 2012-05-16

Family

ID=43226873

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102383683A Expired - Fee Related CN101901350B (zh) 2010-07-23 2010-07-23 一种基于特征向量的静态手势识别方法

Country Status (1)

Country Link
CN (1) CN101901350B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102938060A (zh) * 2012-12-07 2013-02-20 上海电机学院 动态手势识别系统及方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063618B (zh) * 2011-01-13 2012-10-31 中科芯集成电路股份有限公司 互动系统中的动态手势识别方法
JP5709228B2 (ja) 2011-04-28 2015-04-30 Necソリューションイノベータ株式会社 情報処理装置、情報処理方法及びプログラム
US8929612B2 (en) * 2011-06-06 2015-01-06 Microsoft Corporation System for recognizing an open or closed hand
CN102855461B (zh) * 2011-07-01 2016-05-25 株式会社理光 在图像中检测手指的方法及设备
CN102368290B (zh) * 2011-09-02 2012-12-26 华南理工大学 一种基于手指高级特征的手势识别方法
CN103049446B (zh) * 2011-10-13 2016-01-27 中国移动通信集团公司 一种图像检索方法及装置
CN103778407A (zh) * 2012-10-23 2014-05-07 南开大学 一种迁移学习框架下基于条件随机场的手势识别算法
JP5907283B2 (ja) * 2012-11-22 2016-04-26 富士通株式会社 情報処理装置、生体部位判定プログラムおよび生体部位判定方法
CN103544716B (zh) * 2013-10-30 2016-04-27 京北方信息技术股份有限公司 一种对图像的像素进行颜色分类的方法及装置
CN104102904B (zh) * 2014-07-14 2016-03-23 济南大学 一种静态手势识别方法
CN104751141A (zh) * 2015-03-30 2015-07-01 东南大学 基于特征图像全像素灰度值的elm手势识别算法
CN105405143B (zh) * 2015-11-13 2017-04-12 华中师范大学 一种基于全局期望最大算法的手势分割方法及系统
CN105867630A (zh) * 2016-04-21 2016-08-17 深圳前海勇艺达机器人有限公司 机器人的手势识别方法及装置及机器人系统
CN106408579B (zh) * 2016-10-25 2019-01-29 华南理工大学 一种基于视频的捏合指尖跟踪方法
CN107702161A (zh) * 2017-08-23 2018-02-16 信利光电股份有限公司 一种电磁炉控制方法、装置及电磁炉
CN109840478B (zh) * 2019-01-04 2021-07-02 广东智媒云图科技股份有限公司 一种动作评估方法、装置、移动终端和可读存储介质
CN110020634B (zh) * 2019-04-15 2020-05-19 刘政操 一种企业管理用资料展示板
CN114842712B (zh) * 2022-04-12 2023-10-17 汕头大学 一种基于手势识别的手语教学系统
CN116884078B (zh) * 2023-09-07 2023-11-24 鹿客科技(北京)股份有限公司 摄像装置控制方法、监控设备和计算机可读介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685343A (zh) * 2008-09-26 2010-03-31 联想(北京)有限公司 一种实现手势识别的方法、装置及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2407635B (en) * 2003-10-31 2006-07-12 Hewlett Packard Development Co Improvements in and relating to camera control

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685343A (zh) * 2008-09-26 2010-03-31 联想(北京)有限公司 一种实现手势识别的方法、装置及电子设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
孙丽娟 等.基于视觉的手势识别技术.《计算机技术与发展》.2008,第18卷(第10期),214-216,221. *
曹陶科 等.基于视觉的手势识别研究.《郑州大学学报(理学版)》.2008,第40卷(第3期),63-66. *
覃文军 等.基于傅立叶描述子-BP神经网络的手势识别方法.《东北大学学报(自然科学版)》.2009,第30卷(第9期),1232-1235. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102938060A (zh) * 2012-12-07 2013-02-20 上海电机学院 动态手势识别系统及方法

Also Published As

Publication number Publication date
CN101901350A (zh) 2010-12-01

Similar Documents

Publication Publication Date Title
CN101901350B (zh) 一种基于特征向量的静态手势识别方法
Dominio et al. Combining multiple depth-based descriptors for hand gesture recognition
CN102368290B (zh) 一种基于手指高级特征的手势识别方法
CN104834922B (zh) 基于混合神经网络的手势识别方法
Wang et al. A new face detection method based on shape information
US8391615B2 (en) Image recognition algorithm, method of identifying a target image using same, and method of selecting data for transmission to a portable electronic device
CN102231093B (zh) 一种屏幕定位控制方法及装置
CN102063618B (zh) 互动系统中的动态手势识别方法
CN107885327B (zh) 一种基于Kinect深度信息的指尖检测方法
CN103383700B (zh) 基于边缘方向差直方图的图像检索方法
CN105160323B (zh) 一种手势识别方法
CN108304819B (zh) 姿态识别系统及方法、存储介质
CN101807257A (zh) 图像标签信息识别方法
CN103294996A (zh) 一种3d手势识别方法
CN106326860A (zh) 基于视觉的手势识别方法
CN101447021A (zh) 人脸快速识别系统及其识别方法
CN103455794A (zh) 一种基于帧融合技术的动态手势识别方法
CN104123529A (zh) 人手检测方法及系统
CN103530892A (zh) 一种基于Kinect传感器的双手跟踪方法与装置
CN109359566B (zh) 利用手指特征进行层级分类的手势识别方法
CN105760472A (zh) 视频检索方法及系统
She et al. A real-time hand gesture recognition approach based on motion features of feature points
CN103839042A (zh) 人脸识别方法和人脸识别系统
CN103257713A (zh) 一种手势控制方法
CN105069745A (zh) 基于普通图像传感器及增强现实技术的带表情变脸系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120516

Termination date: 20120723