CN101901350B - 一种基于特征向量的静态手势识别方法 - Google Patents
一种基于特征向量的静态手势识别方法 Download PDFInfo
- Publication number
- CN101901350B CN101901350B CN2010102383683A CN201010238368A CN101901350B CN 101901350 B CN101901350 B CN 101901350B CN 2010102383683 A CN2010102383683 A CN 2010102383683A CN 201010238368 A CN201010238368 A CN 201010238368A CN 101901350 B CN101901350 B CN 101901350B
- Authority
- CN
- China
- Prior art keywords
- gesture
- point
- vector
- angle
- sigma
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Abstract
本发明一种基于特征向量的静态手势识别方法,可概括为:首先在YCbCr颜色空间中用肤色特性对手势进行分割处理,然后选取特征向量描述手势,进行长度和角度归一化处理,根据特征向量确定手势中指尖的位置,最终用指尖和手势中心的相对位置对手势进行识别。该方法具有旋转不变性和缩放不变性,有很好的实时性,满足人机交互应用要求。
Description
(一)技术领域:
本发明涉及一种静态手势识别方法,尤其是一种基于特征向量的静态手势识别方法。属于人机交互领域。
(二)背景技术:
随着人机交互技术的发展,自然和谐的人机交互方式日益受到人们的重视。基于视觉的手势识别技术,以其自然性、简洁性和直接性的特点,提供了一个自然的人机交互接口,受到了研究者的重视。由于人手非刚体的特性,传统的具有旋转不变性和缩放不变性的识别方法,例如傅立叶描述子、图像不变矩等,在手势识别的应用中遇到了种种问题,不能满足人机交互对手势识别实时性的要求。
经过对现有的文献资料研究发现,覃文军等2009年在《东北大学学报(自然科学版)》第30卷第9期发表的论文《基于傅立叶描述子-BP神经网络的手势识别方法》中提出了一种基于傅立叶描述子和BP神经网路的手势识别方法,首先通过多特征融合的手势分割方法提取手势区域,然后结合傅立叶描述子较好的轮廓描绘能力和BP神经网络较好的自学习能力,用傅立叶描述子和BP神经网络的方法对手势进行识别。该论文的方法得到了较高的识别率,但是算法计算量大,识别一幅图像需要4.5秒时间,远不能达到实时应用的要求;同时由于傅立叶描述子适用于对刚体的轮廓描述,因此应用于手势识别中,并不能很好的描述不同角度下的同一手势,其算法的鲁棒性差。
(三)发明内容:
本发明的目的在于提出一种基于特征向量的静态手势识别方法,以解决现有技术在手势识别应用中计算量大、识别结果受手势方向影响大的问题,克服现有技术中的缺陷。
本发明的技术方案概括为:首先在YCbCr颜色空间中用肤色特性对手势进行分割处理,然后选取特征向量描述手势,进行长度和角度归一化处理,根据特征向量确定手势中指尖的位置,最终用指尖和手势中心的相对位置对手势进行识别。
本发明一种基于特征向量的静态手势识别方法,其具体步骤如下:
步骤1:手势分割
采用Logitech QuickCam Pro9000摄像头采集图像,获得图像尺寸为320×240,图像格式为JPEG,拍摄背景无类似肤色的区域,被拍摄的用户穿非肤色长袖衣服。对得到的图像,首先从RGB颜色空间转化到YCbCr颜色空间,之后选择Cb、Cr分量的中心值和阈值,其中Cb分量中心值Cbmid=115,Cr分量中心值Crmid=145,阈值lthres=15,对输入图像的各像素计算其Cb、Cr值与中心值的欧式距离dist:
若dist小于相应的阈值lthres,则将该像素的值设为1,否则将其值设为0,将输入图像转化为二值图像。对得到的二值图像进行一次腐蚀膨胀处理,并假定图像中最大连通区域为手势所在区域。
步骤2:获得手势的中心、方向和边缘
将手势图像转化为二值图像后,通过计算获得手势的中心、方向,并提取手势的边缘。具体方法如下:
由式(2)和式(3)计算手势中心点坐标x和y:
式中,B[i,j]表示图像中第i行第j列的值,图像的大小为n×m。
手势方向θ的计算式如下:
式中,μ11、μ20、μ02为图像的二阶中心矩。
用Canny算子从二值图像中提取手势的边缘。
步骤3:选取特征向量
计算手势中心点和边缘各点连线的角度,找出角度与手势方向角最接近的点,以该点为起始点,对手势边界进行n等分,得边界上的n个点。以手势中心点为起始点,边界上的n个点之一为终止点构造向量,用n个向量来表征该手势。为消除输入图像中手势的尺寸对识别的影响,选取特征向量中长度最长的向量,将其长度设置为100,将其它向量的长度归一化到(0,100)。经实验,采用n=60。
步骤4:定位指尖位置
将步骤3得到的特征向量视为一个首尾相连的向量组,消除起始点选择对向量组的影响,保证特征向量对旋转不敏感。从向量组中求出局部极大值和局部极小值,其中局部极大值对应的点为指尖点候选点,而其相邻的两个局部极小值点的角度差为手指所在区域的角度。选定手指长度阈值lth和角度阈值θth,用指尖到手势中心的长度l和手指所在区域的角度θ与设定阈值相比较来判定指尖候选点是否为指尖。当l>lth且θ<θth时,则该特征向量的终点所在位置为指尖位置,否则该点为非指尖。经实验,采用lth=53,θth=1.87。
步骤5:手势识别
根据步骤2和步骤4得到手势中心点和指尖位置,构造一组以手势中心点为起点,指尖位置为终点的向量。找出这些向量中两两间最大的夹角,以夹角最大的两个向量中的一个为起始向量,将其角度设置为0,在保证各向量相对角度不变的前提下,使其它向量与起始向量的逆时针夹角和之和最小,得到唯一的归一化结果。得到角度归一化的向量组之后,确定手势包含的手指数;根据手指的相对位置和长度信息,对包含相同手指数的不同手势进行区分。
本发明优点及功效在于:对手势的识别具有旋转不变性和缩放不变性,计算简单,满足实时处理要求,适用于不同人手的不同手势的识别。
(四)附图说明:
图1为本发明方法的算法框图。
图2为手势的中心和方向示意图,图中菱形代表手势的中心,图中箭头代表手势的方向。
图3为手势的特征向量示意图。
其中,图3(a)为2手指手势特征向量示意图;
图3(b)为4手指手势特征向量示意图。
图4为指尖位置图,图中菱形为本发明方法定位的指尖位置。
其中,图4(a)为3手指定位结果图;
图4(b)为5手指定位结果图;
(五)具体实施方法:
本发明的技术方案概括为:首先在YCbCr颜色空间中用肤色特性对手势进行分割处理,然后选取特征向量描述手势,进行长度和角度归一化处理,根据特征向量确定手势中指尖的位置,最终用指尖和手势中心的相对位置对手势进行识别。
下面结合附图对本发明的技术方案作进一步的详细描述。主要步骤如下:
步骤1:手势分割
本发明采用Logitech QuickCam Pro9000摄像头采集图像,获得彩色图像尺寸为320×240,图像格式为JPEG,拍摄背景无类似肤色的区域,被拍摄的用户穿非肤色长袖衣服。对得到的手势图像,首先从RGB颜色空间转化到YCbCr颜色空间,之后选择Cb、Cr分量的中心值和阈值,其中Cb分量中心值Cbmid=115,Cr分量中心值Crmid=145,阈值lthres=15,对输入图像的各像素计算其Cb、Cr值与中心值的欧式距离dist:
若dist小于相应的阈值lthres,则将该像素值设为1,否则将其值设为0,从而将输入图像转化为二值图像。对得到的二值图像进行一次腐蚀膨胀处理,并假定图像中最大连通区域为手势所在区域。
步骤2:获得手势的中心、方向和边缘
将手势图像转化为二值图像后,通过计算获得手势的中心、方向,并提取手势的边缘。
由式(2)和式(3)计算手势中心点坐标x和y:
式中,B[i,j]表示图像中第i行第j列的值,图像的大小为n×m。
手势方向θ的计算式如下:
式中,μ11、μ20、μ02为图像的二阶中心矩。
用Canny算子从二值图像中提取手势的边缘。
图2为手势的中心和方向示意图,图中菱形代表手势的中心,图中箭头代表手势的方向。
步骤3:选取特征向量
计算手势中心点和边缘各点连线的角度,找出角度与手势方向角最接近的点,以该点为起始点,对手势边界进行n等分,得边界上的n个点。以手势中心点为起始点,边界上的n个点之一为终止点构造向量,用n个向量来表征该手势。为消除输入图像中手势的尺寸对识别的影响,选取特征向量中长度最长的向量,将其长度设置为100,将其它向量的长度归一化到[0,100]。经实验,采用n=60。
图3(a)为对2手指手势选取特征向量结果图,图3(b)为对4手指手势选取特征向量结果图,
步骤4:定位指尖位置
将步骤3得到的特征向量视为一个首尾相连的向量组,消除起始点选择对向量组的影响,保证特征向量对旋转不敏感。从向量组中求出局部极大值和局部极小值,其中局部极大值对应的点为指尖点候选点,而其相邻的两个局部极小值点的角度差为手指所在区域的角度。选定手指长度阈值lth和角度阈值θth,用指尖到手势中心的长度l和手指所在区域的角度θ与设定阈值相比较来判定指尖候选点是否为指尖。当l>lth且θ<θth时,则该特征向量的终点所在位置为指尖位置,否则该点为非指尖。经实验,采用lth=53,θth=1.87。
图4(a)为对3手指手势的指尖定位结果图,图4(b)为对5手指手势的指尖定位结果图。
步骤5:手势识别
根据步骤2和步骤4得到手势中心点和指尖位置,构造一组以手势中心点为起点,指尖位置为终点的向量。找出这些向量中两两间最大的夹角,以夹角最大的两个向量中的一个为起始向量,将其角度设置为0,在保证各向量相对角度不变的前提下,使其它向量与起始向量的逆时针夹角和之和最小,得到唯一的归一化结果。得到角度归一化的向量组之后,确定了手势包含的手指数;根据手指的相对位置和长度信息,对包含相同手指数的不同手势进行区分。本发明方法识别一幅手势图像耗时0.4秒左右,而覃文军等的方法识别一幅手势图像耗时在4.5秒左右。在本发明优点及功效在于:对手势的识别具有旋转不变性和缩放不变性,计算简单,满足实时处理要求,有很好的识别率。
说明书附图中出现的英文符号,其含义如下:
l:用指尖到手势中心的长度;
θ:手指所在区域的角度;
lth:手指长度阈值,设为53;
θth:角度阈值,设为1.87。
Claims (1)
1.一种基于特征向量的静态手势识别方法,其特征在于,包括下述几个步骤:
步骤1:手势分割
采用Logitech QuickCam Pro9000摄像头采集图像,获得图像尺寸为320×240,图像格式为JPEG,拍摄背景无类似肤色的区域,被拍摄的用户穿非肤色长袖衣服;对得到的图像,首先从RGB颜色空间转化到YCbCr颜色空间,之后选择Cb、Cr分量的中心值和阈值,其中Cb分量中心值Cbmid=115,Cr分量中心值Crmid=145,阈值lthres=15,对输入图像的各像素计算其Cb、Cr值与中心值的欧式距离dist:
若dist小于相应的阈值lthres,则将该像素的值设为1,否则将其值设为0,从而将输入图像转化为二值图像;对得到的二值图像进行一次腐蚀膨胀处理,并假定图像中最大连通区域为手势所在区域;
步骤2:获得手势的中心、方向和边缘
将手势图像转化为二值图像后,通过计算获得手势的中心、方向,并提取手势的边缘;
由式(2)和式(3)计算手势中心点坐标x和y:
式中,B[i,j]表示图像中第i行第j列的值,图像的大小为n×m;
手势方向θ的计算式如下:
式中,μ11、μ20、μ02为图像的二阶中心矩;
用Canny算子从二值图像中提取手势的边缘;
步骤3:选取特征向量
计算手势中心点和边缘各点连线的角度,找出角度与手势方向角最接近的点,以该点为起始点,对手势边界进行n等分,得到边界上的n个点;以手势中心点为起始点,边界上的n个点之一为终止点构造向量,用这n个向量来表征该手势;为消除输入图像中手势的尺寸对识别的影响,选取特征向量中长度最长的向量,将其长度设置为100,将其它向量的长度归一化到(0,100);采用n=60;
步骤4:定位指尖位置
将步骤3得到的特征向量视为一个首尾相连的向量组,消除起始点选择对向量组的影响,保证特征向量对旋转不敏感;从向量组中求出局部极大值和局部极小值,其中局部极大值对应的点为指尖点候选点,而其相邻的两个局部极小值点的角度差为手指所在区域的角度;选定手指长度阈值lth和角度阈值θth,用指尖到手势中心的长度l和手指所在区域的角度θ与设定阈值相比较来判定指尖候选点是否为指尖;当l>lth且θ<θth时,则该特征向量的终点所在位置为指尖位置,否则该点为非指尖;采用lth=53,θth=1.87;
步骤5:手势识别
根据步骤2和步骤4得到手势中心点和指尖位置,构造一组以手势中心点为起点,指尖位置为终点的向量;找出这些向量中两两间最大的夹角,以夹角最大的两个向量中的一个为起始向量,将其角度设置为0,在保证各向量相对角度不变的前提下,使其它向量与起始向量的逆时针夹角和之和最小,得到唯一的归一化结果;得到角度归一化的向量组后,则确定了手势包含的手指数;根据手指的相对位置和长度信息,对包含相同手指数的不同手势进行区分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102383683A CN101901350B (zh) | 2010-07-23 | 2010-07-23 | 一种基于特征向量的静态手势识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102383683A CN101901350B (zh) | 2010-07-23 | 2010-07-23 | 一种基于特征向量的静态手势识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101901350A CN101901350A (zh) | 2010-12-01 |
CN101901350B true CN101901350B (zh) | 2012-05-16 |
Family
ID=43226873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010102383683A Expired - Fee Related CN101901350B (zh) | 2010-07-23 | 2010-07-23 | 一种基于特征向量的静态手势识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101901350B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102938060A (zh) * | 2012-12-07 | 2013-02-20 | 上海电机学院 | 动态手势识别系统及方法 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102063618B (zh) * | 2011-01-13 | 2012-10-31 | 中科芯集成电路股份有限公司 | 互动系统中的动态手势识别方法 |
JP5709228B2 (ja) | 2011-04-28 | 2015-04-30 | Necソリューションイノベータ株式会社 | 情報処理装置、情報処理方法及びプログラム |
US8929612B2 (en) * | 2011-06-06 | 2015-01-06 | Microsoft Corporation | System for recognizing an open or closed hand |
CN102855461B (zh) * | 2011-07-01 | 2016-05-25 | 株式会社理光 | 在图像中检测手指的方法及设备 |
CN102368290B (zh) * | 2011-09-02 | 2012-12-26 | 华南理工大学 | 一种基于手指高级特征的手势识别方法 |
CN103049446B (zh) * | 2011-10-13 | 2016-01-27 | 中国移动通信集团公司 | 一种图像检索方法及装置 |
CN103778407A (zh) * | 2012-10-23 | 2014-05-07 | 南开大学 | 一种迁移学习框架下基于条件随机场的手势识别算法 |
JP5907283B2 (ja) * | 2012-11-22 | 2016-04-26 | 富士通株式会社 | 情報処理装置、生体部位判定プログラムおよび生体部位判定方法 |
CN103544716B (zh) * | 2013-10-30 | 2016-04-27 | 京北方信息技术股份有限公司 | 一种对图像的像素进行颜色分类的方法及装置 |
CN104102904B (zh) * | 2014-07-14 | 2016-03-23 | 济南大学 | 一种静态手势识别方法 |
CN104751141A (zh) * | 2015-03-30 | 2015-07-01 | 东南大学 | 基于特征图像全像素灰度值的elm手势识别算法 |
CN105405143B (zh) * | 2015-11-13 | 2017-04-12 | 华中师范大学 | 一种基于全局期望最大算法的手势分割方法及系统 |
CN105867630A (zh) * | 2016-04-21 | 2016-08-17 | 深圳前海勇艺达机器人有限公司 | 机器人的手势识别方法及装置及机器人系统 |
CN106408579B (zh) * | 2016-10-25 | 2019-01-29 | 华南理工大学 | 一种基于视频的捏合指尖跟踪方法 |
CN107702161A (zh) * | 2017-08-23 | 2018-02-16 | 信利光电股份有限公司 | 一种电磁炉控制方法、装置及电磁炉 |
CN109840478B (zh) * | 2019-01-04 | 2021-07-02 | 广东智媒云图科技股份有限公司 | 一种动作评估方法、装置、移动终端和可读存储介质 |
CN110020634B (zh) * | 2019-04-15 | 2020-05-19 | 刘政操 | 一种企业管理用资料展示板 |
CN114842712B (zh) * | 2022-04-12 | 2023-10-17 | 汕头大学 | 一种基于手势识别的手语教学系统 |
CN116884078B (zh) * | 2023-09-07 | 2023-11-24 | 鹿客科技(北京)股份有限公司 | 摄像装置控制方法、监控设备和计算机可读介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101685343A (zh) * | 2008-09-26 | 2010-03-31 | 联想(北京)有限公司 | 一种实现手势识别的方法、装置及电子设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2407635B (en) * | 2003-10-31 | 2006-07-12 | Hewlett Packard Development Co | Improvements in and relating to camera control |
-
2010
- 2010-07-23 CN CN2010102383683A patent/CN101901350B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101685343A (zh) * | 2008-09-26 | 2010-03-31 | 联想(北京)有限公司 | 一种实现手势识别的方法、装置及电子设备 |
Non-Patent Citations (3)
Title |
---|
孙丽娟 等.基于视觉的手势识别技术.《计算机技术与发展》.2008,第18卷(第10期),214-216,221. * |
曹陶科 等.基于视觉的手势识别研究.《郑州大学学报(理学版)》.2008,第40卷(第3期),63-66. * |
覃文军 等.基于傅立叶描述子-BP神经网络的手势识别方法.《东北大学学报(自然科学版)》.2009,第30卷(第9期),1232-1235. * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102938060A (zh) * | 2012-12-07 | 2013-02-20 | 上海电机学院 | 动态手势识别系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101901350A (zh) | 2010-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101901350B (zh) | 一种基于特征向量的静态手势识别方法 | |
Dominio et al. | Combining multiple depth-based descriptors for hand gesture recognition | |
CN102368290B (zh) | 一种基于手指高级特征的手势识别方法 | |
CN104834922B (zh) | 基于混合神经网络的手势识别方法 | |
Wang et al. | A new face detection method based on shape information | |
US8391615B2 (en) | Image recognition algorithm, method of identifying a target image using same, and method of selecting data for transmission to a portable electronic device | |
CN102231093B (zh) | 一种屏幕定位控制方法及装置 | |
CN102063618B (zh) | 互动系统中的动态手势识别方法 | |
CN107885327B (zh) | 一种基于Kinect深度信息的指尖检测方法 | |
CN103383700B (zh) | 基于边缘方向差直方图的图像检索方法 | |
CN105160323B (zh) | 一种手势识别方法 | |
CN108304819B (zh) | 姿态识别系统及方法、存储介质 | |
CN101807257A (zh) | 图像标签信息识别方法 | |
CN103294996A (zh) | 一种3d手势识别方法 | |
CN106326860A (zh) | 基于视觉的手势识别方法 | |
CN101447021A (zh) | 人脸快速识别系统及其识别方法 | |
CN103455794A (zh) | 一种基于帧融合技术的动态手势识别方法 | |
CN104123529A (zh) | 人手检测方法及系统 | |
CN103530892A (zh) | 一种基于Kinect传感器的双手跟踪方法与装置 | |
CN109359566B (zh) | 利用手指特征进行层级分类的手势识别方法 | |
CN105760472A (zh) | 视频检索方法及系统 | |
She et al. | A real-time hand gesture recognition approach based on motion features of feature points | |
CN103839042A (zh) | 人脸识别方法和人脸识别系统 | |
CN103257713A (zh) | 一种手势控制方法 | |
CN105069745A (zh) | 基于普通图像传感器及增强现实技术的带表情变脸系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120516 Termination date: 20120723 |