CN112906550A - 一种基于分水岭变换的静态手势识别方法 - Google Patents

一种基于分水岭变换的静态手势识别方法 Download PDF

Info

Publication number
CN112906550A
CN112906550A CN202110177991.0A CN202110177991A CN112906550A CN 112906550 A CN112906550 A CN 112906550A CN 202110177991 A CN202110177991 A CN 202110177991A CN 112906550 A CN112906550 A CN 112906550A
Authority
CN
China
Prior art keywords
image
gesture
watershed
gray
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110177991.0A
Other languages
English (en)
Other versions
CN112906550B (zh
Inventor
于天河
张海珍
王鹏
季盛
李翰堂
秦梦娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Penglu Intelligent Technology Co ltd
Harbin University of Science and Technology
Original Assignee
Harbin Penglu Intelligent Technology Co ltd
Harbin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Penglu Intelligent Technology Co ltd, Harbin University of Science and Technology filed Critical Harbin Penglu Intelligent Technology Co ltd
Priority to CN202110177991.0A priority Critical patent/CN112906550B/zh
Publication of CN112906550A publication Critical patent/CN112906550A/zh
Application granted granted Critical
Publication of CN112906550B publication Critical patent/CN112906550B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • G06V40/113Recognition of static hand signs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

一种基于分水岭变换的静态手势识别方法属于图像处理领域;手势识别方法包括手势图像的采集、颜色空间转换、自适应亮度调整、肤色阈值分割、分水岭变换、灰度阈值合并、手势特征提取和模板匹配。自适应亮度调整算法极大地提高了类肤色区域提取准确性;双高斯滤波核更好地解决了分水岭变换中的过分割问题,同时更好地保留了图像的边缘信息;傅里叶相关性判别手势指令更好地利用了待匹配手势的特征,提高了手势识别的准确性。

Description

一种基于分水岭变换的静态手势识别方法
技术领域
本发明涉及图像处理和人机交互领域,尤其涉及一种基于分水岭变换的静 态手势识别方法。
背景技术
手势识别技术作为自然人机交互的应用典范,通过传感器、雷达、视频图像 等技术方案来识别用户的操作指令,其应用范围正在逐渐地进入社会生活的各个 领域。其中,基于视频图像的手势交互方式有着更好地应用和发展前景。例如, 在机器人控制和远程控制中的应用,在一些危险区域等不便直接操控的特殊场合; 辅助聋哑人生活,通过手势交流提高聋哑人的生活质量;在智能家居控制领域, 可以给用户带来更好的交互体验,提高控制设备的便利性;在虚拟现实环境中, 通过手势对环境和虚拟物体进行控制,在目标操作界面上使用手势来完成虚拟环 境下的浏览、选择和操纵。
基于视频图像处理技术的手势识别主要通过手势分割、手势特征提取、手势 特征匹配等步骤来识别手势指令。手势分割作为手势识别中重要的一环,分割的 好坏直接影响了手势特征提取的准确性。分水岭算法作为一种图像分割的方法可 以对手势图像进行分割,但传统的分水岭算法容易产生过分割的问题,高斯滤波 虽然可以减弱过分割的影响,但单一的滤波核会造成图像边缘信息的缺失,最终 影响手势分割的准确性;手势特征的选取直接影响最终的识别准确率,而传统的 面积周长比、欧氏距离作为特征来进行匹配会造成一定的误差。为解决上述问题, 本发明提出一种基于分水岭变换的静态手势识别方法。
发明内容
本发明的目的在于公开一种基于分水岭变换的静态手势识别方法,提高了手 势分割的准确性和手势识别的准确率。
一种基于分水岭变换的静态手势识别方法,包括:
步骤一、CMOS图像传感器采集用户手部的RGB图像,记为M;
步骤二、将采集的RGB图像M转换到YCbCr颜色空间下,转换后的图像 记为N;
步骤三、通过自适应亮度调整的方法对YCbCr颜色空间下的图像N进行光 照补偿,补偿后的图像记为O;
步骤四、通过阈值分割对图像O进行类肤色区域提取,提取的图像记为U;
步骤五、对图像U通过分水岭变换进行分割,分割后的图像记为P;
步骤六、对分水岭分割后的图像P使用两个高斯滤波核进行高斯滤波,滤波 后的图像记为Q;
步骤七、对高斯滤波后的图像Q通过灰度阈值合并分割出单独的完整手势 图像,记为A;
步骤八、对分割后的手势图像A进行手势特征提取,包括手势图像的面积、 周长和傅里叶描述子,并计算面积周长比;
步骤九、通过手势图像A的面积周长比、傅里叶相关性作为特征参数与模 板库中的手势图像的特征参数进行对比来识别手势,首先通过面积周长比进行初 次分类,再通过傅里叶相关性分析进行手势最终识别,若满足识别条件则输出手 势指令,否则判别为无效手势。
步骤一中CMOS图像传感器采集用户手部的RGB图像要求被测者将手背 中心或手掌中心正对摄像头做出相应手势动作。
步骤二中将采集的RGB图像M转换到YCbCr颜色空间下,根据公式(1) 进行颜色空间转换:
Figure BDA0002940597100000021
其中Y表示明亮度,Cb和Cr表示蓝色和红色的浓度偏移量成分。
步骤三中通过自适应亮度调整的方法对YCbCr颜色空间下的图像N进行光 照补偿,具体方法为:
设图像N为n(x,y),亮度补偿后的图像为o(x,y),Gmax和Gmin分别表示图 像变换后最大灰度级与最小灰度级,对于图像n(x,y)中Y分量前5%的像素, o(x,y)取其灰度级的平均值Bav,对于图像n(x,y)中Y分量后5%的像素,o(x,y) 取其灰度级的平均值为Eav,对于图像n(x,y)中Y分量中间90%的像素用公式(2) 进行光照补偿:
Figure BDA0002940597100000031
其中B表示亮度值前5%像素中灰度级的最大值,E表示亮度值后5%像素 中灰度级的最小值。
步骤四中通过阈值设定对图像O进行类肤色区域提取,具体阈值设定方法 为:
当Y>80,133<Cr<173,127<Cb<133时判定为肤色区域,其余为非肤色区 域。
步骤五中对图像U通过分水岭变换进行分割,按照以下步骤进行分水岭变 换:
步骤五一、将阈值分割后的图像U中所有的像素按照灰度值进行分类,按 照从小到大的顺序进行排列t1、t2……tn,并设定测地阈值T1,其中t1、t2……tn表示不同灰度值所对应的像素;
步骤五二、找到灰度值最小的像素点,标记为灰度值的起始点ti,i的初始值 为1;
步骤五三、分别计算像素点ti与其八邻域像素点tm的测地距离dm-i,如公式 (3)所示:
Figure BDA0002940597100000032
其中xi和yi为ti点的横、纵坐标,i为对应灰度值像素点的序号,i=1、2……n; xm和ym为tm点的横、纵坐标,m为对应八邻域点的序号,m=2、3……9;
若dm-i小于T1,则用ti点的像素取代tm点的像素,否则将ti点和tm点用分 割线分割成两块区域;
步骤五四、令i=i+1,重复步骤五三,直至对整个图像完成分割。
步骤六中对分水岭分割后的图像P进行高斯滤波,具体方法为:
使用两个高斯滤波核对分水岭分割后的图像进行高斯滤波,首先设定阈值T2, 通过噪点评估公式(4)进行高斯核的选择,对于图像内噪声点选用中心权值较 小的卷积核H1,边缘噪声点选用中心权值较大的卷积核H2
Figure BDA0002940597100000041
其中g(x,y)表示(x,y)点的灰度值,根据(x,y)的灰度值与周围八邻域相邻 点的灰度均值的差值的绝对值判断该点是否为图像内的噪声点。
步骤七中对高斯滤波后的图像Q通过灰度阈值合并分割出单独的完整手势 图像,具体方法为:
通过计算分水岭变换后的图像的各个区域与其相邻区域的区域相似度进行 区域合并,区域相似度公式为(5):
Figure BDA0002940597100000042
其中G(i,j)、E(i,j)与F(i,j)分别为图像Q中两个相邻区域的灰度对比度、 分水岭线的边缘相似度和区域邻接关系,定义如下:
Figure BDA0002940597100000043
Figure BDA0002940597100000044
Figure BDA0002940597100000045
(6)式中Ri、Rj为待判别的两个区域,ai、aj为Ri与Rj两个区域中的像 素点的个数,μi、μj为两区域的颜色均值,
Figure BDA0002940597100000046
为两区域的交集,L为周 长函数;
(7)式中的σi、σj表示位于分水岭两侧区域边缘的像素灰度方差,ηi、 ηj表示分水岭线两侧区域边缘的像素灰度均值;
(8)式中的Adjacency(i,j)=true表示区域Ri和区域Rj相邻, Adjacency(i,j)=false表示区域Ri和区域Rj不相邻;
灰度区域合并具体步骤为:
步骤七一、计算F(i,j)=1是否成立,若成立则说明两区域相邻,转步骤七 二,否则令i=i+1,j=j+1,重新计算F(i,j)=1是否成立;
步骤七二、设定阈值T3、T4,计算T3<E(i,j)<T4是否成立,若成立则说明 两区域边缘相似,转步骤七三,否则令i=i+1,j=j+1,转步骤七一;
步骤七三、设定阈值T5、T6,计算T5<G(i,j)<T6是否成立,若成立则说明 两区域灰度相似,否则令i=i+1,j=j+1,转步骤七一;
步骤七四、计算区域相似度,如公式(9),若成立则转步骤七五,否则令i=i+1, j=j+1,转步骤七一;
Figure BDA0002940597100000051
步骤七五、进行区域Ri和区域Rj合并。
步骤八中对分割后的手势图像A进行手势特征提取,手势周长特征提取公 式如(10)所示:
Figure BDA0002940597100000052
其中μ(x,y)为手势图像边界函数;
手势面积特征提取为统计整个手势图像的像素数目,公式如(11)所示:
Figure BDA0002940597100000053
其中a(x,y)为整个手势图像函数;
计算面积周长比q,如公式(12)所示:
Figure BDA0002940597100000061
傅里叶描述子特征提取为对图像A进行傅里叶变换,得到傅里叶描述子, 并对其进行归一化处理,如公式(13)和(14)所示:
Figure BDA0002940597100000062
Figure BDA0002940597100000063
其中δ(k)为傅里叶描述子,δ′(k)为归一化的傅里叶描述子,s(t)为手势图 像边缘函数的复数形式。
步骤九中通过手势图像A的面积周长比、傅里叶相关性作为特征参数与模板
库中的手势图像的特征参数进行对比来识别手势,具体步骤为:
步骤九一、求取待识别手势的面积周长比q与模板库中手势图像Mn的面积 周长比的差值的绝对值;
步骤九二、将绝对值按照从小到大排序,取前三个作为候选手势M1、M2、 M3
步骤九三、将待识别手势分别与M1、M2、M3做傅里叶相关性分析得到R(k1)、 R(k2)、R(k3),如公式(15):
Figure BDA0002940597100000064
其中E为数学期望,cov是协方差,D是方差,σ是标准差,H=δ′(ηA)表 示手势图像A的傅里叶描述子,K=δ′(κm)表示手势图像M1、M2、M3的傅里 叶描述子,m=1、2、3,R(k)越接近于1则说明两手势相似度越高,形状越 接近,反之差距越大;
步骤九四、输出R(k1)、R(k2)、R(k3)的最大值R(kn);
步骤九五、判断R(kn)是否大于0.95,若大于则输出R(kn)对应手势指令,否 则判别该手势为无效手势。
本发明的有益效果为:
本发明提出了一种基于分水岭变换的静态手势识别方法,通过对采集到的图 像进行颜色空间转换、自适应亮度调整、肤色阈值分割、分水岭变换、高斯滤波、 灰度阈值合并、手势特征提取、模板匹配来实现手势的识别。与传统的类肤色区 域提取方法相比,本发明使用的自适应亮度调整避免了亮度对于肤色分割的影响, 具有更好的适应性;与传统的分水岭分割算法相比,本发明使用双高斯滤波核不 仅更好地解决了过分割的问题,同时也能够更好保留图像的边缘信息;与传统的 模板匹配算法相比,本发明除使用面积周长比外,还使用傅里叶相关性作为判决 依据,使得手势识别的准确性更高。
附图说明
图1为本发明的一种基于分水岭变换的静态手势识别方法的实施例流程图;
图2为本发明的一种基于分水岭变换的静态手势识别方法的手势分割算法 的实施例流程图;
图3为本发明的一种基于分水岭变换的静态手势识别方法的灰度阈值合并 的实施例流程图;
图4为本发明的一种基于分水岭变换的静态手势识别方法的匹配识别的实 施例流程图。
具体实施方式
本发明提出了一种基于分水岭变换的静态手势识别方法。为了使本技术领域 的人员更好地理解本发明实施例中的技术方案,并使本发明的上述目的、特征和 优点能够更加明显易懂,下面结合附图对本发明方法作进一步详细的说明:
具体实施方式一
本发明提出了一种基于分水岭变换的静态手势识别方法,如图1所示,具体 方法如下:
步骤一、CMOS图像传感器采集用户手部的RGB图像,记为M;
步骤二、将采集的RGB图像M转换到YCbCr颜色空间下,转换后的图像 记为N;
步骤三、通过自适应亮度调整的方法对YCbCr颜色空间下的图像N进行光 照补偿,补偿后的图像记为O;
步骤四、通过阈值分割对图像O进行类肤色区域提取,提取的图像记为U;
步骤五、对图像U通过分水岭变换进行分割,分割后的图像记为P;
步骤六、对分水岭分割后的图像P使用两个高斯滤波核进行高斯滤波,滤波 后的图像记为Q;
步骤七、对高斯滤波后的图像Q通过灰度阈值合并分割出单独的完整手势 图像,记为A;
步骤八、对分割后的手势图像A进行手势特征提取,包括手部图像的面积、 周长和傅里叶描述子,并计算面积周长比;
步骤九、通过手部图像A的面积周长比、傅里叶相关性作为特征参数与模 板库中的手势图像的特征参数进行对比来识别手势,首先通过面积周长比进行初 次分类,再通过傅里叶相关性分析进行手势最终识别,若满足识别条件则输出手 势指令,否则判别为无效手势。
具体实施方式二
在具体实施方式一的基础上,一种基于分水岭变换的静态手势识别方法,所 述步骤一中CMOS图像传感器采集用户的手部图像,要求被测者的手掌中心或 者手背中心正对摄像头,以便能够采集到的完整的手部图像。
具体实施方式三
在具体实施方式一的基础上,一种基于分水岭变换的静态手势识别方法,所 述步骤二中将采集到的RGB图像转换到YCbCr颜色空间下,利用肤色在YCbCr 颜色空间下良好的聚类特性,可以更好地进行类肤色区域的分割,根据公式(1) 进行颜色空间转换:
Figure BDA0002940597100000081
其中Y表示明亮度,Cb和Cr表示蓝色和红色的浓度偏移量成分。
具体实施方式四
在具体实施方式一的基础上,一种基于分水岭变换的静态手势识别方法,所 述步骤三中通过自适应亮度调整的方法对YCbCr颜色空间下的图像N进行光照 补偿。类肤色区域分割对于光照环境的要求很高,过亮和过暗都会影响最终的分 割结果,因此通过自适应亮度调整的方法来调节亮度的范围,消除亮度对分割的 影响,具体方法为:
设图像N为n(x,y),亮度补偿后的图像为o(x,y),Gmax和Gmin分别表示图 像变换后最大灰度级与最小灰度级,对于图像n(x,y)中Y分量前5%的像素, o(x,y)取其灰度级的平均值Bav,对于图像n(x,y)中Y分量后5%的像素, o(x,y)取其灰度级的平均值为Eav,对于图像n(x,y)中Y分量中间90%的像素 用公式(2)进行光照补偿:
Figure BDA0002940597100000091
其中B表示亮度值前5%像素中灰度级的最大值,E表示亮度值后5%像素 中灰度级的最小值。
具体实施方式五
在具体实施方式一的基础上,一种基于分水岭变换的静态手势识别方法,所 述步骤四中通过阈值分割对图像O进行类肤色区域提取,通过合理地设置YCbCr 颜色空间下不同颜色分量的阈值,可以把类肤色区域完整的分割出来,具体阈值 设定方法为:
当Y>80,133<Cr<173,127<Cb<133时判定为肤色区域,其余为非肤色区 域。
具体实施方式六
在具体实施方式一的基础上,一种基于分水岭变换的静态手势识别方法,所 述步骤五中对图像U通过分水岭变换进行分割,流程如图2所示。分水岭算法 的计算过程是一个迭代标注过程,分为两个步骤,一个是排序过程,一个是淹没 过程。其基本思想是把图像看作是测地学上的拓扑地貌,图像中每一点像素的灰 度值表示该点的海拔高度,每一个局部极小值及其影响区域称为集水盆,而集水 盆的边界则形成分水岭。具体步骤为:
步骤五一、将阈值分割后的图像U中所有的像素按照灰度值进行分类,按 照从小到大的顺序进行排列t1、t2……tn,并设定测地阈值T1,其中t1、t2……tn表示不同灰度值所对应的像素;
步骤五二、找到灰度值最小的像素点,标记为灰度值的起始点ti,i的初始值 为1;
步骤五三、分别计算像素点ti与其八邻域像素点tm的测地距离dm-i,如公式(3)所示:
Figure BDA0002940597100000101
其中xi和yi为ti点的横、纵坐标,i为对应灰度值像素点的序号,i=1、2……n; xm和ym为tm点的横、纵坐标,m为对应八邻域点的序号,m=2、3……9;
若dm-i小于T1,则用ti点的像素取代tm点的像素,否则将ti点和tm点用分 割线分割成两块区域;
步骤五四、令i=i+1,重复步骤五三,直至对整个图像完成分割。
具体实施例方式七
在具体实施方式一的基础上,一种基于分水岭变换的静态手势识别方法,所 述步骤六中对分水岭分割后的图像P进行高斯滤波。高斯滤波是一种线性平滑 滤波,适用于消除高斯噪声,通过对整幅图像进行加权平均,每一个像素点的值 都由其本身和邻域内的其他像素值经过加权平均后得到。通过高斯滤波可以滤除 大量的局部极小值点,可以有效解决过分割的问题。具体方法如下:
使用两个高斯滤波核对分水岭分割后的图像进行高斯滤波,首先设定阈值T2, 通过噪点评估公式(4)进行高斯核的选择,对于图像内噪声点选用中心权值较 小的卷积核H1,边缘噪声点选用中心权值较大的卷积核H2
Figure BDA0002940597100000102
其中g(x,y)表示(x,y)点的灰度值,根据(x,y)的灰度值与周围八邻域相邻 点的灰度均值的差值的绝对值判断该点是否为图像内的噪声点。
具体实施方式八
在具体实施方式一的基础上,一种基于分水岭变换的静态手势识别方法,所 述步骤七中对高斯滤波后的图像Q通过灰度阈值合并分割出单独的完整手势图 像,流程如图3所示。灰度阈值合并是基于灰度相似性原理,即同一个区域内部 的像素的灰度值应该具有相似性,而不同区域的像素灰度值应该具有不一致性。 灰度阈值合并认为分水岭变换后的各小区域的灰度值在同一个灰度范围内就属 于同一个物体。当两个待合并区域灰度相似,并且中间的分水岭不是明显的边缘 标记,则两个待合并区域进行合并。具体方法为:
通过计算分水岭变换后的图像的各个区域与其相邻区域的区域相似度进行 区域合并,区域相似度公式为(4):
Figure BDA0002940597100000111
其中G(i,j)、E(i,j)与F(i,j)分别为图像Q中两个相邻区域的灰度对比度、 分水岭线的边缘相似度和区域邻接关系,定义如下:
Figure BDA0002940597100000112
Figure BDA0002940597100000113
Figure BDA0002940597100000114
(5)式中Ri、Rj为待判别的两个区域,ai、aj为Ri、Rj两个区域中的像 素点的个数,μi、μj为两区域的颜色均值,
Figure BDA0002940597100000115
为两区域的交集,L为周 长函数;
(6)式中的σi、σj表示位于分水岭两侧区域边缘的像素灰度方差,ηi、 ηj表示分水岭线两侧区域边缘的像素灰度均值;
(8)式中的Adjacency(i,j)=true表示区域Ri和区域Rj相邻, Adjacency(i,j)=false表示区域Ri和区域Rj不相邻;
灰度区域合并具体步骤为:
步骤七一、计算F(i,j)=1是否成立,若成立则说明两区域相邻,转步骤七 二,否则令i=i+1,j=j+1,重新计算F(i,j)=1是否成立;
步骤七二、设定阈值T3、T4,计算T3<E(i,j)<T4是否成立,若成立则说明 两区域边缘相似,转步骤七三,否则令i=i+1,j=j+1,转步骤七一;
步骤七三、设定阈值T5、T6,计算T5<G(i,j)<T6是否成立,若成立则说明 两区域灰度相似,转步骤七四,否则令i=i+1,j=j+1,转步骤七一;
步骤七四、计算区域相似度,如公式(9),若成立则转步骤七五,否则令i=i+1, j=j+1,转步骤七一;
Figure BDA0002940597100000121
步骤七五、进行区域Ri和区域Rj合并。
具体实施例方式九
在具体实施方式一的基础上,一种基于分水岭变换的静态手势识别方法,所 述步骤八中对分割后的手势图像A进行手势特征提取,包括面积、周长和傅里 叶描述子,并计算面积周长比,其中手势周长特征提取公式如(10)所示:
Figure BDA0002940597100000122
其中μ(x,y)为手势图像边缘函数;
手势面积特征提取为统计整个手势图像的像素数目,公式如(11)所示:
Figure BDA0002940597100000123
其中a(x,y)为整个手势图像函数;
计算面积周长比q,如公式(12)所示:
Figure BDA0002940597100000124
傅里叶描述子特征提取为对图像A进行傅里叶变换,得到傅里叶描述子, 并对其进行归一化处理,如公式(13)和(14)所示:
Figure BDA0002940597100000125
Figure BDA0002940597100000131
其中δ(k)为傅里叶描述子,δ′(k)为归一化的傅里叶描述子,s(t)为手势图 像边缘函数的复数形式。
具体实施方式十
在具体实施方式一的基础上,一种基于分水岭变换的静态手势识别方法, 所述步骤九中通过手势图像A的面积周长比、傅里叶相关性作为特征参数与模 板库中的手势图像的特征参数进行对比来识别手势,手势匹配识别流程如图4所 示。首先通过比较手势图像面积周长比缩小搜索范围,然后通过傅里叶算子进一 步判别手势,具体步骤为:
步骤九一、求取待识别手势的面积周长比q与模板库中手势图像Mn的面积 周长比的差值的绝对值;
步骤九二、将绝对值按照从小到大排序,取前三个作为候选手势M1、M2、 M3
步骤九三、将待识别手势分别与M1、M2、M3做傅里叶相关性分析得到R(k1)、 R(k2)、R(k3),如公式(15):
Figure BDA0002940597100000132
其中E为数学期望,cov是协方差,D是方差,σ是标准差,H=δ′(ηA)表 示手势图像A的傅里叶描述子,K=δ′(κm)表示手势图像M1、M2、M3的傅里 叶描述子,m=1、2、3,R(k)越接近于1则说明两手势相似度越高,形状越 接近,反之差距越大;
步骤九四、输出R(k1)、R(k2)、R(k3)的最大值R(kn);
步骤九五、判断R(kn)是否大于0.95,若大于则输出R(kn)对应手势指令,否 则判别该手势为无效手势。
以上对本申请实施例进行了详细介绍,以上本实施例的说明只适用于帮助理 解本申请的方法及其核心思想;同时对于本领域的一般技术人员,依据本申请的 思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书不应 理解为对基本申请的限制。

Claims (10)

1.一种基于分水岭变换的静态手势识别方法,其特征在于:通过以下步骤实现:
步骤一、CMOS图像传感器采集用户手部的RGB图像,记为M;
步骤二、将采集的RGB图像M转换到YCbCr颜色空间下,转换后的图像记为N;
步骤三、通过自适应亮度调整的方法对YCbCr颜色空间下的图像N进行光照补偿,补偿后的图像记为O;
步骤四、通过阈值分割对图像O进行类肤色区域提取,提取的图像记为U;
步骤五、对图像U通过分水岭变换进行分割,分割后的图像记为P;
步骤六、对分水岭分割后的图像P使用两个高斯滤波核进行高斯滤波,滤波后的图像记为Q;
步骤七、对高斯滤波后的图像Q通过灰度阈值合并分割出单独的完整手势图像,记为A;
步骤八、对分割后的手势图像A进行手势特征提取,包括手势图像的面积、周长和傅里叶描述子,并计算面积周长比;
步骤九、通过手势图像A的面积周长比、傅里叶相关性作为特征参数与模板库中的手势图像的特征参数进行对比来识别手势,首先通过面积周长比进行初次分类,再通过傅里叶相关性分析进行手势最终识别,若满足识别条件则输出手势指令,否则判别为无效手势。
2.根据权利要求1所述的一种基于分水岭变换的静态手势识别方法,其特征在于:所述步骤一中CMOS图像传感器采集用户手部的RGB图像要求被测者将手背中心或手掌中心正对摄像头做出相应手势动作。
3.根据权利要求1所述的一种基于分水岭变换的静态手势识别方法,其特征在于:所述步骤二中将采集的RGB图像M转换到YCbCr颜色空间下,根据公式(1)进行颜色空间转换:
Figure FDA0002940597090000011
其中Y表示明亮度,Cb和Cr表示蓝色和红色的浓度偏移量成分。
4.根据权利要求1所述的一种基于分水岭变换的静态手势识别方法,其特征在于:所述步骤三中通过自适应亮度调整的方法对YCbCr颜色空间下的图像N进行光照补偿,具体方法为:
设图像N为n(x,y),亮度补偿后的图像为o(x,y),Gmax和Gmin分别表示图像变换后最大灰度级与最小灰度级,对于图像n(x,y)中Y分量前5%的像素,o(x,y)取其灰度级的平均值Bav,对于图像n(x,y)中Y分量后5%的像素,o(x,y)取其灰度级的平均值为Eav,对于图像n(x,y)中Y分量中间90%的像素用公式(2)进行光照补偿:
Figure FDA0002940597090000021
其中B表示亮度值前5%像素中灰度级的最大值,E表示亮度值后5%像素中灰度级的最小值。
5.根据权利要求1所述的一种基于分水岭变换的静态手势识别方法,其特征在于:所述步骤四中通过阈值设定对图像O进行类肤色区域提取,具体阈值设定方法为:
当Y>80,133<Cr<173,127<Cb<133时判定为肤色区域,其余为非肤色区域。
6.根据权利要求1所述的一种基于分水岭变换的静态手势识别方法,其特征在于:所述步骤五中对图像U通过分水岭变换进行分割,按照以下步骤进行分水岭变换:
步骤五一、将阈值分割后的图像U中所有的像素按照灰度值进行分类,按照灰度值从小到大的顺序进行排列t1、t2……tn,并设定测地阈值T1,其中t1、t2……tn表示不同灰度值所对应的像素;
步骤五二、找到灰度值最小的像素点,标记为灰度值的起始点ti,i的初始值为1;
步骤五三、分别计算像素点ti与其八邻域像素点tm的测地距离dm-i,如公式(3)所示:
Figure FDA0002940597090000022
其中xi和yi为ti点的横、纵坐标,i为对应灰度值像素点的序号,i=1、2……n;xm和ym为tm点的横、纵坐标,m为对应八邻域点的序号,m=2、3……9;
若dm-i小于T1,则用ti点的像素取代tm点的像素,否则将ti点和tm点用分割线分割成两块区域;
步骤五四、令i=i+1,重复步骤五三,直至对整个图像完成分割。
7.根据权利要求1所述一种基于分水岭变换的静态手势识别方法,其特征在于:所述步骤六中对分水岭分割后的图像P进行高斯滤波,具体方法为:
使用两个高斯滤波核对分水岭分割后的图像进行高斯滤波,首先设定阈值T2,通过噪点评估公式(4)进行高斯核的选择,对于图像内噪声点选用中心权值较小的卷积核H1,边缘噪声点选用中心权值较大的卷积核H2
Figure FDA0002940597090000031
其中g(x,y)表示(x,y)点的灰度值,根据(x,y)的灰度值与周围八邻域相邻点的灰度均值的差值的绝对值判断该点是否为图像内的噪声点。
8.根据权利要求1所述一种基于分水岭变换的静态手势识别方法,其特征在于:所述步骤七中对高斯滤波后的图像Q通过灰度阈值合并分割出单独的完整手势图像,具体方法为:
通过计算分水岭变换后的图像的各个区域与其相邻区域的区域相似度进行区域合并,区域相似度公式为(5):
Figure FDA0002940597090000032
其中G(i,j)、E(i,j)与F(i,j)分别为图像Q中两个相邻区域的灰度对比度、分水岭线的边缘相似度和区域邻接关系,定义如下:
Figure FDA0002940597090000041
Figure FDA0002940597090000042
Figure FDA0002940597090000043
(6)式中Ri、Rj为待判别的两个区域,ai、aj为Ri、Rj两个区域中的像素点的个数,μi、μj为两区域的颜色均值,
Figure FDA0002940597090000044
为两区域的交集,L为周长函数;
(7)式中的σi、σj表示位于分水岭两侧区域边缘的像素灰度方差,ηi、ηj表示分水岭线两侧区域边缘的像素灰度均值;
(8)式中的Adjacency(i,j)=true表示区域Ri和区域Rj相邻,Adjacency(i,j)=false表示区域Ri和区域Rj不相邻;
灰度区域合并具体步骤为:
步骤七一、计算F(i,j)=1是否成立,若成立则说明两区域相邻,转步骤七二,否则令i=i+1,j=j+1,重新计算F(i,j)=1是否成立;
步骤七二、设定阈值T3、T4,计算T3<E(i,j)<T4是否成立,若成立则说明两区域边缘相似,转步骤七三,否则令i=i+1,j=j+1,转步骤七一;
步骤七三、设定阈值T5、T6,计算T5<G(i,j)<T6是否成立,若成立则说明两区域灰度相似,转步骤七四,否则令i=i+1,j=j+1,转步骤七一;
步骤七四、计算区域相似度,如公式(9),若成立则转步骤七五,否则令i=i+1,j=j+1,转步骤七一;
Figure FDA0002940597090000045
步骤七五、进行区域Ri和区域Rj合并。
9.根据权利要求1所述的一种基于分水岭变换的静态手势识别方法,其特征在于:所述步骤八中对分割后的手势图像A进行手势特征提取,手势周长特征提取公式如(10)所示:
Figure FDA0002940597090000051
其中μ(x,y)为手势图像边缘函数;
手势面积特征提取为统计整个手势图像的像素数目,公式如(11)所示:
Figure FDA0002940597090000052
其中a(x,y)为整个手势图像函数;
计算面积周长比q,如公式(12)所示:
Figure FDA0002940597090000053
傅里叶描述子特征提取为对图像A进行傅里叶变换,得到傅里叶描述子,并对其进行归一化处理,如公式(13)和(14)所示:
Figure FDA0002940597090000054
Figure FDA0002940597090000055
其中δ(k)为傅里叶描述子,δ′(k)为归一化的傅里叶描述子,s(t)为手势图像边缘函数的复数形式。
10.根据权利要求1所述的一种基于分水岭变换的静态手势识别方法,其特征在于:所述步骤九中通过手势图像A的面积周长比、傅里叶相关性作为特征参数与模板库中的手势图像的特征参数进行对比来识别手势,具体步骤为:
步骤九一、求取待识别手势的面积周长比q与模板库中手势图像Mn的面积周长比的差值的绝对值;
步骤九二、将绝对值按照从小到大排序,取前三个作为候选手势M1、M2、M3
步骤九三、将待识别手势分别与M1、M2、M3做傅里叶相关性分析得到R(k1)、R(k2)、R(k3),如公式(15):
Figure FDA0002940597090000061
其中E为数学期望,cov是协方差,D是方差,σ是标准差,H=δ′(ηA)表示手势图像A的傅里叶描述子,K=δ′(κm)表示手势图像M1、M2、M3的傅里叶描述子,m=1、2、3,R(k)越接近于1则说明两手势相似度越高,形状越接近,反之差距越大;
步骤九四、输出R(k1)、R(k2)、R(k3)的最大值R(kn);
步骤九五、判断R(kn)是否大于0.95,若大于则输出R(kn)对应手势指令,否则判别该手势为无效手势。
CN202110177991.0A 2021-02-09 2021-02-09 一种基于分水岭变换的静态手势识别方法 Active CN112906550B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110177991.0A CN112906550B (zh) 2021-02-09 2021-02-09 一种基于分水岭变换的静态手势识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110177991.0A CN112906550B (zh) 2021-02-09 2021-02-09 一种基于分水岭变换的静态手势识别方法

Publications (2)

Publication Number Publication Date
CN112906550A true CN112906550A (zh) 2021-06-04
CN112906550B CN112906550B (zh) 2022-07-19

Family

ID=76123094

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110177991.0A Active CN112906550B (zh) 2021-02-09 2021-02-09 一种基于分水岭变换的静态手势识别方法

Country Status (1)

Country Link
CN (1) CN112906550B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114625333A (zh) * 2022-03-08 2022-06-14 深圳康荣电子有限公司 一种可记录手势指令进行控制的液晶拼接lcd系统及方法
CN115100083A (zh) * 2022-08-25 2022-09-23 江苏游隼微电子有限公司 一种车载影像的图像亮度自适应调节方法
CN115861320A (zh) * 2023-02-28 2023-03-28 天津中德应用技术大学 一种汽车零件加工信息智能检测方法
CN116884095A (zh) * 2023-09-08 2023-10-13 烟台大学 仿生机械手的手势识别控制方法、系统、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8363939B1 (en) * 2006-10-06 2013-01-29 Hrl Laboratories, Llc Visual attention and segmentation system
US20170213349A1 (en) * 2016-01-21 2017-07-27 Riverside Research Institute Method for automatic tissue segmentation of medical images
CN109190496A (zh) * 2018-08-09 2019-01-11 华南理工大学 一种基于多特征融合的单目静态手势识别方法
CN110717852A (zh) * 2019-06-13 2020-01-21 内蒙古大学 一种基于fpga的田间视频图像实时分割系统及方法
CN111739058A (zh) * 2020-06-03 2020-10-02 大连理工大学 一种基于高斯滤波的分水岭算法的自由液面识别和提取的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8363939B1 (en) * 2006-10-06 2013-01-29 Hrl Laboratories, Llc Visual attention and segmentation system
US20170213349A1 (en) * 2016-01-21 2017-07-27 Riverside Research Institute Method for automatic tissue segmentation of medical images
CN109190496A (zh) * 2018-08-09 2019-01-11 华南理工大学 一种基于多特征融合的单目静态手势识别方法
CN110717852A (zh) * 2019-06-13 2020-01-21 内蒙古大学 一种基于fpga的田间视频图像实时分割系统及方法
CN111739058A (zh) * 2020-06-03 2020-10-02 大连理工大学 一种基于高斯滤波的分水岭算法的自由液面识别和提取的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
董旭德: "类肤色背景下单目视觉手势识别算法模型研究", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114625333A (zh) * 2022-03-08 2022-06-14 深圳康荣电子有限公司 一种可记录手势指令进行控制的液晶拼接lcd系统及方法
CN114625333B (zh) * 2022-03-08 2022-10-18 深圳康荣电子有限公司 一种可记录手势指令控制液晶拼接lcd的方法及系统
CN115100083A (zh) * 2022-08-25 2022-09-23 江苏游隼微电子有限公司 一种车载影像的图像亮度自适应调节方法
CN115100083B (zh) * 2022-08-25 2022-11-04 江苏游隼微电子有限公司 一种车载影像的图像亮度自适应调节方法
CN115861320A (zh) * 2023-02-28 2023-03-28 天津中德应用技术大学 一种汽车零件加工信息智能检测方法
CN116884095A (zh) * 2023-09-08 2023-10-13 烟台大学 仿生机械手的手势识别控制方法、系统、设备和存储介质
CN116884095B (zh) * 2023-09-08 2023-11-21 烟台大学 仿生机械手的手势识别控制方法、系统、设备和存储介质

Also Published As

Publication number Publication date
CN112906550B (zh) 2022-07-19

Similar Documents

Publication Publication Date Title
CN112906550B (zh) 一种基于分水岭变换的静态手势识别方法
CN109344701B (zh) 一种基于Kinect的动态手势识别方法
CN108108761B (zh) 一种基于深度特征学习的快速交通信号灯检测方法
CN104268583B (zh) 基于颜色区域特征的行人重识别方法及系统
CN107844795B (zh) 基于主成分分析的卷积神经网络特征提取方法
CN110717896B (zh) 基于显著性标签信息传播模型的板带钢表面缺陷检测方法
CN105931295B (zh) 一种地质图专题信息提取方法
CN103035013B (zh) 一种基于多特征融合的精确运动阴影检测方法
CN108537239B (zh) 一种图像显著性目标检测的方法
CN108268859A (zh) 一种基于深度学习的人脸表情识别方法
CN102194108B (zh) 一种聚类线性鉴别分析特征选择的笑脸表情识别方法
CN104504383B (zh) 一种基于肤色和Adaboost算法的人脸检测方法
CN103020992B (zh) 一种基于运动颜色关联的视频图像显著性检测方法
CN104484658A (zh) 一种基于多通道卷积神经网络的人脸性别识别方法及装置
Konwar et al. An American sign language detection system using HSV color model and edge detection
CN110956099B (zh) 一种动态手势指令识别方法
CN110032932B (zh) 一种基于视频处理和决策树设定阈值的人体姿态识别方法
CN109740572A (zh) 一种基于局部彩色纹理特征的人脸活体检测方法
CN110503613A (zh) 基于级联空洞卷积神经网络的面向单幅图像去雨方法
CN110046544A (zh) 基于卷积神经网络的数字手势识别方法
CN111160194B (zh) 一种基于多特征融合的静态手势图像识别方法
Vishwakarma et al. Simple and intelligent system to recognize the expression of speech-disabled person
CN112487981A (zh) 基于双路分割的ma-yolo动态手势快速识别方法
CN111339932B (zh) 一种掌纹图像预处理方法和系统
WO2011074014A2 (en) A system for lip corner detection using vision based approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant