CN109359566A - 利用手指特征进行层级分类的手势识别方法 - Google Patents
利用手指特征进行层级分类的手势识别方法 Download PDFInfo
- Publication number
- CN109359566A CN109359566A CN201811152159.XA CN201811152159A CN109359566A CN 109359566 A CN109359566 A CN 109359566A CN 201811152159 A CN201811152159 A CN 201811152159A CN 109359566 A CN109359566 A CN 109359566A
- Authority
- CN
- China
- Prior art keywords
- finger
- gesture
- cutting line
- profile
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Image Analysis (AREA)
Abstract
利用手指特征进行层级分类的手势识别方法,涉及人工智能技术领域,通过构建一种嵌入深度稀疏自编码器的层级决策分类器,利用不同手势伸出手指的数量、方向、位置和形状等信息对手势进行逐级分组和分类识别,其主要包括手势图像预处理、手指区域分割、手指特征提取和手势分类识别四个步骤。本发明有益效果:本发明解决了现有手势识别的精度低以及针对光照、方向和尺度改变的鲁棒性差的问题,具有很好的鲁棒性,在识别率和稳定性方面具有显著优越性。
Description
技术领域
本发明涉及人工智能技术领域,具体地说是利用手指特征进行层级分类的手势识别方法。
背景技术
当今,几乎所有的人机交互都是用手来完成的。例如:利用手通过对键盘、鼠标或触摸屏的操作来输入或读取设备的信息;利用数据手套感知手的抓取、移动、旋转等动作,实现与虚拟现实系统的交互。传统的人机交互方式需要繁琐枯燥的操作,甚至需要复杂的硬件系统,这些都给用户带来了极大的不便。随着人工智能技术的发展,基于视觉的手势识别技术实现了非接触式的人机交互,极大的减轻了人机交互对用户的约束和限制,并且有助于人类手势自然表达方式的发挥,在人与计算机交互、人与机器人交互、手语交互、医疗辅助、智能家居、虚拟现实、体感游戏等领域具有十分广泛的应用前景。
视觉手势识别是指对视频采集设备采集得到的包含手势的图像或视频,通过计算机视觉技术进行处理,进而识别出用户不同手势所传递的信息的技术。手势识别分为静态手势识别和动态手势识别两种类型:静态手势识别通过对手势图像的处理,根据不同手指伸出组合的状态进行分类识别,从而确定每种手势所代表的含义;动态手势识别通过对手势视频的处理,根据手运动的轨迹、速度、角度等信息识别手势所表达的信息。
基于视觉的手势识别技术是当今国际上极具体挑战性的前沿课题,并正在引起研究人员的极大兴趣。现有的手势识别方法主要有:基于手势几何特征的方法、基于手势轮廓特征的方法、基于手势形状特征的方法等;尽管目前已有针对手势识别的研究工作,但识别的精度以及针对光照、方向和尺度改变的鲁棒性还远未达到实际应用的需要。
发明内容
本发明所要解决的技术问题是提供利用手指特征进行层级分类的手势识别方法,解决现有手势识别的精度低以及针对光照、方向和尺度改变的鲁棒性差的问题。
本发明为解决上述技术问题所采用的技术方案是:利用手指特征进行层级分类的手势识别方法,包括以下步骤:
步骤一、手势图像预处理:对采集得到的包含手势的图像进行预处理以从中分割出手势区域,并对手势进行方向校正;
步骤二、手指区域分割:根据人手轮廓的生理特点,获取分割所需的候选切割线;然后依据候选切割线分割出手指形状的凸性以及候选切割线的两个端点之间所包含间隔轮廓点数量,确定手势中每一根手指的最佳切割线;最后,利用手指的最佳切割线逐一分割出每个手指区域;
步骤三、手指特征提取:首先,将手指细化成逼近手指中心线的单像素线条,再由手指中心线的像素坐标计算手指的方向特征;然后,根据分割出的每个手指所有像素点在手势圆周面内的方位分布情况来确定手指的位置特征;最后,利用分割出手指尺度不变Hu矩特征构建手指的形状特征;
步骤四、手势分类识别:构建一种嵌入深度稀疏自编码器的层级决策分类器对手势进行逐级分类识别,先利用手指的数量对手势图像进行分组,再利用手指的方向、位置和形状特征在每一组内进行手势类别的细分和识别。
本发明所述步骤一中对手势图像预处理包括以下内容:
1.1、在颜色空间中利用贝叶斯模型分割得到肤色区域:首先,采用手势图像在YCrCb颜色空间中的Cr和Cb分量组成肤色特征向量;然后,分别建立肤色区域和背景区域特征向量的先验概率;最后,利用贝叶斯决策规则根据图像不同区域Cr、Cb分量的值分割出肤色手势区域;
1.2、通过形态学处理去除背景区域中的噪声点;
1.3、利用手势区域的最大内接圆确定手势中心点,并以该点作为基准去除手腕部分;
1.4、运用霍夫变换检测出手势轮廓线上直线特征的方向,再根据这些直线方向的平均值将手势旋转校正到竖直方向。
本发明所述步骤2中手指区域分割的具体方法为:
2.1、候选切割线判定:在手势轮廓上间隔取点,以手势区域中心正下方的轮廓点作为起始点,沿顺时针方向对轮廓点依次进行编号;当两个轮廓点的连线位于手势轮廓内,或与轮廓重叠,称这一对轮廓点为可见对;计算间隔轮廓点集中每一对可见对之间的距离,并使用手势区域最大内接圆半径归一化处理为dL;设置距离阈值Thd和间隔阈值Thh,采用可见对之间的相对距离dL和可见对之间所包含间隔轮廓点数量hL判定是否为候选切割线:
当S(dL,hL)=1时,表示该可见对符合阈值条件,将保留其构成的切割线。
2.2、最佳切割线选择:设Gm表示间隔轮廓点集中所有可见对的数量,Gn为间隔轮廓点集中所有轮廓点相连线段的数量,变量CR表示分割后形状的凸性,用来衡量分割后形状是否满足要求:
取可见对中两个轮廓点中较小的一个序号作为切割线序号,根据切割线的序号的相近程度,将它们分为若干组,每一组切割线对应一个手指,在此基础上确定每个手指的候选切割线,计算每组中每一条切割线分割出手指的凸性cL,并统计构成此切割线的可见对之间所包含间隔轮廓点的数量设置凸性阈值Thc进行满足手势分割凸性的判断:
当M(cL,gL)=1时,表示该可见对所构成的切割线满足手势分割的凸性条件;当每一组中的一条切割线同时满足式(2)和(3)时,则该切割线为这一组中的最佳切割线,即所对应手指的最佳切割线;按照从左到右的顺序,对每个手指进行逐一分割。
本发明所述步骤3中手指特征提取的具体内容为:
3.1、手指方向特征建立:将分割得到的每个手指区域缩成逼近手指中心线的单像素线条,再利用线条的像素点坐标计算手指的伸出方向,具体方法为:
在3×3邻域内检查图像的每一像素点,如果该像素点同时满足:1)在上、下、左、右任一方向没有邻点;2)不是孤立点或终止线;3)去除该象素点不会断开区域,则去除该象素点;不断的遍历手指图像,重复这一步骤直到没有像素点可以去除,直至手指区域被细化成一中心线;
在手指的细化中心线上按照一定的像素间隔取两个像素,坐标分别为(x1,y1)和(x2,y2),将这两个像素相连构成的第i条直线的方向可表示为:
沿手指中心细线的方向取nl对这样的像素,可以得到nl条直线的方向(i=1,2,3,…,n),将这nl个方向的平均值定义为该手指的方向特征βf:
3.2、手指位置特征建立:根据公式(5)计算出每一个手指的方向角,将所有手指的方向角进行平均得到手势的主方向,根据手势的主方向的值将手势图像旋转一定的角度,将所有手势图像的主方向统一调整到竖直方向;
以手势区域中心为圆心,以水平向右方向为起始位置,沿圆周方向逆时针将手势区域分成N等份,对每个等份依次进行编号:1,2,3,…,N,采用这些编号定义每个手指的位置,即设pj代表某个手指所包含的第j个像素点的位置,如果这个像素点位于第k个等分区域时,pj=k;则该手指的位置D为所有像素点所在区域编号的平均值:
式中,nf为手指所包含像素点的数量。
3.3、手指形状特征建立:设Hu不变矩为构建如下特征M1,M2,M3,…,M6描述手指的形状:
本发明的有益效果是:本发明提供一种具有高识别率和高鲁棒性的静态手势识别方法,针对现有手势识别的精度低以及针对光照、方向和尺度改变的鲁棒性差的问题,进行专门的设计,建立在光照、方向和尺度变化的情况下具有很好的鲁棒性,在识别率和稳定性方面具有显著优越性的手势识别方法,具有以下优点:(1)本发明的手势识别方法在YCrCb空间中通过肤色分割得到手势区域,这种处理利用了肤色在YCrCb空间中良好聚类特性,克服了光照条件变化对手势识别的影响。
(2)在手指分割前,利用手势轮廓线的方向对手势进行方向旋转校正;在手指分割完成后,利用手指方向对手势方向进行进一步的旋转校正,这种方法克服了手势方向变化对手势识别的影响,使手势识别结果更加准确。
(3)通过构建具有尺度不变性的Hu矩特征来描述不同手指的形状,这种表示克服了手势尺度变化对手势识别的影响,在进行手势识别时,通过在分类器中嵌入深度稀疏自编码器提高了分类器的泛化能力。
(4)本发明方法在光照、方向和尺度变化时具有很好的鲁棒性,对15种手势的平均识别率达到了99.6%,识别率的标准差仅为0.38,这些指标远显著优于现有方法。
附图说明
图1为典型的静态手势图像示意图;
图2为本发明对图1中手势图像的手势区域肤色分割效果图;
图3为本发明对图2中手势图像的背景区域去燥后效果图;
图4为本发明对图1的手势区域分割结果图;
图5为本发明对手势方向归一化效果图;
图6为本发明手势分割的可见对示意图;
图7为本发明手指分割结果的示意图;
图8为本发明对手指细化后手指图像的效果图;
图9为本发明对手指细化后手指中心线的效果图;
图10为本发明手势图像分区示意图;
图11为本发明手势图像数据库示意图;
图12为本发明层级决策分类器分类示意图。
具体实施方式
下面结合说明书附图对本发明实施例进行详细的阐述。
本发明的手势识别方法主要有四个步骤组成:手势图像预处理、手指区域分割、手指特征提取和手势分类识别。典型的静态手势如图1所示,下面以该图中的手势为对象说明本发明的实施过程。
步骤1手势图像预处理
手势图像预处理的目的是从采集得到的手势图像中分割出手势区域,并对手势进行方向校正。首先在颜色空间中利用贝叶斯模型分割得到肤色区域;然后,通过形态学处理去除背景区域中的噪声点;最后,利用手势区域的最大内接圆确定手势中心点,并以该点作为基准去除手腕部分。
步骤1.1肤色区域分割
首先,采用手势图像在YCrCb颜色空间中的Cr和Cb分量组成肤色特征向量;然后,分别建立肤色区域和背景区域特征向量的先验概率;最后,利用贝叶斯决策规则根据图像不同区域Cr、Cb分量的值分割出肤色手势区域。
根据图1中原始图像像素点的Cr、Cb分量,利用贝叶斯决策规则将像素点分类为肤色像素和背景像素。将背景像素的Cr、Cb分量设置为零得到手势的肤色区域的分割效果如图2所示。
步骤1.2背景区域去噪
选用5×5的正方形结构元素对手势图像进行逻辑运算。首先,用结构元素遍历目标图像,使结构元素与其覆盖的图像像素点邻域作“与”操作,如果结果为“1”,则保留该像素点,否则剔除。然后,用结构元素遍历目标图像,使结构元素与其覆盖的图像邻域作“或”操作,如果结果都为“0”,则剔除像素点,否则保留。对图2中的手势图像区域进行去噪处理,得到的结果图像如图3所示。
步骤1.3手势区域分割
以手势区域内的任意一点为圆心画半径为r且完全内含于手势区域的圆,在手势区域内遍历圆心的位置,当半径r达到最大值rmax时的圆为手势区域的最大内接圆。在得到的圆心位置画半径为2rmax的圆,将圆下方的手腕部分去除,从而最终完成手势区域的分割。如图4所示。
步骤1.4手势方向归一化
运用霍夫变换检测出手势轮廓线上直线特征的方向,再根据这些直线的方向的平均值将手势旋转校正到竖直方向,如图5所示。
步骤2手指区域分割
首先,根据人手轮廓的生理特点,获取分割所需的候选切割线;然后,依据候选切割线分割出手指形状的凸性以及候选切割线的两个端点之间所包含间隔轮廓点数量,确定手势中每一根手指的最佳切割线。
步骤2.1候选切割线判定
在手势轮廓上间隔取点。以手势区域中心正下方的轮廓点作为起始点,沿顺时针方向对轮廓点依次进行编号。如图6所示,设点V1、V2、V3、V4为间隔轮廓点集中的4个轮廓点。当两个轮廓点的连线位于手势轮廓内,或与轮廓重叠,称这一对轮廓点为可见对。图6中V2V4是一对可见对,因为两点的连线位于手势轮廓内;而V1V2与V2V3则不是,因为它们的连线的全部或部分位于手势轮廓外。
计算间隔轮廓点集中每一对可见对之间的距离,并使用手势区域最大内接圆半径归一化处理为dL。采用可见对之间的相对距离dL和可见对之间所包含间隔轮廓点数量hL来判定是否为候选切割线,设置距离阈值Thd和间隔阈值Thh进行判断:
当S(dL,hL)=1时,表示该可见对符合阈值条件,将保留其构成的切割线。
步骤2.2最佳切割线选择
设Gm表示间隔轮廓点集中所有可见对的数量,Gn为间隔轮廓点集中所有轮廓点相连线段的数量。定义一个变量CR来表示分割后形状的凸性,用来衡量分割后形状是否满足要求:
取可见对中两个轮廓点中较小的一个序号作为切割线序号,根据切割线的序号的相近程度,将它们分为若干组。每一组切割线对应一个手指,在此基础上确定每个手指的候选切割线。计算每组中每一条切割线分割出手指的凸性cL,并统计构成此切割线的可见对之间所包含间隔轮廓点的数量设置凸性阈值Thc进行满足手势分割凸性的判断:
当M(cL,gL)=1时,表示该可见对所构成的切割线满足手势分割的凸性条件。当每一组中的一条切割线同时满足式(1)和(2)时,则该切割线为这一组中的最佳切割线,即所对应手指的最佳切割线。按照从左到右的顺序,对每个手指进行逐一分割,得到典型手势的分割结果如图7所示。图中采用不同的颜色对分割出的手指进行标记。
步骤3手指特征提取
利用伸出的手指来建立手势识别的特征。首先,将手指细化成逼近手指中心线的单像素线条,再由手指中心线的像素坐标计算手指的方向;然后,根据分割出的每个手指所有像素点在手势圆周面内的方位分布情况来确定手指的位置特征;最后,利用分割出手指尺度不变Hu矩特征构建手指的形状特征。
步骤3.1手指方向特征建立
将分割得到的每个手指区域缩成逼近手指中心线的单像素线条,再利用线条的像素点坐标计算手指的伸出方向。
在3×3邻域内检查图像的每一像素点,如果满足:1)在上、下、左、右任一方向没有邻点;2)不是孤立点或终止线;3)去除该象素点不会断开区域,则去除该象素点;不断的遍历手指图像,重复这一步骤直到没有像素点可以去除。这一过程通过迭代法实现,一次剥去一层剥去区域边界,直至手指区域被细化成一中心线。细化处理后,原来的手指由相应的中心线来表示,将图8中的手指细化处理得到的结果如图9所示。
在手指的细化中心线上按照一定的像素间隔取两个像素,坐标分别为(x1,y1)和(x2,y2),将这两个像素相连构成的第i条直线的方向可表示为:
沿手指中心细线的方向取nl对这样的像素,可以得到nl条直线的方向(i=1,2,3,…,n)。将这nl个方向的平均值定义为该手指的方向特征:
步骤3.2手指位置特征建立
根据(5)式计算出每一个手指的方向角,将所有手指的方向角进行平均得到手势的主方向。根据手势的主方向的值将手势图像旋转一定的角度,将所有手势图像的主方向统一调整到竖直方向。
以手势区域中心为圆心,以水平向右方向为起始位置,沿圆周方向逆时针将手势区域分成N等份,如图10所示。对每个等份依次进行编号:1,2,3,…,N,采用这些编号来定义每个手指的位置。设pj代表某个手指所包含的第j个像素点的位置,如果这个像素点位于第k个等分区域时,pj=k。则该手指的位置为所有像素点所在区域编号的平均值:
式中,nf为手指所包含像素点的数量。
步骤3.3手指形状特征建立
Hu不变矩具有旋转和平移不变性,在Hu不变矩的基础上构建具有尺度不变性的矩特征来描述不同手指的形状。设Hu不变矩为构建如下特征M1,M2,M3,…,M6描述手指的形状:
步骤4手势分类识别
建立一种嵌入深度稀疏自编码器的层级决策分类器对手势进行逐级分类识别。采用阈值判断的方法,利用伸出手指的数量、方向和位置等特征对手势进行逐级分类;采用深度网络的输出,通过对伸出手指形状的识别来完成手势的最终识别。用于手指形状分类的深度稀疏自编码器采用4层网络结构,分别为一个输入层、两个特征层以及一个Softmax分类层。
本发明拟进行分类的图像库包含15种手势,如图11所示。进行分类所采用的层级决策分类器如图12所示。分类过程如下:
首先进行手势分组:根据手指数量将手势分为6组,分别包含0、1、2、3、4、5个手指。然后,再对每一组进行分类。
第一组的分类:第一组手势伸出的手指数量为0,仅对应于一种手势“手势1”,直接识别为手势“手势1”。
第二组的分类:根据伸出的手指方向将手势“手势3”区分出来,再根据手指的位置将手势“手势2”和手势“手势4”区分开来。为避免手势“手势2”和手势“手势3”之间的混淆,采用形状特征再对它们进行一次分类。
第三组的分类:根据伸出的左侧手指的位置将手势分为两组,再根据右侧手指的位置对每一组进行再分类,从而识别出手势“手势5”、“手势6”、“手势7”和“手势8”。
第四组的分类:根据伸出的左侧手指的位置将手势分为两组,再根据右侧手指的形状将第一组区分为出手势“手势9”和“手势10”,根据右侧手指的位置将第二组区分为出手势“手势11”和“手势12”。为避免手势“手势1”和“手势12”的混淆,利用右侧手指的形状特征对两者再进行一次分类。
第五组的分类:根据左侧第一个手指的形状特征将手势区分为手势“手势13”和“手势14”。
第六组的分类:第六组伸出的手指数量为5,仅对应于一种手势“手势15”,直接识别为手势“手势15”。
图11中的图像库包含15种手势,相应的编号分别为1、2、3、…、15。每一种手势分别由5人各采集40次,共计3000幅手势图像。使用900幅图像进行层级决策分类器的训练,使用其余的2100幅图像进行识别测试实验,得到的平均识别率为99.6%,识别率的标准差为0.38。
Claims (4)
1.利用手指特征进行层级分类的手势识别方法,其特征在于:包括以下步骤:
步骤一、手势图像预处理:对采集得到的包含手势的图像进行预处理以从中分割出手势区域,并对手势进行方向校正;
步骤二、手指区域分割:根据人手轮廓的生理特点,获取分割所需的候选切割线;然后依据候选切割线分割出手指形状的凸性以及候选切割线的两个端点之间所包含间隔轮廓点数量,确定手势中每一根手指的最佳切割线;最后,利用手指的最佳切割线逐一分割出每个手指区域;
步骤三、手指特征提取:首先,将手指细化成逼近手指中心线的单像素线条,再由手指中心线的像素坐标计算手指的方向特征;然后,根据分割出的每个手指所有像素点在手势圆周面内的方位分布情况来确定手指的位置特征;最后,利用分割出手指尺度不变Hu矩特征构建手指的形状特征;
步骤四、手势分类识别:构建一种嵌入深度稀疏自编码器的层级决策分类器对手势进行逐级分类识别,先利用手指的数量对手势图像进行分组,再利用手指的方向、位置和形状特征在每一组内进行手势类别的细分和识别。
2.根据权利要求1所述的利用手指特征进行层级分类的手势识别方法,其特征在于:所述步骤一中对手势图像预处理包括以下内容:
1.1、在颜色空间中利用贝叶斯模型分割得到肤色区域:首先,采用手势图像在YCrCb颜色空间中的Cr和Cb分量组成肤色特征向量;然后,分别建立肤色区域和背景区域特征向量的先验概率;最后,利用贝叶斯决策规则根据图像不同区域Cr、Cb分量的值分割出肤色手势区域;
1.2、通过形态学处理去除背景区域中的噪声点;
1.3、利用手势区域的最大内接圆确定手势中心点,并以该点作为基准去除手腕部分;
1.4、运用霍夫变换检测出手势轮廓线上直线特征的方向,再根据这些直线方向的平均值将手势旋转校正到竖直方向。
3.根据权利要求1所述的利用手指特征进行层级分类的手势识别方法,其特征在于:所述步骤2中手指区域分割的具体方法为:
2.1、候选切割线判定:在手势轮廓上间隔取点,以手势区域中心正下方的轮廓点作为起始点,沿顺时针方向对轮廓点依次进行编号;当两个轮廓点的连线位于手势轮廓内,或与轮廓重叠,称这一对轮廓点为可见对;计算间隔轮廓点集中每一对可见对之间的距离,并使用手势区域最大内接圆半径归一化处理为dL;设置距离阈值Thd和间隔阈值Thh,采用可见对之间的相对距离dL和可见对之间所包含间隔轮廓点数量hL判定是否为候选切割线:
当S(dL,hL)=1时,表示该可见对符合阈值条件,将保留其构成的切割线;
2.2、最佳切割线选择:设Gm表示间隔轮廓点集中所有可见对的数量,Gn为间隔轮廓点集中所有轮廓点相连线段的数量,变量CR表示分割后形状的凸性,用来衡量分割后形状是否满足要求:
取可见对中两个轮廓点中较小的一个序号作为切割线序号,根据切割线的序号的相近程度,将它们分为若干组,每一组切割线对应一个手指,在此基础上确定每个手指的候选切割线,计算每组中每一条切割线分割出手指的凸性cL,并统计构成此切割线的可见对之间所包含间隔轮廓点的数量设置凸性阈值Thc进行满足手势分割凸性的判断:
当M(cL,gL)=1时,表示该可见对所构成的切割线满足手势分割的凸性条件;当每一组中的一条切割线同时满足式(2)和(3)时,则该切割线为这一组中的最佳切割线,即所对应手指的最佳切割线;按照从左到右的顺序,对每个手指进行逐一分割。
4.根据权利要求1所述的利用手指特征进行层级分类的手势识别方法,其特征在于:所述步骤3中手指特征提取的具体内容为:
3.1、手指方向特征建立:将分割得到的每个手指区域缩成逼近手指中心线的单像素线条,再利用线条的像素点坐标计算手指的伸出方向,具体方法为:在3×3邻域内检查图像的每一像素点,如果该像素点同时满足:1)在上、下、左、右任一方向没有邻点;2)不是孤立点或终止线;3)去除该象素点不会断开区域,则去除该象素点;不断的遍历手指图像,重复这一步骤直到没有像素点可以去除,直至手指区域被细化成一中心线;
在手指的细化中心线上按照一定的像素间隔取两个像素,坐标分别为(x1,y1)和(x2,y2),将这两个像素相连构成的第i条直线的方向可表示为:
沿手指中心细线的方向取nl对这样的像素,可以得到nl条直线的方向将这nl个方向的平均值定义为该手指的方向特征βf:
3.2、手指位置特征建立:根据公式(5)计算出每一个手指的方向角,将所有手指的方向角进行平均得到手势的主方向,根据手势的主方向的值将手势图像旋转一定的角度,将所有手势图像的主方向统一调整到竖直方向;
以手势区域中心为圆心,以水平向右方向为起始位置,沿圆周方向逆时针将手势区域分成N等份,对每个等份依次进行编号:1,2,3,…,N,采用这些编号定义每个手指的位置,即设pj代表某个手指所包含的第j个像素点的位置,如果这个像素点位于第k个等分区域时,pj=k;则该手指的位置D为所有像素点所在区域编号的平均值:
式中,nf为手指所包含像素点的数量;
3.3、手指形状特征建立:设Hu不变矩为构建如下特征M1,M2,M3,…,M6描述手指的形状:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811152159.XA CN109359566B (zh) | 2018-09-29 | 2018-09-29 | 利用手指特征进行层级分类的手势识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811152159.XA CN109359566B (zh) | 2018-09-29 | 2018-09-29 | 利用手指特征进行层级分类的手势识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109359566A true CN109359566A (zh) | 2019-02-19 |
CN109359566B CN109359566B (zh) | 2022-03-15 |
Family
ID=65348251
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811152159.XA Active CN109359566B (zh) | 2018-09-29 | 2018-09-29 | 利用手指特征进行层级分类的手势识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109359566B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110309806A (zh) * | 2019-07-08 | 2019-10-08 | 哈尔滨理工大学 | 一种基于视频图像处理的手势识别系统及其方法 |
CN110738118A (zh) * | 2019-09-16 | 2020-01-31 | 平安科技(深圳)有限公司 | 手势识别方法、系统及管理终端、计算机可读存储介质 |
CN111507403A (zh) * | 2020-04-17 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 图像分类方法、装置、计算机设备和存储介质 |
CN111523435A (zh) * | 2020-04-20 | 2020-08-11 | 安徽中科首脑智能医疗研究院有限公司 | 一种基于目标检测ssd的手指检测方法、系统及存储介质 |
CN111626364A (zh) * | 2020-05-28 | 2020-09-04 | 中国联合网络通信集团有限公司 | 手势图像分类方法、装置、计算机设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009147904A1 (ja) * | 2008-06-04 | 2009-12-10 | 国立大学法人筑波大学 | 手指形状推定装置、手指形状の推定方法及びプログラム |
CN101807114A (zh) * | 2010-04-02 | 2010-08-18 | 浙江大学 | 一种基于三维手势的自然交互方法 |
CN102368290A (zh) * | 2011-09-02 | 2012-03-07 | 华南理工大学 | 一种基于手指高级特征的手势识别方法 |
CN102467657A (zh) * | 2010-11-16 | 2012-05-23 | 三星电子株式会社 | 手势识别系统和方法 |
CN103544472A (zh) * | 2013-08-30 | 2014-01-29 | Tcl集团股份有限公司 | 一种基于手势图像的处理方法及处理装置 |
CN104063059A (zh) * | 2014-07-13 | 2014-09-24 | 华东理工大学 | 一种基于手指分割的实时手势识别方法 |
US20160283768A1 (en) * | 2015-03-24 | 2016-09-29 | Michael Kounavis | Reliable fingertip and palm detection |
-
2018
- 2018-09-29 CN CN201811152159.XA patent/CN109359566B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009147904A1 (ja) * | 2008-06-04 | 2009-12-10 | 国立大学法人筑波大学 | 手指形状推定装置、手指形状の推定方法及びプログラム |
CN102113012A (zh) * | 2008-06-04 | 2011-06-29 | 国立大学法人筑波大学 | 手指形状推定装置、手指形状的推定方法及程序 |
CN101807114A (zh) * | 2010-04-02 | 2010-08-18 | 浙江大学 | 一种基于三维手势的自然交互方法 |
CN102467657A (zh) * | 2010-11-16 | 2012-05-23 | 三星电子株式会社 | 手势识别系统和方法 |
CN102368290A (zh) * | 2011-09-02 | 2012-03-07 | 华南理工大学 | 一种基于手指高级特征的手势识别方法 |
CN103544472A (zh) * | 2013-08-30 | 2014-01-29 | Tcl集团股份有限公司 | 一种基于手势图像的处理方法及处理装置 |
CN104063059A (zh) * | 2014-07-13 | 2014-09-24 | 华东理工大学 | 一种基于手指分割的实时手势识别方法 |
US20160283768A1 (en) * | 2015-03-24 | 2016-09-29 | Michael Kounavis | Reliable fingertip and palm detection |
Non-Patent Citations (4)
Title |
---|
HUI-SHYONG YEO 等,: "Hand tracking and gesture recognition system for human-computer interaction using low-cost hardware", 《SPRINGERLINK》 * |
YIMIN ZHOU 等,: "A novelfinger and hand pose estimation technique for real-time hand", 《PATTERN RECOGNITION》 * |
刘淑萍 等,: "结合手指检测和HOG特征的分层静态手势识别", 《中国图象图形学报》 * |
王艳 等,: "基于特征距离加权的手势识别", 《计算机科学》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110309806A (zh) * | 2019-07-08 | 2019-10-08 | 哈尔滨理工大学 | 一种基于视频图像处理的手势识别系统及其方法 |
CN110309806B (zh) * | 2019-07-08 | 2020-12-11 | 哈尔滨理工大学 | 一种基于视频图像处理的手势识别系统及其方法 |
CN110738118A (zh) * | 2019-09-16 | 2020-01-31 | 平安科技(深圳)有限公司 | 手势识别方法、系统及管理终端、计算机可读存储介质 |
WO2021051575A1 (zh) * | 2019-09-16 | 2021-03-25 | 平安科技(深圳)有限公司 | 手势识别方法、系统及管理终端、计算机可读存储介质 |
CN110738118B (zh) * | 2019-09-16 | 2023-07-07 | 平安科技(深圳)有限公司 | 手势识别方法、系统及管理终端、计算机可读存储介质 |
CN111507403A (zh) * | 2020-04-17 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 图像分类方法、装置、计算机设备和存储介质 |
CN111523435A (zh) * | 2020-04-20 | 2020-08-11 | 安徽中科首脑智能医疗研究院有限公司 | 一种基于目标检测ssd的手指检测方法、系统及存储介质 |
CN111626364A (zh) * | 2020-05-28 | 2020-09-04 | 中国联合网络通信集团有限公司 | 手势图像分类方法、装置、计算机设备及存储介质 |
CN111626364B (zh) * | 2020-05-28 | 2023-09-01 | 中国联合网络通信集团有限公司 | 手势图像分类方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109359566B (zh) | 2022-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109359566A (zh) | 利用手指特征进行层级分类的手势识别方法 | |
CN106682598B (zh) | 一种基于级联回归的多姿态的人脸特征点检测方法 | |
CN103093196B (zh) | 一种基于手势的汉字交互输入与识别方法 | |
Nai et al. | Fast hand posture classification using depth features extracted from random line segments | |
CN104063059B (zh) | 一种基于手指分割的实时手势识别方法 | |
CN109190516A (zh) | 一种基于手掌边缘轮廓矢量化的静态手势识别方法 | |
CN105536205A (zh) | 一种基于单目视频人体动作感知的上肢训练系统 | |
CN105718552A (zh) | 基于服装手绘草图的服装图像检索方法 | |
Mahmood et al. | A Comparative study of a new hand recognition model based on line of features and other techniques | |
CN106503619B (zh) | 基于bp神经网络的手势识别方法 | |
CN104050460B (zh) | 多特征融合的行人检测方法 | |
Sahana et al. | Hand sign recognition from depth images with multi-scale density features for deaf mute persons | |
CN106056132A (zh) | 一种基于傅里叶描述子和支持向量机的服装款式识别方法 | |
Liu et al. | A image segmentation algorithm based on differential evolution particle swarm optimization fuzzy c-means clustering | |
Lazarou et al. | A novel shape matching descriptor for real-time static hand gesture recognition | |
Mei et al. | A real-time hand detection system based on multi-feature | |
Chen | Research and application of chinese calligraphy character recognition algorithm based on image analysis | |
CN109344689A (zh) | 一种基于Kinect的哑语手势识别方法 | |
Shah et al. | Survey on vision based hand gesture recognition | |
Li et al. | A novel art gesture recognition model based on two channel region-based convolution neural network for explainable human-computer interaction understanding | |
CN102073878A (zh) | 非穿戴指势视觉识别方法 | |
CN105139452B (zh) | 一种基于图像分割的地质曲线重建方法 | |
Le et al. | Smart Elevator Cotrol System Based on Human Hand Gesture Recognition | |
Simion et al. | Finger detection based on hand contour and colour information | |
CN105955473A (zh) | 一种基于计算机的静态手势图像识别交互系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |