CN105760828A - 一种基于视觉的静态手势识别方法 - Google Patents

一种基于视觉的静态手势识别方法 Download PDF

Info

Publication number
CN105760828A
CN105760828A CN201610079098.3A CN201610079098A CN105760828A CN 105760828 A CN105760828 A CN 105760828A CN 201610079098 A CN201610079098 A CN 201610079098A CN 105760828 A CN105760828 A CN 105760828A
Authority
CN
China
Prior art keywords
lbp
css
gesture
image
sigma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610079098.3A
Other languages
English (en)
Other versions
CN105760828B (zh
Inventor
杨明强
庄会伟
贲晛烨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN201610079098.3A priority Critical patent/CN105760828B/zh
Publication of CN105760828A publication Critical patent/CN105760828A/zh
Application granted granted Critical
Publication of CN105760828B publication Critical patent/CN105760828B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • G06V40/113Recognition of static hand signs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于视觉的静态手势识别方法,包括训练阶段和测试阶段:训练阶段中对训练图像进行预处理,然后提取训练图像的LBP特征和CSS角点特征,融合提取到的特征,对基于压缩感知理论设计的分类器进行训练。测试阶段,对拍摄到的手势图像进行预处理,再提取出测试图像的LBP特征和CSS角点特征,融合这两种特征,利用已经训练好的分类器进行分类识别。本发明通过融合两种特征,并且采用压缩感知理论设计分类器,能够弥补单特征的不足,提高手势的识别率。

Description

一种基于视觉的静态手势识别方法
技术领域
本发明涉及一种基于视觉的静态手势识别方法,属于人机交互技术领域。
背景技术
随着计算机技术的迅速发展,人机交互技术已经成为了各国研究者研究的热点。传统的人机交互方式主要是基于键盘、鼠标等设备,这种方式非常不方便,越来越不能满足人们的需求。由于手势具有生动、形象、直观等特点,使得它在人机交互领域有着至关重要的作用。手势识别一般分为基于数据手套的手势识别和基于视觉的手势识别。基于数据手套的手势识别一般是在人的手上佩戴一些传感设备,对人手运动的速度,加速度等物理量进行信号分析,从而获得手势的信息。这种方式比较有利于获得手势的运动信息,识别率比较高,实时性也比较好,但是,由于需要穿戴传感设备,使得这种交互方式变得不方便也不自由,而且这些传感设备也比较昂贵。相比较而言,基于视觉的手势识别不需要价格昂贵的传感设备,只是利用摄像头拍摄到手势的图像数据,然后对图像数据进行处理分析。这种方式自然,方便,不需要佩戴专用设备,为人机交互提供了一种直观的交流方式,但是它的识别率还比较低,实时性也不好,比较容易受到光照,背景等的干扰。因此对于这种方式还有待于研究者的进一步研究。
目前,基于视觉的手势识别的过程一般是:采集手势图像,对图像进行预处理,特征提取,识别分类。其中,对识别结果影响比较大的是特征提取和分类器的设计。比较常用的特征有SIFT(Scale-InvariantFeatureTransform,尺度不变特征转换)、HOG(HistogramofGradient,梯度方向直方图),LBP(LocalBinaryPattern,局部二值模式),角点特征等。但是单一的特征往往不能很好地描述图像,从而分类的结果也不尽如人意。
2013年3月,张汗灵、李红英、周敏在湖南大学学报(自然科学版)上发表的文章《融合多特征和压缩感知的手势识别》,该文章提出了一种融合手势的Zernike矩和HOG特征,利用CS(CompressiveSensing,压缩感知)算法进行分类的手势识别方法,但是,这两种特征都不能很好地描述出手势的局部纹理特征,并且在融合这两种特征的时候赋予了它们相同的权值,从而没有体现出哪种特征对识别的结果影响较大。
2014年6月,杨磊发表了硕士学位论文《融合多特征和压缩感知的手势识别》,在该论文中首先利用基于YCbCr颜色空间的阈值自适应方法和Hu矩手型比较算法进行分割得到手势区域,然后提取手势的SURF(Speed-UpRobustFeatures,加速鲁棒特征)和Hu矩特征,融合这两种特征利用CS算法进行分类。但是,Hu矩只用到低阶矩,不能很好地描述图像的细节。
中国专利文献CN104299004A公开了一种基于多特征融合和指尖检测的手势识别方法。包括训练过程和识别过程:训练过程中,针对复杂的手势,选择合理的手势特征,并利用多特征融合的特征提取算法,对手势进行支持向量机训练,形成训练模型。识别过程中,针对输入的视频图像序列,首先进行手势检测,再进行多特征提取和融合并输入到支持向量机中得到识别结果;同时,对手势进行基于缺陷的指尖检测,通过缺陷筛选器,定位到手指各指尖的位置,然后,将两次识别和检测结果进行综合,得到最终的手势识别结果。但是,该专利中存在以下缺陷:其融合的多特征包括Hu矩特征,缺陷特征和六个比例特征本质上都属于一种特征就是手势的形状特征,提取形状特征对预处理时手势的分割要求比较高;该专利中利用支持向量机进行训练和识别,支持向量机的计算复杂度比较高。
发明内容
针对现有技术的不足,本发明提供了一种基于视觉的静态手势识别方法;
本发明融合了两种常见的特征—LBP和CSS角点特征,并且采用CS算法设计分类器。LBP是一种图像局部纹理特征的描述符,CSS是从图像的全局角度检测图像的局部角点特征,通过融合这两种特征,可以弥补它们各自的缺陷,提高分类效果,通过在JochenTriesh手势数据库上进行的实验,证明该种手势识别方法能够提高手势的识别率、准确率。
术语解释
CSS,CurvatureScaleSpace的缩写,是指曲率尺度空间;
本发明的技术方案为:
一种基于视觉的静态手势识别方法,具体步骤包括:
A、训练阶段
(1)采集训练手势图像样本;
(2)对步骤(1)采集到的训练手势图像进行预处理;
(3)提取步骤(2)预处理后的训练手势灰度图像的LBP特征;
(4)提取步骤(2)预处理后的训练手势轮廓图像的CSS角点特征;
(5)融合步骤(3)得到的训练手势图像的LBP特征及步骤(4)得到的训练手势图像的CSS角点特征,训练基于压缩感知理论的分类器;
B、测试阶段
(6)采集测试手势图像样本;
(7)对步骤(6)采集到的测试手势图像进行预处理;
(8)提取步骤(7)预处理后的测试手势灰度图像的LBP特征;
(9)提取步骤(7)预处理后的测试手势轮廓图像的CSS角点特征;
(10)融合步骤(8)得到的测试手势图像的LBP特征及步骤(9)得到的测试手势图像的CSS角点特征,利用步骤(5)训练好的分类器进行分类。
根据本发明优选的,步骤(2)、步骤(7)所述预处理,具体包括:
a、将彩色图像变换为灰度图像;
b、利用基于阈值的二值化方法对步骤a得到的灰度图像进行处理,得到手势的二值图像;
c、对步骤b得到的手势的二值图像进行形态学处理,得到手势区域平滑的二值图像;
d、采用边缘检测算法得到手势的轮廓边缘。
根据本发明优选的,步骤(3)、步骤(8)所述提取手势图像的LBP特征向量,具体包括:
e、设定所述手势图像中的一个像素点为中心像素点,则以中心像素点为圆心、半径为R的P个邻域像素点上的LBP值LBPP-R的求取公式如式(Ⅰ)所示:
LBP P - R = Σ i = 0 P - 1 s ( g i - g c ) × 2 i - - - ( I )
式(Ⅰ)中, s ( x ) = 0 , x < 0 1 , x &GreaterEqual; 0 , gc表示中心像素点的灰度值,gi表示中心像素点的第i个邻域像素点的灰度值;s(gi-gc)表示第i个邻域像素点的LBP编码,即若gi≥gc则该第i个邻域像素点的LBP编码为1,若gi<gc则该第i个邻域像素点的LBP编码为0;R为1个或2个像素,P为8个或16个像素;
步骤e中,比较常用的有LBP4-1、LBP8-1、LBP8-2、LBP16-2,随着P和R越来越大,LBP值会急剧增大,导致效率低下。该计算过程就是以中心像素点的灰度值为阈值,将周围相邻的P个像素点的灰度值与其进行比较,若某个像素点的灰度值大于或等于中心像素点的灰度值,则将该像素点的位置标为1,否则标为0。于是,周围相邻的P个像素点产生Pbit的无符号的二进制数,这个二进制数作为LBP编码,将其转化为十进制数,即得到以中心像素点为圆心、半径为R的P个邻域像素点上的LBP值LBPP-R。按照上述方法每个像素点都可以得到一个LBP编码和LBP值,由LBP值组成了一幅LBP图像。
f、判断步骤e获取的LBP编码是否为均匀的LBP编码,将步骤e获取的LBP编码首尾相连,如果至多有两次0和1之间的转换,则该LBP编码为均匀LBP编码,将均匀LBP编码图像的统计直方图作为手势图像的LBP特征。
根据本发明优选的,R为1个像素,P为8个像素。
根据本发明优选的,步骤(4)、步骤(9)所述提取手势图像的CSS角点特征,具体包括:
g、找到步骤(2)、步骤(7)预处理后的手势图像的轮廓上的T形交叉点,标记为T形角点,设定手势图像的轮廓函数为Г(μ)=(x(μ),y(μ)),将轮廓上的点用弧长参数μ表达,关于弧长参数μ的详细解释参见http://www.docin.com/p-406152932.html;x(μ)是轮廓上点的横坐标,y(μ)是轮廓上点的纵坐标;将Г(μ)在不同尺度的高斯函数g(μ,σ)下滤波得到不同尺度下的轮廓函数Гσ(μ)=(X(μ,σ),Y(μ,σ)),X(μ,σ)=x(μ)*g(μ,σ),Y(μ,σ)=y(μ)*g(μ,σ),σ是尺度参数,*为卷积运算符;利用(II)式计算在一个较低的尺度σ下的轮廓函数Гσ(μ)的曲率κ(μ,σ),所述较低的尺度σ的取值范围为3.0-4.0,如式(Ⅱ)所示:
&kappa; ( &mu; , &sigma; ) = X &mu; ( &mu; , &sigma; ) Y &mu; &mu; ( &mu; , &sigma; ) - X &mu; &mu; ( &mu; , &sigma; ) Y &mu; ( &mu; , &sigma; ) ( X &mu; ( &mu; , &sigma; ) 2 + Y &mu; ( &mu; , &sigma; ) 2 ) 3 2 - - - ( I I )
式(Ⅱ)中, X &mu; ( &mu; , &sigma; ) = &part; &part; &mu; X ( &mu; , &sigma; ) = x ( &mu; ) * g &mu; ( &mu; , &sigma; ) ;
Y &mu; ( &mu; , &sigma; ) = &part; &part; &mu; Y ( &mu; , &sigma; ) = y ( &mu; ) * g &mu; ( &mu; , &sigma; ) ;
X &mu; &mu; ( &mu; , &sigma; ) = &part; 2 &part; &mu; 2 X ( &mu; , &sigma; ) = x ( &mu; ) * g &mu; &mu; ( &mu; , &sigma; ) ;
Y &mu; &mu; ( &mu; , &sigma; ) = &part; 2 &part; &mu; 2 Y ( &mu; , &sigma; ) = y ( &mu; ) * g &mu; &mu; ( &mu; , &sigma; ) ;
h、将步骤g得到的局部曲率极大点作为候选角点,利用式(III)确定候选角点的局部自适应阈值T(μ1),式(III)中,μ1是候选角点在曲线上的位置,表示候选角点的邻域区域内的平均曲率,L1和L2是邻域区域的大小,i表示邻域区域内的点,κ(i)表示邻域区域内的点的曲率,C为一个系数,C的取值范围为1<C<2,将局部自适应阈值与候选角点的曲率进行比较,如果该候选角点的曲率小于其局部自适应阈值,则将该候选角点剔除;
T ( &mu; 1 ) = C &times; &kappa; &OverBar; = C &times; 1 L 1 + L 2 + 1 &Sigma; i = &mu; - L 2 &mu; + L 1 &kappa; ( i ) - - - ( I I I )
i、利用自适应支持区域(regionofsupport,ROS)检测候选角点的角度,如果候选角点的角度取值范围为170°-190°,则将其剔除。
根据本发明优选的,步骤g中,σ=3.5;步骤h中,C=1.3。
根据本发明优选的,融合步骤(3)得到的训练手势图像的LBP特征及步骤(4)得到的训练手势图像的CSS角点特征,训练基于压缩感知理论的分类器;具体步骤包括:
j、利用步骤(3)得到的训练手势图像的LBP特征及步骤(4)得到的训练手势图像的CSS角点特征,构建稀疏基矩阵ΨLBP和ΨCSS
ΨLBP=[ΨLBP 1LBP 2,……,ΨLBP J](Ⅳ)
ΨCSS=[ΨCSS 1CSS 2,……,ΨCSS J](Ⅴ)
其中,
ΨLBP i=[ΨLBP i1LBP i2,…ΨLBP ij,…,ΨLBP in](Ⅵ)
ΨCSS i=[ΨCSS i1CSS i2,…ΨCSS ij,…,ΨCSS in](Ⅶ)
ΨLBP ij为第i种手势的第j幅训练手势图像的LBP特征列向量,ΨCSS ij为第i种手势的第j幅训练手势图像的CSS角点特征列向量,设定一共有J种手势,每种手势有n幅训练图像;
k、采用高斯随机矩阵作为测量矩阵Φ,分别对步骤j中得到的ΨLBP和ΨCSS进行随机测量,得到测度矩阵ALBP和ACSS
ALBP=ΦΨLBP(Ⅷ)
ACSS=ΦΨCSS(Ⅸ)
假设xLBP为一幅测试手势图像的LBP特征向量,xCSS是该幅测试手势图像的CSS角点特征向量,用测量矩阵Φ分别对其随机测量,得到观测集yLBP和yCSS
yLBP=ΦxLBP(Ⅹ)
yCSS=ΦxCSS(Ⅺ)
l、将yLBP表示为ALBP的线性组合,将yCSS表示为ACSS的线性组合:
yLBP=ALBPθLBP+e(Ⅻ)
yCSS=ACSSθCSS+e(XIII)
其中,θLBP和θCSS是系数矩阵,θ为稀疏的,即:如果θ中有K个系数是非零的,K小于θ中数据的个数;则θ称为K稀疏的;e为噪声常数,‖e‖2<ε,ε小于10-5,引入噪声常数e是考虑到处理过程中会产生噪声的影响。
m、利用l1范数最优化的方法从式(XII)、式(XIII)中分别解出θLBP和θCSS,l1范数最优化为,若y=Aθ+e,则:
&theta; ~ = arg m i n | | &theta; | | 1 , s . t . | | y - A &theta; | | 2 &le; &epsiv; - - - ( X I V )
n、利用与第i种手势相对应的系数θLBP i和θCSS i重建观测集yLBP i和yCSS i
yLBP i=ΨLBP iθLBP i(XV)
yCSS i=ΨCSS iθCSS i(XVI)
其中,i=1,2,……J.
n、利用不同的权值ωLBP和ωCSS融合LBP特征及CSS角点特征,用式(XVII)的分类策略进行分类,即源测试图像的观测集和重建观测集之间的误差i*最小的类别就是该测试图像所属的类,ωLBP为LBP特征在分类决策中的权重,ωCSS为CSS角点特征在分类决策中的权重,ωLBPCSS=1;当ωLBP=1时,表示仅使用LBP特征进行分类,当ωCSS=1时,表示仅使用CSS特征进行分类:
i * = arg min i ( &omega; L B P | | y L B P - y i L B P | | 2 2 + &omega; C S S | | y C S S - y i C S S | | 2 2 ) - - - ( X V I I ) .
根据本发明优选的,ωLBP=0.63,ωCSS=0.37。
本发明的有益效果为:
LBP特征是一种局部特征,具有平移不变性,旋转不变性,能较好地抵抗光照并且计算简单的特点,但是它不具有尺度不变性。CSS角点特征是一种全局特征,它具有平移不变性,旋转不变性和尺度不变性,并且对噪声和遮挡都有一定的抵抗性,但是它容易误检或漏检角点。本发明通过融合这两种局部特征和全局特征,并且采用CS作为分类器在一定程度上弥补了它们的缺陷,通过在JochenTriesh手势数据库上的实验证明本方法比单独用一种特征的识别率都要高,若仅使用LBP特征识别率为87.5%,若仅使用CSS角点特征识别率为72.5%,融合两种特征之后的识别率为96.25%,并且比其他一些常见的手势识别方法的识别率也要好。
附图说明
图1为本发明所述方法流程示意图;
图2(a)为本发明所述手势图像源图像示意图;
图2(b)为本发明所述二值图像示意图;
图2(c)为本发明所述手势的轮廓边缘示意图;
图3(a)为本发明所述手势图像源图像示意图;
图3(b)为本发明所述手势图像LBP值图像示意图;
图3(c)为本发明所述手势图像均匀LBP统计直方图示意图;
图4为本发明所述提取手势图像的CSS角点特征的图像示意图;
图5为利用CS算法设计分类器进行分类的流程图。
具体实施方式
下面结合说明书附图和实施例对本发明作进一步限定,但不限于此。
实施例
本实施例是在JochenTriesh手势数据库上进行的,该数据库共720幅图像,包含10种手势,对24个不同的人分别在3种不同的背景下拍摄,包括单一亮背景,单一暗背景和复杂背景。在本实施例中只利用单一亮背景和单一暗背景下的共480幅图像,将每幅图像裁剪到80×80像素大小。
一种基于视觉的静态手势识别方法,具体步骤包括:
A、训练阶段
(1)采集训练手势图像样本;
(2)对步骤(1)采集到的训练手势图像进行预处理;
(3)提取步骤(2)预处理后的训练手势灰度图像的LBP特征;
(4)提取步骤(2)预处理后的训练手势轮廓图像的CSS角点特征;
(5)融合步骤(3)得到的训练手势图像的LBP特征及步骤(4)得到的训练手势图像的CSS角点特征,训练基于压缩感知理论的分类器;
B、测试阶段
(6)采集测试手势图像样本;
(7)对步骤(6)采集到的测试手势图像进行预处理;
(8)提取步骤(7)预处理后的测试手势灰度图像的LBP特征;
(9)提取步骤(7)预处理后的测试手势轮廓图像的CSS角点特征;
(10)融合步骤(8)得到的测试手势图像的LBP特征及步骤(9)得到的测试手势图像的CSS角点特征,利用步骤(5)训练好的分类器进行分类。
步骤(1)具体包括:取每种手势的前20个人的手势图像作为训练手势图像,共400幅训练手势图像;步骤(6)取每种手势的后4个人的手势图像作为测试手势图像,共80幅测试手势图像。
步骤(2)、步骤(7)所述预处理,具体包括:
a、将彩色图像变换为灰度图像;
b、利用基于阈值的二值化方法对步骤a得到的灰度图像进行处理,得到手势的二值图像;
c、对步骤b得到的手势的二值图像进行形态学处理,得到手势区域平滑的二值图像;
d、采用边缘检测算法得到手势的轮廓边缘。
步骤(3)、步骤(8)所述提取手势图像的LBP特征向量,具体包括:
e、设定所述手势图像中的一个像素点为中心像素点,则以中心像素点为圆心、半径为R的P个邻域像素点上的LBP值LBPP-R的求取公式如式(Ⅰ)所示:
LBP P - R = &Sigma; i = 0 P - 1 s ( g i - g c ) &times; 2 i - - - ( I )
式(Ⅰ)中, s ( x ) = 0 , x < 0 1 , x &GreaterEqual; 0 , gc表示中心像素点的灰度值,gi表示中心像素点的第i个邻域像素点的灰度值;s(gi-gc)表示第i个邻域像素点的LBP编码,即若gi≥gc则该第i个邻域像素点的LBP编码为1,若gi<gc则该第i个邻域像素点的LBP编码为0;R为1个像素,P为8个像素;
f、判断步骤e获取的LBP编码是否为均匀的LBP编码,将步骤e获取的LBP编码首尾相连,如果至多有两次0和1之间的转换,则该LBP编码为均匀LBP编码,将均匀LBP编码图像的统计直方图作为手势图像的LBP特征。图3(a)为选取的一幅手势源图像示意图,图3(b)为该手势源图像的半径为1的8邻域点上的LBP图像示意图,图3(c)为其均匀LBP统计直方图示意图。
步骤(4)、步骤(9)所述提取手势图像的CSS角点特征,具体包括:
g、找到步骤(2)、步骤(7)预处理后的手势图像的轮廓上的T形交叉点,标记为T形角点,设定手势图像的轮廓函数为Г(μ)=(x(μ),y(μ)),将轮廓上的点用弧长参数μ表达,x(μ)是轮廓上点的横坐标,y(μ)是轮廓上点的纵坐标;将Г(μ)在不同尺度的高斯函数g(μ,σ)下滤波得到不同尺度下的轮廓函数Гσ(μ)=(X(μ,σ),Y(μ,σ)),X(μ,σ)=x(μ)*g(μ,σ),Y(μ,σ)=y(μ)*g(μ,σ),σ是尺度参数,*为卷积运算符;利用(II)式计算在一个较低的尺度σ下的轮廓函数Гσ(μ)的曲率κ(μ,σ),所述较低的尺度σ的取值为3.5,如式(Ⅱ)所示:
&kappa; ( &mu; , &sigma; ) = X &mu; ( &mu; , &sigma; ) Y &mu; &mu; ( &mu; , &sigma; ) - X &mu; &mu; ( &mu; , &sigma; ) Y &mu; ( &mu; , &sigma; ) ( X &mu; ( &mu; , &sigma; ) 2 + Y &mu; ( &mu; , &sigma; ) 2 ) 3 2 - - - ( I I )
式(Ⅱ)中, X &mu; ( &mu; , &sigma; ) = &part; &part; &mu; X ( &mu; , &sigma; ) = x ( &mu; ) * g &mu; ( &mu; , &sigma; ) ;
Y &mu; ( &mu; , &sigma; ) = &part; &part; &mu; Y ( &mu; , &sigma; ) = y ( &mu; ) * g &mu; ( &mu; , &sigma; ) ;
X &mu; &mu; ( &mu; , &sigma; ) = &part; 2 &part; &mu; 2 X ( &mu; , &sigma; ) = x ( &mu; ) * g &mu; &mu; ( &mu; , &sigma; ) ;
Y &mu; &mu; ( &mu; , &sigma; ) = &part; 2 &part; &mu; 2 Y ( &mu; , &sigma; ) = y ( &mu; ) * g &mu; &mu; ( &mu; , &sigma; ) ;
h、将步骤g得到的局部曲率极大点作为候选角点,利用式(III)确定候选角点的局部自适应阈值T(μ1),式(III)中,μ1是候选角点在曲线上的位置,表示候选角点的邻域区域内的平均曲率,L1和L2是邻域区域的大小,i表示邻域区域内的点,κ(i)表示邻域区域内的点的曲率,C为一个系数,C的取值范围为1<C<2,将局部自适应阈值与候选角点的曲率进行比较,如果该候选角点的曲率小于其局部自适应阈值,则将该候选角点剔除;
T ( &mu; 1 ) = C &times; &kappa; &OverBar; = C &times; 1 L 1 + L 2 + 1 &Sigma; i = &mu; - L 2 &mu; + L 1 &kappa; ( i ) - - - ( I I I )
i、利用自适应支持区域(regionofsupport,ROS)检测候选角点的角度,如果候选角点的角度取值范围为170°-190°,则将其剔除。
图4为选取的一幅利用该方法检测的提取手势图像的CSS角点特征的图像示意图。
根据本实施例优选的,融合步骤(3)得到的训练手势图像的LBP特征及步骤(4)得到的训练手势图像的CSS角点特征,训练基于压缩感知理论的分类器;图5为利用CS算法设计分类器进行分类的流程图,具体步骤包括:
j、利用步骤(3)得到的训练手势图像的LBP特征及步骤(4)得到的训练手势图像的CSS角点特征,构建稀疏基矩阵ΨLBP和ΨCSS
ΨLBP=[ΨLBP 1LBP 2,……,ΨLBP J](Ⅳ)
ΨCSS=[ΨCSS 1CSS 2,……,ΨCSS J](Ⅴ)
其中,
ΨLBP i=[ΨLBP i1LBP i2,…ΨLBP ij,…,ΨLBP in](Ⅵ)
ΨCSS i=[ΨCSS i1CSS i2,…ΨCSS ij,…,ΨCSS in](Ⅶ)
ΨLBP ij为第i种手势的第j幅训练手势图像的LBP特征列向量,ΨCSS ij为第i种手势的第j幅训练手势图像的CSS角点特征列向量,设定一共有J种手势,每种手势有n幅训练图像;
k、采用高斯随机矩阵作为测量矩阵Φ,分别对步骤j中得到的ΨLBP和ΨCSS进行随机测量,得到测度矩阵ALBP和ACSS
ALBP=ΦΨLBP(Ⅷ)
ACSS=ΦΨCSS(Ⅸ)
假设xLBP为一幅测试手势图像的LBP特征向量,xCSS是该幅测试手势图像的CSS角点特征向量,用测量矩阵Φ分别对其随机测量,得到观测集yLBP和yCSS
yLBP=ΦxLBP(Ⅹ)
yCSS=ΦxCSS(Ⅺ)
l、将yLBP表示为ALBP的线性组合,将yCSS表示为ACSS的线性组合:
yLBP=ALBPθLBP+e(Ⅻ)
yCSS=ACSSθCSS+e(XIII)
其中,θLBP和θCSS是系数矩阵,θ为稀疏的,即:如果θ中有K个系数是非零的,K小于θ中数据的个数;则θ称为K稀疏的;e为噪声常数,‖e‖2<ε,ε=10-6,引入噪声常数e是考虑到处理过程中会产生噪声的影响。
m、利用l1范数最优化的方法从式(XII)、式(XIII)中分别解出θLBP和θCSS,l1范数最优化为,若y=Aθ+e,则:
&theta; ~ = arg min | | &theta; | | 1 , s . t . | | y - A &theta; | | 2 &le; &epsiv; - - - ( X I V )
n、利用与第i种手势相对应的系数θLBP i和θCSS i重建观测集yLBP i和yCSS i
yLBP i=ΨLBP iθLBP i(XV)
yCSS i=ΨCSS iθCSS i(XVI)
其中,i=1,2,……J.
n、利用不同的权值ωLBP和ωCSS融合LBP特征及CSS角点特征,用式(XVII)的分类策略进行分类,即源测试图像的观测集和重建观测集之间的误差i*最小的类别就是该测试图像所属的类,ωLBP为LBP特征在分类决策中的权重,ωCSS为CSS角点特征在分类决策中的权重,ωLBP=0.63,ωCSS=0.37:
i * = arg min i ( &omega; L B P | | y L B P - y i L B P | | 2 2 + &omega; C S S | | y C S S - y i C S S | | 2 2 ) - - - ( X V I I ) .

Claims (8)

1.一种基于视觉的静态手势识别方法,其特征在于,具体步骤包括:
A、训练阶段
(1)采集训练手势图像样本;
(2)对步骤(1)采集到的训练手势图像进行预处理;
(3)提取步骤(2)预处理后的训练手势灰度图像的LBP特征;
(4)提取步骤(2)预处理后的训练手势轮廓图像的CSS角点特征;
(5)融合步骤(3)得到的训练手势图像的LBP特征及步骤(4)得到的训练手势图像的CSS角点特征,训练基于压缩感知理论的分类器;
B、测试阶段
(6)采集测试手势图像样本;
(7)对步骤(6)采集到的测试手势图像进行预处理;
(8)提取步骤(7)预处理后的测试手势灰度图像的LBP特征;
(9)提取步骤(7)预处理后的测试手势轮廓图像的CSS角点特征;
(10)融合步骤(8)得到的测试手势图像的LBP特征及步骤(9)得到的测试手势图像的CSS角点特征,利用步骤(5)训练好的分类器进行分类。
2.根据权利要求1所述的一种基于视觉的静态手势识别方法,其特征在于,步骤(2)、步骤(7)所述预处理,具体包括:
a、将彩色图像变换为灰度图像;
b、利用基于阈值的二值化方法对步骤a得到的灰度图像进行处理,得到手势的二值图像;
c、对步骤b得到的手势的二值图像进行形态学处理,得到手势区域平滑的二值图像;
d、采用边缘检测算法得到手势的轮廓边缘。
3.根据权利要求1所述的一种基于视觉的静态手势识别方法,其特征在于,步骤(3)、步骤(8)所述提取手势图像的LBP特征向量,具体包括:
e、设定所述手势图像中的一个像素点为中心像素点,则以中心像素点为圆心、半径为R的P个邻域像素点上的LBP值LBPP-R的求取公式如式(Ⅰ)所示:
LBP P - R = &Sigma; i = 0 P - 1 s ( g i - g c ) &times; 2 i - - - ( I )
式(Ⅰ)中, s ( x ) = 0 , x < 0 1 , x &GreaterEqual; 0 , gc表示中心像素点的灰度值,gi表示中心像素点的第i个邻域像素点的灰度值;s(gi-gc)表示第i个邻域像素点的LBP编码,即若gi≥gc则该第i个邻域像素点的LBP编码为1,若gi<gc则该第i个邻域像素点的LBP编码为0;R为1个或2个像素,P为8个或16个像素;
f、判断步骤e获取的LBP编码是否为均匀的LBP编码,将步骤e获取的LBP编码首尾相连,如果至多有两次0和1之间的转换,则该LBP编码为均匀LBP编码,将均匀LBP编码图像的统计直方图作为手势图像的LBP特征。
4.根据权利要求3所述的一种基于视觉的静态手势识别方法,其特征在于,R为1个像素,P为8个像素。
5.根据权利要求1所述的一种基于视觉的静态手势识别方法,其特征在于,步骤(4)、步骤(9)所述提取手势图像的CSS角点特征,具体包括:
g、找到步骤(2)、步骤(7)预处理后的手势图像的轮廓上的T形交叉点,标记为T形角点,设定手势图像的轮廓函数为Г(μ)=(x(μ),y(μ)),将轮廓上的点用弧长参数μ表达,x(μ)是轮廓上点的横坐标,y(μ)是轮廓上点的纵坐标;将Г(μ)在不同尺度的高斯函数g(μ,σ)下滤波得到不同尺度下的轮廓函数Гσ(μ)=(X(μ,σ),Y(μ,σ)),X(μ,σ)=x(μ)*g(μ,σ),Y(μ,σ)=y(μ)*g(μ,σ),σ是尺度参数,*为卷积运算符;计算在一个较低的尺度σ下的轮廓函数Гσ(μ)的曲率κ(μ,σ),所述较低的尺度σ的取值范围为3.0-4.0,如式(Ⅱ)所示:
&kappa; ( &mu; , &sigma; ) = X &mu; ( &mu; , &sigma; ) Y &mu; &mu; ( &mu; , &sigma; ) - X &mu; &mu; ( &mu; , &sigma; ) Y &mu; ( &mu; , &sigma; ) ( X &mu; ( &mu; , &sigma; ) 2 + Y &mu; ( &mu; , &sigma; ) 2 ) 3 2 - - - ( I I )
式(Ⅱ)中, X &mu; ( &mu; , &sigma; ) = &part; &part; &mu; X ( &mu; , &sigma; ) = x ( &mu; ) * g &mu; ( &mu; , &sigma; ) ;
Y &mu; ( &mu; , &sigma; ) = &part; &part; &mu; Y ( &mu; , &sigma; ) = y ( &mu; ) * g &mu; ( &mu; , &sigma; ) ;
X &mu; &mu; ( &mu; , &sigma; ) = &part; 2 &part; &mu; 2 X ( &mu; , &sigma; ) = x ( &mu; ) * g &mu; &mu; ( &mu; , &sigma; ) ;
Y &mu; &mu; ( &mu; , &sigma; ) = &part; 2 &part; &mu; 2 Y ( &mu; , &sigma; ) = y ( &mu; ) * g &mu; &mu; ( &mu; , &sigma; ) ;
h、将步骤g得到的局部曲率极大点作为候选角点,利用式(III)确定候选角点的局部自适应阈值T(μ1),式(III)中,μ1是候选角点在曲线上的位置,表示候选角点的邻域区域内的平均曲率,L1和L2是邻域区域的大小,i表示邻域区域内的点,κ(i)表示邻域区域内的点的曲率,C为一个系数,C的取值范围为1<C<2,将局部自适应阈值与候选角点的曲率进行比较,如果该候选角点的曲率小于其局部自适应阈值,则将该候选角点剔除;
T ( &mu; 1 ) = C &times; &kappa; &OverBar; = C &times; 1 L 1 + L 2 + 1 &Sigma; i = &mu; - L 2 &mu; + L 1 &kappa; ( i ) - - - ( I I I )
i、利用自适应支持区域检测候选角点的角度,如果候选角点的角度取值范围为170°-190°,则将其剔除。
6.根据权利要求5所述的一种基于视觉的静态手势识别方法,其特征在于,步骤g中,σ=3.5;步骤h中,C=1.3。
7.根据权利要求1所述的一种基于视觉的静态手势识别方法,其特征在于,融合步骤(3)得到的训练手势图像的LBP特征及步骤(4)得到的训练手势图像的CSS角点特征,训练基于压缩感知理论的分类器;具体步骤包括:
j、利用步骤(3)得到的训练手势图像的LBP特征及步骤(4)得到的训练手势图像的CSS角点特征,构建稀疏基矩阵ΨLBP和ΨCSS
ΨLBP=[ΨLBP 1LBP 2,……,ΨLBP J](Ⅳ)
ΨCSS=[ΨCSS 1CSS 2,……,ΨCSS J](Ⅴ)
其中,
ΨLBP i=[ΨLBP i1LBP i2,…ΨLBP ij,…,ΨLBP in](Ⅵ)
ΨCSS i=[ΨCSS i1CSS i2,…ΨCSS ij,…,ΨCSS in](Ⅶ)
ΨLBP ij为第i种手势的第j幅训练手势图像的LBP特征列向量,ΨCSS ij为第i种手势的第j幅训练手势图像的CSS角点特征列向量,设定一共有J种手势,每种手势有n幅训练图像;
k、采用高斯随机矩阵作为测量矩阵Φ,分别对步骤j中得到的ΨLBP和ΨCSS进行随机测量,得到测度矩阵ALBP和ACSS
ALBP=ΦΨLBP(Ⅷ)
ACSS=ΦΨCSS(Ⅸ)
假设xLBP为一幅测试手势图像的LBP特征向量,xCSS是该幅测试手势图像的CSS角点特征向量,用测量矩阵Φ分别对其随机测量,得到观测集yLBP和yCSS
yLBP=ΦxLBP(Ⅹ)
yCSS=ΦxCSS(Ⅺ)
l、将yLBP表示为ALBP的线性组合,将yCSS表示为ACSS的线性组合:
yLBP=ALBPθLBP+e(Ⅻ)
yCSS=ACSSθCSS+e(XIII)
其中,θLBP和θCSS是系数矩阵,θ为稀疏的,即:如果θ中有K个系数是非零的,K小于θ中数据的个数;则θ称为K稀疏的;e为噪声常数,‖e‖2<ε,ε小于10-5
m、利用l1范数最优化的方法从式(XII)、式(XIII)中分别解出θLBP和θCSS,l1范数最优化为,若y=Aθ+e,则:
&theta; ~ = arg m i n | | &theta; | | 1 , s . t . | | y - A &theta; | | 2 &le; &epsiv; - - - ( X I V )
n、利用与第i种手势相对应的系数θLBP i和θCSS i重建观测集yLBP i和yCSS i
yLBP i=ΨLBP iθLBP i(XV)
yCSS i=ΨCSS iθCSS i(XVI)
其中,i=1,2,……J.
n、利用不同的权值ωLBP和ωCSS融合LBP特征及CSS角点特征,用式(XVII)的分类策略进行分类,即源测试图像的观测集和重建观测集之间的误差i*最小的类别就是该测试图像所属的类,ωLBP为LBP特征在分类决策中的权重,ωCSS为CSS角点特征在分类决策中的权重,ωLBPCSS=1;
i * = arg min i ( &omega; L B P | | y L B P - y i L B P | | 2 2 + &omega; C S S | | y C S S - y i C S S | | 2 2 ) - - - ( X V I I ) .
8.根据权利要求7所述的一种基于视觉的静态手势识别方法,其特征在于,ωLBP=0.63,ωCSS=0.37。
CN201610079098.3A 2016-02-04 2016-02-04 一种基于视觉的静态手势识别方法 Expired - Fee Related CN105760828B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610079098.3A CN105760828B (zh) 2016-02-04 2016-02-04 一种基于视觉的静态手势识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610079098.3A CN105760828B (zh) 2016-02-04 2016-02-04 一种基于视觉的静态手势识别方法

Publications (2)

Publication Number Publication Date
CN105760828A true CN105760828A (zh) 2016-07-13
CN105760828B CN105760828B (zh) 2019-03-22

Family

ID=56330577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610079098.3A Expired - Fee Related CN105760828B (zh) 2016-02-04 2016-02-04 一种基于视觉的静态手势识别方法

Country Status (1)

Country Link
CN (1) CN105760828B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107240112A (zh) * 2017-06-28 2017-10-10 北京航空航天大学 一种复杂场景下个体x角点提取方法
CN107526440A (zh) * 2017-08-28 2017-12-29 四川长虹电器股份有限公司 基于决策树分类的手势识别的智能电器控制方法及系统
CN109117826A (zh) * 2018-09-05 2019-01-01 湖南科技大学 一种多特征融合的车辆识别方法
CN109299743A (zh) * 2018-10-18 2019-02-01 京东方科技集团股份有限公司 手势识别方法及装置、终端
CN113792573A (zh) * 2021-07-13 2021-12-14 浙江理工大学 一种小波变换低频信息与Xception网络的静态手势识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102467657A (zh) * 2010-11-16 2012-05-23 三星电子株式会社 手势识别系统和方法
CN104156690A (zh) * 2014-06-27 2014-11-19 辽宁石油化工大学 一种基于图像空间金字塔特征包的手势识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102467657A (zh) * 2010-11-16 2012-05-23 三星电子株式会社 手势识别系统和方法
CN104156690A (zh) * 2014-06-27 2014-11-19 辽宁石油化工大学 一种基于图像空间金字塔特征包的手势识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
吴健健等: "基于多特征融合与支持向量机的手势识别", 《电子科技》 *
张汗灵等: "融合多特征和压缩感知的手势识别", 《湖南大学学报》 *
柴秀娟: "基于分块局部纹理描述的手势识别", 《高技术通讯》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107240112A (zh) * 2017-06-28 2017-10-10 北京航空航天大学 一种复杂场景下个体x角点提取方法
CN107526440A (zh) * 2017-08-28 2017-12-29 四川长虹电器股份有限公司 基于决策树分类的手势识别的智能电器控制方法及系统
CN109117826A (zh) * 2018-09-05 2019-01-01 湖南科技大学 一种多特征融合的车辆识别方法
CN109117826B (zh) * 2018-09-05 2020-11-24 湖南科技大学 一种多特征融合的车辆识别方法
CN109299743A (zh) * 2018-10-18 2019-02-01 京东方科技集团股份有限公司 手势识别方法及装置、终端
CN109299743B (zh) * 2018-10-18 2021-08-10 京东方科技集团股份有限公司 手势识别方法及装置、终端
CN113792573A (zh) * 2021-07-13 2021-12-14 浙江理工大学 一种小波变换低频信息与Xception网络的静态手势识别方法

Also Published As

Publication number Publication date
CN105760828B (zh) 2019-03-22

Similar Documents

Publication Publication Date Title
Racki et al. A compact convolutional neural network for textured surface anomaly detection
Alsmadi et al. Fish recognition based on robust features extraction from size and shape measurements using neural network
Alsmadi et al. A survey on fish classification techniques
CN105760828B (zh) 一种基于视觉的静态手势识别方法
US9639748B2 (en) Method for detecting persons using 1D depths and 2D texture
CN103390164B (zh) 基于深度图像的对象检测方法及其实现装置
CN106384126A (zh) 基于轮廓曲率特征点和支持向量机的服装款式识别方法
CN113033398B (zh) 一种手势识别方法、装置、计算机设备及存储介质
Zang et al. Traffic sign detection based on cascaded convolutional neural networks
CN110826408B (zh) 一种分区域特征提取人脸识别方法
CN105512599A (zh) 人脸识别方法及人脸识别系统
CN107480620A (zh) 基于异构特征融合的遥感图像自动目标识别方法
CN107247916A (zh) 一种基于Kinect的三维人脸识别方法
CN109801305B (zh) 基于深度胶囊网络的sar图像变化检测方法
CN111126240A (zh) 一种三通道特征融合人脸识别方法
CN104134061A (zh) 一种基于特征融合的支持向量机的数字手势识别方法
CN111639562B (zh) 一种手掌感兴趣区域的智能定位方法
CN112507804A (zh) 一种基于手部图像的身份识别方法
CN110232703B (zh) 一种基于颜色和纹理信息的运动目标识别装置及方法
CN109902692A (zh) 一种基于局部区域深度特征编码的图像分类方法
Gervei et al. 3D face recognition using modified PCA methods
Ningtyas et al. Performance analysis of local binary pattern and k-nearest neighbor on image classification of fingers leaves
Prabha et al. Three dimensional object detection and classification methods: a study
CN116310416A (zh) 基于Radon变换的可变形物体相似度检测方法及电子设备
Alarcon-Ramirez et al. A new methodology based on level sets for target detection in hyperspectral images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190322

Termination date: 20200204

CF01 Termination of patent right due to non-payment of annual fee