CN103077381A - 一种基于分数阶傅里叶变换的单目动态手势识别方法 - Google Patents

一种基于分数阶傅里叶变换的单目动态手势识别方法 Download PDF

Info

Publication number
CN103077381A
CN103077381A CN2013100069178A CN201310006917A CN103077381A CN 103077381 A CN103077381 A CN 103077381A CN 2013100069178 A CN2013100069178 A CN 2013100069178A CN 201310006917 A CN201310006917 A CN 201310006917A CN 103077381 A CN103077381 A CN 103077381A
Authority
CN
China
Prior art keywords
staff
image
fourier transform
monocular
gray level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013100069178A
Other languages
English (en)
Inventor
贾小波
张永强
牛伟涛
马鹏阁
金秋春
惠作奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZHENGZHOU VCOM TECHNOLOGY Co Ltd
Original Assignee
ZHENGZHOU VCOM TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZHENGZHOU VCOM TECHNOLOGY Co Ltd filed Critical ZHENGZHOU VCOM TECHNOLOGY Co Ltd
Priority to CN2013100069178A priority Critical patent/CN103077381A/zh
Publication of CN103077381A publication Critical patent/CN103077381A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明涉及一种在智能电视及职能机顶盒领域应用的人机交互输入技术,特别是涉及一种基于分数阶傅里叶变换的单目动态手势识别方法,首先对人体的肤色图像关键帧进行选取,然后对选取的图像进行预处理,再进行人手区域规范化处理,利用二维分数阶傅里叶变换进行变换,最后经过分类器,对不同的手势进行识别;本发明有效提高和优化人手在运动状态、不同手势操作时的识别效率和识别准确度,提高和优化了智能电视盒和智能机顶盒人机交互的用户体验,使操作起来更方便快捷。

Description

一种基于分数阶傅里叶变换的单目动态手势识别方法
技术领域
本发明涉及一种在智能电视及职能机顶盒领域应用的人机交互输入技术,特别是涉及一种基于分数阶傅里叶变换的单目动态手势识别方法。
背景技术
目前采用高性能嵌入式处理器运行Android嵌入式操作系统实现高速互联网视频点播及网页浏览等功能的智能电视多采用遥控器或无线鼠标作为人机交互手段,但这种人机交互模式存在焦点捕获不准的问题,用户体验不好。
采用单个摄像机采集人手的动态运行轨迹及手势,加以识别后作为Android系统的光标坐标以及确认等输入信息,进而实现电视的控制操作已成为研究热点,现有的手势识别技术主要采用肤色以及边缘检测预处理手段检测到人手区域及轮廓,然后与存储的人手手势模版相关匹配,从而实现手势识别,但这一类技术在静态时检测识别率较高,但在人手处于运动状态,往往出现模版匹配不准确、识别率下降等问题。
发明内容
本发明为了解决上述问题,提供了一种有效提高和优化人手在运动状态、不同手势操作时的识别效率和识别准确度,提高和优化了智能电视盒和智能机顶盒人机交互的用户体验,使操作起来更方便快捷的基于分数阶傅里叶变换的单目动态手势识别方法。
本发明的技术方案是:
一种基于分数阶傅里叶变换的单目动态手势识别方法,包括以下步骤:
步骤1:用色彩聚类算法将原始的肤色图像的集合分组成为由类似对象组成的多个聚类,并对其进行非线性分段变换,得到肤色图像的聚类在YCb′Cr'空间中的分布情况,再将其投影到Cb′-Cr′二维子空间,得到肤色聚类模型;
步骤2:采用迭代法对步骤1中的零散肤色区域进行合并处理,确定人手肤色的区域;
步骤3:据小波包对人手手指特征分解的原理并结合人手的几何特征,确定人手所在的区域,检测到人手后,将此坐标信息作为光标位置的控制消息;
步骤4:对步骤3中所得的人手所在的区域进行规范化处理,包括:
步骤4.1:对人手所在区域的图像统计其直方图,求出Pr(r),所述Pr(r)为出现这个灰度级的概率P(Rk),所述直方图的横坐标为灰度级r,纵坐标为具有该灰度级的像素个数或出现这个灰度级的概率P(Rk),其中P(Rk)=nk/N,式中,N为一幅图像中的像素的总数,nk为图像中第k级灰度的像素数,Rk表示第k个灰度级,P(rk)表示该灰度级出现的概率;
步骤4.2:采用累积分布函数对步骤4.1中所统计出的直方图做变换,即Sk=T(rk)=∑pr(r),以此求出变换后的新灰度,式中rk和Sk分别表示原始图像和变换后的第k阶图像灰度的值,Pr(r)为出现这个灰度级的概率P(Rk);
步骤5:利用二维分数阶傅里叶变换提取人手图像的幅度和相位特征信息;
首先对人手图像做傅里叶变换,变换公式为:取P1=P2,阶次选择范围在[0,1]之间,间隔为0.1;
其次,对二维分数阶傅里叶变换进行特征提取,取f(x,y)为原人手图像灰度值信息,对f(x,y)做二维分数阶傅里叶变换即为: F α , β ( u , v ) = ∫ - ∞ + ∞ ∫ - ∞ + ∞ f ( x , y ) K p , q ( x , y , u , v ) dxdy , 经计算相位信息可以表示为:
Figure BDA00002714290800033
其中Kp,q(x,y,u,v)为二维分数阶傅里叶变换的核函数,其中
Figure BDA00002714290800034
Figure BDA00002714290800035
p和q分别为变换阶次,Kp,q(x,y,u,v)为变换核;
步骤6:把步骤5中b)中求出的人手图像的相位幅值采用Fisher分类器判别人手图像的类别。
所述步骤6中的人手图像类别定义为:握手为确认,手势左翻为左,手势右翻为右,手势上翻为上,手势下翻为下。
所述步骤3中小波包对人手手指特征分解的原理为把人手所在区域的图像和一族Gabor小波进行卷积,即Qu,v(z)=I(z)*ψu,v(z),应用卷积定理得到一个特征向量
Figure BDA00002714290800036
特征向量x(p)中的元素为手势的识别信息。
本发明的有益积极效果是:
本发明针对动态手势识别中模版匹配方法中误识别和不识别等问题,提出了一种基于分数阶傅里叶变换的手势特征识别方法,利用该方法可以有效的提高和优化人手在运动状态,不同手势操作时的识别效率,和准确度,提高和优化了智能电视盒和智能机顶盒人机交互的用户体验,使操作起来更加方便、快捷。
附图说明
图1为发明的原理示意框图。
具体实施方式
参见图1所示,本发明在基于分数阶傅里叶变换的单目动态手势识别方法中,首先对人体的肤色图像关键帧进行选取,然后对选取的图像进行预处理,再进行人手区域规范化处理,利用二维分数阶傅里叶变换进行变换,最后经过分类器,对不同的手势进行识别。
一种基于分数阶傅里叶变换的单目动态手势识别方法,包括以下步骤:
步骤1:用色彩聚类算法将原始的肤色图像的集合分组成为由类似对象组成的多个聚类,并对其进行非线性分段变换,得到肤色图像的聚类在YCb′Cr'空间中的分布情况,再将其投影到Cb′-Cr′二维子空间,得到肤色聚类模型;
步骤2:采用迭代法对步骤1中的零散肤色区域进行合并处理,确定人手肤色的区域;
步骤3:据小波包对人手手指特征分解的原理并结合人手的几何特征,确定人手所在的区域,检测到人手后,将此坐标信息作为光标位置的控制消息;
步骤4:对步骤3中所得的人手所在的区域进行规范化处理,包括:
步骤4.1:对人手所在区域的图像统计其直方图,求出Pr(r),所述Pr(r)为出现这个灰度级的概率P(Rk),所述直方图的横坐标为灰度级r,纵坐标为具有该灰度级的像素个数或出现这个灰度级的概率P(Rk),其中P(Rk)=nk/N,式中,N为一幅图像中的像素的总数,nk为图像中第k级灰度的像素数,Rk表示第k个灰度级,P(rk)表示该灰度级出现的概率;
步骤4.2:采用累积分布函数对步骤4.1中所统计出的直方图做变换,即Sk=T(rk)=∑pr(r),以此求出变换后的新灰度,式中rk和Sk分别表示原始图像和变换后的第k阶图像灰度的值,Pr(r)为出现这个灰度级的概率P(Rk);
步骤5:利用二维分数阶傅里叶变换提取人手图像的幅度和相位特征信息;
首先对人手图像做傅里叶变换,变换公式为:
Figure BDA00002714290800051
取P1=P2,阶次选择范围在[0,1]之间,间隔为0.1;
其次,对二维分数阶傅里叶变换进行特征提取,取f(x,y)为原人手图像灰度值信息,对f(x,y)做二维分数阶傅里叶变换即为: F α , β ( u , v ) = ∫ - ∞ + ∞ ∫ - ∞ + ∞ f ( x , y ) K p , q ( x , y , u , v ) dxdy , 经计算相位信息可以表示为:
Figure BDA00002714290800061
其中Kp,q(x,y,u,v)为二维分数阶傅里叶变换的核函数,其中
Figure BDA00002714290800062
Figure BDA00002714290800063
p和q分别为变换阶次,Kp,q(x,y,u,v)为变换核;
使p=q,则α=β.
只对公式
F α , β ( u , v ) = ∫ - ∞ + ∞ ∫ - ∞ + ∞ f ( x , y ) K p , q ( x , y , u , v ) dxdy
做行向量u做研究(列向量后作相同处理),那么:
F a , ( u ) = ∫ - ∞ + ∞ f ( x , y ) K P ( x , u ) du = ∫ - ∞ + ∞ f , ( x ) K p ( x , u ) dx
其中,f’(x)是f(x,y)中Y是常数的形式,根据分数阶Fourier变换和
Random-Wigner变换之间的关系:
|Xpu)|2=RWx(α,u)
可得:
| X p ( u ) | = RW x ( α , u ) ,
因为y是常数,故:
| F α , ( u ) | = RW f , ( α , u )
所以相位信息表示为:
P a ( u ) = F ′ a | F a ′ | = F a ′ RW f ′ ( a , u )
其中Wf'是f'(x)关于x的Wigner—vile变换。
步骤6:把步骤5中b)中求出的人手图像的相位幅值采用Fisher分类器判别人手图像的类别。
所述步骤6中的人手图像类别定义为:握手为确认,手势左翻为左,手势右翻为右,手势上翻为上,手势下翻为下。
所述步骤3中小波包对人手手指特征分解的原理为把人手所在区域的图像和一族Gabor小波进行卷积,即Qu,v(z)=I(z)*ψu,v(z),应用卷积定理得到一个特征向量
Figure BDA00002714290800071
特征向量x(p)中的元素为手势的识别信息。

Claims (3)

1.一种基于分数阶傅里叶变换的单目动态手势识别方法,其特征在于包括以下步骤:
步骤1:用色彩聚类算法将原始的肤色图像的集合分组成为由类似对象组成的多个聚类,并对其进行非线性分段变换,得到肤色图像的聚类在YCb′Cr'空间中的分布情况,再将其投影到Cb′-Cr′二维子空间,得到肤色聚类模型;
步骤2:采用迭代法对步骤1中的零散肤色区域进行合并处理,确定人手肤色的区域;
步骤3:据小波包对人手手指特征分解的原理并结合人手的几何特征,确定人手所在的区域,检测到人手后,将此坐标信息作为光标位置的控制消息;
步骤4:对步骤3中所得的人手所在的区域进行规范化处理,包括:
步骤4.1:对人手所在区域的图像统计其直方图,求出Pr(r),所述Pr(r)为出现这个灰度级的概率P(Rk),所述直方图的横坐标为灰度级r,纵坐标为具有该灰度级的像素个数或出现这个灰度级的概率P(Rk),其中P(Rk)=nk/N,式中,N为一幅图像中的像素的总数,nk为图像中第k级灰度的像素数,Rk表示第k个灰度级,P(rk)表示该灰度级出现的概率;
步骤4.2:采用累积分布函数对步骤4.1中所统计出的直方图做变换,即Sk=T(rk)=∑pr(r),以此求出变换后的新灰度,式中rk和Sk分别表示原始图像和变换后的第k阶图像灰度的值,Pr(r)为出现这个灰度级的概率P(Rk);
步骤5:利用二维分数阶傅里叶变换提取人手图像的幅度和相位特征信息;
a)首先对人手图像做傅里叶变换,变换公式为:
Figure FDA00002714290700021
取P1=P2,阶次选择范围在[0,1]之间,间隔为0.1;
b)其次,对二维分数阶傅里叶变换进行特征提取,取f(x,y)为原人手图像灰度值信息,对f(x,y)做二维分数阶傅里叶变换即为: F α , β ( u , v ) = ∫ - ∞ + ∞ ∫ - ∞ + ∞ f ( x , y ) K p , q ( x , y , u , v ) dxdy , 经计算相位信息可以表示为:
Figure FDA00002714290700023
其中Kp,q(x,y,u,v)为二维分数阶傅里叶变换的核函数,其中
Figure FDA00002714290700024
Figure FDA00002714290700025
p和q分别为变换阶次,Kp,q(x,y,u,v)为变换核;
步骤6:把步骤5中b)中求出的人手图像的相位幅值采用Fisher分类器判别人手图像的类别。
2.根据权利要求1所述的基于分数阶傅里叶变换的单目动态手势识别方法,其特征在于:所述步骤6中的人手图像类别定义为:握手为确认,手势左翻为左,手势右翻为右,手势上翻为上,手势下翻为下。
3.根据权利要求1所述的基于分数阶傅里叶变换的单目动态手势识别方法,其特征在于:所述步骤3中小波包对人手手指特征分解的原理为把人手所在区域的图像和一族Gabor小波进行卷积,即Qu,v(z)=I(z)*ψu,v(z),应用卷积定理得到一个特征向量
Figure FDA00002714290700031
特征向量x(p)中的元素为手势的识别信息。
CN2013100069178A 2013-01-08 2013-01-08 一种基于分数阶傅里叶变换的单目动态手势识别方法 Pending CN103077381A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013100069178A CN103077381A (zh) 2013-01-08 2013-01-08 一种基于分数阶傅里叶变换的单目动态手势识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013100069178A CN103077381A (zh) 2013-01-08 2013-01-08 一种基于分数阶傅里叶变换的单目动态手势识别方法

Publications (1)

Publication Number Publication Date
CN103077381A true CN103077381A (zh) 2013-05-01

Family

ID=48153905

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013100069178A Pending CN103077381A (zh) 2013-01-08 2013-01-08 一种基于分数阶傅里叶变换的单目动态手势识别方法

Country Status (1)

Country Link
CN (1) CN103077381A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105526671A (zh) * 2015-12-11 2016-04-27 四川长虹电器股份有限公司 一种用户识别方法及空调设备
CN109255324A (zh) * 2018-09-05 2019-01-22 北京航空航天大学青岛研究院 手势处理方法、交互控制方法及设备
CN111353534A (zh) * 2020-02-27 2020-06-30 电子科技大学 一种基于自适应分数阶梯度的图数据类别预测方法
CN111612324A (zh) * 2020-05-15 2020-09-01 深圳看齐信息有限公司 一种基于英语口语考试的多维度评估方法
CN112580403A (zh) * 2019-09-29 2021-03-30 北京信息科技大学 一种跌倒检测的时频特征提取方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000040147A (ja) * 1998-07-24 2000-02-08 Atr Media Integration & Communications Res Lab 手振り認識装置
US6307951B1 (en) * 1996-03-29 2001-10-23 Giken Trastem Co., Ltd. Moving body detection method and apparatus and moving body counting apparatus
CN101661556A (zh) * 2009-09-25 2010-03-03 哈尔滨工业大学深圳研究生院 基于视觉的静态手势识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6307951B1 (en) * 1996-03-29 2001-10-23 Giken Trastem Co., Ltd. Moving body detection method and apparatus and moving body counting apparatus
JP2000040147A (ja) * 1998-07-24 2000-02-08 Atr Media Integration & Communications Res Lab 手振り認識装置
CN101661556A (zh) * 2009-09-25 2010-03-03 哈尔滨工业大学深圳研究生院 基于视觉的静态手势识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PRG HARDING 等: "Recognizing Hand Gesture using Fourier Descriptors", 《PATTERN RECOGNITION, 2004. ICPR 2004. PROCEEDINGS OF THE 17TH INTERNATIONAL CONFERENCE》 *
刘寅 等: "复杂背景下基于傅立叶描述子的手势识别", 《计算机仿真》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105526671A (zh) * 2015-12-11 2016-04-27 四川长虹电器股份有限公司 一种用户识别方法及空调设备
CN109255324A (zh) * 2018-09-05 2019-01-22 北京航空航天大学青岛研究院 手势处理方法、交互控制方法及设备
CN112580403A (zh) * 2019-09-29 2021-03-30 北京信息科技大学 一种跌倒检测的时频特征提取方法
CN111353534A (zh) * 2020-02-27 2020-06-30 电子科技大学 一种基于自适应分数阶梯度的图数据类别预测方法
CN111612324A (zh) * 2020-05-15 2020-09-01 深圳看齐信息有限公司 一种基于英语口语考试的多维度评估方法
CN111612324B (zh) * 2020-05-15 2021-02-19 深圳看齐信息有限公司 一种基于英语口语考试的多维度评估方法

Similar Documents

Publication Publication Date Title
CN107885327B (zh) 一种基于Kinect深度信息的指尖检测方法
Yuan et al. Learning target-focusing convolutional regression model for visual object tracking
CN108062525B (zh) 一种基于手部区域预测的深度学习手部检测方法
CN107358258B (zh) 基于nsct双cnn通道和选择性注意机制的sar图像目标分类
WO2019222951A1 (en) Method and apparatus for computer vision
CN103218605B (zh) 一种基于积分投影与边缘检测的快速人眼定位方法
CN103150019A (zh) 一种手写输入系统及方法
CN107123130B (zh) 一种基于超像素和混合哈希的核相关滤波目标跟踪方法
CN103077381A (zh) 一种基于分数阶傅里叶变换的单目动态手势识别方法
CN102520790A (zh) 一种基于图像传感模块的字符输入方法、装置及终端
CN108197534A (zh) 一种人头部姿态检测方法、电子设备及存储介质
CN108983980A (zh) 一种移动机器人基本运动手势控制方法
CN102426653B (zh) 基于第二代Bandelet变换和星型模型的静态人体检测方法
CN106503619B (zh) 基于bp神经网络的手势识别方法
CN109558855B (zh) 一种基于手掌轮廓特征与模版匹配法相结合的空间手势识别方法
Zhang et al. Lane recognition algorithm using the hough transform based on complicated conditions
CN109727363A (zh) 一种在票据中识别大写金额的方法
CN104156729A (zh) 一种教室人数统计方法
Aradhya et al. A comprehensive of transforms, Gabor filter and k-means clustering for text detection in images and video
CN108614988A (zh) 一种复杂背景下的运动手势自动识别系统
US20140369559A1 (en) Image recognition method and image recognition system
Jiang et al. A survey on artificial intelligence in posture recognition
Pavithra et al. A comprehensive of transforms, Gabor filter and k-means clustering for text detection in images and video
Le et al. Smart Elevator Cotrol System Based on Human Hand Gesture Recognition
Chen et al. Attention region detection based on closure prior in layered bit planes

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130501