CN112329646A - 一种基于手的质心坐标的手势运动方向识别方法 - Google Patents

一种基于手的质心坐标的手势运动方向识别方法 Download PDF

Info

Publication number
CN112329646A
CN112329646A CN202011235610.1A CN202011235610A CN112329646A CN 112329646 A CN112329646 A CN 112329646A CN 202011235610 A CN202011235610 A CN 202011235610A CN 112329646 A CN112329646 A CN 112329646A
Authority
CN
China
Prior art keywords
hand
image
gesture
integral projection
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011235610.1A
Other languages
English (en)
Inventor
王世刚
高阳
韦健
赵云秀
赵岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202011235610.1A priority Critical patent/CN112329646A/zh
Publication of CN112329646A publication Critical patent/CN112329646A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/66Analysis of geometric attributes of image moments or centre of gravity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics

Abstract

一种基于手的质心坐标的手势运动方向识别方法属动态手势识别领域,本发明通过Matlab编程软件与摄像头来获取手部图像、视频帧并实时处理,对得到的视频图像进行预处理,将基于彩色空间的RGB模型转换为YCbCr模型,再利用积分投影法对二值图像分别进行水平和垂直方向的积分投影,得到水平和垂直方向的积分投影直方图后,就可判断出目标物体在整幅图像中的位置,方便求得手部的质心坐标,通过得到的一段时间间隔内的两帧图像中手的不同坐标,进行计算差值与方向角的计算,完成对手的运动方向的判别。本发明增加了对手势运动范围的判定,在对质点的求取以及方位角的判断上更加直观精确,能更加快速准确地识别判断出手势的运动方向。

Description

一种基于手的质心坐标的手势运动方向识别方法
技术领域
本发明属手势识别技术领域,具体涉及一种基于手的质心坐标的手势运动方向识别方法。
背景技术
近几年来,随着科学技术日新月益的飞速发展,一些面向计算机的交互技术已经逐渐不能满足人们的需求,交互技术已经慢慢从面向计算机向面向自然人转变,也就是人机交互的应用在人们的日常生活中变得越来越普遍。以前的人机交互是以机器为主,而现在的人机交互主要是以人为中心,在以往的人机交互技术中,键盘和鼠标占据了大部分主导地位,然而这种传统的交互方式已经不再利于人机交互技术的发展与推广。而手势作为一种自然、方便、实用的方式,受到了很多人机交互研究者的喜爱以及大众的欢迎。因此,以人为中心的手势识别技术逐渐得到人们的关注与青睐。
对于手势交互来说,就是用简单的手的姿势形状或者运动轨迹来向机器表达自己的想法,并不需要直接触碰它。手势交互对于人机智能交互是十分重要的,特点鲜明,自然方便,并且它的应用领域非常广阔,主要包括:聋哑人手语识别、机器人控制、虚拟现实、智能家居、生活质量提高、智能汽车、工业4.0、智能制造等。
现在的手势识别主要分成两类:一类是静态手势识别,另一类是动态手势识别,其中,静态手势识别主要是根据手的不同姿势与形状来代表不同的含义,不用考虑手的运动轨迹以及特征,比较简单,所以其表达的含义也比较简单,不能够做到充分表示出人们的想法。而动态手势识别不仅需要对手部的区域形状进行分析,还需要对整个手部的运动轨迹信息进行分析,所以更加像是结合了静态的手部区域形状与动态的运动轨迹信息,可以很全面的表达出其丰富的语义内容,可以更好的满足人机交互的需求,所以有更加广阔的应用前景。
手势识别可以使用摄像头采集手势数据,进行分析计算识别相应的手势。也可以是基于惯性传感器的手势识别,这种方法是通过加速度计和角速度计获取目标物的加速度值和角速度值,再结合一系列算法,根据计算出的信息识别相应的手势。手势识别的难点主要在于会有大量的冗余信息,给手势的准确分析和计算造成很大的困难。
发明内容
本发明的目的在于提供一种能快速准确识别判断手势运动方向的基于手的质心坐标的手势运动方向识别方法。
本发明的基于手的质心坐标的手势运动方向识别方法,包括下列步骤:
1.1利用Matlab编程软件与摄像头来获取手部图像,具体步骤如下:
1.1.1读取摄像头:使用Matlab的基本函数a=imaqhwinfo和vid=videoinput读取摄像机的基本属性,并捕获视频帧,得到能实时处理的视频帧;
1.1.2设定重复触发以及帧的抓取时间间隔,进行视频采集,设置一个循环,在采集100帧后停止;
1.2对步骤1.1.2得到的视频图像进行预处理,具体步骤如下:
1.2.1取当前的一帧彩色图像,分别将RGB空间转换为HSV空间和YCrCb空间,然后让皮肤像素在YCrCb空间中指向1,使用简单的YCrCb肤色模型对原始图像进行肤色分割,初步得到粗糙的基本肤色区域;
将基于彩色空间的RGB模型转换为YCbCr模型,公式如下:
Figure BDA0002764499300000021
1.2.2分割黄色皮肤区域,去除小的连接像素;显示出皮肤区域,标记连接区域,分割黄色皮肤区域的阈值的设定如下:
Figure BDA0002764499300000022
1.3手的质心坐标计算,包括下列步骤:
1.3.1去除小的连接像素,显示皮肤区域,标记连接区域,然后进行二值化处理,得到手的二值化图像,获得只有0和1组成的二维矩阵;
1.3.2利用积分投影法对二值图像分别进行水平方向和垂直方向的积分投影,水平方向的积分投影记录的是二值图像中每行的非零像素值的个数,垂直方向的积分投影记录的是二值图像中每列的非零像素值的个数,X方向投影得到Y方向上的移动范围:n1-n2,Y方向投影得到X方向上的移动范围:m1-m2;得到水平和垂直方向的积分投影直方图后,就能判断出目标物体在整幅图像中的位置;
1.3.3手的质心的坐标计算:
用f(x,y)表示点(x,y)的像素值,因为此时的图像为二值图像,也就是0和1组成的二维矩阵,那么图像的像素值f(x,y)为(x,y)处的质量;[m1-m2,n1-n2]大小图像中的所有像素值之和用m表示,如下列公式所示:
Figure BDA0002764499300000023
用下列公式计算,能得到手的质心位置处的坐标
Figure BDA0002764499300000024
Figure BDA0002764499300000031
Figure BDA0002764499300000032
1.4识别手的运动方向,包括下列步骤:
1.4.1坐标作差:在手势运动时取两帧图像,得到两个手的质心坐标,由下列公式进行作差计算:
Figure BDA0002764499300000033
分析得到的数值:
当xt≥0时,手势运动的方向只能是上、左、右;若此时yt≥0时,手势的运动方向只能是上、右;
1.4.2方向角的分析:
方向角的计算公式为:
Figure BDA0002764499300000034
在yt≥0的情况下,将运动角度划分为“上、右”两个方向,其中
Figure BDA0002764499300000035
为上,
Figure BDA0002764499300000036
为右,以此能分析剩下的三种情况,将运动方向划分为“上、下、左、右”,编码分别用“up、down、right、left”表示。
本发明通过对摄像机实时采集得到的视频,进行了一系列的图像处理的操作,并通过计算得出手的质心坐标。通过一定时间间隔的两帧不同图像中不同的坐标值,判断识别出运动方向。
与已有的手势识别技术相比,增加了对手势运动范围的判定,在对质点的求取以及方位角的判断上更加直观精确,可以更加快速识别判断出运动方向,提高了准确性。
附图说明
图1为基于手的质心坐标的手势运动方向识别方法的流程图
图2为实验用到的带USB口的摄像头
图3为手的RGB图像
图4为手的二值图像
图5为当只可能为“上、右”两个方向时方向角的划分范围
图6为“上、下、左、右”四个方向的方向角划分范围
具体实施方式
下面结合附图描述本发明。
本发明的基于手的质心坐标的手势运动方向识别方法,包括如图1所示的步骤:
1.1利用Matlab编程软件与摄像头(如图2所示)来获取手部图像,具体步骤如下:
1.1.1读取摄像头:使用Matlab的基本函数a=imaqhwinfo和vid=videoinput读取摄像机的基本属性,并捕获视频帧,得到能实时处理的视频帧;
1.1.2设定重复触发以及帧的抓取时间间隔,进行视频采集,设置一个循环,在采集100帧后停止;
1.2对步骤1.1.2得到的视频图像进行预处理,具体步骤如下:
1.2.1取当前的一帧彩色图像,分别将RGB空间转换为HSV空间和YCrCb空间,然后让皮肤像素在YCrCb空间中指向1,使用简单的YCrCb肤色模型对原始图像进行肤色分割,初步得到粗糙的基本肤色区域;
将基于彩色空间的RGB模型转换为YCbCr模型,公式如下:
Figure BDA0002764499300000041
1.2.2分割黄色皮肤区域,去除小的连接像素;显示出皮肤区域,标记连接区域,分割黄色皮肤区域的阈值的设定如下:
Figure BDA0002764499300000042
1.3手的质心坐标计算,包括下列步骤:
1.3.1去除小的连接像素,显示皮肤区域,标记连接区域,然后进行二值化处理,得到手的二值化图像,获得只有0和1组成的二维矩阵;
1.3.2利用积分投影法对二值图像分别进行水平方向和垂直方向的积分投影,水平方向的积分投影记录的是二值图像中每行的非零像素值的个数,垂直方向的积分投影记录的是二值图像中每列的非零像素值的个数,X方向投影得到Y方向上的移动范围:n1-n2,Y方向投影得到X方向上的移动范围:m1-m2;得到水平和垂直方向的积分投影直方图后,就能判断出目标物体在整幅图像中的位置;
1.3.3手的质心的坐标计算:
用f(x,y)表示点(x,y)的像素值,因为此时的图像为二值图像,也就是0和1组成的二维矩阵,那么图像的像素值f(x,y)为(x,y)处的质量;[m1-m2,n1-n2]大小图像中的所有像素值之和用m表示,如下列公式所示:
Figure BDA0002764499300000051
用下列公式计算,能得到手的质心位置处的坐标
Figure BDA0002764499300000052
Figure BDA0002764499300000053
Figure BDA0002764499300000054
1.4识别手的运动方向,包括下列步骤:
1.4.1坐标作差:在手势运动时取两帧图像,得到两个手的质心坐标,由下列公式进行作差计算:
Figure BDA0002764499300000055
分析得到的数值:
当xt≥0时,手势运动的方向只能是上、左、右;若此时yt≥0时,手势的运动方向只能是上、右;
1.4.2方向角的分析:
方向角的计算公式为:
Figure BDA0002764499300000056
在yt≥0的情况下,将运动角度划分为“上、右”两个方向,其中
Figure BDA0002764499300000061
为上,
Figure BDA0002764499300000062
为右,以此能分析剩下的三种情况,将运动方向划分为“上、下、左、右”,编码分别用“up、down、right、left”表示。

Claims (1)

1.一种基于手的质心坐标的手势运动方向识别方法,其特征在于包括下列步骤:
1.1利用Matlab编程软件与摄像头来获取手部图像,具体步骤如下:
1.1.1读取摄像头:使用Matlab的基本函数a=imaqhwinfo和vid=videoinput读取摄像机的基本属性,并捕获视频帧,得到能实时处理的视频帧;
1.1.2设定重复触发以及帧的抓取时间间隔,进行视频采集,设置一个循环,在采集100帧后停止;
1.2对步骤1.1.2得到的视频图像进行预处理,具体步骤如下:
1.2.1取当前的一帧彩色图像,分别将RGB空间转换为HSV空间和YCrCb空间,然后让皮肤像素在YCrCb空间中指向1,使用简单的YCrCb肤色模型对原始图像进行肤色分割,初步得到粗糙的基本肤色区域;
将基于彩色空间的RGB模型转换为YCbCr模型,公式如下:
Figure FDA0002764499290000011
1.2.2分割黄色皮肤区域,去除小的连接像素;显示出皮肤区域,标记连接区域,分割黄色皮肤区域的阈值的设定如下:
Figure FDA0002764499290000012
1.3手的质心坐标计算,包括下列步骤:
1.3.1去除小的连接像素,显示皮肤区域,标记连接区域,然后进行二值化处理,得到手的二值化图像,获得只有0和1组成的二维矩阵;
1.3.2利用积分投影法对二值图像分别进行水平方向和垂直方向的积分投影,水平方向的积分投影记录的是二值图像中每行的非零像素值的个数,垂直方向的积分投影记录的是二值图像中每列的非零像素值的个数,X方向投影得到Y方向上的移动范围:n1-n2,Y方向投影得到X方向上的移动范围:m1-m2;得到水平和垂直方向的积分投影直方图后,就能判断出目标物体在整幅图像中的位置;
1.3.3手的质心的坐标计算:
用f(x,y)表示点(x,y)的像素值,因为此时的图像为二值图像,也就是0和1组成的二维矩阵,那么图像的像素值f(x,y)为(x,y)处的质量;[m1-m2,n1-n2]大小图像中的所有像素值之和用m表示,如下列公式所示:
Figure FDA0002764499290000021
用下列公式计算,能得到手的质心位置处的坐标
Figure FDA0002764499290000022
Figure FDA0002764499290000023
Figure FDA0002764499290000024
1.4识别手的运动方向,包括下列步骤:
1.4.1坐标作差:在手势运动时取两帧图像,得到两个手的质心坐标,由下列公式进行作差计算:
Figure FDA0002764499290000025
分析得到的数值:
当xt≥0时,手势运动的方向只能是上、左、右;若此时yt≥0时,手势的运动方向只能是上、右;
1.4.2方向角的分析:
方向角的计算公式为:
Figure FDA0002764499290000026
在yt≥0的情况下,将运动角度划分为“上、右”两个方向,其中
Figure FDA0002764499290000027
为上,
Figure FDA0002764499290000028
为右,以此能分析剩下的三种情况,将运动方向划分为“上、下、左、右”,编码分别用“up、down、right、left”表示。
CN202011235610.1A 2020-11-06 2020-11-06 一种基于手的质心坐标的手势运动方向识别方法 Pending CN112329646A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011235610.1A CN112329646A (zh) 2020-11-06 2020-11-06 一种基于手的质心坐标的手势运动方向识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011235610.1A CN112329646A (zh) 2020-11-06 2020-11-06 一种基于手的质心坐标的手势运动方向识别方法

Publications (1)

Publication Number Publication Date
CN112329646A true CN112329646A (zh) 2021-02-05

Family

ID=74315512

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011235610.1A Pending CN112329646A (zh) 2020-11-06 2020-11-06 一种基于手的质心坐标的手势运动方向识别方法

Country Status (1)

Country Link
CN (1) CN112329646A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111738A (zh) * 2021-03-26 2021-07-13 常州工学院 基于视频图像处理的动态手势识别方法和装置
CN113392821A (zh) * 2021-08-17 2021-09-14 南昌虚拟现实研究院股份有限公司 动态手势识别方法、装置、电子设备及可读存储介质
CN117576787A (zh) * 2024-01-16 2024-02-20 北京大学深圳研究生院 基于主动跟踪和自适应手势识别的交接方法、装置及设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103663A (zh) * 2011-02-26 2011-06-22 山东大学 病房巡视服务机器人系统及其目标搜寻方法
CN104050488A (zh) * 2014-06-16 2014-09-17 西安工业大学 一种基于切换的卡尔曼滤波模型的手势识别方法
CN106599792A (zh) * 2016-11-23 2017-04-26 南京信息工程大学 一种手部驾驶违规行为的检测方法
CN107679512A (zh) * 2017-10-20 2018-02-09 济南大学 一种基于手势关键点的动态手势识别方法
CN108983980A (zh) * 2018-07-27 2018-12-11 河南科技大学 一种移动机器人基本运动手势控制方法
CN109543518A (zh) * 2018-10-16 2019-03-29 天津大学 一种基于积分投影的人脸器官精确识别方法
CN110287894A (zh) * 2019-06-27 2019-09-27 深圳市优象计算技术有限公司 一种针对超广角视频的手势识别方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103663A (zh) * 2011-02-26 2011-06-22 山东大学 病房巡视服务机器人系统及其目标搜寻方法
CN104050488A (zh) * 2014-06-16 2014-09-17 西安工业大学 一种基于切换的卡尔曼滤波模型的手势识别方法
CN106599792A (zh) * 2016-11-23 2017-04-26 南京信息工程大学 一种手部驾驶违规行为的检测方法
CN107679512A (zh) * 2017-10-20 2018-02-09 济南大学 一种基于手势关键点的动态手势识别方法
CN108983980A (zh) * 2018-07-27 2018-12-11 河南科技大学 一种移动机器人基本运动手势控制方法
CN109543518A (zh) * 2018-10-16 2019-03-29 天津大学 一种基于积分投影的人脸器官精确识别方法
CN110287894A (zh) * 2019-06-27 2019-09-27 深圳市优象计算技术有限公司 一种针对超广角视频的手势识别方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111738A (zh) * 2021-03-26 2021-07-13 常州工学院 基于视频图像处理的动态手势识别方法和装置
CN113111738B (zh) * 2021-03-26 2023-12-19 常州工学院 基于视频图像处理的动态手势识别方法和装置
CN113392821A (zh) * 2021-08-17 2021-09-14 南昌虚拟现实研究院股份有限公司 动态手势识别方法、装置、电子设备及可读存储介质
CN117576787A (zh) * 2024-01-16 2024-02-20 北京大学深圳研究生院 基于主动跟踪和自适应手势识别的交接方法、装置及设备
CN117576787B (zh) * 2024-01-16 2024-04-16 北京大学深圳研究生院 基于主动跟踪和自适应手势识别的交接方法、装置及设备

Similar Documents

Publication Publication Date Title
CN106682598B (zh) 一种基于级联回归的多姿态的人脸特征点检测方法
CN112329646A (zh) 一种基于手的质心坐标的手势运动方向识别方法
CN102096471B (zh) 一种基于机器视觉的人机交互方法
CN110032932B (zh) 一种基于视频处理和决策树设定阈值的人体姿态识别方法
CN104992171A (zh) 一种基于2d视频序列的手势识别及人机交互方法和系统
JP5703194B2 (ja) ジェスチャ認識装置、その方法、及び、そのプログラム
CN103310194A (zh) 视频中基于头顶像素点梯度方向的行人头肩部检测方法
CN111444764A (zh) 一种基于深度残差网络的手势识别方法
Song et al. Design of control system based on hand gesture recognition
CN105929947B (zh) 一种基于场景态势感知的人机交互方法
CN103218605A (zh) 一种基于积分投影与边缘检测的快速人眼定位方法
CN109359566B (zh) 利用手指特征进行层级分类的手势识别方法
Guo Research of hand positioning and gesture recognition based on binocular vision
CN106650628B (zh) 一种基于三维k曲率的指尖检测方法
Hu et al. Depth sensor based human detection for indoor surveillance
CN106484108A (zh) 基于双视点手势识别的汉字识别方法
Wang et al. Real-time visual static hand gesture recognition system and its FPGA-based hardware implementation
Zhang et al. Physical blob detector and multi-channel color shape descriptor for human detection
Ju et al. A novel approach to extract hand gesture feature in depth images
Guo et al. Gesture recognition for Chinese traffic police
Hsieh et al. A real time hand gesture recognition system based on DFT and SVM
Simion et al. Finger detection based on hand contour and colour information
CN103020631A (zh) 基于星型模型的人体运动识别方法
Khan et al. Computer vision based mouse control using object detection and marker motion tracking
CN113658223B (zh) 一种基于深度学习的多行人检测与跟踪方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210205