CN110147754A - 一种基于vr技术的动态手势识别方法 - Google Patents

一种基于vr技术的动态手势识别方法 Download PDF

Info

Publication number
CN110147754A
CN110147754A CN201910410659.7A CN201910410659A CN110147754A CN 110147754 A CN110147754 A CN 110147754A CN 201910410659 A CN201910410659 A CN 201910410659A CN 110147754 A CN110147754 A CN 110147754A
Authority
CN
China
Prior art keywords
gesture
dynamic
identification method
method based
gesture identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910410659.7A
Other languages
English (en)
Inventor
张星
奚欣阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinling Institute of Technology
Original Assignee
Jinling Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinling Institute of Technology filed Critical Jinling Institute of Technology
Priority to CN201910410659.7A priority Critical patent/CN110147754A/zh
Publication of CN110147754A publication Critical patent/CN110147754A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于VR技术的动态手势识别方法,属于VR技术的技术领域。动态手势识别方法具体包括以下步骤:S1:读取视频与函数设置;S2:RGB空间与HSV空间转换;S3:去噪和修复空洞;S4:HOG特征提取;S5:三帧提取与填充动画;S6:手势匹配与命令执行。本方案采用的是摄像头动态手势的是识别方式,并在较为常见的方法上做出了手势识别功能和优化其效果,更好的加强了用户体验的感觉,增加了手势识别的精确度和完美性。

Description

一种基于VR技术的动态手势识别方法
技术领域
本发明属于VR技术的技术领域,特别是涉及一种基于VR技术的动态手势识别方法。
背景技术
在中国广阔的大地上,有雄伟的高原、起伏的山岭、广阔的平原、低缓的丘陵,还有四周群山环抱、中间低平的大小盆地。但这些地形地势在《地球的描述》《地理志》《梦溪笔谈》等地理名著上仅仅通过生涩的言语描述出来,使读者难以真正体会中国地理的渊博文化。虽《山海经》存在较多争议,但它对于中国地理学的价值是毋庸置疑的,也正因此我们想把《山海经》更好进行展现。全书可分为山经和海经,再细分则可分为五藏山经、海外经、海内经、大荒经。其中有关山川和河流湖泊的描述,具有较高地理学价值。除这些外它还涵盖丰富的古代地理知识,例如南方岩溶洞六,北方河水季节性变化,以及不同气候带景物与动植物分布等特点。在设计上,本书侧重介绍人文地理的内容的部分,如先民对一些疆域的开发,相对应的河道、丘陵的展示等。
在三个模式即书籍、动漫、游戏的设计中,为更好地加强用户体验的感觉,并且方便用户进行操作,体验者可以根据特定的手势进行书页的翻动或文物的全方位展示,并且书籍、动漫、游戏的设计中动作较快,因此对手势的识别度的要求极高,现有的手势识别已经无法满足该技术的需求。
发明内容
本发明为解决上述背景技术中存在的技术问题,提供一种高识别度的基于VR技术的动态手势识别方法。
本发明通过以下技术方案来实现:一种基于VR技术的动态手势识别方法,具体包括以下步骤:
S1:读取视频与函数设置;
S2:RGB空间与HSV空间转换;
S3:去噪和修复空洞;
S4:HOG特征提取;
S5:三帧提取与填充动画;
S6:手势匹配与命令执行;其中,所述步骤S2中的RGB空间与HSV空间转换采用以下映射:
V=Max(R,G,B)
当人体肤色色调在红色区域最为稳定,在图像中的表现就是R最大,G其次,B最小,用到以下表达式即:
V=R。
在进一步的实施例中,所述步骤S1中采用VFW进行视频的拍摄工作,并采用MSVideo函数将视频捕获窗口与驱动设备相连接。
通过采用上述技术方案:是让它实现使用广泛,操作简单,不受地点限制。所以就光线阴影等因素是必须要考虑的,所以我们放弃了差影法,选择利用肤色等几个常见方法来进行手势分割。
在进一步的实施例中,所述步骤S3中的去噪与修复漏洞采用用非线性去除噪声,具体关系如下:
在进一步的实施例中,所述步骤S4中的HOG特征提取具体包括以下步骤:
S401:将图片网格化,形成N*N的像素点网格,并将图像灰度化;
S402:采集每个像素点的梯度的或者边缘方向的直方图,把各直方图在其中的密度计算出来;
S403:将采集每个像素点的梯度的或者边缘方向的直方图,把所形成的之发个图放在区间中进行对比度归一化;
S404:最后进行对比度归一化,将区间内的特征向量进行组合,就得到了整个手势的特征向量。
在进一步的实施例中,所述步骤S5中的三帧提取与填充动画具体包括以下流程:
首先,手部动作刚开始的那一帧,中间的一帧以及最后的一帧进行S5之前的操作,因为手势动作基本上整个手掌是不动的,是依靠手腕的力量进行一定平移,所以可以直接让它们各自填充成动画;利用的是帧间法来检测手部是否运动以及运动结束;如果在做手势动作时,手部动作幅度偏大,帧间法无法检测出手部开始运动和结束,因此一旦它识别不出来,就截取离它最近的一帧,这种情况会出现两次,即截取开始与结束的帧:中间的一帧则通过整个时间段最中间的时间点来判断提取。
在进一步的实施例中,所述步骤S6中的手势匹配与命令执行具体包括以下流程:
建立一个手势匹配库,把我们所指定的手势上传,一共五个动态手势,向左翻,向右翻,点击播放以及将画面放大与缩小的手势;进行完上面修复孔洞之后的操作,将导出的手势视频HOG特征向量与手势库进行匹配,通过HOG特征向量辅助判断,增强准确性,选择相似度最大的动态手势,并执行在这个手势下的指令。
本发明的有益效果:本方案采用的是摄像头动态手势的是识别方式,并在较为常见的方法上做出了手势识别功能和优化其效果,更好的加强了用户体验的感觉,增加了手势识别的精确度和完美性。
附图说明
图1为本发明实现手势识别的流程图。
图2为本发明S3中去噪和修复空洞的效果图。
图3为本发明S6中的数据库中的部分手势图。
具体实施方式
在下文的描述中,给出了大量具体的细节以便提供对本发明更为彻底的理解。然而,对于本领域技术人员而言显而易见的是,本发明可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本发明发生混淆,对于本领域公知的一些技术特征未进行描述。
本发明为了根据特定的手势进行书页的翻动或文物的全方位展示,藉此采用了摄像头动态手势识别的方式,如图1所示,具体包括以下步骤:
S1:读取视频与函数设置;
S2:RGB空间与HSV空间转换;
S3:去噪和修复空洞;
S4:HOG特征提取;
S5:三帧提取与填充动画;
S6:手势匹配与命令执行。
为了更好的了解本方案的识别方式,以下对上述的每一步做详细的阐述。
S1:读取视频与函数设置
①.首先用来读取摄像头拍摄的视频的工具是VFW,它是Microsoft公司开发的一款软件工具包,具有视频捕获、视频单帧捕获、视频编辑、视频播放等通用功能。它的独特之处在于应用灵活,不需要额外设备来播放视频,除此之外还可以利用回调函数来开发其他的视频应用程序。同时利用AVIcap窗口类来实现视频捕获与视频单帧捕捉功能,并可以对采集到的信息实施独立控制。随后用MSVideo函数将视频捕获窗口与驱动设备相连接。这些操作结束之后,需要设置函数来控制捕获速率和显示大小等等。还要对回调函数进行注册,并在其内部对图像进行一定处理,方便识别。
②.在回调函数内部我们设置的是对视频单帧中的手势分割与优化操作。由于所需要设计的3D拟真系统的目标是让它实现使用广泛,操作简单,不受地点限制。所以就光线阴影等因素是必须要考虑的,所以选择利用肤色等几个常见方法来进行手势分割。
S2:RGB空间与HSV空间转换
人体肤色在空间中具有聚类特征,很容易和其他的物体区分开,会在颜色空间中形成小的聚簇。所以正常情况下大家都是利用肤色来进行手势分割。RGB摄像头拍摄的图像是RGB模式的,不利于肤色分割,而在HSV或者HSI空间中,人体肤色特征最明显,因此需要转换到HSI或者HSV模式来进行分割。我们选择HSV空间模式,因为HSV与人体感知色彩一致。
RGB空间与HSV空间转换采用以下映射:
V=Max(R,G,B)
当人体肤色色调在红色区域最为稳定,在图像中的表现就是R最大,G其次,B最小,用到以下表达式即:
V=R。
S3:去噪和修复空洞
因为在拍摄过程会有一些比较复杂的背景或者电子噪声出现且分布不均匀,导致捕获的图像背景复杂且有很多孔洞。所以需要进一步进行去噪处理,可以采用非线性去除噪声的方法,具体关系如下:
滤波器等带来的图像细节模糊,而且对滤除脉冲干扰及图像扫描噪声最为有效。除此之外,还可以采用形态学其他方法去修复小面积的孔洞,完善图像,具体完善效果见图2。
步骤S4:HOG特征提取
S401:将图片网格化,形成N*N的像素点网格,并将图像灰度化;
S402:采集每个像素点的梯度的或者边缘方向的直方图,把各直方图在其中的密度计算出来;
S403:将采集每个像素点的梯度的或者边缘方向的直方图,把所形成的之发个图放在区间中进行对比度归一化;
S404:最后进行对比度归一化,将区间内的特征向量进行组合,就得到了整个手势的特征向量。
步骤S5:三帧提取与填充动画
首先,手部动作刚开始的那一帧,中间的一帧以及最后的一帧进行S5之前的操作,因为手势动作基本上整个手掌是不动的,是依靠手腕的力量进行一定平移,所以可以直接让它们各自填充成动画;利用的是帧间法来检测手部是否运动以及运动结束;如果在做手势动作时,手部动作幅度偏大,帧间法无法检测出手部开始运动和结束,因此一旦它识别不出来,就截取离它最近的一帧,这种情况会出现两次,即截取开始与结束的帧:中间的一帧则通过整个时间段最中间的时间点来判断提取。
步骤S6:手势匹配与命令执行
建立一个手势匹配库,部分手势图如图3所示,把我们所指定的手势上传,一共五个动态手势,向左翻,向右翻,点击播放以及将画面放大与缩小的手势;进行完上面修复孔洞之后的操作,将导出的手势视频HOG特征向量与手势库进行匹配,通过HOG特征向量辅助判断,增强准确性,选择相似度最大的动态手势,并执行在这个手势下的指令。
本方案采用的是摄像头动态手势的是识别方式,并在较为常见的方法上做出了手势识别功能和优化其效果,更好的加强了用户体验的感觉,增加了手势识别的精确度和完美性。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。

Claims (6)

1.一种基于VR技术的动态手势识别方法,其特征在于,具体包括以下步骤:
S1:读取视频与函数设置;
S2:RGB空间与HSV空间转换;
S3:去噪和修复空洞;
S4:HOG特征提取;
S5:三帧提取与填充动画;
S6:手势匹配与命令执行;其中,所述步骤S2中的RGB空间与HSV空间转换采用以下映射:
V=Max(R,G,B)
当人体肤色色调在红色区域最为稳定,在图像中的表现就是R最大,G其次,B最小,用到以下表达式即:
V=R。
2.根据权利要求1所述的一种基于VR技术的动态手势识别方法,其特征在于,所述步骤S1中采用VFW进行视频的拍摄工作,并采用MSVideo函数将视频捕获窗口与驱动设备相连接。
3.根据权利要求1所述的一种基于VR技术的动态手势识别方法,其特征在于,所述步骤S3中的去噪与修复漏洞采用用非线性去除噪声,具体关系如下:
4.根据权利要求1所述的一种基于VR技术的动态手势识别方法,其特征在于,所述步骤S4中的HOG特征提取具体包括以下步骤:
S401:将图片网格化,形成N*N的像素点网格,并将图像灰度化;
S402:采集每个像素点的梯度的或者边缘方向的直方图,把各直方图在其中的密度计算出来;
S403:将采集每个像素点的梯度的或者边缘方向的直方图,把所形成的之发个图放在区间中进行对比度归一化;
S404:最后进行对比度归一化,将区间内的特征向量进行组合,就得到了整个手势的特征向量。
5.根据权利要求1所述的一种基于VR技术的动态手势识别方法,其特征在于,所述步骤S5中的三帧提取与填充动画具体包括以下流程:
首先,手部动作刚开始的那一帧,中间的一帧以及最后的一帧进行S5之前的操作,因为手势动作基本上整个手掌是不动的,是依靠手腕的力量进行一定平移,所以可以直接让它们各自填充成动画;利用的是帧间法来检测手部是否运动以及运动结束;如果在做手势动作时,手部动作幅度偏大,帧间法无法检测出手部开始运动和结束,因此一旦它识别不出来,就截取离它最近的一帧,这种情况会出现两次,即截取开始与结束的帧:中间的一帧则通过整个时间段最中间的时间点来判断提取。
6.根据权利要求1所述的一种基于VR技术的动态手势识别方法,其特征在于,所述步骤S6中的手势匹配与命令执行具体包括以下流程:
建立一个手势匹配库,把我们所指定的手势上传,一共五个动态手势,向左翻,向右翻,点击播放以及将画面放大与缩小的手势;进行完上面修复孔洞之后的操作,将导出的手势视频HOG特征向量与手势库进行匹配,通过HOG特征向量辅助判断,增强准确性,选择相似度最大的动态手势,并执行在这个手势下的指令。
CN201910410659.7A 2019-05-17 2019-05-17 一种基于vr技术的动态手势识别方法 Pending CN110147754A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910410659.7A CN110147754A (zh) 2019-05-17 2019-05-17 一种基于vr技术的动态手势识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910410659.7A CN110147754A (zh) 2019-05-17 2019-05-17 一种基于vr技术的动态手势识别方法

Publications (1)

Publication Number Publication Date
CN110147754A true CN110147754A (zh) 2019-08-20

Family

ID=67594365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910410659.7A Pending CN110147754A (zh) 2019-05-17 2019-05-17 一种基于vr技术的动态手势识别方法

Country Status (1)

Country Link
CN (1) CN110147754A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368762A (zh) * 2020-03-09 2020-07-03 金陵科技学院 基于改进的K-means聚类算法的机器人手势识别方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102385439A (zh) * 2011-10-21 2012-03-21 华中师范大学 一种用于电子白板的人机手势交互系统
CN103422764A (zh) * 2013-08-20 2013-12-04 华南理工大学 一种门控制系统及其控制方法
CN105975934A (zh) * 2016-05-05 2016-09-28 中国人民解放军63908部队 一种用于增强现实辅助维修的动态手势识别方法及系统
CN107272899A (zh) * 2017-06-21 2017-10-20 北京奇艺世纪科技有限公司 一种基于动态手势的vr交互方法、装置及电子设备
CN107766842A (zh) * 2017-11-10 2018-03-06 济南大学 一种手势识别方法及其应用
CN107967441A (zh) * 2017-09-19 2018-04-27 北京工业大学 一种基于双通道3d-2d rbm模型的视频行为识别方法
CN109086664A (zh) * 2018-06-27 2018-12-25 济南大学 一种动静态融合的多态手势识别方法
CN109409343A (zh) * 2018-12-11 2019-03-01 福州大学 一种基于活体检测的人脸识别方法
CN109598206A (zh) * 2018-11-09 2019-04-09 歌尔科技有限公司 动态手势识别方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102385439A (zh) * 2011-10-21 2012-03-21 华中师范大学 一种用于电子白板的人机手势交互系统
CN103422764A (zh) * 2013-08-20 2013-12-04 华南理工大学 一种门控制系统及其控制方法
CN105975934A (zh) * 2016-05-05 2016-09-28 中国人民解放军63908部队 一种用于增强现实辅助维修的动态手势识别方法及系统
CN107272899A (zh) * 2017-06-21 2017-10-20 北京奇艺世纪科技有限公司 一种基于动态手势的vr交互方法、装置及电子设备
CN107967441A (zh) * 2017-09-19 2018-04-27 北京工业大学 一种基于双通道3d-2d rbm模型的视频行为识别方法
CN107766842A (zh) * 2017-11-10 2018-03-06 济南大学 一种手势识别方法及其应用
CN109086664A (zh) * 2018-06-27 2018-12-25 济南大学 一种动静态融合的多态手势识别方法
CN109598206A (zh) * 2018-11-09 2019-04-09 歌尔科技有限公司 动态手势识别方法及装置
CN109409343A (zh) * 2018-12-11 2019-03-01 福州大学 一种基于活体检测的人脸识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
牛又奇: "《多媒体技术及应用》", 31 July 2005 *
袁博: "手势识别技术发展现状与展望", 《科学技术创新》 *
黄美仪: "《基于教育云的智慧校园系统构建》", 31 January 2016 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368762A (zh) * 2020-03-09 2020-07-03 金陵科技学院 基于改进的K-means聚类算法的机器人手势识别方法

Similar Documents

Publication Publication Date Title
CN109325988B (zh) 一种面部表情合成方法、装置及电子设备
CN106874871B (zh) 一种活体人脸双摄像头识别方法及识别装置
CN110543846B (zh) 一种基于生成对抗网络的多姿态人脸图像正面化方法
CN108717524B (zh) 一种基于双摄手机和人工智能系统的手势识别系统
CN111275696B (zh) 一种医学图像处理的方法、图像处理的方法及装置
CN106204779A (zh) 基于多人脸数据采集策略和深度学习的课堂考勤方法
CN103618918A (zh) 一种智能电视的显示控制方法及装置
CN107463954B (zh) 一种模糊异谱图像的模板匹配识别方法
EP2033142A2 (en) Advances in extending the aam techniques from grayscale to color images
CN110136060B (zh) 基于浅层密集连接网络的图像超分辨率重建方法
CN108280411A (zh) 一种具有空间变换能力的行人搜索方法
CN107886558A (zh) 一种基于RealSense的人脸表情动画驱动方法
CN111161137A (zh) 一种基于神经网络的多风格国画花生成方法
CN112232204B (zh) 基于红外图像的活体检测方法
CN107392879B (zh) 一种基于参考帧的低照度监控图像增强方法
CN109274883A (zh) 姿态矫正方法、装置、终端及存储介质
CN103871014B (zh) 改变图像颜色的方法及装置
CN108537115A (zh) 图像识别方法、装置及电子设备
CN106056992A (zh) Ar增强现实教学系统
CN109785400A (zh) 一种剪影图像制作方法、装置、电子设备及存储介质
CN105069745A (zh) 基于普通图像传感器及增强现实技术的带表情变脸系统及方法
CN110032932A (zh) 一种基于视频处理和决策树设定阈值的人体姿态识别方法
CN109886223A (zh) 人脸识别方法、底库录入方法、装置及电子设备
CN110147754A (zh) 一种基于vr技术的动态手势识别方法
CN113344837B (zh) 人脸图像处理方法及装置、计算机可读存储介质、终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190820