CN106484108A - 基于双视点手势识别的汉字识别方法 - Google Patents

基于双视点手势识别的汉字识别方法 Download PDF

Info

Publication number
CN106484108A
CN106484108A CN201610873057.1A CN201610873057A CN106484108A CN 106484108 A CN106484108 A CN 106484108A CN 201610873057 A CN201610873057 A CN 201610873057A CN 106484108 A CN106484108 A CN 106484108A
Authority
CN
China
Prior art keywords
gesture
chinese characters
window
effective
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610873057.1A
Other languages
English (en)
Inventor
杨嘉琛
许茹
姜斌
王焕玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201610873057.1A priority Critical patent/CN106484108A/zh
Publication of CN106484108A publication Critical patent/CN106484108A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于双视点手势识别的汉字识别方法,将手的动作分为笔划书写的动作和两笔划之间的过渡动作,与此相对应,定义有效手势和无效手势,包括:对书写汉字时采集的手部图像进行色彩空间转换,分割出的手势二值化图像;计算手势中心点;在书写汉字时,在进行动态轨迹识别时,先判断一下此手势是否为有效手势;计算视差;根据视差原理,计算获得指尖点的三维坐标;连接有效手势的空间位置,得到书写汉字的轨迹。本发明可实现多角度的手势识别和轨迹跟踪,能够提高用户输入的自由度。

Description

基于双视点手势识别的汉字识别方法
技术领域
本发明属视频处理领域,涉及一种基于双目相机的自然手汉字书写识别方法。
背景技术
在信息化的今天,在计算机技术迅速普及的现代,人与计算机的交互已经成为日常生活的一部分。尤其是在最近几年,研究如何使人和计算机进行自然直接顺畅的交流已经成为人们的焦点。从输入方式的角度来讲,采用鼠标和键盘来作为输入手段的人机交互已不能完全满足人们当前的需求,而以自然手为输入直接与计算机进行交流或者对机器进行控制才是发展的新趋势。
根据手势识别实现的基础不同,可以将手势识别分为基于数据手套和基于视觉两类。基于穿戴设备的手势识别,如数据手套或者颜色标记等,可以反应出手的具体细节信息并且具备可观的效率,但是设备给人带来的空间不便利性限制他的发展。所以,以自然手的手势作为输入,基于机器视觉进行自然手势的检测识别成为研究热点。
根据识别技术的不同,自然手的模型可分为基于二维表观模型和基于三维立体模型两类。二维表观的手势识别局限了信息平面,无法解决手势的遮挡问题,这在一定程度上就限制了手势识别的准确性,三维手势识别技克服传统二维手势交互的信息限制缺点。
本发明基于双目相机捕捉自然手势,实现不同角度的手势识别以及手势轨迹识别,能够输出所书写的汉字。
发明内容
本发明的目的在于克服单目相机在信息捕捉上的缺陷,提供一种可以实现多角度的手势识别和轨迹跟踪,能够提高用户输入的自由度的汉字识别方法。本发明利用双目相机所能提供的左右图像进行立体匹配,获得手的三维空间坐标信息,以便进行手势的识别和轨迹的计算,从而实现书写汉字的识别。技术方案如下:
一种基于双视点手势识别的汉字识别方法,将手的动作分为笔划书写的动作和两笔划之间的过渡动作,与此相对应,定义有效手势和无效手势分别代表两种输入状态,分别对应汉字笔画书写轨迹和笔画之间的过渡轨迹;定义伸出一只食指朝上为有效手势,写有效笔划的时候使用有效手势;定义握拳为无效输入手势,手在两笔划位置之间过渡时使用无效手势,包括下列步骤:
第一步:对书写汉字时采集的手部图像进行色彩空间转换,选取在YCbCr色彩空间进行肤色建模并进行手势分割,分割出的手势二值化图像。
第二步:在分割出的手势二值化图像中,手势区域像素值为1,背景区域的像素值为0,计算手势中心点
第三步:在书写汉字时,在进行动态轨迹识别时,先判断一下此手势是否为有效手势方法如下:
利用canny算子进行边缘提取,根据提取的边缘得到一个矩形边界,计算手的指尖与中心的距离,即上边界与中心点的距离d1,手腕与中心点,即下边界和中心点的距离d2,若满足d1/d2≥1.4,则判断该手势为有效手势,否则为无效手势;
第四步:对于含有有效手势的帧图像,在双目相机获得的左右两幅图像中,选右图为基准图进行立体匹配并计算视差。计算步骤如下:
1)将基准图和待匹配图都转为灰度图;
2)选基准图的指尖点p为兴趣点,以其为中心建立窗口,计算窗口里的像素灰度特征作为参考值;
3)在待匹配图里建立一个相同尺寸的窗口,移动并不断计算窗口覆盖区域的像素灰度特征;
4)判断移动窗口和基准窗口特征值的相似性,取相似程度最高的窗口为匹配的窗口,窗口的中心点即为匹配点p';
5)计算视差disparity=p'(x)-p(x)。
第五步:根据视差原理,计算获得指尖点的三维坐标;
第六步:对所有含有有效手势的帧进行第四步和第五步处理,连接有效手势的空间位置,得到书写汉字的轨迹。
本发明实现多角度的手势识别和轨迹跟踪,能够提高用户输入的自由度,利用双目相机所能提供的左右图像进行立体匹配,获得手的三维空间坐标信息,以便进行手势的识别和轨迹的计算,从而实现书写汉字的识别。
附图说明
图1形态学处理操作。
图2手势分割图示,左图包含有效手势,右图包含无效手势;第一行是肤色检测的分割效果,有噪声;第二行是经过形态学处理的效果;第三行是计算出的中心和指尖标示。
图3手势判断涉及的距离标示,左图为有效手势,右图为无效手势。
具体实施方式
基于双目相机的汉字输入识别,手势由双目相机进行拍摄输入,每一时刻都有左右两幅图像,对其进行手势定位分割,特征提取和手势分析,立体匹配和三维坐标计算,具体包括以下步骤:
第一步:对图像进行色彩空间转换,选取在YCbCr色彩空间进行肤色建模进行手势分割。具体步骤如下:
1)首先对图像进行色彩空间转换,把RGB图像转换到YCbCr色彩空间;
2)提取Y、Cb、Cr分量,对其进行肤色检测,定位手势区域,满足下式则判断为肤色:
在上式中,a=25.39,b=14.03,ecx=1.60,ecy=2.41,cx=109.38,cy=152.02。将待检测的关键帧图像转换到YCbCr空间后,判断像素的CbCr值是否在式3式描述的椭圆内。如在椭圆内,则认为该像素为肤色点,设置像素点值为1,否则就为背景点,设置像素点值为0;
3)对上一步得到的二值化图像进行腐蚀膨胀形态学处理,填补孔洞,去除噪声,得到优化的手势分割图。
第二步:在分割出的有效手势二值化图像中,手势区域像素值为1,背景区域的像素值为0。计算手势中心点(xcenter,ycenter),具体步骤如下:
1)求得所有值为1的像素的x坐标的和为sumx,y坐标的和为sumy;
2)求得所有值为1的像素的个数的总和为sum;
3)中心点x坐标y坐标
第三步,在书写汉字时,将手的动作分为有效笔划的动作和两笔划之间的过渡动作,与此相对应,定义有效手势和无效手势分别代表两种输入状态。在进行动态轨迹识别时,先判断一下此手势是否有效,只有当输入为汉字有效笔画时只有在有效手势输入才跟踪记录手势的轨迹信息。具体定义为:
1)伸出一只食指朝上为有效输入手势,写有效笔画的时候我们使用有效手势;
2)定义握拳为无效输入手势,手在两笔画位置之间过渡时使用无效手势。
利用canny算子进行边缘提取,根据提取的边缘得到一个矩形边界,计算手的指尖与中心的距离,即上边界与中心点的距离d1,手腕与中心点,即下边界和中心点的距离d2,若满足d1/d2≥1.4,则判断该手势为有效手势,否则为无效手势。
第四步:对于含有有效手势的帧图像,在双目相机获得的左右两幅图像中,选右图为基准图进行立体匹配并计算视差。计算步骤如下:
1)将基准图和待匹配图都转为灰度图;
2)选基准图的指尖点p为兴趣点,以其为中心建立窗口,计算窗口里的像素灰度特征作为参考值;
3)在待匹配图里建立一个相同尺寸的窗口,移动并不断计算窗口覆盖区域的像素灰度特征;
4)判断移动窗口和基准窗口特征值的相似性,取相似程度最高的窗口为匹配的窗口,窗口的中心点即为匹配点p';
5)计算视差disparity=p'(x)-p(x)。
第五步:根据视差原理,可以计算获得指尖点的三维坐标
第六步:对所有含有有效手势的帧进行第四步和第五步处理,连接有效手势的空间位置,得到书写汉字的轨迹。

Claims (1)

1.一种基于双视点手势识别的汉字识别方法,将手的动作分为笔划书写的动作和两笔划之间的过渡动作,与此相对应,定义有效手势和无效手势分别代表两种输入状态,分别对应汉字笔画书写轨迹和笔画之间的过渡轨迹;定义伸出一只食指朝上为有效手势,写有效笔划的时候使用有效手势;定义握拳为无效输入手势,手在两笔划位置之间过渡时使用无效手势。包括下列步骤:
第一步:对书写汉字时采集的手部图像进行色彩空间转换,选取在YCbCr色彩空间进行肤色建模并进行手势分割,分割出的手势二值化图像。
第二步:在分割出的手势二值化图像中,手势区域像素值为1,背景区域的像素值为0,计算手势中心点
第三步:在书写汉字时,在进行动态轨迹识别时,先判断一下此手势是否为有效手势方法如下:
利用canny算子进行边缘提取,根据提取的边缘得到一个矩形边界,计算手的指尖与中心的距离,即上边界与中心点的距离d1,手腕与中心点,即下边界和中心点的距离d2,若满足d1/d2≥1.4,则判断该手势为有效手势,否则为无效手势;
第四步:对于含有有效手势的帧图像,在双目相机获得的左右两幅图像中,选右图为基准图进行立体匹配并计算视差。计算步骤如下:
1)将基准图和待匹配图都转为灰度图;
2)选基准图的指尖点p为兴趣点,以其为中心建立窗口,计算窗口里的像素灰度特征作为参考值;
3)在待匹配图里建立一个相同尺寸的窗口,移动并不断计算窗口覆盖区域的像素灰度特征;
4)判断移动窗口和基准窗口特征值的相似性,取相似程度最高的窗口为匹配的窗口,窗口的中心点即为匹配点p';
5)计算视差disparity=p'(x)-p(x)。
第五步:根据视差原理,计算获得指尖点的三维坐标;
第六步:对所有含有有效手势的帧进行第四步和第五步处理,连接有效手势的空间位置,得到书写汉字的轨迹。
CN201610873057.1A 2016-09-30 2016-09-30 基于双视点手势识别的汉字识别方法 Pending CN106484108A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610873057.1A CN106484108A (zh) 2016-09-30 2016-09-30 基于双视点手势识别的汉字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610873057.1A CN106484108A (zh) 2016-09-30 2016-09-30 基于双视点手势识别的汉字识别方法

Publications (1)

Publication Number Publication Date
CN106484108A true CN106484108A (zh) 2017-03-08

Family

ID=58269089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610873057.1A Pending CN106484108A (zh) 2016-09-30 2016-09-30 基于双视点手势识别的汉字识别方法

Country Status (1)

Country Link
CN (1) CN106484108A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107015645A (zh) * 2017-03-24 2017-08-04 广州幻境科技有限公司 一种基于手势的文字输入方法
CN107273806A (zh) * 2017-05-18 2017-10-20 上海斐讯数据通信技术有限公司 一种基于虚拟现实的书画练习方法及系统
CN108846339A (zh) * 2018-06-04 2018-11-20 珠海格力电器股份有限公司 一种文字识别方法、装置、电子设备和存储介质
CN112486317A (zh) * 2020-11-26 2021-03-12 湖北鼎森智能科技有限公司 基于手势的数字阅读方法及系统
CN113269025A (zh) * 2021-04-01 2021-08-17 广州车芝电器有限公司 一种自动报警方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101620738A (zh) * 2009-07-24 2010-01-06 中国科学院软件研究所 一种生成多媒体概念图的方法
CN202274821U (zh) * 2011-09-17 2012-06-13 浏阳市余氏科技环保烟花厂 一种多角度、全方位展示空中字幕图案的礼花弹效果件
CN103093196A (zh) * 2013-01-14 2013-05-08 大连理工大学 一种基于手势的汉字交互输入与识别方法
CN103716579A (zh) * 2012-09-28 2014-04-09 中国科学院深圳先进技术研究院 视频监控方法及系统
CN103927016A (zh) * 2014-04-24 2014-07-16 西北工业大学 一种基于双目视觉的实时三维双手手势识别方法及其系统
CN104408760A (zh) * 2014-10-28 2015-03-11 燕山大学 一种基于双目视觉的高精度虚拟装配系统算法
CN105183174A (zh) * 2015-10-19 2015-12-23 钟林 一种利用定向滑移手势输入汉字的方法
CN105929939A (zh) * 2016-04-06 2016-09-07 四川东鼎里智信息技术有限责任公司 一种远距离手势控制终端

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101620738A (zh) * 2009-07-24 2010-01-06 中国科学院软件研究所 一种生成多媒体概念图的方法
CN202274821U (zh) * 2011-09-17 2012-06-13 浏阳市余氏科技环保烟花厂 一种多角度、全方位展示空中字幕图案的礼花弹效果件
CN103716579A (zh) * 2012-09-28 2014-04-09 中国科学院深圳先进技术研究院 视频监控方法及系统
CN103093196A (zh) * 2013-01-14 2013-05-08 大连理工大学 一种基于手势的汉字交互输入与识别方法
CN103927016A (zh) * 2014-04-24 2014-07-16 西北工业大学 一种基于双目视觉的实时三维双手手势识别方法及其系统
CN104408760A (zh) * 2014-10-28 2015-03-11 燕山大学 一种基于双目视觉的高精度虚拟装配系统算法
CN105183174A (zh) * 2015-10-19 2015-12-23 钟林 一种利用定向滑移手势输入汉字的方法
CN105929939A (zh) * 2016-04-06 2016-09-07 四川东鼎里智信息技术有限责任公司 一种远距离手势控制终端

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107015645A (zh) * 2017-03-24 2017-08-04 广州幻境科技有限公司 一种基于手势的文字输入方法
CN107273806A (zh) * 2017-05-18 2017-10-20 上海斐讯数据通信技术有限公司 一种基于虚拟现实的书画练习方法及系统
CN108846339A (zh) * 2018-06-04 2018-11-20 珠海格力电器股份有限公司 一种文字识别方法、装置、电子设备和存储介质
CN108846339B (zh) * 2018-06-04 2020-11-27 珠海格力电器股份有限公司 一种文字识别方法、装置、电子设备和存储介质
CN112486317A (zh) * 2020-11-26 2021-03-12 湖北鼎森智能科技有限公司 基于手势的数字阅读方法及系统
CN112486317B (zh) * 2020-11-26 2022-08-09 湖北鼎森智能科技有限公司 基于手势的数字阅读方法及系统
CN113269025A (zh) * 2021-04-01 2021-08-17 广州车芝电器有限公司 一种自动报警方法及系统
CN113269025B (zh) * 2021-04-01 2024-03-26 广州车芝电器有限公司 一种自动报警方法及系统

Similar Documents

Publication Publication Date Title
CN109359538B (zh) 卷积神经网络的训练方法、手势识别方法、装置及设备
Zhou et al. A novel finger and hand pose estimation technique for real-time hand gesture recognition
CN106484108A (zh) 基于双视点手势识别的汉字识别方法
Ma et al. Kinect Sensor‐Based Long‐Distance Hand Gesture Recognition and Fingertip Detection with Depth Information
CN105739702B (zh) 用于自然人机交互的多姿态指尖跟踪方法
CN100407798C (zh) 三维几何建模系统和方法
Prisacariu et al. 3D hand tracking for human computer interaction
CN102096471B (zh) 一种基于机器视觉的人机交互方法
CN103995595A (zh) 一种基于手势的游戏体感控制方法
CN106200971A (zh) 基于手势识别的人机交互系统装置及操作方法
Guo Research of hand positioning and gesture recognition based on binocular vision
CN105046199A (zh) 基于像素分类器和椭圆拟合的指尖点提取方法
CN112329646A (zh) 一种基于手的质心坐标的手势运动方向识别方法
JP2016014954A (ja) 手指形状の検出方法、そのプログラム、そのプログラムの記憶媒体、及び、手指の形状を検出するシステム。
Itkarkar et al. A survey of 2D and 3D imaging used in hand gesture recognition for human-computer interaction (HCI)
CN110956099A (zh) 一种动态手势指令识别方法
He et al. Salient feature point selection for real time RGB-D hand gesture recognition
Li et al. A novel hand gesture recognition based on high-level features
Sokhib et al. A combined method of skin-and depth-based hand gesture recognition.
JP3144400B2 (ja) ジェスチャ認識装置及び方法
CN108521594B (zh) 一种基于体感相机手势识别的自由视点视频播放方法
CN107918507A (zh) 一种基于立体视觉的虚拟触摸板方法
Yang et al. 3D character recognition using binocular camera for medical assist
CN108108648A (zh) 一种新型的手势识别系统装置及方法
CN115205744A (zh) 一种针对花样滑冰运动的智能运动辅助方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170308

RJ01 Rejection of invention patent application after publication