CN109766559B - 一种手语识别翻译系统及其识别方法 - Google Patents

一种手语识别翻译系统及其识别方法 Download PDF

Info

Publication number
CN109766559B
CN109766559B CN201910026747.7A CN201910026747A CN109766559B CN 109766559 B CN109766559 B CN 109766559B CN 201910026747 A CN201910026747 A CN 201910026747A CN 109766559 B CN109766559 B CN 109766559B
Authority
CN
China
Prior art keywords
sign language
recognition
signal data
verification
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910026747.7A
Other languages
English (en)
Other versions
CN109766559A (zh
Inventor
李荣颉
吴金泽
张佳祥
孙浩
王艺博
杨佳雨
贺潇
曾振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Wuzhi Technology Co ltd
Original Assignee
Shenyang Wuzhi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Wuzhi Technology Co ltd filed Critical Shenyang Wuzhi Technology Co ltd
Priority to CN201910026747.7A priority Critical patent/CN109766559B/zh
Publication of CN109766559A publication Critical patent/CN109766559A/zh
Application granted granted Critical
Publication of CN109766559B publication Critical patent/CN109766559B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明提供一种手语识别翻译系统及其识别方法,涉及手势识别领域。该系统包括数据采集处理模块、识别模块和验证模块;该方法包括:采集物理信号搭建并训练出分类模型和验证模型;对采集到的信号数据进行预处理得到时序信号;设置手语识别的窗口长度和步长以及置信度阈值;截取与手语识别窗口相同长度的时序信号分别输入至识别模块和验证模块获得识别结果和验证结果;计算信号数据验证结果的置信度;忽略错误识别结果,输出正确识别结果,然后继续识别下一段时序信号。本方法利用深度学习的算法对处理后的数据进行模式识别并进行验证,实现对手语多元分类,准确、完整的识别,大大的拓展了能够识别的手语数目,并且极大的增强了手语的识别效果。

Description

一种手语识别翻译系统及其识别方法
技术领域
本发明涉及手势识别技术领域,具体涉及一种手语识别翻译系统及其识别方法。
背景技术
近些年随着技术的发展基于手势的人机交互逐渐成为了研究热点,基于手势的设备控制如汽车,电脑,手机以及基于手势的游戏如雨后春笋般涌现。同时因为肢体语言尤其是手部的动作在人的情感表达中具有举足轻重的地位,并且全世界有大量的语言表达有障碍的人士,这一类型的算法的实现与改良将有机会帮助大量残障人士更有效的与他人沟通。
现有的手语识别算法主要是基于计算机视觉或数据手套等设备进行手语识别,基于计算机视觉的方法易受遮挡和光照条件等因素的影响,且便携性较差;而基于数据手套的方法具有易损坏、穿脱不便和价格昂贵的缺点。虽然目前出现了一些基于可穿戴设备的手势识别方法和设备,但这些方法和设备尚处于研发阶段,而且识别效果均差强人意,只能够识别有限的几种语言,很难行之有效的解决残障人士的交流问题。
发明内容
针对现有技术存在的问题,本发明提供一种手语识别翻译系统及其识别方法,能准确有效实时的对手语进行识别,且具有高度泛化能力,以期实现残障人士无障碍交流的识别。
为了实现上述目的,一种手语识别翻译系统,包括数据采集处理模块、识别模块和验证模块;
所述数据采集处理模块,用于以固定频率对表面肌电信号、加速度信号和陀螺仪信号进行采集,并对采集到的信号数据进行预处理,包括分割、特征提取和数据标准化;
所述识别模块,用于根据采集到的信号数据采用深度学习方法搭建、训练出基于卷积神经网络VGG-NET的分类模型,并通过训练好的分类模型对处理后的信号数据进行分类,完成手语识别工作;
所述验证模块,用于根据采集到的手语数据采用深度学习的方法搭建、训练出基于连续的卷积层的验证模型,并通过训练好的验证模型对处理后的信号数据进行再分类,再综合识别模块的结果计算属于识别结果的置信度,最后根据置信度判断手语识别是否成功。
进一步地,所述数据采集处理模块对采集到的信号数据进行特征提取时,根据信号数据种类提取不同的特征,其中,对表面肌电信号数据提取均方根、小波系数和自回归系数,对加速度和陀螺仪信号数据提取均方根、过零点率和自回归系数。
采用手语识别翻译系统进行手语识别的方法,包括以下步骤:
步骤1:数据采集处理模块以固定频率通过传感器,采集表面肌电信号、加速度信号和陀螺仪信号三种物理信号;
步骤2:根据采集到的信号数据采用深度学习方法搭建并训练出基于卷积神经网络VGG-NET的分类模型以及基于连续卷积层的验证模型;
步骤3:对采集到的信号数据进行预处理得到具备波形特征的时序信号;所述预处理包括对信号数据进行压缩、滤波、降噪、特征提取;
步骤4:设置手语识别的窗口长度和步长以及信号数据验证结果置信度的阈值:
步骤5:截取与手语识别窗口相同长度的时序信号,并令截取到的信号数据段n=1,继续步骤7;
步骤6:判断截取n段后的时序信号长度是否小于手语识别的窗口长度,若是,则结束手语识别,若否,则截取与手语识别窗口相同长度的时序信号,并令n=n+1,继续步骤7;
步骤7:将截取到的第n段预处理后的信号数据分别输入至识别模块和验证模块,通过分类模型和验证模型对输入的信号数据进行识别与分类,分别获得对第n段信号数据的识别结果和验证结果;
步骤8:计算第n段信号数据识别结果和验证结果的欧氏距离作为信号数据验证结果的置信度;
步骤9:判断信号数据验证结果的置信度是否大于阈值,若是,则忽略错误识别结果,返回步骤6,若否,则输出正确识别结果,返回步骤6。
本发明的有益效果:
本发明提出一种手语识别翻译系统及其识别方法,利用深度学习的算法对处理后的数据进行模式识别并进行验证,实现对手语多元分类,准确、完整的识别,大大的拓展了能够识别的手语数目,并且极大的增强了手语的识别效果。
附图说明
图1为本发明实施例中手语识别翻译系统的结构框图;
图2为本发明实施例中手语识别翻译系统使用方法的流程图;
图3为本发明实施例中数据采集处理模块采集物理信号的示意图;
其中,(a)为采集加速度信号(Acceleration,ACC)的示意图;(b)为采集陀螺仪信号(Gyroscope,GYR)的示意图;(c)为采集表面肌电信号(Surface Electromyography,sEMG)的示意图;
图4为本发明实施例中识别模块搭建、训练出的基于卷积神经网络VGG-NET的分类模型结构图;
图5为本发明实施例中验证模块搭建、训练出的基于连续的卷积层的验证模型结构图;
图6为本发明实施例中经过数据采集处理模块处理后的数据示意图。
具体实施方式
为了使本发明的目的、技术方案及优势更加清晰,下面结合附图和具体实施例对本发明做进一步详细说明。此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
一种手语识别翻译系统,结构如图1所示,包括数据采集处理模块、识别模块和验证模块。
所述数据采集处理模块,用于以固定频率对表面肌电信号、加速度信号和陀螺仪信号进行采集,并对采集到的信号数据进行预处理,包括分割、特征提取和数据标准化。
本实施例中,所述数据采集处理模块对采集到的信号数据进行特征提取时,根据信号数据种类提取不同的特征,其中,对表面肌电信号数据提取均方根、小波系数和自回归系数,对加速度和陀螺仪信号数据提取均方根、过零点率和自回归系数。
所述识别模块,用于根据采集到的信号数据采用深度学习方法搭建、训练出基于卷积神经网络VGG-NET的分类模型,并通过训练好的分类模型对处理后的信号数据进行分类,完成手语识别工作。
所述验证模块,用于根据采集到的手语数据采用深度学习的方法搭建、训练出基于连续的卷积层的验证模型,并通过训练好的验证模型对处理后的信号数据进行再分类,再综合识别模块的结果计算属于识别结果的置信度,最后根据置信度判断手语识别是否成功。
采用手语识别翻译系统进行手语识别的方法,流程如图2所示,具体包括以下步骤:
步骤1:数据采集处理模块以固定频率通过传感器,采集表面肌电信号、加速度信号和陀螺仪信号三种物理信号。
本实施例中,数据采集处理模块以100hz的频率通过传感器对物理信号进行采集,采集到的物理信号如图3所示。
步骤2:根据采集到的信号数据采用深度学习方法搭建并训练出基于卷积神经网络VGG-NET的分类模型以及基于连续卷积层的验证模型。
本实施例中,采用CNN算法和VGGNet架构搭建并训练出基于卷积神经网络VGG-NET的分类模型。如图4所示,运用一维卷积神经网络,在时序方向上进行计算,使用多层重叠的小卷积核代替大卷积核,不仅减少了运算消耗,且有效的提高了网络的感知能力。经过实验相比元原来的LeNet传统结构,识别的精度及泛化能力都有了极大的提高。另外我们采用了AdaptivePooling Layer代替全连接层,通过其对卷积部分的输出进行处理,有效代替的全连接层的分类决策功能。
对于验证模型,由于在线连续输入是以滑窗进行处理,且滑动步长远小于窗口长度,所以由不可避免的会将不完整、无效的数据输入模型,由于训练数据量有限,且神经网络模型的归纳学习过程存在较强的黑盒性不可避免的具有很强的过拟合现象,导致其对于错误输入的处理能力有限,仅靠网络分类结构本身的激活函数得到的各个类别的置信度不能有效区分分类的效果,因此本实施例中采用基于连续的卷积层的验证模型,如图5所示。
步骤3:对采集到的信号数据进行预处理得到具备波形特征的时序信号;所述预处理包括对信号数据进行压缩、滤波、降噪、特征提取。
本实施例中,由于物理特性的不同,表面肌电信号和加速度信号、陀螺仪信号分别采用不同的特征提取方式:
(1)对于加速度信号和陀螺仪这种传统的牛顿物理学信号,由于在采集数据的过程中不可避免的会产生噪声,而且这两种信号具备连续性的特征,因此我们采用多项式拟合加下采样的方式处理数据,根据数据的变换频度,以12个数据点为一个单位使用三次多项式进行拟合,同时为了增强拟合效果,采用重叠拟合的思路,每次窗口的移动步长设为4,对重叠部分采用分别拟合后取均值的方式进行计算,最后仅使用前一半的点对数据进行复原以实现数据压缩的目的;
(2)对于表面肌电信号,由于生物电信号特有的随机性特征,我们首先进行对其进行阈值滤波降噪预处理,然后采用多层离散小波变换,采用db3小波进行五层变换,对数据进行进一步的降噪和数值特征提取;表面肌电信号往往会出现零点漂移的现象,因此随后会对数据进行零点漂移消除处理,降低漂移误差对模型的影响。
随后对特征提取后的数据进行标准化,归一化处理,保证各个维度的数值标量相近,加快模型训练时的收敛速度和提高识别准确率,最终经过数据采集处理模块处理后的数据如图6所示。
步骤4:设置手语识别的窗口长度和步长以及信号数据验证结果置信度的阈值;
本实施例中,设置滑动窗口的长度为128,步长为8-20之间的随机值,对采集的数据进行抽取,随后会将抽取数据作为一个特征窗口进行手语识别。
步骤5:截取与手语识别窗口相同长度的时序信号,并令截取到的信号数据段n=1,继续步骤7。
步骤6:判断截取n段后的时序信号长度是否小于手语识别的窗口长度,若是,则结束手语识别,若否,则截取与手语识别窗口相同长度的时序信号,并令n=n+1,继续步骤7。
步骤7:将截取到的第n段预处理后的信号数据分别输入至识别模块和验证模块,通过分类模型和验证模型对输入的信号数据进行识别与分类,分别获得对第n段信号数据的识别结果和验证结果。
步骤8:计算第n段信号数据识别结果和验证结果的欧氏距离作为信号数据验证结果的置信度。
步骤9:判断信号数据验证结果的置信度是否大于阈值,若是,则忽略错误识别结果,返回步骤6,若否,则输出正确识别结果,返回步骤6。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;因而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (1)

1.一种手语识别翻译系统进行手语识别的方法,其特征在于,所述一种手语识别翻译系统,包括数据采集处理模块、识别模块和验证模块;
所述数据采集处理模块,用于以固定频率对表面肌电信号、加速度信号和陀螺仪信号进行采集,并对采集到的信号数据进行预处理,包括分割、特征提取和数据标准化;
所述识别模块,用于根据采集到的信号数据采用深度学习方法搭建、训练出基于卷积神经网络VGG-NET的分类模型,并通过训练好的分类模型对处理后的信号数据进行分类,完成手语识别工作;
所述验证模块,用于根据采集到的手语数据采用深度学习的方法搭建、训练出基于连续的卷积层的验证模型,并通过训练好的验证模型对处理后的信号数据进行再分类,再综合识别模块的结果计算属于识别结果的置信度,最后根据置信度判断手语识别是否成功;
所述数据采集处理模块对采集到的信号数据进行特征提取时,根据信号数据种类提取不同的特征,其中,对表面肌电信号数据提取均方根、小波系数和自回归系数,对加速度和陀螺仪信号数据提取均方根、过零点率和自回归系数;
所述的手语识别翻译系统进行手语识别的方法,包括以下步骤:
步骤1:数据采集处理模块以固定频率通过传感器,采集表面肌电信号、加速度信号和陀螺仪信号三种物理信号;
步骤2:根据采集到的信号数据采用深度学习方法搭建并训练出基于卷积神经网络VGG-NET的分类模型以及基于连续卷积层的验证模型;
步骤3:对采集到的信号数据进行预处理得到具备波形特征的时序信号;所述预处理包括对信号数据进行压缩、滤波、降噪、特征提取;
步骤4:设置手语识别的窗口长度和步长以及信号数据验证结果置信度的阈值;
步骤5:截取与手语识别窗口相同长度的时序信号,并令截取到的信号数据段n=1,继续步骤7;
步骤6:判断截取n段后的时序信号长度是否小于手语识别的窗口长度,若是,则结束手语识别,若否,则截取与手语识别窗口相同长度的时序信号,并令n=n+1,继续步骤7;
步骤7:将截取到的第n段预处理后的信号数据分别输入至识别模块和验证模块,通过分类模型和验证模型对输入的信号数据进行识别与分类,分别获得对第n段信号数据的识别结果和验证结果;
步骤8:计算第n段信号数据识别结果和验证结果的欧氏距离作为信号数据验证结果的置信度;
步骤9:判断信号数据验证结果的置信度是否大于阈值,若是,则忽略错误识别结果,返回步骤6,若否,则输出正确识别结果,返回步骤6。
CN201910026747.7A 2019-01-11 2019-01-11 一种手语识别翻译系统及其识别方法 Active CN109766559B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910026747.7A CN109766559B (zh) 2019-01-11 2019-01-11 一种手语识别翻译系统及其识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910026747.7A CN109766559B (zh) 2019-01-11 2019-01-11 一种手语识别翻译系统及其识别方法

Publications (2)

Publication Number Publication Date
CN109766559A CN109766559A (zh) 2019-05-17
CN109766559B true CN109766559B (zh) 2023-09-05

Family

ID=66453737

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910026747.7A Active CN109766559B (zh) 2019-01-11 2019-01-11 一种手语识别翻译系统及其识别方法

Country Status (1)

Country Link
CN (1) CN109766559B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348420B (zh) * 2019-07-18 2022-03-18 腾讯科技(深圳)有限公司 手语识别方法、装置、计算机可读存储介质和计算机设备
CN111700718B (zh) * 2020-07-13 2023-06-27 京东科技信息技术有限公司 一种识别握姿的方法、装置、假肢及可读存储介质
CN114115531B (zh) * 2021-11-11 2022-09-30 合肥工业大学 一种基于注意力机制的端到端手语识别方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622610A (zh) * 2012-03-05 2012-08-01 西安电子科技大学 一种基于分类器集成的手写维文字符识别方法
CN107480682A (zh) * 2017-08-25 2017-12-15 重庆慧都科技有限公司 一种商品包装生产日期检测方法
CN107491726A (zh) * 2017-07-04 2017-12-19 重庆邮电大学 一种基于多通道并行卷积神经网络的实时表情识别方法
CN107742095A (zh) * 2017-09-23 2018-02-27 天津大学 基于卷积神经网络的汉语手语识别方法
CN107736894A (zh) * 2017-09-24 2018-02-27 天津大学 一种基于深度学习的心电信号情绪识别方法
CN108364006A (zh) * 2018-01-17 2018-08-03 超凡影像科技股份有限公司 基于多模式深度学习的医学图像分类装置及其构建方法
CN108766434A (zh) * 2018-05-11 2018-11-06 东北大学 一种手语识别翻译系统及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622610A (zh) * 2012-03-05 2012-08-01 西安电子科技大学 一种基于分类器集成的手写维文字符识别方法
CN107491726A (zh) * 2017-07-04 2017-12-19 重庆邮电大学 一种基于多通道并行卷积神经网络的实时表情识别方法
CN107480682A (zh) * 2017-08-25 2017-12-15 重庆慧都科技有限公司 一种商品包装生产日期检测方法
CN107742095A (zh) * 2017-09-23 2018-02-27 天津大学 基于卷积神经网络的汉语手语识别方法
CN107736894A (zh) * 2017-09-24 2018-02-27 天津大学 一种基于深度学习的心电信号情绪识别方法
CN108364006A (zh) * 2018-01-17 2018-08-03 超凡影像科技股份有限公司 基于多模式深度学习的医学图像分类装置及其构建方法
CN108766434A (zh) * 2018-05-11 2018-11-06 东北大学 一种手语识别翻译系统及方法

Also Published As

Publication number Publication date
CN109766559A (zh) 2019-05-17

Similar Documents

Publication Publication Date Title
WO2021143353A1 (zh) 一种手势信息处理方法、装置、电子设备及存储介质
CN109766559B (zh) 一种手语识别翻译系统及其识别方法
Wang et al. Kinect based dynamic hand gesture recognition algorithm research
CN111103976B (zh) 手势识别方法、装置及电子设备
US11641352B2 (en) Apparatus, method and computer program product for biometric recognition
CN111104820A (zh) 一种基于深度学习的手势识别方法
CN102508547A (zh) 基于计算机视觉的手势输入法构建方法及系统
CN106503619B (zh) 基于bp神经网络的手势识别方法
CN106502390B (zh) 一种基于动态3d手写数字识别的虚拟人交互系统及方法
Kalsh et al. Sign language recognition system
Bao et al. Extracting region of interest for palmprint by convolutional neural networks
Thongtawee et al. A novel feature extraction for American sign language recognition using webcam
Shinde et al. Real time two way communication approach for hearing impaired and dumb person based on image processing
CN112749646A (zh) 一种基于手势识别的交互式点读系统
CN107346207B (zh) 一种基于隐马尔科夫模型的动态手势切分识别方法
CN107909003B (zh) 一种针对大词汇量的手势识别方法
Saha et al. A novel approach to american sign language recognition using madaline neural network
CN114384999B (zh) 基于自适应学习的用户无关肌电手势识别系统
CN110123280B (zh) 一种基于智能移动终端操作行为识别的手指灵活度检测模型的构建方法
CN111914724B (zh) 基于滑动窗口分割的连续中国手语识别方法及其系统
CN111913575B (zh) 一种手语词的识别方法
CN112883922B (zh) 基于CNN-BiGRU神经网络融合的手语识别方法
Nath et al. Embedded sign language interpreter system for deaf and dumb people
CN110163142B (zh) 实时手势识别方法及系统
CN109919050B (zh) 身份识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant