CN108320625A - 面向言语康复的震动反馈系统及装置 - Google Patents
面向言语康复的震动反馈系统及装置 Download PDFInfo
- Publication number
- CN108320625A CN108320625A CN201810341455.8A CN201810341455A CN108320625A CN 108320625 A CN108320625 A CN 108320625A CN 201810341455 A CN201810341455 A CN 201810341455A CN 108320625 A CN108320625 A CN 108320625A
- Authority
- CN
- China
- Prior art keywords
- module
- processing module
- speech
- vibrational feedback
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 41
- 230000004888 barrier function Effects 0.000 claims abstract description 23
- 210000001260 vocal cord Anatomy 0.000 claims abstract description 23
- 230000001360 synchronised effect Effects 0.000 claims abstract description 11
- 230000005540 biological transmission Effects 0.000 claims abstract description 9
- 230000000007 visual effect Effects 0.000 claims abstract description 8
- 230000004927 fusion Effects 0.000 claims abstract description 6
- 230000035939 shock Effects 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000033001 locomotion Effects 0.000 claims description 7
- 238000000034 method Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 230000003321 amplification Effects 0.000 claims description 4
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 230000008921 facial expression Effects 0.000 claims description 3
- 238000012549 training Methods 0.000 abstract description 12
- 238000004088 simulation Methods 0.000 abstract description 6
- 206010011878 Deafness Diseases 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 210000000214 mouth Anatomy 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 238000002630 speech therapy Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000033764 rhythmic process Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 238000013480 data collection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 210000001584 soft palate Anatomy 0.000 description 1
- 230000002889 sympathetic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B21/00—Teaching, or communicating with, the blind, deaf or mute
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/04—Speaking
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B21/00—Teaching, or communicating with, the blind, deaf or mute
- G09B21/06—Devices for teaching lip-reading
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Social Psychology (AREA)
- Entrepreneurship & Innovation (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明涉及面向言语康复的震动反馈系统及装置,包括视频采集模块、视频处理模块、语音采集模块、语音处理模块、同步处理模块、数据传输模块、数据显示模块、震动采集模块、信号处理模块、震动反馈模块;本发明提供一种具有音、视频识别系统,同时加入震动采集模块、震动反馈模块,能够辅助听障生在言语康复训练中可视三维人脸发音模型及声带震动模拟,同时震动反馈模块能够反馈听障儿童发音过程中声带振动情况,并给予反馈,是一种融合三维虚拟言语导师模拟发音过程、声带震动模拟以及震动信息反馈的辅助听障生言语训练的康复系统。
Description
技术领域
本发明涉及面向言语康复的震动反馈系统及装置。
背景技术
在我国,听力障碍人数是世界上最多的国家,据中国残联最新统计的数据显示,中国各类残疾人总数已达8500万,其中听力障碍残疾人2057万,居各类残疾之首,占全国人口的16.7‰,其中七岁以下聋童可达80万,每年还将新生聋儿3万余名。但聋儿并非有言语障碍,在早期进行言语康复训练是帮助聋儿发声、正常与人交流的有效途径之一。传统的语言康复训练一般通过语训教师人为示范发音动作让听障儿童进行模仿口型,而发音主要通过气流引起声带震动产生能量,基频通过咽腔、口腔 和鼻腔等共鸣形成谐音,在经过舌、软腭和嘴唇等构音器官的运动,最后形成语言。因此单纯的口型模仿还不足以完成发音的练习,需要听障儿童感受声带的震动才能发声。目前的语训方式发音时的声带震动情况则需要听障儿童通过触摸的方式感知。该过程完全不可视,全靠触觉完成,言语康复训练的听障儿童年龄一般年龄较小,完成这一个过程比较困难,而且听障儿童练习过程中声带震动情况完全不可视。
具最新研究表明,可视化的发音教学有助于听障儿童的语言学习,视听结合的语音教学方式比单独的视觉或听觉教学效果更好,这是由于发音的动态模拟过程可刺激聋儿对内部发音器官运动轨迹的理解,并使聋儿形成发音时对发音器官位置的控制。近年来涌现出一批视听结合的聋儿言语康复系统,这些系统采用计算机生成的三维可视模型虚拟发音人头像,唇部运动等信息进行言语康复训练或单一的采集声带震动信息进行特征值提取。因此现有的研究中缺少一款能融合三维虚拟言语导师模拟发音过程以及声带震动模拟,同时还能够对听障儿童声带震动准确性进行判断、提示的震动反馈装置。有鉴于此,有必要针对听障生的特殊需求,提供面向言语康复的震动反馈系统及装置。
发明内容
本发明是一种融合三维虚拟言语导师模拟发音过程以及声带震动模拟,使听障儿童能够直观的了解言语康复训练的发音动作及声带震动频率等。系统还包括一套震动反馈装置,用于对聋儿言语康复训练的发音进行反馈。多通道信息反馈系统可以实现真正意义的无人干预的听障儿童与计算机人机交互的发音康复训练。
面向言语康复的震动反馈系统及装置,其特征在于:包括视频采集模块、视频处理模块、语音采集模块、语音处理模块、同步处理模块、数据传输模块、数据显示模块、震动采集模块、信号处理模块、震动反馈模块。
所述视频采集模块用于采集说话人面部发音的运动数据。
所述视频处理模块用于提取人发音面部表情及唇部运动的特征值。
所述语音采集模块用于采集说话人发音的音频数据。
所述语音处理模块用于将语音信号模数转换、降低信号噪声、提取语音信号特征值。
所述震动采集模块利用震动传感器进行震动检测,并将采集到的震波转换为电信号。
所述信号处理模块用于将震动传感器转换的电信号进行模数转换、降低信号噪声、功率放大、提取震波的特征值。
所述震动反馈模块用于将震波的特征值与标准震动数据库进行对比,判断是否驱动震动马达对不准确发音进行反馈。
所述同步处理模块用于将视频数据、语音数据、震波转至的电信号进行同步处理。
所述数据传输模块用于传输同步处理的视频、音频、震动信息。所述数据显示模块用于显示说话人音频、视频、震动可视化信息,融合三维虚拟言语导师模拟发音过程以及声带震动模拟,将视频信息、语音信息、震动信息同步可视化。
本发明在三维人脸可视模型基础上,融合三维虚拟言语导师模拟发音过程以及声带震动模拟,听障儿童能够直观的了解言语康复训练意图。通过与发音震动数据库做出比对,将需要震动的数据信息反馈给震动反馈装置,震动反馈装置震动告知听障儿童发音过程中声带振动情况,并给予反馈,解决了传统语音康复训练中听障儿童需要用手触摸康复训练教师才知道需要声带震动发生的问题,提高听障儿童康复训练效果,同时面向听障儿童发音康复的震动反馈装置技术也可以实现真正意义的无人干预的听障儿童与计算机人机交互的发音康复训练。
附图说明
图1是面向言语康复的震动反馈系统及装置。
图2是同步处理模块107示意图。
图3是震动反馈模块110工作流程图。
具体实施方案
下面结合附图详细说明本发明的技术方案。
图1是面向言语康复的震动反馈系统及装置。包括视频采集模块101、视频处理模块102、语音数据采集模块103、语音处理模块104、震动采集模块105、信号处理模块106、同步处理模块107、数据传输模块108、数据显示模块109、震动反馈模块110。
视频采集模块101用于采集说话人的面部运动数据。通过视频录像方式获取人面部运动数据信息。
视频处理模块102用于提取人发音面部表情及唇部运动的特征值目的。并且对视频图像进行人脸特征提取及背景滤波。
语音采集模块103用于采集说话人发音的音频数据。说话人的语音数据可以通过对说话人的语音进行录音的方式直接获得。
语音处理模块104用于将语音信号模数转换、降低信号噪声、提取语音信号特征值。
震动采集模块105利用震动传感器进行震动检测,并将采集到的震波转换为电信号。
信号处理模块106用于将震动传感器转换的电信号进行模数转换、降低信号噪声、功率放大、提取震波的特征值。提取的特征值包括震动频率、震幅及震动节奏。
图2是同步处理模块107示意图。
视频数据接收模块201接收到由视频处理模块102传送的数据视频;音频数据接收模块202接收到由语音处理模块104传送的音频数据;震动数据接收模块203接收到由信号处理模块106经模数转换、降低信号噪声的震动;同时将视频数据、语音数据、震动数据同步处理。
数据传输模块108用于将已同步的信息实时不间断传递。
数据显示模块109用于显示说话人音频、视频、震动特征的可视化信息;数据显示模块109可以是显示器、手机等电子显示设备。
图3是震动反馈模块110工作流程图。
将提取的信号特征值与标准数据库301进行比对,在误差允许范围内则继续比对下一帧数据302。不在误差允许的范围内则驱动微型震动马达304,微型震动马达304发出低频的震动,将震动信息反馈至听障儿童,提醒听障儿童此时的发音需要声带震动或发音不标准。所述标准数据库303是采集正常人发音的字母、元音、词语、语句时声带震动的:震动频率、震幅及震动节奏特征值,作为评判听障儿童语训发音时正确率的评判标准。所述微型震动马达304为适合人体的低频、低功耗震动元件。
综上所述本发明为面向言语康复的震动反馈系统及装置,提供一种能融合三维虚拟言语导师模拟发音过程以及声带震动模拟,听障儿童能够直观的了解计算机言语康复训练意图。同时本系统提出一种震动反馈装置,反馈声带震动信息,能够辅助听障儿童在言语康复训练中了解如何发音、什么时间需要声带震动发音等信息。
应当理解的是,以上所示实施例仅表达本发明的几种实施方案,其描述较为具体和详细,但不能因此理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (4)
1.面向言语康复的震动反馈系统及装置,其特征在于:包括视频采集模块、视频处理模块、语音采集模块、语音处理模块、同步处理模块、数据传输模块、数据显示模块、震动采集模块、信号处理模块、震动反馈模块;
所述视频采集模块用于采集说话人面部发音的运动数据;
所述视频处理模块用于提取人发音面部表情及唇部运动的特征值;
所述语音采集模块用于采集说话人发音的音频数据;
所述语音处理模块用于将语音信号模数转换、降低信号噪声、提取语音信号特征值;
所述震动采集模块是采用震动传感器来提取发音过程中的声带震动信号,并将采集到的震波转换为电信号;
所述信号处理模块用于将震动传感器转换的电信号进行模数转换、降低信号噪声、功率放大、提取震波的特征值;
所述震动反馈模块用于将震波的特征值与标准震动数据库进行对比,判断是否驱动震动马达对不准确发音进行反馈;
所述同步处理模块用于将视频数据、语音数据、震波转至的电信号进行同步处理;
所述数据传输模块用于传输同步处理的视频、音频、震动信息;所述数据显示模块用于显示说话人音频、视频、震动可视化信息,融合三维虚拟言语导师模拟发音过程以及声带震动模拟,将视频信息、语音信息、震动信息同步可视化。
2.根据权利要求1所述的面向言语康复的震动反馈系统及装置其特征在于:视频处理模块、音频处理模块、信号处理模块与同步处理模块相连接,同步处理模块。
3.根据权利要求1所述的面向言语康复的震动反馈系统及装置,其特征在于:所述震动采集模块与信号处理模块相连,采用震动传感器将采集到的声带震动的震波转为电信号;信号处理模块用于将震动传感器转换的电信号进行模数转换、降低信号噪声、功率放大、提取震波的特征值。
4.根据权利要求1所述的面向言语康复的震动反馈系统及装置,其特征在于:震动反馈模块与标准发音声带震动数据库相连,用于将信号处理模块中提取的特征值与标准数据库进行比对,判定是否启动震动马达对听障儿童进行震动反馈。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810341455.8A CN108320625A (zh) | 2018-04-17 | 2018-04-17 | 面向言语康复的震动反馈系统及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810341455.8A CN108320625A (zh) | 2018-04-17 | 2018-04-17 | 面向言语康复的震动反馈系统及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108320625A true CN108320625A (zh) | 2018-07-24 |
Family
ID=62897659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810341455.8A Pending CN108320625A (zh) | 2018-04-17 | 2018-04-17 | 面向言语康复的震动反馈系统及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108320625A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108806354A (zh) * | 2018-08-28 | 2018-11-13 | 南京林业大学 | 一种听障儿童发音训练玩具、系统和方法 |
CN109598991A (zh) * | 2019-01-11 | 2019-04-09 | 张翩 | 一种英语发音教学系统、装置及方法 |
CN110349565A (zh) * | 2019-07-02 | 2019-10-18 | 长春大学 | 一种面向听障人士的辅助发音学习方法及其系统 |
CN110853624A (zh) * | 2019-11-29 | 2020-02-28 | 杭州南粟科技有限公司 | 言语康复训练系统 |
CN112617755A (zh) * | 2020-12-28 | 2021-04-09 | 深圳市艾利特医疗科技有限公司 | 言语功能障碍检测方法、装置、设备、存储介质及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751809A (zh) * | 2010-02-10 | 2010-06-23 | 长春大学 | 基于三维头像的聋儿语言康复方法及系统 |
CN102063903A (zh) * | 2010-09-25 | 2011-05-18 | 中国科学院深圳先进技术研究院 | 言语交互训练系统及方法 |
CN102920435A (zh) * | 2012-10-23 | 2013-02-13 | 泰亿格电子(上海)有限公司 | 基于言语发声实时视听反馈和促进技术的康复系统及方法 |
CN106251721A (zh) * | 2016-09-26 | 2016-12-21 | 宇龙计算机通信科技(深圳)有限公司 | 虚拟运动教学方法及系统 |
-
2018
- 2018-04-17 CN CN201810341455.8A patent/CN108320625A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751809A (zh) * | 2010-02-10 | 2010-06-23 | 长春大学 | 基于三维头像的聋儿语言康复方法及系统 |
CN102063903A (zh) * | 2010-09-25 | 2011-05-18 | 中国科学院深圳先进技术研究院 | 言语交互训练系统及方法 |
CN102920435A (zh) * | 2012-10-23 | 2013-02-13 | 泰亿格电子(上海)有限公司 | 基于言语发声实时视听反馈和促进技术的康复系统及方法 |
CN106251721A (zh) * | 2016-09-26 | 2016-12-21 | 宇龙计算机通信科技(深圳)有限公司 | 虚拟运动教学方法及系统 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108806354A (zh) * | 2018-08-28 | 2018-11-13 | 南京林业大学 | 一种听障儿童发音训练玩具、系统和方法 |
CN109598991A (zh) * | 2019-01-11 | 2019-04-09 | 张翩 | 一种英语发音教学系统、装置及方法 |
CN110349565A (zh) * | 2019-07-02 | 2019-10-18 | 长春大学 | 一种面向听障人士的辅助发音学习方法及其系统 |
CN110349565B (zh) * | 2019-07-02 | 2021-03-19 | 长春大学 | 一种面向听障人士的辅助发音学习方法及其系统 |
CN110853624A (zh) * | 2019-11-29 | 2020-02-28 | 杭州南粟科技有限公司 | 言语康复训练系统 |
CN112617755A (zh) * | 2020-12-28 | 2021-04-09 | 深圳市艾利特医疗科技有限公司 | 言语功能障碍检测方法、装置、设备、存储介质及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108320625A (zh) | 面向言语康复的震动反馈系统及装置 | |
CN101751809B (zh) | 基于三维头像的聋儿语言康复方法及系统 | |
US7676372B1 (en) | Prosthetic hearing device that transforms a detected speech into a speech of a speech form assistive in understanding the semantic meaning in the detected speech | |
Erber | Visual perception of speech by deaf children: Recent developments and continuing needs | |
CN100397438C (zh) | 聋哑人汉语发音计算机辅助学习方法 | |
Nickerson et al. | Teaching speech to the deaf: Can a computer help | |
CN102663925A (zh) | 面向听障儿童语训的舌部训练方法及其系统 | |
CN107301863A (zh) | 一种聋哑儿童言语障碍康复方法及康复训练系统 | |
Badin et al. | Visual articulatory feedback for phonetic correction in second language learning | |
CN104537925A (zh) | 语障儿童语言训练辅助系统及方法 | |
CN102663928A (zh) | 一种聋人学习说话的电子教学方法 | |
CN104537926B (zh) | 听障儿童语言训练辅助系统及方法 | |
Goldstein Jr et al. | Tactile aids for profoundly deaf children | |
CN113658584A (zh) | 智能化发音矫正方法及系统 | |
Wayland | Phonetics: A practical introduction | |
CN101494816A (zh) | 一种适用于全聋患者的助听装置与方法 | |
CN101958060A (zh) | 英语拼读速成技术工具 | |
Humes et al. | Audiology and communication disorders: An overview | |
KR101967849B1 (ko) | 섀도윙과 속청을 결합시켜 모국어 습득과정을 모사한 외국어 학습 방법, 장치 및 프로그램 기록매체 | |
CN106157750A (zh) | 一种智能聋哑人发音及交流学习眼镜 | |
CN113160366A (zh) | 一种3d人脸动画合成方法及系统 | |
Fletcher et al. | Speech modification by a deaf child through dynamic orometric modeling and feedback | |
CN206946127U (zh) | 一种聋哑人用的眼镜 | |
Goldstein Jr et al. | Modification of vocalizations of preschool deaf children by vibrotactile and visual displays | |
CN113593374A (zh) | 一种口肌训练结合的多模态言语康复训练系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180724 |