CN102663928A - 一种聋人学习说话的电子教学方法 - Google Patents

一种聋人学习说话的电子教学方法 Download PDF

Info

Publication number
CN102663928A
CN102663928A CN2012100583720A CN201210058372A CN102663928A CN 102663928 A CN102663928 A CN 102663928A CN 2012100583720 A CN2012100583720 A CN 2012100583720A CN 201210058372 A CN201210058372 A CN 201210058372A CN 102663928 A CN102663928 A CN 102663928A
Authority
CN
China
Prior art keywords
pronunciation
mouth
learners
learner
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100583720A
Other languages
English (en)
Inventor
吕卫
褚晶辉
杨博菲
郑岩
杨德龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN2012100583720A priority Critical patent/CN102663928A/zh
Publication of CN102663928A publication Critical patent/CN102663928A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明属于学习用具技术领域,涉及一种聋人学习说话的电子教学方法,包括:通过麦克风和摄像头获取学习者在练习发音时的音频和视频数据以及音频、视频内容的时间同步信息;提取音频特征参数;提取嘴的有关口型的视觉特征;将提取出的音频特征参数与预存在标准发音的特征参数模板库里对应的特征参数进行比较分类,判断学习者的发音是否正确;如果差异较大,则通过将其音频特征及有关口型的视觉特征与常见错误发音的特征参数模板库对比,判断属于哪一类常见错误,用图像、动画、视频内容给出学习者的错误发音方式与标准发音方式的对比。本发明能够自动分析学习者发音是否规范,纠正错误,学习过程基本无需教学人员的干预。

Description

一种聋人学习说话的电子教学方法
技术领域
本发明属于学习用具技术领域,具体涉及一种聋人学习说话的电子教学方法。
背景技术
专利CN2057550“频率可变式聋人语音训练助听器”,提出一种适用于聋人进行语音听觉训练的助听器,该助听器的特点是利用聋人对于语音的不同频率分量的不同反应,采用语音带通滤波器、放大器来构成助听器,从而使聋人在不感觉痛苦的情况下听清楚语音,从而达到对聋人进行语音听觉训练的目的。
专利CN2279662“一种适合于室外活动用的聋人语言训练机”提出了一种多功能的适合于室外活动用的聋人语言训练机,其特征在于由话筒和无线发射机组成无线话筒,供老师携带,由无线接收机、后置放大器、七段均衡器、功率放大器和双声道耳机依次连接组成信号接收放大装置,供同学使用。
专利CN1183945“使聋人感知声音的装置”,提出一种利用电子装置以声音的振动形式,以能够使人体皮肤产生感觉的方式作用于人体皮肤,使人通过对皮肤的感觉感知声音的信息。由拾音器、放大器和对人体皮肤的振动传感器所组成,其特征在于:对人体皮肤的振动传感器贴于人体皮肤,并以声音的振动形式,以能够使人体皮肤产生感觉的机械振动方式作用于人体皮肤。
以上技术的原理均是采用模拟电路使聋人感知声音产生的振动,其共同缺点有以下几点:1、教学装置本身没有采用图片、视频显示这些可视化的教学方式,而是需要教学人员的现场示范,可重复性差,也不容易引起学习者的兴趣;2、学习者无法通过“示范说明-学话者发音-纠正发音”这样的互动方式进行自主学习;3、学习过程离不开教学人员的大量干预,例如需要由教学人员反复进行示范和评价发音是否规范并进行纠正;4、在一对多的教学环境下,教学人员不能同时辅导多名学习者。
发明内容
本发明所要解决的技术问题是克服现有技术的不足,提出一种能够以可视化的方式进行教学,能够自动分析学习者发音是否规范,并显示纠正错误的对应示范教学内容,学习过程基本无需教学人员的干预的聋人学习说话电子教学装置。本发明通过以下技术方案实现:
一种聋人学习说话的电子教学方法,在进行电子教学之前,已经在教学装置里预存有教学内容,与教学内容相关的标准发音的特征参数模板库和常见错误发音的特征参数模板库,在进行电子教学的时候,采用如下的步骤:
(1)播放教学内容
(2)通过麦克风和摄像头获取学习者在练习发音时的音频和视频数据以及音频、视频内容的时间同步信息;
(3)对获得的音频数据进行预处理,做离散傅里叶变换,根据频域能量标记出静音帧与非静音帧,对非静音帧提取音频特征参数;
(4)对获得的视频数据采用基于哈尔特征推进级联分类器的快速人脸嘴部检测方法,检测、跟踪视频流中说话人的嘴部运动,提取嘴的有关口型的视觉特征,包括高度、宽度、形状、圆度、下颌的位置、面部肌肉运动;
(5)采用隐马尔可夫模型作为训练识别算法,将提取出的音频特征参数与预存在标准发音的特征参数模板库里对应的特征参数进行比较分类,通过分析声音的频率、音调、音高、音长等语音特征,判断学习者的发音是否正确;
(6)如果判断学习者的发音与标准发音差异较大,则通过将其音频特征及有关口型的视觉特征与常见错误发音的特征参数模板库对比,判断属于哪一类常见错误,用图像、动画、视频内容给出学习者的错误发音方式与标准发音方式的对比。
其中,对非静音帧采用MFCC倒谱系数法进行音频特征提取。
与现有技术相比,本发明的有益效果是:
1.以图片、视频这些可视化的手段进行教学,使学习者在学习时更有兴趣,注意力更加集中;
2.自动对在学习者发音时采集到的声音和视频内容进行分析,找出发音不规范的原因,给出对应的范例视频来纠正发音;
3.学习过程基本为自学,教学人员只需要事后观看学习时的录像来掌握学习进度;
4.教学人员可同时对多名学习人员进行监督;
5.教学内容可通过网络更新。
具体实施方式
下面结合实施例对本发明进行说明。本发明采用的装置由显示屏、麦克风、摄像头、计算机或其它具备计算能力的设备和专门设计的教学软件组成,教学软件分为视频或图片播放、声音与图像采集、声音与图像的分析比较共3个模块。本装置的工作过程为:1、播放标准的发音教学内容,如展示音标与口型、声带运动的对应关系的图片或视频;2、通过麦克风和摄像头采集学习者发音时的声音与视频;3、通过对声音和视频的分析,将学习者的发音与口型同标准的发音与口型进行比较,分析两者的差异及其原因,例如口型、舌头位置、声带运动等;4、以图示的方式展示学习者的错误并有针对性地播放纠正这些错误的图片或视频;5、在学习者的发音比较接近标准发音时给予肯定提示并进入下一段内容的学习。
本装置的硬件部分可以是外接麦克风和摄像头的计算机,或者是平板电脑、智能手机,或者是带有显示屏、麦克风、摄像头的嵌入式计算机系统。最佳实施方式为硬件采用平板电脑,软件为按上一段所述技术方案设计的教学软件。该软件支持运行Linux、Mac OS、WindowsXP、Windows7操作系统的计算机,或者是运行Android、iOS、移动版Windows操作系统的平板电脑以及智能手机。
本装置的软件部分采用声音、视频双模式识别系统,此系统包含一个音频分析子系统、一个视频分析子系统、一个发音识别子系统,以及一个标准发音的特征参数模板库和一个常见错误发音的特征参数模板库。视频分析子系统对从摄像头获取的学习者发音时的视频内容进行分析,提取嘴的高度、宽度、形状、圆度、下颌的位置、面部肌肉运动等有关口型的视觉特征;同时,音频分析子系统对从麦克风获取的学习者发音时的音频内容进行频谱分析,提取频率、音调、音高、音长等语音特征。然后,发音识别子系统将视频分析和音频分析两个子系统获取的特征参数与两个模板库中对应内容的特征参数进行比较分类(即对学习者的发音与口型和标准库、常见错误库的发音与口型进行比较分类),从而判断学习者的发音是否正确,或是属于哪一类常见错误,并用图像、动画、视频内容给出学习者的错误发音方式与标准发音方式的对比,帮助学习者纠正发音。
主要完成的工作如下:
一.视、音频特征检测与提取。
利用麦克风和摄像头采集学习者音、视频信息,对采集到的纯音频信息进行预处理,预处理过程包括预滤波、采样和量化、分帧、加窗、预加重、端点检测等。经过预处理的语音数据就可以进行特征参数提取;对采集到的纯视频信息引入旋转哈尔特征在积分图像中的应用,在基于Adaboost推进学习算法的基础上,通过使用单值分类作为基础特征分类器,并且以级联的方式合并强分类器,划分检测区域并用于嘴部定位,提取嘴的高度、宽度、形状、圆度、下颌的位置、面部肌肉运动等有关口型的视觉特征。
二.视、音频特征融和与识别。
在发音识别子系统中,采用隐马尔可夫模型(HMM)作为训练识别算法,将提取出的音频的特征参数与两个模板库中对应内容的特征参数进行比较分类,通过分析声音的频率、音调、音高、音长等语音特征判断学习者的发音是否正确,并结合分析学习者的嘴的高度、宽度、形状、圆度、下颌的位置、面部肌肉运动等口型特征,判断属于哪一类常见错误,用图像、动画、视频内容给出学习者的错误发音方式与标准发音方式的对比,帮助学习者纠正发音。
本发明进行教学的具体步骤如下:
(1)通过麦克风和摄像头获取学习者在练习发音时的音频和视频数据(即语音和图像信息)以及音、视频内容的时间同步信息。
(2)对获得的音频数据进行预处理,做离散傅里叶变换,根据频域能量标记出静音帧与非静音帧,对非静音帧采用MFCC倒谱系数(Mel Frequency Cepstmm Coefficient)进行音频特征提取。
(3)对获得的视频数据采用基于旋转哈尔特征推进级联分类器的快速人脸嘴部检测方法,检测、跟踪视频流中说话人的嘴部运动,提取嘴的高度、宽度、形状、圆度、下颌的位置、面部肌肉运动等有关口型的视觉特征。
(4)采用隐马尔可夫模型(HMM)作为训练识别算法,将提取出的音频的特征参数与标准模板库中对应内容的特征参数进行比较分类。通过分析声音的频率、音调、音高、音长等语音特征,判断学习者的发音是否正确。
(5)如果学习者的发音与标准发音差异较大,则通过将其音频特征及口型特征与标准库、常见错误库的对比,判断属于哪一类常见错误,用图像、动画、视频内容给出学习者的错误发音方式与标准发音方式的对比,帮助学习者纠正发音。

Claims (2)

1.一种聋人学习说话的电子教学方法,在进行教学之前,已经在教学装置里预存有教学内容,与教学内容相关的标准发音的特征参数模板库和常见错误发音的特征参数模板库,在进行电子教学的时候,采用如下的步骤:
(1)播放教学内容;
(2)通过麦克风和摄像头获取学习者在练习发音时的音频和视频数据以及音频、视频内容的时间同步信息;
(3)对获得的音频数据进行预处理,做离散傅里叶变换,根据频域能量标记出静音帧与非静音帧,对非静音帧提取音频特征参数;
(4)对获得的视频数据采用基于哈尔特征推进级联分类器的快速人脸嘴部检测方法,检测、跟踪视频流中说话人的嘴部运动,提取嘴的有关口型的视觉特征,包括高度、宽度、形状、圆度、下颌的位置、面部肌肉运动;
(5)采用隐马尔可夫模型作为训练识别算法,将提取出的音频特征参数与预存在标准发音的特征参数模板库里对应的特征参数进行比较分类,通过分析声音的频率、音调、音高、音长等语音特征,判断学习者的发音是否正确;
(6)如果判断学习者的发音与标准发音差异较大,则通过将其音频特征及有关口型的视觉特征与常见错误发音的特征参数模板库对比,判断属于哪一类常见错误,用图像、动画、视频内容给出学习者的错误发音方式与标准发音方式的对比。
2.根据权利要求1所述的聋人学习说话的电子教学方法,其特征在于,对非静音帧采用MFCC倒谱系数法进行音频特征提取。
CN2012100583720A 2012-03-07 2012-03-07 一种聋人学习说话的电子教学方法 Pending CN102663928A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100583720A CN102663928A (zh) 2012-03-07 2012-03-07 一种聋人学习说话的电子教学方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100583720A CN102663928A (zh) 2012-03-07 2012-03-07 一种聋人学习说话的电子教学方法

Publications (1)

Publication Number Publication Date
CN102663928A true CN102663928A (zh) 2012-09-12

Family

ID=46773400

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100583720A Pending CN102663928A (zh) 2012-03-07 2012-03-07 一种聋人学习说话的电子教学方法

Country Status (1)

Country Link
CN (1) CN102663928A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102920432A (zh) * 2012-10-16 2013-02-13 上海市闸北区民办小小虎幼稚园 基于音位矩阵对比技术的言语听觉康复系统及其康复方法
WO2014089732A1 (en) * 2012-12-10 2014-06-19 Intel Corporation Method, apparatus and system of video and audio sharing among communication devices
CN104157181A (zh) * 2014-07-22 2014-11-19 雷青云 一种语言教学方法和系统
CN104200716A (zh) * 2014-09-25 2014-12-10 吴若鹏 钢琴和钢琴互动练习装置
CN104821114A (zh) * 2015-05-04 2015-08-05 渤海大学 一种适用于听力障碍学生的钢琴教学辅助装置
CN105761559A (zh) * 2016-04-29 2016-07-13 东北电力大学 一种基于先入为主的反向共鸣的外语学习方法
CN106157750A (zh) * 2016-08-24 2016-11-23 深圳市铁格龙科技有限公司 一种智能聋哑人发音及交流学习眼镜
CN106228996A (zh) * 2016-07-15 2016-12-14 黄河科技学院 声乐学习电子辅助发音系统
CN107424450A (zh) * 2017-08-07 2017-12-01 英华达(南京)科技有限公司 发音纠正系统和方法
CN108091215A (zh) * 2018-01-09 2018-05-29 绥化学院 一种基于多媒体的听障学生用的教学器具
CN108537702A (zh) * 2018-04-09 2018-09-14 深圳市鹰硕技术有限公司 外语教学评价信息生成方法以及装置
WO2019034184A1 (zh) * 2017-08-17 2019-02-21 厦门快商通科技股份有限公司 融合声学特征和发音运动特征的发音评估方法和系统
WO2019034183A1 (zh) * 2017-08-17 2019-02-21 厦门快商通科技股份有限公司 一种发音探测方法及装置、语音范畴学习方法及系统
CN111369866A (zh) * 2020-03-04 2020-07-03 南京市中西医结合医院 一种语音治疗控制系统
CN112906650A (zh) * 2021-03-24 2021-06-04 百度在线网络技术(北京)有限公司 教学视频的智能处理方法、装置、设备和存储介质
CN113779301A (zh) * 2021-08-18 2021-12-10 北京艺旗网络科技有限公司 一种音乐教学方法及装置
CN113792829A (zh) * 2021-07-29 2021-12-14 湖南五凌电力科技有限公司 水轮机巡检方法、装置、计算机设备及存储介质
US11361677B1 (en) 2021-11-10 2022-06-14 King Abdulaziz University System for articulation training for hearing impaired persons

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1787035A (zh) * 2005-11-04 2006-06-14 黄中伟 聋哑人汉语发音计算机辅助学习方法
CN102063903A (zh) * 2010-09-25 2011-05-18 中国科学院深圳先进技术研究院 言语交互训练系统及方法
CN102169642A (zh) * 2011-04-06 2011-08-31 李一波 具有智能纠错功能的交互式虚拟教师系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1787035A (zh) * 2005-11-04 2006-06-14 黄中伟 聋哑人汉语发音计算机辅助学习方法
CN102063903A (zh) * 2010-09-25 2011-05-18 中国科学院深圳先进技术研究院 言语交互训练系统及方法
CN102169642A (zh) * 2011-04-06 2011-08-31 李一波 具有智能纠错功能的交互式虚拟教师系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘华东等: "面向聋儿的计算机言语训练方法及其实现", 《北京大学学报(自然科学版)》 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102920432A (zh) * 2012-10-16 2013-02-13 上海市闸北区民办小小虎幼稚园 基于音位矩阵对比技术的言语听觉康复系统及其康复方法
CN102920432B (zh) * 2012-10-16 2015-01-07 上海泰亿格康复服务有限公司 基于音位矩阵对比技术的言语听觉康复系统
CN104756502A (zh) * 2012-12-10 2015-07-01 英特尔公司 通信设备之间的视频和音频共享的方法、设备和系统
US10798142B2 (en) 2012-12-10 2020-10-06 Intel Corporation Method, apparatus and system of video and audio sharing among communication devices
WO2014089732A1 (en) * 2012-12-10 2014-06-19 Intel Corporation Method, apparatus and system of video and audio sharing among communication devices
CN104157181A (zh) * 2014-07-22 2014-11-19 雷青云 一种语言教学方法和系统
CN104200716A (zh) * 2014-09-25 2014-12-10 吴若鹏 钢琴和钢琴互动练习装置
CN104200716B (zh) * 2014-09-25 2018-04-13 吴若鹏 钢琴和钢琴互动练习装置
CN104821114A (zh) * 2015-05-04 2015-08-05 渤海大学 一种适用于听力障碍学生的钢琴教学辅助装置
CN104821114B (zh) * 2015-05-04 2020-05-01 渤海大学 一种适用于听力障碍学生的钢琴教学辅助装置
CN105761559A (zh) * 2016-04-29 2016-07-13 东北电力大学 一种基于先入为主的反向共鸣的外语学习方法
CN106228996A (zh) * 2016-07-15 2016-12-14 黄河科技学院 声乐学习电子辅助发音系统
CN106228996B (zh) * 2016-07-15 2019-08-02 黄河科技学院 声乐学习电子辅助发音系统
CN106157750A (zh) * 2016-08-24 2016-11-23 深圳市铁格龙科技有限公司 一种智能聋哑人发音及交流学习眼镜
CN107424450A (zh) * 2017-08-07 2017-12-01 英华达(南京)科技有限公司 发音纠正系统和方法
US11786171B2 (en) 2017-08-17 2023-10-17 Xiamen Kuaishangtong Tech. Corp., Ltd. Method and system for articulation evaluation by fusing acoustic features and articulatory movement features
WO2019034184A1 (zh) * 2017-08-17 2019-02-21 厦门快商通科技股份有限公司 融合声学特征和发音运动特征的发音评估方法和系统
WO2019034183A1 (zh) * 2017-08-17 2019-02-21 厦门快商通科技股份有限公司 一种发音探测方法及装置、语音范畴学习方法及系统
CN108091215A (zh) * 2018-01-09 2018-05-29 绥化学院 一种基于多媒体的听障学生用的教学器具
CN108537702A (zh) * 2018-04-09 2018-09-14 深圳市鹰硕技术有限公司 外语教学评价信息生成方法以及装置
CN111369866A (zh) * 2020-03-04 2020-07-03 南京市中西医结合医院 一种语音治疗控制系统
CN112906650A (zh) * 2021-03-24 2021-06-04 百度在线网络技术(北京)有限公司 教学视频的智能处理方法、装置、设备和存储介质
CN112906650B (zh) * 2021-03-24 2023-08-15 百度在线网络技术(北京)有限公司 教学视频的智能处理方法、装置、设备和存储介质
CN113792829A (zh) * 2021-07-29 2021-12-14 湖南五凌电力科技有限公司 水轮机巡检方法、装置、计算机设备及存储介质
CN113779301A (zh) * 2021-08-18 2021-12-10 北京艺旗网络科技有限公司 一种音乐教学方法及装置
US11361677B1 (en) 2021-11-10 2022-06-14 King Abdulaziz University System for articulation training for hearing impaired persons

Similar Documents

Publication Publication Date Title
CN102663928A (zh) 一种聋人学习说话的电子教学方法
CN106409030A (zh) 一种个性化外语口语学习系统
CN107203953B (zh) 一种基于互联网、表情识别和语音识别的教学系统及其实现方法
CN100397438C (zh) 聋哑人汉语发音计算机辅助学习方法
CN104537925B (zh) 语障儿童语言训练辅助系统及方法
US7299188B2 (en) Method and apparatus for providing an interactive language tutor
CN102063903B (zh) 言语交互训练系统及方法
CN101197084A (zh) 自动化英语口语评测学习系统
CN105551328A (zh) 基于移动交互和大数据分析的语言教学辅研同步集成系统
CN101751809B (zh) 基于三维头像的聋儿语言康复方法及系统
CN107945625A (zh) 一种英语发音测试与评价系统
CN104537926B (zh) 听障儿童语言训练辅助系统及方法
Nickerson et al. Teaching speech to the deaf: Can a computer help
US20070003913A1 (en) Educational verbo-visualizer interface system
CN109598991B (zh) 一种英语发音教学系统、装置及方法
CN110930781B (zh) 录播系统
CN110427977B (zh) 一种课堂互动行为的检测方法
CN108320625A (zh) 面向言语康复的震动反馈系统及装置
CN113658584A (zh) 智能化发音矫正方法及系统
CN109448463A (zh) 基于虚拟现实技术的外语发音自主学习训练系统及其方法
CN109545196B (zh) 语音识别方法、装置及计算机可读存储介质
CN101958060A (zh) 英语拼读速成技术工具
CN110413130B (zh) 基于动作捕捉的虚拟现实手语学习、测试和评价方法
Zhao et al. Pronunciation of rehabilitation methods based on 3d-talking head
CN110808066A (zh) 教学环境安全分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120912