CN101739852B - 基于语音识别的实现自动口译训练的方法和装置 - Google Patents
基于语音识别的实现自动口译训练的方法和装置 Download PDFInfo
- Publication number
- CN101739852B CN101739852B CN2008101721736A CN200810172173A CN101739852B CN 101739852 B CN101739852 B CN 101739852B CN 2008101721736 A CN2008101721736 A CN 2008101721736A CN 200810172173 A CN200810172173 A CN 200810172173A CN 101739852 B CN101739852 B CN 101739852B
- Authority
- CN
- China
- Prior art keywords
- training
- module
- speech recognition
- content
- interpretation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
一种基于语音识别的实现自动口译训练的方法和装置,将口译训练分解成可处理的专项技能训练方法,包括:用户设置训练参数,选训练形式,激活内容生成模块;确定训练形式,进入训练起始状态;自动生成所需的训练内容和预期应答内容;编译当前对话阶段预期应答内容的语音识别规则,播放训练内容,启动语音识别模块;激活语音识别模块进行语音识别并保存语音识别的结果;语言处理模块把语音识别的结果与取得的预期应答内容进行比对,作出评估反馈;将信息发送至信息数据库保存。使各种水平的学习者可以进行自主口译训练。其次利用自行研发的词句模糊比对技术比对预期的口译内容和实际识别的内容,使反馈结果有一定的灵活性,比较能被学习者接受。
Description
技术领域
本发明涉及一种在外语教学中的自动口译训练的方法和装置,特别涉及一种基于语音识别的实现自动口译训练的方法和装置。
背景技术
市场上有各种基于语言试验室设备的口译训练系统,其机制是提供源语录音和录制训练对象的口译内容,训练对象的口译录音提供给教师进行分析和讲评,系统无法自动进行分析。训练方法基本上是整体性的,没有细分为各种专项技能训练的训练方法。
语音识别技术已经在外语口语教学软件中有许多应用,主要集中在应答内容固定的练习形式中使用,基本上是一种朗读指定内容的形式。因为学界和业界通常认为口译训练是高级的语言技能训练,现有语音识别和语言分析技术不能胜任此类训练,目前没有把语音识别技术用于口译训练的方法和训练装置。
随着语音识别系统的识别准确率和识别速度的提高以及在特定环境下对硬件条件的要求越来越低,将基于微小芯片的语音识别技术嵌入消费类电子产品中越来越成为现实。随着消费类电子产品性能变得越来越混杂功能越来越强劲,语音识别科技使消费者可以更方便、更直观地使用这些产品。并且,在使用这些产品的时候不会伴随着一系列的按键和提示音,而是实现消费者和产品间的直接对话。
目前通用的口译训练方法如交替翻译,记忆训练、影子跟读、同声翻译的训练方法只适用于双语水平达到较高水平的训练对象和训练教师,完全依赖人指导的训练活动。目前的人工智能技术尚无法取代人进行目前通用的口译训练活动。
发明内容
本发明的目的在于提供一种基于语音识别的实现自动口译训练的方法和装置,并把现有人工智能技术与这种训练方法结合,实现自动口译训练的装置,满足双语水平不等的人们自主进行口译训练的需求。
本发明是采用以下技术手段实现的:
一种基于语音识别的实现自动口译训练的方法,将口译训练分解成可处理的专项技能训练方法,包括以下步骤:
用户设置训练参数,开始所选训练形式,激活内容生成模块;
口译训练控制模块确定训练形式,进入训练起始状态;
自动生成所需的训练内容和预期应答内容;
编译当前对话阶段预期应答内容的语音识别规则,为识别用户的语音做好准备;
播放训练内容,并根据训练形式启动语音识别模块;
激活语音识别模块进行语音识别并保存语音识别的结果;
语言处理模块把语音识别的结果与取得的预期应答内容进行比对,根据评估体系作出评估反馈;
将训练数据和查询模块训练记录发送至信息数据库保存。
前述用户设置训练参数包括;训练练习的内容、难度、速度、停顿时间;
所述训练形式包括;分解的专项训练方法、交替翻译、影子跟读、同声翻译、记忆训练。
前述的自动生成所需的训练内容和预期应答内容包括:机器播放的内容、预期用户应答内容、预期应答内容的语音识别规则。
前述的播放训练内容,并根据训练形式启动语音识别模块,对交替翻译或记忆训练采用先播放后启动语音识别,而对影子跟读和同声翻译训练同时启动语音识别模块。
前述的训练内容、难度、速度、停顿时间为模糊比对程序的基准设定值。
一种基于语音识别实现自动口译的训练装置,包括计算机,耳机、麦克风、还设有训练活动控制模块、训练内容生成模块、语音合成模块、语音识别模块、口译训练控制模块和评估模块以及信息数据库;
所述的训练活动控制模块与训练内容生成模块、语音合成模块、语音识别模块、语言处理模块进行数据连接;
所述训练内容生成模块,用于自动生成训练内容,并与语音合成模块数据连接;
所述语音合成模块,用于播放训练内容;
所述语音识别模块,用于监听用户的话语,并把语音识别的结果传送给口译训练控制模块和评估模块;
所述口译训练控制模块和评估模块,按照不同训练形式接收语音识别的结果并将其与预期答案进行比较,给出比较结果;
所述评估模块,根据训练内容的难易程度按照不同权重计算并显示得分,对比显示用户应答内容和答案;
所述的语言处理模块与训练数据保存和查询模块连接;所述训练数据保存和查询模块与信息数据库连接;
所述信息数据库保存和查询模块存储各种训练信息,并提供查询。
前述的语音识别模块设有冗余提高语音识别区分度。
前述的语言处理模块设有将语音识别的结果信息与取得的预期应答内容信息进行比对的比较程序。
前述的比较程序包括加权评分标准程序及模糊比对程序。
本发明与现有技术相比,具有以下明显的优势和有益效果:
本发明首先采用分离专项技能的思想使口译训练实现了自动化,使各种水平的学习者可以进行自主口译训练。其次利用自行研发的词句模糊比对技术比对预期的口译内容和实际识别的内容,使反馈结果有一定的灵活性,比较能被学习者接受。
附图说明
图1为本发明实现自动口译训练的方法的流程示意图;
图2为本发明实现自动口译训练的装置示意图。
具体实施方式
下面结合附图对本发明的具体实施例加以说明:
本发明的主要发明思路在于:
1)训练内容用程序自动生成,内容的难度可控,可以确保训练者不受语言材料难度的影响,实现不同水平的学习者都能进行相应的口译专项技能的训练;
2)把整体式口译训练方法细分为记忆训练、交替翻译、影子跟读、同声翻译及其他相关技能的单项训练方法,在口译训练的基础阶段以离散式训练方法为主要训练手段,在高级阶段才逐步采用具有实习性质的整体式训练方法。
3)在分离出相对简单的专项训练方法的基础上,使现有语音识别和自然语言处理技术可以用于口译训练结果的自动分析和处理。
请参阅图1所示,为本发明实现自动口译训练的方法的流程示意图。从图中可以看出,
10为学习者根据自己的能力设置训练内容的难度参数,并选择某种专项训练方法;
20为学习者启动训练活动,训练活动控制模块调用训练内容生成模块;
30为训练内容生成模块根据学习者设定的参数自动生成训练内容和正确答案;
40为编译预期应答内容的语音识别规则,为识别学习者的语音做好准备;
50为训练活动控制模块启动语音合成模块生成并播放训练内容,根据所选专项训练方法按照相应模式启动语音识别模块;
60为学习者的话语激活语音识别模块,进行语音识别并传递语音识别的结果到训练活动控制模块;
70为训练活动控制模块调用语言处理模块,语言处理模块把语音识别的结果与取得的预期应答内容进行比对,产生并展示反馈信息;
80为70的数据信息反馈到信息数据库;
90为训练结束时学习者激活训练记录保存模块保存训练记录,训练记录查询模块可以向学习者或者教师提供训练记录详情,供人工分析之用。
请参阅图2所示,为本发明实现自动口译训练的装置示意图。
结合图1所示,图2的装置与图1的每一步骤相对应,例如:100为训练参数设置模块,300为内容生成模块,200为训练活动控制模块,400为播放模块,500为语音识别模块,700为语音处理模块,800为信息数据库,900为训练数据保存和查询模块。其中,训练活动控制模块200,控制内容生成模块300、播放模块400、语音识别模块500和语音处理模块700的运行。
以下举例说明数字口译训练过程:
学习者在用户界面上设定以下训练参数:
设置为3位数到6位数的整数,不设小数部分,系统将生成如234,000的数字,3位数以下为0。
每组生成3个数字。
每隔2秒钟播放一个数字。
播放语速为中速。
翻译为英译汉。
学习者启动交替翻译训练过程,系统按照上述设定随机生成3个规定难度的数字,编译这3个数字预期的汉语语音识别规则和正确答案。
训练控制模块按照交替翻译的要求以每2秒播放一个数字的间隔用语音合成方式播放全部3个数字。
训练控制模块随后启动汉语语音识别模块,按照预期的汉语语音识别规则监听学习者的话音,并要求学习者把3个数字逐个翻译成汉语。
语音识别模块识别出学习者的各个数字的汉语翻译结果,其中有些可能是沉默或者不完整的翻译结果,如234,000翻译成二十三万。语音识别模块把这些结果传送给语言处理模块。
语言处理模块把学习者对各个数字的翻译结果与正确答案进行模糊比对,根据加权评分标准评分,显示识别的翻译结果、正确答案以及评分,完成一组数字训练。
学习者可以重复步骤1.1至步骤1.5,进行多组同一种难度的口译训练。或者从步骤一开始,更改训练难度,进行多组不同难度的训练。
训练结束时学习者可以要求系统保存所有训练记录,系统把所有记录上传到指定网站。学习者或者教师可以访问网站查询训练记录。
最后应说明的是:以上实施例仅用以说明本发明而并非限制本发明所描述的技术方案;因此,尽管本说明书参照上述的各个实施例对本发明已进行了详细的说明,但是,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。
Claims (8)
1.一种基于语音识别的实现自动口译训练的方法,将口译训练分解成可处理的专项技能训练方法,其特征在于:包括以下步骤:
1.1、用户设置训练参数,开始所选训练形式,激活内容生成模块;
1.2、口译训练控制模块确定训练形式,进入训练起始状态;
1.3、自动生成所需的训练内容和预期应答内容;
1.4、编译当前对话阶段预期应答内容的语音识别规则,为识别用户的语音做好准备;
1.5、播放训练内容,并根据训练形式启动语音识别模块;
1.6、激活语音识别模块进行语音识别并保存语音识别的结果;
1.7、语言处理模块把语音识别的结果与取得的预期应答内容进行比对,根据评估体系作出评估反馈;
1.8、将训练数据和查询模块训练记录发送至信息数据库保存。
2.根据权利要求1所述的基于语音识别实现自动口译训练的方法,其特征在于所述步骤1.1包括:训练练习的内容、难度、速度、停顿时间;
所述训练形式包括:交替翻译、影子跟读、同声翻译、记忆训练。
3.根据权利要求1所述的基于语音识别实现自动口译训练的方法,其特征在于所述步骤1.3包括:机器播放的内容、预期用户应答内容、预期应答内容的语音识别规则。
4.根据权利要求1所述的基于语音识别实现自动口译训练的方法,其特征在于:所述步骤1.5对交替翻译或记忆训练采用先播放后启动语音识别,而对影子跟读和同声翻译训练同时启动语音识别模块。
5.一种基于语音识别实现自动口译的训练装置,包括计算机、耳机、麦克风;其特征在于:还设有训练活动控制模块、训练内容生成模块、语音合成模块、语音识别模块、口译训练控制模块和评估模块以及信息数据库;
所述的训练活动控制模块与训练内容生成模块、语音合成模块、语音识别模块、语言处理模块进行数据连接;所述训练内容生成模块,用于自动生成训练内容,并与语音合成模块数据连接;
所述语音合成模块,用于播放训练内容;
所述语音识别模块,用于监听用户的话语,并把语音识别的结果传送给口译训练控制模块和评估模块;
所述口译训练控制模块和评估模块,按照不同训练形式接收语音识别的结果并将其与预期答案进行比较,给出比较结果;
所述评估模块,根据训练内容的难易程度按照不同权重计算并显示得分,对比显示用户应答内容和答案;
所述的语言处理模块与训练数据保存和查询模块连接;所述训练数据保存和查询模块与信息数据库连接;
信息数据库保存和查询模块存储各种训练信息,并提供查询。
6.根据权利要求5所述的基于语音识别实现自动口译的训练装置,其特征在于:语音识别模块设有冗余提高语音识别区分度。
7.根据权利要求5所述的基于语音识别实现自动口译的训练装置,其特征在于:语言处理模块设有将语音识别的结果信息与取得的预期应答内容信息进行比对的比较程序。
8.根据权利要求7所述的基于语音识别实现自动口译的训练装置,其特征在于:所述的比较程序包括加权评分标准程序及模糊比对程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101721736A CN101739852B (zh) | 2008-11-13 | 2008-11-13 | 基于语音识别的实现自动口译训练的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101721736A CN101739852B (zh) | 2008-11-13 | 2008-11-13 | 基于语音识别的实现自动口译训练的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101739852A CN101739852A (zh) | 2010-06-16 |
CN101739852B true CN101739852B (zh) | 2011-11-09 |
Family
ID=42463277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008101721736A Expired - Fee Related CN101739852B (zh) | 2008-11-13 | 2008-11-13 | 基于语音识别的实现自动口译训练的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101739852B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9293129B2 (en) * | 2013-03-05 | 2016-03-22 | Microsoft Technology Licensing, Llc | Speech recognition assisted evaluation on text-to-speech pronunciation issue detection |
US9606985B2 (en) * | 2014-06-13 | 2017-03-28 | Nuance Communications, Inc. | Structured natural language representations |
CN106251717A (zh) * | 2016-09-21 | 2016-12-21 | 北京光年无限科技有限公司 | 智能机器人语言跟读学习方法和装置 |
CN108648524A (zh) * | 2018-05-02 | 2018-10-12 | 周志娟 | 一种英语单词学习装置及方法 |
CN113781272A (zh) * | 2021-08-13 | 2021-12-10 | 洪恩完美(北京)教育科技发展有限公司 | 阅读训练方法、装置、设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5511980A (en) * | 1994-02-23 | 1996-04-30 | Leapfrog Rbt, L.L.C. | Talking phonics interactive learning device |
CN1387172A (zh) * | 2001-05-17 | 2002-12-25 | 魏强 | 直译意译对照排版电话语音朗读外语学习方法 |
CN1629899A (zh) * | 2003-12-19 | 2005-06-22 | 王明山 | 借助软硬件辅助语言学习的方法 |
CN1808518A (zh) * | 2005-01-20 | 2006-07-26 | 英业达股份有限公司 | 名著辅助语言学习系统及其方法 |
CN101304457A (zh) * | 2007-05-10 | 2008-11-12 | 许罗迈 | 一种基于语音电话实现自动口语训练的方法与装置 |
-
2008
- 2008-11-13 CN CN2008101721736A patent/CN101739852B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5511980A (en) * | 1994-02-23 | 1996-04-30 | Leapfrog Rbt, L.L.C. | Talking phonics interactive learning device |
CN1191557C (zh) * | 1994-02-23 | 2005-03-02 | 跳蛙企业股份有限公司 | 话音交互式学习机 |
CN1387172A (zh) * | 2001-05-17 | 2002-12-25 | 魏强 | 直译意译对照排版电话语音朗读外语学习方法 |
CN1629899A (zh) * | 2003-12-19 | 2005-06-22 | 王明山 | 借助软硬件辅助语言学习的方法 |
CN1808518A (zh) * | 2005-01-20 | 2006-07-26 | 英业达股份有限公司 | 名著辅助语言学习系统及其方法 |
CN101304457A (zh) * | 2007-05-10 | 2008-11-12 | 许罗迈 | 一种基于语音电话实现自动口语训练的方法与装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101739852A (zh) | 2010-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Agarwal et al. | A review of tools and techniques for computer aided pronunciation training (CAPT) in English | |
CN105792752B (zh) | 用于诊断和治疗语言相关障碍的计算技术 | |
US5717828A (en) | Speech recognition apparatus and method for learning | |
US6134529A (en) | Speech recognition apparatus and method for learning | |
CN109074345A (zh) | 通过数字媒体内容提取自动生成和呈现课程 | |
US20050255431A1 (en) | Interactive language learning system and method | |
JP2012215645A (ja) | コンピュータを利用した外国語会話練習システム | |
KR20010013236A (ko) | 읽기 및 발음 교습기 | |
Michael | Automated Speech Recognition in language learning: Potential models, benefits and impact | |
KR20160008949A (ko) | 음성 대화 기반의 외국어 학습 방법 및 이를 위한 장치 | |
CN111833853A (zh) | 语音处理方法及装置、电子设备、计算机可读存储介质 | |
McCrocklin | Learners’ feedback regarding ASR-based dictation practice for pronunciation learning | |
CN101739852B (zh) | 基于语音识别的实现自动口译训练的方法和装置 | |
CN110598208A (zh) | Ai/ml增强发音课程设计和个性化练习计划方法 | |
KR20190080314A (ko) | 분절 인터넷 강의 제공 방법 및 장치 | |
CN117541445A (zh) | 一种虚拟环境交互的口才训练方法、系统、设备及介质 | |
Hoque et al. | Robust recognition of emotion from speech | |
KR20220011109A (ko) | 디지털 영어 학습 서비스 방법 및 시스템 | |
JP6656529B2 (ja) | 外国語の会話訓練システム | |
CN111326030A (zh) | 一种集读听写识字学习系统、装置及方法 | |
Kantor et al. | Reading companion: The technical and social design of an automated reading tutor | |
CN114255759A (zh) | 用机器实施的口语训练方法、设备及可读存储介质 | |
Leppik et al. | Estoñol, a computer-assisted pronunciation training tool for Spanish L1 speakers to improve the pronunciation and perception of Estonian vowels | |
JP2015060056A (ja) | 教育装置並びに教育装置用ic及び媒体 | |
Hjalmarsson | Evaluating AdApt, a multi-modal conversational dialogue system using PARADISE |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111109 Termination date: 20121113 |