CN101739852B

CN101739852B - 基于语音识别的实现自动口译训练的方法和装置

Info

Publication number: CN101739852B
Application number: CN2008101721736A
Authority: CN
Inventors: 许罗迈
Original assignee: Individual
Current assignee: Individual
Priority date: 2008-11-13
Filing date: 2008-11-13
Publication date: 2011-11-09
Anticipated expiration: 2028-11-13
Also published as: CN101739852A

Abstract

一种基于语音识别的实现自动口译训练的方法和装置，将口译训练分解成可处理的专项技能训练方法，包括：用户设置训练参数，选训练形式，激活内容生成模块；确定训练形式，进入训练起始状态；自动生成所需的训练内容和预期应答内容；编译当前对话阶段预期应答内容的语音识别规则，播放训练内容，启动语音识别模块；激活语音识别模块进行语音识别并保存语音识别的结果；语言处理模块把语音识别的结果与取得的预期应答内容进行比对，作出评估反馈；将信息发送至信息数据库保存。使各种水平的学习者可以进行自主口译训练。其次利用自行研发的词句模糊比对技术比对预期的口译内容和实际识别的内容，使反馈结果有一定的灵活性，比较能被学习者接受。

Description

基于语音识别的实现自动口译训练的方法和装置

技术领域

本发明涉及一种在外语教学中的自动口译训练的方法和装置，特别涉及一种基于语音识别的实现自动口译训练的方法和装置。

背景技术

市场上有各种基于语言试验室设备的口译训练系统，其机制是提供源语录音和录制训练对象的口译内容，训练对象的口译录音提供给教师进行分析和讲评，系统无法自动进行分析。训练方法基本上是整体性的，没有细分为各种专项技能训练的训练方法。

语音识别技术已经在外语口语教学软件中有许多应用，主要集中在应答内容固定的练习形式中使用，基本上是一种朗读指定内容的形式。因为学界和业界通常认为口译训练是高级的语言技能训练，现有语音识别和语言分析技术不能胜任此类训练，目前没有把语音识别技术用于口译训练的方法和训练装置。

随着语音识别系统的识别准确率和识别速度的提高以及在特定环境下对硬件条件的要求越来越低，将基于微小芯片的语音识别技术嵌入消费类电子产品中越来越成为现实。随着消费类电子产品性能变得越来越混杂功能越来越强劲，语音识别科技使消费者可以更方便、更直观地使用这些产品。并且，在使用这些产品的时候不会伴随着一系列的按键和提示音，而是实现消费者和产品间的直接对话。

目前通用的口译训练方法如交替翻译，记忆训练、影子跟读、同声翻译的训练方法只适用于双语水平达到较高水平的训练对象和训练教师，完全依赖人指导的训练活动。目前的人工智能技术尚无法取代人进行目前通用的口译训练活动。

发明内容

本发明的目的在于提供一种基于语音识别的实现自动口译训练的方法和装置，并把现有人工智能技术与这种训练方法结合，实现自动口译训练的装置，满足双语水平不等的人们自主进行口译训练的需求。

本发明是采用以下技术手段实现的：

一种基于语音识别的实现自动口译训练的方法，将口译训练分解成可处理的专项技能训练方法，包括以下步骤：

用户设置训练参数，开始所选训练形式，激活内容生成模块；

口译训练控制模块确定训练形式，进入训练起始状态；

自动生成所需的训练内容和预期应答内容；

编译当前对话阶段预期应答内容的语音识别规则，为识别用户的语音做好准备；

播放训练内容，并根据训练形式启动语音识别模块；

激活语音识别模块进行语音识别并保存语音识别的结果；

语言处理模块把语音识别的结果与取得的预期应答内容进行比对，根据评估体系作出评估反馈；

将训练数据和查询模块训练记录发送至信息数据库保存。

前述用户设置训练参数包括；训练练习的内容、难度、速度、停顿时间；

所述训练形式包括；分解的专项训练方法、交替翻译、影子跟读、同声翻译、记忆训练。

前述的自动生成所需的训练内容和预期应答内容包括：机器播放的内容、预期用户应答内容、预期应答内容的语音识别规则。

前述的播放训练内容，并根据训练形式启动语音识别模块，对交替翻译或记忆训练采用先播放后启动语音识别，而对影子跟读和同声翻译训练同时启动语音识别模块。

前述的训练内容、难度、速度、停顿时间为模糊比对程序的基准设定值。

一种基于语音识别实现自动口译的训练装置，包括计算机，耳机、麦克风、还设有训练活动控制模块、训练内容生成模块、语音合成模块、语音识别模块、口译训练控制模块和评估模块以及信息数据库；

所述的训练活动控制模块与训练内容生成模块、语音合成模块、语音识别模块、语言处理模块进行数据连接；

所述训练内容生成模块，用于自动生成训练内容，并与语音合成模块数据连接；

所述语音合成模块，用于播放训练内容；

所述语音识别模块，用于监听用户的话语，并把语音识别的结果传送给口译训练控制模块和评估模块；

所述口译训练控制模块和评估模块，按照不同训练形式接收语音识别的结果并将其与预期答案进行比较，给出比较结果；

所述评估模块，根据训练内容的难易程度按照不同权重计算并显示得分，对比显示用户应答内容和答案；

所述的语言处理模块与训练数据保存和查询模块连接；所述训练数据保存和查询模块与信息数据库连接；

所述信息数据库保存和查询模块存储各种训练信息，并提供查询。

前述的语音识别模块设有冗余提高语音识别区分度。

前述的语言处理模块设有将语音识别的结果信息与取得的预期应答内容信息进行比对的比较程序。

前述的比较程序包括加权评分标准程序及模糊比对程序。

本发明与现有技术相比，具有以下明显的优势和有益效果：

本发明首先采用分离专项技能的思想使口译训练实现了自动化，使各种水平的学习者可以进行自主口译训练。其次利用自行研发的词句模糊比对技术比对预期的口译内容和实际识别的内容，使反馈结果有一定的灵活性，比较能被学习者接受。

附图说明

图1为本发明实现自动口译训练的方法的流程示意图；

图2为本发明实现自动口译训练的装置示意图。

具体实施方式

下面结合附图对本发明的具体实施例加以说明：

本发明的主要发明思路在于：

1)训练内容用程序自动生成，内容的难度可控，可以确保训练者不受语言材料难度的影响，实现不同水平的学习者都能进行相应的口译专项技能的训练；

2)把整体式口译训练方法细分为记忆训练、交替翻译、影子跟读、同声翻译及其他相关技能的单项训练方法，在口译训练的基础阶段以离散式训练方法为主要训练手段，在高级阶段才逐步采用具有实习性质的整体式训练方法。

3)在分离出相对简单的专项训练方法的基础上，使现有语音识别和自然语言处理技术可以用于口译训练结果的自动分析和处理。

请参阅图1所示，为本发明实现自动口译训练的方法的流程示意图。从图中可以看出，

10为学习者根据自己的能力设置训练内容的难度参数，并选择某种专项训练方法；

20为学习者启动训练活动，训练活动控制模块调用训练内容生成模块；

30为训练内容生成模块根据学习者设定的参数自动生成训练内容和正确答案；

40为编译预期应答内容的语音识别规则，为识别学习者的语音做好准备；

50为训练活动控制模块启动语音合成模块生成并播放训练内容，根据所选专项训练方法按照相应模式启动语音识别模块；

60为学习者的话语激活语音识别模块，进行语音识别并传递语音识别的结果到训练活动控制模块；

70为训练活动控制模块调用语言处理模块，语言处理模块把语音识别的结果与取得的预期应答内容进行比对，产生并展示反馈信息；

80为70的数据信息反馈到信息数据库；

90为训练结束时学习者激活训练记录保存模块保存训练记录，训练记录查询模块可以向学习者或者教师提供训练记录详情，供人工分析之用。

请参阅图2所示，为本发明实现自动口译训练的装置示意图。

结合图1所示，图2的装置与图1的每一步骤相对应，例如：100为训练参数设置模块，300为内容生成模块，200为训练活动控制模块，400为播放模块，500为语音识别模块，700为语音处理模块，800为信息数据库，900为训练数据保存和查询模块。其中，训练活动控制模块200，控制内容生成模块300、播放模块400、语音识别模块500和语音处理模块700的运行。

以下举例说明数字口译训练过程：

学习者在用户界面上设定以下训练参数：

设置为3位数到6位数的整数，不设小数部分，系统将生成如234，000的数字，3位数以下为0。

每组生成3个数字。

每隔2秒钟播放一个数字。

播放语速为中速。

翻译为英译汉。

学习者启动交替翻译训练过程，系统按照上述设定随机生成3个规定难度的数字，编译这3个数字预期的汉语语音识别规则和正确答案。

训练控制模块按照交替翻译的要求以每2秒播放一个数字的间隔用语音合成方式播放全部3个数字。

训练控制模块随后启动汉语语音识别模块，按照预期的汉语语音识别规则监听学习者的话音，并要求学习者把3个数字逐个翻译成汉语。

语音识别模块识别出学习者的各个数字的汉语翻译结果，其中有些可能是沉默或者不完整的翻译结果，如234,000翻译成二十三万。语音识别模块把这些结果传送给语言处理模块。

语言处理模块把学习者对各个数字的翻译结果与正确答案进行模糊比对，根据加权评分标准评分，显示识别的翻译结果、正确答案以及评分，完成一组数字训练。

学习者可以重复步骤1.1至步骤1.5，进行多组同一种难度的口译训练。或者从步骤一开始，更改训练难度，进行多组不同难度的训练。

训练结束时学习者可以要求系统保存所有训练记录，系统把所有记录上传到指定网站。学习者或者教师可以访问网站查询训练记录。

最后应说明的是：以上实施例仅用以说明本发明而并非限制本发明所描述的技术方案；因此，尽管本说明书参照上述的各个实施例对本发明已进行了详细的说明，但是，本领域的普通技术人员应当理解，仍然可以对本发明进行修改或等同替换；而一切不脱离发明的精神和范围的技术方案及其改进，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于语音识别的实现自动口译训练的方法，将口译训练分解成可处理的专项技能训练方法，其特征在于：包括以下步骤：

1.1、用户设置训练参数，开始所选训练形式，激活内容生成模块；

1.2、口译训练控制模块确定训练形式，进入训练起始状态；

1.3、自动生成所需的训练内容和预期应答内容；

1.4、编译当前对话阶段预期应答内容的语音识别规则，为识别用户的语音做好准备；

1.5、播放训练内容，并根据训练形式启动语音识别模块；

1.6、激活语音识别模块进行语音识别并保存语音识别的结果；

1.7、语言处理模块把语音识别的结果与取得的预期应答内容进行比对，根据评估体系作出评估反馈；

1.8、将训练数据和查询模块训练记录发送至信息数据库保存。

2.根据权利要求1所述的基于语音识别实现自动口译训练的方法，其特征在于所述步骤1.1包括：训练练习的内容、难度、速度、停顿时间；

所述训练形式包括：交替翻译、影子跟读、同声翻译、记忆训练。

3.根据权利要求1所述的基于语音识别实现自动口译训练的方法，其特征在于所述步骤1.3包括：机器播放的内容、预期用户应答内容、预期应答内容的语音识别规则。

4.根据权利要求1所述的基于语音识别实现自动口译训练的方法，其特征在于：所述步骤1.5对交替翻译或记忆训练采用先播放后启动语音识别，而对影子跟读和同声翻译训练同时启动语音识别模块。

5.一种基于语音识别实现自动口译的训练装置，包括计算机、耳机、麦克风；其特征在于：还设有训练活动控制模块、训练内容生成模块、语音合成模块、语音识别模块、口译训练控制模块和评估模块以及信息数据库；

所述的训练活动控制模块与训练内容生成模块、语音合成模块、语音识别模块、语言处理模块进行数据连接；所述训练内容生成模块，用于自动生成训练内容，并与语音合成模块数据连接；

所述语音合成模块，用于播放训练内容；

信息数据库保存和查询模块存储各种训练信息，并提供查询。

6.根据权利要求5所述的基于语音识别实现自动口译的训练装置，其特征在于：语音识别模块设有冗余提高语音识别区分度。

7.根据权利要求5所述的基于语音识别实现自动口译的训练装置，其特征在于：语言处理模块设有将语音识别的结果信息与取得的预期应答内容信息进行比对的比较程序。

8.根据权利要求7所述的基于语音识别实现自动口译的训练装置，其特征在于：所述的比较程序包括加权评分标准程序及模糊比对程序。