CN1614684A

CN1614684A - 发音矫正设备及方法

Info

Publication number: CN1614684A
Application number: CNA2003101034524A
Authority: CN
Inventors: 颜睿余
Original assignee: Micro Star International Co Ltd
Current assignee: Micro Star International Co Ltd
Priority date: 2003-11-03
Filing date: 2003-11-03
Publication date: 2005-05-11
Anticipated expiration: 2023-11-03
Also published as: CN1295673C

Abstract

一种发音矫正设备及方法，包括功能选择模块、数据供应模块、专家系统、口语识别单元、口语特征相似库及数据库；首先由数据供应模块选定训练教材供使用者练习发音，等使用者发出训练教材的读音后，即令口语识别单元将使用者的发音与语音模型进行分项对比，并输出对比结果，还由专家系统针对该对比结果进行分析，并将其所分析的数据连同使用者错误的发音信息储存在数据库中，以自动提供使用者改进发音的建议，还可令使用者追踪自我学习记录，随时针对本身的发音弱点进行改进。

Description

发音矫正设备及方法

技术领域

本发明是关于一种语音识别技术，特别是关于一种可对使用者发音模式中的音节成分主动进行分析，并针对使用者的发音弱点提供改进建议的发音矫正设备及方法。

背景技术

由于科技发达及交通便利，分布于世界各地的人们可借由先进的网络及通信技术相互交换信息，通过便利快速的交通工具前往世界各地访问。因此，人与人之间的关系不再因距离的遥远而产生空间上的隔阂，反之，增加了人们相互间沟通及交流的频率，即使分处于地球两端，也会由于网络通信的发达及交通工具的迅速便捷而可摆脱空间距离上的限制，将整个世界融合成一个没有空间距离限制的地球村。

在此趋势中，若要使分布于世界各地区，且种族、生活习惯及语言都不相同的人们彼此间能沟通顺畅，必须制定一种共同语言。这是因为语言是人类沟通思想、传递信息与表达意愿最基本与最主要的工具，近年来，由于信息快速膨胀及国际间的互动日趋频繁，人与人之间沟通的障碍也已由地理上的空间隔阂转为语言间的隔阂。据统计，全球大约有九千种语言，以欧洲共同体为例，就涵盖了约九种的官方语言，而在国际网络市场行销公司2000年的研究中指出，目前全球四亿七千六百万的国际互联网人口，使用的语言超过10种以上，而且，除了母语之外，要通晓某种外语是相当困难的事，更何况还要应付各种不同的语言。因此开发出一个能将语言障碍打破的语言学习辅助机器，对不同语系间人们的交流及信息的互通，都将产生划时代的影响。台湾专利公告第448,379号案即提出一种计算机外国语教学的方法，其是利用互动方式并搭配不同场景进行教学，是一种多媒体教学法，帮助使用者配合生活化的场景，学习在日常生活中如何使用外语进行交谈的技巧；此外，台湾专利公告第468,120号案也提出一种外语口语学习系统及方法，该案是利用语音识别技术识别使用者的发音，再将所识别的字汇重新发音，供使用者自行矫正发音。

综上可知，学习他国语言已成为现代人迈向国际化的必经过程，因此，才有上述种种辅助方法产生。此外，市场上也有多种关于提高外语能力的书籍，这些方法都是希望以比较有效率的学习方式，缩短人们学习他国语言所需花费的时间及金钱。不论是上述两个案例还是市面上流通的外语学习辅助书籍及其提供的教材，在辅助使用者学习外国语言发音方面所采用的方式有两种：一种是请使用者作自我的听力学习，另一种是请使用者发出某些单字或句子的读音后，给予相似度的评分，但它们都缺乏具有分析能力的训练方式，也无法针对使用者的发音方式提供改进的方法及建议，因此，使用者只了解自己的发音不很正确，却不知如何修正，使有心学习口语发音及改进本身错误发音方式的使用者必须通过专人进行口语发音训练，并针对其错误的发音方法进行指导并提供改善建议，如此，虽可及时针对使用者本身错误的口语发音进行修正，但也造成使用者在时间及金钱上的耗费，因此，如何提供一种具有分析使用者发音正确与否，并可及时提供改进建议供使用者参考的语言学习辅助设备，节省使用者所耗费的时间及金钱并提高使用者的学习效率，是目前个人顺应国际化趋势所必须克服的问题。

发明内容

为克服上述现有技术的缺点，本发明的主要目的在于提供一种发音矫正设备及方法，其可针对使用者的发音进行分析并提供改进意见供使用者参考。

本发明的另一目的在于提供一种发音矫正设备及方法，其可将针对使用者发音进行分析所得的数据及使用者错误的发音信息储存在数据库中，建立使用者本身的学习记录，令使用者可随时针对自己的发音弱点进行改进。

基于上述发明目的，本发明提供一种发音矫正设备及方法。

本发明的发音矫正设备包括：(1)功能选择模块，其作为使用者使用发音矫正设备的操作接口，可供使用者直接操作，也可在该发音矫正设备与电子信息产品搭接时，与电子信息产品所含的操作接口连接进行操作；(2)数据供应模块，其提供使用者学习口语发音的训练教材；(3)口语特征相似库，其按口语发音的音节相似度区分各式音节，并储存；(4)口语识别单元，其利用语音识别算法、训练教材及已区分的各式音节等数据建立语音模型，并将使用者的发音与该语音模型进行分项对比，将对比结果输出；(5)专家系统，其具有语音识别功能，可针对该对比结果进行分析，并根据分析的结果为使用者提供改进建议；以及(6)数据库，其储存该专家系统分析的数据及使用者错误的发音信息，以记录使用者的学习记录。

本发明的发音矫正方法包括：(1)令该口语识别单元先行按口语音节相似度区分各式音节，并予以储存；(2)令该数据供应模块从专家系统中选定训练教材，以供使用者进行发音练习；(3)令该口语识别单元利用语音识别算法、已区分的各式音节及训练教材等数据建立语音模型，并将使用者的发音与该语音模型进行分项对比，并输出对比结果；(4)令该专家系统针对所得的分项对比结果进行分析，并将分析数据连同使用者错误的发音信息储存在数据库中；(5)令该专家系统针对使用者的发音问题提供改善建议。

综上所述，本发明的发音矫正设备及方法可针对使用者的发音进行分析，并提供改进意见供使用者参考；还可将对使用者发音分析的数据及使用者错误的发音信息储存在数据库中，建立使用者本身的学习记录，令使用者可随时针对自己的发音弱点进行改进。

附图说明

图1是本发明的发音矫正设备内部结构的方块图；以及

图2是本发明的发音矫正方法在进行发音矫正程序时所进行的各项步骤的流程图。

具体实施方式

实施例

以下通过特定的具体实例详细说明本发明的观点，但并非以任何观点限制本发明的范畴。

图1是本发明的发音矫正设备1的内部结构方块图。本发明的发音矫正设备1除可独立使用外，也可与笔记本电脑、桌上电脑、个人数字助理等电子信息产品(图未标)相互整合，以增加该电子信息产品的使用功能。如图所示，该发音矫正设备1包括：功能选择模块11、数据供应模块12、专家系统13、口语识别单元14、口语特征相似库15及数据库16。

口语特征相似库15储存有按口语音节相似度区分的各式音节数据，并可根据数据库16存放的数据进行修正。

功能选择模块11可与电子信息产品搭接或直接组设在发音矫正设备1上，以对发音矫正设备1的发音训练功能进行操作。

此时，数据供应模块12从专家系统13中，选取范例单字、词组或句子等作为训练教材，由发音矫正设备1按使用者设定的输出方式(如通过电子产品的显示屏(图未标)或由声音播放装置输出(图未标))，令使用者根据数据供应模块12选定的训练教材进行发音矫正训练。当数据供应模块12将选定的训练教材输出，供使用者进行发音练习时，也同时将该训练教材的文字内容输入口语识别单元14。

口语识别单元14可先行至口语特征相似库15中取出与该训练教材发音模式相关的音调、音节等数据，等使用者按训练教材发音方式读出该训练教材的读音时，口语识别单元14即接收使用者所发出的读音，并与现有的从数据供应模块12输入的训练教材文字内容，及由口语特征相似库15取出与该训练教材文字内容相关的发音模式相互进行对比。该口语识别单元14先将使用者的读音进行初步切割，以将音节区分，并取得发音样本，随后，再通过语音识别算法，如隐马尔可夫模型(Hidden Markov Model，HMM，以下略称为HMM模型)，并辅以一阶算法、已区分的音节及训练教材等数据建立一语音模型，并将所取得的发音样本与该语音模型通过概率统计方式进行分析，以描述使用者的发音特性。因HMM模型是利用统计观念建立，故可克服观测发音特性所蕴藏的时变特性，并对初步分割的音节进行辨认，HMM模型可将使用者的读音同语音模型进行分项对比，以描述出不同层次的语音单元，如句子、单字、音节及音素，并将所描述的语音单元汇整成音调、音节及音节分段时间等分项对比结果输出至专家系统13执行进一步的分析作业。

专家系统13按现有的提供给数据供应模块12的训练教材，针对口语识别单元14所汇整的音调、音节及音节分段时间等分项对比结果进行分析，还以语音或屏幕显示等方式输出，以提供改善建议供使用者参考，令使用者可根据专家系统13所提供的建议，矫正错误的发音问题，另一方面，专家系统13也将所分析的数据及使用者错误的发音信息储存在数据库16中，以供以后进行语音数据分析，还可供数据供应模块12日后作为选定训练教材的参考及供使用者追踪学习记录。

图2是本发明的发音矫正方法通过发音矫正设备1进行发音矫正程序时的流程图，如图所示，在步骤S1中，令口语特征相似库15先行按照口语音节相似度区分各式音节并予以储存，接着进至步骤S2。

在步骤S2中，当使用者通过功能选择模块11操作发音矫正功能时，令数据供应模块12从专家系统13中选定训练教材(如范例单字、字符串及语句等)，供使用者进行发音练习，接着进至步骤S3。

在步骤S3中，令口语识别单元14利用隐马尔可夫模型(HiddenMarkov Model，HMM)、口语特征相似库15内已区分的音节数据及数据供应模块12选定的训练教材建立一个语音模型，将使用者的发音与该语音模型按音调、音节及音节分段时间等分项进行对比，并在对比完成后产生音调输出、音节输出及音节分段时间输出等对比结果，随后进至步骤S4。

在步骤S4中，令专家系统13针对对比结果分析其音调高低、快慢及发音错误的问题，并将所分析的数据及使用者错误的发音信息储存在数据库16中，以作为使用者的学习记录，并可供数据供应模块日后作为选取训练教材的参考，随后进至步骤S5。

在步骤S5中，令专家系统13针对使用者错误的发音模式，提供改善建议，令使用者可清楚了解错误之处，以及时进行改进。

Claims

1.一种发音矫正设备，其特征在于，该设备包括：

功能选择模块，作为使用者对该发音矫正设备进行功能选取的操作接口；

数据供应模块，在该功能选择模块被使用者操作时，为使用者提供训练教材作为口语发音练习之用；

口语特征相似库，区分各式音节；

口语识别单元，利用语音识别算法、数据供应模块提供的训练教材及口语特征相似库内已区分的各式音节建立语音模型，将使用者的发音与该语音模型进行分项对比，并输出对比结果；

专家系统，分析由口语识别单元输出的对比结果，并根据所得的分析数据提供矫正建议供使用者参考；以及

数据库，记录该专家系统所分析的数据及使用者错误的发音信息。

2.如权利要求1所述的发音矫正设备，其特征在于，该数据供应模块提供给使用者的训练教材是从专家系统中取得。

3.如权利要求1所述的发音矫正设备，其特征在于，该训练教材包括单字、字符串及语句。

4.如权利要求1所述的发音矫正设备，其特征在于，该语音模型是具有语音识别功能的隐马尔可夫模型。

5.如权利要求1所述的发音矫正设备，其特征在于，该分项对比的项目是音调对比、音节对比及音节分段时间对比中的一种。

6.如权利要求1所述的发音矫正设备，其特征在于，该对比结果的输出项目是音调输出、音节输出及音节分段时间输出中的一种。

7.如权利要求1所述的发音矫正设备，其特征在于，该矫正建议是指提示使用者须矫正发音的音调或音节。

8.如权利要求1所述的发音矫正设备，其特征在于，该发音矫正设备可整合搭接在电子信息产品中。

9.如权利要求1所述的发音矫正设备，其特征在于，该口语特征相似库是根据口语音阶相似度区分各式音节并予以储存。

10.一种发音矫正方法，其特征在于，借由发音矫正设备分析使用者的发音并提供改进建议，该方法包括：

先行区分各式音节，并予以储存；

提供训练教材供使用者进行发音练习；

利用语音识别算法、已区分的各式音节及训练教材，建立一语音模型与使用者的发音进行分项对比；以及

针对对比的结果进行分析，为使用者提供改善建议。

11.如权利要求10所述的发音矫正方法，其特征在于，该发音矫正设备是权利要求1所述的发音矫正设备。

12.如权利要求10所述的发音矫正方法，其特征在于，该口语特征相似库是按口语音节相似度区分各式音节并予以储存。

13.如权利要求10所述的发音矫正方法，其特征在于，该训练教材是由数据供应模块从专家系统中选定，并供使用者进行发音练习。

14.如权利要求10所述的发音矫正方法，其特征在于，该语音识别算法是具有语音识别功能的隐马尔可夫模型。

15.如权利要求10所述的发音矫正方法，其特征在于，该分项对比程序是由口语识别单元进行，它是按音调、音节和音节分段时间中的一种进行对比。

16.如权利要求10所述的发音矫正方法，其特征在于，该方法是由专家系统针对对比的结果进行分析，并将所分析的数据及使用者错误的发音信息储存在数据库中。

17.如权利要求16所述的发音矫正方法，其特征在于，该数据库中所存放的数据可作为使用者的学习记录。

18.如权利要求16所述的发音矫正方法，其特征在于，该数据库中所存放的数据还可作为数据供应模块日后选择训练教材的参考。

19.如权利要求13所述的发音矫正方法，其特征在于，该专家系统具有语音识别功能，并可同时针对音调高低、快慢及发音错误问题中的一种进行分析。