CN1099646C - 发音测量装置和方法 - Google Patents

发音测量装置和方法 Download PDF

Info

Publication number
CN1099646C
CN1099646C CN98103685A CN98103685A CN1099646C CN 1099646 C CN1099646 C CN 1099646C CN 98103685 A CN98103685 A CN 98103685A CN 98103685 A CN98103685 A CN 98103685A CN 1099646 C CN1099646 C CN 1099646C
Authority
CN
China
Prior art keywords
phoneme
phonetic entry
speaker
score
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN98103685A
Other languages
English (en)
Other versions
CN1191354A (zh
Inventor
达纳·比尔德
斯蒂芬·奥斯汀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Mobility LLC
Google Technology Holdings LLC
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of CN1191354A publication Critical patent/CN1191354A/zh
Application granted granted Critical
Publication of CN1099646C publication Critical patent/CN1099646C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/04Speaking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

在一个说话人数据库(15)中进行一次查找操作以为在输入端(11)处接收到的用户的语音得到一个预先设定的模式。一个话音模拟单元模拟一个本地语音说话人的话音。语音输入被加到模拟单元(102-107)以给出一个记分。该记分在一个分析单元(40)中被相对于一个预先确定的说话人的记分进行分析。一个被连接到此分析单元的输出端的指示器装置(16)将结果表示出来。

Description

发音测量装置和方法
技术领域
本发明涉及一种发音测量装置和一种测量发音的方法,可用于例如辅导学习语言的学生。
背景技术
语音识别产品现在被用得越来越广泛了。它们使用不同的方案将输入语音的特征和预先设定的语音模型或在训练过程中确定的语音模型进行比较。这样,例如和说话人无关的语音识别产品便能将接收到的语音的特征和“1”“2”等等这样的单词、或专门术语通常叫作“音素”或“三合音”的、能组合成完整的单词模型的单词要素的预先设定的模型进行比较。一个基于单词要素的话音识别系统的优点是用已经存在于存储器中的模型的组成部份可以构造出新的单词。例如,“promise”的组合模型的第一部分可以和“conduct”的模型的后一部份合并起来构成单词“product”的模型。同样,也有语音驱动的单词处理软件,其中使用大量的组合模型以识别从麦克风输入的话音并在单词处理应用中显示出被说出的单词。
这类产品主要用于在输入单词为未知但属于从词典中有限选择的单词之一时识别单词,或主要用于通过预先选择用户要说的单词和当说话人说出该单词时在存储器中为其建立一个模型或模式以训练一个这样的识别器。描述的这类语音识别装置都以说话人能相当程度地说这种要识别的语言为先决条件。
发明内容
根据本发明的一种测量发音的方法,包括:接收语音输入和处理语音输入以给出多个语音输入音素;进行一次查找操作以得到语音输入的一个预定的模式,其中预定的模式包括多个模式音素;通过将语音输入音素与模式音素相比较,将语音输入加予模式以给出一个记分;相对于一个预定的说话人的记分对前述记分进行分析,包括比较至少一个语音输入音素的时间长度和至少一个模式音素的时间长度,由此给出一个结果;和指示出结果,包括指示出至少一个语音输入音素的时间长度的可信度测量。
根据本发明的另一种测量发音的方法,包括:接收语音输入;进行一次查找操作以得到语音输入的一个预定的模式;将语音输入加予模式以给出一个记分,包括提供一个第一输入,它给出单词分段的时间长度测量,以及一个第二输入,它给出在语音输入中的单词分段和预定的模式中的单词分段之间的相互关系的测量;相对于一个预定的说话人的记分对前述记分进行分析,由此给出一个结果,其中分析记分的步骤包括相对于预定的说话人的单词分段时间长度的预定测量进行第一输入的统计分析;和指示出结果,包括指示出语音输入中单词分段的时间长度的可信度测量。
根据本发明的一种用于发音测量的装置,包括:一个话音模拟单元,具有一个接收代表说话人语音的信号的输入端,和一个输出端;一个说话人数据库;一个分析单元,其第一输入端连接到说话人数据库,而其第二输入端连接到话音模拟单元的输出端,并且它还有一个输出端;以及一个图形用户接口指示器装置,连接到分析单元的输出,包括一个说话人语音音素的时间长度的可信度测量的指示器,和一个说话人语音音素的质量的可信度测量的指示器。
附图说明
仅通过实例并参考插图描述了本发明的一个较好的实施例。
图1是一个方框图,说明依照本发明的较好实施例的一个发音测量装置的电路原理图。
图2为表示图1的维特比解码器的详细情况。
图3是说明图1的装置工作的流程图。
图4是图1的装置加在显示器上的一个输出的图解说明。
图5是图解说明一些特别希望的特征的分枝系统图。
图6是说明一个特别希望的特征的用户图形接口的图解说明。
具体实施方式
本发明需要一个说话人说出显示在一个计算装置附带的显示装置上的一个单词或一列单词。本发明的作用是使说话人的语音和指示或显示出的单词的相应模型相对照,同时测量出说话人对单词的发音如何,并象老师对学生就所学语言打分一样,也对单词或词的要素打分。和语音识别装置相反,本发明假定说话人可能对目标语言不太熟练。
参看图1,表示有一个发音测量用的装置10,它可以合适地称呼为“语音辅导员”。此装置包括有一个被连接到模数转换器12的麦克风11。模数转换器12再被连接到微处理器13的一个输入端。同样连接到微处理器13的还有输入装置14、存储器15和显示器16。存储器15中有一个词典20,其中包含有单词和每个单词的音素串或其他的单词分段的串。例如,单词“computer”储存在词典20中,和该单词一起还储存有如下的两个音素串:
k-ah-m-p-uw-t-er和
k-ah-m-p-uw-d-er。
这些音素串表示单词“computer”两种可供选择的普通发音方式。在存储器15中装有本地语音说话人数据库21。该数据库包含有着用户希望模仿的发音的本地语音说话人的各种音素、单词和句子的统计数据。在存储器15中也可以存放本地语音说话人的语音合成数据以合成用户要模拟的语音。
微处理器13包含有由软件形成的许多单元。它们包括特征提取单元30,其输入端为31而输出端为32;包括一个维特比解码器33,其一个输入端连接到特征提取单元30的输出端,而一个输入端34连接到词典20,还有第一输出端35、第二输出端36、和一个部份回扫输出端37;包括有统计分析单元40,其输入端连接到维特比解码器的输出端35、36,而其输入端41和42连接到本地语音说话人数据库21的输出端,另外有输出端43和44;包括有以计算机程序形式提供的一个用户图形接口50,其输入端被连接到统计分析单元40的输出端43和44,并有一个输出端51连接到显示器16。在处理器13中也表示出了选择器60。它被连接到输入装置14,并将输出端连接到词典20、本地语音说话人数据库21和用户图形接口50。在处理器13中备有一个跟踪工具62,其输入端连接到维特比解码器的输出端37,而输出端63被连接到用户图形接口50。
在图2中通过实例表示出维特比解码器33的较好的详细情况。维特比解码器33包含一个连接到输入端34的单词分段串选择器100(即音素串选择器),并包含一个静止模式101、和若干音素模式102-107,其中的音素模式102、103和104为串联而音素模式104被连接到并联连接的音素模式105和106,后者再和音素模式107串联。最后,一个静止模式108被加到模式网络的末端。有一个记分比较器110和每个音素模式相连接。各个音素模式是设置来识别被选择的音素(或其他的单词分段)正如每个模式中表示的那样。图2使用单词“computer”表示一个例子。任何其他的单词或单词序列都可以此方式表示出来。
对图1的装置的工作将参照图3的流程图进行说明。在200阶段,一个单词、词组或其他表达词是使用输入装置14进行选择的。例如输入装置14是一个键盘,单词“computer”即可输入。此单词被送至选择器60。选择器60在词典20中发起一次查找(201阶段),上述的相应音素串即从词典20中输入维特比解码器的输入端34。在202阶段建立维特比解码器并建立图2的各个音素模式102-107。同时,选择器60将选择的单词送到用户图形接口50由显示器16进行显示。
用户现在向麦克风11说话(210阶段)。模数转换器12将话音数字化成例如16KBPS的数字比特流。特征提取单元30以该种技术中熟知的办法从数字比特流提取频谱特征和激励特征。这些特征被以通常每秒100个取样的速率送至维特比解码器33。这些取样同时被按帧送至不同模式101-108的子集。各帧在图中按照最佳匹配路径从左至右由模式序列连续吸收。该最佳匹配路径取决于在任何给定模式中的匹配结果。
每个音素模式在接收的取样流中探测出它特有的音素并向记分比较器110送去第一个数值,指出取样和被识别音素之间的相关程度,再送去第二个数值,指示出该音素的时间长度。当单词完成且静止模式101在单词结尾处探测到静止时,记分比较器110将这些数值送至统计分析单元40。
选择器60发起执行另一次查找操作。这是在本地语音说话人数据库21中发生,同时使所述单词(“computer”)的统计数据被输入到统计分析单元40的输入端41和42。对于所述单词的每一个音素,此音素的时间长度的目标平均值和变化以及此音素记分的目标平均值和变化分别被输入输入端41和42。这一阶段在图3中被表示为215阶段,但此阶段可以和201阶段同时进行这一点将受到重视。
维特比解码器33的输出量的统计分析是在图3的216阶段中如下进行的。对于一个特定音素的时间长度,从输出端35输出的值在输出端41处和此音素的目标平均值时间长度进行比较。在输入端42处计算出被测时间长度和目标平均值时间长度间之差值并将其除以本地语音说话人的音素时间长度的偏差值。结果便是被测时间长度的可信度。如果此被测时间长度很接近于平均值时间长度,可信度便高。但即使此时间长度和平均值时间长度相差很大,如果由本地语音说话人说出的音素时间长度的偏差也高,则仍然可以获得高的可信度。
同样,对一个特定音素的记分(即相互关系)是在输出端36处输出,并和由本地语音说话人说出和在统计分析单元40的输入端42处输入的该音素的目标平均值记分进行比较。同样,该记分的变化量在输入端42处送出。被测记分和目标平均值记分之差被计算出并除以此记分的偏差。结果给出可信度,说明被说出的音素和本地语音说话人的音素之间的相关程度。这些音素时间长度的可信度和音素记分的可信度分别在统计分析单元40的输出端43和44处输出。它们被送至用户图形接口50,其结果在显示器16上显示。这一结果显示在图3上被表示为220阶段。
这样一来,统计分析单元40便成了一个统计比较器,能为维特比解码器33的输出端36或35处的一个信号相对于说话人数据库21建立一个等级,并将此等级作为输出送出。
用户图形接口50可以用许多不同形式将结果表示出来。在显示器16上显示结果的例子表示在图4中。图4中的表示法在同时对不同音素的相对时间长度和相互关系给出直观表示时是很有利的。在图4中,时间线400是将各个音素401分别排列于其下方而画出的,对应每个音素都有一个方块402画在时间线上方。方块的高度表示和本地语言说话人的音素之间的相互关系。因此高的块表示相关性好,即音素发音正确,而矮的方块表示音素发音不正确。方块的宽度403表示相对于本地语音说话人说出的音素的较好时间长度的、该音素的相对时间长度。因此对于该音素,宽的方块表示发音时间长度过长而短的方块表示时间长度过短。
于是,用户很容易就可直观地看到该单词的发音质量。例如,在被表示出的例子中,元音“AH”发音较差、时间长度也有些过长,而元音“UW”发音较好且其时间长度适中。这样,用户便知道对第一个元音的发音可以进行改进而第二个元音则发音合适。
上面叙述了一个简单而有用的装置。它可以帮助学习语言的学生学习和练习表达词语的发音。这一工具几乎可以适用于学习任何语言,只要把表达词句划分成音素并向用户指出单个音素的发音质量。已经说明,向用户指出的内容最好包括发音质量和发音时间长度。没有必要指出单个音素发音的这些特殊的方面,而可以指出发音的确实可供选择的方面如音高、强调等等。
所说明的工具可以被修改和扩大以给出另外的有用的特点。例如,可以将整个的词组或句子输入输入装置14并在输出显示器16上表示出来。对一个完整单词的发音、或一个词组、一整个句子、或某种别的表达词语的发音可以指出其可信度。
图5表示出对音素、单词和句子给出可信度的一种方法。一个树枝状系统被画出来,其中音素时间长度的可信度501和音素记分的可信度502合并成该音素的单一的可信度503。此音素的可信度和同一个单词中另一个音素的可信度506合并。这些可信度一起给出此双音素单词的可信度507。此可信度507可以和另一个单词的可信度508合并而给出单词组合的可信度510、或甚至一个完整句子的可信度。当然, 图5画出的树状系统只是对一个完整词组或句子的较大的树状系统的图解说明。
在图1中画出了一种跟踪工具62,下面对其进行较详细的说明。该跟踪工具62是一个可选择的特征,能向用户指出在一个句子发音过程中的进展。维特比解码器的输出端37向跟踪工具62指出在该单词的记分过程中维特比解码器进展了多远。当图2的每个音素模式102、103等等探测其特定音素并完成该音素的探测,以及下一个音素模式开始探测随后的音素时,一个部份回扫指示被送至跟踪工具62,以指出一个音素的探测完成和下一个音素的探测开始。跟踪工具62将此进展和句子的正被发音的单词联系起来。跟踪工具62在输出端63处向用户图形接口50指示出这一进展。一个例子表示在图6中。
在图6中,显示器16上画出了一个显示输出,其中词句“I Iove my computer”是被输入输入装置14的句子并由用户发音。当跟踪工具62向用户图形接口50指出用户在句子发音中的活动进展时,用户图形接口50产生一个弹球600。当用户发音读出句子时,弹球的样子是从一个音节跳到一个音节。这种球的一个个音节的跳动或其他的合适的进展指示器的初始化是由跟踪工具62经输出端63进行的。
仅通过实例,已对一种测量发音的方法和一种进行发音测量的装置进行了说明。一个技术熟练人员能够不用离开本发明的范围和主旨而很容易进行细节的修改。

Claims (10)

1.一种测量发音的方法,包括:
接收语音输入和处理语音输入以给出多个语音输入音素;
进行一次查找操作以得到语音输入的一个预定的模式,其中预定的模式包括多个模式音素;
通过将语音输入音素与模式音素相比较,将语音输入加予模式以给出一个记分;
相对于一个预定的说话人的记分对前述记分进行分析,包括比较至少一个语音输入音素的时间长度和至少一个模式音素的时间长度,由此给出一个结果;和
指示出结果,包括指示出至少一个语音输入音素的时间长度的可信度测量。
2.根据权利要求1的方法,还包括一个选择表达词句的步骤,
其中进行查找操作的步骤包括从存储器为被选择的表达词句取得一个预定的模式。
3.根据权利要求1的方法,其中将语音输入加予模式以给出一个记分的步骤包括提供一个第一输入,它给出单词分段的时间长度测量,以及一个第二输入,它给出在语音输入中的单词分段和预定的模式中的单词分段之间的相互关系的测量。
4.一种测量发音的方法,包括:
接收语音输入;
进行一次查找操作以得到语音输入的一个预定的模式;
将语音输入加予模式以给出一个记分,包括提供一个第一输入,它给出单词分段的时间长度测量,以及一个第二输入,它给出在语音输入中的单词分段和预定的模式中的单词分段之间的相互关系的测量;
相对于一个预定的说话人的记分对前述记分进行分析,由此给出一个结果,其中分析记分的步骤包括相对于预定的说话人的单词分段时间长度的预定测量进行第一输入的统计分析;和
指示出结果,包括指示出语音输入中单词分段的时间长度的可信度测量。
5.根据权利要求4的方法,其中指示出结果的步骤包括给出统计分析的结果的图解说明。
6.根据权利要求3的方法,其中分析记分的步骤包括相对于预定的说话人的单词分段和预定的模式中的单词分段之间的相互关系的预定测量进行第二输入的统计分析。
7.根据权利要求6的方法,其中指示出结果的步骤包括给出统计分析的结果的图解说明。
8.一种用于发音测量的装置,包括:
一个话音模拟单元,具有一个接收代表说话人语音的信号的输入端,和一个输出端;
一个说话人数据库;
一个分析单元,其第一输入端连接到说话人数据库,而其第二输入端连接到话音模拟单元的输出端,并且它还有一个输出端;以及
一个图形用户接口指示器装置,连接到分析单元的输出,包括一个说话人语音音素的时间长度的可信度测量的指示器,和一个说话人语音音素的质量的可信度测量的指示器。
9.根据权利要求8的装置,其中话音模拟单元包括一个存储器单元,存储器单元中存放有多个代表不同的表达词句的预定的模式。
10.根据权利要求9的装置,还包括选择输入设备,它连接到话音模拟单元以选择一种表达词句以对其进行发音测量。
CN98103685A 1997-01-30 1998-01-23 发音测量装置和方法 Expired - Lifetime CN1099646C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US791124 1991-11-13
US08/791,124 US5857173A (en) 1997-01-30 1997-01-30 Pronunciation measurement device and method

Publications (2)

Publication Number Publication Date
CN1191354A CN1191354A (zh) 1998-08-26
CN1099646C true CN1099646C (zh) 2003-01-22

Family

ID=25152769

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98103685A Expired - Lifetime CN1099646C (zh) 1997-01-30 1998-01-23 发音测量装置和方法

Country Status (3)

Country Link
US (1) US5857173A (zh)
JP (1) JP4189051B2 (zh)
CN (1) CN1099646C (zh)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6120298A (en) * 1998-01-23 2000-09-19 Scientific Learning Corp. Uniform motivation for multiple computer-assisted training systems
DE19842405A1 (de) * 1998-09-16 2000-03-23 Philips Corp Intellectual Pty Spracherkennungsverfahren mit Konfidenzmaßbewertung
US6336089B1 (en) * 1998-09-22 2002-01-01 Michael Everding Interactive digital phonetic captioning program
US7062441B1 (en) 1999-05-13 2006-06-13 Ordinate Corporation Automated language assessment using speech recognition modeling
DE19929462A1 (de) * 1999-06-26 2001-02-22 Philips Corp Intellectual Pty Verfahren zum Training eines automatischen Spracherkenners
EP1067512B1 (en) * 1999-07-08 2007-12-26 Sony Deutschland GmbH Method for determining a confidence measure for speech recognition
EP1110500A3 (de) * 1999-12-20 2003-02-12 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Selbstkontrolle des Ist-Zustands eines an einer neurologischen Erkrankung leidenden Patienten
EP1189202A1 (en) * 2000-09-18 2002-03-20 Sony International (Europe) GmbH Duration models for speech recognition
US6725198B2 (en) 2001-01-25 2004-04-20 Harcourt Assessment, Inc. Speech analysis system and method
US6732076B2 (en) 2001-01-25 2004-05-04 Harcourt Assessment, Inc. Speech analysis and therapy system and method
WO2002071390A1 (en) * 2001-03-01 2002-09-12 Ordinate Corporation A system for measuring intelligibility of spoken language
US6953343B2 (en) * 2002-02-06 2005-10-11 Ordinate Corporation Automatic reading system and methods
KR100499854B1 (ko) * 2002-04-11 2005-07-08 주식회사 언어과학 음소별 오류유형 검출시스템 및 방법과 이를 적용한발음교정 시스템 및 방법
TW556152B (en) * 2002-05-29 2003-10-01 Labs Inc L Interface of automatically labeling phonic symbols for correcting user's pronunciation, and systems and methods
US7219059B2 (en) * 2002-07-03 2007-05-15 Lucent Technologies Inc. Automatic pronunciation scoring for language learning
US20040049391A1 (en) * 2002-09-09 2004-03-11 Fuji Xerox Co., Ltd. Systems and methods for dynamic reading fluency proficiency assessment
US7455522B2 (en) * 2002-10-04 2008-11-25 Fuji Xerox Co., Ltd. Systems and methods for dynamic reading fluency instruction and improvement
US7752045B2 (en) * 2002-10-07 2010-07-06 Carnegie Mellon University Systems and methods for comparing speech elements
WO2004061796A1 (en) * 2002-12-31 2004-07-22 Burlingtonspeech Limited Comprehensive spoken language learning system
JP3962701B2 (ja) * 2003-03-31 2007-08-22 キヤノン株式会社 シート搬送装置及び画像形成装置
US7407384B2 (en) * 2003-05-29 2008-08-05 Robert Bosch Gmbh System, method and device for language education through a voice portal server
US7524191B2 (en) * 2003-09-02 2009-04-28 Rosetta Stone Ltd. System and method for language instruction
US7280963B1 (en) * 2003-09-12 2007-10-09 Nuance Communications, Inc. Method for learning linguistically valid word pronunciations from acoustic data
DE10360044B3 (de) * 2003-12-18 2005-05-25 T-Mobile Deutschland Gmbh Verfahren zur Ermittlung der sprachlichen Fähigkeiten von Probanden
US20060008781A1 (en) * 2004-07-06 2006-01-12 Ordinate Corporation System and method for measuring reading skills
US8033831B2 (en) * 2004-11-22 2011-10-11 Bravobrava L.L.C. System and method for programmatically evaluating and aiding a person learning a new language
US8221126B2 (en) * 2004-11-22 2012-07-17 Bravobrava L.L.C. System and method for performing programmatic language learning tests and evaluations
US8272874B2 (en) * 2004-11-22 2012-09-25 Bravobrava L.L.C. System and method for assisting language learning
WO2006057896A2 (en) * 2004-11-22 2006-06-01 Bravobrava, L.L.C. System and method for assisting language learning
KR100682909B1 (ko) * 2004-12-23 2007-02-15 삼성전자주식회사 음성 인식 방법 및 장치
WO2006076280A2 (en) * 2005-01-11 2006-07-20 Educational Testing Service Method and system for assessing pronunciation difficulties of non-native speakers
JP4811993B2 (ja) * 2005-08-23 2011-11-09 株式会社国際電気通信基礎技術研究所 音声処理装置、およびプログラム
JP5066668B2 (ja) * 2005-11-08 2012-11-07 株式会社国際電気通信基礎技術研究所 音声認識装置、およびプログラム
JP4557919B2 (ja) * 2006-03-29 2010-10-06 株式会社東芝 音声処理装置、音声処理方法および音声処理プログラム
US20070239455A1 (en) * 2006-04-07 2007-10-11 Motorola, Inc. Method and system for managing pronunciation dictionaries in a speech application
JP4716125B2 (ja) * 2006-08-04 2011-07-06 株式会社国際電気通信基礎技術研究所 発音評定装置、およびプログラム
GB2457855B (en) * 2006-11-30 2011-01-12 Nat Inst Of Advanced Ind Scien Speech recognition system and speech recognition system program
US8521674B2 (en) * 2007-04-27 2013-08-27 Nec Corporation Information analysis system, information analysis method, and information analysis program
US8751229B2 (en) * 2008-11-21 2014-06-10 At&T Intellectual Property I, L.P. System and method for handling missing speech data
US8775184B2 (en) * 2009-01-16 2014-07-08 International Business Machines Corporation Evaluating spoken skills
US9378650B2 (en) * 2009-09-04 2016-06-28 Naomi Kadar System and method for providing scalable educational content
US8258947B2 (en) * 2009-09-29 2012-09-04 International Business Machines Corporation Auto-translation of source strings in global verification testing in a functional testing tool
TWI431563B (zh) * 2010-08-03 2014-03-21 Ind Tech Res Inst 語言學習系統、語言學習方法及其程式產品
US8744856B1 (en) 2011-02-22 2014-06-03 Carnegie Speech Company Computer implemented system and method and computer program product for evaluating pronunciation of phonemes in a language
JP6045175B2 (ja) * 2012-04-05 2016-12-14 任天堂株式会社 情報処理プログラム、情報処理装置、情報処理方法及び情報処理システム
KR20150001189A (ko) * 2013-06-26 2015-01-06 한국전자통신연구원 음성인식을 이용한 외국어 말하기 능력의 훈련 및 평가 방법과 그 장치
JP2015025873A (ja) * 2013-07-24 2015-02-05 株式会社ベネッセコーポレーション 情報処理装置、情報処理方法及びプログラム
CN103514765A (zh) * 2013-10-28 2014-01-15 苏州市思玛特电力科技有限公司 语言教学评估方法
CN103514764A (zh) * 2013-10-28 2014-01-15 苏州市思玛特电力科技有限公司 语言教学评估系统
US10319250B2 (en) 2016-12-29 2019-06-11 Soundhound, Inc. Pronunciation guided by automatic speech recognition
US11322172B2 (en) 2017-06-01 2022-05-03 Microsoft Technology Licensing, Llc Computer-generated feedback of user speech traits meeting subjective criteria
GB2613563A (en) * 2021-12-03 2023-06-14 Learnlight Uk Ltd Apparatus, computing device and method for speech analysis

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5129000A (en) * 1986-04-05 1992-07-07 Sharp Kabushiki Kaisha Voice recognition method by analyzing syllables
US5503560A (en) * 1988-07-25 1996-04-02 British Telecommunications Language training
EP0706171A1 (en) * 1994-10-07 1996-04-10 Canon Kabushiki Kaisha Speech recognition method and apparatus

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1156544B (it) * 1982-11-08 1987-02-04 Olivetti & Co Spa Metodo ed apparecchiatura di riconoscimento fonetico di parole
JPH065451B2 (ja) * 1986-12-22 1994-01-19 株式会社河合楽器製作所 発音訓練装置
GB9223066D0 (en) * 1992-11-04 1992-12-16 Secr Defence Children's speech training aid
US5487671A (en) * 1993-01-21 1996-01-30 Dsp Solutions (International) Computerized system for teaching speech
US5562453A (en) * 1993-02-02 1996-10-08 Wen; Sheree H.-R. Adaptive biofeedback speech tutor toy
KR100309207B1 (ko) * 1993-03-12 2001-12-17 에드워드 이. 데이비스 음성-대화식언어명령방법및장치
US5625749A (en) * 1994-08-22 1997-04-29 Massachusetts Institute Of Technology Segment-based apparatus and method for speech recognition by analyzing multiple speech unit frames and modeling both temporal and spatial correlation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5129000A (en) * 1986-04-05 1992-07-07 Sharp Kabushiki Kaisha Voice recognition method by analyzing syllables
US5503560A (en) * 1988-07-25 1996-04-02 British Telecommunications Language training
EP0706171A1 (en) * 1994-10-07 1996-04-10 Canon Kabushiki Kaisha Speech recognition method and apparatus

Also Published As

Publication number Publication date
CN1191354A (zh) 1998-08-26
JPH10222190A (ja) 1998-08-21
US5857173A (en) 1999-01-05
JP4189051B2 (ja) 2008-12-03

Similar Documents

Publication Publication Date Title
CN1099646C (zh) 发音测量装置和方法
US8401849B2 (en) Methods employing phase state analysis for use in speech synthesis and recognition
EP2276019A1 (en) Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method
EP2270773A1 (en) Apparatus and method for creating singing synthesizing database, and pitch curve generation apparatus and method
WO2008044582A1 (en) Method and apparatus for locating speech keyword and speech recognition system
KR101487005B1 (ko) 문장입력을 통해 발음교정을 실시하는 외국어 학습장치 및 그 학습방법
CN113539240A (zh) 动画生成方法、装置、电子设备和存储介质
WO2019075828A1 (zh) 一种语音评价方法及装置
KR100362292B1 (ko) 음성인식 기술을 이용한 영어 발음 학습 방법 및 시스템
CN109697975B (zh) 一种语音评价方法及装置
US5764851A (en) Fast speech recognition method for mandarin words
Yousfi et al. Holy Qur'an speech recognition system Imaalah checking rule for warsh recitation
Al-Bakeri et al. ASR for Tajweed rules: integrated with self-learning environments
JP2001306087A (ja) 音声データベース作成装置および音声データベース作成方法および記録媒体
CN114446268A (zh) 一种音频数据处理方法、装置、电子设备、介质和程序产品
JP2806364B2 (ja) 発声訓練装置
KR101487006B1 (ko) 연음법칙이 적용되는 발음의 발음교정을 실시하는 외국어 학습장치 및 그 학습방법
CN112634861A (zh) 数据处理方法、装置、电子设备和可读存储介质
Wallich Putting speech recognizers to work: While advances in signal processing and algorithms would extend their usefulness, limited models are already meeting many inspection and inventory applications
KR101487007B1 (ko) 사용자의 발음을 분석하여 교정해주는 외국어 학습장치 및 그 학습방법
Bahaadini et al. Implementation and evaluation of statistical parametric speech synthesis methods for the Persian language
JPH05165494A (ja) 音声認識装置
Billi et al. A PC-based very large vocabulary isolated word speech recognition system
JP2017126004A (ja) 音声評価装置、方法、及びプログラム
JP2001100775A (ja) 音声合成装置のための音声データ量削減装置及び音声合成装置

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MOTOROLA MOBILE CO., LTD.

Free format text: FORMER OWNER: MOTOROLA INC.

Effective date: 20110111

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20110111

Address after: Illinois Instrunment

Patentee after: MOTOROLA MOBILITY, Inc.

Address before: Illinois Instrunment

Patentee before: Motorola, Inc.

C41 Transfer of patent application or patent right or utility model
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Illinois State

Patentee after: MOTOROLA MOBILITY LLC

Address before: Illinois State

Patentee before: MOTOROLA MOBILITY, Inc.

CP02 Change in the address of a patent holder

Address after: Illinois State

Patentee after: MOTOROLA MOBILITY, Inc.

Address before: Illinois Instrunment

Patentee before: MOTOROLA MOBILITY, Inc.

TR01 Transfer of patent right

Effective date of registration: 20160620

Address after: California, USA

Patentee after: Google Technology Holdings LLC

Address before: Illinois State

Patentee before: MOTOROLA MOBILITY LLC

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20030122