CN101609670A - 语言发音测试系统及其方法 - Google Patents

语言发音测试系统及其方法 Download PDF

Info

Publication number
CN101609670A
CN101609670A CNA2009100233867A CN200910023386A CN101609670A CN 101609670 A CN101609670 A CN 101609670A CN A2009100233867 A CNA2009100233867 A CN A2009100233867A CN 200910023386 A CN200910023386 A CN 200910023386A CN 101609670 A CN101609670 A CN 101609670A
Authority
CN
China
Prior art keywords
information
individual character
pronunciation
unit
synthetic video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2009100233867A
Other languages
English (en)
Inventor
陈淮琰
蒋阳安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Besta Xian Co Ltd
Original Assignee
Inventec Besta Xian Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Besta Xian Co Ltd filed Critical Inventec Besta Xian Co Ltd
Priority to CNA2009100233867A priority Critical patent/CN101609670A/zh
Publication of CN101609670A publication Critical patent/CN101609670A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明是一种语言发音测试系统及其方法,该系统包含:数据库,储存多个单字数据,每个单字数据包含拼字、音标及发音信息;数据选择单元,从数据库中选出单字数据,并输出所选单字数据的音标及发音信息;语音合成单元,根据所选单字数据的音标合成所选单字数据的合成声音信息;音频分析单元,分别对所选单字数据的合成声音信息及发音信息进行音频分析处理,分别产生对应合成声音信息及发音信息的音频特征参数;差异评断单元,比对合成声音信息的音频特征参数及发音信息的音频特征参数,并根据比对结果及预设门坎值产生评断数据。本发明可以用来测试单字和真人发音的发音信息的正确性,可提高发音的正确性和工作效率。

Description

语言发音测试系统及其方法
技术领域
本发明涉及一种语言发音测试系统及其方法,尤其是一种用来测试真人发音正确性的语言发音测试系统及其方法。
背景技术
目前,便携式电子消费产品,例如电子辞典、个人数字助理机或手机等,愈来愈受到人们的青睐,而人们对于便携式电子消费产品功能的要求也是愈来愈高,其中,语言翻译及学习功能是消费者越来越重视的功能之一。
随着配备闪存的加大,可储存的数据量增加,现在的电子字典类产品中英文字典大多具有单字真人发音功能。为了确保发音与单字的正确匹配且发音符合音标,传统上,需要多位数据处理人员花费大量的时间去全部验听,如果要使用程序匹配方式会有些困难。由于真人发音从录音,切音到最后整理应用到产品环节比较多,稍有疏忽就会造成发音错位等问题。例如,单字通过匹配有时会将缩写字的发音发错,如单字apt(有...倾向的,易于...的)的真人发音容易发成apartment(公寓),因为apartment的缩写形式也是apt;再者,有些单字有多种词性和发音,也容易让配音员误判而发错音。因此程序匹配方式无法通过语意的判断而时常匹配错误。
在先前技术中,以一本大型的英汉字典举例,20万单字全部验听一遍需要10人约15天时间完成,其消耗的人力与时间甚巨。因此,如何自动测试提高发音的正确性和工作效率,是一项亟待解决的问题。
发明内容
本发明为解决背景技术中存在的上述技术问题,而提出语言发音测试系统及其方法。
本发明的技术解决方案是:一种语言发音测试系统,其特殊之处在于:该系统包含:数据库,储存多个单字数据,每个单字数据包含拼字、音标及发音信息;数据选择单元,从数据库中选出单字数据,并输出所选单字数据的音标及发音信息;语音合成单元,根据所选单字数据的音标合成所选单字数据的合成声音信息;音频分析单元,分别对所选单字数据的合成声音信息及发音信息进行音频分析处理,分别产生对应合成声音信息及发音信息的音频特征参数;差异评断单元,比对合成声音信息的音频特征参数及发音信息的音频特征参数,并根据比对结果及预设门坎值产生评断数据,数据库与数据选择单元连接,数据选择单元分别和语音合成单元、音频分析单元连接,语音合成单元与音频分析单元连接,音频分析单元与差异评断单元连接。
上述系统还包含声音信息输出单元和录音单元,录音单元用来录制合成声音信息及发音信息的录音,而音频分析单元根据合成声音信息的录音及发音信息的录音产生音频特征参数,数据选择单元和语音合成单元分别通过声音信息输出单元与录音单元连接,录音单元与音频分析单元连接。
上述发音信息为真人发音信息。
上述音频特征参数为线性预估编码(LPC)倒频谱参数。
一种语言发音测试方法,用来测试单字发音信息的正确性,其特殊之处在于:该方法包含下列步骤:
1)取得单字音标;
2)根据音标产生合成声音信息;
3)分别对合成声音信息及发音信息进行音频分析处理,分别产生对应合成声音信息及发音信息的音频特征参数;
4)比对合成声音信息的音频特征参数及发音信息的音频特征参数;
5)根据比对结果及预设门坎值评断发音信息的正确性。
上述合成声音信息及发音信息之间的差异值超过预设门坎值时,表示发音信息不正确。
一种语言发音测试方法,用来测试真人发音信息的正确性,其特殊之处于:该方法包含下列步骤:
1)在电子辞典选择单字;
2)取得所选单字的音标,并根据此音标产生合成声音信息并播放此合成声音信息;
3)使用录音设备录制此合成声音信息的录音;
4)播放此单字的真人发音信息;
5)使用录音设备录制此真人发音信息的录音;
6)分别对合成声音信息及发音信息的录音进行音频分析处理,分别产生对应合成声音信息及发音信息的录音的音频特征参数;
7)判断两组音频特征参数的差异值是否大于预设门坎值,若是,则在测试评断表中纪录此单字。
本发明的提供的语言发音测试系统及其方法,可以用来测试单字和真人发音的发音信息的正确性,可提高发音的正确性和工作效率。
附图说明
图1为本发明语言发音测试系统的第一实施例方块图;
图2为本发明语言发音测试系统的第二实施例方块图;
图3为本发明语言发音测试方法的第一实施例步骤流程图;
图4为本发明语言发音测试方法的第二实施例步骤流程图;
图5为本发明语言发音测试系统在选择单字的实施例示意图;
图6为本发明各种声音信息波型示意图。
其中,1-语言发音测试系统,11-数据库,111-单字数据,112-拼字,113-音标,114-发音信息,12-数据选择单元,13-语音合成单元,131-合成声音信息,14-音频分析单元,141、142、241、242-音频特征参数,15-差异评断单元,151-预设门坎值,152-评断资料,21-电子辞典,22-测试装置,27-屏幕,28-声音信息输出单元,29-录音单元,291、292-录音数据。
具体实施方式
参见图1,本发明的语言发音测试系统1包含数据库11、数据选择单元12、语音合成单元13、音频分析单元14及差异评断单元15。数据库11用来储存多个单字数据111,例如英文单字或任何可用音标表示其发音的语言单字。每个单字数据111包含拼字112、音标113及发音信息114。其中,发音信息114为真人发音信息。语言发音测试系统1可用于自动测试真人发音信息的正确性,达到降低测试所需的人力及时间。
数据选择单元12用来从数据库11中选出单字数据111,并输出所选单字数据111的音标113及发音信息114。数据选择单元12包含显示接口,显示每个单字数据的拼字,供测试操作员观看,而测试操作员可手动操作显示接口来选择特定单字,参见图5。
语音合成单元13根据所选单字数据111的音标113合成所选单字数据111的合成声音信息131。其中,语音合成单元13可使用频谱参数合成方式(Articulatory Synthesis)、波形拼接方式(Formant Synthesis)、串接合成法(Concatenated Synthesis)或是其它产生对应音标113的语音的合成方式。
音频分析单元14分别对所选单字数据111的合成声音信息131及发音信息114进行音频分析处理,分别产生对应合成声音信息131的音频特征参数141及发音信息114的音频特征参数142,例如线性预估编码(LPC)倒频谱参数等等,但不限于此,凡是可描述音频信号的特征的音频分析处理及音频特征参数皆可使用于本发明的音频分析单元。
差异评断单元15比对音频特征参数141及音频特征参数142,并根据比对结果及预设门坎值151产生评断数据152。虽然合成声音信息131听起来较不自然,但是由于是根据音标113所产生,所以其正确度相当高,因此,当差异值超过预设门坎值151时,表示发音信息114不正确,可能是当初在切音时发生错误,或是此单词有多种词性和发音,造成录音员发音错误等等。因此,评断数据152纪录这些不正确的发音信息114对应的单字数据111,如表1所示,其记录单字“deregulator”、“apt”及“foliage”的真人发音信息与音标的合成声音信息差异过大。
而操作人员测试完数据库11中所有单字数据111后,再确认评断数据152内的纪录,亲自聆听发音信息114不正确的单字确认其正确性。
           表1
  编号   单字
  1   deregulator
  2   apt
  3   foliage
  …   …
其中,上述语言发音测试系统1可整合于同一装置上实施,也可分别设置于两个以上装置来实施,例如数据库11、数据选择单元12及语音合成单元13设置于待测电子辞典上,而音频分析单元14及差异评断单元15设置于测试装置上,而待测电子辞典具有声音信息输出单元,测试装置具有录音单元。以下将详述第二种实施方式。
参见图2,第二实施例与第一实施例不同之处在于数据库11、数据选择单元12及语音合成单元13设置于电子辞典21中,电子辞典21具有声音信息输出单元28。而音频分析单元14及差异评断单元15设置于测试装置22,测试装置22还具有录音单元29。
电子辞典21的屏幕27显示每个单字数据111的拼字112供操作人员观看并选择,参见图5,而所选的单字数据111的音标113输入语音合成单元13产生合成声音信息131,并通过声音信息输出单元28发出,而由测试装置22的录音单元29录制合成声音信息131的录音,产生录音数据291,如图6的波型图(a)。接着,电子辞典21播放所选的单字数据111的发音声音信息114,同样,由声音信息输出单元28发出,而录音单元29录制发音声音信息114的录音,产生录音数据292,如图6的波型图(b)。接着,音频分析单元14分别对录音数据291及292进行音频分析处理,分别产生音频特征参数241及音频特征参数242,再由差异评断单元15比对音频特征参数241及音频特征参数242,如图6中绘示两个波型的差异的波型图(c),以及绘示两组音频特征参数的差异的示意图(d)。接着,差异评断单元15根据比对结果及预设门坎值151产生评断数据152,其记录差异过大的单字,如表1所示。
参见图3,本发明的方法可用来测试单字的发音信息的正确性,包含下列步骤。首先,在步骤31取得此单字的音标,接着在步骤32根据此音标产生合成声音信息。在步骤33,分别对此合成声音信息及此单字的发音信息进行音频分析处理,分别产生对应合成声音信息及发音信息的音频特征参数。其中,发音信息可为真人发音信息。而音频特征参数是线性预估编码(LPC)倒频谱参数。
在步骤34,比对合成声音信息的音频特征参数及发音信息的音频特征参数。并在步骤35根据比对结果及预设门坎值评断发音信息的正确性。
参见图4,本方法的方法还可用来测试电子辞典内的真人发音信息的正确性,包含下列步骤。首先,在步骤41,在电子辞典选择单字。在步骤42,取得所选单字的音标,并根据此音标产生合成声音信息并播放此合成声音信息。在步骤43,使用录音设备录制此合成声音信息的录音。在步骤44,播放此单字的真人发音信息。在步骤45,使用录音设备录制此真人发音信息的录音。
在步骤46分别对合成声音信息及发音信息的录音进行音频分析处理,分别产生对应合成声音信息及发音信息的录音的音频特征参数。在步骤47,判断两组音频特征参数的差异值是否大于预设门坎值,若是,则在步骤48在测试评断表中纪录此单字,如表1所示。

Claims (7)

1、一种语言发音测试系统,其特征在于:该系统包含:数据库,储存多个单字数据,每个单字数据包含拼字、音标及发音信息;数据选择单元,从数据库中选出单字数据,并输出所选单字数据的音标及发音信息;语音合成单元,根据所选单字数据的音标合成所选单字数据的合成声音信息;音频分析单元,分别对所选单字数据的合成声音信息及发音信息进行音频分析处理,分别产生对应合成声音信息及发音信息的音频特征参数;差异评断单元,比对合成声音信息的音频特征参数及发音信息的音频特征参数,并根据比对结果及预设门坎值产生评断数据,所述数据库与数据选择单元连接,所述数据选择单元分别和语音合成单元、音频分析单元连接,所述语音合成单元与音频分析单元连接,所述音频分析单元与差异评断单元连接。
2、根据权利要求1所述的语言发音测试系统,其特征在于:所述系统还包含声音信息输出单元和录音单元,录音单元用来录制合成声音信息及发音信息的录音,而音频分析单元根据合成声音信息的录音及发音信息的录音产生音频特征参数,所述数据选择单元和语音合成单元分别通过声音信息输出单元与录音单元连接,所述录音单元与音频分析单元连接。
3、根据权利要求1或2所述的语言发音测试系统,其特征在于:所述发音信息为真人发音信息。
4、根据权利要求1或2所述的语言发音测试系统,其特征在于:所述音频特征参数为线性预估编码(LPC)倒频谱参数。
5、一种语言发音测试方法,用来测试单字发音信息的正确性,其特征在于:该方法包含下列步骤:
1)取得单字音标;
2)根据音标产生合成声音信息;
3)分别对合成声音信息及发音信息进行音频分析处理,分别产生对应合成声音信息及发音信息的音频特征参数;
4)比对合成声音信息的音频特征参数及发音信息的音频特征参数;
5)根据比对结果及预设门坎值评断发音信息的正确性。
6、根据权利要求5所述的语言发音测试方法,其特征在于:所述合成声音信息及发音信息之间的差异值超过预设门坎值时,表示发音信息不正确。
7、一种语言发音测试方法,用来测试真人发音信息的正确性,其特征在于:该方法包含下列步骤:
1)在电子辞典选择单字;
2)取得所选单字的音标,并根据此音标产生合成声音信息并播放此合成声音信息;
3)使用录音设备录制此合成声音信息的录音;
4)播放此单字的真人发音信息;
5)使用录音设备录制此真人发音信息的录音;
6)分别对合成声音信息及发音信息的录音进行音频分析处理,分别产生对应合成声音信息及发音信息的录音的音频特征参数;
7)判断两组音频特征参数的差异值是否大于预设门坎值,若是,则在测试评断表中纪录此单字。
CNA2009100233867A 2009-07-21 2009-07-21 语言发音测试系统及其方法 Pending CN101609670A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2009100233867A CN101609670A (zh) 2009-07-21 2009-07-21 语言发音测试系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2009100233867A CN101609670A (zh) 2009-07-21 2009-07-21 语言发音测试系统及其方法

Publications (1)

Publication Number Publication Date
CN101609670A true CN101609670A (zh) 2009-12-23

Family

ID=41483395

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2009100233867A Pending CN101609670A (zh) 2009-07-21 2009-07-21 语言发音测试系统及其方法

Country Status (1)

Country Link
CN (1) CN101609670A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107680581A (zh) * 2012-03-02 2018-02-09 苹果公司 用于名称发音的系统和方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107680581A (zh) * 2012-03-02 2018-02-09 苹果公司 用于名称发音的系统和方法
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation

Similar Documents

Publication Publication Date Title
CN109599093B (zh) 智能质检的关键词检测方法、装置、设备及可读存储介质
US8812314B2 (en) Method of and system for improving accuracy in a speech recognition system
CN103745731B (zh) 一种语音识别效果自动化测试系统及测试方法
US10977299B2 (en) Systems and methods for consolidating recorded content
JP3940383B2 (ja) 音声認識精度を決定する方法
US8909525B2 (en) Interactive voice recognition electronic device and method
US7440895B1 (en) System and method for tuning and testing in a speech recognition system
CN102723080B (zh) 一种语音识别测试系统及方法
US8473295B2 (en) Redictation of misrecognized words using a list of alternatives
CN107086040A (zh) 语音识别能力测试方法和装置
CN1879146B (zh) 用于语音到文本的转录系统的错误检测
CN1783213A (zh) 用于自动语音识别的方法和装置
CN107393544A (zh) 一种语音信号修复方法及移动终端
US8983845B1 (en) Third-party audio subsystem enhancement
CN108305618B (zh) 语音获取及搜索方法、智能笔、搜索终端及存储介质
CN109326305B (zh) 一种批量测试语音识别和文本合成的方法和测试系统
Pallett Performance assessment of automatic speech recognizers
US20130253932A1 (en) Conversation supporting device, conversation supporting method and conversation supporting program
CN110738981A (zh) 一种基于智能语音通话对答的交互方法
CN109637536B (zh) 一种自动化识别语义准确性的方法及装置
CN110111778B (zh) 一种语音处理方法、装置、存储介质及电子设备
CN105188008A (zh) 一种测试音频输出单元的方法及装置
Coleman et al. Mining a year of speech
CN101253547B (zh) 语音对话方法和系统
CN101609670A (zh) 语言发音测试系统及其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20091223