CN107993653A - 语音识别设备的错误发音自动纠正更新方法和更新系统 - Google Patents
语音识别设备的错误发音自动纠正更新方法和更新系统 Download PDFInfo
- Publication number
- CN107993653A CN107993653A CN201711239000.7A CN201711239000A CN107993653A CN 107993653 A CN107993653 A CN 107993653A CN 201711239000 A CN201711239000 A CN 201711239000A CN 107993653 A CN107993653 A CN 107993653A
- Authority
- CN
- China
- Prior art keywords
- speech recognition
- recognition apparatus
- pronunciation
- incorrect pronunciations
- corpus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 239000000463 material Substances 0.000 description 5
- 238000000605 extraction Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Electrically Operated Instructional Devices (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了语音识别设备的错误发音自动纠正更新方法和更新系统,包括语音识别设备和云服务器,所述语音识别设备包括麦克风、音响装置、语音对比器、声学模型库、发音纠正装置和错误发音语料库;通过麦克风获取语音识别信息,并与声学模型库对比并且计算发音符合度,如符合度低于门限值,则判断错误发音语料库内有无错误语音,如果有,则直接使用错误发音语料库内的正确语音片段替换错误语音,并且从音响装置输出;否则,调取声学模型库内的标准发音替换错误语音,并且使用输出装置输出,然后将当前错误发音和声学模型库对应的标准发音存储至错误发音语料库,从而达到智能辅助语言训练,并自动记录错误发音习惯和自动纠偏的技术目的。
Description
技术领域
本发明涉及语音识别技术领域,特别是涉及一种语音识别设备的错误发音自动纠正更新方法和系统。
背景技术
语音识别是一种利用机器模拟人类的识别和理解过程、把人类的语音信号转变为相应的文本或命令的技术。语音识别的根本目的是研究出一种具有听觉功能的机器,能直接接受人的语音,理解人的意图,并做出相应的反应。从技术上看,它属于多维模式识别和智能接口的范畴。
在语音识别技术中,最简单的是对特定人、小词汇量、孤立词的语音识别,最复杂、最难的是对非特定人、大词汇量、连续语音的语音识别。目前主要采用的主流算法是隐马尔可夫模型方法。
语音识别系统在本质上是一种模式识别系统,通常包括特征提取、模式匹配和参考模式库等基本单元,如图1所示。语音信号先经过特征提取后形成特征矢量,并利用词典和子词模型集合串接成的词模型进行识别,然后根据语言模型的句法限制在句子级进行输入语音与参考模板间的匹配,最后识别出相应的句子。因此,语言模型的确定对于语音识别系统至关重要。
现有技术中,语言模型一般是直接利用大型语料库进行训练得到的,但是对于特定语种或者特定领域,我们没有相关的语料库,根本无法训练得到语言模型。目前一般的做法是跨地区甚至跨国抓取HTML语料,从而得到相应语种的语料库,以利用得到的语料库对语言模型进行训练。但是通过抓取HTML语料的做法是比较困难的,且得到的语料质量较差不一定好,特别是对于特定的领域,例如电话客服领域,根本无法得到相应的语料。这种使用就必须采用人工标注的方法建立相应的语料库,这种办法需要很多会该语种的人录制并制作语料库,周期长且花费较大。
发明内容
为了克服上述现有技术的不足,本发明提供了一种语音识别设备的错误发音自动纠正更新方法和系统,包括语音识别设备和云服务器,所述语音识别设备包括麦克风、音响装置、语音对比器、声学模型库、发音纠正装置和错误发音语料库;通过麦克风获取语音识别信息,并与声学模型库对比并且计算发音符合度,如符合度低于门限值,则判断错误发音语料库内有无错误语音,如果有,则直接使用错误发音语料库内的正确语音片段替换错误语音,并且从音响装置输出;否则,调取声学模型库内的标准发音替换错误语音,并且使用输出装置输出,然后将当前错误发音和声学模型库对应的标准发音存储至错误发音语料库,以达到智能辅助语言训练,并自动记录错误发音习惯和自动纠偏的技术目的。
本发明所采用的技术方案是:语音识别设备的错误发音自动纠正更新方法,包括如下步骤:
S100、通过麦克风获取语音识别信息;
S200、与声学模型库对比并且计算符合度,如果符合度低于门限值,则进入步骤S400,否则,执行步骤S300;
S300、从音响装置输出当前正确发音;
S400、判断错误发音语料库内有无错误语音,如果有,则进入步骤S500,否则,进入步骤S600;
S500、直接使用错误发音语料库内的正确语音片段替换错误语音,并且从音响装置输出;
S600、调取声学模型库内的标准发音替换错误语音,并且使用输出装置输出;
S700、将当前错误发音和声学模型库对应的标准发音存储至错误发音语料库。
更优地,在S100之前,语音识别设备已预存声学模型库数据。
更优地,符合度门限值为0.3-0.5。
更优地,S700的后续步骤还包括:S701、将当前错误发音和声学模型库对应的标准发音上传到云服务器,以分享给其他语音识别设备的错误发音语料库。
语音识别设备的错误发音自动纠正更新系统,包括语音识别设备和云服务器,语音识别设备包括麦克风、音响装置、语音对比器、声学模型库、发音纠正装置和错误发音语料库,错误发音语料库和云服务器具有网络连接,并且:
语音对比器用于比较当前发音是否跟声学模型库中的标准发音相符合,并计算符合度;
发音纠正装置用于将用户当前的错误语音直接用错误发音语料库中相对应的正确语音片段替换;
错误发音语料库用于存储用户的错误发音和声学模型库中标准发音之间的对应关系。
更优地,语音识别设备在运行工作之前,已预存声学模型库数据,这些声学模型库数据为隐马尔可夫模型HMM,其用HMM刻画语音信号作出两个假设,一是内部状态的转移只与上一状态有关,另一是输出值只与当前状态或当前的状态转移有关。
与现有技术相比,本发明的有益效果是:
首先,本发明可将当前用户的错误语音直接使用错误发音语料库内的正确语音片段替换,从而极大提高用户训练口语和方言的速度,降低了学习成本,并可标准化应用于同声传译;
其次,本发明将当前用户的错误发音作为样本上传到云服务器共享,有利于同一地区方言的用户快速提高错误发音资料库的训练速度,缩短语音识别设备的优化进程。
附图说明
图1为一种语音识别设备的错误发音自动纠正更新的流程图,
图2为一种语音识别设备的错误发音自动纠正更新系统的组成结构图。
具体实施方式
为了加深对本发明的理解,下面结合附图和实施例对本发明进一步说明,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。
如图1所示,语音识别设备的错误发音自动纠正更新方法,包括如下步骤:
S100、通过麦克风获取语音识别信息;
S200、与声学模型库对比并且计算符合度,如果符合度低于门限值,则进入步骤S400,否则,执行步骤S300;
S300、从音响装置输出当前正确发音;
S400、判断错误发音语料库内有无错误语音,如果有,则进入步骤S500,否则,进入步骤S600;
S500、直接使用错误发音语料库内的正确语音片段替换错误语音,并且从音响装置输出;
S600、调取声学模型库内的标准发音替换错误语音,并且使用输出装置输出;
S700、将当前错误发音和声学模型库对应的标准发音存储至错误发音语料库。
更优地,在S100之前,语音识别设备已预存声学模型库数据。
更优地,符合度门限值为0.3-0.5。
更优地,S700的后续步骤还包括:S701、将当前错误发音和声学模型库对应的标准发音上传到云服务器,以分享给其他语音识别设备的错误发音语料库。
如图2所示,语音识别设备的错误发音自动纠正更新系统,包括语音识别设备100和云服务器200,语音识别设备包括麦克风101、音响装置105、语音对比器102、声学模型库103、发音纠正装置104和错误发音语料库106,错误发音语料库和云服务器具有网络连接,并且:语音对比器用于比较当前发音是否跟声学模型库中的标准发音相符合,并计算符合度;发音纠正装置用于将用户当前的错误语音直接用错误发音语料库中相对应的正确语音片段替换;错误发音语料库用于存储用户的错误发音和声学模型库中标准发音之间的对应关系。
更优地,语音识别设备在运行工作之前,已预存声学模型库数据,这些声学模型库数据为隐马尔可夫模型HMM,其用HMM刻画语音信号作出两个假设,一是内部状态的转移只与上一状态有关,另一是输出值只与当前状态或当前的状态转移有关。
本发明的实施例公布的是较佳的实施例,但并不局限于此,本领域的普通技术人员,极易根据上述实施例,领会本发明的精神,并做出不同的引申和变化,但只要不脱离本发明的精神,都在本发明的保护范围内。
Claims (6)
1.语音识别设备的错误发音自动纠正更新方法,其特征在于,包括如下步骤:
S100、通过麦克风获取语音识别信息;
S200、与声学模型库对比并且计算符合度,如果符合度低于门限值,则进入步骤S400,否则,执行步骤S300;
S300、从音响装置输出当前正确发音;
S400、判断错误发音语料库内有无错误语音,如果有,则进入步骤S500,否则,进入步骤S600;
S500、直接使用错误发音语料库内的正确语音片段替换错误语音,并且从音响装置输出;
S600、调取声学模型库内的标准发音替换错误语音,并且使用输出装置输出;
S700、将当前错误发音和声学模型库对应的标准发音存储至错误发音语料库。
2.根据权利要求1所述的语音识别设备的错误发音自动纠正更新方法,其特征在于:在S100之前,语音识别设备已预存声学模型库数据。
3.根据权利要求1所述的语音识别设备的错误发音自动纠正更新方法,其特征在于:所述符合度门限值为0.3-0.5。
4.根据权利要求1-3任意一项所述的语音识别设备的错误发音自动纠正更新方法,其特征在于:S700的后续步骤还包括:
S701、将当前错误发音和声学模型库对应的标准发音上传到云服务器,以分享给其他语音识别设备的错误发音语料库。
5.根据权利要求1所述的语音识别设备的错误发音自动纠正更新系统,其特征在于,包括语音识别设备和云服务器,所述语音识别设备包括麦克风、音响装置、语音对比器、声学模型库、发音纠正装置和错误发音语料库,所述错误发音语料库和云服务器具有网络连接,并且:
所述语音对比器用于比较当前发音是否跟声学模型库中的标准发音相符合,并计算符合度;
所述发音纠正装置用于将用户当前的错误语音直接用错误发音语料库中相对应的正确语音片段替换;
所述错误发音语料库用于存储用户的错误发音和声学模型库中标准发音之间的对应关系。
6.根据权利要求5所述的语音识别设备的错误发音自动纠正更新系统,其特征在于:所述语音识别设备在运行工作之前,已预存声学模型库数据,这些声学模型库数据为隐马尔可夫模型HMM,其用HMM刻画语音信号作出两个假设,一是内部状态的转移只与上一状态有关,另一是输出值只与当前状态或当前的状态转移有关。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711239000.7A CN107993653A (zh) | 2017-11-30 | 2017-11-30 | 语音识别设备的错误发音自动纠正更新方法和更新系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711239000.7A CN107993653A (zh) | 2017-11-30 | 2017-11-30 | 语音识别设备的错误发音自动纠正更新方法和更新系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107993653A true CN107993653A (zh) | 2018-05-04 |
Family
ID=62034603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711239000.7A Pending CN107993653A (zh) | 2017-11-30 | 2017-11-30 | 语音识别设备的错误发音自动纠正更新方法和更新系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107993653A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108766437A (zh) * | 2018-05-31 | 2018-11-06 | 平安科技(深圳)有限公司 | 语音识别方法、装置、计算机设备及存储介质 |
CN109064789A (zh) * | 2018-08-17 | 2018-12-21 | 重庆第二师范学院 | 一种伴随脑瘫性口齿不清辅助控制系统及方法、辅助器 |
CN109461436A (zh) * | 2018-10-23 | 2019-03-12 | 广东小天才科技有限公司 | 一种语音识别发音错误的纠正方法及系统 |
CN109686365A (zh) * | 2018-12-26 | 2019-04-26 | 深圳供电局有限公司 | 一种语音识别方法和语音识别系统 |
CN110021293A (zh) * | 2019-04-08 | 2019-07-16 | 上海汽车集团股份有限公司 | 语音识别方法及装置、可读存储介质 |
CN111918173A (zh) * | 2020-07-22 | 2020-11-10 | 浙江大丰实业股份有限公司 | 一种舞台音响的保护系统和使用方法 |
CN112786052A (zh) * | 2020-12-30 | 2021-05-11 | 科大讯飞股份有限公司 | 语音识别方法、电子设备和存储装置 |
CN112992184A (zh) * | 2021-04-20 | 2021-06-18 | 北京世纪好未来教育科技有限公司 | 一种发音评测方法、装置、电子设备和存储介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1183607A (zh) * | 1996-10-31 | 1998-06-03 | 微软公司 | 在语音识别过程中显示可变数目的替换单词的方法和系统 |
CN1645477A (zh) * | 2004-01-20 | 2005-07-27 | 微软公司 | 使用用户纠正的自动语音识别学习 |
CN1941077A (zh) * | 2005-09-27 | 2007-04-04 | 株式会社东芝 | 识别语音输入中的字符串的语音识别设备和方法 |
CN101105939A (zh) * | 2007-09-04 | 2008-01-16 | 安徽科大讯飞信息科技股份有限公司 | 发音指导方法 |
CN101221759A (zh) * | 2001-03-28 | 2008-07-16 | 高通股份有限公司 | 使用隐含语者自适应的语音识别系统 |
CN101266792A (zh) * | 2007-03-16 | 2008-09-17 | 富士通株式会社 | 语音识别系统和语音识别方法 |
CN101923854A (zh) * | 2010-08-31 | 2010-12-22 | 中国科学院计算技术研究所 | 一种交互式语音识别系统和方法 |
US20150255067A1 (en) * | 2006-04-05 | 2015-09-10 | Canyon IP Holding LLC | Filtering transcriptions of utterances using received information to correct transcription errors |
CN105047198A (zh) * | 2015-08-24 | 2015-11-11 | 百度在线网络技术(北京)有限公司 | 语音纠错处理方法及装置 |
CN105469789A (zh) * | 2014-08-15 | 2016-04-06 | 中兴通讯股份有限公司 | 一种语音信息的处理方法及终端 |
CN105632499A (zh) * | 2014-10-31 | 2016-06-01 | 株式会社东芝 | 用于优化语音识别结果的方法和装置 |
CN105808197A (zh) * | 2014-12-30 | 2016-07-27 | 联想(北京)有限公司 | 一种信息处理方法和电子设备 |
CN106847288A (zh) * | 2017-02-17 | 2017-06-13 | 上海创米科技有限公司 | 语音识别文本的纠错方法与装置 |
CN106875939A (zh) * | 2017-01-13 | 2017-06-20 | 佛山市父母通智能机器人有限公司 | 对大范围波动的汉语方言语音识别处理方法及智能机器人 |
CN107301865A (zh) * | 2017-06-22 | 2017-10-27 | 海信集团有限公司 | 一种用于语音输入中确定交互文本的方法和装置 |
-
2017
- 2017-11-30 CN CN201711239000.7A patent/CN107993653A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1183607A (zh) * | 1996-10-31 | 1998-06-03 | 微软公司 | 在语音识别过程中显示可变数目的替换单词的方法和系统 |
CN101221759A (zh) * | 2001-03-28 | 2008-07-16 | 高通股份有限公司 | 使用隐含语者自适应的语音识别系统 |
CN1645477A (zh) * | 2004-01-20 | 2005-07-27 | 微软公司 | 使用用户纠正的自动语音识别学习 |
CN1941077A (zh) * | 2005-09-27 | 2007-04-04 | 株式会社东芝 | 识别语音输入中的字符串的语音识别设备和方法 |
US20150255067A1 (en) * | 2006-04-05 | 2015-09-10 | Canyon IP Holding LLC | Filtering transcriptions of utterances using received information to correct transcription errors |
CN101266792A (zh) * | 2007-03-16 | 2008-09-17 | 富士通株式会社 | 语音识别系统和语音识别方法 |
CN101105939A (zh) * | 2007-09-04 | 2008-01-16 | 安徽科大讯飞信息科技股份有限公司 | 发音指导方法 |
CN101923854A (zh) * | 2010-08-31 | 2010-12-22 | 中国科学院计算技术研究所 | 一种交互式语音识别系统和方法 |
CN105469789A (zh) * | 2014-08-15 | 2016-04-06 | 中兴通讯股份有限公司 | 一种语音信息的处理方法及终端 |
CN105632499A (zh) * | 2014-10-31 | 2016-06-01 | 株式会社东芝 | 用于优化语音识别结果的方法和装置 |
CN105808197A (zh) * | 2014-12-30 | 2016-07-27 | 联想(北京)有限公司 | 一种信息处理方法和电子设备 |
CN105047198A (zh) * | 2015-08-24 | 2015-11-11 | 百度在线网络技术(北京)有限公司 | 语音纠错处理方法及装置 |
CN106875939A (zh) * | 2017-01-13 | 2017-06-20 | 佛山市父母通智能机器人有限公司 | 对大范围波动的汉语方言语音识别处理方法及智能机器人 |
CN106847288A (zh) * | 2017-02-17 | 2017-06-13 | 上海创米科技有限公司 | 语音识别文本的纠错方法与装置 |
CN107301865A (zh) * | 2017-06-22 | 2017-10-27 | 海信集团有限公司 | 一种用于语音输入中确定交互文本的方法和装置 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019227548A1 (zh) * | 2018-05-31 | 2019-12-05 | 平安科技(深圳)有限公司 | 语音识别方法、装置、计算机设备及存储介质 |
CN108766437A (zh) * | 2018-05-31 | 2018-11-06 | 平安科技(深圳)有限公司 | 语音识别方法、装置、计算机设备及存储介质 |
CN109064789A (zh) * | 2018-08-17 | 2018-12-21 | 重庆第二师范学院 | 一种伴随脑瘫性口齿不清辅助控制系统及方法、辅助器 |
CN109461436A (zh) * | 2018-10-23 | 2019-03-12 | 广东小天才科技有限公司 | 一种语音识别发音错误的纠正方法及系统 |
CN109461436B (zh) * | 2018-10-23 | 2020-12-15 | 广东小天才科技有限公司 | 一种语音识别发音错误的纠正方法及系统 |
CN109686365B (zh) * | 2018-12-26 | 2021-07-13 | 深圳供电局有限公司 | 一种语音识别方法和语音识别系统 |
CN109686365A (zh) * | 2018-12-26 | 2019-04-26 | 深圳供电局有限公司 | 一种语音识别方法和语音识别系统 |
CN110021293A (zh) * | 2019-04-08 | 2019-07-16 | 上海汽车集团股份有限公司 | 语音识别方法及装置、可读存储介质 |
CN111918173A (zh) * | 2020-07-22 | 2020-11-10 | 浙江大丰实业股份有限公司 | 一种舞台音响的保护系统和使用方法 |
CN111918173B (zh) * | 2020-07-22 | 2021-10-29 | 浙江大丰实业股份有限公司 | 一种舞台音响的保护系统和使用方法 |
CN112786052A (zh) * | 2020-12-30 | 2021-05-11 | 科大讯飞股份有限公司 | 语音识别方法、电子设备和存储装置 |
CN112786052B (zh) * | 2020-12-30 | 2024-05-31 | 科大讯飞股份有限公司 | 语音识别方法、电子设备和存储装置 |
CN112992184A (zh) * | 2021-04-20 | 2021-06-18 | 北京世纪好未来教育科技有限公司 | 一种发音评测方法、装置、电子设备和存储介质 |
CN112992184B (zh) * | 2021-04-20 | 2021-09-10 | 北京世纪好未来教育科技有限公司 | 一种发音评测方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107993653A (zh) | 语音识别设备的错误发音自动纠正更新方法和更新系统 | |
CN104575490B (zh) | 基于深度神经网络后验概率算法的口语发音评测方法 | |
CN101105939B (zh) | 发音指导方法 | |
CN108682417B (zh) | 语音识别中的小数据语音声学建模方法 | |
CN101246685B (zh) | 计算机辅助语言学习系统中的发音质量评价方法 | |
CN109461436B (zh) | 一种语音识别发音错误的纠正方法及系统 | |
JP2017058674A (ja) | 音声認識のための装置及び方法、変換パラメータ学習のための装置及び方法、コンピュータプログラム並びに電子機器 | |
CN104464423A (zh) | 一种口语考试评测的校标优化方法及系统 | |
CN105261246A (zh) | 一种基于大数据挖掘技术的英语口语纠错系统 | |
Abro et al. | Qur'an recognition for the purpose of memorisation using Speech Recognition technique | |
US9805740B2 (en) | Language analysis based on word-selection, and language analysis apparatus | |
Sinclair et al. | A semi-markov model for speech segmentation with an utterance-break prior | |
Ibrahim et al. | Improve design for automated Tajweed checking rules engine of Quranic verse recitation: a review | |
Koudounas et al. | Italic: An italian intent classification dataset | |
Ashihara et al. | SpeechGLUE: How well can self-supervised speech models capture linguistic knowledge? | |
WO2019075827A1 (zh) | 一种语音评价方法及装置 | |
TW201937479A (zh) | 一種多語言混合語音識別方法 | |
CN107958666A (zh) | 用于口音不变语音识别的方法 | |
CN111898342A (zh) | 一种基于编辑距离的中文发音校验方法 | |
Huang et al. | English mispronunciation detection based on improved GOP methods for Chinese students | |
KR20130126570A (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
Zheng | [Retracted] An Analysis and Research on Chinese College Students’ Psychological Barriers in Oral English Output from a Cross‐Cultural Perspective | |
CN111128181B (zh) | 背诵题评测方法、装置以及设备 | |
Wang et al. | Automatic generation and pruning of phonetic mispronunciations to support computer-aided pronunciation training. | |
Singhal et al. | wspire: A parallel multi-device corpus in neutral and whispered speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180504 |
|
RJ01 | Rejection of invention patent application after publication |