CN107993653A

CN107993653A - 语音识别设备的错误发音自动纠正更新方法和更新系统

Info

Publication number: CN107993653A
Application number: CN201711239000.7A
Authority: CN
Inventors: 李晓飞
Original assignee: Nanjing Yun You Intelligent Technology Co Ltd
Current assignee: Nanjing Yun You Intelligent Technology Co Ltd
Priority date: 2017-11-30
Filing date: 2017-11-30
Publication date: 2018-05-04

Abstract

本发明公开了语音识别设备的错误发音自动纠正更新方法和更新系统，包括语音识别设备和云服务器，所述语音识别设备包括麦克风、音响装置、语音对比器、声学模型库、发音纠正装置和错误发音语料库；通过麦克风获取语音识别信息，并与声学模型库对比并且计算发音符合度，如符合度低于门限值，则判断错误发音语料库内有无错误语音，如果有，则直接使用错误发音语料库内的正确语音片段替换错误语音，并且从音响装置输出；否则，调取声学模型库内的标准发音替换错误语音，并且使用输出装置输出，然后将当前错误发音和声学模型库对应的标准发音存储至错误发音语料库，从而达到智能辅助语言训练，并自动记录错误发音习惯和自动纠偏的技术目的。

Description

语音识别设备的错误发音自动纠正更新方法和更新系统

技术领域

本发明涉及语音识别技术领域，特别是涉及一种语音识别设备的错误发音自动纠正更新方法和系统。

背景技术

语音识别是一种利用机器模拟人类的识别和理解过程、把人类的语音信号转变为相应的文本或命令的技术。语音识别的根本目的是研究出一种具有听觉功能的机器，能直接接受人的语音，理解人的意图，并做出相应的反应。从技术上看，它属于多维模式识别和智能接口的范畴。

在语音识别技术中，最简单的是对特定人、小词汇量、孤立词的语音识别，最复杂、最难的是对非特定人、大词汇量、连续语音的语音识别。目前主要采用的主流算法是隐马尔可夫模型方法。

语音识别系统在本质上是一种模式识别系统，通常包括特征提取、模式匹配和参考模式库等基本单元，如图1所示。语音信号先经过特征提取后形成特征矢量，并利用词典和子词模型集合串接成的词模型进行识别，然后根据语言模型的句法限制在句子级进行输入语音与参考模板间的匹配，最后识别出相应的句子。因此，语言模型的确定对于语音识别系统至关重要。

现有技术中，语言模型一般是直接利用大型语料库进行训练得到的，但是对于特定语种或者特定领域，我们没有相关的语料库，根本无法训练得到语言模型。目前一般的做法是跨地区甚至跨国抓取HTML语料，从而得到相应语种的语料库，以利用得到的语料库对语言模型进行训练。但是通过抓取HTML语料的做法是比较困难的，且得到的语料质量较差不一定好，特别是对于特定的领域，例如电话客服领域，根本无法得到相应的语料。这种使用就必须采用人工标注的方法建立相应的语料库，这种办法需要很多会该语种的人录制并制作语料库，周期长且花费较大。

发明内容

为了克服上述现有技术的不足，本发明提供了一种语音识别设备的错误发音自动纠正更新方法和系统，包括语音识别设备和云服务器，所述语音识别设备包括麦克风、音响装置、语音对比器、声学模型库、发音纠正装置和错误发音语料库；通过麦克风获取语音识别信息，并与声学模型库对比并且计算发音符合度，如符合度低于门限值，则判断错误发音语料库内有无错误语音，如果有，则直接使用错误发音语料库内的正确语音片段替换错误语音，并且从音响装置输出；否则，调取声学模型库内的标准发音替换错误语音，并且使用输出装置输出，然后将当前错误发音和声学模型库对应的标准发音存储至错误发音语料库，以达到智能辅助语言训练，并自动记录错误发音习惯和自动纠偏的技术目的。

本发明所采用的技术方案是：语音识别设备的错误发音自动纠正更新方法，包括如下步骤：

S100、通过麦克风获取语音识别信息；

S200、与声学模型库对比并且计算符合度，如果符合度低于门限值，则进入步骤S400，否则，执行步骤S300；

S300、从音响装置输出当前正确发音；

S400、判断错误发音语料库内有无错误语音，如果有，则进入步骤S500，否则，进入步骤S600；

S500、直接使用错误发音语料库内的正确语音片段替换错误语音，并且从音响装置输出；

S600、调取声学模型库内的标准发音替换错误语音，并且使用输出装置输出；

S700、将当前错误发音和声学模型库对应的标准发音存储至错误发音语料库。

更优地，在S100之前，语音识别设备已预存声学模型库数据。

更优地，符合度门限值为0.3-0.5。

更优地，S700的后续步骤还包括：S701、将当前错误发音和声学模型库对应的标准发音上传到云服务器，以分享给其他语音识别设备的错误发音语料库。

语音识别设备的错误发音自动纠正更新系统，包括语音识别设备和云服务器，语音识别设备包括麦克风、音响装置、语音对比器、声学模型库、发音纠正装置和错误发音语料库，错误发音语料库和云服务器具有网络连接，并且：

语音对比器用于比较当前发音是否跟声学模型库中的标准发音相符合，并计算符合度；

发音纠正装置用于将用户当前的错误语音直接用错误发音语料库中相对应的正确语音片段替换；

错误发音语料库用于存储用户的错误发音和声学模型库中标准发音之间的对应关系。

更优地，语音识别设备在运行工作之前，已预存声学模型库数据，这些声学模型库数据为隐马尔可夫模型HMM，其用HMM刻画语音信号作出两个假设，一是内部状态的转移只与上一状态有关，另一是输出值只与当前状态或当前的状态转移有关。

与现有技术相比，本发明的有益效果是：

首先，本发明可将当前用户的错误语音直接使用错误发音语料库内的正确语音片段替换，从而极大提高用户训练口语和方言的速度，降低了学习成本，并可标准化应用于同声传译；

其次，本发明将当前用户的错误发音作为样本上传到云服务器共享，有利于同一地区方言的用户快速提高错误发音资料库的训练速度，缩短语音识别设备的优化进程。

附图说明

图1为一种语音识别设备的错误发音自动纠正更新的流程图，

图2为一种语音识别设备的错误发音自动纠正更新系统的组成结构图。

具体实施方式

为了加深对本发明的理解，下面结合附图和实施例对本发明进一步说明，该实施例仅用于解释本发明，并不对本发明的保护范围构成限定。

如图1所示，语音识别设备的错误发音自动纠正更新方法，包括如下步骤：

S100、通过麦克风获取语音识别信息；

S300、从音响装置输出当前正确发音；

更优地，在S100之前，语音识别设备已预存声学模型库数据。

更优地，符合度门限值为0.3-0.5。

如图2所示，语音识别设备的错误发音自动纠正更新系统，包括语音识别设备100和云服务器200，语音识别设备包括麦克风101、音响装置105、语音对比器102、声学模型库103、发音纠正装置104和错误发音语料库106，错误发音语料库和云服务器具有网络连接，并且：语音对比器用于比较当前发音是否跟声学模型库中的标准发音相符合，并计算符合度；发音纠正装置用于将用户当前的错误语音直接用错误发音语料库中相对应的正确语音片段替换；错误发音语料库用于存储用户的错误发音和声学模型库中标准发音之间的对应关系。

本发明的实施例公布的是较佳的实施例，但并不局限于此，本领域的普通技术人员，极易根据上述实施例，领会本发明的精神，并做出不同的引申和变化，但只要不脱离本发明的精神，都在本发明的保护范围内。

Claims

1.语音识别设备的错误发音自动纠正更新方法，其特征在于，包括如下步骤：

S100、通过麦克风获取语音识别信息；

S300、从音响装置输出当前正确发音；

2.根据权利要求1所述的语音识别设备的错误发音自动纠正更新方法，其特征在于：在S100之前，语音识别设备已预存声学模型库数据。

3.根据权利要求1所述的语音识别设备的错误发音自动纠正更新方法，其特征在于：所述符合度门限值为0.3-0.5。

4.根据权利要求1-3任意一项所述的语音识别设备的错误发音自动纠正更新方法，其特征在于：S700的后续步骤还包括：

S701、将当前错误发音和声学模型库对应的标准发音上传到云服务器，以分享给其他语音识别设备的错误发音语料库。

5.根据权利要求1所述的语音识别设备的错误发音自动纠正更新系统，其特征在于，包括语音识别设备和云服务器，所述语音识别设备包括麦克风、音响装置、语音对比器、声学模型库、发音纠正装置和错误发音语料库，所述错误发音语料库和云服务器具有网络连接，并且：

所述语音对比器用于比较当前发音是否跟声学模型库中的标准发音相符合，并计算符合度；

所述发音纠正装置用于将用户当前的错误语音直接用错误发音语料库中相对应的正确语音片段替换；

所述错误发音语料库用于存储用户的错误发音和声学模型库中标准发音之间的对应关系。

6.根据权利要求5所述的语音识别设备的错误发音自动纠正更新系统，其特征在于：所述语音识别设备在运行工作之前，已预存声学模型库数据，这些声学模型库数据为隐马尔可夫模型HMM，其用HMM刻画语音信号作出两个假设，一是内部状态的转移只与上一状态有关，另一是输出值只与当前状态或当前的状态转移有关。