CN111354337A

CN111354337A - 语音识别方法以及用户终端

Info

Publication number: CN111354337A
Application number: CN201811580728.0A
Authority: CN
Inventors: 李杨; 汪凯; 李众欢
Original assignee: Shanghai Industrial Utechnology Research Institute
Current assignee: Shanghai Industrial Utechnology Research Institute
Priority date: 2018-12-24
Filing date: 2018-12-24
Publication date: 2020-06-30

Abstract

本发明提供了一种语音识别方法，包括如下步骤：将原始语音保存在一临时栈中；在所述临时栈中提取第一段语音形成第一特征序列；将第一特征序列送入语音识别引擎进行识别获得第一词序列并保存；识别完毕后，在所述临时栈中提取与第一段语音紧接的第二段语音形成第二特征序列；将第一特征序列送入语音识别引擎进行识别获得第二次序列，并接续保存在第一词序列之后。

Description

语音识别方法以及用户终端

技术领域

本发明涉及计算机领域，尤其涉及一种语音识别方法以及用户终端。

背景技术

语音识别是智能电子产品的基础技术，通过语音识别可以实现电子产品的声控、解锁、文字输入等多种功能。

现有技术的语音识别技术需要在识别某一段语音之后，再去抓取下一段语音。由于每次识别需要1-100毫秒的时间，因此这样的方法在对连续输入的语音进行识别的时候，会存在1-100毫秒的语音信号无法被采集，会有丢字的情况。如何解决上述问题，是现有技术需要解决的问题。

发明内容

本发明所要解决的技术问题是，提供一种语音识别方法以及用户终端，避免语音识别的丢字情况。

为了解决上述问题，本发明提供了一种语音识别方法，包括如下步骤：将原始语音保存在一临时栈中；在所述临时栈中提取第一段语音形成第一特征序列；将第一特征序列送入语音识别引擎进行识别获得第一词序列并保存；识别完毕后，在所述临时栈中提取与第一段语音紧接的第二段语音形成第二特征序列；将第一特征序列送入语音识别引擎进行识别获得第二次序列，并接续保存在第一词序列之后。

可选的，持续获取原始语音，并接续保存在所述临时栈中。

可选的，获得第一词序列并保存后，删除第一段语音。

可选的，获得第二词序列并保存后，删除第二段语音。

本发明还提供了一种用户终端，包括语音收集模块和语音处理模块，所述语音处理模块在获取所述语音收集模块收集的原始语音后，执行如下步骤：将原始语音保存在一临时栈中；在所述临时栈中提取第一段语音形成第一特征序列；将第一特征序列送入语音识别引擎进行识别获得第一词序列并保存；识别完毕后，在所述临时栈中提取与第一段语音紧接的第二段语音形成第二特征序列；将第一特征序列送入语音识别引擎进行识别获得第二次序列，并接续保存在第一词序列之后。

本发明由于设置了临时栈，保证采样是连续进行的，不受识别时间的影响，不会出现间断，因此输出的文字不会出现丢字的问题。

附图说明

附图1是本发明一具体实施方式所述方法的实施步骤示意图。

附图2是本发明一具体实施方式的原始语音的模拟波形图。

附图3是本发明一具体实施方式所述装置的结构示意图。

具体实施方式

下面结合附图对本发明提供的语音识别方法以及用户终端的具体实施方式做详细说明。

附图1是本具体实施方式所述方法的实施步骤示意图，包括：步骤S10，将原始语音保存在一临时栈中；步骤S11，在所述临时栈中提取第一段语音形成第一特征序列；步骤S12，将第一特征序列送入语音识别引擎进行识别获得第一词序列并保存；步骤S13，识别完毕后，在所述临时栈中提取与第一段语音紧接的第二段语音形成第二特征序列；步骤S14，将第一特征序列送入语音识别引擎进行识别获得第二次序列，并接续保存在第一词序列之后。

参考步骤S10，将原始语音保存在一临时栈中。附图2所示为原始语音的模拟波形图。本步骤中，如果原始语音是一段，则直接将该语音保存在临时栈中，如果原始语音是连续输入的，可以根据时间周期性的获取原始语音，并接续保存在所述临时栈中，形成用于识别的附图2所示的原始语音。

参考步骤S11，在所述临时栈中提取第一段语音V1形成第一特征序列。上述采样可以采用从原始语音信号中提取特征的方式，即从语音波形中提取随时间变化的语音特征序列，作为第一特征序列。

参考步骤S12，将第一特征序列送入语音识别引擎进行识别获得第一词序列并保存。所述语音识别引擎能够将第一特征序列识别为具体的文字。

参考步骤S13，识别完毕后，在所述临时栈中提取与第一段语音V1紧接的第二段语音V2形成第二特征序列。由于原始语音是存在临时栈中的，因此采样可以紧接进行，不会造成丢失。

参考步骤S14，将第一特征序列送入语音识别引擎进行识别获得第二次序列，并接续保存在第一词序列之后。反复执行上述步骤S13和S14，即可以获得连续的文字输出。且由于采样是连续进行的，不受识别时间的影响，不会出现间断，因此输出的文字不会出现丢字的问题。

附图3是本具体实施方式所述装置的结构示意图，包括语音收集模块31和语音处理模块32，所述语音处理模块32在获取所述语音收集模块31收集的原始语音后，执行附图1所示的步骤。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种语音识别方法，其特征在于，包括如下步骤：

将原始语音保存在一临时栈中；

在所述临时栈中提取第一段语音形成第一特征序列；

将第一特征序列送入语音识别引擎进行识别获得第一词序列并保存；

识别完毕后，在所述临时栈中提取与第一段语音紧接的第二段语音形成第二特征序列；

将第一特征序列送入语音识别引擎进行识别获得第二次序列，并接续保存在第一词序列之后。

2.根据权利要求1所述的方法，其特征在于，持续获取原始语音，并接续保存在所述临时栈中。

3.根据权利要求1所述的方法，其特征在于，获得第一词序列并保存后，删除第一段语音。

4.根据权利要求1所述的方法，其特征在于，获得第二词序列并保存后，删除第二段语音。

5.一种用户终端，其特征在于，包括语音收集模块和语音处理模块，所述语音处理模块在获取所述语音收集模块收集的原始语音后，执行如下步骤：将原始语音保存在一临时栈中；

在所述临时栈中提取第一段语音形成第一特征序列；

6.根据权利要求5所述的用户终端，其特征在于，持续获取原始语音，并接续保存在所述临时栈中。

7.根据权利要求5所述的用户终端，其特征在于，获得第一词序列并保存后，删除第一段语音。

8.根据权利要求5所述的用户终端，其特征在于，获得第二词序列并保存后，删除第二段语音。