CN107591156B

CN107591156B - 语音识别方法及装置

Info

Publication number: CN107591156B
Application number: CN201710935699.4A
Authority: CN
Inventors: 王琪; 张楠赓
Original assignee: Canaan Bright Sight Co Ltd
Current assignee: Canaan Bright Sight Co Ltd
Priority date: 2017-10-10
Filing date: 2017-10-10
Publication date: 2021-07-16
Anticipated expiration: 2037-10-10
Also published as: CN107591156A

Abstract

本发明公开了一种语音识别方法及装置。所述方法包括：接收当前输入的语音信息；获取所述语音信息对应的当前状态信息；基于预设语音识别库和/或所述当前状态信息对所述语音信息进行识别。通过本发明的技术方案，可通过结合当前状态信息提高语音识别率，避免由于需要采用遍历的方法匹配语音库中的所有词汇而导致匹配效率低，进而导致语音识别效率低、延迟较大等问题，如此，也有利于降低语音识别负担。

Description

语音识别方法及装置

技术领域

本发明涉及语音技术领域，特别涉及一种语音识别方法及装置。

背景技术

目前，在进行语音识别时，均是将待识别的语音与语音识别库进行匹配，从而对语音进行识别，但相关技术中在匹配时，是将待识别的语音与语音识别库中有固定排序的所有词汇依次进行顺序匹配从而完成语音识别的，这就使得语音识别效率低、延迟比较大，同时也增加了语音识别系统的负担。

发明内容

本发明提供一种语音识别方法及装置，用以在接收到当前输入的语音信息时，可获取语音信息对应的当前状态信息，进而基于预设语音识别库和/或当前状态信息对语音信息进行识别，从而通过结合当前状态信息提高语音识别率，避免由于需要采用遍历的方法匹配语音库中的所有词汇而导致匹配效率低，进而导致语音识别效率低、延迟较大等问题，如此，也有利于降低语音识别系统的负担。

本发明提供一种语音识别方法，包括：

接收当前输入的语音信息；

获取所述语音信息对应的当前状态信息；

基于预设语音识别库和/或所述当前状态信息对所述语音信息进行识别。

在一个实施例中，所述方法还包括：

在对所述语音信息进行识别后，根据所述语音信息的识别结果对所述预设语音识别库进行调整。

在一个实施例中，所述根据所述语音信息的识别结果对所述语音识别库进行调整，包括：

当所述语音信息与所述预设语音识别库中预设词汇相匹配时，将所述预设词汇确定为所述识别结果；

根据所述预设词汇调整所述预设语音识别库。

在一个实施例中，所述根据所述预设词汇调整所述预设语音识别库，包括：

根据所述预设词汇调整所述预设语音识别库中各词汇的存储排序。

在一个实施例中，所述基于预设语音识别库和/或所述当前状态信息对所述语音信息进行识别，包括：

从调整顺序后的所述预设语音识别库的开头依次与所述语音信息进行匹配，以对所述语音信息进行识别。

在一个实施例中，所述方法还包括：

当所述预设语音识别库中的词汇按照状态信息的不同分类存储时，根据所述当前状态信息，调整各状态信息对应的词汇在所述预设识别库中的排序。

确定所述预设语音识别库中与所述当前状态信息对应的词汇；

从所述当前状态信息对应的词汇的开头依次与所述语音信息进行匹配，以对所述语音信息进行识别。

在一个实施例中，所述当前状态信息包括但不限于以下至少一项：

接收到所述语音信息时用户所在位置、用户所处位置的环境、时间信息、天气信息、用户的个人状态、用户的历史语音识别词汇。

本发明还提供一种语音识别装置，包括：

接收模块，用于接收当前输入的语音信息；

获取模块，用于获取所述语音信息对应的当前状态信息；

识别模块，用于基于预设语音识别库和/或所述当前状态信息对所述语音信息进行识别。

在一个实施例中，所述装置还包括：

第一调整模块，用于在对所述语音信息进行识别后，根据所述语音信息的识别结果对所述预设语音识别库进行调整。

在一个实施例中，所述第一调整模块包括：

第一确定子模块，用于当所述语音信息与所述预设语音识别库中预设词汇相匹配时，将所述预设词汇确定为所述识别结果；

调整子模块，用于根据所述预设词汇调整所述预设语音识别库。

在一个实施例中，所述调整子模块包括：

调整单元，用于根据所述预设词汇调整所述预设语音识别库中各词汇的存储排序。

在一个实施例中，所述识别模块包括：

匹配子模块，用于从调整顺序后的所述预设语音识别库的开头依次与所述语音信息进行匹配，以对所述语音信息进行识别。

在一个实施例中，所述装置还包括：

第二调整模块，用于当所述预设语音识别库中的词汇按照状态信息的不同分类存储时，根据所述当前状态信息，调整各状态信息对应的词汇在所述预设识别库中的排序。

在一个实施例中，所述识别模块包括：

第二确定子模块，用于确定所述预设语音识别库中与所述当前状态信息对应的词汇；

识别子模块，用于从所述当前状态信息对应的词汇的开头依次与所述语音信息进行匹配，以对所述语音信息进行识别。

在一个实施例中，所述当前状态信息包括以下至少一项：

本公开的实施例提供的技术方案可以包括以下有益效果：

在接收到当前输入的语音信息时，可获取所述语音信息对应的当前状态信息，进而基于预设语音识别库和/或所述当前状态信息对所述语音信息进行识别，从而通过结合当前状态信息提高语音识别率，避免由于需要采用遍历的方法匹配语音库中的所有词汇而导致匹配效率低，进而导致语音识别效率低、延迟较大等问题，如此，也有利于降低语音识别负担。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是根据一示例性实施例示出的一种语音识别方法的流程图。

图2是根据一示例性实施例示出的另一种语音识别方法的流程图。

图3是根据一示例性实施例示出的又一种语音识别方法的流程图。

图4是根据一示例性实施例示出的一种语音识别装置的框图。

图5是根据一示例性实施例示出的另一种语音识别装置的框图。

图6是根据一示例性实施例示出的又一种语音识别装置的框图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

为了解决上述技术问题，本公开实施例提供了一种语音识别方法，该方法适用于语音识别程序、系统或装置中，其执行主体可以是手机等终端，如图1所示，步骤S101至步骤S103，其中：

在步骤S101中，接收当前输入的语音信息；

在步骤S102中，获取语音信息对应的当前状态信息；

其中，当前状态信息包括但不限于以下至少一项：

接收到语音信息时用户所在位置、用户所处位置的环境、时间信息、天气信息、用户的个人状态、用户的历史语音识别词汇。

在步骤S103中，基于预设语音识别库和/或当前状态信息对语音信息进行识别。

在接收到当前输入的语音信息时，可获取语音信息对应的当前状态信息，进而基于预设语音识别库和/或当前状态信息对语音信息进行识别，从而通过结合当前状态信息提高语音识别率，避免由于需要采用遍历的方法匹配语音库中的所有词汇而导致匹配效率低，进而导致语音识别效率低、延迟较大等问题，如此，也有利于降低语音识别负担。

在一个实施例中，方法还包括：

在对语音信息进行识别后，根据语音信息的识别结果对预设语音识别库进行调整。

在对语音信息进行识别后，根据语音信息的识别结果对预设语音识别库进行自动调整，如此，可通过不断调整预设语音识别库进一步提高后续的语音识别效率和时效性，以缩短语音识别时间，减少用户的等待时间。

如图2所示，在一个实施例中，根据语音信息的识别结果对语音识别库进行调整，可被执行为：

在步骤S201中，当语音信息与预设语音识别库中预设词汇相匹配时，将预设词汇确定为识别结果；

在步骤S202中，根据预设词汇调整预设语音识别库。

当语音信息与预设语音识别库中预设词汇相匹配时，可自动将预设词汇确定为识别结果，以根据该预设词汇动态调整预设语音识别库，如此，可进一步提高后续的语音识别效率和时效性，以缩短语音识别时间，减少用户的等待时间。

在一个实施例中，根据预设词汇调整预设语音识别库，包括：

根据预设词汇调整预设语音识别库中各词汇的存储排序。

在根据预设词汇调整预设语音识别库时，可根据预设词汇调整预设语音识别库中各词汇的存储排序，如根据该预设词汇的累计匹配次数将其在预设语音识别库中的存储排序向前调整，这样，预设语音识别库中词汇的次序就可被动态调整，从而使得匹配可能性高的词汇被逐步移动到预设语音识别库的头部，这样，有利于提高词汇的识别效率、减少识别延迟，同时也有利于降低语音识别负担。

在一个实施例中，基于预设语音识别库和/或当前状态信息对语音信息进行识别，包括：

从调整顺序后的预设语音识别库的开头依次与语音信息进行匹配，以对语音信息进行识别。

在进行语音识别时，可从调整顺序后的预设语音识别库的开头依次与语音信息进行匹配，以对语音信息进行识别，由于本实施例中语音识别库中的各词汇的排序会被不断优化，以最大程度地吻合用户习惯，因而这种识别方式相比于使用相关技术中词汇顺序固定的语音识别库而言，可以提高语音识别效率、减少识别延迟。

在一个实施例中，方法还包括：

当预设语音识别库中的词汇按照状态信息的不同分类存储时，根据当前状态信息，调整各状态信息对应的词汇在预设识别库中的排序。

当预设语音识别库中的词汇按照状态信息的不同分类存储时，可根据该当前状态信息，自动调整各状态信息对应的词汇在预设识别库中的排序，例如，将该当前状态信息对应的词汇在预设识别库中的顺序向前调整，以提高该当前状态信息对应的词汇的优先匹配率，当然，在调整各状态信息对应的词汇在预设识别库中的排序后，也可以将预设语音识别库中与该语音信息相匹配的预设词汇在该当前状态信息对应的词汇中的排序进行调整，以不断优化预设语音识别库中各词汇的排序，从而提高语音匹配效率、减少延迟。

如图3所示，在一个实施例中，基于预设语音识别库和/或当前状态信息对语音信息进行识别，包括：

在步骤S301中，确定预设语音识别库中与当前状态信息对应的词汇；

在步骤S302中，从当前状态信息对应的词汇的开头依次与语音信息进行匹配，以对语音信息进行识别。

当预设语音识别库中的词汇按照状态信息的不同分类存储时，在进行语音识别时，可确定预设语音识别库中与当前状态信息对应的词汇，进而从当前状态信息对应的词汇的开头依次与语音信息进行匹配，以对语音信息进行准确识别，这相比于需要与预设语音识别库中的所有词汇均进行匹配而言，可有效减少匹配次数，进而提高识别效率并缩短识别时间。

例如：如果通过摄像头确定了用户所在物理位置，比如电视机前，则在语音识别时，首先匹配与电视相关的词汇；

如果温度高于预定值，则在语音识别时，首先匹配空调相关词汇；

如果进入晚间，则在语音识别时，首先匹配照明开关词汇；

当该当前状态信息与某个历史习惯相契合时，根据首先匹配该用户的历史语音识别词汇。

当然，需要说明的是：在本发明中用户还可以根据需求，自由调整预设语音识别库中各词汇的存储顺序以及各当前状态信息的优先级。

在一个实施例中，当前状态信息包括但不限于以下至少一项：

其中，用户所在位置、用户所处位置的环境可通过麦克风、摄像头、红外传感器等设备获取，而天气信息可通过应用、温度传感器、湿度传感器等获取。

用户的个人状态可以是姿态、表情、情绪、健康状况等。

如图4所示，本发明还提供一种语音识别装置，包括：

接收模块401，被配置为接收当前输入的语音信息；

获取模块402，被配置为获取语音信息对应的当前状态信息；

识别模块403，被配置为基于预设语音识别库和/或当前状态信息对语音信息进行识别。

如图5所示，在一个实施例中，上述图4所示的装置还可包括：

第一调整模块501，被配置为在对语音信息进行识别后，根据语音信息的识别结果对预设语音识别库进行调整。

如图6所示，在一个实施例中，第一调整模块501可以包括：

第一确定子模块5011，被配置为当语音信息与预设语音识别库中预设词汇相匹配时，将预设词汇确定为识别结果；

调整子模块5012，被配置为根据预设词汇调整预设语音识别库。

在一个实施例中，调整子模块5012可以包括：

调整单元，被配置为根据预设词汇调整预设语音识别库中各词汇的存储排序。

在一个实施例中，识别模块包括：

匹配子模块，被配置为从调整顺序后的预设语音识别库的开头依次与语音信息进行匹配，以对语音信息进行识别。

在一个实施例中，装置还包括：

第二调整模块，被配置为当预设语音识别库中的词汇按照状态信息的不同分类存储时，根据当前状态信息，调整各状态信息对应的词汇在预设识别库中的排序。

在一个实施例中，识别模块包括：

第二确定子模块，被配置为确定预设语音识别库中与当前状态信息对应的词汇；

识别子模块，被配置为从当前状态信息对应的词汇的开头依次与语音信息进行匹配，以对语音信息进行识别。

在一个实施例中，当前状态信息包括以下至少一项：

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

最后，本发明中的语音识别装置适用于终端设备。例如，可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种语音识别方法，其特征在于，包括：

接收当前输入的语音信息；

获取所述语音信息对应的当前状态信息；

基于预设语音识别库和所述当前状态信息对所述语音信息进行识别；

当所述语音信息与所述预设语音识别库中预设词汇相匹配时，将所述预设词汇确定为识别结果；

根据所述预设词汇调整所述预设语音识别库。

2.根据权利要求1所述的方法，其特征在于，

所述根据所述预设词汇调整所述预设语音识别库，包括：

3.根据权利要求2所述的方法，其特征在于，

所述基于预设语音识别库和所述当前状态信息对所述语音信息进行识别，包括：

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

当所述预设语音识别库中的词汇按照状态信息的不同分类存储时，根据所述当前状态信息，调整各状态信息对应的词汇在所述预设语音识别库中的排序。

5.根据权利要求4所述的方法，其特征在于，

6.根据权利要求1至5中任一项所述的方法，其特征在于，

所述当前状态信息包括以下至少一项：

7.一种语音识别装置，其特征在于，包括：

接收模块，用于接收当前输入的语音信息；

获取模块，用于获取所述语音信息对应的当前状态信息；

识别模块，用于基于预设语音识别库和所述当前状态信息对所述语音信息进行识别；

第一调整模块，用于在对所述语音信息进行识别后，根据所述语音信息的识别结果对所述预设语音识别库进行调整，所述第一调整模块包括：

8.根据权利要求7所述的装置，其特征在于，

所述调整子模块包括：

9.根据权利要求8所述的装置，其特征在于，

所述识别模块包括：

10.根据权利要求7所述的装置，其特征在于，所述装置还包括：

第二调整模块，用于当所述预设语音识别库中的词汇按照状态信息的不同分类存储时，根据所述当前状态信息，调整各状态信息对应的词汇在所述预设语音识别库中的排序。

11.根据权利要求10所述的装置，其特征在于，

所述识别模块包括：

12.根据权利要求7至11中任一项所述的装置，其特征在于，

所述当前状态信息包括以下至少一项：