CN106373565A

CN106373565A - 一种自动切换语音识别引擎的方法

Info

Publication number: CN106373565A
Application number: CN201610712552.4A
Authority: CN
Inventors: 冯海洪; 毛德平
Original assignee: Anhui Mic Technology Co Ltd
Current assignee: Anhui Mic Technology Co Ltd
Priority date: 2016-08-24
Filing date: 2016-08-24
Publication date: 2017-02-01

Abstract

本发明提供一种自动切换语音识别引擎的方法，在使用在线听写引擎和在线识别引擎前检测网络通信质量，判断聚焦情况，在网络通信质量好、聚焦到编辑框时切换到在线听写引擎，在网络通信质量差是直接切换离线识别引擎，在网络通信质量好、聚焦不到编辑框时切换在线识别引擎，并根据在线识别引擎的识别结果判断命令词是否为可编辑命令，在网络通信质量好、命令词为可编辑命令时切换到在线听写引擎，在网络通信质量差、命令词为可编辑命令时自动跳出，在命令词为不可编辑命令时继续使用在线识别引擎，实现在线听写引擎、在线识别引擎和离线识别引擎间的自动切换，大大降低了在线引擎与服务器建立联系时耗费的网络资源和系统资源。

Description

一种自动切换语音识别引擎的方法

技术领域

本发明属于语音识别技术领域，涉及一种语音识别引擎切换方法，具体是一种自动切换语音识别引擎的方法。

背景技术

与机器进行语音交流，让机器明白你说什么，这是人们长期以来梦寐以求的事情。中国物联网校企联盟形象得把语音识别比做为“机器的听觉系统”。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分的引用，例如在翼卡车联网中，只需按一键通客服人员口述即可设置目的地直接导航，安全、便捷。

现有的语音识别软件基本都建立在在线识别引擎和在线听写引擎的技术基础上，由于在线识别引擎和在线听写引擎工作时均需要与服务器建立联系，如果无法在具体应用时进行切换，会极大的耗费网络资源和系统资源。

发明内容

本发明的目的在于提供一种操作简单、的自动切换语音识别引擎的方法。

本发明的目的可以通过以下技术方案实现：

一种自动切换语音识别引擎的方法，包括以下步骤：

步骤S1，会话开始时，首先检测网络通信质量，如果网络通信质量较差，则在线听写引擎和在线识别引擎初始化失败，离线识别引擎初始化成功，执行步骤S6；如果网络通信质量较好，则在线听写引擎、在线识别引擎和离线识别引擎均初始化成功，执行步骤S2；

步骤S2，判断聚焦情况，如果聚焦到编辑框，执行步骤S5；如果聚焦不到编辑框，执行步骤S3；

步骤S3，再次检测网络通信质量，判断在线识别引擎是否可用，如果在线识别引擎可用，执行步骤S4；如果在线识别引擎不可用，执行步骤S6；

步骤S4，通过在线识别引擎进行在线语音识别，根据识别结果进行命令词类型检查，判断命令词是否为可编辑命令，如果命令词为可编辑命令，执行步骤S5，如果命令词为不可编辑命令，继续执行步骤S4；

步骤S5，再次检测网络通信质量，判断在线听写引擎是否可用，如果在线听写引擎可用，执行步骤S7，如果在线听写引擎不可用，执行步骤S8；

步骤S6，通过离线识别引擎进行离线语音识别，会话结束；

步骤S7，利用在线听写引擎进行在线听写任务；

步骤S8，跳出，会话结束。

本发明的有益效果：本发明提供一种自动切换语音识别引擎的方法，在使用在线听写引擎和在线识别引擎前检测网络通信质量，判断聚焦情况，在网络通信质量好、聚焦到编辑框时切换到在线听写引擎，在网络通信质量差是直接切换离线识别引擎，在网络通信质量好、聚焦不到编辑框时切换在线识别引擎，并根据在线识别引擎的识别结果判断命令词是否为可编辑命令，在网络通信质量好、命令词为可编辑命令时切换到在线听写引擎，在网络通信质量差、命令词为可编辑命令时自动跳出，在命令词为不可编辑命令时继续使用在线识别引擎，实现在线听写引擎、在线识别引擎和离线识别引擎间的自动切换，大大降低了在线引擎与服务器建立联系时耗费的网络资源和系统资源。

附图说明

下面结合附图和具体实施例对本发明作进一步详细描述。

图1是本发明的流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

如图1所示，本发明提供了一种自动切换语音识别引擎的方法，包括以下步骤：

步骤S1，会话开始时，首先检测网络通信质量，如果网络通信质量较差，则在线听写引擎和在线识别引擎初始化失败，离线识别引擎初始化成功，执行步骤S6；如果网络通信质量较好，则在线听写引擎、在线识别引擎和离线识别引擎均初始化成功，执行步骤S2。

步骤S2，判断聚焦情况，如果聚焦到编辑框，执行步骤S5；如果聚焦不到编辑框，执行步骤S3。

步骤S3，再次检测网络通信质量，判断在线识别引擎是否可用，如果在线识别引擎可用，执行步骤S4；如果在线识别引擎不可用，执行步骤S6。

步骤S4，通过在线识别引擎进行在线语音识别，根据识别结果进行命令词类型检查，判断命令词是否为可编辑命令，如果命令词为可编辑命令，执行步骤S5，如果命令词为不可编辑命令，继续执行步骤S4。

步骤S5，再次检测网络通信质量，判断在线听写引擎是否可用，如果在线听写引擎可用，执行步骤S7，如果在线听写引擎不可用，执行步骤S8。

步骤S6，通过离线识别引擎进行离线语音识别，会话结束。

步骤S7，利用在线听写引擎进行在线听写任务。

步骤S8，跳出，会话结束。

在本说明书的描述中，参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上内容仅仅是对本发明结构所作的举例和说明，所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，只要不偏离发明的结构或者超越本权利要求书所定义的范围，均应属于本发明的保护范围。

Claims

1.一种自动切换语音识别引擎的方法，其特征在于，包括以下步骤：

步骤S6，通过离线识别引擎进行离线语音识别，会话结束；

步骤S7，利用在线听写引擎进行在线听写任务；

步骤S8，跳出，会话结束。