CN109256125A

CN109256125A - 语音的离线识别方法、装置与存储介质

Info

Publication number: CN109256125A
Application number: CN201811151463.2A
Authority: CN
Inventors: 贺学焱; 宋晔; 欧阳能钧
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Apollo Zhilian Beijing Technology Co Ltd
Priority date: 2018-09-29
Filing date: 2018-09-29
Publication date: 2019-01-22
Anticipated expiration: 2038-09-29
Also published as: CN109256125B

Abstract

本申请实施例公开了一种语音的离线识别方法、装置与存储介质，苏送方法包括：获取语音指令，并将所述语音指令转换成待识别文字；判断辞典中是否存在与所述待识别文字匹配的控制指令，所述辞典包括预设的N个控制指令；若所述辞典中不包括与所述待识别文字匹配的控制指令，则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板；根据所述目标句式模板确定所述待识别文字的意图。即本实施例的方法，在辞典匹配失败之后，进行句式模板的匹配，进而提高了匹配的成功率，提高用户语音识别的体验。

Description

语音的离线识别方法、装置与存储介质

技术领域

本申请实施例涉及语音识别领域，尤其涉及一种语音的离线识别方法、装置与存储介质。

背景技术

语音技术作为最令人期待的人机交互方式，必将逐步成为诸多交互方式中越来越关键的一种。例如，在汽车领域，可利用自然语言理解技术定制出高度实用的智能信息服务系统，用更人性化的人机交互方式提供更便捷、准确的信息语音命令和导航，对于驾驶的体验将是前景广阔的提升。对语音交互来说，离线识别是必不可少的功能，离线识别不仅要求产品具有本地将语音转化为文字的能力，同时也要求产品(例如车载装置)能够正确地理解到用户的意图，并做出相应的反馈。

然而，现有的车载环境，语音识别通过对离线辞典中大量标记训练样本集进行匹配，若匹配不到，则识别失败。即现有技术，对离线辞典的依赖性比较高，语音识别的失败率高。

发明内容

本申请实施例提供一种语音的离线识别方法、装置与存储介质。

第一方面，本申请实施例提供一种语音离线识别方法，包括：

获取语音指令，并将所述语音指令转换成待识别文字；

判断辞典中是否存在与所述待识别文字匹配的控制指令，所述辞典包括预设的N个控制指令；

若所述辞典中不包括与所述待识别文字匹配的控制指令，则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板；

根据所述目标句式模板确定所述待识别文字的意图。

在一方面的一种实现方式中，所述判断辞典中是否存在与所述待识别文字匹配的控制指令，包括：

根据所述待识别文字，确定所述待识别文字与所述N个控制指令中每个控制指令的文字的第一相似度，获得N个第一相似度；

根据所述N个第一相似度，判断所述辞典中是否存在与所述待识别文字匹配的控制指令。

在一方面的另一种实现方式中，根据所述N个第一相似度，判断辞典中是否存在与所述待识别文字匹配的控制指令，包括：

若所述N个第一相似度均小于第一预设值，则判断所述N个第一相似度中是否存在大于等于第二预设值的相似度；

若存在，则确定辞典中存在与所述待识别文字匹配的控制指令；

若不存在，则确定辞典中不存在与所述待识别文字匹配的控制指令；

所述第一预设值大于所述第二预设值。

若所述N个第一相似度均小于第一预设值，则根据所述待识别文字，确定所述待识别文字的拼音与所述N个控制指令中每个控制指令的拼音的第二相似度；

判断所述N个第二相似度中是否存在大于等于第二预设值的相似度；

所述第一预设值大于所述第二预设值。

在一方面的另一种实现方式中，所述方法还包括：

若所述N个第一相似度中存在大于或等于所述第一预设值的第一相似度，则根据该第一相似度对应的控制指令，确定所述待识别文字的意图。

在一方面的另一种实现方式中，所述方法还包括：

根据所述大于等于第二预设值的任一相似度所对应的控制指令，确定所述待识别文字的意图。

在一方面的另一种实现方式中，所述方法还包括：

根据所述大于等于第二预设值的相似度中最大相似度所对应的控制指令，确定所述待识别文字的意图。

第二方面，本申请实施例提供一种语音离线识别装置，包括：

获取模块，用于获取语音指令，并将所述语音指令转换成待识别文字；

判断模块，用于判断辞典中是否存在与所述待识别文字匹配的控制指令，所述辞典包括预设的N个控制指令；

查找模块，用于若所述辞典中不包括与所述待识别文字匹配的控制指令，则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板；

确定模块，用于根据所述目标句式模板确定所述待识别文字的意图。

在二方面的一种实现方式中，所述判断模块，包括：

确定单元，用于根据所述待识别文字，确定所述待识别文字与所述N个控制指令中每个控制指令的文字的第一相似度，获得N个第一相似度；

判断单元，用于根据所述N个第一相似度，判断辞典中是否存在与所述待识别文字匹配的控制指令。

在二方面的另一种实现方式中，所述判断单元，具体用于若所述N个第一相似度均小于第一预设值，则判断所述N个第一相似度中是否存在大于等于第二预设值的相似度；

所述确定单元，用于若判断单元确定判断所述N个第一相似度中存在大于等于第二预设值的相似度，则确定辞典中存在与所述待识别文字匹配的控制指令；若判断单元确定判断所述N个第一相似度中不存在大于等于第二预设值的相似度，则确定辞典中不存在与所述待识别文字匹配的控制指令；

所述第一预设值大于所述第二预设值。

在二方面的另一种实现方式中，所述确定单元，具体用于若所述N个第一相似度均小于第一预设值，则根据所述待识别文字，确定所述待识别文字的拼音与所述N个控制指令中每个控制指令的拼音的第二相似度；

所述判断单元，用于判断所述N个第二相似度中是否存在大于等于第二预设值的相似度；

所述确定单元，还用于若所述判断单元判断所述N个第二相似度中存在大于等于第二预设值的相似度，则确定辞典中存在与所述待识别文字匹配的控制指令；若所述判断单元判断所述N个第二相似度中不存在大于等于第二预设值的相似度，则确定辞典中不存在与所述待识别文字匹配的控制指令；

所述第一预设值大于所述第二预设值。

在二方面的另一种实现方式中，所述确定模块，还用于若所述N个第一相似度中存在大于或等于所述第一预设值的第一相似度，则根据该第一相似度对应的控制指令，确定所述待识别文字的意图。

在二方面的另一种实现方式中，所述确定模块，还用于根据所述大于等于第二预设值的任一相似度所对应的控制指令，确定所述待识别文字的意图。

在二方面的另一种实现方式中，所述确定模块，还用于根据所述大于等于第二预设值的相似度中最大相似度所对应的控制指令，确定所述待识别文字的意图。

第三方面，本申请实施例一种语音离线识别装置，包括：存储器和处理器；

所述存储器，用于存储计算机程序；

所述处理器，用于获取语音指令，并将所述语音指令转换成待识别文字；判断辞典中是否存在与所述待识别文字匹配的控制指令；若所述辞典中不包括与所述待识别文字匹配的控制指令，则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板；根据所述目标句式模板确定所述待识别文字的意图，其中所述辞典包括预设的N个控制指令。

在第三方面的一种实现方式中，所述处理器具体用于：

根据所述N个第一相似度，判断辞典中是否存在与所述待识别文字匹配的控制指令。

在第三方面的另一种实现方式中，所述处理器还具体用于：

所述第一预设值大于所述第二预设值。

在第三方面的另一种实现方式中，所述处理器还具体用于：

所述第一预设值大于所述第二预设值。

在第三方面的另一种实现方式中，所述处理器还用于：

第四方面，本申请实施例一种计算机存储介质，所述存储介质中存储计算机程序，所述计算机程序在执行时实现如第一方面任一项所述的语音离线识别方法。

第五方面，本申请实施例一种计算机程序产品，所述程序产品包括计算机程序，所述计算机程序存储在可读存储介质中，语音离线识别装置的至少一个处理器可以从所述可读存储介质读取所述计算机程序，所述至少一个处理器执行所述计算机程序使得语音离线识别装置实施如权利要求1-7任一所述的语音离线识别方法。

本申请实施例提供的语音的离线识别方法、装置与存储介质，通过获取语音指令，并将所述语音指令转换成待识别文字；判断辞典中是否存在与所述待识别文字匹配的控制指令，所述辞典包括预设的N个控制指令；若所述辞典中不包括与所述待识别文字匹配的控制指令，则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板；根据所述目标句式模板确定所述待识别文字的意图。即本实施例的方法，在辞典匹配失败之后，进行句式模板的匹配，进而提高了匹配的成功率，提高用户语音识别的体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例一提供的模拟通信接口的时序控制方法的流程图；

图2为本实施例方法的一种应用场景图；

图3为本申请实施例二提供的语音离线识别方法的流程图；

图4为本申请实施例一提供的语音离线识别装置；

图5为本申请实施例二提供的语音离线识别装置；

图6为本申请实施例提供的语音离线识别装置。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B的情况，其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a,b,或c中的至少一项(个)，可以表示：a,b,c,a-b,a-c,b-c,或a-b-c，其中a,b,c可以是单个，也可以是多个。

本实施例的方法可以适用于汽车领域、智能家居领域等任意需要语音交互的领域。

已有的语音识别技术，将用户输入的语音与辞典中预设的控制指令进行匹配，若匹配成功，则确定本次语音识别成功，若匹配识别，在确定本次语音匹配识别。

但是，在实际使用时，用户输入的语言控制指令不准确(例如，用户发音不标准，造成语音指令不准确)，对于这样情况，已有的语音识别技术，无法准确识别出用户输入的语音，造成识别失败，进而降低用户的语音使用体验。

为了解决上述技术问题，本申请的方法在辞典识别失败之后，对用户输入的语音进行句式模板匹配，进而提高了识别的成功率，提升了用户的语音使用体验。

下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

图1为本申请实施例一提供的语音离线识别方法的流程图，如图1所示，本实施例的方法可以包括：

S101、获取语音指令，并将所述语音指令转换成待识别文字。

本实施例的执行主体为语音离线识别装置(以下简称识别装置)，该识别装置可以是单独的电子设备，也可以是电子设备中的一部分，例如为电子设备中的处理器。

本实施例的电子设备可以是用户设备(user equipment，UE)、移动台(mobilestation，MS)、移动终端(mobile terminal，MT)等，是一种向用户提供语音/数据连通性的设备，例如，具有无线连接功能的手持式设备、车载设备等。目前，一些电子设备的举例为：手机(mobile phone)、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobileinternet device，MID)、可穿戴设备，虚拟现实(virtual reality，VR)设备、增强现实(augmented reality，AR)设备、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程手术(remote medical surgery)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等。

图2为本实施例方法的一种应用场景图，本实施例以汽车领域为例进行说明，其他领域参照即可。如图2所示，语音离线识别装置与多个车载设备连接，用户可以向各车载设备发送语音指令，以使车载设备进行响应。例如，用户输入的语音指令“打开副驾驶的车窗”，语音离线识别装置接收到语音指令“打开副驾驶的车窗”后，对该语音指令进行识别，获得其对应的控制指令，并将该控制指令发送给车窗控制设备，以使车窗控制设备根据该控制指令，控制副驾驶的车窗打开。

本实施例的识别装置上设置有麦克风，用户可以通过该麦克风向识别装置输入语音指令。

本实施例中可以使用已有的技术，将语音指令转成成待识别文字，例如，在设备装置中安装语音转换软件，该语音转换软件可以将识别装置获取的语音转换成待识别文字。其具体过程参照已有技术，本实施例在此不再赘述。

S102、判断辞典中是否存在与所述待识别文字匹配的控制指令，所述辞典包括预设的N个控制指令。

其中，N为大于1的整数。

本实施例的识别装置中保存有辞典，该辞典是预先训练的，在该辞典中保存有预设的N个控制指令。

本实施例可以是使用Hash查找的方法，在辞典中查找与待识别文字匹配的控制指令。

例如，对待识别文字进行切词，计算切词后待识别文字的哈希hash值。在辞典中根据待识别文字的hash值查找待识别文字的标识，其中，辞典的数据项架构包括控制指令的标识、控制指令的hash值以及控制指令本身，进而查找到待识别文字对应的控制指令。

可选的，还可以根据已有其他方法，在辞典中查找该待识别文字匹配的控制指令，本实施例对此不做限制。

本实施例的控制指令可以理解为固定说法，例如在汽车领域，可以将控制车辆的所有车载设备的固定说法均作为控制指令，保存在该辞典中。

本实施例中，不同领域对应的辞典可以不同，该辞典可以是用户预先输入的，也可以是用户从网络端下载的。

S103、若所述辞典中不包括与所述待识别文字匹配的控制指令，则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板。

S104、根据所述目标句式模板确定所述待识别文字的意图。

本实施例的识别装置上还保存有多个句式模板，该句式模板可以是用户自行输入的，也可以是用户从网络端下载的，本实施例对此不做限制。

本实施例的多个句式模板可以理解为固定句式的集合，这些固定句式例如可以是，我想去+地名，我想听+歌曲名，我想打电话给+人名等。其中，句式模板中还包括常见的地名(公共场所，以及用户经常和/或最近去的地方)、歌曲名(例如流程歌曲，以及用户经常听的歌曲)和人名(例如通讯录中的联系人)等。

本实施例的方法，当用户输入的语言控制指令在辞典中匹配失败后，为了进一步提高匹配的成功率，则本实施例获取待识别文字的句式模板，将待识别文字的句式模板与识别装置保存的多个预设的句式模板进行匹配。获取识别装置中多个预设的句式模板中与待识别文字的句式模板匹配的句式模板，将该句式模板记为目标句式模板。例如，该目标句式模板为：我想去+地名。

接着，根据该目标句式模板确定待识别文字的意图。

例如，用户输入的语言控制指令为“我想去火车站”，进行句式匹配，获得的目标模板为：“我想去+地名”。而“我想去+地名”该句式模拟对应的车载设备为导航设备。这样，识别装置从保存的地名中匹配出目标地“火车站”，即可确定出该待识别文字的意图为想导航去火车站。接着，识别装置向导航设备发送控制指令，以使导航控制指令导航去火车站即可。

可选的，本实施例中进行辞典匹配和进行句式模板匹配时，可以是基于文字匹配的。

可选的，本实施例中进行辞典匹配和进行句式模板匹配可以不同，例如，辞典匹配是具有文字进行的匹配，而句式模板匹配可以是基于拼音匹配的。

本申请实施例提供的语音离线识别方法，通过获取语音指令，并将所述语音指令转换成待识别文字；判断辞典中是否存在与所述待识别文字匹配的控制指令，所述辞典包括预设的N个控制指令；若所述辞典中不包括与所述待识别文字匹配的控制指令，则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板；根据所述目标句式模板确定所述待识别文字的意图。即本实施例的方法，在辞典匹配失败之后，进行句式模板的匹配，进而提高了匹配的成功率，提高用户语音识别的体验。

图3为本申请实施例二提供的语音离线识别方法的流程图，在上述实施例的基础上，本实施例涉及的辞典匹配的具体过程，如图3所示，本实施例的方法可以包括：

S301、根据所述待识别文字，确定所述待识别文字与所述N个控制指令中每个控制指令的文字的第一相似度，获得N个第一相似度。

S302、根据所述N个第一相似度，判断辞典中是否存在与所述待识别文字匹配的控制指令。

S303、若所述N个第一相似度中存在大于或等于所述第一预设值的第一相似度，则根据该第一相似度对应的控制指令，确定所述待识别文字的意图。

S304、若所述N个第一相似度中不存在大于或等于所述第一预设值的第一相似度，则根据所述大于等于第二预设值的相似度对应的控制指令，确定所述待识别文字的意图。

具体是，计算待识别文字与辞典中N个控制指令中每个控制指令的文字的第一相似度，其计算过程可以根据已有技术确定，在此不再拽述，进而获得N个第一相似度。接着，根据N个相似度判断辞典中是否存在与待识别文字匹配的控制指令。例如，若N个相似度中存在大于或等于某一预设值的第一相似度，则将该第一相似度对应的控制指令，确定该指令为辞典中与待识别文字匹配的控制指令。

在一些实施例中，上述S302中，根据所述N个第一相似度，判断辞典中是否存在与所述待识别文字匹配的控制指令，可以包括：

若所述N个相似度均小于第一预设值，则根据所述待识别文字，确定所述待识别文字的拼音与所述N个控制指令中每个控制指令的拼音的相似度。

其中，所述第一预设值大于所述第二预设值。

本实施例的辞典匹配过程包括精准匹配和模糊匹配，即首先进行精准匹配，在精准匹配失败后，进而模糊匹配，以提高辞典匹配的容错率，提高匹配的成功率。

具体是，根据上述步骤，获得待识别文字与辞典中N个控制指令中每个控制指令的第一相似度，进而获得N个第一相似度。接着，判断N个第一相似度中是否存在大于或等于第一预设值的第一相似度。例如，第一预设值为1，则判断辞典中是否存在与待识别文字完全匹配的控制指令。

若N个第一相似度中存在大于或等于第一预设值的第一相似度，则获取该第一相似度对应的控制指令，根据该控制指令确定待识别文字的意图。例如，第一预设值为1，N个第一相似度中大于或等于第一预设值的第一相似度1，该第一相似度1对应的控制指令为“打开车窗”，这样，识别装置可以确定该待识别文字的意图为打开车窗，进而向车窗控制设备发送控制控制指令，以打开车窗。

若N个第一相似度中不存在大于或等于第一预设值的第一相似度，即N个第一相似度均小于第一预设值，此时，降匹配的等级，即将第一预设值降低为第二预设值，判断N个第一相似度中是否存在大于或等于第二预设值的第一相似度。

若N个第一相似度中存在大于或等于第二预设值的第一相似度，则确定辞典中存在与所述待识别文字匹配的控制指令。

若N个第一相似度中不存在大于或等于第二预设值的第一相似度，则确定辞典中不存在与所述待识别文字匹配的控制指令。

本实施例的方法，首先对待识别文字进行精准匹配，计算待识别文字与辞典中各控制指令的第一相似度。若辞典中不存在与待识别文字精确匹配的控制指令，则降低匹配的判断准确，判断所述N个第一相似度中是否存在大于等于第二预设值的相似度；若存在，则根据大于等于第二预设值的相似度对应的控制指令，确定待识别文字对应的意图，进而提高辞典匹配的容错率，提高匹配的成功率。

在一些实施例中，上述S302中，根据所述N个第一相似度，判断辞典中是否存在与所述待识别文字匹配的控制指令，还可以包括：

所述第一预设值大于所述第二预设值。

本实施例中，通过不同的方式来确定第二相似度。

具体是，获取待识别文字与辞典中N个控制指令中每个控制指令的第一相似度，获得N个第一相似度。接着，判断N个第一相似度中是否存在大于或等于第一预设值的第一相似度。若N个第一相似度中存在不大于或等于第一预设值的第一相似度，即N个第一相似度均小于第一预设值，此时，获取待识别文字与N个控制指令中每个控制指令的第二相似度，获得N个第二相似度。

其中，获得第二相似度的过程为，将待识别文字的拼音与N个控制指令中每个控制指令的拼音进行比对，获得待识别文字的拼音与N个控制指令中每个控制指令的拼音的第二相似度，获得N个第二相似度。

接着，判断所述N个第二相似度中是否存在大于等于第二预设值的相似度。若存在，则确定辞典中存在与所述待识别文字匹配的控制指令。若不存在，则确定辞典中不存在与所述待识别文字匹配的控制指令。

本实施例，通过将待识别文字的拼音与N个控制指令中每个控制指令的拼音进行一一匹配，来确定两者拼音的相似度。这样可以解决由于发音不准，使得S101中的将语音指令转换成待识别文字过程中，转换的待识别文字不准确而造成的匹配识别的问题，进一步提高了匹配的容错率，提高了匹配的成功率。

本实施例的方法，首先对待识别文字进行精准匹配，计算待识别文字与辞典中各控制指令的第一相似度。若辞典中不存在与待识别文字精确匹配的控制指令，则降低匹配的判断准确，计算待识别文字与辞典中各控制指令的第二相似度。获得从N个第二相似度中获取大于或等于第二预设值的第二相似度对应的控制指令，将该控制指令作为与待识别文字匹配的控制指令，并根据该控制指令确定待识别文字的意图。这样可以提高辞典匹配的容错率，提高匹配的成功率。

在一种示例中，上述S303可以包括：根据所述大于等于第二预设值的任一相似度所对应的控制指令，确定所述待识别文字的意图。

在另一种示例中，上述S303可以包括：根据所述大于等于第二预设值的相似度中最大相似度所对应的控制指令，确定所述待识别文字的意图。

图4为本申请实施例一提供的语音离线识别装置，如图4所示，所述语音离线识别装置100包括：

获取模块110，用于获取语音指令，并将所述语音指令转换成待识别文字；

判断模块120，用于判断辞典中是否存在与所述待识别文字匹配的控制指令，所述辞典包括预设的N个控制指令；

查找模块130，用于若所述辞典中不包括与所述待识别文字匹配的控制指令，则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板；

确定模块140，用于根据所述目标句式模板确定所述待识别文字的意图。

本实施例的语音离线识别装置，可以用于执行上述各方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

图5为本申请实施例二提供的语音离线识别装置，在上述实施例的基础上，如图5所示，所述判断模块120，包括：

确定单元121，用于根据所述待识别文字，确定所述待识别文字与所述N个控制指令中每个控制指令的文字的第一相似度，获得N个第一相似度；

判断单元122，用于根据所述N个第一相似度，判断辞典中是否存在与所述待识别文字匹配的控制指令。

在一种实现方式中，所述判断单元122，具体用于若所述N个第一相似度均小于第一预设值，则判断所述N个第一相似度中是否存在大于等于第二预设值的相似度；

所述确定单元121，用于若判断单元确定判断所述N个第一相似度中存在大于等于第二预设值的相似度，则确定辞典中存在与所述待识别文字匹配的控制指令；若判断单元确定判断所述N个第一相似度中不存在大于等于第二预设值的相似度，则确定辞典中不存在与所述待识别文字匹配的控制指令；

所述第一预设值大于所述第二预设值。

在另一种实现方式中，所述确定单元121，具体用于若所述N个第一相似度均小于第一预设值，则根据所述待识别文字，确定所述待识别文字的拼音与所述N个控制指令中每个控制指令的拼音的第二相似度；

所述判断单元122，用于判断所述N个第二相似度中是否存在大于等于第二预设值的相似度；

所述确定单元121，还用于若所述判断单元判断所述N个第二相似度中存在大于等于第二预设值的相似度，则确定辞典中存在与所述待识别文字匹配的控制指令；若所述判断单元判断所述N个第二相似度中不存在大于等于第二预设值的相似度，则确定辞典中不存在与所述待识别文字匹配的控制指令；

所述第一预设值大于所述第二预设值。

在另一种实现方式中，所述确定模块121，用于若所述N个第一相似度中存在大于或等于所述第一预设值的第一相似度，则根据该第一相似度对应的控制指令，确定所述待识别文字的意图。

在另一种实现方式中，所述确定模块121，还用于根据所述大于等于第二预设值的任一相似度所对应的控制指令，确定所述待识别文字的意图。

在另一种实现方式中，所述确定模块121，还用于根据所述大于等于第二预设值的相似度中最大相似度所对应的控制指令，确定所述待识别文字的意图。

图6为本申请实施例提供的语音离线识别装置，如图6所示，所述语音离线识别装置200包括：存储器210和处理器220；

所述存储器210，用于存储计算机程序；

所述处理器220，用于获取语音指令，并将所述语音指令转换成待识别文字；判断辞典中是否存在与所述待识别文字匹配的控制指令；若所述辞典中不包括与所述待识别文字匹配的控制指令，则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板；根据所述目标句式模板确定所述待识别文字的意图，其中所述辞典包括预设的N个控制指令。

在一些实施例中，所述处理器220具体用于：

在一些实施例中，所述处理器220还具体用于：

所述第一预设值大于所述第二预设值。

在一些实施例中，所述处理器220还具体用于：

所述第一预设值大于所述第二预设值。

在一些实施例中，所述处理器220还用于：

在一些实施例中，所述处理器200还用于：

所述语音离线识别装置的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

1.一种语音离线识别方法，其特征在于，包括：

获取语音指令，并将所述语音指令转换成待识别文字；

根据所述目标句式模板确定所述待识别文字的意图。

2.根据权利要求1所述的方法，其特征在于，所述判断辞典中是否存在与所述待识别文字匹配的控制指令，包括：

3.根据权利要求2所述的方法，其特征在于，根据所述N个第一相似度，判断辞典中是否存在与所述待识别文字匹配的控制指令，包括：

所述第一预设值大于所述第二预设值。

4.根据权利要求2所述的方法，其特征在于，根据所述N个第一相似度，判断辞典中是否存在与所述待识别文字匹配的控制指令，包括：

所述第一预设值大于所述第二预设值。

5.根据权利要求3所述的方法，其特征在于，所述方法还包括：

6.根据权利要求3或4所述的方法，其特征在于，所述方法还包括：

7.根据权利要求3或4所述的方法，其特征在于，所述方法还包括：

8.一种语音离线识别装置，其特征在于，包括：

9.根据权利要求8所述的装置，其特征在于，所述判断模块，包括：

10.根据权利要求9所述的装置，其特征在于，

所述判断单元，具体用于若所述N个第一相似度均小于第一预设值，则判断所述N个第一相似度中是否存在大于等于第二预设值的相似度；

所述第一预设值大于所述第二预设值。

11.根据权利要求9所述的装置，其特征在于，所述确定单元，具体用于若所述N个第一相似度均小于第一预设值，则根据所述待识别文字，确定所述待识别文字的拼音与所述N个控制指令中每个控制指令的拼音的第二相似度；

所述第一预设值大于所述第二预设值。

12.一种语音离线识别装置，其特征在于，包括：存储器和处理器；

所述存储器，用于存储计算机程序；

13.根据权利要求12所述的装置，其特征在于，所述处理器具体用于：

14.根据权利要求13所述的装置，其特征在于，所述处理器还具体用于：

所述第一预设值大于所述第二预设值。

15.根据权利要求13所述的装置，其特征在于，所述处理器还具体用于：

所述第一预设值大于所述第二预设值。

16.根据权利要求15所述的装置，其特征在于，所述处理器还用于：

17.根据权利要求14或15所述的装置，其特征在于，所述处理器还用于：

18.根据权利要求14或15所述的装置，其特征在于，所述处理器还用于：

19.一种计算机存储介质，其特征在于，所述存储介质中存储计算机程序，所述计算机程序在执行时实现如权利要求1-7中任一项所述的语音离线识别方法。

20.一种计算机程序产品，其特征在于，所述程序产品包括计算机程序，所述计算机程序存储在可读存储介质中，语音离线识别装置的至少一个处理器可以从所述可读存储介质读取所述计算机程序，所述至少一个处理器执行所述计算机程序使得语音离线识别装置实施如权利要求1-7任一所述的语音离线识别方法。