CN108231076A

CN108231076A - 一种语音控制方法、装置、设备及存储介质

Info

Publication number: CN108231076A
Application number: CN201810008996.9A
Authority: CN
Inventors: 张继雄
Original assignee: Guangzhou Shiyuan Electronics Thecnology Co Ltd; Guangzhou Shirui Electronics Co Ltd
Current assignee: Guangzhou Shiyuan Electronics Thecnology Co Ltd; Guangzhou Shirui Electronics Co Ltd
Priority date: 2018-01-04
Filing date: 2018-01-04
Publication date: 2018-06-29

Abstract

本发明公开了一种语音控制方法、装置、设备及存储介质。该方法包括：确认对采集到的语音信息进行语音识别的识别结果中的触发词；依据触发词与预存的功能映射表获取触发词对应的目标功能；根据目标功能确定目标应用，并执行目标功能调用指令，通过本发明的技术方案，能够提升语音控制的准确度。

Description

一种语音控制方法、装置、设备及存储介质

技术领域

本发明涉及一种智能终端技术，尤其涉及一种语音控制方法、装置、设备及存储介质。

背景技术

随着智能终端技术的不断发展，智能终端的种类也越来越多，人们通过各种类型的智能终端的多种功能享受着科技发展带来的各种便利。科技发展为人们带来了舒适的生活，然而人们对于智能终端的期望并不止于此，人们依旧希望智能终端能够越来越智能，实现人们理想中的生活。

现有技术中的语音控制方法为根据接收到的语音控制指令确定组件调用信息，通过组件调用信息可以实现对应用程序的组件的调用，进而实现通过语音对终端的控制，通过上述方式实现语音控制不但工作量巨大，而且准确度低。

发明内容

本发明实施例提供一种语音控制方法、装置、设备及存储介质，能够提升语音控制的准确度。

第一方面，本发明实施例提供了一种语音控制方法，包括：

确认对采集到的语音信息进行语音识别的识别结果中的触发词；

依据所述触发词与预存的功能映射表获取所述触发词对应的目标功能；

根据所述目标功能确定目标应用，并执行所述目标功能调用指令。

进一步的，所述确认对采集到的语音信息进行语音识别的识别结果中的触发词之前，还包括：

获取智能终端中的应用以及所述应用对应的功能；

将所述智能终端中的应用和所述功能的对应关系存储于配置文件；

相应的，根据所述目标功能确定目标应用，并执行所述目标功能调用指令包括：

在所述配置文件中查找与所述目标功能相匹配的目标应用；

执行所述目标功能调用指令。

建立关于触发词的样本信息和功能对应关系的功能映射表。

进一步的，所述依据所述触发词与预存的功能映射表获取所述触发词对应的目标功能之前，还包括：

若至少两个应用具备所述触发词对应的功能时，预先设定所述至少两个应用的优先级等级；

相应的，依据所述触发词与预存的功能映射表获取所述触发词对应的目标功能包括：

依据所述触发词与预存的功能映射表获取所述触发词对应的功能；

根据所述功能确定具备所述功能的至少两个应用；

根据所述预先设定的优先级等级选择优先级等级高的应用对应的功能作为目标功能。

若至少两个应用具备所述触发词对应的功能时，建立优先处理机制，其中，所述优先处理机制包括：具备所述功能的前台程序对应的应用的优先级高于具备所述功能的后台程序对应的应用的优先级；或者，具备所述功能的活跃进程对应的应用的优先级高于具备所述功能的非活跃进程对应的应用的优先级；

根据所述功能确定具备所述功能的至少两个应用；

根据所述优先处理机制选择优先级等级高的应用对应的功能作为目标功能。

第二方面，本发明实施例还提供了一种语音控制装置，该装置包括：

确认模块，用于确认对采集到的语音信息进行语音识别的识别结果中的触发词；

第一获取模块，用于依据所述触发词与预存的功能映射表获取所述触发词对应的目标功能；

执行模块，用于根据所述目标功能确定目标应用，并执行所述目标功能调用指令。

进一步的，还包括：

第二获取模块，用于获取智能终端中的应用以及所述应用对应的功能；

存储模块，用于将所述智能终端中的应用和所述功能的对应关系存储于配置文件；

相应的，所述执行模块具体用于：

在所述配置文件中查找与所述目标功能相匹配的目标应用；

执行所述目标功能调用指令。

进一步的，还包括：

映射表建立模块，用于在确认对采集到的语音信息进行语音识别的识别结果中的触发词之前，建立关于触发词的样本信息和功能对应关系的功能映射表。

进一步的，还包括：

等级设定模块，用于在依据所述触发词与预存的功能映射表获取所述触发词对应的目标功能之前，若至少两个应用具备所述触发词对应的功能时，预先设定所述至少两个应用的优先级等级；

相应的，所述第一获取模块具体用于：

根据所述功能确定具备所述功能的至少两个应用；

进一步的，还包括：

机制建立模块，用于在依据所述触发词与预存的功能映射表获取所述触发词对应的目标功能之前，若至少两个应用具备所述触发词对应的功能时，建立优先处理机制，其中，所述优先处理机制包括：具备所述功能的前台程序对应的应用的优先级高于具备所述功能的后台程序对应的应用的优先级；或者，具备所述功能的活跃进程对应的应用的优先级高于具备所述功能的非活跃进程对应的应用的优先级；

相应的，所述第一获取模块具体用于：

根据所述功能确定具备所述功能的至少两个应用；

第三方面，本发明实施例还提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如本发明实施例中任一所述的语音控制方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例中任一所述的语音控制方法。

本发明实施例通过确认对采集到的语音信息进行语音识别的识别结果中的触发词；依据触发词与预存的功能映射表获取触发词对应的目标功能；根据目标功能确定目标应用，并执行目标功能调用指令，能够提升语音控制的准确度。

附图说明

图1是本发明实施例一中的一种语音控制方法的流程图；

图2是本发明实施例二中的一种语音控制方法的流程图；

图3是本发明实施例三中的一种语音控制装置的结构示意图；

图4是本发明实施例四中的一种计算机设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一中的一种语音控制方法的流程图，本实施例可适用于语音控制的情况，该方法可以由本发明实施例中的语音控制装置来执行，该装置可采用软件和/或硬件的方式实现，如图1所示，该方法具体包括如下步骤：

S110，确认对采集到的语音信息进行语音识别的识别结果中的触发词。

其中，采集语音信息的方式可以为通过智能终端上的麦克风获取用户输入的语音信息，也可以为通过专门用于语音识别的麦克风获取用户输入的语音信息，本发明实施例对此不进行限制。

其中，所述触发词为用户提前设定或者系统提前设定的用于触发执行触发词对应的功能的词语。所述触发词可以为一个词语，也可以为一个数字，还可以为一句话，本发明实施例对触发词的具体形式不进行限制。

具体的，确认对采集到的语音信息进行语音识别的识别结果中的触发词的方式可以为对麦克风采集到的语音信息进行语音识别，并实时确定识别结果中的触发词，也可以为麦克风采集到的语音信息进行语音识别后，确定识别结果中的触发词。

S120，依据触发词与预存的功能映射表获取触发词对应的目标功能。

其中，所述目标功能为用户输入的语音信息对应的功能，也即，用户需要打开的功能。

可选的，所述确认对采集到的语音信息进行语音识别的识别结果中的触发词之前，还包括：

建立关于触发词的样本信息和功能对应关系的功能映射表。

其中，所述触发词的样本信息为预先设定的触发词，例如可以是，视频、音乐、语音、看儿童电影和听音乐等。

其中，预存的功能映射表至少包括触发词的样本信息和功能的对应关系。例如可以是，触发词的样本信息A对应功能Q，触发词的样本信息B对应功能W，触发词的样本信息C对应功能R.。

具体的，将触发词与预存的功能映射表中的触发词的样本信息进行匹配，查找与触发词相同的触发词样本信息对应的功能作为目标功能。

可选的，所述依据所述触发词与预存的功能映射表获取所述触发词对应的目标功能之前，还包括：

其中，在发现至少两个应用具备用户输入的语音信息中的触发词对应的功能，则需要设定至少两个应用的优先级等级，例如，应用A、应用B和应用C都具备用户输入的语音信息中的触发词，则设定应用A、应用B和应用C的优先级等级分别为应用A的优先级等级高于应用B的优先级等级，应用B的优先级等级高于应用C的优先级等级。

根据所述功能确定具备所述功能的至少两个应用；

其中，至少两个应用具备所述触发词对应的功能，例如可以是，应用A具备触发词X对应的功能W，应用B具备触发词X对应的功能W，因此在确定功能W之后，发现具备功能W的应用不止一个，则需要根据应用的优先级确定目标功能。例如可以是，若应用A的优先级高于应用B，则将应用A的功能W作为目标功能。

具体的，根据用户输入的语音信息中的触发词在预存的功能映射表中查找与所述触发词相同的触发词的样本信息对应的功能，作为所述触发词对应的功能，确定具备上述功能的至少两个应用，根据预先设定的优先级等级选择优先级等级高的应用对应的功能作为目标功能。

可选的，也可以为在建立功能映射表时，将应用的优先级等级存储至功能映射表中，例如可以是，功能映射表包括：触发词的样本信息A对应应用X中的功能Q的优先级高于触发词的样本信息A对应应用Y中的功能Q，触发词的样本信息B对应功能W。

具体的，优先级的等级可以根据用户设定而改变，例如，应用A和应用B都具备用户输入的语音信息中的触发词，用户设定应用A和应用B的优先级等级为应用A的优先级等级高于应用B的优先级等级，经过一段时间后，用户更改设定应用B的优先级等级高于应用A的优先级等级。

根据所述功能确定具备所述功能的至少两个应用；

具体的，若用户没有设定优先级，则系统默认的优先级处理机制为：前台程序的优先级大于后台程序的优先级，活跃进程的优先级大于非活跃进程的优先级，若具备用户输入的语音信息中的触发词的至少两个应用为同一优先级等级或者其中任意两个应用为同一优先级等级，则可以触发词优先级高于其他优先级的应用对应的功能，若优先级高于其他优先级的应用为两个或者两个以上，则将所有优先级等级高于其他的应用对应的功能均作为目标功能；也可以根据优先级等级相同的应用生成提示信息，输出提示框显示提示信息，供用户选择，将用户选择的应用对应的功能作为目标功能。

S130，根据目标功能确定目标应用，并执行目标功能调用指令。

其中，执行目标功能调用指令可以为通过AIDL等进程通信的方式调用目标功能。

在一个具体的例子中，用户说“看儿童电影”，其中，电影为触发词，则打开与触发词电影对应的应用中的儿童电影页面(功能)，完成一对一的匹配。

具体的，用户说了某句触发词后，根据触发词进行精确匹配，直接映射到该触发词对应的功能。然后通过AIDL等进程通信的方式调用该功能。当同一触发词同时映射到多个应用的功能时，可以自行设置触发优先级指数。指数值越高，代表优先级越高，优先执行该功能。若没有设置优先级，则系统有默认的优先级处理机制：如前台程序的优先级大于后台程序的优先级；活跃进程的优先级大于非活跃进程优先级等。

本实施例的技术方案，通过确认对采集到的语音信息进行语音识别的识别结果中的触发词；依据触发词与预存的功能映射表获取触发词对应的目标功能；根据目标功能确定目标应用，并执行目标功能调用指令，能够提升语音控制的准确度。

实施例二

图2为本发明实施例二中的一种语音控制方法的流程图，本实施例以上述实施例一为基础进行优化，在本实施例中，所述确认对采集到的语音信息进行语音识别的识别结果中的触发词之前，还包括：获取智能终端中的应用以及所述应用对应的功能；将所述智能终端中的应用和所述功能的对应关系存储于配置文件；相应的，根据所述目标功能确定目标应用，并执行所述目标功能调用指令包括：在所述配置文件中查找与所述目标功能相匹配的目标应用；执行所述目标功能调用指令。

如图2所示，本实施例的方法具体包括如下步骤：

S210，获取智能终端中的应用以及应用对应的功能。

其中，获取智能终端中的所有的应用以及应用对应的功能，例如，智能终端包括应用Q、应用W、应用R和应用U，应用Q有功能X、功能Y和功能Z共3个功能，应用W有功能A和功能B共两个功能，应用R有功能C和功能B共两个功能,应用U有功能A和功能D共两个功能。

S220，将智能终端中的应用和功能的对应关系存储于配置文件。

其中，所述配置文件可以供其他应用读取，将智能终端中的应用和功能的对应关系存储于配置文件中，根据功能就可以确定功能对应的应用。

具体的，当开启语音控制时，获取智能终端中的应用以及应用的功能，将智能终端中的应用和功能的对应关系存储于配置文件中，可以实时获取智能终端中的应用以及应用的功能，也可以周期性获取智能终端中的应用以及应用的功能，并当智能终端中的应用以及应用的功能更新时，根据智能终端中的应用以及应用的功能更新功能映射表，实现功能映射表的实时更新。

S230，确认对采集到的语音信息进行语音识别的识别结果中的触发词。

S240，依据触发词与预存的功能映射表获取触发词对应的目标功能。

S250，在配置文件中查找与目标功能相匹配的目标应用。

S260，执行目标功能调用指令。

在一个具体的例子中，某应用有A、B、C这几个功能，通过配置文件的方式定义好实时刷新并显示所有应用对外提供的功能，并可以填写该功能对应的触发词，如：看儿童电影(触发词)对应打开影视模块中的儿童电影页面(功能)，完成一对一的匹配。用户说了某句触发词后，匹配系统进行精确匹配，直接映射到该触发词对应的功能。然后通过AIDL等进程通信的方式调用该功能。当应用对外提供的功能有更新时，无需重新编译，即可直接读取到最新的功能列表。

本发明实施例，语音直接转成文字即可，不需要封装组件调用信息，功能预先在应用配置文件定义好，根据文字确定对应某个功能，直接设置一对一映射，主要是某个触发词和某个功能的直接匹配，便可找到具体组件。并且当应用的功能修改或者变更后，不需要重新编译，直接更新匹配关系即可。切若同一个语音命令对应了多个功能，则会按照优先级来进行最优匹配。

本实施例的技术方案，通过获取智能终端中的应用以及应用对应的功能；将智能终端中的应用和功能的对应关系存储于配置文件确认对采集到的语音信息进行语音识别的识别结果中的触发词；依据触发词与预存的功能映射表获取触发词对应的目标功能；根据目标功能确定目标应用，并执行目标功能调用指令，能够在智能终端的应用对应的功能修改或者变更后，自动更新功能映射表，提升语音控制的准确度。

实施例三

图3为本发明实施例三中的一种语音控制装置的结构示意图。本实施例可适用于语音控制的情况，该装置可采用软件和/或硬件的方式实现，该装置可集成在任何提供语音控制功能的设备中，如图3所示，所述语音控制装置具体包括：确认模块310、第一获取模块320和执行模块330。

其中，确认模块310，用于确认对采集到的语音信息进行语音识别的识别结果中的触发词；

第一获取模块320，用于依据所述触发词与预存的功能映射表获取所述触发词对应的目标功能；

执行模块330，用于根据所述目标功能确定目标应用，并执行所述目标功能调用指令。

可选的，还包括：

相应的，所述执行模块具体用于：

在所述配置文件中查找与所述目标功能相匹配的目标应用；

执行所述目标功能调用指令。

可选的，还包括：

相应的，所述第一获取模块具体用于：

根据所述功能确定具备所述功能的至少两个应用；

可选的，还包括：

相应的，所述第一获取模块具体用于：

根据所述功能确定具备所述功能的至少两个应用；

实施例四

图4为本发明实施例四中的一种计算机设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图4显示的计算机设备12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图4所示，计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示，通常称为“硬盘驱动器”)。尽管图4中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该计算机设备12交互的设备通信，和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。另外，本实施例中的计算机设备12，显示器24不是作为独立个体存在，而是嵌入镜面中，在显示器24的显示面不予显示时，显示器24的显示面与镜面从视觉上融为一体。并且，计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白，尽管图中未示出，可以结合计算机设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的语音控制方法：确认对采集到的语音信息进行语音识别的识别结果中的触发词；依据所述触发词与预存的功能映射表获取所述触发词对应的目标功能；根据所述目标功能确定目标应用，并执行所述目标功能调用指令。

实施例五

本发明实施例五提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请所有发明实施例提供的语音控制方法：确认对采集到的语音信息进行语音识别的识别结果中的触发词；依据所述触发词与预存的功能映射表获取所述触发词对应的目标功能；根据所述目标功能确定目标应用，并执行所述目标功能调用指令。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种语音控制方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述确认对采集到的语音信息进行语音识别的识别结果中的触发词之前，还包括：

获取智能终端中的应用以及所述应用对应的功能；

在所述配置文件中查找与所述目标功能相匹配的目标应用；

执行所述目标功能调用指令。

3.根据权利要求1所述的方法，其特征在于，所述确认对采集到的语音信息进行语音识别的识别结果中的触发词之前，还包括：

建立关于触发词的样本信息和功能对应关系的功能映射表。

4.根据权利要求1所述的方法，其特征在于，所述依据所述触发词与预存的功能映射表获取所述触发词对应的目标功能之前，还包括：

相应的，所述依据所述触发词与预存的功能映射表获取所述触发词对应的目标功能包括：

根据所述功能确定具备所述功能的至少两个应用；

5.根据权利要求1所述的方法，其特征在于，所述依据所述触发词与预存的功能映射表获取所述触发词对应的目标功能之前，还包括：

根据所述功能确定具备所述功能的至少两个应用；

6.一种语音控制装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，还包括：

相应的，所述执行模块具体用于：

在所述配置文件中查找与所述目标功能相匹配的目标应用；

执行所述目标功能调用指令。

8.根据权利要求6所述的装置，其特征在于，还包括：

9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-5中任一所述的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-5中任一所述的方法。