WO2019228140A1

WO2019228140A1 - 指令执行方法、装置、存储介质及电子设备

Info

Publication number: WO2019228140A1
Application number: PCT/CN2019/085563
Authority: WO
Inventors: 李冠; 达剑; 熊万江; 刘嘉飞; 周伍润; 朱忠磊; 董治; 李海泉; 文昭彦; 高亮
Original assignee: Oppo广东移动通信有限公司
Priority date: 2018-05-30
Filing date: 2019-05-05
Publication date: 2019-12-05
Also published as: CN108711428A; CN108711428B

Abstract

一种指令执行方法、装置、存储介质及电子设备，其中，电子设备接收输入的第一语音信息（101）；获取第一语音信息包括的多个第一待执行指令（102）；对多个第一待执行指令进行排序，得到多个第一待执行指令的第一排序信息（103）；根据第一排序信息，依次执行多个第一待执行指令（104）。

Description

指令执行方法、装置、存储介质及电子设备

本申请要求于2018年05月30日提交中国专利局、申请号为201810542932.7、发明名称为“指令执行方法、装置、存储介质及电子设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及电子设备技术领域，具体涉及一种指令执行方法、装置、存储介质及电子设备。

背景技术

目前，电子设备可以通过语音指令的方式来执行特定操作。比如，当用户说出“播放音乐”时，电子设备将“播放音乐”识别为音乐播放指令，并执行该音乐播放指令，进行音乐播放。

发明内容

第一方面，本申请实施例提供了一种指令执行方法，包括：

接收输入的第一语音信息；

获取所述第一语音信息包括的多个第一待执行指令；

对所述多个第一待执行指令进行排序，得到所述多个第一待执行指令的第一排序信息；

根据所述第一排序信息，依次执行所述多个第一待执行指令。

第二方面，本申请实施例提供了一种指令执行装置，包括：

接收模块，用于接收输入的第一语音信息；

获取模块，用于获取所述第一语音信息包括的多个第一待执行指令；

排序模块，用于对所述多个第一待执行指令进行排序，得到所述多个第一待执行指令的第一排序信息；

执行模块，用于根据所述第一排序信息，依次执行所述多个第一待执行指令。

第三方面，本申请实施例提供了一种存储介质，其上存储有计算机程序，当所述计算机程序在计算机上运行时，使得所述计算机执行：

接收输入的第一语音信息；

获取所述第一语音信息包括的多个第一待执行指令；

第四方面，本申请实施例提供了一种电子设备，包括处理器和存储器，所述存储器有计算机程序，所述处理器通过调用所述计算机程序，用于执行：

接收输入的第一语音信息；

获取所述第一语音信息包括的多个第一待执行指令；

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的指令执行方法的一流程示意图。

图2是本申请实施例提供中获取第一语音信息包括的多个第一待执行指令的操作示意图。

图3是本申请实施例中执行多个第一待执行指令的示意图。

图4是本申请实施例中拼接执行多个第一待执行指令以及多个第二待执行指令的示意图。

图5是本申请实施例提供的指令执行方法的另一流程示意图。

图6是本申请实施例提供的指令执行装置的一结构示意图。

图7是本申请实施例提供的电子设备的一结构示意图。

图8是本申请实施例提供的电子设备的另一结构示意图。

具体实施方式

请参照图式，其中相同的组件符号代表相同的组件，本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例，其不应被视为限制本申请未在此详述的其它具体实施例。

在以下的说明中，本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明，除非另有述明。因此，这些步骤及操作将有数次提到由计算机执行，本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处，其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置，其具有由该数据格式所定义的特定特性。但是，本申请原理以上述文字来说明，其并不代表为一种限制，本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。

本文所使用的术语“模块”可看做为在该运算系统上执行的软件对象。本文所述的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而本文所述的装置及方法可以以软件的方式进行实施，当然也可在硬件上进行实施，均在本申请保护范围之内。

本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块，而是某些实施例还包括没有列出的步骤或模块，或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本申请实施例提供一种指令执行方法，该指令执行方法的执行主体可以是本申请实施例提供的指令执行装置，或者集成了该指令执行装置的电子设备，其中该指令执行装置可以采用硬件或者软件的方式实现。其中，电子设备可以是智能手机、平板电脑、掌上电脑、笔记本电脑、或者台式电脑等设备。

本申请实施例提供一种指令执行方法，其中，包括：

接收输入的第一语音信息；

获取所述第一语音信息包括的多个第一待执行指令；

对所述多个第一待执行指令进行排序，得到第一排序信息；

在一实施例中，所述指令执行方法，还包括：

在执行所述多个第一待执行指令期间，接收输入的第二语音信息；

获取所述第二语音信息包括的多个第二待执行指令；

对所述多个第二待执行指令进行排序，得到第二排序信息；

在执行完成所述多个第一待执行指令时，根据所述第二排序信息，依次执行所述多个第二待执行指令。

在一实施例中，所述获取所述第一语音信息包括的多个第一待执行指令，包括：

将所述第一语音信息发送至服务器，指示所述服务器对所述第一语音信息进行解析，并返回解析所述第一语音信息所得到的语音解析文本；

接收所述服务器返回的所述语音解析文本；

根据所述语音解析文本获取所述多个第一待执行指令。

在一实施例中，所述获取所述第一语音信息包括的多个第一待执行指令之前，还包括：

获取所述第一语音信息的声纹特征；

判断所述声纹特征是否与预设声纹特征匹配；

在所述声纹特征与预设声纹特征匹配时，获取所述第一语音信息包括的多个第一待执行指令。

在一实施例中，所述判断所述声纹特征是否与预设声纹特征匹配，包括：

获取所述声纹特征和所述预设声纹特征的相似度；

判断所述相似度是否大于或等于第一预设相似度；

在所述相似度大于或等于所述第一预设相似度时，确定所述声纹特征与所述预设声纹特征匹配。

在一实施例中，所述判断所述相似度是否大于或等于第一预设相似度之后，还包括：

在所述相似度小于所述第一预设相似度且大于或等于第二预设相似度时，获取当前的位置信息；

根据所述位置信息确定当前是否位于预设位置范围内；

在当前位于预设位置范围内时，确定所述声纹特征与所述预设声纹特征匹配。7

在一实施例中，所述判断所述声纹特征是否与预设声纹特征匹配之后，还包括：

若所述声纹特征与所述预设声纹特征不匹配，则丢弃所述第一语音信息。

在一实施例中，所述接收输入的第一语音信息，包括：

采集外部环境中的声音信息，并对所述声音信息进行降噪处理，提取出所述声音信息中的人声信息作为所述第一语音信息。

请参照图1，图1为本申请实施例提供的指令执行方法的流程示意图。如图1所示，本申请实施例提供的指令执行方法的流程可以如下：

在101中，接收输入的第一语音信息。

本申请实施例中，电子设备可以通过音频采集模组来对外部环境中的声音进行采集，以得到音频格式的声音信息。在采集得到外部环境中的声音信息之后，对采集得到的声音信息进行降噪处理，提取出声音信息中的人声信息，将该人声信息记为输入的第一语音信息。

其中，音频采集模组可以是电子设备内置的麦克风，也可以是电子设备外部接入的麦克风，本申请对此不做具体限制，可由电子设备根据设定的选取规则进行选取。比如，选取规则被配置为：若接入了外部麦克风，则通过接入的外部麦克风对外部环境中的声音进行采集；若未接入外部麦克风，则通过内置麦克风进对外部环境中的声音进行采集。

比如，当用户需要用语音指令的方式控制电子设备下载XX应用，并安装XX应用时，可以说出“请帮我下载和安装XX应用”，与此同时，电子设备将通过内置麦克风采集到包括人声信息“请帮我下载和安装XX应用”和环境噪音的声音信息，之后，电子设备对采集到的声音信息进行降噪处理，去除声音信息中的环境噪音，提取出人声信息“请帮我下载和安装XX应用”，将人声信息“请帮我下载和安装XX应用”作为输入的第一语音信息。

在102中，获取第一语音信息包括的多个第一待执行指令。

本申请实施例中，电子设备在接收到输入的音频格式的第一语音信息之后，判断本地是否存在语音解析引擎，若存在，则电子设备将第一语音信息输入到本地的语音解析引擎进行语音解析，得到语音解析文本。其中，对语音信息进行语音解析，也即是将语音信息由“音频”向“文字”的转换过程。

此外，在本地存在多个语音解析引擎时，电子设备可以按照以下方式从多个语音解析引擎中选取一个语音解析引擎对接收到的第一语音信息进行语音继续：

其一，电子设备可以从本地的多个语音解析引擎中随机选取一个语音解析引擎，对接收到第一语音信息进行语音解析。

其二，电子设备可以从多个语音解析引擎中选取解析成功率最高的语音解析引擎，对接收到的第一语音信息进行语音解析。

其三，电子设备可以从多个语音解析引擎中选取解析时长最短的语音解析引擎，对接收到的第一语音信息进行语音解析。

其四，电子设备还可以从多个语音解析引擎中，选取解析成功率达到预设成功率、且解析时长最短的语音解析引擎对第一语音信息进行语音解析。

需要说明的是，本领域技术人员还可以按照以上未列出的方式进行语音解析引擎的选取，或者可以结合多个语音解析引擎对第一语音信息进行语音解析，比如，电子设备可以同时通过两个语音解析引擎对第一语音信息进行语音解析，并在两个语音解析引擎得到的语音解析文本相同时，将该相同的语音解析文本作为第一语音信息的语音解析文本；又比如，电子设备可以通过至少三个语音解析引擎对第一语音信息进行语音解析，并在其中至少两个语音解析引擎得到的语音解析文本相同时，将该相同的语音解析文本作为第一语音信息的语音解析文本。

在解析得到第一语音信息的语音解析文本之后，电子设备进一步从该语音解析文本中获取第一语音信息包括的多个第一待执行指令。

其中，电子设备预先存储有多个指令关键词，每一个指令关键词对应一个指令。在从解析得到的语音解析文本获取第一语音信息包括的多个第一待执行指令时，电子设备首先对前述语音解析文本进行分词操作，得到对应语音解析文本的词序列，该词序列中包括多个词。

在得到对应语音解析文本的词序列之后，电子设备对词序列进行指令关键词的匹配，也即是查找出词序列中的多个指令关键词，从而得到对应这多个指令关键词的多个指令，将这多个指令作为第一语音信息包括的多个第一待执行指令。其中，指令关键词的匹配查找包括完全匹配和/或模糊匹配。

比如，请参照图2，电子设备通过本地的语音解析引擎对音频格式的第一语音信息“请帮我下载和安装XX应用”进行语音解析，得到文本格式的语音解析文本“请帮我下载和安装XX应用”。对该语音解析文本进行分词操作，得到词序列为{请，帮我，下载，和，安装，XX应用}。对该词序列进行指令关键词的匹配，识别出词序列中的指令关键词为“下载”和“安装”，从而得到两个第一待执行指令，分别为“下载XX应用”和“安装XX应用”。

在103中，对多个第一待执行指令进行排序，得到第一排序信息。

本申请实施例中，在获取到第一语音信息包括的多个第一待执行指令之后，电子设备根据各第一待执行指令所对应的指令关键词在前述词序列中的顺序，对多个第一待执行指令进行排序，得到第一排序信息。

比如，对应第一语音信息的词序列为{请，帮我，下载，和，安装，XX应用}，获取得到的两个第一待执行指令分别为“下载XX应用”和“安装XX应用”，其中，“下载XX应用”对应的指令关键词为“下载”，“按照XX应用”对应的指令关键词为“安装”，根据两个指令关键词在词序列中的顺序，对“下载XX应用”和“安装XX应用”进行排序，得到的第一排序信息为：“下载XX应用”、“安装XX应用”，其中，“下载XX应用”的顺序在“安装XX应用”之前。

在104中，根据第一排序信息，依次执行多个第一待执行指令。

本申请实施例中，电子设备在完成对多个第一待执行指令的排序操作，并得到第一排序信息时，即可根据得到的第一排序信息，依次执行多个第一待执行指令。

比如，请参照图3，获取到第一语音信息的两个待执行指令分别为“下载XX应用”和“安装XX应用”，排序得到的第一排序信息为：“下载XX应用”、“安装XX应用”。根据第一排序信息，电子设备设备首先执行“下载XX应用”，从互联网下载到XX应用的安装包，然后执行“安装XX应用”，根据下载得到的XX应用的安装包，进行XX应用的安装。

由上可知，本申请实施例中，电子设备可以接收输入的第一语音信息。获取第一语音信息包括的多个第一待执行指令。对多个第一待执行指令进行排序，得到多个第一待执行指令的第一排序信息。根据第一排序信息，依次执行多个第一待执行指令。由此，即使用户说出的语音信息中包括多条指令，也能够依次执行语音信息中的多条指令，确保不遗漏任何指令，达到提高语音控制准确度的目的。

在一实施例中，该指令执行方法，还可以包括：

在执行多个第一待执行指令期间，接收输入的第二语音信息；

获取第二语音信息包括的多个第二待执行指令；

对多个第二待执行指令进行排序，得到第二排序信息；

在执行完成多个第一待执行指令时，根据第二排序信息，依次执行多个第二待执行指令。

本申请实施例中，电子设备在执行多个第一待执行指令的期间，继续通过音频采集模组对外部环境中的声音进行采集，得到音频格式的声音信息。在采集得到外部环境中的声音信息之后，对采集得到的声音信息进行降噪处理，提取出声音信息中的人声信息，将此时提取出的人声信息记为输入的第二语音信息。

在接收到输入的第二语音信息之后，电子设备获取第二语音信息包括的多个第二待执行指令，并对多个第二待执行指令进行排序，得到第二排序信息，具体可参照以上实施例中对第一语音信息的处理操作相应实施，此处不再赘述。

在得到第二排序信息之后，电子设备将获取得到的多个第二待执行指令拼接至前述多个第一待执行指令的尾部，从而在执行完成多个第一待执行指令时，根据得到的第二排序信息，依次执行多个第二待执行指令。

比如，请结合参照图4和图3，获取到第一语音信息的两个待执行指令分别为“下载XX应用”和“安装XX应用”，排序得到的第一排序信息为：“下载XX应用”、“安装XX应用”。在执行前述两个第一待执行指令的过程中，接收到第二语音信息，并获取到该第二语音信息包括的两个第二待执行指令，分别为“启动XX应用”和“在XX应用中播放XX视频”，之后多这两个第二待执行指令进行排序，得到第二排序信息为：“启动XX应用”和“在XX应用中播放XX视频”。在执行完成两个第一待执行指令之后，再执行“启动XX应用”，启动安装的XX应用，再执行“在XX应用中播放XX视频”，通过XX应用播放XX视频。

由此，可以使得电子设备能够对非连续语音方式输入的指令进行拼接，并根据拼接得到的指令组合来连续执行，提升了电子设备与用户语音交互的智能性。

在一实施例中，获取第一语音信息包括的多个第一待执行指令，包括：

将第一语音信息发送至服务器，指示服务器对第一语音信息进行解析，并返回解析第一语音信息所得到的语音解析文本；

接收服务器返回的语音解析文本；

根据接收到的语音解析文本，获取第一语音信息包括的多个第一待执行指令。

其中，电子设备在接收到输入的、音频格式的第一语音信息之后，判断本地是否存在语音解析引擎，若不存在，则将接收到的第一语音信息发送至服务器(该服务器为提供语音解析服务的服务器)，指示该服务器对第一语音信息进行解析，并返回解析第一语音信息所得到的语音解析文本。

在接收到服务器返回的语音解析文本之后，电子设备即可根据该语音解析文本获取第一语音信息包括的多个第一待执行指令。其中，对于如何从语音解析文本中获取前述多个第一待执行指令，具体可参照以上实施例中的相关描述，此处不再赘述。

在一实施例中，获取第一语音信息包括的多个第一待执行指令之前，还包括：

获取第一语音信息的声纹特征；

判断获取到的声纹特征是否与预设声纹特征匹配；

在获取到的声纹特征与预设声纹特征匹配时，获取第一语音信息包括的多个第一待执行指令。

在实际生活中，每个人说话时的声音都有自己的特点，熟悉的人之间，可以只听声音而相互辨别出来。

这种声音的特点就是声纹特征，声纹特征主要由两个因素决定，第一个是声腔的尺寸，具体包括咽喉、鼻腔和口腔等，这些器官的形状、尺寸和位置决定了声带张力的大小和声音频率的范围。因此不同的人虽然说同样的话，但是声音的频率分布是不同的，听起来有的低沉有的洪亮。

第二个决定声纹特征的因素是发声器官被操纵的方式，发声器官包括唇、齿、舌、软腭及腭肌肉等，他们之间相互作用就会产生清晰的语音。而他们之间的协作方式是人通过后天与周围人的交流中随机学习到的。人在学习说话的过程中，通过模拟周围不同人的说话方式，就会逐渐形成自己的声纹特征。

本申请实施例中，在接收到输入的第一语音信息时，电子设备首先获取到该第一语音信息的声纹特征。

在获取到第一语音信息的声纹特征之后，电子设备进一步将获取到的该声纹特征与预设声纹特征进行进行比对，以判断该声纹特征是否与预设声纹特征匹配。其中，预设声纹特征可以为机主预先录入的声纹特征，判断输入的语音信息的声纹特征是否与预设声纹特征匹配，也即是判断当前输入语音信息的用户是否为机主。

在获取到的声纹特征与预设声纹特征匹配时，电子设备确定当前输入第一语音信息的用户为机主，此时获取第一语音信息包括的多个第一待执行指令，并执行这多个第一待执行指令，具体可参照以上实施例的相关描述，此处不再赘述。

其中，电子设备在判断获取到的声纹特征是否与预设声纹特征匹配时，可以获取该声纹特征(从接收到的语音信息所获取到的声纹特征)与预设声纹特征的相似度，并判断获取到的相似度是否大于或等于第一预设相似度(根据实际需要进行设置，比如，可以设置为95％)。其中，在获取到的相似度大于或等于第一预设相似度时，确定获取到的声纹特征与预设声纹特征匹配；在获取到的相似度小于低于相似度时，确定获取到的声纹特征与预设声纹特征不匹配。

此外，在获取到的声纹特征与预设声纹特征不匹配时，电子设备确定当前输入语音信息的用户不为机主，丢弃接收到的第一语音信息，并继续接收输入到的第一语音信息，直至接收到机主输入的第一语音信息时，获取该第一语音信息包括的多个第一待执行指令，并执行这多个第一待执行指令，具体可参照以上实施例的相关描述，此处不再赘述。

本申请实施例通过在对输入的第一语音信息进行响应之前，首先根据该第一语音信息的声纹特征进行用户的身份识别，在且仅在输入第一语音信息的用户为机主时，才对输入第一语音信息进行响应。由此，能够避免电子设备执行非机主意愿的操作，提升机主的使用体验。

在一实施例中，判断获取到的相似度是否大于或等于第一预设相似度之后，还包括：

在获取到的相似度小于第一预设相似度且大于或等于第二预设相似度时，获取当前的位置信息；

根据该位置信息判断当前是否位于预设位置范围内；

在当前位于预设位置范围内时，确定获取的声纹特征与预设声纹特征匹配。

需要说明的是，由于声纹特征和人体的生理特征密切相关，在日常生活中，如果用户感冒发炎的话，其声音将变得沙哑，声纹特征也将随之发生变化。在这种情况下，即使电子设备接收到的语音信息由机主说出，电子设备也无法识别出。此外，还存在多种导致电子设备无法识别出机主的情况，此处不再赘述。

为解决可能出现的、无法识别出机主的情况，在本申请实施例中，电子设备在完成对声纹特征相似度的判断之后，若接收到的语音信息的声纹特征与预设声纹特征的相似度小于第一预设相似度，进一步判断该声纹特征是否大于获等于第二预设相似度(该第二预设相似度配置为小于第一预设相似度，具体可由本领域技术人员根据实际需要取合适值，比如，在第一预设相似度被设置为95％时，可以将第二预设相似度设置为75％)。

在判断结果为是，也即是获取到的语音信息的声纹特征、与预设声纹特征的相似度小于第一预设相似度且大于或等于第二预设相似度时，电子设备进一步获取到当前的位置信息。其中，电子设备可以采用卫星定位技术或者基站定位技术等不同的定位技术来获取到当前的位置信息。

在获取到当前的位置信息之后，电子设备根据该位置信息判断当前是否位于预设位置范围内。其中，预设位置范围可以配置为机主的常用位置范围，比如家里和公司等。

在当前位于预设位置范围内时，电子设备确定前述声纹特征与预设声纹特征匹配，将输入语音信息的当前用户识别为机主。

由此，能够避免可能出现的、无法识别出机主的情况，达到提升机主使用体验的目的。

下面将在上述实施例描述的方法基础上，对本申请的指令执行方法做进一步介绍。请参照图5，该指令执行方法可以包括：

在201中，接收输入的第一语音信息。

在202中，获取第一语音信息包括的多个第一待执行指令。

在一实施例中，在完成对本地是否存在语音解析引擎的判断，且本地不存在语音解析引擎时，将接收到的第一语音信息发送至服务器(该服务器为提供语音解析服务的服务器)，指示该服务器对第一语音信息进行解析，并返回解析第一语音信息所得到的语音解析文本。

在203中，对多个第一待执行指令进行排序，得到第一排序信息。

在204中，根据第一排序信息，依次执行多个第一待执行指令。

在205中，在执行多个第一待执行指令期间，接收输入的第二语音信息。

电子设备在执行多个第一待执行指令的期间，继续通过音频采集模组对外部环境中的声音进行采集，得到音频格式的声音信息。在采集得到外部环境中的声音信息之后，对采集得到的声音信息进行降噪处理，提取出声音信息中的人声信息，将此时提取出的人声信息记为输入的第二语音信息。

在206中，获取第二语音信息包括的多个第二待执行指令。

在207中，对多个第二待执行指令进行排序，得到第二排序信息。

在208中，在执行完成多个第一待执行指令时，根据第二排序信息，依次执行多个第二待执行指令。

比如，请结合参照图4和图3，获取到第一语音信息的两个待执行指令分别为“下载XX应用”和“安装XX应用”，排序得到的第一排序信息为：“下载XX应用”、“安装XX应用”。在执行前述两个第一待执行指令的过程中，接收到第二语音信息，并获取到该第二语音信息包括的两个第二待执行指令，分别为“启动XX应用”和“在XX应用中播放XX视频”，之后多这两个第二待执行指令进行排序，得到第二排序信息为：“启动XX应用”和“在XX应用中播放XX视频”。在执行完成两个第一待执行指令之后，再执行“启动XX应用”，启动安装的XX应用，再执行“在XX应用中播放XX视频”，通过 XX应用播放XX视频。

在一实施例中，还提供了一种指令执行装置。请参照图6，图6为本申请实施例提供的指令执行装置400的结构示意图。其中该指令执行装置应用于电子设备，该指令执行装置包括接收模块401、获取模块402、排序模块403和执行模块404，如下：

接收模块401，用于接收输入的第一语音信息。

获取模块402，用于获取第一语音信息包括的多个第一待执行指令。

排序模块403，用于对多个第一待执行指令进行排序，得到第一排序信息。

执行模块404，用于根据第一排序信息，依次执行多个第一待执行指令。

在一实施例中，接收模块401还可以用于在执行模块404执行多个第一待执行指令期间，接收输入的第二语音信息。

获取模块402还可以用于获取第二语音信息包括的多个第二待执行指令。

排序模块403还可以用于对多个第二待执行指令进行排序，得到第二排序信息。

执行模块404还可以用于在执行完成多个第一待执行指令时，根据第二排序信息，依次执行多个第二待执行指令。

在一实施例中，获取模块402，还可以用于：

接收服务器返回的语音解析文本；

在一实施例中，获取模块402，还可以用于：

获取第一语音信息的声纹特征；

判断获取到的声纹特征是否与预设声纹特征匹配；

在一实施例中，获取模块402，还可以用于：

获取前述声纹特征和预设声纹特征的相似度；

判断获取到的相似度是否大于或等于第一预设相似度；

在获取到的相似度大于或等于第一预设相似度时，确定前述声纹特征与预设声纹特征匹配。

在一实施例中，获取模块402，还可以用于：

根据该位置信息判断当前是否位于预设位置范围内；

在一实施例中，在判断声纹特征是否与预设声纹特征匹配之后，获取模块402还用于：

若声纹特征与预设声纹特征不匹配，则丢弃第一语音信息。

在一实施例中，在接收输入的第一语音信息时，接收模块401用于：

采集外部环境中的声音信息，并对声音信息进行降噪处理，提取出声音信息中的人声信息作为第一语音信息。

其中，指令执行装置400中各模块执行的步骤可以参考上述方法实施例描述的方法步骤。该指令执行装置400可以集成在电子设备中，如手机、平板电脑等。

具体实施时，以上各个模块可以作为独立的实体实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单位的具体实施可参见前面的实施例，在此不再赘述。

由上可知，本实施例指令执行装置可以由接收模块401接收输入的第一语音信息。由获取模块402获取第一语音信息包括的多个第一待执行指令。由排序模块403对多个第一待执行指令进行排序，得到多个第一待执行指令的第一排序信息。由执行模块404根据第一排序信息，依次执行多个第一待执行指令。由此，即使用户说出的语音信息中包括多条指令，也能够依次执行语音信息中的多条指令，确保不遗漏任何指令，达到提高语音控制准确度的目的。

在一实施例中，还提供一种电子设备。请参照图7，电子设备500包括处理器501以及存储器502。其中，处理器501与存储器502电性连接。

处理器500是电子设备500的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或加载存储在存储器502内的计算机程序，以及调用存储在存储器502内的数据，执行电子设备500的各种功能并处理数据。

存储器502可用于存储软件程序以及模块，处理器501通过运行存储在存储器502的计算机程序以及模块，从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器502可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器502还可以包括存储器控制器，以提供处理器501对存储器502的访问。

在本申请实施例中，电子设备500中的处理器501会按照如下的步骤，将一个或一个以上的计算机程序的进程对应的指令加载到存储器502中，并由处理器501运行存储在存储器502中的计算机程序，从而实现各种功能，如下：

接收输入的第一语音信息；

获取第一语音信息包括的多个第一待执行指令；

对多个第一待执行指令进行排序，得到第一排序信息；

根据第一排序信息，依次执行多个第一待执行指令。

请一并参阅图8，在某些实施方式中，电子设备500还可以包括：显示器503、射频电路504、音频电路505以及电源506。其中，其中，显示器503、射频电路504、音频电路505以及电源506分别与处理器501电性连接。

显示器503可以用于显示由用户输入的信息或提供给用户的信息以及各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示器503可以包括显示面板，在某些实施方式中，可以采用液晶显示器(Liquid Crystal Display，LCD)、或者有机发光二极管(Organic Light-Emitting Diode，OLED)等形式来配置显示面板。

射频电路504可以用于收发射频信号，以通过无线通信与网络设备或其他电子设备建立无线通讯，与网络设备或其他电子设备之间收发信号。

音频电路505可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。

电源506可以用于给电子设备500的各个部件供电。在一些实施例中，电源506可以通过电源管理系统与处理器501逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管图8中未示出，电子设备500还可以包括摄像头、蓝牙模块等，在此不再赘述。

在某些实施方式中，处理器501可以执行：

获取第二语音信息包括的多个第二待执行指令；

对多个第二待执行指令进行排序，得到第二排序信息；

在某些实施方式中，在获取第一语音信息包括的多个第一待执行指令时，处理器501可以执行：

接收服务器返回的语音解析文本；

在某些实施方式中，在获取第一语音信息包括的多个第一待执行指令之前，处理器501可以执行：

获取第一语音信息的声纹特征；

判断获取到的声纹特征是否与预设声纹特征匹配；

在某些实施方式中，在判断获取到的声纹特征是否与预设声纹特征匹配时，处理器501还可以执行：

获取前述声纹特征和预设声纹特征的相似度；

判断获取到的相似度是否大于或等于第一预设相似度；

在某些实施方式中，在判断获取到的相似度是否大于或等于第一预设相似度之后，处理器501还可以执行：

根据该位置信息判断当前是否位于预设位置范围内；

在某些实施方式中，在判断声纹特征是否与预设声纹特征匹配之后，处理器501还可以执行：

若声纹特征与预设声纹特征不匹配，则丢弃第一语音信息。

在一实施例中，在接收输入的第一语音信息时，处理器501可以执行：

本申请实施例还提供一种存储介质，所述存储介质存储有计算机程序，当所述计算机程序在计算机上运行时，使得所述计算机执行上述任一实施例中的指令执行方法，比如：接收输入的第一语音信息；获取第一语音信息包括的多个第一待执行指令；对多个第一待执行指令进行排序，得到第一排序信息；根据第一排序信息，依次执行多个第一待执行指令。

本申请实施例中，存储介质可以是磁碟、光盘、只读存储器(Read Only Memory，ROM，)或者随机存取器(Random Access Memory，RAM)等。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

需要说明的是，对本申请实施例的指令执行方法而言，本领域普通测试人员可以理解实现本申请实施例的指令执行方法的全部或部分流程，是可以通过计算机程序来控制相关的硬件来完成，所述计算机程序可存储于一计算机可读取存储介质中，如存储在电子设备的存储器中，并被该电子设备内的至少一个处理器执行，在执行过程中可包括如指令执行方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储器、随机存取记忆体等。

对本申请实施例的指令执行装置而言，其各功能模块可以集成在一个处理芯片中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中，所述存储介质譬如为只读存储器，磁盘或光盘等。

以上对本申请实施例所提供的一种指令执行方法、装置、存储介质及电子设备进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种指令执行方法，其中，包括：

接收输入的第一语音信息；

获取所述第一语音信息包括的多个第一待执行指令；

对所述多个第一待执行指令进行排序，得到第一排序信息；

根据所述第一排序信息，依次执行所述多个第一待执行指令。
如权利要求1所述的指令执行方法，其中，所述指令执行方法，还包括：

在执行所述多个第一待执行指令期间，接收输入的第二语音信息；

获取所述第二语音信息包括的多个第二待执行指令；

对所述多个第二待执行指令进行排序，得到第二排序信息；

在执行完成所述多个第一待执行指令时，根据所述第二排序信息，依次执行所述多个第二待执行指令。
如权利要求1所述的指令执行方法，其中，所述获取所述第一语音信息包括的多个第一待执行指令，包括：

将所述第一语音信息发送至服务器，指示所述服务器对所述第一语音信息进行解析，并返回解析所述第一语音信息所得到的语音解析文本；

接收所述服务器返回的所述语音解析文本；

根据所述语音解析文本获取所述多个第一待执行指令。
如权利要求1所述的指令执行方法，其中，所述获取所述第一语音信息包括的多个第一待执行指令之前，还包括：

获取所述第一语音信息的声纹特征；

判断所述声纹特征是否与预设声纹特征匹配；

在所述声纹特征与预设声纹特征匹配时，获取所述第一语音信息包括的多个第一待执行指令。
如权利要求4所述的指令执行方法，其中，所述判断所述声纹特征是否与预设声纹特征匹配，包括：

获取所述声纹特征和所述预设声纹特征的相似度；

判断所述相似度是否大于或等于第一预设相似度；

在所述相似度大于或等于所述第一预设相似度时，确定所述声纹特征与所述预设声纹特征匹配。
如权利要求5所述的指令执行方法，其中，所述判断所述相似度是否大于或等于第一预设相似度之后，还包括：

在所述相似度小于所述第一预设相似度且大于或等于第二预设相似度时，获取当前的位置信息；

根据所述位置信息确定当前是否位于预设位置范围内；

在当前位于预设位置范围内时，确定所述声纹特征与所述预设声纹特征匹配。7
如权利要求4所述的指令执行方法，其中，所述判断所述声纹特征是否与预设声纹特征匹配之后，还包括：

若所述声纹特征与所述预设声纹特征不匹配，则丢弃所述第一语音信息。
如权利要求1所述的指令执行方法，其中，所述接收输入的第一语音信息，包括：

采集外部环境中的声音信息，并对所述声音信息进行降噪处理，提取出所述声音信息中的人声信息作为所述第一语音信息。
一种指令执行装置，其中，包括：

接收模块，用于接收输入的第一语音信息；

获取模块，用于获取所述第一语音信息包括的多个第一待执行指令；

排序模块，用于对所述多个第一待执行指令进行排序，得到所述多个第一待执行指令的第一排序信息；

执行模块，用于根据所述第一排序信息，依次执行所述多个第一待执行指令。
如权利要求9所述的指令执行装置，其中，

所述接收模块还用于在执行模块执行多个第一待执行指令期间，接收输入的第二语音信息。

所述获取模块还用于获取第二语音信息包括的多个第二待执行指令。

所述排序模块还用于对多个第二待执行指令进行排序，得到第二排序信息。

所述执行模块还用于在执行完成多个第一待执行指令时，根据第二排序信息，依次执行多个第二待执行指令。
如权利要求9所述的指令执行装置，其中，所述获取模块还用于：

将第一语音信息发送至服务器，指示服务器对第一语音信息进行解析，并返回解析第一语音信息所得到的语音解析文本；

接收服务器返回的语音解析文本；

根据接收到的语音解析文本，获取第一语音信息包括的多个第一待执行指令。
一种存储介质，其上存储有计算机程序，其中，当所述计算机程序在计算机上运行时，使得所述计算机执行：

接收输入的第一语音信息；

获取所述第一语音信息包括的多个第一待执行指令；

对所述多个第一待执行指令进行排序，得到第一排序信息；

根据所述第一排序信息，依次执行所述多个第一待执行指令。
一种电子设备，包括处理器和存储器，所述存储器储存有计算机程序，其中，所述处理器通过调用所述计算机程序，用于执行：

接收输入的第一语音信息；

获取所述第一语音信息包括的多个第一待执行指令；

对所述多个第一待执行指令进行排序，得到第一排序信息；

根据所述第一排序信息，依次执行所述多个第一待执行指令。
如权利要求13所述的电子设备，其中，所述处理器还用于执行：

在执行所述多个第一待执行指令期间，接收输入的第二语音信息；

获取所述第二语音信息包括的多个第二待执行指令；

对所述多个第二待执行指令进行排序，得到第二排序信息；

在执行完成所述多个第一待执行指令时，根据所述第二排序信息，依次执行所述多个第二待执行指令。
如权利要求13所述的电子设备，其中，在获取所述第一语音信息包括的多个第一待执行指令时，所述处理器用于执行：

将所述第一语音信息发送至服务器，指示所述服务器对所述第一语音信息进行解析，并返回解析所述第一语音信息所得到的语音解析文本；

接收所述服务器返回的所述语音解析文本；

根据所述语音解析文本获取所述多个第一待执行指令。
如权利要求13所述的电子设备，其中，在获取所述第一语音信息包括的多个第一待执行指令之前，所述处理器还用于执行：

获取所述第一语音信息的声纹特征；

判断所述声纹特征是否与预设声纹特征匹配；

在所述声纹特征与预设声纹特征匹配时，获取所述第一语音信息包括的多个第一待执行指令。
如权利要求16所述的电子设备，其中，在判断所述声纹特征是否与预设声纹特征匹配时，所述处理器用于执行：

获取所述声纹特征和所述预设声纹特征的相似度；

判断所述相似度是否大于或等于第一预设相似度；

在所述相似度大于或等于所述第一预设相似度时，确定所述声纹特征与所述预设声纹特征匹配。
如权利要求17所述的电子设备，其中，在判断所述相似度是否大于或等于第一预设相似度之后，所述处理器还用于执行：

在所述相似度小于所述第一预设相似度且大于或等于第二预设相似度时，获取当前的位置信息；

根据所述位置信息确定当前是否位于预设位置范围内；

在当前位于预设位置范围内时，确定所述声纹特征与所述预设声纹特征匹配。7
如权利要求16所述的电子设备，其中，在判断所述声纹特征是否与预设声纹特征匹配之后，所述处理器还用于执行：

若所述声纹特征与所述预设声纹特征不匹配，则丢弃所述第一语音信息。
如权利要求13所述的电子设备，其中，在接收输入的第一语音信息时，所述处理器用于执行：

采集外部环境中的声音信息，并对所述声音信息进行降噪处理，提取出所述声音信息中的人声信息作为所述第一语音信息。