WO2014023257A1

WO2014023257A1 - 指令处理方法、装置和系统

Info

Publication number: WO2014023257A1
Application number: PCT/CN2013/081131
Authority: WO
Inventors: 梅敬青; 薛国栋
Original assignee: 华为终端有限公司
Priority date: 2012-08-09
Filing date: 2013-08-09
Publication date: 2014-02-13
Also published as: EP2830044A4; CN102831894B; US20150039319A1; CN102831894A; EP2830044A1; EP2830044B1; US9704503B2

Abstract

本发明实施例提供一种指令处理方法、装置和系统，方法包括：接收语音解析服务器发送的多条语音指令，多条语音指令为语音解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的；分别判断多条语音指令中任意两条语音指令是否为相似指令，相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令；当多条语音指令中存在两条语音指令为相似指令时，丢弃两条相似的语音指令中的一条语音指令。本发明实施例还提供了一种指令处理装置和系统。本实施例消除了命令重复执行带来的控制错误。

Description

指令处理方法、装置和系统本申请要求于 2012 年 8 月 9 日提交中国专利局、申请号为 201210282268.X, 名称为 "指令处理方法、装置和系统" 的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域本发明涉及通信技术，尤其涉及一种指令处理方法、装置和系统。背景技术语音控制技术作为一种相对更加筒易、人性化的控制方式，已逐渐被业界所认可，越来越多的电子设备，如智能手机（ Smart Phone )、平板电脑（ Tablet )、智能电视（Smart TV )等，都将具有语音控制功能，并将会同时出现在人们的日常生活中；可以预见，语音控制功能将越来越多样化，且将出现越来越多的支持语音控制的消费电子设备、办公设备等。随着终端设备计算能力的增强以及智能化的趋势，一些终端设备所能支持的功能越来越丰富，且可能出现重叠，如用户可以通过 Smart Phone、 Smart TV等上 Twitter。此外，随着家庭自动化的普及，通过各种智能终端均可以控制家庭网络中的其他设备，如在 Moto的 4Home Service中，用户可以用手机远程控制各种家用电器。因此，语音控制技术不仅将成为一种重要的人机交互方式，而且可以被不同的智能终端所理解和执行。目前的语音命令技术主要包括传统语音控制技术和智能语音控制技术，传统语音控制技术中用户需要依据特定的语法和命令词汇来发布命令，智能语音控制技术中用户可以通过自然语言自由发布命令。相比之下，传统语音控制技术实现机制相对筒单、准确度高，但用户体验相对较差，智能语音控制技术实现机制复杂，但用户体验相对较好。但目前业界普遍认为智能语音控制技术的发展前景更为广阔，如 Apple、 Google等公司都在加大这方面的研究和开发。对于智能语音控制技术，由于其计算开销大，通常采用云端处理的模式，不仅可以降低设备本地处理的复杂度，还可以减少能量消耗。在现有技术中 ,语音控制的一种执行方式为在电子设备的后台一直运行监听的语音控制，例如 Samsung的 Smart Interaction TV实时监听用户的操作指令，以快速执行用户的操作指令。

然而，用户发出的同一条语音命令有可能被多个设备同时监听到，例如，当用户对设备 A发出指令： "降低设备 B的音量一格" 时，该命令可能同时被设备 B监听到，则设备 B会执行设备 A下发的指令和从用户直接接收到的指令，使得设备 B 的音量被重复降两次，从而导致语音命令的重复执行，甚至出现控制错误。发明内容本发明实施例提供一种指令处理方法、装置和系统，避免多个语音控制设备重复执行同时采集到的一条语音命令，消除命令重复执行带来的控制错误。本发明实施例的第一方面是提供一种指令处理方法，包括：

接收语音解析服务器发送的多条语音指令，所述多条语音指令为所述语音解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的；

分别判断所述多条语音指令中任意两条语音指令是否为相似指令，所述相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令；

当所述多条语音指令中存在两条语音指令为相似指令时，丢弃两条相似的语音指令中的一条语音指令。

在第一方面的第一种可能的实现方式中，所述多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容；

所述分别判断所述多条语音指令中任意两条语音指令是否为相似指令包括：

根据所述多条语音指令对应的源语音命令的采集时间信息，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠；根据所述多条语音指令的指令内容，分别判断所述多条语音指令中任意两条语音指令在内容上是否重复；

当所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间重叠，且在内容上重复时，确定所述两条语音指令为相似指令。

结合第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，所述方法还包括：

当从所述语音解析服务器接收到一条新的语音指令时，记录所述新的语音指令的采集时间信息；

将所述新的语音指令的采集时间与之前记录的语音指令的采集时间进行比较，确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令；

将所述新的语音指令与所述相关语音指令作为所述多条语音指令。

结合第一方面的第一种可能的实现方式或第一方面的第二种可能的实现方式，在第一方面的第三种可能的实现方式中，所述根据所述多条语音指令对应的源语音命令的采集时间信息，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠包括：

根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值，以及截止时间戳的差值是否均小于预设的门限值；若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值，则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠；或者，

根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳，分别获取多条语音指令的持续时间，判断所述多条语音指令中任意两条语音指令的持续时间是否有重叠部分；若所述持续时间有重叠部分，则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。

结合第一方面、第一方面的第一种可能的实现方式、第一方面的第二种可能的实现方式或第一方面的第三种可能的实现方式，在第一方面的第四种可能的实现方式中，所述多条语音指令中还分别携带各所述语音指令对应的源语音命令的优先级参数；

所述方法还包括：

根据语音指令对应的源语音命令的优先级参数，确定两条相似的语音指令中的优先级高的语音指令，以及两条相似的语音指令中的优先级低的语音指令；所述当所述多条语音指令中存在两条语音指令为相似指令时，丢弃两条相似的语音指令中的一条语音指令包括：

当所述多条语音指令中存在两条语音指令为相似指令时，将两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备，将优先级低的语音指令进行丢弃处理。

结合第一方面、第一方面的第一种可能的实现方式、第一方面的第二种可能的实现方式、第一方面的第三种可能的实现方式或第一方面的第四种可能的实现方式，在第一方面的第五种可能的实现方式中，本发明实施例的指令处理方法还包括：

当接收到的一条新的语音指令与已返回给其他语音控制设备的语音指令为相似指令时，对所述新的语音指令进行丢弃处理。

结合第一方面，在第一方面的第六种可能的实现方式中，本发明实施例的指令处理方法还包括：

所述语音解析服务器与各语音控制设备进行时间同步；

所述语音解析服务器分别接收所述各语音控制设备发送的所述源语音命令。

结合第一方面，在第一方面的第七种可能的实现方式中，本发明实施例的指令处理方法还包括：

本地语音控制网关与各语音控制设备进行时间同步；

所述本地语音控制网关分别接收所述各语音控制设备发送的所述源语音命令，并将各所述源语音命令发送到所述语音解析服务器。

本发明实施例的第二方面是提供一种指令处理装置，包括：

接收模块，用于接收语音解析服务器发送的多条语音指令，所述多条语音指令为所述语音解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的；

判断模块，用于分别判断所述接收模块接收到的所述多条语音指令中任意两条语音指令是否为相似指令，所述相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令；

冗余指令处理模块，用于当所述判断模块的判断结果为所述多条语音指令中有两条语音指令为相似指令时，丢弃两条相似的语音指令中的一条语音指令。

在第二方面的第一种可能的实现方式中，所述接收模块接收到的所述多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容；

所述判断模块包括：

第一判断单元，用于根据所述接收模块接收到的所述多条语音指令对应的源语音命令的采集时间信息，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠；

第二判断单元，用于根据所述接收模块接收到的所述多条语音指令的指令内容，分别判断所述多条语音指令中任意两条语音指令在内容上是否重复；相似指令确定单元，用于当所述第一判断单元和第二判断单元的判断结果为所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间重叠，且在内容上重复时，确定所述两条语音指令为相似指令。

结合第二方面的第一种可能的实现方式，在第二方面的第二种可能的实现方式中，所述装置还包括：

记录模块，用于当从所述语音解析服务器接收到一条新的语音指令时，记录所述新的语音指令的采集时间信息；

语音指令确定模块，用于将所述新的语音指令的采集时间与所述记录模块之前记录的语音指令的采集时间进行比较，确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令；并将所述新的语音指令与所述相关语音指令作为所述多条语音指令。

结合第二方面的第一种可能的实现方式或第二方面的第二种可能的实现方式，在第二方面的第三种可能的实现方式中，所述第一判断单元包括：第一判断子单元，用于根据所述接收模块接收到的所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值，以及截止时间戳的差值是否均小于预设的门限值；若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值，则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠；或者，

第二判断子单元，用于所述接收模块接收到的根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳，分别获取多条语音指令的持续时间，判断所述多条语音指令中任意两条语音指令的持续时间是否有重叠部分；若所述持续时间有重叠部分，则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。

结合第二方面、第二方面的第一种可能的实现方式、第二方面的第二种可能的实现方式或第二方面的第三种可能的实现方式，在第二方面的第四种可能的实现方式中，所述接收模块接收到的所述多条语音指令中还分别携带所述多条语音指令对应的源语音命令的优先级参数；

所述装置还包括：

获取模块，用于根据所述接收模块接收到的语音指令对应的源语音命令的优先级参数，确定两条相似的语音指令中的优先级高的语音指令，以及两条相似的语音指令中的优先级低的语音指令；

所述冗余指令处理模块具体用于当所述判断模块的判断结果为所述多条语音指令中存在两条语音指令为相似指令时，将两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备，将优先级低的语音指令进行丢弃处理。

结合第二方面、第二方面的第一种可能的实现方式、第二方面的第二种可能的实现方式、第二方面的第三种可能的实现方式或第二方面的第四种可能的实现方式，在第二方面的第五种可能的实现方式中，所述冗余指令处理模块还用于当所述接收模块接收到的一条新的语音指令与已返回给其他语音控制设备的语音指令为相似指令时，对所述新的语音指令进行丢弃处理。

本发明实施例的第三方面是提供一种指令处理系统，包括语音解析服务器、多个语音控制设备和上述的指令处理装置；

所述多个语音控制设备分别用于采集多个源语音命令，并分别将所述多个源语音命令发送到所述语音解析服务器；

所述语音解析服务器用于接收所述多个语音控制设备发送的多个源语音命令，对所述多个源语音命令分别进行解析后生成所述多个源语音命令对应的多个语音指令，并将所述多个语音指令分别发送到所述指令处理装置。

在第三方面的第一种可能的实现方式中，所述语音解析服务器还用于与所述多个语音控制设备进行时间同步。本发明实施例的第四方面是提供一种指令处理系统，包括语音解析服务器、多个语音控制设备和本地语音控制网关，所述本地语音控制网关包括上述的指令处理装置；

所述多个语音控制设备用于分别采集多个源语音命令，并分别将所述多个源语音命令发送到所述本地语音控制网关；

所述语音解析服务器用于分别接收所述本地语音控制网关发送的多个源语音命令，对所述多个源语音命令分别进行解析后生成所述多个源语音命令对应的多个语音指令，并分别将所述多个语音指令返回到所述本地语音控制网关。

在第四方面的第一种可能的实现方式中，所述本地语音控制网关还用于与所述多个语音控制设备进行时间同步。

本发明实施例的技术效果是：通过接收语音解析服务器发送的多条语音指令，分别判断多条语音指令中任意两条语音指令是否为相似指令，相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令；当两条语音指令为相似指令时，丢弃其中一条语音指令。本实施例避免了多个语音控制设备重复执行同时采集到的一条语音命令，消除了命令重复执行带来的控制错误。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一筒单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。图 1为本发明指令处理方法实施例一的流程图；

图 2为本发明指令处理方法实施例二的流程图；

图 3为本发明指令处理方法实施例二中的系统架构示意图；

图 4为本发明指令处理方法实施例三的信令图；

图 5为本发明指令处理方法实施例三中的系统架构示意图；

图 6为本发明指令处理装置实施例一的结构示意图；图 7为本发明指令处理装置实施例二的结构示意图；

图 8为本发明指令处理装置实施例三的结构示意图；

图 9为本发明计算机系统实施例的结构示意图；

图 10为本发明指令处理系统实施例一的结构示意图；

图 11为本发明指令处理系统实施例二的结构示意图。具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图 1为本发明指令处理方法实施例一的流程图，如图 1所示，本实施例提供了一种指令处理方法，可以具体包括如下步骤：

步骤 101 , 接收语音解析服务器发送的多条语音指令。

本实施例提出了一种冗余语音指令识别和处理（ Redundant voicE Command identification and Handling；以下筒称： RECH )机制，具体可以在现有的语音控制系统中增加一个 RECH功能实体，该 RECH功能实体可以为一个独立的设备，也可以为集成在现有的设备中的一个模块。具体地，本实施例中的 RECH功能实体可以与网络侧的语音解析服务器设置在一起，或者直接作为一个模块设置在语音解析服务器中；也可以设置在本地，即与本地语音控制网关设置在一起，或者直接作为一个模块设置在本地语音控制网关中。

本步骤为 RECH功能实体接收语音解析服务器发送的多条语音指令，多条语音指令可以为语音解析服务器依次发送的，其可以为语音解析服务器在一个预设的时间段内生成并发送的。此处设置预设的时间段的目的是为了对在不同时刻接收到的语音指令进行不同处理，当接收到的两个语音指令的时间差较大时，则可以直接将在先接收到的语音指令返回给相应的语音控制设备，而不会等到接收到在后的语音指令，并对二者进行相似性判断后才处理；因此，本实施例可以具体设置预设的时间段，并对预设的时间段内接收到的各语音指令进行两两的相似性判断。其中，多条语音指令为语音解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的。在本实施例中，需要进行相似性判断的两个语音指令为分别来自不同语音控制设备的语音指令，而无需对来自同一语音控制设备的语音指令进行相似性判断。各语音指令为语音解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的，语音解析服务器对每一个源语音命令进行解析，生成每一个源语音命令对应的语音指令。

步骤 102, 分别判断所述多条各语音指令中任意两条语音指令是否为相似指令，如果是，则执行步骤 103, 否则执行步骤 104。

在接收到语音指令后，分别判断所述多条语音指令中任意两条语音指令是否为相似指令，此处的相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令。具体地，当本实施例可以对各语音指令中的任意两条语音指令进行相似性判断，分别判断每两条指令是否为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令，如果是，即其中有两条语音指令为相似指令，则执行步骤 103, 否则，即其中任意两条语音指令均不为相似指令，则执行步骤 104。具体地，在进行相似性判断时，可以根据对应的源语音命令的采集时间信息判断两个语音指令在时间上是否重叠，以及根据语音指令的指令内容判断两个语音指令在内容上是否满足重复。

具体地，本实施例中上述步骤 101接收的多条语音指令是指满足预设的时间条件的语音指令，此处的预设的时间条件用于对进行相似性判断的语音指令对应的源语音命令的采集时间进行限定，如只需对采集时间间隔较近的语音指令进行相似性判断，而采集时间间隔较远（如 2分钟以上 )的语音指令基本上不可能是相似指令。在上述步骤 101之后，本实施例还可以包括如下步骤：当从所述语音解析服务器接收到一条新的语音指令时，记录所述新的语音指令的采集时间信息；将所述新的语音指令的采集时间与之前记录的语音指令的采集时间进行比较，确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令；将所述新的语音指令与所述相关语音指令作为所述多条语音指令。其中，语音指令的采集时间为该语音指令对应的源语音命令的起始时间戳。

相应地，本实施例可以设置一个指令时间表，将接收到的语音指令的采集时间记录在该指令时间表中。本实施例还可以为该指令时间表设置一个定时器，该定时器用于对其中存储的采集时间信息进行计时，当采集时间信息在指令时间表中存储的时间大于一个预设时间，如 5分钟时，表明该采集时间信息对应的语音指令已超时，其基本上不可能与后续接收到的其他语音指令为相似指令，则便可以将该指令时间信息从指令时间表中删除，后续便不会从指令时间表中获取到对应的已超时的语音指令。

本实施例为了避免因对所有语音指令进行相似性判断而造成的较大计算量，对需要进行相似性判断的语音指令进行采集时间的限定，即通过指令时间表中存储的各语音指令的采集时间来判定某两条语音指令是否需要进行相似性判断。此处具体根据指令时间表获取采集时间与新的语音指令的采集时间的差值小于预定阈值的相关语音指令，此处获取的相关语音指令以及新的语音指令便是当前需要进行相似性判断的多条语音指令。

步骤 103 , 丢弃两条相似的语音指令中的一条语音指令。

经过上述相似性判断，当其中两条语音指令为相似指令时，可以从这两条相似的语音指令中选择一条语音指令进行丢弃处理，从而避免出现冗余指令，有效避免了相同命令的重复执行。同时，将另外一条语音指令发送给该语音指令对应的语音控制设备，语音控制设备在接收到各自的语音指令后，便可以执行该语音指令所指示的操作，以响应用户发出的源语音命令。

具体地，本实施例也可以根据这两条相似的语音指令对应的源语音命令的优先级对这两条语音指令进行冗余处理，其中，语音指令的优先级可以根据默认设置的源语音命令的优先级来获取，也可以在语音指令中携带源语音命令的优先级参数，该优先级参数可以根据实际情况来设定，如设置语音控制设备接收到源语音命令的音量值作为优先级参数，音量值越高，则对应的语音指令的优先级越高。具体为将这两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备，此处对应的语音控制设备具体为向语音解析服务器发送该语音指令对应的源语音命令的设备，语音控制设备在接收到各自的语音指令后，便可以执行该语音指令所指示的操作，以响应用户发出的源语音命令。同时，将其中优先级低的语音指令进行丢弃处理，同时可以向该优先级低的语音指令对应的语音控制设备发送冗余指令指示，以通知其监听到的源语音命令为冗余命令，从而有效避免了相同命令的重复执行。

步骤 104, 将各语音指令分别返回给对应的语音控制设备。经过上述相似性判断，当多条语音指令中不存在相似指令时，可以直接将各语音指令分别返回给对应的语音控制设备，此处对应的语音控制设备具体为向语音解析服务器发送该语音指令对应的源语音命令的设备，每个语音指令分别对应一个语音控制设备，语音控制设备在接收到各自的语音指令后，便可以执行该语音指令所指示的操作，以响应用户发出的源语音命令。

本实施例提供了一种指令处理方法，通过接收语音解析服务器发送的多条语音指令，分别判断多条语音指令中任意两条语音指令是否为相似指令，相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令；当两条语音指令为相似指令时，丢弃其中一条语音指令。本实施例避免了多个语音控制设备重复执行同时采集到的一条语音命令，消除了命令重复执行带来的控制错误。

图 2为本发明指令处理方法实施例二的信令图，如图 2所示，本实施例提供了一种指令处理方法，本实施例具体为将 RECH功能实体设置在网络侧，图 3为本发明指令处理方法实施例二中的系统架构示意图，如图 3所示，假设设备 A和设备 B为两个语音控制设备，二者均具有语音控制功能，本实施例以网络中存在这两个语音控制设备为例来对本发明的方案进行说明， RECH功能实体为与语音解析服务器相独立的一个设备，当然该 RECH功能实体也可以集成在语音解析服务器中。具体地，本实施例提供的指令处理方法可以具体包括如下步骤：

步骤 201 , 设备 A与语音解析服务器进行时间同步。

步骤 202, 设备 B与语音解析服务器进行时间同步。

上述步骤为先将具有语音控制功能的设备 A和设备 B分别与位于网络侧的语音解析服务器进行时间同步，以使得后续语音解析服务器能够准确获取到在源语音命令中携带的采集时间信息。

需要指出的是，本实施例中的上述步骤 201和步骤 202之间不存在时序限定关系，即这两个步骤可以同时执行，也可以以任意顺序执行。

步骤 203, 设备 A向语音解析服务器发送源语音命令 A。

当设备 A监听并采集到用户发出的源语音命令后，源语音命令可以为： "将设备 B的音量降低一格" ，设备 A在执行该源语音命令之前，需要先将其发送到语音解析服务器进行解析处理，本步骤为设备 A向语音解析服务器发送源语音命令 A。此处的源语音命令 A具体指设备 A上报的源语音命令，在该源语音命令 A中携带源语音命令 A的起始时间戳 ( initial time stamp A ) 、截止时间戳 (end time stamp A)和优先权参数 (priority re-value A),源语音命令 A 的起始时间戳用于表示设备 A监听到的该源语音命令的起始时间，源语音命令 A的截止时间戳用于表示设备 A监听到的该源语音命令的截止时间，优先权参数为用户或设备设定的用于在出现相似指令时标识设备或命令优先权的参数。

步骤 204, 语音解析服务器对设备 A进行身份验证与鉴权。

语音解析服务器在接收到设备 A上报的源语音命令后，先对该设备 A进行身份验证与鉴权，身份验证与鉴权通过之后，才执行后续的解析处理。

步骤 205, 设备 B向语音解析服务器发送源语音命令 B。

当设备 B监听并采集到用户发出的源语音命令后，源语音命令可以为： "将设备 B的音量降低一格" ，设备 B在执行该源语音命令之前，需要先将其发送到语音解析服务器进行解析处理，本步骤为设备 B 向语音解析服务器发送源语音命令 B。此处的源语音命令 B具体指设备 B上报的源语音命令，在该源语音命令 B中携带源语音命令 B的起始时间戳 ( initial time stamp B ) 、截止时间戳 (end time stamp B)和优先权参数 (priority re-value B), 源语音命令 B 的起始时间戳用于表示设备 B监听到的该源语音命令的起始时间，源语音命令 A的截止时间戳用于表示设备 B监听到的该源语音命令的截止时间，优先权参数为用户设定的用于在出现相似指令时标识设备或命令优先权的参数。

步骤 206 , 语音解析服务器对设备 B进行身份验证与鉴权。

语音解析服务器在接收到设备 B上报的源语音命令后，先对该设备 B进行身份验证与鉴权，身份验证与鉴权通过之后，才执行后续的解析处理。

需要指出的是，本实施例中的上述步骤 204和步骤 206之间不存在时序限定关系，即这两个步骤可以同时执行，也可以以任意顺序执行。

步骤 207, 语音解析服务器向 RECH功能实体发送对源语音命令 A解析后生成的语音指令 A。

语音解析服务器在接收到设备 A上报的源语音命令 A, 并对设备 A完成身份验证与鉴权后，语音解析服务器对该源语音命令 A进行解析处理，通过解析处理生成设备能够理解并执行的语音指令 A, 该语音指令 A与源语音命令 A相对应。语音解析服务器将解析后生成的语音指令 A发送到 RECH功能实体，在该语音指令 A中携带语音指令 A对应的源语音命令 A的起始时间戳、截止时间戳和优先权参数，由 RECH功能实体对该语音指令 A与其他语音指令进行相似性判断。

步骤 208,语音解析服务器向 RECH功能实体发送对源语音命令 B解析后生成的语音指令

语音解析服务器在接收到设备 B上报的源语音命令 B, 并对设备 B完成身份验证与鉴权后，语音解析服务器对该源语音命令 B 进行解析处理，通过解析处理生成设备能够理解并执行的语音指令 B,该语音指令 B与源语音命令 B相对应。语音解析服务器将解析后生成的语音指令 B发送到 RECH功能实体，在该语音指令 B中携带语音指令 B对应的源语音命令 B的起始时间戳、截止时间戳和优先权参数，由 RECH功能实体对该语音指令 B与其他语音指令进行相似性判断。

需要指出的是，本实施例中的上述步骤 207和步骤 208之间不存在时序限定关系，即这两个步骤可以同时执行，也可以以任意顺序执行。

步骤 209, RECH功能实体根据语音指令、语音指令 B分别对应的源语音命令的起始时间戳和截止时间戳，判断语音指令 A对应的源语音命令 A和语音指令 B对应的源语音命令 B的采集时间是否重叠，如果是，则执行步骤 210, 否则执行步骤 214。

RECH功能实体在从语音解析服务器接收到语音指令 A和语音指令 B后，根据其中携带的采集时间信息，该采集时间信息可以包括起始时间戳和截止时间戳，来判断语音指令 A对应的源语音命令 A和语音指令 B对应的源语音命令 B 的采集时间是否重叠，即进行时间相似性判断。具体地，在进行时间相似性判断时， RECH功能实体可以判断源语音命令 A的起始时间戳与源语音命令 B的起始时间戳的差值是否小于预设的门限值，且判断源语音命令 A的截止时间戳与源语音命令 B 的截止时间戳的差值是否小于预设的门限值，如果二者的起始时间戳的差值和截止时间戳的差值均小于预设的门限值，则表明语音指令 A对应的源语音命令 A和语音指令 B对应的源语音命令 B的采集时间重叠，则执行步骤 210; 如果二者的起始时间戳或截止时间戳的差值大于或等于预设的门限值，则表明语音指令 A对应的源语音命令 A和语音指令 B对应的源语音命令 B的采集时间不重叠，则执行步骤 214。

或者，在进行时间相似性判断时， RECH功能实体也可以根据语音指令 A、语音指令 B对应的源语音命令的起始时间戳和截止时间戳，分别获取语音指令 A、语音指令 B的持续时间，判断语音指令 A的持续时间与语音指令 B的持续时间是否有重叠部分，如果二者的持续时间存在重叠部分，则表明语音指令 A对应的源语音命令 A和语音指令 B对应的源语音命令 B的采集时间重叠，则执行步骤 210; 如果二者的持续时间不存在重叠部分，则表明语音指令 A对应的源语音命令 A和语音指令 B对应的源语音命令 B的采集时间不重叠，则执行步骤 214。

进一步地，在本实施例中，在上述步骤 209之前， RECH功能实体还可以先判断语音指令 A的起始时间戳与语音指令 B的起始时间戳的差值是否大于预设的时间阈值，如果是，再执行步骤 209, 否则可以结束本流程。

步骤 210, RECH功能实体根据语音指令八、语音指令 B的指令内容，判断语音指令 A和语音指令 B在内容上是否重复，如果是，则执行步骤 211 , 否则执行步骤 214。

经过上述判断步骤，当 RECH功能实体确定语音指令 A与语音指令 B在时间上重叠时， RECH功能实体根据语音指令、语音指令 B的指令内容，进一步判断语音指令 A和语音指令 B在内容上是否重复，具体可以对用户的语音特征进行比较，从而判断这两个语音指令对应的源语音命令是否由同一个用户发出。如果二者的指令内容出现的重叠部分较多，例如可以设定一个阈值，若二者的指令内容中重叠内容部分的百分比大于这个阈值，则表明语音指令 A 和语音指令 B在内容上重复，语音指令 A和语音指令 B为相似指令，并执行步骤 211; 如果二者的指令内容不相同，则表明语音指令 A和语音指令 B在内容上不重复，语音指令 A和语音指令 B不为相似指令，并执行步骤 214。

需要指出的是，也可以先判断语音指令 A和语音指令 B是否在内容上重复，当不满足时执行步骤 214, 当满足内容上重复时，再判断语音指令 A和语音指令对应的源语音命令的采集时间是否重叠，当采集时间不重叠时执行步骤 214, 当采集时间重叠时，执行步骤 211。

步骤 211 , RECH功能实体根据语音指令 A、语音指令 B对应的源语音命令的优先级参数，获取语音指令 A、语音指令 B的优先级。通过上述时间相似性判断和内容相似性判断的判断过程，当确定语音指令

A和语音指令 B为相似指令时， RECH功能实体根据语音指令、语音指令 B 对应的源语音命令的优先级参数，分别获取语音指令 A、语音指令 B的优先级。例如，当设定优先级参数为设备接收到源语音命令的音量值时，通过比较设备 A接收到源语音命令 A的音量值与设备 B接收到源语音命令 B的音量值，音量值大的意味着其离用户更近，则可能是用户面向的设备；此处可以将音量值大的设备当作优先级高的设备，即将其定义为主要源语音命令采集终端，将将音量值小的设备当作优先级低的设备；相应地，优先级高的设备对应的语音指令的优先级也高，优先级低的设备对应的语音指令的优先级也低。本实施例中假设语音指令 A的优先级高于语音指令 B的优先级。

步骤 212, RECH功能实体将优先级高的语音指令 A返回给设备 A, 并丢弃优先级低的语音指令 B。

当获取到语音指令 A和语音指令 B的优先级后，在本实施例中，优先级高的语音指令 A认为是源语音命令采集终端发出的，优先级低的语音指令 B 认为是冗余指令，则 RECH功能实体将优先级高的语音指令 A直接返回给设备 A, 并丢弃优先级低的语音指令 B。

步骤 213, RECH功能实体向设备 B发送冗余指令指示。

在本实施例中， RECH功能实体还可以向设备 B发送冗余指令指示，以通知设备 B其监听到的源语音命令为冗余命令，无需执行该源语音命令。

步骤 214, RECH功能实体将语音指令 A返回给设备 A,将语音指令 B返回给设备

通过上述判断，如果语音指令 A与语音指令 B不满足时间相似性条件，或者不满足内容相似性条件时，表明语音指令 A与语音指令 B不为相似性指令，则 RECH功能实体直接将语音指令 A返回给设备 A, 将语音指令 B返回给设备 B, 由设备 A和设备 B分别执行语音指令 A和语音指令 B。

在本实施例中，当完成上述各个步骤的执行后，若 RECH功能实体从语音解析服务器接收到一个新的语音指令，则 RECH功能实体还可以将该新的语音指令与已返给其他语音控制设备的语音指令进行相似性判断。例如，当 RECH功能实体向设备 A返回语音指令 A后，若 RECH功能实体又从语音解析服务器接收到一个来自设备 B的新的语音指令，则 RECH功能实体还可以将该新的语音指令与已返给设备 A的语音指令 A进行相似性判断。当该新的语音指令与语音指令 A为相似指令时，则无需将该新的指令返回给设备 B, 而直接将其进行丢弃处理。

本实施例提供了一种指令处理方法， RECH功能实体接收语音解析服务器发送的语音指令 A和语音指令 B, 根据语音指令 A和语音指令 B对应的源语音命令的起始时间戳和截止时间戳，以及语音指令 A和语音指令 B的指令内容，判断语音指令 A与语音指令 B是否为相似指令；当语音指令 A与语音指令 B为相似指令时，根据语音指令 A和语音指令 B对应的源语音命令的优先级参数，将优先级高的语音指令返回给对应的语音控制设备，将优先级低的语音指令进行丢弃处理。本实施例避免了多个语音控制设备重复执行同时采集到的一条语音命令，消除了命令重复执行带来的控制错误。

图 4为本发明指令处理方法实施例三的信令图，如图 4所示，本实施例提供了一种指令处理方法，本实施例具体为将 RECH功能实体设置在本地，图 5 为本发明指令处理方法实施例三中的系统架构示意图，如图 5所示，假设设备 A和设备 B为两个语音控制设备，二者均具有语音控制功能，本实施例以网络中存在这两个语音控制设备为例来对本发明的方案进行说明， RECH功能实体为集成在本地语音控制网关中的一个模块，当然该 RECH功能实体也可以为设置在本地的与本地语音控制网关相独立的一个设备。具体地，本实施例提供的指令处理方法可以具体包括如下步骤：

步骤 401 , 设备 A与本地语音控制网关进行时间同步。

步骤 402, 设备 B与本地语音控制网关进行时间同步。

上述步骤为先将具有语音控制功能的设备 A和设备 B分别与位于本地的本地语音控制网关进行时间同步，以使得后续本地语音控制网关能够准确获取到在源语音命令中携带的采集时间信息。

需要指出的是，本实施例中的上述步骤 401和步骤 402之间不存在时序限定关系，即这两个步骤可以同时执行，也可以以任意顺序执行。

步骤 403, 设备 A向本地语音控制网关发送源语音命令 A。

当设备 A监听并采集到用户发出的源语音命令后，源语音命令可以为： "将设备 B的音量降低一格" ，本步骤为设备 A向本地语音控制网关发送源语音命令。此处的源语音命令 A具体指设备 A上报的源语音命令，在该源语音命令 A中携带源语音命令 A的起始时间戳 ( initial time stamp A ) 、截止时间戳 (end time stamp A)和优先权参数 (priority re-value A), 源语音命令 A的起始时间戳用于表示设备 A监听到的该源语音命令的起始时间，源语音命令 A 的截止时间戳用于表示设备 A监听到的该源语音命令的截止时间，优先权参数为用户设定的用于在出现相似指令时标识设备或命令优先权的参数。

步骤 404, 本地语音控制网关对设备 A进行身份验证与鉴权。

本地语音控制网关在接收到设备 A上报的源语音命令后，先对该设备 A 进行身份验证与鉴权，身份验证与鉴权通过之后，才执行后续的处理。

步骤 405 , 设备 B向本地语音控制网关发送源语音命令 B。

当设备 B监听并采集到用户发出的源语音命令后，源语音命令可以为：

"将设备 B的音量降低一格" ，本步骤为设备 B向本地语音控制网关发送源语音命令 B。此处的源语音命令 B具体指设备 B上报的源语音命令，在该源语音命令 B中携带源语音命令 B的起始时间戳 ( initial time stamp B ) 、截止时间戳 (end time stamp B)和优先权参数 (priority re-value B),源语音命令 B的起始时间戳用于表示设备 B监听到的该源语音命令的起始时间，源语音命令 A 的截止时间戳用于表示设备 B监听到的该源语音命令的截止时间，优先权参数为用户设定的用于在出现相似指令时标识设备或命令优先权的参数。

步骤 406, 本地语音控制网关对设备 B进行身份验证与鉴权。

本地语音控制网关在接收到设备 B上报的源语音命令后，先对该设备 B 进行身份验证与鉴权，身份验证与鉴权通过之后，才执行后续的处理。

需要指出的是，本实施例中的上述步骤 404和步骤 406之间不存在时序限定关系，即这两个步骤可以同时执行，也可以以任意顺序执行。

步骤 407, 本地语音控制网关将源语音命令 A发送到语音解析服务器。步骤 408, 本地语音控制网关将源语音命令 B发送到语音解析服务器。需要指出的是，本实施例中的上述步骤 407和步骤 408之间不存在时序限定关系，即这两个步骤可以同时执行，也可以以任意顺序执行。

步骤 409,语音解析服务器向本地语音控制网关发送对源语音命令 A解析后生成的语音指令 A。

语音解析服务器在接收到设备 A上报的源语音命令 A, 并对设备 A完成身份验证与鉴权后，语音解析服务器对该源语音命令 A进行解析处理，通过解析处理生成设备能够理解并执行的语音指令 A, 该语音指令 A与源语音命令 A相对应。语音解析服务器将解析后生成的语音指令 A发送到本地语音控制网关，在该语音指令 A中携带语音指令 A对应的源语音命令 A的起始时间戳、截止时间戳和优先权参数，由本地语音控制网关中的 RECH功能实体对该语音指令 A与其他语音指令进行相似性判断。

步骤 410,语音解析服务器向本地语音控制网关发送对源语音命令 B解析后生成的语音指令 B。

语音解析服务器在接收到设备 B上报的源语音命令 B, 并对设备 B完成身份验证与鉴权后，语音解析服务器对该源语音命令 B 进行解析处理，通过解析处理生成设备能够理解并执行的语音指令 B,该语音指令 B与源语音命令 B相对应。语音解析服务器将解析后生成的语音指令 B发送到本地语音控制网关，在该语音指令 B中携带语音指令 B对应的源语音命令 B的起始时间戳、截止时间戳和优先权参数，由本地语音控制网关中的 RECH功能实体对该语音指令 B与其他语音指令进行相似性判断。

需要指出的是，本实施例中的上述步骤 409和步骤 410之间不存在时序限定关系，即这两个步骤可以同时执行，也可以以任意顺序执行。

步骤 411 , 本地语音控制网关根据语音指令 A、语音指令 B分别对应的源语音命令的起始时间戳和截止时间戳，判断语音指令 A对应的源语音命令 A 和语音指令 B对应的源语音命令 B的采集时间是否重叠，如果是，则执行步骤 412, 否则执行步骤 416。

本地语音控制网关在从语音解析服务器接收到语音指令 A和语音指令 B 后，根据其中携带的采集时间信息，该采集时间信息可以包括起始时间戳和截止时间戳，来判断语音指令 A对应的源语音命令 A和语音指令 B对应的源语音命令 B 的采集时间是否重叠，即进行时间相似性判断。具体地，在进行时间相似性判断时，本地语音控制网关中的 RECH功能实体可以判断源语音命令 A的起始时间戳与源语音命令 B的起始时间戳的差值是否小于预设的门限值，且判断源语音命令 A的截止时间戳与源语音命令 B的截止时间戳的差值是否小于预设的门限值，如果二者的起始时间戳的差值和截止时间戳的差值均小于预设的门限值，则表明源语音命令 A和源语音命令 B的采集时间重叠，则执行步骤 412; 如果二者的起始时间戳或截止时间戳的差值大于或等于预设的门限值，则表明源语音命令 A和源语音命令 B的采集时间不重叠，则执行步骤 416。

或者，在进行时间相似性判断时，本地语音控制网关中的 RECH功能实体也可以根据语音指令 A、语音指令 B对应的源语音命令的起始时间戳和截止时间戳，分别获取语音指令 A、语音指令 B的持续时间，判断语音指令 A 的持续时间与语音指令 B 的持续时间是否有重叠部分，如果二者的持续时间存在重叠部分，则表明源语音命令 A和源语音命令 B的采集时间重叠，则执行步骤 412; 如果二者的持续时间在时间上不重叠，则表明语音指令 A和语音指令 B不满足时间相似性条件，则执行步骤 416。

进一步地，在本实施例中，在上述步骤 411之前， RECH功能实体还可以先判断语音指令 A的起始时间戳与语音指令 B的起始时间戳的差值是否大于预设的时间阈值，如果是，再执行步骤 411 , 否则可以结束本流程。

步骤 412, 本地语音控制网关中的 RECH功能实体根据语音指令 A、语音指令 B的指令内容，判断语音指令 A和语音指令 B在内容上是否重复，如果是，则执行步骤 413, 否则执行步骤 416。

经过上述判断步骤，当本地语音控制网关中的 RECH功能实体确定语音指令 A对应的源语音命令 A与语音指令 B对应的源语音命令 B的采集时间重叠时， RECH功能实体根据语音指令、语音指令 B的指令内容判断语音指令 A和语音指令 B在内容上是否重复，具体可以对用户的语音特征进行比较，从而判断这两个语音指令对应的源语音命令是否由同一个用户发出。如果二者的指令内容出现的重叠部分较多，例如可以设定一个阈值，若二者的指令内容中重叠内容部分的百分比大于这个阈值，则表明语音指令 A和语音指令 B在内容上重复，语音指令 A和语音指令 B为相似指令，并执行步骤 413; 如果二者的指令内容不相同，则表明语音指令 A和语音指令 B在内容上不重复，语音指令 A和语音指令 B不为相似指令，并执行步骤 416。

需要指出的是，也可以先判断语音指令 A和语音指令 B是否在内容上重复，当不满足时执行步骤 416, 当满足内容上重复时，再判断语音指令 A和语音指令 B对应的源语音命令的采集时间是否重叠，当采集时间不重叠时执行步骤 416, 当采集时间重叠时，执行步骤 413。

步骤 413, 本地语音控制网关中的 RECH功能实体根据语音指令 A、语音指令 B对应的源语音命令的优先级参数，获取语音指令 A、语音指令 B的优先级。

通过上述时间相似性判断和内容相似性判断的判断过程，当确定语音指令 A和语音指令 B为相似指令时，本地语音控制网关中的 RECH功能实体根据语音指令 A、语音指令 B对应的源语音命令的优先级参数，分别获取语音指令、语音指令 B的优先级。例如，当设定优先级参数为设备接收到源语音命令的音量值时，通过比较设备 A接收到源语音命令 A的音量值与设备 B接收到源语音命令 B 的音量值，音量值大的意味着其离用户更近，则可能是用户面向的设备；此处可以将音量值大的设备当作优先级高的设备，即将其定义为主要源语音命令采集终端，将将音量值小的设备当作优先级低的设备；相应地，优先级高的设备对应的语音指令的优先级也高，优先级低的设备对应的语音指令的优先级也低。本实施例中假设语音指令 A的优先级高于语音指令 B 的优先级。

步骤 414, 本地语音控制网关将优先级高的语音指令 A返回给设备 A, 并丢弃优先级低的语音指令 B。

当获取到语音指令 A和语音指令 B的优先级后，在本实施例中，优先级高的语音指令 A认为是源语音命令采集终端发出的，优先级低的语音指令 B 认为是冗余指令，则本地语音控制网关将优先级高的语音指令 A直接返回给设备 A, 并丢弃优先级低的语音指令 B。

步骤 415, 本地语音控制网关向设备 B发送冗余指令指示。

在本实施例中，本地语音控制网关还可以向设备 B发送冗余指令指示，以通知设备 B其监听到的源语音命令为冗余命令，无需执行该源语音命令。

步骤 416, 本地语音控制网关将语音指令 A返回给设备 A, 将语音指令 B 返回给设备 B。

通过上述判断，如果语音指令 A与语音指令 B不满足时间相似性条件，或者不满足内容相似性条件时，表明语音指令 A与语音指令 B不为相似性指令，则本地语音控制网关直接将语音指令 A返回给设备 A, 将语音指令 B返回给设备 B, 由设备 A和设备 B分别执行语音指令 A和语音指令 B。

在本实施例中，当完成上述各个步骤的执行后，若本地语音控制网关从语音解析服务器接收到一个新的语音指令，则本地语音控制网关中的 RECH功能实体还可以将该新的语音指令与已返给其他语音控制设备的语音指令进行相似性判断。例如，当 RECH功能实体向设备 A返回语音指令 A后，若 RECH 功能实体又从语音解析服务器接收到一个来自设备 B 的新的语音指令，则 RECH功能实体还可以将该新的语音指令与已返给设备 A的语音指令 A进行相似性判断。当该新的语音指令与语音指令 A为相似指令时，则无需将该新的指令返回给设备 B, 而直接将其进行丢弃处理。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括： ROM, RAM,磁碟或者光盘等各种可以存储程序代码的介质。

图 6为本发明指令处理装置实施例一的结构示意图，如图 6所示，本实施例提供了一种指令处理装置，可以具体执行上述方法实施例一中的各个步骤，此处不再赘述。本实施例提供的指令处理装置可以具体包括接收模块 601、判断模块 602和冗余指令处理模块 603。其中，接收模块 601用于接收语音解析服务器发送的多条语音指令，所述多条语音指令为所述解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的。判断模块 602用于分别判断接收模块 601接收到的所述多条语音指令中任意两条语音指令是否为相似指令，所述相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令。冗余指令处理模块 603用于当判断模块 602的判断结果为多条语音指令中存在两条语音指令为相似指令时，丢弃两条相似的语音指令中的一条语音指令。

图 7为本发明指令处理装置实施例二的结构示意图，如图 7所示，本实施例提供了一种指令处理装置，可以具体执行上述方法实施例二或实施例三中的各个步骤，此处不再赘述。本实施例提供的指令处理装置在上述图 6所示的基础之上，接收模块 601接收到的所述多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容。判断模块 602可以具体包括第一判断单元 612、第二判断单元 622和相似指令确定单元 632。其中，第一判断单元 612用于根据接收模块 601接收到的所述多条语音指令对应的源语音命令的采集时间信息，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠。第二判断单元 622用于根据接收模块 601接收到的所述多条语音指令的指令内容，分别判断所述多条语音指令中任意两条语音指令在内容上是否重复。相似指令确定单元 632用于当第一判断单元 612和第二判断单元 622的判断结果为所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间重叠，且在内容上重复时，确定所述两条语音指令为相似指令。

进一步地，本实施例提供的指令处理装置还可以包括记录模块 604和语音指令确定模块 605。记录模块 604用于当从所述语音解析服务器接收到一条新的语音指令时，记录所述新的语音指令的采集时间信息。语音指令确定模块 605用于将所述新的语音指令的采集时间与记录模块 604之前记录的语音指令的采集时间进行比较，确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令；并将所述新的语音指令与所述相关语音指令作为所述多条语音指令。

具体地，第一判断单元 612可以具体包括第一判断子单元 6121和第二判断子单元 6122。其中，第一判断子单元 6121用于根据接收模块 601接收到的所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值，以及截止时间戳的差值是否均小于预设的门限值；若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值，则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。第二判断子单元 6122用于根据接收模块 601 接收到的根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳，分别获取多条语音指令的持续时间，判断所述多条语音指令中任意两条语音指令的持续时间是否有重叠部分；若所述持续时间有重叠部分，则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。

更进一步地，本实施例中的接收模块 601接收到的所述多条语音指令中还分别携带所述多条语音指令对应的源语音命令的优先级参数。该指令处理装置还可以包括获取模块 606。获取模块 606用于根据接收模块 601接收到的语音指令对应的源语音命令的优先级参数，确定所述两条相似的语音指令中的优先级高的语音指令，以及所述两条相似的语音指令中的优先级低的语音指令。冗余指令处理模块 603具体用于当判断模块 602的判断结果为多条语音指令中存在两条语音指令为相似指令时，将两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备，将优先级低的语音指令进行丢弃处理。

更进一步地，该指令处理装置中的冗余指令处理模块 603还用于当接收模块 601 接收到的一条新的语音指令与已返回给其他语音控制设备的语音指令为相似指令时，对所述新的语音指令进行丢弃处理。

本实施例提供了一种指令处理装置，通过接收语音解析服务器发送的多条语音指令，分别判断多条语音指令中任意两条语音指令是否为相似指令，相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令；当两条语音指令为相似指令时，丢弃其中一条语音指令。本实施例避免了多个语音控制设备重复执行同时采集到的一条语音命令，消除了命令重复执行带来的控制错误。

图 8为本发明指令处理装置实施例三的结构示意图，如图 8所示，本实施例提供的指令处理装置可以具体包括，存储器 801、接收器 802和处理器 803。其中，接收器 802用于接收语音解析服务器发送的多条语音指令；所述多条语音指令为所述解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的。存储器 801用于存储程序指令。处理器 803与存储器 801和接收器 802耦合。处理器 803被配置为根据存储器 801中的程序指令，分别判断接收器 802接收的所述多条语音指令中任意两条语音指令是否为相似指令，所述相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令；当所述多条语音指令中存在两条语音指令为相似指令时，丢弃两条相似的语音指令中的一条语音指令。具体地，接收器 802接收的多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容。处理器 803被配置具体用于根据所述多条语音指令对应的源语音命令的采集时间信息，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠；根据所述多条语音指令的指令内容，分别判断所述多条语音指令中任意两条语音指令在内容上是否重复；当所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间重叠，且在内容上重复时，确定所述两条语音指令为相似指令。

进一步地，处理器 803还被配置用于当从所述语音解析服务器接收到一条新的语音指令时，记录所述新的语音指令的采集时间信息；将所述新的语音指令的采集时间与之前记录的语音指令的采集时间进行比较，确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令；将所述新的语音指令与所述相关语音指令作为所述多条语音指令。

更具体地，处理器 803被配置用于根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值，以及截止时间戳的差值是否均小于预设的门限值；若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值，则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。或者，处理器 803被配置用于根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳，分别获取多条语音指令的持续时间，判断所述多条语音指令中任意两条语音指令的持续时间是否有重叠部分；若所述持续时间有重叠部分，则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。

进一步地，接收器 802接收的多条语音指令中还分别携带各所述语音指令对应的源语音命令的优先级参数。处理器 803还被配置用于根据语音指令对应的源语音命令的优先级参数，确定两条相似的语音指令中的优先级高的语音指令，以及两条相似的语音指令中的优先级低的语音指令；当多条语音指令中存在相似指令时，将两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备，将优先级低的语音指令进行丢弃处理。

更进一步地，处理器 803还被配置用于当接收到的一条新的语音指令与已返回给其他语音控制设备的语音指令为相似指令时，对所述新的语音指令进行丢弃处理。

图 9为本发明计算机系统实施例的结构示意图，如图 9所示，本实施例提供了一种计算机系统，该计算机系统可以具体为微处理器计算机，诸如通用目的的 PC、定制的 PC、例如台式计算机或智能电话等便携式设备，但本发明的范围并不局限于这些例子。该计算机系统包括处理器 901、输入设备 902和输出设备 903 , 输入设备 902和输出设备 903耦合于该处理器 901。

处理器 901可以为通用目的的 CPU、专用集成电路（ Application Specific Integrated Circuit; 以下筒称： ASIC )或者一个或多个集成电路，其被配置用于控制执行本发明的程序。输入设备 902包括键盘和鼠标、键区、触屏输入设备、语音输入模块等。输出设备 903包括屏幕显示单元和语音模块。

计算机系统还包括存储器 904, 该存储器 904也可以包括一个或多个下述存储设备：只读内存（Read-Only Memory; 以下筒称： ROM ) 、随机存储器 ( Random Access Memory; 以下筒称： RAM )和硬盘。存储器通过信号总线 905与处理器相耦合。

该计算机系统还包括用于与通信网络，诸如以太网（Ethernet ) 、无线接入网（ Radio Access Network; 以下筒称： RAN )、无线局域网（ Wireless Local Area Network; 以下筒称： WLAN )等进行通信的通信接口 906。

上述存储器 904 (诸如 RAM ) 中存储有操作系统 914、应用软件 924、程序 934等，其中，操作系统 914为控制处理器所执行的处理过程的应用程序，应用软件 924可以为 word处理器、 email程序等，用以将输出设备上的数据显示给用户，程序 934可以具体为本发明提供的指令处理方法所对应的程序。

该计算机系统还包括接收器 907, 被配置用于接收语音解析服务器发送的多条语音指令，所述多条语音指令为所述解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的。本实施例中的处理器 901被配置为执行存储在所述存储器 904中的指令，其中，所述处理器 901被配置为用于：分别判断所述多条语音指令中任意两条语音指令是否为相似指令，所述相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令；当多条语音指令中存在两条语音指令为相似指令时，丢弃两条相似的语音指令中的一条语音指令。

具体地，接收器 907接收的多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容。处理器 901被配置具体用于根据所述多条语音指令对应的源语音命令的采集时间信息，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠；根据所述多条语音指令的指令内容，分别判断所述多条语音指令中任意两条语音指令在内容上是否重复；当所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间重叠，且在内容上重复时，确定所述两条语音指令为相似指令。

具体地，处理器 901还被配置用于当从所述语音解析服务器接收到一条新的语音指令时，记录所述新的语音指令的采集时间信息；将所述新的语音指令的采集时间与之前记录的语音指令的采集时间进行比较，确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令；将所述新的语音指令与所述相关语音指令作为所述多条语音指令。

更具体地，处理器 901被配置用于根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值，以及截止时间戳的差值是否均小于预设的门限值；若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值，则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。或者，处理器 901被配置用于根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳，分别获取多条语音指令的持续时间，判断所述多条语音指令中任意两条语音指令的持续时间是否有重叠部分；若所述持续时间有重叠部分，则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。

进一步地，接收器 907接收的多条语音指令中还分别携带各所述语音指令对应的源语音命令的优先级参数。处理器 901还被配置用于根据语音指令对应的源语音命令的优先级参数，确定两条相似的语音指令中的优先级高的语音指令，以及两条相似的语音指令中的优先级低的语音指令；当多条语音指令中存在两条语音指令为相似指令时，将两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备，将优先级低的语音指令进行丢弃处理。

更进一步地，处理器 901还被配置用于当接收到的一条新的语音指令与已返回给其他语音控制设备的语音指令为相似指令时，对所述新的语音指令进行丢弃处理。

图 10为本发明指令处理系统实施例一的结构示意图，如图 10所示，本实施例提供的指令处理系统可以具体包括语音解析服务器 1、多个语音控制设备 2和指令处理装置 3。其中，指令处理装置 3可以具体如上述图 6、图 7或图 8 所示的指令处理装置，该图中指令处理装置 3为与语音解析服务器 1相独立的设备，该指令处理装置 3还可以根据实际情况设置在语音解析服务器 1中（图中未示出）。多个语音控制设备 2分别用于采集多个源语音命令，并分别将所述多个源语音命令发送到所述语音解析服务器 1。语音解析服务器 1用于接收多个语音控制设备 2发送的多个源语音命令，对所述多个源语音命令分别进行解析后生成所述多个源语音命令对应的多个语音指令，并将所述多个语音指令分别发送到所述指令处理装置 3。

本实施例中的语音解析服务器 1还用于与多个语音控制设备 2进行时间同步。

图 11为本发明指令处理系统实施例二的结构示意图，如图 11所示，本实施例提供的指令处理系统可以具体包括语音解析服务器 1、多个语音控制设备 2和本地语音控制网关 4。本地语音控制网关 4可以包括上述图 6、图 7或图 8 所示的指令处理装置 3。多个语音控制设备 2用于分别采集多个源语音命令，并分别将所述多个源语音命令发送到所述本地语音控制网关 3。语音解析服务器 1用于分别接收本地语音控制网关 4发送的多个源语音命令，对所述多个源语音命令分别进行解析后生成所述多个源语音命令对应的多个语音指令，并分别将所述多个语音指令返回到所述本地语音控制网关 4。

本实施例中的本地语音控制网关 4还用于与所述多个语音控制设备 2进行时间同步。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

权利要求书

1、一种指令处理方法，其特征在于，包括：

2、根据权利要求 1所述的方法，其特征在于，所述多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容；所述分别判断所述多条语音指令中任意两条语音指令是否为相似指令包括：

3、根据权利要求 2所述的方法，其特征在于，所述方法还包括：当从所述语音解析服务器接收到一条新的语音指令时，记录所述新的语音指令的采集时间信息；

4、根据权利要求 2或 3所述的方法，其特征在于，所述根据所述多条语音指令对应的源语音命令的采集时间信息，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠包括：根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值，以及截止时间戳的差值是否均小于预设的门限值；若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值，则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠；或者，

5、根据权利要求 1-4任一所述的方法，其特征在于，所述多条语音指令中还分别携带各所述语音指令对应的源语音命令的优先级参数；

所述方法还包括：

根据语音指令对应的源语音命令的优先级参数，确定两条相似的语音指令中的优先级高的语音指令，以及两条相似的语音指令中的优先级低的语音指令；

所述当所述多条语音指令中存在两条语音指令为相似指令时，丢弃两条相似的语音指令中的一条语音指令包括：

6、根据权利要求 1-5任一所述的方法，其特征在于，还包括：

7、根据权利要求 1所述的方法，其特征在于，还包括：

所述语音解析服务器与各语音控制设备进行时间同步；

8、根据权利要求 1所述的方法，其特征在于，还包括：

本地语音控制网关与各语音控制设备进行时间同步；

9、一种指令处理装置，其特征在于，包括：

冗余指令处理模块，用于当所述判断模块的判断结果为所述多条语音指令中存在两条语音指令为相似指令时，丢弃两条相似的语音指令中的一条语音指令。

10、根据权利要求 9所述的装置，其特征在于，所述接收模块接收到的所述多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容；

所述判断模块包括：

11、根据权利要求 10所述的装置，其特征在于，所述装置还包括：记录模块，用于当从所述语音解析服务器接收到一条新的语音指令时，记录所述新的语音指令的采集时间信息；

12、根据权利要求 10或 11所述的装置，其特征在于，所述第一判断单元包括：

第一判断子单元，用于根据所述接收模块接收到的所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳，分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值，以及截止时间戳的差值是否均小于预设的门限值；若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值，则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠；或者，

13、根据权利要求 9-12中任一项所述的装置，其特征在于，所述接收模块接收到的所述多条语音指令中还分别携带所述多条语音指令对应的源语音命令的优先级参数；

所述装置还包括：

14、根据权利要求 9-13任一所述的装置，其特征在于，所述冗余指令处理模块还用于当所述接收模块接收到的一条新的语音指令与已返回给其他语音控制设备的语音指令为相似指令时，对所述新的语音指令进行丢弃处理。

15、一种指令处理系统，其特征在于，包括语音解析服务器、多个语音控制设备和权利要求 9-14中任一项所述的指令处理装置；

16、根据权利要求 15所述的系统，其特征在于，所述语音解析服务器还用于与所述多个语音控制设备进行时间同步。

17、一种指令处理系统，其特征在于，包括语音解析服务器、多个语音控制设备和本地语音控制网关，所述本地语音控制网关包括权利要求 9-14中任一项所述的指令处理装置；

18、根据权利要求 17所述的系统，其特征在于，所述本地语音控制网关还用于与所述多个语音控制设备进行时间同步。