CN102831894B - 指令处理方法、装置和系统 - Google Patents

指令处理方法、装置和系统 Download PDF

Info

Publication number
CN102831894B
CN102831894B CN201210282268.XA CN201210282268A CN102831894B CN 102831894 B CN102831894 B CN 102831894B CN 201210282268 A CN201210282268 A CN 201210282268A CN 102831894 B CN102831894 B CN 102831894B
Authority
CN
China
Prior art keywords
phonetic
voice
orders
voice command
phonetic order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210282268.XA
Other languages
English (en)
Other versions
CN102831894A (zh
Inventor
梅敬青
薛国栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Device Co Ltd
Original Assignee
Huawei Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Device Co Ltd filed Critical Huawei Device Co Ltd
Priority to CN201210282268.XA priority Critical patent/CN102831894B/zh
Publication of CN102831894A publication Critical patent/CN102831894A/zh
Priority to PCT/CN2013/081131 priority patent/WO2014023257A1/zh
Priority to EP13827606.8A priority patent/EP2830044B1/en
Application granted granted Critical
Publication of CN102831894B publication Critical patent/CN102831894B/zh
Priority to US14/520,575 priority patent/US9704503B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例提供一种指令处理方法、装置和系统,方法包括:接收语音解析服务器发送的多条语音指令,多条语音指令为语音解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的;分别判断多条语音指令中任意两条语音指令是否为相似指令,相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令;当多条语音指令中存在两条语音指令为相似指令时,丢弃两条相似的语音指令中的一条语音指令。本发明实施例还提供了一种指令处理装置和系统。本实施例消除了命令重复执行带来的控制错误。

Description

指令处理方法、装置和系统
技术领域
本发明涉及通信技术,尤其涉及一种指令处理方法、装置和系统。
背景技术
语音控制技术作为一种相对更加简易、人性化的控制方式,已逐渐被业界所认可,越来越多的电子设备,如智能手机(Smart Phone)、平板电脑(Tablet)、智能电视(Smart TV)等,都将具有语音控制功能,并将会同时出现在人们的日常生活中;可以预见,语音控制功能将越来越多样化,且将出现越来越多的支持语音控制的消费电子设备、办公设备等。随着终端设备计算能力的增强以及智能化的趋势,一些终端设备所能支持的功能越来越丰富,且可能出现重叠,如用户可以通过Smart Phone、Smart TV等上Twitter。此外,随着家庭自动化的普及,通过各种智能终端均可以控制家庭网络中的其他设备,如在Moto的4Home Service中,用户可以用手机远程控制各种家用电器。因此,语音控制技术不仅将成为一种重要的人机交互方式,而且可以被不同的智能终端所理解和执行。目前的语音命令技术主要包括传统语音控制技术和智能语音控制技术,传统语音控制技术中用户需要依据特定的语法和命令词汇来发布命令,智能语音控制技术中用户可以通过自然语言自由发布命令。相比之下,传统语音控制技术实现机制相对简单、准确度高,但用户体验相对较差,智能语音控制技术实现机制复杂,但用户体验相对较好。但目前业界普遍认为智能语音控制技术的发展前景更为广阔,如Apple、Google等公司都在加大这方面的研究和开发。对于智能语音控制技术,由于其计算开销大,通常采用云端处理的模式,不仅可以降低设备本地处理的复杂度,还可以减少能量消耗。
在现有技术中,语音控制的一种执行方式为在电子设备的后台一直运行监听的语音控制,例如Samsung的Smart Interaction TV实时监听用户的操作指令,以快速执行用户的操作指令。
然而,用户发出的同一条语音命令有可能被多个设备同时监听到,例如,当用户对设备A发出指令:“降低设备B的音量一格”时,该命令可能同时被设备B监听到,则设备B会执行设备A下发的指令和从用户直接接收到的指令,使得设备B的音量被重复降两次,从而导致语音命令的重复执行,甚至出现控制错误。
发明内容
本发明实施例提供一种指令处理方法、装置和系统,避免多个语音控制设备重复执行同时采集到的一条语音命令,消除命令重复执行带来的控制错误。
本发明实施例的第一方面是提供一种指令处理方法,包括:
接收语音解析服务器发送的多条语音指令,所述多条语音指令为所述语音解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的;
分别判断所述多条语音指令中任意两条语音指令是否为相似指令,所述相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令;
当所述多条语音指令中存在两条语音指令为相似指令时,丢弃两条相似的语音指令中的一条语音指令。
在第一方面的第一种可能的实现方式中,所述多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容;
所述分别判断所述多条语音指令中任意两条语音指令是否为相似指令包括:
根据所述多条语音指令对应的源语音命令的采集时间信息,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠;
根据所述多条语音指令的指令内容,分别判断所述多条语音指令中任意两条语音指令在内容上是否重复;
当所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间重叠,且在内容上重复时,确定所述两条语音指令为相似指令。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述方法还包括:
当从所述语音解析服务器接收到一条新的语音指令时,记录所述新的语音指令的采集时间信息;
将所述新的语音指令的采集时间与之前记录的语音指令的采集时间进行比较,确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令;
将所述新的语音指令与所述相关语音指令作为所述多条语音指令。
结合第一方面的第一种可能的实现方式或第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,所述根据所述多条语音指令对应的源语音命令的采集时间信息,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠包括:
根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值,以及截止时间戳的差值是否均小于预设的门限值;若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠;或者,
根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别获取多条语音指令的持续时间,判断所述多条语音指令中任意两条语音指令的持续时间是否有重叠部分;若所述持续时间有重叠部分,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。
结合第一方面、第一方面的第一种可能的实现方式、第一方面的第二种可能的实现方式或第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式中,所述多条语音指令中还分别携带各所述语音指令对应的源语音命令的优先级参数;
所述方法还包括:
根据语音指令对应的源语音命令的优先级参数,确定两条相似的语音指令中的优先级高的语音指令,以及两条相似的语音指令中的优先级低的语音指令;
所述当所述多条语音指令中存在两条语音指令为相似指令时,丢弃两条相似的语音指令中的一条语音指令包括:
当所述多条语音指令中存在两条语音指令为相似指令时,将两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备,将优先级低的语音指令进行丢弃处理。
结合第一方面、第一方面的第一种可能的实现方式、第一方面的第二种可能的实现方式、第一方面的第三种可能的实现方式或第一方面的第四种可能的实现方式,在第一方面的第五种可能的实现方式中,本发明实施例的指令处理方法还包括:
当接收到的一条新的语音指令与已返回给其他语音控制设备的语音指令为相似指令时,对所述新的语音指令进行丢弃处理。
结合第一方面,在第一方面的第六种可能的实现方式中,本发明实施例的指令处理方法还包括:
所述语音解析服务器与各语音控制设备进行时间同步;
所述语音解析服务器分别接收所述各语音控制设备发送的所述源语音命令。
结合第一方面,在第一方面的第七种可能的实现方式中,本发明实施例的指令处理方法还包括:
本地语音控制网关与各语音控制设备进行时间同步;
所述本地语音控制网关分别接收所述各语音控制设备发送的所述源语音命令,并将各所述源语音命令发送到所述语音解析服务器。
本发明实施例的第二方面是提供一种指令处理装置,包括:
接收模块,用于接收语音解析服务器发送的多条语音指令,所述多条语音指令为所述语音解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的;
判断模块,用于分别判断所述接收模块接收到的所述多条语音指令中任意两条语音指令是否为相似指令,所述相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令;
冗余指令处理模块,用于当所述判断模块的判断结果为所述多条语音指令中有两条语音指令为相似指令时,丢弃两条相似的语音指令中的一条语音指令。
在第二方面的第一种可能的实现方式中,所述接收模块接收到的所述多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容;
所述判断模块包括:
第一判断单元,用于根据所述接收模块接收到的所述多条语音指令对应的源语音命令的采集时间信息,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠;
第二判断单元,用于根据所述接收模块接收到的所述多条语音指令的指令内容,分别判断所述多条语音指令中任意两条语音指令在内容上是否重复;
相似指令确定单元,用于当所述第一判断单元和第二判断单元的判断结果为所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间重叠,且在内容上重复时,确定所述两条语音指令为相似指令。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述装置还包括:
记录模块,用于当从所述语音解析服务器接收到一条新的语音指令时,记录所述新的语音指令的采集时间信息;
语音指令确定模块,用于将所述新的语音指令的采集时间与所述记录模块之前记录的语音指令的采集时间进行比较,确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令;并将所述新的语音指令与所述相关语音指令作为所述多条语音指令。
结合第二方面的第一种可能的实现方式或第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式中,所述第一判断单元包括:
第一判断子单元,用于根据所述接收模块接收到的所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值,以及截止时间戳的差值是否均小于预设的门限值;若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠;或者,
第二判断子单元,用于所述接收模块接收到的根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别获取多条语音指令的持续时间,判断所述多条语音指令中任意两条语音指令的持续时间是否有重叠部分;若所述持续时间有重叠部分,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。
结合第二方面、第二方面的第一种可能的实现方式、第二方面的第二种可能的实现方式或第二方面的第三种可能的实现方式,在第二方面的第四种可能的实现方式中,所述接收模块接收到的所述多条语音指令中还分别携带所述多条语音指令对应的源语音命令的优先级参数;
所述装置还包括:
获取模块,用于根据所述接收模块接收到的语音指令对应的源语音命令的优先级参数,确定两条相似的语音指令中的优先级高的语音指令,以及两条相似的语音指令中的优先级低的语音指令;
所述冗余指令处理模块具体用于当所述判断模块的判断结果为所述多条语音指令中存在两条语音指令为相似指令时,将两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备,将优先级低的语音指令进行丢弃处理。
结合第二方面、第二方面的第一种可能的实现方式、第二方面的第二种可能的实现方式、第二方面的第三种可能的实现方式或第二方面的第四种可能的实现方式,在第二方面的第五种可能的实现方式中,所述冗余指令处理模块还用于当所述接收模块接收到的一条新的语音指令与已返回给其他语音控制设备的语音指令为相似指令时,对所述新的语音指令进行丢弃处理。
本发明实施例的第三方面是提供一种指令处理系统,包括语音解析服务器、多个语音控制设备和上述的指令处理装置;
所述多个语音控制设备分别用于采集多个源语音命令,并分别将所述多个源语音命令发送到所述语音解析服务器;
所述语音解析服务器用于接收所述多个语音控制设备发送的多个源语音命令,对所述多个源语音命令分别进行解析后生成所述多个源语音命令对应的多个语音指令,并将所述多个语音指令分别发送到所述指令处理装置。
在第三方面的第一种可能的实现方式中,所述语音解析服务器还用于与所述多个语音控制设备进行时间同步。
本发明实施例的第四方面是提供一种指令处理系统,包括语音解析服务器、多个语音控制设备和本地语音控制网关,所述本地语音控制网关包括上述的指令处理装置;
所述多个语音控制设备用于分别采集多个源语音命令,并分别将所述多个源语音命令发送到所述本地语音控制网关;
所述语音解析服务器用于分别接收所述本地语音控制网关发送的多个源语音命令,对所述多个源语音命令分别进行解析后生成所述多个源语音命令对应的多个语音指令,并分别将所述多个语音指令返回到所述本地语音控制网关。
在第四方面的第一种可能的实现方式中,所述本地语音控制网关还用于与所述多个语音控制设备进行时间同步。
本发明实施例的技术效果是:通过接收语音解析服务器发送的多条语音指令,分别判断多条语音指令中任意两条语音指令是否为相似指令,相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令;当两条语音指令为相似指令时,丢弃其中一条语音指令。本实施例避免了多个语音控制设备重复执行同时采集到的一条语音命令,消除了命令重复执行带来的控制错误。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明指令处理方法实施例一的流程图;
图2为本发明指令处理方法实施例二的流程图;
图3为本发明指令处理方法实施例二中的系统架构示意图;
图4为本发明指令处理方法实施例三的信令图;
图5为本发明指令处理方法实施例三中的系统架构示意图;
图6为本发明指令处理装置实施例一的结构示意图;
图7为本发明指令处理装置实施例二的结构示意图;
图8为本发明指令处理装置实施例三的结构示意图;
图9为本发明计算机系统实施例的结构示意图;
图10为本发明指令处理系统实施例一的结构示意图;
图11为本发明指令处理系统实施例二的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明指令处理方法实施例一的流程图,如图1所示,本实施例提供了一种指令处理方法,可以具体包括如下步骤:
步骤101,接收语音解析服务器发送的多条语音指令。
本实施例提出了一种冗余语音指令识别和处理(Redundant voicECommand identification and Handling;以下简称:RECH)机制,具体可以在现有的语音控制系统中增加一个RECH功能实体,该RECH功能实体可以为一个独立的设备,也可以为集成在现有的设备中的一个模块。具体地,本实施例中的RECH功能实体可以与网络侧的语音解析服务器设置在一起,或者直接作为一个模块设置在语音解析服务器中;也可以设置在本地,即与本地语音控制网关设置在一起,或者直接作为一个模块设置在本地语音控制网关中。
本步骤为RECH功能实体接收语音解析服务器发送的多条语音指令,多条语音指令可以为语音解析服务器依次发送的,其可以为语音解析服务器在一个预设的时间段内生成并发送的。此处设置预设的时间段的目的是为了对在不同时刻接收到的语音指令进行不同处理,当接收到的两个语音指令的时间差较大时,则可以直接将在先接收到的语音指令返回给相应的语音控制设备,而不会等到接收到在后的语音指令,并对二者进行相似性判断后才处理;因此,本实施例可以具体设置预设的时间段,并对预设的时间段内接收到的各语音指令进行两两的相似性判断。其中,多条语音指令为语音解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的。在本实施例中,需要进行相似性判断的两个语音指令为分别来自不同语音控制设备的语音指令,而无需对来自同一语音控制设备的语音指令进行相似性判断。各语音指令为语音解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的,语音解析服务器对每一个源语音命令进行解析,生成每一个源语音命令对应的语音指令。
步骤102,分别判断所述多条各语音指令中任意两条语音指令是否为相似指令,如果是,则执行步骤103,否则执行步骤104。
在接收到语音指令后,分别判断所述多条语音指令中任意两条语音指令是否为相似指令,此处的相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令。具体地,当本实施例可以对各语音指令中的任意两条语音指令进行相似性判断,分别判断每两条指令是否为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令,如果是,即其中有两条语音指令为相似指令,则执行步骤103,否则,即其中任意两条语音指令均不为相似指令,则执行步骤104。具体地,在进行相似性判断时,可以根据对应的源语音命令的采集时间信息判断两个语音指令在时间上是否重叠,以及根据语音指令的指令内容判断两个语音指令在内容上是否满足重复。
具体地,本实施例中上述步骤101接收的多条语音指令是指满足预设的时间条件的语音指令,此处的预设的时间条件用于对进行相似性判断的语音指令对应的源语音命令的采集时间进行限定,如只需对采集时间间隔较近的语音指令进行相似性判断,而采集时间间隔较远(如2分钟以上)的语音指令基本上不可能是相似指令。在上述步骤101之后,本实施例还可以包括如下步骤:当从所述语音解析服务器接收到一条新的语音指令时,记录所述新的语音指令的采集时间信息;将所述新的语音指令的采集时间与之前记录的语音指令的采集时间进行比较,确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令;将所述新的语音指令与所述相关语音指令作为所述多条语音指令。其中,语音指令的采集时间为该语音指令对应的源语音命令的起始时间戳。
相应地,本实施例可以设置一个指令时间表,将接收到的语音指令的采集时间记录在该指令时间表中。本实施例还可以为该指令时间表设置一个定时器,该定时器用于对其中存储的采集时间信息进行计时,当采集时间信息在指令时间表中存储的时间大于一个预设时间,如5分钟时,表明该采集时间信息对应的语音指令已超时,其基本上不可能与后续接收到的其他语音指令为相似指令,则便可以将该指令时间信息从指令时间表中删除,后续便不会从指令时间表中获取到对应的已超时的语音指令。
本实施例为了避免因对所有语音指令进行相似性判断而造成的较大计算量,对需要进行相似性判断的语音指令进行采集时间的限定,即通过指令时间表中存储的各语音指令的采集时间来判定某两条语音指令是否需要进行相似性判断。此处具体根据指令时间表获取采集时间与新的语音指令的采集时间的差值小于预定阈值的相关语音指令,此处获取的相关语音指令以及新的语音指令便是当前需要进行相似性判断的多条语音指令。
步骤103,丢弃两条相似的语音指令中的一条语音指令。
经过上述相似性判断,当其中两条语音指令为相似指令时,可以从这两条相似的语音指令中选择一条语音指令进行丢弃处理,从而避免出现冗余指令,有效避免了相同命令的重复执行。同时,将另外一条语音指令发送给该语音指令对应的语音控制设备,语音控制设备在接收到各自的语音指令后,便可以执行该语音指令所指示的操作,以响应用户发出的源语音命令。
具体地,本实施例也可以根据这两条相似的语音指令对应的源语音命令的优先级对这两条语音指令进行冗余处理,其中,语音指令的优先级可以根据默认设置的源语音命令的优先级来获取,也可以在语音指令中携带源语音命令的优先级参数,该优先级参数可以根据实际情况来设定,如设置语音控制设备接收到源语音命令的音量值作为优先级参数,音量值越高,则对应的语音指令的优先级越高。具体为将这两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备,此处对应的语音控制设备具体为向语音解析服务器发送该语音指令对应的源语音命令的设备,语音控制设备在接收到各自的语音指令后,便可以执行该语音指令所指示的操作,以响应用户发出的源语音命令。同时,将其中优先级低的语音指令进行丢弃处理,同时可以向该优先级低的语音指令对应的语音控制设备发送冗余指令指示,以通知其监听到的源语音命令为冗余命令,从而有效避免了相同命令的重复执行。
步骤104,将各语音指令分别返回给对应的语音控制设备。
经过上述相似性判断,当多条语音指令中不存在相似指令时,可以直接将各语音指令分别返回给对应的语音控制设备,此处对应的语音控制设备具体为向语音解析服务器发送该语音指令对应的源语音命令的设备,每个语音指令分别对应一个语音控制设备,语音控制设备在接收到各自的语音指令后,便可以执行该语音指令所指示的操作,以响应用户发出的源语音命令。
本实施例提供了一种指令处理方法,通过接收语音解析服务器发送的多条语音指令,分别判断多条语音指令中任意两条语音指令是否为相似指令,相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令;当两条语音指令为相似指令时,丢弃其中一条语音指令。本实施例避免了多个语音控制设备重复执行同时采集到的一条语音命令,消除了命令重复执行带来的控制错误。
图2为本发明指令处理方法实施例二的信令图,如图2所示,本实施例提供了一种指令处理方法,本实施例具体为将RECH功能实体设置在网络侧,图3为本发明指令处理方法实施例二中的系统架构示意图,如图3所示,假设设备A和设备B为两个语音控制设备,二者均具有语音控制功能,本实施例以网络中存在这两个语音控制设备为例来对本发明的方案进行说明,RECH功能实体为与语音解析服务器相独立的一个设备,当然该RECH功能实体也可以集成在语音解析服务器中。具体地,本实施例提供的指令处理方法可以具体包括如下步骤:
步骤201,设备A与语音解析服务器进行时间同步。
步骤202,设备B与语音解析服务器进行时间同步。
上述步骤为先将具有语音控制功能的设备A和设备B分别与位于网络侧的语音解析服务器进行时间同步,以使得后续语音解析服务器能够准确获取到在源语音命令中携带的采集时间信息。
需要指出的是,本实施例中的上述步骤201和步骤202之间不存在时序限定关系,即这两个步骤可以同时执行,也可以以任意顺序执行。
步骤203,设备A向语音解析服务器发送源语音命令A。
当设备A监听并采集到用户发出的源语音命令后,源语音命令可以为:“将设备B的音量降低一格”,设备A在执行该源语音命令之前,需要先将其发送到语音解析服务器进行解析处理,本步骤为设备A向语音解析服务器发送源语音命令A。此处的源语音命令A具体指设备A上报的源语音命令,在该源语音命令A中携带源语音命令A的起始时间戳(initial time stamp A)、截止时间戳(end time stamp A)和优先权参数(priority re-value A),源语音命令A的起始时间戳用于表示设备A监听到的该源语音命令的起始时间,源语音命令A的截止时间戳用于表示设备A监听到的该源语音命令的截止时间,优先权参数为用户或设备设定的用于在出现相似指令时标识设备或命令优先权的参数。
步骤204,语音解析服务器对设备A进行身份验证与鉴权。
语音解析服务器在接收到设备A上报的源语音命令后,先对该设备A进行身份验证与鉴权,身份验证与鉴权通过之后,才执行后续的解析处理。
步骤205,设备B向语音解析服务器发送源语音命令B。
当设备B监听并采集到用户发出的源语音命令后,源语音命令可以为:“将设备B的音量降低一格”,设备B在执行该源语音命令之前,需要先将其发送到语音解析服务器进行解析处理,本步骤为设备B向语音解析服务器发送源语音命令B。此处的源语音命令B具体指设备B上报的源语音命令,在该源语音命令B中携带源语音命令B的起始时间戳(initial time stamp B)、截止时间戳(end time stamp B)和优先权参数(priority re-value B),源语音命令B的起始时间戳用于表示设备B监听到的该源语音命令的起始时间,源语音命令A的截止时间戳用于表示设备B监听到的该源语音命令的截止时间,优先权参数为用户设定的用于在出现相似指令时标识设备或命令优先权的参数。
步骤206,语音解析服务器对设备B进行身份验证与鉴权。
语音解析服务器在接收到设备B上报的源语音命令后,先对该设备B进行身份验证与鉴权,身份验证与鉴权通过之后,才执行后续的解析处理。
需要指出的是,本实施例中的上述步骤204和步骤206之间不存在时序限定关系,即这两个步骤可以同时执行,也可以以任意顺序执行。
步骤207,语音解析服务器向RECH功能实体发送对源语音命令A解析后生成的语音指令A。
语音解析服务器在接收到设备A上报的源语音命令A,并对设备A完成身份验证与鉴权后,语音解析服务器对该源语音命令A进行解析处理,通过解析处理生成设备能够理解并执行的语音指令A,该语音指令A与源语音命令A相对应。语音解析服务器将解析后生成的语音指令A发送到RECH功能实体,在该语音指令A中携带语音指令A对应的源语音命令A的起始时间戳、截止时间戳和优先权参数,由RECH功能实体对该语音指令A与其他语音指令进行相似性判断。
步骤208,语音解析服务器向RECH功能实体发送对源语音命令B解析后生成的语音指令B。
语音解析服务器在接收到设备B上报的源语音命令B,并对设备B完成身份验证与鉴权后,语音解析服务器对该源语音命令B进行解析处理,通过解析处理生成设备能够理解并执行的语音指令B,该语音指令B与源语音命令B相对应。语音解析服务器将解析后生成的语音指令B发送到RECH功能实体,在该语音指令B中携带语音指令B对应的源语音命令B的起始时间戳、截止时间戳和优先权参数,由RECH功能实体对该语音指令B与其他语音指令进行相似性判断。
需要指出的是,本实施例中的上述步骤207和步骤208之间不存在时序限定关系,即这两个步骤可以同时执行,也可以以任意顺序执行。
步骤209,RECH功能实体根据语音指令A、语音指令B分别对应的源语音命令的起始时间戳和截止时间戳,判断语音指令A对应的源语音命令A和语音指令B对应的源语音命令B的采集时间是否重叠,如果是,则执行步骤210,否则执行步骤214。
RECH功能实体在从语音解析服务器接收到语音指令A和语音指令B后,根据其中携带的采集时间信息,该采集时间信息可以包括起始时间戳和截止时间戳,来判断语音指令A对应的源语音命令A和语音指令B对应的源语音命令B的采集时间是否重叠,即进行时间相似性判断。具体地,在进行时间相似性判断时,RECH功能实体可以判断源语音命令A的起始时间戳与源语音命令B的起始时间戳的差值是否小于预设的门限值,且判断源语音命令A的截止时间戳与源语音命令B的截止时间戳的差值是否小于预设的门限值,如果二者的起始时间戳的差值和截止时间戳的差值均小于预设的门限值,则表明语音指令A对应的源语音命令A和语音指令B对应的源语音命令B的采集时间重叠,则执行步骤210;如果二者的起始时间戳或截止时间戳的差值大于或等于预设的门限值,则表明语音指令A对应的源语音命令A和语音指令B对应的源语音命令B的采集时间不重叠,则执行步骤214。
或者,在进行时间相似性判断时,RECH功能实体也可以根据语音指令A、语音指令B对应的源语音命令的起始时间戳和截止时间戳,分别获取语音指令A、语音指令B的持续时间,判断语音指令A的持续时间与语音指令B的持续时间是否有重叠部分,如果二者的持续时间存在重叠部分,则表明语音指令A对应的源语音命令A和语音指令B对应的源语音命令B的采集时间重叠,则执行步骤210;如果二者的持续时间不存在重叠部分,则表明语音指令A对应的源语音命令A和语音指令B对应的源语音命令B的采集时间不重叠,则执行步骤214。
进一步地,在本实施例中,在上述步骤209之前,RECH功能实体还可以先判断语音指令A的起始时间戳与语音指令B的起始时间戳的差值是否大于预设的时间阈值,如果是,再执行步骤209,否则可以结束本流程。
步骤210,RECH功能实体根据语音指令A、语音指令B的指令内容,判断语音指令A和语音指令B在内容上是否重复,如果是,则执行步骤211,否则执行步骤214。
经过上述判断步骤,当RECH功能实体确定语音指令A与语音指令B在时间上重叠时,RECH功能实体根据语音指令A、语音指令B的指令内容,进一步判断语音指令A和语音指令B在内容上是否重复,具体可以对用户的语音特征进行比较,从而判断这两个语音指令对应的源语音命令是否由同一个用户发出。如果二者的指令内容出现的重叠部分较多,例如可以设定一个阈值,若二者的指令内容中重叠内容部分的百分比大于这个阈值,则表明语音指令A和语音指令B在内容上重复,语音指令A和语音指令B为相似指令,并执行步骤211;如果二者的指令内容不相同,则表明语音指令A和语音指令B在内容上不重复,语音指令A和语音指令B不为相似指令,并执行步骤214。
需要指出的是,也可以先判断语音指令A和语音指令B是否在内容上重复,当不满足时执行步骤214,当满足内容上重复时,再判断语音指令A和语音指令对应的源语音命令的采集时间是否重叠,当采集时间不重叠时执行步骤214,当采集时间重叠时,执行步骤211。
步骤211,RECH功能实体根据语音指令A、语音指令B对应的源语音命令的优先级参数,获取语音指令A、语音指令B的优先级。
通过上述时间相似性判断和内容相似性判断的判断过程,当确定语音指令A和语音指令B为相似指令时,RECH功能实体根据语音指令A、语音指令B对应的源语音命令的优先级参数,分别获取语音指令A、语音指令B的优先级。例如,当设定优先级参数为设备接收到源语音命令的音量值时,通过比较设备A接收到源语音命令A的音量值与设备B接收到源语音命令B的音量值,音量值大的意味着其离用户更近,则可能是用户面向的设备;此处可以将音量值大的设备当作优先级高的设备,即将其定义为主要源语音命令采集终端,将将音量值小的设备当作优先级低的设备;相应地,优先级高的设备对应的语音指令的优先级也高,优先级低的设备对应的语音指令的优先级也低。本实施例中假设语音指令A的优先级高于语音指令B的优先级。
步骤212,RECH功能实体将优先级高的语音指令A返回给设备A,并丢弃优先级低的语音指令B。
当获取到语音指令A和语音指令B的优先级后,在本实施例中,优先级高的语音指令A认为是源语音命令采集终端发出的,优先级低的语音指令B认为是冗余指令,则RECH功能实体将优先级高的语音指令A直接返回给设备A,并丢弃优先级低的语音指令B。
步骤213,RECH功能实体向设备B发送冗余指令指示。
在本实施例中,RECH功能实体还可以向设备B发送冗余指令指示,以通知设备B其监听到的源语音命令为冗余命令,无需执行该源语音命令。
步骤214,RECH功能实体将语音指令A返回给设备A,将语音指令B返回给设备B。
通过上述判断,如果语音指令A与语音指令B不满足时间相似性条件,或者不满足内容相似性条件时,表明语音指令A与语音指令B不为相似性指令,则RECH功能实体直接将语音指令A返回给设备A,将语音指令B返回给设备B,由设备A和设备B分别执行语音指令A和语音指令B。
在本实施例中,当完成上述各个步骤的执行后,若RECH功能实体从语音解析服务器接收到一个新的语音指令,则RECH功能实体还可以将该新的语音指令与已返给其他语音控制设备的语音指令进行相似性判断。例如,当RECH功能实体向设备A返回语音指令A后,若RECH功能实体又从语音解析服务器接收到一个来自设备B的新的语音指令,则RECH功能实体还可以将该新的语音指令与已返给设备A的语音指令A进行相似性判断。当该新的语音指令与语音指令A为相似指令时,则无需将该新的指令返回给设备B,而直接将其进行丢弃处理。
本实施例提供了一种指令处理方法,RECH功能实体接收语音解析服务器发送的语音指令A和语音指令B,根据语音指令A和语音指令B对应的源语音命令的起始时间戳和截止时间戳,以及语音指令A和语音指令B的指令内容,判断语音指令A与语音指令B是否为相似指令;当语音指令A与语音指令B为相似指令时,根据语音指令A和语音指令B对应的源语音命令的优先级参数,将优先级高的语音指令返回给对应的语音控制设备,将优先级低的语音指令进行丢弃处理。本实施例避免了多个语音控制设备重复执行同时采集到的一条语音命令,消除了命令重复执行带来的控制错误。
图4为本发明指令处理方法实施例三的信令图,如图4所示,本实施例提供了一种指令处理方法,本实施例具体为将RECH功能实体设置在本地,图5为本发明指令处理方法实施例三中的系统架构示意图,如图5所示,假设设备A和设备B为两个语音控制设备,二者均具有语音控制功能,本实施例以网络中存在这两个语音控制设备为例来对本发明的方案进行说明,RECH功能实体为集成在本地语音控制网关中的一个模块,当然该RECH功能实体也可以为设置在本地的与本地语音控制网关相独立的一个设备。具体地,本实施例提供的指令处理方法可以具体包括如下步骤:
步骤401,设备A与本地语音控制网关进行时间同步。
步骤402,设备B与本地语音控制网关进行时间同步。
上述步骤为先将具有语音控制功能的设备A和设备B分别与位于本地的本地语音控制网关进行时间同步,以使得后续本地语音控制网关能够准确获取到在源语音命令中携带的采集时间信息。
需要指出的是,本实施例中的上述步骤401和步骤402之间不存在时序限定关系,即这两个步骤可以同时执行,也可以以任意顺序执行。
步骤403,设备A向本地语音控制网关发送源语音命令A。
当设备A监听并采集到用户发出的源语音命令后,源语音命令可以为:“将设备B的音量降低一格”,本步骤为设备A向本地语音控制网关发送源语音命令A。此处的源语音命令A具体指设备A上报的源语音命令,在该源语音命令A中携带源语音命令A的起始时间戳(initial time stamp A)、截止时间戳(end time stamp A)和优先权参数(priority re-value A),源语音命令A的起始时间戳用于表示设备A监听到的该源语音命令的起始时间,源语音命令A的截止时间戳用于表示设备A监听到的该源语音命令的截止时间,优先权参数为用户设定的用于在出现相似指令时标识设备或命令优先权的参数。
步骤404,本地语音控制网关对设备A进行身份验证与鉴权。
本地语音控制网关在接收到设备A上报的源语音命令后,先对该设备A进行身份验证与鉴权,身份验证与鉴权通过之后,才执行后续的处理。
步骤405,设备B向本地语音控制网关发送源语音命令B。
当设备B监听并采集到用户发出的源语音命令后,源语音命令可以为:“将设备B的音量降低一格”,本步骤为设备B向本地语音控制网关发送源语音命令B。此处的源语音命令B具体指设备B上报的源语音命令,在该源语音命令B中携带源语音命令B的起始时间戳(initial time stamp B)、截止时间戳(end time stamp B)和优先权参数(priority re-value B),源语音命令B的起始时间戳用于表示设备B监听到的该源语音命令的起始时间,源语音命令A的截止时间戳用于表示设备B监听到的该源语音命令的截止时间,优先权参数为用户设定的用于在出现相似指令时标识设备或命令优先权的参数。
步骤406,本地语音控制网关对设备B进行身份验证与鉴权。
本地语音控制网关在接收到设备B上报的源语音命令后,先对该设备B进行身份验证与鉴权,身份验证与鉴权通过之后,才执行后续的处理。
需要指出的是,本实施例中的上述步骤404和步骤406之间不存在时序限定关系,即这两个步骤可以同时执行,也可以以任意顺序执行。
步骤407,本地语音控制网关将源语音命令A发送到语音解析服务器。
步骤408,本地语音控制网关将源语音命令B发送到语音解析服务器。
需要指出的是,本实施例中的上述步骤407和步骤408之间不存在时序限定关系,即这两个步骤可以同时执行,也可以以任意顺序执行。
步骤409,语音解析服务器向本地语音控制网关发送对源语音命令A解析后生成的语音指令A。
语音解析服务器在接收到设备A上报的源语音命令A,并对设备A完成身份验证与鉴权后,语音解析服务器对该源语音命令A进行解析处理,通过解析处理生成设备能够理解并执行的语音指令A,该语音指令A与源语音命令A相对应。语音解析服务器将解析后生成的语音指令A发送到本地语音控制网关,在该语音指令A中携带语音指令A对应的源语音命令A的起始时间戳、截止时间戳和优先权参数,由本地语音控制网关中的RECH功能实体对该语音指令A与其他语音指令进行相似性判断。
步骤410,语音解析服务器向本地语音控制网关发送对源语音命令B解析后生成的语音指令B。
语音解析服务器在接收到设备B上报的源语音命令B,并对设备B完成身份验证与鉴权后,语音解析服务器对该源语音命令B进行解析处理,通过解析处理生成设备能够理解并执行的语音指令B,该语音指令B与源语音命令B相对应。语音解析服务器将解析后生成的语音指令B发送到本地语音控制网关,在该语音指令B中携带语音指令B对应的源语音命令B的起始时间戳、截止时间戳和优先权参数,由本地语音控制网关中的RECH功能实体对该语音指令B与其他语音指令进行相似性判断。
需要指出的是,本实施例中的上述步骤409和步骤410之间不存在时序限定关系,即这两个步骤可以同时执行,也可以以任意顺序执行。
步骤411,本地语音控制网关根据语音指令A、语音指令B分别对应的源语音命令的起始时间戳和截止时间戳,判断语音指令A对应的源语音命令A和语音指令B对应的源语音命令B的采集时间是否重叠,如果是,则执行步骤412,否则执行步骤416。
本地语音控制网关在从语音解析服务器接收到语音指令A和语音指令B后,根据其中携带的采集时间信息,该采集时间信息可以包括起始时间戳和截止时间戳,来判断语音指令A对应的源语音命令A和语音指令B对应的源语音命令B的采集时间是否重叠,即进行时间相似性判断。具体地,在进行时间相似性判断时,本地语音控制网关中的RECH功能实体可以判断源语音命令A的起始时间戳与源语音命令B的起始时间戳的差值是否小于预设的门限值,且判断源语音命令A的截止时间戳与源语音命令B的截止时间戳的差值是否小于预设的门限值,如果二者的起始时间戳的差值和截止时间戳的差值均小于预设的门限值,则表明源语音命令A和源语音命令B的采集时间重叠,则执行步骤412;如果二者的起始时间戳或截止时间戳的差值大于或等于预设的门限值,则表明源语音命令A和源语音命令B的采集时间不重叠,则执行步骤416。
或者,在进行时间相似性判断时,本地语音控制网关中的RECH功能实体也可以根据语音指令A、语音指令B对应的源语音命令的起始时间戳和截止时间戳,分别获取语音指令A、语音指令B的持续时间,判断语音指令A的持续时间与语音指令B的持续时间是否有重叠部分,如果二者的持续时间存在重叠部分,则表明源语音命令A和源语音命令B的采集时间重叠,则执行步骤412;如果二者的持续时间在时间上不重叠,则表明语音指令A和语音指令B不满足时间相似性条件,则执行步骤416。
进一步地,在本实施例中,在上述步骤411之前,RECH功能实体还可以先判断语音指令A的起始时间戳与语音指令B的起始时间戳的差值是否大于预设的时间阈值,如果是,再执行步骤411,否则可以结束本流程。
步骤412,本地语音控制网关中的RECH功能实体根据语音指令A、语音指令B的指令内容,判断语音指令A和语音指令B在内容上是否重复,如果是,则执行步骤413,否则执行步骤416。
经过上述判断步骤,当本地语音控制网关中的RECH功能实体确定语音指令A对应的源语音命令A与语音指令B对应的源语音命令B的采集时间重叠时,RECH功能实体根据语音指令A、语音指令B的指令内容判断语音指令A和语音指令B在内容上是否重复,具体可以对用户的语音特征进行比较,从而判断这两个语音指令对应的源语音命令是否由同一个用户发出。如果二者的指令内容出现的重叠部分较多,例如可以设定一个阈值,若二者的指令内容中重叠内容部分的百分比大于这个阈值,则表明语音指令A和语音指令B在内容上重复,语音指令A和语音指令B为相似指令,并执行步骤413;如果二者的指令内容不相同,则表明语音指令A和语音指令B在内容上不重复,语音指令A和语音指令B不为相似指令,并执行步骤416。
需要指出的是,也可以先判断语音指令A和语音指令B是否在内容上重复,当不满足时执行步骤416,当满足内容上重复时,再判断语音指令A和语音指令B对应的源语音命令的采集时间是否重叠,当采集时间不重叠时执行步骤416,当采集时间重叠时,执行步骤413。
步骤413,本地语音控制网关中的RECH功能实体根据语音指令A、语音指令B对应的源语音命令的优先级参数,获取语音指令A、语音指令B的优先级。
通过上述时间相似性判断和内容相似性判断的判断过程,当确定语音指令A和语音指令B为相似指令时,本地语音控制网关中的RECH功能实体根据语音指令A、语音指令B对应的源语音命令的优先级参数,分别获取语音指令A、语音指令B的优先级。例如,当设定优先级参数为设备接收到源语音命令的音量值时,通过比较设备A接收到源语音命令A的音量值与设备B接收到源语音命令B的音量值,音量值大的意味着其离用户更近,则可能是用户面向的设备;此处可以将音量值大的设备当作优先级高的设备,即将其定义为主要源语音命令采集终端,将将音量值小的设备当作优先级低的设备;相应地,优先级高的设备对应的语音指令的优先级也高,优先级低的设备对应的语音指令的优先级也低。本实施例中假设语音指令A的优先级高于语音指令B的优先级。
步骤414,本地语音控制网关将优先级高的语音指令A返回给设备A,并丢弃优先级低的语音指令B。
当获取到语音指令A和语音指令B的优先级后,在本实施例中,优先级高的语音指令A认为是源语音命令采集终端发出的,优先级低的语音指令B认为是冗余指令,则本地语音控制网关将优先级高的语音指令A直接返回给设备A,并丢弃优先级低的语音指令B。
步骤415,本地语音控制网关向设备B发送冗余指令指示。
在本实施例中,本地语音控制网关还可以向设备B发送冗余指令指示,以通知设备B其监听到的源语音命令为冗余命令,无需执行该源语音命令。
步骤416,本地语音控制网关将语音指令A返回给设备A,将语音指令B返回给设备B。
通过上述判断,如果语音指令A与语音指令B不满足时间相似性条件,或者不满足内容相似性条件时,表明语音指令A与语音指令B不为相似性指令,则本地语音控制网关直接将语音指令A返回给设备A,将语音指令B返回给设备B,由设备A和设备B分别执行语音指令A和语音指令B。
在本实施例中,当完成上述各个步骤的执行后,若本地语音控制网关从语音解析服务器接收到一个新的语音指令,则本地语音控制网关中的RECH功能实体还可以将该新的语音指令与已返给其他语音控制设备的语音指令进行相似性判断。例如,当RECH功能实体向设备A返回语音指令A后,若RECH功能实体又从语音解析服务器接收到一个来自设备B的新的语音指令,则RECH功能实体还可以将该新的语音指令与已返给设备A的语音指令A进行相似性判断。当该新的语音指令与语音指令A为相似指令时,则无需将该新的指令返回给设备B,而直接将其进行丢弃处理。
本实施例提供了一种指令处理方法,RECH功能实体接收语音解析服务器发送的语音指令A和语音指令B,根据语音指令A和语音指令B对应的源语音命令的起始时间戳和截止时间戳,以及语音指令A和语音指令B的指令内容,判断语音指令A与语音指令B是否为相似指令;当语音指令A与语音指令B为相似指令时,根据语音指令A和语音指令B对应的源语音命令的优先级参数,将优先级高的语音指令返回给对应的语音控制设备,将优先级低的语音指令进行丢弃处理。本实施例避免了多个语音控制设备重复执行同时采集到的一条语音命令,消除了命令重复执行带来的控制错误。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图6为本发明指令处理装置实施例一的结构示意图,如图6所示,本实施例提供了一种指令处理装置,可以具体执行上述方法实施例一中的各个步骤,此处不再赘述。本实施例提供的指令处理装置可以具体包括接收模块601、判断模块602和冗余指令处理模块603。其中,接收模块601用于接收语音解析服务器发送的多条语音指令,所述多条语音指令为所述解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的。判断模块602用于分别判断接收模块601接收到的所述多条语音指令中任意两条语音指令是否为相似指令,所述相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令。冗余指令处理模块603用于当判断模块602的判断结果为多条语音指令中存在两条语音指令为相似指令时,丢弃两条相似的语音指令中的一条语音指令。
图7为本发明指令处理装置实施例二的结构示意图,如图7所示,本实施例提供了一种指令处理装置,可以具体执行上述方法实施例二或实施例三中的各个步骤,此处不再赘述。本实施例提供的指令处理装置在上述图6所示的基础之上,接收模块601接收到的所述多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容。判断模块602可以具体包括第一判断单元612、第二判断单元622和相似指令确定单元632。其中,第一判断单元612用于根据接收模块601接收到的所述多条语音指令对应的源语音命令的采集时间信息,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠。第二判断单元622用于根据接收模块601接收到的所述多条语音指令的指令内容,分别判断所述多条语音指令中任意两条语音指令在内容上是否重复。相似指令确定单元632用于当第一判断单元612和第二判断单元622的判断结果为所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间重叠,且在内容上重复时,确定所述两条语音指令为相似指令。
进一步地,本实施例提供的指令处理装置还可以包括记录模块604和语音指令确定模块605。记录模块604用于当从所述语音解析服务器接收到一条新的语音指令时,记录所述新的语音指令的采集时间信息。语音指令确定模块605用于将所述新的语音指令的采集时间与记录模块604之前记录的语音指令的采集时间进行比较,确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令;并将所述新的语音指令与所述相关语音指令作为所述多条语音指令。
具体地,第一判断单元612可以具体包括第一判断子单元6121和第二判断子单元6122。其中,第一判断子单元6121用于根据接收模块601接收到的所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值,以及截止时间戳的差值是否均小于预设的门限值;若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。第二判断子单元6122用于根据接收模块601接收到的根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别获取多条语音指令的持续时间,判断所述多条语音指令中任意两条语音指令的持续时间是否有重叠部分;若所述持续时间有重叠部分,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。
更进一步地,本实施例中的接收模块601接收到的所述多条语音指令中还分别携带所述多条语音指令对应的源语音命令的优先级参数。该指令处理装置还可以包括获取模块606。获取模块606用于根据接收模块601接收到的语音指令对应的源语音命令的优先级参数,确定所述两条相似的语音指令中的优先级高的语音指令,以及所述两条相似的语音指令中的优先级低的语音指令。冗余指令处理模块603具体用于当判断模块602的判断结果为多条语音指令中存在两条语音指令为相似指令时,将两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备,将优先级低的语音指令进行丢弃处理。
更进一步地,该指令处理装置中的冗余指令处理模块603还用于当接收模块601接收到的一条新的语音指令与已返回给其他语音控制设备的语音指令为相似指令时,对所述新的语音指令进行丢弃处理。
本实施例提供了一种指令处理装置,通过接收语音解析服务器发送的多条语音指令,分别判断多条语音指令中任意两条语音指令是否为相似指令,相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令;当两条语音指令为相似指令时,丢弃其中一条语音指令。本实施例避免了多个语音控制设备重复执行同时采集到的一条语音命令,消除了命令重复执行带来的控制错误。
图8为本发明指令处理装置实施例三的结构示意图,如图8所示,本实施例提供的指令处理装置可以具体包括,存储器801、接收器802和处理器803。其中,接收器802用于接收语音解析服务器发送的多条语音指令;所述多条语音指令为所述解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的。存储器801用于存储程序指令。处理器803与存储器801和接收器802耦合。处理器803被配置为根据存储器801中的程序指令,分别判断接收器802接收的所述多条语音指令中任意两条语音指令是否为相似指令,所述相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令;当所述多条语音指令中存在两条语音指令为相似指令时,丢弃两条相似的语音指令中的一条语音指令。
具体地,接收器802接收的多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容。处理器803被配置具体用于根据所述多条语音指令对应的源语音命令的采集时间信息,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠;根据所述多条语音指令的指令内容,分别判断所述多条语音指令中任意两条语音指令在内容上是否重复;当所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间重叠,且在内容上重复时,确定所述两条语音指令为相似指令。
进一步地,处理器803还被配置用于当从所述语音解析服务器接收到一条新的语音指令时,记录所述新的语音指令的采集时间信息;将所述新的语音指令的采集时间与之前记录的语音指令的采集时间进行比较,确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令;将所述新的语音指令与所述相关语音指令作为所述多条语音指令。
更具体地,处理器803被配置用于根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值,以及截止时间戳的差值是否均小于预设的门限值;若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。或者,处理器803被配置用于根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别获取多条语音指令的持续时间,判断所述多条语音指令中任意两条语音指令的持续时间是否有重叠部分;若所述持续时间有重叠部分,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。
进一步地,接收器802接收的多条语音指令中还分别携带各所述语音指令对应的源语音命令的优先级参数。处理器803还被配置用于根据语音指令对应的源语音命令的优先级参数,确定两条相似的语音指令中的优先级高的语音指令,以及两条相似的语音指令中的优先级低的语音指令;当多条语音指令中存在相似指令时,将两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备,将优先级低的语音指令进行丢弃处理。
更进一步地,处理器803还被配置用于当接收到的一条新的语音指令与已返回给其他语音控制设备的语音指令为相似指令时,对所述新的语音指令进行丢弃处理。
图9为本发明计算机系统实施例的结构示意图,如图9所示,本实施例提供了一种计算机系统,该计算机系统可以具体为微处理器计算机,诸如通用目的的PC、定制的PC、例如台式计算机或智能电话等便携式设备,但本发明的范围并不局限于这些例子。该计算机系统包括处理器901、输入设备902和输出设备903,输入设备902和输出设备903耦合于该处理器901。
处理器901可以为通用目的的CPU、专用集成电路(Application SpecificIntegrated Circuit;以下简称:ASIC)或者一个或多个集成电路,其被配置用于控制执行本发明的程序。输入设备902包括键盘和鼠标、键区、触屏输入设备、语音输入模块等。输出设备903包括屏幕显示单元和语音模块。
计算机系统还包括存储器904,该存储器904也可以包括一个或多个下述存储设备:只读内存(Read-Only Memory;以下简称:ROM)、随机存储器(Random Access Memory;以下简称:RAM)和硬盘。存储器通过信号总线905与处理器相耦合。
该计算机系统还包括用于与通信网络,诸如以太网(Ethernet)、无线接入网(Radio Access Network;以下简称:RAN)、无线局域网(Wireless LocalArea Network;以下简称:WLAN)等进行通信的通信接口906。
上述存储器904(诸如RAM)中存储有操作系统914、应用软件924、程序934等,其中,操作系统914为控制处理器所执行的处理过程的应用程序,应用软件924可以为word处理器、email程序等,用以将输出设备上的数据显示给用户,程序934可以具体为本发明提供的指令处理方法所对应的程序。
该计算机系统还包括接收器907,被配置用于接收语音解析服务器发送的多条语音指令,所述多条语音指令为所述解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的。本实施例中的处理器901被配置为执行存储在所述存储器904中的指令,其中,所述处理器901被配置为用于:分别判断所述多条语音指令中任意两条语音指令是否为相似指令,所述相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令;当多条语音指令中存在两条语音指令为相似指令时,丢弃两条相似的语音指令中的一条语音指令。
具体地,接收器907接收的多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容。处理器901被配置具体用于根据所述多条语音指令对应的源语音命令的采集时间信息,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠;根据所述多条语音指令的指令内容,分别判断所述多条语音指令中任意两条语音指令在内容上是否重复;当所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间重叠,且在内容上重复时,确定所述两条语音指令为相似指令。
具体地,处理器901还被配置用于当从所述语音解析服务器接收到一条新的语音指令时,记录所述新的语音指令的采集时间信息;将所述新的语音指令的采集时间与之前记录的语音指令的采集时间进行比较,确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令;将所述新的语音指令与所述相关语音指令作为所述多条语音指令。
更具体地,处理器901被配置用于根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值,以及截止时间戳的差值是否均小于预设的门限值;若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。或者,处理器901被配置用于根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别获取多条语音指令的持续时间,判断所述多条语音指令中任意两条语音指令的持续时间是否有重叠部分;若所述持续时间有重叠部分,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。
进一步地,接收器907接收的多条语音指令中还分别携带各所述语音指令对应的源语音命令的优先级参数。处理器901还被配置用于根据语音指令对应的源语音命令的优先级参数,确定两条相似的语音指令中的优先级高的语音指令,以及两条相似的语音指令中的优先级低的语音指令;当多条语音指令中存在两条语音指令为相似指令时,将两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备,将优先级低的语音指令进行丢弃处理。
更进一步地,处理器901还被配置用于当接收到的一条新的语音指令与已返回给其他语音控制设备的语音指令为相似指令时,对所述新的语音指令进行丢弃处理。
图10为本发明指令处理系统实施例一的结构示意图,如图10所示,本实施例提供的指令处理系统可以具体包括语音解析服务器1、多个语音控制设备2和指令处理装置3。其中,指令处理装置3可以具体如上述图6、图7或图8所示的指令处理装置,该图中指令处理装置3为与语音解析服务器1相独立的设备,该指令处理装置3还可以根据实际情况设置在语音解析服务器1中(图中未示出)。多个语音控制设备2分别用于采集多个源语音命令,并分别将所述多个源语音命令发送到所述语音解析服务器1。语音解析服务器1用于接收多个语音控制设备2发送的多个源语音命令,对所述多个源语音命令分别进行解析后生成所述多个源语音命令对应的多个语音指令,并将所述多个语音指令分别发送到所述指令处理装置3。
本实施例中的语音解析服务器1还用于与多个语音控制设备2进行时间同步。
图11为本发明指令处理系统实施例二的结构示意图,如图11所示,本实施例提供的指令处理系统可以具体包括语音解析服务器1、多个语音控制设备2和本地语音控制网关4。本地语音控制网关4可以包括上述图6、图7或图8所示的指令处理装置3。多个语音控制设备2用于分别采集多个源语音命令,并分别将所述多个源语音命令发送到所述本地语音控制网关3。语音解析服务器1用于分别接收本地语音控制网关4发送的多个源语音命令,对所述多个源语音命令分别进行解析后生成所述多个源语音命令对应的多个语音指令,并分别将所述多个语音指令返回到所述本地语音控制网关4。
本实施例中的本地语音控制网关4还用于与所述多个语音控制设备2进行时间同步。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (16)

1.一种指令处理方法,其特征在于,包括:
接收语音解析服务器发送的多条语音指令,所述多条语音指令为所述语音解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的;
分别判断所述多条语音指令中任意两条语音指令是否为相似指令,所述相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令;
当所述多条语音指令中存在两条语音指令为相似指令时,丢弃两条相似的语音指令中的一条语音指令;
其中,所述多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容;
所述分别判断所述多条语音指令中任意两条语音指令是否为相似指令包括:
根据所述多条语音指令对应的源语音命令的采集时间信息,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠;
根据所述多条语音指令的指令内容,分别判断所述多条语音指令中任意两条语音指令在内容上是否重复;
当所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间重叠,且在内容上重复时,确定所述两条语音指令为相似指令。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当从所述语音解析服务器接收到一条新的语音指令时,记录所述新的语音指令的采集时间信息;
将所述新的语音指令的采集时间与之前记录的语音指令的采集时间进行比较,确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令;
将所述新的语音指令与所述相关语音指令作为所述多条语音指令。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述多条语音指令对应的源语音命令的采集时间信息,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠包括:
根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值,以及截止时间戳的差值是否均小于预设的门限值;若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠;或者,
根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别获取多条语音指令的持续时间,判断所述多条语音指令中任意两条语音指令的持续时间是否有重叠部分;若所述持续时间有重叠部分,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。
4.根据权利要求1或2所述的方法,其特征在于,所述多条语音指令中还分别携带各所述语音指令对应的源语音命令的优先级参数;
所述方法还包括:
根据语音指令对应的源语音命令的优先级参数,确定两条相似的语音指令中的优先级高的语音指令,以及两条相似的语音指令中的优先级低的语音指令;
所述当所述多条语音指令中存在两条语音指令为相似指令时,丢弃两条相似的语音指令中的一条语音指令包括:
当所述多条语音指令中存在两条语音指令为相似指令时,将两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备,将优先级低的语音指令进行丢弃处理。
5.根据权利要求1或2所述的方法,其特征在于,还包括:
当接收到的一条新的语音指令与已返回给其他语音控制设备的语音指令为相似指令时,对所述新的语音指令进行丢弃处理。
6.根据权利要求1所述的方法,其特征在于,还包括:
所述语音解析服务器与各语音控制设备进行时间同步;
所述语音解析服务器分别接收所述各语音控制设备发送的所述源语音命令。
7.根据权利要求1所述的方法,其特征在于,还包括:
本地语音控制网关与各语音控制设备进行时间同步;
所述本地语音控制网关分别接收所述各语音控制设备发送的所述源语音命令,并将各所述源语音命令发送到所述语音解析服务器。
8.一种指令处理装置,其特征在于,包括:
接收模块,用于接收语音解析服务器发送的多条语音指令,所述多条语音指令为所述语音解析服务器对来自不同语音控制设备的源语音命令进行解析后生成的;
判断模块,用于分别判断所述接收模块接收到的所述多条语音指令中任意两条语音指令是否为相似指令,所述相似指令为不同语音控制设备对同一语音信息进行采集得到的源语音命令对应的语音指令;
冗余指令处理模块,用于当所述判断模块的判断结果为所述多条语音指令中存在两条语音指令为相似指令时,丢弃两条相似的语音指令中的一条语音指令;
其中,所述接收模块接收到的所述多条语音指令中分别携带各语音指令对应的源语音命令的采集时间信息和各语音指令的指令内容;
所述判断模块包括:
第一判断单元,用于根据所述接收模块接收到的所述多条语音指令对应的源语音命令的采集时间信息,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间是否重叠;
第二判断单元,用于根据所述接收模块接收到的所述多条语音指令的指令内容,分别判断所述多条语音指令中任意两条语音指令在内容上是否重复;
相似指令确定单元,用于当所述第一判断单元和第二判断单元的判断结果为所述多条语音指令中任意两条语音指令对应的源语音命令的采集时间重叠,且在内容上重复时,确定所述两条语音指令为相似指令。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
记录模块,用于当从所述语音解析服务器接收到一条新的语音指令时,记录所述新的语音指令的采集时间信息;
语音指令确定模块,用于将所述新的语音指令的采集时间与所述记录模块之前记录的语音指令的采集时间进行比较,确定采集时间与所述新的语音指令的采集时间的差值小于预定阈值的相关语音指令;并将所述新的语音指令与所述相关语音指令作为所述多条语音指令。
10.根据权利要求8或9所述的装置,其特征在于,所述第一判断单元包括:
第一判断子单元,用于根据所述接收模块接收到的所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别判断所述多条语音指令中任意两条语音指令对应的源语音命令的起始时间戳的差值,以及截止时间戳的差值是否均小于预设的门限值;若所述起始时间戳的差值以及所述截止时间戳的差值均小于预设的门限值,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠;或者,
第二判断子单元,用于所述接收模块接收到的根据所述多条语音指令对应的源语音命令的起始时间戳和截止时间戳,分别获取多条语音指令的持续时间,判断所述多条语音指令中任意两条语音指令的持续时间是否有重叠部分;若所述持续时间有重叠部分,则确定所述多条语音指令中的任意两条指令对应的源语音命令的采集时间重叠。
11.根据权利要求8或9所述的装置,其特征在于,所述接收模块接收到的所述多条语音指令中还分别携带所述多条语音指令对应的源语音命令的优先级参数;
所述装置还包括:
获取模块,用于根据所述接收模块接收到的语音指令对应的源语音命令的优先级参数,确定两条相似的语音指令中的优先级高的语音指令,以及两条相似的语音指令中的优先级低的语音指令;
所述冗余指令处理模块具体用于当所述判断模块的判断结果为所述多条语音指令中存在两条语音指令为相似指令时,将两条相似的语音指令中优先级高的语音指令返回给对应的语音控制设备,将优先级低的语音指令进行丢弃处理。
12.根据权利要求8或9所述的装置,其特征在于,所述冗余指令处理模块还用于当所述接收模块接收到的一条新的语音指令与已返回给其他语音控制设备的语音指令为相似指令时,对所述新的语音指令进行丢弃处理。
13.一种指令处理系统,其特征在于,包括语音解析服务器、多个语音控制设备和权利要求8-12中任一项所述的指令处理装置;
所述多个语音控制设备分别用于采集多个源语音命令,并分别将所述多个源语音命令发送到所述语音解析服务器;
所述语音解析服务器用于接收所述多个语音控制设备发送的多个源语音命令,对所述多个源语音命令分别进行解析后生成所述多个源语音命令对应的多个语音指令,并将所述多个语音指令分别发送到所述指令处理装置。
14.根据权利要求13所述的系统,其特征在于,所述语音解析服务器还用于与所述多个语音控制设备进行时间同步。
15.一种指令处理系统,其特征在于,包括语音解析服务器、多个语音控制设备和本地语音控制网关,所述本地语音控制网关包括权利要求8-12中任一项所述的指令处理装置;
所述多个语音控制设备用于分别采集多个源语音命令,并分别将所述多个源语音命令发送到所述本地语音控制网关;
所述语音解析服务器用于分别接收所述本地语音控制网关发送的多个源语音命令,对所述多个源语音命令分别进行解析后生成所述多个源语音命令对应的多个语音指令,并分别将所述多个语音指令返回到所述本地语音控制网关。
16.根据权利要求15所述的系统,其特征在于,所述本地语音控制网关还用于与所述多个语音控制设备进行时间同步。
CN201210282268.XA 2012-08-09 2012-08-09 指令处理方法、装置和系统 Active CN102831894B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201210282268.XA CN102831894B (zh) 2012-08-09 2012-08-09 指令处理方法、装置和系统
PCT/CN2013/081131 WO2014023257A1 (zh) 2012-08-09 2013-08-09 指令处理方法、装置和系统
EP13827606.8A EP2830044B1 (en) 2012-08-09 2013-08-09 Instruction processing method, apparatus, and system
US14/520,575 US9704503B2 (en) 2012-08-09 2014-10-22 Command handling method, apparatus, and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210282268.XA CN102831894B (zh) 2012-08-09 2012-08-09 指令处理方法、装置和系统

Publications (2)

Publication Number Publication Date
CN102831894A CN102831894A (zh) 2012-12-19
CN102831894B true CN102831894B (zh) 2014-07-09

Family

ID=47334993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210282268.XA Active CN102831894B (zh) 2012-08-09 2012-08-09 指令处理方法、装置和系统

Country Status (4)

Country Link
US (1) US9704503B2 (zh)
EP (1) EP2830044B1 (zh)
CN (1) CN102831894B (zh)
WO (1) WO2014023257A1 (zh)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831894B (zh) 2012-08-09 2014-07-09 华为终端有限公司 指令处理方法、装置和系统
CN104035814A (zh) * 2013-03-07 2014-09-10 联想(北京)有限公司 一种数据处理的方法及电子设备
US10204622B2 (en) * 2015-09-10 2019-02-12 Crestron Electronics, Inc. Acoustic sensory network
US10748539B2 (en) * 2014-09-10 2020-08-18 Crestron Electronics, Inc. Acoustic sensory network
CN106469040B (zh) 2015-08-19 2019-06-21 华为终端有限公司 通信方法、服务器及设备
US10783888B2 (en) * 2015-09-10 2020-09-22 Crestron Electronics Inc. System and method for determining recipient of spoken command in a control system
US9653075B1 (en) 2015-11-06 2017-05-16 Google Inc. Voice commands across devices
US10185544B1 (en) 2015-12-28 2019-01-22 Amazon Technologies, Inc. Naming devices via voice commands
US10026401B1 (en) 2015-12-28 2018-07-17 Amazon Technologies, Inc. Naming devices via voice commands
US10127906B1 (en) * 2015-12-28 2018-11-13 Amazon Technologies, Inc. Naming devices via voice commands
US10049670B2 (en) 2016-06-06 2018-08-14 Google Llc Providing voice action discoverability example for trigger term
CN106357525A (zh) * 2016-08-29 2017-01-25 珠海格力电器股份有限公司 智能网关控制方法和装置及智能网关
US10515632B2 (en) 2016-11-15 2019-12-24 At&T Intellectual Property I, L.P. Asynchronous virtual assistant
WO2018090252A1 (zh) * 2016-11-16 2018-05-24 深圳达闼科技控股有限公司 机器人语音指令识别的方法及相关机器人装置
US10757058B2 (en) 2017-02-17 2020-08-25 International Business Machines Corporation Outgoing communication scam prevention
US10810510B2 (en) 2017-02-17 2020-10-20 International Business Machines Corporation Conversation and context aware fraud and abuse prevention agent
US10102868B2 (en) * 2017-02-17 2018-10-16 International Business Machines Corporation Bot-based honeypot poison resilient data collection
CN107039041B (zh) * 2017-03-24 2020-10-20 广东美的制冷设备有限公司 语音扩展的方法与语音助手
CN107707436A (zh) * 2017-09-18 2018-02-16 广东美的制冷设备有限公司 终端控制方法、装置及计算机可读存储介质
CN107655154A (zh) * 2017-09-18 2018-02-02 广东美的制冷设备有限公司 终端控制方法、空调器及计算机可读存储介质
US10424299B2 (en) * 2017-09-29 2019-09-24 Intel Corporation Voice command masking systems and methods
US10887351B2 (en) * 2018-05-02 2021-01-05 NortonLifeLock Inc. Security for IoT home voice assistants
WO2019212697A1 (en) * 2018-05-03 2019-11-07 Google Llc Coordination of overlapping processing of audio queries
US10783886B2 (en) * 2018-06-12 2020-09-22 International Business Machines Corporation Cognitive agent disambiguation
CN109074808B (zh) * 2018-07-18 2023-05-09 深圳魔耳智能声学科技有限公司 语音控制方法、中控设备和存储介质
CN109308897B (zh) * 2018-08-27 2022-04-26 广东美的制冷设备有限公司 语音控制方法、模块、家电设备、系统和计算机存储介质
CN111063344B (zh) * 2018-10-17 2022-06-28 青岛海信移动通信技术股份有限公司 一种语音识别方法、移动终端以及服务器
US10885912B2 (en) 2018-11-13 2021-01-05 Motorola Solutions, Inc. Methods and systems for providing a corrected voice command
CN109541953A (zh) * 2018-11-27 2019-03-29 深圳狗尾草智能科技有限公司 拓展辅助设备、基于智能机器人的拓展平台及方法
CN109671431A (zh) * 2018-12-14 2019-04-23 科大国创软件股份有限公司 一种基于机器人语音交互的管廊平台监控系统
US11183185B2 (en) * 2019-01-09 2021-11-23 Microsoft Technology Licensing, Llc Time-based visual targeting for voice commands
KR20200098025A (ko) * 2019-02-11 2020-08-20 삼성전자주식회사 전자 장치 및 그 제어 방법
JP2020140431A (ja) * 2019-02-28 2020-09-03 富士ゼロックス株式会社 情報処理装置、情報処理システム、及び情報処理プログラム
CN110299152A (zh) * 2019-06-28 2019-10-01 北京猎户星空科技有限公司 人机对话的输出控制方法、装置、电子设备及存储介质
US20210065719A1 (en) * 2019-08-29 2021-03-04 Comcast Cable Communications, Llc Methods and systems for intelligent content controls
CN113129878A (zh) * 2019-12-30 2021-07-16 富泰华工业(深圳)有限公司 声控方法及终端装置
JP2021117301A (ja) * 2020-01-23 2021-08-10 トヨタ自動車株式会社 エージェントシステム、端末装置およびエージェントプログラム
KR20210106806A (ko) * 2020-02-21 2021-08-31 현대자동차주식회사 차량의 음성인식 장치 및 방법
CN111399910B (zh) * 2020-03-12 2022-06-07 支付宝(杭州)信息技术有限公司 用户指令的处理方法及装置
CN111524529B (zh) * 2020-04-15 2023-11-24 广州极飞科技股份有限公司 音频数据处理方法、装置和系统、电子设备及存储介质
CN112233672A (zh) * 2020-09-30 2021-01-15 成都长虹网络科技有限责任公司 分布式语音控制方法、系统、计算机设备和可读存储介质
US20220179619A1 (en) * 2020-12-03 2022-06-09 Samsung Electronics Co., Ltd. Electronic device and method for operating thereof
CN112837686A (zh) * 2021-01-29 2021-05-25 青岛海尔科技有限公司 唤醒响应操作的执行方法、装置、存储介质及电子装置
CN113470638B (zh) * 2021-05-28 2022-08-26 荣耀终端有限公司 槽位填充的方法、芯片、电子设备和可读存储介质
CN113990298B (zh) * 2021-12-24 2022-05-13 广州小鹏汽车科技有限公司 语音交互方法及其装置、服务器和可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101911723A (zh) * 2008-01-29 2010-12-08 高通股份有限公司 通过在来自多个麦克风的信号之间智能地进行选择而改善声音质量
CN102262879A (zh) * 2010-05-24 2011-11-30 乐金电子(中国)研究开发中心有限公司 语音命令竞争处理方法、装置、语音遥控器和数字电视

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010054622A (ko) * 1999-12-07 2001-07-02 서평원 음성 인식 시스템의 음성 인식률 향상 방법
JP2001319045A (ja) * 2000-05-11 2001-11-16 Matsushita Electric Works Ltd 音声マンマシンインタフェースを用いたホームエージェントシステム、及びプログラム記録媒体
EP1215658A3 (en) * 2000-12-05 2002-08-14 Hewlett-Packard Company Visual activation of voice controlled apparatus
US7647374B2 (en) * 2001-07-03 2010-01-12 Nokia Corporation Method for managing sessions between network parties, methods, network element and terminal for managing calls
GB0213255D0 (en) * 2002-06-10 2002-07-17 Nokia Corp Charging in communication networks
US7379978B2 (en) * 2002-07-19 2008-05-27 Fiserv Incorporated Electronic item management and archival system and method of operating the same
US20080177994A1 (en) * 2003-01-12 2008-07-24 Yaron Mayer System and method for improving the efficiency, comfort, and/or reliability in Operating Systems, such as for example Windows
US20070128899A1 (en) * 2003-01-12 2007-06-07 Yaron Mayer System and method for improving the efficiency, comfort, and/or reliability in Operating Systems, such as for example Windows
US7752050B1 (en) * 2004-09-03 2010-07-06 Stryker Corporation Multiple-user voice-based control of devices in an endoscopic imaging system
DE602004015987D1 (de) * 2004-09-23 2008-10-02 Harman Becker Automotive Sys Mehrkanalige adaptive Sprachsignalverarbeitung mit Rauschunterdrückung
US20060136220A1 (en) * 2004-12-22 2006-06-22 Rama Gurram Controlling user interfaces with voice commands from multiple languages
US7849199B2 (en) 2005-07-14 2010-12-07 Yahoo ! Inc. Content router
JP4542974B2 (ja) * 2005-09-27 2010-09-15 株式会社東芝 音声認識装置、音声認識方法および音声認識プログラム
EP1958362A4 (en) * 2005-11-29 2010-03-17 Google Inc DETECTING RECONSTITUTED CONTENT IN RADIATION MEDIA
US7899669B2 (en) * 2005-12-12 2011-03-01 Gregory John Gadbois Multi-voice speech recognition
WO2007119586A1 (ja) * 2006-04-13 2007-10-25 Kyocera Corporation グループ通信方法及び通信端末
EP1850593A1 (fr) * 2006-04-27 2007-10-31 Nagravision S.A. Procédé de génération de paquets à destination d'au moins un récepteur mobile
JP5037041B2 (ja) * 2006-06-23 2012-09-26 アルパイン株式会社 車載用音声認識装置及び音声コマンド登録方法
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
AU2007312942A1 (en) * 2006-10-17 2008-04-24 Altec Lansing Australia Pty Ltd Unification of multimedia devices
US20090055379A1 (en) * 2007-08-22 2009-02-26 Richard Murtagh Systems and Methods for Locating Contact Information
WO2009086599A1 (en) * 2008-01-07 2009-07-16 Avega Systems Pty Ltd A user interface for managing the operation of networked media playback devices
USRE48946E1 (en) * 2008-01-07 2022-02-22 D&M Holdings, Inc. Systems and methods for providing a media playback in a networked environment
US8725492B2 (en) * 2008-03-05 2014-05-13 Microsoft Corporation Recognizing multiple semantic items from single utterance
KR101631496B1 (ko) * 2008-06-03 2016-06-17 삼성전자주식회사 로봇 장치 및 그 단축 명령 등록 방법
JP5533854B2 (ja) * 2009-03-31 2014-06-25 日本電気株式会社 音声認識処理システム、および音声認識処理方法
WO2011032271A1 (en) * 2009-09-17 2011-03-24 Royal Canadian Mint/Monnaie Royale Canadienne Trusted message storage and transfer protocol and system
US9152634B1 (en) * 2010-06-23 2015-10-06 Google Inc. Balancing content blocks associated with queries
US20120311090A1 (en) * 2011-05-31 2012-12-06 Lenovo (Singapore) Pte. Ltd. Systems and methods for aggregating audio information from multiple sources
US20130018895A1 (en) * 2011-07-12 2013-01-17 Harless William G Systems and methods for extracting meaning from speech-to-text data
US8340975B1 (en) * 2011-10-04 2012-12-25 Theodore Alfred Rosenberger Interactive speech recognition device and system for hands-free building control
US20130317827A1 (en) * 2012-05-23 2013-11-28 Tsung-Chun Fu Voice control method and computer-implemented system for data management and protection
CN102831894B (zh) * 2012-08-09 2014-07-09 华为终端有限公司 指令处理方法、装置和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101911723A (zh) * 2008-01-29 2010-12-08 高通股份有限公司 通过在来自多个麦克风的信号之间智能地进行选择而改善声音质量
CN102262879A (zh) * 2010-05-24 2011-11-30 乐金电子(中国)研究开发中心有限公司 语音命令竞争处理方法、装置、语音遥控器和数字电视

Also Published As

Publication number Publication date
WO2014023257A1 (zh) 2014-02-13
US20150039319A1 (en) 2015-02-05
EP2830044A1 (en) 2015-01-28
EP2830044B1 (en) 2016-05-25
CN102831894A (zh) 2012-12-19
US9704503B2 (en) 2017-07-11
EP2830044A4 (en) 2015-06-03

Similar Documents

Publication Publication Date Title
CN102831894B (zh) 指令处理方法、装置和系统
CN104699598A (zh) 自动化测试方法、装置、设备及系统
CN106814639A (zh) 语音控制系统及方法
CA2931150C (en) Automatic inspection and monitoring method based on time domain slotting control
CN104699591A (zh) 一种测试场景重现方法以及装置
CN110956963A (zh) 一种基于可穿戴设备实现的交互方法及可穿戴设备
CN110071855B (zh) 设备联动控制方法、装置、系统、网关及存储介质
CN109299088A (zh) 海量数据存储方法、装置、存储介质及电子设备
CN107509051A (zh) 远程控制方法、装置、终端及计算机可读存储介质
CN104636240A (zh) 一种信息报表的获取方法及终端
CN105487639A (zh) 一种优化应用程序耗电的方法、装置及电子设备
CN110501918A (zh) 智能家电控制方法、装置、电子设备和存储介质
CN113742174B (zh) 云手机应用监控方法、装置、电子设备和存储介质
CN107346280A (zh) 一种数据上报和数据处理的方法、装置和电子设备
CN110061893B (zh) 一种故障信息采集方法、服务器及存储介质
CN108491325B (zh) 文件系统测试方法、装置、存储介质及终端
CN107544248B (zh) 一种移动机器人中的任务优化方法及设备
CN113612659B (zh) 设备连网测试方法、装置、电子设备及存储介质
CN115994112A (zh) 一种储能协调控制方法、控制器、设备和介质
CN113157475A (zh) 日志处理方法、装置、存储介质及电子设备
CN113515425A (zh) 数据动态上报的方法和装置
CN109828913A (zh) 一种测试报告生成方法及装置
CN111444433A (zh) 一种移动应用的推送方法及系统
CN110996374B (zh) 一种无线网络控制方法、装置、设备及介质
CN105095057A (zh) 应用耗电检测方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20171027

Address after: Metro Songshan Lake high tech Industrial Development Zone, Guangdong Province, Dongguan City Road 523808 No. 2 South Factory (1) project B2 -5 production workshop

Patentee after: HUAWEI terminal (Dongguan) Co., Ltd.

Address before: 518129 Longgang District, Guangdong, Bantian HUAWEI base B District, building 2, building No.

Patentee before: Huawei Device Co., Ltd.

TR01 Transfer of patent right
CP01 Change in the name or title of a patent holder

Address after: 523808 Southern Factory Building (Phase I) Project B2 Production Plant-5, New Town Avenue, Songshan Lake High-tech Industrial Development Zone, Dongguan City, Guangdong Province

Patentee after: Huawei Device Co., Ltd.

Address before: 523808 Southern Factory Building (Phase I) Project B2 Production Plant-5, New Town Avenue, Songshan Lake High-tech Industrial Development Zone, Dongguan City, Guangdong Province

Patentee before: HUAWEI terminal (Dongguan) Co., Ltd.

CP01 Change in the name or title of a patent holder