CN111833862B - 一种设备的控制方法、控制设备及存储介质 - Google Patents

一种设备的控制方法、控制设备及存储介质 Download PDF

Info

Publication number
CN111833862B
CN111833862B CN201910319499.5A CN201910319499A CN111833862B CN 111833862 B CN111833862 B CN 111833862B CN 201910319499 A CN201910319499 A CN 201910319499A CN 111833862 B CN111833862 B CN 111833862B
Authority
CN
China
Prior art keywords
information
pronunciation
equipment
source
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910319499.5A
Other languages
English (en)
Other versions
CN111833862A (zh
Inventor
刘冠华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan Shunde Midea Electrical Heating Appliances Manufacturing Co Ltd
Original Assignee
Foshan Shunde Midea Electrical Heating Appliances Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Shunde Midea Electrical Heating Appliances Manufacturing Co Ltd filed Critical Foshan Shunde Midea Electrical Heating Appliances Manufacturing Co Ltd
Priority to CN201910319499.5A priority Critical patent/CN111833862B/zh
Publication of CN111833862A publication Critical patent/CN111833862A/zh
Application granted granted Critical
Publication of CN111833862B publication Critical patent/CN111833862B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Selective Calling Equipment (AREA)

Abstract

本发明公开了一种设备的控制方法,所述方法包括:接收语音指令;基于接收所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息;基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备确定为目标设备;控制所述目标设备执行所述语音指令。本发明还同时公开了一种控制设备及存储介质。

Description

一种设备的控制方法、控制设备及存储介质
技术领域
本发明涉及设备控制技术,具体涉及一种设备的控制方法、控制设备及存储介质。
背景技术
在智能家电的使用场景中,智能音箱作为一种有效的人机交互方式,其便利且亲近人类原始交互方式,越来越受到人们的喜爱,成为智能家电的人机交互主要入口。
当用户想要通过智能音箱对家里的其他智能设备进行语音控制时,通常需要先通过唤醒词来唤醒智能音箱;例如,通过用户发出唤醒词“Alex”,使智能音箱进入指令接收状态;然后用户再说出动作和被控制的设备名称,如“打开客厅灯”、“关掉卧房空调”等,其中“客厅”、“卧房”等命名是根据家庭中同一类型的设备在不同位置而命名的,如有多盏灯、多台空调,为了区分哪个房间的灯或哪个房间的空调而命名。当智能音箱接收到用户发送的语音指令后,就可以通过解析接收到的语音指令,得到带有房间属性的控制指令后,来确定待控制设备的设备信息、该设备所在的房间信息、动作信息,从而根据设备信息、房间信息和动作信息,控制对应房间里的对应设备来执行对应的动作。
显然,上述控制方式的控制过程比较繁琐,不仅需要用户要记住待控制设备的设备信息、而且还要记住每个设备所在的位置,使得用户体验较差。
发明内容
为解决现有存在的技术问题,本发明实施例主要提供一种设备的控制方法、控制设备及存储介质,能够通过简单的语音指令即可实现对目标设备的控制。
本发明实施例的技术方案是这样实现的:
根据本发明实施例的一方面,提供一种设备的控制方法,所述方法包括:
接收语音指令;
基于接收所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息;
基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备确定为目标设备;
控制所述目标设备执行所述语音指令。
上述方案中,所述基于接收与所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息,包括:
基于所述第一设备的坐标信息,确定所述第一设备只有一个时,获取所述第一设备中至少两个麦克风接收所述语音指令所产生的音频特征数据;
将每个所述麦克风对应的音频特征数据进行比较;
根据比较结果,将指令接收时间最短和/或声波频率最强的音频特征数据对应的麦克风确定为目标麦克风;
获取所述目标麦克风的朝向信息;
将所述朝向信息确定为所述发音源的发音方向信息;
基于所述发音方向信息,获取所述发音源所在方向内所有第二设备的坐标信息;
基于所述第一设备的坐标信息和所有所述第二设备的坐标信息,确定所述发音源的位置信息。
上述方案中,所述基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备,确定为目标设备,包括:
基于所述发音源的位置信息和每个所述第二设备的坐标信息,确定距离所述发音源最近的第二设备;
将距离所述发音源最近的所述第二设备确定为所述目标设备。
上述方案中,所述基于接收与所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息,包括:
基于所述第一设备的坐标信息,确定所述第一设备具有至少两个时,获取每个所述第一设备中至少一个麦克风接收所述语音指令所产生的音频特征数据;
基于至少两个所述第一设备对应的所述音频特征数据,确定至少两个所述第一设备之间的音频特征差;
基于所述音频特征差,确定每个所述第一设备到所述发音源的距离;
基于每个所述第一设备到所述发音源的距离,确定所述发音源的发音方位信息。
上述方案中,所述基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备,确定为目标设备,包括:
基于所述发音源的位置信息和每个所述第一设备的坐标信息,确定距离所述发音源最近的第一设备;
将距离所述发音源最近的所述第一设备所在区域内、与所述目标设备信息相匹配的第二设备确定为所述目标设备。
上述方案中,在接收所述语音指令之前,所述方法还包括:
在电子户型图中分别对所述第一设备的位置和/或所述第二设备的位置进行标记,生成所述第一设备的坐标信息和/或所述第二设备的坐标信息;
或者,接收所述第一设备和/或所述第二设备上报的坐标信息。
根据本发明实施例的另一方面,提供一种控制设备,所述设备包括:
接收单元,用于接收语音指令;
确定单元,用于基于接收所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息;以及基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备,确定为目标设备;
控制单元,用于控制所述目标设备执行所述语音指令。
上述方案中,所述设备还包括:
获取单元,用于基于所述第一设备的坐标信息,确定所述第一设备只有一个时,获取所述第一设备中至少两个麦克风接收所述语音指令所产生的音频特征数据;还用于根据所述至少两个麦克风对应的所述音频特征数据的比较结果,获取所述至少两个麦克风中至少一个麦克风的朝向信息;还用于基于所述至少一个麦克风的朝向信息所确定的所述发音源的发音方向信息,获取所述发音源所在方向内所有第二设备的坐标信息;
比较单元,用于将所述至少两个麦克风对应的音频特征数据进行比较;
所述确定单元,具体用于根据比较结果,将指令接收时间最短和/或声波频率最强的音频特征数据对应的麦克风为所述至少一个麦克风;还用于将所述至少一个麦克风的所述朝向信息确定为所述发音源的发音方向信息;还用于基于所述第一设备的坐标信息和所述所有第二设备的坐标信息,确定所述发音源的位置信息;
或者,所述获取单元,用于基于所述第一设备的坐标信息,确定所述第一设备具有至少两个时,获取每个所述第一设备中至少一个麦克风接收所述语音指令所产生的音频特征数据;
所述确定单元,还用于基于所述至少两个第一设备对应的所述音频特征数据,确定所述至少两个第一设备之间的音频特征差;还用于基于所述音频特征差,确定每个所述第一设备到所述发音源的距离;还用于基于每个所述第一设备到所述发音源的距离,确定所述发音源的发音方位信息。
上述方案中,所述确定单元,具体还用于基于所述发音源的位置信息和每个所述第二设备的坐标信息,确定距离所述发音源最近的第二设备;还用于将距离所述发音源最近的所述第二设备确定为所述目标设备;
或者,所述确定单元,具体还用于基于所述发音源的位置信息和每个所述第一设备的坐标信息,确定距离所述发音源最近的第一设备;还用于将距离所述发音源最近的所述第一设备所在区域内与所述目标设备信息相匹配的第二设备确定为所述目标设备。
根据本发明实施例的第三方面,提供一种控制设备,所述设备包括:存储器和处理器;
其中,所述存储器,用于存储能够在所述处理器上运行的计算机程序;
所述处理器,用于运行所述计算机程序时,执行上述设备的控制方法中任一项所述方法的步骤。
根据本发明实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现上述设备的控制方法中任一项所述方法的步骤。
本发明实施例提供的一种设备的控制方法、控制设备及存储介质,通过接收语音指令;基于接收所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息;基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备,确定为目标设备;控制所述目标设备执行所述语音指令。如此,能够通过识别发音源的发音位置来确定待控制的目标设备,用户无需记住每个设备的所在位置和详细的设备信息就可以实现对目标设备的控制,简化了用户与智能家电之间的交互流程,提高了用户的使用体验。
附图说明
图1为本发明实施例中设备的控制方法的流程示意图;
图2为本发明实施例中基于发音源方位确定待控制设备的示意图;
图3为本发明实施例中通过三角定位方法确定待控设备的示意图;
图4为本发明实施例中基于音箱所在位置确定待控制设备的示意图;
图5为本发明实施例中控制设备的结构组成示意图一;
图6为本发明实施例中控制设备的结构组成示意图二。
具体实施方式
下面结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
图1为本发明实施例中设备的控制方法的流程示意图;如图1所示,所述方法包括:
步骤101,接收语音指令;
这里,所述方法主要应用于具有音频接收功能的电子设备(以下称第一设备),例如:该第一设备可以是智能音箱、智能手机或智能床等设备。在用户向第一设备发送语音指令时,该第一设备中的麦克风能够接收到该语音指令。例如,该语音指令可以是“开灯”、“关空调”、“开电视”等指令。
步骤102,基于接收所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息;
本发明实施例中,该第一设备的坐标信息具体可以通过在电子户型图上对第一设备的位置进行标记所生成。这是因为在电子户型图上具有每个房间的尺寸信息、位置信息和朝向信息,而通过在电子户型图中对第一设备的位置进行标记,能够准确地获取到第一设备的坐标信息。
当第一设备基于该第一设备的坐标信息确定该第一设备只有一个时,该第一设备中可以安装有多个麦克风,且多个麦克风的位置不同且朝向也不同。当用户向第一设备发送语音指令时,该第一设备中的每个麦克风都能接收到该语音指令,并且在接收到该语音指令时会产生音频特征数据。这里,该音频特征数据包括声波频率、音频强度、指令接收时等数据。由于每个麦克风的位置不同且朝向也不同,因此,每个麦克风产生的音频特征数据不同。
然后,将每个麦克风对应的音频特征数据进行比较得到比较结果,并将比较结果中指令接收时间最短和/或声波频率最强的音频特征数据对应的麦克风确定为目标麦克风。接着,再获取该目标麦克风的朝向信息,并将该朝向信息确定为发音源的发音方向信息。这里,每个麦克风的朝向信息也可以通过在电子户型图中对每个麦克风的朝向进行标记所生成。
当第一设备根据发音方向信息确定发音源对应的发音方向后,还可以基于该发音源的发音方向信息,获取该发音源所在方向内各第二设备的坐标信息,并基于第一设备的坐标信息和各第二设备的坐标信息,确定该发音源的具体位置。
这里,该第二设备的坐标信息也可以通过在电子户型图上对每个第二设备的位置进行标记所生成,例如,该第二设备可以是灯、空调、洗衣机等家用电器。当第二设备是移动设备(例如吸尘器)时,该第二设备的坐标信息还可以通过第二设备主动上报自身的坐标信息来得到。
例如,在第一设备中安装有三个麦克风,当用户向第一设备发出语音指令“开灯”时,第一设备中的三个麦克风均能够接收到该语音指令“开灯”,由于每个麦克风在第一设备上的朝向不同、位置不同,因此,每个麦克风获取到该语音指令的时间不同、音频强度也不同。通过对每个麦克风接收该语音指令“开灯”所产生的指令接收时间和/或音频强度值进行比较,确定出三个麦克风中的第一麦克风的指令接收时间最短和/或声波频率最强,则可以将第一麦克风确定为目标麦克风;然后,通过获取该第一麦克风的朝向标记信息,确定该第一麦克风的朝向是“南”,从而可以确定发音源的发音方向也是“南”,则由第一设备基于发音源的发音方向信息,获取发音源所在方向内所有第二设备的坐标信息,或者是获取第一麦克风所朝方向内所有第二设备的坐标信息。待获取到第二设备的坐标信息后,基于第一设备的坐标信息和第二设备的坐标信息,确定发音源的位置。
例如,基于第一设备的坐标信息确定第一设备的位置在主卧室,而第一设备中目标麦克风的朝向信息是指向次卧室的方向“南”,则可以确定发音源的发音方向是“南”,并获取南面所有第二设备的坐标信息。当基于第二设备的坐标信息确定所有第二设备的位置均在次卧室时,可以确定出发音源当前所处位置是“次卧室”。
当第一设备基于该第一设备的坐标信息确定该第一设备具有三个时,三个第一设备可以被分别放置在电子户型图对应的不同房间区域内,也可以放置在电子户型图对应的同一房区域内。然后,通过获取每个第一设备中至少一个麦克风接收语音指令所产生的音频特征数据来确定发音源的位置信息。
这里,所述至少一个麦克风可以是每个第一设备中指令接收时间最短,音频强度最强的麦克风。具体确定该至少一个麦克风的方法可以参考上述针对一个第一设备时确定目标麦克风的方法,这里不再赘述。
当第一设备获取到每个第一设备中至少一个麦克风接收语音指令所产生的音频特征数据后,可以基于每个第一设备对应的音频特征数据,计算每个第一设备之间的音频特征差。然后,基于该音频特征差确定至少三个第一设备到发音源的距离,再基于每个第一设备的坐标信息,通过三角定位算法对每个第一设备到发音源的距离进行计算,从而得到发音源的发音位置。
这里,该音频特征差包括:声波频率差、音频强度差、指令接收时间差等数据。
例如,当该音频特征差是指令接收时间差时,可以通过下列公式:
和/>分别计算第一设备A到发音源的距离S1、第一设备B到发音源的距离S2、第一设备C到发音源的距离S3。其中,V表示声速,T1-T2表示第一设备A与第一设备B之间的指令接收时间差、T1-T3表示第一设备A与第一设备C之间的指令接收时间差、T2-T3表示第一设备B与第一设备C之间的指令接收时间差。
当得到每个第一设备到发音源的距离后,再基于每个第一设备的坐标信息,通过三角定位算法计算发音源的精确位置。
步骤103,基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备确定为目标设备;
本发明实施例中,当第一设备接收到语音指令时,还可以通过对该语音指令进行语义解析,得到该语音指令中携带的目标设备信息,例如该目标设备信息是“灯”。
当第一设备得到发音源的位置信息后,可以基于发音源的位置信息和每个第二设备的坐标信息,确定距离发音源最近、且与目标信息相匹配的第二设备,并将距离发音源最近、且与目标信息相匹配的第二设备确定为目标设备(如图2、图3所示)。
步骤104,控制所述目标设备执行所述语音指令。
图2为本发明实施例中基于发音源方位确定待控制设备的示意图;
如图2所示,该电子户型图中包括四个灯,分别是灯1、灯2、灯3和灯4,其中,灯1、灯2、灯3和灯4分别位于不同的房间区域内,且灯1、灯2、灯3和灯4都在该电子户型图中有对应的坐标值。第一设备(智能音箱)5位于电子户型图中的位置A,且也在该电子户型图中有对应的坐标值,当第一设备5接收到用户发送的语音指令,并对该语音指令进行分词处理后,得到目标设备信息是“灯”。然后基于第一设备5的坐标值,确定发音源的位置处于位置B时,可以基于灯1、灯2、灯3和灯4分别在电子户型图中的坐标值和发音源的位置信息,确定灯1是距离用户最近、且与目标设备信息相匹配的待控设备,则控制灯1执行该语音指令。
图3为本发明实施例中通过多个音箱确定待控设备的示意图;
如图3所示,该电子户型图中包括四个灯,分别是灯1、灯2、灯3和灯4,其中,灯1、灯2、灯3和灯4分别位于不同的房间区域内,且灯1、灯2、灯3和灯4都在该电子户型图中有对应的坐标值。第一设备(智能音箱)5具有三个,三个第一设备5位于同一房间(客厅)内,且每个第一设备5在该电子户型图中也有对应的坐标值。当用户在客厅发出语音指令“开灯”时,三个第一设备5都能接收到该语音指令“开灯”,然后基于三个第一设备5对应的坐标值、以及指令接收时间差,利用三角定位算法能够计算出用户当前的位置处于位置A,然后,再基于用户的位置A的坐标值和每盏灯的坐标值,确定出灯1距离用户的位置A最近,则控制灯1执行该语音指令“开灯”。
本发明实施例中,还可以基于发音源的位置信息和每个第一设备的坐标信息,确定距离发音源最近的第一设备;然后,将距离发音源最近的第一设备所在区域内、与目标设备信息相匹配的第二设备确定为目标设备(如图4所示)。
图4为本发明实施例中基于音箱所在位置确定待控制设备的示意图;
如图4所示,该电子户型图中包括四个灯,分别是灯1、灯2、灯3和灯4,其中,灯1、灯2、灯3和灯4分别位于不同的房间区域内,且灯1、灯2、灯3和灯4都在该电子户型图中有对应的坐标值。第一设备(智能音箱)5具有四个,分别是第一设备401、第一设备402、第一设备403和第一设备404,且每个第一设备均位于不同的房间区域内,且每个第一设备在该电子户型图中也有对应的坐标值。当用户向第一设备发送语音指令时,第一设备401、第一设备402、第一设备403和第一设备404都能够接收到该语音指令,通过每个第一设备的指令接收时间确定用户当前处于位置A时,可以通过每个第一设备的坐标信息和用户的位置信息,确定出第一设备404距离用户最近,则将第一设备404所在区域内、且与目标设备信息相匹配的灯4确定为待控设备,并控制灯4执行该语音指令。
本发明实施例提供的设备的控制方法,通过智能音箱接收用户发出的语音指令,基于接收所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息;基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备确定为目标设备;控制所述目标设备执行所述语音指令。如此,通过识别发音源的发音位置来确定待控制的目标设备,用户无需记住每个设备的所在位置和详细的设备信息就可以实现对目标设备的控制,简化了用户与智能家电之间的交互流程,提高了用户的使用体验。
图5为本发明实施例中控制设备的结构组成示意图,如图5所示,所述设备包括:
接收单元501,用于接收语音指令;
确定单元502,用于基于接收所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息;以及基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备,确定为目标设备;
控制单元503,用于控制所述目标设备执行所述语音指令。
本发明实施例中,该装置可以是智能音箱、智能手机等具有麦克风功能的设备。
本发明实施例中,所述设备还包括:
获取单元504,用于基于所述第一设备的坐标信息,确定所述第一设备只有一个时,获取所述第一设备中至少两个麦克风接收所述语音指令所产生的音频特征数据;还用于根据所述至少两个麦克风对应的所述音频特征数据的比较结果,获取所述至少两个麦克风中至少一个麦克风的朝向信息;还用于基于所述至少一个麦克风的朝向信息所确定的所述发音源的发音方向信息,获取所述发音源所在方向内所有第二设备的坐标信息;
比较单元505,用于将所述至少两个麦克风对应的音频特征数据进行比较;
所述确定单元502,具体用于根据比较结果,将指令接收时间最短和/或声波频率最强的音频特征数据对应的麦克风为所述至少一个麦克风;还用于将所述至少一个麦克风的所述朝向信息确定为所述发音源的发音方向信息;还用于基于所述第一设备的坐标信息和所述所有第二设备的坐标信息,确定所述发音源的位置信息;
或者,所述获取单元504,用于基于所述第一设备的坐标信息,确定所述第一设备具有至少两个时,获取每个所述第一设备中至少一个麦克风接收所述语音指令所产生的音频特征数据;
所述确定单元502,还用于基于所述至少两个第一设备对应的所述音频特征数据,确定所述至少两个第一设备之间的音频特征差;还用于基于所述音频特征差,确定每个所述第一设备到所述发音源的距离;还用于基于每个所述第一设备到所述发音源的距离,确定所述发音源的发音方位信息。
本发明实施例中,所述确定单元502,具体还用于基于所述发音源的位置信息和每个所述第二设备的坐标信息,确定距离所述发音源最近的第二设备;还用于将距离所述发音源最近的所述第二设备确定为所述目标设备;
或者,所述确定单元502,具体还用于基于所述发音源的位置信息和每个所述第一设备的坐标信息,确定距离所述发音源最近的第一设备;还用于将距离所述发音源最近的所述第一设备所在区域内与所述目标设备信息相匹配的第二设备确定为所述目标设备。
需要说明的是:上述实施例提供的控制设备在对其他设备进行控制时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将控制设备的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的控制设备与设备的控制方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图6为本发明实施例中控制设备的结构组成示意图二,控制设备600可以是移动电话、计算机、数字广播终端、信息收发设备、游戏控制台、平板设备、个人数字助理、信息推送服务器、内容服务器等。图6所示的控制设备600包括:至少一个处理器601、存储器602、至少一个网络接口604和用户接口603。控制设备600中的各个组件通过总线系统605耦合在一起。可理解,总线系统605用于实现这些组件之间的连接通信。总线系统605除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图6中将各种总线都标为总线系统605。
其中,用户接口603可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。
可以理解,存储器602可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储器302旨在包括但不限于这些和任意其它适合类型的存储器。
本发明实施例中的存储器602用于存储各种类型的数据以支持控制设备600的操作。这些数据的示例包括:用于在控制设备600上操作的任何计算机程序,如操作系统6021和应用程序6022。其中,操作系统6021包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序6022可以包含各种应用程序,例如媒体播放器(MediaPlayer)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序6022中。
上述本发明实施例揭示的方法可以应用于处理器601中,或者由处理器601实现。处理器601可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器601中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器601可以是通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器601可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器602,处理器601读取存储器602中的信息,结合其硬件完成前述方法的步骤。
在示例性实施例中,控制设备600可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,ProgrammableLogic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)、通用处理器、控制器、微控制器(MCU,Micro Controller Unit)、微处理器(Microprocessor)、或其他电子元件实现,用于执行前述方法。
具体所述处理器601运行所述计算机程序时,执行:接收语音指令;基于接收所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息;基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备确定为目标设备;控制所述目标设备执行所述语音指令。
具体所述处理器601运行所述计算机程序时,还执行:基于所述第一设备的坐标信息,确定所述第一设备只有一个时,获取所述第一设备中至少两个麦克风接收所述语音指令所产生的音频特征数据;将每个所述麦克风对应的音频特征数据进行比较;根据比较结果,将指令接收时间最短和/或声波频率最强的音频特征数据对应的麦克风确定为目标麦克风;获取所述目标麦克风的朝向信息;将所述朝向信息确定为所述发音源的发音方向信息;基于所述发音方向信息,获取所述发音源所在方向内所有第二设备的坐标信息;基于所述第一设备的坐标信息和所有所述第二设备的坐标信息,确定所述发音源的位置信息。
具体所述处理器601运行所述计算机程序时,还执行:基于所述发音源的位置信息和每个所述第二设备的坐标信息,确定距离所述发音源最近、且与所述目标设备信息相匹配的第二设备;将距离所述发音源最近、且与所述目标设备信息相匹配的所述第二设备确定为所述目标设备。
具体所述处理器601运行所述计算机程序时,还执行:基于所述第一设备的坐标信息,确定所述第一设备具有至少三个时,获取每个所述第一设备中至少一个麦克风接收所述语音指令所产生的音频特征数据;基于至少三个所述第一设备对应的所述音频特征数据,确定至少三个所述第一设备之间的音频特征差;基于所述音频特征差,确定每个所述第一设备到所述发音源的距离;基于每个所述第一设备到所述发音源的距离,确定所述发音源的发音方位信息。
具体所述处理器601运行所述计算机程序时,还执行:基于所述发音源的位置信息和每个所述第一设备的坐标信息,确定距离所述发音源最近的第一设备;将距离所述发音源最近的所述第一设备所在区域内、与所述目标设备信息相匹配的第二设备确定为所述目标设备。
具体所述处理器601运行所述计算机程序时,还执行:在电子户型图中分别对所述第一设备的位置和/或所述第二设备的位置进行标记,生成所述第一设备的坐标信息和/或所述第二设备的坐标信息;或者,接收所述第二设备上报的坐标信息。
在示例性实施例中,本发明实施例还提供了一种计算机可读存储介质,例如包括计算机程序的存储器602,上述计算机程序可由控制设备600的处理器601执行,以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备,如移动电话、计算机、平板设备、个人数字助理等。
一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器运行时,执行:接收语音指令;基于接收所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息;基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备确定为目标设备;控制所述目标设备执行所述语音指令。
该计算机程序被处理器运行时,还执行:基于所述第一设备的坐标信息,确定所述第一设备只有一个时,获取所述第一设备中至少两个麦克风接收所述语音指令所产生的音频特征数据;将每个所述麦克风对应的音频特征数据进行比较;根据比较结果,将指令接收时间最短和/或声波频率最强的音频特征数据对应的麦克风确定为目标麦克风;获取所述目标麦克风的朝向信息;将所述朝向信息确定为所述发音源的发音方向信息;基于所述发音方向信息,获取所述发音源所在方向内所有第二设备的坐标信息;基于所述第一设备的坐标信息和所有所述第二设备的坐标信息,确定所述发音源的位置信息。
该计算机程序被处理器运行时,还执行:基于所述发音源的位置信息和每个所述第二设备的坐标信息,确定距离所述发音源最近、且与所述目标设备信息相匹配的第二设备;将距离所述发音源最近、且与所述目标设备信息相匹配的所述第二设备确定为所述目标设备。
该计算机程序被处理器运行时,还执行:基于所述第一设备的坐标信息,确定所述第一设备具有至少三个时,获取每个所述第一设备中至少一个麦克风接收所述语音指令所产生的音频特征数据;基于至少三个所述第一设备对应的所述音频特征数据,确定至少三个所述第一设备之间的音频特征差;基于所述音频特征差,确定每个所述第一设备到所述发音源的距离;基于每个所述第一设备到所述发音源的距离,确定所述发音源的发音方位信息。
该计算机程序被处理器运行时,还执行:基于所述发音源的位置信息和每个所述第一设备的坐标信息,确定距离所述发音源最近的第一设备;将距离所述发音源最近的所述第一设备所在区域内、与所述目标设备信息相匹配的第二设备确定为所述目标设备。
该计算机程序被处理器运行时,还执行:在电子户型图中分别对所述第一设备的位置和/或所述第二设备的位置进行标记,生成所述第一设备的坐标信息和/或所述第二设备的坐标信息;或者,接收所述第二设备上报的坐标信息。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。

Claims (7)

1.一种设备的控制方法,其特征在于,所述方法包括:
接收语音指令;
基于接收所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息;
基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备确定为目标设备;
控制所述目标设备执行所述语音指令;其中,
所述基于接收与所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息,包括:
基于所述第一设备的坐标信息,确定所述第一设备只有一个时,获取所述第一设备中至少两个麦克风接收所述语音指令所产生的音频特征数据;
将每个所述麦克风对应的音频特征数据进行比较得到比较结果;
根据比较结果,将指令接收时间最短和/或声波频率最强的音频特征数据对应的麦克风确定为目标麦克风;
获取所述目标麦克风的朝向信息;
将所述朝向信息确定为所述发音源的发音方向信息;
基于所述发音方向信息,获取所述发音源所在方向内所有第二设备的坐标信息;
当基于所有所述第二设备的坐标信息确定所有第二设备处在同一个区域时,确定所述发音源的位置为所述区域。
2.根据权利要求1所述的方法,所述基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备,确定为目标设备,包括:
基于所述发音源的位置信息和每个所述第二设备的坐标信息,确定距离所述发音源最近、且与所述目标设备信息相匹配的第二设备;
将距离所述发音源最近、且与所述目标设备信息相匹配的所述第二设备确定为所述目标设备。
3.根据权利要求1所述的方法,其特征在于,在接收所述语音指令之前,所述方法还包括:
在电子户型图中分别对所述第一设备的位置和/或所述第二设备的位置进行标记,生成所述第一设备的坐标信息和/或所述第二设备的坐标信息;
或者,接收所述第二设备上报的坐标信息。
4.一种控制设备,其特征在于,所述设备包括:
接收单元,用于接收语音指令;
确定单元,用于基于接收所述语音指令的第一设备的坐标信息,确定与所述语音指令对应的发音源的发音方位信息;以及基于所述发音方位信息,将所述发音源所在方位内与所述语音指令中携带的目标设备信息相匹配的第二设备,确定为目标设备;
控制单元,用于控制所述目标设备执行所述语音指令;其中,
所述设备还包括:
获取单元,用于基于所述第一设备的坐标信息,确定所述第一设备只有一个时,获取所述第一设备中至少两个麦克风接收所述语音指令所产生的音频特征数据;还用于根据所述至少两个麦克风对应的所述音频特征数据的比较结果,获取所述至少两个麦克风中至少一个麦克风的朝向信息;还用于基于所述至少一个麦克风的朝向信息所确定的所述发音源的发音方向信息,获取所述发音源所在方向内所有第二设备的坐标信息;
比较单元,用于将所述至少两个麦克风对应的音频特征数据进行比较;
所述确定单元,具体用于根据比较结果,将指令接收时间最短和/或声波频率最强的音频特征数据对应的麦克风为所述至少一个麦克风;还用于将所述至少一个麦克风的所述朝向信息确定为所述发音源的发音方向信息;还用于当基于所述所有第二设备的坐标信息确定所有第二设备处在同一个区域时,确定所述发音源的位置为所述区域。
5.根据权利要求4所述的设备,其特征在于,
所述确定单元,具体还用于基于所述发音源的位置信息和每个所述第二设备的坐标信息,确定距离所述发音源最近的第二设备;还用于将距离所述发音源最近的所述第二设备确定为所述目标设备;
或者,所述确定单元,具体还用于基于所述发音源的位置信息和每个所述第一设备的坐标信息,确定距离所述发音源最近的第一设备;还用于将距离所述发音源最近的所述第一设备所在区域内与所述目标设备信息相匹配的第二设备确定为所述目标设备。
6.一种控制设备,其特征在于,所述设备包括:存储器和处理器;
其中,所述存储器,用于存储能够在所述处理器上运行的计算机程序;
所述处理器,用于运行所述计算机程序时,执行权利要求1至3任一项所述方法的步骤。
7.一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现权利要求1至3任一项所述方法的步骤。
CN201910319499.5A 2019-04-19 2019-04-19 一种设备的控制方法、控制设备及存储介质 Active CN111833862B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910319499.5A CN111833862B (zh) 2019-04-19 2019-04-19 一种设备的控制方法、控制设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910319499.5A CN111833862B (zh) 2019-04-19 2019-04-19 一种设备的控制方法、控制设备及存储介质

Publications (2)

Publication Number Publication Date
CN111833862A CN111833862A (zh) 2020-10-27
CN111833862B true CN111833862B (zh) 2023-10-20

Family

ID=72911682

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910319499.5A Active CN111833862B (zh) 2019-04-19 2019-04-19 一种设备的控制方法、控制设备及存储介质

Country Status (1)

Country Link
CN (1) CN111833862B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11646024B2 (en) * 2021-05-10 2023-05-09 International Business Machines Corporation Creating a virtual context for a voice command
WO2023284562A1 (zh) * 2021-07-14 2023-01-19 海信视像科技股份有限公司 控制设备、家电设备以及控制方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107123421A (zh) * 2017-04-11 2017-09-01 广东美的制冷设备有限公司 语音控制方法、装置及家电设备
CN107516526A (zh) * 2017-08-25 2017-12-26 百度在线网络技术(北京)有限公司 一种声源跟踪定位方法、装置、设备和计算机可读存储介质
CN107528753A (zh) * 2017-08-16 2017-12-29 捷开通讯(深圳)有限公司 智能家居语音控制方法、智能设备及具有存储功能的装置
CN107705785A (zh) * 2017-08-01 2018-02-16 百度在线网络技术(北京)有限公司 智能音箱的声源定位方法、智能音箱及计算机可读介质
WO2018032930A1 (zh) * 2016-08-15 2018-02-22 歌尔股份有限公司 一种智能设备的语音交互控制方法和装置
CN108320742A (zh) * 2018-01-31 2018-07-24 广东美的制冷设备有限公司 语音交互方法、智能设备及存储介质
JP2018194810A (ja) * 2017-05-15 2018-12-06 ネイバー コーポレーションNAVER Corporation デバイス制御方法及び電子機器
CN108962263A (zh) * 2018-06-04 2018-12-07 百度在线网络技术(北京)有限公司 一种智能设备控制方法及系统
CN109462794A (zh) * 2018-12-11 2019-03-12 Oppo广东移动通信有限公司 智能音箱及用于智能音箱的语音交互方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018032930A1 (zh) * 2016-08-15 2018-02-22 歌尔股份有限公司 一种智能设备的语音交互控制方法和装置
CN107123421A (zh) * 2017-04-11 2017-09-01 广东美的制冷设备有限公司 语音控制方法、装置及家电设备
JP2018194810A (ja) * 2017-05-15 2018-12-06 ネイバー コーポレーションNAVER Corporation デバイス制御方法及び電子機器
CN107705785A (zh) * 2017-08-01 2018-02-16 百度在线网络技术(北京)有限公司 智能音箱的声源定位方法、智能音箱及计算机可读介质
CN107528753A (zh) * 2017-08-16 2017-12-29 捷开通讯(深圳)有限公司 智能家居语音控制方法、智能设备及具有存储功能的装置
CN107516526A (zh) * 2017-08-25 2017-12-26 百度在线网络技术(北京)有限公司 一种声源跟踪定位方法、装置、设备和计算机可读存储介质
CN108320742A (zh) * 2018-01-31 2018-07-24 广东美的制冷设备有限公司 语音交互方法、智能设备及存储介质
CN108962263A (zh) * 2018-06-04 2018-12-07 百度在线网络技术(北京)有限公司 一种智能设备控制方法及系统
CN109462794A (zh) * 2018-12-11 2019-03-12 Oppo广东移动通信有限公司 智能音箱及用于智能音箱的语音交互方法

Also Published As

Publication number Publication date
CN111833862A (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
CN107644642B (zh) 语义识别方法、装置、存储介质及电子设备
CN109597022B (zh) 声源方位角运算、定位目标音频的方法、装置和设备
JP6731894B2 (ja) デバイス制御方法及び電子機器
US9953634B1 (en) Passive training for automatic speech recognition
CN109164414A (zh) 基于麦克风阵列的定位方法、装置和存储介质
CN109308908B (zh) 一种语音交互方法及装置
CN108469966A (zh) 语音播报控制方法、装置、智能设备及介质
CN111833862B (zh) 一种设备的控制方法、控制设备及存储介质
US9984563B2 (en) Method and device for controlling subordinate electronic device or supporting control of subordinate electronic device by learning IR signal
WO2020088153A1 (zh) 语音处理方法、装置、存储介质和电子设备
US20200265843A1 (en) Speech broadcast method, device and terminal
CN205754811U (zh) 移动终端及其音频处理系统
CN113168227A (zh) 执行电子装置的功能的方法以及使用该方法的电子装置
WO2020048431A1 (zh) 一种语音处理方法、电子设备和显示设备
KR102512614B1 (ko) 오디오 개선을 지원하는 전자 장치 및 이를 위한 방법
CN107197090B (zh) 一种语音信号的接收方法及移动终端
US20200084574A1 (en) Electronic device and method for identifying location by electronic device
US11636867B2 (en) Electronic device supporting improved speech recognition
CN113053368A (zh) 语音增强方法、电子设备和存储介质
CN110473542B (zh) 语音指令执行功能的唤醒方法、装置及电子设备
US20210383806A1 (en) User input processing method and electronic device supporting same
KR20210001082A (ko) 사용자 발화를 처리하는 전자 장치와 그 동작 방법
CN110647045A (zh) 一种智能家居控制方法及设备、计算机可读存储介质
US11620996B2 (en) Electronic apparatus, and method of controlling to execute function according to voice command thereof
CN109511166B (zh) 一种设备的定位方法及定位装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant