CN112037789A - 设备唤醒方法、装置、存储介质及电子装置 - Google Patents
设备唤醒方法、装置、存储介质及电子装置 Download PDFInfo
- Publication number
- CN112037789A CN112037789A CN202010790818.3A CN202010790818A CN112037789A CN 112037789 A CN112037789 A CN 112037789A CN 202010790818 A CN202010790818 A CN 202010790818A CN 112037789 A CN112037789 A CN 112037789A
- Authority
- CN
- China
- Prior art keywords
- target
- devices
- sound source
- distance value
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000004044 response Effects 0.000 claims abstract description 61
- 238000004590 computer program Methods 0.000 claims description 16
- 230000002618 waking effect Effects 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000004422 calculation algorithm Methods 0.000 description 14
- 230000002860 competitive effect Effects 0.000 description 12
- 230000004807 localization Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000010408 sweeping Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/22—Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明实施例提供了一种设备唤醒方法、装置、存储介质及电子装置,其中,该方法包括:获取至少两个设备与发出目标语音的声源的距离值,其中,所述至少两个设备均处于允许被所述目标语音中包括的目标唤醒词唤醒的状态;基于获取的所述距离值从所述至少两个设备中确定出目标设备;控制所述目标设备执行与所述目标唤醒词对应的第一应答操作。通过本发明,解决了相关技术中存在的分布式竞争响应决策准确率低的问题,有效提高了分布式竞争响应决策的准确率。
Description
技术领域
本发明实施例涉及通信领域,具体而言,涉及一种设备唤醒方法、装置、存储介质及电子装置。
背景技术
随着智能语音交互设备的日益增多,多种品类多台设备语音交互竞争响应的需求也越来越重要。针对同一唤醒词可同时唤醒多个智能设备的场景下,常规的处理方式是利用智能设备唤醒词的唤醒音频的频域能量均峰值大小来判决用于应答的目标智能设备。
在相关技术中,采用唤醒词的唤醒音频在特定频带范围中的能量均峰值大小来判决用于应答的目标智能设备,具有一定抗噪能力。对于不同品类设备,由于设备之间的麦克分阵列拾音的效果存在差异,即使同一品类设备,不同设备之间麦克风也会存在差异,这些均将导致计算得到的能量均峰值打分不可直接用于分布式竞争响应决策。
此外,智能家居环境中对分布式竞争响应存在影响的干扰不仅有低干扰的稳态噪音,还有大量强干扰非稳态噪音,比如智能设备播放的音乐与语音类自噪音等,附近人声的干扰,能量大且不规律。这些干扰与噪声都会对基于唤醒词音频的能量特征打分造成不稳定的影响,从而导致分布式竞争响应决策不准确。
针对相关技术中存在的分布式竞争响应决策准确率低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种设备唤醒方法、装置、存储介质及电子装置,以至少解决相关技术中存在的分布式竞争响应决策准确率低的问题。
根据本发明的一个实施例,提供了一种设备唤醒方法,包括:获取至少两个设备与发出目标语音的声源的距离值,其中,所述至少两个设备均处于允许被所述目标语音中包括的目标唤醒词唤醒的状态;基于获取的所述距离值从所述至少两个设备中确定出目标设备;控制所述目标设备执行与所述目标唤醒词对应的第一应答操作。
根据本发明的另一个实施例,还提供了一种设备唤醒方法,包括:接收到目标语音;确定第一设备与发出所述目标语音的声源的第一距离值;在确定所述目标语音中包括有用于唤醒所述第一设备的目标唤醒词的情况下,将所述距离值发送给控制器,以指示所述控制器在获取到至少两个设备与所述声源的距离值的情况下,基于获取的所述距离值从所述至少两个设备中确定出目标设备,并控制所述目标设备执行与所述目标唤醒词对应的第一应答操作。
根据本发明的另一个实施例,还提供了一种设备唤醒装置,包括:获取模块,用于获取至少两个设备与发出目标语音的声源的距离值,其中,所述至少两个设备均处于允许被所述目标语音中包括的目标唤醒词唤醒的状态;第一确定模块,用于基于获取的所述距离值从所述至少两个设备中确定出目标设备;控制模块,用于控制所述目标设备执行与所述目标唤醒词对应的第一应答操作。
根据本发明的另一个实施例,还提供了一种设备唤醒装置,包括:接收模块,用于接收到目标语音;第二确定模块,用于确定第一设备与发出所述目标语音的声源的第一距离值;发送模块,用于在确定所述目标语音中包括有用于唤醒所述第一设备的目标唤醒词的情况下,将所述距离值发送给控制器,以指示所述控制器在获取到至少两个设备与所述声源的距离值的情况下,基于获取的所述距离值从所述至少两个设备中确定出目标设备,并控制所述目标设备执行与所述目标唤醒词对应的第一应答操作。
根据本发明的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,基于设备与声源的距离来确定响应的设备,由于麦克风的差异以及周围环境噪声对距离的判定影响较小,因此,能够实现准确确定设备与声源之间的距离的目的,从而无需额外校准不同设备之间麦克风的差异,有效避免因基于唤醒词音频能量特征计算受到环境或设备的影响造成打分不准确而竞争响应决策错误的影响,有效解决了相关技术中存在的分布式竞争响应决策准确率低的问题,有效提高了分布式竞争响应决策的准确率。
附图说明
图1是本发明实施例的设备唤醒方法的移动终端的硬件结构框图;
图2是根据本发明实施例的设备唤醒方法的流程图一;
图3是根据本发明实施例的设备唤醒方法的流程图二;
图4是根据本发明实施例的基于声源定位的距离估计算法流程图;
图5是根据本发明实施例的一种基于声源定位距离估计的分布式竞争响应流程图;
图6是根据本发明实施例的另一种基于声源定位距离估计的分布式竞争响应流程图;
图7是根据本发明实施例的设备唤醒装置的结构框图一;
图8是根据本发明实施例的设备唤醒装置的结构框图二。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明的实施例。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
随着智能设备的普及,家庭中可能同时在线多台智能网器终端设备,为了避免对某智能设备唤醒时而所有设备都应答现象,就需要多设备之间进行竞争响应。针对如何实现多设备之间的竞争响应的问题,在本发明实施例中提出了一种基于声源定位的方法来实现测定声源与各网器设备之间的位置差异,从而根据声源与网器设备之间的相对位置来决策由哪一台设备应答响应。下面结合实施例对本发明进行具体说明:
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种设备唤醒方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的设备唤醒方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种设备唤醒方法,图2是根据本发明实施例的设备唤醒方法的流程图一,如图2所示,该流程包括如下步骤:
步骤S202,获取至少两个设备与发出目标语音的声源的距离值,其中,所述至少两个设备均处于允许被所述目标语音中包括的目标唤醒词唤醒的状态;
步骤S204,基于获取的所述距离值从所述至少两个设备中确定出目标设备;
步骤S206,控制所述目标设备执行与所述目标唤醒词对应的第一应答操作。
其中,执行上述操作的可以是控制器,或者是决策模块,或者是具备决策能力的终端,例如,移动终端、计算机终端等,或者还可以其他的具备类似处理能力的处理设备或处理单元等。上述设备可以是智能设备,例如,音响、手机、扫地机器人、空调、灯具、电视等等,上述至少两个设备可以是处于同一区域中的设备,例如,客厅中的智能设备,卧室中的智能设备、厨房中的智能设备、办公室中的智能设备等。下面以控制器执行上述操作为例(仅是一种示例性说明,在实际操作中还可以是其他的设备或模块来执行上述操作)进行说明:
在上述实施例中,控制器所获取到的距离值可以是上述至少两个设备所分别计算出的自身距离声源的距离,此外,上述距离值还可以是由其他的第三方设备来计算得到。控制器在获取上述距离值的同时,还可以一并获取与各距离值一并传输过来的设备标识,控制器在获取到上述距离值之后,可以对接收到的各距离值按照由小到大的顺序进行排序,并基于一定的选择策略根据该排序结果从上述至少两个设备中确定出用于响应唤醒词的目标设备,例如,该选择策略可以是选择距离声源距离最小的设备作为目标设备,还可以是从处于空闲态的设备中选择距离声源距离最小的设备作为目标设备,当然,还可以是其他选择策略,例如,可以根据预先配置的设备响应优先级来选择目标设备,还可以根据用户的使用习惯来选择目标设备。
在上述实施例中,基于设备与声源的距离来确定响应的设备,由于麦克风的差异以及周围环境噪声对距离的判定影响较小,因此,能够实现准确确定设备与声源之间的距离的目的,从而无需额外校准不同设备之间麦克风的差异,有效避免因基于唤醒词音频能量特征计算受到环境或设备的影响造成打分不准确而竞争响应决策错误的影响,有效解决了相关技术中存在的分布式竞争响应决策准确率低的问题,有效提高了分布式竞争响应决策的准确率
在一个可选的实施例中,基于获取的所述距离值从所述至少两个设备中确定出目标设备包括:基于获取的所述距离值从所述至少两个设备中确定出距离所述声源最近的所述目标设备。在本实施例中,可以按照前述的方式先对获取的各个距离值排序(例如,按照由小到大的顺序排序,或者按照由大到小的顺序排序),然后从排序后的距离值中确定出最小的距离值,进而将该最小的距离值所对应的设备确定为目标设备,在本实施例中,可以不考虑各设备的其他状态(例如,是否处于空闲,处于空闲的时间是否超过10min,15min等,响应优先级是否是最高的等等),仅基于设备与声源的距离来确定响应设备即可,简化了确定响应设备的操作,避免出现多个设备同时响应的问题。
在一个可选的实施例中,基于获取的所述距离值从所述至少两个设备中确定出目标设备包括:确定所述至少两个设备中包括的处于空闲态的候选设备;基于获取的所述距离值从所述候选设备中确定出距离所述声源最近的所述目标设备。在本实施例中,除了考虑设备与声源的距离之外,还需要综合考虑设备是否处于空闲态,即,在确定目标设备时,可以将处于空闲态的设备中距离声源最近的设备确定为上述目标设备,从而保证了处于工作状态的设备能够正常工作。此外,在实际应用中,还可以综合设备与声源的距离和其他的设备状态来确定目标设备,例如,将响应优先级较高(例如,响应优先级排在前三位、前五位等)的设备中距离声源最近的设备确定为上述目标设备,此外,还可以综合用户的使用习惯来确定目标设备,例如,将用户最常使用(例如,单日使用频率超过3次,或者每周使用频率超过5次等)的设备中距离声源最近的设备确定为上述目标设备。
在一个可选的实施例中,控制所述目标设备执行与所述目标唤醒词对应的第一应答操作包括:向所述目标设备发送第一指令,其中,所述第一指令用于指示所述目标设备执行与所述目标唤醒词对应的第一应答操作。可选地,在基于获取的所述距离值从所述至少两个设备中确定出目标设备之后,所述方法还包括:向所述至少两个设备中包括的除所述目标设备之外的其他设备发送第二指令,其中,所述第二指令用于指示所述其他设备拒绝执行与所述目标唤醒词对应的第二应答操作。在本实施例中,可以通过发送第一指令和第二指令的方式来实现控制距离声源最近的设备响应,而其他设备不响应的目的,此外,在实际应用中还可以通过预先配置响应规则来实现设备的响应控制,例如,预先配置只有收到第一指令的设备作出响应,未收到该第一指令的设备不做响应。当然,在实际操作中还可以通过其他方式来实现设备的响应控制,例如,通过第三方设备控制设备进行响应。
由前述实施例可知,在本发明中可以通过一个决策设备,例如,上述的控制器来实现分布式竞争响应,下面结合实施例对各设备中的操作进行说明:
在本实施例中还提供了一种设备唤醒方法,图3是根据本发明实施例的设备唤醒方法的流程图二,如图3所示,该流程包括如下步骤:
S302,接收到目标语音;
S304,确定第一设备与发出所述目标语音的声源的第一距离值;
S306,在确定所述目标语音中包括有用于唤醒所述第一设备的目标唤醒词的情况下,将所述距离值发送给控制器,以指示所述控制器在获取到至少两个设备与所述声源的距离值的情况下,基于获取的所述距离值从所述至少两个设备中确定出目标设备,并控制所述目标设备执行与所述目标唤醒词对应的第一应答操作。
其中,执行上述操作的可以是第一设备,其中,该第一设备是上述的至少两个设备中包括的设备,且该第一设备可以是智能设备,例如,音响、手机、扫地机器人、空调、灯具、电视等等。上述第一设备可以是处于特定区域中的智能设备,上述至少两个设备可以是处于同一区域中的设备,例如,客厅中的智能设备,卧室中的智能设备、厨房中的智能设备、办公室中的智能设备等。
上述第一设备可以利用内设的麦克风阵列拾音采集上述目标语音的音频信号,然后经过前端信号处理后再经过内设的声源定位算法算出该第一设备相对于声源的空间位置。下面对第一设备内的处理操作进行说明:
图4是根据本发明实施例的基于声源定位的距离估计算法流程图,其中,该流程包括如下步骤:
S402,采集信号。智能设备(对应于上述的第一设备)麦克风阵列采集声源一段语音信号以及回声通道喇叭播放的回声信号。
S404,语音信号预处理。将采集到的语音信号进行回声消除、去噪等前端信号处理,去除回声、噪声等非声源信号的干扰信号。
S406,声源定位。采用声源定位算法,如2D-MUSIC(Multiple SignalClassification)等算法精确估计声源的方位角与俯仰角。
S408,距离估计。根据声源定位算法估计得到的方位角和俯仰角再采用测向交叉定位算法或垂心定位算法进行声源距离估计,从而得到声源与智能设备之间的距离。
在一个可选的实施例中,确定第一设备与发出所述目标语音的声源的第一距离值包括:判断接收到的目标语音中是否包括有所述目标唤醒词;在确定所述目标语音中包括有所述目标唤醒词的情况下,确定所述第一设备与所述声源的第一距离值。下面结合图5对本实施例进行说明:
图5是根据本发明实施例的一种基于声源定位距离估计的分布式竞争响应流程图,如图5所示,包括如下步骤:
S502,第一设备内的麦克风阵列拾音,其中,该麦克风阵列采集声源信号及回声信号(对应于上述的目标语音);
S504,常规信号处理,即,对麦克风采集的多通道音频信号进行信号处理;
S506,唤醒处理,即,对常规信号处理完的音频信号进行唤醒处理,即判断该音频信号中是否包含能够唤醒第一设备的唤醒词,若唤醒成功转至步骤S508,否则,转至步骤S502;
S508,信号回采,即,如上一步唤醒成功,则从当前时刻往前回采一段时间的麦克风阵列录制的原始音频;
S510,回采信号预处理,即,对回采的信号进行去噪、去回声等信号处理;
S512,声源定位,即,利用声源定位算法,估计声源的方位角与俯仰角;
S514,距离估计,即,利用测向交叉定位发或垂心定位法来估计声源与第一设备间的距离;
S516,分布式决策响应,即,控制器根据接收到的各设备估计的距离进行分布式决策,确定由谁响应。
在一个可选的实施例中,确定第一设备与发出所述目标语音的声源的第一距离值包括:在判断接收到的目标语音中是否包括有所述目标唤醒词的同时,确定所述第一设备与上述声源的第一距离值。下面结合图6对本实施例进行说明:
图6是根据本发明实施例的另一种基于声源定位距离估计的分布式竞争响应流程图,如图6所示,包括如下步骤:
S602,第一设备内的麦克风阵列拾音,其中,该麦克风阵列采集声源信号及回声信号(对应于上述的目标语音);
S604,语音信号处理,即,对麦克风采集的多通道音频信号进行信号处理,可选地,可以对音频信号进行回声消除、去噪、去混响等处理,并将处理完的多通道数据一方面传递给唤醒模块进行唤醒判断处理,另一方面将多通道数据拷贝给声源定位算法模块;
S606,声源定位,即,利用信号处理后的多通道数据估计声源的方位角与俯仰角;
S608,距离估计,即,根据方位角和俯仰角信息,采用测向交叉法或垂心定位法进一步估计声源与设备之间的距离;
S610,唤醒处理,即,对信号处理完的数据流进行唤醒处理,若唤醒不成功则转至步骤S602;若唤醒成功,则将步骤S608估计的距离传递给控制器进行分布式竞争响应判决;
S612,分布式决策响应,即,控制器根据接收到的各设备估计的距离进行分布式决策,确定由谁响应。
由上述实施例可知,在本发明实施例中,可以利用声源定位的算法来估计声源与设备之间的距离,并将此估计距离作为分布式竞争响应的决策依据。此外可选的基于声源定位的距离估计算法模块可以放置在唤醒处理之后,若唤醒成功则回采信号并处理进行声源定位距离估计,最后进行分布式竞争响应判决并响应;也可以将基于声源定位的距离估计算法模块与唤醒处理同时进行,然后根据唤醒状态判断是否进行分布式竞争响应判决并响应。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种设备唤醒装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图7是根据本发明实施例的设备唤醒装置的结构框图一,如图7所示,该装置包括:
获取模块72,用于获取至少两个设备与发出目标语音的声源的距离值,其中,所述至少两个设备均处于允许被所述目标语音中包括的目标唤醒词唤醒的状态;
第一确定模块74,用于基于获取的所述距离值从所述至少两个设备中确定出目标设备;
控制模块76,用于控制所述目标设备执行与所述目标唤醒词对应的第一应答操作。
在一个可选的实施例中,获取模块72可以通过如下方式实现基于获取的所述距离值从所述至少两个设备中确定出目标设备:基于获取的所述距离值从所述至少两个设备中确定出距离所述声源最近的所述目标设备。
在一个可选的实施例中,获取模块72可以通过如下方式实现基于获取的所述距离值从所述至少两个设备中确定出目标设备:确定所述至少两个设备中包括的处于空闲态的候选设备;基于获取的所述距离值从所述候选设备中确定出距离所述声源最近的所述目标设备。
在一个可选的实施例中,控制模块76可以通过如下方式实现控制所述目标设备执行与所述目标唤醒词对应的第一应答操作:向所述目标设备发送第一指令,其中,所述第一指令用于指示所述目标设备执行与所述目标唤醒词对应的第一应答操作。
在一个可选的实施例中,所述装置还用于在基于获取的所述距离值从所述至少两个设备中确定出目标设备之后,向所述至少两个设备中包括的除所述目标设备之外的其他设备发送第二指令,其中,所述第二指令用于指示所述其他设备拒绝执行与所述目标唤醒词对应的第二应答操作。
图8是根据本发明实施例的设备唤醒装置的结构框图二,如图8所示,该装置包括:
接收模块82,用于接收到目标语音;
第二确定模块84,用于确定第一设备与发出所述目标语音的声源的第一距离值;
发送模块86,用于在确定所述目标语音中包括有用于唤醒所述第一设备的目标唤醒词的情况下,将所述距离值发送给控制器,以指示所述控制器在获取到至少两个设备与所述声源的距离值的情况下,基于获取的所述距离值从所述至少两个设备中确定出目标设备,并控制所述目标设备执行与所述目标唤醒词对应的第一应答操作。
在一个可选的实施例中,所述第二确定模块84可以通过如下方式确定第一设备与发出所述目标语音的声源的第一距离值:判断接收到的目标语音中是否包括有所述目标唤醒词;在确定所述目标语音中包括有所述目标唤醒词的情况下,确定所述第一设备与所述声源的第一距离值。
在一个可选的实施例中,所述第二确定模块84可以通过如下方式确定第一设备与发出所述目标语音的声源的第一距离值:在判断接收到的目标语音中是否包括有所述目标唤醒词的同时,确定所述第一设备与上述声源的第一距离值。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
通过本发明提供的多设备之间分布式竞争响应的判断指标,通过麦克风阵列采集信号并处理然后基于声源定位算法估计声源角度进而估计声源的距离,能更准确的确定响应的设备,此外,本发明提出的基于声源定位的距离估计算法能更适应分布式所处环境的变化,能避免设备麦克风差异以及噪声环境波动对能量计算的影响,进而可直接利用声源信息估计距离,并且,本发明提出的基于声源定位的距离估计方法也适用于不同的设备,而不需要额外校准不同设备之间麦克风的差异,可以更简便的实现不同设备之间的分布式竞争响应。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种设备唤醒方法,其特征在于,包括:
获取至少两个设备与发出目标语音的声源的距离值,其中,所述至少两个设备均处于允许被所述目标语音中包括的目标唤醒词唤醒的状态;
基于获取的所述距离值从所述至少两个设备中确定出目标设备;
控制所述目标设备执行与所述目标唤醒词对应的第一应答操作。
2.根据权利要求1所述的方法,其特征在于,基于获取的所述距离值从所述至少两个设备中确定出目标设备包括:
基于获取的所述距离值从所述至少两个设备中确定出距离所述声源最近的所述目标设备。
3.根据权利要求1所述的方法,其特征在于,基于获取的所述距离值从所述至少两个设备中确定出目标设备包括:
确定所述至少两个设备中包括的处于空闲态的候选设备;
基于获取的所述距离值从所述候选设备中确定出距离所述声源最近的所述目标设备。
4.根据权利要求1所述的方法,其特征在于,控制所述目标设备执行与所述目标唤醒词对应的第一应答操作包括:
向所述目标设备发送第一指令,其中,所述第一指令用于指示所述目标设备执行与所述目标唤醒词对应的第一应答操作。
5.根据权利要求1所述的方法,其特征在于,在基于获取的所述距离值从所述至少两个设备中确定出目标设备之后,所述方法还包括:
向所述至少两个设备中包括的除所述目标设备之外的其他设备发送第二指令,其中,所述第二指令用于指示所述其他设备拒绝执行与所述目标唤醒词对应的第二应答操作。
6.一种设备唤醒方法,其特征在于,包括:
接收到目标语音;
确定第一设备与发出所述目标语音的声源的第一距离值;
在确定所述目标语音中包括有用于唤醒所述第一设备的目标唤醒词的情况下,将所述距离值发送给控制器,以指示所述控制器在获取到至少两个设备与所述声源的距离值的情况下,基于获取的所述距离值从所述至少两个设备中确定出目标设备,并控制所述目标设备执行与所述目标唤醒词对应的第一应答操作。
7.根据权利要求6所述的方法,其特征在于,确定第一设备与发出所述目标语音的声源的第一距离值包括:
判断接收到的目标语音中是否包括有所述目标唤醒词;
在确定所述目标语音中包括有所述目标唤醒词的情况下,确定所述第一设备与所述声源的第一距离值。
8.根据权利要求6所述的方法,其特征在于,确定第一设备与发出所述目标语音的声源的第一距离值包括:在判断接收到的目标语音中是否包括有所述目标唤醒词的同时,确定所述第一设备与上述声源的第一距离值。
9.一种设备唤醒装置,其特征在于,包括:
获取模块,用于获取至少两个设备与发出目标语音的声源的距离值,其中,所述至少两个设备均处于允许被所述目标语音中包括的目标唤醒词唤醒的状态;
第一确定模块,用于基于获取的所述距离值从所述至少两个设备中确定出目标设备;
控制模块,用于控制所述目标设备执行与所述目标唤醒词对应的第一应答操作。
10.一种设备唤醒装置,其特征在于,包括:
接收模块,用于接收到目标语音;
第二确定模块,用于确定第一设备与发出所述目标语音的声源的第一距离值;
发送模块,用于在确定所述目标语音中包括有用于唤醒所述第一设备的目标唤醒词的情况下,将所述距离值发送给控制器,以指示所述控制器在获取到至少两个设备与所述声源的距离值的情况下,基于获取的所述距离值从所述至少两个设备中确定出目标设备,并控制所述目标设备执行与所述目标唤醒词对应的第一应答操作。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至5任一项中所述的方法,或者执行权利要求6至8任一项中所述的方法。
12.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至5任一项中所述的方法,或者执行权利要求6至8任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010790818.3A CN112037789A (zh) | 2020-08-07 | 2020-08-07 | 设备唤醒方法、装置、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010790818.3A CN112037789A (zh) | 2020-08-07 | 2020-08-07 | 设备唤醒方法、装置、存储介质及电子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112037789A true CN112037789A (zh) | 2020-12-04 |
Family
ID=73582862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010790818.3A Pending CN112037789A (zh) | 2020-08-07 | 2020-08-07 | 设备唤醒方法、装置、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112037789A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634890A (zh) * | 2020-12-17 | 2021-04-09 | 北京百度网讯科技有限公司 | 用于唤醒播放设备的方法、装置、设备以及存储介质 |
CN112837694A (zh) * | 2021-01-29 | 2021-05-25 | 青岛海尔科技有限公司 | 设备唤醒方法、装置、存储介质及电子装置 |
CN112837686A (zh) * | 2021-01-29 | 2021-05-25 | 青岛海尔科技有限公司 | 唤醒响应操作的执行方法、装置、存储介质及电子装置 |
CN112992140A (zh) * | 2021-02-18 | 2021-06-18 | 珠海格力电器股份有限公司 | 智能设备的控制方法、装置、设备及存储介质 |
CN113241068A (zh) * | 2021-03-26 | 2021-08-10 | 青岛海尔科技有限公司 | 语音信号的响应方法和装置、存储介质及电子装置 |
CN113593548A (zh) * | 2021-06-29 | 2021-11-02 | 青岛海尔科技有限公司 | 智能设备的唤醒方法和装置、存储介质及电子装置 |
CN113992463A (zh) * | 2021-09-10 | 2022-01-28 | 科大讯飞股份有限公司 | 语音交互方法及相关装置、设备、系统和存储介质 |
WO2022179269A1 (zh) * | 2021-02-26 | 2022-09-01 | 华为技术有限公司 | 语音交互的方法与电子设备 |
WO2023221062A1 (zh) * | 2022-05-19 | 2023-11-23 | 北京小米移动软件有限公司 | 电子设备的语音唤醒方法、装置、存储介质及芯片 |
WO2024088046A1 (zh) * | 2022-10-28 | 2024-05-02 | 华为技术有限公司 | 一种设备控制方法及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109391528A (zh) * | 2018-08-31 | 2019-02-26 | 百度在线网络技术(北京)有限公司 | 语音智能设备的唤醒方法、装置、设备及存储介质 |
CN109410943A (zh) * | 2018-12-10 | 2019-03-01 | 珠海格力电器股份有限公司 | 设备的语音控制方法、系统和智能终端 |
CN110322878A (zh) * | 2019-07-01 | 2019-10-11 | 华为技术有限公司 | 一种语音控制方法、电子设备及系统 |
-
2020
- 2020-08-07 CN CN202010790818.3A patent/CN112037789A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109391528A (zh) * | 2018-08-31 | 2019-02-26 | 百度在线网络技术(北京)有限公司 | 语音智能设备的唤醒方法、装置、设备及存储介质 |
CN109410943A (zh) * | 2018-12-10 | 2019-03-01 | 珠海格力电器股份有限公司 | 设备的语音控制方法、系统和智能终端 |
CN110322878A (zh) * | 2019-07-01 | 2019-10-11 | 华为技术有限公司 | 一种语音控制方法、电子设备及系统 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634890B (zh) * | 2020-12-17 | 2023-11-24 | 阿波罗智联(北京)科技有限公司 | 用于唤醒播放设备的方法、装置、设备以及存储介质 |
CN112634890A (zh) * | 2020-12-17 | 2021-04-09 | 北京百度网讯科技有限公司 | 用于唤醒播放设备的方法、装置、设备以及存储介质 |
CN112837694A (zh) * | 2021-01-29 | 2021-05-25 | 青岛海尔科技有限公司 | 设备唤醒方法、装置、存储介质及电子装置 |
CN112837686A (zh) * | 2021-01-29 | 2021-05-25 | 青岛海尔科技有限公司 | 唤醒响应操作的执行方法、装置、存储介质及电子装置 |
CN112837694B (zh) * | 2021-01-29 | 2022-12-06 | 青岛海尔科技有限公司 | 设备唤醒方法、装置、存储介质及电子装置 |
CN112992140A (zh) * | 2021-02-18 | 2021-06-18 | 珠海格力电器股份有限公司 | 智能设备的控制方法、装置、设备及存储介质 |
WO2022179269A1 (zh) * | 2021-02-26 | 2022-09-01 | 华为技术有限公司 | 语音交互的方法与电子设备 |
CN113241068A (zh) * | 2021-03-26 | 2021-08-10 | 青岛海尔科技有限公司 | 语音信号的响应方法和装置、存储介质及电子装置 |
CN113593548A (zh) * | 2021-06-29 | 2021-11-02 | 青岛海尔科技有限公司 | 智能设备的唤醒方法和装置、存储介质及电子装置 |
CN113593548B (zh) * | 2021-06-29 | 2023-12-19 | 青岛海尔科技有限公司 | 智能设备的唤醒方法和装置、存储介质及电子装置 |
CN113992463A (zh) * | 2021-09-10 | 2022-01-28 | 科大讯飞股份有限公司 | 语音交互方法及相关装置、设备、系统和存储介质 |
CN113992463B (zh) * | 2021-09-10 | 2023-05-30 | 科大讯飞股份有限公司 | 语音交互方法及相关装置、设备、系统和存储介质 |
WO2023221062A1 (zh) * | 2022-05-19 | 2023-11-23 | 北京小米移动软件有限公司 | 电子设备的语音唤醒方法、装置、存储介质及芯片 |
WO2024088046A1 (zh) * | 2022-10-28 | 2024-05-02 | 华为技术有限公司 | 一种设备控制方法及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112037789A (zh) | 设备唤醒方法、装置、存储介质及电子装置 | |
CN106898348B (zh) | 一种出声设备的去混响控制方法和装置 | |
EP3340243B1 (en) | Method for performing voice control on device with microphone array, and device thereof | |
CN107591152B (zh) | 基于耳机的语音控制方法、装置及其设备 | |
US10453472B2 (en) | Parameter prediction device and parameter prediction method for acoustic signal processing | |
CN110265052B (zh) | 收音设备的信噪比确定方法、装置、存储介质及电子装置 | |
CN106648527A (zh) | 一种音量控制方法、装置以及播放设备 | |
CN109377991B (zh) | 一种智能设备控制方法及装置 | |
CN104601538A (zh) | 服务器、发话控制方法、发话装置以及发话系统 | |
CN111554317B (zh) | 一种语音播报方法、设备、计算机存储介质及系统 | |
CN110875045A (zh) | 一种语音识别方法、智能设备和智能电视 | |
CN110767225B (zh) | 一种语音交互方法、装置及系统 | |
CN113593548B (zh) | 智能设备的唤醒方法和装置、存储介质及电子装置 | |
CN109448710A (zh) | 语音处理方法及装置、家电设备、存储介质电子装置 | |
CN104217728A (zh) | 一种音频处理方法及电子设备 | |
CN112420051A (zh) | 设备的确定方法、装置及存储介质 | |
CN114203176A (zh) | 智能设备的控制方法、装置、存储介质及电子装置 | |
JP6843701B2 (ja) | 音響信号処理のパラメータ予測装置及びパラメータ予測方法 | |
CN108449492A (zh) | 语音通话数据处理方法、装置、存储介质及移动终端 | |
CN112466305B (zh) | 饮水机的语音控制方法及装置 | |
CN112837694B (zh) | 设备唤醒方法、装置、存储介质及电子装置 | |
CN115410593A (zh) | 音频信道的选择方法、装置、设备及存储介质 | |
CN113889116A (zh) | 语音信息的处理方法和装置、存储介质及电子装置 | |
CN113870879A (zh) | 智能家电麦克风的共享方法、智能家电和可读存储介质 | |
CN110797048B (zh) | 语音信息的获取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |