CN117542356A - 智能设备的语音唤醒方法、存储介质及电子装置 - Google Patents
智能设备的语音唤醒方法、存储介质及电子装置 Download PDFInfo
- Publication number
- CN117542356A CN117542356A CN202210918363.8A CN202210918363A CN117542356A CN 117542356 A CN117542356 A CN 117542356A CN 202210918363 A CN202210918363 A CN 202210918363A CN 117542356 A CN117542356 A CN 117542356A
- Authority
- CN
- China
- Prior art keywords
- intelligent
- wake
- information
- voice wake
- awakened
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000011156 evaluation Methods 0.000 claims description 90
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000002618 waking effect Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Electric Clocks (AREA)
Abstract
本申请提供了一种智能设备的语音唤醒方法、存储介质及电子装置,涉及智能家居/智慧家庭技术领域,该方法包括:在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,每个待唤醒设备的语音唤醒信息用于表示每个待唤醒设备所采集到的使用对象发出的语音唤醒指令;当智能设备集合包含的待唤醒设备的设备数量小于或等于智能设备集合包含的智能设备的设备数量时,根据每个待唤醒设备的语音唤醒信息,从智能设备集合中选取出待唤醒的目标设备;向目标设备发送第一指示信息,以指示目标设备进行唤醒,智能设备集合中除目标设备以外的其他未接收到第一指示信息的智能设备不进行唤醒。
Description
技术领域
本申请涉及通信领域,具体而言,涉及一种智能设备的语音唤醒方法、存储介质及电子装置。
背景技术
相关技术中,对于用户发出的唤醒指令,同一设备组内响应该唤醒指令的智能设备是由云端和智能设备共同决定的:如果预设时间段(例如,300毫秒)内,接收到云端发送的决策结果,组内设备使用云端的决策结果决定是否被唤醒;如果在预设时间段内,没有接收到云端发送的决策结果,组内设备将会自动被唤醒。
但是,当同一设备组存在多个智能设备时,如果在预设时间段内,组内超过两个智能设备没有接收到云端发送的决策结果,则没有接收到云端发送的决策结果的各个智能设备均会自动被唤醒,即,存在一个唤醒指令唤醒两个以上智能设备的情况,降低了设备唤醒的准确性,影响用户的使用体验。
由此可知,相关技术中的智能设备的语音唤醒方法,存在两个及以上的智能设备被用于同一唤醒指令唤醒导致的设备唤醒的准确性的问题。
发明内容
本申请实施例提供一种智能设备的语音唤醒方法、存储介质及电子装置,以至少解决相关技术中的智能设备的语音唤醒方法存在两个及以上的智能设备被用于同一唤醒指令唤醒导致的设备唤醒的准确性的问题。
根据本申请实施例的一个方面,提供了一种智能设备的语音唤醒方法,包括:在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,其中,所述每个待唤醒设备的语音唤醒信息用于表示所述每个待唤醒设备所采集到的、使用对象发出的语音唤醒指令;在所述智能设备集合包含的待唤醒设备的设备数量小于或等于所述智能设备集合包含的智能设备的设备数量的情况下,根据所述每个待唤醒设备的语音唤醒信息,从所述待唤醒设备中选取出待唤醒的目标设备;向所述目标设备发送第一指示信息,其中,所述第一指示信息用于指示所述目标设备进行唤醒,所述智能设备集合中除了所述目标设备以外的其他未接收到所述第一指示信息的智能设备不进行唤醒。
在一个示例性实施例中,所述方法还包括:在接收到所述智能设备集合中的第一智能设备的语音唤醒信息的情况下,确定所述预设时间段,其中,所述预设时间段是以接收到所述第一智能设备的语音唤醒信息的时间为起点的预设时长的时间段,所述第一智能设备的语音唤醒信息为第一个接收到的语音唤醒信息。
在一个示例性实施例中,所述方法还包括:将与目标帐号或者目标帐号组绑定的智能设备中,具有相同的厂商标识的智能设备,确定为一个设备集合,得到所述智能设备集合;或者,将与目标帐号或者目标帐号组绑定的智能设备中,使用相同的唤醒指令的智能设备,确定为一个设备集合,得到所述智能设备集合;或者,将与目标帐号或者目标帐号组绑定的智能设备中,处于相同位置区域的智能设备,确定为一个设备集合,得到所述智能设备集合;或者,响应于接收到的分组指示信息,将与目标帐号或者目标帐号组绑定的智能设备中,所述分组指示信息所指示的智能设备确定为一个设备集合,得到所述智能设备集合。
在一个示例性实施例中,所述在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,包括:在所述预设时间段内,接收到所述智能设备集合中的第二智能设备的语音唤醒信息,其中,所述第二智能设备的语音唤醒信息用于表示所述第二智能设备所采集到的语音唤醒指令;将所述第二智能设备的语音唤醒信息,确定为一个待唤醒设备的语音唤醒信息,其中,所述智能设备集合包括所述第二智能设备。
在一个示例性实施例中,所述方法还包括:在所述预设时间段之后,接收到所述智能设备集合中的第三智能设备发送的语音唤醒信息,其中,所述第三智能设备的语音唤醒信息用于表示所述第三智能设备所采集到的、所述使用对象发出的语音唤醒指令;向所述第三智能设备发送第二指示信息,其中,所述第二指示信息用于指示所述第三智能设备不进行唤醒。
在一个示例性实施例中,在所述接收到所述智能设备集合中的第三智能设备发送的语音唤醒信息之后,所述方法还包括:根据所述第三智能设备的语音唤醒信息,确定所述第三智能设备采集到语音唤醒指令的时间;根据所述第三智能设备采集到语音唤醒指令的时间,确定所述第三智能设备采集到的语音唤醒指令为所述使用对象发出的语音唤醒指令。
在一个示例性实施例中,所述根据所述每个待唤醒设备的语音唤醒信息,从所述智能设备集合中选取出待唤醒的目标设备,包括:在所述每个待唤醒设备的语音唤醒信息为所述每个待唤醒设备采集到的、与所述语音唤醒指令对应的设备评估值的情况下,从所述智能设备集合中,选取出设备评估值最大的待唤醒设备,得到所述目标设备。
在一个示例性实施例中,在所述从所述智能设备集合中,选取出设备评估值最大的待唤醒设备,得到所述目标设备之前,所述方法还包括:在所述每个待唤醒设备上,根据所述每个待唤醒设备采集到的一路语音信号的能量值对所述每个待唤醒设备进行评估,得到所述每个待唤醒设备的第一评估值;在所述每个待唤醒设备上,根据所述每个待唤醒设备与所述使用对象之间的距离对所述每个待唤醒设备进行评估,得到所述每个待唤醒设备的第二评估值;在所述每个待唤醒设备上,对所述每个待唤醒设备的第一评估值和所述每个待唤醒设备的第二评估值进行加权求和,得到所述每个待唤醒设备的设备评估值。
根据本申请实施例的另一个方面,还提供了一种智能设备的语音唤醒装置,包括:第一接收单元,用于在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,其中,所述每个待唤醒设备的语音唤醒信息用于表示所述每个待唤醒设备所采集到的、使用对象发出的语音唤醒指令;选取单元,用于在所述智能设备集合包含的待唤醒设备的设备数量小于或等于所述智能设备集合包含的智能设备的设备数量的情况下,根据所述每个待唤醒设备的语音唤醒信息,从所述智能设备集合中选取出待唤醒的目标设备;第一发送单元,用于向所述目标设备发送第一指示信息,其中,所述第一指示信息用于指示所述目标设备进行唤醒,所述智能设备集合中除了所述目标设备以外的其他未接收到所述第一指示信息的智能设备不进行唤醒。
在一个示例性实施例中,所述装置还包括:第一确定单元,用于在接收到所述智能设备集合中的第一智能设备的语音唤醒信息的情况下,确定所述预设时间段,其中,所述预设时间段是以接收到所述第一智能设备的语音唤醒信息的时间为起点的预设时长的时间段,所述第一智能设备的语音唤醒信息为第一个接收到的语音唤醒信息。
在一个示例性实施例中,所述装置还包括:第二确定单元,用于将与目标帐号或者目标帐号组绑定的智能设备中,具有相同的厂商标识的智能设备,确定为一个设备集合,得到所述智能设备集合;或者,第三确定单元,用于将与目标帐号或者目标帐号组绑定的智能设备中,使用相同的唤醒指令的智能设备,确定为一个设备集合,得到所述智能设备集合;或者,第四确定单元,用于将与目标帐号或者目标帐号组绑定的智能设备中,处于相同位置区域的智能设备,确定为一个设备集合,得到所述智能设备集合;或者,第五确定单元,用于响应于接收到的分组指示信息,将与目标帐号或者目标帐号组绑定的智能设备中,所述分组指示信息所指示的智能设备确定为一个设备集合,得到所述智能设备集合。
在一个示例性实施例中,该第一接收单元包括:接收模块,用于在所述预设时间段内,接收到所述智能设备集合中的第二智能设备的语音唤醒信息,其中,所述第二智能设备的语音唤醒信息用于表示所述第二智能设备所采集到的语音唤醒指令;确定模块,用于将所述第二智能设备的语音唤醒信息,确定为一个待唤醒设备的语音唤醒信息,其中,所述智能设备集合包括所述第二智能设备。
在一个示例性实施例中,该装置还包括:第二接收单元,用于在所述预设时间段之后,接收到所述智能设备集合中的第三智能设备发送的语音唤醒信息,其中,所述第三智能设备的语音唤醒信息用于表示所述第三智能设备所采集到的、所述使用对象发出的语音唤醒指令;第二发送单元,用于向所述第三智能设备发送第二指示信息,其中,所述第二指示信息用于指示所述第三智能设备不进行唤醒。
在一个示例性实施例中,所述装置还包括:第六确定单元,用于在所述接收到所述智能设备集合中的第三智能设备发送的语音唤醒信息之后,根据所述第三智能设备的语音唤醒信息,确定所述第三智能设备采集到语音唤醒指令的时间;第七确定单元,用于根据所述第三智能设备采集到语音唤醒指令的时间,确定所述第三智能设备采集到的语音唤醒指令为所述使用对象发出的语音唤醒指令。
在一个示例性实施例中,所述选取单元包括:选取模块,用于在所述每个待唤醒设备的语音唤醒信息为所述每个待唤醒设备采集到的、与所述语音唤醒指令对应的设备评估值的情况下,从所述智能设备集合中,选取出设备评估值最大的待唤醒设备,得到所述目标设备。
在一个示例性实施例中,所述装置还包括:第一评估单元,用于在所述从所述智能设备集合中,选取出设备评估值最大的待唤醒设备,得到所述目标设备之前,在所述每个待唤醒设备上,根据所述每个待唤醒设备采集到的一路语音信号的能量值对所述每个待唤醒设备进行评估,得到所述每个待唤醒设备的第一评估值;第二评估单元,用于在所述每个待唤醒设备上,根据所述每个待唤醒设备与所述使用对象之间的距离对所述每个待唤醒设备进行评估,得到所述每个待唤醒设备的第二评估值;求和单元,用于在所述每个待唤醒设备上,对所述每个待唤醒设备的第一评估值和所述每个待唤醒设备的第二评估值进行加权求和,得到所述每个待唤醒设备的设备评估值。
根据本申请实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述智能设备的语音唤醒方法。
根据本申请实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的智能设备的语音唤醒方法。
在本申请实施例中,采用从预设时间段内接收到语音唤醒信息的智能设备中选取一个智能设备进行设备唤醒的方式,通过在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,其中,每个待唤醒设备的语音唤醒信息用于表示每个待唤醒设备所采集到的、使用对象发出的语音唤醒指令;在智能设备集合包含的待唤醒设备的设备数量小于或等于智能集合包含的智能设备的设备数量的情况下,根据每个待唤醒设备的语音唤醒信息,从智能设备集合中选取出待唤醒的目标设备;向目标设备发送第一指示信息,其中,第一指示信息用于指示目标设备进行唤醒,智能设备集合中除了目标设备以外的其他未接收到第一指示信息的智能设备不进行唤醒,由于在预设时间段内无论是否接收到一个智能设备集合中所有的智能设备的语音唤醒信息时,均从已接收到语音唤醒信息的所有待唤醒设备中选取出一个待唤醒设备进行唤醒,通过调整设备唤醒的机制,智能设备仅基于服务器的指示进行唤醒,而不会进行设备的本地唤醒,可以实现减少发生两个及以上的智能设备被用于同一唤醒指令唤醒的概率的目的,达到了提升设备唤醒的准确性的技术效果,进而解决了相关技术中的智能设备的语音唤醒方法存在两个及以上的智能设备被用于同一唤醒指令唤醒导致的设备唤醒的准确性的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的一种可选的智能设备的语音唤醒方法的硬件环境的示意图;
图2是根据本申请实施例的一种可选的智能设备的语音唤醒方法的流程示意图;
图3是根据本申请实施例的一种可选的智能设备的语音唤醒方法的示意图;
图4根据本申请实施例的另一种可选的智能设备的语音唤醒方法的流程示意图;
图5是根据本申请实施例的一种可选的智能设备的语音唤醒装置的结构框图;
图6是根据本申请实施例的一种可选的电子装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一个方面,提供了一种智能设备的语音唤醒方法。智能设备的语音唤醒方法广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(Intelligence House)生态等全屋智能数字化控制应用场景。可选地,在本实施例中,上述智能设备的语音唤醒方法可以应用于如图1所示的包含终端102和服务器104的硬件环境中。如图1所示,服务器104通过网络与终端102进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器104提供数据运算服务。
上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:WIFI(Wireless Fidelity,无线保真),蓝牙。终端102可以并不限定于为PC、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
本申请实施例的智能设备的语音唤醒方法可以由服务器104来执行,也可以由终端102来执行,还可以是由服务器104和终端102共同执行。其中,终端102执行本申请实施例的智能设备的语音唤醒方法也可以是由安装在其上的客户端来执行。
以由服务器104来执行本实施例中的智能设备的语音唤醒方法为例,图2是根据本申请实施例的一种可选的智能设备的语音唤醒方法的流程示意图,如图2所示,该方法的流程可以包括以下步骤:
步骤S202,在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,其中,每个待唤醒设备的语音唤醒信息用于表示每个待唤醒设备所采集到的、使用对象发出的语音唤醒指令。
本实施例中的智能设备的语音唤醒方法可以应用到通过语音唤醒指令对智能设备进行语音唤醒的场景中。上述的智能设备可以是位于用户家庭中的智能家居设备,可以为智能电视机、智能冰箱、智能热水器等安装有智能芯片的电子设备,上述智能家居设备相比于传统的家居设备增加了计算模块、网络接口、输入输出装置等,从而使得本实施例中的智能家居设备具有智能分析和智能服务的功能。
在同一区域内可能存在多个可以使用同一语音唤醒指令(例如,唤醒词)唤醒的智能设备,为了避免多个智能设备同时对同一语音唤醒指令进行响应,可以设置包含多个智能设备的设备组,并采用分布式唤醒方案,分布式唤醒方案如下:
智能设备在检测到语音唤醒指令之后被激活,上传本设备的语音唤醒信息(或者说设备特征信息)至云端,并在等待时间段内等待接收云端下发的唤醒决策结果(即,设备是否唤醒,并对语音唤醒指令进行响应);云端可以在一定时间段内收集同一设备组(即,智能设备集合)内的各个智能设备上报的语音唤醒信息,如果收集齐全,则根据组内各个智能设备的语音唤醒信息进行唤醒决策,并正常下发唤醒决策结果,如果收集不全,则不会下发唤醒决策结果;智能设备如果在等待时间段内未接收到云端下发的唤醒决策结果(即,等待超时),则会自行唤醒。
对于上述分布式唤醒方案,如果智能设备等待超时,则存在多个智能设备同时唤醒的情况,从而影响设备唤醒的准确性。为了至少部分解决上述技术问题,可以调整智能设备的分布式唤醒机制,即,智能设备不再进行本地唤醒,服务器服务器仅从预设时间段内接收到语音唤醒信息的组内设备中选择一个组内设备进行唤醒,其他组内设备则不进行唤醒,可以避免出现两个及两个以上的智能设备同时唤醒的情况,提高设备唤醒的准确性。
对于智能设备集合(可以是一个设备组)内的一个智能设备,该智能设备可以通过语音采集部件进行语音信号采集,并对采集到的语音信号进行检测(例如,语音识别),确定是否检测到预设的语音指令。如果检测到语音唤醒指令,则可以基于检测到的语音唤醒指令进行响应处理。这里,语音唤醒指令可以是用于唤醒智能设备的语音交互功能的指令。在检测到语音唤醒指令时,智能设备的语音交互功能可以处于休眠状态(或称待唤醒状态、低功耗状态等)或者已唤醒状态,本实施例中对此不作限定。
智能设备集合中可以包含一个或多个智能设备,即,一个或多个组内设备,智能设备集合中的智能设备可以具有以下至少之一的设备特征:与同一对象绑定,与同一对象之间的距离小于或者等于预设距离,属于同一品牌,使用相同语音唤醒指令,处于相同的位置区域,被绑定到的对象指定为属于同一设备组,还可以具有其他设备特征,本实施例中对此不做限定。
语音唤醒指令可以是由使用对象发出的,上述使用对象可以是与智能设备建立有关联关系的对象,使用对象可以通过对象标识(例如,目标帐号、身份标识等)进行表示,例如,智能设备所绑定到的目标帐号、目标帐号的关联帐号等,也可以是与智能设备位于同一区域内的对象,例如,可以是与智能设备位于同一个房间内的用户。
需要说明的是,使用对象是能够被智能设备所识别的对象,即,对于智能设备而言,语音唤醒指令与使用对象具有对应关系,其可以用于标识发出语音唤醒指令的用户。对于具有身份识别功能的智能设备,使用对象是与识别到的用户身份对应的对象,对于不具备身份识别功能的智能设备,使用对象可以是与智能设备所绑定的对象。
如果检测到语音唤醒指令,智能设备可以获取与语音唤醒指令对应的语音唤醒信息,从而得到智能设备的语音唤醒信息,并将智能设备的语音唤醒信息发送给目标服务器,上述语音唤醒信息用于确定智能设备是否为智能设备所属的智能设备集合中响应语音唤醒指令被唤醒的设备,可以包括但不限于以下至少之一:与目标对象之间的距离;麦克风阵列中的各个麦克风所采集到的、与语音唤醒指令对应的各路语音信号的能量值中的最大能量值;设备评估值(根据与语音唤醒指令对应的语音信号所评估的、用于表示智能设备被选取出对语音唤醒指令进行响应的可能性,例如,打分值);智能设备的设备标识,语音唤醒指令的检测时间等。本实施例中对于语音唤醒信息不做限定。
目标服务器(即,服务器104)可以接收到智能设备集合内的一个或多个智能设备所发送的语音唤醒信息,接收到语音唤醒信息的智能设备为智能设备集合内的待唤醒设备。在接收到第一个智能设备发送的语音唤醒信息之后,目标服务器可以设置等待接收智能设备集合内的其他智能设备的唤醒决策窗口,即,预设时间段,并在预设时间段内,等待接收智能设备集合内的其他智能设备发送的语音唤醒信息。目标服务器在预设时间段内可以接收到智能设备集合中的至少部分智能设备发送的语音唤醒信息。
唤醒决策窗口的起始时刻可以是接收到第一个智能设备的语音唤醒信息的时刻,也可以是其他的时刻,唤醒决策窗口的窗口大小可以是预设大小(例如,300ms),还可以是其他唤醒决策窗口的设置方式,本实施例中对此不做限定。
步骤S204,在智能设备集合包含的待唤醒设备的设备数量小于或等于智能设备集合包含的智能设备的设备数量的情况下,根据每个待唤醒设备的语音唤醒信息,从智能设备集合中选取出待唤醒的目标设备。
智能设备集合,在预设时间段内被目标服务器接收到对应的语音唤醒信息的智能设备的数量可能等于智能设备集合包含的智能设备的设备数量(即,设备总数量),也可能小于智能设备集合包含的智能设备的设备数量。无论是哪种场景,目标服务器均直接基于智能设备集合中的每个待唤醒设备的语音唤醒信息,选取出一个待唤醒设备进行设备唤醒,对于其他已接收到的语音唤醒信息的待唤醒设备和未在预设时间段内接收到语音唤醒信息的待唤醒设备,不进行设备唤醒。
可选地,根据每个待唤醒设备的语音唤醒信息,从智能设备集合中选取出待唤醒的目标设备的过程可以是:先根据每个待唤醒设备的语音唤醒信息,确定每个待唤醒设备所采集到的、语音唤醒指令的能量值,再将所采集到的、语音唤醒指令的能量值最大的待唤醒设备,确定为待唤醒的目标设备;或者,先根据每个待唤醒设备的语音唤醒信息,确定每个待唤醒设备所采集到的、语音唤醒指令的能量值以及与使用对象之间的距离,再根据所采集到的、语音唤醒指令的能量值以及与使用对象之间的距离,确定每个待唤醒设备的设备分数,最后将设备分数最大的待唤醒设备,确定为待唤醒的目标设备。
例如,设备组包含的设备个数为4个,设备A、设备B、设备C和设备D。服务器只接收到了设备A、设备B和设备C发送的语音唤醒信息。设备A所采集到的语音唤醒指令的能量值为3、设备B所采集到的语音唤醒指令的能量值为5、设备C所采集到的语音唤醒指令的能量值为4时,可以将设备B作为待唤醒的设备。
步骤S206,向目标设备发送第一指示信息,其中,第一指示信息用于指示目标设备进行唤醒,智能设备集合中除了目标设备以外的其他未接收到第一指示信息的智能设备不进行唤醒。
在本实施例中,目标服务器在智能设备集合中选取出待唤醒的目标设备之后,可以控制目标设备进行唤醒。控制目标设备进行唤醒的过程可以是:向目标设备发送第一指示信息,以指示目标设备进行唤醒。智能设备集合除了目标设备以外的其他未接收到第一指示信息的智能设备不进行唤醒,从而可以保证仅目标设备进行唤醒,这里的唤醒是指唤醒设备的语音交互功能,对语音唤醒指令进行响应。
可选地,目标服务器还可以向智能设备集合中除了目标设备以外的其他设备发送不进行唤醒的指示信息,以指示其他设备不进行唤醒。此外,对于智能设备集合内除了智能设备集合以外的其他待唤醒设备,也可以向其发送不进行唤醒的指示信息,以指示其他待唤醒设备不进行唤醒。或者,也可以不向智能设备集合内的其他设备发送指示信息,而仅收到指示信息的智能设备允许进行唤醒。
例如,云端可以向设备A、设备B、设备C发送同样的唤醒决策,唤醒决策用于将设备B进行唤醒。设备A以及设备C在接收到唤醒决策之后,可以不将设备进行唤醒(或者,直接不做处理),设备B在接收到唤醒决策之后,可以将设备进行唤醒。
通过上述步骤S202至步骤S206,在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,其中,每个待唤醒设备的语音唤醒信息用于表示每个待唤醒设备所采集到的、使用对象发出的语音唤醒指令;在智能设备集合包含的待唤醒设备的设备数量小于或等于智能设备集合包含的智能设备的设备数量的情况下,根据每个待唤醒设备的语音唤醒信息,从智能设备集合中选取出待唤醒的目标设备;向目标设备发送第一指示信息,其中,第一指示信息用于指示目标设备进行唤醒,智能设备集合中除了目标设备以外的其他未接收到第一指示信息的智能设备不进行唤醒,解决了相关技术中的智能设备的语音唤醒方法存在两个及以上的智能设备被用于同一唤醒指令唤醒导致的设备唤醒的准确性的问题,提高了设备唤醒的准确性。
在一个示例性实施例中,上述方法还包括:
S11,在接收到智能设备集合中的第一智能设备的语音唤醒信息的情况下,确定预设时间段,其中,预设时间段是以接收到第一智能设备的语音唤醒信息的时间为起点的预设时长的时间段,第一智能设备的语音唤醒信息为第一个接收到的语音唤醒信息。
在本实施例中,目标服务器可以根据接收到的待唤醒设备发送的语音唤醒信息,确定预设时间段。可选地,可以在接收到智能设备集合中的第一智能设备的语音唤醒信息之后,确定预设时间段。上述预设时间段是以接收到第一智能设备的语音唤醒信息的时间为起点的预设时长的时间段,第一智能设备的语音唤醒信息为第一个接收到的语音唤醒信息。例如,当服务器接收到第一个语音唤醒信息的时间为E时刻,预设时长为300ms时,则设置的预设时间段为E至E+300ms之间的时间段。
可选地,上述预设时间段还可以是以第一智能设备检测到语音唤醒指令的时刻为起点的预设时长的时间段。例如,当第一智能设备检测到语音唤醒指令的时间为F时刻,预设时长为300ms时,则设置的预设时间段为F至F+300ms之间的时间段。
需要说明的是,上述预设时长可以是预先设定的时长,其可以是系统默认的时长,其可以是一个固定的值,也可以是由对应的对象设定的一个可以更改的值,本实施例中对此不做限定。
通过本实施例,根据第一个接收到的语音唤醒信息的时刻和预设时长确定预设时间段,可以提高预设时间段确定的精准性。
在一个示例性实施例中,目标服务器可以将具有预设关系的智能设备,确定为智能设备集合所包括的智能设备,上述预设关系可以至少包括以下之一:具有相同的厂商标识的智能设备,使用相同的唤醒指令的智能设备,处于相同位置区域的智能设备,分组指示信息所指示的智能设备。
作为一种可选的实施方式,可以将与目标帐号或者目标帐号组绑定的智能设备中,具有相同的厂商标识的智能设备,确定为一个设备集合,得到智能设备集合。可选地,上述目标帐号(或者,目标帐号组)为与使用对象对应的帐号(或者,帐号组)。
可选地,每个待唤醒设备发送的语音唤醒信息中可以携带有用于指示本设备所绑定的目标帐号或者目标帐号组的指示信息,目标服务器在接收到待唤醒设备发送的语音唤醒信息之后,可以根据其携带的上述指示信息,确定目标帐号或者目标帐号组。
作为另一种可选的实施方式,可以将与目标帐号或者目标帐号组绑定的智能设备中,使用相同的唤醒指令(比如,语音唤醒指令)的智能设备,确定为一个设备集合,得到智能设备集合。例如,当设备A、B、C和D使用相同的唤醒词(上述唤醒指令的一种示例)时,可以将设备A、B、C和D所组成的设备集合,确定为智能设备集合。
作为又一种可选的实施方式,可以将与目标帐号或者目标帐号组绑定的智能设备中,处于相同位置区域的智能设备,确定为一个设备集合,得到智能设备集合。例如,当设备A、B、C和D都位于卧室(上述位置区域的一种示例)时,可以将设备A、B、C和D所组成的设备集合,确定为智能设备集合。
作为再一种可选的实施方式,可以响应于接收到的分组指示信息,将与目标帐号或者目标帐号组绑定的智能设备中,分组指示信息所指示的智能设备确定为一个设备集合,得到智能设备集合。例如,当分组指示信息指示的智能设备为设备A、B、C和D时,可以将设备A、B、C和D所组成的设备集合,确定为智能设备集合。
可选地,在目标服务器接收到分组指示信息之前,使用对象可以根据自身的需求,在与目标帐号或者目标帐号组绑定的智能设备中筛选出属于智能设备集合的设备,并生成指示这些智能设备的分组指示信息。
通过本实施例,采用多种方式进行设备集合的配置,可以提高设备集合的配置的灵活性,进而提高用户的使用体验。
在一个示例性实施例中,在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,包括:
S31,在预设时间段内,接收到智能设备集合中的第二智能设备的语音唤醒信息,其中,第二智能设备的语音唤醒信息用于表示第二智能设备所采集到的语音唤醒指令;
S32,将第二智能设备的语音唤醒信息,确定为一个待唤醒设备的语音唤醒信息,其中,智能设备集合包括第二智能设备。
在本实施例中,目标服务器在预设时间段内,可以接收到智能设备集合中的第二智能设备的语音唤醒信息,上述第二智能设备的语音唤醒信息用于表示第二智能设备所采集到的语音唤醒指令。
在接收到第二智能设备的语音唤醒信息之后,由于第二智能设备为智能设备集合内的智能设备,可以将第二智能设备确定为一个待唤醒设备,将第二智能设备的语音唤醒信息,确定为一个待唤醒设备的语音唤醒信息,上述智能设备集合包括第二智能设备。
例如,当预设时间段为E至E+300ms之间的时间段,且在E+100ms时接收到第二智能设备发送的语音唤醒信息,可以将第二智能设备发送的语音唤醒信息,确定为一个待唤醒设备的语音唤醒信息。
可选地,也可以在接收到第二智能设备的语音唤醒信息之后,对第二智能设备的语音唤醒信息进行解析,确定其是否为与使用对象发送的语音唤醒指令对应的唤醒信息,在第二智能设备的语音唤醒信息为与语音唤醒指令对应的唤醒信息的情况下,将第二智能设备的语音唤醒信息,确定为一个待唤醒设备的语音唤醒信息。
需要说明的是,上述预设时间段内包括预设时间段的节点时刻,即,若目标服务器在预设时间段的开始时刻或者结束时刻,接收到智能设备集合中的第二智能设备的语音唤醒信息,也可以将第二智能设备的语音唤醒信息,确定为一个待唤醒设备的语音唤醒信息。
通过本实施例,将预设时间段内接收到的待唤醒设备发送的语音唤醒信息确定为一个待唤醒设备的语音唤醒信息,可以提高分布式语音唤醒的便捷性。
在一个示例性实施例中,上述方法还包括:
S41,在预设时间段之后,接收到智能设备集合中的第三智能设备发送的语音唤醒信息,其中,第三智能设备的语音唤醒信息用于表示第三智能设备所采集到的、使用对象发出的语音唤醒指令;
S42,向第三智能设备发送第二指示信息,其中,第二指示信息用于指示第三智能设备不进行唤醒。
由于不同智能设备确定检测到语音唤醒指令的时间不同,语音唤醒信息从发送至被目标服务器接收到所需的传输时间不同,因此,部分智能设备发送的语音唤醒信息可能在预设时间段之后被接收到。在本实施例中,在预设时间段之后,目标服务器可以接收到智能设备集合中的第三智能设备发送的语音唤醒信息,上述第三智能设备的语音唤醒信息用于表示第三智能设备所采集到的、使用对象发出的语音唤醒指令。
可选地,在接收到第三智能设备发送的的语音唤醒信息之后,目标服务器可以确定不对第三智能设备进行唤醒,可以向第三智能设备发送第二指示信息,上述第二指示信息用于指示第三智能设备不进行唤醒。
通过本实施例,对于在预设时间段之后接收到的语音唤醒信息所对应的待唤醒设备通过指示信息指示其不进行唤醒,可以降低同一语音唤醒指令同时唤醒多个待唤醒设备的情况,提高设备唤醒的准确性。
在一个示例性实施例中,在接收到智能设备集合中的第三智能设备发送的语音唤醒信息之后,上述方法还包括:
S51,根据第三智能设备的语音唤醒信息,确定第三智能设备采集到语音唤醒指令的时间;
S52,根据第三智能设备采集到语音唤醒指令的时间,确定第三智能设备采集到的语音唤醒指令为使用对象发出的语音唤醒指令。
在本实施例中,在接收到智能设备集合中的第三智能设备发送的语音唤醒信息之后,目标服务器可以根据第三智能设备的语音唤醒信息,确定第三智能设备采集到语音唤醒指令的时间。根据第三智能设备采集到语音唤醒指令的时间,目标服务器可以确定第三智能设备采集到的语音唤醒指令与智能设备集合采集到的语音唤醒指令是否为同一语音唤醒指令。
如果根据第三智能设备采集到语音唤醒指令的时间,确定第三智能设备采集到的语音唤醒指令与智能设备集合采集到的语音唤醒指令是否为同一语音唤醒指令,即,使用对象发出的前述语音唤醒指令,则可以执行前述实施例中发送第二指示信息的步骤。如果不是同一唤醒指令,则可以将其作为一个新的语音唤醒指令按照与前述实施例中类似的方式确定智能设备集合内响应该语音唤醒指令进行唤醒的待唤醒设备,已经进行过说明的,在此不做赘述。
可选地,根据第三智能设备的语音唤醒信息,确定第三智能设备采集到语音唤醒指令的时间的过程可以是:对第三智能设备的语音唤醒信息进行解析,确定语音唤醒信息的发送时间,将该发送时间确定为采集到语音唤醒指令的时间(由于确定采集到语音唤醒指令与发送语音唤醒信息的时间差较小,可以忽略不计);或者,对第三智能设备的语音唤醒信息进行解析,得到语音唤醒信息中携带的语音采集时间,将解析出的语音采集间,确定为采集到语音唤醒指令的时间。
可选地,根据第三智能设备采集到语音唤醒指令的时间,确定第三智能设备采集到的语音唤醒指令为使用对象发出的语音唤醒指令的过程可以是:当第三智能设备采集到语音唤醒指令的时间位于预设时间段时,可以将第三智能设备采集到的语音唤醒指令确定为使用对象发出的语音唤醒指令;当第三智能设备采集到语音唤醒指令的时间位于预设时间段之后时,可以确定第三智能设备采集到的语音唤醒指令不是使用对象发出的前述语音唤醒指令。
通过本实施例,通过对语音唤醒信息进行解析,确定语音唤醒指令的采集时间,进而基于语音唤醒指令的采集时间确定不同待唤醒设备采集到的是否是同一语音唤醒指令,可以提高设备唤醒的准确性。
在一个示例性实施例中,根据每个待唤醒设备的语音唤醒信息,从智能设备集合中选取出待唤醒的目标设备,包括:
S61,在每个待唤醒设备的语音唤醒信息为每个待唤醒设备采集到的、与语音唤醒指令对应的设备评估值的情况下,从智能设备集合中,选取出设备评估值最大的待唤醒设备,得到目标设备。
在本实施例中,如果每个待唤醒设备的语音唤醒信息为每个待唤醒设备采集到的、与语音唤醒指令对应的设备评估值,可以从智能设备集合中,选取出设备评估值最大的待唤醒设备,得到目标设备。
例如,智能设备集合为设备A、B、C和D,且设备A的设备评估值为2,设备B的设备评估值为3,设备C的设备评估值为4,设备D的设备评估值为2时,可以将设备C确定为目标设备。
可选地,上述设备评估值可以是设备所采集到的、使用对象发送的语音唤醒指令的能量值,也可以是根据设备所采集到的、使用对象发送的语音唤醒指令的能量值以及设备与使用对象之间的距离,确定出的设备评估值,还可以是确定出的其他设备评估值,本实施例中对此不做限定。
可选地,当智能设备集合中设备评估值最大的待唤醒设备存在多个时,可以任意选取一个待唤醒设备作为目标设备,也可以在指定待唤醒设备的唤醒优先级的情况下,将多个待唤醒设备中优先级最大的设备确定为目标设备,还可以采用其他方式从多个待唤醒设备中确定目标设备,本实施例中对此不做限定。
例如,智能设备集合为设备A、B、C和D,且设备A的设备评估值为4,设备B的设备评估值为3,设备C的设备评估值为4,设备D的设备评估值为2时,可以在设备A和C中任选一个作为目标设备。
需要说明的是,在每个待唤醒设备的语音唤醒信息为每个待唤醒设备采集到的、与语音唤醒指令对应的一路语音信号的情况下,可以确定每个待唤醒设备采集到的一路语音信号的能量值;从智能设备集合中,选取出采集到的一路语音信号的能量值最大的待唤醒设备,得到目标设备。
通过本实施例,基于待唤醒设备的设备评估值从智能设备集合中选取出设备评估值最大的待唤醒设备作为目标设备,可以提高设备唤醒的便捷性。
在一个示例性实施例中,在从智能设备集合中,选取出设备评估值最大的待唤醒设备,得到目标设备之前,上述方法还包括:
S71,在每个待唤醒设备上,根据每个待唤醒设备采集到的一路语音信号的能量值对每个待唤醒设备进行评估,得到每个待唤醒设备的第一评估值;
S72,在每个待唤醒设备上,根据每个待唤醒设备与使用对象之间的距离对每个待唤醒设备进行评估,得到每个待唤醒设备的第二评估值;
S73,在每个待唤醒设备上,对每个待唤醒设备的第一评估值和每个待唤醒设备的第二评估值进行加权求和,得到每个待唤醒设备的设备评估值。
在本实施例中,对于每个待唤醒设备,其可以确定每个待唤醒设备的设备评估值,并将设备评估值作为语音唤醒信息或者语音唤醒信息的一部分发送至目标服务器。每个待唤醒设备确定每个待唤醒设备的设备评估值的过程可以是:根据每个待唤醒设备采集到的一路语音信号的能量值对每个待唤醒设备进行评估,得到每个待唤醒设备的第一评估值;根据每个待唤醒设备与使用对象之间的距离对每个待唤醒设备进行评估,得到每个待唤醒设备的第二评估值;对每个待唤醒设备的第一评估值和每个待唤醒设备的第二评估值进行加权求和,得到每个待唤醒设备的设备评估值。
可选地,在根据每个待唤醒设备与使用对象之间的距离对每个待唤醒设备进行评估,得到每个待唤醒设备的第二评估值之前,可以通过每个待唤醒设备上的目标部件,确定与使用对象之间的距离,上述目标部件至少包括以下之一:图像采集部件,测距传感部件。
作为一种可选的实施方式,可以通过待唤醒设备上的图像采集部件对使用对象所处的位置区域进行图像采集,得到目标采集图像,上述目标采集图像中包含使用对象;对目标采集对象进行图像识别,确定出待唤醒设备与使用对象的距离。
作为另一种可选的实施方式,通过待唤醒设备接收与使用对象对应的反射信号,上述反射信号是通过测距传感部件发出的测距信号与使用对象发生反射之后所形成的信号;根据测距信号的强度以及反射信号的强度,确定待唤醒设备与使用对象的距离。
可选地,上述对每个待唤醒设备的第一评估值和每个待唤醒设备的第二评估值进行加权求和,得到每个待唤醒设备的设备评估值的过程可以是:将第一评估值与第二评估值的和,确定为设备评估值,或者,将第一评估值与第二评估值的和乘以修正系数之后的值,确定为设备评估值,第一评估值与第二评估值的修正系数可以是相同的,也可以是不同的,本实施例中对此不做限定。
需要说明的是,如果待唤醒设备未检测到与使用对象之间的距离,可以将第一评估值作为待唤醒设备的评估值,如果待唤醒设备检测到与使用对象之间的距离,可以采用上述方式先确定第一评估值和第二评估值,再对第一评估值和第二评估值进行加权求和,得到设备评估值。
通过本实施例,基于待唤醒设备采集到的语音信号的能量值以及待唤醒设备与用户之间的距离确定设备的评估值,可以提高设备评估值确定的合理性,进而提高设备唤醒的准确性。
下面结合可选示例对本申请实施例中的智能设备的语音唤醒方法进行解释说明。在本可选示例中,待唤醒设备为音响,预设时间段为300ms。
相关技术中的分布式唤醒方案,设备唤醒同时由云端和终端一起决定,300ms内终端收到云端决策结果就使用云端结果,300ms没收到云端结果,终端就会自动唤醒,存在多个终端概率性同时被唤醒的情况。
本可选实例中提供了一种分布式唯一唤醒方案,终端去掉300ms的超时唤醒,唤醒完全依靠云端的下发的唤醒决策结果。300ms内还是正常决策结果,如果在300ms内完成决策,就将唤醒决策下发给全部组内设备,并使得正确的唤醒设备被唤醒,如果云端超过300ms没有完成决策,云端主动将当时分数比较大的设备确定为待唤醒设备,并主动唤醒该设备,如果在300ms之后,云端再次收到其他终端上传唤醒的信息直接就拒绝,以使得组内只有唯一的一个设备唤醒。
结合图3和图4所示,本可选示例中的智能设备的语音唤醒方法的流程可以包括以下步骤:
步骤S402,在唤醒决策窗口内,接收音响A和音响B发送的能量值。
例如,上述能量值为音响A和音响B所采集到的、用户发送的语音唤醒指令的能量值。
步骤S404,在接收到的能量值小于组内设备的个数的情况下,将接收到的能量值大的音响,确定为待唤醒音响。
例如,当音响B发送的能量值大于音响A发送的能量值时,可以将音响B确定为待唤醒音响。
步骤S406,向待唤醒音响发送唤醒结果,向其他音响发送不唤醒结果。
云端可以向音响B发送唤醒的决策结果,向音响A下发不唤醒的决策结果。
通过本可选示例,参加分布式唤醒的所有组内设备,都依靠云端下发的唤醒决策结果进行唤醒响应,可以减少多个设备被同时唤醒的情况,提高设备唤醒的准确性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM(Read-Only Memory,只读存储器)/RAM(Random Access Memory,随机存取存储器)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述智能设备的语音唤醒方法的智能设备的语音唤醒装置。图5是根据本申请实施例的一种可选的智能设备的语音唤醒装置的结构框图,如图5所示,该装置可以包括:
第一接收单元502,用于在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,其中,每个待唤醒设备的语音唤醒信息用于表示每个待唤醒设备所采集到的、使用对象发出的语音唤醒指令;
选取单元504,与第一接收单元502相连,用于在智能设备集合包含的待唤醒设备的设备数量小于或等于智能设备集合包含的智能设备的设备数量的情况下,根据每个待唤醒设备的语音唤醒信息,从智能设备集合中选取出待唤醒的目标设备;
第一发送单元506,与选取单元504相连,用于向目标设备发送第一指示信息,其中,第一指示信息用于指示目标设备进行唤醒,智能设备集合中除了目标设备以外的其他未接收到第一指示信息的智能设备不进行唤醒。
需要说明的是,该实施例中的第一接收单元502可以用于执行上述步骤S202,该实施例中的选取单元504可以用于执行上述步骤S204,该实施例中的第一发送单元506可以用于执行上述步骤S206。
通过上述模块,在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,其中,每个待唤醒设备的语音唤醒信息用于表示每个待唤醒设备所采集到的、使用对象发出的语音唤醒指令;在智能设备集合包含的待唤醒设备的设备数量小于或等于智能设备集合包含的智能设备的设备数量的情况下,根据每个待唤醒设备的语音唤醒信息,从智能设备集合中选取出待唤醒的目标设备;向目标设备发送第一指示信息,其中,第一指示信息用于指示目标设备进行唤醒,智能设备集合中除了目标设备以外的其他未接收到第一指示信息的智能设备不进行唤醒,解决了相关技术中的智能设备的语音唤醒方法存在两个及以上的智能设备被用于同一唤醒指令唤醒导致的设备唤醒的准确性的问题,提高了设备唤醒的准确性。
在一个示例性实施例中,上述装置还包括:
第一确定单元,用于在接收到智能设备集合中的第一智能设备的语音唤醒信息的情况下,确定预设时间段,其中,预设时间段是以接收到第一智能设备的语音唤醒信息的时间为起点的预设时长的时间段,第一智能设备的语音唤醒信息为第一个接收到的语音唤醒信息。
在一个示例性实施例中,上述装置还包括:
第二确定单元,用于将与目标帐号或者目标帐号组绑定的智能设备中,具有相同的厂商标识的智能设备,确定为一个设备集合,得到智能设备集合;或者,
第三确定单元,用于将与目标帐号或者目标帐号组绑定的智能设备中,使用相同的唤醒指令的智能设备,确定为一个设备集合,得到智能设备集合;或者,
第四确定单元,用于将与目标帐号或者目标帐号组绑定的智能设备中,处于相同位置区域的智能设备,确定为一个设备集合,得到智能设备集合;或者,
第五确定单元,用于响应于接收到的分组指示信息,将与目标帐号或者目标帐号组绑定的智能设备中,分组指示信息所指示的智能设备确定为一个设备集合,得到智能设备集合。
在一个示例性实施例中,第一接收单元包括:
接收模块,用于在预设时间段内,接收到智能设备集合中的第二智能设备的语音唤醒信息,其中,第二智能设备的语音唤醒信息用于表示第二智能设备所采集到的语音唤醒指令;
确定模块,用于将第二智能设备的语音唤醒信息,确定为一个待唤醒设备的语音唤醒信息,其中,智能设备集合包括第二智能设备。
在一个示例性实施例中,上述装置还包括:
第二接收单元,用于在预设时间段之后,接收到智能设备集合中的第三智能设备发送的语音唤醒信息,其中,第三智能设备的语音唤醒信息用于表示第三智能设备所采集到的、使用对象发出的语音唤醒指令;
第二发送单元,用于向第三智能设备发送第二指示信息,其中,第二指示信息用于指示第三智能设备不进行唤醒。
在一个示例性实施例中,上述装置还包括:
第六确定单元,用于在接收到智能设备集合中的第三智能设备发送的语音唤醒信息之后,根据第三智能设备的语音唤醒信息,确定第三智能设备采集到语音唤醒指令的时间;
第七确定单元,用于根据第三智能设备采集到语音唤醒指令的时间,确定第三智能设备采集到的语音唤醒指令为使用对象发出的语音唤醒指令。
在一个示例性实施例中,选取单元包括:
选取模块,用于在每个待唤醒设备的语音唤醒信息为每个待唤醒设备采集到的、与语音唤醒指令对应的设备评估值的情况下,从智能设备集合中,选取出设备评估值最大的待唤醒设备,得到目标设备。
在一个示例性实施例中,上述装置还包括:
第一评估单元,用于在从智能设备集合中,选取出设备评估值最大的待唤醒设备,得到目标设备之前,在每个待唤醒设备上,根据每个待唤醒设备采集到的一路语音信号的能量值对每个待唤醒设备进行评估,得到每个待唤醒设备的第一评估值;
第二评估单元,用于在每个待唤醒设备上,根据每个待唤醒设备与使用对象之间的距离对每个待唤醒设备进行评估,得到每个待唤醒设备的第二评估值;
求和单元,用于在每个待唤醒设备上,对每个待唤醒设备的第一评估值和每个待唤醒设备的第二评估值进行加权求和,得到每个待唤醒设备的设备评估值。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本申请实施例的又一个方面,还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行本申请实施例中上述任一项智能设备的语音唤醒方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S1,在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,其中,每个待唤醒设备的语音唤醒信息用于表示每个待唤醒设备所采集到的、使用对象发出的语音唤醒指令;
S2,在智能设备集合包含的待唤醒设备的设备数量小于或等于智能设备集合包含的智能设备的设备数量的情况下,根据每个待唤醒设备的语音唤醒信息,从智能设备集合中选取出待唤醒的目标设备;
S3,向目标设备发送第一指示信息,其中,第一指示信息用于指示目标设备进行唤醒,智能设备集合中除了目标设备以外的其他未接收到第一指示信息的智能设备不进行唤醒。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例中对此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、ROM、RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
根据本申请实施例的又一个方面,还提供了一种用于实施上述智能设备的语音唤醒方法的电子装置,该电子装置可以是服务器、终端、或者其组合。
图6是根据本申请实施例的一种可选的电子装置的结构框图,如图6所示,包括处理器602、通信接口604、存储器606和通信总线608,其中,处理器602、通信接口604和存储器606通过通信总线608完成相互间的通信,其中,
存储器606,用于存储计算机程序;
处理器602,用于执行存储器606上所存放的计算机程序时,实现如下步骤:
S1,在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,其中,每个待唤醒设备的语音唤醒信息用于表示每个待唤醒设备所采集到的、使用对象发出的语音唤醒指令;
S2,在智能设备集合包含的待唤醒设备的设备数量小于或等于智能设备集合包含的智能设备的设备数量的情况下,根据每个待唤醒设备的语音唤醒信息,从智能设备集合中选取出待唤醒的目标设备;
S3,向目标设备发送第一指示信息,其中,第一指示信息用于指示目标设备进行唤醒,智能设备集合中除了目标设备以外的其他未接收到第一指示信息的智能设备不进行唤醒。
可选地,在本实施例中,通信总线可以是PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线、或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于上述电子装置与其他设备之间的通信。
上述的存储器可以包括RAM,也可以包括非易失性存储器(non-volatilememory),例如,至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
作为一种示例,上述存储器606中可以但不限于包括上述设备的控制装置中的第一接收单元502、选取单元504、以及第一发送单元506。此外,还可以包括但不限于上述设备的控制装置中的其他模块单元,本示例中不再赘述。
上述处理器可以是通用处理器,可以包含但不限于:CPU(Central ProcessingUnit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(DigitalSignal Processing,数字信号处理器)、ASIC(Application Specific IntegratedCircuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图6所示的结构仅为示意,实施上述智能设备的语音唤醒方法的设备可以是终端设备,该终端设备可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图6其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图6中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图6所示的不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例中所提供的方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种智能设备的语音唤醒方法,其特征在于,包括:
在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,其中,所述每个待唤醒设备的语音唤醒信息用于表示所述每个待唤醒设备所采集到的、使用对象发出的语音唤醒指令;
在所述智能设备集合包含的待唤醒设备的设备数量小于或等于所述智能设备集合包含的智能设备的设备数量的情况下,根据所述每个待唤醒设备的语音唤醒信息,从所述智能设备集合中选取出待唤醒的目标设备;
向所述目标设备发送第一指示信息,其中,所述第一指示信息用于指示所述目标设备进行唤醒,所述智能设备集合中除了所述目标设备以外的其他未接收到所述第一指示信息的智能设备不进行唤醒。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在接收到所述智能设备集合中的第一智能设备的语音唤醒信息的情况下,确定所述预设时间段,其中,所述预设时间段是以接收到所述第一智能设备的语音唤醒信息的时间为起点的预设时长的时间段,所述第一智能设备的语音唤醒信息为第一个接收到的语音唤醒信息。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将与目标帐号或者目标帐号组绑定的智能设备中,具有相同的厂商标识的智能设备,确定为一个设备集合,得到所述智能设备集合;或者,
将与目标帐号或者目标帐号组绑定的智能设备中,使用相同的唤醒指令的智能设备,确定为一个设备集合,得到所述智能设备集合;或者,
将与目标帐号或者目标帐号组绑定的智能设备中,处于相同位置区域的智能设备,确定为一个设备集合,得到所述智能设备集合;或者,
响应于接收到的分组指示信息,将与目标帐号或者目标帐号组绑定的智能设备中,所述分组指示信息所指示的智能设备确定为一个设备集合,得到所述智能设备集合。
4.根据权利要求2所述的方法,其特征在于,所述在预设时间段内,接收智能设备集合中的每个待唤醒设备的语音唤醒信息,包括:
在所述预设时间段内,接收到所述智能设备集合中的第二智能设备的语音唤醒信息,其中,所述第二智能设备的语音唤醒信息用于表示所述第二智能设备所采集到的语音唤醒指令;
将所述第二智能设备的语音唤醒信息,确定为所述智能设备集合中的一个待唤醒设备的语音唤醒信息。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述预设时间段之后,接收到所述智能设备集合中的第三智能设备发送的语音唤醒信息,其中,所述第三智能设备的语音唤醒信息用于表示所述第三智能设备所采集到的、所述使用对象发出的语音唤醒指令;
向所述第三智能设备发送第二指示信息,其中,所述第二指示信息用于指示所述第三智能设备不进行唤醒。
6.根据权利要求5所述的方法,其特征在于,在所述接收到所述智能设备集合中的第三智能设备发送的语音唤醒信息之后,所述方法还包括:
根据所述第三智能设备的语音唤醒信息,确定所述第三智能设备采集到语音唤醒指令的时间;
根据所述第三智能设备采集到语音唤醒指令的时间,确定所述第三智能设备采集到的语音唤醒指令为所述使用对象发出的语音唤醒指令。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述根据所述每个待唤醒设备的语音唤醒信息,从所述智能设备集合中选取出待唤醒的目标设备,包括:
在所述每个待唤醒设备的语音唤醒信息为所述每个待唤醒设备采集到的、与所述语音唤醒指令对应的设备评估值的情况下,从所述智能设备集合中,选取出设备评估值最大的待唤醒设备,得到所述目标设备。
8.根据权利要求7所述的方法,其特征在于,在所述从所述智能设备集合中,选取出设备评估值最大的待唤醒设备,得到所述目标设备之前,所述方法还包括:在所述每个待唤醒设备上,根据所述每个待唤醒设备采集到的一路语音信号的能量值对所述每个待唤醒设备进行评估,得到所述每个待唤醒设备的第一评估值;
在所述每个待唤醒设备上,根据所述每个待唤醒设备与所述使用对象之间的距离对所述每个待唤醒设备进行评估,得到所述每个待唤醒设备的第二评估值;
在所述每个待唤醒设备上,对所述每个待唤醒设备的第一评估值和所述每个待唤醒设备的第二评估值进行加权求和,得到所述每个待唤醒设备的设备评估值。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至8中任一项所述的方法。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210918363.8A CN117542356A (zh) | 2022-08-01 | 2022-08-01 | 智能设备的语音唤醒方法、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210918363.8A CN117542356A (zh) | 2022-08-01 | 2022-08-01 | 智能设备的语音唤醒方法、存储介质及电子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117542356A true CN117542356A (zh) | 2024-02-09 |
Family
ID=89790516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210918363.8A Pending CN117542356A (zh) | 2022-08-01 | 2022-08-01 | 智能设备的语音唤醒方法、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117542356A (zh) |
-
2022
- 2022-08-01 CN CN202210918363.8A patent/CN117542356A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109240100A (zh) | 智能家居控制方法、设备、系统及存储介质 | |
JP7279992B2 (ja) | 音声認識デバイス及びそのウェイクアップ応答方法、コンピュータ記憶媒体 | |
CN112738740B (zh) | 消息推送的发送方法及装置、存储介质及电子装置 | |
CN111965991A (zh) | 智能控制开关的权限调节方法、装置、智能控制开关以及存储介质 | |
CN113357781A (zh) | 空调控制方法、装置、空调、介质及程序产品 | |
CN113765758B (zh) | 场景联动控制指令的传输方法、系统、装置及存储介质 | |
CN113593544A (zh) | 设备的控制方法和装置、存储介质及电子装置 | |
CN112309378B (zh) | 语音识别设备及其唤醒响应方法、计算机存储介质 | |
CN117542356A (zh) | 智能设备的语音唤醒方法、存储介质及电子装置 | |
CN115309062B (zh) | 设备的控制方法、装置、存储介质及电子装置 | |
CN114265327B (zh) | 智能家居设备的休眠控制方法、装置、处理器及电子设备 | |
CN117542355A (zh) | 分布式语音唤醒方法和装置、存储介质及电子装置 | |
CN115494737A (zh) | 智能家电的控制方法、存储介质及电子装置 | |
CN115312048B (zh) | 设备唤醒方法及装置、存储介质及电子装置 | |
CN115148204B (zh) | 语音唤醒的处理方法及装置、存储介质及电子装置 | |
CN114815635A (zh) | 计算机可读存储介质、智能面板及其语音交互方法 | |
US20240312462A1 (en) | Voice control method and apparatus for device, storage medium, and electronic apparatus | |
CN113383311A (zh) | 应用处理方法、装置、存储介质及电子设备 | |
CN115312049B (zh) | 指令的响应方法、存储介质及电子装置 | |
CN115314331B (zh) | 智能终端的控制方法和装置、存储介质及电子装置 | |
CN117524211A (zh) | 分布式语音唤醒方法和装置、存储介质及电子装置 | |
CN115419997B (zh) | 提示信息的发送方法及装置、存储介质及电子装置 | |
CN117015008A (zh) | 设备唤醒方法和装置、存储介质及电子装置 | |
CN117527459A (zh) | 智能设备的控制方法和装置、存储介质及电子装置 | |
CN117041476A (zh) | 智能设备的控制方法和装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |