CN117950620A - 一种设备控制方法及电子设备 - Google Patents
一种设备控制方法及电子设备 Download PDFInfo
- Publication number
- CN117950620A CN117950620A CN202211339079.1A CN202211339079A CN117950620A CN 117950620 A CN117950620 A CN 117950620A CN 202211339079 A CN202211339079 A CN 202211339079A CN 117950620 A CN117950620 A CN 117950620A
- Authority
- CN
- China
- Prior art keywords
- electronic device
- wake
- word
- received
- electronic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 200
- 230000001629 suppression Effects 0.000 claims abstract description 145
- 230000004044 response Effects 0.000 claims abstract description 114
- 230000005764 inhibitory process Effects 0.000 claims abstract description 30
- 230000008569 process Effects 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 19
- 230000002618 waking effect Effects 0.000 claims description 18
- 230000003993 interaction Effects 0.000 description 46
- 238000004891 communication Methods 0.000 description 23
- 238000013461 design Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 19
- 238000012545 processing Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 238000010295 mobile communication Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 229920001621 AMOLED Polymers 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/4401—Bootstrapping
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Telephone Function (AREA)
Abstract
本申请提供一种设备控制方法及电子设备,该方法包括:第一电子设备接收到第一音频时,确定第一音频中是否包含第一唤醒词;当确定第一音频中包含第一唤醒词,且第一电子设备为多个电子设备中响应优先级最高的电子设备时,唤醒第一电子设备,向第二电子设备发送第一抑制指示;多个电子设备包括第一电子设备和第二电子设备,多个电子设备与第一唤醒词关联,响应优先级表示响应第一唤醒词的优先级,第一抑制指示用于指示:不响应接收到的第一唤醒词。该方法能够提高多设备共用相同唤醒词场景下用户语音唤醒设备的准确性。该方法中,第一电子设备、第二电子设备可以为人工智能设备,该方法可以应用于人工智能场景例如智能家居、全屋智能面板等场景中。
Description
技术领域
本申请涉及电子设备技术领域,尤其涉及一种设备控制方法及电子设备。
背景技术
目前,用户可以通过说出唤醒词来唤醒电子设备并与电子设备进行语音交互,其中,唤醒词可以是用户设置的或者电子设备系统预先配置的。
当前,在多设备场景(例如全屋智能家居场景等)中,多个电子设备可能具有相同的唤醒词,该情况下,每个电子设备可以在检测到用户说出的唤醒词时,将自身的声强、声纹、设备状态等信息广播给其它设备,同时接收其它设备广播的声强、声纹、设备状态等信息,并结合自身信息、来自其它设备的信息以及预设的优先级策略,确定自身在多个电子设备中的优先级,进而根据优先级决策自身是否对用户的唤醒词进行应答。基于该方法,在用户说出唤醒词后,多个电子设备中最终会决策出一个电子设备进行应答。
上述方法中,在某个电子设备已被唤醒且正在应答的情况下,用户再次进行唤醒时会重新决策出一个新的电子设备进行应答,则会出现多个电子设备同时应答用户的情况,造成设备应答冲突、重复应答等问题,因此设备应答的准确性较低。
发明内容
本申请提供一种设备控制方法及电子设备,用以提高多设备共用相同唤醒词场景下用户语音唤醒设备的准确性。
第一方面,本申请实施例提供一种设备控制方法,应用于第一电子设备,该方法包括:当接收到第一音频时,确定所述第一音频中是否包含第一唤醒词;其中,所述第一电子设备与所述第一唤醒词关联;当确定所述第一音频中包含所述第一唤醒词,且所述第一电子设备为多个电子设备中响应优先级最高的电子设备时,唤醒所述第一电子设备,以及,向第二电子设备发送第一抑制指示;其中,所述多个电子设备包括所述第一电子设备和所述第二电子设备,所述多个电子设备与所述第一唤醒词关联,所述响应优先级用于表示响应所述第一唤醒词的优先级,所述第一抑制指示携带所述第一唤醒词,所述第一抑制指示用于指示:不响应接收到的所述第一唤醒词。
在该方法中,多个电子设备中的第一电子设备响应于接收到的第一唤醒词而被唤醒时,可以向其它使用第一唤醒词的电子设备发送抑制响应接收到的第一唤醒词的指示,使得其它电子设备不响应接收到的第一唤醒词。基于此方式,即使多个电子设备同时接收到的第一唤醒词,也只有第一电子设备响应该唤醒词,因此能够避免多个电子设备同时应答接收到的唤醒词的问题,避免设备应答冲突和重复应答,因此能够提高设备应答的准确性,提高方案的实用性。
在一种可能的设计中,在唤醒所述第一电子设备之后,所述方法还包括:当接收到来自第三电子设备的第二抑制指示时,切换为不响应接收到的所述第一唤醒词的模式;其中,所述第二抑制指示携带所述第一唤醒词,所述第二抑制指示用于指示:不响应接收到的所述第一唤醒词。
在该方法中,多个电子设备中的第一电子设备接收到来自其它电子设备的、抑制响应接收到的第一唤醒词的指示时,切换为不响应接收到的所述第一唤醒词的模式,可以避免与其它电子设备发生应答冲突或重复应答,能够提高设备应答的准确性。
在一种可能的设计中,所述方法还包括:当接收到所述第二抑制指示时,停止运行所述第一唤醒词关联的服务,和/或,降低所述第一电子播放音频时采用的音量;其中,所述第一唤醒词关联的服务是在唤醒所述第一电子设备时启动并运行的服务。
在该方法中,第一电子设备接收到抑制指示时,停止运行第一唤醒词关联的服务,可以避免与应答第一唤醒词的电子设备提供重复的语音交互体验,降低播放音频时采用的音量则可以避免其它应答的电子设备误将第一电子设备播放的音频作为用户音频进行响应的情况,进而避免设备间互相应答的问题。通过上述方法能够提高设备应答的准确性,提高用户使用体验。
在一种可能的设计中,所述唤醒所述第一电子设备,包括:启动并运行第一服务;其中,所述第一服务与所述第一唤醒词关联;在向第二电子设备发送第一抑制指示之后,所述方法还包括:当停止运行所述第一服务时,向所述第二电子设备发送解抑制指示;其中,所述解抑制指示用于指示允许响应接收到的唤醒词。
在该方法中,第一电子设备在停止运行第一服务时就结束了对第一唤醒词及后续用户语音指示的应答过程,则无需再抑制其它电子设备对第一唤醒词的应答,因此,第一电子设备在停止运行第一服务时向第二电子设备发送解抑制指示,可以解除对第二电子设备的抑制,保证第二电子设备后续可以正常处理接收到的第一唤醒词。
在一种可能的设计中,在向第二电子设备发送第一抑制指示之后,所述方法还包括:
在经过第一设定时长后向所述第二电子设备发送解抑制指示,或者,响应于接收到的用户指示,向所述第二电子设备发送解抑制指示;其中,所述解抑制指示用于指示允许响应接收到的唤醒词。
在该方法中,第一电子设备在经过第一设定时长后向第二电子设备发送解抑制指示,来解除第二电子设备对第一唤醒词的响应的抑制,能够避免对第二电子设备的长时间抑制,降低对第二电子设备侧处理流程的影响,保证第二电子设备后续可以正常处理接收到的第一唤醒词。
在一种可能的设计中,所述方法还包括:向所述第二电子设备发送第一时长信息;其中,所述第一时长信息用于指示所述第一抑制指示的生效时长。
在该方法中,在该方法中,第一电子设备通过将第一抑制指示的生效时长发送到第二电子设备,可以允许第二电子设备在经过生效时长后自动解除抑制状态,进而保证第二电子设备后续可以正常处理接收到的第一唤醒词,避免对第二电子设备的长时间抑制,降低对第二电子设备侧处理流程的影响。
在一种可能的设计中,所述第一电子设备与所述第二电子设备位于同一空间区域内。
在该方法中,处于同一空间区域内的、使用同一唤醒词的电子设备间发生应答冲突、互相应答等干扰的可能性较高,且对用户使用体验的影响较高,因此可以针对处于同一空间区域内的电子设备,按照上述方法进行控制,能够明显降低空间区域内设备间的应答冲突、互相应答等的影响,提高用户使用体验。
第二方面,本申请实施例提供一种设备控制方法,应用于第二电子设备,该方法包括:接收来自第一电子设备的第一抑制指示;其中,所述第一抑制指示携带第一唤醒词,所述第一抑制指示用于指示:不响应接收到的所述第一唤醒词;所述第一电子设备为当前响应所述第一唤醒词的电子设备,所述第二电子设备与所述第一唤醒词关联;响应于接收到的所述第一抑制指示,切换为不响应接收到的所述第一唤醒词的模式。
在该方法中,第二电子设备和第一电子设备的唤醒词均为第一唤醒词,第二电子设备接收到来自第二电子设备的、抑制响应接收到的第一唤醒词的指示时,切换为不响应接收到的所述第一唤醒词的模式,可以避免与第二电子设备发生应答冲突或重复应答,能够提高设备应答的准确性。
在一种可能的设计中,所述方法还包括:降低所述第二电子设备播放音频时采用的音量。
在该方法中,第二电子设备接收到不响应第一唤醒词的抑制指示后,降低自身播放音频时采用的音量,能够避免第一电子设备误将第二电子设备播放的音频作为用户音频进行响应的情况,进而避免设备间互相应答的问题。通过该方法能够提高设备应答的准确性,提高用户使用体验。
在一种可能的设计中,在切换为不响应接收到的所述第一唤醒词的模式之后,所述方法还包括:当接收到包含所述第一唤醒词的第二音频时,不唤醒所述第一电子设备。
在该方法中,第二电子设备在切换为不响应第一唤醒词的抑制状态的情况下,不响应接收到的第一唤醒词,能够避免与其它响应第一唤醒词的电子设备发生应答冲突,提高设备应答的准确性。
在一种可能的设计中,在响应于接收到的所述第一抑制指示,切换为不响应接收到的所述第一唤醒词的模式之前,所述方法还包括:确定与所述第一电子设备处于同一空间区域内;所述确定与所述第一电子设备处于同一空间区域内,具体包括:当确定设定的历史时间段内与所述第一电子设备同时接收到所述第一唤醒词的次数大于或等于设定次数时,确定与所述第一电子设备处于同一空间区域内;其中,在每次音频接收过程中,当确定接收到的音频中包含所述第一唤醒词且接收到来自所述第一电子设备的所述第一唤醒词时,确定与所述第一电子设备同时接收到所述第一唤醒词。
在该方法中,处于同一空间区域内的、使用同一唤醒词的电子设备,在实际场景中同时接收到唤醒词的可能性很大,因此电子设备可以根据历史时间内接收唤醒词的情况,确定不同电子设备是否处于同一空间区域内。基于该方式,第二电子设备确定与第一电子设备处于同一空间区域内时,可以在接收到第一电子设备的抑制指示后切换为不响应唤醒词的抑制状态,而第一电子设备可以响应唤醒词,因此能够实现同一空间区域中保证一个电子设备响应接收到的唤醒词的效果,避免设备间应答冲突或重复应答的问题。
在一种可能的设计中,在切换为不响应接收到的所述第一唤醒词的模式之后,所述方法还包括:在经过第一设定时长后,切换为允许响应接收到的所述第一唤醒词的模式。
在该方法中,第二电子设备被抑制后,在经过第一设定时长后可以自动解除抑制,因此能够及时恢复响应唤醒词的功能,保证第二电子设备后续可以正常处理接收到的第一唤醒词,避免长时间抑制造成用户使用体验不佳的问题。
在一种可能的设计中,所述方法还包括:接收来自所述第一电子设备的第一时长信息;其中,所述第一时长信息用于指示所述第一抑制指示的生效时长;在切换为不响应接收到的所述第一唤醒词的模式之后,在经过所述生效时长后,切换为允许响应接收到的所述第一唤醒词的模式。
在该方法中,第二电子设备被抑制后,在经过第一抑制指示的生效时长后可以自动解除抑制,因此能够及时恢复响应唤醒词功能,保证第二电子设备后续可以正常处理接收到的第一唤醒词,避免长时间抑制造成用户使用体验不佳的问题。
在一种可能的设计中,在切换为不响应接收到的所述第一唤醒词的模式之后,所述方法还包括:当接收到来自所述第一电子设备的解抑制指示时,切换为允许响应接收到的所述第一唤醒词的模式;其中,所述解抑制指示用于指示:允许响应接收到的所述第一唤醒词。
在该方法中,第二电子设备被抑制后,在接收到解除抑制的指示后可以解除抑制,恢复响应唤醒词的功能,保证第二电子设备后续可以正常处理接收到的第一唤醒词。
在一种可能的设计中,在切换为允许响应接收到的所述第一唤醒词的模式后,所述方法还包括:当接收到第一音频时,确定所述第一音频中是否包含所述第一唤醒词;当确定所述第一音频中包含所述第一唤醒词,且所述第二电子设备为多个电子设备中响应优先级最高的电子设备时,唤醒所述第二电子设备,以及,向所述第一电子设备发送第二抑制指示;其中,所述多个电子设备包括所述第一电子设备和所述第二电子设备,所述多个电子设备与所述第一唤醒词关联,所述响应优先级用于表示响应所述第一唤醒词的优先级,所述第二抑制指示携带所述第一唤醒词,所述第二抑制指示用于指示:不响应接收到的所述第一唤醒词。
在该方法中,第二电子设备在切换为能够响应第一唤醒词的模式后,若再接收到第一唤醒词时,可以确定响应唤醒词时进行唤醒,同时可以抑制其它电子设备对唤醒词的响应,能够避免设备应答冲突和重复应答。
第三方面,本申请提供一种电子设备,该电子设备包括存储器和一个或多个处理器;其中,存储器用于存储计算机程序代码,计算机程序代码包括计算机指令;当计算机指令被一个或多个处理器执行时,使得电子设备执行上述第一方面或第一方面的任一可能的设计所描述的方法,或者执行上述第二方面或第二方面的任一可能的设计所描述的方法。
第四方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,当计算机程序在计算机上运行时,使得计算机执行上述第一方面或第一方面的任一可能的设计所描述的方法,或者执行上述第二方面或第二方面的任一可能的设计所描述的方法。
第五方面,本申请提供一种计算机程序产品,该计算机程序产品包括计算机程序或指令,当计算机程序或指令在计算机上运行时,使得计算机执行上述第一方面或第一方面的任一可能的设计所描述的方法,或者执行上述第二方面或第二方面的任一可能的设计所描述的方法。
上述第三方面到第五方面的有益效果,请参见上述第一方面或第二方面的有益效果的描述,这里不再重复赘述。
附图说明
图1a为一种多设备场景下用户语音唤醒设备的方法的示意图;
图1b为一种控制多设备唤醒的方法的示意图;
图2本申请实施例提供的一种电子设备的硬件架构示意图;
图3本申请实施例提供的一种电子设备的软件架构示意图;
图4为本申请实施例提供的一种设备控制方法的示意图;
图5为本申请实施例提供的一种控制多设备唤醒的方法的示意图;
图6为本申请实施例提供的一种设备控制方法的流程的示意图;
图7为本申请实施例提供的一种控制多设备唤醒的方法的示意图;
图8为本申请实施例提供的一种设备控制方法的示意图;
图9为本申请实施例提供的一种设备控制方法的示意图;
图10为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例作进一步地详细描述。
其中,在本申请实施例的描述中,以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
为了便于理解,示例性的给出了与本申请相关概念的说明以供参考。
电子设备,可以为具有语音唤醒功能的设备,即用户可以通过语音唤醒电子设备。具体的,用户是通过说出唤醒词唤醒电子设备的。其中,唤醒词可以是用户根据自身需要预先设置在电子设备中的,也可以是电子设备在出厂之前设置好的,还可以是通过其它方式设置的,本申请实施例中对唤醒词的设置方式不做具体限制。
需要说明的是,本申请实施例中唤醒电子设备的用户可以是任意的电子设备,也可以是特定的电子设备。示例性的,特定用户可以为预先将发出唤醒词的声音存储在电子设备中的用户,如机主等。
本申请一些实施例中电子设备可以是便携式设备,诸如手机、平板电脑、具备无线通讯功能的可穿戴设备(例如手表、手环等)、车载终端设备、增强现实(augmentedreality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digitalassistant,PDA)、智能家居设备(例如,智能电视、智能音箱等)、智能机器人、车间设备、无人驾驶(self driving)中的无线终端、远程手术(remote medical surgery)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端,或智慧家庭(smart home)中的无线终端、飞行设备(例如,智能机器人、无人机、飞机)等。
其中,可穿戴设备为用户可以直接穿戴在身上或者整合到用户的衣服或配件上的一种便携式设备。
在本申请一些实施例中,电子设备还可以是还包含其它功能诸如个人数字助理和/或音乐播放器功能的便携式终端设备。便携式终端设备的示例性实施例包括但不限于搭载或者其它操作系统的便携式终端设备。上述便携式终端设备也可以是其它便携式终端设备,诸如具有触敏表面(例如触控面板)的膝上型计算机(laptop)等。还应当理解的是,在本申请其它一些实施例中,上述电子设备也可以不是便携式终端设备,而是具有触敏表面(例如触控面板)的台式计算机。
应理解,本申请实施例中“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A、B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一(项)个”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a、b或c中的至少一项(个),可以表示:a,b,c,a和b,a和c,b和c,或a、b和c,其中a、b、c可以是单个,也可以是多个。
图1a为一种多设备场景下用户语音唤醒设备的方法的示意图。如图1a中所示,该方法包括:
S101:电子设备接收到语音唤醒指示。
其中,电子设备可以为共用同一唤醒词的多个电子设备中的任一电子设备,语音唤醒指示可以为用户说出该唤醒词的语音。
S102:电子设备获取语音唤醒指示对应的声强、声纹置信度以及电子设备的设备状态等唤醒参考信息。并分别执行步骤S103及步骤S104~S105。
S103:电子设备判断声强是否大于预设阈值;若是,执行步骤S108,否则,执行步骤S106。
S104:电子设备对自身获取的唤醒参考信息进行广播,以使其它电子设备接收该唤醒参考信息。并执行步骤S105。
S105:电子设备接收其它电子设备广播的唤醒参考信息。并执行步骤S106。
其中,其它电子设备为与当前电子设备共用同一唤醒词的至少一个电子设备。
S106:电子设备按照预设的优先级策略,比较自身的唤醒参考信息与来自其它电子设备的唤醒参考信息的优先级。
S107:电子设备确定自身的唤醒参考信息的优先级是否最高;若是,执行步骤S108,否则,执行步骤S109。
S108:电子设备对接收到的语音唤醒指示进行应答。
S109:电子设备忽略接收到的语音唤醒指示。
对于共用同一唤醒词的多个电子设备,每个电子设备在接收到用户发出的语音唤醒指示后均可以按照上述传统方法进行自我决策,以确定是否对用户的语音唤醒指示进行应答,因此最终会有一个电子设备响应用户。
示例性的,如图1b中的(a)示意图中所示,若设备A、设备B、设备C的唤醒词相同,当用户说出该唤醒词且设备A和设备B接收到唤醒词、设备C未接收到唤醒词时,设备A和设备B可以分别按照上述方法进行决策确定自身是否进行应答(或响应)。当设备A确定应答、设备B确定不应答时,设备A可以对用户说出的唤醒词进行响应,设备B则不做响应。当用户再次说出唤醒词时,如图1b中的(b)示意图中所示,设备A处于收音应答状态,因此无法对用户再次说出的唤醒词进行响应,当设备B、设备C接收到用户再次说出的唤醒词时,设备B和设备C可以分别按照上述方法进行决策确定自身是否进行应答。当设备B确定应答时,设备B可以对用户说出的唤醒词进行响应,但此时设备A正在对用户进行应答,则会出现设备A与设备B重复应答的问题,影响用户的语音交互体验。
此外,在实际用户场景下,尤其是在复杂环境下,可能导致多设备应答冲突、多设备重复应答、多设备间互相应答等问题的场景较多,例如用户连续唤醒设备、多个用户利用同一唤醒词对不同设备进行唤醒、已唤醒的设备不参与响应、再次唤醒会有新设备响应用户、不同设备播放的内容被相互识别和应答等场景。在实际复杂多变的场景下如何更准确的对用户的语音唤醒指示进行应答,从而提高用户的语音交互体验,还是当前有待解决的问题。
鉴于以上问题,本申请实施例提供了一种设备控制方法及电子设备,该方案可以在多个电子设备共用相同唤醒词的场景中,决策出合适的用于响应用户发出的唤醒词的电子设备,提高用户唤醒设备的准确度,减少多个设备间的应答冲突、重复应答、互相应答等问题,从而提高用户语音交互体验,因此该方案的实用性较高。
下面参阅图2,对本申请实施例提供的方法适用的电子设备的结构进行介绍。
如图2中所示,电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,USB接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及SIM卡接口195等。
其中传感器模块180可以包括陀螺仪传感器、加速度传感器、接近光传感器、指纹传感器、触摸传感器、温度传感器、压力传感器、距离传感器、磁传感器、环境光传感器、气压传感器、骨传导传感器等。
可以理解的是,图2所示的电子设备100仅仅是一个范例,并不构成对电子设备的限定,并且电子设备可以具有比图中所示出的更多的或者更少的部件,可以组合两个或更多的部件,或者可以具有不同的部件配置。图2中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。其中,控制器可以是电子设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
本申请实施例提供的设备控制方法的执行可以由处理器110来控制或调用其他部件来完成,比如调用内部存储器121中存储的本申请实施例的处理程序,或者通过外部存储器接口120调用第三方设备中存储的本申请实施例的处理程序,来控制无线通信模块160向其它设备进行数据通信,提高电子设备100的智能化、便捷化程度,提升用户的体验。处理器110可以包括不同的器件,比如集成CPU和GPU时,CPU和GPU可以配合执行本申请实施例提供的设备控制方法,比如设备控制方法中部分算法由CPU执行,另一部分算法由GPU执行,以得到较快的处理效率。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。显示屏194可用于显示由用户输入的信息或提供给用户的信息以及各种图形用户界面(graphical user interface,GUI)。例如,显示屏194可以显示照片、视频、网页、或者文件等。再例如,显示屏194可以显示本申请实施例中所述的应用的平行视界的界面、蒙层界面等。
在本申请实施例中,显示屏194可以是一个一体的柔性显示屏,也可以采用两个刚性屏以及位于两个刚性屏之间的一个柔性屏组成的拼接显示屏。
摄像头193(前置摄像头或者后置摄像头,或者一个摄像头既可作为前置摄像头,也可作为后置摄像头)用于捕获静态图像或视频。通常,摄像头193可以包括感光元件比如镜头组和图像传感器,其中,镜头组包括多个透镜(凸透镜或凹透镜),用于采集待拍摄物体反射的光信号,并将采集的光信号传递给图像传感器。图像传感器根据所述光信号生成待拍摄物体的原始图像。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行电子设备100的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,应用程序(比如本申请方案对应的功能等)的代码等。存储数据区可存储电子设备100使用过程中所创建的数据等。
内部存储器121还可以存储本申请方案的算法对应的一个或多个计算机程序。该一个或多个计算机程序被存储在上述内部存储器121中并被配置为被一个或多个处理器110执行,该一个或多个计算机程序包括指令,上述指令可以用于执行以下实施例中的各个步骤。
此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。
当然,本申请实施例方案的算法的代码还可以存储在外部存储器中。这种情况下,处理器110可以通过外部存储器接口120运行存储在外部存储器中的本申请方案的算法的代码。
传感器模块180可以包括陀螺仪传感器、加速度传感器、接近光传感器、指纹传感器、触摸传感器等。
触摸传感器,也称“触控面板”。触摸传感器可以设置于显示屏194,由触摸传感器与显示屏194组成触摸显示屏,也称“触控屏”。触摸传感器用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器也可以设置于电子设备100的表面,与显示屏194所处的位置不同。
示例性的,电子设备100的显示屏194显示主界面,主界面中包括多个应用(比如相机应用、运动健康应用等)的图标。例如用户可以通过触摸传感器点击主界面中相机应用的图标,触发处理器110启动相机应用,打开摄像头193。显示屏194显示相机应用的界面,例如取景界面。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。在本申请实施例中,移动通信模块150还可以用于与其它设备进行信息交互。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频装置(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,WiFi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。本申请实施例中,无线通信模块160,用于与其它电子设备建立连接,进行数据交互。或者无线通信模块160可以用于接入接入点设备,向其它电子设备发送控制指令,或者接收来自其它电子设备发送的数据。
另外,电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。电子设备100可以接收按键190输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。电子设备100可以利用马达191产生振动提示(比如来电振动提示)。电子设备100中的指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。电子设备100中的SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。
应理解,在实际应用中,电子设备100可以包括比图2所示的更多或更少的部件,本申请实施例不作限定。图示电子设备100仅是一个范例,并且电子设备100可以具有比图中所示出的更多的或者更少的部件,可以组合两个或更多的部件,或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。
电子设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。示例性的,如图3所示,该软件架构可以分为四层,从上至下分别为应用程序层,应用程序框架层(framework,FWK),运行时和系统库,以及(Linux)内核(kernel)层。
应用程序层是操作系统的最上一层,包括操作系统的原生应用程序,例如相机、图库、日历、蓝牙、音乐、视频、信息等,还可以包括第三方应用程序。本申请实施例涉及的应用程序简称应用(application,APP),为能够实现某项或多项特定功能的软件程序。通常,电子设备中可以安装多个应用,例如相机应用、邮箱应用等。下文中提到的应用,可以是电子设备出厂时已安装的系统应用,也可以是用户在使用电子设备的过程中从网络下载或从其他电子设备获取的第三方应用。
当然,对于开发者来说,开发者可以编写应用程序并安装到该层。一种可能的实现方式中,应用程序可以使用Java语言开发,通过调用应用程序框架层所提供的应用程序编程接口(application programming interface,API)来完成,开发者可以通过应用程序框架来与操作系统的底层(例如内核层等)进行交互,开发自己的应用程序。
应用程序框架层为应用程序层的API和编程框架。应用程序框架层可以包括一些预先定义的函数。应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定显示屏(或屏幕),截取显示屏等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括文件(例如文档、视频、图像、音频),文本等信息。
视图系统包括可视控件,例如显示文字、图片、文档等内容的控件等。视图系统可用于构建应用程序。显示窗口中的界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备的通信功能。通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。
运行时包括核心库和虚拟机。运行时负责系统的调度和管理。
系统的核心库包含两部分:一部分是Java语言需要调用的功能函数,另一部分是系统的核心库。应用程序层和应用程序框架层运行在虚拟机中。以Java举例,虚拟机将应用程序层和应用程序框架层的Java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器,媒体库,三维图形处理库(例如:OpenGL ES),二维图形引擎(例如:SGL)等。表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了二维和三维图层的融合。媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.564,MP3,AAC,AMR,JPG,PNG等。三维图形处理库用于实现三维图形绘图、图像渲染、合成和图层处理等。二维图形引擎是二维绘图的绘图引擎。
内核层提供操作系统的核心系统服务,如安全性、内存管理、进程管理、网络协议栈和驱动模型等都基于内核层实现。内核层同时也作为硬件和软件栈之间的抽象层。该层有许多与电子设备相关的驱动程序,主要的驱动有:显示驱动;作为输入设备的键盘驱动;基于内存技术设备的Flash驱动;照相机驱动;音频驱动;蓝牙驱动;WiFi驱动等。
需要理解的是,如上所述的功能服务只是一种示例,在实际应用中,电子设备也可以按照其他因素来划分为更多或更少的功能服务,或者可以按照其他方式来划分各个服务的功能,或者也可以不划分功能服务,而是按照整体来工作。
本申请实施例提供的方案可以应用在多个电子设备使用相同的语音唤醒词的场景中,能够提高电子设备响应用户的唤醒词的准确度。
可选的,本申请实施例中所述的电子设备可以为人工智能(artificialintelligence,AI)设备,本申请实施例提供的方法可以应用于人工智能场景中,例如可以应用于全屋智能面板、智能家居等场景中。
示例性的,本申请实施例提供的方案可以应用于同一空间内同一用户/不同用户连续唤醒设备、不同用户同时唤醒设备等场景中。例如可以应用于全屋场景下同房间内同一用户/不同用户连续唤醒设备、不同位置的用户同时唤醒设备等场景中。
下面结合具体实施例,对本申请提供的方案进行详细说明。
参阅图4,本申请实施例提供的一种设备控制方法可以包括:
S401:第一电子设备接收到第一音频时,确定第一音频中是否包含用于唤醒第一电子设备的第一唤醒词。
在本申请一些实施例中,第一电子设备接收第一音频时处于空闲状态。其中,空闲状态为电子设备未被唤醒,且未运行语音交互服务(或称为语音服务)即未与用户进行语音交互的状态。
在本申请一些实施例中,第一唤醒词为第一电子设备关联的、用于语音唤醒第一电子设备的唤醒词。第一电子设备可以通过采集所在环境中用户的语音对应的音频数据,并对采集的音频数据进行唤醒词识别的方式,确定接收到的第一音频中是否包含第一唤醒词,进而进一步判断是否唤醒第一电子设备。
S402:第二电子设备接收到第二音频时,确定第二音频中是否包含用于唤醒第二电子设备的第二唤醒词。
在本申请一些实施例中,第二电子设备接收第二音频时处于空闲状态。
在本申请一些实施例中,第一音频和第二音频可以为同一用户在较短时间段内先后(或连续)发出的声音对应的音频,或者,第一音频和第二音频可以是不同用户同时发出的声音对应的音频,或者,第一音频和第二音频可以是不同用户在较短时间段内先后发出的声音对应的音频。其中,较短时间段的时长可以小于或等于设定的时长阈值。因此,步骤S402可以与步骤S401同时执行,步骤S402也可以早于或晚于步骤S401执行。
在本申请一些实施例中,第二电子设备可以是与第一电子设备处于同一空间环境内的电子设备。示例性的,该空间环境可以为全屋环境、室内环境等。可选的,第二电子设备可以是与第一电子设备共用唤醒词的至少一个电子设备中的每个电子设备,即用于语音唤醒第二电子设备的唤醒词(即第二唤醒词)与用于语音唤醒第一电子设备的唤醒词(即第一唤醒词)相同。
第二电子设备接收第二音频、确定第二唤醒词的方式可以参照第一电子设备接收第一音频、确定第一唤醒词的方式,此处不再赘述。
S403:当第一电子设备确定第一音频中包含第一唤醒词且确定响应第一唤醒词时,启动语音交互服务,以及,广播第一抑制信息;其中,第一抑制信息用于指示禁止响应接收到的唤醒词,即禁止电子设备被唤醒,第一抑制信息携带第一唤醒词。
在本申请一些实施例中,第一电子设备确定第一音频中包含第一唤醒词时,进一步确定是否响应第一唤醒词,当第一电子设备确定响应第一唤醒词即确定被唤醒时,可以启动第一唤醒词关联的语音交互服务,还可以通过语音交互服务播放用于响应第一唤醒词的第三音频和/或显示用于响应第一唤醒词的内容。在启动语音交互服务后,第一电子设备还可以继续通过运行的语音交互服务响应用户后续的语音指示,从而为用户提供语音交互体验。
其中,第一抑制信息中包括第一唤醒词,能够使第二电子设备在接收到来自第一电子设备的第一抑制信息后,可以根据第一抑制信息确定第一唤醒词,进而确定第二电子设备是否是与第一电子设备共用同一唤醒词的设备。
在本申请一些实施例中,第一电子设备可以采用以下步骤1~3所述的决策方法确定是否响应接收到的第一唤醒词:
步骤1:第一电子设备在确定第一唤醒词后,确定第一唤醒参考信息;其中,第一唤醒参考信息包括:第一音频的音频特征和/或第一电子设备的设备特征。
可选的,第一音频的音频特征可以包括以下至少一项:第一音频所指示的唤醒词(即第一唤醒词),第一音频的声强,声纹置信度等。第一电子设备的设备特征可以包括以下至少一项:第一电子设备的设备状态、第一电子设备的设备类型。其中,设备状态可以包括以下至少一项:空闲状态、收音应答状态、抑制状态等,各状态可参照下文中的相关介绍,此处暂不详述。可选的,设备状态还可以包括设备是否正在运行语音交互服务等。
步骤2:第一电子设备接收其它至少一个电子设备广播的唤醒参考信息;其中,在所述至少一个电子设备中,每个电子设备广播的唤醒参考信息包括:该电子设备接收到的唤醒词对应的音频的音频特征和/或该电子设备的设备特征。第一电子设备也可以通过其他方式接收其他电子设备发送的唤醒参考信息,本申请实施例不作限制。
其中,所述至少一个电子设备包括所述第二电子设备,所述至少一个电子设备广播的唤醒参考信息中包括所述第二电子设备广播的第二唤醒参考信息,所述第二唤醒参考信息用于指示:第二音频的音频特征和/或第二电子设备的设备特征。所述第二唤醒参考信息是所述第二电子设备在确定第二唤醒词后获取到的。其中,电子设备对应的音频特征和设备特征可参照上文中的介绍,此处不再赘述。
在本申请一些实施例中,上述第一电子设备在确定第一唤醒词之后,可以将第一唤醒参考信息广播出去,具体可以采用WiFi、蓝牙等短距通信方式将第一唤醒参考信息广播出去。各电子设备也可以采用WiFi、蓝牙等短距通信方式接收其它电子设备广播的唤醒参考信息。
步骤3:第一电子设备根据第一唤醒参考信息和所述至少一个电子设备广播的唤醒参考信息,以及设定的优先级策略,确定第一电子设备是否为响应优先级最高的电子设备,若是,则确定响应第一唤醒词,否则,确定不响应第一唤醒词;其中,设定的优先级策略用于根据不同电子设备的参考信息确定不同电子设备的响应优先级。
在本申请一些实施例中,设定的优先级策略包含各特征信息(即上述的音频特征/设备特征)对应的优先级,不同特征信息对应的权重,以及根据不同特征信息对应的优先级和权重确定设备的响应优先级的计算方式。第一电子设备可以根据设定的优先级策略,确定第一唤醒参考信息中不同特征对应的优先级及权重,并根据第一唤醒参考信息中不同特征对应的权重,对不同特征对应的优先级进行加权求和,得到第一电子设备的响应优先级。同理,第一电子设备可以参照该方式确定所述至少一个电子设备的响应优先级。进而可以通过比较第一电子设备和所述至少一个电子设备的响应优先级,确定第一电子设备是否为响应优先级最高的电子设备。
示例性的,若与第一电子设备共用唤醒词的电子设备仅包括上述的第二电子设备,则第一电子设备在确定第一唤醒参考信息后可以根据第一唤醒参考信息确定第一电子设备的响应优先级,在接收第二电子设备广播的第二唤醒参考信息后可以根据第二唤醒参考信息确定第二电子设备的响应优先级。若确定第一电子设备的响应优先级高于第二电子设备的响应优先级,则可以确定第一电子设备的响应优先级最高,因此第一电子设备确定响应第一唤醒词;否则,第一电子设备确定不响应第一唤醒词。
基于上述方法,第一电子设备在接收到第一唤醒词后,可以根据自身对应的唤醒参考信息、其它采用第一唤醒词的电子设备对应的唤醒参考信息以及设定的优先级策略,通过自我决策的方式确定是否对接收到的第一唤醒词进行响应。若确定对接收到的第一唤醒词进行响应,则第一电子设备被唤醒,并可以在唤醒后为用户提供语音交互服务。若确定不对接收到的唤醒词进行响应,则第一电子设备保持未被唤醒时的空闲状态。
同理,第二电子设备在接收到第二唤醒词后,也可以参照上述步骤1~3所述的决策方法确定是否对接收到的第二唤醒词进行响应,此处不再赘述。
在本申请一些实施例中,第一电子设备确定响应第一唤醒词时,除可以广播第一抑制信息以外,还可以广播第一抑制信息的生效时长,使得接收第一抑制信息的电子设备在生效时长内切换为抑制状态,在经过生效市场后则解除抑制状态。该过程的具体实施方式可参照下文中解除对第二电子设备的抑制的方法的相关介绍,此处暂不详述。
在本申请一些实施例中,第一电子设备在广播第一抑制信息之后,还可以在接收到用户指示或者到达设定的抑制时长或者结束语音交互服务时,广播解除抑制的指示信息,使得接收第一抑制信息的电子设备在相应时机解除抑制状态。该过程的具体实施方式可参照下文中解除对第二电子设备的抑制的方法的相关介绍,此处暂不详述。
S404:第二电子设备接收第一电子设备广播的第一抑制信息,第一抑制信息包含第一唤醒词。
可选的,第二电子设备也可以通过其他方式接收来自第一电子设备的第一抑制信息,本申请实施例不作限制。
S405:第二电子设备确定第一唤醒词与第二唤醒词是否相同,若是,执行步骤S406,否则,执行步骤S407。
S406:第二电子设备不响应第二唤醒词。
在本申请一些实施例中,第二电子设备在接收到来自第一电子设备的第一抑制信息后,当确定第二唤醒词与第一抑制信息中携带的第一唤醒词相同时,第二电子设备可以切换为不响应接收到的唤醒词的状态,因此不响应第二唤醒词。基于该方法,第一电子设备在进行响应时可以抑制其它电子设备对第一唤醒词进行响应,保证仅第一电子设备对第一唤醒词(或第二唤醒词)进行响应,能够避免电子设备间的重复唤醒等问题,进而提高设备唤醒的准确度。
S407:第二电子设备启动与第二唤醒词关联的语音交互服务。
在本申请一些实施例中,第二电子设备在接收到来自第一电子设备的第一抑制信息后,当确定第二唤醒词与第一抑制信息中携带的第一唤醒词不同时,不会导致第二电子设备与第一电子设备重复响应同一唤醒词的问题,则第二电子设备可以对第二唤醒词进行独立响应。
在上述方法中,当第一电子设备与第二电子设备使用相同的唤醒词,且第一电子设备、第二电子设备均接收到唤醒词并决策为第一电子设备响应唤醒词时,第一电子设备可以通过抑制第二电子设备对唤醒词的响应过程,来避免第一电子设备、第二电子设备对该唤醒词进行重复响应,第一电子设备也可以通过控制降低第二电子设备播放音频的音量的方式,减少第一电子设备、第二电子设备间相互的语音识别和响应,从而减少设备间相互应答,有助于提高用户语音交互体验。
在本申请一些实施例中,第一电子设备确定响应第一唤醒词时,可以切换为收音应答状态,其中,收音应答状态为电子设备被唤醒后运行语音交互服务、与用户进行语音交互的过程对应的状态。该状态下,第一电子设备可以对接收到的第一音频中包含的第一唤醒词进行语音应答,还可以对用户后续的其它语音指示进行响应。在与用户进行语音交互的过程结束后(即停止运行语音交互服务后),第一电子设备可以再切换为空闲状态。其中,在接收到用户下发的结束语音交互服务的语音指示后,或者在当前时间与上一次接收到用户语音指示的时间的时间间隔超过设定时长时,电子设备可以停止语音交互服务,结束与用户的语音交互过程。
在第一电子设备和第二电子设备的唤醒词相同的情况下,在第二电子设备接收第一电子设备广播的第一抑制信息后,第二电子设备可以切换为抑制状态,其中,抑制状态为电子设备被禁止响应接收到的唤醒词的状态。在该状态下,第二电子设备可以不响应接收到的第一唤醒词,此外还可以退出当前运行的语音交互服务、降低设备播放音频时采用的音量等,从而避免重复应答,同时减少设备间互相应答,降低对第一电子设备的响应过程的影响。
在第一电子设备处于收音应答状态,第二电子设备处于抑制状态的情况下,当第一电子设备、第二电子设备再次接收到第一唤醒词时,第二电子设备处于抑制状态,因此不会响应再次接收到的第一唤醒词。对于第一电子设备,若第一电子设备的设备能力支持在收音应答状态下接收和应答唤醒词,则第一电子设备可以按照上述实施例中步骤1~3所述的决策方法再次进行决策,若决策结果为响应唤醒词,则可以再次响应接收到的唤醒词;若第一电子设备的设备能力不支持在收音应答状态下接收和响应唤醒词,则第一电子设备可以继续执行收音应答状态下运行语音交互服务、与用户进行语音交互的过程,并可以将接收到的唤醒词作为用户的语音指示进行响应。因此最终结果为仍由第一电子设备应答用户,能够保证连续唤醒过程中也仅有一个电子设备响应唤醒词的效果,避免了连续唤醒的问题。
可选的,如图4中所示,基于上述方法,在上述步骤S406之后,还可以包括如下步骤S408~S411:
S408:第二电子设备切换为抑制状态;其中,第二电子设备在抑制状态下不响应接收到的唤醒词。
S409:第一电子设备继续运行语音交互服务。
S410:第二电子设备根据接收到的第三音频确定接收到第一唤醒词时,不响应接收到的第一唤醒词。
S411:第一电子设备继续运行语音交互服务。
上述方法中,第一电子设备被唤醒后处于收音应答状态,在该状态下,若第一电子设备无法接收和识别唤醒词对应的音频,或者,第一电子设备可以接收和识别唤醒词对应的音频但是无法对识别的唤醒词进行响应,则用户再次说出相同的唤醒词时,第一电子设备无法进行响应。若按照上述图1a所示的传统方法,则需要在与第一电子设备共用唤醒词的其它电子设备中决策出一个新的用于响应该唤醒词的设备,但同时第一电子设备也处于响应该唤醒词或唤醒后提供语音交互服务的过程中,因此就会造成针对同一唤醒词的重复唤醒或应答的问题。而本申请上述实施例提供的方法中,第二电子设备可以在接收到第一抑制信息后,将自身状态调整为抑制状态,即不响应第一唤醒词的状态。基于第一电子设备广播的第一抑制信息的生效时长或者第一电子设备广播的解除抑制的指示信息,第二电子设备可以及时解除抑制状态。其中,在第二电子设备处于抑制状态期间,即便用户再次说出第一唤醒词,第二电子设备也不会进行响应,而第一电子设备继续执行响应唤醒词或唤醒后提供语音服务的过程,实现仅第一电子设备处于唤醒状态的效果,因此可以避免重复应答。此外,第二电子设备还可以在处于抑制状态期间降低设备播放音频时采用的音量等,能够减少与第一电子设备间的互相应答,提高设备应答准确度。
示例1
以下以家庭环境场景下的电子设备A、电子设备B、电子设备C共用同一唤醒词(例如:小X小X)为例,对上述实施例提供的方法进行举例说明。
如图5中所示,电子设备A、电子设备B、电子设备C均处于空闲状态,当用户说出唤醒词“小X小X”时,若电子设备A~C接收唤醒词的情况为电子设备A和电子设备B能够接收到唤醒词,电子设备C未接收到唤醒词,则电子设备A、电子设备B分别按照上述实施例中的步骤1~3所述的方法进行自我决策,从而确定是否响应接收到的唤醒词,如图5中的步骤S1所示。若电子设备A的决策结果为响应,电子设备B的决策结果为不响应,则电子设备A被唤醒,则电子设备A可以按照上述实施例提供的第一电子设备所执行的方法,切换为收音应答状态,并响应“小X小X”这一唤醒词,如图5中的步骤S2所示。同时,如图5中的步骤S3所示,电子设备A广播抑制信息。电子设备B、电子设备C接收到电子设备A广播的抑制信息后,根据抑制信息的指示,不响应“小X小X”这一唤醒词。如图5中所示,电子设备B接收到电子设备A广播的抑制信息后,可以按照上述实施例中所述的第二电子设备所执行的方法,切换为抑制状态,如图5中的步骤S4所示。可选的,电子设备C接收到电子设备A广播的抑制信息后,也可以按照上述实施例中所述的第二电子设备所执行的方法,切换为抑制状态,如图5中的步骤S5所示。当用户再次说出唤醒词“小X小X”时,因电子设备A处于收音应答状态中,该状态下电子设备A正在进行应答,因此无法响应本次唤醒事件。如图5中的步骤S6所示,电子设备B、电子设备C可以接收到唤醒词并进行是否响应唤醒词的决策。但是电子设备B、电子C处于抑制状态,因此直接决策为不能响应本次唤醒事件。因此结果仍是电子设备A应答用户,如图5中的步骤S7所示。
在本申请一些实施例中,上述方法中,第一电子设备在广播第一抑制信息从而抑制第二电子设备响应第一唤醒词后,还需要及时解除对第二电子设备的抑制。具体可采用如下至少一种方式:
1)在上述步骤S403中,第一电子设备除广播第一抑制信息外,还可以广播第一抑制时长,该第一抑制时长为第一抑制信息的生效时长,即禁止电子设备响应第一唤醒词的时长。对应的,第二电子设备可以在接收到第一电子设备广播的第一抑制时长后开始计时,并在经过第一抑制时长后主动解除抑制,并从抑制状态切换为空闲状态。解除抑制后第二电子设备若接收到唤醒词,则可以参照上述实施例中步骤1~3所述的决策方法进行相应决策,若决策为第二电子设备可以响应唤醒词,则第二电子设备可以进行响应,若决策为不响应唤醒词,则第二电子设备可以忽略本次接收到的唤醒词。其中,第一电子设备可以同步或异步广播第一抑制信息和第一抑制时长。
2)在上述步骤S403中,第一电子设备在广播第一抑制信息后,可以设置第一抑制时长并开始计时,在经过第一抑制时长后,第一电子设备可以广播第一解抑制信息,第一解抑制信息用于指示解除对电子设备的抑制。第二电子设备接收到第一电子设备广播的第一解抑制信息后,可以主动解除抑制,并从抑制状态切换为空闲状态。解除抑制后第二电子设备若接收到唤醒词,则可以参照上述实施例中步骤1~3所述的决策方法进行相应决策,若决策为第二电子设备可以响应唤醒词,则第二电子设备可以进行响应,若决策为不响应唤醒词,则第二电子设备可以忽略本次接收到的唤醒词。
3)在上述步骤S403中,第一电子设备在广播第一抑制信息后,可以在确定当前语音交互服务结束或者在接收到用户下发的结束语音交互指示后,广播第一解抑制信息,第一解抑制信息用于指示解除对电子设备的抑制。第二电子设备接收到第一电子设备广播的第一解抑制信息后,可以主动解除抑制,并从抑制状态切换为空闲状态。解除抑制后第二电子设备若接收到唤醒词,则可以参照上述实施例中步骤1~3所述的决策方法进行相应决策,若决策为第二电子设备可以响应唤醒词,则第二电子设备可以进行响应,若决策为不响应唤醒词,则第二电子设备可以忽略本次接收到的唤醒词。其中,结束语音交互指示可以是用户作用在第一电子设备显示屏上的操作(例如退出当前语音交互服务的操作等),也可以是用户语音下发的指示(例如用户说出的退出服务、再见等指令)。
其中,上述各方法中所述第一抑制时长可以为设定时长,例如2秒、3秒等秒级别的时长。
在本申请一些实施例中,上述方法中,第二电子设备在参照上述实施例中步骤1~3所述的决策方法确定是否对接收到的第二唤醒词进行响应的结果为不响应时,可以在确定与第一电子设备处于设定的同一空间区域(例如同一房间)内时,执行上述实施例中步骤S404~S406所述的方法,从而避免对第一电子设备的响应过程造成干扰;可以在确定与第一电子设备未处于设定的同一空间区域内时,执行上述实施例中步骤S405所述的方法。
在本申请一些实施例中,第二电子设备若确定所维护的设备列表中包含第一电子设备,则确定与第一电子设备位于同一空间区域内,否则,确定与第一电子设备位于不同空间区域内,该设备列表中包含第二电子设备记录的与第二电子设备处于同一空间区域内的其它电子设备。其中,第二电子设备在每次接收唤醒词并进行决策的过程中,若接收到的来自其它电子设备的唤醒参考信息中携带的唤醒词与第二电子设备接收到的唤醒词相同,则确定第二电子设备与其它电子设备同时接收到同一唤醒词。第二电子设备可以基于该方式统计设定时间段(例如几个小时或一天等)内与某个其它电子设备同时接收到同一唤醒词的次数。当该次数大于设定的次数阈值时,第二电子设备可以确定与该其它电子设备位于同一空间区域内,并将该其它电子设备记录到设备列表中。
上述实施例中以第一电子设备为应答设备,第二电子设备为被抑制设备为例,对本申请实施例提供的方案进行了说明。实际应用中,共用同一唤醒词的多个电子设备中的每个电子设备均可以执行上述实施例中所述的应用于第一电子设备的方法或者上述实施例中所述的应用于第二电子设备的方法。其中,初始时电子设备可以参照上述实施例中步骤1~3所述的决策方法确定自身是否是响应用户唤醒词的设备,当电子设备通过决策确定自身为响应用户唤醒词的设备时,可以执行上述实施例中所述的应用于第一电子设备的方法,当电子设备通过决策确定自身不是响应用户唤醒词的设备时,可以执行上述实施例中所述的应用于第二电子设备的方法。下面结合具体实例进行说明。
参照图6,本申请实施例提供的一种设备控制方法的流程可以包括:
S601:电子设备接收到唤醒词;其中,电子设备为共用该唤醒词的多个电子设备中的任一电子设备。
该步骤的具体实施方式可以参照上述实施例中步骤S401所述的方法,此处不再详述。
S602:电子设备按照设定的决策方法,确定是否响应接收到的唤醒词;若是,执行步骤S603,否则,执行步骤S605。
其中,所述设定的决策方法可以参照上述实施例中步骤1~3所述的方法,电子设备可参照上述实施例中步骤1~3所述的方法,确定是否响应接收到的唤醒词(即是否被唤醒),此处不再赘述。
S603:电子设备响应接收到的唤醒词,启动运行语音交互服务,以及,广播抑制信息,所述抑制信息用于指示禁止响应接收到的唤醒词。
S604:电子设备结束语音交互服务时,广播解抑制信息,所述解抑制信息用于指示解除对电子设备的唤醒抑制。
S605:电子设备接收到其它电子设备广播的抑制信息,所述抑制信息用于指示禁止响应接收到的唤醒词。
S606:电子设备确定与所述其它电子设备是否处于设定的同一空间区域内;若是,执行步骤S607,否则,执行步骤S609。
S607:电子设备切换为抑制状态,降低播放音频时采用的音量,若当前正在运行语音交互服务,则退出当前正在运行的语音交互服务。
S608:电子设备接收到来自所述其它电子设备的解抑制信息时,解除抑制状态并切换为设定状态,同时恢复播放音频时采用的音量。
可选的,设定状态可以为空闲状态。
S609:电子设备不对唤醒音进行应答,并继续执行当前正在进行的服务进程。
在上述方法中,共用同一唤醒词的多个电子设备中被唤醒的应答设备可以广播抑制信息,收到抑制信息的电子设备进入抑制状态不允许应答,应答设备应答结束后可以广播解抑制信息,收到解抑制信息的电子设备可以解除抑制,解除抑制后允许被唤醒。基于该方式能够保证仅一个电子设备被用户的唤醒词唤醒并进行应答,进而减少出现设备间重复应答的影响。此外,不应答的电子设备在与应答设备处于同一空间环境内时退出语音交互服务并降低自身设备媒体音量,能够减少出现设备间互相应答的影响。
需要说明的是,上述实例提供的具体实施流程,仅是对本申请实施例适用方法流程的举例说明,其中各步骤的执行顺序可根据实际需求进行相应调整,还可以增加其它步骤,或减少部分步骤。各步骤的具体实施方式可参照前文实施例中的相关介绍,此处不再详述。
在本申请一些实施例中,上述的电子设备可以包括收发单元、决策单元、唤醒抑制控制单元、空间位置判断单元、语音控制单元等软件功能模块。其中,收发单元可以用于收发唤醒参考信息,决策单元可以用于决策是否响应用户的唤醒词,唤醒抑制控制单元用于控制电子设备的唤醒或抑制状态以及抑制其它电子设备、解抑制其它电子设备等,空间位置判断单元用于判断是否与被唤醒的电子设备处于同一空间环境内,语音控制单元用于控制语音交互服务的执行及设备播放音频的音量等。可选的,上述各功能单元可以部署在图3中所示的电子设备中,例如可以部署在图3所示的电子设备的应用程序框架层中。
需要理解的是,上述电子设备包括的功能单元只是一种示例,在实际应用中,电子设备也可以按照其他因素来划分为更多或更少的功能单元(或服务),或者可以按照其他方式来划分各个功能单元的功能,或者也可以不划分功能单元,而是按照整体来工作。在实际应用中,电子设备也可以包括更多或者更少的功能单元。
示例2
以下以家庭环境场景下的电子设备A、电子设备B、电子设备C共用同一唤醒词(例如:小X小X)为例,对上述实施例提供的方法进行举例说明。
如图7中所示,初始时电子设备A、电子设备B、电子设备C均处于空闲状态,当用户1说出唤醒词“小X小X”时,电子设备A被唤醒,切换为收音应答状态并响应该唤醒词,电子设备B、电子设备C被抑制,切换为抑制状态,且不响应该唤醒词,如图7中的步骤S1所示。该过程具体可以参照上述示例1中的相关说明,此处不再详述。示例性的,该过程中电子设备A执行的方法可以参照上述实施例中步骤S601~S603所述的方法,电子设备B、电子设备C执行的方法可以参照上述实施例中步骤S601~S602以及步骤S605~S608所述的方法。
在电子设备A处于收音应答状态,电子设备B、电子设备C处于抑制状态的情况下,用户1再次说出“小X小X”这一唤醒词时,电子设备B、电子设备C不会进行应答,电子设备A继续之前的应答过程,如图7中的步骤S2所示。该过程具体可以参照上述示例1中的相关说明,此处不再详述。
如图7中的步骤S3所示,电子设备A可以在经过设定的抑制时长后,向被抑制的电子设备B、电子设备C发送解抑制信息,从而解除对电子设备B、电子设备C的唤醒抑制。电子设备B、电子设备C接收到解抑制信息后,切换为被抑制前的状态(即空闲状态)。示例性的,该过程中电子设备A执行的方法可以参照上述实施例中步骤S604所述的方法,电子设备B、电子设备C执行的方法可以参照上述实施例中步骤S609所述的方法。
当电子设备A处于收音应答状态,电子设备B、电子设备C处于空闲状态时,当用户2在电子设备C附近说出唤醒词“小X小X”时,电子设备B、电子设备C可以接收到该唤醒词,并按照上述实施例中的步骤1~3所述的方法进行自我决策,从而确定是否响应该唤醒词,如图7中的步骤S4所示。
当电子设备C与用户2距离更近,决策为响应该唤醒词,电子设备B决策为不响应该唤醒词时,电子设备C被唤醒,响应用户2的该唤醒词,如图7中的步骤S5所示。电子设备C还可以向电子设备A、电子设备B发送抑制信息,从而抑制电子设备B、电子设备C响应用户2的唤醒词,如图7中的步骤S6所示。
如图7中所示,电子设备C被唤醒后可以切换为收音应答状态,并响应用户2的唤醒词,为用户2提供语音交互服务。如图7中的步骤S7所示,电子设备A接收到来自电子设备C的抑制信息后,若确定与电子设备C位于同房间内,则可以从收音应答状态切换为抑制状态,退出当前正在提供的语音交互服务,并降低自身播放音频时采用的音量。如图7中的步骤S8所示,电子设备B接收到来自电子设备C的抑制信息后,从空闲状态切换为抑制状态,并降低自身播放音频时采用的音量,还可以停止接收语音指示。电子设备C在结束为用户2提供的语音交互服务后,可以向电子设备A和电子设备B发送解抑制信号,电子设备A和电子设备接收到解抑制信号后解除唤醒抑制,可以恢复播放音频时采用的音量。
在上述方法,在同一空间环境内多人多次唤醒电子设备的场景中,也能够保证仅一个电子设备进行应答,其它电子设备可以通过降低播放音频的音量来减少对应答设备的干扰,减少设备间互相应答的情况,因此能够提高设备应答的准确度,提高用户语音交互体验,实用性较高。
基于以上实施例及相同技术构思,本申请实施例还提供一种设备控制方法,如图8中所示,该方法包括:
S801:当第一电子设备接收到第一音频时,确定所述第一音频中是否包含第一唤醒词;其中,所述第一电子设备与所述第一唤醒词关联。
示例性的,所述第一电子设备、所述第一音频、所述第一唤醒词可以分别为上述实施例中所述的第一电子设备、第一音频、第一唤醒词。第一电子设备与第一唤醒词关联,即为第一唤醒词是用于语音唤醒第一电子设备的信息。该步骤的具体执行方式可以参照上述实施例中步骤S401的相关说明,此处不再重述。
S802:当第一电子设备确定所述第一音频中包含所述第一唤醒词,且所述第一电子设备为多个电子设备中响应优先级最高的电子设备时,唤醒所述第一电子设备,以及,向第二电子设备发送第一抑制指示;其中,所述多个电子设备包括所述第一电子设备和所述第二电子设备,所述多个电子设备与所述第一唤醒词关联,所述响应优先级用于表示响应所述第一唤醒词的优先级,所述第一抑制指示携带所述第一唤醒词,所述第一抑制指示用于指示:不响应接收到的所述第一唤醒词。
示例性的,所述第一电子设备可以按照上述实施例中步骤1~3所述的决策方法,确定第一电子设备是否为多个电子设备中响应优先级最高的电子设备,进而确定自身是否可以响应第一唤醒词,此处不再详述。
示例性的,所述第一抑制指示可以为上述实施例中所述的第一抑制信息。
在本申请一些实施例中,第二电子设备可以为除所述第一电子设备以外的、与所述第一唤醒词关联的至少一个电子设备中的每个电子设备。可选的,第二电子设备与第一电子设备位于同一空间区域内。示例性的,所述第二电子设备可以为上述实施例中所述的第二电子设备。其中,第二电子设备侧执行的方法可以参照上述图4中所示的第二电子设备执行的方法,此处不再详述。
在本申请一些实施例中,第一电子设备向第二电子设备发送第一抑制指示的方式可以是:第一电子设备以广播方式发送第一抑制指示,第二电子设备监听并接收其它电子设备广播的信息,从而可以接收到第一电子设备广播的第一抑制指示。
在本申请一些实施例中,唤醒第一电子设备的方式可以是:启动并运行第一唤醒词关联的第一服务,还可以通过第一服务播放用于应答第一唤醒词的音频。
在本申请一些实施例中,在唤醒第一电子设备以后,当第一电子设备接收到来自第三电子设备的第二抑制指示时,可以切换为不响应接收到的所述第一唤醒词的模式,还可以停止运行正在运行的第一服务,和/或,降低播放音频时采用的音量。其中,所述第二抑制指示携带所述第一唤醒词,所述第二抑制指示用于指示:不响应接收到的所述第一唤醒词。所述第三电子设备为响应接收到的第一唤醒词的设备。在第一电子设备接收到来自第三电子设备的第二抑制指示之前,第三电子设备侧执行的方法可以参照上述第一电子设备执行的方法。
在本申请一些实施例中,第一电子设备唤醒后,可以在停止运行第一服务时,向第二电子设备发送解抑制指示,或者,第一电子设备可以在经过第一设定时长后向所述第二电子设备发送解抑制指示,或者,第一电子设备可以响应于接收到的用户指示,向所述第二电子设备发送解抑制指示。其中,所述解抑制指示用于指示允许响应接收到的唤醒词,则第二电子设备接收到解抑制指示后,可以切换为允许响应接收到的第一唤醒词的模式或状态。
在本申请一些实施例中,第一电子设备也可以在确定唤醒时,向第二电子设备发送第一时长信息,该第一时长信息用于指示所述第一抑制指示的生效时长,则第二电子设备在切换为不响应接收到的第一唤醒词的模式后,在经过生效时长后,可以切换回允许响应接收到的第一唤醒词的模式。
关于上述解除抑制的方法的具体实施方式,可以参照前述实施例中相关的介绍,此处不再详述。
上述方法中,电子设备所执行的具体步骤可参阅前述实施例中相关的介绍,在此不再过多赘述。
基于以上实施例及相同技术构思,本申请实施例还提供一种设备控制方法,如图9中所示,该方法包括:
S901:第二电子设备接收来自第一电子设备的第一抑制指示;其中,所述第一抑制指示携带第一唤醒词,所述第一抑制指示用于指示:不响应接收到的所述第一唤醒词;所述第一电子设备为当前响应所述第一唤醒词的电子设备,所述第二电子设备与所述第一唤醒词关联。
示例性的,第二电子设备、第一电子设备、第一抑制指示、第一唤醒词可以分别为前述实施例中所述的第二电子设备、第一电子设备、第一抑制信息、第一唤醒词。该步骤的具体执行方式可以参照前述实施例中关于第二电子设备侧方法的相关说明,此处不再重述。
在本申请一些实施例中,在第二电子设备接收来自第一电子设备的第一抑制指示之前,第二电子设备还可以执行以下步骤:接收到第二音频时,确定第二音频中是否包含用于唤醒第二电子设备的第二唤醒词,当所述第二音频中包含所述第二唤醒词时,第二电子设备可以按照上述实施例中步骤1~3所述的方法决策是否响应接收到的第一唤醒词,并决策为不响应第一唤醒词。
S902:第二电子设备响应于接收到的所述第一抑制指示,切换为不响应接收到的所述第一唤醒词的模式。
在本申请一些实施例中,在切换为不响应接收到的所述第一唤醒词的模式之后,第二电子设备可以降低播放音频时所采用的音量,后续当接收到包含所述第一唤醒词的第二音频时,不唤醒第二电子设备。
在本申请一些实施例中,第二电子设备在响应于接收到的所述第一抑制指示,切换为不响应接收到的所述第一唤醒词的模式之前,还可以确定第二电子设备与第一电子设备处于同一空间区域内,具体可以参照前文实施例中的相关说明,此处不再详述。
在本申请一些实施例中,第二电子设备在切换为不响应接收到的所述第一唤醒词的模式之后,可以在经过第一设定时长后,或者在接收到来自所述第一电子设备的解抑制指示时,切换回允许响应接收到的所述第一唤醒词的模式,其中,解抑制指示用于指示:允许响应接收到的所述第一唤醒词。第二电子设备可以接收来自第一电子设备的第一时长信息,该第一时长信息用于指示所述第一抑制指示的生效时长,则第二电子设备在切换为不响应接收到的所述第一唤醒词的模式之后,可以在经过生效时长后,切换回允许响应接收到的所述第一唤醒词的模式。该方法的具体实施方式,可以参照前述实施例中相关的介绍,此处不再详述。
上述方法中,电子设备所执行的具体步骤可参阅前述实施例中相关的介绍,在此不再过多赘述。
基于以上实施例及相同技术构思,本申请实施例还提供一种电子设备,该电子设备用于实现本申请实施例提供的设备控制方法,具体可以用于执行上述实施例中所述的第一电子设备侧或第二电子设备侧执行的方法。如图10中所示,电子设备1000可以包括:存储器1001,一个或多个处理器1002,以及一个或多个计算机程序(图中未示出)。上述各器件可以通过一个或多个通信总线1003耦合。可选地,电子设备1000还可以包括显示屏1004。
其中,存储器1001中存储有一个或多个计算机程序(代码),一个或多个计算机程序包括计算机指令;一个或多个处理器1002调用存储器1001中存储的计算机指令,使得电子设备1000执行本申请实施例提供的应用于第一电子设备或应用于第二电子设备的设备控制方法。
具体实现中,存储器1001可包括高速随机存取的存储器,并且也可包括非易失性存储器,例如一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备。存储器1001可以存储操作系统(下述简称系统),例如ANDROID,IOS,WINDOWS,或者LINUX等嵌入式操作系统。存储器1001可用于存储本申请实施例的实现程序。存储器1001还可以存储网络通信程序,该网络通信程序可用于与一个或多个附加设备,一个或多个用户设备,一个或多个网络设备进行通信。
一个或多个处理器1002可以是一个通用中央处理器(Central Processing Unit,CPU),微处理器,特定应用集成电路(Application-Specific Integrated Circuit,ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。
显示屏1004可以用于显示应用界面等相关用户界面。
需要说明的是,图10仅仅是本申请实施例提供的电子设备1000的一种实现方式,实际应用中,电子设备1000还可以包括更多或更少的部件,这里不作限制。
基于以上实施例及相同技术构思,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,当计算机程序在计算机上运行时,使得计算机执行上述实施例提供的应用于第一电子设备侧或应用于第二电子设备侧的方法。
基于以上实施例及相同技术构思,本申请实施例还提供一种计算机程序产品,该计算机程序产品包括计算机程序或指令,当计算机程序或指令在计算机上运行时,使得计算机执行上述实施例提供的应用于第一电子设备侧或应用于第二电子设备侧的方法。
本申请实施例提供的方法中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、网络设备、用户设备或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,简称DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机可以存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,数字视频光盘(digital video disc,简称DVD)、或者半导体介质(例如,SSD)等。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (16)
1.一种设备控制方法,应用于第一电子设备,其特征在于,所述方法包括:
当接收到第一音频时,确定所述第一音频中是否包含第一唤醒词;其中,所述第一电子设备与所述第一唤醒词关联;
当确定所述第一音频中包含所述第一唤醒词,且所述第一电子设备为多个电子设备中响应优先级最高的电子设备时,唤醒所述第一电子设备,以及,向第二电子设备发送第一抑制指示;其中,所述多个电子设备包括所述第一电子设备和所述第二电子设备,所述多个电子设备与所述第一唤醒词关联,所述响应优先级用于表示响应所述第一唤醒词的优先级,所述第一抑制指示携带所述第一唤醒词,所述第一抑制指示用于指示:不响应接收到的所述第一唤醒词。
2.如权利要求1所述的方法,其特征在于,在唤醒所述第一电子设备之后,所述方法还包括:
当接收到来自第三电子设备的第二抑制指示时,切换为不响应接收到的所述第一唤醒词的模式;其中,所述第二抑制指示携带所述第一唤醒词,所述第二抑制指示用于指示:不响应接收到的所述第一唤醒词。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
当接收到所述第二抑制指示时,停止运行所述第一唤醒词关联的服务,和/或,降低所述第一电子播放音频时采用的音量;
其中,所述第一唤醒词关联的服务是在唤醒所述第一电子设备时启动并运行的服务。
4.如权利要求1~3任一所述的方法,其特征在于,所述唤醒所述第一电子设备,包括:
启动并运行第一服务;其中,所述第一服务与所述第一唤醒词关联;
在向第二电子设备发送第一抑制指示之后,所述方法还包括:
当停止运行所述第一服务时,向所述第二电子设备发送解抑制指示;其中,所述解抑制指示用于指示允许响应接收到的唤醒词。
5.如权利要求1~3任一所述的方法,其特征在于,在向第二电子设备发送第一抑制指示之后,所述方法还包括:
在经过第一设定时长后向所述第二电子设备发送解抑制指示,或者,响应于接收到的用户指示,向所述第二电子设备发送解抑制指示;
其中,所述解抑制指示用于指示允许响应接收到的唤醒词。
6.如权利要求1~3任一所述的方法,其特征在于,所述方法还包括:
向所述第二电子设备发送第一时长信息;其中,所述第一时长信息用于指示所述第一抑制指示的生效时长。
7.如权利要求1~6任一所述的方法,其特征在于,所述第一电子设备与所述第二电子设备位于同一空间区域内。
8.一种设备控制方法,应用于第二电子设备,其特征在于,所述方法包括:
接收来自第一电子设备的第一抑制指示;其中,所述第一抑制指示携带第一唤醒词,所述第一抑制指示用于指示:不响应接收到的所述第一唤醒词;所述第一电子设备为当前响应所述第一唤醒词的电子设备,所述第二电子设备与所述第一唤醒词关联;
响应于接收到的所述第一抑制指示,切换为不响应接收到的所述第一唤醒词的模式。
9.如权利要求8所述的方法,其特征在于,所述方法还包括:
降低所述第二电子设备播放音频时采用的音量。
10.如权利要求8或9所述的方法,其特征在于,在切换为不响应接收到的所述第一唤醒词的模式之后,所述方法还包括:
当接收到包含所述第一唤醒词的第二音频时,不唤醒所述第二电子设备。
11.如权利要求8~10任一所述的方法,其特征在于,在响应于接收到的所述第一抑制指示,切换为不响应接收到的所述第一唤醒词的模式之前,所述方法还包括:
确定与所述第一电子设备处于同一空间区域内;
所述确定与所述第一电子设备处于同一空间区域内,具体包括:
当确定设定的历史时间段内与所述第一电子设备同时接收到所述第一唤醒词的次数大于或等于设定次数时,确定与所述第一电子设备处于同一空间区域内;
其中,在每次音频接收过程中,当确定接收到的音频中包含所述第一唤醒词且接收到来自所述第一电子设备的所述第一唤醒词时,确定与所述第一电子设备同时接收到所述第一唤醒词。
12.如权利要求8或9所述的方法,其特征在于,在切换为不响应接收到的所述第一唤醒词的模式之后,所述方法还包括:
在经过第一设定时长后,切换为允许响应接收到的所述第一唤醒词的模式。
13.如权利要求8或9所述的方法,其特征在于,所述方法还包括:
接收来自所述第一电子设备的第一时长信息;其中,所述第一时长信息用于指示所述第一抑制指示的生效时长;
在切换为不响应接收到的所述第一唤醒词的模式之后,在经过所述生效时长后,切换为允许响应接收到的所述第一唤醒词的模式。
14.如权利要求8或9所述的方法,其特征在于,在切换为不响应接收到的所述第一唤醒词的模式之后,所述方法还包括:
当接收到来自所述第一电子设备的解抑制指示时,切换为允许响应接收到的所述第一唤醒词的模式;其中,所述解抑制指示用于指示:允许响应接收到的所述第一唤醒词。
15.一种电子设备,其特征在于,所述电子设备包括存储器和一个或多个处理器;
其中,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;当所述计算机指令被所述一个或多个处理器执行时,使得所述电子设备执行如权利要求1~14任一所述的方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,当所述计算机程序在电子设备上运行时,使得所述电子设备执行如权利要求1~14任一所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211339079.1A CN117950620A (zh) | 2022-10-28 | 2022-10-28 | 一种设备控制方法及电子设备 |
PCT/CN2023/123513 WO2024088046A1 (zh) | 2022-10-28 | 2023-10-09 | 一种设备控制方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211339079.1A CN117950620A (zh) | 2022-10-28 | 2022-10-28 | 一种设备控制方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117950620A true CN117950620A (zh) | 2024-04-30 |
Family
ID=90799017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211339079.1A Pending CN117950620A (zh) | 2022-10-28 | 2022-10-28 | 一种设备控制方法及电子设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN117950620A (zh) |
WO (1) | WO2024088046A1 (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102392297B1 (ko) * | 2017-04-24 | 2022-05-02 | 엘지전자 주식회사 | 전자기기 |
CN109377987B (zh) * | 2018-08-31 | 2020-07-28 | 百度在线网络技术(北京)有限公司 | 智能语音设备间的交互方法、装置、设备及存储介质 |
CN110223684A (zh) * | 2019-05-16 | 2019-09-10 | 华为技术有限公司 | 一种语音唤醒方法及设备 |
CN112289313A (zh) * | 2019-07-01 | 2021-01-29 | 华为技术有限公司 | 一种语音控制方法、电子设备及系统 |
CN111312239B (zh) * | 2020-01-20 | 2023-09-26 | 北京小米松果电子有限公司 | 响应方法、装置、电子设备及存储介质 |
CN112037789A (zh) * | 2020-08-07 | 2020-12-04 | 海尔优家智能科技(北京)有限公司 | 设备唤醒方法、装置、存储介质及电子装置 |
-
2022
- 2022-10-28 CN CN202211339079.1A patent/CN117950620A/zh active Pending
-
2023
- 2023-10-09 WO PCT/CN2023/123513 patent/WO2024088046A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2024088046A1 (zh) | 2024-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114006625B (zh) | 一种分屏显示方法与电子设备 | |
WO2021052263A1 (zh) | 语音助手显示方法及装置 | |
WO2020143408A1 (zh) | 显示方法及相关装置 | |
WO2021213164A1 (zh) | 应用界面交互方法、电子设备和计算机可读存储介质 | |
WO2021000881A1 (zh) | 一种分屏方法及电子设备 | |
CN115297200A (zh) | 一种具有折叠屏的设备的触控方法与折叠屏设备 | |
WO2021052279A1 (zh) | 一种折叠屏显示方法及电子设备 | |
CN107925738B (zh) | 用于提供图像的方法、电子设备 | |
CN113496426A (zh) | 一种推荐服务的方法、电子设备和系统 | |
WO2021036898A1 (zh) | 折叠屏设备中应用打开方法及相关装置 | |
CN113747552B (zh) | 一种功耗优化方法和电子设备 | |
WO2020259514A1 (zh) | 一种调用服务的方法及装置 | |
CN112445276A (zh) | 一种折叠屏显示应用方法及电子设备 | |
KR20180014569A (ko) | 근거리 무선 통신 네트워크에서 스캔 방법 및 이를 구현하는 전자 장치 | |
CN109522058B (zh) | 唤醒方法、装置、终端及存储介质 | |
CN111862972A (zh) | 语音交互服务方法、装置、设备及存储介质 | |
CN117950620A (zh) | 一种设备控制方法及电子设备 | |
CN114500732B (zh) | 一种界面显示的方法和电子设备、存储介质 | |
CN115686401A (zh) | 一种投屏方法、电子设备及系统 | |
CN115206308A (zh) | 一种人机交互的方法及电子设备 | |
CN108519913B (zh) | 应用程序的运行状态管理方法、装置、存储介质及终端 | |
CN116723382B (zh) | 一种拍摄方法及相关设备 | |
WO2024078412A1 (zh) | 跨屏分享方法、图形界面及相关装置 | |
WO2024067169A1 (zh) | 信息处理方法及电子设备 | |
CN114793288B (zh) | 权限信息处理方法、装置、服务器及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |