CN111754997B - 控制装置及其操作方法,和语音交互装置及其操作方法 - Google Patents
控制装置及其操作方法,和语音交互装置及其操作方法 Download PDFInfo
- Publication number
- CN111754997B CN111754997B CN201910388450.5A CN201910388450A CN111754997B CN 111754997 B CN111754997 B CN 111754997B CN 201910388450 A CN201910388450 A CN 201910388450A CN 111754997 B CN111754997 B CN 111754997B
- Authority
- CN
- China
- Prior art keywords
- voice
- voice interaction
- information
- interaction device
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 625
- 238000000034 method Methods 0.000 title claims abstract description 140
- 230000007958 sleep Effects 0.000 claims description 92
- 230000004044 response Effects 0.000 claims description 58
- 238000011084 recovery Methods 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 5
- 230000001360 synchronised effect Effects 0.000 claims description 4
- 230000010365 information processing Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 15
- 238000004590 computer program Methods 0.000 description 13
- 230000015654 memory Effects 0.000 description 9
- 230000007547 defect Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 238000005406 washing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 241000209094 Oryza Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 108010001267 Protein Subunits Proteins 0.000 description 2
- 230000000739 chaotic effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 238000001816 cooling Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006266 hibernation Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Selective Calling Equipment (AREA)
Abstract
本公开提供了一种控制装置及其操作方法,和语音交互装置及其操作方法。控制装置的操作方法包括接收多个语音交互装置分别发送的多个参数信息,该多个参数信息是多个语音交互装置在采集到用户同一时刻的第一语音输入的情况下发送的;根据第一语音输入,确定用户的需求信息;根据多个参数信息及需求信息,确定多个语音交互装置中的第一语音交互装置为与用户交互的装置;以及向第一语音交互装置发送唤醒指令,并向多个语音交互装置中除第一语音交互装置外的其他语音交互装置发送非唤醒指令。其中,第一语音输入包括预定语音输入和表征用户需求的语音输入。
Description
技术领域
本公开涉及互联网技术领域,更具体地,涉及一种控制装置及其操作方法,和语音交互装置及其操作方法。
背景技术
随着互联网技术和计算机技术的快速发展,语音交互技术应运而生,以解放双手,提高用户与电子设备的交互效率。
在实现本公开构思的过程中,发明人发现现有技术中至少存在如下问题:随着智能及物联化技术的普及,现代化家庭中往往设置有能够与用户进行交互的多个语音交互设备,且为了实现所谓的多个语音交互设备的管理,该多个语音交互设备往往源自同一供应商,因此该多个语音交互设备具有相同的唤醒语,则当该多个语音交互设备距离较近时,该多个语音交互设备往往响应于用户同一时刻发出的唤醒词而被唤醒,且在用户与语音交互设备进行语音交互时,该多个语音交互设备往往会同时做出应答,这无疑使得交互场景嘈杂混乱,从而降低用户体验。
发明内容
有鉴于此,本公开提供了一种能够提高交互体验的控制装置及其操作方法,和语音交互装置及其操作方法。
本公开的第一方面提供了一种控制装置的操作方法,该方法包括:接收多个语音交互装置分别发送的多个参数信息,所述多个参数信息是所述多个语音交互装置在采集到用户同一时刻的第一语音输入的情况下发送的;根据所述第一语音输入,确定所述用户的需求信息;根据所述多个参数信息及所述需求信息,确定所述多个语音交互装置中的第一语音交互装置为与所述用户交互的装置;以及向所述第一语音交互装置发送唤醒指令,并向所述多个语音交互装置中除所述第一语音交互装置外的其他语音交互装置发送非唤醒指令,其中,所述第一语音输入包括预定语音输入和表征所述用户需求的语音输入。
根据本公开的实施例,上述参数信息包括语音交互装置的性能参数,所述根据所述多个参数信息及所述需求信息,确定所述第一语音交互装置包括:根据所述多个语音交互装置中每个语音装置的性能参数与所述需求信息的匹配关系,确定所述第一语音交互装置。
根据本公开的实施例,上述参数信息还包括所述用户的位置信息,所述根据所述多个语音交互装置中每个语音装置的性能参数与所述需求信息的匹配关系,确定所述第一语音交互装置包括:确定所述多个语音交互装置中性能参数与所述用户的需求信息匹配的至少一个第二语音交互装置;以及根据所述至少一个第二语音交互装置发送的参数信息中的用户的位置信息,确定所述至少一个第二语音交互装置中的一个为所述第一语音交互装置,其中,所述用户的位置信息表征所述用户相对于语音交互装置的位置。
根据本公开的实施例,上述参数信息包括语音交互装置的操作信息,所述非唤醒指令包括睡眠指令和休眠指令,所述向所述其他语音交互装置发送非唤醒指令包括:根据所述其他语音交互装置的操作信息,确定所述其他语音交互装置在采集所述第一语音输入时是否执行第一操作;以及向执行所述第一操作的其他语音交互装置发送所述睡眠指令,向未执行所述第一操作的其他语音交互装置发送所述休眠指令,其中,语音交互装置响应于所述睡眠指令处于睡眠状态,所述睡眠状态包括执行所述第一操作且对采集的所述用户的语音输入不作响应的状态;语音交互装置响应于所述休眠指令处于休眠状态,所述休眠状态包括不执行任何操作的状态。
根据本公开的实施例,上述方法还包括:接收所述第一语音交互装置在采集到所述用户的第二语音输入的情况下发送的第一语音信息,所述第一语音信息与所述第二语音输入相对应;确定所述第一语音信息是否为通用语音信息;以及在所述第一语音信息为所述通用语音信息的情况下,向所述多个语音交互装置发送所述第一语音信息。
根据本公开的实施例,上述方法还包括:接收所述第一语音交互装置发送的恢复请求,所述恢复请求由所述第一语音交互装置在采集到所述用户的第三语音输入或预设时段内未采集到所述用户的语音输入的情况下发送;以及向所述多个语音交互装置发送恢复指令,以使所述多个语音交互装置恢复至采集所述第一语音输入之前的状态。
根据本公开的实施例,在向所述第一语音交互装置发送唤醒指令之后,上述方法还包括:监听所述第一语音交互装置的操作,确定所述第一语音交互装置是否执行第三操作;在所述第一语音交互装置执行所述第三操作的情况下,向所述第一语音交互装置发送同步请求;以及接收所述第一语音交互装置响应于所述同步请求发送的所述第三操作的执行进度信息。
根据本公开的实施例,上述方法还包括:在再次接收到所述多个语音交互装置中至少一个语音交互装置分别发送的至少一个参数信息的情况下,重新确定第一语音交互装置;接收所述重新确定后的第一语音交互装置在采集到所述用户的第四语音输入的情况下发送的获取请求;以及响应于所述重新确定后的第一语音交互装置的获取请求,向所述重新确定后的第一语音交互装置发送所述执行进度信息。
本公开的第二方面提供了一种语音交互装置的操作方法。该方法包括:在采集到用户的第一语音输入的情况下,向控制装置发送参数信息,以确定所述语音交互装置是否为第一语音交互装置;在所述语音交互装置是第一语音交互装置的情况下,接收所述控制装置发送的唤醒指令,以响应于所述唤醒指令处于唤醒状态;在所述语音交互装置不是第一语音交互装置的情况下,接收所述控制装置发送的非唤醒指令,以响应于所述非唤醒指令处于非唤醒状态,其中,所述第一语音输入包括预定语音输入和表征所述用户需求的语音输入。
根据本公开的实施例,上述参数信息包括所述语音交互装置的性能参数,在向控制装置发送参数信息之前,上述方法还包括:获取所述性能参数。
根据本公开的实施例,上述参数信息还包括所述用户的位置信息,在向控制装置发送参数信息之前,所述方法还包括:根据采集的所述用户的第一语音输入,确定所述用户的位置信息,其中,所述用户的位置信息表征所述用户相对于所述语音交互装置的位置。
根据本公开的实施例,上述参数信息包括语音交互装置的操作信息,所述非唤醒指令包括睡眠指令和休眠指令,其中:在所述操作信息表征所述语音交互装置执行第一操作的情况下,接收到的非唤醒指令为所述睡眠指令,以响应于所述睡眠指令处于睡眠状态,所述睡眠状态包括执行所述第一操作且对采集的所述用户的语音输入不作响应的状态;在所述操作信息表征所述语音交互装置未执行第一操作的情况下,接收到的所述非唤醒指令为所述休眠指令,以响应于所述休眠指令处于休眠状态,所述休眠状态包括不执行任何操作的状态。
根据本公开的实施例,在语音交互装置切换至唤醒状态后,上述方法还包括:实时采集用户的语音输入;在采集到用户的第二语音输入的情况下,确定第二语音输入对应的第二语音信息是否为通用语音信息;以及在确定第二语音输入对应的第二语音信息是通用语音信息的情况下,向控制装置发送第二语音信息,以使控制装置发送第二语音信息至多个语音交互装置,使多个语音交互装置执行与第二语音信息相对应的操作。
根据本公开的实施例,上述方法还包括:在所述语音交互装置处于唤醒状态、且采集到所述用户的第二语音输入的情况下,确定所述第二语音输入对应的第一语音信息是否为通用语音信息;以及在确定所述第一语音信息为通用语音信息的情况下,向所述控制装置发送第一语音信息。并且/或者上述方法还包括:接收所述控制装置发送的属于所述通用语音信息的第二语音信息;以及根据所述第二语音信息,执行第二操作,所述第二操作与所述第二语音信息对应的语音输入相对应。
根据本公开的实施例,上述方法还包括:在所述语音交互装置处于唤醒状态、且采集到所述用户的第三语音输入或在预设时段内未采集到用户的语音输入的情况下,向所述控制装置发送恢复请求;并且/或者,上述方法还包括:接收所述控制装置发送的恢复指令,将当前状态切换至采集所述第一语音输入之前的状态。
根据本公开的实施例,上述方法还包括:在所述语音交互装置处于唤醒状态、且执行第三操作的情况下,响应于所述控制装置发送的同步请求,向所述控制装置发送所述第三操作的执行进度信息。
根据本公开的实施例,上述方法还包括:在所述语音交互装置处于唤醒状态、且采集到所述用户的第四语音输入的情况下,向所述控制装置发送获取请求;接收所述控制装置响应于所述获取请求发送的所述执行进度信息;以及根据所述执行进度信息,执行所述第三操作,其中,所述第三操作与所述第四语音输入相对应。
本公开的第三方面提供了一种控制装置,该装置包括:参数信息接收模块,用于接收多个语音交互装置分别发送的多个参数信息,所述多个参数信息是所述多个语音交互装置在采集到用户同一时刻的第一语音输入的情况下发送的;需求信息确定模块,用于根据所述第一语音输入,确定所述用户的需求信息;第一装置确定模块,用于根据所述多个参数信息及所述需求信息,确定所述多个语音交互装置中的第一语音交互装置为与所述用户交互的装置;以及指令发送模块,用于向所述第一语音交互装置发送唤醒指令,并向所述多个语音交互装置中除所述第一语音交互装置外的其他语音交互装置发送非唤醒指令,其中,所述第一语音输入包括预定语音输入和表征所述用户需求的语音输入。
根据本公开的实施例,上述参数信息包括语音交互装置的性能参数,所述第一装置确定模块具体用于:根据所述多个语音交互装置中每个语音装置的性能参数与所述需求信息的匹配关系,确定所述第一语音交互装置。
根据本公开的实施例,上述参数信息还包括所述用户的位置信息,所述第一装置确定模块包括:第一确定子模块,用于确定所述多个语音交互装置中性能参数与所述用户的需求信息匹配的至少一个第二语音交互装置;以及第二确定子模块,用于根据所述至少一个第二语音交互装置发送的参数信息中的用户的位置信息,确定所述至少一个第二语音交互装置中的一个为所述第一语音交互装置,其中,所述用户的位置信息表征所述用户相对于语音交互装置的位置。
根据本公开的实施例,上述参数信息包括语音交互装置的操作信息,所述非唤醒指令包括睡眠指令和休眠指令,所述指令发送模块包括:操作确定子模块,用于根据所述其他语音交互装置的操作信息,确定所述其他语音交互装置在采集所述第一语音输入时是否执行第一操作;以及指令发送子模块,用于向执行所述第一操作的其他语音交互装置发送所述睡眠指令,向未执行所述第一操作的其他语音交互装置发送所述休眠指令,其中,语音交互装置响应于所述睡眠指令处于睡眠状态,所述睡眠状态包括执行所述第一操作且对采集的所述用户的语音输入不作响应的状态;语音交互装置响应于所述休眠指令处于休眠状态,所述休眠状态包括不执行任何操作的状态。
根据本公开的实施例,上述控制装置还包括第一语音信息接收模块,用于接收所述第一语音交互装置在采集到所述用户的第二语音输入的情况下发送的第一语音信息,所述第一语音信息与所述第二语音输入相对应;第一语音信息确定模块,用于确定所述第一语音信息是否为通用语音信息;以及第一语音信息发送模块,用于在所述第一语音信息为所述通用语音信息的情况下,向所述多个语音交互装置发送所述第一语音信息。
根据本公开的实施例,上述控制装置还包括:恢复请求接收模块,接收所述第一语音交互装置发送的恢复请求,所述恢复请求由所述第一语音交互装置在采集到所述用户的第三语音输入或预设时段内未采集到所述用户的语音输入的情况下发送;以及所述指令发送模块还用于:在所述恢复请求接收模块接收到所述恢复请求的情况下,向所述多个语音交互装置发送恢复指令,以使所述多个语音交互装置恢复至采集所述第一语音输入之前的状态。
根据本公开的实施例,上述控制装置还包括:操作监听模块,用于在所述指令发送模块发送所述唤醒指令后,监听所述第一语音交互装置执行的操作,并确定所述第一语音交互装置是否执行第三操作;同步请求发送模块,用于在确定所述第一语音交互装置执行所述第三操作的情况下,向所述第一语音交互装置发送同步请求;以及第一进度信息接收模块,用于接收所述第一语音交互装置响应于所述同步请求发送的所述第三操作的执行进度信息。
根据本公开的实施例,上述第一装置确定模块还用于:在所述参数信息接收模块再次接收到所述多个语音交互装置中至少一个语音交互装置分别发送的至少一个参数信息的情况下,重新确定第一语音交互装置。上述控制装置还包括:获取请求接收模块,用于接收所述重新确定后的第一语音交互装置在采集到所述用户的第四语音输入的情况下发送的获取请求;以及第一进度信息发送模块,用于响应于所述重新确定后的第一语音交互装置的获取请求,向所述重新确定后的第一语音交互装置发送所述执行进度信息。
本公开的第四方面提供了一种语音交互装置,包括:参数信息发送模块,用于在采集到用户的第一语音输入的情况下,向控制装置发送参数信息,以确定所述语音交互装置是否为第一语音交互装置;指令接收模块,用于:在所述语音交互装置是第一语音交互装置的情况下,接收所述控制装置发送的唤醒指令;在所述语音交互装置不是第一语音交互装置的情况下,接收所述控制装置发送的非唤醒指令;以及状态切换模块,用于:在所述指令接收模块接收到所述唤醒指令的情况下,响应于所述唤醒指令,将当前状态切换为唤醒状态;在所述指令接收模块接收到所述非唤醒指令的情况下,响应于所述非唤醒指令,将当前状态切换为非唤醒状态,其中,所述第一语音输入包括预定语音输入和表征所述用户需求的语音输入。
根据本公开的实施例,上述参数信息包括所述语音交互装置的性能参数,上述语音交互装置还包括:性能参数获取模块,用于在所述参数信息发送模块向所述控制装置发送所述参数信息之前,获取所述性能参数。
根据本公开的实施例,上述参数信息还包括所述用户的位置信息,上述语音交互装置还包括:位置信息确定模块,用于根据采集的所述用户的第一语音输入,确定所述用户的位置信息,其中,所述用户的位置信息表征所述用户相对于所述语音交互装置的位置。
根据本公开的实施例,上述参数信息包括语音交互装置的操作信息,所述非唤醒指令包括睡眠指令和休眠指令,其中:在所述操作信息表征所述语音交互装置执行第一操作的情况下,所述指令接收模块接收到的非唤醒指令为所述睡眠指令,所述状态切换模块响应于所述睡眠指令将当前状态切换至睡眠状态,所述睡眠状态包括执行所述第一操作且对采集的所述用户的语音输入不作响应的状态;在所述操作信息表征所述语音交互装置未执行第一操作的情况下,所述指令接收模块接收到的非唤醒指令为所述休眠指令,所述状态切换模块响应于所述休眠指令将当前状态切换至休眠状态,所述休眠状态包括不执行任何操作的状态。
根据本公开的实施例,上述语音交互装置还包括:第二语音信息确定模块,用于在处于所述唤醒状态,且采集到所述用户的第二语音输入的情况下,确定所述第二语音输入对应的第一语音信息是否为通用语音信息;第二语音信息发送模块,用于在确定所述第一语音信息为通用语音信息的情况下,向所述控制装置发送第一语音信息;并且或者,上述语音交互装置还包括:第二语音信息接收模块,用于接收所述控制装置发送的属于所述通用语音信息的第二语音信息;以及操作执行模块,用于根据所述第二语音信息,执行第二操作,所述第二操作与所述第二语音信息对应的语音输入相对应。
根据本公开的实施例,上述语音交互装置还包括恢复请求发送模块,用于在处于唤醒状态、且采集到所述用户的第三语音输入或在预设时段内未采集到用户的语音输入的情况下,向所述控制装置发送恢复请求;并且/或者所述指令接收模块还用于接收所述控制装置发送的恢复指令;所述状态切换模块还用于响应于所述恢复指令,将当前状态切换至采集所述第一语音输入之前的状态。
根据本公开的实施例,上述语音交互装置还包括:第二进度信息发送模块,用于在处于唤醒状态,且执行第三操作的情况下,响应于所述控制装置发送的同步请求,向所述控制装置发送所述第三操作的执行进度信息。
根据本公开的实施例,上述语音交互装置还包括:获取请求发送模块,用于在处于所述唤醒状态、且采集到所述用户的第四语音输入的情况下,向所述控制装置发送获取请求;第二进度信息接收模块,用于接收所述控制装置响应于所述获取请求发送的所述执行进度信息;以及操作执行模块,用于根据所述执行进度信息,执行所述第三操作,其中,所述第三操作与所述第四语音输入相对应。
本公开的第五方面提供了一种电子设备,包括上述的控制装置和上述的语音交互装置。
本公开的第六方面提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行上述的控制装置的操作方法,和/或上述的语音交互装置的操作方法。
本公开的另一个方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的智能家居系统的控制方法。
本公开的另一个方面提供了一种计算机程序,该计算机程序包括计算机可执行指令,该指令在被执行时用于实现如上所述的控制装置的操作方法,和/或上述的语音交互装置的操作方法。
根据本公开的实施例,可以至少部分地解决现有技术中多个语音交互设备会同时响应于用户同一时刻的唤醒词而被唤醒,从而导致用户与智能设备的交互场景嘈杂混乱的技术问题,并因此通过根据多个语音交互装置发送的多个参数信息,确定一个语音交互装置作为唯一被唤醒的装置的技术方案,避免嘈杂的交互环境,从而提高用户体验。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的控制装置及其操作方法,和语音交互装置及其操作方法的应用场景;
图2A示意性示出了根据本公开实施例的控制装置的操作方法的流程图;
图2B示意性示出了根据本公开实施例的确定第一语音交互装置的操作流程图;
图2C示意性示出了根据本公开实施例的向其他语音交互装置发送非唤醒指令的操作流程图;
图3示意性示出了根据本公开第二实施例的控制装置的操作方法的流程图;
图4示意性示出了根据本公开第三实施例的控制装置的操作方法的流程图;
图5A示意性示出了根据本公开第四实施例的控制装置的操作方法的流程图;
图5B示意性示出了图5A所示的操作方法的应用场景图;
图5C示意性示出了根据本公开第五实施例的控制装置的操作方法的流程图;
图6A示意性示出了根据本公开第一实施例的语音交互装置的操作方法的流程图;
图6B示意性示出了根据本公开第二实施例的语音交互装置的操作方法的流程图;
图7A示意性示出了根据本公开第三实施例的语音交互装置的操作方法的流程图;
图7B示意性示出了根据本公开第四实施例的语音交互装置的操作方法的流程图;
图8示意性示出了根据本公开第五实施例的语音交互装置的操作方法的流程图;
图9A示意性示出了根据本公开第六实施例的语音交互装置的操作方法的流程图;
图9B示意性示出了根据本公开第七实施例的语音交互装置的操作方法的流程图;
图10示意性示出了根据本公开实施例的控制装置的结构框图;
图11示意性示出了根据本公开实施例的语音交互装置的结构框图;
图12示意性示出了根据本公开实施例的适于执行控制装置的操作方法,或语音交互装置的操作方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
本公开的实施例提供了一种能够提高交互体验的控制装置的操作方法,该方法包括:接收多个语音交互装置分别发送的多个参数信息,该多个参数信息是多个语音交互装置在采集到用户同一时刻的第一语音输入的情况下发送的;根据第一语音输入,确定用户的需求信息;根据多个参数信息及需求信息,确定多个语音交互装置中的第一语音交互装置为与用户交互的装置;以及向第一语音交互装置发送唤醒指令,并向多个语音交互装置中除第一语音交互装置外的其他语音交互装置发送非唤醒指令。其中,第一语音输入包括预定语音输入和表征用户需求的语音输入。
本公开的另一实施例提供了一种能够提高交互体验的语音交互装置的操作方法,该方法包括:在采集到用户的第一语音输入的情况下,向控制装置发送参数信息,以确定语音交互装置是否为第一语音交互装置;在语音交互装置是第一语音交互装置的情况下,接收控制装置发送的唤醒指令,以响应于唤醒指令处于唤醒状态;在语音交互装置不是第一语音交互装置的情况下,接收控制装置发送的非唤醒指令,以响应于非唤醒指令处于非唤醒状态,其中,第一语音输入包括预定语音输入和表征所述用户需求的语音输入。
图1示意性示出了根据本公开实施例的控制装置及其操作方法,和语音交互装置及其操作方法的应用场景。需要说明的是,图1所示仅为可以应用本公开实施例的应用场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,该应用场景100包括多个语音交互装置、网络120和用户130,其中,网络120例如可以是局域网络、具体例如可以是无线网络等。
其中,多个语音交互装置中的至少两个装置之间例如可以通过网络120进行交互,该多个语音交互装置是能够与用户通过语音进行交互的智能电子设备。
具体地,该多个语音交互装置例如可以是智能家居设备,具体可以包括智能灯具111、智能电视、智能机顶盒、智能音箱、智能空调112、智能热水器113、智能冰箱114、智能窗帘、智能洗衣机115、智能空气净化器、智能游戏机和智能投影仪等;或者,具体例如可以包括智能卫浴设备,例如智能花洒、智能浴缸、智能浴霸、智能梳妆镜、智能马桶等;或者,具体例如还可以包括智能厨具设备,例如智能抽油烟机、智能热水壶、智能燃气罩、智能橱柜、智能洗碗机、智能微波炉和智能烤箱等。
根据本公开的实施例,该多个语音交互装置可以接收用户的语音输入,并且可以在语音输入包括唤醒词(例如“叮咚叮咚”等)的情况下,可以响应于该语音输入而切换至唤醒状态,以接收用户指令,并根据用户指令执行相应操作。
根据本公开的实施例,该多个语音交互装置例如还具有传感器,例如声音传感器或距离传感器等,以用于在接收到用户的语音输入的情况下,根据声音来源或红外检测实现对用户的定位,以测得用户相对于其自身的位置信息。
根据本公开的实施例,该多个语音交互装置例如还可以与提供网络120的网络设备进行交互,用于将测得的位置信息发送给网络设备,以由网络设备根据位置信息确定与用户交互的第一语音交互装置,使得该多个语音交互装置在网络设备的控制下进行工作。
根据本公开的实施例,用户130例如还可以通过其他电子设备中安装的应用程序对该多个语音交互装置进行控制,且可以通过该应用程序设定该多个语音交互装置中的一个语音交互装置为控制装置,其余装置为受控装置,则该多个语音交互装置将根据语音输入测得的位置信息发送给控制装置,以由控制装置根据位置信息确定与用户交互的第一语音交互装置,使得该多个语音交互装置在设定的控制装置的控制下进行工作。
例如,如图1所示,当用户130说出包括唤醒词“叮咚叮咚,帮我播放稻香”的语音时,多个语音交互装置智能灯具111、智能空调112、智能热水器113、智能冰箱114和智能洗衣机115中的部分或全部均可接收到该语音输入,则接收到该语音输入的语音交互装置将参数信息(可以包括自身的功能信息和/或检测到的用户的位置信息)发送给网络设备或确定的控制装置,网络设备或确定的控制装置根据接收的参数信息,确定具有音乐播放功能且距离用户较近的智能冰箱114为第一语音交互装置,以用于与用户130进行交互,智能冰箱114在该网络设备或确定的控制装置的控制下被唤醒,而智能灯具111、智能空调112、智能热水器113和智能洗衣机115则在该网络设备或确定的控制装置的控制下保持非唤醒状态,从而可以避免多个语音交互装置均被唤醒导致的语音交互场景嘈杂混乱的缺陷,提高用户体验。
需要说明的是,本公开实施例所提供的控制装置的操作方法一般可以由确定的控制装置执行,语音交互装置的操作方法可以由多个语音交互装置中任意一个装置执行。相应地,本公开实施例所提供的控制装置一般可以设置于网络设备或任意一个语音交互装置中(例如确定的控制装置中),语音交互装置可以是参考图1中的语音交互装置111~115。本公开实施例所提供的控制装置的操作方法也可以由不同于语音交互装置且能够与语音交互装置通信的其他电子设备执行。相应地,本公开实施例所提供的控制装置也可以设置于不同于语音交互装置且能够与语音交互装置通信的其他电子设备中。
可以理解的是,图1中的语音交互装置和网络120的类型和数目仅仅是示意性的,根据实现需要,可以具有任意类型和任意数目的语音交互装置和云端设备。
图2A示意性示出了根据本公开实施例的控制装置的操作方法的流程图,图2B示意性示出了根据本公开实施例的确定第一语音交互装置的操作流程图,图2C示意性示出了根据本公开实施例的向其他语音交互装置发送非唤醒指令的操作流程图。
如图2A所示,该控制装置的操作方法包括操作S201~操作S204。
在操作S201,接收多个语音交互装置分别发送的多个参数信息。
具体地,多个参数信息具体可以是在多个语音交互装置接收到某个用户在同一时刻的第一语音输入的情况下发送的。相应地,语音交互装置具有语音采集功能,例如设置有语音采集器等,该多个语音交互装置可以是空间范围内能够采集到用户的第一语音输入的语音交互装置,例如,若用户家中具有n个语音交互装置,则操作S201中涉及的多个语音交互装置为该n个语音交互装置中的部分或全部。例如,该多个语音交互装置可以是参考图1中的智能灯具111、智能空调112、智能热水器113、智能冰箱114和智能洗衣机115中的部分或全部。
其中,当用户发出语音指令“叮咚叮咚、帮我播放稻香”时,多个语音交互装置111~115均可通过采集该语音指令,接收到第一语音输入。则多个语音交互装置111~115在接收到第一语音输入时,即分别向控制装置发送参数信息,以供控制装置接收。
根据本公开的实施例,所述的第一语音输入具体可以包括有预定语音输入和表征用户需求的语音输入。其中,预定语音输入例如可以是语音交互装置的唤醒词(例如“叮咚叮咚”)对应的语音输入。该唤醒词例如可以是语音交互装置出厂时预设的唤醒词,也可以是用户自定义设定的唤醒词。其中的表征用户需求的语音输入则为除了唤醒词外的其他语音对应的语音输入,例如可以为“帮我播放稻香”等。
根据本公开的实施例,所述参数信息例如可以包括语音交互装置的属性参数和/或性能参数等,其中属性参数例如可以包括语音交互装置的品牌、型号等,性能参数例如可以包括语音交互装置的功能(例如播放音乐、播放视频、控温、照明灯)、及语音交互装置的工作参数(例如光照亮度、音质、屏幕分辨率、温度调节范围等)。
在操作S202,根据多个所述第一语音输入,确定所述用户的需求信息。
根据本公开的实施例,当控制装置集成于某个语音交互装置时,则该某个语音交互装置还可以在采集得到第一语音输入后,对第一语音输入进行语音识别分析,从而得到用户的需求信息。其中用户的需求信息具体是通过识别分析第一语音输入中表征用户需求的语音输入得到的。例如,当表征用户需求的语音输入为“帮我播放稻香”时,得到的需求信息例如可以为播放音乐;当表征用户需求的语音输入为“帮我播放无损音乐时”,得到的需求信息例如可以为播放音乐和高音质等。其中,识别分析语音的具体实现方法可以采用现有技术中任意的语音识别方法,本公开对此不作限定。
在操作S203,根据多个参数信息及需求信息,确定多个语音交互装置中的第一语音交互装置为与所述用户交互的装置。
根据本公开的实施例,在多个参数信息包括性能参数的情况下,该操作S203具体例如可以包括:先确定多个参数信息与需求信息的匹配关系,然后确定参数信息与需求信息匹配的语音交互装置为第一语音交互装置。例如,当需求信息为播放音乐时,可以确定表征具有音乐播放功能的参数信息与需求信息相匹配,则该参数信息对应的语音交互装置即为第一语音交互装置。当需求信息为播放音乐和高音质时,首先确定表征具有音乐播放功能的参数信息与需求信息相匹配,再确定表征音质高的参数信息与需求信息的匹配度更高,则可以确定匹配度高的参数信息对应的语音交互装置为第一语音交互装置。
根据本公开的实施例,为了在性能参数与需求信息匹配的语音交互装置有多个时,能够择一的选择第一语音交互装置,从而进一步避免多个语音交互装置响应于用户的指令导致的环境嘈杂的情况。语音交互装置发送的参数信息例如还可以包括用于表征用户相对于语音交互装置的位置的用户的位置信息。
相应地,该多个语音交互装置例如还应具有对采集得到的语音输入进行分析处理的功能。具体地,语音交互装置可以在采集到用户的语音输入后,根据语音信号的强弱来确定用户相对于其自身的距离远近。则发送的参数信息中包括的位置信息可以是距离值。或者,该多个语音交互装置还可以设置有能够对用户进行定位的传感器,且该传感器工作的触发条件为语音交互装置采集到第一语音输入,该传感器例如可以是通过语音交互装置采集到的语音输入的声音来源实现对用户的定位,或者还可以是通过红外检测等技术实现对用户的定位,以获取用户信息包括的用户的位置信息,该位置信息可以是距离值,或者是以语音交互装置所在位置为原点定位得到的用户所在位置的坐标值。可以理解的是,上述用户的位置信息仅作为示例以利于理解本公开,该位置信息例如还可以包括确定的用户所在的空间。
则如图2B所示,操作S203具体可以包括操作S213~操作S223。在操作S213,确定多个语音交互装置中性能参数与用户的需求信息匹配的至少一个第二语音交互装置;在操作S223,根据至少一个第二语音交互装置发送的参数信息中的用户的位置信息,确定至少一个第二语音交互装置中的一个为第一语音交互装置。具体可以是,先根据多个语音交互装置的性能参数,确定能够满足用户需求的第二语音交互装置。然后选择位置信息表征距离用户最近的第二语音交互装置为第一语音交互装置。
根据本公开的实施例,该操作S203确定的第一语音交互装置例如可以是参考图1中描述的智能冰箱114,在此不再赘述。
在操作S204,向第一语音交互装置发送唤醒指令,并向多个语音交互装置中除第一语音交互装置外的其他语音交互装置发送非唤醒指令。
根据本公开的实施例,由于向第一语音交互装置发送的是唤醒指令,则第一语音交互装置可以响应于该唤醒指令由接收第一语音输入之前的状态切换至唤醒状态;而由于向其他语音交互装置发送的是非唤醒指令,因此,其他语音交互装置可以由接收第一语音输入之前的状态切换至非唤醒状态。
根据本公开的实施例,非唤醒状态例如可以是不对第一语音输入做出任何响应的状态;或者,该非唤醒状态例如还可以是语音交互装置不执行任何操作的状态,即类似于关机的状态。
根据本公开的实施例,上述操作S204具体可以是,向参考图1中的智能冰箱114发送唤醒指令,则该智能冰箱114响应于该唤醒指令被唤醒,可以与用户进行语音交互,而向智能灯具111、智能空调112、智能热水器113和智能洗衣机115中接收到第一语音输入的语音交互装置发送的是非唤醒指令,则该些语音交互装置响应于该非唤醒指令切换至非唤醒状态,即无法与用户进行语音交互的状态。
根据本公开的实施例,考虑到其他语音交互装置中可能有部分语音交互装置在采集到第一语音输入之前执行的操作是类似于照明、供冷等不影响第一语音交互装置与用户交互过程的操作,例如不会发出声音的操作。此种情况下,若直接将该部分语音交互装置切换至类似于关机的状态,可能会影响用户体验。例如,在用户位于黑暗的空间中发出“叮咚叮咚,帮我播放稻香”的语音指令之前,位于该黑暗空间中的智能灯具111执行照明操作,此时若在确定第一语音交互装置为智能冰箱114时,向智能灯具111发出指令使该智能灯具111切换至不执行任何操作的状态(即不执行照明操作的状态),无疑会给用户带来较差的体验。
为了避免上述缺陷,如图2C所示,该操作S204发出的非唤醒指令例如可以包括休眠指令和睡眠指令,且多个语音交互装置发送的参数信息还可以包括语音交互装置的操作信息,以用于表征语音交互装置在采集得到第一语音输入时执行的操作。相应地,操作S204具体例如可以包括操作S214~操作S224。
在操作S214,根据其他语音交互装置的操作信息,确定其他语音交互装置在采集第一语音输入时是否执行第一操作;在操作S224,向执行第一操作的其他语音交互装置发送睡眠指令,向未执行第一操作的其他语音交互装置发送休眠指令。其中,第一操作具体可以是不影响第一语音交互装置与用户交互过程的操作,该第一操作包括的操作类型可以根据实际需求进行设定。在其他语音交互装置接收到睡眠指令时,可以响应于睡眠指令切换到睡眠状态,该睡眠状态具体可以是能够执行第一操作,能够采集语音输入,但对采集到的用户的语音输入不作响应的状态。在其他语音交互装置接收到休眠指令时,可以响应于休眠指令切换到休眠状态。休眠状态可以是不执行任何操作的状态,例如可以为关机状态。
综上可知,本公开的控制装置的操作方法通过接收的参数信息确定多个语音交互装置中的唯一的装置作为被唤醒的装置,用于与用户进行交互,相较于现有技术中多个语音交互装置均被唤醒的技术方案,可以避免多个语音交互装置同时与用户进行交互导致的交互场景嘈杂混乱的缺陷,并因此提高用户体验。
图3示意性示出了根据本公开第二实施例的控制装置的操作方法的流程图。
根据本公开的实施例的控制装置的操作方法除了图2A描述的操作S201~操作S204外,如图3所示,还可以包括操作S305~操作S307。
在操作S305,接收第一语音交互装置在采集到用户的第二语音输入的情况下发送的第一语音信息。其中,第一语音信息与第二语音输入相对应。
其中第二语音输入具体可以是与用于向多个语音交互装置发送指令的语音对应的语音输入,其中的指令具体可以是类似于“关闭所有设备”、或者“我要出门了”等用户发出的、多个语音交互装置可以通用的、且需要多个语音交互装置响应的语音指令,由于该语音指令需要多个语音交互装置协同工作才能达到用户想要的效果,因此,若仅第一语音交互装置响应于该第二语音输入对应的第二语音信息执行相应操作,则不能很好的满足用户的需求。
根据本公开的实施例,在第一语音交互装置切换至唤醒状态后,即可实时的采集用户的语音输入,并响应于用户的语音输入,执行相应的操作。考虑到上述问题,当采集到的用户的语音输入为第二语音输入时,先由第一语音交互装置确定对应的第一语音信息是否为通用语音信息,即多个语音交互装置可以通用的、且需要多个语音交互装置共同响应的语音信息;若是通用语音信息,则应该向控制装置发送该第二语音输入对应的第一语音信息,以通知控制装置该语音指令需要多个语音交互装置共同完成。具体地,云端系统或第一语音交互装置预先存储有通用语音信息列表,以作为确定是否为通用语音信息的参考。
其中的第一语音信息具体例如可以是与第二语音输入对应的,能够表征该第二语音输入的、电子设备能够识别的信息,例如可以是将第二语音输入转换得到的二进制编码或字符序列等;或者对语音输入进行识别处理后,再转换得到的二进制编码或字符序列等。
在操作S306,确定第一语音信息是否为通用语音信息。
根据本公开的实施例,该操作S306具体可以是将第一语音信息与云端系统中存储的或控制装置预存储的通用语音信息列表进行比对,若该第一语音信息是通用语音列表中的信息,则确定该第一语音信息是通用语音信息;或者,操作S306具体还可以通过以下操作实现:将第一语音信息作为预训练得到的深度学习模型的输入,输出得到的结果即为二分类结果,可以表征是通用语言信息或不是通用语言信息。可以理解的是,上述方法仅为实现操作S306的示例,本公开对此不作限定。还可以理解的是,该控制装置通过再次判断第一语音信息是否为通用语音信息,可以避免控制装置与第一语音交互装置存储的通用语音信息存在差异的情况导致的判断结果不准确的缺陷。
在操作S307,在第一语音信息为通用语音信息的情况下,向多个语音交互装置发送第一语音信息,以使多个语音交互装置执行与第二语音输入相对应的操作。
考虑到该属于通用语音信息的第一语音信息对应的第二语音输入的语音指令需要多个语音交互装置协同操作才能满足用户的需求,因此,在确定了第一语音信息是通用语音信息的情况下,将该第一语音信息发送至多个语音交互装置,通过多个语音交互装置响应于该第一语音信息的操作即可完成与用户需求相同的活动,满足用户需求,例如当第二语音输入为“我要出门”或“关闭所有设备”时,能够表征用户的意图为关闭所有语音交互装置,则该多个语音交互装置通过执行与第一语音信息对应的操作,例如关机操作,即可满足用户的需求,从而在保证交互场景不嘈杂混乱的同时,可使得语音交互装置的响应操作更为符合用户需求。
根据本公开的实施例,在上述应用场景中,为了避免本身处于关机状态的语音交互装置在接收到第一语音信息后因再次执行对应的操作而开机。语音交互装置在接收到所述第一语音信息后,例如还可以根据当前状态来确定是否执行与第二语音输入对应的操作。若当前状态与第一语音信息相匹配,则执行与第二语音输入对应的操作,若当前状态与第一语音信息不匹配,则不执行与第二语音输入对应的操作。
图4示意性示出了根据本公开第三实施例的控制装置的操作方法的流程图。
根据本公开的实施例,在第一语音交互装置在采集到用户的第三语音输入或在预设时段内未采集到用户的语音输入的情况下,考虑到可能用户此时不再需要与该第一语音交互装置进行交互。或者,在预设时段内未采集到用户的语音输入的情况下,还可以向用户发出类似于“主人,主人,您还在听吗?”或“主人,您还在吗?”的询问语音,在发出询问语音后依旧未采集到用户的语音输入的情况下,可以确定用户此时不再需要与该第一语音交互装置进行交互。其中,第三语音输入具体可以是用户发出的类似于“休眠”等指令对应的语音输入。
此种情况下,考虑到在第一语音交互装置和/或其他语音交互装置接收第一语音输入之前可能在执行播放广播或音乐等操作,而用户往往希望在结束与第一语音交互装置的交互后,第一语音交互装置和/或其他语音交互装置能够继续播放广播或音乐等操作,因此,在第一语音交互装置确定用户不再需要与第一语音交互装置进行交互后,可以向控制装置发送表征结束交互的恢复请求。
相应地,本公开实施例的控制装置的操作方法除了图2A描述的操作S201~操作S204外,如图4所示,还可以包括S408~操作S409。在操作S408,接收第一语音交互装置发送的恢复请求,该恢复请求由第一语音交互装置在采集到用户的第三语音输入或预设时段内未采集到用户的语音输入的情况下发送;以及在操作S409,向多个语音交互装置发送恢复指令,以使多个语音交互装置恢复至采集用户的第一语音输入之前的状态。具体即为,使多个语音交互装置恢复至其在采集第一语音输入之前的播放音乐或广播等的状态,以继续执行向用户播放广播或音乐等操作,满足用户需求。
图5A示意性示出了根据本公开第四实施例的控制装置的操作方法的流程图。
本公开实施例的控制装置的操作方法除了图2A描述的操作S201~操作S204外,如图5A所示,还可以包括操作S510~操作S512。
在操作S510,监听第一语音交互装置的操作,确定第一语音交互装置是否执行第三操作。在操作S511,在第一语音交互装置执行第三操作的情况下,向第一语音交互装置发送同步请求;在操作S512,接收第一语音交互装置响应于同步请求发送的第三操作的执行进度信息。
根据本公开的实施例,在确定了第一语音交互装置,且第一语音交互装置切换至唤醒状态后,控制装置例如还可以实时的监听所述第一语音交互装置的操作,并实时的确定监听到的操作是否为第三操作。其中第三操作具体可以是响应于用户的语音输入,执行所需的时长大于预设时长的操作,例如可以是播报类的操作,例如播放音乐、朗读电子书、播放广播或播放视频等;或者具有复杂流程类的操作,例如网上购物等。
发送同步请求后,即可接收到第一语音交互装置响应于该同步请求发送的第三操作的执行进度信息,该执行进度信息可以是该第三操作已执行的时长,或者该第三操作已执行的时长占该第三操作执行所需的总时长的比例等。根据本公开的实施例,在接收到该第三操作的执行进度信息后,例如还可以存储并更新已存储的进度信息。
图5B示意性示出了图5A所示的控制装置的操作方法的应用场景图;图5C示意性示出了根据本公开第五实施例的控制装置的操作方法的流程图。
如图5B所示,本公开的实施例的控制装置的操作方法例如可以应用于家庭场景中,其中,在客厅501、卧室502、卧室503和卧室504中均配置有智能音箱,则图2A中描述的多个语音交互设备即可以是该客厅501、卧室502、卧室503和卧室504中配置的智能音箱,则当用户在客厅501中说出包括唤醒词的语音指令时,该四个智能音箱即可采集到第一语音输入,并通过操作S201~操作S204,将客厅501中的智能音箱唤醒。
根据本公开的实施例,当用户自图5B中左侧图所示的客厅501位置移动到图5B中右侧图所示的卧室502时,用户一般会需要将卧室502中的智能音箱唤醒,而将客厅501中的智能音箱休眠,因此,会再此说出包括唤醒词的语音指令,则多个语音交互装置中能够采集到该唤醒词的语音输入的装置会向控制装置再次发送参数信息。因此,本公开实施例的控制装置的操作方法除了图2A所示的操作S201~操作S204外,例如还可以包括图5C所示的操作S513:在再次接收到多个语音交互装置中至少一个语音交互装置分别发送的至少一个参数信息的情况下,重新确定第一语音交互装置。具体可以是重复执行操作S201~操作S203来重新确定第一语音交互装置。在图5B的应用场景中,重新确定的第一语音交互装置即为卧室502中的智能音箱,类似的,在重新确定该第一语音交互装置后,该方法还可以向重新确定的第一语音交互装置(卧室502中的智能音箱)发送唤醒指令,以使重新确定的第一语音交互装置切换至唤醒状态,而向除该重新确定的第一语音交互装置外的接收到该第一语音输入的其他装置发送非唤醒指令,以使之前确定的第一语音交互装置(例如客厅501中的智能音箱)及其他装置切换至非唤醒状态。
根据本公开的实施例,在用户再次提供包括唤醒词的语音指令时,之前确定的第一语音交互装置例如还可能由于距离用户过远而采集不到再次提供的语音指令。此种情况下,控制装置的操作方法也可以在重新确定第一语音交互装置后,向当前处于唤醒状态的第一语音交互装置发送休眠指令,以使之前的第一语音交互装置切换至休眠状态,避免额外电能的消耗。
根据本公开的实施例,在用户指示第一语音交互装置执行图5A描述的第三操作,即用户听音乐,或者听广播等持续时间较长的内容时,在自客厅501移动至卧室502后,在唤醒卧室502中的智能音箱,休眠客厅501中的智能音箱的同时,会比较希望卧室502中的智能音箱能够接着客厅501中的智能音箱的执行进度继续执行播放等操作,因此,本公开实施例的控制装置的操作方法还可以包括图5C描述的操作S514~操作S515。
在操作S514,接收重新确定后的第一语音交互装置在采集到用户的第四语音输入的情况下发送的获取请求;在操作S515,响应于重新确定后的第一语音交互装置的获取请求,向重新确定后的第一语音交互装置发送所述执行进度信息。
其中,考虑到用户希望卧室502中的智能音箱能够接着客厅501中的智能音箱的执行进度继续执行播放等操作,且根据图5A描述的控制装置的操作方法可知,控制装置实时接收有第三操作的执行进度信息,因此,通过上述操作S514~操作S515,在用户可以发出“继续”、或“继续播放”等指令时,卧室502中的智能音箱可以在采集到与该指令相应的第四语音输入的情况下向控制装置发送获取请求,以获取第三操作的执行进度信息,并根据获取的执行进度信息继续执行第三操作。
综上可知,本公开实施例的控制装置的操作方法响应于用户的语音输入,可以由重新确定的第一语音交互装置继续执行之前的第一语音交互装置未完成的第三操作,从而可以使得多个语音交互装置构成的智能系统可以为用户提供流畅的服务,避免部分操作的重复执行,因此可以避免浪费用户时间的缺陷,有效提高用户体验。
图6A示意性示出了根据本公开第一实施例的语音交互装置的操作方法的流程图,图6B示意性示出了根据本公开第二实施例的语音交互装置的操作方法的流程图。
如图6A所示,该语音交互装置的操作方法包括操作S601。
在操作S601,向控制装置发送参数信息。
根据本公开的实施例,该操作S601具体可以是在语音交互装置采集到用户的第一语音输入的情况下执行的,以使得控制装置根据该参数信息确定语音交互装置是否为第一语音交互装置。
根据本公开的实施例,第一语音输入具体可以包括预定语音输入和表征用户需求的语音输入,具体详见对图2A中操作S201的描述部分,在此不再赘述。
根据本公开的实施例,所述的参数信息例如可以包括语音交互装置的性能参数。此种情况下,如图6B所示,语音交互装置的操作方法在执行操作S601之前,例如还可以包括操作S604,获取性能参数的操作。其中,性能参数具体可以是语音交互装置自本地获取的,或自向该语音交互装置提供服务的服务器或云端获取的。
根据本公开的实施例,为了便于控制装置能够更精准地确定唯一的第一语音交互装置,该参数信息例如还可以包括用户的位置信息。则如图6B,该操作方法在执行操作S601之前,还可以包括操作S605:根据采集的用户的第一语音输入,确定用户的位置信息。其中确定用户的位置信息的方法详见对图2C中位置信息的描述,在此不再详述。
根据本公开的实施例,参数信息例如不仅包括性能参数,还包括用户的位置信息,则如图6B所示,该语音交互装置的操作方法同时包括操作S604和操作S605。该操作S604可以在操作S605之前或之后执行,本公开对此不作限定,只要操作S604~操作S605均在操作S601之前执行即可。
根据本公开的实施例,考虑到在语音交互装置是第一语音交互装置的情况下,会接收到控制装置通过操作S204发送的唤醒指令。则如图6A所示,该语音交互装置的操作方法还可以包括操作S602,接收控制装置发送的唤醒指令,以响应于唤醒指令处于唤醒状态。该操作S602具体可以是:在接收到唤醒指令时,响应于唤醒指令,将当前状态切换至唤醒状态,以与用户进行交互。
根据本公开的实施例,考虑到在语音交互装置是第一语音交互装置的情况下,会接收到控制装置通过操作S204发送的非唤醒指令。则如图6A所示,该语音交互装置的操作方法还可以包括操作S603,接收控制装置发送的非唤醒指令,以响应于非唤醒指令处于非唤醒状态。该操作S603具体可以是:在接收到非唤醒指令时,响应于非唤醒指令,先确定当前状态是否为非唤醒状态,若不是,则响应于非唤醒指令,将当前状态切换至唤醒状态,以避免对用于的语音指令做出响应。
其中,在语音交互装置不是第一语音交互装置的情况下,接收到的非唤醒指令具体例如可以包括睡眠指令或休眠指令。相应地,为了避免语音交互装置在执行第一操作时,因接收到休眠指令而停止执行第一操作。操作S601发送的参数信息例如还可以包括有语音交互装置的操作信息。因此在操作信息表征语音交互装置执行第一操作的情况下,接收的非唤醒指令为控制装置通过图2C中的操作S224发送的睡眠指令,响应于该睡眠指令语音交互装置处于睡眠状态,即将当前状态切换至睡眠状态。在操作信息表征语音交互装置未执行第一操作的情况下,接收的非唤醒指令为控制装置通过图2C中的操作S224发送的休眠指令,响应于该休眠指令语音交互装置处于休眠状态,即将当前状态切换至休眠状态。其中,睡眠状态是指能够执行第一操作但对采集的用户的语音输入不作响应的状态;休眠状态指不执行任何操作的状态。
综上可知,本公开实施例的语音交互装置由控制装置控制切换其工作状态,而并非在采集到用户的唤醒词后直接切换工作状态至唤醒状态,且在其切换至唤醒状态的情况下,其他语音交互装置处于非唤醒状态,从而可以避免语音交互装置的工作环境嘈杂混乱的缺陷,并因此提高用户体验。且语音交互装置不是第一语音交互装置时,在执行第一操作时,接收到的控制装置的指令为能够继续执行第一操作的睡眠指令,从而可以在一定程度上提高用户体验。
图7A示意性示出了根据本公开第三实施例的语音交互装置的操作方法的流程图。
根据本公开的实施例,在该语音交互装置为第一语音交互装置的情况下,在切换至唤醒状态后,即可以与用户进行语音交互,以执行与用户的语音指令对应的操作。
根据本公开的实施例,考虑到用户的一些语音指令例如“关闭所有设备”、或者“我要出门了”,需要通过多个语音交互装置协同操作才能达到用户想要的效果,因此如图7A所示,本公开实施例的语音交互装置的操作方法在操作S602之后,还包括操作S706~操作S707。在操作S706,在采集到用户的第二语音输入的情况下,确定第二语音输入对应的第一语音信息是否为通用语音信息;以及在操作S707,在确定第二语音输入对应的第一语音信息是通用语音信息的情况下,向控制装置发送该第一语音信息,以使控制装置通过操作S305~操作S307将第一语音信息发送至采集到第一语音输入的多个语音交互装置,使多个语音交互装置执行与第二语音输入相对应的操作。
根据本公开的实施例,上述操作S707具体可以是先识别采集到的语音输入,例如可以是识别得到语音输入的关键词,在识别得到的关键词为预设关键词的情况下,确定采集到的语音输入是第二语音输入,然后确定该第二语音输入对应的第一语音信息是否为通用语音信息,具体可以是将第二语音输入对应的第一语音信息与语音交互装置中或云端系统中存储的通用语音信息列表进行比对,若第二语音输入对应的第一语音信息是通用语音信息列表中的语音信息的情况下,确定该第二语音输入对应的第一语音信息为通用语音信息;若第二语音输入对应的第一语音信息不是通用语音信息列表中的语音信息的情况下,确定该第二语音输入对应的第一语音信息不是通用语音信息。其中第二语音输入和第一语音信息可以是参考图3中操作S305和操作S306中描述的第二语音输入和第一语音信息,在此不再赘述。
根据本公开的实施例,通过上述操作S707将第二语音信息发送给控制装置后,控制装置即可以通过参考图3描述的操作S305~操作S307将第一语音信息发送给多个语音交互装置,以使多个语音交互装置通过执行与第二语音输入对应的操作,例如关机操作,来满足用户的需求,从而在保证交互场景不嘈杂混乱的同时,使得语音交互装置的响应操作更为符合用户需求。
图7B示意性示出了根据本公开第四实施例的语音交互装置的操作方法的流程图。
根据本公开的实施例,无论语音交互装置是否为第一语音交互装置,该语音交互装置均可接收控制装置通过操作S307发送的语音信息。相应地,如图7B所示,本公开实施例的语音交互装置的操作方法还可以包括操作S708~操作S709。在操作S708,接收控制装置发送的属于通用语音信息的第二语音信息;在操作S709,根据第二语音信息,执行第二操作,该第二操作是与第二语音信息对应的语音输入相对应的操作。
其中,在语音交互装置是第一语音交互装置的情况下,在图7A描述的操作S707之后执行操作S708~操作S709,此时,第二语音信息即为操作S707中发送的第一语音信息。
在语音交互装置不是第一语音交互装置的情况下,在图6A描述的操作S603之后执行操作S708~操作S709。此时,第二语音信息即为控制装置通过操作S306确定的为通用语音信息的第一语音信息。
图8示意性示出了根据本公开第五实施例的语音交互装置的操作方法的流程图。
在语音交互装置是第一语音交互装置,并切换至唤醒状态后,可以响应于用户的语音输入或自行判断后确定用户此时是否还需要与该语音交互装置进行交互。其中,确定用户是否还需要进行交互的实现方式详见上文描述,在此不再赘述。
此种情况下,考虑到在语音交互装置和/或其他语音交互装置接收第一语音输入之前可能在执行播放广播或音乐等操作,而用户往往希望在结束与语音交互装置的交互后,语音交互装置和/或其他语音交互装置能够继续播放广播或音乐等操作,因此,在语音交互装置确定用户不再需要进行交互后,可以向控制装置发送表征结束交互的恢复请求。因此如图8所示,本公开实施例的操作方法在操作S602之后,还可以包括操作S810,在采集到用户的第三语音输入或在预设时段内未采集到用户的语音输入的情况下,向控制装置发送恢复请求。
相应地,控制装置在接收到恢复请求后,即可通过操作S408~操作S409向多个语音交互装置发送恢复指令,使多个语音交互装置恢复至采集用户的所述第一语音输入之前的状态。具体可以是使多个语音交互装置恢复至采集第一语音输入之前的播放音乐或广播等的状态,以向用户继续播放广播或音乐,满足用户需求。
因此,如图8所示,无论语音交互装置是否为第一语音交互装置,均可执行操作S811,接收控制装置的恢复指令,以响应于恢复指令将当前状态切换至采集第一语音输入之前的状态。其中,在语音交互装置是第一语音交互装置的情况下,操作S811在操作S810之后执行。在语音交互装置不是第一语音交互装置的情况下,操作S811在操作S603之后执行。
图9A示意性示出了根据本公开第六实施例的语音交互装置的操作方法的流程图。
根据本公开的实施例,在语音交互装置通过操作S602切换至唤醒状态后,如图9A所示,本公开实施例的语音交互装置的操作方法还包括操作S912,在执行第三操作时,响应于控制装置发送的同步请求,向控制装置实时地发送第三操作的执行进度信息,以将第三操作的执行进度实时地更新于控制装置,则在图5B描述的应用场景中,控制装置在重新确定第一语音交互装置后即可执行图5C描述的操作S514~操作S515,以使得该第一语音交互装置在控制装置的控制下切换至非唤醒状态后,可以由重新确定的第一语音交互装置继续执行该第三操作,使得多个语音交互装置构成的智能系统可以为用户提供流畅的服务,避免部分操作的重复执行,并因此可以避免浪费用户时间的缺陷,有效提高用户体验,详细内容请参见对图5B~图5C的描述,在此不再赘述。
图9B示意性示出了根据本公开第七实施例的语音交互装置的操作方法的流程图。
根据本公开的实施例,而在该语音交互装置不是第一语音交互装置,并由操作S603切换至休眠状态后,同样可以采集用户再次发出的第一语音指令对应的第一语音输入,且在再次接收到用户的第一语音输入的情况下,通过类似于操作S601的操作重新向控制装置发送参数信息,以使控制装置通过操作S513重新确定第一语音交互装置。
根据本公开的实施例,在语音交互装置是重新确定后的第一语音交互装置,并响应于控制装置发送的唤醒指令切换至唤醒状态的情况下,如图9B所示,语音交互装置的操作方法还可以包括操作S913~操作S914。
在操作S913,在采集到用户的第四语音输入的情况下,向控制装置发送获取请求;在操作S914,接收控制装置响应于获取请求发送的第三操作的执行进度信息;以及在操作S915,根据所述执行进度信息,执行所述第三操作。其中,第四语音输入具体例如可以是与用户的语音指令“继续”或“继续播放”等对应的语音输入,具体详见对图5C中操作S514的描述,在此不再赘述。
综上可知,本公开实施例的语音交互装置通过上述操作S913~操作S915,可以使得重新确定的第一语音交互装置响应于用户的语音指令,继续执行原来的第一语音交互装置执行的第三操作,从而可避免部分操作的重复执行,并因此可以避免浪费用户时间的缺陷,有效提高用户体验。
图10示意性示出了根据本公开实施例的控制装置的结构框图。
如图10所示,该控制装置1000包括参数信息接收模块1001、需求信息确定模块1002、第一装置确定模块1003和指令发送模块1004。
参数信息接收模块1001用于接收多个语音交互装置分别发送的多个参数信息,该多个参数信息是多个语音交互装置在采集到用户同一时刻的第一语音输入的情况下发送的(操作S201)。
需求信息确定模块1002用于根据第一语音输入,确定用户的需求信息(操作S202)。其中,第一语音输入包括预定语音输入和表征用户需求的语音输入。
第一装置确定模块1003用于根据多个参数信息及需求信息,确定多个语音交互装置中的第一语音交互装置为与用户交互的装置(操作S203)。
指令发送模块1004用于向述第一语音交互装置发送唤醒指令,并向多个语音交互装置中除第一语音交互装置外的其他语音交互装置发送非唤醒指令(操作S204)。
根据本公开的实施例,上述参数信息包括语音交互装置的性能参数,第一装置确定模块1003具体用于:根据多个语音交互装置中每个语音装置的性能参数与需求信息的匹配关系,确定第一语音交互装置。
根据本公开的实施例,上述参数信息还包括所述用户的位置信息。如图10所示,第一装置确定模块1003可以包括第一确定子模块10031和第二确定子模块10032。第一确定子模块10031用于确定多个语音交互装置中性能参数与用户的需求信息匹配的至少一个第二语音交互装置(操作S213)。第二确定子模块10032用于根据至少一个第二语音交互装置发送的参数信息中的用户的位置信息,确定至少一个第二语音交互装置中的一个为第一语音交互装置(操作S223)。其中,用户的位置信息表征用户相对于语音交互装置的位置。
根据本公开的实施例,上述参数信息包括语音交互装置的操作信息,所述非唤醒指令包括睡眠指令和休眠指令。如图10所示,上述指令发送模块1004可以包括操作确定子模块10041和指令发送子模块10042。操作确定子模块10041用于根据其他语音交互装置的操作信息,确定其他语音交互装置在采集第一语音输入时是否执行第一操作(操作S214)。指令发送子模块10042用于向执行第一操作的其他语音交互装置发送睡眠指令,向未执行第一操作的其他语音交互装置发送休眠指令(操作S224)。其中,语音交互装置响应于所述睡眠指令处于睡眠状态,所述睡眠状态包括执行所述第一操作且对采集的所述用户的语音输入不作响应的状态;语音交互装置响应于所述休眠指令处于休眠状态,所述休眠状态包括不执行任何操作的状态。
根据本公开的实施例,如图10所示,上述控制装置1000例如还可以包括第一语音信息接收模块1005、第一语音信息确定模块1006和第一语音信息发送模块1007。第一语音信息接收模块1005用于接收第一语音交互装置在采集到用户的第二语音输入的情况下发送的第一语音信息,该第一语音信息与第二语音输入相对应(操作S305)。第一语音信息确定模块1006用于确定第一语音信息是否为通用语音信息(操作S306)。第一语音信息发送模块1007用于在第一语音信息为通用语音信息的情况下,向多个语音交互装置发送第一语音信息,以使多个语音交互装置执行与第二语音输入相对应的操作(操作S307)。
根据本公开的实施例,如图10所示,上述控制装置1000例如还可以包括恢复请求接收模块1008,该恢复请求接收模块1008用于接收第一语音交互装置发送的恢复请求,该恢复请求由第一语音交互装置在采集到用户的第三语音输入或预设时段内未采集到用户的语音输入的情况下发送(操作S408);相应地,上述指令发送模块1004还用于在恢复请求接收模块1008接收到恢复请求的情况下,向多个语音交互装置发送恢复指令,以使多个语音交互装置恢复至采集第一语音输入之前的状态(操作S409)。
根据本公开的实施例,如图10所示,上述控制装置1000例如还可以包括操作监听模块1009、同步请求发送模块1010和第一进度信息接收模块1011。操作监听模块1009用于在指令发送模块发送唤醒指令后,监听第一语音交互装置执行的操作,并确定第一语音交互装置是否执行第三操作(操作S510)。同步请求发送模块1010用于在确定第一语音交互装置执行第三操作的情况下,向第一语音交互装置发送同步请求(操作S511)。第一进度信息接收模块1011用于接收第一语音交互装置响应于同步请求发送的第三操作的执行进度信息(操作S512)。
根据本公开的实施例,上述第一装置确定模块1003还用于在参数信息接收模块1001再次接收到多个语音交互装置中至少一个语音交互装置分别发送的至少一个参数信息的情况下,重新确定第一语音交互装置(操作S513)。如图10所示,上述控制装置1000例如还可以包括获取请求接收模块1012和第一进度信息发送模块1013,获取请求接收模块1012用于接收重新确定后的第一语音交互装置在采集到用户的第四语音输入的情况下发送的获取请求(操作S514)。第一进度信息发送模块1013用于响应于重新确定后的第一语音交互装置的获取请求,向重新确定后的第一语音交互装置发送执行进度信息(操作S515)。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,参数信息接收模块1001、需求信息确定模块1002、第一装置确定模块1003、指令发送模块1004、第一语音信息接收模块1005、第一语音信息确定模块1006和第一语音信息发送模块1007、恢复请求接收模块1008、操作监听模块1009、同步请求发送模块1010、第一进度信息接收模块1011、获取请求接收模块1012、第一进度信息发送模块1013、第一确定子模块10031和第二确定子模块10032、操作确定子模块10041以及指令发送子模块10042中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,参数信息接收模块1001、需求信息确定模块1002、第一装置确定模块1003、指令发送模块1004、第一语音信息接收模块1005、第一语音信息确定模块1006和第一语音信息发送模块1007、恢复请求接收模块1008、操作监听模块1009、同步请求发送模块1010、第一进度信息接收模块1011、获取请求接收模块1012、第一进度信息发送模块1013、第一确定子模块10031和第二确定子模块10032、操作确定子模块10041以及指令发送子模块10042中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,参数信息接收模块1001、需求信息确定模块1002、第一装置确定模块1003、指令发送模块1004、第一语音信息接收模块1005、第一语音信息确定模块1006和第一语音信息发送模块1007、恢复请求接收模块1008、操作监听模块1009、同步请求发送模块1010、第一进度信息接收模块1011、获取请求接收模块1012、第一进度信息发送模块1013、第一确定子模块10031和第二确定子模块10032、操作确定子模块10041以及指令发送子模块10042中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图11示意性示出了根据本公开实施例的语音交互装置的结构框图。
如图11所示,该语音交互装置1100包括参数信息发送模块1101、指令接收模块1102和状态切换模块1103。
参数信息发送模块1101用于在采集到用户的第一语音输入的情况下,向控制装置发送参数信息,以确定语音交互装置是否为第一语音交互装置(操作S601)。其中,第一语音输入包括预定语音输入和表征用户需求的语音输入。
指令接收模块1102用于在语音交互装置是第一语音交互装置的情况下,接收控制装置发送的唤醒指令。状态切换模块1103用于在指令接收模块1102接收到唤醒指令的情况下,响应于唤醒指令,将当前状态切换为唤醒状态(操作S602)。或者,指令接收模块1102用于在语音交互装置不是第一语音交互装置的情况下,接收控制装置发送的非唤醒指令。状态切换模块1103用于在指令接收模块1102接收到非唤醒指令的情况下,响应于非唤醒指令,将当前状态切换为非唤醒状态(操作S603)。
根据本公开的实施例,上述参数信息包括所述语音交互装置的性能参数。如图11所示,上述语音交互装置1100例如还可以包括性能参数获取模块1104,用于在参数信息发送模块1101向控制装置发送参数信息之前,获取性能参数(操作S604)。
根据本公开的实施例,上述参数信息还包括所述用户的位置信息。如图11所示,上述语音交互装置1100例如还可以包括位置信息确定模块1105,用于根据采集的用户的第一语音输入,确定用户的位置信息(操作S605)。其中,用户的位置信息表征用户相对于语音交互装置的位置。
根据本公开的实施例,上述参数信息包括语音交互装置的操作信息,所述非唤醒指令包括睡眠指令和休眠指令。在所述操作信息表征语音交互装置执行第一操作的情况下,上述指令接收模块1102接收到的非唤醒指令为睡眠指令,状态切换模块1103响应于睡眠指令将当前状态切换至睡眠状态,睡眠状态包括执行第一操作且对采集的所述用户的语音输入不作响应的状态。或者,在操作信息表征语音交互装置未执行第一操作的情况下,上述指令接收模块1102接收到的非唤醒指令为休眠指令,状态切换模块1103响应于休眠指令将当前状态切换至休眠状态,休眠状态包括不执行任何操作的状态。
根据本公开的实施例,如图11所示,上述语音交互装置1100例如还可以包括第二语音信息确定模块1106和第二语音信息发送模块1107。第二语音信息确定模块1106用于在处于唤醒状态,且采集到用户的第二语音输入的情况下,确定第二语音输入对应的第一语音信息是否为通用语音信息(操作S706)。第二语音信息发送模块1107用于在确定第一语音信息为通用语音信息的情况下,向控制装置发送第一语音信息(操作S707)。并且/或者,如图11所示,上述语音交互装置1100例如还可以包括第二语音信息接收模块1108和操作执行模块1109。第二语音信息接收模块1108用于接收控制装置发送的属于通用语音信息的第二语音信息(操作S708)。操作执行模块1109用于根据第二语音信息,执行第二操作,该第二操作与第二语音信息对应的语音输入相对应(操作S709)。
根据本公开的实施例,如图11所示,上述语音交互装置1100例如还可以包括恢复请求发送模块1110,用于在处于唤醒状态、且采集到用户的第三语音输入或在预设时段内未采集到用户的语音输入的情况下,向控制装置发送恢复请求(操作S810)。并且/或者,指令接收模块1102还用于接收控制装置发送的恢复指令;状态切换模块1103还用于响应于恢复指令,将当前状态切换至采集第一语音输入之前的状态(操作S811)。
根据本公开的实施例,如图11所示,上述语音交互装置1100例如还可以包括第二进度信息发送模块1111,用于在处于唤醒状态,且执行第三操作的情况下,响应于控制装置发送的同步请求,向控制装置发送第三操作的执行进度信息(操作S912)。
根据本公开的实施例,如图11所示,上述语音交互装置1100例如还可以包括获取请求发送模块1112、第二进度信息接收模块1113和操作执行模块。获取请求发送模块1112用于在处于所述唤醒状态、且采集到用户的第四语音输入的情况下,向控制装置发送获取请求(操作S913)。第二进度信息接收模块1113用于接收控制装置响应于获取请求发送的执行进度信息(操作S914)。操作执行模块用于根据所述执行进度信息,执行所述第三操作(操作S915)。其中,第三操作与第四语音输入相对应,操作执行模块具体可以是上文描述的操作执行模块1109。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,参数信息发送模块1101、指令接收模块1102、状态切换模块1103、性能参数获取模块1104、位置信息确定模块1105、第二语音信息确定模块1106、第二语音信息发送模块1107、第二语音信息接收模块1108、操作执行模块1109、恢复请求发送模块1110、第二进度信息发送模块1111、获取请求发送模块1112以及第二进度信息接收模块1113中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,参数信息发送模块1101、指令接收模块1102、状态切换模块1103、性能参数获取模块1104、位置信息确定模块1105、第二语音信息确定模块1106、第二语音信息发送模块1107、第二语音信息接收模块1108、操作执行模块1109、恢复请求发送模块1110、第二进度信息发送模块1111、获取请求发送模块1112以及第二进度信息接收模块1113中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,参数信息发送模块1101、指令接收模块1102、状态切换模块1103、性能参数获取模块1104、位置信息确定模块1105、第二语音信息确定模块1106、第二语音信息发送模块1107、第二语音信息接收模块1108、操作执行模块1109、恢复请求发送模块1110、第二进度信息发送模块1111、获取请求发送模块1112以及第二进度信息接收模块1113中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
根据本公开的实施例,还提供了一种电子设备,该电子设备可以用于执行图2A~图5C描述的控制装置的操作方法,还可以用于执行参考图6A~图9B描述的语音交互装置的操作方法。相应地,该电子设备既包括参考图10描述的控制装置,也包括图11描述的语音交互装置,该电子设备可以是在参考图1描述的多个语音交互装置中的任意一个装置中集成控制装置形成的电子设备,或者,控制装置和语音交互装置可以是该电子设备中的两个功能模块,且该两个功能模块可以进行交互,在此不再赘述。
图12示意性示出了根据本公开实施例的适于执行控制装置的操作方法,或语音交互装置的操作方法的电子设备的方框图。图12示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图12所示,根据本公开实施例的电子设备1200包括处理器1201,其可以根据存储在只读存储器(ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(RAM)1203中的程序而执行各种适当的动作和处理。处理器1201例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器1201还可以包括用于缓存用途的板载存储器。处理器1201可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 1203中,存储有电子设备1200操作所需的各种程序和数据。处理器1201、ROM 1202以及RAM 1203通过总线1204彼此相连。处理器1201通过执行ROM 1202和/或RAM1203中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 1202和RAM 1203以外的一个或多个存储器中。处理器1201也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备1200还可以包括输入/输出(I/O)接口1205,输入/输出(I/O)接口1205也连接至总线1204。电子设备1200还可以包括连接至I/O接口1205的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被处理器1201执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 1202和/或RAM 1203和/或ROM 1202和RAM 1203以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (19)
1.一种控制装置的操作方法,包括:
接收多个语音交互装置分别发送的多个参数信息,所述多个参数信息是所述多个语音交互装置在采集到用户同一时刻的第一语音输入的情况下发送的;
根据所述第一语音输入,确定所述用户的需求信息;
根据所述多个参数信息及所述需求信息,确定所述多个语音交互装置中的第一语音交互装置为与所述用户交互的装置;以及
向所述第一语音交互装置发送唤醒指令,并向所述多个语音交互装置中除所述第一语音交互装置外的其他语音交互装置发送非唤醒指令,
其中,所述第一语音输入包括预定语音输入和表征所述用户需求的语音输入;
接收所述第一语音交互装置在采集到所述用户的第二语音输入的情况下发送的第一语音信息,所述第一语音信息与所述第二语音输入相对应;
确定所述第一语音信息是否为通用语音信息;以及
在所述第一语音信息为所述通用语音信息的情况下,向所述多个语音交互装置发送所述第一语音信息。
2.根据权利要求1所述的方法,其中,所述参数信息包括语音交互装置的性能参数,根据所述多个参数信息及所述需求信息,确定所述第一语音交互装置包括:
根据所述多个语音交互装置中每个语音装置的性能参数与所述需求信息的匹配关系,确定所述第一语音交互装置。
3.根据权利要求2所述的方法,其中,所述参数信息还包括所述用户的位置信息,所述根据所述多个语音交互装置中每个语音装置的性能参数与所述需求信息的匹配关系,确定所述第一语音交互装置包括:
确定所述多个语音交互装置中性能参数与所述用户的需求信息匹配的至少一个第二语音交互装置;以及
根据所述至少一个第二语音交互装置发送的参数信息中的用户的位置信息,确定所述至少一个第二语音交互装置中的一个为所述第一语音交互装置,
其中,所述用户的位置信息表征所述用户相对于语音交互装置的位置。
4.根据权利要求1所述的方法,其中,所述参数信息包括语音交互装置的操作信息,所述非唤醒指令包括睡眠指令和休眠指令,向所述其他语音交互装置发送非唤醒指令包括:
根据所述其他语音交互装置的操作信息,确定所述其他语音交互装置在采集所述第一语音输入时是否执行第一操作;以及
向执行所述第一操作的其他语音交互装置发送所述睡眠指令,向未执行所述第一操作的其他语音交互装置发送所述休眠指令,
其中,语音交互装置响应于所述睡眠指令处于睡眠状态,所述睡眠状态包括执行所述第一操作且对采集的所述用户的语音输入不作响应的状态;语音交互装置响应于所述休眠指令处于休眠状态,所述休眠状态包括不执行任何操作的状态。
5.根据权利要求1所述的方法,还包括:
接收所述第一语音交互装置发送的恢复请求,所述恢复请求由所述第一语音交互装置在采集到所述用户的第三语音输入或预设时段内未采集到所述用户的语音输入的情况下发送;以及
向所述多个语音交互装置发送恢复指令,以使所述多个语音交互装置恢复至采集所述第一语音输入之前的状态。
6.根据权利要求1所述的方法,其中,在向所述第一语音交互装置发送唤醒指令之后,所述方法还包括:
监听所述第一语音交互装置的操作,确定所述第一语音交互装置是否执行第三操作;
在所述第一语音交互装置执行所述第三操作的情况下,向所述第一语音交互装置发送同步请求;以及
接收所述第一语音交互装置响应于所述同步请求发送的所述第三操作的执行进度信息。
7.根据权利要求6所述的方法,还包括:
在再次接收到所述多个语音交互装置中至少一个语音交互装置分别发送的至少一个参数信息的情况下,重新确定第一语音交互装置;
接收所述重新确定后的第一语音交互装置在采集到所述用户的第四语音输入的情况下发送的获取请求;以及
响应于所述重新确定后的第一语音交互装置的获取请求,向所述重新确定后的第一语音交互装置发送所述执行进度信息。
8.一种语音交互装置的操作方法,包括:
在采集到用户的第一语音输入的情况下,向控制装置发送参数信息,以确定所述语音交互装置是否为第一语音交互装置;
在所述语音交互装置是第一语音交互装置的情况下,接收所述控制装置发送的唤醒指令,以响应于所述唤醒指令处于唤醒状态;
在所述语音交互装置不是第一语音交互装置的情况下,接收所述控制装置发送的非唤醒指令,以响应于所述非唤醒指令处于非唤醒状态,
其中,所述第一语音输入包括预定语音输入和表征所述用户需求的语音输入;
在所述语音交互装置处于唤醒状态、且采集到所述用户的第二语音输入的情况下,确定所述第二语音输入对应的第一语音信息是否为通用语音信息;以及
在确定所述第一语音信息为通用语音信息的情况下,向所述控制装置发送第一语音信息;并且/或者
所述方法还包括:
接收所述控制装置发送的属于所述通用语音信息的第二语音信息;以及
根据所述第二语音信息,执行第二操作,所述第二操作与所述第二语音信息对应的语音输入相对应。
9.根据权利要求8所述的方法,其中,所述参数信息包括所述语音交互装置的性能参数,在向控制装置发送参数信息之前,所述方法还包括:获取所述性能参数。
10.根据权利要求9所述的方法,其中,所述参数信息还包括所述用户的位置信息,在向控制装置发送参数信息之前,所述方法还包括:
根据采集的所述用户的第一语音输入,确定所述用户的位置信息,
其中,所述用户的位置信息表征所述用户相对于所述语音交互装置的位置。
11.根据权利要求8所述的方法,其中,所述参数信息包括语音交互装置的操作信息,所述非唤醒指令包括睡眠指令和休眠指令,其中:
在所述操作信息表征所述语音交互装置执行第一操作的情况下,接收到的非唤醒指令为所述睡眠指令,以响应于所述睡眠指令处于睡眠状态,所述睡眠状态包括执行所述第一操作且对采集的所述用户的语音输入不作响应的状态;
在所述操作信息表征所述语音交互装置未执行第一操作的情况下,接收到的所述非唤醒指令为所述休眠指令,以响应于所述休眠指令处于休眠状态,所述休眠状态包括不执行任何操作的状态。
12.根据权利要求8所述的方法,其中:
所述方法还包括:在所述语音交互装置处于唤醒状态、且采集到所述用户的第三语音输入或在预设时段内未采集到用户的语音输入的情况下,向所述控制装置发送恢复请求;并且/或者
所述方法还包括:接收所述控制装置发送的恢复指令,将当前状态切换至采集所述第一语音输入之前的状态。
13.根据权利要求8所述的方法,其中,所述方法还包括:
在所述语音交互装置处于唤醒状态、且执行第三操作的情况下,响应于所述控制装置发送的同步请求,向所述控制装置发送所述第三操作的执行进度信息。
14.根据权利要求13所述的方法,其中,上述方法还包括:
在所述语音交互装置处于唤醒状态、且采集到所述用户的第四语音输入的情况下,向所述控制装置发送获取请求;
接收所述控制装置响应于所述获取请求发送的所述执行进度信息;以及
根据所述执行进度信息,执行所述第三操作,
其中,所述第三操作与所述第四语音输入相对应。
15.一种控制装置,包括:
参数信息接收模块,用于接收多个语音交互装置分别发送的多个参数信息,所述多个参数信息是所述多个语音交互装置在采集到用户同一时刻的第一语音输入的情况下发送的;
需求信息确定模块,用于根据所述第一语音输入,确定所述用户的需求信息;
第一装置确定模块,用于根据所述多个参数信息及所述需求信息,确定所述多个语音交互装置中的第一语音交互装置为与所述用户交互的装置;以及
指令发送模块,用于向所述第一语音交互装置发送唤醒指令,并向所述多个语音交互装置中除所述第一语音交互装置外的其他语音交互装置发送非唤醒指令,
其中,所述第一语音输入包括预定语音输入和表征所述用户需求的语音输入;
第一语音信息接收模块,用于接收所述第一语音交互装置在采集到所述用户的第二语音输入的情况下发送的第一语音信息,所述第一语音信息与所述第二语音输入相对应;
第一语音信息确定模块,用于确定所述第一语音信息是否为通用语音信息;以及
第一语音信息发送模块,用于在所述第一语音信息为所述通用语音信息的情况下,向所述多个语音交互装置发送所述第一语音信息。
16.一种语音交互装置,包括:
参数信息发送模块,用于在采集到用户的第一语音输入的情况下,向控制装置发送参数信息,以确定所述语音交互装置是否为第一语音交互装置;
指令接收模块,用于:
在所述语音交互装置是第一语音交互装置的情况下,接收所述控制装置发送的唤醒指令;
在所述语音交互装置不是第一语音交互装置的情况下,接收所述控制装置发送的非唤醒指令;以及
状态切换模块,用于:
在所述指令接收模块接收到所述唤醒指令的情况下,响应于所述唤醒指令,将当前状态切换为唤醒状态;
在所述指令接收模块接收到所述非唤醒指令的情况下,响应于所述唤醒指令,将当前状态切换为非唤醒状态,
其中,所述第一语音输入包括预定语音输入和表征所述用户需求的语音输入;
所述装置还包括:
第二语音信息确定模块,用于在所述语音交互装置处于唤醒状态、且采集到所述用户的第二语音输入的情况下,确定所述第二语音输入对应的第一语音信息是否为通用语音信息;以及
第二语音信息发送模块,用于在确定所述第一语音信息为通用语音信息的情况下,向所述控制装置发送第一语音信息;并且/或者
所述装置还包括:
第二语音信息接收模块,用于接收所述控制装置发送的属于所述通用语音信息的第二语音信息;以及
操作执行模块,用于根据所述第二语音信息,执行第二操作,所述第二操作与所述第二语音信息对应的语音输入相对应。
17.一种电子设备,包括:
根据权利要求15所述的控制装置;以及
根据权利要求16所述的语音交互装置。
18.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行:
根据权利要求1~8中任意一项所述的方法;并且/或者
根据权利要求9~16中任意一项所述的方法。
19.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器:
执行根据权利要求1~7中任意一项所述的方法;并且/或者
执行根据权利要求8~15中任意一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910388450.5A CN111754997B (zh) | 2019-05-09 | 2019-05-09 | 控制装置及其操作方法,和语音交互装置及其操作方法 |
PCT/CN2020/081165 WO2020224346A1 (zh) | 2019-05-09 | 2020-03-25 | 控制装置及其操作方法,和语音交互装置及其操作方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910388450.5A CN111754997B (zh) | 2019-05-09 | 2019-05-09 | 控制装置及其操作方法,和语音交互装置及其操作方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111754997A CN111754997A (zh) | 2020-10-09 |
CN111754997B true CN111754997B (zh) | 2023-08-04 |
Family
ID=72672786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910388450.5A Active CN111754997B (zh) | 2019-05-09 | 2019-05-09 | 控制装置及其操作方法,和语音交互装置及其操作方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111754997B (zh) |
WO (1) | WO2020224346A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113050505B (zh) * | 2021-03-25 | 2021-12-24 | 广东凌霄泵业股份有限公司 | 一种远程控制型多功能spa浴缸智能控制器 |
CN113113007A (zh) * | 2021-03-30 | 2021-07-13 | 北京金山云网络技术有限公司 | 语音数据的处理方法和装置、电子设备和存储介质 |
CN113569712B (zh) * | 2021-07-23 | 2023-11-14 | 北京百度网讯科技有限公司 | 信息交互方法、装置、设备以及存储介质 |
CN115171680B (zh) * | 2022-06-07 | 2024-09-24 | 青岛海尔科技有限公司 | 设备的语音交互方法和装置、存储介质及电子装置 |
CN116030812B (zh) * | 2023-03-29 | 2023-06-16 | 广东海新智能厨房股份有限公司 | 用于燃气灶的智能互联语音控制方法、装置、设备及介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105554283A (zh) * | 2015-12-21 | 2016-05-04 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN107450879A (zh) * | 2016-05-30 | 2017-12-08 | 中兴通讯股份有限公司 | 终端操作方法及装置 |
CN107680589A (zh) * | 2017-09-05 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 语音信息交互方法、装置及其设备 |
CN108538298A (zh) * | 2018-04-04 | 2018-09-14 | 科大讯飞股份有限公司 | 语音唤醒方法及装置 |
CN108663942A (zh) * | 2017-04-01 | 2018-10-16 | 青岛有屋科技有限公司 | 一种语音识别设备控制方法、语音识别设备和中控服务器 |
CN109192208A (zh) * | 2018-09-30 | 2019-01-11 | 深圳创维-Rgb电子有限公司 | 一种电器设备的控制方法、系统、装置、设备及介质 |
CN109274562A (zh) * | 2018-09-27 | 2019-01-25 | 珠海格力电器股份有限公司 | 一种语音指令执行的方法、装置、智能家电设备及介质 |
CN109377987A (zh) * | 2018-08-31 | 2019-02-22 | 百度在线网络技术(北京)有限公司 | 智能语音设备间的交互方法、装置、设备及存储介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103475551B (zh) * | 2013-09-11 | 2014-05-14 | 厦门狄耐克电子科技有限公司 | 一种基于语音识别的智能家居系统 |
CN106469040B (zh) * | 2015-08-19 | 2019-06-21 | 华为终端有限公司 | 通信方法、服务器及设备 |
US10304463B2 (en) * | 2016-10-03 | 2019-05-28 | Google Llc | Multi-user personalization at a voice interface device |
CN106782540B (zh) * | 2017-01-17 | 2021-04-13 | 联想(北京)有限公司 | 语音设备及包括所述语音设备的语音交互系统 |
KR20180085931A (ko) * | 2017-01-20 | 2018-07-30 | 삼성전자주식회사 | 음성 입력 처리 방법 및 이를 지원하는 전자 장치 |
CN106951209A (zh) * | 2017-03-29 | 2017-07-14 | 联想(北京)有限公司 | 一种控制方法、装置及电子设备 |
US11189273B2 (en) * | 2017-06-29 | 2021-11-30 | Amazon Technologies, Inc. | Hands free always on near field wakeword solution |
CN107919119A (zh) * | 2017-11-16 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 多设备交互协同的方法、装置、设备及计算机可读介质 |
CN109391528A (zh) * | 2018-08-31 | 2019-02-26 | 百度在线网络技术(北京)有限公司 | 语音智能设备的唤醒方法、装置、设备及存储介质 |
CN109215663A (zh) * | 2018-10-11 | 2019-01-15 | 北京小米移动软件有限公司 | 设备唤醒方法及装置 |
CN109450750A (zh) * | 2018-11-30 | 2019-03-08 | 广东美的制冷设备有限公司 | 设备的语音控制方法、装置、移动终端和家电设备 |
-
2019
- 2019-05-09 CN CN201910388450.5A patent/CN111754997B/zh active Active
-
2020
- 2020-03-25 WO PCT/CN2020/081165 patent/WO2020224346A1/zh active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105554283A (zh) * | 2015-12-21 | 2016-05-04 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN107450879A (zh) * | 2016-05-30 | 2017-12-08 | 中兴通讯股份有限公司 | 终端操作方法及装置 |
CN108663942A (zh) * | 2017-04-01 | 2018-10-16 | 青岛有屋科技有限公司 | 一种语音识别设备控制方法、语音识别设备和中控服务器 |
CN107680589A (zh) * | 2017-09-05 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 语音信息交互方法、装置及其设备 |
CN108538298A (zh) * | 2018-04-04 | 2018-09-14 | 科大讯飞股份有限公司 | 语音唤醒方法及装置 |
CN109377987A (zh) * | 2018-08-31 | 2019-02-22 | 百度在线网络技术(北京)有限公司 | 智能语音设备间的交互方法、装置、设备及存储介质 |
CN109274562A (zh) * | 2018-09-27 | 2019-01-25 | 珠海格力电器股份有限公司 | 一种语音指令执行的方法、装置、智能家电设备及介质 |
CN109192208A (zh) * | 2018-09-30 | 2019-01-11 | 深圳创维-Rgb电子有限公司 | 一种电器设备的控制方法、系统、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111754997A (zh) | 2020-10-09 |
WO2020224346A1 (zh) | 2020-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111754997B (zh) | 控制装置及其操作方法,和语音交互装置及其操作方法 | |
CN108111948B (zh) | 在语音接口设备处的服务器提供的视觉输出 | |
CN107135443B (zh) | 一种信号处理方法及电子设备 | |
JP7348558B2 (ja) | 機器制御システム | |
CN108022590B (zh) | 语音接口设备处的聚焦会话 | |
CN105700389B (zh) | 一种智能家庭自然语言控制方法 | |
US11721342B2 (en) | Multi-modal interaction with intelligent assistants in voice command devices | |
CN107339786B (zh) | 一种空调、调控空调扬声器播报音量的系统及方法 | |
CN106297781B (zh) | 控制方法和控制器 | |
WO2019205134A1 (zh) | 智能家居语音控制方法、装置、设备和系统 | |
CN112051743A (zh) | 设备控制方法、冲突处理方法、相应的装置及电子设备 | |
US11031008B2 (en) | Terminal device and method for controlling thereof | |
JP2016502355A (ja) | オートメ−ションシステムの音声制御された構成 | |
WO2017141530A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
CN110808044B (zh) | 智能家居设备语音控制方法、装置、电子设备及存储介质 | |
JP6452571B2 (ja) | 情報出力装置及び情報出力方法及び情報出力プログラム | |
CN111077785A (zh) | 一种唤醒方法、装置、终端及存储介质 | |
CN110632854A (zh) | 语音控制方法及装置、语音控制节点及系统及存储介质 | |
CN114120996A (zh) | 语音交互方法及装置 | |
CN114373462A (zh) | 语音交互设备及其控制方法、控制装置 | |
JP2016063415A (ja) | ネットワークシステム、音声出力方法、サーバ、機器、および音声出力プログラム | |
CN111756603A (zh) | 智能家居系统的控制方法、装置、电子设备和可读介质 | |
WO2024008013A1 (zh) | 一种智能家居设备联动方案推荐方法及相关装置 | |
CN109974229B (zh) | 确定空调状态的方法、装置、电子设备及存储介质 | |
CN108663942B (zh) | 一种语音识别设备控制方法、语音识别设备和中控服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210524 Address after: 100176 room 1004, 10th floor, building 1, 18 Kechuang 11th Street, Beijing Economic and Technological Development Zone, Daxing District, Beijing Applicant after: Beijing Huijun Technology Co.,Ltd. Address before: 100086 8th Floor, 76 Zhichun Road, Haidian District, Beijing Applicant before: BEIJING JINGDONG SHANGKE INFORMATION TECHNOLOGY Co.,Ltd. Applicant before: BEIJING JINGDONG CENTURY TRADING Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |