CN109377987B - 智能语音设备间的交互方法、装置、设备及存储介质 - Google Patents

智能语音设备间的交互方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109377987B
CN109377987B CN201811014793.7A CN201811014793A CN109377987B CN 109377987 B CN109377987 B CN 109377987B CN 201811014793 A CN201811014793 A CN 201811014793A CN 109377987 B CN109377987 B CN 109377987B
Authority
CN
China
Prior art keywords
intelligent voice
equipment
user
voice
forwarding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811014793.7A
Other languages
English (en)
Other versions
CN109377987A (zh
Inventor
程高飞
王飞
张岩
熊芩
高磊磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Shanghai Xiaodu Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811014793.7A priority Critical patent/CN109377987B/zh
Publication of CN109377987A publication Critical patent/CN109377987A/zh
Priority to JP2019128002A priority patent/JP6942755B2/ja
Priority to US16/513,624 priority patent/US11282520B2/en
Application granted granted Critical
Publication of CN109377987B publication Critical patent/CN109377987B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4604LAN interconnection over a backbone network, e.g. Internet, Frame Relay
    • H04L12/462LAN interconnection over a bridge based backbone
    • H04L12/4625Single bridge functionality, e.g. connection of two networks over a single bridge
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Automation & Control Theory (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本申请实施例提供了一种智能语音设备间的交互方法、装置、设备及存储介质。该方法包括:接收被唤醒的各智能语音设备发送的唤醒消息;根据唤醒消息确定转发设备;向转发设备发送转发指令,转发指令中包括:所有智能语音设备的类型技能信息,以使转发设备根据转发指令接收用户语音请求;向除转发设备的其他被唤醒的智能语音设备发送不响应消息。能够使最适合的响应设备执行转发设备请求的云端结果,并且被唤醒的多个智能语音设备不同时响应,避免造成混乱,更容易满足用户需求。

Description

智能语音设备间的交互方法、装置、设备及存储介质
技术领域
本申请实施例涉及智能语音设备技术领域,尤其涉及一种智能语音设备间的交互方法、装置、设备及存储介质。
背景技术
随着智能语音设备的增多,在一个家庭中会出现多种类型的智能语音设备。比如智能语音音箱,智能语音电视,智能语音空调等设备。当用户对智能语音设备说出语音需求时,应该由最合适的语音设备对用户的需求进行响应。比如,用户对着音箱说“我要看电影”,这个时候将结果交由智能电视进行处理是最有利于用户体验的交互。又如用户对着电视说“将空调调到26度”,应该由空调来执行这个操作。
现有技术中各智能语音设备是远场设备,则智能语音设备间没有进行相互连接,各智能语音设备独立进行响应。若各智能语音设备都被唤醒时,各智能语音设备间没有实现协同效应,都会同时响应。或者用户在一个智能语音设备前发出语音指令,该智能语音设备没有执行能力,有执行能力的设备离用户太远不能被唤醒执行指令。
所以现有技术中的各智能语音设备不能由最合适的语音设备对用户的需求进行响应,进而导致不能满足用户对各智能语音设备的需求。
发明内容
本申请实施例提供一种智能语音设备间的交互方法、装置、设备及存储介质。解决了现有技术中的各智能语音设备不能由最合适的语音设备对用户的需求进行响应,进而导致不能满足用户对各智能语音设备的需求的技术问题。
本申请实施例第一方面提供一种智能语音设备间的交互方法,包括:接收被唤醒的各智能语音设备发送的唤醒消息;根据所述唤醒消息确定转发设备;向所述转发设备发送转发指令,所述转发指令中包括:所有智能语音设备的类型技能信息,以使所述转发设备根据所述转发指令接收用户语音请求;向除所述转发设备的其他被唤醒的智能语音设备发送不响应消息。
本申请实施例第二方面提供一种智能语音设备间的交互方法,包括:向主控设备发送唤醒消息;接收主控设备发送的转发指令,所述转发指令中包括:所有智能语音设备的类型技能信息;接收用户语音请求;将所述用户语音请求,所述所有智能语音设备的类型技能信息发送给云端设备;接收所述云端设备发送的所述响应数据及响应设备的网络信息;根据所述响应设备的网络信息向所述响应设备发送执行指令,所述执行指令中包括所述响应数据,以使所述响应设备根据所述执行指令执行所述响应数据。
本申请实施例第三方面提供一种智能语音设备间的交互方法,包括:接收转发设备发送的用户语音请求,所述所有智能语音设备的类型技能信息;根据所述用户语音请求获取响应数据;根据所述用户语音请求,所述所有智能语音设备的类型技能信息选择响应设备;向所述转发设备发送所述响应数据及响应设备的网络信息。
本申请实施例第四方面提供一种智能语音设备间的交互装置,包括:接收模块,用于接收被唤醒的各智能语音设备发送的唤醒消息;确定模块,用于根据所述唤醒消息确定转发设备;发送模块,用于向所述转发设备发送转发指令,所述转发指令中包括:所有智能语音设备的类型技能信息,以使所述转发设备根据所述转发指令接收用户语音请求;所述发送模块,还用于向除所述转发设备的其他被唤醒的智能语音设备发送不响应消息。
本申请实施例第五方面提供一种智能语音设备间的交互装置,包括:发送模块,用于向主控设备发送唤醒消息;接收模块,用于接收主控设备发送的转发指令,所述转发指令中包括:所有智能语音设备的类型技能信息;所述接收模块,还用于接收用户语音请求;所述发送模块,还用于将所述用户语音请求,所述所有智能语音设备的类型技能信息发送给云端设备;所述接收模块,还用于接收所述云端设备发送的所述响应数据及响应设备的网络信息;所述发送模块,还用于根据所述响应设备的网络信息向所述响应设备发送执行指令,所述执行指令中包括所述响应数据,以使所述响应设备根据所述执行指令执行所述响应数据。
本申请实施例第六方面提供一种智能语音设备间的交互装置,包括:接收模块,用于接收转发设备发送的用户语音请求,所述所有智能语音设备的类型技能信息;获取模块,用于根据所述用户语音请求获取响应数据;选择模块,用于根据所述用户语音请求,所述所有智能语音设备的类型技能信息选择响应设备;发送模块,用于向所述转发设备发送所述响应数据及响应设备的网络信息。
本申请实施例第七方面提供一种主控设备,包括:存储器,处理器以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面所述的方法。
本申请实施例第八方面提供一种转发设备,包括:存储器,处理器以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第二方面所述的方法。
本申请实施例第九方面提供一种云端设备,包括:存储器,处理器以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第三方面所述的方法。
本申请实施例第十方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行如上述第一方面所述的方法。
本申请实施例第十一方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行如上述第二方面所述的方法。
本申请实施例第十二方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行如上述第三方面所述的方法。
基于以上各方面,本申请实施例通过接收被唤醒的各智能语音设备发送的唤醒消息;根据唤醒消息确定转发设备;向转发设备发送转发指令,转发指令中包括:所有智能语音设备的类型技能信息,以使转发设备根据转发指令接收用户语音请求;向除转发设备的其他被唤醒的智能语音设备发送不响应消息。由于多个智能语音设备互联互通,能够使最适合的响应设备执行转发设备请求的云端结果,并且被唤醒的多个智能语音设备不同时响应,避免造成混乱,而且多个智能语音设备间的能力能够互补,更容易满足用户需求。
应当理解,上述发明内容部分中所描述的内容并非旨在限定本申请的实施例的关键或重要特征,亦非用于限制本申请的范围。本申请的其它特征将通过以下的描述变得容易理解。
附图说明
图1为本申请实施例提供的智能语音设备间的交互方法的一种应用场景图;
图2为本申请实施例一提供的智能语音设备间的交互方法的流程图;
图3为本发明实施例一提供的智能语音设备间的交互方法步骤202的流程图;
图4为本申请实施例二提供的智能语音设备间的交互方法的流程图;
图5为本发明实施例二提供的智能语音设备间的交互方法中执行步骤401之前的流程图;
图6为本申请实施例三提供的智能语音设备间的交互方法的流程图;
图7为本申请实施例四提供的智能语音设备间的交互装置的结构示意图;
图8为本申请实施例五提供的智能语音设备间的交互装置的结构示意图;
图9为本申请实施例六提供的智能语音设备间的交互装置的结构示意图;
图10为本申请实施例七提供的主控设备的结构示意图;
图11为本申请实施例八提供的转发设备的结构示意图;
图12为本申请实施例九提供的云端设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实施例。虽然附图中显示了本申请的某些实施例,然而应当理解的是,本申请可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本申请。应当理解的是,本申请的附图及实施例仅用于示例性作用,并非用于限制本申请的保护范围。
本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请实施例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了清楚理解本申请的技术方案,下面对本申请的应用场景进行说明。
图1为本申请实施例提供的智能语音设备间的交互方法的一种应用场景图,如图1所示,本实施例提供的智能语音设备间的交互方法一种应用场景中,构成的智能语音设备间的交互系统包括:多个智能语音设备及云端设备15。各智能语音设备间具有网络连接。在图1中为描述方便,有些网络连接关系未示意出。从各智能语音设备间选取一个主控设备11,主控设备11与其他各智能语音设备通信,获取每个智能语音设备的类型技能信息。用户发出唤醒语音来唤醒至少一个智能语音设备,被唤醒的智能语音设备12,13,14向主控设备11发送唤醒消息,主控设备11根据唤醒消息从各被唤醒的智能语音设备中确定转发设备14,主控设备11将网络中所有智能语音设备的类型技能信息发送给转发设备14,主控设备11向除转发设备的其他被唤醒的智能语音设备12,13发送不响应消息。转发设备14接收用户语音请求,并将用户语音请求和网络中所有智能语音设备的类型技能信息发送给云端设备15,云端设备15根据用户语音请求获取响应数据,并根据用户语音请求,所有智能语音设备的类型技能信息选择响应设备,该响应设备为最适合对用户语音请求进行响应的智能语音设备。云端设备15向转发设备14发送响应数据及响应设备的网络信息,转发设备14根据响应设备的网络信息向响应设备发送执行指令,在图1中选出的响应设备为智能语音设备13,响应设备根据执行指令执行响应数据。能够将多个智能语音设备进行互联互通,由最适合转发的智能语音设备获取用户语音请求,并转发给云端设备,并由云端设备根据用户语音请求和所有智能语音设备类型技能信息选择出最适合的响应设备,根据用户语音请求获取响应数据,由最适合的响应设备执行响应数据。多个智能语音设备在交互的情况下不会同时进行响应,避免造成混乱,而且多个智能语音设备间的能力能够互补,更容易满足用户需求。
以下将参照附图来具体描述本申请的实施例。需要说明的是,本申请各实施例中各智能语音设备间具有网络连接。
实施例一
图1为本申请实施例一提供的智能语音设备间的交互方法的流程图,如图1所示,本申请实施例的执行主体为智能语音设备间的交互装置,该智能语音设备间的交互装置可集成在主控设备上,该主控设备为智能语音设备,如可以为智能音箱,智能电视,智能冰箱,智能手机,智能手表等。则本实施例提供的智能语音设备间的交互方法包括以下几个步骤。
步骤201,接收被唤醒的各智能语音设备发送的唤醒消息。
具体地,本实施例中,在各智能语音设备上均开启语音唤醒功能。在用户发出包括唤醒词的语音信息时,距离用户较近的智能设备被唤醒,主控设备接收被唤醒的各智能语音设备发送的唤醒消息。
其中,在唤醒消息中包括:唤醒事件,唤醒事件可以包括:唤醒词。唤醒消息中还包括能够检测用户与被唤醒智能语音设备之间距离的信息,如唤醒消息中唤醒词的音量强度。
可以理解的是,主控设备也可以为被唤醒的智能语音设备,其也能够接收自身的唤醒消息。
步骤202,根据唤醒消息确定转发设备。
具体地,本实施例中,根据唤醒消息中的信息可确定各被唤醒的智能语音设备与用户的距离,从被唤醒的智能设备中选择出与用户距离最近的的被唤醒的智能语音设备,将与用户距离最近的被唤醒的智能语音设备确定为转发设备。
其中,通过唤醒消息确定与用户距离最近的被唤醒的智能语音设备的方法本实施例中不做限定。
其中,转发设备是负责在用户与云端设备间进行用户语音请求转发的设备,并负责将云端设备获取的响应数据转发给最适合的响应设备,并将执行指令转发给最适合的响应设备的设备。
步骤203,向转发设备发送转发指令,转发指令中包括:所有智能语音设备的类型技能信息,以使转发设备根据转发指令接收用户语音请求。
其中,在主控设备中预先存储有所有智能语音设备的类型技能信息。智能语音设备的类型技能信息包括:智能语音设备的类型信息和技能信息。智能语音设备的类型,如为:音箱,电视,冰箱,手机,手表等。智能语音设备的技能信息表示智能语音设备所具有的能力。如对于智能手机,其技能信息包括:大屏幕视频播放,小屏幕视频播放,音乐播放,拍照,录影,视频通话,图像显示等。主控设备中还可以预先存储有所有智能语音设备的网络信息。其中,智能设备的网络信息包括:网络IP地址。
本实施例中,存储的所有智能语音设备的类型技能信息可以以列表的形式进行存储。
具体地,本实施例中,将所有智能语音设备的类型技能信息携带在转发指令中,并向转发设备发送转发指令,以使转发设备根据转发指令接收用户语音请求,并将用户语音请求和所有智能语音设备的类型技能信息发送给云端设备,云端设备根据用户语音请求识别出用户需要的响应数据,获取响应数据,并根据用户语音请求和所有智能语音设备的类型技能信息选择出最适合的响应设备,向转发设备发送响应数据及响应设备的网络信息,转发设备根据响应设备的网络信息向响应设备发送执行指令,执行指令中包括响应数据,以使响应设备根据执行指令执行响应数据。
步骤204,向除转发设备的其他被唤醒的智能语音设备发送不响应消息。
具体地,本实施例中,为了使所有被唤醒的智能语音设备在云端设备选择出最合适的响应设备前不进行响应,向除转发设备的其他被唤醒的智能语音设备发送不响应消息。除转发设备的其他被唤醒的智能语音设备接收到不响应消息后,即使接收到用户语音请求不进行响应。
本实施例提供的智能语音设备间的交互方法,通过接收被唤醒的各智能语音设备发送的唤醒消息;根据唤醒消息确定转发设备;向转发设备发送转发指令,转发指令中包括:所有智能语音设备的类型技能信息,以使转发设备根据转发指令接收用户语音请求;向除转发设备的其他被唤醒的智能语音设备发送不响应消息。由于多个智能语音设备互联互通,能够使最适合的响应设备执行转发设备请求的云端结果,并且被唤醒的多个智能语音设备不同时响应,避免造成混乱,而且多个智能语音设备间的能力能够互补,更容易满足用户需求。
进一步地,图3为本发明实施例一提供的智能语音设备间的交互方法步骤202的流程图,如图3所示,本实施例提供的智能语音设备间的交互方法,步骤202,根据唤醒消息确定转发设备包括以下步骤。
步骤202a,根据唤醒消息确定与用户距离最近的被唤醒的智能语音设备。
优选地,本实施例中,根据唤醒消息确定与用户距离最近的被唤醒的智能语音设备,具体包括:
获取各智能语音设备发送的唤醒消息的音量强度。
其中,本实施例中,在唤醒消息中包括唤醒事件,唤醒事件中包括唤醒词,在唤醒消息中还包括唤醒词的音量强度。所以本实施例中通过获取各智能语音设备发送的唤醒消息中唤醒词的音量强度来获取各智能语音设备发送的唤醒消息的音量强度。
其次,将音量强度最大的唤醒消息对应的被唤醒的智能语音设备确定为与用户距离最近的被唤醒的智能语音设备。
进一步地,本实施例中,由于声波在传输过程中会有衰减,所以可根据唤醒消息的音量大小确定用户与每个被唤醒的智能语音设备的距离,获取音量强度最大的唤醒消息对应的被唤醒的智能语音设备,将音量强度最大的唤醒消息对应的被唤醒的智能语音设备确定为与用户距离最近的被唤醒的智能语音设备。
步骤202b,将与用户距离最近的被唤醒的智能语音设备确定为转发设备。
进一步地,本实施例中,由于转发设备是负责在用户与云端设备间进行用户语音请求转发的设备,所以将与用户距离最近的被唤醒的智能语音设备确定为转发设备,能够准确的接收到用户的语音请求,以使云端设备根据转发设备发送的用户语音请求获取响应数据,并根据用户语音请求确定相匹配的最适合响应的响应设备。
进一步地,本实施例提供的智能语音设备间的交互方法,在根据唤醒消息确定转发设备时,获取各智能语音设备发送的唤醒消息的音量强度,将音量强度最大的唤醒消息对应的被唤醒的智能语音设备确定为与用户距离最近的被唤醒的智能语音设备,将与用户距离最近的被唤醒的智能语音设备确定为转发设备。能够使确定出的转发设备为距离用户最近的被唤醒的智能语音设备,能够准确的接收到用户的语音请求,以使云端设备根据转发设备发送的用户语音请求更准确地获取响应数据,并根据用户语音请求更准确地确定相匹配的最适合响应的响应设备。
实施例二
图4为本申请实施例二提供的智能语音设备间的交互方法的流程图,如图4所示,本申请实施例的执行主体为智能语音设备间的交互装置,该智能语音设备间的交互装置可集成在转发设备上,该转发设备为智能语音设备,如可以为智能音箱,智能电视,智能冰箱,智能手机,智能手表等。则本实施例提供的智能语音设备间的交互方法包括以下几个步骤。
步骤401,向主控设备发送唤醒消息。
具体地,本实施中,在各智能语音设备上均开启语音唤醒功能。在用户发出包括唤醒词的语音信息时,距离用户较近的智能设备被唤醒,被唤醒的智能语音设备向主控设备发送唤醒消息,在被唤醒的智能语音设备中包括转发设备,所以该转发设备也向主控设备发送唤醒消息。
其中,在唤醒消息中包括:唤醒事件,唤醒事件可以包括:唤醒词。唤醒消息中还包括能够检测用户与被唤醒智能语音设备之间距离的信息,如唤醒消息中唤醒词的音量强度。
需要说明的是,在主控设备接收到唤醒消息后,根据唤醒消息确定转发设备。
步骤402,接收主控设备发送的转发指令,转发指令中包括:所有智能语音设备的类型技能信息。
具体地,本实施例中,接收主控设备发送的携带有所有智能语音设备的类型技能信息的转发指令。
其中,智能语音设备的类型技能信息包括:智能语音设备的类型信息和智能语音设备的技能信息。其中,智能语音设备的类型可以为:音箱,电视,冰箱,手机,手表等。智能语音设备的技能信息表示智能语音设备所具有的能力。如对于智能手机,其技能信息包括:大屏幕视频播放,小屏幕视频播放,音乐播放,拍照,录影,视频通话,图像显示等。
步骤403,接收用户语音请求。
具体地,本实施例中,转发设备已开启麦克风,能够接收到用户语音请求。其中,对用户语音请求进行示例性说明为“我要看电影”,“我要听音乐”等。
步骤404,将用户语音请求,所有智能语音设备的类型技能信息发送给云端设备。
具体地,本实施例中,将用户语音请求转发给云端设备,并将所有智能语音设备的类型技能信息转发给云端设备。以使云端设备对用户语音请求进行识别,获取到与用户语音请求相匹配的响应数据。并根据用户语音请求从所有的所有智能语音设备的类型技能信息中获取与用户语音请求相匹配的响应设备,若相匹配的响应设备为多个,则可随机选择一个响应设备。
本实施例中,对根据用户语音请求从所有智能语音设备的类型技能信息中获取与用户语音请求相匹配的响应设备进行示例性说明为:若用户语音请求为“我要看电影”,则从所有智能语音设备的类型技能信息中获取具有屏幕播放技能的智能语音设备,如为智能电视,则将智能电视作为相匹配的响应设备。
步骤405,接收云端设备发送的响应数据及响应设备的网络信息。
步骤406,根据响应设备的网络信息向响应设备发送执行指令,执行指令中包括响应数据,以使响应设备根据执行指令执行响应数据。
具体地,本实施例中,云端设备获取响应数据和对应的响应设备后,将响应数据及响应设备的网络信息发送给转发设备,转发设备根据响应设备的网络信息向响应设备发送执行指令。在执行指令中携带响应数据,响应设备接收到执行指令,则根据执行指令执行响应数据。
本实施例提供的智能语音设备间的交互方法,通过向主控设备发送唤醒消息,接收主控设备发送的转发指令,转发指令中包括:所有智能语音设备的类型技能信息,接收用户语音请求,将用户语音请求,所有智能语音设备的类型技能信息发送给云端设备,接收云端设备发送的响应数据及响应设备的网络信息,根据响应设备的网络信息向响应设备发送执行指令,执行指令中包括响应数据,以使响应设备根据执行指令执行响应数据。由于多个智能语音设备互联互通,能够使最适合的响应设备执行转发设备请求的云端结果,并且被唤醒的多个智能语音设备不同时响应,避免造成混乱,而且多个智能语音设备间的能力能够互补,更容易满足用户需求。
进一步地,图5为本发明实施例二提供的智能语音设备间的交互方法中执行步骤401之前的流程图,则本实施例中,在执行步骤401之前,还包括了以下几个步骤。
步骤400a,根据选取策略选择主控设备。
具体地,本实施例中,在多个智能语音设备进行网络连接后,多个智能语音设备,包括转发设备根据选择策略选择出一个主控设备。
进一步地,本实施例中,根据选取策略选择主控设备,具体包括:
首先,获取加入网络的所有智能语音设备的加入时间。
其次,将加入时间最早的智能语音设备选择为主控设备。
具体地,本实施例中,可在每个智能语音设备加入到网络时,确定加入时间,在所有智能语音网络设备中选择加入时间最早的智能语音设备为主控设备。
或者,本实施例中,根据选取策略选择主控设备,具体包括:
采用raft算法从所有智能语音设备中选择主控设备。
其中,raft算法是一种共识算法,通过raft算法从所有智能语音设备中选择主控设备。
步骤400b,接收用户语音信息。
进一步地,本实施例中,每个智能语音设备具有语音采集设备,如可以为麦克风,可通过语音采集设备接收用户语音信息。
步骤400c,对用户语音信息进行唤醒词识别。
进一步地,本实施例中,可通过语音识别算法对用户语音信息进行唤醒词识别。唤醒词可以为所有智能语音设备的通用名称,如为“小明”。
步骤400d,若识别成功,则向主控设备发送唤醒消息。
进一步地,本实施例中,若识别成功,则确定智能语音设备被唤醒,则向主控设备发送唤醒消息。
本实施例提供的智能语音设备间的交互方法,在向主控设备发送唤醒消息之前,还包括:根据选取策略选择主控设备,具体地,根据选取策略选择主控设备可以为获取加入网络的所有智能语音设备的加入时间,将加入时间最早的智能语音设备选择为主控设备。或者根据选取策略选择主控设备可以为采用raft算法从所有智能语音设备中选择主控设备。能够由选择出的主控设备对多个智能语音设备的标识信息,网络信息及类型技能信息进行管理,更好地选择出转发设备,并控制多个被唤醒的设备在云端设备确定最适合的响应设备前不进行响应。
实施例三
图6为本申请实施例三提供的智能语音设备间的交互方法的流程图,如图6所示,本实施例提供的智能语音设备间的交互方法的执行主体为智能语音设备间的交互装置,该智能语音设备间的交互装置可集成在云端设备上,云端设备可以为计算机,服务器等。则本实施例提供的智能语音设备间的交互方法包括以下几个步骤。
步骤601,接收转发设备发送的用户语音请求,所有智能语音设备的类型技能信息。
具体地,在转发设备接收到用户语音请求后,将用户语音请求发送给云端设备,云端设备接收转发设备发送的用户语音请求。并接收由主控设备发送给转发设备的所有智能语音设备的类型技能信息。
其中,智能设备的网络信息包括:智能语音设备的标识和网络IP地址。智能语音设备的类型技能信息包括:智能语音设备的类型信息和智能语音设备的技能信息。智能语音设备的技能信息表示智能语音设备所具有的能力。
步骤602,根据用户语音请求获取响应数据。
具体地,本实施例中,对用户语音请求进行识别,获取与用户语音请求相匹配的响应数据。
本实施例中,对根据用户语音请求获取响应数据进行示例性说明:用户语音请求为“我要看周星驰的电影”,则对应的相匹配的响应数据为周星驰最热门的电影的视频数据。
步骤603,根据用户语音请求,所有智能语音设备的类型技能信息选择响应设备。
具体地,本实施例中,根据用户语音请求,从所有智能语音设备的类型技能信息中选择相匹配的类型技能信息,相匹配的类型技能信息对应的智能语音设备为选择的响应设备。
步骤604,向转发设备发送响应数据及响应设备的网络信息。
本实施例提供的智能语音设备间的交互方法,通过接收转发设备发送的用户语音请求,所有智能语音设备的类型技能信息,根据用户语音请求获取响应数据,根据用户语音请求,所有智能语音设备的类型技能信息选择响应设备,向转发设备发送响应数据及响应设备的网络信息,由于多个智能语音设备互联互通,能够使最适合的响应设备执行转发设备请求的云端结果,并且被唤醒的多个智能语音设备不同时响应,避免造成混乱,而且多个智能语音设备间的能力能够互补,更容易满足用户需求。
进一步地,本实施例中,步骤603,根据用户语音请求,所有智能语音设备的类型技能信息选择响应设备,具体包括:
首先,确定与用户语音请求相匹配的类型技能信息。
其次,选择与用户语音请求相匹配类型技能信息对应的智能语音设备为响应设备。
优选地,本实施例中,对用户语音请求进行识别,确定与用户语音请求相匹配的类型信息及技能信息,从相匹配的类型信息及技能信息对应的智能语音设备中选择响应设备。
进一步地,若与用户语音请求相匹配类型技能信息对应的智能语音设备为多个,则选择与用户语音请求相匹配类型技能信息对应的智能语音设备为响应设备,具体包括:
随机选择与用户语音请求相匹配类型技能信息对应的多个智能语音设备中的一个为响应设备。
本实施例中,根据用户语音请求,所有智能语音设备的类型技能信息选择响应设备进行示例性说明为:若用户语音请求为“我要看电视节目”,则从所有智能语音设备的类型技能信息中获取具有屏幕播放技能的智能语音设备,如为智能电视,智能手机,则从智能电视或智能手机中选择一个智能语音设备作为响应设备。
本实施例提供的智能语音设备间的交互方法,在根据用户语音请求,所有智能语音设备的类型技能信息选择响应设备时,确定与用户语音请求相匹配的类型技能信息;选择与用户语音请求相匹配类型技能信息对应的智能语音设备为响应设备,能够选择出最适合进行响应的响应设备,若与用户语音请求相匹配类型技能信息对应的智能语音设备为多个,则随机选择与用户语音请求相匹配类型技能信息对应的多个智能语音设备中的一个为响应设备,能够避免多个响应设备同时进行响应,进一步提高用户体验。
图7为本申请实施例四提供的智能语音设备间的交互装置的结构示意图,如图7所示,本实施例提供的智能语音设备间的交互装置70包括:接收模块71,确定模块72,发送模块73。
其中,接收模块71,用于接收被唤醒的各智能语音设备发送的唤醒消息。确定模块72,用于根据唤醒消息确定转发设备。发送模块73,用于向转发设备发送转发指令,转发指令中包括:所有智能语音设备的类型技能信息,以使转发设备根据转发指令接收用户语音请求。发送模块73,还用于向除转发设备的其他被唤醒的智能语音设备发送不响应消息。
本实施例提供的智能语音设备间的交互装置可以执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
进一步地,如图7所示,本实施例提供的智能语音设备间的交互装置中,确定模块72,具体包括:第一确定子模块721和第二确定子模块722。
进一步地,第一确定子模块721,用于根据唤醒消息确定与用户距离最近的被唤醒的智能语音设备。第二确定子模块722,用于将与用户距离最近的被唤醒的智能语音设备确定为转发设备。
进一步地,第一确定子模块721,具体用于:获取各智能语音设备发送的唤醒消息的音量强度;将音量强度最大的唤醒消息对应的被唤醒的智能语音设备确定为与用户距离最近的被唤醒的智能语音设备。
进一步地,本实施例提供的智能语音设备间的交互装置可以执行图3所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
实施例四
图8为本申请实施例四提供的智能语音设备间的交互装置的结构示意图,如图8所示,本实施例提供的智能语音设备间的交互装置80,包括:发送模块81,接收模块82。
其中,发送模块81,用于向主控设备发送唤醒消息。接收模块82,用于接收主控设备发送的转发指令,转发指令中包括:所有智能语音设备的类型技能信息。接收模块82,还用于接收用户语音请求。发送模块81,还用于将用户语音请求,所有智能语音设备的类型技能信息发送给云端设备。接收模块82,还用于接收云端设备发送的响应数据及响应设备的网络信息。发送模块81,还用于根据响应设备的网络信息向响应设备发送执行指令,执行指令中包括响应数据,以使响应设备根据执行指令执行响应数据。
本实施例提供的智能语音设备间的交互装置可以执行图4所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
进一步地,如图8所示,本实施例提供的智能语音设备间的交互装置,还包括:选择模块83。
进一步地,发送模块81,具体用于:接收用户语音信息;对用户语音信息进行唤醒词识别;若识别成功,则向主控设备发送唤醒消息。
进一步地,选择模块83,用于根据选取策略选择主控设备。
可选地,选择模块83,具体用于:获取加入网络的所有智能语音设备的加入时间;将加入时间最早的智能语音设备选择为主控设备。
可选地,选择模块83,具体用于:采用raft算法从所有智能语音设备中选择主控设备。
进一步地,本实施例提供的智能语音设备间的交互装置可以执行图5所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
实施例五
图9为本申请实施例五提供的智能语音设备间的交互装置的结构示意图,如图9所示,本实施例提供的智能语音设备间的交互装置90,包括:接收模块91,获取模块92,选择模块93及发送模块94。
其中,接收模块91,用于接收转发设备发送的用户语音请求,所有智能语音设备的类型技能信息。获取模块92,用于根据用户语音请求获取响应数据。选择模块93,用于根据用户语音请求,所有智能语音设备的类型技能信息选择响应设备。发送模块94,用于向转发设备发送响应数据及响应设备的网络信息。
本实施例提供的智能语音设备间的交互装置可以执行图6所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
进一步地,本实施例提供的智能语音设备间的交互装置中,选择模块93,具体包括:确定子模块931和选择子模块932。
其中,确定子模块931,用于确定与用户语音请求相匹配的类型技能信息。选择子模块932,用于选择与用户语音请求相匹配类型技能信息对应的智能语音设备为响应设备。
进一步地,若与用户语音请求相匹配类型技能信息对应的智能语音设备为多个,则选择子模块932,具体用于:随机选择与用户语音请求相匹配类型技能信息对应的多个智能语音设备中的一个为响应设备。
实施例六
图10为本申请实施例六提供的一种主控设备的结构示意图,如图10所示,本实施例提供的主控设备100包括:存储器1001,处理器1002以及计算机程序。
其中,计算机程序存储在存储器1001中,并被配置为由处理器1002执行以实现如如本申请实施例一提供的智能语音设备间的交互方法。
相关说明可以对应参见图2至图3的步骤所对应的相关描述和效果进行理解,此处不做过多赘述。
实施例七
图11为本申请实施例七提供的一种转发设备的结构示意图,如图11所示,本实施例提供的转发设备110包括:存储器1101,处理器1102以及计算机程序。
其中,计算机程序存储在存储器1101中,并被配置为由处理器1102执行以实现如如本申请实施例二提供的智能语音设备间的交互方法。
相关说明可以对应参见图4至图5的步骤所对应的相关描述和效果进行理解,此处不做过多赘述。
实施例八
图12为本申请实施例八提供的一种云端设备的结构示意图,如图12所示,本实施例提供的云端设备120包括:存储器1201,处理器1202以及计算机程序。
其中,计算机程序存储在存储器1201中,并被配置为由处理器1202执行以实现如如本申请实施例三提供的智能语音设备间的交互方法。
相关说明可以对应参见图6的步骤所对应的相关描述和效果进行理解,此处不做过多赘述。
实施例九
本申请实施例九还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行以实现本申请实施例一提供的智能语音设备间的交互方法。
实施例十
本申请实施例十还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行以实现本申请实施例二提供的智能语音设备间的交互方法。
实施例十一
本申请实施例十一还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行以实现本申请实施例三提供的智能语音设备间的交互方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (20)

1.一种智能语音设备间的交互方法,所述方法应用于主控设备,其特征在于,包括:
接收被唤醒的各智能语音设备发送的唤醒消息;
根据所述唤醒消息确定转发设备;
向所述转发设备发送转发指令,所述转发指令中包括:所有智能语音设备的类型技能信息,以使所述转发设备根据所述转发指令接收用户语音请求,将所述用户语音请求,所述所有智能语音设备的类型技能信息发送给云端设备;
向除所述转发设备的其他被唤醒的智能语音设备发送不响应消息;
其中,所述主控设备为所有智能语音设备中的一个;所述主控设备是根据选取策略选择出来的,所述选择策略是将加入网络的所有智能语音设备中加入时间最早的智能语音设备选择为所述主控设备,或者采用raft算法从所有智能语音设备中选择所述主控设备;
所述根据所述唤醒消息确定转发设备,具体包括:
根据所述唤醒消息确定与用户距离最近的被唤醒的智能语音设备;
将所述与用户距离最近的被唤醒的智能语音设备确定为转发设备。
2.根据权利要求1所述的方法,其特征在于,所述根据所述唤醒消息确定与用户距离最近的被唤醒的智能语音设备,具体包括:
获取各所述智能语音设备发送的唤醒消息的音量强度;
将音量强度最大的唤醒消息对应的被唤醒的智能语音设备确定为与用户距离最近的被唤醒的智能语音设备。
3.一种智能语音设备间的交互方法,所述方法应用于转发设备,其特征在于,包括:
向主控设备发送唤醒消息;
接收主控设备发送的转发指令,所述转发指令中包括:所有智能语音设备的类型技能信息;
接收用户语音请求;
将所述用户语音请求,所述所有智能语音设备的类型技能信息发送给云端设备;
接收所述云端设备发送的响应数据及响应设备的网络信息;
根据所述响应设备的网络信息向所述响应设备发送执行指令,所述执行指令中包括所述响应数据,以使所述响应设备根据所述执行指令执行所述响应数据;
其中,所述主控设备为所有智能语音设备中的一个,所述转发设备为与用户距离最近的被唤醒的智能语音设备;
所述向主控设备发送唤醒消息之前,还包括:
根据选取策略选择所述主控设备;
所述根据选取策略选择所述主控设备,具体包括:
获取加入网络的所有智能语音设备的加入时间;将加入时间最早的智能语音设备选择为所述主控设备;
或者,所述根据选取策略选择所述主控设备,具体包括:
采用raft算法从所有智能语音设备中选择所述主控设备。
4.根据权利要求3所述的方法,其特征在于,所述向主控设备发送唤醒消息,具体包括:
接收用户语音信息;
对所述用户语音信息进行唤醒词识别;
若识别成功,则向主控设备发送唤醒消息。
5.一种智能语音设备间的交互方法,所述方法应用于云端设备,其特征在于,包括:
接收转发设备发送的用户语音请求,所述所有智能语音设备的类型技能信息;
根据所述用户语音请求获取响应数据;
根据所述用户语音请求,所述所有智能语音设备的类型技能信息选择响应设备;
向所述转发设备发送所述响应数据及响应设备的网络信息;
其中,所述所有智能语音设备的类型技能信息是由主控设备发送给所述转发设备的,所述主控设备为所有智能语音设备中的一个,所述主控设备是根据选取策略选择出来的,所述选择策略是将加入网络的所有智能语音设备中加入时间最早的智能语音设备选择为所述主控设备,或者采用raft算法从所有智能语音设备中选择所述主控设备;所述转发设备为与用户距离最近的被唤醒的智能语音设备。
6.根据权利要求5所述的方法,其特征在于,所述根据所述用户语音请求,所述所有智能语音设备的类型技能信息选择响应设备,具体包括:
确定与所述用户语音请求相匹配的类型技能信息;
选择与所述用户语音请求相匹配类型技能信息对应的智能语音设备为响应设备。
7.根据权利要求6所述的方法,其特征在于,若与所述用户语音请求相匹配类型技能信息对应的智能语音设备为多个,则选择与所述用户语音请求相匹配类型技能信息对应的智能语音设备为响应设备,具体包括:
随机选择与所述用户语音请求相匹配类型技能信息对应的多个智能语音设备中的一个为响应设备。
8.一种智能语音设备间的交互装置,所述装置位于主控设备中,其特征在于,包括:
接收模块,用于接收被唤醒的各智能语音设备发送的唤醒消息;
确定模块,用于根据所述唤醒消息确定转发设备;
发送模块,用于向所述转发设备发送转发指令,所述转发指令中包括:所有智能语音设备的类型技能信息,以使所述转发设备根据所述转发指令接收用户语音请求,将所述用户语音请求,所述所有智能语音设备的类型技能信息发送给云端设备;
所述发送模块,还用于向除所述转发设备的其他被唤醒的智能语音设备发送不响应消息;
其中,所述主控设备为所有智能语音设备中的一个;所述主控设备是根据选取策略选择出来的,所述选择策略是将加入网络的所有智能语音设备中加入时间最早的智能语音设备选择为所述主控设备,或者采用raft算法从所有智能语音设备中选择所述主控设备;
所述确定模块,具体包括:
第一确定子模块,用于根据所述唤醒消息确定与用户距离最近的被唤醒的智能语音设备;
第二确定子模块,用于将所述与用户距离最近的被唤醒的智能语音设备确定为转发设备。
9.根据权利要求8所述的装置,其特征在于,所述第一确定子模块,具体用于:
获取各所述智能语音设备发送的唤醒消息的音量强度;将音量强度最大的唤醒消息对应的被唤醒的智能语音设备确定为与用户距离最近的被唤醒的智能语音设备。
10.一种智能语音设备间的交互装置,所述装置位于转发设备中,其特征在于,包括:
发送模块,用于向主控设备发送唤醒消息;
接收模块,用于接收主控设备发送的转发指令,所述转发指令中包括:所有智能语音设备的类型技能信息;
所述接收模块,还用于接收用户语音请求;
所述发送模块,还用于将所述用户语音请求,所述所有智能语音设备的类型技能信息发送给云端设备;
所述接收模块,还用于接收所述云端设备发送的响应数据及响应设备的网络信息;
所述发送模块,还用于根据所述响应设备的网络信息向所述响应设备发送执行指令,所述执行指令中包括所述响应数据,以使所述响应设备根据所述执行指令执行所述响应数据;
其中,所述主控设备为所有智能语音设备中的一个,所述转发设备为与用户距离最近的被唤醒的智能语音设备;
所述装置还包括:
选择模块,用于根据选取策略选择所述主控设备;
所述选择模块,具体用于:
获取加入网络的所有智能语音设备的加入时间;将加入时间最早的智能语音设备选择为所述主控设备;
或者,所述选择模块,具体用于:
采用raft算法从所有智能语音设备中选择所述主控设备。
11.根据权利要求10所述的装置,其特征在于,所述发送模块,具体用于:
接收用户语音信息;对所述用户语音信息进行唤醒词识别;若识别成功,则向主控设备发送唤醒消息。
12.一种智能语音设备间的交互装置,所述装置应用于云端设备中,其特征在于,包括:
接收模块,用于接收转发设备发送的用户语音请求,所述所有智能语音设备的类型技能信息;
获取模块,用于根据所述用户语音请求获取响应数据;
选择模块,用于根据所述用户语音请求,所述所有智能语音设备的类型技能信息选择响应设备;
发送模块,用于向所述转发设备发送所述响应数据及响应设备的网络信息;
其中,所述所有智能语音设备的类型技能信息是由主控设备发送给所述转发设备的,所述主控设备为所有智能语音设备中的一个,所述主控设备是根据选取策略选择出来的,所述选择策略是将加入网络的所有智能语音设备中加入时间最早的智能语音设备选择为所述主控设备,或者采用raft算法从所有智能语音设备中选择所述主控设备;所述转发设备为与用户距离最近的被唤醒的智能语音设备。
13.根据权利要求12所述的装置,其特征在于,所述选择模块,具体包括:
确定子模块,用于确定与所述用户语音请求相匹配的类型技能信息;
选择子模块,用于选择与所述用户语音请求相匹配类型技能信息对应的智能语音设备为响应设备。
14.根据权利要求13所述的装置,其特征在于,若与所述用户语音请求相匹配类型技能信息对应的智能语音设备为多个,则所述选择子模块,具体用于:
随机选择与所述用户语音请求相匹配类型技能信息对应的多个智能语音设备中的一个为响应设备。
15.一种主控设备,其特征在于,包括:存储器,处理器以及计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1或2所述的方法。
16.一种转发设备,其特征在于,包括:存储器,处理器以及计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求3或4所述的方法。
17.一种云端设备,其特征在于,包括:存储器,处理器以及计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求5-7中任一项所述的方法。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行如权利要求1或2中任一项所述的方法。
19.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行如权利要求3或4所述的方法。
20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行如权利要求5-7中任一项所述的方法。
CN201811014793.7A 2018-08-31 2018-08-31 智能语音设备间的交互方法、装置、设备及存储介质 Active CN109377987B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201811014793.7A CN109377987B (zh) 2018-08-31 2018-08-31 智能语音设备间的交互方法、装置、设备及存储介质
JP2019128002A JP6942755B2 (ja) 2018-08-31 2019-07-10 スマート音声機器間のインタラクション方法、装置、機器及び記憶媒体
US16/513,624 US11282520B2 (en) 2018-08-31 2019-07-16 Method, apparatus and device for interaction of intelligent voice devices, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811014793.7A CN109377987B (zh) 2018-08-31 2018-08-31 智能语音设备间的交互方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109377987A CN109377987A (zh) 2019-02-22
CN109377987B true CN109377987B (zh) 2020-07-28

Family

ID=65404219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811014793.7A Active CN109377987B (zh) 2018-08-31 2018-08-31 智能语音设备间的交互方法、装置、设备及存储介质

Country Status (3)

Country Link
US (1) US11282520B2 (zh)
JP (1) JP6942755B2 (zh)
CN (1) CN109377987B (zh)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111614705B (zh) * 2019-02-25 2022-01-21 华为技术有限公司 多终端设备之间服务决策分发的方法及系统
CN111756604B (zh) * 2019-03-29 2022-04-12 华为技术有限公司 一种设备配合方法、装置及系统
CN111862988B (zh) * 2019-04-26 2023-03-03 广东美的白色家电技术创新中心有限公司 语音识别设备及其唤醒响应方法、计算机存储介质
CN111862964B (zh) * 2019-04-26 2024-03-22 广东美的白色家电技术创新中心有限公司 语音识别设备及其唤醒响应方法、计算机存储介质
CN110265006B (zh) * 2019-04-28 2021-02-19 北京百度网讯科技有限公司 唤醒方法、主节点、从节点和存储介质
CN110085235A (zh) * 2019-05-05 2019-08-02 珠海格力电器股份有限公司 语音控制方法和装置
CN110136712A (zh) * 2019-05-07 2019-08-16 甄十信息科技(上海)有限公司 实现智能语音ai功能的方法及装置
CN111754997B (zh) * 2019-05-09 2023-08-04 北京汇钧科技有限公司 控制装置及其操作方法,和语音交互装置及其操作方法
CN110223684A (zh) * 2019-05-16 2019-09-10 华为技术有限公司 一种语音唤醒方法及设备
CN111986664A (zh) * 2019-05-24 2020-11-24 珠海格力电器股份有限公司 一种响应语音指令的方法和设备
KR102245953B1 (ko) * 2019-06-05 2021-04-28 엘지전자 주식회사 복수의 전자기기의 제어방법
CN110286986A (zh) * 2019-06-27 2019-09-27 新华网(北京)科技有限公司 信息处理方法、装置、电子设备及计算机可读存储介质
CN110322878A (zh) * 2019-07-01 2019-10-11 华为技术有限公司 一种语音控制方法、电子设备及系统
CN110335601A (zh) * 2019-07-10 2019-10-15 三星电子(中国)研发中心 语音助手设备及其语音唤醒方法
CN112309378B (zh) * 2019-07-24 2023-11-03 广东美的白色家电技术创新中心有限公司 语音识别设备及其唤醒响应方法、计算机存储介质
CN110473537B (zh) * 2019-08-22 2022-04-26 百度在线网络技术(北京)有限公司 语音技能的控制方法、装置、设备及存储介质
CN110556115A (zh) * 2019-09-10 2019-12-10 深圳创维-Rgb电子有限公司 基于多控制终端的iot设备控制方法、控制终端及存储介质
CN112634884A (zh) * 2019-09-23 2021-04-09 北京声智科技有限公司 控制输出音频的方法、输出音频的方法、装置、电子设备、和计算机可读存储介质
CN110890092B (zh) * 2019-11-07 2022-08-05 北京小米移动软件有限公司 唤醒控制方法及装置、计算机存储介质
CN112908318A (zh) * 2019-11-18 2021-06-04 百度在线网络技术(北京)有限公司 智能音箱的唤醒方法、装置、智能音箱及存储介质
CN111063343B (zh) * 2019-12-11 2022-08-19 广东美的厨房电器制造有限公司 语音交互方法、装置、电子设备及介质
CN111128169A (zh) * 2019-12-30 2020-05-08 云知声智能科技股份有限公司 语音唤醒方法及装置
CN113132191A (zh) * 2019-12-31 2021-07-16 海信集团有限公司 智能设备的语音控制方法、智能设备及存储介质
CN113098739B (zh) * 2020-01-09 2023-05-23 博泰车联网科技(上海)股份有限公司 用于信息处理的方法、设备和计算机存储介质
CN113129888A (zh) * 2020-01-10 2021-07-16 阿里巴巴集团控股有限公司 设备唤醒方法、装置、设备
CN111192591B (zh) * 2020-02-10 2022-12-13 百度在线网络技术(北京)有限公司 智能设备的唤醒方法、装置、智能音箱及存储介质
CN113472614A (zh) * 2020-04-28 2021-10-01 海信集团有限公司 一种语音交互设备及语音交互方法
CN111613221A (zh) * 2020-05-22 2020-09-01 云知声智能科技股份有限公司 一种就近唤醒方法、装置和系统
CN111722824B (zh) * 2020-05-29 2024-04-30 北京小米松果电子有限公司 语音控制方法、装置及计算机存储介质
CN114070660B (zh) * 2020-08-03 2023-08-11 海信视像科技股份有限公司 一种智能语音终端和应答方法
CN112118222A (zh) * 2020-08-11 2020-12-22 深圳市欣博跃电子有限公司 一种数据转发的方法、装置、电子设备和存储介质
CN112102826A (zh) * 2020-08-31 2020-12-18 南京创维信息技术研究院有限公司 一种控制语音设备多端唤醒的系统和方法
CN112201236B (zh) * 2020-09-22 2024-03-19 北京小米松果电子有限公司 终端唤醒方法、装置及计算机可读存储介质
CN112269614A (zh) * 2020-10-26 2021-01-26 维沃移动通信有限公司 一种消息处理方法、装置和电子设备
CN112420043A (zh) * 2020-12-03 2021-02-26 深圳市欧瑞博科技股份有限公司 基于语音的智能唤醒方法、装置、电子设备及存储介质
CN112751678A (zh) * 2020-12-29 2021-05-04 美智光电科技股份有限公司 唤醒方法、语音设备、网关设备、装置和可读存储介质
CN112929724B (zh) * 2020-12-31 2022-09-30 海信视像科技股份有限公司 显示设备、机顶盒及远场拾音唤醒控制方法
CN115116438A (zh) * 2021-03-22 2022-09-27 华为技术有限公司 一种协同唤醒第一电子设备的方法及第一电子设备
CN113241068A (zh) * 2021-03-26 2021-08-10 青岛海尔科技有限公司 语音信号的响应方法和装置、存储介质及电子装置
CN113096658A (zh) * 2021-03-31 2021-07-09 歌尔股份有限公司 一种终端设备及其唤醒方法、装置和计算机可读存储介质
CN113138559A (zh) * 2021-04-02 2021-07-20 Oppo广东移动通信有限公司 设备交互方法、装置、电子设备及存储介质
CN113157240A (zh) * 2021-04-27 2021-07-23 百度在线网络技术(北京)有限公司 语音处理方法、装置、设备、存储介质及计算机程序产品
CN115314327B (zh) * 2021-05-07 2024-02-06 海信集团控股股份有限公司 一种电子设备、智能设备以及智能设备控制方法
CN113362823A (zh) * 2021-06-08 2021-09-07 深圳市同行者科技有限公司 居家电器的多端响应方法、装置、设备及存储介质
CN113838463A (zh) * 2021-09-16 2021-12-24 Oppo广东移动通信有限公司 信息传输方法、装置、电子设备及存储介质
CN114155854B (zh) * 2021-12-13 2023-09-26 海信视像科技股份有限公司 语音数据的处理方法及装置
CN114465837B (zh) * 2022-01-30 2024-03-08 云知声智能科技股份有限公司 一种智能语音设备协同唤醒处理方法及装置
CN114861110B (zh) * 2022-05-25 2024-06-11 抖音视界有限公司 用于作品转发的方法、装置、设备和存储介质
CN117950620A (zh) * 2022-10-28 2024-04-30 华为技术有限公司 一种设备控制方法及电子设备
CN116030812B (zh) * 2023-03-29 2023-06-16 广东海新智能厨房股份有限公司 用于燃气灶的智能互联语音控制方法、装置、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106469040A (zh) * 2015-08-19 2017-03-01 华为终端(东莞)有限公司 通信方法、服务器及设备
CN108259280A (zh) * 2018-02-06 2018-07-06 北京语智科技有限公司 一种室内智能化控制的实现方法、系统

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4502393B2 (ja) * 2005-06-13 2010-07-14 キヤノン株式会社 通信パラメータの共有方法及び通信装置
JP2008210103A (ja) * 2007-02-26 2008-09-11 Ricoh Co Ltd ドキュメント処理システム、ドキュメント処理方法、およびプログラム
JP2009026191A (ja) * 2007-07-23 2009-02-05 Nippon Telegraph & Telephone East Corp 配信装置、配信方法および配信システム
CN103155444B (zh) * 2010-08-26 2017-04-12 马维尔国际贸易有限公司 具有主接入类别和辅接入类别的无线通信
US9245527B2 (en) * 2013-10-11 2016-01-26 Apple Inc. Speech recognition wake-up of a handheld portable electronic device
US9930110B2 (en) * 2016-03-02 2018-03-27 International Business Machines Corporation Dynamic client-based leader election
CN105788599B (zh) * 2016-04-14 2019-08-06 北京小米移动软件有限公司 语音处理方法、路由器及智能语音控制系统
US9972320B2 (en) * 2016-08-24 2018-05-15 Google Llc Hotword detection on multiple devices
US10304463B2 (en) * 2016-10-03 2019-05-28 Google Llc Multi-user personalization at a voice interface device
KR102562287B1 (ko) * 2016-10-14 2023-08-02 삼성전자주식회사 전자 장치 및 전자 장치의 오디오 신호 처리 방법
US10181323B2 (en) * 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
KR101889279B1 (ko) * 2017-01-16 2018-08-21 주식회사 케이티 음성 명령에 기반하여 서비스를 제공하는 시스템 및 방법
CN106878071B (zh) * 2017-01-25 2020-09-15 上海钜真金融信息服务有限公司 一种基于Raft算法的区块链共识机制
CN106707788B (zh) * 2017-03-09 2019-05-28 上海电器科学研究院 一种智能家居语音控制识别系统与方法
CN106951209A (zh) * 2017-03-29 2017-07-14 联想(北京)有限公司 一种控制方法、装置及电子设备
CN108320742B (zh) * 2018-01-31 2021-09-14 广东美的制冷设备有限公司 语音交互方法、智能设备及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106469040A (zh) * 2015-08-19 2017-03-01 华为终端(东莞)有限公司 通信方法、服务器及设备
CN108259280A (zh) * 2018-02-06 2018-07-06 北京语智科技有限公司 一种室内智能化控制的实现方法、系统

Also Published As

Publication number Publication date
CN109377987A (zh) 2019-02-22
US11282520B2 (en) 2022-03-22
JP6942755B2 (ja) 2021-09-29
JP2019207710A (ja) 2019-12-05
US20190341048A1 (en) 2019-11-07

Similar Documents

Publication Publication Date Title
CN109377987B (zh) 智能语音设备间的交互方法、装置、设备及存储介质
CN109410944B (zh) 语音交互方法、装置和终端
CN109658932B (zh) 一种设备控制方法、装置、设备及介质
CN107835444B (zh) 信息交互方法、装置、音频终端及计算机可读存储介质
CN109240107B (zh) 一种电器设备的控制方法、装置、电器设备和介质
US11227598B2 (en) Method for controlling terminal by voice, terminal, server and storage medium
JP2022008594A (ja) 通信方法、サーバー、およびデバイス
CN110459221A (zh) 多设备协同语音交互的方法和装置
US12001758B2 (en) Voice information processing method and electronic device
CN107731231B (zh) 一种支持多云端语音服务的方法及一种存储设备
CN108320751B (zh) 一种语音交互方法、装置、设备和服务器
CN109450747B (zh) 一种唤醒智能家居设备的方法、装置及计算机存储介质
US11200899B2 (en) Voice processing method, apparatus and device
CN105100915B (zh) 一种切换音视频应用的方法及电视机
US11244686B2 (en) Method and apparatus for processing speech
RU2582070C1 (ru) Способ управления внешним вводом и устройство приема вещания
CN111916079A (zh) 一种电子设备的语音响应方法、系统、设备和存储介质
CN106970813A (zh) 软件升级控制方法、装置及电子设备
CN207720161U (zh) 一种基于语音控制的智能家居3d虚拟演示系统
CN108432160A (zh) 在无线通信系统中基于声音信号发送和接收数据的设备和方法
CN104284221B (zh) 一种信息处理的方法、可穿戴设备及数字电视设备
CN112954760B (zh) 蓝牙设备的连接方法、装置和电子设备
CN110858883A (zh) 一种智能音箱及智能音箱使用的方法
CN104007969A (zh) 一种开机音播放方法及装置
CN113747092A (zh) 一种声道播放方法、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210517

Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Patentee after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Patentee after: Shanghai Xiaodu Technology Co.,Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Patentee before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.