CN110473555B - 一种基于分布式语音设备的交互方法及装置 - Google Patents

一种基于分布式语音设备的交互方法及装置 Download PDF

Info

Publication number
CN110473555B
CN110473555B CN201910854904.3A CN201910854904A CN110473555B CN 110473555 B CN110473555 B CN 110473555B CN 201910854904 A CN201910854904 A CN 201910854904A CN 110473555 B CN110473555 B CN 110473555B
Authority
CN
China
Prior art keywords
voice
information
equipment
voice information
devices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910854904.3A
Other languages
English (en)
Other versions
CN110473555A (zh
Inventor
葛有功
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Landleaf Building Technology Co ltd
Original Assignee
Shanghai Landleaf Building Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Landleaf Building Technology Co ltd filed Critical Shanghai Landleaf Building Technology Co ltd
Priority to CN201910854904.3A priority Critical patent/CN110473555B/zh
Publication of CN110473555A publication Critical patent/CN110473555A/zh
Application granted granted Critical
Publication of CN110473555B publication Critical patent/CN110473555B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明属于智能家居领域,公开了一种基于分布式语音设备的交互方法及装置,其方法包括:接收第一语音设备采集并发送的第一语音信息;获取第一语音信息对应的语义;根据语义判断第一语音信息是否包含交互意图;若是,则根据第一语音信息,在第二语音设备中确定目标语音设备;建立第一语音设备与目标语音设备之间的通信通道。本发明通过设置在不同位置的语音设备可实现家庭成员之间的交流,不仅可提高交流效果,而且,当家庭成员双手被占用,无法方便地拨打电话时,可通过语音唤醒语音设备,实现与不同房间的目标用户进行交流,不仅可提高交流的便捷性,而且不存在手机因静音或无电而导致手机无法接通的情况,进而提高交流的可靠性。

Description

一种基于分布式语音设备的交互方法及装置
技术领域
本发明属于智能家居技术领域,特别涉及一种基于分布式语音设备的交互方法及装置。
背景技术
随着生活水平的不断提高,人们的居住空间也越来越大。当人们居住在大户型或上下层的别墅里时,若位于不同房间的家庭成员之间需要交流时,则需要成员从一个房间走到另一个房间以进行面对面交流,或者需要成员加大说话声音以克服声音的穿墙损耗,再或者需要通过手机来进行交流,使得处于不同空间的家庭成员之间的交流很不便利,并且,可能存在听不清或听不到的情况,影响交流效果。
发明内容
本发明的目的是提供一种基于分布式语音设备的交互方法及装置,不仅可提高交流效果,而且可提高交流的便捷性。
本发明提供的技术方案如下:
一方面,提供一种基于分布式语音设备的交互方法,应用于控制终端,所述控制终端与设置于不同区域的多个语音设备通信连接;
所述基于分布式语音设备的交互方法包括:
接收第一语音设备采集并发送的第一语音信息;所述第一语音设备为所述多个语音设备中的任意一个;
获取所述第一语音信息对应的语义;
根据所述语义判断所述第一语音信息是否包含交互意图;
若是,则根据所述第一语音信息,在第二语音设备中确定目标语音设备;所述第二语音设备为所述多个语音设备中除所述第一语音设备以外的其它语音设备;
建立所述第一语音设备与所述目标语音设备之间的通信通道。
进一步优选地,所述根据所述第一语音信息,在第二语音设备中确定目标语音设备具体包括:
当所述第一语音信息中包括语音设备的标识信息时,获取所述标识信息;
根据所述标识信息,在所述第二语音设备中确定目标语音设备。
进一步优选地,所述根据所述第一语音信息,在第二语音设备中确定目标语音设备具体包括:
当所述第一语音信息中不包括语音设备的标识信息时,将所述第一语音信息发送至第二语音设备,并控制所述第二语音设备广播所述第一语音信息;
接收第三语音设备采集并发送的第二语音信息;所述第三语音设备为所述第二语音设备中的任意一个或多个;
根据所述第二语音信息,在所述第二语音设备中确定目标语音设备。
进一步优选地,所述接收第一语音设备采集并发送的语音信息之前还包括:
获取不同用户的声纹特征库;
所述根据所述第一语音信息,在第二语音设备中确定目标语音设备还包括:
提取所述第二语音信息对应的声纹特征;
根据所述声纹特征和所述声纹特征库,识别所述第二语音信息对应的用户身份;
根据所述用户身份和所述第一语音信息,从所述第三语音设备中确定目标语音设备。
进一步优选地,还包括:
当接收到多个语音设备采集并发送的所述第一语音信息时,获取每个语音设备发送的所述第一语音信息的分贝信息;
根据所述分贝信息,从发送所述第一语音信息的多个语音设备中确定第一语音设备。
另一方面,还提供一种基于分布式语音设备的交互装置,包括:
信息收发模块,用于与设置于不同区域的多个语音设备通信连接,还用于接收第一语音设备采集并发送的第一语音信息;所述第一语音设备为所述多个语音设备中的任意一个;
获取模块,用于获取所述第一语音信息对应的语义;
判断模块,用于根据所述语义判断所述第一语音信息是否包含交互意图;
分析模块,用于当所述第一语音信息包含交互意图时,根据所述第一语音信息,在第二语音设备中确定目标语音设备;所述第二语音设备为所述多个语音设备中除所述第一语音设备以外的其它语音设备;
通道建立模块,用于建立所述第一语音设备与所述目标语音设备之间的通信通道。
进一步优选地,所述分析模块包括:
标识获取单元,用于当所述第一语音信息中包括语音设备的标识信息时,获取所述标识信息;
分析单元,用于根据所述标识信息,在所述第二语音设备中确定目标语音设备。
进一步优选地,所述分析模块包括控制单元和分析单元;
所述控制单元,用于当所述第一语音信息中不包括语音设备的标识信息时,将所述第一语音信息发送至第二语音设备,并控制所述第二语音设备广播所述第一语音信息;
所述信息收发模块,用于接收第三语音设备采集并发送的第二语音信息;所述第三语音设备为所述第二语音设备中的任意一个或多个;
所述分析单元,用于根据所述第二语音信息,在所述第二语音设备中确定目标语音设备。
进一步优选地,还包括:
特征库获取模块,用于获取不同用户的声纹特征库;
所述分析模块还包括:
提取单元,用于提取所述第二语音信息对应的声纹特征;
识别单元,用于根据所述声纹特征和所述声纹特征库,识别所述第二语音信息对应的用户身份;
所述分析单元,还用于根据所述用户身份和所述第一语音信息,从所述第三语音设备中确定目标语音设备。
进一步优选地,所述获取模块,还用于当接收到多个语音设备采集并发送的所述第一语音信息时,获取每个语音设备发送的所述第一语音信息的分贝信息;
所述分析模块,还用于根据所述分贝信息,从发送所述第一语音信息的多个语音设备中确定第一语音设备。
与现有技术相比,本发明提供的一种基于分布式语音设备的交互方法及装置具有以下有益效果:本发明通过设置在不同位置的语音设备可实现家庭成员之间的交流,不仅可提高交流效果,而且,当家庭成员双手被占用,无法方便地拨打电话时,可通过语音唤醒语音设备,并通过设置在不同位置的语音设备实现与不同房间的目标用户进行交流,不仅可提高交流的便捷性,而且不存在手机因静音或无电而导致手机无法接通的情况,进而提高交流的可靠性。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种基于分布式语音设备的交互方法及装置的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种基于分布式语音设备的交互方法的第一实施例的流程示意图;
图2是本发明一种基于分布式语音设备的交互方法的第二实施例的流程示意图;
图3是本发明一种基于分布式语音设备的交互装置的一个实施例的结构示意框图。
附图标号说明
10、信息收发模块;20、获取模块;30、判断模块;40、分析模块;41、标识获取单元;42、分析单元;43、控制单元;44、提取单元;45、识别单元;50、通道建立模块;60、特征库获取模块。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
应当理解,当在本说明书中使用时,术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的存在或添加。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
图1是本发明提供的第一实施例,一种基于分布式语音设备的交互方法,应用于控制终端,控制终端可为本地网关,控制终端与设置于不同区域的多个语音设备通信连接;
该基于分布式语音设备的交互方法包括:
S100接收第一语音设备采集并发送的第一语音信息;所述第一语音设备为所述多个语音设备中的任意一个;
S200获取所述第一语音信息对应的语义;
S300根据所述语义判断所述第一语音信息是否包含交互意图;
S400若是,则根据所述第一语音信息,在第二语音设备中确定目标语音设备;所述第二语音设备为所述多个语音设备中除所述第一语音设备以外的其它语音设备;
S500建立所述第一语音设备与所述第二语音设备之间的通信通道。
具体地,随着智能家居的不断普及,语音音箱的作用越发明显。在家居场景下,为了更好地进行语音指令控制,可在家庭的各个房间设置语音面板或语音音箱来采集语音,并给出指令对应的响应。语音面板可为86型语音面板,以增加房间的整体美观性。在各个房间设置的语音面板或语音音箱即为本发明的语音设备,设置在各个房间的语音设备与控制终端通信连接,语音设备可采集用户的语音和播放语音。
一般情况下,各语音设备内的用于实现语音采集功能的模块处于未唤醒状态,当某一房间内的A用户需要与其他房间的B用户进行语音交互(语音交流)时,A用户可语音输入预设的唤醒词,以将距离A用户最近的语音设备唤醒,为方便后续描述,将该被A用户唤醒的语音设备定义为第一语音设备。第一语音设备被唤醒后可采集A用户输入的第一语音信息,第一语音设备将采集的第一语音信息发送给控制终端。
控制终端接收到第一语音信息后,可通过本地的语义解析模块对该第一语音信息进行语义解析。此外,还可将该第一语音信息发送至与控制终端通信连接的服务器,由服务器对该第一语音信息进行语义解析后,将语义解析结果返回至控制终端。
控制终端获取第一语音信息对应的语义后,可根据该语义判断第一语音信息是否包含交互意图,若是,则根据第一语音信息,在第二语音设备中确定目标语音设备。目标语音设备为A用户希望交互的对象所在房间的语音设备,即B用户所在房间的语音设备。目标语音设备可为一个或多个,其具体数量可根据用户希望交流的对象的数量来确定,进而实现家庭中的多人交谈方式。
可选的,S400根据第一语音信息,在第二语音设备中确定目标语音设备具体包括:
S410当所述第一语音信息中包括语音设备的标识信息时,获取所述标识信息;
S420根据所述标识信息,在所述第二语音设备中确定目标语音设备。
具体地,当确定第一语音信息包含交互意图时,进一步判断第一语音信息中是否包括语音设备的标识信息,如果包括,则获取该标识信息,并根据该标识信息,在第二语音设备中确定目标语音设备。例如,第一语音信息为“帮我连接C房间的语音设备”,则标识信息为“C房间”,目标语音设备即为设置在C房间的语音设备。
控制终端确定目标语音设备后,建立第一语音设备与目标语音设备之间的通信通道,即在后续A用户与B用户交互的过程中,将第一语音设备采集的语音信息透传至目标语音设备,并将目标语音设备采集的语音信息透传至第一语音设备,以实现A用户与B用户之间的交互。
示例性的,假设妈妈在A房间,孩子小明在B房间,妈妈现在需要和小明进行沟通交流。妈妈可通过语音指令唤醒A房间的语音设备(第一语音设备),然后输入第一语音信息,如帮我连接B房间的语音设备,控制终端根据该第一语音信息,可判断出该第一语音信息包括交互意图,然后从第一语音信息中获取标识信息“B房间的语音设备”,控制终端根据该标识信息,即可确定目标语音设备为B房间的语音设备,然后建立第一语音设备与目标语音设备之间的通信通道,并将该第一语音信息透传至目标语音设备,目标语音设备被唤醒,语音输出该第一语音信息,等待小明通过B房间的语音设备回复对应的语音信息,控制终端将小明回复的语音信息透传至A房间的语音设备,A房间的语音设备输出该回复信息。控制终端通过将第一语音设备采集的语音信息透传至目标语音设备,并将目标语音设备采集的语音信息透传至第一语音设备,可实现在A房间的妈妈与在B房间的小明的交流。
本发明的交互方法,主要用于在家中各家庭成员之间的交流,通过设置在不同位置的语音设备可实现家庭成员之间的交流,不仅可提高交流效果,而且,当家庭成员双手被占用,无法方便地拨打电话时,可通过语音唤醒语音设备,并通过设置在不同位置的语音设备实现与不同房间的目标用户进行交流,不仅可提高交流的便捷性,而且不存在手机因静音或无电而导致手机无法接通的情况,进而提高交流的可靠性。
本发明提供的第二实施例,如图2所示,一种基于分布式语音设备的交互方法,应用于控制终端,控制终端可为本地网关,控制终端与设置于不同区域的多个语音设备通信连接;
该基于分布式语音设备的交互方法包括:
S100接收第一语音设备采集并发送的第一语音信息;所述第一语音设备为所述多个语音设备中的任意一个;
S200获取所述第一语音信息对应的语义;
S300根据所述语义判断所述第一语音信息是否包含交互意图;
S400若是,则根据所述第一语音信息,在第二语音设备中确定目标语音设备;所述第二语音设备为所述多个语音设备中除所述第一语音设备以外的其它语音设备;
S500建立所述第一语音设备与所述第二语音设备之间的通信通道;
其中,S400根据所述第一语音信息,在第二语音设备中确定目标语音设备具体包括:
S430当所述第一语音信息中不包括语音设备的标识信息时,将所述第一语音信息发送至第二语音设备,并控制所述第二语音设备广播所述第一语音信息;
S440接收第三语音设备采集并发送的第二语音信息;所述第三语音设备为所述第二语音设备中的任意一个或多个;
S450根据所述第二语音信息,在所述第二语音设备中确定目标语音设备。
具体地,当控制终端判断出第一语音信息中不包括语音设备的标识信息时,将该第一语音信息发送至第二语音设备,即将该第一语音信息发送至除第一语音信息以外的所有语音设备。第二语音设备被唤醒,第二语音设备广播该第一语音信息,第二语音设备所处房间内的用户听到该第一语音信息后,可根据该第一语音信息进行相应的回复。
例如,妈妈想找小明,但是不知道现在小明在哪个房间,此时,可对第一语音设备输入第一语音信息“小明,你在哪”,其他房间内的第二语音设备广播“小明,你在哪”,小明听到后,可对所处房间的语音设备输入回复信息“我在B房间”,该所处房间的语音设备即为第三语音设备,回复信息即为第二语音信息。
第三语音设备将采集到的第二语音信息发送至控制终端,控制终端根据该第二语音信息从第二语音设备中确定目标语音设备。例如,根据第二语音信息“我在B房间”即可确定目标语音设备为B房间的语音设备。
第二语音信息还可以是他人(非小明本人)的回复信息,如他人回复的“小明在B房间”,此时,仍可根据第二语音信息“小明在B房间”确定出目标语音设备为B房间的语音设备。若第二语音信息是小明本人回答的,则目标语音设备为第三语音设备,若第二语音信息是非小明本人回答的,则目标语音设备不是第三语音设备。
可选的,在接收第一语音设备采集并发送的语音信息之前还包括:
S010获取不同用户的声纹特征库;
S400所述根据所述第一语音信息,在第二语音设备中确定目标语音设备还包括:
S460提取所述第二语音信息对应的声纹特征;
S470根据所述声纹特征和所述声纹特征库,识别所述第二语音信息对应的用户身份;
S480根据所述用户身份和所述第一语音信息,从所述第三语音设备中确定目标语音设备。
具体地,控制终端还可获取各家庭成员的语音,以建立家庭成员的声纹特征库。控制终端与服务器通信连接,服务器与各家庭成员的智能终端通信连接,各家庭成员可通过智能终端上的APP完成语音录入,智能终端将录入的语音发送至服务器,服务器对各家庭成员录入的语音进行处理,提取出各家庭成员对应的声纹特征,然后建立家庭成员的声纹特征库。声纹特征可包括声调、频率等特征。各家庭成员的语音录入还可直接通过语音设备来完成,然后语音设备将各家庭成员录入的语音发送至控制终端,控制终端再发送服务器,由服务器生成声纹特征库。
控制终端接收服务器发送的声纹特征库后,将该声纹特征库存储在本地。
当控制终端无法根据第二语音信息,在第二语音设备中确定出目标语音设备时,即第二语音信息中并未包含任何语音设备的标识信息时,可提取第二语音信息对应的声纹特征,然后根据该声纹特征以及存储的声纹特征库,确定第三语音设备对应的用户身份,然后根据识别出的用户身份,从第三语音设备中确定目标语音设备。
第三语音设备可为一个或多个,当第三语音设备为一个时,则第二语音信息也为一个,若该第二语音信息对应的声纹特征与第一语音信息中包含的用户信息相匹配时,则说明采集该第二语音信息的第三语音设备即为目标语音设备。若该第二语音信息对应的声纹特征与第一语音信息中包含的用户信息不匹配时,则说明采集该第二语音信息的第三语音设备不是目标语音设备,此时,控制终端可控制第一语音设备输出提示信息,提示用户(妈妈)未找到目标用户(小明)。
当第三语音设备为多个时,每个第三语音设备接收一条第二语音信息,即第二语音信息有多条。若某条第二语音信息对应的声纹特征与第一语音信息中包含的用户信息相匹配时,则说明该条第二语音信息对应的第三语音设备即为目标语音设备。若所有的第二语音信息对应的声纹特征与第一语音信息中包含的用户信息都不匹配时,则说明所有的第三语音设备都不是目标语音设备,此时,控制终端可控制第一语音设备输出提示信息,提示用户未找到目标对象。
可选的,还包括:
S110当接收到多个语音设备采集并发送的所述第一语音信息时,获取每个语音设备发送的所述第一语音信息的分贝信息;
S120根据所述分贝信息,从发送所述第一语音信息的多个语音设备中确定第一语音设备。
具体地,当多个语音设备被用户唤醒并采集该用户输入的第一语音信息时,可根据每个语音设备采集的第一语音信息的分贝信息来确定唯一的第一语音设备,即选取分贝最大的第一语音信息对应的语音设备作为第一语音设备。
当多个语音设备采集的第一语音信息的分贝相同时,还可根据用户与语音设备之间的距离来确定第一语音设备;即选取距离用户最近的语音设备作为第一语音设备。
应理解,在上述各实施例中,各步骤序号的大小并不意味着执行顺序的先后,各步骤的执行顺序应以功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
根据本发明提供的第三实施例,如图3所示,一种基于分布式语音设备的交互装置,包括:
信息收发模块10,用于与设置于不同区域的多个语音设备通信连接,还用于接收第一语音设备采集并发送的第一语音信息;所述第一语音设备为所述多个语音设备中的任意一个;
获取模块20,用于获取所述第一语音信息对应的语义;
判断模块30,用于根据所述语义判断所述第一语音信息是否包含交互意图;
分析模块40,用于当所述第一语音信息包含交互意图时,根据所述第一语音信息,在第二语音设备中确定目标语音设备;所述第二语音设备为所述多个语音设备中除所述第一语音设备以外的其它语音设备;
通道建立模块50,用于建立所述第一语音设备与所述目标语音设备之间的通信通道。
优选地,分析模块40包括:
标识获取单元41,用于当所述第一语音信息中包括语音设备的标识信息时,获取所述标识信息;
分析单元42,用于根据所述标识信息,在所述第二语音设备中确定目标语音设备。
优选地,分析模块40包括控制单元43和分析单元42;
控制单元43,用于当所述第一语音信息中不包括语音设备的标识信息时,将所述第一语音信息发送至第二语音设备,并控制所述第二语音设备广播所述第一语音信息;
信息收发模块10,用于接收第三语音设备采集并发送的第二语音信息;所述第三语音设备为所述第二语音设备中的任意一个或多个;
分析单元42,用于根据所述第二语音信息,在所述第二语音设备中确定目标语音设备。
优选地,还包括:
特征库获取模块60,用于获取不同用户的声纹特征库;
分析模块40还包括:
提取单元44,用于提取所述第二语音信息对应的声纹特征;
识别单元45,用于根据所述声纹特征和所述声纹特征库,识别所述第二语音信息对应的用户身份;
分析单元42,还用于根据所述用户身份和所述第一语音信息,从所述第三语音设备中确定目标语音设备。
优选地,获取模块20,还用于当接收到多个语音设备采集并发送的所述第一语音信息时,获取每个语音设备发送的所述第一语音信息的分贝信息;
分析模块40,还用于根据所述分贝信息,从发送所述第一语音信息的多个语音设备中确定第一语音设备。
本实施例中的各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于分布式语音设备的交互方法,其特征在于,应用于控制终端,所述控制终端与设置于不同房间的多个语音设备通信连接;
所述基于分布式语音设备的交互方法包括:
接收第一语音设备采集并发送的第一语音信息;所述第一语音设备为所述多个语音设备中的任意一个;
获取所述第一语音信息对应的语义;
根据所述语义判断所述第一语音信息是否包含交互意图;
若是,则根据所述第一语音信息,在第二语音设备中确定目标语音设备;所述第二语音设备为所述多个语音设备中除所述第一语音设备以外的其它语音设备;
建立所述第一语音设备与所述目标语音设备之间的通信通道。
2.根据权利要求1所述的一种基于分布式语音设备的交互方法,其特征在于,所述根据所述第一语音信息,在第二语音设备中确定目标语音设备具体包括:
当所述第一语音信息中包括语音设备的标识信息时,获取所述标识信息;
根据所述标识信息,在所述第二语音设备中确定目标语音设备。
3.根据权利要求1或2所述的一种基于分布式语音设备的交互方法,其特征在于,所述根据所述第一语音信息,在第二语音设备中确定目标语音设备具体包括:
当所述第一语音信息中不包括语音设备的标识信息时,将所述第一语音信息发送至第二语音设备,并控制所述第二语音设备广播所述第一语音信息;
接收第三语音设备采集并发送的第二语音信息;所述第三语音设备为所述第二语音设备中的任意一个或多个;
根据所述第二语音信息,在所述第二语音设备中确定目标语音设备。
4.根据权利要求3所述的一种基于分布式语音设备的交互方法,其特征在于,所述接收第一语音设备采集并发送的语音信息之前还包括:
获取不同用户的声纹特征库;
所述根据所述第一语音信息,在第二语音设备中确定目标语音设备还包括:
提取所述第二语音信息对应的声纹特征;
根据所述声纹特征和所述声纹特征库,识别所述第二语音信息对应的用户身份;
根据所述用户身份和所述第一语音信息,从所述第三语音设备中确定目标语音设备。
5.根据权利要求1所述的一种基于分布式语音设备的交互方法,其特征在于,还包括:
当接收到多个语音设备采集并发送的所述第一语音信息时,获取每个语音设备发送的所述第一语音信息的分贝信息;
根据所述分贝信息,从发送所述第一语音信息的多个语音设备中确定第一语音设备。
6.一种基于分布式语音设备的交互装置,其特征在于,包括:
信息收发模块,用于与设置于不同房间的多个语音设备通信连接,还用于接收第一语音设备采集并发送的第一语音信息;所述第一语音设备为所述多个语音设备中的任意一个;
获取模块,用于获取所述第一语音信息对应的语义;
判断模块,用于根据所述语义判断所述第一语音信息是否包含交互意图;
分析模块,用于当所述第一语音信息包含交互意图时,根据所述第一语音信息,在第二语音设备中确定目标语音设备;所述第二语音设备为所述多个语音设备中除所述第一语音设备以外的其它语音设备;
通道建立模块,用于建立所述第一语音设备与所述目标语音设备之间的通信通道。
7.根据权利要求6所述的一种基于分布式语音设备的交互装置,其特征在于,所述分析模块包括:
标识获取单元,用于当所述第一语音信息中包括语音设备的标识信息时,获取所述标识信息;
分析单元,用于根据所述标识信息,在所述第二语音设备中确定目标语音设备。
8.根据权利要求6或7所述的一种基于分布式语音设备的交互装置,其特征在于,所述分析模块包括控制单元和分析单元;
所述控制单元,用于当所述第一语音信息中不包括语音设备的标识信息时,将所述第一语音信息发送至第二语音设备,并控制所述第二语音设备广播所述第一语音信息;
所述信息收发模块,用于接收第三语音设备采集并发送的第二语音信息;所述第三语音设备为所述第二语音设备中的任意一个或多个;
所述分析单元,用于根据所述第二语音信息,在所述第二语音设备中确定目标语音设备。
9.根据权利要求8所述的一种基于分布式语音设备的交互装置,其特征在于,还包括:
特征库获取模块,用于获取不同用户的声纹特征库;
所述分析模块还包括:
提取单元,用于提取所述第二语音信息对应的声纹特征;
识别单元,用于根据所述声纹特征和所述声纹特征库,识别所述第二语音信息对应的用户身份;
所述分析单元,还用于根据所述用户身份和所述第一语音信息,从所述第三语音设备中确定目标语音设备。
10.根据权利要求6所述的一种基于分布式语音设备的交互装置,其特征在于,
所述获取模块,还用于当接收到多个语音设备采集并发送的所述第一语音信息时,获取每个语音设备发送的所述第一语音信息的分贝信息;
所述分析模块,还用于根据所述分贝信息,从发送所述第一语音信息的多个语音设备中确定第一语音设备。
CN201910854904.3A 2019-09-10 2019-09-10 一种基于分布式语音设备的交互方法及装置 Active CN110473555B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910854904.3A CN110473555B (zh) 2019-09-10 2019-09-10 一种基于分布式语音设备的交互方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910854904.3A CN110473555B (zh) 2019-09-10 2019-09-10 一种基于分布式语音设备的交互方法及装置

Publications (2)

Publication Number Publication Date
CN110473555A CN110473555A (zh) 2019-11-19
CN110473555B true CN110473555B (zh) 2020-09-08

Family

ID=68515491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910854904.3A Active CN110473555B (zh) 2019-09-10 2019-09-10 一种基于分布式语音设备的交互方法及装置

Country Status (1)

Country Link
CN (1) CN110473555B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111028837B (zh) * 2019-12-16 2022-10-04 深圳云之家网络有限公司 语音会话方法、语音识别系统及计算机存储介质
CN113129888A (zh) * 2020-01-10 2021-07-16 阿里巴巴集团控股有限公司 设备唤醒方法、装置、设备
CN111667820A (zh) * 2020-06-22 2020-09-15 京东方科技集团股份有限公司 通信方法、装置、电子设备和计算机可读存储介质
CN111817936A (zh) * 2020-08-12 2020-10-23 深圳市欧瑞博科技股份有限公司 智能家居设备的控制方法,装置、电子设备以及存储介质
CN112259076B (zh) * 2020-10-12 2024-03-01 北京声智科技有限公司 语音交互方法、装置、电子设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104007678A (zh) * 2014-05-26 2014-08-27 邯郸美的制冷设备有限公司 家用电器语音控制的方法、终端和系统
US20160070695A1 (en) * 2013-08-06 2016-03-10 Nuance Communications, Inc. Method And Apparatus For A Multi I/O Modality Language Independent User-Interaction Platform
CN106782539A (zh) * 2017-01-16 2017-05-31 上海智臻智能网络科技股份有限公司 一种智能语音交互方法、装置及系统
CN208873015U (zh) * 2018-06-28 2019-05-17 江苏尚秦工程技术有限公司 一种无线对讲的智能家居控制系统
CN109936814A (zh) * 2019-01-16 2019-06-25 深圳市北斗智能科技有限公司 一种对讲终端、语音对讲协同调度方法及其系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160070695A1 (en) * 2013-08-06 2016-03-10 Nuance Communications, Inc. Method And Apparatus For A Multi I/O Modality Language Independent User-Interaction Platform
CN104007678A (zh) * 2014-05-26 2014-08-27 邯郸美的制冷设备有限公司 家用电器语音控制的方法、终端和系统
CN106782539A (zh) * 2017-01-16 2017-05-31 上海智臻智能网络科技股份有限公司 一种智能语音交互方法、装置及系统
CN208873015U (zh) * 2018-06-28 2019-05-17 江苏尚秦工程技术有限公司 一种无线对讲的智能家居控制系统
CN109936814A (zh) * 2019-01-16 2019-06-25 深圳市北斗智能科技有限公司 一种对讲终端、语音对讲协同调度方法及其系统

Also Published As

Publication number Publication date
CN110473555A (zh) 2019-11-19

Similar Documents

Publication Publication Date Title
CN110473555B (zh) 一种基于分布式语音设备的交互方法及装置
CN108900502B (zh) 一种基于家居智能互联的通信方法、系统
CN102857807B (zh) 语音控制通信终端的方法及数字电视终端
US20060047513A1 (en) Voice-activated remote control system and method
CN104104790A (zh) 语音操控方法与移动终端装置
CN103067754A (zh) 一种电视语音投票方法、系统和终端
CN210986246U (zh) 会议终端及会议终端系统
MXPA05000311A (es) Pasarela de comunicacion controlable por voz para controlar multiples aparatos electronicos y de informacion.
CN104104789A (zh) 语音接听方法与移动终端装置
CN109151789B (zh) 翻译方法、装置、系统以及蓝牙耳机
JP2003527784A (ja) 局部的なスピーチ認識を採用してdtmf信号を送信する方法と装置
CN111971647A (zh) 语音识别设备、语音识别设备的协作系统和语音识别设备的协作方法
WO2016198132A1 (en) Communication system, audio server, and method for operating a communication system
US10236016B1 (en) Peripheral-based selection of audio sources
CN104873062A (zh) 一种具有语音控制功能的水杯
CN103152334A (zh) 楼宇对讲系统使用管理平台语音识别远程开门的方法
US6373374B1 (en) Cordless phone system with speech recognition alarm
CN111161742A (zh) 一种定向人员沟通方法、系统、存储介质及智能语音设备
CN111261139A (zh) 文字拟人化播报方法及系统
CN105337818A (zh) 一种基于电力网络的家庭组网方法、系统及设备
KR20190016398A (ko) 로비폰과 pc를 사용한 경비실 인터폰 착신 지정이 가능한 인터폰 서비스 시스템 및 방법
CN110910541A (zh) 门禁控制方法、系统、网络设备及计算机可读存储介质
CN109510743A (zh) 一种智能音箱系统的快速集群方法
CN111882711A (zh) 一种门锁控制方法及系统,存储介质、电子装置
CN111918151B (zh) 智能家居控制面板及对讲方法、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant