CN114556805A

CN114556805A - 用于由语音助手处理的语音命令的中继设备、语音助手和无线网络

Info

Publication number: CN114556805A
Application number: CN202080051277.0A
Authority: CN
Inventors: 托马斯·吉拉迪尔; 文森特·娜拉塔比
Original assignee: Google LLC
Current assignee: Google LLC
Priority date: 2019-12-09
Filing date: 2020-12-09
Publication date: 2022-05-27
Also published as: US20220301567A1; EP4013085A1; EP3836582A1; EP3836582B1; WO2021116152A1

Abstract

本公开涉及一种无线网络(10)的中继设备(30)，所述无线网络包括通过无线链路相互连接的多个网络节点，其中，所述中继设备(30)被配置为：‑从连接到无线网络的源节点(20)接收输入信号，所述输入信号包括由源节点的麦克风接收的语音命令，所述语音命令将由语音助手处理；‑基于输入信号来确定连接到无线网络并适于处理所述语音命令的接收者语音助手(40)；‑向接收者语音助手(40)传送包括语音命令的输出信号。本公开还涉及语音助手(40)和无线网络(10)，以及用于通过中继设备(30)和语音助手(40)来处理语音命令的方法。

Description

用于由语音助手处理的语音命令的中继设备、语音助手和无线网络

技术领域

本公开涉及一种用于中继由语音助手处理的语音命令的中继设备、一种适于处理这种中继的语音命令的语音助手以及一种包括语音助手和中继设备的无线网络。

背景技术

语音助手正变得越来越流行。语音助手是一旦识别出语音触发(例如“你好语音助手”)就会做出响应的被动聆听设备。它们使用话音识别算法来检测用户口头请求中的关键字。这样的语音助手连接到互联网，因此他们可以将解析的请求发送到将计算适当响应的远程服务器。

这种语音助手只能处理由附近用户发出的请求，使得其通常不可能用单个语音助手来覆盖整个公寓或房屋。

为了能够从例如在同一个房子里内的多个位置向语音助手发出请求，众所周知的是将多个语音助手嵌入到不同的电子设备中，诸如电视、扬声器、智能手机、智能手表等。所有这些语音助手都是独立的，因为它们包括完整的语音助手软件(话音识别算法等)并连接到互联网，以便将解析的请求发送到远程服务器并接收远程服务器计算出的响应。这将语音助手的使用限制在昂贵的电子设备上，因为它们必须有足够的能力来运行完整的软件，并且必须至少集成例如已插入或具有高电池容量的Wi-Fi芯片组(或任何其他允许连接互联网的芯片组)。

最近，一些配备麦克风的蓝牙扬声器开始只实现语音触发的检测。一旦检测到语音触发，此类蓝牙扬声器就会与其配对的语音助手建立蓝牙语音链接，以便向其传送语音命令从而可以确定响应。这是有利的，因为与完整的语音助手软件相比，语音触发的检测需要更少的资源(在性能和成本方面)。

在这种情况下，可以在一定程度上扩大语音助手的覆盖范围，因为它可以处理从所述蓝牙扬声器附近的用户收到的请求。相关的资源复杂度增加低于提供两个独立的语音助手，因为蓝牙扬声器仅实现语音触发的检测，而语音助手可选地通过远程服务器来处理语音命令并确定响应。

然而，所部署的语音助手使用只允许一对一的语音链接的蓝牙协议版本，使得这些语音助手只能与单个远程设备通信，这极大地限制了可实现的覆盖区域扩展。此外，可实现的覆盖区域扩展也受到蓝牙协议最大范围的限制。

发明内容

本公开旨在提出一种用于扩大语音助手覆盖区域的解决方案，以能够减少覆盖给定区域(例如公寓或建筑物)所需的语音助手数量，以创建“环境”或“无处不在”的语音助手。

此外，本公开旨在至少在一些实施例中，即使对于现有语音助手(其在可以建立同步语音链路的数量上可能受到极大的限制)也允许实现这种覆盖区域扩展。

为此目的，并且根据第一方面，本公开涉及一种中继设备，其包括处理电路和用于连接到无线网络的无线通信单元，所述无线网络包括通过无线链路相互连接的多个网络节点，其中，所述中继设备被配置为：

-通过所述无线通信单元从连接到所述无线网络的源节点接收输入信号，所述输入信号包括由所述源节点的麦克风接收的语音命令，所述语音命令由语音助手处理；

-通过所述处理电路并且基于所述输入信号来确定连接到所述无线网络并适于处理所述语音命令的接收者语音助手；

-由所述无线通信单元向所述接收者语音助手传送包括所述语音命令的输出信号。

因此，这样的中继设备可以将从无线网络的源节点接收到的语音命令中继到无线网络的语音助手。换句话说，语音命令可以在无线网络内通过多跳到达语音助手，从而增加语音助手的覆盖范围。

无线网络包括或优选地构成于仅通过无线链路相互连接的多个网络节点。因此，无线网络的任何网络节点可以通过使用专门的无线链路直接(通过单个无线链路/跳)和/或间接(通过多个无线链路/跳)与无线网络的任何其他网络节点进行通信。因此，这种无线网络可以使用任何拓扑，只要网络节点之间的所有链路都是无线链路。无线网络可以通过其网络节点中的至少一个连接到有线网络。无线网络可以是同构的或者是异构的。在同构无线网络中，所有无线链路都使用同一无线通信协议。在异构无线网络中，并非所有的无线链路都使用同一无线通信协议，有些无线链路可以使用第一无线通信协议，例如蓝牙协议，而其他一些无线链路可以使用不同于第一无线通信协议的第二无线通信协议，例如Wi-Fi协议。

因此，中继设备可以直接从源节点(单跳)或间接地(多跳，通过至少一个其他中继设备)来接收语音命令。类似地，中继设备可以直接(单跳)或间接(多跳，通过至少一个其他中继设备)向确定的接收者语音助手传送语音命令。

在一个特定实施例中，中继设备还可包括单独考虑或以任何技术上可能的组合考虑的以下特征中的一个或多个。

在一个特定实施例中，无线通信单元包括以下至少一项：

-蓝牙通信单元；

-Wi-Fi通信单元；

-Zigbee通信单元。

在一个特定实施例中，处理电路被配置为通过执行以下至少一项来确定接收者语音助手：

-从输入信号中提取所述语音助手的标识符；

-在输入信号中搜索至少一个预定词；

-使用无线网络的拓扑。

在一个特定实施例中，处理电路还被配置为基于无线网络的拓扑来确定到接收者语音助手的路径，并且当向接收者语音助手传送语音命令时使用所述路径。

根据第二方面，本公开涉及一种方法，其用于通过连接到无线网络的中继设备来处理包括要由语音助手处理的语音命令的输入信号，所述无线网络包括通过无线链路相互连接的多个网络节点，其中，所述方法包括：

-从连接到无线网络的源节点接收输入信号，所述输入信号包括由源节点的麦克风接收的语音命令；

-基于输入信号来确定连接到无线网络并且适于处理所述语音命令的接收者语音助手；

-向接收者语音助手传送包括语音命令的输出信号。

根据第三方面，本公开涉及一种包括指令的计算机程序产品，所述指令当由包括无线通信单元和处理电路的中继设备执行时，配置所述中继设备以执行根据本发明的任何一个实施例的处理输入信号的方法。

根据第四方面，本公开涉及一种语音助手，其包括处理电路和用于连接到无线网络的无线通信单元，所述无线网络包括通过无线链路相互连接的多个网络节点，其中，所述语音助手被配置为：

-通过无线通信单元接收至少两个输入信号，每个输入信号包括由无线网络的源节点的麦克风接收的语音命令；

-由处理电路来确定所述输入信号的语音命令是否对应于单个用户发出的同一请求；

-如果所述语音命令对应于单个用户发出的同一请求：基于所述语音命令中的至少一个来确定对语音命令的单个响应；

-如果所述语音命令对应于不同的请求：确定对每个不同语音命令的响应。

实际上，在包括至少一个被布置为中继语音命令的中继设备的无线网络中，语音助手可以接收多个语音命令。然而，在某些情况下，语音命令可能对应于同一用户发出的同一请求。实际上，同一请求可以被不同的源节点接收，这些源节点可能通过同一中继设备或通过各自不同的中继设备连接到语音助手。源节点之一也可能直接连接到语音助手，在这种情况下，通过中继设备直接从这个源节点接收同一请求，并且间接从另一个源节点接收同一请求。因此，语音助手优选地被布置为检测通过不同路径接收的语音命令是否对应于单个用户发出的同一请求，以避免确定对单个请求的多个响应。

在特定实施例中，语音助手还可以包括单独考虑或以任何技术上可能的组合考虑的以下特征中的一个或多个。

在一个特定实施例中，所述处理电路还被配置为，如果所述语音命令对应于单个用户发出的同一请求，则处理所述语音命令以产生增强的语音命令，并且基于增强的语音命令来确定单个响应。

在一个特定实施例中，处理电路还被配置为，如果所述语音命令对应于单个用户发出的同一请求，则处理对应的输入信号以针对用户来确定位置信息，并且基于位置信息来确定单个响应。

在一个特定实施例中，处理电路还被配置为如果所述语音命令对应于具有各自优先级的不同请求，则按照基于请求的各自优先级确定的顺序来确定各自的响应。

在一个特定实施例中，处理电路还被配置为如果输入信号包括针对已经发出对应请求的用户的位置信息，则从输入信号提取所述位置信息并且基于位置信息来确定所述响应。

在一个特定实施例中，确定响应包括基于用户的位置信息来选择无线网络的至少一个响应节点，并且命令至少一个响应节点以执行响应与请求而确定的至少一个动作。

根据第五方面，本公开涉及一种用于由连接到无线网络的语音助手处理语音命令的方法，所述无线网络包括通过无线链路相互连接的多个网络节点，其中，所述方法包括：

-从无线网络的至少一个中继设备接收至少两个输入信号，每个输入信号包括由无线网络的源节点的相应麦克风接收的语音命令；

-确定所述输入信号的语音命令是否对应于由单个用户发出的同一请求；

-如果所述语音命令对应于单个用户发出的同一请求：则基于所述语音命令中的至少一个来确定对语音命令的单个响应；

-如果所述语音命令对应于不同的请求：则确定对每个不同语音命令的响应。

根据第六方面，本公开涉及一种包括指令的计算机程序产品，当由包括无线通信单元和处理电路的语音助手执行时，所述指令配置所述语音助手以执行根据本发明的任一个实施例的用于处理语音命令的方法。

根据第七方面，本公开涉及一种无线网络，其包括通过无线链路相互连接的多个网络节点，其中，至少一个网络节点是包括麦克风的源节点，至少一个网络节点是根据本发明任一个实施例的语音助手，并且至少一个网络节点是根据本发明任一个实施例的中继设备。

在一个特定实施例中，无线网络可以包括以下至少一项：

-低功耗蓝牙、BLE、网状网络；

-蓝牙微微网；

-Wi-Fi网络。

附图说明

通过阅读以下描述将更好地理解本发明，以下描述是作为示例而不是以限制的方式给出的，并参考以下附图作出，附图示出：

-图1：包括至少一个中继设备的示例性无线网络的示意表示；

-图2：表示用于由中继设备处理包括由语音助手处理的语音命令的输入信号的示例性方法的主要步骤的图；

-图3：表示用于由语音助手处理从无线网络接收的多个语音命令的示例性方法的主要步骤的图；

-图4：包括多个源节点和中继设备以及一个语音助手的示例性无线网络的示意表示。

在这些图中，从一个图到另一个图的相同附图标记表示相同或类似的元件。为清楚起见，除非另有明确说明，否则所示元件未按比例绘制。

具体实施方式

图1示意性地表示包括通过无线链路相互连接的多个网络节点的示例性无线网络10。

在图1的a)部分描绘的示例性实施例中，无线网络10的网络节点包括：

-包括麦克风(图中未示出)的源节点20，其适于将用户发出的口头请求数字化以获得语音命令；

-语音助手40，其用于处理与用户发出的口头请求相对应的语音命令；

-中继设备30，其用于将来自源节点20的语音命令中继到语音助手40。

在图1的b)部分描绘的示例性实施例中，无线网络10包括两个中继设备30，并且源节点20发出的语音命令在到达语音助手40之前依次由第一中继设备30和第二中继设备30中继。

当然，无线网络10可以包括与图1中表示的无线网络10不同数量的网络节点和/或可以具有与图1中表示的无线网络10不同的拓扑结构。特别地，无线网络10可以包括：

-多个源节点20，其优选地分布在给定区域(例如房屋、建筑物等)中，以便能够记录来自所述给定区域内的任何位置的口头请求；

-多个中继设备30，其优选地分布在所述给定区域中，以便能够将来自任何源节点20的语音命令转发到语音助手40；

-多个语音助手40，其可以对应于例如来自不同制造商的语音助手，

-一个或多个响应节点50，每个响应节点适于执行用于响应于请求的一个可能的动作；例如，响应节点50可以包括以下中的至少一个：扬声器、屏幕、致动器(例如用于打开/关闭灯、电视、烤箱、散热器等)等。

当然，网络节点可以实现多种功能。

例如，源节点20也可以是中继设备30和/或响应节点50。类似地，中继设备30也可以是源节点20和/或响应节点50，并且甚至是语音助手40(如果无线网络包括多个语音助手40)等。

无线网络10的每个网络节点包括无线通信单元以便连接到无线网络10，即以便与无线网络10的至少一个其他网络节点建立无线链路。每个无线通信单元支持至少一种无线通信协议。

在本公开中，“(口头)请求”对应于用户发出的声音信号。“语音命令”对应于通过至少数字化由麦克风响应于口头请求的接收而发出的模拟音频信号而获得的数字信号。语音命令可以对应于数字音频信号或从数字音频信号导出的预处理数据，例如从数字音频信号中提取的单词列表。而且，“语音命令”对应于口头请求的有用部分，即对应于要确定对其的响应的实际请求的数据(例如“现在几点了？”，“请提高客厅中温度”、“明天的天气预报是什么？”等)。“语音触发”类似于语音命令(即数字音频信号或从所述数字音频信号导出的预处理数据)，但对应于口头请求的控制部分，其用于检测声音信号包括由语音助手处理的请求(例如“你好语音助手”等)。

如图1所示，中继设备30包括无线通信单元31和处理电路32。

例如，处理电路32包括一个或多个处理器和存储装置(磁性硬盘、固态盘、光盘、电子存储器等)，其中，以一组程序代码指令的形式存储计算机程序产品，该程序代码指令要被执行以便实现用于处理包括语音命令的输入信号的方法60的全部或部分步骤。可替选地，或与其组合，处理电路32可包括适于实现处理方法60的所有或部分所述步骤的一个或多个可编程逻辑电路(FPGA、PLD等)和/或一个或多个专用集成电路(ASIC)和/或一组分立电子组件等。

例如，耦合到处理电路32的无线通信单元31对应于包括被认为是技术人员已知的组件((多个)天线、(多个)放大器、(多个)本地振荡器、(多个)混频器、(多个)模拟和/或数字滤波器等)的射频电路。如上所述，无线通信单元31实现至少一种无线通信协议。例如，无线通信单元31可以包括以下至少一项：

-蓝牙通信单元；

-Wi-Fi通信单元；

-Zigbee通信单元。

换言之，中继设备30的处理电路32与无线通信单元31形成一组由软件(特定计算机程序产品)及/或由硬件(处理器、FPGA、PLD、ASIC、分立电子元件、射频电路等)配置的装置，以实现用于由中继设备30处理包括语音命令的输入信号的方法60的全部或部分步骤。

图2示意性地表示了用于由中继设备30处理包括要由无线网络10的语音助手40处理的语音命令的输入信号的方法60的主要步骤。

如图2所示，所述处理方法50包括由中继设备30执行以下步骤：

-步骤S61，从连接到无线网络10的源节点20接收输入信号，所述输入信号包括由源节点20的麦克风接收的语音命令；

-步骤S62，基于输入信号来确定连接到无线网络并且适于处理所述语音命令的接收者语音助手40；

-步骤S63，向接收者语音助手40传送包括语音命令的输出信号。

在步骤S61期间，中继设备30的无线通信单元31接收包括由源节点20的麦克风接收的语音命令的输入信号。如上所述，可以直接从源节点20或者间接地通过至少一个其他中继设备30来接收输入信号。除了语音命令之外，输入信号还可以包括口头请求的语音触发。语音命令(以及在适用的情况下，语音触发)可以对应于数字音频信号，或者对应于从数字音频信号导出的预处理数据，例如在数字音频信号中检测到的单词列表。

在步骤S62期间，中继设备30的处理电路32基于输入信号来确定连接到无线网络10并适于处理所述语音命令的接收者语音助手40。

例如，如果存在连接到无线网络10的单个语音助手40，则步骤S62可以简化为在中继设备30的存储装置中检索所述语音助手40的标识符。也可以为无线网络10定义默认语音助手40，在这种情况下，中继设备30可以在中继设备30的存储装置中检索所述默认语音助手40的标识符。

根据另一示例，如果存在连接到无线网络10的至少两个语音助手40，则步骤S62可以包括例如在输入信号中搜索至少一个预定词(即关键字)。例如，如果输入信号包括包含语音助手名称的语音触发(例如，用于

制造的语音助手的“Hello Siri”、用于

制造的语音助手的“Hello Google”、用于由

制造的语音助手的“HelloAlexa”等)，则可以在语音触发中搜索预定名称(例如“Siri”、“Google”、“Alexa”等)。因此，如果无线网络10包括由不同制造商开发的语音助手，则可以确定连接到无线网络10的语音助手40中的哪个是所接收的语音命令的接收者语音助手。在输入信号中(例如在语音触发中)搜索预定词可以使用本领域技术人员已知的任何方法。例如，可以使用话音识别算法，或者计算与存储在中继设备30的存储装置中的每个参考词的相似度等。

根据又一示例，如果存在连接到无线网络10的至少两个语音助手40，则步骤S62可以包括例如使用无线网络10的拓扑。例如，如果拓扑(或拓扑的至少一部分)对于中继设备30是已知的，则可以例如选择最近的语音助手40(例如，根据到达语音助手所需的跳数，或到达所述语音助手所需的时间等)作为接收方语音助手40。

应当注意，以上示例是非限制性的并且可以例如也被结合。例如，如果存在多个来自同一制造商的语音助手，则可以选择与从包含在输入信号中的语音触发中提取的名称(例如“Siri”、“Google”、“Alexa”等)对应的最接近的语音助手40。

不管无线网络10中是否存在一个或多个语音助手40，步骤S62也可以简化为例如从输入信号中提取接收者语音助手40的标识符。实际上，例如，如果所述标识符已被先前确定接收者语音助手40的源节点20和/或被先前确定所述接收者语音助手40的另一中继设备30包括在输入信号中，则接收者语音助手的标识符可以与语音命令一起直接包括在输入信号中。

结合以上示例或作为以上示例的替代，确定接收者语音助手40的步骤S62还可以包括确定所接收的输入信号包括由语音助手40处理的语音命令。例如，有可能源节点20不对数字音频信号中的语音触发进行任何检测，并且中继设备30需要确定输入信号中包含的数字音频信号是否包含语音触发。在这种情况下，中继设备30可以通过应用本领域技术人员已知的方法在所接收的数字音频信号中搜索语音触发。如果中继设备30检测到语音触发，则所述中继设备30将语音命令转发给语音助手40。如果中继设备30没有检测到语音触发，则不将所接收的数字音频信号转发给语音助手40。

为了减少要在源节点20与中继设备30之间交换的数据量，优选地由源节点20执行数字音频信号是否包括语音命令的确定。例如，源节点20可以例如当检测到触发时，确定数字音频信号包括语音命令。触发可以是要在数字音频信号中检测到的语音触发，也可以是通过例如用户在发出口头请求之前按下源节点20或源节点20的遥控器上的按钮(在这种情况下，遥控器可以是无线网络10的网络节点)等引起的手动触发。

出于本公开的目的，接收者语音助手40的标识符可以是明确地识别无线网络10内的语音助手40的任何识别信息。这样的标识符可以是例如MAC地址、IP地址、网状网络中的ID等。

在步骤S63期间，中继设备30的无线通信单元31向接收者语音助手40传送包括语音命令的输出信号。应当注意的是，中继设备30可以将所接收的语音命令转发，或者它可以在将所述语音命令转发给接收方语音助手40之前对其进行预处理。因此，通常由独立语音助手应用的处理可以分散在源节点20、中继设备30和接收者语音助手40之间，使得接收者语音助手40总是至少计算对用户请求的响应(可选地使用远程服务器)。

如上所述，中继设备30可以直接(单跳)或间接(多跳，通过至少一个其他中继设备30)向接收者语音助手40传送语音命令。

在一些实施例中，中继设备的处理电路32可以例如基于无线网络10的拓扑来确定到接收者语音助手40的路径。然后在向接收者语音助手传送语音命令时使用所确定的路径。路径通常构成于无线网络10的网络节点的列表，这些网络节点需要被经过以将语音命令传递给接收者语音助手40。当然，如果接收者语音助手40可以由中继设备30直接到达，则该列表可以为空。

应当注意的是，中继设备30在传送输出信号时，可以使用与接收输入信号所用的无线通信协议相同的无线通信协议，或可以使用不同的无线通信协议。例如，如果使用不同的无线通信协议，则中继设备30可以使用例如用于接收包括语音命令在内的输入信号的蓝牙协议，并且可以使用例如用于传送包括语音命令在内的输出信号的Wi-Fi协议，反之亦然。

此外，当使用相同的无线通信协议来接收输入信号和传送输出信号时，中继设备30可以使用不同版本的所述无线通信协议来接收和传送。例如，中继设备30可以使用3.0或更早版本的蓝牙协议进行接收，并使用4.0或更高版本的蓝牙协议进行传送，以便例如在中继语音命令时使用低功耗蓝牙(BLE)技术。此外，中继设备30可使用不支持网状网络的蓝牙协议版本进行接收(例如4.0或更低版本)，并使用支持网状网络的蓝牙协议版本进行传送(5.0或更高版本)。

上面的描述主要集中在请求链路，即从源节点20到接收者语音助手40的通信。当然，中继设备30也可以用于响应链路，即从接收方语音助手40到响应节点50的通信，响应节点50可以是源节点20或不同于源节点20的网络节点。这可能取决于用户的请求，因为并非所有请求都需要涉及属于无线网络10的响应节点50。另外，响应链接可能不需要是语音链接。例如，如果请求是“提高客厅中的温度”，则响应主要是提高客厅散热器的温度设定值(当然也可以建立语音响应链接以进一步通知用户该请求已被考虑)。

因此，中继设备30用在请求链路上，该请求链路是语音请求链路，其可以是单向单播链路(例如用于蓝牙协议的A2DP链路)、双向单播链路(例如用于蓝牙协议的HFP链路)或广播链接。中继设备30也可以用在响应链路上，该响应链路可以是语音响应链路，其可以是单向单播链路、双向单播链路或广播链路。

因此，通过使用一个或多个中继设备30，可以极大地扩展任何语音助手40的覆盖区域。这样的中继设备30不必是独立的语音助手，并且特别是它们不需要实现完整的语音助手软件，并且它们不需要计算对口头请求的响应。因此，在中继设备30所需资源上的要求低于语音助手40。此外，中继设备30可以从多个源节点20收集语音命令，并且通过使用单个一对一语音链接将这些语音命令转发给接收者语音助手。因此，这样的解决方案也可以用于扩展现有语音助手的覆盖区域。

如图1所示，语音助手40包括无线通信单元41和处理电路42。

例如，处理电路42包括一个或多个处理器和存储装置(磁性硬盘、固态盘、光盘、电子存储器等)，其中，以一组程序代码指令的形式存储计算机程序产品，该程序代码指令要被执行以便实现用于处理语音命令的全部或部分步骤。可替代地，或与其组合，处理电路42可包括适于实现所有或部分所述步骤的一个或多个可编程逻辑电路(FPGA、PLD等)和/或一个或多个专用集成电路(ASIC)和/或一组分立电子组件等。

例如，耦合到处理电路42的无线通信单元41对应于包括被认为是技术人员已知的组件((多个)天线、(多个)放大器、(多个)本地振荡器、(多个)混频器、(多个)模拟和/或数字滤波器等)的射频电路。如上所述，无线通信单元41实现至少一种无线通信协议。例如，无线通信单元41可以包括蓝牙通信单元、Wi-Fi通信单元等。

换言之，语音助手40的处理电路42与无线通信单元41形成一组由软件(特定计算机程序产品)及/或由硬件(处理器、FPGA、PLD、ASIC、分立电子元件、射频电路等)配置的装置，以实现用于由语音助手40处理包括语音命令的输入信号的全部或部分步骤。

如上所述，本公开可以用于现有的语音助手。

然而，在优选实施例中，语音助手40也可以被配置为考虑到它可以通过一个或多个中继设备30间接地接收语音命令的事实。例如，语音助手40可以接收事实上对应于单个用户发出的同一请求的多个语音命令。如上所述，例如如果不同的源节点20接收到同一请求，则可能发生这些源节点可能通过相同的中继设备30或通过相应不同的中继设备30连接到语音助手40。源节点20之一也可能直接连接到语音助手40，在这种情况下，通过中继设备30等直接从这个源节点20以及间接从另一个源节点20接收到同一请求。

图3示意性地表示了用于由语音助手40处理包括语音命令的输入信号的方法70的示例性实施例的主要步骤，所述语音命令可能对应于由单个用户发出的同一请求。如图3所示，所述处理方法70包括由语音助手40执行的以下步骤：

-步骤S71，接收至少两个输入信号，至少一个输入信号是从无线网络10的中继设备30接收的，每个输入信号包括由无线网络10的源节点20的麦克风接收的语音命令；

-步骤S72，确定所述输入信号的语音指令是否对应于单个用户发出的同一请求；

-步骤S73，如果所述语音命令对应于单个用户发出的同一请求，则基于所述语音命令中的至少一个来确定对语音命令的单个响应；

-步骤S74，如果所述语音命令对应于不同的请求，则确定对每个不同语音命令的响应。

在步骤S71期间，语音助手40的无线通信单元41接收包括相应语音命令的输入信号。

在步骤S72期间，语音助手40的处理电路42确定所接收的语音指令是否对应于同一用户发出的同一请求。

应当注意的是，对应于同一用户请求的语音指令原则上应该被及时接收。因此，在一些实施例中，如果同时接收来自不同用户的不同请求的概率被认为是低的，则步骤S72可以简化为确定是否在预定时间段内接收到所述语音命令。

可替代地或附加地，步骤S72可以包括例如比较语音命令以确定它们是否对应于同一请求。例如，如果语音命令对应于数字音频信号，则语音助手40可以例如关联数字音频信号以获得相似度值。如果相似度值高于预定阈值，则认为语音命令对应于同一请求。如果不是，则认为语音命令对应于不同的请求。

如果认为语音命令对应于不同的请求，则语音助手40在步骤S74期间确定对于每个不同语音命令的响应。响应可以完全由语音助手40来确定。可替代地，语音助手40可以使用诸如远程服务器(图中未示出)之类的其他设备来确定响应。

如果认为语音命令对应于不同的请求，则可以按照先到先得的原则来处理这些不同的语音命令。可替代地，语音助手40可以根据请求的相应优先级来确定对不同语音命令的响应。例如，在一些实施例中，语音助手40可以被配置为检测每个语音命令中的代表高优先级请求的预定词。例如，如果语音助手40在语音命令中检测到诸如“紧急的”、“重要的”、“警察”、“紧急情况”等词语，则对应的请求被分配高优先级并被首先处理。替代地或组合地，可以为不同的用户分配不同的优先级。在那种情况下，语音助手40可以例如分析语音命令以识别说出对应请求的用户，并且基于分配给所识别用户的优先级来处理请求。

如果语音命令被认为对应于来自同一用户的同一请求，则在步骤S73期间，语音助手40通过使用所述语音命令中的至少一个来确定对对应于同一请求的所述语音命令的单个响应。

根据第一示例，当确定对对应于同一请求的语音命令的单个响应时，语音助手40可以例如在所述语音命令中选择一个语音命令，并且只能使用所选的语音命令。例如，每个源节点20可以提供所传送的语音命令的置信度水平，例如所述语音命令的信噪比SNR或接收信号强度指示符RSSI。在那种情况下，语音助手40可以选择具有最高置信度水平的语音命令。

根据第二示例，语音助手40可以处理所述语音命令以产生增强的语音命令。例如，如果语音命令作为数字音频信号被接收，语音助手40可以组合所述语音命令以提高SNR。这种组合可以是例如数字音频信号的简单相干相加，或可以考虑所述语音命令的相应SNR或RSSI(例如，最大比率组合、MRC等)的更复杂的组合。更一般地说，可以实现技术人员已知的用于组合同一信号的不同副本以提高所述信号的SNR的任何方法。

当确定对给定请求的响应时，语音助手40可以取决于请求来确定由至少一个响应节点执行的至少一个动作。在某些情况下，响应节点可以是不属于无线网络10的远程设备。在其他一些情况下，响应节点可以是无线网络10的网络节点。例如，响应节点的选择取决于要执行的动作，因为响应节点必须能够执行该动作。例如，如果动作对应于向用户发出音频响应，则响应节点必须包括例如扬声器或耳机，并且如果所述源节点20包括扬声器和/或耳机，则响应节点可以是源节点20。根据另一示例，响应节点可以是连接到无线网络10的致动器(例如，用于打开/关闭灯、电视、烤箱、散热器等)。此外，响应节点可以在语音命令中被识别并从中检索(例如“打开电视”、“关闭烤箱”等)。

在一些实施例中，可以基于发出对应请求的用户的位置信息来确定响应。事实上，在某些情况下，例如基于用户的位置来选择响应节点可能是有利的。例如，如果响应包括针对用户的音频或视频响应，则选择离用户最近的扬声器或屏幕以便以有效方式提供音频或视频响应可能是有利的。如果在某些情况下知道用户所在的房间可能就足够了，那么其他一些情况将受益于至少大致了解用户在房间中的位置。

在一些实施例中，用户的位置信息可以包括在所接收的输入信号中。在那种情况下，语音助手40可以简单地从输入信号中提取位置信息，并且使用所提取的位置信息来确定响应(例如，确定最合适的响应节点)。例如，可以假设用户的位置与可能已知的源节点20的位置几乎相同。因此，输入信号中的位置信息可能是源节点20的位置(例如源节点20所在房间的ID)，或者甚至是使得语音助手40能够检索源节点20/用户的位置的源节点20的ID。

在源节点20包括若干麦克风的情况下，在所述麦克风的输出处的数字音频信号可以用于估计由用户发出的声音信号相对于源节点20的到达方向DoA。所述数字音频信号的RSSI也可以用于估计源节点20与用户之间的距离。因此，可以理解，也可以基于DoA和/或RSSI(或距离)等来估计用户相对于源节点20的位置。源节点20可以将这样的信息附加到语音命令作为用户的位置信息。该位置信息然后由语音助手40检索。基于例如源节点20的位置以及用户的附加位置信息(DoA、RSSI等)，语音助手40可以更准确地估计用户的位置。

源节点20的位置可能是先验已知的，或者可能由例如中继设备30确定。例如，蓝牙协议的5.1版本实现了测向技术，中继设备30可以使用该技术来确定源节点20的位置。因此，中继设备30可以向语音命令附加源节点20的位置作为用户的位置信息。

更一般地说，蓝牙协议版本5.1的测向技术可以用于确定无线网络10的任何符合蓝牙实现的网络节点的位置。例如，如果符合蓝牙协议的5.1版本，可以由源节点20或中继设备30来确定用户移动电话的位置。在用户被识别(例如通过处理语音命令)之后，源节点20或中继设备30可以假设用户的位置信息对应于其移动电话的位置。根据另一个示例，可以确定符合5.1版(或更高版本)的蓝牙实现的响应节点的位置，以便能够例如基于用户的位置信息来选择离用户最近的响应节点。

在一些实施例中，当至少两个源节点20已经接收到同一口头请求时，可以通过例如比较在这些源节点20上的口头请求的到达时间ToA，和/或通过比较在这些源节点20上的口头请求的RSSI等来估计用户的位置。

在那种情况下，例如可以通过连接到已经接收到同一口头请求的源节点20的中继设备30来估计用户的位置信息，并且将该位置信息附加有语音命令。在那种情况下，中继设备30可能必须如上面针对语音助手40所讨论的，确定所述语音命令是否对应于由同一用户发出的同一请求。在这种情况下，中继设备30优选地计算增强的语音命令，并且仅将增强的语音命令与位置信息一起转发给接收者语音助手40。可替代地，中继设备30可以同时转发语音命令和对应的位置信息。

可替代地或组合地，语音助手40可以基于所接收的输入信号来估计用户的位置信息。例如，对于每个语音命令，所接收的输入信号可以包括附加信息，诸如对应源节点20上的口头请求的ToA、对应源节点20上的口头请求的RSSI等。基于此附加信息和/或基于语音命令，语音助手40可以通过应用技术人员已知的方法来估计用户的位置信息。

如上所述，无线网络10可以包括多个源节点20、多个中继设备30、多个语音助手40和多个响应节点50。这些多个网络节点可以布置在多种可能的网络拓扑中，并且可以使用不同的无线通信协议。例如，无线网络10可以包括一个或多个BLE网状网络、和/或一个或多个蓝牙微微网、和/或一个或多个Wi-Fi网络等。

图4示意性地表示了包括多个网络节点的无线网络10的非限制性示例。

图4的示例性无线网络10包括十二(12)个网络节点，其分别由A到L的相应字母表示。

对于每个网络节点A-L，在括号之间给出功能。例如，网络节点A(20)只是源节点20，网络节点B(30)只是中继设备30，网络节点E(30，50)既是中继设备30又是响应节点50，网络节点F(50)只是响应节点50，网络节点H(40，50)既是语音助手40又是响应节点50，网络节点L(20，30，50)是源节点20、中继设备30和响应节点50等。

图4示出了可以在网络节点A-L之间建立的无线语音链路的示例。例如，网络节点A到网络节点B的无线语音链路是广播语音链路，网络节点C到网络节点E的无线语音链路是单向语音链路，网络节点E与网络节点H之间的无线语音链路为双向语音链路等。

例如，无线网络10包括两个BLE网状网络。无线网络10的第一BLE网状网络包括例如网络节点C、D和E。无线网络10的第二BLE网状网络包括例如网络节点B、F、G、H、J、K和L。网络节点E与网络节点H之间的无线链路使用例如Wi-Fi协议，使得网络节点E和H一起形成无线网络10的Wi-Fi网络。在图4中，网络节点A和I不被认为属于BLE网状网络或WiFi网络。然而，网络节点A通过例如蓝牙无线链路连接到网络节点B(和第一BLE网状网络)，并且网络节点I通过例如蓝牙无线链路连接到网络节点H(以及第二BLE网状网络)。

从图4中可以看出，网络节点A-L(源节点、中继设备、语音助手、响应节点)可以嵌入到各种电子设备中，该各种电子设备包括例如扬声器、耳机、移动电话、平板电脑、电视、灯具、烤箱、冰箱等。

要强调的是，本发明不限于上述示例性实施例。上述示例性实施例的变体也在本发明的范围内。

以上描述通过其各种特征及其各自的优点清楚地说明了这一点，本公开达到了为其设定的目标。特别地，通过提供用于将来自源节点20的语音命令转发到语音助手40的中继设备30，可以以比提供若干独立语音助手更低的复杂度增加来扩展所述语音助手40的覆盖区域，因为所述语音助手40可以处理来自其附近和任何源节点20附近的用户的请求。此外，语音助手40还可以被配置为处理对应于来自同一用户的同一请求的多个语音命令，以便受益于由此产生的无线网络10所提供的多样性。

Claims

1.一种中继设备(30)，所述中继设备(30)包括用于连接到对应于公寓或房屋或建筑物的区域中的无线网络的无线通信单元(31)和处理电路(32)，所述无线网络包括通过无线链路相互连接的多个网络节点，其中，所述中继设备(30)被配置为：

-通过所述无线通信单元(31)从连接到所述无线网络的源节点(20)接收输入信号，所述输入信号包括由所述源节点的麦克风接收的语音命令，所述语音命令将由语音助手处理；

-通过所述处理电路(32)并且基于所述输入信号来确定嵌入在位于所述区域的电子设备中、连接到所述无线网络并且适于处理所述语音命令的接收者语音助手(40)；

-由所述无线通信单元(31)并且向所述接收者语音助手(40)传送包括所述语音命令的输出信号。

2.根据权利要求1所述的中继设备(30)，其中，所述无线通信单元(31)包括以下中的至少一项：

-蓝牙通信单元；

-Wi-Fi通信单元；

-Zigbee通信单元。

3.根据权利要求1或2所述的中继设备(30)，其中，所述处理电路(32)被配置为通过执行以下中的至少一项来确定所述接收者语音助手：

-从所述输入信号提取所述无线网络内所述语音助手的标识符；

-在所述输入信号中搜索至少一个预定词；

-使用所述无线网络的拓扑。

4.根据权利要求1至3中的任一项所述的中继设备(30)，其中，所述处理电路(32)还被配置为基于所述无线网络的拓扑来确定到所述接收者语音助手的路径，并且当向所述接收者语音助手传送所述语音命令时使用所述路径。

5.一种方法(60)，用于通过连接到与公寓或房屋或建筑物相对应的区域中的无线网络的中继设备(30)来处理包括将由语音助手(40)处理的语音命令的输入信号，所述无线网络包括通过无线链路相互连接的多个网络节点，其中，所述方法包括：

-(S61)从连接到所述无线网络的源节点(20)接收输入信号，所述输入信号包括由所述源节点的麦克风接收的语音命令；

-(S62)基于所述输入信号来确定嵌入在位于所述区域的电子设备中、连接到所述无线网络并且适于处理所述语音命令的接收者语音助手(40)；

-(S63)向所述接收者语音助手(40)传送包括所述语音命令的输出信号。

6.包括指令的计算机程序产品，所述指令在由包括无线通信单元(31)和处理电路(32)的中继设备(30)执行时配置所述中继设备以执行根据权利要求5所述的方法。

7.语音助手(40)，所述语音助手(40)包括处理电路(42)和用于连接到无线网络(10)的无线通信单元(41)，所述无线网络包括通过无线链路相互连接的多个网络节点，其中，所述语音助手(40)被配置为：

-通过所述无线通信单元(41)接收至少两个输入信号，每个输入信号包括由所述无线网络(10)的源节点(20)的麦克风接收的语音命令；

-由所述处理电路(42)来确定所述输入信号的所述语音命令是否对应于单个用户发出的同一请求；

-如果所述语音命令对应于单个用户发出的同一请求：基于所述语音命令中的至少一个来确定对所述语音命令的单个响应；

-如果所述语音命令对应于不同的请求：确定对于每个不同语音命令的响应。

8.根据权利要求7所述的语音助手(40)，其中，所述处理电路(42)还被配置为：如果所述语音命令对应于单个用户发出的同一请求，则处理所述语音命令以产生增强的语音命令，并且基于所述增强的语音命令来确定所述单个响应。

9.根据权利要求7或8所述的语音助手(40)，其中，所述处理电路(42)还被配置为通过组合由不同麦克风获得的对应于单个用户发出的同一请求的数字音频信号来提高语音命令的信噪比SNR。

10.根据权利要求7至9中的任一项所述的语音助手(40)，其中，所述处理电路(42)还被配置为：如果所述语音命令对应于单个用户发出的同一请求，则处理对应的输入信号以为所述用户确定位置信息，并且基于所述位置信息来确定所述单个响应。

11.根据权利要求7至10中的任一项所述的语音助手(40)，其中，所述处理电路(42)还被配置为：如果输入信号包括已经发出对应请求的所述用户的位置信息，则从所述输入信号提取所述位置信息并且基于所述位置信息来确定所述响应。

12.根据权利要求10或11所述的语音助手(40)，其中，确定所述响应包括基于所述用户的所述位置信息来选择所述无线网络的至少一个响应节点，并且命令所述至少一个响应节点来执行响应于所述请求而确定的至少一个动作。

13.一种用于由连接到无线网络(10)的语音助手(40)来处理语音命令的方法(70)，所述无线网络包括通过无线链路相互连接的多个网络节点，其中，所述方法包括：

-(S71)接收至少两个输入信号，每个输入信号包括由所述无线网络(10)的源节点(20)的麦克风接收的语音命令；

-(S72)确定所述输入信号的所述语音命令是否对应于单个用户发出的同一请求；

-如果所述语音命令对应于单个用户发出的同一请求：则(S73)基于所述语音命令中的至少一个来确定对所述语音命令的单个响应；

-如果所述语音命令对应于不同的请求：则(S74)确定对每个不同语音命令的响应。

14.包括指令的计算机程序产品，所述指令在由包括无线通信单元(41)和处理电路(42)的语音助手(40)执行时配置所述语音助手以执行根据权利要求13所述的方法。

15.无线网络(10)，所述无线网络(10)包括通过无线链路相互连接的多个网络节点，其中，至少一个网络节点是包括麦克风的源节点(20)，至少一个网络节点是根据权利要求7至12中的任一项所述的语音助手(40)，以及至少一个网络节点是根据权利要求1至4中的任一项所述的中继设备(30)。

16.根据权利要求15所述的无线网络(10)，包括以下中的至少一项：

-低功耗蓝牙、BLE、网状网络；

-蓝牙微微网；

-Wi-Fi网络。