CN113593548A

CN113593548A - 智能设备的唤醒方法和装置、存储介质及电子装置

Info

Publication number: CN113593548A
Application number: CN202110725401.3A
Authority: CN
Inventors: 郝斌
Original assignee: Qingdao Haier Technology Co Ltd; Haier Smart Home Co Ltd
Current assignee: Qingdao Haier Technology Co Ltd; Haier Smart Home Co Ltd
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2021-11-02
Anticipated expiration: 2041-06-29
Also published as: WO2023273747A1; CN113593548B

Abstract

本发明公开了一种智能设备的唤醒方法和装置、存储介质及电子装置，其中，上述方法包括：从多个智能设备中获取允许被唤醒信号唤醒的智能设备作为候选设备；在候选设备的数量为多个的情况下，确定多个候选设备中每个候选设备对应的目标唤醒角度以及目标唤醒能量；根据所述目标唤醒角度和所述目标唤醒能量，从多个所述候选设备中确定目标设备，其中，所述目标设备用于响应所述唤醒信号。采用上述技术方案，解决了相关技术中，确定响应唤醒指令的智能设备的准确性较低等问题。

Description

智能设备的唤醒方法和装置、存储介质及电子装置

技术领域

本发明涉及通信领域，具体而言，涉及一种智能设备的唤醒方法和装置、存储介质及电子装置。

背景技术

随着计算机性能发展，人工智能开始在各个方面展示自己的优势，让人们逐渐体会到智能科技和万物互联的魅力。在智能家居场景中，同时会有多台配置语音交互功能的设备，比如电视机、音箱、空调等，用户发出唤醒指令后，可能只想有一台设备响应。在目前的解决方案中，考虑到了用户相对设备的位置，假设发出唤醒指令的用户在设备A预设范围内，即使有其他设备B距离用户更近，并且用户实际想要唤醒设备B，但依然设备A会优先响应。这就导致了响应用户唤醒指令的设备并不是用户真实想要唤醒的设备。

针对相关技术中，确定响应唤醒指令的智能设备的准确性较低等问题，尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种智能设备的唤醒方法和装置、存储介质及电子装置，以至少解决相关技术中，确定响应唤醒指令的智能设备的准确性较低等问题。

根据本发明实施例的一个实施例，提供了一种智能设备的唤醒方法，包括：从多个智能设备中获取允许被唤醒信号唤醒的智能设备作为候选设备，其中，所述多个智能设备是目标场景中检测到所述唤醒信号的设备；在所述候选设备的数量为多个的情况下，确定多个所述候选设备中每个候选设备对应的目标唤醒角度以及目标唤醒能量，其中，所述目标唤醒角度用于指示所述唤醒信号的音源位置相对于所述每个候选设备的方向，所述目标唤醒能量用于指示所述每个候选设备接收到所述唤醒信号的能量；根据所述目标唤醒角度和所述目标唤醒能量，从多个所述候选设备中确定目标设备，其中，所述目标设备用于响应所述唤醒信号。

在一个示例性实施例中，所述根据所述目标唤醒角度和所述目标唤醒能量，从多个所述候选设备中确定目标设备，包括：将目标唤醒角度落入角度范围的候选设备确定为所述目标设备；在多个所述候选设备所对应的目标唤醒角度均未落入所述角度范围时，将目标唤醒能量最大的候选设备确定为所述目标设备。

在一个示例性实施例中，确定多个所述候选设备中每个候选设备对应的目标唤醒角度，包括：基于所述唤醒信号和所述每个候选设备的唤醒角度变量构建所述每个候选设备的唤醒角度变量的搜索函数；对所述搜索函数进行优化搜索，得到所述每个候选设备的唤醒角度变量的最优解作为所述每个候选设备对应的目标唤醒角度。

在一个示例性实施例中，基于所述唤醒信号和所述每个候选设备的唤醒角度变量构建所述每个候选设备的唤醒角度变量的搜索函数，包括：基于所述唤醒信号构造所述每个候选设备的唤醒角度变量的协方差矩阵；基于所述每个候选设备的唤醒角度变量构造所述每个候选设备的唤醒角度变量的方向导量；基于所述协方差矩阵和所述方向导量构造所述每个候选设备的唤醒角度变量的极大似然函数作为所述搜索函数。

在一个示例性实施例中，对所述搜索函数进行优化搜索，得到所述每个候选设备的唤醒角度变量的最优解作为所述每个候选设备对应的目标唤醒角度，包括：对优化搜索算法中的搜索参数进行初始化，得到目标搜索参数，其中，所述搜索参数包括：粒子个数，粒子位置，迭代次数，每个粒子的位置范围，每个粒子的最大速度和学习因子；采用所述目标搜索参数以及线性递减惯性权重对所述搜索函数执行所述优化搜索算法，得到所述每个候选设备的唤醒角度变量的最优解作为所述每个候选设备对应的目标唤醒角度。

在一个示例性实施例中，对优化搜索算法中的搜索参数进行初始化，得到目标搜索参数，包括：初始化所述粒子个数，所述迭代次数，所述每个粒子的最大速度和所述学习因子，得到目标粒子个数，目标迭代次数，目标最大速度和目标学习因子，其中，所述目标粒子个数，所述目标迭代次数，所述目标最大速度和所述目标学习因子用于使得所述优化搜索算法的准确率达到准确率阈值的同时所述优化搜索算法的计算量最小；根据所述每个候选设备的麦克风阵列排列方式初始化每个粒子的位置范围，得到目标位置范围；使用历史最优解初始化所述粒子位置，得到目标粒子位置，其中，所述目标搜索参数包括：所述目标粒子个数，所述目标迭代次数，所述目标最大速度，所述目标学习因子，所述目标位置范围和所述目标粒子位置。

在一个示例性实施例中，确定多个所述候选设备中每个候选设备对应的目标唤醒能量，包括：计算所述每个候选设备在所述唤醒信号的频率范围内的能量和；将所述能量和确定为所述每个候选设备对应的目标唤醒能量。

在一个示例性实施例中，从多个智能设备中获取允许被唤醒信号唤醒的智能设备作为候选设备，包括：对每个智能设备接收到的语音信号执行回声消除操作和/或噪声消除操作，得到所述唤醒信号，其中，所述噪声消除操作包括以下至少之一：平稳噪声抑制，混响抑制，非平稳噪声抑制；基于所述唤醒信号对每个智能设备进行唤醒判别；将所述多个智能设备中唤醒判别成功的智能设备确定为所述候选设备。

根据本发明实施例的另一个实施例，还提供了一种智能设备的唤醒装置，包括：获取模块，用于从多个智能设备中获取允许被唤醒信号唤醒的智能设备作为候选设备，其中，所述多个智能设备是目标场景中检测到所述唤醒信号的设备；第一确定模块，用于在所述候选设备的数量为多个的情况下，确定多个所述候选设备中每个候选设备对应的目标唤醒角度以及目标唤醒能量，其中，所述目标唤醒角度用于指示所述唤醒信号的音源位置相对于所述每个候选设备的方向，所述目标唤醒能量用于指示所述每个候选设备接收到所述唤醒信号的能量；第二确定模块，用于根据所述目标唤醒角度和所述目标唤醒能量，从多个所述候选设备中确定目标设备，其中，所述目标设备用于响应所述唤醒信号。

根据本发明实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述智能设备的唤醒方法。

根据本发明实施例的又一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，上述处理器通过计算机程序执行上述的智能设备的唤醒方法。

在本发明实施例中，从多个智能设备中获取允许被唤醒信号唤醒的智能设备作为候选设备，其中，多个智能设备是目标场景中检测到唤醒信号的设备；在候选设备的数量为多个的情况下，确定多个候选设备中每个候选设备对应的目标唤醒角度以及目标唤醒能量，其中，目标唤醒角度用于指示唤醒信号的音源位置相对于每个候选设备的方向，目标唤醒能量用于指示每个候选设备接收到唤醒信号的能量；根据目标唤醒角度和目标唤醒能量，从多个所述候选设备中确定目标设备，其中，目标设备用于响应所述唤醒信号，即当目标场景下检测到唤醒信号的设备为多个智能设备时，从中获取允许被唤醒信号唤醒的智能设备作为候选设备，当候选设备的数量为多个时，确定每个候选设备对应的目标唤醒角度以及目标唤醒能量，再依据目标唤醒角度和目标唤醒能量来确定用于响应唤醒信号的目标设备。采用上述技术方案，解决了相关技术中，确定响应唤醒指令的智能设备的准确性较低等问题，实现了提高确定响应唤醒指令的智能设备的准确性的技术效果。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例的一种智能设备的唤醒方法的计算机终端的硬件结构框图；

图2是根据本发明实施例的智能设备的唤醒方法的流程图；

图3是根据本发明实施例的智能设备的唤醒方法的示意图；

图4是根据本发明实施例的一种智能设备的唤醒装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例所提供的方法实施例可以在计算机终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例，图1是本发明实施例的一种智能设备的唤醒方法的计算机终端的硬件结构框图。如图1所示，计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104，在一个示例性实施例中，上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述计算机终端的结构造成限定。例如，计算机终端还可包括比图1中所示更多或者更少的组件，或者具有与图1所示等同功能或比图1所示功能更多的不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的智能设备的唤醒方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网进行通讯。

在本实施例中提供了一种智能设备的唤醒方法，应用于上述计算机终端，图2是根据本发明实施例的智能设备的唤醒方法的流程图，该流程包括如下步骤：

步骤S202，从多个智能设备中获取允许被唤醒信号唤醒的智能设备作为候选设备，其中，所述多个智能设备是目标场景中检测到所述唤醒信号的设备；

步骤S204，在所述候选设备的数量为多个的情况下，确定多个所述候选设备中每个候选设备对应的目标唤醒角度以及目标唤醒能量，其中，所述目标唤醒角度用于指示所述唤醒信号的音源位置相对于所述每个候选设备的方向，所述目标唤醒能量用于指示所述每个候选设备接收到所述唤醒信号的能量；

步骤S206，根据所述目标唤醒角度和所述目标唤醒能量，从多个所述候选设备中确定目标设备，其中，所述目标设备用于响应所述唤醒信号。

通过上述步骤，当目标场景下检测到唤醒信号的设备为多个智能设备时，从中获取允许被唤醒信号唤醒的智能设备作为候选设备，当候选设备的数量为多个时，确定每个候选设备对应的目标唤醒角度以及目标唤醒能量，再依据目标唤醒角度和目标唤醒能量来确定用于响应唤醒信号的目标设备。采用上述技术方案，解决了相关技术中，确定响应唤醒指令的智能设备的准确性较低等问题，实现了提高确定响应唤醒指令的智能设备的准确性的技术效果。

在上述步骤S202提供的技术方案中，多个智能设备是目标场景中检测到唤醒信号的设备，比如：电视机，机顶盒，手机，音箱，空调，烤箱，蒸箱，炒锅，微波炉等等。

可选地，在本实施例中，上述唤醒信号可以但不限于是从用户发出的语音信号中提取出的用于进行唤醒判别的唤醒信息，比如：对用户发出的语音信号进行一系列的处理后可以得到唤醒信号，从唤醒信号中可以提取出唤醒指令，比如唤醒关键词等等。上述多个智能设备可以但不限于是目标场景中接收到语音信号并提取出唤醒关键词的设备，上述允许被唤醒信号唤醒的智能设备可以但不限于是目标场景中允许使用相同的唤醒关键词唤醒的设备。

可选地，在本实施例中，上述目标场景可以但不限于包括任何类型的允许智能控制的场景，比如：家庭，车库，办公室，教室，教学楼，实验室等等。

在一个示例性实施例中，可以但不限于通过以下方式从多个智能设备中获取允许被唤醒信号唤醒的智能设备作为候选设备：对每个智能设备接收到的语音信号执行回声消除操作和/或噪声消除操作，得到唤醒信号，其中，噪声消除操作包括以下至少之一：平稳噪声抑制，混响抑制，非平稳噪声抑制；基于唤醒信号对每个智能设备进行唤醒判别；将多个智能设备中唤醒判别成功的智能设备确定为候选设备。

可选地，在本实施例中，对于智能设备中带自播功能的设备可以首先进行回声消除操作(AEC)，回声消除操作可以但不限于采用NLMS双滤波器方法。

可选地，在本实施例中，噪声消除操作可以但不限于包括以下至少之一：平稳噪声抑制，混响抑制，非平稳噪声抑制。即可以按照实际需要对语音信号或者执行了回声消除操作后的语音信号执行一种或者多种的噪声消除操作。噪声消除操作可以但不限于在stft域进行处理。

可选地，在本实施例中，平稳噪声抑制的操作过程可以但不限于为首先利用最小值追踪方法IMCRA估计噪声谱后，再利用最优改进对数谱幅度估计OMLSA得到平稳噪声抑制的增益值G_n(f)。

可选地，在本实施例中，混响抑制的操作过程可以但不限于为使用CDR估计，假设噪声场是散射噪声场，每组麦克风对计算一次CDR，对各组加权平均得到CDR(f)，得到混响抑制的增益值G_r(f)。

可选地，在本实施例中，非平稳噪声抑制的操作过程可以但不限于为采用一个线性滤波器，假设唤醒词长度最长为800ms，利用800ms之前的数据更新得到的滤波器信息，来自适应噪声消除当前时刻的带有唤醒词的数据。得到经过线性滤波器的信号X_w(f)后，可求非平稳噪声抑制的增益值G_s(m，f)。其中，

在上述噪声消除操作中，控制了噪声消除操作过程的计算量，从而降低整个智能设备的唤醒过程的计算量，提高智能设备的唤醒过程的计算速度和效率。

可选地，在本实施例中，经过回声消除操作和/或噪声消除操作后得到的唤醒信号通过istft变换到时域，再通过AGC的方式进行唤醒判别，将多个智能设备中唤醒判别成功的智能设备确定为候选设备。

可选地，在本实施例中，考虑到了噪声、后期混响和非平稳噪声的影响，均采用计算量小的方法，在性能较差设备上，也能得到较好的朝向唤醒效果。

在上述步骤S204提供的技术方案中，目标唤醒角度用于指示唤醒信号的音源位置相对于每个候选设备的方向。目标唤醒角度可以但不限于采用DOA估计算法来确定。目标唤醒能量用于指示每个候选设备接收到唤醒信号的能量。目标唤醒能量可以但不限于采用能量估计算法来确定。

在一个示例性实施例中，可以但不限于采用以下方式确定多个候选设备中每个候选设备对应的目标唤醒角度：基于唤醒信号和每个候选设备的唤醒角度变量构建每个候选设备的唤醒角度变量的搜索函数；对搜索函数进行优化搜索，得到每个候选设备的唤醒角度变量的最优解作为每个候选设备对应的目标唤醒角度。

可选地，在本实施例中，可以但不限于采用构建搜索函数并对搜索函数进行优化搜索的方式来确定每个候选设备对应的目标唤醒角度。

可选地，在本实施例中，唤醒角度变量的搜索函数可以但不限于采用极大似然函数的函数形式。

在一个示例性实施例中，基于唤醒信号和每个候选设备的唤醒角度变量可以但不限于采用以下方式构建每个候选设备的唤醒角度变量的搜索函数：基于唤醒信号构造每个候选设备的唤醒角度变量的协方差矩阵；基于每个候选设备的唤醒角度变量构造每个候选设备的唤醒角度变量的方向导量；基于协方差矩阵和方向导量构造每个候选设备的唤醒角度变量的极大似然函数作为搜索函数。

可选地，在本实施例中，唤醒角度变量的极大似然函数可以但不限于为：

其中，PA(θ，f)是唤醒角度变量的方向导量：PA(θ，f)＝e^-j*2πf*d/c。d是声源在角度θ下相对于原点的距离。Rxx(f)＝X(f)*X^*(f)是协方差矩阵。X(f)是麦克风阵列信号。

可选地，在本实施例中，可以但不限于通过X_c(m，f)＝X(m，f)*G_n(f)G_r(f)*G_s(m，f)，得到协方差矩阵Rxx(f)＝X_c(f)*X_c ^*(f)。其中，X(m，f)为每个麦克风阵列的频域信号。

可选地，在本实施例中，在回声消除操作的过程中，默认每个麦克风都需要做AEC，在麦克风个数较多时计算量也会上升，如果需要简化计算量，由于线性滤波器的目标通道1路，参考通道为另1路做过回声消除的信号，因此AEC可以只做两路。如果AEC只做两路，则需要计算回声消除操作的增益值

在求协方差矩阵时还需再乘上G_e(m，f)项才得到最终的X_c(m，f)。

在一个示例性实施例中，可以但不限于通过以下方式对搜索函数进行优化搜索，得到每个候选设备的唤醒角度变量的最优解作为每个候选设备对应的目标唤醒角度：对优化搜索算法中的搜索参数进行初始化，得到目标搜索参数，其中，搜索参数包括：粒子个数，粒子位置，迭代次数，每个粒子的位置范围，每个粒子的最大速度和学习因子；采用目标搜索参数以及线性递减惯性权重对搜索函数执行优化搜索算法，得到每个候选设备的唤醒角度变量的最优解作为每个候选设备对应的目标唤醒角度。

可选地，在本实施例中，优化搜索算法中的搜索参数可以但不限于包括：粒子个数，粒子位置，迭代次数，每个粒子的位置范围，每个粒子的最大速度和学习因子等等。

可选地，在本实施例中，优化搜索算法可以但不限于包括粒子群优化算法等等。

在一个示例性实施例中，可以但不限于通过以下方式对优化搜索算法中的搜索参数进行初始化，得到目标搜索参数：初始化粒子个数，迭代次数，每个粒子的最大速度和学习因子，得到目标粒子个数，目标迭代次数，目标最大速度和目标学习因子，其中，目标粒子个数，目标迭代次数，目标最大速度和目标学习因子用于使得优化搜索算法的准确率达到准确率阈值的同时优化搜索算法的计算量最小；根据每个候选设备的麦克风阵列排列方式初始化每个粒子的位置范围，得到目标位置范围；使用历史最优解初始化粒子位置，得到目标粒子位置，其中，目标搜索参数包括：目标粒子个数，目标迭代次数，目标最大速度，目标学习因子，目标位置范围和目标粒子位置。

可选地，在本实施例中，为了使得优化搜索算法的准确率达到准确率阈值的同时优化搜索算法的计算量最小，可以但不限于对粒子个数，迭代次数，每个粒子的最大速度和学习因子的值进行取舍，比如：目标粒子个数为2，目标迭代次数10，目标最大速度不超过π/2，目标学习因子为2使得优化搜索算法的准确率达到准确率阈值的同时优化搜索算法的计算量最小。

可选地，在本实施例中，可以但不限于根据每个候选设备的麦克风阵列排列方式确定目标位置范围，比如：对于线性排列的麦克风阵列，每个粒子的位置范围可以但不限于是[0,π]。

可选地，在本实施例中，使用历史最优解初始化粒子位置得到目标粒子位置能够加速优化搜索算法的收敛。

通过上述过程，采用极大似然估计方法，通过粒子群优化快速求出方程最优解。一方面，充分利用了阵列信息，在求协方差矩阵时，考虑混响、噪声以及非平稳噪声的影响，大大提升算法鲁棒性；另一方面，利用粒子群优化，用2个粒子和10次迭代，就可稳定求得最优解，避免全空间角度搜索，使得计算量大幅下降。

在一个示例性实施例中，可以但不限于通过以下方式确定多个候选设备中每个候选设备对应的目标唤醒能量：计算每个候选设备在唤醒信号的频率范围内的能量和；将能量和确定为每个候选设备对应的目标唤醒能量。

可选地，在本实施例中，每个候选设备对应的目标唤醒能量可以但不限于表示为

X_w(f)是经过回声消除操作和/或噪声消除操作后得到的唤醒信号。

在上述步骤S206提供的技术方案中，依据目标唤醒角度和目标唤醒能量能够从多个候选设备中确定出更加符合用户预期的设备作为目标设备响应用户的唤醒信号。

在一个示例性实施例中，可以但不限于通过以下方式根据目标唤醒角度和目标唤醒能量，从多个候选设备中确定目标设备：将目标唤醒角度落入角度范围的候选设备确定为所述目标设备；在多个所述候选设备所对应的目标唤醒角度均未落入所述角度范围时，将目标唤醒能量最大的候选设备确定为所述目标设备。

可选地，在本实施例中，每个智能设备对应了允许响应唤醒的角度范围，比如：可以设定为朝向智能设备发出的唤醒信号允许该智能设备来响应。

可选地，在本实施例中，如果所对应的目标唤醒角度落入所对应的角度范围的候选设备的数量不唯一，也可以将其中对应的目标唤醒能量最大的候选设备确定为目标设备。

可选地，在本实施例中，如果多个候选设备所对应的目标唤醒角度均未落入所对应的角度范围，则依据候选设备所对应的目标唤醒能量来确定目标设备，比如：将多个候选设备中所对应的目标唤醒能量最大的候选设备确定为目标设备。

可选地，在本实施例中，首先通过判定所对应的目标唤醒角度是否落入所对应的角度范围来判定发出唤醒信号的用户是否在某个设备预设的角度范围内，如果是，则该设备优先响应；否则，比较各设备的目标唤醒能量，目标唤醒能量最大的设备优先响应。

可选地，在本实施例中，对于每个候选设备的各个麦克风阵列，如果麦克风敏感度和增益相同，无须进行能量校准；如果各个麦克风阵列敏感度、增益、型号不一致，在能量比较之前，首先需要进行能量校准。

为了更好的理解上述智能设备的唤醒方法的过程，以下再结合可选实施例对上述智能设备的唤醒过程的实现方法流程进行说明，但不用于限定本发明实施例的技术方案。

在本实施例中提供了一种智能设备的唤醒方法，图3是根据本发明实施例的智能设备的唤醒方法的示意图，如图3所示，该方法可以但不限于包括如下步骤：

步骤S301：检测目标场景中用户的语音信号；

步骤S302：对语音信号进行回声消除操作和/或噪声消除操作，得到唤醒信号；

步骤S303：对唤醒信号进行唤醒判别(AGC)；

步骤S304：判断各个设备是否唤醒成功；

步骤S305：对于允许被唤醒的智能设备执行上述依据角度和能量进行唤醒判别的过程；

步骤S306：根据上述判别过程的结果来确定目标设备对语音信号进行响应。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例的方法。

图4是根据本发明实施例的一种智能设备的唤醒装置的结构框图；如图4所示，包括：

获取模块42，用于从多个智能设备中获取允许被唤醒信号唤醒的智能设备作为候选设备，其中，所述多个智能设备是目标场景中检测到所述唤醒信号的设备；

第一确定模块44，用于在所述候选设备的数量为多个的情况下，确定多个所述候选设备中每个候选设备对应的目标唤醒角度以及目标唤醒能量，其中，所述目标唤醒角度用于指示所述唤醒信号的音源位置相对于所述每个候选设备的方向，所述目标唤醒能量用于指示所述每个候选设备接收到所述唤醒信号的能量；

第二确定模块46，用于根据所述目标唤醒角度和所述目标唤醒能量，从多个所述候选设备中确定目标设备，其中，所述目标设备用于响应所述唤醒信号。

通过上述实施例，当目标场景下检测到唤醒信号的设备为多个智能设备时，从中获取允许被唤醒信号唤醒的智能设备作为候选设备，当候选设备的数量为多个时，确定每个候选设备对应的目标唤醒角度以及目标唤醒能量，再依据目标唤醒角度和目标唤醒能量来确定用于响应唤醒信号的目标设备，将目标唤醒能量最大的候选设备确定为目标设备。采用上述技术方案，解决了相关技术中，确定响应唤醒指令的智能设备的准确性较低等问题，实现了提高确定响应唤醒指令的智能设备的准确性的技术效果。

在一个示例性实施例中，所述第二确定模块，用于将目标唤醒角度落入角度范围的候选设备确定为所述目标设备；在多个所述候选设备所对应的目标唤醒角度均未落入所述角度范围时，将目标唤醒能量最大的候选设备确定为所述目标设备。

在一个示例性实施例中，所述第一确定模块，包括：构建单元，用于基于所述唤醒信号和所述每个候选设备的唤醒角度变量构建所述每个候选设备的唤醒角度变量的搜索函数；搜索单元，用于对所述搜索函数进行优化搜索，得到所述每个候选设备的唤醒角度变量的最优解作为所述每个候选设备对应的目标唤醒角度。

在一个示例性实施例中，所述构建单元，还用于：基于所述唤醒信号构造所述每个候选设备的唤醒角度变量的协方差矩阵；基于所述每个候选设备的唤醒角度变量构造所述每个候选设备的唤醒角度变量的方向导量；基于所述协方差矩阵和所述方向导量构造所述每个候选设备的唤醒角度变量的极大似然函数作为所述搜索函数。

在一个示例性实施例中，所述搜索单元，还用于：对优化搜索算法中的搜索参数进行初始化，得到目标搜索参数，其中，所述搜索参数包括：粒子个数，粒子位置，迭代次数，每个粒子的位置范围，每个粒子的最大速度和学习因子；采用所述目标搜索参数以及线性递减惯性权重对所述搜索函数执行所述优化搜索算法，得到所述每个候选设备的唤醒角度变量的最优解作为所述每个候选设备对应的目标唤醒角度。

在一个示例性实施例中，所述搜索单元，还用于：初始化所述粒子个数，所述迭代次数，所述每个粒子的最大速度和所述学习因子，得到目标粒子个数，目标迭代次数，目标最大速度和目标学习因子，其中，所述目标粒子个数，所述目标迭代次数，所述目标最大速度和所述目标学习因子用于使得所述优化搜索算法的准确率达到准确率阈值的同时所述优化搜索算法的计算量最小；根据所述每个候选设备的麦克风阵列排列方式初始化每个粒子的位置范围，得到目标位置范围；使用历史最优解初始化所述粒子位置，得到目标粒子位置，其中，所述目标搜索参数包括：所述目标粒子个数，所述目标迭代次数，所述目标最大速度，所述目标学习因子，所述目标位置范围和所述目标粒子位置。

在一个示例性实施例中，所述第一确定模块，包括：计算单元，用于计算所述每个候选设备在所述唤醒信号的频率范围内的能量和；确定单元，用于将所述能量和确定为所述每个候选设备对应的目标唤醒能量。

在一个示例性实施例中，所述获取模块，包括：执行模块，用于对每个智能设备接收到的语音信号执行回声消除操作和/或噪声消除操作，得到所述唤醒信号，其中，所述噪声消除操作包括以下至少之一：平稳噪声抑制，混响抑制，非平稳噪声抑制；判别模块，用于基于所述唤醒信号对每个智能设备进行唤醒判别；第四确定模块，用于将所述多个智能设备中唤醒判别成功的智能设备确定为所述候选设备。

本发明的实施例还提供了一种存储介质，该存储介质包括存储的程序，其中，上述程序运行时执行上述任一项的方法。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的程序代码：

S1，从多个智能设备中获取允许被唤醒信号唤醒的智能设备作为候选设备，其中，所述多个智能设备是目标场景中检测到所述唤醒信号的设备；

S2，在所述候选设备的数量为多个的情况下，确定多个所述候选设备中每个候选设备对应的目标唤醒角度以及目标唤醒能量，其中，所述目标唤醒角度用于指示所述唤醒信号的音源位置相对于所述每个候选设备的方向，所述目标唤醒能量用于指示所述每个候选设备接收到所述唤醒信号的能量；

S3，根据所述目标唤醒角度和所述目标唤醒能量，从多个所述候选设备中确定目标设备，其中，所述目标设备用于响应所述唤醒信号。

本发明的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种智能设备的唤醒方法，其特征在于，包括：

从多个智能设备中获取允许被唤醒信号唤醒的智能设备作为候选设备，其中，所述多个智能设备是目标场景中检测到所述唤醒信号的设备；

在所述候选设备的数量为多个的情况下，确定多个所述候选设备中每个候选设备对应的目标唤醒角度以及目标唤醒能量，其中，所述目标唤醒角度用于指示所述唤醒信号的音源位置相对于所述每个候选设备的方向，所述目标唤醒能量用于指示所述每个候选设备接收到所述唤醒信号的能量；

根据所述目标唤醒角度和所述目标唤醒能量，从多个所述候选设备中确定目标设备，其中，所述目标设备用于响应所述唤醒信号。

2.根据权利要求1所述的智能设备的唤醒方法，其特征在于，所述根据所述目标唤醒角度和所述目标唤醒能量，从多个所述候选设备中确定目标设备，包括：

将目标唤醒角度落入角度范围的候选设备确定为所述目标设备；

在多个所述候选设备所对应的目标唤醒角度均未落入所述角度范围时，将目标唤醒能量最大的候选设备确定为所述目标设备。

3.根据权利要求1或2所述的智能设备的唤醒方法，其特征在于，所述确定多个所述候选设备中每个候选设备对应的目标唤醒角度，包括：

基于所述唤醒信号和所述每个候选设备的唤醒角度变量，构建所述每个候选设备的唤醒角度变量的搜索函数；

对所述搜索函数进行优化搜索，得到所述每个候选设备的唤醒角度变量的最优解作为所述每个候选设备对应的目标唤醒角度。

4.根据权利要求3所述的智能设备的唤醒方法，其特征在于，所述基于所述唤醒信号和所述每个候选设备的唤醒角度变量，构建所述每个候选设备的唤醒角度变量的搜索函数，包括：

基于所述唤醒信号构造所述每个候选设备的唤醒角度变量的协方差矩阵；

基于所述每个候选设备的唤醒角度变量构造所述每个候选设备的唤醒角度变量的方向导量；

基于所述协方差矩阵和所述方向导量构造所述每个候选设备的唤醒角度变量的极大似然函数作为所述搜索函数。

5.根据权利要求3或4所述的智能设备的唤醒方法，其特征在于，所述对所述搜索函数进行优化搜索，得到所述每个候选设备的唤醒角度变量的最优解作为所述每个候选设备对应的目标唤醒角度，包括：

对优化搜索算法中的搜索参数进行初始化，得到目标搜索参数，其中，所述搜索参数包括：粒子个数，粒子位置，迭代次数，每个粒子的位置范围，每个粒子的最大速度和学习因子；

采用所述目标搜索参数以及线性递减惯性权重对所述搜索函数执行所述优化搜索算法，得到所述每个候选设备的唤醒角度变量的最优解作为所述每个候选设备对应的目标唤醒角度。

6.根据权利要求5所述的智能设备的唤醒方法，其特征在于，所述对优化搜索算法中的搜索参数进行初始化，得到目标搜索参数，包括：

初始化所述粒子个数，所述迭代次数，所述每个粒子的最大速度和所述学习因子，得到目标粒子个数，目标迭代次数，目标最大速度和目标学习因子，其中，所述目标粒子个数，所述目标迭代次数，所述目标最大速度和所述目标学习因子用于使得所述优化搜索算法的准确率达到准确率阈值的同时所述优化搜索算法的计算量最小；

根据所述每个候选设备的麦克风阵列排列方式初始化每个粒子的位置范围，得到目标位置范围；

使用历史最优解初始化所述粒子位置，得到目标粒子位置，其中，所述目标搜索参数包括：所述目标粒子个数，所述目标迭代次数，所述目标最大速度，所述目标学习因子，所述目标位置范围和所述目标粒子位置。

7.根据权利要求1所述的智能设备的唤醒方法，其特征在于，所述确定多个所述候选设备中每个候选设备对应的目标唤醒能量，包括：

计算所述每个候选设备在所述唤醒信号的频率范围内的能量和；

将所述能量和确定为所述每个候选设备对应的目标唤醒能量。

8.根据权利要求1所述的智能设备的唤醒方法，其特征在于，所述从多个智能设备中获取允许被唤醒信号唤醒的智能设备作为候选设备，包括：

对每个智能设备接收到的语音信号执行回声消除操作和/或噪声消除操作，得到所述唤醒信号，其中，所述噪声消除操作包括以下至少之一：平稳噪声抑制，混响抑制，非平稳噪声抑制；

基于所述唤醒信号对每个智能设备进行唤醒判别；

将所述多个智能设备中唤醒判别成功的智能设备确定为所述候选设备。

9.一种智能设备的唤醒装置，其特征在于，包括：

获取模块，用于从多个智能设备中获取允许被唤醒信号唤醒的智能设备作为候选设备，其中，所述多个智能设备是目标场景中检测到所述唤醒信号的设备；

第一确定模块，用于在所述候选设备的数量为多个的情况下，确定多个所述候选设备中每个候选设备对应的目标唤醒角度以及目标唤醒能量，其中，所述目标唤醒角度用于指示所述唤醒信号的音源位置相对于所述每个候选设备的方向，所述目标唤醒能量用于指示所述每个候选设备接收到所述唤醒信号的能量；

第二确定模块，用于根据所述目标唤醒角度和所述目标唤醒能量，从多个所述候选设备中确定目标设备，其中，所述目标设备用于响应所述唤醒信号。

10.一种计算机可读的存储介质，其特征在于，所述计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行上述权利要求1至8任一项中所述的方法。

11.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至8任一项中所述的方法。