WO2018188287A1

WO2018188287A1 - 一种语音控制方法、装置及家电设备

Info

Publication number: WO2018188287A1
Application number: PCT/CN2017/104905
Authority: WO
Inventors: 张新健
Original assignee: 广东美的制冷设备有限公司
Priority date: 2017-04-11
Filing date: 2017-09-30
Publication date: 2018-10-18

Abstract

一种语音控制方法、装置及家电设备，其中，方法包括：基于麦克风阵列采集声源所发出的语音信息（11）；对语音信息进行识别，确定与语音信息对应的目标控制指令（12）；获取声源相对于麦克风阵列的位置信息（13）；控制家电设备按照目标控制指令和位置信息运行（14）。通过本方法，能够实现对家电设备的智能化控制，用户仅通过发出语音信息即可控制家电设备，解除用户对遥控器的依赖，提升用户体验。

Description

一种语音控制方法、装置及家电设备

相关申请的交叉引用

本申请要求广东美的制冷设备有限公司于2017年4月11日提交的、发明名称为“语音控制方法、装置及家电设备”的、中国专利申请号“201710233667.X”，和广东美的制冷设备有限公司于2017年6月22日提交的、发明名称为“声波驱蚊方法、装置及空调器”的、中国专利申请号“201710482779.9”，及广东美的制冷设备有限公司、美的集团股份有限公司于2017年6月22日提交的、发明名称为“声源定位的方法和装置及空调器”的、中国专利申请号“201710493300.1”的优先权。

技术领域

本发明涉及智能家居领域，尤其涉及一种语音控制方法、装置及家电设备。

背景技术

家电设备比如空调、电风扇等作为生活电器，越来越多地出现在人们的日常生活中，现有对家电设备的控制大多是通过配套的遥控器，或者通过在移动终端中安装应用程序实现的，用户无法摆脱对外部控制设备的依赖，体验感较差。

发明内容

有鉴于此，本发明实施例提供一种语音控制方法、装置及家电设备，以实现智能化控制家电设备，用户仅通过发出语音信息即可对家电设备进行控制，解除了用户对遥控器的依赖。

本发明第一方面实施例提出一种语音控制方法，包括：

基于麦克风阵列采集声源所发出的语音信息；

对所述语音信息进行识别，确定与所述语音信息对应的目标控制指令；

获取所述声源相对于所述麦克风阵列的位置信息；

控制家电设备按照所述目标控制指令和所述位置信息运行。

本发明实施例的语音控制方法，通过采集声源发出的语音信息，对语音信息进行识别确定对应的目标控制指令，获取声源相对于麦克风阵列的位置信息，控制家电设备按照目标控制指令和位置信息运行。由此，能够实现对家电设备的智能化控制，用户仅通过发出语音信息即可控制家电设备，解除了用户对遥控器的依赖，提升了用户体验。

本发明第二方面实施例提出了一种语音控制装置，包括：

麦克风阵列，用于采集声源所发出的语音信息；

语音识别模块，用于对所述语音信息进行识别，确定与所述语音信息对应的目标控制指令；

定位模块，用于获取所述声源相对于所述麦克风阵列的位置信息；

控制模块，用于控制家电设备按照所述目标控制指令和所述位置信息运行。

本发明实施例的语音控制装置，通过采集声源发出的语音信息，对语音信息进行识别确定对应的目标控制指令，获取声源相对于麦克风阵列的位置信息，控制家电设备按照目标控制指令和位置信息运行。由此，能够实现对家电设备的智能化控制，用户仅通过发出语音信息即可控制家电设备，解除了用户对遥控器的依赖，提升了用户体验。

本发明第三方面实施例提出了一种家电设备，包括：如上所述的语音控制装置。

本发明实施例的家电设备，通过采集声源发出的语音信息，对语音信息进行识别确定对应的目标控制指令，获取声源相对于麦克风阵列的位置信息，控制家电设备按照目标控制指令和位置信息运行。由此，能够实现对家电设备的智能化控制，用户仅通过发出语音信息即可控制家电设备，解除了用户对遥控器的依赖，提升了用户体验。

本发明第四方面实施例提出了一种计算机程序产品，当所述计算机程序产品中的指令由处理器执行时，执行如第一方面实施例所述的语音控制方法。

本发明第五方面实施例提出了一种计算机可读存储介质，其上存储有计算机程序，当该计算机程序被处理器执行时能够实现如第一方面实施例所述的语音控制方法。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本发明一实施例提供的语音控制方法的流程示意图；

图2为本发明另一实施例提供的语音控制方法的流程示意图；

图3为本发明又一实施例提供的语音控制方法的流程示意图；

图4为本发明又一实施例提供的语音控制方法的流程示意图；

图5为信号模型和阵列模型示意图；

图6为本发明又一实施例提供的语音控制方法的流程示意图；

图7为根据本发明一个示例的获取声源位置信息的场景示意图；

图8为根据本发明一个示例的获取声源位置信息的坐标示意图；

图9为根据本发明一个示例的获取声源位置信息的流程示意图；

图10为本发明又一实施例提供的语音控制方法的流程示意图；

图11为本发明一个实施例提供的语音控制装置的结构示意图；

图12为本发明一个实施例提供的家电设备的结构示意图；

图13为本发明一个实施例提供的家电设备的系统架构图。

具体实施方式

下面结合附图对本发明实施例进行详细描述。

应当明确，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

下面参考附图描述本发明实施例的语音控制方法、装置及家电设备。

图1为本发明一实施例提供的语音控制方法的流程示意图。

如图1所示，该语音控制方法包括以下步骤：

S11，基于麦克风阵列采集声源所发出的语音信息。

用户在使用家电设备时，若需要对家电设备进行控制，比如控制家电设备开启或关闭，或者控制家电设备改变运行方式，比如改变家电设备的档位、风向等，可以向所需控制的家电设备发出语音信息。本实施例中，家电设备可以包括但不限于空调、风扇等。

本实施例中，家电设备可以基于内置的麦克风阵列采集声源(用户)所发出的语音信息。其中，麦克风阵列，可以是线性阵列、圆形阵列、球形阵列等等任意的拓扑结构。

本发明实施例中，麦克风阵列可以是直线麦克风阵列，由若干个相互独立且特性相同的麦克风组成，且所有麦克风处于同一直线上，每个麦克风的朝向相同，任意两个相邻麦克风的间隔相同，均为预设距离。

S12，对语音信息进行识别，确定与语音信息对应的目标控制指令。

本实施例中，通过麦克风阵列采集到声源发出的语音信息之后，对语音信息进行识别，确定与语音信息对应的目标控制指令。

本发明实施例中，对语音信息进行识别以确定对应的目标控制指令的方式有两种。作为一种可能的实现方式，可以通过查询语音模板库的方式确定目标控制指令。作为另一种可能的实现方式，可以利用语音识别模型确定目标控制指令。采用两种方式确定目标控制指令的具体过程将在后续内容中给出，为避免赘述，此处不作详细说明。

S13，获取声源相对于麦克风阵列的位置信息。

其中，位置信息可以是声源相对于麦克风阵列的角度信息和/或距离信息。

本实施例中，通过麦克风阵列采集到声源发出的语音信息之后，还可以获取声源相对于麦克风阵列的位置信息。作为一种可能的实现方式，可以采用波束形成算法获取声源的位置信息。

需要说明的是，本实施例中，步骤S12和步骤S13的执行顺序不分先后，二者可以同时执行，也可以先后执行，本实施例仅以步骤S13在步骤S12之后执行为例进行解释说明，而不能作为对本发明的限制。

S14，控制家电设备按照目标控制指令和位置信息运行。

本实施例中，确定了语音信息对应的目标控制指令，并获取了声源相对于麦克风阵列的位置信息之后，家电设备的控制系统即可控制家电设备按照目标控制指令和位置信息运行，即控制家电设备朝向声源所在的位置执行目标控制指令。

以家电设备为空调为例。当用户发出“风力调小一点儿”的语音信息时，空调内置的麦克风阵列采集该语音信息，并确定出与该语音信息对应的目标控制指令为“调小风力”，另外，空调内置的处理装置获取的声源的位置信息为相对空调左侧30°夹角处，则空调内置的控制系统控制空调朝向左侧30°方向吹风，同时将空调出风的风力减小。

本实施例的语音控制方法，通过采集声源发出的语音信息，对语音信息进行识别确定对应的目标控制指令，获取声源相对于麦克风阵列的位置信息，控制家电设备按照目标控制指令和位置信息运行。由此，能够实现对家电设备的智能化控制，用户仅通过发出语音信息即可控制家电设备，解除了用户对遥控器的依赖，提升了用户体验。

为了确定语音信息对应的目标控制指令，需要对语音信息进行识别。如前文所述，本发明实施例通过对语音信息进行识别以确定目标控制指令的方式有两种，其中一种为通过查询语音模板库的方式确定目标控制指令，该方式的实现过程具体包括：获取目标语音信息的目标内容，判断预设的语音模板库是否存在与目标内容对应的准控制指令，如果语音模板库中存在准控制指令，则将准控制指令作为目标控制指令，从而，如图2所示，本发明实施例提供的另一种语音控制方法可以包括以下步骤：

S21，基于麦克风阵列采集声源所发出的语音信息。

S22，对语音信息进行模数转换得到数字语音信息。

本实施例中，家电设备通过麦克风阵列采集到声源发出的语音信息后，可以先对语音信息进行模数转换，将模拟语音信息转换为数字语音信息，以用于后续的语音处理。作为一种可能的实现方式，可以采用高精度模数转换处理芯片对麦克风阵列采集的多路模拟语音信息进行高速模数转换，得到数字语音信息。

S23，消除数字语音信息中的干扰信息，得到目标语音信息。

其中，干扰信息包括但不限于噪声信息和回声信息。

本实施例中，对多路语音信息进行模数转换处理得到多路数字语音信息之后，还可以进一步对所得的多路数字语音信息进行处理，以消除多路数字语音信息中的干扰信息，比如对多路数字语音信息进行噪声消除处理和回声消除处理，得到目标语音信息。作为一种可能的实现方式，可以采用数字音频处理芯片对所得的多路数字语音信息进行处理，以消除干扰信息，得到目标语音信息。

S24，获取目标语音信息的目标内容。

本实施例中，在对麦克风阵列采集的语音信息进行一系列处理得到目标语音信息之后，还可以进一步获取目标语音信息中的目标内容。具体地，可以采用相关的语音识别技术获取目标内容。

其中，目标内容为一些常用的控制命令，包括但不限于调小、调高、关闭、开启、减小、降低等。

S25，判断预设的语音模板库是否存在与目标内容对应的准控制指令。

其中，准控制指令为与目标内容匹配度超过预设阈值的控制指令。

为了能够执行用户发出的控制命令，可以预先在家电设备中存储可以识别的控制指令，在接收到用户发出的控制命令后，将控制命令同预先存储的控制指令相匹配，以执行匹配到的控制指令，实现对家电设备的控制。

本实施例中，可以预先设置好语音模板库，语音模板库中存储有若干个能够被家电设备识别并执行的控制指令，执行每个控制指令实现的控制效果完全不同。在获取了目标语音信息中的目标内容之后，将目标内容同语音模板库中的所有控制指令进行匹配，以判断语音模板库中是否存在与目标内容对应的准控制指令。

具体地，可以通过计算目标内容与语音模板库中控制指令的匹配度来判断是否存在准控制指令，当目标内容与控制指令的匹配度超过预设阈值(比如90％)时，该控制指令即为准控制指令。

需要说明的是，本实施例中的语音模板库和预设阈值可以在家电设备出厂前由生产商设置。

本实施例中，若判断得知语音模板库中存在与目标内容对应的准控制指令，执行步骤S26；若判断得知语音模板库中不存在与目标内容对应的准控制指令，执行步骤S29。

S26，将准控制指令作为目标控制指令。

本实施例中，当得知预设的语音模板库中存在与目标内容对应的准控制指令时，准控制指令被作为目标控制控制指令用于控制家电设备。

S27，采用预设的波束形成算法对目标语音信息进行处理得到位置信息。

本实施例中，在对麦克风阵列采集的语音信息进行一系列处理得到目标语音信息之后，还可以采用预设的波束形成算法对目标语音信息进行处理，得到声源的位置信息。

波束形成算法是基于最大输出功率的可控算法，其基本思想是，将各阵元采集来的信号进行加权求和形成波束，通过搜索声源的可能位置来引导该波束，修改权值使得麦克风阵列的输出信号功率最大。波束形成算法既能用于时域中，也可以用于频域中，具有较强的适用性。

需要说明的是，步骤S27与步骤S24～S26的执行顺序不分先后，获取位置信息的步骤和获取目标控制指令的步骤可以同时进行，也可以先后进行，本实施例仅以步骤S27在步骤S26之后执行为例进行解释说明，而不能作为对本发明的限制。

S28，控制家电设备按照目标控制指令和位置信息运行。

本实施例中，获取了声源的位置信息和声源所发出的语音信息对应的目标控制指令之后，即可控制家电设备按照目标控制指令和位置信息运行。

具体地，当识别出目标控制指令为准控制指令之后，进一步向家电设备输出获取的位置信息，以控制家电设备按照目标控制指令和位置信息运行。也就是说，可以将是否识别出目标控制指令为准控制指令作为条件，以决定是否向家电设备输出位置信息。当识别出目标控制指令为准控制指令时，才向家电设备输出位置信息，否则，不进行任何操作。

通过在识别出目标控制指令为准控制指令时向家电设备输出位置信息以控制家电设备按照目标控制指令和位置信息运行，未识别出时不进行任何操作，能够提高语言控制的准确率，避免家电设备因执行不必要的控制指令而影响用户体验。

S29，不进行任何操作。

本实施例中，当判断得知语音模板库中不存在与目标内容对应的准控制指令时，家电设备不再进行任何操作，即不响应声源发出的语音信息。

本实施例的语音控制方法，通过对麦克风阵列采集的语音信息进行模数转换得到数字语音信息，消除数字语音信息中的干扰信息得到目标语音信息，能够消除干扰信息对目标语音信息的干扰，提高后续处理的准确率。通过采用预设的波束形成算法对目标语音信息进行处理得到位置信息，获取目标语音信息的目标内容，判断预设的语音模板库是否存在与目标内容对应的准控制指令，当存在准控制指令时将准控制指令作为目标控制指令，并向家电设备输出获取的位置信息，控制家电设备按照目标控制指令和位置信息运行，当不存在准控制指令时不进行任何操作，能够提高语言控制的准确率，避免家电设备因执行不必要的控制指令而影响用户体验。

前文介绍了本发明实施例通过对语音信息进行识别以确定目标控制指令的两种实现方式中的一种，下面将详细介绍另一种实现方式，即利用语音识别模型确定目标控制指令。从而，如图3所示，在如图2所示实施例的基础上，步骤S24～S26可以替换为如下步骤：

S31，将目标语音信息输入到语音识别模型中判断目标语音信息是否为准控制指令。

其中，语音识别模型可以通过训练获得，利用语音识别模型可以获得能够被家电设备识别并执行的控制指令。作为一种可能的实现方式，在训练语音识别模型时，可以录制不同人使用普通话发出的预定义的控制指令，以得到录音样本作为训练样本，然后基于神经网络模型利用训练样本训练获得语音识别模型。作为另一种可能的实现方式，在训练语音识别模型时，可以录制不同地区的人使用方言发出的预定义的控制指令，以得到不同口音的录音样本作为训练样本，基于神经网络模型利用训练样本训练获得语音识别模型。

本实施例中，在对麦克风阵列采集的语音信息进行一系列处理得到目标语音信息之后，将目标语音信息输入到预先训练好的语音识别模型中，语音识别模型通过对目标语音信息进行解析，判断目标语音信息是否为准控制指令。若目标语音信息输入至语音识别模型中解析得到能够被家电设备识别并执行的控制指令，则认为目标语音信息为准控制指令；否则，认为目标语音信息不是准控制指令，不再进行任何操作。

其中，准控制指令为能够被家电设备识别并执行的控制指令中与目标语音信息对应的控制指令。

S32，如果识别出目标语音信息为准控制指令，则将准控制指令作为目标控制指令。

本实施例中，当语音识别模型识别出目标语音信息为准控制指令时，将准控制指令作为目标控制指令。

本实施例的语音控制方法，通过将目标语音信息输入到语音识别模型中，并在语音识别模型识别出目标语音信息为准控制指令时，将准控制指令作为目标控制指令，能够提高语言控制的准确率。

为了更清楚地说明上述采用预设波束形成算法对目标语音信息进行处理得到位置信息的实现过程，本发明实施例提出了另一种语音控制方法。图4为本发明又一实施例提供的语音控制算法的流程示意图。

如图4所示，在如图2所示实施例的基础上，步骤S27可以包括以下步骤：

S271，获取麦克风阵列中各路麦克风中的目标语音信息相对于参考麦克风的相对时间差。

其中，参考麦克风为麦克风阵列中的一个麦克风。

声源发出的语音信息到达麦克风阵列时，由于声程差，每个麦克风接收到的信号有所差异。为了能够保证各个麦克风得到的信号相同，需要对接收到的信息进行人为补偿。此时，可以计算获得各个麦克风收到信号的相对时间差，以用于补偿获得与参考麦克风相同的信号。

假设麦克风阵列由M个麦克风组成，分别记为m₁，m₂，…，m_M，且相邻麦克风之间的间隔相等，均为d。空间内至少存在一个声源，均为窄带声源或单频信号声源，声源位置距离麦克风均较远，以至于声源发出的语音信息到达麦克风的声波可以近似为平面波，从而每个麦克风接收到的平面波的方向角即波达方向均相同，记为

将m₁作为参考麦克风，则其他麦克风接收到语音信息的时间相对于m₁存在一定的延时或超期，从而会产生一定的相位差。第i个麦克风接收到语音信息相对于m₁的时延t_i可以根据公式(1)计算获得，公式(1)表示如下：

其中，c为声速，M为麦克风的个数，d为相邻两个麦克风之间的间隔。为避免相位差大于π而造成方向模糊的情况，通常取

λ'为波长，即d满足“半波长”原则。

因此，本实施例中，麦克风阵列中各路麦克风中的目标语音信息相对于参考麦克风的相对时间差也可以通过公式(1)计算获得。

S272，根据相对时间差和预设的加权相关函数对各路麦克风的目标语音信息进行处理。

本实施例中，在获得麦克风阵列中各路麦克风中的目标语音信息相对于参考麦克风的相对时间差之后，根据预设的加权相关函数对各路麦克风的目标语音信息进行处理，得到处理后的各路目标语音信息，可以表示为w_ix_i(t-t_i)。

其中，w_i,i＝1,2,...,M为每个麦克风的目标语音信息的加权相关函数，x_i(t-t_i),i＝1,2,...,M为人为补偿后的目标语音信息。

S273，将处理后的各路的目标语音信息求和，形成一路波束信息和波束信息的输出功率。

本实施例中，在相邻两个麦克风之间的间隔满足半波长原则的条件下，将处理后的各路的目标语音信息进行加权求和，得到一路波束信息，计算公式如公式(2)所示。

基于如图5所示的信号模型和阵列模型，波束信息可以表示为如公式(3)所示的矢量形式。

y(t)＝W^Hx_i(t) (3)

其中，x(t)为麦克风阵列所接收的语音信息x_i(t)组成的矩阵，W为包含加权相关函数w_i和延时值t_i的矩阵，W^H表示矩阵W的共轭转置矩阵，i＝1,2,...,M，i和M均为正整数。对于远场平面波，W等于其阵列流行矢量，即W＝a(k')，k’为当前

对应的波束。

本实施例中，在计算波束信息的输出功率时，需要引入快拍模型。假设每个麦克风接收了N个快拍的数据，且N→∞时，波束信息的输出功率可通过公式(4)计算获得。

其中，x(n)为麦克风阵列所接收的语音信息组成的矩阵。

S274，调整加强相关函数的加权值，得到输出功率最大的目标波束信号。

由于W＝a(k')，从而，通过改变波束k’，即可改变矩阵W，进而实现对加权相关函数的加权值的调整，形成不同的波束，实现对声源点所在的整个空间的扫描。

本实施例中，通过改变波束k’调整加强相关函数的加权值，得到输出功率最大的波束，即为目标波束信号。

通过W＝a(k')，相当于给出了一个空间滤波器，可以把声源点所在的整个空间即麦克风阵列前方的空间进行网格划分，可以依次计算出每个网格点到各个麦克风的相对时间差，得到每个网格的波束信号与该波束信号的输出功率，从而实现对整个空间的扫描，最终可以从中确定出最大输出功率对应的波束信号。

S275，搜索目标波束信号所对应的空间点，将空间点的位置信息作为声源的位置信息。

本实施例中，在得到输出功率最大的目标波束信号之后，搜索目标波束信号所对应的空间点，搜索到的空间点的位置信息即为声源的位置信息。

本实施例的语音控制方法，通过获取麦克风阵列中各路麦克风中的目标语音信息相对于参考麦克风的相对时间差，根据相对时间差和预设的加权相关函数对目标语音信息进行处理后求和形成一路波束信息和波束信息的输出功率，通过调整加权相关函数的加权值得到输出功率最大的目标波束信号，搜索目标波束信号对应的空间点作为声源的位置信息，能够提高位置信息识别的准确率。

前文介绍了本发明实施例获取声源相对于麦克风阵列的位置信息的实现方式中的一种，下面将详细介绍另一种实现方式，即基于相对时间差估计的方法，获取声源的位置。从而，在如图2所示实施例的基础上，如图6所示，步骤S27可以替换为如下步骤：

S401，根据语音信息和预设参量，获取语音信息到达M个麦克风中的任意两个麦克风的相对时间差。

其中，根据所述语音信息的信噪比设定所述预设参量。

S402，根据语音信息到达该两个麦克风的相对时间差和这两个麦克风的位置对语音信息进行定位。

可以理解的是，麦克风阵列中可以包括M个麦克风，如图7所示，本发明实施例以麦克风阵列包括4个麦克风为例进行示意，每个麦克风均可以接收相应的语音信息，各个麦克风的相对位置是既定的，且各个麦克风之间互不相关。

可以理解的是，麦克风阵列所接收的语音信息，包括语音信号和噪声信号。

当该麦克风阵列设置在家电设备，如空调器、风扇等上时，如果用户需要对家电设备进行语音控制，则麦克风阵列接收到的语音信息中会包含用户输入的语音信号，以及环境噪声信号、混响噪声信号等。可以理解，用户对处于室内环境的空调或风扇进行语音控制时，用户对空调或风扇发出的声音会发生反射，即产生反射噪声，空调器、风扇等运行以及其他设备(如音箱等)也会产生声音，其与反射噪声可组成混响噪声。

在本发明的实施例中，考虑到语音信息中包含环境噪声、混响噪声，因此，在计算语音信息到达任意两个麦克风的相对时间差时，引入了预设参量。

可选地，可以根据语音信息的信噪比设置预设参量，且信噪比在一定范围内时，预设参量可与信噪比正相关，即信噪比越大，预设参量取值越大。

具体地，获取M个麦克风之中的第一麦克风和第二麦克风的第一语音信息和第二语音信息，对第一语音信息和第二语音信息进行傅立叶变换以生成第一傅立叶变换值和第二傅立叶变换值，根据第一傅立叶变换值、第二傅立叶变换值和预设参量生成相对时间差。

其中，第一麦克风和第二麦克风为M个麦克风之中的任意两个麦克风，例如，参见图7，第一麦克风为麦克风1，第二麦克风为麦克风2。

在本发明的一个示例中，获取麦克风1接收到的第一语音信息x₁(t)和麦克风2接收到的第二语音信息x₂(t)，对第一语音信息x₁(t)和第二语音信息x₂(t)进行傅立叶变换以生成第一傅立叶变换值X₁(ω)和第二傅立叶变换值X₂(ω)，进而可以通过以下公式(5)生成相对时间差：

其中，R₁₂(τ)的峰值位置为相对时间差，ψ₁₂(ω)为广义互相关加权函数，G₁₂(ω)为第一傅立叶变换值和第二傅立叶变换值之间的互功率谱，φ₁₂(ω)为广义互相关谱，其中，G₁₂(ω)＝X₁(ω)X₂(ω)。

需要说明的是，在获取相对时间差时，可以选择不同的加权函数ψ₁₂(ω)，例如，基本互相关函数，ψ₁₂(ω)＝1；SCOT(Smooth Co-herence Transform，平滑相干变换)加权函数，

CSP(Crosspower Spectrum Phase，互功率谱相位)加权函数，

等。可以理解，不同的加权函数可以得到不同的相对时间差估计算法，传统CSP算法中，选择CSP加权函数，即

进一步地，两个间距为d的麦克风1、麦克风2接收到的语音信息x₁(t)、x₂(t)的理想模型(不考虑混响噪声)，如式(6)所示：

x_i(t)＝a_iS(t-τ_i)+n_ie(t) (6)

实际模型(考虑混响噪声)如式(7)所示：

x_i(t)＝a_iS(t-τ_i)+n_ie(t)+n_ir(t) (7)

其中，i＝1,2，S(t)为声源信号，a_i为声音传播过程中的衰减因子，τ_i是声源到达麦克风i所需要的时间，n_ie(t)为麦克风i接收到的环境噪声信号，n_ir(t)为麦克风i接收到的混响噪声信号。

需要说明的是，在室内环境中，用户在对空调或风扇等家电设备进行语音控制时，必然会产生多路径的声音反射，并且语音信息还包含了家电设备本身及其他设备运作产生的噪声信号，所以实际模型中不仅要考虑环境噪声，还得考虑房间多径反射噪声、家电设备本身运作产生的噪声，即混响噪声。

由式(6)的理想模型可知，两个麦克风接收到的语音信息x₁(t)、x₂(t)的互功率谱函数G₁₂(ω)可通过下式(8)计算：

其中，N_ie(ω)为环境噪声信号n_ie(t)的加窗傅立叶变换，S_i(ω)为麦克风i接收到的声源信号的傅立叶变换值。

由于S(t)、n_1e(t)、n_2e(t)彼此不相关，因此，在高信噪比情况下，上式(8)可以简化为式(9)：

当考虑房间多径反射噪声时，两麦克风接收到的语音信息的互功率谱函数G₁₂(ω)可通过下式(10)计算：

由于S(t)、n_1e(t)、n_2e(t)之间彼此不相关，因此，上式(10)可以简化为式(11)：

进一步地，在高信噪比的情况下，由于N_ir(ω)相对于S(ω)很小，两者之间的相关性也随之很小，因此上式(11)又可以通过下式(12)近似表示：

然而，在实际家居环境中，空调、电风扇等家电设备运转时，一方面，由于自身状态的变化，如风量的改变、风向的改变等会产生各种不同的噪声；另一方面，用户对空调、风扇等家电设备进行语音控制时，往往会伴随出现语音的多路径反射声、电视声、音响声、其他人声、煮饭声等，即空调、风扇等家电设备运行过程中存在较大的环境噪声和较强的混响，这使得式(11)中的后三项变得比较大，不可忽略，因此，用|G₁₂(ω)|来近似|S(ω)|²也会产生较大的误差，使得式加权函数的峰值不再明显，式(5)中的R₁₂(τ)的峰值也不再明显，从而较大影响了不考虑混响噪声的传统CSP算法的性能。

即言，在传统CSP算法中，在高信噪比的情况下，|G₁₂(ω)|与|S(ω)|²之间的差值较小，可以等效做近似替换，此时估计出的时延精度较高；而在低信噪比的情况下，两者之间将会有较大的差值，不可近似替换，而且随着信噪比的下降，|S(ω)|²在|G₁₂(ω)|中所占的比例也下降。

在本发明的实施例中，基于传统CSP算法，为保证|S(ω)|²在|G₁₂(ω)|所占的比例具有一定稳定性，引入一个随信噪比变化的预设参量，记为λ²，通过这个预设参量来调节广义互相关加权函数的大小，进而减小噪声的影响，提高算法的抗噪性能。

具体地，在传统的CSP算法使用的广义互相关加权函数中引入预设参量λ²，在本发明的实施例中，广义互相关加权函数通过式(13)表示：

在本发明的一个实施例中，0.707≤λ≤1，λ²随着信噪比的变换而变化的量，且λ²满足下式(14)：

其中，σ表示信噪比，σ₀、σ₁、λ₀、λ₁是根据实际情况定的常数，且λ₁>λ₀。

可以理解，如果取λ²＝1，则为传统的CSP算法。

由此，基于传统CSP算法，引入了随着信噪比而变化的预设参量λ²后，可以对室内环境下，由人声多路径反射噪声、设备自身运转产生的声音、及其他设备产生的噪声等组成的混响声音有较强的抵抗能力，实现更好的应对噪声的能力，提高语音信息到达两麦克风的相对时间差(声程差)的计算精度，从而有利于提升声源定位的精度，有助于空调、风扇类家电设备的语音识别控制。

具体地，可以通过以下公式(15)对语音信息进行定位：

||m_i1-s||-||m_i2-s||＝Δτ_ic (15)

其中，Δτ_i为语音信息到达M个麦克风中的任意两个麦克风的相对时间差，即为式(5)中的R₁₂(τ)的峰值，m_i1、m_i2分别为任意两个麦克风之间位置矢量，s表示声源位置矢量，c为在当前介质下的声速，如在1个标准大气压和15℃下，声音在空气中的传播速度为340m/s。

在本发明的一个示例中，麦克风阵列中任意两个麦克风和声源位置的三维空间几何结构如图8所示，麦克风1和麦克风2在x轴上，其连线的中点为原点，声源到这两个麦克风的时间差(即声程差)为Δτ_i。

由式(15)可以看出，声源的位置在一个双曲面上。

参见图8，声源S的球面坐标为(r,θ,φ)，将声源、麦克风1和麦克风2转化到直角坐标系中分别为：

将s、m_i1、m_i2代入式(15)，且两边平方，可得：

当声场为远场，即距离r比较远时，

趋近于零，则此时式(16)可以近似为：

由此可见，当知道语音信息到达任意两个麦克风的相对时间差和这两个麦克风之间的距离时，就可以近似的求得θ角。当声源为远场声源时，可以用θ角的锥面来表示声源的可能位置。因此，只要能求得声程差Δτ_i，就可以近似地求得声源对于该任意两个麦克风连线中点的方向角。即言，通过两个麦克风就能获得一个声源的可能位置面。进而通过一个包含M个麦克风的阵列，可以获得多个声源可能位置的面，这些面的焦点也就是声源的位置。

需要说明的是，在实际情况中，由于存在误差，得到的声源位置往往不能够全都交于一点，所以只要找到距离几个面距离最近的位置，就是所估计出的声源位置。

在本发明的一个实施例中，在基于麦克风阵列采集声源所发出的语音信息后，还可以对语音信息进行短时傅立叶变换以生成多个音频频域值，进而将多个音频频域值中的最大值和/或最小值与门限值进行比较以判断语音信息是否为有效语音信号，如果为有效语音信号，则将语音信息的幅度谱减去噪声幅度谱，其中，门限值可以包括第一门限值和/或第二门限值，且第一门限值小于第二门限值。

具体地，如图9所示，在麦克风阵列中每个麦克风采集到一帧语音信息x[n]之后，对各帧语音信息进行短时傅立叶变换，得到多个音频频域值X[k,τ]，其中，n＝1,2,3,...,fLen，k＝1,2,3,...,fLen，fLen为语音信息的帧长，τ为短时傅立叶变换的时间参数。

进一步地，根据X[k,τ]进行判断。

在本发明的一个示例中，参见图9，如果多个音频频域值中的最大值max_1≤k≤fLen{|X[k,τ]|}小于等于第一门限值threshold1，即max_1≤k≤fLen{|X[k,τ]|}≤threshold1，则判定接收到的语音信息为噪声信号，否则判定接收到的语音信息为有效语音信号。

在本发明的另一个示例中，如果多个音频频域值中的最小值min_1≤k≤fLen{|X[k,τ]|}大于等于第二门限值threshold2，即min_1≤k≤fLen{|X[k,τ]|}≥threshold2，则判定接收到的语音信息为噪声信号，否则判定接收到的语音信息为有效语音信号。

在本发明的又一个示例中，如果多个音频频域值中的最大值max_1≤k≤fLen{|X[k,τ]|}大于第一门限值threshold1，即max_1≤k≤fLen{|X[k,τ]|}＞threshold1，且多个音频频域值中的最小值min_1≤k≤fLen{|X[k,τ]|}小于第二门限值threshold2，即min_1≤k≤fLen{|X[k,τ]|}＜threshold2，则判定接收到的语音信息为有效语音信号，否则判定接收到的语音信息为噪声信号。

即言，超过门限值的音频频域值对应的语音信息不是有效语音信号。其中，门限值可以根据经验事先设定，也可以由具体环境来确定。例如，用户在对空调、风扇等家电设备进行语音控制时，声音频率一般为200～1000Hz，此时可以设定第一门限值为200Hz，第二门限值为1000Hz。

更进一步地，参见图9，如果判定语音信息为噪声信号，则更新噪声信号的幅度谱的值，使噪声幅度谱始终保持为最近的噪声偏置；如果判定语音信息为有效语音信号，则将接收语音信息的幅度谱在频域减去噪声幅度谱，即以最近的噪声模拟当前的噪声。

举例而言，如果第一帧语音信息为噪声信号，则对应的更新的噪声幅度谱为第一帧语音信息的幅度谱；如果第二帧语音信息为有效语音信号，则对应的噪声幅度谱为第一帧语音信息的幅度谱，此时将第二帧语音信息的幅度谱减去第一帧语音信息的幅度谱；如果第三帧语音信息为噪声信号，则更新噪声幅度谱为第三帧语音信息的幅度谱；如果第四帧语音信息为噪声信号，则更新噪声幅度谱为第四帧语音信息的幅度谱；如果第五帧语音信息为有效语音信号，则对应的噪声幅度谱为第四帧语音信息的幅度谱，此时将第五帧语音信息的幅度谱减去第四帧语音信息的幅度谱，以此类推。由此，实现了自适应环境，在不同的噪声环境下都可以较好的实现去除背景噪声，得到降噪后的语音信息幅度谱。

综上，根据上述基于相对时间差估计的方法，在获取语音信息到达任意两个麦克风的相对时间差时，引入了预设参量，即通过麦克风阵列所采集的语音信息和预设参量，获取语音信息到达多个麦克风之中任意两个麦克风的相对时间差，进而根据任意两个麦克风的相对时间差和这两个麦克风的位置对语音信息进行定位。由此，能够有效的自适应减少环境噪声，而且对远场环境下的混响及声音衍射噪声有较强的适应抵抗能力，实现了双重降噪效果，大幅提升了基于阵列式麦克风的远场声源识别精度，使远场声源识别的实用性大大增强。

需要说明的是，在本发明实施例中，还可以通过GPS定位、基于子空间的声源定位等多种方法，获取声源的位置信息，此处不作限制。

通过上述分析可知，在确定了语音信息对应的控制指令，及获取了声源相对于麦克风阵列的位置信息后，可以控制家电设备按照控制指令和位置信息运行。在本发明一种可能的实现形式中，控制指令可以是驱蚊指令，下面结合图 10，对本发明实施例提供的语音控制方法进行进一步说明。

图10为本发明又一实施例提供的语音控制方法的流程示意图。

如图10所示，该语音控制方法包括：

步骤501，基于麦克风阵列采集声源所发出的语音信息。

其中，所述麦克风阵列包括M个麦克风，其中，M为大于1的正整数。

步骤502，对语音信息进行识别，确定与语音信息对应的目标控制指令为驱蚊指令。

步骤503，向用户返回响应消息。

步骤504，获取声源相对于麦克风阵列的位置信息。

步骤505，根据驱蚊指令和位置信息，发射驱蚊声波。

可以理解的是，超声波在空气中产生的振荡可以通过蚊虫头部的触须，使蚊虫的听觉神经感到不适，从而使蚊虫力求避开声波区域。另外，蚊虫依靠翅膀颤动飞行，翅膀颤动引起空气颤动，而超声波在空气中所引发的超声振荡会加剧空气的颤动，从而使得蚊虫飞行时的空气阻力加大，肌肉负担增大，难于忍受，只得逃逸。

因此，在本发明实施例中，确定了声源即用户相对于麦克风针对的位置信息后，且确定目标控制指令为驱蚊指令后，可以利用超声波驱蚊的原理，向用户所在的位置发射驱蚊声波，以驱赶用户所在位置的蚊虫。

其中，驱蚊声波，指具有某一种或多种特定频率，可以通过刺激蚊虫的神经系统、肌肉系统等将蚊虫驱赶出声波区域的声波。

具体的，由于人耳听觉频率范围在20赫兹至2万赫兹(20HZ-20KHZ)，因此，在本发明实施例中，为了避免驱蚊声波干扰到用户的正常休息，可以将驱蚊声波的频率设定在人耳听觉范围之外的频率范围。例如，可以将驱蚊声波的频率范围设定为大于24KHz以上的范围，以避免用户被驱蚊声波影响。

另外，为了避免蚊虫对驱蚊声波产生适应性和免疫力，在本发明实施例中，可以设置驱蚊声波的频率在预设的范围内不断变化。即，步骤505具体可以包括：以预设的调节频率，调整驱蚊声波的频率，从而使驱蚊声波的频率不断变化。

具体的，在本发明实施例中，可以在家电设备中设置控制转向模块，和以时钟脉冲发生器、充电调节电路、多谐振荡器和扬声器或蜂鸣器等组成的超声波发射模块。在确定用户的位置信息后，控制转向模块可以通过驱动马达或电机转动，使超声波发送模块进行转向，以使声波的发射方向朝向用户所在的大致方位，从而超声波发射模块即可向用户所在的位置发射驱蚊声波。且通过调整时钟脉冲的频率等方法，可以调整驱蚊声波的频率，以避免蚊虫对固定频率的驱蚊声波产生适应性和免疫力。

需要说明的是，在本申请实施例中，步骤502和步骤504也可以同时进行，即，在基于麦克风阵列采集声源所发出的语音信息后，一方面根据语音信息，确定对应的目标控制指令是否为驱蚊指令，一方面根据语音信息，确定用户的位置信息。然后仅在语音信息对应的目标控制指令为驱蚊指令时，将确定的位置信息，发送给控制转向模块，以使超声波发射模块向用户所在的位置发射驱蚊声波。通过同时根据采集到的语音信息，确定语音信息对应的目标控制指令及声源的位置信息，提高了声波驱蚊的效率。

另外，用户需要对家电设备进行控制时，向所需控制的家电设备发出语音信息后，通常希望了解操作是否成功，那么在本申请实施例中，确定语音信息对应的目标控制指令为驱蚊指令后，还可以向用户返回响应消息，以提示用户驱蚊操作成功。

另外，在用户不需要利用设备进行驱蚊时，也可以通过语音，控制设备的声波驱蚊功能关闭，以减少能源的消耗。

为了实现上述实施例，本申请还提出一种语音控制装置。

图11为本发明一个实施例提供的语音控制装置的结构示意图。

如图11所示，语音控制装置60包括：

麦克风阵列610、语音识别模块620、定位模块630，以及控制模块640。其中，

麦克风阵列610，用于采集声源所发出的语音信息。

语音识别模块620，用于对语音信息进行识别，确定与语音信息对应的目标控制指令。

可选地，在本发明实施例的一种可能的实现方式中，语音识别模块620还可以包括：

模型识别单元，用于将目标语音信息输入到语音识别模型中判断目标语音信息是否为准控制指令。

第二设置单元，用于如果识别出目标语音信息为准控制指令，则将准控制指令作为目标控制指令。

定位模块630，用于获取声源相对于麦克风阵列的位置信息。

具体地，定位模块630用于，采用预设的波束形成算法对目标语音信息进行处理得到位置信息。

进一步地，在本发明实施例的一种可能的实现方式中，定位模块630可以包括：

第一时延获取单元，用于获取麦克风阵列中各路麦克风中的目标语音信息相对于参考麦克风的时延值，其中，参考麦克风为麦克风阵列中的一个麦克风。

处理单元，用于利用根据时延值和预设的加权相关函数对各路麦克风的目标语音信息进行处理。

波束形式单元，用于将处理后的各路的目标语音信息求和，形成一路波束信息和波束信息的输出功率。

调整单元，用于调整加强相关函数的加权值，得到输出功率最大的目标波束信号。

搜索单元，用于搜索目标波束信号所对应的空间点，将空间点的位置信息作为声源的位置信息。

在本发明实施例的另一种可能的实现方式中，定位模块630可以包括：

第二时延获取单元，用于根据语音信息和预设参量，获取所述语音信息到达所述M个麦克风中的任意两个麦克风的相对时间差，其中，根据所述语音信息的信噪比设定所述预设参量；

定位单元，用于根据所述语音信息到达该两个麦克风的相对时间差和这两个麦克风的位置对所述语音信息进行定位。

所述第二时延获取单元，具体用于：

通过以下公式生成所述语音信息到达所述M个麦克风中的任意两个麦克风的相对时间差：

其中，R₁₂(τ)的峰值位置为相对时间差，ψ₁₂(ω)为广义互相关加权函数，G₁₂(ω)为第一傅立叶变换值和第二傅立叶变换值之间的互功率谱，G₁₂(ω)＝X₁(ω)X₂(ω)，X₁(ω)、X₂(ω)分别为对第一语音信息x₁(t)和第二语音信息x₂(t)进行傅立叶变换生成的第一傅立叶变换值和第二傅立叶变换值。

所述第二时延获取单元，还用于通过以下公式确定广义互相关加权函数 ψ₁₂(ω)：

其中，λ²为所述预设参量，

σ表示信噪比，σ₀、σ₁、λ₀、λ₁为预设的常数，且λ₁＞λ₀。

在本发明实施例的另一种可能的实现方式中，所述定位模块，还用于通过以下公式获取所述声源相对于所述麦克风阵列的位置信息：

||m_i1-s||-||m_i2-s||＝Δτ_ic，

其中，Δτ_i为所述语音信息到达所述M个麦克风中的任意两个麦克风的相对时间差，m_i1、m_i2分别为所述任意两个麦克风之间位置矢量，s表示声源位置矢量，c为在当前介质下的声速。

控制模块640，用于控制家电设备按照目标控制指令和位置信息运行。

具体地，控制模块640用于，当识别出目标控制指令为准控制指令后，向家电设备输出位置信息，以控制家电设备按照目标控制指令和位置信息运行。

可选地，在本发明实施例一种可能的实现方式中，该语音控制装置60还可以包括：

转换模块，用于在语音识别模块620对语音信息进行识别，确定与语音信息对应的控制指令之前，对语音信息进行模数转换得到数字语音信息。

干扰消除模块，用于消除数字语音信息中的干扰信息，得到目标语音信息。

变换模块，用于对所述语音信息进行短时傅立叶变换以生成多个音频频域值；

比较模块，用于将所述多个音频频域值中的最大值和最小值与门限值进行比较以判断所述语音信息是否为有效语音信号，其中，所述门限值包括第一门限值和第二门限值，且所述第一门限值小于所述第二门限值；

判断模块，用于在所述多个音频频域值中的最大值大于所述第一门限值且最小值小于所述第二门限值时，判断所述语音信息为有效语音信号，并将所述语音信息的幅度谱减去噪声幅度谱；

及在所述多个音频频域值中的最大值小于等于所述第一门限值或最小值大于等于所述第二门限值时，判断所述语音信息为噪声信号，并更新噪声幅度谱，以使噪声幅度谱为最近的噪声幅度谱。

可选地，在本发明实施例一种可能的实现方式中，上述目标控制指令可以为驱蚊指令，相应的，所述控制模块，具体用于：

根据所述驱蚊指令和所述位置信息，发射驱蚊声波。

该语音控制装置60还可以包括：发送模块，用于向用户返回响应消息。

可选地，在本发明实施例的一种可能的实现方式中，控制模块，还用于：

以预设的调节频率，调整所述驱蚊声波的频率。

需要说明的是，前述对语音控制方法实施例的解释说明也适用于本实施例的语音控制装置，其实现原理类似，此处不再赘述。

本实施例的语音控制装置，通过采集声源发出的语音信息，对语音信息进行识别确定对应的目标控制指令，获取声源相对于麦克风阵列的位置信息，控制家电设备按照目标控制指令和位置信息运行。由此，能够实现对家电设备的智能化控制，用户仅通过发出语音信息即可控制家电设备，解除了用户对遥控器的依赖，提升了用户体验。

为了实现上述实施例，本申请还提出一种家电设备。

图12为本发明一个实施例提供的家电设备的结构示意图。

如图12所示，该家电设备120，包括如前述实施例所述的语音控制装置60。

其中，家电设备120可以为空调器，风扇等任意设备。

可以理解的是，当利用空调器或风扇类等家电设备进行驱蚊时，由于空调器或风扇类设备通常在卧室中使用，房间空间较小，因此，相比在野外环境中具有更好的驱蚊效果。另外，空调器本身是一个需要出风的设备，空调器在使用过程中吹出风流，随着风力、风向的变化，室内空气振荡，同时配合超声波发射模块发射驱蚊声波，更加大了对蚊虫肌肉系统的刺激，提高了驱蚊的效果。

需要说明的是，前述对语音控制方法实施例的解释说明也适用于本实施例的家电设备，其实现原理类似，此处不再赘述。

在本发明一种可能的实现形式中，家电设备可以采用图13所示的系统架构图。

如图13所示，家电设备可以包括语音播报子系统131、语音识别子系统132、麦克风阵列子系统123、声源定位子系统134、控制子系统135。

具体实现时，麦克风阵列子系统133可以采集语音信息，并一方面将语音信息发送给语音识别子系统132进行语音识别，一方面将语音信息发送给声源定位子系统134进行声源定位。

语音识别子系统132对语音信息进行语音识别后，若确定了语音信息对应的目标控制指令，则一方面可以向声纹定位子系统134发送控制信号，以使声源定位子系统134将定位结果发送给控制子系统135；一方面可以向控制子系统135发送识别出的目标控制指令；再一方面可以向语音播放子系统131输出提示指令，以使语音播报子系统131提示用户操作成功。

声源定位子系统134根据麦克风阵列子系统133采集到的语音信息，经过信号处理，确定了声源信息后，若接收到语音识别子系统132输出的控制指令，则可以将定位结果发送给控制子系统135。

控制子系统135可以控制家电设备按照目标控制指令和位置信息运行，比如，控制子系统135中可以包括超声波发射模块和控制转向模块等，控制转向模块在接收到声源定位子系统134发送的定位结果后，可以控制超声波发射模块启动发射或关闭发射驱蚊声波，并根据声源定位子系统134发送的定位结果，驱动马达或电机转动，从而使超声波发射模块进行转向，实现向用户所在的位置发射驱蚊声波。

本实施例的家电设备，通过采集声源发出的语音信息，对语音信息进行识别确定对应的目标控制指令，获取声源相对于麦克风阵列的位置信息，控制家电设备按照目标控制指令和位置信息运行。由此，能够实现对家电设备的智能化控制，用户仅通过发出语音信息即可控制家电设备，解除了用户对遥控器的依赖，提升了用户体验。

为了实现上述实施例，本发明还提出一种计算机程序产品，当计算机程序产品中的指令由处理器执行时，执行如前述实施例所述的语音控制方法。

为了实现上述实施例，本发明还提出一种计算机可读存储介质，其上存储有计算机程序，当该计算机程序被处理器执行时能够实现如前述实施例所述的语音控制方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

一种语音控制方法，其特征在于，包括：

基于麦克风阵列采集声源所发出的语音信息；

对所述语音信息进行识别，确定与所述语音信息对应的目标控制指令；

获取所述声源相对于所述麦克风阵列的位置信息；

控制家电设备按照所述目标控制指令和所述位置信息运行。
如权利要求1所述的语音控制方法，其特征在于，所述对所述语音信息进行识别，确定与所述语音信息对应的目标控制指令之前，还包括：

对所述语音信息进行短时傅立叶变换以生成多个音频频域值；

将所述多个音频频域值中的最大值和最小值与门限值进行比较以判断所述语音信息是否为有效语音信号，其中，所述门限值包括第一门限值和第二门限值，且所述第一门限值小于所述第二门限值；

如果所述多个音频频域值中的最大值大于所述第一门限值且最小值小于所述第二门限值，则判断所述语音信息为有效语音信号，并将所述语音信息的幅度谱减去噪声幅度谱；

如果所述多个音频频域值中的最大值小于等于所述第一门限值或最小值大于等于所述第二门限值，则判断所述语音信息为噪声信号，并更新噪声幅度谱，以使噪声幅度谱为最近的噪声幅度谱。
如权利要求1所述的语音控制方法，其特征在于，所述对所述语音信息进行识别，确定与所述语音信息对应的目标控制指令之前，还包括：

对所述语音信息进行模数转换得到数字语音信息；

消除所述数字语音信息中的干扰信息，得到所述目标语音信息。
如权利要求3所述的语音控制方法，其特征在于，所述对所述语音信息进行识别，确定与所述语音信息对应的目标控制指令，包括：

获取所述目标语音信息的目标内容；

判断预设的语音模板库是否存在与所述目标内容对应的准控制指令；其中，所述准控制指令为与所述目标内容匹配度超过预设阈值的控制指令；

如果所述语音模板库中存在所述准控制指令，则将所述准控制指令作为所述目标控制指令。
如权利要求3所述的语音控制方法，其特征在于，所述对所述语音信息进行识别，确定与所述语音信息对应的目标控制指令，包括：

将所述目标语音信息输入到语音识别模型中判断所述目标语音信息是否为准控制指令；

如果识别出所述目标语音信息为所述准控制指令，则将所述准控制指令作为所述目标控制指令。
如权利要求4或5所述的语音控制方法，其特征在于，所述控制家电设备按照所述目标控制指令和所述位置信息运行，包括：

当识别出所述目标控制指令为所述准控制指令后，向所述家电设备输出所述位置信息，以控制所述家电设备按照所述目标控制指令和所述位置信息运行。
如权利要求3所述的语音控制方法，其特征在于，所述获取所述声源相对于所述麦克风阵列的位置信息，包括：

采用预设的波束形成算法对所述目标语音信息进行处理得到所述位置信息。
如权利要求7所述的语音控制方法，其特征在于，所述采用预设波束形成算法对所述目标语音信息进行处理得到所述位置信息，包括：

获取所述麦克风阵列中各路麦克风中的所述目标语音信息相对于参考麦克风的时延值；其中，所述参考麦克风为所述麦克风阵列中的一个麦克风；

根据所述时延值和预设的加权相关函数对各路麦克风的所述目标语音信息进行处理；

将处理后的各路的所述目标语音信息求和，形成一路波束信息和所述波束信息的输出功率；

调整所述加强相关函数的加权值，得到输出功率最大的目标波束信号；

搜索所述目标波束信号所对应的空间点，将所述空间点的位置信息作为所述声源的所述位置信息。
如权利要求1所述的语音控制方法，其特征在于，所述麦克风阵列包括M个麦克风，M为大于1的整数；

所述获取所述声源相对于所述麦克风阵列的位置信息，包括：

根据语音信息和预设参量，获取所述语音信息到达所述M个麦克风中的任意两个麦克风的相对时间差，其中，根据所述语音信息的信噪比设定所述预设参量；

根据所述语音信息到达该两个麦克风的相对时间差和这两个麦克风的位置对所述语音信息进行定位。
如权利要求9所述的语音控制方法，其特征在于，所述根据语音信息和预设参量，获取所述语音信息到达所述M个麦克风中的任意两个麦克风的相对时间差，包括：

通过以下公式生成所述语音信息到达所述M个麦克风中的任意两个麦克风的相对时间差：

其中，R₁₂(τ)的峰值位置为相对时间差，ψ₁₂(ω)为广义互相关加权函数，G₁₂(ω)为第一傅立叶变换值和第二傅立叶变换值之间的互功率谱，G₁₂(ω)＝X₁(ω)X₂(ω)，X₁(ω)、X₂(ω)分别为对第一语音信息x₁(t)和第二语音信息x₂(t)进行傅立叶变换生成的第一傅立叶变换值和第二傅立叶变换值。
如权利要求10所述的语音控制方法，其特征在于，所述广义互相关加权函数ψ₁₂(ω)通过以下公式确定：

其中，λ²为所述预设参量，
σ表示信噪比，σ₀、σ₁、λ₀、λ₁为预设的常数，且λ₁＞λ₀。
如权利要求7所述的声源定位的方法，其特征在于，通过以下公式获取所述声源相对于所述麦克风阵列的位置信息：

||m_i1-s||-||m_i2-s||＝Δτ_ic，

其中，Δτ_i为所述语音信息到达所述M个麦克风中的任意两个麦克风的相对时间差，m_i1、m_i2分别为所述任意两个麦克风之间位置矢量，s表示声源位置矢量，c为在当前介质下的声速。
如权利要求1所述的语音控制方法，其特征在于，所述目标控制指令为驱蚊指令；

所述控制家电设备按照所述目标控制指令和所述位置信息运行，包括：

根据所述驱蚊指令和所述位置信息，发射驱蚊声波；

所述确定与所述语音信息对应的目标控制指令之后，还包括：

向用户返回响应消息。
如权利要求13所述的语音控制方法，其特征在于，所述根据所述驱蚊指令和所述位置信息，发射驱蚊声波，包括：

以预设的调节频率，调整所述驱蚊声波的频率。
一种语音控制装置，其特征在于，包括：

麦克风阵列，用于采集声源所发出的语音信息；

语音识别模块，用于对所述语音信息进行识别，确定与所述语音信息对应的目标控制指令；

定位模块，用于获取所述声源相对于所述麦克风阵列的位置信息；

控制模块，用于控制家电设备按照所述目标控制指令和所述位置信息运行。
根据权利要求15所述的语音控制装置，其特征在于，还包括：

变换模块，用于对所述语音信息进行短时傅立叶变换以生成多个音频频域值；

比较模块，用于将所述多个音频频域值中的最大值和最小值与门限值进行比较以判断所述语音信息是否为有效语音信号，其中，所述门限值包括第一门限值和第二门限值，且所述第一门限值小于所述第二门限值；

判断模块，用于在所述多个音频频域值中的最大值大于所述第一门限值且最小值小于所述第二门限值时，判断所述语音信息为有效语音信号，并将所述语音信息的幅度谱减去噪声幅度谱；

及在所述多个音频频域值中的最大值小于等于所述第一门限值或最小值大于等于所述第二门限值时，判断所述语音信息为噪声信号，并更新噪声幅度谱，以使噪声幅度谱为最近的噪声幅度谱。
根据权利要求15所述的语音控制装置，其特征在于，还包括：

转换模块，用于在所述语音识别模块对所述语音信息进行识别，确定与所述语音信息对应的控制指令之前，对所述语音信息进行模数转换得到数字语音信息；

干扰消除模块，用于消除所述数字语音信息中的干扰信息，得到所述目标语音信息。
根据权利要求17所述的语音控制装置，其特征在于，所述语音识别模块，包括：

内容获取单元，用于获取所述目标语音信息的目标内容；

判断单元，用于判断预设的语音模板库是否存在与所述目标内容对应的准控制指令；其中，所述准控制指令为与所述目标内容匹配度超过预设阈值的控制指令；

第一设置单元，用于如果所述语音模板库中存在所述准控制指令，则将所述准控制指令作为所述目标控制指令。
根据权利要求17所述的语音控制装置，其特征在于，所述语音识别模块，包括：

模型识别单元，用于将所述目标语音信息输入到语音识别模型中判断所述目标语音信息是否为准控制指令；

第二设置单元，用于如果识别出所述目标语音信息为所述准控制指令，则将所述准控制指令作为所述目标控制指令。
根据权利要求18或19所述的语音控制装置，其特征在于，所述控制模块，具体用于当识别出所述目标控制指令为所述准控制指令后，向所述家电设备输出所述位置信息，以控制所述家电设备按照所述目标控制指令和所述位置信息运行。
根据权利要求17所述的语音控制装置，其特征在于，所述定位模块，具体用于采用预设的波束形成算法对所述目标语音信息进行处理得到所述位置信息。
根据权利要求21所述的语音控制装置，其特征在于，所述定位模块，包括：

第一时延获取单元，用于获取所述麦克风阵列中各路麦克风中的所述目标语音信息相对于参考麦克风的时延值；其中，所述参考麦克风为所述麦克风阵列中的一个麦克风；

处理单元，用于利用根据所述时延值和预设的加权相关函数对各路麦克风的所述目标语音信息进行处理；

波束形式单元，用于将处理后的各路的所述目标语音信息求和，形成一路波束信息和所述波束信息的输出功率；

调整单元，用于调整所述加强相关函数的加权值，得到输出功率最大的目标波束信号；

搜索单元，用于搜索所述目标波束信号所对应的空间点，将所述空间点的位置信息作为所述声源的所述位置信息。
如权利要求15所述的语音控制装置，其特征在于，所述麦克风阵列包括M个麦克风，M为大于1的整数；

所述定位模块，包括：

第二时延获取单元，用于根据语音信息和预设参量，获取所述语音信息到达所述M个麦克风中的任意两个麦克风的相对时间差，其中，根据所述语音信息的信噪比设定所述预设参量；

定位单元，用于根据所述语音信息到达该两个麦克风的相对时间差和这两个麦克风的位置对所述语音信息进行定位。
如权利要求23所述的语音控制装置，其特征在于，所述第二时延获取单元，具体用于：

通过以下公式生成所述语音信息到达所述M个麦克风中的任意两个麦克风的相对时间差：

其中，R₁₂(τ)的峰值位置为相对时间差，ψ₁₂(ω)为广义互相关加权函数，G₁₂(ω)为第一傅立叶变换值和第二傅立叶变换值之间的互功率谱，G₁₂(ω)＝X₁(ω)X₂(ω)，X₁(ω)、X₂(ω)分别为对第一目标语音信息x₁(t)和第二目标语音信息x₂(t)进行傅立叶变换生成的第一傅立叶变换值和第二傅立叶变换值。
如权利要求24所述的语音控制装置，其特征在于，所述第二时延获取单元，还用于通过以下公式确定广义互相关加权函数ψ₁₂(ω)：

其中，λ²为所述预设参量，
σ表示信噪比，σ₀、σ₁、λ₀、λ₁为预设的常数，且λ₁＞λ₀。
如权利要求21所述的声源定位的装置，其特征在于，所述定位模块，还用于通过以下公式获取所述声源相对于所述麦克风阵列的位置信息：

||m_i1-s||-||m_i2-s||＝Δτ_ic，

其中，Δτ_i为所述语音信息到达所述M个麦克风中的任意两个麦克风的相对时间差，m_i1、m_i2分别为所述任意两个麦克风之间位置矢量，s表示声源位置矢量，c为在当前介质下的声速。
如权利要求15所述的语音控制装置，其特征在于，所述目标控制指令为驱蚊指令；

所述控制模块，具体用于：

根据所述驱蚊指令和所述位置信息，发射驱蚊声波；

所述装置，还包括：

发送模块，用于向用户返回响应消息。
如权利要求27所述的语音控制装置，其特征在于，所述控制模块，还用于：

以预设的调节频率，调整所述驱蚊声波的频率。
一种家电设备，包括上述权利要求15-28任一项所述的语音控制装置。
一种计算机程序产品，当所述计算机程序产品中的指令由处理器执行时，执行如权利要求1-14中任一项所述的语音控制方法。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-14中任一项所述的语音控制方法。