CN116634319A

CN116634319A - 音频处理方法、装置、电子设备和存储介质

Info

Publication number: CN116634319A
Application number: CN202210134718.4A
Authority: CN
Inventors: 丁歌; 郭奶超
Original assignee: Beijing Xiaomi Mobile Software Co Ltd
Current assignee: Beijing Xiaomi Mobile Software Co Ltd
Priority date: 2022-02-14
Filing date: 2022-02-14
Publication date: 2023-08-22

Abstract

本公开是关于音频处理方法、装置、电子设备和存储介质，所述方法应用于音频录制设备，所述音频录制设备具有至少两个麦克风，所述方法包括：获取所述至少两个麦克风中的每个所述麦克风采集的原始音频信号；根据分频点分别对每个所述麦克风采集的原始音频信号进行分频处理，得到每个麦克风对应的低频信号和高频信号；根据目标声源方向和每个麦克风的端射方向，分别对各个麦克风对应的低频信号进行正向滤波和反向滤波，并根据所述正向滤波的结果和至少一个所述麦克风对应的高频信号确定有效信号，以及根据所述反向滤波的结果和至少一个所述麦克风对应的高频信号确定噪声信号；使用所述噪声信号对所述有效信号进行噪音消除处理，得到目标音频信号。

Description

音频处理方法、装置、电子设备和存储介质

技术领域

本公开涉及音频处理技术领域，具体涉及一种音频处理方法、装置、电子设备和存储介质。

背景技术

目前的手机、耳机等设备都能够进行音频录制，音频录制功能可以用于语音通话，人机语音交互等场景中。手机、耳机内具有麦克风微阵列，麦克风阵列中的每个麦克风都能够采集音频，且这些音频需要通过时延估计、波束形成、噪声消除等处理才能实现定向音频拾取。但是，相关技术中通过对麦克风采集的音频进行处理而定向拾取的音频质量和稳定性均较差。

发明内容

为克服相关技术中存在的问题，本公开实施例提供一种音频处理方法、装置、电子设备和存储介质，用以解决相关技术中的缺陷。

根据本公开实施例的第一方面，提供一种音频处理方法，应用于音频录制设备，所述音频录制设备具有至少两个麦克风，所述方法包括：

获取所述至少两个麦克风中的每个所述麦克风采集的原始音频信号；

根据分频点分别对每个所述麦克风采集的原始音频信号进行分频处理，得到每个麦克风对应的低频信号和高频信号；

根据目标声源方向和每个麦克风的端射方向，分别对各个麦克风对应的低频信号进行正向滤波和反向滤波，并根据所述正向滤波的结果和至少一个所述麦克风对应的高频信号确定有效信号，以及根据所述反向滤波的结果和至少一个所述麦克风对应的高频信号确定噪声信号，其中，所述有效信号为所述目标音频信号和所述噪声信号的混合信号；

使用所述噪声信号对所述有效信号进行噪音消除处理，得到目标音频信号。

在一个实施例中，所述根据目标声源方向和每个麦克风的端射方向，分别对各个麦克风对应的低频信号进行正向滤波和反向滤波，包括：

将目标麦克风对应的低频信号作为目标信号输入至空间滤波器，将其余麦克风对应的低频信号作为干扰信号输入至空间滤波器进行空间滤波，得到正向滤波的结果，其中，所述目标麦克风的端射方向与所述目标声源方向相匹配；

将远端麦克风对应的低频信号作为目标信号输入至空间滤波器，将其余麦克风对应的低频信号作为干扰信号输入至空间滤波器进行空间滤波，得到反向滤波的结果，其中，所述远端麦克风的端射方向与所述目标麦克风的端射方向相反。

在一个实施例中，所述将目标麦克风对应的低频信号作为目标信号输入至空间滤波器，同时将其余麦克风对应的低频信号作为干扰信号输入至空间滤波器进行空间滤波，包括：

将所述目标麦克风对应的低频信号作为目标信号输入空间滤波器、根据其余麦克风中的各个所述麦克风与所述目标麦克风的距离，将各个所述麦克风对应的低频信号作为各级干扰信号输入所述空间滤波器进行空间滤波；和/或，

所述将远端麦克风对应的低频信号作为目标信号输入至空间滤波器，将其余麦克风对应的低频信号作为干扰信号输入至空间滤波器进行空间滤波，包括：

将所述远端麦克风对应的低频信号作为目标信号输入所述空间滤波器，根据其余麦克风中的各个所述麦克风与所述远端麦克风的距离，将各个所述麦克风对应的低频信号作为各级干扰信号输入所述空间滤波器进行空间滤波。

在一个实施例中，所述根据所述正向滤波的结果和至少一个所述麦克风对应的高频信号确定有效信号，以及根据所述反向滤波的结果和至少一个所述麦克风对应的高频信号确定噪声信号，包括：

将所述正向滤波的结果和所述目标麦克风对应的高频信号合并，得到所述有效信号；

将所述反向滤波的结果与所述远端麦克风对应的高频信号合并，得到噪声信号。

在一个实施例中，还包括：

根据录音模式选择指令，确定目标声源方向。

在一个实施例中，所述目标声源方向包括多个子方向；

所述根据目标声源方向和每个麦克风的端射方向，分别对各个麦克风对应的低频信号进行正向滤波和反向滤波，并根据所述正向滤波的结果和至少一个所述麦克风对应的高频信号确定有效信号，以及根据所述反向滤波的结果和至少一个所述麦克风对应的高频信号确定噪声信号，包括：

分别针对所述目标声源方向的每个子方向，确定所述子方向对应的所述有效信号和所述噪声信号；

所述使用所述噪声信号对所述有效信号进行噪音消除处理，得到目标音频信号，包括：

根据每个所述子方向对应的噪声信号，对每个所述子方向对应的有效信号进行噪声消除处理，得到每个所述子方向对应的目标音频子信号；

根据每个所述子方向对应的目标音频子信号，确定所述目标音频信号。

在一个实施例中，所述目标声源方向包括第一子方向和第二子方向，所述第一子方向和所述第二子方向相反。

在一个实施例中，还包括：

根据相邻麦克风的距离，确定所述分频点；

所述根据分频点分别对每个所述麦克风采集的原始音频信号进行分频处理，得到每个麦克风对应的低频信号和高频信号，包括：

在所述分频点小于预设的分频点阈值的情况下，根据分频点分别对每个所述麦克风采集的原始音频信号进行分频处理，得到每个麦克风对应的低频信号和高频信号。

根据本公开实施例的第二方面，提供一种音频处理装置，应用于音频录制设备，所述音频录制设备具有至少两个麦克风，所述装置包括：

获取模块，用于获取所述至少两个麦克风中的每个所述麦克风采集的原始音频信号；

分频模块，用于根据分频点分别对每个所述麦克风采集的原始音频信号进行分频处理，得到每个麦克风对应的低频信号和高频信号；

滤波模块，用于根据目标声源方向和每个麦克风的端射方向，分别对各个麦克风对应的低频信号进行正向滤波和反向滤波，并根据所述正向滤波的结果和至少一个所述麦克风对应的高频信号确定有效信号，以及根据所述反向滤波的结果和至少一个所述麦克风对应的高频信号确定噪声信号，其中，所述有效信号为所述目标音频信号和所述噪声信号的混合信号；

噪声消除模块，用于使用所述噪声信号对所述有效信号进行噪音消除处理，得到目标音频信号。

在一个实施例中，所述滤波模块用于根据目标声源方向和每个麦克风的端射方向，分别对各个麦克风对应的低频信号进行正向滤波和反向滤波时，具体用于：

在一个实施例中，所述滤波模块用于将目标麦克风对应的低频信号作为目标信号输入至空间滤波器，将其余麦克风对应的低频信号作为干扰信号输入至空间滤波器进行空间滤波时，具体用于：

所述滤波模块用于将远端麦克风对应的低频信号作为目标信号输入至空间滤波器，将其余麦克风对应的低频信号作为干扰信号输入至空间滤波器进行空间滤波时，具体用于：

在一个实施例中，所述滤波模块用于根据所述正向滤波的结果和至少一个所述麦克风对应的高频信号确定有效信号，以及根据所述反向滤波的结果和至少一个所述麦克风对应的高频信号确定噪声信号时，具体用于：

在一个实施例中，还包括方向选择模块，用于：

根据录音模式选择指令，确定目标声源方向。

在一个实施例中，所述目标声源方向包括多个子方向；

所述滤波模块具体用于：

所述噪声消除模块具体用于：

在一个实施例中，还包括分频点确定模块，用于：

根据相邻麦克风的距离，确定所述分频点；

所述分频模块具体用于：

根据本公开实施例的第三方面，提供一种电子设备，所述电子设备包括存储器、处理器，所述存储器用于存储可在处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时基于第一方面所述的音频处理方法。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现第一方面所述的方法。

本公开的实施例提供的技术方案可以包括以下有益效果：

本公开通过获取音频录制设备的至少两个麦克风中每个麦克风所采集的原始音频信号，并根据分频点分别对每个麦克风采集的原始音频信号进行分频处理，得到每个麦克风对应的低频信号和高频信号，然后根据目标声源方向和每个麦克风的端射方向，对每个麦克风对应的低频信号进行正向滤波，并将所述低频信号的正向滤波结果与所述高频信号合并，得到有效信号，以及根据目标声源方向和每个麦克风的端射方向，对每个麦克风对应的低频信号进行反向滤波，并将所述低频信号的反向滤波结果与所述高频信号合并，得到噪声信号，最后使用所述噪声信号对所述有效信号进行噪音消除处理，得到目标音频信号。由于正反向滤波只针对低频信号，且有效信号和噪声信号都结合了滤波结果和高频信号，因此实现了对低频信号的定向波束形成，同时避免滤波过程对高频信号造成失真影响，提高了定向拾取的目标音频信号的保真率和稳定性，进而使音频录制设备在语音通话、人机语音交互等场景下提高用户的使用体验。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是本公开一示例性实施例示出的音频处理方法的流程图；

图2是本公开一示例性实施例示出的分频器的示意图；

图3是本公开一示例性实施例示出的两个麦克风的空间滤波器示意图；

图4是本公开一示例性实施例示出的三个麦克风的空间滤波器示意图；

图5是本公开一示例性实施例示出的自适应噪声消除滤波器的示意图；

图6是本公开另一示例性实施例示出的音频处理方法的流程图；

图7是本公开一示例性实施例示出的音频处理装置的结构示意图；

图8是本公开一示例性实施例示出的电子设备的结构框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在本公开使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本公开可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本公开范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

相关技术中的手机、耳机等设备中不同麦克风的距离较远，造成定向拾音的指向性效果不明显，并且对音频信号的处理过程容易造成较大失真。另外相关技术中手机、耳机等设备的降噪算法和盲源分离算法不具有指向性，不能很好的对非目标方向的干扰信号进行滤除，并且通常此类算法需要结合语音信号的特性做噪声检测，对于目标语音信号增强或提取有一定效果，而对于非语音信号的目标信号增强效果较弱。

基于此，第一方面，本公开至少一个实施例提供了一种音频处理方法，请参照附图1，其示出了该方法的流程，包括步骤S101和步骤S104。

其中，该音频处理方法应用于手机、耳机等音频录制设备，音频录制设备具有至少两个麦克风，上述至少两个麦克风可以组成麦克风阵列，或者单独设置。每个麦克风均具有不同的端射方向，端射方向就是该麦克风对应的音频录制设备的端部方向，例如手机的顶端和底端分别设有两个麦克风，则顶端的麦克风的端射方向为顶端方向，底端的麦克风的端射方向为底端方向。每个麦克风均能够用于采集音频，该音频处理方法用于对采集的这些音频进行处理，从而定向拾取目标声源方向的音频，由于麦克风采集的音频并不作为最终输出或保存的音频，因此本申请下文将麦克风采集的音频称为原始音频信号。

在步骤S101中，获取所述至少两个麦克风中的每个所述麦克风采集的原始音频信号。

手机、耳机等音频录制设备内的麦克风可以实时采集原始音频信号，或者在特定模式下采集原始音频信号。例如手机内的麦克风在通话模式下、人机交互模式下采集原始音频信号，耳机内的麦克风在耳机所连接的主机设备处于耳机模式下采集原始音频信号。

其中，原始音频信号可以为时域信号，即时域形式的音频信号。

在步骤S102中，根据分频点分别对每个所述麦克风采集的原始音频信号进行分频处理，得到每个麦克风对应的低频信号和高频信号。

其中，分频点为空间滤波器的可实现指向性的最高频点，因此如果超出分频点，空间滤波器不具有显著的波束指向效果，并且会引入额外的信号失真。可以预先根据相邻麦克风的距离，确定分频点，例如，按照下述公式确定分频点cf(Hz)：其中，c为声速，d为相邻麦克风的距离；然后在分频点小于预设的分频点阈值的情况下，执行步骤S102，即根据分频点对每个麦克风采集的原始音频信号进行分频处理，得到每个麦克风对应的低频信号和高频信号。对于常见的语音、音乐等声音信号，其频谱能量主要分布在10kHz以下，因此分频点阈值可以设置为10kHz。

分频处理，可以理解为将原始音频信号中高于分频点的部分确定为高频信号，将原始音频信号中低于分频点的部分确定为低频信号。在一个可能的实施例中，可以按照下述方式对原始音频信号进行分频处理：将原始音频信号输入至分频滤波器中进行分频处理，得到低频信号和高频信号，其中，分频滤波器根据分频点进行设计，且分频滤波器可以为如图2所示的形式，包括至少两个级联的低通滤波器(LP)和至少两个级联的高通滤波器(HP)。可以用下述函数表示分频处理的过程：F(signal,cf)＝[sig_l,sig_h]，其中，signal是分频器的输入信号，即原始音频信号，F(·)表示分频处理函数，sig_l、sig_h分别是以cf为分频点进行分频得到的低频信号和高频信号。

在音频录制设备具有两个麦克风的情况下，可以分别对两个麦克风进行分频：F(sig1,cf)＝[sig1_l,sig1_h]、F(sig2,cf)＝[sig2_l,sig2_h]，其中，sig1_l、sig1_h是sig1的低频信号和高频信号，sig2_l、sig2_h是sig2的低频信号和高频信号。

通过分频处理，既在有效频率范围内实现了空间指向性，同时又可以避免高频部分的波束非线性造成的失真。

在步骤S103中，根据目标声源方向和每个所述麦克风的端射方向，分别对各个麦克风采集的原始音频信号进行正向滤波和反向滤波，并根据所述正向滤波的结果和至少一个所述麦克风对应的高频信号确定有效信号，以及根据所述反向滤波的结果和至少一个所述麦克风对应的高频信号确定噪声信号，其中，所述有效信号为所述目标音频信号和所述噪声信号的混合信号。

其中，正向滤波可以为按照目标声源方向进行空间滤波的过程，反向滤波可以为按照目标声源方向的反方向进行空间滤波的过程。正向滤波和反向滤波可以采用空间滤波器完成。空间滤波器的滤波函数H(ω)可以采用下述公式进行表示：

H(ω)＝H_L(ω)·a(ω,θ)；

H_L(ω)为低频补偿滤波系数，H_L(ω)是与相邻麦克风间的距离相关的函数，因此空间滤波器内的滤波函数根据相邻麦克风间的距离生成；a(ω,θ)为麦克风阵列的导向矢量；

空间滤波器的滤波过程可以下述公式进行表示：

Y＝S*H(ω)；

Y为空间滤波器的频域输出信号，可以通过逆傅里叶变换将频域信号Y转换为时域信号y；S为空间滤波器的输入信号，即频域形式的目标信号和各级频域形式的干扰信号组成的向量，目标信号和干扰信号均为麦克风采集的原始音频信号。

在一个可能的场景下，音频录制设备具有两个麦克风，空间滤波器如图3所示，两个麦克风对应的低频信号sig1_l、sig2_l分别输入至空间滤波器中，输出定向滤波结果。

在该两个麦克风的场景下，空间滤波器的低频补偿滤波系数H_L(ω)可以为：

其中，j为负的单位向量，ω表示数字角频率，τ表示延时，/>

在该两个麦克风的场景下，麦克风阵列的导向矢量a(ω,θ)可以为：

其中，c为声速；

在该两个麦克风的场景下，空间滤波器的输入信号S可以为向量[S1 S2]，其中，S1为其中一个麦克风对应的低频信号sig1_l由时域转为频域的信号，S2为其中另一个麦克风对应的低频信号sig2_l由时域转为频域的信号，且S1为目标信号，S2为干扰信号。

在另一个可能的场景下，音频录制设备具有三个麦克风，空间滤波器如图4所示，三个麦克风对应的低频信号sig1_l、sig2_l、sig3_l分别输入至空间滤波器中，输出定向滤波结果。

在该三个麦克风的场景下，空间滤波器的低频补偿滤波系数H_L(ω)可以为：

在三个麦克风的场景下，麦克风阵列的导向矢量a(ω,θ)可以为：

其中，α_2,1＝-1,α_2,2＝0。

在该三个麦克风的场景下，空间滤波器的输入信号S可以为向量[S1 S2 S3]，其中，S1为第一个麦克风对应的低频信号sig1_l由时域转为频域的信号，S2为第二个麦克风对应的低频信号sig2_l由时域转为频域的信号，S3为第三个麦克风对应的低频信号sig3_l由时域转为频域的信号，且S1为目标信号，S2为一级干扰信号，S3为二级干扰信号。

基于上述空间滤波器的结构和参数，本步骤可以采用下述方式对各个麦克风对应的低频信号进行正向滤波：将目标麦克风对应的低频信号作为目标信号输入至空间滤波器，将其余麦克风对应的低频信号作为干扰信号输入至空间滤波器进行空间滤波，得到正向滤波的结果。

其中，所述目标麦克风的端射方向与所述目标声源方向相匹配，也就是说，目标麦克风为目标声源方向所对应的音频录制设备的端部内的麦克风，具体来说，可以将麦克风的端射方向两侧的预设角度范围设置为匹配范围，当目标声源方向处于某麦克风的匹配范围内时，则该麦克风的端射方向与目标声源方向相匹配。例如，手机的顶部和底部分别设置有麦克风，当手机的底部朝向声源进行录音的情况下，则目标声源方向为底端，则设置在底部，即端射方向为底端方向的麦克风为目标麦克风。再例如，耳机的头部和尾部分别设置有麦克风，当用户佩戴耳机进行语音通话的情况下，则目标声源方向为耳机的尾部，则设置在尾部，即端射方向为尾部方向的麦克风为目标麦克风。用户可以根据目标声源方向和录制方式，通过对音频录制设备进行操作而选定目标麦克风，例如用户可以通过选择不同的录音模式来选择不同的目标麦克风；或者在用户未选择目标麦克风的情况下，音频录制设备可以通过识别目标声源方向，并根据各个麦克风的端射方向自动确定目标麦克风。

可选的，将所述目标麦克风对应的低频信号作为目标信号输入空间滤波器、根据其余麦克风中的各个所述麦克风与所述目标麦克风的距离，将各个所述麦克风对应的低频信号作为各级干扰信号输入所述空间滤波器进行空间滤波。

在音频录制设备具有两个麦克风的情况下，可以将目标麦克风之外的另一个麦克风对应的低频信号作为干扰信号输入至空间滤波器，则空间滤波器的输入信号S可以为向量[S1 S2]，其中，S1为其中一个麦克风对应的低频信号sig1_l由时域转为频域的信号，S2为其中另一个麦克风对应的低频信号sig2_l由时域转为频域的信号，且S1为目标信号，S2为干扰信号。

在音频录制设备具有至少三个麦克风的情况下，可以根据其余麦克风中的各个所述麦克风与所述目标麦克风的距离，将各个所述麦克风对应的低频信号作为各级干扰信号输入所述空间滤波器中，也就是与目标麦克风的距离越小，则干扰级别越高，例如沿目标麦克风至远端麦克风的方向为每个麦克风编号，则目标麦克风的编号为1，然后编号为2的麦克风所采集的原始音频信号的干扰级别为1，然后其他麦克风以此类推。则空间滤波器的输入信号S可以为向量[S1……Sn]，其中，S1为目标麦克风对应的低频信号sig1_l由时域转为频域的信号，Sn为远端麦克风对应的低频信号sign_l由时域转为频域的信号，远端麦克风就是距离目标麦克风最远的麦克风，远端麦克风的端射方向与目标麦克风的端射方向相反，n≥3。

基于上述空间滤波器的结构和参数，本步骤可以采用下述方式对各个麦克风对应的低频信号进行反向滤波：将远端麦克风对应的低频信号作为目标信号输入至空间滤波器，将其余麦克风对应的低频信号作为干扰信号输入至空间滤波器进行空间滤波，得到反向滤波的结果。

其中，远端麦克风所在的音频录制设备的一端与目标声源方向所对应的音频录制设备的一端相反。例如，手机的顶部和底部分别设置有麦克风，当手机的底部朝向声源进行录音的情况下，则目标声源方向为底端，则设置在顶部，即端射方向为顶端方向的麦克风为远端麦克风。再例如，耳机的头部和尾部分别设置有麦克风，当用户佩戴耳机进行语音通话的情况下，则目标声源方向为耳机的尾部，则设置在头部，即端射方向为头部方向的麦克风为远端麦克风。

可以将正向滤波过程中空间滤波器的输入信号改变方向，作为该反向滤波过程中空间滤波器的输入信号。

可选的，将所述远端麦克风对应的低频信号作为目标信号输入所述空间滤波器，根据其余麦克风中的各个所述麦克风与所述远端麦克风的距离，将各个所述麦克风对应的低频信号作为各级干扰信号输入所述空间滤波器进行空间滤波。

在音频录制设备具有两个麦克风的情况下，可以将远端麦克风之外的另一个麦克风所采集的原始音频信号作为干扰信号输入至空间滤波器，则空间滤波器的输入信号S可以为向量[S2 S1]，其中，S1为目标麦克风对应的低频信号sig1_l由时域转为频域的信号，S2为远端麦克风对应的低频信号sig2_l由时域转为频域的信号，且S1为干扰信号，S2为目标信号。

在音频录制设备具有至少三个麦克风的情况下，可以根据其余麦克风中的各个所述麦克风与所述远端麦克风的距离，将各个所述麦克风对应的低频信号作为各级干扰信号输入所述空间滤波器中，也就是与远端麦克风的距离越小，则干扰级别越高，例如最近的麦克风的干扰级别为1，然后其他麦克风以此类推。则空间滤波器的输入信号S可以为向量[Sn……S1]，其中，S1为目标麦克风对应的低频信号sig1_l由时域转为频域的信号，Sn为远端麦克风对应的低频信号sign_l由时域转为频域的信号，远端麦克风就是距离目标麦克风最远的麦克风，远端麦克风的端射方向与目标麦克风的端射方向相反，n≥3。

本步骤中，可以将所述正向滤波的结果和所述目标麦克风对应的高频信号合并，得到所述有效信号。例如按照下述公式完成上述合并：y1＝y1_l+sig1_h，其中，y1为有效信号，y1_l是正向滤波的结果，sig1_h是目标麦克风所采集的原始音频信号。

本步骤中，可以将所述反向滤波的结果与所述远端麦克风对应的高频信号合并，得到噪声信号。例如按照下述公式完成上述合并：y2＝y2_l+sign_h，其中，y2为噪声信号，y2_l是反向滤波的结果，sign_h是远端麦克风所采集的原始音频信号。

在步骤S104中，使用所述噪声信号对所述有效信号进行噪音消除处理，得到目标音频信号。

可以采用如图5所示的自适应噪声消除滤波器进行噪声消除处理，该滤波器利用自适应LMS算法实现噪声消除。目标音频信号即为设备最终获取和存储、传输的音频信号。

可以将有效信号y1作为该自适应噪声消除滤波器的输入信号x(t)，将噪声信号y2作为该自适应噪声消除滤波器的噪声参考信号n(t)，则该自适应噪声消除滤波器可以输出目标音频信号ys1(t)。

需要注意的是，若目标声源方向反向，则目标麦克风和远端麦克风互换，进而原来的有效信号y1转换为噪声信号，原来的噪声信号y2转换为有效信号。进而可以将有效信号y2作为该自适应噪声消除滤波器的输入信号x(t)，将噪声信号y1作为该自适应噪声消除滤波器的噪声参考信号n(t)，则该自适应噪声消除滤波器可以输出目标声源方向反向后的目标音频信号ys2(t)。

另外，本公开所提供的音频处理方法，定向拾音的指向性效果明显，避免了在音频信号的处理过程中造成失真；而且本公开通过对非目标方向进行定向拾音来获取噪声信号，不需要进行噪声估计，因此能够很好的对非目标方向的干扰信号进行滤除，且不限于语音信号，对音乐、歌唱等信号也同样有效。

本公开的一些实施例中，可以预先根据录音模式选择指令，确定目标声源方向。其中，录音模式选择指令可以根据用户的操作生成，例如用户可以调取录音模式设置界面，并对该界面内的某个录音模式的标识进行点击等操作，从而生成该录音模式对应的录音模式选择指令。每个录音模式均具有对应的目标声源方向，例如，手机等音频录制设备的顶端设有一个麦克风，底端设有一个麦克风，则音频录制设备可以具有顶端录音模式和底端录音模式，则在顶端录音模式下，目标声源方向为顶端方向，目标麦克风为顶端的麦克风，远端麦克风为底端的麦克风；相反，在底端录音模式下，目标生源方向为底端方向，目标麦克风为底端的麦克风，远端麦克风为顶端的麦克风。

需要注意的是，录音模式还可以为多方向录音模式，则目标生源声源方向可以包括多个子方向。例如上述顶端和底端分别设有麦克风的音频录制设备可以具有双向录音模式，在该录音模式下，目标声源方向包括顶端方向和底端方向两个子方向。

在目标声源方向包括多个子方向的情况下，执行步骤S103时，即根据目标声源方向和每个麦克风的端射方向，分别对各个麦克风对应的低频信号进行正向滤波和反向滤波，并根据所述正向滤波的结果和至少一个所述麦克风对应的高频信号确定有效信号，以及根据所述反向滤波的结果和至少一个所述麦克风对应的高频信号确定噪声信号时，可以分别针对所述目标声源方向的每个子方向，确定所述子方向对应的所述有效信号和所述噪声信号。也就是说，可以针对每个子方向执行步骤S103来确定其对应的有效信号和噪声信号，步骤S103的具体执行细节已经在上述实施例中进行了较为详细的介绍，这里不再重复赘述。

基于上述对每个子方向所确定的有效信号和噪声信号，在执行步骤S104时，即使用所述噪声信号对所述有效信号进行噪音消除处理，得到目标音频信号时，可以先根据每个所述子方向对应的噪声信号，对每个所述子方向对应的有效信号进行噪声消除处理，得到每个所述子方向对应的目标音频子信号；然后再根据每个所述子方向对应的目标音频子信号，确定所述目标音频信号，例如可以将各个子方向对应的目标音频子信号相加，得到目标音频信号。

在一个示例中，目标声源方向包括第一子方向和第二子方向，且所述第一子方向和所述第二子方向相反。例如，步骤S104中所介绍的目标声源方向为本示例中的第一子方向，步骤S104中所介绍的目标声源方向的反向为本示例中的第二子方向。则可以将步骤S104中的目标声源方向的目标音频信号ys1(t)作为本示例中第一子方向的目标音频子信号，将步骤S104中的目标声源方向的反向的目标音频信号ys2(t)作为本示例中第二子方向的目标音频子信号，然后将两个子方向的目标音频子信号按照下述公式处理，得到本实施例中的目标音频信号ys3(t)：ys3(t)＝ys1(t)+ys2(t)。

本公开的一些实施例中，在所述分频点大于或等于预设的分频点阈值的情况下，可以不对麦克风所采集的原始音频信号进行分频处理。而是根据目标声源方向和每个麦克风的端射方向，分别对各个麦克风所采集的原始音频信号进行正向滤波和反向滤波；然后使用所述反向滤波的结果对所述正向滤波的结果进行噪音消除处理，得到目标音频信号。

其中，正向滤波和反向滤波的过程与步骤S103中介绍的低频信号的正向滤波和反向滤波方式相同，这里不再重复赘述。

本实施例中，在分频点大于或等于预设的分频阈值的情况下，不对麦克风所采集的原始音频信号进行分频处理，然后对原始音频信号进行双向滤波，并将正向滤波结果作为有效信号，将反向滤波结果作为噪声信号，进而进行噪声消除，得到目标音频信号，即设备最终获取、存储、传输的音频信号。

请参照附图6，其示例性的示出了本公开一个实施例进行音频处理的完整流程。从图6中可以看出，该实施例的音频录制设备具有两个麦克风，两个麦克风根据目标声源方向分别为目标麦克风和远端麦克风，目标麦克风所采集的原始音频信号为sig1，远端麦克风所采集的原始音频信号为sig2，且根据两个麦克风的距离所确定的分频点小于分频点阈值，因此sig1和sig2分别输入至分频滤波器中，以上述分频点进行分频，得到sig1对应的高频信号sig1_h、sig1对应的低频信号sig1_l、sig2对应的高频信号sig2_h、sig2对应的低频信号sig2_l，接下来对sig1_l和sig2_l进行正向滤波，并将正向滤波的结果与sig1_h合成得到有效信号，对sig1_l和sig2_l进行反向滤波得到噪声信号，并将反向滤波的结果与sig2_h合成得到噪声信号，最后将有效信号作为带噪输入信号，将噪声信号作为噪声参考信号进行自适应噪声抵消，从而得到目标信号，即目标音频信号。由于正反向滤波只针对低频信号，且有效信号和噪声信号都结合了滤波结果和高频信号，因此实现了对低频信号的定向波束形成，同时避免滤波过程对高频信号造成失真影响，也就是通过分频处理，既在有效频率范围内实现了空间指向性，同时又可以避免高频部分的波束非线性造成的失真。提高了定向拾取的目标音频信号的保真率和稳定性，进而使音频录制设备在语音通话、人机语音交互等场景下提高用户的使用体验。

根据本公开实施例的第二方面，提供一种音频处理装置，应用于音频录制设备，所述音频录制设备具有至少两个麦克风，请参照附图7，所述装置包括：

获取模块701，用于获取所述至少两个麦克风中的每个所述麦克风采集的原始音频信号；

分频模块702，用于根据分频点分别对每个所述麦克风采集的原始音频信号进行分频处理，得到每个麦克风对应的低频信号和高频信号；

滤波模块703，用于根据目标声源方向和每个麦克风的端射方向，分别对各个麦克风对应的低频信号进行正向滤波和反向滤波，并根据所述正向滤波的结果和至少一个所述麦克风对应的高频信号确定有效信号，以及根据所述反向滤波的结果和至少一个所述麦克风对应的高频信号确定噪声信号，其中，所述有效信号为所述目标音频信号和所述噪声信号的混合信号；

噪声消除模块704，用于使用所述噪声信号对所述有效信号进行噪音消除处理，得到目标音频信号。

在本公开的一些实施例中，所述滤波模块用于根据目标声源方向和每个麦克风的端射方向，分别对各个麦克风对应的低频信号进行正向滤波和反向滤波时，具体用于：

在本公开的一些实施例中，所述滤波模块用于将目标麦克风对应的低频信号作为目标信号输入至空间滤波器，将其余麦克风对应的低频信号作为干扰信号输入至空间滤波器进行空间滤波时，具体用于：

在本公开的一些实施例中，所述滤波模块用于根据所述正向滤波的结果和至少一个所述麦克风对应的高频信号确定有效信号，以及根据所述反向滤波的结果和至少一个所述麦克风对应的高频信号确定噪声信号时，具体用于：

在本公开的一些实施例中，还包括方向选择模块，用于：

根据录音模式选择指令，确定目标声源方向。

在本公开的一些实施例中，所述目标声源方向包括多个子方向；

所述滤波模块具体用于：

所述噪声消除模块具体用于：

在本公开的一些实施例中，所述目标声源方向包括第一子方向和第二子方向，所述第一子方向和所述第二子方向相反。

在本公开的一些实施例中，还包括分频点确定模块，用于：

根据相邻麦克风的距离，确定所述分频点；

所述分频模块具体用于：

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在第一方面有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

根据本公开实施例的第三方面，请参照附图8，其示例性的示出了一种电子设备的框图。例如，设备800可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图8，设备800可以包括以下一个或多个组件：处理组件802，存储器804，电源组件806，多媒体组件808，音频组件810，输入/输出(I/O)的接口812，传感器组件814，以及通信组件816。

处理组件802通常控制设备800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理组件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在设备800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电力组件806为设备800的各种组件提供电力。电力组件806可以包括电源管理系统，一个或多个电源，及其他与为设备800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触控面板(TP)。如果屏幕包括触控面板，屏幕可以被实现为触控屏，以接收来自用户的输入信号。触控面板包括一个或多个触控传感器以感测触控、滑动和触控面板上的手势。所述触控传感器可以不仅感测触控或滑动动作的边界，而且还检测与所述触控或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当设备800处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为设备800提供各个方面的状态评估。例如，传感器组件814可以检测到设备800的打开/关闭状态，组件的相对定位，例如所述组件为设备800的显示器和小键盘，传感器组件814还可以图像检测设备800或设备800一个组件的位置改变，用户与设备800接触的存在或不存在，设备800方位或加速/减速和设备800的温度变化。传感器组件814还可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于设备800和其他设备之间有线或无线方式的通信。设备800可以接入基于通信标准的无线网络，如WiFi，2G或3G，4G或5G或它们的组合。在一个示例性实施例中，通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述电子设备的供电方法。

第四方面，本公开在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由设备800的处理器820执行以完成上述电子设备的供电方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种音频处理方法，其特征在于，应用于音频录制设备，所述音频录制设备具有至少两个麦克风，所述方法包括：

2.根据权利要求1所述的音频处理方法，其特征在于，所述根据目标声源方向和每个麦克风的端射方向，分别对各个麦克风对应的低频信号进行正向滤波和反向滤波，包括：

3.根据权利要求2所述的音频处理方法，其特征在于，所述将目标麦克风对应的低频信号作为目标信号输入至空间滤波器，将其余麦克风对应的低频信号作为干扰信号输入至空间滤波器进行空间滤波，包括：

将所述目标麦克风对应的低频信号作为目标信号输入空间滤波器，根据其余麦克风中的各个所述麦克风与所述目标麦克风的距离，将各个所述麦克风对应的低频信号作为各级干扰信号输入所述空间滤波器进行空间滤波；和/或，

4.根据权利要求2所述的音频处理方法，其特征在于，所述根据所述正向滤波的结果和至少一个所述麦克风对应的高频信号确定有效信号，以及根据所述反向滤波的结果和至少一个所述麦克风对应的高频信号确定噪声信号，包括：

5.根据权利要求1所述的音频处理方法，其特征在于，还包括：

根据录音模式选择指令，确定目标声源方向。

6.根据权利要求1所述的音频处理方法，其特征在于，所述目标声源方向包括多个子方向；

7.根据权利要求6所述的音频处理方法，其特征在于，所述目标声源方向包括第一子方向和第二子方向，所述第一子方向和所述第二子方向相反。

8.根据权利要求1所述的音频处理方法，其特征在于，还包括：

根据相邻麦克风的距离，确定所述分频点；

9.一种音频处理装置，其特征在于，应用于音频录制设备，所述音频录制设备具有至少两个麦克风，所述装置包括：

10.根据权利要求9所述的音频处理装置，其特征在于，所述滤波模块用于根据目标声源方向和每个麦克风的端射方向，分别对各个麦克风对应的低频信号进行正向滤波和反向滤波时，具体用于：

11.根据权利要求10所述的音频处理装置，其特征在于，所述滤波模块用于将目标麦克风对应的低频信号作为目标信号输入至空间滤波器，将其余麦克风对应的低频信号作为干扰信号输入至空间滤波器进行空间滤波时，具体用于：

将所述目标麦克风所采集的原始音频信号作为目标信号输入空间滤波器、根据其余麦克风中的各个所述麦克风与所述目标麦克风的距离，将各个所述麦克风作为各级干扰信号输入所述空间滤波器进行空间滤波；和/或，

将所述远端麦克风所采集的原始音频信号作为目标信号输入所述空间滤波器，根据其余麦克风中的各个所述麦克风与所述远端麦克风的距离，将各个所述麦克风作为各级干扰信号输入所述空间滤波器进行空间滤波。

12.根据权利要求10所述的音频处理装置，其特征在于，所述滤波模块用于根据所述正向滤波的结果和至少一个所述麦克风对应的高频信号确定有效信号，以及根据所述反向滤波的结果和至少一个所述麦克风对应的高频信号确定噪声信号时，具体用于：

13.根据权利要求9所述的音频处理装置，其特征在于，还包括方向选择模块，用于：

根据录音模式选择指令，确定目标声源方向。

14.根据权利要求9所述的音频处理装置，其特征在于，所述目标声源方向包括多个子方向；

所述滤波模块具体用于：

所述噪声消除模块具体用于：

15.根据权利要求14所述的音频处理装置，其特征在于，所述目标声源方向包括第一子方向和第二子方向，所述第一子方向和所述第二子方向相反。

16.根据权利要求9所述的音频处理装置，其特征在于，还包括分频点确定模块，用于：

根据相邻麦克风的距离，确定所述分频点；

所述分频模块具体用于：

17.一种电子设备，其特征在于，所述电子设备包括存储器、处理器，所述存储器用于存储可在处理器上运行的计算机指令，所述处理器用于在执行所述计算机指令时基于权利要求1至8中任一项所述的音频处理方法。

18.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现权利要求1至8中任一项所述的方法。