CN113270106B

CN113270106B - 双麦克风的风噪声抑制方法、装置、设备及存储介质

Info

Publication number: CN113270106B
Application number: CN202110495914.XA
Authority: CN
Inventors: 王维; 王广新; 杨汉丹
Original assignee: Shenzhen Youjie Zhixin Technology Co ltd
Current assignee: Shenzhen Youjie Zhixin Technology Co ltd
Priority date: 2021-05-07
Filing date: 2021-05-07
Publication date: 2024-03-15
Anticipated expiration: 2041-05-07
Also published as: CN113270106A

Abstract

本申请涉及智能语音领域，揭示了双麦克风的风噪声抑制方法，包括：获取双麦克风分别接收当前语音后的时域信号，包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号；获取当前语音对应的语音活动检测信号、第一通道时域信号经过子带分解后的第一子带信号，以及第二通道时域信号经过子带分解后的第二子带信号；将语音活动检测信号、第一子带信号以及第二子带信号输入滤波器得到当前语音对应的噪音信号；第一子带信号和第二子带信号进行固定波束形成，得到当前语音对应的增强信号；通过增强信号以及噪音信号，估计当前语音对应的语音存在概率；根据语音存在概率对当前语音进行噪声抑制。先抵消掉目标语音显著提升噪声抑制效果。

Description

双麦克风的风噪声抑制方法、装置、设备及存储介质

技术领域

本申请涉及智能语音领域，特别是涉及到双麦克风的风噪声抑制方法、装置、设备及存储介质。

背景技术

随着技术的发展，智能语音更广范围地使用于各类型的智能设备中，但在语音交互中噪音的存在影响了语音交互效果，需要通过降风噪技术进行噪声抑制。现有的降风噪技术中，有基于单通道语音增强的方法进行噪音抑制，但是风噪声非平稳性强，难以通过单通道噪声估计的方法进行精准跟踪。现有基于复相干函数的方法多通道检测方式，虽然可比较精准地跟踪噪音，但是对低频目标语音的损伤较大，依然达不到语音交互的良好效果。基于掩码或谱映射增强的深度学习方法，噪音抑制效果较好，但是运算量大不利于小型智能设备的集成。综上，现有降噪技术不能解决小型智能设备上语音交互过程中的噪音抑制的问题。

发明内容

本申请的主要目的为提供双麦克风的风噪声抑制方法，旨在解决现有降噪技术不能解决小型智能设备上语音交互过程中的噪音抑制的技术问题。

本申请提出一种双麦克风的风噪声抑制方法，包括：

获取所述双麦克风分别接收当前语音后的时域信号，所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号；

根据所述时域信号获取所述当前语音对应的语音活动检测信号，获取所述第一通道时域信号经过子带分解后对应的第一子带信号，以及所述第二通道时域信号经过子带分解后对应的第二子带信号；

将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中，得到所述当前语音对应的噪音信号；

对所述第一子带信号和所述第二子带信号进行固定波束形成，得到所述当前语音对应的增强信号；

通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号，估计所述当前语音对应的语音存在概率；

根据所述语音存在概率对所述当前语音进行噪声抑制。

优选地，所述语音活动检测信号包括帧级别的第一语音活动检测信号，所述根据所述时域信号获取所述当前语音对应的语音活动检测信号的步骤，包括：

通过所述第一通道时域信号计算所述当前语音对应的谐波比；

将所述谐波比作为所述第一语音活动检测信号。

优选地，所述将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中，得到所述当前语音对应的噪音信号的步骤，包括：

将所述谐波比作为识别语音帧的概率，判断当前帧是否为语音帧，其中，所述当前帧为所述当前语音中的任意一帧；

通过第一公式控制所述滤波器的步长因子，若为语音帧则将所述步长因子增大至第一预设因子，若不为语音帧，则判定为非语音帧并将所述步长因子缩小至第二预设因子；

在所述第一预设因子下对所述语音帧中的各子带序列进行滤波，抵消掉语音数据，在所述第二预设因子下对所述非语音帧中的各子带序列进行滤波后，得到所述当前语音对应的第一噪音信号。

优选地，所述语音活动检测信号包括频点级别的第二语音活动检测信号，将所述谐波比作为所述第一语音活动检测信号的步骤之后，包括：

将所述第一语音活动检测信号、所述第一子带信号以及所述第二子带信号输入第一滤波器中，得到所述当前语音对应的第一噪音信号；

通过所述第一噪音信号和所述当前语音对应的增强信号，计算所述当前语音对应的子带信号中各子带序列分别对应的第一语音存在概率；

将所述第一语音存在概率作为所述第二语音活动检测信号。

根据所述第一语音存在概率确定指定子带序列对应的指定概率，其中，所述指定子带序列为所述当前语音对应的任意一子带序列；

将所述指定概率代入第二公式，得到所述滤波器对所述指定子带序列滤波时的指定步长因子；

在所述指定步长因子下对所述指定子带序列进行滤波；

按照所述指定子带序列的滤波过程，对所述当前语音对应的所有子带序列进行滤波，得到所述当前语音对应的第二噪音信号。

优选地，所述通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号，估计所述当前语音对应的语音存在概率的步骤，包括：

根据第三公式对所述当前语音对应的增强信号进行时间维度平滑得到第一平滑信号，根据所述第三公式对所述当前语音对应的噪音信号进行时间维度平滑得到第二平滑信号；

将所述第一平滑信号代入频域维度平滑的第四公式，得到增强信号的平滑信号，将所述第二平滑信号代入频域维度平滑的第四公式，得到噪音信号的平滑信号；

根据第五公式计算所述增强信号的平滑信号与所述噪音信号的平滑信号的能量比值；

根据所述能量比值计算得到所述当前语音对应的语音存在概率。

优选地，所述根据所述语音存在概率对所述当前语音进行噪声抑制的步骤，包括：

利用所述语音存在概率通过第六公式计算时变平滑系数；

通过所述时变平滑系数通过第七公式实时更新噪声谱；

利用更新后的噪声谱通过第八公式计算后验信噪比；

利用所述后验信噪比通过第九公式计算先验信噪比；

根据所述先验信噪比通过第十公式计算当前时刻条件增益；

根据所述当前时刻条件增益通过第十一公式计算当前滤波系数；

根据所述当前滤波系数对所述当前语音进行噪声抑制。

本申请还提供了一种一种双麦克风的风噪声抑制装置，包括：

第一获取模块，用于获取所述双麦克风分别接收当前语音后的时域信号，所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号；

第二获取模块，用于根据所述时域信号获取所述当前语音对应的语音活动检测信号，获取所述第一通道时域信号经过子带分解后对应的第一子带信号，以及所述第二通道时域信号经过子带分解后对应的第二子带信号；

输入模块，用于将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中，得到所述当前语音对应的噪音信号；

得到模块，用于对所述第一子带信号和所述第二子带信号进行固定波束形成，得到所述当前语音对应的增强信号；

估计模块，用于通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号，估计所述当前语音对应的语音存在概率；

抑制模块，用于根据所述语音存在概率对所述当前语音进行噪声抑制。

本申请还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。

本申请还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述的方法的步骤。

本申请通过双麦克风的风噪声抑制方法计算量小，适合部署于小型智能设备中，通过NLMS自适应滤波器先抵消掉目标语音，得到包含风噪在内的参考噪声后再进行后续的谱增强，由于先抵消掉了目标语音可以最大程度避免降噪过程中对目标语音的损伤，且能显著提升有语音段的风噪声的抑制效果。

附图说明

图1本申请一实施例的双麦克风的风噪声抑制方法流程示意图；

图2本申请一实施例的噪音抑制处理流程示意图；

图3本申请一实施例的双麦克风的风噪声抑制系统流程示意图；

图4本申请一实施例的计算机设备内部结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本申请一实施例的双麦克风的风噪声抑制方法，包括：

S1：获取所述双麦克风分别接收当前语音后的时域信号，所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号；

S2：根据所述时域信号获取所述当前语音对应的语音活动检测信号，获取所述第一通道时域信号经过子带分解后对应的第一子带信号，以及所述第二通道时域信号经过子带分解后对应的第二子带信号；

S3：将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中，得到所述当前语音对应的噪音信号；

S4：对所述第一子带信号和所述第二子带信号进行固定波束形成，得到所述当前语音对应的增强信号；

S5：通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号，估计所述当前语音对应的语音存在概率；

S6：根据所述语音存在概率对所述当前语音进行噪声抑制。

本申请通过双麦克风的双通道时域信号以及子带分解技术，识别目标语音，然后通过NLMS(Normalized Least Mean Square，归一化最小均方自适应滤波器)自适应滤波器先抵消掉目标语音，得到包含风噪在内的参考噪声，再进行后续的谱增强进行噪音抑制。通过先抵消掉目标语音可以最大程度避免降噪过程中对目标语音的损伤。

上述双麦克风分别对接收的语音进行傅里叶转换，得到当前语音的双通道时域信号分别为x₁(t)，x₂(t)。对上述两路时域信号使用分析滤波器进行子带分解，得到各通道时域信号分别对应的子带信号x₁(k,n)，x₂(k,n)，其中k,n分别为子带序号和帧序号，下述相同，不赘述。时域信号由多个时序排布的帧数据组成，每帧帧数据由多个时序排布的子带序列组成，上述子带序号和帧序号对应于语音生成的时序次序。

上述语音活动检测信号即对当前语音的时域信号进行VAD(Voice ActivityDetection，语音活动检测)检测后得到的数据信号，根据处理过程不同，得到的语音活动检测信号包括帧级别的语音活动检测信号和/或频点级别的语音活动检测信号。然后将语音活动检测信号、第一子带信号以及第二子带信号输入滤波器中，识别并抵消目标语音，得到包括风噪在内的参考噪音，即上述噪音信号U(k,n)。上述滤波器为NLMS滤波器。

上述固定波束形成，是将双通道子带信号x₁(k,n)，x₂(k,n)作固定波束形成得到增强信号，上述固定波束使用频域延时求和波束，也可以使用超指向MVDR(Minimum variancedistortionless response，最小方差无失真响应)，不作限定。双通道子带信号x₁(k,n)，x₂(k,n)作固定波束形成后输出得到增强信号Y_ref(k,n)。然后对噪音信号U(k,n)和增强信号Y_ref(k,n)，分别依次进行时间维度平滑和频域维度平滑后，计算平滑后增强信号Y_ref(k,n)和噪音信号U(k,n)的能量比值，进而根据能量比值估算语音存在概率，然后根据语音存在概率计算滤波系数，进行噪音抑制。

进一步地，所述语音活动检测信号包括帧级别的第一语音活动检测信号，所述根据所述时域信号获取所述当前语音对应的语音活动检测信号的步骤S2，包括：

S21：通过所述第一通道时域信号计算所述当前语音对应的谐波比；

S22：将所述谐波比作为所述第一语音活动检测信号。

本申请实施例通过对第一通道时域信号x₁(t)进行互相关计算，利用基音周期检测的方法得到谐波比P₀。利用谐波比P₀作为帧级别的VAD概率，作为识别语音帧的概率，即上述帧级别的第一语音活动检测信号。谐波比P₀为(0,1)之间的概率值，若为语音帧时，概率值接近1，若为非语音帧时，概率值接近0。本申请实施例通过谐波比P₀用来控制NLMS滤波器的步长因子，谐波比P₀为根据每帧音频计算得到的一个概率值，因此此时的NLMS滤波器对每帧音频中的所有子带序列均使用相同的步长因子u,但相邻帧音频之间使用不同的步长因子。

进一步地，所述将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中，得到所述当前语音对应的噪音信号的步骤S3，包括：

S31：将所述谐波比作为识别语音帧的概率，判断当前帧是否为语音帧，其中，所述当前帧为所述当前语音中的任意一帧；

S32：通过第一公式控制所述滤波器的步长因子，若为语音帧则将所述步长因子增大至第一预设因子，若不为语音帧，则判定为非语音帧并将所述步长因子缩小至第二预设因子；

S33：在所述第一预设因子下对所述语音帧中的各子带序列进行滤波，抵消掉语音数据，在所述第二预设因子下对所述非语音帧中的各子带序列进行滤波后，得到所述当前语音对应的第一噪音信号。

本申请实施例通过谐波比P₀控制NLMS滤波器的步长因子的过程如上所述。计算步长因子u的第一公式为：u＝P₀*u_max+(1-P₀)*u_min，其中u_max、u_min为预设步长门限，以保证滤波器稳定。在步长因子u的控制下，NLMS滤波器在有目标语音的时候进行大步长更新滤波，从而能有效抵消掉目标语音，在无目标语音的时候选择较小步长保留参考噪音，经过NLMS滤波器后输出抵消掉目标语音的第一噪声信号U₁(k,n)。本申请实施例中，可直接根据第一噪声信号U₁(k,n)和增强信号Y_ref(k,n)，分别依次进行时间维度平滑和频域维度平滑后，计算平滑后增强信号Y_ref(k,n)和噪音信号U₁(k,n)的能量比值，进而根据能量比值估算语音存在概率，然后根据语音存在概率计算滤波系数，进行噪音抑制。

进一步地，所述语音活动检测信号包括频点级别的第二语音活动检测信号，将所述谐波比作为所述第一语音活动检测信号的步骤S22之后，包括：

S23：将所述第一语音活动检测信号、所述第一子带信号以及所述第二子带信号输入第一滤波器中，得到所述当前语音对应的第一噪音信号；

S24：通过所述第一噪音信号和所述当前语音对应的增强信号，计算所述当前语音对应的子带信号中各子带序列分别对应的第一语音存在概率；

S25：将所述第一语音存在概率作为所述第二语音活动检测信号。

本申请实施例为提升噪音实时跟踪的效果，增强降噪效果，使用跟精细的频点级别的第二语音活动检测信号，控制滤波器的步长因子，使步长因子不仅跟随帧数据的不同而发生时间变化，且跟随帧内不同子带序列而发生时间变化，即步长因子的变化跟随声音信号发生更精细的跟踪，以便更好的抵消目标语音，保留风噪在内的参考噪音，使得在降噪过程中噪音抑制效果更佳，且更好的保护目标语音。

通过固定波束形成后输出增强信号Y_ref(k,n)，以及谐波比P₀控制下的第一滤波器输出的第一噪声信号U₁(k,n)，将Y_ref(k,n)和U₁(k,n)分别进行如下平滑处理，包括时间维度平滑，时间维度平滑对应的第三公式为然后再进行频域维度平滑，频域维度平滑对应的第四公式为/>其中h为汉明平滑窗,β为平滑系数，如本申请优选为0.95，ξ(k,n)表示模的平方，下标λ代表Y_ref(k,n)或者U₁(k,n),i表示位移单位。然后根据第五公式计算能量比值，第五公式为最后根据能量比值计算得到第一语音存在概率P₁(k,n)，或表示为P₁，计算过程过下：

其中，Λ_max(k,n)和Λ_min(k,n)为预设门限，可以根据风噪的频率范围在不同频段设置不同的参数，根据实验经验进行设置。

S301：根据所述第一语音存在概率确定指定子带序列对应的指定概率，其中，所述指定子带序列为所述当前语音对应的任意一子带序列；

S302：将所述指定概率代入第二公式，得到所述滤波器对所述指定子带序列滤波时的指定步长因子；

S303：在所述指定步长因子下对所述指定子带序列进行滤波；

S304：按照所述指定子带序列的滤波过程，对所述当前语音对应的所有子带序列进行滤波，得到所述当前语音对应的第二噪音信号。

本申请实施例通过两步迭代的方式通过两级滤波器串联滤波，先利用帧级别的VAD控制第一个复数NLMS滤波器对消一次目标语音，处理得到第一语音存在概率，再利用第一语音存在概率作为频点级别的VAD控制第二个复数NLMS滤波器再对消一次目标语音，最后再进行噪声谱的估计跟踪，得到更精确的第二语音存在概率，进而可以对强非平稳的风噪声进行快速准确的跟踪，从而保证了后续的噪音抑制效果。第二个复数NLMS滤波器中输入频点级别的第一语音存在概率P₁(k,n)后，利用第二公式u(k,n)＝P₁(k,n)*u_max1(k)+(1-P₁(k,n))*u_min1(k)，计算得到控制第二个复数NLMS滤波器对各个子带序列的步长因子u(k,n)，其中u_max1(k)和u_min1(k)为每个子带的步长因子门限。第二个复数NLMS滤波器输出第二噪声信号U₂(k,n)。

进一步地，所述通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号，估计所述当前语音对应的语音存在概率的步骤S5，包括：

S51：根据第三公式对所述当前语音对应的增强信号进行时间维度平滑得到第一平滑信号，根据所述第三公式对所述当前语音对应的噪音信号进行时间维度平滑得到第二平滑信号；

S52：将所述第一平滑信号代入频域维度平滑的第四公式，得到增强信号的平滑信号，将所述第二平滑信号代入频域维度平滑的第四公式，得到噪音信号的平滑信号；

S53：根据第五公式计算所述增强信号的平滑信号与所述噪音信号的平滑信号的能量比值；

S54：根据所述能量比值计算得到所述当前语音对应的语音存在概率。

本申请上述语音存在概率包括第一语音存在概率P₁(k,n)和计算第二语音存在概率P₂(k,n)，计算第一语音存在概率P₁(k,n)和计算第二语音存在概率P₂(k,n)的原理相同，区别仅在于使用不同的预设门限Λ_max(k,n)和Λ_min(k,n)，以及使用不同的平滑系数β，使估计得到更准确的第二语音存在概率P₂(k,n)，或表示为P₂。上述第三公式、第四公式以及第五公式的解释见上述第一语音存在概率P₁(k,n)计算过程，不赘述。

本申请实施例可直接通过频点级别的VAD对消目标语音，再进行噪声估计跟踪。但为提高噪声估计跟踪效果，本申请优选先利用帧级别的VAD控制第一个复数NLMS滤波器对消一次目标语音，处理得到第一语音存在概率，再以第一级语音存在概率作为频点级别的VAD，输入第二个复数NLMS滤波器再对消一次目标语音，得到更精准的第二语音存在概率，最后再根据第二语音存在概率进行噪声估计跟踪，进而可以对强非平稳的风噪声进行快速准确的跟踪，从而保证了后续的噪音抑制效果，噪音抑制处理流程示意图如图2所示。

进一步地，所述根据所述语音存在概率对所述当前语音进行噪声抑制的步骤S6，包括：

S61：利用所述语音存在概率通过第六公式计算时变平滑系数；

S62：通过所述时变平滑系数通过第七公式实时更新噪声谱；

S63：利用更新后的噪声谱通过第八公式计算后验信噪比；

S64：利用所述后验信噪比通过第九公式计算先验信噪比；

S65：根据所述先验信噪比通过第十公式计算当前时刻条件增益；

S66：根据所述当前时刻条件增益通过第十一公式计算当前滤波系数；

S67：根据所述当前滤波系数对所述当前语音进行噪声抑制。

本申请实施例利用第二语音存在概率P₂(k,n)和固定波束输出Y_ref(k,n)，估计得到最终的噪声谱。噪声谱估计过程具体如下：利用P₂(k,n)通过第六公式计算时变平滑系数第六公式为/>其中α_d为预设系数。接着利用时变平滑系数/>通过第七公式更新噪声谱λ_d(k,n)，第七公式为conj表示共轭操作。接着利用上一步估计得到的噪声谱，通过第八公式计算后验信噪比γ(k,n)，第八公式为/>然后利用所述后验信噪比通过第九公式计算先验信噪比ζ(k,n)，第九公式为ζ(k,n)＝α*G_H1 ²(k,n-1)*γ(k,n-1)+(1-α)*max(γ(λ,k)-1,0)，其中G_H1(k,n-1)为上一时刻频点k的条件增益系数，α为预设平滑参数。根据所述先验信噪比通过第十公式计算当前时刻条件增益G_H1，第十公式为/>然后根据所述当前时刻条件增益通过第十一公式计算当前滤波系数G(k,n)，第十一公式为/>其中G_min为权值下限，利用G(k,n)对Y_ref(k,n)进行滤波，即Y(k,n)＝G(k,n)*Y_ref(k,n)。最后将滤波后的子带信号Y_ref(k,n)通过综合滤波器组合得到时域单通道信号，得到恢复语音y。

参照图3，本申请一实施例的双麦克风的风噪声抑制装置，包括：

第一获取模块1，用于获取所述双麦克风分别接收当前语音后的时域信号，所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号；

第二获取模块2，用于根据所述时域信号获取所述当前语音对应的语音活动检测信号，获取所述第一通道时域信号经过子带分解后对应的第一子带信号，以及所述第二通道时域信号经过子带分解后对应的第二子带信号；

输入模块3，用于将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中，得到所述当前语音对应的噪音信号；

得到模块4，用于对所述第一子带信号和所述第二子带信号进行固定波束形成，得到所述当前语音对应的增强信号；

估计模块5，用于通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号，估计所述当前语音对应的语音存在概率；

抑制模块6，用于根据所述语音存在概率对所述当前语音进行噪声抑制。

本申请实施例的解释同上述方法的对应部分，不赘述。

进一步地，所述语音活动检测信号包括帧级别的第一语音活动检测信号，第二获取模块2，包括：

第一计算单元，用于通过所述第一通道时域信号计算所述当前语音对应的谐波比；

第一作为单元，用于将所述谐波比作为所述第一语音活动检测信号。

进一步地，输入模块3，包括：

判断单元，用于将所述谐波比作为识别语音帧的概率，判断当前帧是否为语音帧，其中，所述当前帧为所述当前语音中的任意一帧；

控制单元，用于通过第一公式控制所述滤波器的步长因子，若为语音帧则将所述步长因子增大至第一预设因子，若不为语音帧，则判定为非语音帧并将所述步长因子缩小至第二预设因子；

第一滤波单元，用于在所述第一预设因子下对所述语音帧中的各子带序列进行滤波，抵消掉语音数据，在所述第二预设因子下对所述非语音帧中的各子带序列进行滤波后，得到所述当前语音对应的第一噪音信号。

进一步地，所述语音活动检测信号包括频点级别的第二语音活动检测信号，第二获取模块2，包括：

输入单元，用于将所述第一语音活动检测信号、所述第一子带信号以及所述第二子带信号输入第一滤波器中，得到所述当前语音对应的第一噪音信号；

第二计算单元，用于通过所述第一噪音信号和所述当前语音对应的增强信号，计算所述当前语音对应的子带信号中各子带序列分别对应的第一语音存在概率；

第二作为单元，用于将所述第一语音存在概率作为所述第二语音活动检测信号。

进一步地，输入模块3，包括：

确定单元，用于根据所述第一语音存在概率确定指定子带序列对应的指定概率，其中，所述指定子带序列为所述当前语音对应的任意一子带序列；

第一代入单元，用于将所述指定概率代入第二公式，得到所述滤波器对所述指定子带序列滤波时的指定步长因子；

第二滤波单元，用于在所述指定步长因子下对所述指定子带序列进行滤波；

第三滤波单元，用于按照所述指定子带序列的滤波过程，对所述当前语音对应的所有子带序列进行滤波，得到所述当前语音对应的第二噪音信号。

进一步地，估计模块5，包括：

平滑单元，用于根据第三公式对所述当前语音对应的增强信号进行时间维度平滑得到第一平滑信号，根据所述第三公式对所述当前语音对应的噪音信号进行时间维度平滑得到第二平滑信号；

第二代入单元，用于将所述第一平滑信号代入频域维度平滑的第四公式，得到增强信号的平滑信号，将所述第二平滑信号代入频域维度平滑的第四公式，得到噪音信号的平滑信号；

第三计算单元，用于根据第五公式计算所述增强信号的平滑信号与所述噪音信号的平滑信号的能量比值；

第四计算单元，用于根据所述能量比值计算得到所述当前语音对应的语音存在概率。

进一步地，抑制模块6，包括：

第五计算单元，用于利用所述语音存在概率通过第六公式计算时变平滑系数；

更新单元，用于通过所述时变平滑系数通过第七公式实时更新噪声谱；

第六计算单元，用于利用更新后的噪声谱通过第八公式计算后验信噪比；

第七计算单元，用于利用所述后验信噪比通过第九公式计算先验信噪比；

第八计算单元，用于根据所述先验信噪比通过第十公式计算当前时刻条件增益；

第九计算单元，用于根据所述当前时刻条件增益通过第十一公式计算当前滤波系数；

抑制单元，用于根据所述当前滤波系数对所述当前语音进行噪声抑制。

参照图4，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储双麦克风的风噪声抑制过程需要的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现双麦克风的风噪声抑制方法。

上述处理器执行上述双麦克风的风噪声抑制方法，包括：获取所述双麦克风分别接收当前语音后的时域信号，所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号；根据所述时域信号获取所述当前语音对应的语音活动检测信号，获取所述第一通道时域信号经过子带分解后对应的第一子带信号，以及所述第二通道时域信号经过子带分解后对应的第二子带信号；将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中，得到所述当前语音对应的噪音信号；对所述第一子带信号和所述第二子带信号进行固定波束形成，得到所述当前语音对应的增强信号；通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号，估计所述当前语音对应的语音存在概率；根据所述语音存在概率对所述当前语音进行噪声抑制。

上述计算机设备，通过双麦克风的风噪声抑制方法计算量小，适合部署于小型智能设备中，通过NLMS自适应滤波器先抵消掉目标语音，得到包含风噪在内的参考噪声后再进行后续的谱增强，由于先抵消掉了目标语音可以最大程度避免降噪过程中对目标语音的损伤，且能显著提升有语音段的风噪声的抑制效果。

本领域技术人员可以理解，图4中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现双麦克风的风噪声抑制方法，包括：获取所述双麦克风分别接收当前语音后的时域信号，所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号；根据所述时域信号获取所述当前语音对应的语音活动检测信号，获取所述第一通道时域信号经过子带分解后对应的第一子带信号，以及所述第二通道时域信号经过子带分解后对应的第二子带信号；将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中，得到所述当前语音对应的噪音信号；对所述第一子带信号和所述第二子带信号进行固定波束形成，得到所述当前语音对应的增强信号；通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号，估计所述当前语音对应的语音存在概率；根据所述语音存在概率对所述当前语音进行噪声抑制。

上述计算机可读存储介质，通过双麦克风的风噪声抑制方法计算量小，适合部署于小型智能设备中，通过NLMS自适应滤波器先抵消掉目标语音，得到包含风噪在内的参考噪声后再进行后续的谱增强，由于先抵消掉了目标语音可以最大程度避免降噪过程中对目标语音的损伤，且能显著提升有语音段的风噪声的抑制效果。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，上述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种双麦克风的风噪声抑制方法，其特征在于，包括：

根据所述语音存在概率对所述当前语音进行噪声抑制；

所述语音活动检测信号包括帧级别的第一语音活动检测信号，所述根据所述时域信号获取所述当前语音对应的语音活动检测信号的步骤，包括：

将所述谐波比作为所述第一语音活动检测信号；

所述将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中，得到所述当前语音对应的噪音信号的步骤，包括：

在所述第一预设因子下对所述语音帧中的各子带序列进行滤波，抵消掉语音数据，在所述第二预设因子下对所述非语音帧中的各子带序列进行滤波后，得到所述当前语音对应的第一噪音信号；

所述语音活动检测信号包括频点级别的第二语音活动检测信号，将所述谐波比作为所述第一语音活动检测信号的步骤之后，包括：

将所述第一语音存在概率作为所述第二语音活动检测信号；

所述第一公式为u＝P₀*u_max+(1-P₀)*u_min，其中u为步长因子、P₀为谐波比、u_max和u_min为预设步长门限。

2.根据权利要求1所述的双麦克风的风噪声抑制方法，其特征在于，所述将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中，得到所述当前语音对应的噪音信号的步骤，包括：

在所述指定步长因子下对所述指定子带序列进行滤波；

按照所述指定子带序列的滤波过程，对所述当前语音对应的所有子带序列进行滤波，得到所述当前语音对应的第二噪音信号；

其中，所述第二公式为u(k,n)＝P₁(k,n)*u_max1(k)+(1-P₁(k,n))*u_min1(k)，u(k,n)为各个子带序列的步长因子，P₁(k,n)为第一语音存在概率，u_max1(k)和u_min1(k)为每个子带的步长因子门限。

3.根据权利要求2所述的双麦克风的风噪声抑制方法，其特征在于，所述通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号，估计所述当前语音对应的语音存在概率的步骤，包括：

根据所述能量比值计算得到所述当前语音对应的语音存在概率；

其中，所述第三公式为所述第四公式为所述第五公式为/> ξ(k,n)表示模的平方，h为汉明平滑窗，β为平滑系数，下标λ代表增强信号Y_ref(k,n)或者第一噪声信号U₁(k,n)，i表示位移单位。

4.根据权利要求1所述的双麦克风的风噪声抑制方法，其特征在于，所述根据所述语音存在概率对所述当前语音进行噪声抑制的步骤，包括：

利用所述语音存在概率通过第六公式计算时变平滑系数；

通过所述时变平滑系数通过第七公式实时更新噪声谱；

利用更新后的噪声谱通过第八公式计算后验信噪比；

利用所述后验信噪比通过第九公式计算先验信噪比；

根据所述先验信噪比通过第十公式计算当前时刻条件增益；

根据所述当前滤波系数对所述当前语音进行噪声抑制；

其中，所述第六公式为所述第七公式为所述第八公式为所述第九公式为ζ(k,n)＝α*G_H1 ²(k,n-1)*γ(k,n-1)+(1-α)*max(γ(λ,k)-1,0)，所述第十公式为/>所述第十一公式为/>P₂(k,n)为第二语音存在概率，α_d为预设系数，Y_ref(k,n)为增强信号，conj表示共轭操作，G_H1(k,n-1)为上一时刻频点k的条件增益系数，α为预设平滑参数，G_min为权值下限。

5.一种双麦克风的风噪声抑制装置，其特征在于，包括：

抑制模块，用于根据所述语音存在概率对所述当前语音进行噪声抑制；

所述语音活动检测信号包括帧级别的第一语音活动检测信号，所述第二获取模块，包括：

第一作为单元，用于将所述谐波比作为所述第一语音活动检测信号；

所述输入模块，包括：

第一滤波单元，用于在所述第一预设因子下对所述语音帧中的各子带序列进行滤波，抵消掉语音数据，在所述第二预设因子下对所述非语音帧中的各子带序列进行滤波后，得到所述当前语音对应的第一噪音信号；

所述语音活动检测信号包括频点级别的第二语音活动检测信号，所述第二获取模块，包括：

第二作为单元，用于将所述第一语音存在概率作为所述第二语音活动检测信号；

6.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。

7.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。