CN117409803A

CN117409803A - 风噪抑制方法、装置及存储介质

Info

Publication number: CN117409803A
Application number: CN202311499889.8A
Authority: CN
Inventors: 盛长浩; 张瑜聪; 宫云梅
Original assignee: Guangdong Qiyang Technology Co ltd
Current assignee: Guangdong Qiyang Technology Co ltd
Priority date: 2023-11-10
Filing date: 2023-11-10
Publication date: 2024-01-16

Abstract

本申请实施例提供一种风噪抑制方法、装置及存储介质，风噪抑制方法包括：获取音频输入信号，音频输入信号包括第一输入信号和第二输入信号；在音频输入信号存在风噪的情况下，根据第一频谱的功率谱与第二频谱的功率谱的比值以及音频输入信号的功率谱，确定噪声功率谱，其中，第一频谱为第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之间的频谱差，第二频谱为第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之间的频谱和；根据噪声功率谱和音频输入信号的频谱，确定音频输入信号的维纳滤波增益，并根据维纳滤波增益对音频输入信号进行风噪抑制。本申请实施例至少有利于提高通话质量和风噪抑制效果。

Description

风噪抑制方法、装置及存储介质

技术领域

本申请实施例涉及自动控制领域，特别涉及一种风噪抑制方法、装置及存储介质。

背景技术

随着通讯设备的发展，用户对当前的语音通讯设备例如手机，无线立体声耳机等在语音通过过程中的质量要求越来越高，当前常用的方式是在语音通讯设备中设置双麦克风进行收音以提高通话质量。

影响语音通讯设备通话质量的一个因素在于收音过程中的噪声，而风噪属于一种常见的典型噪声，在使用语音通讯设备进行通话的过程中，风噪会对语音通话的质量造成较大的干扰，特别是在风速较大的情况下，语音通讯设备的麦克风采集到的语音信号质量大打折扣，进而严重影响用户的通话体验。风噪与其他一些常见噪声不同的一点是它是由气流直接冲击麦克风形成的，因此，当前的处理方式通常是将风噪当成一种特殊的噪声单独进行检测和处理，但当前处理方式的风噪抑制效果不佳。

发明内容

本申请实施例提供一种风噪抑制方法、装置及存储介质，至少有利于提高对采集到的语音信号中风噪的抑制效果，提高语音通话的质量和用户体验。

根据本申请一些实施例，本申请实施例一方面提供一种风噪抑制方法，包括：获取音频输入信号，所述音频输入信号包括不同音频采集设备根据同一声源生成的第一输入信号和第二输入信号；在所述音频输入信号存在风噪的情况下，根据第一频谱的功率谱与第二频谱的功率谱的比值以及所述音频输入信号的功率谱，确定噪声功率谱，其中，所述第一频谱为所述第一输入信号的短时傅里叶变换频谱和所述第二输入信号的短时傅里叶变换频谱之间的频谱差，所述第二频谱为所述第一输入信号的短时傅里叶变换频谱和所述第二输入信号的短时傅里叶变换频谱之间的频谱和；根据所述噪声功率谱和所述音频输入信号的频谱，确定所述音频输入信号的维纳滤波增益，并根据所述维纳滤波增益对所述音频输入信号进行风噪抑制。

在一些实施例中，在所述确定噪声功率谱前，还包括：根据所述第一输入信号的短时傅里叶变换频谱和所述第二输入信号的短时傅里叶变换频谱，确定所述音频输入信号的频谱；根据所述音频输入信号的频谱，确定所述音频输入信号的功率谱。

在一些实施例中，所述根据所述音频输入信号的频谱，确定所述音频输入信号的功率谱包括：根据以下公式计算所述音频输入信号的功率谱

其中，k为频率索引，i为时间索引，α_d为第一平滑因子，为所述音频输入信号的频谱。

在一些实施例中，所述确定所述音频输入信号的频谱包括：对所述第一输入信号的短时傅里叶变换频谱和所述第二输入信号的短时傅里叶变换频谱进行加权合成，确定所述音频输入信号的频谱。

在一些实施例中，所述确定音频输入信号的频谱包括：通过以下公式确定所述音频输入信号的频谱

其中，k为频率索引，i为时间索引，Y₁(k,i)为所述第一输入信号的短时傅里叶变换频谱，Y₂(k,i)为所述第二输入信号的短时傅里叶变换频谱，λ(k,i)为所述第一输入信号频谱幅值与所述第二输入信号频谱幅值的比值。

在一些实施例中，所述确定所述噪声功率谱包括：通过以下公式计算确定所述噪声功率谱Φ_W(k,i)：

其中，k为频率索引，i为时间索引，PR(k,i)为所述第一频谱和所述第二频谱之间的功率谱之比，为所述音频输入信号的频谱。

在一些实施例中，所述根据所述噪声功率谱和所述音频输入信号的频谱，确定所述音频输入信号的维纳滤波增益，包括：通过以下公式计算所述维纳滤波增益H(k,i)：

其中，k为频率索引，i为时间索引，Φ_W(k,i)为所述噪声功率谱，为所述音频输入信号的频谱，α_snr为第二平滑因子。

在一些实施例中，在所述确定噪声功率谱后，还包括：根据所述音频输入信号的功率谱，确定所述音频输入信号功率谱的频谱质心；在所述频谱质心大于或等于第一预设门限的情况下，根据所述噪声功率谱和所述音频输入信号的频谱，确定所述维纳滤波增益，并根据所述维纳滤波增益对所述音频输入信号进行风噪抑制；在所述频谱质心小于所述第一预设门限的情况下，直接根据预设增益对所述音频输入信号进行风噪抑制。

在一些实施例中，所述根据所述音频输入信号的功率谱，确定所述音频输入信号的频谱质心包括：通过以下公式计算所述音频输入信号功率谱的频谱质心SSC(i)：

其中，k为频率索引，i为时间索引，f_s为信号的采样率，N_fft为短时傅里叶变换的窗长，k₃为质心频点的上限，为所述音频输入信号的功率谱。

在一些实施例中，在所述获取音频输入信号后，还包括：根据所述第一频谱的功率谱和所述第二频谱的功率谱，确定所述音频输入信号的功率差和比；在所述功率差和比大于或等于第二预设门限的情况下，判定所述音频输入信号存在风噪。

在一些实施例中，根据所述第一频谱的功率谱和所述第二频谱的功率谱，确定所述音频输入信号的功率差和比，包括：通过以下公式确定所述功率差和比

其中，k为频率索引，i为时间索引，k₁为频点下限，k₂为频点上限，PR(k,l)为所述第一频谱的功率谱和所述第二频谱的功率谱之比。

根据本申请一些实施例，本申请实施例另一方面还提供一种风噪抑制装置，包括用于执行前述任一项实施例所述的风噪抑制方法的模块。

根据本申请一些实施例，本申请实施例又一方面还提供一种计算机可读存储介质，计算机可读存储介质存储有指令，所述指令在由计算机执行时实现前述实施例中任一项所述的风噪抑制方法。

本申请实施例提供的技术方案至少具有以下优点：

本申请实施例提供的风噪抑制方法，在通过不同音频采集设备根据同一声源生成的第一输入信号和第二输入信号确定出音频输入信号后，检测到音频输入信号存在风噪的情况下，确定第一频谱与第二频谱的比值，即第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之间的频谱差对应的功率谱，与第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之间的频谱和对应的功率谱之间的比值，并根据第一频谱与第二频谱的比值和音频输入信号的功率谱，估算出音频输入信号中噪声对应的噪声功率谱，准确的实现对音频输入信号中风噪的估算；然后根据噪声功率谱以及音频输入信号的频谱，确定出音频输入信号的维纳滤波增益，使得风噪抑制采用的滤波增益能够与实际的风噪具有良好的对应性；基于维纳滤波增益对音频输入信号进行风噪抑制，有效抑制风噪对音频输入信号质量的干扰，显著提高音频输入信号的质量，进而提高语音通话质量和用户体验。

附图说明

一个或多个实施例通过与之对应的附图中的图片进行示例性说明，这些示例性说明并不构成对实施例的限定，除非有特别申明，附图中的图不构成比例限制。

图1为本申请一实施例提供的一种风噪抑制方法的流程图；

图2为本申请一实施例提供的另一种风噪抑制方法的流程示意图；

图3为本申请一实施例提供的一种带噪语音的原始波形图；

图4为本申请一实施例提供的一种降噪后的带噪语音波形图；

图5为本申请另一实施例提供的一种风噪抑制装置的结构示意图。

具体实施方式

由背景技术可知，当前的语音通话质量受风噪影响较大，风噪抑制效果有待提升。

本申请实施例提供一种风噪抑制方法，在通过不同音频采集设备根据同一声源生成的第一输入信号和第二输入信号确定出音频输入信号后，检测到音频输入信号存在风噪的情况下，确定第一频谱与第二频谱的比值，即第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之间的频谱差对应的功率谱，与第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之间的频谱和对应的功率谱之间的比值，并根据第一频谱与第二频谱的比值和音频输入信号的功率谱，估算出音频输入信号中噪声对应的噪声功率谱，准确的实现对音频输入信号中风噪的估算；然后根据噪声功率谱以及音频输入信号的频谱，确定出音频输入信号的维纳滤波增益，使得风噪抑制采用的滤波增益能够与实际的风噪具有良好的对应性；基于维纳滤波增益对音频输入信号进行风噪抑制，有效抑制风噪对音频输入信号质量的干扰，显著提高音频输入信号的质量，进而提高语音通话质量和用户体验。

下面将结合附图对本申请的各实施例进行详细的阐述。然而，本领域的普通技术人员可以理解，在本申请各实施例中，为了使读者更好地理解本申请而提出了许多技术细节。但是，即使没有这些技术细节和基于以下各实施例的种种变化和修改，也可以实现本申请所要求保护的技术方案。

参考图1，图1为一种风噪抑制方法的流程图，本申请一实施例提供了一种风噪抑制方法，可以应用在多种语音通信设备或者录音设备中，例如，手机、蓝牙耳机、无线立体声耳机或者录音机等，本申请实施例以应用在手机为例进行说明，风噪抑制方法至少包括如下步骤：

步骤S10：获取音频输入信号，音频输入信号包括不同音频采集设备根据同一声源生成的第一输入信号和第二输入信号。

手机通常具有两个麦克风，即设置有两个音频采集设备，用户在使用手机进行语音通话的过程中，两个麦克风会分别对用户的语音进行采集，使得手机可以通过不同的麦克风在同一时间段分别根据接收到的用户语音生成不同的音频信号。例如，手机具有两个音频采集设备麦克风A和麦克风B，用户使用手机进行通话的过程中，麦克风A和麦克风B可以分别以用户语音作为声源，将用户语音将换为语音信号，麦克风A生成第一输入信号，麦克风B生成第二输入信号。麦克风A和麦克风B在根据用户语音生成第一输入信号和第二输入信号后，可以将获取第一输入信号和第二输入信号上传到手机内部的音频信号处理模块中，使得音频信号处理模块获取到音频输入信号。

可以理解的是，音频采集设备还可以是话筒或者声卡等其他通过振动对语音具有收集和处理能力的设备，本申请实施例以麦克风为例进行说明。音频采集设备通常是按照一定的时长对用户语音进行切分，生成若干个语音切片进行音频信号的生成和上传，因此，音频输入信号可以是根据一个语音切片中的语音信号生成的。

步骤S20，在音频输入信号存在风噪的情况下，根据第一频谱的功率谱与第二频谱的功率谱的比值以及音频输入信号的功率谱，确定风噪功率谱。

手机内部的音频信号处理模块在获取到音频输入信号后，对音频输入信号是否存在风噪进行检测，例如，可以通过预设算法对第一输入信号和第二输入信号进行相关性检测，由于第一输入信号和第二输入信号为不同麦克风根据同一段语音产生的不同音频信号，因此，可以逐帧计算第一输入信号和第二输入信号的幅度相关系数，并根据幅度相关系数判断是否存在风噪。

在检测到音频输入信号存在风噪的情况下，音频信号处理模块根据音频输入信号的功率谱以及第一频谱和第二频谱的功率谱比值，对音频输入信号中的噪声进行功率估计，确定噪声对应的噪声功率谱。其中，第一频谱为第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之间的频谱差，第二频谱为第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之间的频谱和。

也就是说，音频信号处理模块基于计算出的音频输入信号的功率谱，以及第一输入信号和第二输入信号的频谱差对应的功率谱，与第一输入信号和第二输入信号的频谱和对应的功率谱之间的比值，对音频输入信号进行噪声估计，确定噪声功率谱。利用音频输入信号的功率谱，与第一输入信号和第二输入信号频谱差对应的功率谱和第一输入信号和第二输入信号频谱和对应的功率谱各频点的比值，准确的对音频输入信号进行噪声估计，有利于后续准确的对音频输入信号进行噪声抑制。

在一些实施例中，在确定噪声功率谱前，根据第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱，确定音频输入信号的频谱；根据音频输入信号的频谱，确定音频输入信号的功率谱。

手机的音频信号处理模块获取到的音频输入信号包括第一输入信号和第二输入信号，在进行信号上行的过程中，上行传输到通信网络的信号只有一路音频信号，因此，音频信号处理模块可以先根据第一输入信号和第二输入信号，确定出上行传输的音频输入信号的频谱，并根据确定出的音频输入信号的频谱，计算出音频输入信号的功率谱。

在确定上行传输的音频输入信号的频谱时，可以先分别对第一输入信号和第二输入信号进行短时傅里叶变换，得到第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱。确定上行传输的音频输入信号的频谱时，可以根据预先设置的主麦克风标识，直接将第一输入信号的短时傅里叶变换频谱和第二输入信号的傅里叶变换频谱中的一个作为上行传输的音频输入信号的频谱，例如，麦克风A为主麦克风，则可以直接将第一输入信号的短时傅里叶变换频谱作为上行传输的音频输入信号的频谱。在确定出频谱后，根据上行传输的音频输入信号的频谱进行功率谱计算，确定与频谱对应的功率谱，并将确定出的功率谱作为音频输入信号的功率谱。

在一些实施例中，确定音频输入信号的频谱包括：对第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱进行加权合成，确定音频输入信号的频谱。

在进行上行传输的音频输入信号的频谱计算的时候，不仅可以直接将麦克风A和麦克风B中一者产生的音频信号的频谱作为音频输入信号的频谱，还可以结合第一输入信号和第二输入信号进行音频输入信号的频谱计算。

先对第一输入信号和第二输入信号分别进行短时傅里叶变换，分别确定出第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱。然后根据麦克风A和麦克风B的主从关系或者预先为每个麦克风设置的信号上传通路，为第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱分别添加对应的加权系数或者计算公式，然后对添加加权系数后的两个频谱进行合成，将合成出的新的频谱作为上行传输过程中的音频输入信号的频谱。

此外，对第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱进行加权合成时，还可以分别计算出第一输入信号的功率谱和第二输入信号的功率谱，以及第一输入信号和第二输入信号的互功率谱。然后将确定出的互功率谱的平方，与第一输入信号功率谱和第二输入信号功率谱之和的平方的比值，作为频谱合成增益。并将频谱合成增益与任一输入信号频谱之间的乘积作为输入信号的频谱。

通过对第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱进行加权合成，准确的确定出上行传输过程中的音频输入信号的频谱，利用两个不同信号的加权合成，可以对音频输入信号中的风噪和其他噪声进行部分抵消，从而实现对音频输入信号的初步降噪，获取到质量较高的音频输入信号的频谱，便于后续进一步进行风噪抑制。

在一些实施例中，确定音频输入信号的频谱包括：通过以下公式确定音频输入信号的频谱

其中，k为频率索引，i为时间索引，Y₁(k,i)为第一输入信号的短时傅里叶变换频谱的第k个频点，Y₂(k,i)为第二输入信号的短时傅里叶变换频谱的第k个频点，λ(k,i)为第一输入信号频谱幅值与第二输入信号频谱幅值的比值。

通过音频处理模块确定上行传输的音频输入信号的频谱时，在分别计算出第一输入信号的短时傅里叶变换频谱Y₁和第二输入信号的短时傅里叶变换频谱Y₂后，可以根据两个信号频谱各频点幅值的比值，即各频点绝对值的比值，确定出两个信号各频点之间的偏差系数λ(k,i)，然后结合两个信号各频点的具体偏差大小，在第二输入信号的短时傅里叶变换频谱的基础上，通过上述公式对第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱进行逐频点的合成。

通过根据第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之间的偏差，以第二输入信号的短时傅里叶变换频谱为基础，通过加权求和的方式，逐频点的对第二输入信号的短时傅里叶变换频谱进行修正，大大提高了上行传输过程中的音频输入信号的频谱质量。同时，采用上述公式进行频谱计算的过程中，相当于基于第一输入信号和第二输入信号的相关性，对音频输入信号的频谱进行一次初步风噪抑制，有效的降低了音频输入信号频谱中的风噪分量，此外，结合后续的噪声抑制处理使得风噪抑制由两步抑制构成，大大提升了风噪抑制的效果，有利于提高语音通话的质量和用户体验。

此外，本申请实施例是以第二输入信号的短时傅里叶变换频谱为基础进行频谱合成，在具体的应用中，也可以以第一输入信号的短时傅里叶变换频谱为基础进行频谱合成，只需将第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱在公式中的位置对调。在频谱合成的过程中，还可以在频谱合成结果的接触上，进一步对频谱进行调整，例如，将设置为/>其中，n为常数。

在一些实施例中，根据音频输入信号的频谱，确定音频输入信号的功率谱包括：根据以下公式计算音频输入信号的功率谱

其中，k为频率索引，i为时间索引，α_d为第一平滑因子，为音频输入信号的频谱。

在进行音频输入信号的功率谱计算的过程中，可以根据音频输入信号的频谱/>逐频点的进行计算，这里音频输入信号的频谱/>可以是第一输入信号的短时傅里叶变换频谱、第二输入信号的短时傅里叶变换频谱或者根据第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱合成的频谱。

在逐频点进行功率谱计算的过程中，可以直接计算出音频输入信号的频谱中每个频点绝对值的平方，从而得到音频输入信号的功率谱。也可以采用上述公式利用平滑因子α_d进行功率谱中各频点的计算。即，根据平滑因子α_d，对频点上一时间索引绝对值的平方和频点当前时间索引绝对值的平方进行加权求和，其中，α_d的取值范围处于0至1的范围内。通过采用上述公式进行功率谱的计算后，生成的音频输入信号的功率谱中各频点之间较为平滑，大大降低了功率谱中相邻频点之间出现突变的概率，便于后续有效抑制风噪，同时降低风噪抑制对上行传输的音频信号中非噪声信号质量的影响。

在一些实施例中，确定噪声功率谱包括：通过以下公式计算确定噪声功率谱Φ_w(k,i)：

其中，k为频率索引，i为时间索引，PR(k,i)为所述第一频谱和所述第二频谱之间的功率谱之比，为音频输入信号的频谱。

在进行噪声噪声功率谱Φ_W(k,i)计算的过程中，可以将第一频谱对应的功率谱和第二频谱对应的功率谱之间的比值作为噪声功率估算系数，然后结合音频输入信号的功率谱逐频点进行噪声功率谱的计算，其中，音频输入信号的功率谱可以利用音频输入信号的频谱中，各频点绝对值的平方进行表征。利用第一频谱和第二频谱各自对应的功率谱之间的比值估算噪声功率的过程中，由于第一频谱和第二频谱分别为第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱通过做差和求和得到，因此，相当于将第一输入信号和第二输入信号之间的偏差做了放大处理，降低了误差被遗漏的概率，大大提高了噪声估计的准确性。

此外，在进行噪声噪声功率谱Φ_W(k,i)计算的过程中，还可以直接利用第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之比，或者，利用第一输入信号的短时傅里叶变换频谱对应的功率谱，和第二输入信号的短时傅里叶变换频谱对应的功率谱之比作为噪声功率谱的估算系数，然后根据音频输入信号的功率谱，逐频点进行噪声功率谱的计算。音频输入信号的功率谱也可以是通过前面提到的结合第一平滑因子计算出的功率谱。

在一些实施例中，在获取音频输入信号后，还包括：根据第一频谱的功率谱和第二频谱的功率谱，确定音频输入信号的功率差和比；在功率差和比大于或等于第二预设门限的情况下，判定音频输入信号存在风噪。

在进行音频输入信号中是否存在风噪的判断过程中，不仅可以通过相关性计算的方式进行检测，还可以先对第一输入信号和第二输入信号分别做短时傅里叶变换，得到第一输入信号的频谱和第二输入信号的频谱。然后将第一输入信号的频谱和第二输入信号的频谱做差得到第一频谱，将第一输入信号的频谱和第二输入信号的频谱求和得到第二频谱。

然后分别计算出第一频谱对应的功率谱和第二频谱对应的功率谱，功率谱的可以是直接对频谱中各频点的绝对值进行求平方处理得到，也可以是参考以下公式进行处理得到：

Φ_D(k,i)＝α_sΦ_D(k,i-1)+(1-α_s)|D(k,i)|²

Φ_S(k,i)＝α_sΦ_S(k,i-1)+(1-α_s)|S(k,i)|²

其中，k为频率索引，i为时间索引，D(k,i)为第一频谱，S(k,i)为第二频谱，α_s为功率平滑因子，Φ_D(k,i)为第一频谱对应的功率谱，Φ_S(k,i)为第二频谱对应的功率谱。采用上述公式进行功率谱计算，有利于降低功率谱中相邻频点之间的突变，便于后续分析和噪声抑制。

由于第一频谱为第一输入信号和第二输入信号进行频谱做差得到，第二频谱为第一输入信号和第二输入信号进行频谱求和得到，因此，第一频谱对应的功率谱和第二频谱对应的功率谱之间的比值可以看作是音频输入信号的功率差和比。因此，在计算出第一频谱和第二频谱各自对应的功率谱后，将两者逐频点计算比值，即可获取到音频输入信号各频点的功率差和比。

风噪对音频输入信号足够大的情况下，会使得音频输入信号各频点的功率差和比具有较大的差值，因此，在获取音频输入信号各频点的功率差和比后，在音频输入信号中存在至少一个功率差和比大于或等于第二预设门限的频点，或者音频输入信号各频点的平均功率差和比大于或等于第二预设门限的情况下，可以判定音频输入信号中存在风噪。其中，第二预设门限可以根据语音通信设备或者录音设备的应用场景中风速的常见范围进行设置。

通过根据功率差和比和第二预设门限之间的大小关系，准确的对音频输入信号中是否存在风噪进行判断，提高风噪检测的准确性。

在一些实施例中，根据第一频谱的功率谱和第二频谱的功率谱，确定音频输入信号的功率差和比，包括：通过以下公式确定所述功率差和比

其中，k为频率索引，i为时间索引，k₁为频点下限，k₂为频点上限，PR(k,i)为第一频谱的功率谱和第二频谱的功率谱之比。

在进行功率差和比计算的过程中，可以通过上述公式计算若干个频点的平均功率差和比，并将计算出的平均功率差和比作为音频输入信号的功率差和比。通过获取多个频点的平均功率差和比进行风噪检测，避免了音频输入信号中由于个别或者少数频点的偶发性突变导致风噪检测的误判，进一步提高风噪检测的准确性。

此外，求取平均功率差和比的过程中，通过k₁对参与平均功率差和比计算的频点的下限进行限制，通过k₂对参与平均功率差和比计算的频点的上限进行限制，使得平均功率差和比可以根据特定区间内的若干个频点进行计算。例如，在风速较小的情况下，风噪的频率也较低，可以通过对k₁和k₂的设置，选取功率谱中频点排序靠前的半数频点或三分之一频点进行平均功率差和比的计算。反之，在风速较大的情况下，可以选取功率谱中频点排序靠后的半数频点或三分之一频点进行平均功率差和比的计算。

通过利用频点上限和频点下限对参与平均功率差和比的频点进行筛选，使得平均功率差和比计算选用的频点和风噪特征更为贴合，进一步提高利用功率差和比进行风噪判断的准确性。

步骤S30，根据噪声功率谱和音频输入信号的频谱，确定音频输入信号的维纳滤波增益，并根据维纳滤波增益对音频输入信号进行风噪抑制。

手机中的音频信号处理模块在确定出音频输入信号的噪声功率谱后，可以结合音频输入信号的频谱以及噪声功率谱，对音频输入信号进行维纳滤波增益的计算，然后将计算出的维纳滤波增益与音频输入信号的频谱的频率点乘结果作为音频输入信号最终的频谱，从而利用维纳滤波增益实现对音频输入信号的风噪抑制。然后对音频输入信号最终的频谱进行短时傅里叶反变换，得到最终上行输出的音频信号。通过计算维纳滤波增益对音频输入信号进行风噪抑制，提升风噪抑制的效果，进而提高用户语音通话的质量和用户体验。

在一些实施例中，根据噪声功率谱和音频输入信号的频谱，确定音频输入信号的维纳滤波增益，包括：通过以下公式计算维纳滤波增益H(k,i)：

其中，k为频率索引，i为时间索引，Φ_W(k,i)为噪声功率谱，为音频输入信号的频谱，α_snr为第二平滑因子。

在进行维纳滤波增益计算的过程中，可以直接根据上述公式进行维纳滤波增益的计算，利用第二平滑因子，使得计算出的各频点的维纳滤波增益由频点前一时间索引的增益值与当前时间索引下，噪声功率谱与音频输入信号频谱绝对值平方比值的关系计算得到，使得各频点的维纳滤波增益尽可能平滑，从而提高风噪抑制后的音频信号质量。

此外，在进行维纳率滤波增益计算的过程中，还可以根据以下公式计算得到的维纳滤波增益H(k,i)：

其中，，k为频率索引，i为时间索引，Φ_W(k,i)为噪声功率谱，为音频输入信号的频谱，α_snr为第二平滑因子，x为自然数，b为常数。

b的取值越大，计算出的滤波增益的噪声抑制强度越强，x的取值会影响计算出的维纳滤波增益的类型，例如，在x的取值为0.5的情况下，计算出的滤波增益为平方根维纳滤波增益。

在计算出维纳滤波增益后，可以通过以下公式计算出音频输入信号最终的频域输出

其中，k为频率索引，i为时间索引，H(k,i)为维纳滤波增益，为音频输入信号的频谱。然后通过短时傅里叶反变换得到最终上行输出的音频信号。

在一些实施例中，在确定噪声功率谱后，还包括：根据音频输入信号的功率谱，确定音频输入信号功率谱的频谱质心；在频谱质心大于或等于第一预设门限的情况下，根据噪声功率谱和音频输入信号的频谱，确定维纳滤波增益，并根据维纳滤波增益对音频输入信号进行风噪抑制；在频谱质心小于第一预设门限的情况下，直接根据预设增益对音频输入信号进行风噪抑制。

用户在通过手机进行语音通话的过程中，通常会是间断式的发言，也就是说，在部分时间内用户并未讲话，在用户未讲话的时间内，麦克风仍然会对周边的声音进行采集和输出，在风噪存在且用户未讲话的情况下，上传的音频信号为纯噪声，会对用户的通话质量造成较大的影响。

因此，在获取音频输入信号的功率谱后，对音频输入信号功率谱的频谱质心进行计算，在计算出音频输入信号功率谱的频谱质心后，对频谱质心和第一预设门限之间的大小关系进行比较，在频谱质心大于或等于第一预设门限的情况下，可以判定音频输入信号对应的语音为纯风噪；在频谱质心小于第一预设门限的情况下，可以判定音频输入信号对应的语音为带风噪语音。在音频输入信号对应的语音为纯风噪的情况下，可以直接将音频输入信号的频谱与预设增益点乘的结果作为频谱输出，然后通过短时傅里叶反变换生成上行的音频信号。在啊音频输入信号对应的语音为带风噪语音的情况下，对音频输入信号进行维纳滤波增益的计算，然后将计算出的维纳滤波增益与音频输入信号的频谱的频率点乘结果作为音频输入信号最终的频谱，并通过短时傅里叶反变换生成上行的音频信号。

通过对音频输入信号进行功率谱的频谱质心计算，根据频谱质心与第一预设门限的关系，对音频输入信号对应的语音是否为纯风噪进行识别，并直接利用预设增益对纯风噪进行抑制，大大提高了对风噪的抑制力度，同时避免了为纯风噪的语音进行维纳滤波带来的工作量，提高了语音通话过程中的风噪抑制效率。

在一些实施例中，根据音频输入信号的功率谱，确定音频输入信号的频谱质心包括：通过以下公式计算音频输入信号功率谱的频谱质心SSC(i)：

其中，k为频率索引，i为时间索引，f_s为信号的采样率，N_fft为短时傅里叶变换的窗长，k₃为质心频点的上限，为音频输入信号的功率谱。

在进行频谱质心的计算过程中，可以遍历音频输入信号功率谱各频点进行计算，从而将音频输入信号各频点的信息都纳入质心计算，避免信息遗漏。此外，参考上述针对风噪的描述和分析，常见的风噪对应的风速通常处于较小的范围内，因此，风噪对应的频率也会处于一个较小的范围内。也就是说，风噪信息主要包含在功率谱中考前的若干频点中，对应频率较高的频点中风噪信息很少甚至不存在。

在采用上述公式计算音频输入信号功率谱的频谱质心SSC(i)的过程中，由于在计算的过程中限定了频点上限k₃，在频点上限k₃为功率谱频点上限外的任一频点的情况下，可以减少频谱质心计算过程中的计算量，从而提高频谱质心计算的效率。另外，频点上限k₃可以根据当前应用场景中风噪对应的常见风速进行设置，使得计算过程中利用的各频点能够与风噪频率相贴合，进而提高根据频谱质心进行音频输入信号是否为存风噪判断的准确性。

参考图2，图2为一种风噪抑制的具体流程图，在获取到双麦克风采集到的音频信号后，先对音频信号进行短时傅里叶变换，得到音频信号的频谱。然后对两路音频信号的频谱进行求和以及做差，得到差信号谱与和信号谱，并计算出差信号谱对应的功率谱与和信号谱对应的功率谱之间的比值作为音频信号的功率谱差和比，并根据功率谱差和比进行是否存在风噪的检测。在不存在风噪的情况下，直接对音频信号的频谱进行短时傅里叶反变换后进行上行输出，在存在风噪的情况下，对两路音频信号的频谱进行加权求和，通过相关性运算初步降噪。

然后基于初步降噪后得到的音频输入信号频谱，对音频输入信号进行功率谱和功率谱频谱质心的计算，并根据功率谱频谱质心对音频输入信号对应的语音是否为纯风噪进行检测。在语音为纯风噪的情况下，将预设增益在频域与音频输入信号的频谱点乘进行降噪，并在经过短时傅里叶反变换后上行输出。在语音不是纯风噪的情况下，利用功率谱差和比和音频输入信号的功率谱进行风噪估算，得到噪声功率谱，然后结合噪声功率谱对音频输入信号的频谱进行维纳滤波降噪，然后经短时傅里叶反变换后上行输出。参考图3和图4，在风速为风速2m/s至6m/s的情况下，图3为带噪语音信号的原始波形图，图4为降噪后的带噪语音波形图。

需要理解的是，为了便于理解，上述部分实施例针对的是某一步骤或者某些步骤进行的详细说明，然后上述各实施例在不存在技术冲突的基础上，也可以相互配合实施，具体的结合方式在此就不再赘述。

综上，本申请实施例提供的风噪抑制方法，在通过不同音频采集设备根据同一声源生成的第一输入信号和第二输入信号确定出音频输入信号后，检测到音频输入信号存在风噪的情况下，确定第一频谱与第二频谱的比值，即第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之间的频谱差对应的功率谱，与第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之间的频谱和对应的功率谱之间的比值，并根据第一频谱与第二频谱的比值和音频输入信号的功率谱，估算出音频输入信号中噪声对应的噪声功率谱，准确的实现对音频输入信号中风噪的估算；然后根据噪声功率谱以及音频输入信号的频谱，确定出音频输入信号的维纳滤波增益，使得风噪抑制采用的滤波增益能够与实际的风噪具有良好的对应性；基于维纳滤波增益对音频输入信号进行风噪抑制，有效抑制风噪对音频输入信号质量的干扰，显著提高音频输入信号的质量，进而提高语音通话质量和用户体验。

相应的，参考图5，图5为一种风噪抑制装置的结构示意图。本申请另一实施例还提供一种风噪抑制装置，本申请另一实施例提供的风噪抑制装置包括可执行前述任一实施例提供的风噪抑制方法的模块。以下将结合附图对本申请另一实施例提供的风噪抑制装置进行详细说明，与前一实施例相同或者相应的部分，可参考前述实施例的相应说明，以下将不做详细赘述。

风噪抑制装置包括：获取模块501、确定模块502和处理模块503。

获取模块501，用于获取音频输入信号，音频输入信号包括不同音频采集设备根据同一声源生成的第一输入信号和第二输入信号。

确定模块502，用于在音频输入信号存在风噪的情况下，根据第一频谱的功率谱与第二频谱的功率谱的比值以及音频输入信号的功率谱，确定噪声功率谱，其中，第一频谱为第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之间的频谱差，第二频谱为第一输入信号的短时傅里叶变换频谱和第二输入信号的短时傅里叶变换频谱之间的频谱和。

处理模块503，用于根据噪声功率谱和音频输入信号的频谱，确定音频输入信号的维纳滤波增益，并根据维纳滤波增益对音频输入信号进行风噪抑制。

不难发现，本实施例为与风噪抑制方法实施例相对应的装置实施例，本实施例可与风噪抑制方法实施例互相配合实施。风噪抑制方法实施例中提到的相关技术细节在本实施例中依然有效，为了减少重复，这里不再赘述。相应的，本实施例中提到的相关技术细节也可应用在风噪抑制方法实施例中。

值得一提的是，本实施方式中所涉及到的各模块均为逻辑模块，在实际应用中，一个逻辑单元可以是一个物理单元，也可以是一个物理单元的一部分，还可以以多个物理单元的组合实现。此外，为了突出本发明的创新部分，本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入，但这并不表明本实施方式中不存在其它的单元。

相应的，本申请实施例还提供一种计算机可读存储介质，计算机可读存储介质存储有指令。指令在由计算机执行时实现上述实施例提供的风噪抑制方法。

本领域技术人员可以理解，实现上述实施例方法中全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序存储在存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-On ly Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。

本领域的普通技术人员可以理解，上述各实施方式是实现本申请的具体实施例，而在实际应用中，可以在形式上和细节上对其作各种改变，而不偏离本申请的精神和范围。任何本领域技术人员，在不脱离本申请的精神和范围内，均可作各种改动与修改，因此本申请的保护范围应当以权利要求限定的范围为准。

Claims

1.一种风噪抑制方法，其特征在于，包括：

获取音频输入信号，所述音频输入信号包括不同音频采集设备根据同一声源生成的第一输入信号和第二输入信号；

在所述音频输入信号存在风噪的情况下，根据第一频谱的功率谱与第二频谱的功率谱的比值以及所述音频输入信号的功率谱，确定噪声功率谱，其中，所述第一频谱为所述第一输入信号的短时傅里叶变换频谱和所述第二输入信号的短时傅里叶变换频谱之间的频谱差，所述第二频谱为所述第一输入信号的短时傅里叶变换频谱和所述第二输入信号的短时傅里叶变换频谱之间的频谱和；

根据所述噪声功率谱和所述音频输入信号的频谱，确定所述音频输入信号的维纳滤波增益，并根据所述维纳滤波增益对所述音频输入信号进行风噪抑制。

2.根据权利要求1所述的风噪抑制方法，其特征在于，在所述确定噪声功率谱前，还包括：

根据所述第一输入信号的短时傅里叶变换频谱和所述第二输入信号的短时傅里叶变换频谱，确定所述音频输入信号的频谱；

根据所述音频输入信号的频谱，确定所述音频输入信号的功率谱。

3.根据权利要求2所述的风噪抑制方法，其特征在于，所述根据所述音频输入信号的频谱，确定所述音频输入信号的功率谱包括：根据以下公式计算所述音频输入信号的功率谱

4.根据权利要求2所述的风噪抑制方法，没其特征在于，所述确定所述音频输入信号的频谱包括：

对所述第一输入信号的短时傅里叶变换频谱和所述第二输入信号的短时傅里叶变换频谱进行加权合成，确定所述音频输入信号的频谱。

5.根据权利要求4所述的风噪抑制方法，其特征在于，所述确定音频输入信号的频谱包括：通过以下公式确定所述音频输入信号的频谱

6.根据权利要求1所述的风噪抑制方法，其特征在于，所述确定所述噪声功率谱包括：通过以下公式计算确定所述噪声功率谱Φ_W(k,i)：

其中，k为频率索引，i为时间索引，PR(k,i)为所述第一频谱和所述第二频谱之间的功率谱之比，为所述音频输入信号频谱。

7.根据权利要求1所述的风噪抑制方法，其特征在于，所述根据所述噪声功率谱和所述音频输入信号的频谱，确定所述音频输入信号的维纳滤波增益，包括：通过以下公式计算所述维纳滤波增益H(k,i)：

8.根据权利要求1所述的风噪抑制方法，其特征在于，在所述确定噪声功率谱后，还包括：

根据所述音频输入信号的功率谱，确定所述音频输入信号功率谱的频谱质心；

在所述频谱质心大于或等于第一预设门限的情况下，根据所述噪声功率谱和所述音频输入信号的频谱，确定所述维纳滤波增益，并根据所述维纳滤波增益对所述音频输入信号进行风噪抑制；

在所述频谱质心小于所述第一预设门限的情况下，直接根据预设增益对所述音频输入信号进行风噪抑制。

9.根据权利要求8所述的风噪抑制方法，其特征在于，所述根据所述音频输入信号的功率谱，确定所述音频输入信号的频谱质心包括：通过以下公式计算所述音频输入信号功率谱的频谱质心SSC(i)：

其中，k为频率索引，i为时间索引，f_s为信号的采样率，N_fft为短时傅里叶变换的窗长，

k₃为质心频点的上限，为所述音频输入信号的功率谱。

10.根据权利要求1至9中任一项所述的风噪抑制方法，其特征在于，在所述获取音频输入信号后，还包括：

根据所述第一频谱的功率谱和所述第二频谱的功率谱，确定所述音频输入信号的功率差和比；

在所述功率差和比大于或等于第二预设门限的情况下，判定所述音频输入信号存在风噪。

11.根据权利要求10所述的风噪抑制方法，其特征在于，所述根据所述第一频谱的功率谱和所述第二频谱的功率谱，确定所述音频输入信号的功率差和比，包括：通过以下公式确定所述功率差和比

其中，k为频率索引，i为时间索引，k₁为频点下限，k₂为频点上限，PR(k,i)为所述第一频谱的功率谱和所述第二频谱的功率谱之比。

12.一种的风噪抑制装置，其特征在于，包括用于执行权利要求1至11任一项所述的风噪抑制方法的模块。

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有指令，所述指令在由计算机执行时实现如权利要求1至11中任一项所述的风噪抑制方法。