CN115101083A

CN115101083A - 一种适用于分离式麦克风的降噪方法

Info

Publication number: CN115101083A
Application number: CN202210801851.0A
Authority: CN
Inventors: 朱国正; 马冰; 马升
Original assignee: Hefei Madao Information Technology Co ltd
Current assignee: Hefei Madao Information Technology Co ltd
Priority date: 2022-07-08
Filing date: 2022-07-08
Publication date: 2022-09-23

Abstract

本发明涉及降噪方法，具体涉及一种适用于分离式麦克风的降噪方法，采集帧音频数据后，通过对该帧音频数据的峰值与期望峰值进行比较，动态调节音频增益；采用静态滤波消除定频噪音；采用动态滤波消除环境噪音；本发明提供的技术方案能够有效克服现有技术所存在的麦克风拾音距离存在严重限制、录音质量较差的缺陷。

Description

一种适用于分离式麦克风的降噪方法

技术领域

本发明涉及降噪方法，具体涉及一种适用于分离式麦克风的降噪方法。

背景技术

随着语音技术的不断发展，市面上出现了各种各样的智能语音产品，如智能语音鼠标、智能语音键盘等。这些智能语音产品可以通过麦克风收音，并将音频文件上传至引擎端，然后引擎端返回转译结果，完成一次语音与文字之间的交互过程。

上述过程涉及到一个非常关键的点，就是麦克风收音环节，如果录制的音频不够清晰干净，那么将会严重影响录音质量。普通麦克风的增益都是事先调整好的，有一个固定值，这样会使得麦克风具有一个最佳拾音距离，那么就会导致麦克风的拾音距离存在严重限制，给使用者带来较大不便。

发明内容

(一)解决的技术问题

针对现有技术所存在的上述缺点，本发明提供了一种适用于分离式麦克风的降噪方法，能够有效克服现有技术所存在的麦克风拾音距离存在严重限制、录音质量较差的缺陷。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：

一种适用于分离式麦克风的降噪方法，包括以下步骤：

S1、采集帧音频数据后，通过对该帧音频数据的峰值与期望峰值进行比较，动态调节音频增益；

S2、采用静态滤波消除定频噪音；

S3、采用动态滤波消除环境噪音。

优选地，S1中通过对该帧音频数据的峰值与期望峰值进行比较，动态调节音频增益，包括：

采用下式计算当前采样点的音频增益：

其中，β_n为当前采样点的音频增益；β_n-1为上一帧音频数据最后一个采样点的音频增益；M为当前帧音频数据的峰值；X为期望峰值；α为遗忘因子，其取值范围α∈(0,1]；A为增益调节幅度。

优选地，S2中采用静态滤波消除定频噪音，包括：

通过高通滤波器过滤低频噪音，通过陷波滤波器消除音频硬件采集带来的电流噪声。

优选地，所述通过高通滤波器过滤低频噪音，包括：

高通滤波器的S域表达式为：

其中，K为音频增益，一般取1，即音频增益为0dB；ω₀为截止频率，ω₀＝100Hz。

优选地，S3中采用动态滤波消除环境噪音，包括：

S31、采集一段非人声音频，并记录噪声频谱能量，从所有的音频频谱中减去该噪声频谱能量；

S32、基于统计模型估算出音频频谱中每个频点对应的噪声及语音的分量，并对噪声分量进行过滤。

优选地，所述基于统计模型估算出音频频谱中每个频点对应的噪声及语音的分量，并对噪声分量进行过滤之前，包括：

确定噪声相对于人声在时域和频域上的声学统计特征更加平稳；

确定所有噪声均满足加性条件。

优选地，还包括采用Opus 16倍压缩算法，在损耗尽可能低的前提下将降噪后的每帧640字节的音频数据压缩为40字节，提高音频传输效率。

(三)有益效果

与现有技术相比，本发明所提供的一种适用于分离式麦克风的降噪方法，具有以下有益效果：

1)动态调节音频增益：当声源距离较近时，会自动减小音频增益，防止截幅，当声源距离较远时，会自动增大音频增益，防止录音音量过小；可以做到自适应声源距离，有效防止喷麦、截幅等常见录音问题的发生，在麦克风最大拾音距离范围内，真正做到每个位置都是最佳拾音距离；

2)多种降噪方法配合：利用动态增益保证录音音量大小始终处于平稳范围，利用静态滤波过滤背景低频噪音和硬件电流噪声，再利用动态滤波过滤掉录音过程中的环境噪音，实现全方位降噪，最大程度保证了录音质量。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的流程示意图；

图2为本发明中动态调节音频增益的原理图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种适用于分离式麦克风的降噪方法，如图1和图2所示，①采集帧音频数据后，通过对该帧音频数据的峰值与期望峰值进行比较，动态调节音频增益。

其中，通过对该帧音频数据的峰值与期望峰值进行比较，动态调节音频增益，包括：

采用下式计算当前采样点的音频增益：

分离式麦克风(比如领夹麦克风等)中音频采集模块所采用的是可设定增益的数字麦克风，为了使麦克风近距离、远距离采集音频的大小、质量趋于稳定，必须动态调节音频增益。在本申请中使用了动态音频增益(AGC)技术，可以根据当前音量大小动态调整麦克风增益，有效解决近距离音频截幅和远距离音频音量过小的问题，同时提高音频质量。

音频采集模块开始工作时，分离式麦克风内部的控制器会给音频采集模块设定初始音频增益。如图2所示，当采集完一帧音频数据后，将该帧音频数据发送给控制器，控制器通过对该帧音频数据的峰值与期望峰值进行比较，动态调节音频增益。

②采用静态滤波消除定频噪音，具体包括：

其中，通过高通滤波器过滤低频噪音，包括：

高通滤波器的S域表达式为：

其中，K为音频增益，一般取1，即音频增益为0dB；ω₀为截止频率，ω₀＝100Hz(本申请中将截止频率设置为100Hz)。

陷波滤波器用于消除音频硬件采集带来的电流噪声，该滤波器具有硬件匹配性，不同的硬件电路噪声频段可能不一样。

低通滤波器一般用于过滤高频噪音，由于本申请中PCM的采样率为16kHz，理论最高能够达到8kHz，而人声的最高频率可达10kHz，所以低通滤波器在本申请中意义不大，故不采用低通滤波器。

③采用动态滤波消除环境噪音，具体包括：

其中，基于统计模型估算出音频频谱中每个频点对应的噪声及语音的分量，并对噪声分量进行过滤之前，包括：

确定所有噪声均满足加性条件。

动态滤波第一步是谱减法，这种方法能够有效降低稳态的环境噪音。但是，对于非稳态环境噪音，采用这种方法就会导致有的地方频谱减少了，噪声有残留；有的地方频谱减多了，人声有损伤。而在进行实时音频处理时，环境噪音的状态经常是随时间变化的，很难让环境噪音一直保持绝对稳态。

所以，动态滤波的第二步是基于统计模型的实时降噪算法，这种降噪方法其实也是针对相对平稳的噪声进行过滤的，因此为了方便找出噪声和人声的直观统计区别，在采用基于统计模型的实时降噪算法之前，都需要进行上述“两个确定”，以满足该实时降噪算法的使用条件。

本申请技术方案中，还包括采用Opus 16倍压缩算法，在损耗尽可能低的前提下将降噪后的每帧640字节的音频数据压缩为40字节，提高音频传输效率。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种适用于分离式麦克风的降噪方法，其特征在于：包括以下步骤：

S2、采用静态滤波消除定频噪音；

S3、采用动态滤波消除环境噪音。

2.根据权利要求1所述的适用于分离式麦克风的降噪方法，其特征在于：S1中通过对该帧音频数据的峰值与期望峰值进行比较，动态调节音频增益，包括：

采用下式计算当前采样点的音频增益：

3.根据权利要求1所述的适用于分离式麦克风的降噪方法，其特征在于：S2中采用静态滤波消除定频噪音，包括：

4.根据权利要求3所述的适用于分离式麦克风的降噪方法，其特征在于：所述通过高通滤波器过滤低频噪音，包括：

高通滤波器的S域表达式为：

5.根据权利要求1所述的适用于分离式麦克风的降噪方法，其特征在于：S3中采用动态滤波消除环境噪音，包括：

6.根据权利要求5所述的适用于分离式麦克风的降噪方法，其特征在于：所述基于统计模型估算出音频频谱中每个频点对应的噪声及语音的分量，并对噪声分量进行过滤之前，包括：

确定所有噪声均满足加性条件。

7.根据权利要求1所述的适用于分离式麦克风的降噪方法，其特征在于：还包括采用Opus16倍压缩算法，在损耗尽可能低的前提下将降噪后的每帧640字节的音频数据压缩为40字节，提高音频传输效率。