CN117479063A

CN117479063A - 基于多领麦自适应降噪会议系统

Info

Publication number: CN117479063A
Application number: CN202311491129.2A
Authority: CN
Inventors: 朱国正; 马冰; 马升
Original assignee: Hefei Madao Information Technology Co ltd
Current assignee: Hefei Madao Information Technology Co ltd
Priority date: 2023-11-07
Filing date: 2023-11-07
Publication date: 2024-01-30

Abstract

本发明公开了基于多领麦自适应降噪会议系统，属于音频处理系统领域。该系统包括：领麦，用于音频信号的采集；选择模块，用于对提取采集到的音频信号进行信号预处理并提取特征值，并根据特征值计算各领麦的加权值，以确定最佳领麦或领麦组合；降噪模块，用于对最佳领麦或领麦组合采集到的音频信号进行协同降噪处理；混合模块，用于对协同降噪后的音频信号进行混合，生成整体的会议音频输出。本发明通过多领麦协同降噪的方法，能够有效抑制背景噪声和干扰声源，提供清晰且准确的会议音频；自适应性和灵活性：系统能够根据不同会议场景和参与者的变化，自适应地调整麦克风选择和降噪算法，以适应不同的环境和需求。

Description

基于多领麦自适应降噪会议系统

技术领域

本发明涉及音频处理系统领域，特别涉及基于多领麦自适应降噪会议系统。

背景技术

在大型会议场景中，由于不同麦克风之间的相互干扰和环境噪声的存在，会议音频质量可能会受到严重影响。现有技术一般多采用降噪处理算法，对音频数据进行优化处理。

在大多数的会议降噪算法中，都是采用声源定位，该方法由诸多局限性，如采用矩阵麦克风采集音频信号，只适用于小型会议场景，对于大型会议场景，无法获取到每个发言者声音；对于发言者的位置要求严苛，若发言者处于移动状态，拾音效果会大打折扣；无法同时获取多个发言者的声音等。

发明内容

本发明提供基于多领麦自适应降噪会议系统，通过对每个发音人的声音进行识别和分离，以及利用多领麦协同降噪的方法，提供清晰且准确的会议音频。

基于多领麦自适应降噪会议系统，包括：

领麦，用于音频信号的采集；

选择模块，用于对提取采集到的音频信号进行信号预处理并提取特征值，并根据所述特征值计算各领麦的加权值，以确定最佳领麦或领麦组合；

降噪模块，用于对所述最佳领麦或领麦组合采集到的音频信号进行协同降噪处理；

混合模块，用于对协同降噪后的音频信号进行混合，生成整体的会议音频输出。

更优地，所述信号预处理至少包括去底噪、降低回声和均衡化，以减少噪声和提高信号的平衡性。

更优地，所述特征值包括时域特征和频域特征。

更优地，所述根据所述特征值计算各领麦的加权值，通过如下公式计算：

Y为该麦克风加权值，W为能量/功率均值，S为信噪比，α为相位差，A、B、C分别为能量权重、相位权重和信噪比权重；

其中，当存在多个音频信号时，将多个音频信号进行分离，并分别进行上述步骤。

更优地，所述协同降噪包括：

信号对齐，通过延迟估计算法对音频信号进行时间对齐，使音频信号在时间上保持一致；

噪声估计，将对齐后的若干音频信号使用小波变换法估算出噪声模型，并通过对若干音频信号的自相关和/或互相关计算出噪声的频谱；

目标信号估计，基于谱减法对若干音频信号进行分析和处理，得到目标信号：

Y(jω)＝X(jω)-T(jω)………(2)

其中，Y(jω)为目标信号的频谱，X(jω)为音频信号的频谱，T(jω)为噪声信号频谱；

信号混合和抑制，对所述目标信号，利用自适应滤波的最小均方误差算法进行加权和混合操作。

更优地，所述自适应滤波的最小均方误差算法包括：

S1，获取包含噪声的输入信号x(n)和期望信号d(n)；

S2，预设最大迭代次数N，N为大于0的自然数；

S3，设置初始滤波器系数ω(0)；

S4，计算滤波器的输出信号：

计算滤波器的误差信号：

更新滤波器的系数向量：

ω(n)＝ω(n-1)+μ·e(n)·x(n)..........(5)

其中，μ为步长参数，n和i为自然数，μ的取值范围如下：

重复S4，直至满足最大迭代次数或误差收敛。

更优地，所述对协同降噪后的音频信号进行混合，包括：

音量平衡，调整协同降噪后的音频信号的音量，使其在混合音频中达到平衡；

交叠混合，将相邻的音频剪辑的重叠部分进行混合，逐步过渡到下一个剪辑，得到混合音频；

均衡和调音，对混合音频进行均衡和调音，以确保各个音频信号在频谱上的平衡和协调；

音频编码，将混合后的音频编码成无损的WAV格式并输出。

本发明提供基于多领麦自适应降噪会议系统，能够至少实现如下效果之一：

降噪效果优异：通过多领麦协同降噪的方法，能够有效抑制背景噪声和干扰声源，提供清晰且准确的会议音频；

自适应性和灵活性：系统能够根据不同会议场景和参与者的变化，自适应地调整麦克风选择和降噪算法，以适应不同的环境和需求。

附图说明

图1为本发明提供的基于多领麦自适应降噪会议系统的系统原理图。

具体实施方式

下面结合附图，对本发明的一个具体实施方式进行详细描述，但应当理解本发明的保护范围并不受具体实施方式的限制。

如图1所示，基于多领麦自适应降噪会议系统，包括：

领麦，用于音频信号的采集。会议参与者佩戴领麦，每个领麦都配备一个麦克风，用于捕捉发音人的声音。领麦应具备良好的音频采集性能，以确保高质量的音频输入。领夹麦通过无线方式连接到一个客户端，无线连接方式可以为蓝牙连接或无线局域网(WLAN)等技术。客户端包括选择模块、降噪模块和混合模块。客户端是一个中央控制单元，用于接收和处理来自各个领麦的音频信号。客户端应具备较高的处理性能和存储容量，以确保对多个发音人的同时处理和存储。

选择模块，用于对提取采集到的音频信号进行信号预处理并提取特征值，并根据特征值计算各领麦的加权值，以确定最佳领麦或领麦组合。选择模块根据音频信号的特征值，动态选择合适的麦克风进行放大和采集。通过算法和实时信号处理，可以实现自动选择最佳麦克风和多个麦克风的最佳组合。

降噪模块，用于对最佳领麦或领麦组合采集到的音频信号进行协同降噪处理；通过合理的信号融合和优化算法，提高降噪效果，避免不同麦克风之间的互相干扰，并最大程度地保留感兴趣的声源信号。

混合模块，用于对协同降噪后的音频信号进行混合，生成整体的会议音频输出。混合模块对来自不同麦克风的音频信号进行混合，生成整体的会议音频输出。混合过程应考虑到不同发音人的音量平衡和音频质量的保持。

进一步的，信号预处理至少包括去底噪、降低回声和均衡化，以减少噪声和提高信号的平衡性。

具体的，音频信号的特征值包括时域特征和频域特征。这些特征可以反映声音信号的能量分布、频谱特性等信息。

使用提取的特征值计算各个麦克风的加权值，可以确定最佳麦克风或麦克风组合，以平衡各个麦克风的贡献。

根据特征值计算各领麦的加权值：

①基于时移的选择：声音的时移特性表现的麦克风与声源实际距离，在频谱中通过相位差反映，尽可能的选择相位差最小的麦克风最为主麦克风。

②基于能量或功率的选择：根据各个麦克风的能量或功率特征，选择具有较高能量或功率的麦克风作为主导麦克风。

③基于信噪比的选择：通过比较各个麦克风信号的信噪比(SNR)，选择具有较高SNR的麦克风作为主导麦克风。

具体计算公式如下：

具体的，协同降噪包括：

信号对齐，通过延迟估计算法对音频信号进行时间对齐，使音频信号在时间上保持一致。由于多个麦克风位置不同，信号在录制时可能存在时间上的偏移。因此，在进行协同降噪时，需要使用延迟估计算法对麦克风信号进行时间对齐，使它们在时间上保持一致。

噪声估计，将对齐后的若干音频信号使用小波变换法估算出噪声模型，并通过对若干音频信号的自相关和/或互相关计算出噪声的频谱。通过对多个麦克风信号进行分析，使用小波变换法估算出噪声模型，并通过对多个麦克风信号的自相关、互相关方法计算出噪声的统计特性。

目标信号估计，在协同降噪中，需要估计目标信号的特征。基于频谱减法的目标信号估计，可以通过对多通道信号进行分析和处理得到。

基于谱减法对若干音频信号进行分析和处理，得到目标信号：

Y(jω)＝X(jω)-T(jω)………(2)

其中，Y(jω)为目标信号的频谱，X(jω)为音频信号的频谱，T(jω)为噪声信号频谱。

信号混合和抑制，对目标信号，利用自适应滤波的最小均方误差算法进行加权和混合操作。根据计算得到的加权系数所确定的最佳麦克风或麦克风组合，对每个麦克风的目标信号进行加权和混合操作(当为麦克风组合时)，这将抑制噪声并增强目标信号。信号混合和抑制使用到的算法为于自适应滤波的最小均方误差(LMS)算法。

具体的，自适应滤波的最小均方误差算法包括：

S1，获取包含噪声的输入信号x(n)和期望信号d(n)；

S2，预设最大迭代次数N，N为大于0的自然数；

S3，设置初始滤波器系数ω(0)；

S4，计算滤波器的输出信号：

计算滤波器的误差信号：

更新滤波器的系数向量：

ω(n)＝ω(n-1)+μ·e(n)·x(n)..........(5)

其中，μ为步长参数，n和i为自然数，μ是步长参数，控制滤波器系数的调整速度。较小的步长可以提高收敛性，但可能导致较慢的调整速度；较大的步长可能导致不稳定或发散。因此，μ的取值范围如下：

重复S4，直至满足最大迭代次数或误差收敛。

具体的，对协同降噪后的音频信号进行混合，具体指将多个音频信号合并为一个单一的混合音频信号的过程，包括：

音量平衡，调整协同降噪后的音频信号的音量，使其在混合音频中达到平衡。通过调整不同发音人的音量，使其在混合音频中达到平衡，可以通过对每个音频信号进行音量增益或降低来实现。

交叠混合，将相邻的音频剪辑的重叠部分进行混合，逐步过渡到下一个剪辑，得到混合音频。在音频剪辑之间应用交叠混合技术，以平滑过渡。这可以通过将相邻音频剪辑的重叠部分进行混合，逐渐过渡到下一个剪辑来实现。

均衡和调音，对混合音频进行均衡和调音，以确保各个音频信号在频谱上的平衡和协调。对混合音频进行均衡和调音，以确保各个音频信号在频谱上的平衡和协调。

音频编码，将混合后的音频编码成无损的WAV格式并输出。混合后的音频为PCM格式，PCM格式的音频不能作为最终的输出音频，需要编码成无损的WAV格式，WAV音频可直接输出到扬声器、录音设备或其他音频处理系统中，也可以根据用户需求，将PCM音频同步编码成MP3等格式存储或导出。

以上公开的仅为本发明的几个具体实施例，但是，本发明实施例并非局限于此，任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims

1.基于多领麦自适应降噪会议系统，其特征在于，包括：

领麦，用于音频信号的采集；

2.如权利要求1所述的基于多领麦自适应降噪会议系统，其特征在于，所述信号预处理至少包括去底噪、降低回声和均衡化，以减少噪声和提高信号的平衡性。

3.如权利要求2所述的基于多领麦自适应降噪会议系统，其特征在于，所述特征值包括时域特征和频域特征。

4.如权利要求3所述的基于多领麦自适应降噪会议系统，其特征在于，所述根据所述特征值计算各领麦的加权值，通过如下公式计算：

5.如权利要求4所述的基于多领麦自适应降噪会议系统，其特征在于，所述协同降噪包括：

Y(jω)＝X(jω)-T(jω)...........(2)

6.如权利要求5所述的基于多领麦自适应降噪会议系统，其特征在于，所述自适应滤波的最小均方误差算法包括：

S1，获取包含噪声的输入信号x(n)和期望信号d(n)；

S2，预设最大迭代次数N，N为大于0的自然数；

S3，设置初始滤波器系数ω(0)；

S4，计算滤波器的输出信号：

计算滤波器的误差信号：

更新滤波器的系数向量：

ω(n)＝ω(n-1)+μ·e(n)·x(n)...........(5)

其中，μ为步长参数，n和i为自然数，μ的取值范围如下：

重复S4，直至满足最大迭代次数或误差收敛。

7.如权利要求1所述的基于多领麦自适应降噪会议系统，其特征在于，所述对协同降噪后的音频信号进行混合，包括：

音频编码，将混合后的音频编码成无损的WAV格式并输出。