CN113838475B

CN113838475B - 一种基于对数mmse估计器的语音信号增强方法及系统

Info

Publication number: CN113838475B
Application number: CN202111428863.5A
Authority: CN
Inventors: 黄放; 兰燎; 张倩; 李忠秦
Original assignee: Chengdu Aerospace Communication Equipment Co ltd
Current assignee: Chengdu Aerospace Communication Equipment Co ltd
Priority date: 2021-11-29
Filing date: 2021-11-29
Publication date: 2022-02-15
Anticipated expiration: 2041-11-29
Also published as: CN113838475A

Abstract

本发明公开了提供了一种基于对数MMSE估计器的语音信号增强方法及系统，该语音信号增强方法，采用对数MMSE估计器处理带噪信号，得到增益后的带噪信号。本发明解决了现有技术存在的因不能有效识别频带较宽且不断变化（非平稳）的噪声、不能有效进行实时更新和估计噪声从而导致的噪声抑制、语音通话效果较差等问题。

Description

一种基于对数MMSE估计器的语音信号增强方法及系统

技术领域

本发明涉及信号处理技术领域，具体是一种基于对数MMSE估计器的语音信号增强方法及系统。

背景技术

在语音通信中，很难避免有噪声的出现，这些噪声在很大程度上影响语音的质量和可懂性，这时就需要通过技术方法对噪声进行抑制。这些噪声中有些噪声能量比较小可以通过能量阈值去除，有些能量较大的噪声频域能量集中在较低的频段，可以通过滤波器去除，而有些噪声的频域（时域）随着对话或者环境变化而改变，且具有较宽的频带，这时这种不断变化（非平稳）的噪声抑制不能采用传统方法进行处理。

发明内容

为克服现有技术的不足，本发明提供了一种基于对数MMSE估计器的语音信号增强方法及系统，解决现有技术存在的因不能有效识别频带较宽且不断变化（非平稳）的噪声、不能有效进行实时更新和估计噪声从而导致的噪声抑制、语音通话效果较差等问题。

本发明解决上述问题所采用的技术方案是：

一种基于对数MMSE估计器的语音信号增强方法，采用对数MMSE估计器处理带噪信号，得到增益后的带噪信号。

作为一种优选的技术方案，采用两级对数MMSE估计器级联的方式处理带噪信号，得到增益后的带噪信号，两级对数MMSE估计器按带噪信号的通过先后顺序分别记为第一对数MMSE估计器、第二对数MMSE估计器。

作为一种优选的技术方案，包括以下步骤：

S1，计算带噪信号的先验信噪比和后验信噪比；

S2，将通过步骤S1处理的带噪信号输入至第一对数MMSE估计器，经第一对数MMSE估计器处理得到第一次增益后的带噪信号；

S3，计算第一次增益后的带噪信号的先验信噪比和后验信噪比；

S4，将通过步骤S3处理的带噪信号输入至第二对数MMSE估计器，经第二对数MMSE估计器处理得到第二次增益后的带噪信号。

作为一种优选的技术方案，步骤S1和/或步骤S3中，设带噪信号的当前帧为第m帧，计算带噪信号的后验信噪比采用如下公式：

，

其中，m表示帧的编号，

表示第m帧带噪信号的后验信噪比，

表示第m帧带噪信号的频域能量，

表示第m帧带噪信号的噪声频域能量；

带噪信号的先验信噪比采用如下公式：

，

其中，

表示第m帧带噪信号的先验信噪比，a表示权重因子，0<a<1，

表示上一帧带噪信号增益后得到的实际信号频域值，

表示上一帧带噪信号的噪声能量。

作为一种优选的技术方案，步骤S1和/或步骤S3还包括以下步骤：计算最大似然比，若最大似然比＞设定的阈值，更新噪声；若最大似然比≤设定的阈值，维持当前噪声；计算最大似然比公式如下：

，

其中，

表示最大似然比；

更新噪声的公式如下：

，

其中，b为权重因子，0<b<1。

作为一种优选的技术方案，第一次增益后的带噪信号的频域值计算公式为：

，

其中，

表示第m帧带噪信号第一次增益后的的实际信号频域值，

表示第m帧带噪信号第一次增益后的增益函数，

表示第m帧带噪信号的频域值。

作为一种优选的技术方案，第m帧带噪信号第一次增益后的增益函数计算公式如下：

，

其中，

。

作为一种优选的技术方案，第m帧带噪信号第二级增益后的带噪信号的频域值计算公式如下：

，

其中，

表示第m帧带噪信号第二级增益后的频域值，

表示第m帧带噪信号第二级增益后的增益函数。

作为一种优选的技术方案，还包括以下步骤：

S5，将得到的第二次增益后的带噪信号进行滤波处理，得到经滤波处理后的信号。

一种基于对数MMSE估计器的语音信号增强系统，基于所述的一种基于对数MMSE估计器的语音信号增强方法，包括以下模块：

第一先验后验计算模块，用以：计算带噪信号的先验信噪比和后验信噪比，并将计算结果输入至第一对数MMSE估计器；

第一对数MMSE估计器，用以：得到第一次增益后的带噪信号，并将第一次增益后的带噪信号输入至第二先验后验计算模块；

第二先验后验计算模块，用以：计算第一次增益后的带噪信号的先验信噪比和后验信噪比，并将计算结果输入至第二对数MMSE估计器；

第二对数MMSE估计器，用以：得到第二次增益后的带噪信号。

本发明相比于现有技术，具有以下有益效果：

（1）本发明对进行带噪信号增益，便于有效识别频带较宽且不断变化（非平稳）的噪声，便于有效进行实时更新和估计噪声，从而便于提供良好的噪声抑制效果、语音通话效果；

（2）本发明采用两级对数MMSE估计器级联的方式对信号进行噪声抑制处理，并通过滤波处理去掉两级估计器带来的额外噪声；

（3）本发明适用于抑制频带宽且频谱特性不一定的噪声信号，对于带有此种特性噪声的带噪信号有很好的的抑制作用；

（4）本发明采用计算每一帧的最大似然比，并判断其是否大于设定的阈值的方式来更新噪声，便于有效保证语音通话效果，同时兼顾了处理效率。

附图说明

图1为本发明所述一种基于对数MMSE估计器的语音信号增强方法的步骤示意图；

图2为本发明所述一种基于对数MMSE估计器的语音信号增强系统的结构框图；

图3为本发明信号增益流程图；

图4为两级信号增益及去噪流程图。

具体实施方式

下面结合实施例及附图，对本发明作进一步的详细说明，但本发明的实施方式不限于此。

实施例

如图1至图4所示，本发明对具有较宽的频带且不断变化（非平稳）的噪声进行实时更新和估计，通过估计出带噪信号在频域的增益函数，从而对带噪信号的频谱进行实时增益继而得到噪声抑制后的信号。本方法能够有效抑制不平稳且频带宽的噪声，从而提高通话质量和体验。

本发明中以对数MMSE估计器（MMSE，Minimum Mean Square Error，最小均方误差）为基础估计带噪信号的增益函数，对带噪信号进行噪声抑制。同时采用两级对数MMSE估计器级联的方式，对带噪信号进行二次增益以将噪声的频域能量降到最小，再通过滤波处理滤除两级估计器带来的额外噪声。

具体的，本发明将带噪信号进行分帧，并将带噪信号的前几帧（优选的，可取前5帧）当做初始噪声，用来计算后验信噪比（后验SNR）和先验信噪比（先验SNR），再将先验信噪比和后验信噪比输入给第一对数MMSE估计器得到当前帧的增益函数，同时根据先后验信噪比判断是否需要更新初始噪声。接着将增益后的带噪信号二次计算后验信噪比和先验信噪比并输入给第二对数MMSE估计器得到二次增益后的带噪信号，最后对此时的带噪信号进行滤波处理得到处理完成的信号。

本发明具体实施方式下面具体分为两个部分，一是信号增益流程，二是两级信号增益级联流程，三是对数MMSE估计器具体流程。

一.信号增益流程具体如下：

（1）计算先验信噪比和后验信噪比；

这里先验信噪比可以看作当前帧的实际信噪比，后验信噪比可以看作当前帧的带噪信噪比。

这里设当前帧为第m帧，则后验信噪比可以由下列公式得到：

，

其中，

表示第m帧的后验信噪比，

表示第m帧的带噪信号频域能量，

表示第m帧的噪声频域能量。

先验信噪比可以由下列公式得到：

，

其中，

为第m帧的先验信噪比；a为权重因子，范围0<a<1；

表示上一帧估计增益后得到的实际信号频域估值，

表示上一帧的噪声能量，

表示第m帧的后验信噪比。

（2）计算噪声能量；

在算先验信噪比时提到上一帧和当前帧的噪声能量，这里对噪声如何更新作补充描述。将带噪信号的前几帧频域能量作为初始值N(1)，并通过判断最大似然比是否大于阈值（优选的，阈值可取0.5）来决定是否更新噪声，判断后的噪声频域能量作为第2帧的噪声能量N(2)，依次类推。

最大似然比可以由下列公式得到：

，

当第m帧算出来的似然比大于阈值，对噪声进行更新，

，

其中b为权重因子，范围0<b<1。

（3）计算第一次增益后的带噪信号频域估计值。

这里设第m帧经第一对数MMSE估计器估计出来的增益函数为

，则第m帧估计增益后的实际信号频域估值为

，则：

。

二．两级信号增益级联流程如下：

两级级联是将增益后的信号再次进行增益计算从而得到二次估计增益后的信号，在第二次增益时，将第一次增益后的带噪信号进行分帧，计算先验信噪比和后验信噪比，计算增益函数并进行噪声抑制。这里需要说明的是第二次增益需要将第一次增益后的前几帧设置为噪声初始频域能量值，从而获得级联的效果。最后将二次增益后的带噪信号进行滤波处理。

（1）计算二次增益后的带噪信号频域估计值；

由第1点信号增益流程中的第（3）可以知道第一次增益后的带噪信号频域估值为

，这里设第m帧第二级对数MMSE估计器估计出来的增益函数为

，可以得到二级增益后的带噪信号的频域估计值

为：

。

三.对数MMSE估计器流程如下：

这里设第m帧对数MMSE估计器估计出来的频域增益函数为

，则：

，

其中，

表示第m帧的先验信噪比，

。

本发明采用两级对数MMSE估计器级联的方式对信号进行噪声抑制处理，并通过滤波处理去掉两级估计器带来的额外噪声。

本发明适用于抑制频带宽且频谱特性不一定的噪声信号，对于带有此种特性噪声的带噪信号有很好的的抑制作用。

本发明采用计算每一帧的最大似然比，并判断其是否大于设定的阈值的方式来更新噪声。

本发明由于采用两级对数MMSE估计器级联的方式进行噪声抑制，所以第二次增益时的噪声的初始值设定为第一次增益后的前几帧信号，从而获得两级级联的效果。

如上所述，可较好地实现本发明。

本说明书中所有实施例公开的所有特征，或隐含公开的所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以以任何方式组合和/或扩展、替换。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，依据本发明的技术实质，在本发明的精神和原则之内，对以上实施例所作的任何简单的修改、等同替换与改进等，均仍属于本发明技术方案的保护范围之内。