CN111933169B

CN111933169B - 一种二次利用语音存在概率的语音降噪方法

Info

Publication number: CN111933169B
Application number: CN202010841886.8A
Authority: CN
Inventors: 胡岸; 何云鹏; 高君效
Original assignee: Chipintelli Technology Co Ltd
Current assignee: Chipintelli Technology Co Ltd
Priority date: 2020-08-20
Filing date: 2020-08-20
Publication date: 2022-08-02
Anticipated expiration: 2040-08-20
Also published as: CN111933169A

Abstract

一种二次利用语音存在概率的语音降噪方法，包括以下步骤：S1对带噪语音进行逐帧读取，并将连续的多帧作为噪声估计的初始值；S2以初始值为基础，通过递归的最小值统计法来进行每一帧的噪声估计；S3使用估计出的噪声值，求得语音存在概率；S4将语音存在概率和谱估计器进行结合；S5使用结合后的谱估计器来求取最终降噪后的语音。本发明通过求得的语音存在概率，利用其动态调节不同的语音谱估计器的权重或参数，通过语音存在概率与语音谱估计器的结合，更好的抑制噪声并减小失真；并可以对求得的谱估计值二次利用语音存在概率来动态调整，以进一步抑制噪声。

Description

一种二次利用语音存在概率的语音降噪方法

技术领域

本发明属于人工智能技术领域，涉及语音识别,具体涉及一种二次利用语音存在概率的语音降噪方法。

背景技术

语音降噪技术属于语音前端处理技术，它的目的是从带噪语音中滤除背景噪声，留下纯净语音。但是处理过后的语音信号要和原始语音完全一样是不可能的，即语音降噪或多或少会给语音带来一定失真，语音降噪是要找到一种算法能够有效地达到以下两个目的：一是抑制语音中的噪声，提高信噪比；二是围绕语音听感以及语音清晰度这两个方面做改进，尽量做到声音不失真。

发明内容

为克服现有技术存在的缺陷，本发明公开了一种二次利用语音存在概率的语音降噪方法。

本发明所述二次利用语音存在概率的语音降噪方法，包括以下步骤：

S1对带噪语音进行逐帧读取，并将连续的多帧作为噪声估计的初始值；

S2以初始值为基础，通过递归的最小值统计法来进行每一帧的噪声估计；

S3使用估计出的噪声值，求得语音存在概率；

S4将语音存在概率和谱估计器进行结合；

S5使用结合后的谱估计器来求取最终降噪后的语音。

优选的：所述步骤S2中，对初始值的语音信号分帧并加窗处理，然后对每帧语音做快速傅里叶变换得到其频谱

；取频谱幅度

，接着根据幅度通过递归的最小值统计法进行噪声估计得到噪声估计值。

优选的：所述步骤S3中，先根据噪声估计值求得后验信噪比，再利用直接平滑准则，得到先验信噪比；

并根据先验信噪比计算语音存在概率

。

优选的：所述步骤S4中结合的具体方式为：

；

G1为结合后的谱估计器，

为任何一种输出值在0-1之间的函数；f 的下标1,2...表示不同的权重值，GA,GB表示两种在不同信噪比条件下的不同语音谱估计器。

进一步的：f 函数为:

，其中a,b分别为预先设定的参数。

优选的：所述步骤S4中结合的具体方式为：

其中G1为结合后的谱估计器，Gc为原

MMSE语音谱估计器。

进一步的：通过下列函数确定

，

，其中a,b分别为预先设定的参数。

进一步的：对G1进行第二次结合语音存在概率，得到的最终谱估计器如以下形式：

。

本发明通过求得的语音存在概率，利用其动态调节不同的语音谱估计器的权重或参数，通过语音存在概率与语音谱估计器的结合，更好的抑制噪声并减小失真；并可以对求得的谱估计值二次利用语音存在概率来动态调整，以进一步抑制噪声。

附图说明

图1是本发明所述语音降噪方法的一个具体实施方式流程示意图；

图1中输入的x(n)表示目标人声，d（n）是环境噪声;

图2是本发明所述

MMSE语音谱估计器的噪声抑制动态曲线图的一个具体实例；图2中纵坐标纵坐标表示噪声抑制量，单位为dB。横轴为瞬时信噪比，图中的

表示先验信噪比。图3表明瞬时信噪比变化时不同先验信噪比以及不同的

值对噪声抑制量的影响。

图3是本发明所述语音存在概率映射到参数

的映射函数曲线图的一个具体实例；图3中横坐标为概率，纵坐标为参数

的值

图4为利用本发明进行带噪语音处理前后的一个具体实例的时域波形图，图4中纵坐标为归一化的语音信号幅度。

具体实施方式

下面对本发明的具体实施方式作进一步的详细说明。

本发明所述二次利用语音存在概率的语音降噪方法，包括如下步骤：

对带噪语音进行逐帧读取语音数据，并将连续多帧语音数据作为噪声估计的初始值；

以初始值为基础，可以通过递归的最小值统计法来进行每一帧的噪声估计,得到噪声估计值。

具体可以是：对语音信号分帧并加窗处理，然后对每帧语音做短时FFT即快速傅里叶变换得到其频谱

；取频谱幅度

，接着根据幅度通过递归的最小值统计法进行噪声估计得到噪声估计值

。

使用噪声估计值，求得语音的先验信噪比和后验信噪比；

可以先求得后验信噪比，再利用直接平滑准则，得到先验信噪比；

根据先验信噪比和后验信噪比计算语音存在概率

，k表示频域的频谱子带，l表示时域的帧数。

将语音存在概率和谱估计器结合。

结合可以采用以下两种方式

第一种形式的结合方式可以如下式：

其中

为任何一种输出值在0-1之间的函数。其作用是求得一个权重，并动态调整

和

的占比。

f 的下标1,2...表示不同的权重值，GA,GB表示两种在不同信噪比条件下各具优势的语音谱估计器.

第一种结合方式中，f 函数的一个具体实施方式可以为:

，其中a,b分别为预先设定的参数。

第二种形式的结合方式可以如下式：

中包含和信噪比相关且能够动态调整的参数，

为任何一种输出范围符合参数范围的函数。

f(*)为符合

范围的函数,比如在

MMSE语音估计器中,

取值范围为负无穷到正无穷。

以下给出第二种形式结合的一个更具体的实施方式：

该具体实施方式中，通过语音存在概率

来调整

MMSE估计器的阶次。

可以把

MMSE估计器当做是MMSE估计器的一种拓展。通过调整该估计器中参数

的大小，动态的控制抑制曲线。以达到更好的语音降噪效果。

MMSE语音谱估计器的噪声抑制动态曲线图如图2所示。

当

为1的时候，噪声抑制结果等同于幅度谱估计MMSE的增益函数。当

为2的时候,可得到谱估计

MMSE的语音估计值。

为2时

MMSE语音谱估计器的计算可采取如下形式表示：

其中Gc为原

MMSE语音谱估计器。

这一类语音谱估计器中包含和信噪比相关且能够动态调整的参数

，在不同的信噪比下动态调整该值,可以取得最佳的噪声抑制效果。

以下例子为通过语音存在概率来推算

一个方法。

对当前帧的语音存在概率求平均，并可以通过下列函数确定

，

，其中a,b分别为根据映射函数曲线图预先设定的参数，例如可以取a=10,b=0.004。

语音存在概率映射到参数

的映射函数曲线图如图3所示。

为了进一步提升噪声抑制性能。将谱估计器

与语音存在概率第二次结合。将结合语音存在概率求解

的

MMSE的增益函数记为

。

第二次结合语音存在概率后得到的最终谱估计器如以下形式：

利用结合后的最终谱估计器进行降噪，具体为：

为降噪后的频域数据，经过傅里叶反变换IFFT后得到降噪后的时域数据

。

使用该最终谱估计来求取最终降噪后的语音。

在通过语音存在概率计算谱估计器的基础上，并与谱估计器二次结合，进一步提高了降噪效果。

图4为利用本发明进行带噪语音处理前后的一个具体实例的时域波形图，上半部分为处理前，下半部分为处理后，从图4可以看出，处理后的波形噪声显著缩小。

前文所述的为本发明的各个优选实施例，各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提，各个优选实施方式都可以任意叠加组合使用，所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程，并非用以限制本发明的专利保护范围，本发明的专利保护范围仍然以其权利要求书为准，凡是运用本发明的说明书内容所作的等同结构变化，同理均应包含在本发明的保护范围内。