CN105719658B

CN105719658B - 基于新阈值函数和自适应阈值的小波包语音降噪方法

Info

Publication number: CN105719658B
Application number: CN201610124417.8A
Authority: CN
Inventors: 刘冲冲; 邹翔; 周正仙; 屈军; 郑贤锋; 崔执凤
Original assignee: Anhui Normal University
Current assignee: Zhuhai Zao An Technology Co ltd
Priority date: 2016-03-04
Filing date: 2016-03-04
Publication date: 2019-11-26
Anticipated expiration: 2036-03-04
Also published as: CN105719658A

Abstract

本发明揭示了一种基于新阈值函数和自适应阈值的小波包语音降噪方法，步骤1、带噪语音输入；步骤2、小波包分解；步骤3：对带噪语音进行小波包降噪；步骤4：小波包重构，得出去噪语音信号；步骤5、去噪语音输出；所述步骤4是通过对带噪语音的语音分量和噪音分量设定不同的阈值，并根据阈值限定抑制噪音分量，增强语音分量，完成小波包降噪，缓解了传统降噪阈值不变和软硬阈值函数带来的语音失真，通过阈值调整系数，对语音分量和噪音分量设定不同的阈值，结合本发明提出的新阈值函数，对语音分量和噪音分量实现区分和平滑处理，能更好的抑制噪音，增强语音，减少失真，从而获得更佳的听觉效果。

Description

基于新阈值函数和自适应阈值的小波包语音降噪方法

技术领域

本发明涉及小波包信号处理领域，尤其涉及一种基于新阈值函数和自适应阈值的小波包语音降噪方法。

背景技术

近年来，伴随高速通信的不断发展，音频通信成为国际热门研究课题。语音在产生和传输过程中，不可避免要受到噪声污染，提高音频通信系统通信质量的关键问题之一是消除干扰噪声。

近年来，小波包分析能根据信号特性，对信号高低频进行分解，在语音降噪方面得到广泛应用。小波包分析的基本方法是，信号进行小波包分解后，对外层每一个小波包系数设定阈值，根据阈值，采用阈值函数对小波包系数进行量化处理。目前小波包分析多数采用硬阈值函数或软阈值函数对分解系数进行量化处理。但是，硬阈值函数增加了信号的突变性和压制了原信号中的小的快变信息，软阈值函数会对整个信号能量产生一个偏移。这两种方法都可能造成信号的不连续性，会使去噪信号失真，虽能获得较高输出信噪比，但是实际的听觉效果并不理想。

针对上述问题，本发明提出一种基于新阈值函数和自适应阈值的小波包语音降噪方法，自适应阈值能对噪音分量和语音分量区分处理，新阈值函数能对信号进行平滑处理，实现对语音分量的保护，减小失真。实验证明，采用本发明提出的方法，可以获得更加清晰，听觉效果更好的增强语音。

发明内容

本发明提出一种基于新阈值函数和自适应阈值的小波包语音降噪方法，自适应阈值能对噪音分量和语音分量区分处理，新阈值函数能对信号进行平滑处理，实现对语音分量的保护，减小失真，获得更佳的听觉效果。

为实现上述目的，本发明提出一种基于小波包语音降噪的阈值调整系数实现阈值的自适应，对语音分量和噪音分量设定不同的阈值，结合本发明提出的新阈值函数(发明内容是自适应阈值和新阈值函数)，对语音分量和噪音分量实现区分和平滑处理，最终实现抑制噪音，增强语音，减小失真，获得更佳语音效果的目的。

基于新阈值函数和自适应阈值的小波包语音降噪方法，

步骤1、带噪语音输入；

步骤2、小波包分解；

步骤3：对带噪语音进行小波包降噪；

步骤4：小波包重构，得出去噪语音信号；

步骤5、去噪语音输出；

所述步骤3是通过对带噪语音的语音分量和噪音分量设定不同的阈值，并结合新阈值函数对语音分量和噪音分量区分并且平滑处理，完成小波包降噪。

所述一种基于小波包分析的语音增强方法为：

1)对带噪语音进行小波包分解；

2)计算阈值并按照本发明提出的自适应阈值，结合本发明提出的新阈值函数，对带噪语音进行小波包降噪；

3)小波包重构，得出去噪语音信号。

所述的阈值调整系数的获取方法为：

1)对带噪语音信号进行小波包分解，分帧处理；

2)计算每一帧是语音帧的相对几率；

3)若某帧很大可能是语音帧，则k(λ)＝1，否则k(λ)＝0；

其中，λ是帧数，最终得到的k(λ)即为阈值调整系数。

所述的新阈值函数为：

其中sign(x)是符号函数，x小于0时,sign(x)＝-1,x大于或者等于0时，sign(x)＝1。A、B均是正常数，A根据实验所需取值，B在1附近取值，w_jk是需要处理的小波包系数，w′_jk是阈值量化处理后的小波包系数，T是经阈值调整系数调整后的自适应阈值。

本发明的优点在于：

1、本发明可以实现对小波包阈值自适应调整，从而保护语音分量，减小失真，获得更佳的听觉效果；

2、本发明可以实现对语音分量和噪音分量区分和平滑处理，能更好的抑制噪音，增强语音；

3、所述新阈值函数构造简单，可以调整，且在整个区间是光滑、连续、可导的，并且具有高阶导数，在远处收敛于y＝x，方便更加深入的数据处理。

附图说明

下面对本发明说明书中每幅附图表达的内容作简要说明：

图1为获取本发明所述阈值调整系数的流程图；

图2为本发明所述新阈值函数的某个示意图像；

图3为本发明所述语音增强流程图。

具体实施方式

本发明提出一种基于小波包分析的语音增强方法，能对噪音分量和语音分量区分和平滑处理，从而更好的抑制噪音，减少失真，获得更佳的听觉效果。

为实现上述目的，本发明提出一种基于小波包语音降噪的阈值调整系数，对语音分量和噪音分量设定不同的阈值，结合本发明提出的新阈值函数，对语音分量和噪音分量实现区分和平滑处理，最终实现抑制噪音，减小失真，获得更佳语音效果的目的。

其具体实施方式如下:

所述一种基于小波包分析的语音增强方法如图3：

步骤1、对带噪语音进行小波包分解；

步骤2、按公式计算外层每一个小波包分解系数的基础阈值，其中σ为小波包分解系数的标准差，N为对应小波包系数的数据长度；；

步骤3、将t按照阈值调整系数调整，得最终自适应阈值T(λ)＝t·(1-p·k(λ))，其中p为介于0到1之间的常数，根据实际调整，通常取0.6-0.95之间，k(λ)是阈值调整系数；

步骤4、按照阈值T(λ)和本发明提出的新阈值函数，对带噪语音进行小波包降噪；

步骤5、小波包重构，得出去噪语音信号。

所述的阈值调整系数的获取方法如图1：

步骤1、对带噪语音信号进行小波包分解；

步骤2、计算外层每一个小波包系数的方差，如果某个小波包系数的方差小于某一个设定的值(如0.0001)，则该小波包系数对应的阈值系数全部设为0，否则跳入下一步；

步骤3、对外层的每一个小波包系数分帧，设帧长为L，帧移为L/2，帧号为λ，第j层第k个小波包系数为w_jk(n)计算每一帧的绝对值的平均值，如下式：

步骤4、对得到的E(λ)进行由小到大排序，得到Es(λ)，找出使Es(λ)变化最大的帧号，若该种帧号有多个，取最小的帧号，记为λ_max，如下式：

Es(λ)＝sort(E(λ))，

λ_max＝min(λ_i)；

步骤5、对E(λ)按下式进行平滑处理：

E(λ)＝α·E(λ-1)+(1-α)·E(λ)，

其中α是平滑因子，根据实验决定其值，如0.3；

步骤6、k(λ)可由下式得到：

其中m是介于0-1之间的调节因子，根据实验决定其取值；

所述的新阈值函数为：

其某个图像如图2，其中sign(x)是符号函数，x小于0时,sign(x)＝-1,x大于或者等于0时，sign(x)＝1。A、B均是正常数，A根据实验所需取值，B在1附近取值，w_jk是需要处理的小波包系数，w′_jk是阈值量化处理后的小波包系数，T是经阈值调整系数调整后的自适应阈值。

上面结合附图对本发明进行了示例性描述，显然本发明具体实现并不受上述方式的限制，只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进，或未经改进将本发明的构思和技术方案直接应用于其它场合的，均在本发明的保护范围之内。

Claims

1.基于新阈值函数和自适应阈值的小波包语音降噪方法，

步骤1、带噪语音输入；

步骤2、小波包分解；

步骤3：对带噪语音进行小波包降噪；

步骤4：小波包重构，得出去噪语音信号；

步骤5、去噪语音输出；

其特征在于：所述步骤3是通过对带噪语音的语音分量和噪音分量设定不同的阈值，并结合新阈值函数对语音分量和噪音分量区分并且平滑处理，完成小波包降噪；

所述的新阈值函数为：

其中sign(x)是符号函数，x小于0时，sign(x)＝-1，x大于或者等于0时，sign(x)＝1，A、B均是正常数，A根据实验所需取值，B在1附近取值，w_jk是需要处理的小波包系数，w′_jk是阈值量化处理后的小波包系数，T是经阈值调整系数调整后的自适应阈值；

所述步骤3中带噪语音的小波包降噪采取的阈值设定方法如下：

步骤a、对带噪语音进行小波包分解；

步骤b、按公式计算外层每个小波包分解系数的基础阈值，其中σ为小波包分解系数的标准差，N为对应小波包系数的数据长度；

步骤c、计算外层每一个小波包系数的方差，如果某个小波包系数的方差小于某一个设定的值，则该小波包系数对应的阈值系数全部设为0，否则跳入下一步；

步骤d、对外层的每一个小波包系数分帧，设帧长为L，帧移为L/2，帧号为λ，第j层第k个小波包系数为w_jk(n)计算每一帧小波包系数的绝对值的平均值，如下式：

步骤e、对得到的E(λ)进行从小到大排序，得到Es(λ)，找出使Es(λ)变化最大的帧号，若该变化最大对应的帧号有多个，取最小的帧号，记为λ_max，如下式：

Es(λ)＝sort(E(λ))，

λ_max＝min(λ_i)；

步骤f、对E(λ)按下式进行平滑处理：

E(λ)＝α·E(λ-1)+(1-α)·E(λ)，

其中α是平滑因子，根据实验决定其值；

步骤g、k(λ)是阈值调整系数，k(λ)可由下式得到：

其中m是介于0-1之间的调节因子，根据实验决定其取值；

步骤h、计算自适应阈值：

T(λ)＝t·(1-p·k(λ))。