CN108877826A

CN108877826A - 一种基于多窗谱的语音减噪方法

Info

Publication number: CN108877826A
Application number: CN201810996691.3A
Authority: CN
Inventors: 龙华; 商林松; 邵玉斌; 杜庆治
Original assignee: Kunming University of Science and Technology
Current assignee: Kunming University of Science and Technology
Priority date: 2018-08-29
Filing date: 2018-08-29
Publication date: 2018-11-23

Abstract

本发明涉及一种基于多窗谱的语音减噪方法，属于音频信号处理技术领域。本发明通过使用多窗谱具有较小偏差和方差，从含噪语音的多窗谱来估计噪声，使得先验信噪比具有较小的方差，从而有利于噪声的消除，将其引入到谱减法中，使得噪声估计的偏差较小，并且在对语音进行傅里叶变换得到的幅度进行平滑处理，计算谱减后的幅值，最终进行傅里叶反变换得到减噪后的语音，减噪后的语音更接近纯净语音。

Description

一种基于多窗谱的语音减噪方法

技术领域

本发明涉及一种基于多窗谱的语音减噪方法，属于音频信号处理技术领域。

背景技术

语音减噪属于语音增强技术，其本质就是语音降噪，换句话说，日常生活中，麦克风采集的语音通常是带有不同噪声的“污染”语音，语音增强的主要目的就是从这些被“污染”的带噪语音中恢复出我们想要的干净语音。

为了抑制语音中的噪声，学者们提出过一些语音增强方法。谱减法就是其中的一种，谱减法存在对噪声谱估计不准的缺点。

发明内容

本发明要解决的技术问题是：提供一种基于多窗谱的语音减噪方法，通过引入多窗谱对谱减法进行改进，同时对傅里叶变换后的幅值进行平滑处理，使得噪声大大降低，最终提取出的语音更接近纯净语音。

本发明采用的技术方案是：一种基于多窗谱的语音减噪方法，该方法包括以下步骤：

(1)语音采集：采集语音；

(2)语音信号的预处理：主要包括分帧、加窗处理；

(3)对预处理后的信号进行快速傅里叶变换(FFT)，分别求其幅度谱|X_i(k)|和相位谱θ_i(k)，在相邻帧之间做平滑处理，计算平均幅度谱

(4)将预处理后的信号进行多窗谱估计，得到多窗谱功率谱密度P(k，i)；

(5)对多窗谱功率谱密度估计值进行相邻帧之间的平滑处理，计算出平均功率谱密度P_y(k，i)；

(6)计算出噪声平均功率谱密度P_n(k)；

(7)计算增益因子g(k，i)；

(8)通过增益因子和平均幅度求得谱减后的幅度谱

(9)通过快速傅里叶反变换(IFFT)得到减噪后的语音信号

具体地，所述步骤(1)中的语音采集，在通过专业音频软件采集信号时，采样率f_s≥2f_h，f_h为信号最高频率，设置声道数为单声道，采样频率为8000Hz，量化精度为16bit。

具体地，所述步骤(2)中预处理包括以下步骤：

(1)分帧：因为语音信号为短时平稳信号，所以需要进行分帧处理，以便把每一帧当成平稳信号处理。同时为了减少帧与帧之间的变化，相邻帧之间取重叠。一般帧长取25ms，帧移取帧长的一半。

(2)加窗：加窗之后是为了进行傅里叶展开，使全局更加连续，避免出现吉布斯效应，加窗之后，原本没有周期性的语音信号呈现出周期函数的部分特征。在语音信号分析中，常用的窗函数有矩形窗、海宁窗和汉明窗。

具体地，所述步骤(3)中，平均幅度谱的计算公式如下：

以i帧为中心前后各取M帧，共有2M+1帧进行平均。

具体地，所述步骤(4)中，多窗谱定义如下：

式中，L为数据窗个数；为k个数据窗的谱：

式中；x(n)为数据序列；N为序列长度，a_k(n)为第k个数据窗，

多窗谱功率谱密度计算公式如下：

P(k，i)＝PMTM[x_i(m)]。

具体地，所述步骤(5)中，平均功率谱密度计算公式如下：

公式中以i帧为中心前后各取M帧，共有2M+1帧进行平均。

具体地，所述步骤(6)中，噪声平均功率谱密度计算公式如下：

具体地，所述步骤(7)中，增益因子计算公式如下：

α为过减增益因子，β为增益补偿因子。

具体地，所述步骤(8)中，幅度谱计算公式如下：

具体地，所述步骤(9)中，傅里叶反变换公式如下：

本发明的有益效果是：本发明将多窗谱引入到谱减法中，对谱减法进行了改进，使原来对噪声的估计误差减小，同时将傅里叶变换后的幅值进行平滑处理，最终使得处理后的语音跟接近纯净语音。

附图说明

图1是本发明流程图。

具体实施方式

下面通过附图和具体实施例对本发明作进一步详细说明，但本发明的保护范围不局限于所述内容。

实施例1：如图1所示，一种基于多窗谱的语音减噪方法，包括以下步骤：

(1)语音采集：采集语音；

(2)需要设置声道数，当采集语音信号时，设置为单声道，当采样频率满足奈奎斯特采样定理，采样率f_s≥2f_h，f_h为信号最高频率，采样频率设置为8000Hz，量化精度为16bit；

(3)分帧：因为语音信号为短时平稳信号，所以需要进行分帧处理，以便把每一帧当成平稳信号处理。同时为了减少帧与帧之间的变化，相邻帧之间取重叠。一般帧长取25ms，帧移取帧长的一半；

(4)加窗：加窗之后是为了进行傅里叶展开，使全局更加连续，避免出现吉布斯效应，加窗之后，原本没有周期性的语音信号呈现出周期函数的部分特征。在语音信号分析中，常用的窗函数有矩形窗、海宁窗和汉明窗；

(5)对预处理后的信号进行快速傅里叶变换(FFT)，分别求其幅度谱|X_i(k)|和相位谱θ_i(k)，在相邻帧之间做平滑处理，计算平均幅度谱平均幅度谱计算公式如下：

以i帧为中心前后各取M帧，共有2M+1帧进行平均。

(6)将预处理后的信号进行多窗谱估计，得到多窗谱功率谱密度P(k，i)。多窗谱定义如下：

式中，L为数据窗个数；为k个数据窗的谱：

式中；x(n)为数据序列；N为序列长度，a_k(n)为第k个数据窗；

多窗谱功率谱密度计算公式如下：

P(k，i)＝PMTM[x_i(m)]。

(7)对多窗谱功率谱密度估计值进行相邻帧之间的平滑处理，计算出平均功率谱密度P_y(k，i)。平均功率谱密度计算公式如下：

公式中以i帧为中心前后各取M帧，共有2M+1帧进行平均。

(8)计算出噪声平均功率谱密度P_n(k)，计算公式如下：

(9)计算增益因子g(k，i)，计算公式如下：

(10)通过增益因子和平均幅度求得谱减后的幅度谱计算公式如下：

(11)通过快速傅里叶反变换(IFFT)得到减噪后的语音信号计算公式如下：

多窗谱是一种非参数谱估计方法，相对于传统的周期图法，多窗谱具有更小的偏差和方差，是一致估计，本发明利用谱减法方差小的特点，从含噪语音的多窗谱来估计噪声，使得先验信噪比具有较小的方差，从而有利于噪声的消除。本发明通过使用多窗谱对谱减法进行改进，同时对傅里叶变换后的幅值进行平滑处理，可以进一步的降低噪声。

以上结合附图对本发明的具体实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims

1.一种基于多窗谱的语音减噪方法，其特征在于：包括如下步骤：

(1)语音采集：采集语音；

(2)语音信号的预处理：包括分帧、加窗处理；

(3)对预处理后的信号进行快速傅里叶变换FFT，分别求其幅度谱|X_i(k)|和相位谱θ_i(k)，在相邻帧之间做平滑处理，计算平均幅度谱

(6)计算出噪声平均功率谱密度P_n(k)；

(7)计算增益因子g(k，i)；

(8)通过增益因子和平均幅度求得谱减后的幅度谱

(9)通过快速傅里叶反变换IFFT得到减噪后的语音信号

2.根据权利要求1所述的一种基于多窗谱的语音减噪方法，其特征在于：所述步骤(1)中的语音采集通过专业的音频采集软件进行采集，声道数为单声道，采样频率满足奈奎斯特采样定理，采样率f_s≥2f_h，f_h为信号最高频率。

3.根据权利要求1所述的一种基于多窗谱的语音减噪方法，其特征在于：所述步骤(2)分帧采用的帧长为128，帧移为64，加窗处理中窗函数采用汉宁窗。

4.根据权利要求1所述的一种基于多窗谱的语音减噪方法，其特征在于：所述步骤(3)中，平均幅度谱的计算公式如下：

以i帧为中心前后各取M帧，共有2M+1帧进行平均。

5.根据权利要求1所述的一种基于多窗谱的语音减噪方法，其特征在于：所述步骤(4)中，多窗谱功率谱密度计算公式如下：

P(k，i)＝PMTM[x_i(m)]。

6.根据权利要求1所述的一种基于多窗谱的语音减噪方法，其特征在于：所述步骤(5)中，平均功率谱密度计算公式如下：

公式中以i帧为中心前后各取M帧，共有2M+1帧进行平均。

7.根据权利要求1所述的一种基于多窗谱的语音减噪方法，其特征在于：所述步骤(6)中，噪声平均功率谱密度计算公式如下：

8.根据权利要求1所述的一种基于多窗谱的语音减噪方法，其特征在于：所述步骤(7)中，增益因子计算公式如下：

α为过减增益因子，β为增益补偿因子。

9.根据权利要求1所述的一种基于多窗谱的语音减噪方法，其特征在于：所述步骤(8)中，幅度谱计算公式如下：

10.根据权利要求1所述的一种基于多窗谱的语音减噪方法，其特征在于：所述步骤(9)中，傅里叶反变换公式如下：