CN108877826A - 一种基于多窗谱的语音减噪方法 - Google Patents
一种基于多窗谱的语音减噪方法 Download PDFInfo
- Publication number
- CN108877826A CN108877826A CN201810996691.3A CN201810996691A CN108877826A CN 108877826 A CN108877826 A CN 108877826A CN 201810996691 A CN201810996691 A CN 201810996691A CN 108877826 A CN108877826 A CN 108877826A
- Authority
- CN
- China
- Prior art keywords
- spectrum
- voice
- windows
- frame
- method based
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 67
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000003595 spectral effect Effects 0.000 claims description 13
- 238000009499 grossing Methods 0.000 claims description 6
- 238000009432 framing Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 abstract description 4
- 230000008030 elimination Effects 0.000 abstract description 2
- 238000003379 elimination reaction Methods 0.000 abstract description 2
- 230000005236 sound signal Effects 0.000 abstract description 2
- 230000000737 periodic effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000004568 cement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
本发明涉及一种基于多窗谱的语音减噪方法,属于音频信号处理技术领域。本发明通过使用多窗谱具有较小偏差和方差,从含噪语音的多窗谱来估计噪声,使得先验信噪比具有较小的方差,从而有利于噪声的消除,将其引入到谱减法中,使得噪声估计的偏差较小,并且在对语音进行傅里叶变换得到的幅度进行平滑处理,计算谱减后的幅值,最终进行傅里叶反变换得到减噪后的语音,减噪后的语音更接近纯净语音。
Description
技术领域
本发明涉及一种基于多窗谱的语音减噪方法,属于音频信号处理技术领域。
背景技术
语音减噪属于语音增强技术,其本质就是语音降噪,换句话说,日常生活中,麦克风采集的语音通常是带有不同噪声的“污染”语音,语音增强的主要目的就是从这些被“污染”的带噪语音中恢复出我们想要的干净语音。
为了抑制语音中的噪声,学者们提出过一些语音增强方法。谱减法就是其中的一种,谱减法存在对噪声谱估计不准的缺点。
发明内容
本发明要解决的技术问题是:提供一种基于多窗谱的语音减噪方法,通过引入多窗谱对谱减法进行改进,同时对傅里叶变换后的幅值进行平滑处理,使得噪声大大降低,最终提取出的语音更接近纯净语音。
本发明采用的技术方案是:一种基于多窗谱的语音减噪方法,该方法包括以下步骤:
(1)语音采集:采集语音;
(2)语音信号的预处理:主要包括分帧、加窗处理;
(3)对预处理后的信号进行快速傅里叶变换(FFT),分别求其幅度谱|Xi(k)|和相位谱θi(k),在相邻帧之间做平滑处理,计算平均幅度谱
(4)将预处理后的信号进行多窗谱估计,得到多窗谱功率谱密度P(k,i);
(5)对多窗谱功率谱密度估计值进行相邻帧之间的平滑处理,计算出平均功率谱密度Py(k,i);
(6)计算出噪声平均功率谱密度Pn(k);
(7)计算增益因子g(k,i);
(8)通过增益因子和平均幅度求得谱减后的幅度谱
(9)通过快速傅里叶反变换(IFFT)得到减噪后的语音信号
具体地,所述步骤(1)中的语音采集,在通过专业音频软件采集信号时,采样率fs≥2fh,fh为信号最高频率,设置声道数为单声道,采样频率为8000Hz,量化精度为16bit。
具体地,所述步骤(2)中预处理包括以下步骤:
(1)分帧:因为语音信号为短时平稳信号,所以需要进行分帧处理,以便把每一帧当成平稳信号处理。同时为了减少帧与帧之间的变化,相邻帧之间取重叠。一般帧长取25ms,帧移取帧长的一半。
(2)加窗:加窗之后是为了进行傅里叶展开,使全局更加连续,避免出现吉布斯效应,加窗之后,原本没有周期性的语音信号呈现出周期函数的部分特征。在语音信号分析中,常用的窗函数有矩形窗、海宁窗和汉明窗。
具体地,所述步骤(3)中,平均幅度谱的计算公式如下:
以i帧为中心前后各取M帧,共有2M+1帧进行平均。
具体地,所述步骤(4)中,多窗谱定义如下:
式中,L为数据窗个数;为k个数据窗的谱:
式中;x(n)为数据序列;N为序列长度,ak(n)为第k个数据窗,
多窗谱功率谱密度计算公式如下:
P(k,i)=PMTM[xi(m)]。
具体地,所述步骤(5)中,平均功率谱密度计算公式如下:
公式中以i帧为中心前后各取M帧,共有2M+1帧进行平均。
具体地,所述步骤(6)中,噪声平均功率谱密度计算公式如下:
具体地,所述步骤(7)中,增益因子计算公式如下:
α为过减增益因子,β为增益补偿因子。
具体地,所述步骤(8)中,幅度谱计算公式如下:
具体地,所述步骤(9)中,傅里叶反变换公式如下:
本发明的有益效果是:本发明将多窗谱引入到谱减法中,对谱减法进行了改进,使原来对噪声的估计误差减小,同时将傅里叶变换后的幅值进行平滑处理,最终使得处理后的语音跟接近纯净语音。
附图说明
图1是本发明流程图。
具体实施方式
下面通过附图和具体实施例对本发明作进一步详细说明,但本发明的保护范围不局限于所述内容。
实施例1:如图1所示,一种基于多窗谱的语音减噪方法,包括以下步骤:
(1)语音采集:采集语音;
(2)需要设置声道数,当采集语音信号时,设置为单声道,当采样频率满足奈奎斯特采样定理,采样率fs≥2fh,fh为信号最高频率,采样频率设置为8000Hz,量化精度为16bit;
(3)分帧:因为语音信号为短时平稳信号,所以需要进行分帧处理,以便把每一帧当成平稳信号处理。同时为了减少帧与帧之间的变化,相邻帧之间取重叠。一般帧长取25ms,帧移取帧长的一半;
(4)加窗:加窗之后是为了进行傅里叶展开,使全局更加连续,避免出现吉布斯效应,加窗之后,原本没有周期性的语音信号呈现出周期函数的部分特征。在语音信号分析中,常用的窗函数有矩形窗、海宁窗和汉明窗;
(5)对预处理后的信号进行快速傅里叶变换(FFT),分别求其幅度谱|Xi(k)|和相位谱θi(k),在相邻帧之间做平滑处理,计算平均幅度谱平均幅度谱计算公式如下:
以i帧为中心前后各取M帧,共有2M+1帧进行平均。
(6)将预处理后的信号进行多窗谱估计,得到多窗谱功率谱密度P(k,i)。多窗谱定义如下:
式中,L为数据窗个数;为k个数据窗的谱:
式中;x(n)为数据序列;N为序列长度,ak(n)为第k个数据窗;
多窗谱功率谱密度计算公式如下:
P(k,i)=PMTM[xi(m)]。
(7)对多窗谱功率谱密度估计值进行相邻帧之间的平滑处理,计算出平均功率谱密度Py(k,i)。平均功率谱密度计算公式如下:
公式中以i帧为中心前后各取M帧,共有2M+1帧进行平均。
(8)计算出噪声平均功率谱密度Pn(k),计算公式如下:
(9)计算增益因子g(k,i),计算公式如下:
(10)通过增益因子和平均幅度求得谱减后的幅度谱计算公式如下:
(11)通过快速傅里叶反变换(IFFT)得到减噪后的语音信号计算公式如下:
多窗谱是一种非参数谱估计方法,相对于传统的周期图法,多窗谱具有更小的偏差和方差,是一致估计,本发明利用谱减法方差小的特点,从含噪语音的多窗谱来估计噪声,使得先验信噪比具有较小的方差,从而有利于噪声的消除。本发明通过使用多窗谱对谱减法进行改进,同时对傅里叶变换后的幅值进行平滑处理,可以进一步的降低噪声。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
Claims (10)
1.一种基于多窗谱的语音减噪方法,其特征在于:包括如下步骤:
(1)语音采集:采集语音;
(2)语音信号的预处理:包括分帧、加窗处理;
(3)对预处理后的信号进行快速傅里叶变换FFT,分别求其幅度谱|Xi(k)|和相位谱θi(k),在相邻帧之间做平滑处理,计算平均幅度谱
(4)将预处理后的信号进行多窗谱估计,得到多窗谱功率谱密度P(k,i);
(5)对多窗谱功率谱密度估计值进行相邻帧之间的平滑处理,计算出平均功率谱密度Py(k,i);
(6)计算出噪声平均功率谱密度Pn(k);
(7)计算增益因子g(k,i);
(8)通过增益因子和平均幅度求得谱减后的幅度谱
(9)通过快速傅里叶反变换IFFT得到减噪后的语音信号
2.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(1)中的语音采集通过专业的音频采集软件进行采集,声道数为单声道,采样频率满足奈奎斯特采样定理,采样率fs≥2fh,fh为信号最高频率。
3.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(2)分帧采用的帧长为128,帧移为64,加窗处理中窗函数采用汉宁窗。
4.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(3)中,平均幅度谱的计算公式如下:
以i帧为中心前后各取M帧,共有2M+1帧进行平均。
5.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(4)中,多窗谱功率谱密度计算公式如下:
P(k,i)=PMTM[xi(m)]。
6.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(5)中,平均功率谱密度计算公式如下:
公式中以i帧为中心前后各取M帧,共有2M+1帧进行平均。
7.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(6)中,噪声平均功率谱密度计算公式如下:
8.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(7)中,增益因子计算公式如下:
α为过减增益因子,β为增益补偿因子。
9.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(8)中,幅度谱计算公式如下:
10.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(9)中,傅里叶反变换公式如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810996691.3A CN108877826A (zh) | 2018-08-29 | 2018-08-29 | 一种基于多窗谱的语音减噪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810996691.3A CN108877826A (zh) | 2018-08-29 | 2018-08-29 | 一种基于多窗谱的语音减噪方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108877826A true CN108877826A (zh) | 2018-11-23 |
Family
ID=64322368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810996691.3A Pending CN108877826A (zh) | 2018-08-29 | 2018-08-29 | 一种基于多窗谱的语音减噪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108877826A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109102818A (zh) * | 2018-08-29 | 2018-12-28 | 昆明理工大学 | 一种基于信号频率概率密度函数分布的去噪音频采样算法 |
CN109319351A (zh) * | 2018-11-28 | 2019-02-12 | 广州市煌子辉贸易有限公司 | 一种具有声音识别功能的智能垃圾桶 |
CN109507510A (zh) * | 2018-11-28 | 2019-03-22 | 深圳桓轩科技有限公司 | 一种变压器故障诊断系统 |
CN109798611A (zh) * | 2018-11-28 | 2019-05-24 | 福建澳尤机电有限公司 | 一种蒸发式环保空调 |
CN111091833A (zh) * | 2019-12-09 | 2020-05-01 | 浙江工业大学 | 一种降低噪声影响的端点检测方法 |
CN112562716A (zh) * | 2020-12-03 | 2021-03-26 | 兰州交通大学 | 基于神经网络的语音增强方法、装置、终端和介质 |
WO2021114733A1 (zh) * | 2019-12-10 | 2021-06-17 | 展讯通信(上海)有限公司 | 一种分频段进行处理的噪声抑制方法及其系统 |
CN113726458A (zh) * | 2021-08-25 | 2021-11-30 | 中国电子科技集团公司第五十四研究所 | 一种低信噪比下水声通信信号实时检测提取方法 |
CN117786320A (zh) * | 2023-12-27 | 2024-03-29 | 长春国地探测仪器工程技术股份有限公司 | 一种基于多窗谱谱减法的分布式光纤声波传感数据消噪方法 |
-
2018
- 2018-08-29 CN CN201810996691.3A patent/CN108877826A/zh active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109102818A (zh) * | 2018-08-29 | 2018-12-28 | 昆明理工大学 | 一种基于信号频率概率密度函数分布的去噪音频采样算法 |
CN109102818B (zh) * | 2018-08-29 | 2022-10-21 | 昆明理工大学 | 一种基于信号频率概率密度函数分布的去噪音频采样算法 |
CN109319351A (zh) * | 2018-11-28 | 2019-02-12 | 广州市煌子辉贸易有限公司 | 一种具有声音识别功能的智能垃圾桶 |
CN109507510A (zh) * | 2018-11-28 | 2019-03-22 | 深圳桓轩科技有限公司 | 一种变压器故障诊断系统 |
CN109798611A (zh) * | 2018-11-28 | 2019-05-24 | 福建澳尤机电有限公司 | 一种蒸发式环保空调 |
CN111091833A (zh) * | 2019-12-09 | 2020-05-01 | 浙江工业大学 | 一种降低噪声影响的端点检测方法 |
WO2021114733A1 (zh) * | 2019-12-10 | 2021-06-17 | 展讯通信(上海)有限公司 | 一种分频段进行处理的噪声抑制方法及其系统 |
CN112562716A (zh) * | 2020-12-03 | 2021-03-26 | 兰州交通大学 | 基于神经网络的语音增强方法、装置、终端和介质 |
CN113726458A (zh) * | 2021-08-25 | 2021-11-30 | 中国电子科技集团公司第五十四研究所 | 一种低信噪比下水声通信信号实时检测提取方法 |
CN113726458B (zh) * | 2021-08-25 | 2022-07-01 | 中国电子科技集团公司第五十四研究所 | 一种低信噪比下水声通信信号实时检测提取方法 |
CN117786320A (zh) * | 2023-12-27 | 2024-03-29 | 长春国地探测仪器工程技术股份有限公司 | 一种基于多窗谱谱减法的分布式光纤声波传感数据消噪方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108877826A (zh) | 一种基于多窗谱的语音减噪方法 | |
CN108831499B (zh) | 利用语音存在概率的语音增强方法 | |
US11056130B2 (en) | Speech enhancement method and apparatus, device and storage medium | |
US6122610A (en) | Noise suppression for low bitrate speech coder | |
CN106340292B (zh) | 一种基于连续噪声估计的语音增强方法 | |
KR100304666B1 (ko) | 음성 향상 방법 | |
CN111128213B (zh) | 一种分频段进行处理的噪声抑制方法及其系统 | |
CN110085249A (zh) | 基于注意力门控的循环神经网络的单通道语音增强方法 | |
CN103021420B (zh) | 一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法 | |
CN105390142B (zh) | 一种数字助听器语音噪声消除方法 | |
CN108735225A (zh) | 一种基于人耳掩蔽效应与贝叶斯估计的改进谱减方法 | |
CN108899052B (zh) | 一种基于多带谱减法的帕金森语音增强方法 | |
JPH10513273A (ja) | スペクトル減算雑音抑止方法 | |
WO2006070560A1 (ja) | 雑音抑圧装置、雑音抑圧方法、雑音抑圧プログラムおよびコンピュータに読み取り可能な記録媒体 | |
CN110169764A (zh) | 一种lms自适应滤波ppg信号心率提取方法 | |
CN117711419B (zh) | 用于数据中台的数据智能清洗方法 | |
CN102314883B (zh) | 一种判断音乐噪声的方法以及语音消噪方法 | |
CN114005457A (zh) | 一种基于幅度估计与相位重构的单通道语音增强方法 | |
WO2020024787A1 (zh) | 音乐噪声抑制方法及装置 | |
CN110197657B (zh) | 一种基于余弦相似度的动态音声特征提取方法 | |
CN111653287A (zh) | 基于dnn和频带内互相关系数的单通道语音增强算法 | |
CN112233657A (zh) | 一种基于低频音节识别的语音增强方法 | |
CN106997766B (zh) | 一种基于宽带噪声的同态滤波语音增强方法 | |
CN111968627A (zh) | 一种基于联合字典学习和稀疏表示的骨导语音增强方法 | |
Selvi et al. | Speech Enhancement using Adaptive Filtering with Different Window Functions and Overlapping Sizes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181123 |
|
RJ01 | Rejection of invention patent application after publication |