CN108877826A - 一种基于多窗谱的语音减噪方法 - Google Patents

一种基于多窗谱的语音减噪方法 Download PDF

Info

Publication number
CN108877826A
CN108877826A CN201810996691.3A CN201810996691A CN108877826A CN 108877826 A CN108877826 A CN 108877826A CN 201810996691 A CN201810996691 A CN 201810996691A CN 108877826 A CN108877826 A CN 108877826A
Authority
CN
China
Prior art keywords
spectrum
voice
windows
frame
method based
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810996691.3A
Other languages
English (en)
Inventor
龙华
商林松
邵玉斌
杜庆治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201810996691.3A priority Critical patent/CN108877826A/zh
Publication of CN108877826A publication Critical patent/CN108877826A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本发明涉及一种基于多窗谱的语音减噪方法,属于音频信号处理技术领域。本发明通过使用多窗谱具有较小偏差和方差,从含噪语音的多窗谱来估计噪声,使得先验信噪比具有较小的方差,从而有利于噪声的消除,将其引入到谱减法中,使得噪声估计的偏差较小,并且在对语音进行傅里叶变换得到的幅度进行平滑处理,计算谱减后的幅值,最终进行傅里叶反变换得到减噪后的语音,减噪后的语音更接近纯净语音。

Description

一种基于多窗谱的语音减噪方法
技术领域
本发明涉及一种基于多窗谱的语音减噪方法,属于音频信号处理技术领域。
背景技术
语音减噪属于语音增强技术,其本质就是语音降噪,换句话说,日常生活中,麦克风采集的语音通常是带有不同噪声的“污染”语音,语音增强的主要目的就是从这些被“污染”的带噪语音中恢复出我们想要的干净语音。
为了抑制语音中的噪声,学者们提出过一些语音增强方法。谱减法就是其中的一种,谱减法存在对噪声谱估计不准的缺点。
发明内容
本发明要解决的技术问题是:提供一种基于多窗谱的语音减噪方法,通过引入多窗谱对谱减法进行改进,同时对傅里叶变换后的幅值进行平滑处理,使得噪声大大降低,最终提取出的语音更接近纯净语音。
本发明采用的技术方案是:一种基于多窗谱的语音减噪方法,该方法包括以下步骤:
(1)语音采集:采集语音;
(2)语音信号的预处理:主要包括分帧、加窗处理;
(3)对预处理后的信号进行快速傅里叶变换(FFT),分别求其幅度谱|Xi(k)|和相位谱θi(k),在相邻帧之间做平滑处理,计算平均幅度谱
(4)将预处理后的信号进行多窗谱估计,得到多窗谱功率谱密度P(k,i);
(5)对多窗谱功率谱密度估计值进行相邻帧之间的平滑处理,计算出平均功率谱密度Py(k,i);
(6)计算出噪声平均功率谱密度Pn(k);
(7)计算增益因子g(k,i);
(8)通过增益因子和平均幅度求得谱减后的幅度谱
(9)通过快速傅里叶反变换(IFFT)得到减噪后的语音信号
具体地,所述步骤(1)中的语音采集,在通过专业音频软件采集信号时,采样率fs≥2fh,fh为信号最高频率,设置声道数为单声道,采样频率为8000Hz,量化精度为16bit。
具体地,所述步骤(2)中预处理包括以下步骤:
(1)分帧:因为语音信号为短时平稳信号,所以需要进行分帧处理,以便把每一帧当成平稳信号处理。同时为了减少帧与帧之间的变化,相邻帧之间取重叠。一般帧长取25ms,帧移取帧长的一半。
(2)加窗:加窗之后是为了进行傅里叶展开,使全局更加连续,避免出现吉布斯效应,加窗之后,原本没有周期性的语音信号呈现出周期函数的部分特征。在语音信号分析中,常用的窗函数有矩形窗、海宁窗和汉明窗。
具体地,所述步骤(3)中,平均幅度谱的计算公式如下:
以i帧为中心前后各取M帧,共有2M+1帧进行平均。
具体地,所述步骤(4)中,多窗谱定义如下:
式中,L为数据窗个数;为k个数据窗的谱:
式中;x(n)为数据序列;N为序列长度,ak(n)为第k个数据窗,
多窗谱功率谱密度计算公式如下:
P(k,i)=PMTM[xi(m)]。
具体地,所述步骤(5)中,平均功率谱密度计算公式如下:
公式中以i帧为中心前后各取M帧,共有2M+1帧进行平均。
具体地,所述步骤(6)中,噪声平均功率谱密度计算公式如下:
具体地,所述步骤(7)中,增益因子计算公式如下:
α为过减增益因子,β为增益补偿因子。
具体地,所述步骤(8)中,幅度谱计算公式如下:
具体地,所述步骤(9)中,傅里叶反变换公式如下:
本发明的有益效果是:本发明将多窗谱引入到谱减法中,对谱减法进行了改进,使原来对噪声的估计误差减小,同时将傅里叶变换后的幅值进行平滑处理,最终使得处理后的语音跟接近纯净语音。
附图说明
图1是本发明流程图。
具体实施方式
下面通过附图和具体实施例对本发明作进一步详细说明,但本发明的保护范围不局限于所述内容。
实施例1:如图1所示,一种基于多窗谱的语音减噪方法,包括以下步骤:
(1)语音采集:采集语音;
(2)需要设置声道数,当采集语音信号时,设置为单声道,当采样频率满足奈奎斯特采样定理,采样率fs≥2fh,fh为信号最高频率,采样频率设置为8000Hz,量化精度为16bit;
(3)分帧:因为语音信号为短时平稳信号,所以需要进行分帧处理,以便把每一帧当成平稳信号处理。同时为了减少帧与帧之间的变化,相邻帧之间取重叠。一般帧长取25ms,帧移取帧长的一半;
(4)加窗:加窗之后是为了进行傅里叶展开,使全局更加连续,避免出现吉布斯效应,加窗之后,原本没有周期性的语音信号呈现出周期函数的部分特征。在语音信号分析中,常用的窗函数有矩形窗、海宁窗和汉明窗;
(5)对预处理后的信号进行快速傅里叶变换(FFT),分别求其幅度谱|Xi(k)|和相位谱θi(k),在相邻帧之间做平滑处理,计算平均幅度谱平均幅度谱计算公式如下:
以i帧为中心前后各取M帧,共有2M+1帧进行平均。
(6)将预处理后的信号进行多窗谱估计,得到多窗谱功率谱密度P(k,i)。多窗谱定义如下:
式中,L为数据窗个数;为k个数据窗的谱:
式中;x(n)为数据序列;N为序列长度,ak(n)为第k个数据窗;
多窗谱功率谱密度计算公式如下:
P(k,i)=PMTM[xi(m)]。
(7)对多窗谱功率谱密度估计值进行相邻帧之间的平滑处理,计算出平均功率谱密度Py(k,i)。平均功率谱密度计算公式如下:
公式中以i帧为中心前后各取M帧,共有2M+1帧进行平均。
(8)计算出噪声平均功率谱密度Pn(k),计算公式如下:
(9)计算增益因子g(k,i),计算公式如下:
(10)通过增益因子和平均幅度求得谱减后的幅度谱计算公式如下:
(11)通过快速傅里叶反变换(IFFT)得到减噪后的语音信号计算公式如下:
多窗谱是一种非参数谱估计方法,相对于传统的周期图法,多窗谱具有更小的偏差和方差,是一致估计,本发明利用谱减法方差小的特点,从含噪语音的多窗谱来估计噪声,使得先验信噪比具有较小的方差,从而有利于噪声的消除。本发明通过使用多窗谱对谱减法进行改进,同时对傅里叶变换后的幅值进行平滑处理,可以进一步的降低噪声。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (10)

1.一种基于多窗谱的语音减噪方法,其特征在于:包括如下步骤:
(1)语音采集:采集语音;
(2)语音信号的预处理:包括分帧、加窗处理;
(3)对预处理后的信号进行快速傅里叶变换FFT,分别求其幅度谱|Xi(k)|和相位谱θi(k),在相邻帧之间做平滑处理,计算平均幅度谱
(4)将预处理后的信号进行多窗谱估计,得到多窗谱功率谱密度P(k,i);
(5)对多窗谱功率谱密度估计值进行相邻帧之间的平滑处理,计算出平均功率谱密度Py(k,i);
(6)计算出噪声平均功率谱密度Pn(k);
(7)计算增益因子g(k,i);
(8)通过增益因子和平均幅度求得谱减后的幅度谱
(9)通过快速傅里叶反变换IFFT得到减噪后的语音信号
2.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(1)中的语音采集通过专业的音频采集软件进行采集,声道数为单声道,采样频率满足奈奎斯特采样定理,采样率fs≥2fh,fh为信号最高频率。
3.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(2)分帧采用的帧长为128,帧移为64,加窗处理中窗函数采用汉宁窗。
4.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(3)中,平均幅度谱的计算公式如下:
以i帧为中心前后各取M帧,共有2M+1帧进行平均。
5.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(4)中,多窗谱功率谱密度计算公式如下:
P(k,i)=PMTM[xi(m)]。
6.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(5)中,平均功率谱密度计算公式如下:
公式中以i帧为中心前后各取M帧,共有2M+1帧进行平均。
7.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(6)中,噪声平均功率谱密度计算公式如下:
8.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(7)中,增益因子计算公式如下:
α为过减增益因子,β为增益补偿因子。
9.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(8)中,幅度谱计算公式如下:
10.根据权利要求1所述的一种基于多窗谱的语音减噪方法,其特征在于:所述步骤(9)中,傅里叶反变换公式如下:
CN201810996691.3A 2018-08-29 2018-08-29 一种基于多窗谱的语音减噪方法 Pending CN108877826A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810996691.3A CN108877826A (zh) 2018-08-29 2018-08-29 一种基于多窗谱的语音减噪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810996691.3A CN108877826A (zh) 2018-08-29 2018-08-29 一种基于多窗谱的语音减噪方法

Publications (1)

Publication Number Publication Date
CN108877826A true CN108877826A (zh) 2018-11-23

Family

ID=64322368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810996691.3A Pending CN108877826A (zh) 2018-08-29 2018-08-29 一种基于多窗谱的语音减噪方法

Country Status (1)

Country Link
CN (1) CN108877826A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102818A (zh) * 2018-08-29 2018-12-28 昆明理工大学 一种基于信号频率概率密度函数分布的去噪音频采样算法
CN109319351A (zh) * 2018-11-28 2019-02-12 广州市煌子辉贸易有限公司 一种具有声音识别功能的智能垃圾桶
CN109507510A (zh) * 2018-11-28 2019-03-22 深圳桓轩科技有限公司 一种变压器故障诊断系统
CN109798611A (zh) * 2018-11-28 2019-05-24 福建澳尤机电有限公司 一种蒸发式环保空调
CN111091833A (zh) * 2019-12-09 2020-05-01 浙江工业大学 一种降低噪声影响的端点检测方法
CN112562716A (zh) * 2020-12-03 2021-03-26 兰州交通大学 基于神经网络的语音增强方法、装置、终端和介质
WO2021114733A1 (zh) * 2019-12-10 2021-06-17 展讯通信(上海)有限公司 一种分频段进行处理的噪声抑制方法及其系统
CN113726458A (zh) * 2021-08-25 2021-11-30 中国电子科技集团公司第五十四研究所 一种低信噪比下水声通信信号实时检测提取方法
CN117786320A (zh) * 2023-12-27 2024-03-29 长春国地探测仪器工程技术股份有限公司 一种基于多窗谱谱减法的分布式光纤声波传感数据消噪方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102818A (zh) * 2018-08-29 2018-12-28 昆明理工大学 一种基于信号频率概率密度函数分布的去噪音频采样算法
CN109102818B (zh) * 2018-08-29 2022-10-21 昆明理工大学 一种基于信号频率概率密度函数分布的去噪音频采样算法
CN109319351A (zh) * 2018-11-28 2019-02-12 广州市煌子辉贸易有限公司 一种具有声音识别功能的智能垃圾桶
CN109507510A (zh) * 2018-11-28 2019-03-22 深圳桓轩科技有限公司 一种变压器故障诊断系统
CN109798611A (zh) * 2018-11-28 2019-05-24 福建澳尤机电有限公司 一种蒸发式环保空调
CN111091833A (zh) * 2019-12-09 2020-05-01 浙江工业大学 一种降低噪声影响的端点检测方法
WO2021114733A1 (zh) * 2019-12-10 2021-06-17 展讯通信(上海)有限公司 一种分频段进行处理的噪声抑制方法及其系统
CN112562716A (zh) * 2020-12-03 2021-03-26 兰州交通大学 基于神经网络的语音增强方法、装置、终端和介质
CN113726458A (zh) * 2021-08-25 2021-11-30 中国电子科技集团公司第五十四研究所 一种低信噪比下水声通信信号实时检测提取方法
CN113726458B (zh) * 2021-08-25 2022-07-01 中国电子科技集团公司第五十四研究所 一种低信噪比下水声通信信号实时检测提取方法
CN117786320A (zh) * 2023-12-27 2024-03-29 长春国地探测仪器工程技术股份有限公司 一种基于多窗谱谱减法的分布式光纤声波传感数据消噪方法

Similar Documents

Publication Publication Date Title
CN108877826A (zh) 一种基于多窗谱的语音减噪方法
CN108831499B (zh) 利用语音存在概率的语音增强方法
US11056130B2 (en) Speech enhancement method and apparatus, device and storage medium
US6122610A (en) Noise suppression for low bitrate speech coder
CN106340292B (zh) 一种基于连续噪声估计的语音增强方法
KR100304666B1 (ko) 음성 향상 방법
CN111128213B (zh) 一种分频段进行处理的噪声抑制方法及其系统
CN110085249A (zh) 基于注意力门控的循环神经网络的单通道语音增强方法
CN103021420B (zh) 一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法
CN105390142B (zh) 一种数字助听器语音噪声消除方法
CN108735225A (zh) 一种基于人耳掩蔽效应与贝叶斯估计的改进谱减方法
CN108899052B (zh) 一种基于多带谱减法的帕金森语音增强方法
JPH10513273A (ja) スペクトル減算雑音抑止方法
WO2006070560A1 (ja) 雑音抑圧装置、雑音抑圧方法、雑音抑圧プログラムおよびコンピュータに読み取り可能な記録媒体
CN110169764A (zh) 一种lms自适应滤波ppg信号心率提取方法
CN117711419B (zh) 用于数据中台的数据智能清洗方法
CN102314883B (zh) 一种判断音乐噪声的方法以及语音消噪方法
CN114005457A (zh) 一种基于幅度估计与相位重构的单通道语音增强方法
WO2020024787A1 (zh) 音乐噪声抑制方法及装置
CN110197657B (zh) 一种基于余弦相似度的动态音声特征提取方法
CN111653287A (zh) 基于dnn和频带内互相关系数的单通道语音增强算法
CN112233657A (zh) 一种基于低频音节识别的语音增强方法
CN106997766B (zh) 一种基于宽带噪声的同态滤波语音增强方法
CN111968627A (zh) 一种基于联合字典学习和稀疏表示的骨导语音增强方法
Selvi et al. Speech Enhancement using Adaptive Filtering with Different Window Functions and Overlapping Sizes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181123

RJ01 Rejection of invention patent application after publication