CN106328155A - 一种修正先验信噪比过估计的语音增强方法 - Google Patents

一种修正先验信噪比过估计的语音增强方法 Download PDF

Info

Publication number
CN106328155A
CN106328155A CN201610819097.8A CN201610819097A CN106328155A CN 106328155 A CN106328155 A CN 106328155A CN 201610819097 A CN201610819097 A CN 201610819097A CN 106328155 A CN106328155 A CN 106328155A
Authority
CN
China
Prior art keywords
signal
noise ratio
speech
noise
speech enhancement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610819097.8A
Other languages
English (en)
Inventor
谭洪舟
李竺珊
李宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
SYSU CMU Shunde International Joint Research Institute
Original Assignee
Sun Yat Sen University
SYSU CMU Shunde International Joint Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University, SYSU CMU Shunde International Joint Research Institute filed Critical Sun Yat Sen University
Priority to CN201610819097.8A priority Critical patent/CN106328155A/zh
Publication of CN106328155A publication Critical patent/CN106328155A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供的方法通过对先验信噪比与后验信噪比进行修正或重估,使得先验信噪比与后验信噪比能够克服过估计的问题,从而语音增强方法在实际应用中能够起到很好的效果。

Description

一种修正先验信噪比过估计的语音增强方法
技术领域
本发明涉及语音处理技术领域,更具体地,涉及一种修正先验信噪比过估计的语音增强方法。
背景技术
嘈杂环境中,语音不可避免地会受到外界环境噪声的干扰,甚至可能使语音完全淹没在噪声中。外界噪声破坏了语音信号的模型参数和声学特性,从而严重影响语音处理系统的性能,如语音识别、语音编码。因此,语音增强技术被广泛应用于语音处理系统中,对带噪语音进行预处理,使用语音增强技术的目的是从带噪语音中获得尽可能纯净的原始语音。在频域中,目前常用的语音增强方法是基于统计模型的最小均方误差(Minimum MeanSquare Error,MMSE)法。它通过假设不同的语音频谱分布来获得更优的估计,在实际使用过程中,MMSE法的增益函数是一个被先验信噪比(Signal-Noise Ratio,SNR)影响的函数。
在经典的加性噪声模型中,带噪语音信号可表示为x(t)=s(t)+n(t),其中,s(t)表示语音信号,n(t)表示噪声信号。令S(p,k),N(p,k),X(p,k)分别表示语音信号s(t),噪声信号n(t),带噪语音信号x(t)的短时帧p的第k个频谱分量。语音增强的目标是在最小化失真测度条件下,由一系列噪声频谱特征值,找到一个估计器由于对频谱的估计不存在任何直接的解,则首先从噪声特征值中估计推导出SNR。随后,S(p,k)的估计可通过将谱增益G(p,k)作用于每个短时谱成分X(p,k)来获得。这个增益对应于不同的函数(如维纳滤波、MMSE等)。失真测度的选择决定增益行为的好坏。也就是说,在降噪和语音失真中有一个权衡。然而,信噪比的估计是关键的参数,因为在给定的噪声功率谱密度条件下,其决定语音增强的有效性。
大多数经典的语音增强技术要求两个参数的计算,即先验信噪比与后验信噪比。先验信噪比定义为后验信噪比定义为其中E[·]是期望算子。
在实际实现过程中,E[|S(p,k)|2]与E[|N(p,k)|2]的功率谱密度(Power SpectralDensity,PSD)未知,而仅仅是带噪语音的功率谱密度|X(p,k)|2是已知的,则前两者需要被估计。但是在具体实施的时候,由于估计的S(p,k)、N(p,k)数值与实际的数值存在着较大的误差,存在着过估计的问题,使得所计算得到先验信噪比与后验信噪比与实质上的不符,而导致语音增强技术的实际应用效果并不好。
发明内容
本发明为解决以上现有技术的难题,提供了一种修正先验信噪比过估计的语音增强方法,该方法通过对先验信噪比与后验信噪比进行修正或重估,使得先验信噪比与后验信噪比能够克服过估计的问题,从而语音增强方法在实际应用中能够起到很好的效果。
为实现以上发明目的,采用的技术方案是:
一种修正先验信噪比过估计的语音增强方法,包括以下步骤:
S1.将带噪语音信号经过预处理后变换到频域,得到带噪语音信号的频谱分布图;
S2.基于带噪语音信号的频谱分布图使用MMSE法对噪声功率谱进行估计,其中表示噪声信号n(t)的短时帧p的第k个频谱分量;
S3.计算后验信噪比:其中X(p,k)表示带噪语音信号x(t)的短时帧p的第k个频谱分量;
S4.基于后验信噪比SNRpost(p,k)使用判决引导法来对先验信噪比进行估计;
S5.对后验信噪比进行重估:
其中δ、为设定的参数;
S6.对先验信噪比进行修正:
S7.基于重估的后验信噪比与修正的先验信噪比来计算频谱增益GMMSE(p,k)
S8.将频谱增益作用于带噪语音信号,则得到增强语音信号
| S ^ ( p , k ) | = G M M S E ( p , k ) | X ( p , k ) | :
S9.将进行处理变换到时域从而输出增强的语音信号。
优选地,所述步骤S4可用下式表示:
S N ^ R p r i o ( p , k ) = ξ p , k = β | S ^ ( p - 1 , k ) | 2 γ ^ n ( p , k ) + ( 1 - β ) P [ γ p , k - 1 ]
其中,P[·]表示半波整流,表示估计的短时帧p-1的第k个语音频谱分量,β=0.98。
优选地,所述GMMSE(p,k)表示如下:
其中Ei[·]表示指数积分,I0(·)和I1(·)表示第零阶和第一阶修正贝塞尔函数。
优选地,所述δ≈-6dB。
优选地,所述步骤S1的预处理包括依次执行的分帧、加窗和傅里叶变换处理。
优选地,所述步骤S9的处理包括依次执行的傅里叶逆变换、去窗和合帧处理。
与现有技术相比,本发明的有益效果是:
本发明提供的方法通过对先验信噪比与后验信噪比进行修正或重估,使得先验信噪比与后验信噪比能够克服过估计的问题,从而语音增强方法在实际应用中能够起到很好的效果。
附图说明
图1为方法的流程图。
图2为估计的先验信噪比和后验信噪比的二元分布图。
图3为重估后验信噪比后先验信噪比和后验信噪比的二元分布图。
图4为修正先验信噪比后先验信噪比和后验信噪比的二元分布图。
图5为改进RFSNR(过估计修正后)之前与之后的语音时频图(包括纯净语音、带噪语音、增强语音)
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
以下结合附图和实施例对本发明做进一步的阐述。
实施例1
如图1所示,图1为本发明提供的方法的流程示意图,本发明提供的方法具体包括以下步骤:
第一步、首先,带噪语音信号经过采样(采样频率8000HZ)、分帧(140*129)、加窗、傅里叶变换到频域。经过这些预处理后,用MMSE法估计噪声功率谱,带噪语音信号已知。
第二步、其次,分别根据如后两式计算后验信噪比与先验信噪比,
S N ^ R p o s t ( p , k ) = γ p , k = | X ( p , k ) | 2 γ ^ n ( p , k ) ,
其中,β=0.98。
上述方案中,本发明提供的方法在对后验信噪比与先验信噪比进行计算时,采用的是DD法。如图2所示,图2为估计的先验信噪比和后验信噪比的二元分布图。
第三步、接着,将后验信噪比进行重估,如式
其中,δ≈-6dB。
如图3所示,即为重估后验信噪比之后,先验信噪比和后验信噪比的二元分布。该方法被称为可靠后验信噪比技术(RFSNR)。
第四步、对有偏的先验信噪比进行修正:
如图4所示,即为修正先验信噪比后,先验信噪比和后验信噪比的二元分布。该方法被称为改进的可靠后验信噪比技术(改进的RFSNR)。
第五步、基于重估的后验信噪比与修正的先验信噪比来计算频谱增益,采用MMSE的增益函数,
第六步、最后,将频谱增益作用于带噪语音信号,则得到增强语音信号,
| S ^ ( p , k ) | = G M M S E ( p , k ) | X ( p , k ) | .
如图5,纯净语音被车站噪声(SNR=10)破坏后得到的带噪语音,从其纯净语音、带噪语音、增强语音的时频图明显可以看出带噪语音被增强。
第七步、对带噪语音信号进行傅里叶逆变换、去窗、合帧(17967*1),则可输出增强的语音信号,可对语音进行主观听觉测试。
如表一所示,在不同的噪声环境以及输入SNR情况下,由分段信噪比客观评价DD、RFSNR、改进的RFSNR降噪算法,明显看出改进的RFSNR的优势。
表一
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (6)

1.一种修正先验信噪比过估计的语音增强方法,其特征在于:包括以下步骤:
S1.将带噪语音信号经过预处理后变换到频域,得到带噪语音信号的频谱分布图;
S2.基于带噪语音信号的频谱分布图使用MMSE法对噪声功率谱进行估计,其中表示噪声信号n(t)的短时帧p的第k个频谱分量;
S3.计算后验信噪比:其中X(p,k)表示带噪语音信号x(t)的短时帧p的第k个频谱分量;
S4.基于后验信噪比SNRpost(p,k)使用判决引导法来对先验信噪比进行估计;
S5.对后验信噪比进行重估:
其中δ、为设定的参数;
S6.对先验信噪比进行修正:
S7.基于重估的后验信噪比与修正的先验信噪比来计算频谱增益GMMSE(p,k)
S8.将频谱增益作用于带噪语音信号,则得到增强语音信号
| S ^ ( p , k ) | = G M M S E ( p , k ) | X ( p , k ) | :
S9.将进行处理变换到时域从而输出增强的语音信号。
2.根据权利要求1所述的修正先验信噪比过估计的语音增强方法,其特征在于:所述步骤S4可用下式表示:
S N ^ R p r i o ( p , k ) = ξ p , k = β | S ^ ( p - 1 , k ) | 2 γ ^ n ( p , k ) + ( 1 - β ) P [ γ p , k - 1 ]
其中,P[·]表示半波整流,表示估计的短时帧p-1的第k个语音频谱分量,β=0.98。
3.根据权利要求1所述的修正先验信噪比过估计的语音增强方法,其特征在于:所述GMMSE(p,k)表示如下:
其中Ei[·]表示指数积分,I0(·)和I1(·)表示第零阶和第一阶修正贝塞尔函数。
4.根据权利要求1所述的修正先验信噪比过估计的语音增强方法,其特征在于:所述δ≈-6dB。
5.根据权利要求1~4任一项所述的修正先验信噪比过估计的语音增强方法,其特征在于:所述步骤S1的预处理包括依次执行的分帧、加窗和傅里叶变换处理。
6.根据权利要求5所述的修正先验信噪比过估计的语音增强方法,其特征在于:所述步骤S9的处理包括依次执行的傅里叶逆变换、去窗和合帧处理。
CN201610819097.8A 2016-09-13 2016-09-13 一种修正先验信噪比过估计的语音增强方法 Pending CN106328155A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610819097.8A CN106328155A (zh) 2016-09-13 2016-09-13 一种修正先验信噪比过估计的语音增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610819097.8A CN106328155A (zh) 2016-09-13 2016-09-13 一种修正先验信噪比过估计的语音增强方法

Publications (1)

Publication Number Publication Date
CN106328155A true CN106328155A (zh) 2017-01-11

Family

ID=57787178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610819097.8A Pending CN106328155A (zh) 2016-09-13 2016-09-13 一种修正先验信噪比过估计的语音增强方法

Country Status (1)

Country Link
CN (1) CN106328155A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107393553A (zh) * 2017-07-14 2017-11-24 深圳永顺智信息科技有限公司 用于语音活动检测的听觉特征提取方法
CN108133711A (zh) * 2018-01-24 2018-06-08 成都创信特电子技术有限公司 具有降噪模块的数字信号监测设备
CN108257607A (zh) * 2018-01-24 2018-07-06 成都创信特电子技术有限公司 一种多通道语音信号处理方法
CN108281154A (zh) * 2018-01-24 2018-07-13 成都创信特电子技术有限公司 一种语音信号的降噪方法
CN110970051A (zh) * 2019-12-06 2020-04-07 广州国音智能科技有限公司 语音数据采集方法、终端及可读存储介质
CN111182431A (zh) * 2019-12-27 2020-05-19 中山大学花都产业科技研究院 一种会议扩声系统啸叫抑制方法
CN113744725A (zh) * 2021-08-19 2021-12-03 清华大学苏州汽车研究院(相城) 一种语音端点检测模型的训练方法及语音降噪方法
CN115881155A (zh) * 2022-12-02 2023-03-31 宁波硕正电子科技有限公司 一种瞬态噪声抑制方法、装置、设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090226005A1 (en) * 2005-12-22 2009-09-10 Microsoft Corporation Spatial noise suppression for a microphone array
CN101582264A (zh) * 2009-06-12 2009-11-18 瑞声声学科技(深圳)有限公司 语音增强的方法及语音增加的声音采集系统
CN101599274A (zh) * 2009-06-26 2009-12-09 瑞声声学科技(深圳)有限公司 语音增强的方法
CN101673550A (zh) * 2008-09-09 2010-03-17 联芯科技有限公司 谱增益计算方法、装置以及噪声抑制系统
CN101763858A (zh) * 2009-10-19 2010-06-30 瑞声声学科技(深圳)有限公司 双麦克风信号处理方法
CN101853665A (zh) * 2009-06-18 2010-10-06 博石金(北京)信息技术有限公司 语音中噪声的消除方法
CN101976565A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
CN102074246A (zh) * 2011-01-05 2011-05-25 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
CN102074245A (zh) * 2011-01-05 2011-05-25 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及语音增强方法
CN103871421A (zh) * 2014-03-21 2014-06-18 厦门莱亚特医疗器械有限公司 一种基于子带噪声分析的自适应降噪方法与系统
CN105280193A (zh) * 2015-07-20 2016-01-27 广东顺德中山大学卡内基梅隆大学国际联合研究院 基于mmse误差准则的先验信噪比估计方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090226005A1 (en) * 2005-12-22 2009-09-10 Microsoft Corporation Spatial noise suppression for a microphone array
CN101673550A (zh) * 2008-09-09 2010-03-17 联芯科技有限公司 谱增益计算方法、装置以及噪声抑制系统
CN101582264A (zh) * 2009-06-12 2009-11-18 瑞声声学科技(深圳)有限公司 语音增强的方法及语音增加的声音采集系统
CN101853665A (zh) * 2009-06-18 2010-10-06 博石金(北京)信息技术有限公司 语音中噪声的消除方法
CN101599274A (zh) * 2009-06-26 2009-12-09 瑞声声学科技(深圳)有限公司 语音增强的方法
CN101763858A (zh) * 2009-10-19 2010-06-30 瑞声声学科技(深圳)有限公司 双麦克风信号处理方法
CN101976565A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
CN102074246A (zh) * 2011-01-05 2011-05-25 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
CN102074245A (zh) * 2011-01-05 2011-05-25 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及语音增强方法
CN103871421A (zh) * 2014-03-21 2014-06-18 厦门莱亚特医疗器械有限公司 一种基于子带噪声分析的自适应降噪方法与系统
CN105280193A (zh) * 2015-07-20 2016-01-27 广东顺德中山大学卡内基梅隆大学国际联合研究院 基于mmse误差准则的先验信噪比估计方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CYRIL PLAPOUS 等: "NOISE REDUCTION USING RELIABLE A POSTERIORI SIGNAL-TO-NOISE RATIO FEATURES", 《14TH EUROPEAN SIGNAL PROCESSING CONFERENCE》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107393553A (zh) * 2017-07-14 2017-11-24 深圳永顺智信息科技有限公司 用于语音活动检测的听觉特征提取方法
CN108133711A (zh) * 2018-01-24 2018-06-08 成都创信特电子技术有限公司 具有降噪模块的数字信号监测设备
CN108257607A (zh) * 2018-01-24 2018-07-06 成都创信特电子技术有限公司 一种多通道语音信号处理方法
CN108281154A (zh) * 2018-01-24 2018-07-13 成都创信特电子技术有限公司 一种语音信号的降噪方法
CN108257607B (zh) * 2018-01-24 2021-05-18 成都创信特电子技术有限公司 一种多通道语音信号处理方法
CN108133711B (zh) * 2018-01-24 2021-05-18 成都创信特电子技术有限公司 具有降噪模块的数字信号监测设备
CN108281154B (zh) * 2018-01-24 2021-05-18 成都创信特电子技术有限公司 一种语音信号的降噪方法
CN110970051A (zh) * 2019-12-06 2020-04-07 广州国音智能科技有限公司 语音数据采集方法、终端及可读存储介质
CN111182431A (zh) * 2019-12-27 2020-05-19 中山大学花都产业科技研究院 一种会议扩声系统啸叫抑制方法
CN113744725A (zh) * 2021-08-19 2021-12-03 清华大学苏州汽车研究院(相城) 一种语音端点检测模型的训练方法及语音降噪方法
CN113744725B (zh) * 2021-08-19 2024-07-05 清华大学苏州汽车研究院(相城) 一种语音端点检测模型的训练方法及语音降噪方法
CN115881155A (zh) * 2022-12-02 2023-03-31 宁波硕正电子科技有限公司 一种瞬态噪声抑制方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN106328155A (zh) 一种修正先验信噪比过估计的语音增强方法
US11056130B2 (en) Speech enhancement method and apparatus, device and storage medium
Mittal et al. Signal/noise KLT based approach for enhancing speech degraded by colored noise
CN101853666B (zh) 一种语音增强的方法和装置
CN110634500B (zh) 一种先验信噪比的计算方法、电子设备及存储介质
CN107680609A (zh) 一种基于噪声功率谱密度的双通道语音增强方法
CN105489226A (zh) 一种用于拾音器的多窗谱估计的维纳滤波语音增强方法
CN103632677A (zh) 带噪语音信号处理方法、装置及服务器
CN104427143B (zh) 残留回声检测方法及系统
Yang et al. A noise reduction method based on LMS adaptive filter of audio signals
CN107731242B (zh) 一种广义最大后验的谱幅度估计的增益函数语音增强方法
Zou et al. Speech signal enhancement based on MAP algorithm in the ICA space
CN109087657B (zh) 一种应用于超短波电台的语音增强方法
US10453469B2 (en) Signal processor
CN107045874A (zh) 一种基于相关性的非线性语音增强方法
CN108711432A (zh) 一种单麦克风的感知增益函数的语音增强方法
CN105869649A (zh) 感知滤波方法和感知滤波器
Gui et al. Adaptive subband Wiener filtering for speech enhancement using critical-band gammatone filterbank
Wei et al. Laplacian-Gaussian mixture based dual-gain wiener filter for speech enhancement
Islam et al. Enhancement of noisy speech based on decision-directed Wiener approach in perceptual wavelet packet domain
Sumithra et al. Wavelet based speech signal de-noising using hybrid thresholding
CN108696791A (zh) 一种单麦克风的组合感知增益函数语音增强方法
Khalil et al. Enhancement of speech signals using multiple statistical models
Zhu et al. Robust speech analysis in noisy environment using running spectrum filtering
CN115685071A (zh) 一种基于最大期望算法的语音信号达到时差估算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170111

RJ01 Rejection of invention patent application after publication