CN105788606A - 一种用于拾音器的基于递归最小追踪的噪声估计方法 - Google Patents

一种用于拾音器的基于递归最小追踪的噪声估计方法 Download PDF

Info

Publication number
CN105788606A
CN105788606A CN201610199809.0A CN201610199809A CN105788606A CN 105788606 A CN105788606 A CN 105788606A CN 201610199809 A CN201610199809 A CN 201610199809A CN 105788606 A CN105788606 A CN 105788606A
Authority
CN
China
Prior art keywords
noise
cpsd
algorithm
imt
noisy speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610199809.0A
Other languages
English (en)
Inventor
赖锦培
张正文
高铭泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Kanglide Technology Co Ltd
Original Assignee
Wuhan Kanglide Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Kanglide Technology Co Ltd filed Critical Wuhan Kanglide Technology Co Ltd
Priority to CN201610199809.0A priority Critical patent/CN105788606A/zh
Publication of CN105788606A publication Critical patent/CN105788606A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明提供一种用于拾音器的基于递归最小追踪的噪声估计方法。该方法中的平滑因子使用了递归平均技术,在估计噪声互功率谱时,该平滑因子会根据每个频点的实际信噪比作相应的调整。仿真结果表明,本发明的噪声估计方法应用于一个语音增强系统时,取得了较小的噪声均方估计误差及较好的感知语音质量评价(PESQ)得分。

Description

一种用于拾音器的基于递归最小追踪的噪声估计方法
技术领域
本发明涉及应用于拾音器语音增强系统的噪声估计方法,尤其涉及一种基于递归最小追踪的噪声互功率谱估计方法,属于语音信号处理中语音增强技术领域。
背景技术
二元麦克风语音增强系统,应用于免提系统、助听器以及人工耳蜗等系统中时,具有独特的优势。目前,相干性滤波器已被很好的应用于二元麦克风语音增强系统中。然而,当两个麦克风之间的距离比较近时,两个通道将的噪声将呈现出相关性,此时相干性滤波器的消噪性能将大为降低。此时,若能求出噪声间的互功率谱密度(cross power spectraldensity,CPSD)将有效的解决这一问题。
Fathi以二元麦克风系统为基础提出了一种改进最小追踪(improved minimumtracking, IMT)噪声CPSD估计方法(KALLEL F, GHORBEL M, FRIKHA M, et al. A noisecross PSD estimator based on improved minimum statistics method for two-microphone speech enhancement dedicated to a bilateral cochlear implant [J].Applied Acoustics, 2012, 73(3): 256-264.),无需借助语音检测技术,无论在有声或无声时都能对噪声CPSD进行更新。但是该算法所估计的噪声CPSD无法快速跟踪噪声的变化,在语音的活动期会出现噪声过估计的现象。
信号模型:两个麦克风接收到的带噪语音信号可表示为:
(1)
其中“i”表示麦克风的序号,yi(n),si(n)和vi(n)分别表示带噪语音,纯净语音信号和噪声信号。对式(1)两边做短时傅里叶变换使其变成频域形式:
(2)
其中ω表示频率因子,k表示帧因子。
IMT噪声CPSD估计算法:IMT噪声CPSD估计算法是基于这样一个假设,即哪怕在语音活动期间,单个频带的带噪语音信号功率通常都会衰减到噪声的功率水平。因此通过在每个频带跟踪带噪语音的最小值,可以得到该频带噪声水平的一个粗略估计。图1展示的就是一个基于IMT算法的语音增强系统。
IMT算法首先通过以下递归式对带噪语音进行短时平滑:
(3)
然后IMT算法在每个频点对带噪语音CPSD的最小值(RV1V2min(ω,k))进行跟踪,用公式表达为:
(4)
带噪语音CPSD的最小值RV1V2min(ω,k)与噪声CPSD的估计值PV1V2(ω,k)之间的关系为:
(5)
其中Bmin为偏置参数。
对IMT算法的研究发现,IMT算法会连续的对带噪语音CPSD进行平滑,而不管是否有语音存在。因此无论噪声CPSD是否增加,只要带噪语音的CPSD变大,噪声CPSD估计也会跟着变大。这主要是由于公式(4)的第二项,它实现了一个一阶差分运算,可以视为离散情况下对求导的一种近似。当带噪语音CPSD出现很窄的峰值的时候,此时会有很大的导数值,噪声估计会突然的大幅变大。因而在语音活动期间,IMT算法会对噪声过估计。而在语音高能量段的噪声过估计会导致其后紧跟的低能量的语音段被抑制。
有鉴于此,有必要提供一种用于拾音器的基于递归最小追踪的噪声估计方法,以解决上述问题。
发明内容
本发明的目的是:针对上述问题,本发明通过引入时间递归平均算法予以克服,提出一种基于递归最小追踪的噪声互功率谱估计方法。该方法在估计噪声CPSD时,其迭代公式中的平滑因子采用递归平均技术,会根据每个频点的实际信噪比而自适应的改变。不同环境下的仿真结果表明,与IMT噪声CPSD估计算法相比,本发明提出的方法估计的噪声CPSD更加准确,应用于语音增强系统中对语音的增强效果也更好。
本发明所采用的技术方案是:一种用于拾音器的基于递归最小追踪的噪声估计方法,其特征在于,包括如下步骤:
1)建立信号模型:两个麦克风接收到的带噪语音信号可以表示为:
(1)
其中,“i”表示麦克风的序号,yi(n),si(n)和vi(n)分别表示带噪语音,纯净语音信号和噪声信号;对式(1)两边做短时傅里叶变换使其变成频域形式:
(2)
其中,ω表示频率因子,k表示帧因子;
2)采用IMT噪声CPSD估计算法:其原理是通过在每个频带跟踪带噪语音的最小值,可以得到该频带噪声水平的一个粗略估计,其中:
IMT算法首先通过以下递归式对带噪语音进行短时平滑:
(3)
然后IMT算法在每个频点对带噪语音CPSD的最小值(RV1V2min(ω,k))进行跟踪,用公式表达为:
(4)
带噪语音CPSD的最小值RV1V2min(ω,k)与噪声CPSD的估计值PV1V2(ω,k)之间的关系为:
(5)
其中,Bmin为偏置参数;
3)将步骤2)中IMT算法的平滑因子替换为后验信噪比的sigmoid函数:
(6)
其中,β参数的一般的取值范围为15≤β≤30,但在实际情况中可能会远远超出这个范围;λ(ω,k)为平滑因子,而γ(ω,k)则是后验信噪比的近似:
(7)
式(7)中的分母为过去10帧的噪声功率谱估计值的平均;对公式(7)进行调整以用于二元麦克风系统中:
(8)
将上述递归平均技术用于步骤2)中的IMT算法中可得:
(9)。
本发明的有益效果是:将本方法应用于拾音器中,相比已有的语音增强系统的噪声估计方法,本发明针对IMT噪声CPSD估计方法为基础,引入递归平滑技术,得出了一种基于递归最小追踪的噪声CPSD估计方法。因为采用了递归平滑因子,该方法克服了IMT方法所存在的噪声过估计的问题,所得到的噪声CPSD估计更加准确。仿真结果表明,较之于IMT方法,无论是噪声CPSD估计的准确性还是增强后语音的质量,本发明提出的方法都取得了更好的仿真结果。
附图说明
图1是IMT噪声CPSD估计方法的原理图。
图2是本发明的平滑因子λ(ω,k)和后验信噪比γ(ω,k)间的函数关系曲线。
具体实施方式
为了更好地理解本发明,下面结合实施例进一步阐明本发明的内容,但本发明的内容不仅仅局限于下面的实施例。本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样在本申请所列权利要求书限定范围之内。
为克服背景技术的问题,本发明采用一种递归最小追踪的改进算法。该算法利用了噪声对语音频谱影响不均匀的现象。这一现象是指语音的有些频谱区域受噪声影响比其他一些区域所受影响更大,不同频谱的分量极有可能具有不同的实际信噪比。因此,可以对噪声的CPSD按单个频带进行估计和更新。LIN以单通道为基础提出一种递归平均技术(LINL, HOLMES W H, AMBIKAIRAJAH E. Adaptive noise estimation algorithm for speechenhancement[J]. Electronics Letters, 2003, 39(9):754-755.),平滑因子使用了后验信噪比的sigmoid函数:
(6)
其中β参数的一般的取值范围为15≤β≤30,但在实际情况中可能会远远超出这个范围。而γ(ω,k)则是后验信噪比的近似:
(7)
式(7)中的分母为过去10帧的噪声功率谱估计值的平均。对公式(7)进行调整以用于二元麦克风系统中:
(8)
将上述递归平均技术用于IMT算法中可得:
(9)
公式(6)中所描述的平滑因子λ(ω,k)和后验信噪比γ(ω,k)间的函数关系曲线如图2所示。
虽然采用不同的β值计算得到的λ(ω,k)与γ(ω,k)的函数曲线不同,但是他们却有一个共同的特征:当后验信噪比γ(ω,k)较大的时候,λ(ω,k)→1;当后验信噪比γ(ω,k)取较小值的时候,λ(ω,k)→0。所以公式(9)可以做如下解释:如果存在语音,即在语音的活动期,后验信噪比估计γ(ω,k)取为大值,此时λ(ω,k)≈1。而当λ(ω,k)≈1时,根据公式(9)可以得到,噪声的CPSD估计会在语音的活动期噪声会暂时停止更新。相反,如果不存在语音,即语音处于静默期,在这种情况下认为后验信噪比估计γ(ω,k)取小值。根据图1所示可知此时λ(ω,k)≈0。根据公式(9)可以知道,此时噪声的CPSD估计值会紧跟带噪语音的CPSD变化。相对于公式(3)使用的固定平滑因子λ,信噪比相关的平滑因子λ(ω,k)的优点在于这些平滑因子与时间和频率相关。这意味着噪声的CPSD会根据不同频点的后验信噪比λ(ω,k),在不同的频点以不同的速率做自适应,这对于背景噪声为有色噪声的情况特别适用。
仿真分析:为衡量上述方法性能,将本发明方法应用到基于先验信噪比的相干性滤波器中。仿真测试中,采样率为8kHz,窗函数采用hamming窗,每帧长度为32ms,帧移为50%。麦克风阵列放置于长6m宽4m高3m的房间里。两个麦克风的坐标分别位于(2:0.94:1)和(2:1.06:1),目标声源位于(3:1.03:1.7),噪声源位于(1:2:1.5),目标语音为中科院的测试语音库,语音内容为女声“沉舟侧畔千帆过,病树前头万木春”和男声“农业生产合作社”。噪声是取自noisex92噪声库的汽车噪声(volvo)、工厂噪声(factory2)、轮机噪声(destroyerops)以及装甲车驾驶舱噪声(m109),将这4种噪声与上述语音段合成信噪比为−5 dB,0 dB以及5 dB的带噪语音。IMT算法参数的设置为:α=0.997,χ=0.96,γ=0.01,Bmin=2。本发明提出的递归最小追踪的参数设置为α=0.997,β=0.177,χ=0.96,γ=0.01,Bmin=2。
为了更加直观的知道噪声CPSD估计与真实噪声CPSD间的差距。表1给出了本发明算法与IMT估计算法的均方误差(Mean Squa- red Error, MSE)对比测试,均方误差计算方式如下:
(10)
其中K为信号的帧数,PV(ω,k)和PV1V2(ω,k)分别为实际和估计的噪声CPSD值。均方误差值越小说明所估计的噪声CPSD越接近实际的CPSD。从仿真数据可看出,不同的噪声环境和不同的输入信噪比的试验中,相对于IMT估计算法,本发明方法均取得了更低的均方误差。这说明本发明方法估计出的噪声CPSD更接近真实的噪声CPSD。需要注意到的是在factory2、destroyerops以及m109三种噪声中,IMT的均方误差值很大,这表明IMT算法在对噪声CPSD估计时出现了严重的噪声过估计值。
表1 两种算法的均方误差。
然而,评判语音质量的一个更重要的评价标准还是语音听觉质量评估,这里进一步采用语音质量客观评估值(PESQ)来对增强语音进行评估。增强算法这里采用了基于先验信噪比的相干性滤波器,其参数的设置为:λv=0.9,λd=0.97,λv=0.9,λy=0.7。表2给出了本发明算法与IMT估计算法的PESQ对比测试。仿真结果表明,与IMT估计算法相比,本发明提出的递归最小追踪算法在不同的噪声和不同信噪比下取得了更高的PESQ得分。即使用递归最小追踪算法的语音增强系统可以获得质量更高的增强语音。
表2 两种算法的PESQ得分。
结论:本发明针对IMT噪声CPSD估计算法为基础,引入递归平滑技术,得出了一种基于递归最小追踪的噪声CPSD估计方法。因为采用了递归平滑因子,该方法克服了IMT算法所存在的噪声过估计的问题,所得到的噪声CPSD估计更加准确。仿真结果表明,较之于IMT算法,无论是噪声CPSD估计的准确性还是增强后语音的质量,本发明提出的方法都取得了更好的仿真结果。
本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (1)

1.一种用于拾音器的基于递归最小追踪的噪声估计方法,其特征在于,包括如下步骤:
1)建立信号模型:两个麦克风接收到的带噪语音信号可以表示为:
(1)
其中,“i”表示麦克风的序号,yi(n),si(n)和vi(n)分别表示带噪语音,纯净语音信号和噪声信号;对式(1)两边做短时傅里叶变换使其变成频域形式:
(2)
其中,ω表示频率因子,k表示帧因子;
2)采用IMT噪声CPSD估计算法:其原理是通过在每个频带跟踪带噪语音的最小值,可以得到该频带噪声水平的一个粗略估计,其中:
IMT算法首先通过以下递归式对带噪语音进行短时平滑:
(3)
然后IMT算法在每个频点对带噪语音CPSD的最小值(RV1V2min(ω,k))进行跟踪,用公式表达为:
(4)
带噪语音CPSD的最小值RV1V2min(ω,k)与噪声CPSD的估计值PV1V2(ω,k)之间的关系为:
(5)
其中,Bmin为偏置参数;
3)将步骤2)中IMT算法的平滑因子替换为后验信噪比的sigmoid函数:
(6)
其中,β参数的一般的取值范围为15≤β≤30,但在实际情况中可能会远远超出这个范围;λ(ω,k)为平滑因子,而γ(ω,k)则是后验信噪比的近似:
(7)
式(7)中的分母为过去10帧的噪声功率谱估计值的平均;对公式(7)进行调整以用于二元麦克风系统中:
(8)
将上述递归平均技术用于步骤2)中的IMT算法中可得:
(9)。
CN201610199809.0A 2016-04-03 2016-04-03 一种用于拾音器的基于递归最小追踪的噪声估计方法 Pending CN105788606A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610199809.0A CN105788606A (zh) 2016-04-03 2016-04-03 一种用于拾音器的基于递归最小追踪的噪声估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610199809.0A CN105788606A (zh) 2016-04-03 2016-04-03 一种用于拾音器的基于递归最小追踪的噪声估计方法

Publications (1)

Publication Number Publication Date
CN105788606A true CN105788606A (zh) 2016-07-20

Family

ID=56395245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610199809.0A Pending CN105788606A (zh) 2016-04-03 2016-04-03 一种用于拾音器的基于递归最小追踪的噪声估计方法

Country Status (1)

Country Link
CN (1) CN105788606A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107393550A (zh) * 2017-07-14 2017-11-24 深圳永顺智信息科技有限公司 语音处理方法及装置
CN111128215A (zh) * 2019-12-24 2020-05-08 声耕智能科技(西安)研究院有限公司 一种单通道实时降噪方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000504434A (ja) * 1996-02-01 2000-04-11 テレフオンアクチーボラゲツト エル エム エリクソン(パブル) ノイズのある音声パラメータを強化する方法および装置
US20060271360A1 (en) * 1998-06-30 2006-11-30 Walter Etter Estimating the noise components of a signal during periods of speech activity
CN103559887A (zh) * 2013-11-04 2014-02-05 深港产学研基地 用于语音增强系统的背景噪声估计方法
CN103646648A (zh) * 2013-11-19 2014-03-19 清华大学 一种噪声功率估计方法
CN105224844A (zh) * 2014-07-01 2016-01-06 腾讯科技(深圳)有限公司 验证方法、系统和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000504434A (ja) * 1996-02-01 2000-04-11 テレフオンアクチーボラゲツト エル エム エリクソン(パブル) ノイズのある音声パラメータを強化する方法および装置
US20060271360A1 (en) * 1998-06-30 2006-11-30 Walter Etter Estimating the noise components of a signal during periods of speech activity
CN103559887A (zh) * 2013-11-04 2014-02-05 深港产学研基地 用于语音增强系统的背景噪声估计方法
CN103646648A (zh) * 2013-11-19 2014-03-19 清华大学 一种噪声功率估计方法
CN103646648B (zh) * 2013-11-19 2016-03-23 清华大学 一种噪声功率估计方法
CN105224844A (zh) * 2014-07-01 2016-01-06 腾讯科技(深圳)有限公司 验证方法、系统和装置

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
HASSAN FARSI: "Improvement of Minimum Tracking in Minimum Statistics Noise Estimation Method", 《SIGNAL PROCESSING》 *
L. LIN 等: "AN ADAPTIVE NOISE ESTIMATION ALGORITHM FOR SPEECH ENHANCEMENT", 《PROCEEDINGS OF THE 9TH AUSTRALIAN INTERNATIONAL CONFERENCE ON SPEECH SCIENCE & TECHNOLOGY》 *
MOHSEN RAHMANI 等: "A noise cross PSD estimator for dual-microphone speech enhancement based on minimum statistics", 《JOURNAL OF ZHEJIANG UNIVERSITY SCIENCE A》 *
MOHSEN RAHMANI 等: "An iterative noise cross-PSD estimation for two-microphone speech enhancement", 《APPLIED ACOUSTICS》 *
张正文 等: "基于递归最小追踪的噪声互功率谱估计算法", 《科学技术与工程》 *
罗艾洲著: "《语音增强 理论与实践》", 31 December 2012 *
赵晓晴: "二元麦克风阵列语音增强算法研究", 《中国优秀硕士论文全文数据库》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107393550A (zh) * 2017-07-14 2017-11-24 深圳永顺智信息科技有限公司 语音处理方法及装置
CN107393550B (zh) * 2017-07-14 2021-03-19 深圳永顺智信息科技有限公司 语音处理方法及装置
CN111128215A (zh) * 2019-12-24 2020-05-08 声耕智能科技(西安)研究院有限公司 一种单通道实时降噪方法及系统
CN111128215B (zh) * 2019-12-24 2022-06-07 声耕智能科技(西安)研究院有限公司 一种单通道实时降噪方法及系统

Similar Documents

Publication Publication Date Title
CN103456310B (zh) 一种基于谱估计的瞬态噪声抑制方法
CN110739005B (zh) 一种面向瞬态噪声抑制的实时语音增强方法
CN108831495A (zh) 一种应用于噪声环境下语音识别的语音增强方法
CN112735456B (zh) 一种基于dnn-clstm网络的语音增强方法
CN106875938B (zh) 一种改进的非线性自适应语音端点检测方法
CN111445919B (zh) 结合ai模型的语音增强方法、系统、电子设备和介质
CN109817234B (zh) 基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质
CN106558315B (zh) 异质麦克风自动增益校准方法及系统
CN109767782A (zh) 一种提高dnn模型泛化性能的语音增强方法
US20150032445A1 (en) Noise estimation apparatus, noise estimation method, noise estimation program, and recording medium
CN109741758A (zh) 一种双麦克风语音降噪方法
Park et al. Noise Cancellation Based on Voice Activity Detection Using Spectral Variation for Speech Recognition in Smart Home Devices.
CN110808057A (zh) 一种基于约束朴素生成对抗网络的语音增强方法
Nian et al. A progressive learning approach to adaptive noise and speech estimation for speech enhancement and noisy speech recognition
CN105788606A (zh) 一种用于拾音器的基于递归最小追踪的噪声估计方法
CN112201269A (zh) 基于改进噪声估计的mmse-lsa语音增强方法
CN106782618A (zh) 基于二阶锥规划的目标方向语音检测方法
Yang et al. Deep learning-based speech presence probability estimation for noise PSD estimation in single-channel speech enhancement
Tashev et al. Unified framework for single channel speech enhancement
Ji et al. A priori SAP estimator based on the magnitude square coherence for dual-channel microphone system
Fu et al. Speech presence probability estimation based on integrated time-frequency minimum tracking for speech enhancement in adverse environments
Islam et al. Enhancement of noisy speech based on decision-directed Wiener approach in perceptual wavelet packet domain
Yong et al. Noise estimation with lowcomplexity for speech enhancement
Ephraim et al. A brief survey of speech enhancement 1
Schwab et al. Robust noise estimation applied to different speech estimators

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160720