CN103109320B - 噪声抑制装置 - Google Patents

噪声抑制装置 Download PDF

Info

Publication number
CN103109320B
CN103109320B CN201080069164.XA CN201080069164A CN103109320B CN 103109320 B CN103109320 B CN 103109320B CN 201080069164 A CN201080069164 A CN 201080069164A CN 103109320 B CN103109320 B CN 103109320B
Authority
CN
China
Prior art keywords
noise
power spectrum
spectrum
sound
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080069164.XA
Other languages
English (en)
Other versions
CN103109320A (zh
Inventor
古田训
田崎裕久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN103109320A publication Critical patent/CN103109320A/zh
Application granted granted Critical
Publication of CN103109320B publication Critical patent/CN103109320B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02085Periodic noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Telephone Function (AREA)

Abstract

具备:功率谱计算部(3),将时域的输入信号变换为作为频域的信号的功率谱;声音/噪声区间判定部(5),判定功率谱是声音还是噪声;噪声谱估计部(6),根据声音/噪声区间判定部(5)的判定结果估计功率谱的噪声谱;周期分量估计部(4),分析构成功率谱的谐波构造,估计功率谱的周期性信息;权重系数计算部(7),根据周期性信息、声音/噪声区间判定部(5)的判定结果、以及功率谱的信号信息,计算用于对功率谱进行加权的加权系数;SN比计算部(8),根据功率谱、声音/噪声区间判定部(5)的判定结果以及加权系数,计算用于抑制功率谱中包含的噪声的抑制系数;谱抑制部(10),使用抑制系数来抑制功率谱的振幅;以及逆傅立叶变换部(11),将在谱抑制部(10)中被进行了振幅抑制的功率谱变换为时域而得到噪声抑制信号。

Description

噪声抑制装置
技术领域
本发明涉及噪声抑制装置,该噪声抑制装置用于导入了声音通信、声音积蓄、声音识别系统的汽车导航、便携电话、对讲机等声音通信系统、免提通话系统、TV会议系统、监视系统等的音质改善、声音识别系统的识别率提高,抑制输入信号中混入的背景噪声。
背景技术
伴随近年来的数字信号处理技术的发展,利用便携电话的室外的声音通话、汽车内的免提声音通话、利用声音识别的免提操作得到广泛普及。这些装置由于在高噪音环境下使用的情况较多,所以与声音一起背景噪声也被输入到麦克风而导致通话声音的劣化、声音识别率的降低等。因此,为了实现舒适的声音通话、高精度的声音识别,需要抑制输入信号中混入的背景噪声的噪声抑制装置。
作为以往的噪声抑制方法,例如有如下方法:将时域的输入信号变换为作为频域的信号的功率谱,使用输入信号的功率谱和根据输入信号另行估计出的估计噪声谱来计算用于噪声抑制的抑制量,使用所得到的抑制量来进行输入信号的功率谱的振幅抑制,将被振幅抑制的功率谱和输入信号的相位谱变换为时域而得到噪声抑制信号(例如,非专利文献1)。
在该以往的噪声抑制方法中,根据声音的功率谱与估计噪声功率谱之比(SN比)计算了抑制量,但如果其值成为负(用数字值),则无法正确地计算抑制量。例如,在低频具有大的功率的汽车行驶噪音被重叠了的声音信号中,声音的低频被埋在噪音中,所以SN比会成为负,其结果,存在如下课题:声音信号的低频被过度抑制而音质劣化。
针对上述课题,作为生成/还原缺损的低频信号的方法,例如,在专利文献1中公开了如下声音信号处理装置:从输入信号中抽出声音的基本频率(间距)信号的高次谐波分量的一部分,并对所抽出的高次谐波分量进行平方而生成低次谐波分量,通过将所得到的低次谐波分量重叠于输入信号而得到音质改善了的声音信号。通过将该声音信号处理装置设置于噪声抑制装置的后级,能够实现低频分量改善了的噪声抑制装置。
专利文献1:日本特开2008-76988号公报(第5页~6页、图1)
非专利文献1:Y.Ephraim,D.Malah,“Speech EnhancementUsing a Minimum Mean Square Error Short-Time SpectralAmplitude Estimator”,IEEE Trans.ASSP,vol.ASSP-32,No.6Dec.1984
发明内容
但是,在专利文献1公开的以往的声音信号处理装置中,所生成的低频信号是根据输入信号分析并生成的,所以在输入信号中有残留噪声的情况、即在噪声抑制装置的输出信号中有残留噪声的情况下,由于在低频分量中出现残留噪声的影响,所以存在音质急剧劣化这样的课题。另外,存在如下课题:在低频分量的生成、滤波处理、以及低频分量的重叠程度的控制中需要大量的运算量/存储器量。
本发明是为了解决上述那样的课题而完成的,其目的在于通过简便的处理提供高品质的噪声抑制装置。
本发明涉及的噪声抑制装置,具备:功率谱计算部,将时域的输入信号变换为作为频域的信号的功率谱;声音/噪声判定部,判定功率谱是声音还是噪声;噪声谱估计部,根据声音/噪声判定部的判定结果,估计功率谱的噪声谱;周期分量估计部,分析构成功率谱的谐波构造,估计功率谱的周期性信息;权重系数计算部,根据周期性信息、声音/噪声判定部的判定结果、以及功率谱的信号信息,计算用于对功率谱进行加权的加权系数;抑制系数计算部,根据功率谱、声音/噪声判定部的判定结果以及加权系数,计算用于抑制功率谱中包含的噪声的抑制系数;谱抑制部,使用抑制系数来抑制功率谱的振幅;以及变换部,将在谱抑制部中被进行了振幅抑制的功率谱变换为时域而得到噪声抑制信号。
根据本发明,具备:周期分量估计部,分析构成功率谱的谐波构造,估计功率谱的周期性信息;权重系数计算部,根据周期性信息、声音/噪声判定部的判定结果、以及功率谱的信号信息,计算用于对功率谱进行加权的加权系数;抑制系数计算部,根据功率谱、声音/噪声判定部的判定结果以及加权系数,计算用于抑制功率谱中包含的噪声的抑制系数;以及谱抑制部,使用抑制系数来抑制功率谱的振幅,所以即使在声音被埋在噪声中的带宽中也能够校正为保证声音的谐波构造,能够抑制声音的过度的抑制,能够进行高品质的噪声抑制。
附图说明
图1是示出实施方式1的噪声抑制装置的结构的框图。
图2是示意地示出实施方式1的噪声抑制装置的周期分量估计部中的声音的谐波构造检测的说明图。
图3是示意地示出实施方式1的噪声抑制装置的周期分量估计部中的声音的谐波构造校正的说明图。
图4是示意地示出实施方式1的噪声抑制装置的SN比计算部中的使用了被加权后的后验SNR时的先验SNR的样子的说明图。
图5是示出实施方式1的噪声抑制装置的输出结果的一个例子的图。
图6是示出实施方式4的噪声抑制装置的结构的框图。
具体实施方式
以下,为了更详细地说明本发明,根据附图,说明用于实现本发明的方式。
实施方式1.
图1是示出本发明的实施方式1的噪声抑制装置的结构的框图。
噪声抑制装置100包括输入端子1、傅立叶变换部2、功率谱计算部3、周期分量估计部4、声音/噪声区间判定部(声音/噪声判定部)5、噪声谱估计部6、权重系数计算部7、SN比计算部(抑制系数计算部)8、抑制量计算部9、谱抑制部10、逆傅立叶变换部(变换部)11、以及输出端子12。
以下,参照图1,说明噪声抑制装置100的动作原理。
首先,通过麦克风(未图示)等进入的声音、音乐等在被进行了A/D(模拟/数字)变换之后,以规定的采样频率(例如,8kHz)被采样,并且被分割为帧单位(例如10ms),经由输入端子1被输入到噪声抑制装置100。
傅立叶变换部2在对输入信号施加了例如汉明窗之后,例如如下式(1)那样进行256点的快速傅立叶变换,从时域的信号变换为谱分量X(λ,k)。
X(λ,k)=FT[x(t)]              …(1)
此处,λ表示对输入信号进行了帧分割时的帧编号、k表示指定功率谱的频率带宽的频率分量的编号(以下,称为谱编号)、FT[·]表示傅立叶变换处理。
在功率谱计算部3中,使用下式(2),根据输入信号的谱分量得到功率谱Y(λ,k)。
Y ( &lambda; , k ) = Re { X ( &lambda; , k ) } 2 + Im { X ( &lambda; , k ) } 2 ; 0 &le; k < 128 &CenterDot; &CenterDot; &CenterDot; ( 2 )
此处,Re{X(λ,k)}以及Im{X(λ,k)}分别表示傅立叶变换后的输入信号谱的实数部以及虚数部。
周期分量估计部4输入功率谱计算部3输出的功率谱Y(λ,k),进行输入信号谱的谐波构造的分析。如图2所示,通过检测功率谱所构成的谐波构造的波峰(以后,称为谱峰值),进行谐波构造的分析。具体而言,为了去除与谐波构造无关的微小峰值分量,例如,在从各功率谱分量减去功率谱的最大值的20%的值之后,从低频依次跟踪功率谱的谱包络的极大值而求出。另外,在图2的功率谱例中,为了易于说明,将声音谱和噪声谱记载为不同分量,但实际的输入信号是在声音谱上重叠(相加)有噪声谱,无法观测功率比噪声谱小的声音谱的峰值。
在搜索谱峰值之后,作为周期性信息p(λ,k),如果是功率谱的极大值(谱峰值),则设为p(λ,k)=1,否则设为p(λ,k)=0,由此针对每个谱编号k设置值。另外,在图2的例子中,进行了所有谱峰值的抽出,但也可以例如仅限于SN比良好的带宽等特定的频率带宽而进行。
接下来,根据所观测的谱峰值的高次谐波周期,估计埋在噪声谱中的声音谱的峰值。具体而言,例如如图3那样,在未观测到谱峰值的区间(被埋在噪声中的低频部分、高频部分)中,视为以所观测到的谱峰值的高次谐波周期(峰值间隔)存在谱峰值,设置其谱编号的周期性信息p(λ,k)=1。另外,在极其低的频率带宽(例如,120Hz以下)中存在声音分量的情形是稀少的,所以也可以在该带宽中不对周期性信息p(λ,k)设置“1”。在极其高的频率带宽中也可以同样地处理。
接下来,使用下式(3),根据功率谱Y(λ,k)求出归一化自相关函数ρN(λ,τ)。
ρ(λ,τ)=FT[Y(λ,k)]
&rho; N ( &lambda; , &tau; ) = &rho; ( &lambda; , &tau; ) &rho; ( &lambda; , 0 ) &CenterDot; &CenterDot; &CenterDot; ( 3 )
此处,τ是延迟时间,FT[·]表示傅立叶变换处理,例如与式(1)同样地以点数=256进行快速傅立叶变换即可。另外,式(3)是维纳-辛钦(Wiener-Khintchine)定理,所以说明省略。接下来,使用式(4),求出归一化自相关函数的最大值ρmax(λ)。此处,式(4)意味着在16≤τ≤96的范围内检索ρ(λ,τ)的最大值。
ρmax(λ)=max[ρ(λ,τ)]、16≤τ≤96        …(4)
以上,分别输出所得到的周期性信息p(λ,τ)和自相关函数最大值ρmax(λ)。另外,在周期性的分析中,除了上述功率谱的峰值分析、自相关函数法以外,还能够使用倒频谱分析等公知的手法。
声音/噪声区间判定部5输入功率谱计算部3输出的功率谱Y(λ,k)、周期分量估计部4输出的自相关函数最大值ρmax(λ)、以及后述噪声谱估计部6输出的估计噪声谱N(λ,k),判定当前帧的输入信号是声音还是噪声,并将其结果作为判定标志而输出。作为声音/噪声区间的判定方法,例如,在满足下式(5)和式(6)中的某一方或者两方的情况下,设为是声音,将判定标志Vflag设置为“1(声音)”,在其以外的情况下,设为是噪声,将判定标志Vflag设置为“0(噪声)”而输出。
其中, S pow = &Sigma; k = 0 127 Y ( &lambda; , k ) , N pow = &Sigma; k = 0 127 N ( &lambda; , k )
此处,在式(5)中,N(λ,k)是估计噪声谱,Spow和Npow分别表示输入信号的功率谱的总和、估计噪声谱的总和。另外,THFR_SN以及THACF是判定用的规定的常数阈值,作为优选的例子是THFR_SN=3.0以及THACF=0.3,但也可以根据输入信号的状态、噪声电平而适当进行变更。
噪声谱估计部6输入功率谱计算部3输出的功率谱Y(λ,k)和声音/噪声区间判定部5输出的判定标志Vflag,依照下式(7)和判定标志Vflag进行噪声谱的估计和更新,输出估计噪声谱N(λ,k)。
此处,N(λ-1,k)是前帧中的估计噪声谱,在噪声谱估计部6内的例如RAM(Random Access Memory,随机访问存储器)等存储单元中保持。在式(7)中,在判定标志Vflag=0的情况下,当前帧的输入信号被判定为噪声,所以使用输入信号的功率谱Y(λ,k)和更新系数α,来进行前帧的估计噪声谱N(λ-1,k)的更新。另外,更新系数α是0<α<1的范围的规定的常数,作为优选的例子是α=0.95,但也可以根据输入信号的状态、噪声电平来适当进行变更。
另一方面,在判定标志Vflag=1的情况下,当前帧的输入信号是声音,将前帧的估计噪声谱N(λ-1,k)原样地作为当前帧的估计噪声谱N(λ,k)而输出。
权重系数计算部7输入周期分量估计部4输出的周期性信息p(λ,k)、声音/噪声区间判定部5输出的判定标志Vflag、以及后述SN比计算部8输出的每个谱分量的SN比(信号对噪声比),针对该SN比,计算用于进行每个谱分量的加权的权重系数W(λ,k)。
此处,W(λ-1,k)是前帧的权重系数、β是用于平滑化的规定的常数,优选为β=0.8。另外,wp(k)是加权常数,例如,如下式(9)那样根据判定标志和每个谱分量的SN比来确定,通过该谱编号下的值和邻接的谱编号的值来进行平滑化。通过与邻接的谱分量进行平滑化,从而具有抑制加权系数的急剧化、吸收谱峰值分析的误差的效果。
另外,对于p(λ,k)=0时的加权常数wZ(k),通常保持1.0而不加权即可,但也可以根据需要与wp(k)同样地利用判定标志和每个谱分量的SN比来控制。
w P ( k ) = 0.25 &CenterDot; w ^ P ( k - 1 ) + 1.25 &CenterDot; w ^ P ( k ) + 0.25 &CenterDot; w ^ P ( k + 1 ) , 1 &le; k < 127 w ^ P ( k ) , k = 0,127 &CenterDot; &CenterDot; &CenterDot; ( 9 )
其中,
在周期性信息p(λ,k)=1、并且、判定标志Vflag=1(声音)的情况下,
在周期性信息p(λ,k)=1、并且、判定标志Vflag=0(噪声)的情况下,
此处,snr(k)是SN比计算部8输出的每个谱分量的SN比,THSB_SNR是规定的常数阈值。如式(9)那样,通过利用判定标志和每个谱分量的SN比来控制加权常数,从而在输入信号被判定为声音的情况下,对于声音埋在噪声中那样的带宽的谱峰值(谱的谐波构造的波峰部分)进行大的加权,另外,对于本来SN比高的带宽的谱分量,不进行过量的加权。另一方面,在输入信号被判定为噪声的情况下,通过抑制加权(将权重常数设为1.0),并且对估计为SN比高的谱分量进行加权,从而例如即使在当前帧虽然是声音但判定标志错误为是噪声的情况下,也能够进行加权。另外,也可以根据输入信号的状态、噪声电平,适当变更阈值THSB_SNR
SN比计算部8使用功率谱计算部3输出的功率谱Y(λ,k)、噪声谱估计部6输出的估计噪声谱N(λ,k)、权重系数计算部7输出的权重系数W(λ,k)、以及后述抑制量计算部9输出的前帧的谱抑制量G(λ-1,k),计算每个谱分量的后验SNR(a posteriori SNR)和先验SNR(a priori SNR)。
能够使用功率谱Y(λ,k)和估计噪声谱N(λ,k),根据下式(10),求出后验SNRγ(λ,k)。另外,通过进行基于上述式(9)的加权,校正为在谱峰值下将后验SNR估计得更高。
&gamma; ( &lambda; , k ) = W ( &lambda; , k ) &CenterDot; | Y ( &lambda; , k ) | 2 N ( &lambda; , k ) &CenterDot; &CenterDot; &CenterDot; ( 10 )
另外,使用前帧的谱抑制量G(λ-1、k)、前帧的后验SNRγ(λ-1,k),根据下式(11),求出先验SNRξ(λ,k)。
ξ(λ,k)=δ·γ(λ-1,k)·G2(λ-1,k)+(1-δ)·F[γ(λ,k)-1]…(11)
其中,
此处,δ是0<δ<1的范围的规定的常数,在本实施方式中优选为δ=0.98。另外,F[·]意味着半波整流,在后验SNR以数字值是负的情况下,取值为零。
图4是示意地示出使用了根据权重系数W(λ,k)加权后的后验SNR时的、先验SNR的样子的图。图4(a)与图3的波形相同,示出声音谱与噪声谱的关系。图4(b)示出未进行加权时的先验SNR的样子、图4(c)示出进行了加权时的先验SNR的样子。另外,在图4(b)中为了说明方式而记载了阈值THSB_SNR。当比较图4(b)和图4(c)时可知,在图4(b)中埋在噪声中的声音谱的峰值部分的SN比未被良好地抽出,相对于此,在图4(c)中峰值部分的SN比被良好地抽出。另外,可知超过阈值THSB_SNR的峰值部分的SN比也未过度地变大,而良好地动作。
另外,在该实施方式1中,仅对后验SNR进行了加权,但对先验SNR也能够进行加权,或者也可以对后验SNR和先验SNR这两方进行加权。在该情况下,为了使得适合作为先验SNR的加权,变更上述式(9)的常数即可。
以上,将所得到的后验SNRγ(λ,k)和先验SNRξ(λ,k)输出到抑制量计算部9,并且将先验SNRξ(λ,k)作为每个谱分量的SN比而输出到权重系数计算部7。
抑制量计算部9根据SN比计算部8输出的先验SNR以及后验SNRγ(λ,k),求出作为每个谱的噪声抑制量的谱抑制量G(λ,k),输出到谱抑制部10。
作为求出谱抑制量G(λ,k)的手法,例如,能够应用Joint MAP法。Joint MAP法是将噪声信号和声音信号假设为是高斯分布而估计谱抑制量G(λ,k)的方法,使用先验SNRξ(λ,k)以及后验SNRγ(λ,k),求出使附条件的概率密度函数成为最大的振幅谱和相位谱,将其值用作估计值。可以将决定概率密度函数的形状的v和μ作为参数,根据下式(12)表示谱抑制量。另外,对于Joint MAP法中的谱抑制量导出法的详细内容,参照以下所示的参考文献1,此处省略。
G ( &lambda; , k ) = u ( &lambda; , k ) + u 2 ( &lambda; , k ) + v 2 &gamma; ( &lambda; , k )
u ( &lambda; , k ) = 1 2 - &mu; 4 &gamma; ( &lambda; , k ) &xi; ( &lambda; , k ) &CenterDot; &CenterDot; &CenterDot; ( 12 )
参考文献1
T.Lotter,P.Vary,“Speech Enhancement by MAP SpectralAmplitude Estimation Using a Super-Gaussian Speech Model”,EURASIP Journal on Applied Signal Processing,pp.1110-1126,No.7,2005
在谱抑制部10中,依照下式(13),针对输入信号的每个谱进行抑制,求出噪声被抑制的声音信号谱S(λ,k),输出到逆傅立叶变换部11。
S(λ,k)=G(λ,k)·Y(λ,k)               …(13)
以上,通过逆傅立叶变换部11对所得到的声音谱S(λ,k)进行逆傅立叶变换,并与前帧的输出信号进行重叠处理之后,从输出端子12输出噪声被抑制的声音信号s(t)。
图5是作为该实施方式1的噪声抑制装置的输出结果的一个例子示意地示出声音区间中的输出信号的谱的图。图5(a)是在将图2所示的谱作为输入信号的情况下通过不进行式(10)所示的SN比的加权的以往的方法得到的输出结果,图5(b)是进行式(10)所示的SN比的加权时的输出结果。在图5(a)中,被埋在噪声中的带宽的声音的谐波构造消失,相对于此,在图5(b)中,被埋在噪声中的带宽的声音的谐波构造恢复,可知能够进行良好的噪声抑制。
如以上那样,根据该实施方式1,即使在声音埋在噪声中而SN比成为负那样的带宽中,也能够校正为保持声音的谐波构造来估计SN比,所以能够抑制声音的过度的抑制,能够进行高品质的噪声抑制。
另外,根据该实施方式1,通过针对SN比的加权来实现被埋在噪声中的声音的谐波构造的校正,所以无需生成伪低频信号等,能够以少的处理量/存储器量来进行高品质的噪声抑制。
进而,根据该实施方式1,使用声音/噪声区间判定标志和前帧的每个谱分量的SN比来进行加权控制,所以具有能够在噪声区间、SN比高的带宽中抑制不必要的加权这样的效果,能够进行更高品质的噪声抑制。
另外,在该实施方式1中,作为一个例子,进行了低频以及高频这两方的谐波构造的校正,但不限于此,也可以根据需要仅进行低频的校正,或者仅进行高频的校正,也可以仅进行例如500~800Hz附近等特定的频率带宽的校正。这样的频率带宽的校正例如对风声、汽车发送机声等窄带宽噪音中埋入的声音的校正是有效的。
实施方式2.
在上述实施方式1中,示出了在式(9)中将加权的值在频率方向上设为固定的结构,但在该实施方式2中,示出将加权的值在频率方向上设为不同的值的结构。
例如,作为声音的一般性的特征,低频的谐波构造清楚,所以能够增大加权,随着频率变高,减小加权。另外,实施方式2的噪声抑制装置的构成要素与实施方式1相同,所以省略说明。
如以上那样,根据该实施方式2,在SN比的估计中,构成为按照频率进行不同的加权,所以能够进行适合于声音的每个频率的加权,能够进行更高品质的噪声抑制。
实施方式3.
在上述实施方式1中,示出了在式(9)中将加权的值设为规定的常数的结构,但在该实施方式3中,示出如下结构:根据输入信号的声音相似度的指标来切换使用多个加权常数、或者使用规定的函数来进行控制。
作为输入信号的声音相似度的指标、即输入信号的样子的控制因素,例如在式(4)中自相关系数的最大值高的情况、即输入信号的周期构造明确(输入信号是声音的可能性高)的情况下,能够增大权重,在低的情况下,能够减小权重。另外,也可以合起来使用自相关函数和声音/噪声区间判定标志。另外,实施方式3的噪声抑制装置的构成要素与实施方式1相同,所以省略说明。
如以上那样,根据该实施方式3,构成为根据输入信号的样子而控制加权常数的值,所以在输入信号是声音的可能性高的情况下,能够进行加权以使得声音的周期性构造突出,能够抑制声音的劣化。由此,能够进行更高品质的噪声抑制。
实施方式4.
图6是示出本发明的实施方式4的噪声抑制装置的结构的框图。
在上述实施方式1中,示出了为了估计周期分量进行所有谱峰值的检测的结构,但在该实施方式4中,将SN比计算部8计算出的前帧的SN比输出到周期分量估计部4,周期分量估计部4在进行谱峰值的检测时,使用该前帧的SN比,仅在SN比高的带宽中进行谱峰值的检测。同样地,在计算归一化自相关函数ρN(λ,τ)时,也能够仅在SN比高的带宽中进行计算。另外,其他结构与实施方式1的噪声抑制装置相同,所以省略说明。
如以上那样,根据该实施方式4,构成为周期分量估计部4使用从SN比计算部8输入的前帧的SN比,仅在SN比高的带宽中进行谱峰值的检测、或者仅在SN比高的带宽中进行归一化自相关函数的计算,所以能够提高谱峰值的检测精度、声音/噪声区间判定的精度,能够进行更高品质的噪声抑制。
实施方式5.
在上述实施方式1至实施方式4中,示出了权重系数计算部7以强调谱峰值的方式进行SN比的加权的结构,但在该实施方式5中,示出相反地以强调谱的波谷部分的方式、即以在谱的波谷中减小SN比的方式进行加权的结构。
例如,通过将谱峰值间的谱编号的中央值视为谱的波谷部分,来进行谱的波谷的检测。另外,其他结构与实施方式1的噪声抑制装置相同,所以省略说明。
如以上那样,根据该实施方式5,通过权重系数计算部7以减小谱的波谷部分的SN比的方式进行加权,从而能够使声音的频率构造突出,能够进行更高品质的噪声抑制。
在上述实施方式1至实施方式5中,作为噪声抑制的方法,使用最大后验概率法(Joint MAP法)进行了说明,但还能够应用于其他方法。例如,有如下方法:非专利文献1中详述的最小平均平方误差短时间谱振幅法、以下所示的参考文献2中详述的谱减法等。
参考文献2
S.F.Boll,“Suppression of Acoustic Noise in Speech UsingSpectral Subtraction”,IEEE Trans.on ASSP,Vol.ASSP-27,No.2,pp.113-120,Apr.1979
另外,在上述实施方式1至实施方式5中,说明了窄带电话(0~4000Hz)的情况,但不限于窄带电话声音,例如,还能够应用于0~8000Hz等宽带电话声音、音响信号。
在上述各实施方式中,将噪声被抑制的输出信号,以数字数据形式送出到声音编码装置、声音识别装置、声音积蓄装置、免提通话装置等各种声音音响处理装置,但本实施方式的噪声抑制装置100还能够通过单独或者与上述其他装置一起用DSP(数字信号处理处理器)而实现、或者通过作为软件程序执行而实现。程序既可以存储于执行软件程序的计算机装置的存储装置,也可以存储于CD-ROM等存储介质来分发。另外,还能够通过网络提供程序。另外,除了向各种声音音响处理装置送出以外,还能够在D/A(数字/模拟)变换之后,通过放大装置放大,从扬声器等直接作为声音信号输出。
另外,在上述实施方式1至实施方式5中,示出了使用声音的功率谱与估计噪声功率谱之比即SN比作为功率谱的信号信息的结构,但除了该SN比以外,例如还能够仅使用声音的功率谱,或者还能够使用从声音的功率谱中减去估计噪声功率谱而得到的谱(假设为没有噪声的情况下的声音的功率谱)与估计噪声功率谱之比。
另外,本申请发明在该发明的范围内,能够进行各实施方式的自由的组合、或者各实施方式的任意的构成要素的变形、或者各实施方式的任意的构成要素的省略。
产业上的可利用性
本发明的噪声抑制装置能够用于导入了声音通信、声音积蓄、声音识别系统的汽车导航、便携电话、对讲机等声音通信系统、TV会议系统、监视系统等音质改善、声音识别系统的识别率的提高。

Claims (5)

1.一种噪声抑制装置,具备:
功率谱计算部,将时域的输入信号变换为作为频域的信号的功率谱;
声音/噪声判定部,判定所述功率谱是声音还是噪声;
噪声谱估计部,根据所述声音/噪声判定部的判定结果,估计所述功率谱的噪声谱;
周期分量估计部,分析构成所述功率谱的谐波构造,估计所述功率谱的周期性信息;
权重系数计算部,根据所述周期性信息、所述声音/噪声判定部的判定结果、以及所述功率谱的信号信息,计算用于对所述功率谱进行加权的加权系数;
抑制系数计算部,根据所述功率谱、在所述噪声谱估计部中估计出的噪声谱以及所述加权系数,计算用于抑制所述功率谱中包含的噪声的抑制系数;
谱抑制部,使用所述抑制系数来抑制所述功率谱的振幅;以及
变换部,将在所述谱抑制部中被进行了振幅抑制的功率谱变换为时域而得到噪声抑制信号。
2.根据权利要求1所述的噪声抑制装置,其特征在于,
所述抑制系数计算部计算每个功率谱的信号对噪声比而作为所述功率谱的信号信息,
所述权重系数计算部计算与所述信号对噪声比对应的加权系数。
3.根据权利要求1所述的噪声抑制装置,其特征在于,
所述权重系数计算部计算根据所述声音/噪声判定部的判定结果控制了加权的强度的加权系数。
4.根据权利要求2所述的噪声抑制装置,其特征在于,
所述抑制系数计算部计算当前帧的前一帧的功率谱的信号对噪声比,
所述权重系数计算部计算根据所述前一帧的信号对噪声比控制了加权的强度的加权系数。
5.根据权利要求1所述的噪声抑制装置,其特征在于,
所述权重系数计算部计算根据功率谱的带宽分量控制了加权强度的加权系数。
CN201080069164.XA 2010-09-21 2010-09-21 噪声抑制装置 Active CN103109320B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2010/005711 WO2012038998A1 (ja) 2010-09-21 2010-09-21 雑音抑圧装置

Publications (2)

Publication Number Publication Date
CN103109320A CN103109320A (zh) 2013-05-15
CN103109320B true CN103109320B (zh) 2015-08-05

Family

ID=45873521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080069164.XA Active CN103109320B (zh) 2010-09-21 2010-09-21 噪声抑制装置

Country Status (5)

Country Link
US (1) US8762139B2 (zh)
JP (1) JP5183828B2 (zh)
CN (1) CN103109320B (zh)
DE (1) DE112010005895B4 (zh)
WO (1) WO2012038998A1 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2581904B1 (en) * 2010-06-11 2015-10-07 Panasonic Intellectual Property Corporation of America Audio (de)coding apparatus and method
JP6182895B2 (ja) * 2012-05-01 2017-08-23 株式会社リコー 処理装置、処理方法、プログラム及び処理システム
JP6051701B2 (ja) * 2012-09-05 2016-12-27 ヤマハ株式会社 エンジン音加工装置
US9304010B2 (en) * 2013-02-28 2016-04-05 Nokia Technologies Oy Methods, apparatuses, and computer program products for providing broadband audio signals associated with navigation instructions
US9865277B2 (en) * 2013-07-10 2018-01-09 Nuance Communications, Inc. Methods and apparatus for dynamic low frequency noise suppression
JP6339896B2 (ja) * 2013-12-27 2018-06-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 雑音抑圧装置および雑音抑圧方法
US10748551B2 (en) * 2014-07-16 2020-08-18 Nec Corporation Noise suppression system, noise suppression method, and recording medium storing program
US10741195B2 (en) * 2016-02-15 2020-08-11 Mitsubishi Electric Corporation Sound signal enhancement device
CN106452627B (zh) * 2016-10-18 2019-02-15 中国电子科技集团公司第三十六研究所 一种用于宽带频谱感知的噪声功率估计方法和装置
IL250253B (en) * 2017-01-24 2021-10-31 Arbe Robotics Ltd A method for separating targets and echoes from noise, in radar signals
US10587983B1 (en) * 2017-10-04 2020-03-10 Ronald L. Meyer Methods and systems for adjusting clarity of digitized audio signals
CN108600917B (zh) * 2018-05-30 2020-11-10 扬州航盛科技有限公司 一种嵌入式多路音频管理系统及管理方法
CN108899042A (zh) * 2018-06-25 2018-11-27 天津科技大学 一种基于移动平台的语音降噪方法
IL260694A (en) 2018-07-19 2019-01-31 Arbe Robotics Ltd Method and device for two-stage signal processing in a radar system
IL260696A (en) 2018-07-19 2019-01-31 Arbe Robotics Ltd Method and device for structured self-testing of radio frequencies in a radar system
IL260695A (en) 2018-07-19 2019-01-31 Arbe Robotics Ltd Method and device for eliminating waiting times in a radar system
IL261636A (en) 2018-09-05 2018-10-31 Arbe Robotics Ltd Deflected MIMO antenna array for vehicle imaging radars
US10587439B1 (en) * 2019-04-12 2020-03-10 Rovi Guides, Inc. Systems and methods for modifying modulated signals for transmission
US11342895B2 (en) * 2019-10-07 2022-05-24 Bose Corporation Systems and methods for modifying an audio playback
CN113744754B (zh) * 2021-03-23 2024-04-05 京东科技控股股份有限公司 语音信号的增强处理方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1706174A (zh) * 2002-10-16 2005-12-07 艾利森公司 综合噪声消除及残余回波抑制
CN1969320A (zh) * 2004-06-18 2007-05-23 松下电器产业株式会社 噪声抑制装置及噪声抑制方法
CN101031963A (zh) * 2004-09-16 2007-09-05 法国电信 处理有噪声的声音信号的方法以及实现该方法的装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4580508B2 (ja) * 2000-05-31 2010-11-17 株式会社東芝 信号処理装置及び通信装置
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
WO2002029782A1 (en) * 2000-10-02 2002-04-11 The Regents Of The University Of California Perceptual harmonic cepstral coefficients as the front-end for speech recognition
EP1376539B8 (en) 2001-03-28 2010-12-15 Mitsubishi Denki Kabushiki Kaisha Noise suppressor
JP2004341339A (ja) 2003-05-16 2004-12-02 Mitsubishi Electric Corp 雑音抑圧装置
JP2006113515A (ja) 2004-09-16 2006-04-27 Toshiba Corp ノイズサプレス装置、ノイズサプレス方法及び移動通信端末装置
US20080243496A1 (en) 2005-01-21 2008-10-02 Matsushita Electric Industrial Co., Ltd. Band Division Noise Suppressor and Band Division Noise Suppressing Method
JP2006201622A (ja) 2005-01-21 2006-08-03 Matsushita Electric Ind Co Ltd 帯域分割型雑音抑圧装置及び帯域分割型雑音抑圧方法
JP4827675B2 (ja) 2006-09-25 2011-11-30 三洋電機株式会社 低周波帯域音声復元装置、音声信号処理装置および録音機器
JP2008129077A (ja) 2006-11-16 2008-06-05 Matsushita Electric Ind Co Ltd ノイズ除去装置
JP5275612B2 (ja) * 2007-07-18 2013-08-28 国立大学法人 和歌山大学 周期信号処理方法、周期信号変換方法および周期信号処理装置ならびに周期信号の分析方法
WO2010046954A1 (ja) 2008-10-24 2010-04-29 三菱電機株式会社 雑音抑圧装置および音声復号化装置
US20110286605A1 (en) * 2009-04-02 2011-11-24 Mitsubishi Electric Corporation Noise suppressor
JP5528538B2 (ja) 2010-03-09 2014-06-25 三菱電機株式会社 雑音抑圧装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1706174A (zh) * 2002-10-16 2005-12-07 艾利森公司 综合噪声消除及残余回波抑制
CN1969320A (zh) * 2004-06-18 2007-05-23 松下电器产业株式会社 噪声抑制装置及噪声抑制方法
CN101031963A (zh) * 2004-09-16 2007-09-05 法国电信 处理有噪声的声音信号的方法以及实现该方法的装置

Also Published As

Publication number Publication date
DE112010005895T5 (de) 2013-07-18
CN103109320A (zh) 2013-05-15
US8762139B2 (en) 2014-06-24
WO2012038998A1 (ja) 2012-03-29
JPWO2012038998A1 (ja) 2014-02-03
JP5183828B2 (ja) 2013-04-17
US20130138434A1 (en) 2013-05-30
DE112010005895B4 (de) 2016-12-15

Similar Documents

Publication Publication Date Title
CN103109320B (zh) 噪声抑制装置
CN103238183B (zh) 噪音抑制装置
US8010355B2 (en) Low complexity noise reduction method
US8989403B2 (en) Noise suppression device
CN104067339B (zh) 噪音抑制装置
US6289309B1 (en) Noise spectrum tracking for speech enhancement
CN103718241A (zh) 噪音抑制装置
Verteletskaya et al. Noise reduction based on modified spectral subtraction method
Sørensen et al. Speech enhancement with natural sounding residual noise based on connected time-frequency speech presence regions
Shankar et al. Noise dependent super gaussian-coherence based dual microphone speech enhancement for hearing aid application using smartphone
Unoki et al. MTF-based power envelope restoration in noisy reverberant environments
Zhang et al. Speech enhancement for nonstationary noise environments
Singh et al. Phase based single-channel speech enhancement using phase ratio
Naik et al. Modified magnitude spectral subtraction methods for speech enhancement
CN102598127A (zh) 信号处理方法、信息处理装置及用于存储信号处理程序的存储介质
Prodeus et al. Objective estimation of the quality of radical noise suppression algorithms
Upadhyay et al. Recursive noise estimation-based Wiener filtering for monaural speech enhancement
Zengyuan et al. A speech denoising algorithm based on harmonic regeneration
Pallavi et al. Phase-locked Loop (PLL) Based Phase Estimation in Single Channel Speech Enhancement.
Selvi et al. Efficient speech enhancement technique by exploiting the harmonic structure of voiced segments
Gouhar et al. Speech enhancement using new iterative minimum statistics approach
Krishnamoorthy et al. Processing noisy speech for enhancement
CN115132219A (zh) 基于二次谱减法的复杂噪声背景下的语音识别方法和系统
Janardhanan et al. Wideband speech enhancement using a robust noise estimation
Verteletskaya et al. Spectral subtractive type speech enhancement methods

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant