CN103238183A - 噪音抑制装置 - Google Patents

噪音抑制装置 Download PDF

Info

Publication number
CN103238183A
CN103238183A CN2011800565533A CN201180056553A CN103238183A CN 103238183 A CN103238183 A CN 103238183A CN 2011800565533 A CN2011800565533 A CN 2011800565533A CN 201180056553 A CN201180056553 A CN 201180056553A CN 103238183 A CN103238183 A CN 103238183A
Authority
CN
China
Prior art keywords
noise
spectrum
suppression
calculating part
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800565533A
Other languages
English (en)
Other versions
CN103238183B (zh
Inventor
古田训
须藤贵志
田崎裕久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN103238183A publication Critical patent/CN103238183A/zh
Application granted granted Critical
Publication of CN103238183B publication Critical patent/CN103238183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/002Damping circuit arrangements for transducers, e.g. motional feedback circuits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Telephone Function (AREA)

Abstract

校正谱计算部(6)求出针对推测噪音谱根据其偏差程度进行平滑化而得到的校正谱,抑制量限制系数计算部(7)根据校正谱决定抑制量限制系数。抑制量计算部(9)求出基于抑制量限制系数的抑制系数,通过谱抑制部(10)进行输入信号的谱分量的振幅抑制。

Description

噪音抑制装置
技术领域
本发明涉及对重叠于输入信号的背景噪音进行抑制的噪音抑制装置。
背景技术
伴随着近年来的数字信号处理技术的发展,利用便携电话进行的在室外的声音通话、在汽车内的免提声音通话、以及利用声音识别进行的免提操作被广泛地普及。实现这些功能的装置在高噪音环境下使用的情况较多,所以背景噪音也与声音一起被输入到麦克风,导致通话声音的劣化以及声音识别率的降低等。因此,为了实现舒适的声音通话以及高精度的声音识别,需要对混入到输入信号中的背景噪音进行抑制的噪音抑制装置。
作为以往的噪音抑制方法,有如下方法:例如将时域的输入信号变换为作为频域的信号的功率谱,使用输入信号的功率谱和根据输入信号另行推测的推测噪音谱来计算用于噪音抑制的抑制量,使用所得到的抑制量来进行输入信号的功率谱的振幅抑制,将振幅抑制了的功率谱和输入信号的相位谱变换到时域而得到噪音抑制信号(例如,参照非专利文献1)。
在该以往的噪音抑制方法中,根据声音的功率谱和推测噪音功率谱的比(SN比)来计算抑制量,但重叠于输入信号的噪音在时间/频率方向上在某种程度稳定的条件下有效,如果在时间/频率方向上输入了非稳定的噪音,则无法正确地计算抑制量,存在产生被称为乐音(musical tone)的刺耳的人工的残留噪音的课题。
针对上述课题,公开了如下方法:例如通过对噪音抑制后的输出信号,附加适当调整了电平的输入信号(基音),使刺耳的残留噪音在听觉上不会显著(例如,参照专利文献1)。
另外,作为其他方法,公开了如下方法:为了进行稳定的噪音抑制而预先设定规定的目标谱,以使残留噪音谱接近它的方式控制噪音抑制量,从而针对非稳定噪音也抑制音乐噪音的发生,进行自然且稳定的噪音抑制(例如,参照专利文献2)。
专利文献1:日本专利第3459363号公报(第5~6页、图1)
专利文献2:欧州专利申请公开第1995722号说明书
非专利文献1:Y.Ephraim,D.Malah,“Speech EnhancementUsing a Minimum Mean Square Error Short-Time SpectralAmplitude Estimator”,IEEE Trans.ASSP,vol.ASSP-32,No.6Dec.1984
发明内容
在上述以往方法中,有以下所述的课题。
在专利文献1记载的以往技术中,对输出信号附加了规定的加工信号,所以具有在输出信号的音色中产生变化、或者声音信号成为噪音等课题。
在专利文献2记载的以往技术中,根据规定的带宽的功率来进行控制使得噪音抑制后的残留噪音的谱接近规定的目标谱,所以虽然不发生专利文献1的以往技术所致的新的课题,但具有以下所示那样的课题。
图6是示意地说明专利文献2记载的以往技术的图,纵轴表示振幅,横轴表示频率(0~4000Hz)。另外,在图6中,点线是推测噪音谱,单点划线是规定的目标谱,实线是作为通过专利文献2的方法进行了噪音抑制之后的输出信号的残留噪音的谱,断续线是未导入专利文献2的方法的情况即全部带宽以一定的抑制量进行了抑制的情况的残留噪音的谱。在专利文献2的方法中,以使残留噪音的谱的电平与目标谱的振幅电平一致的方式,控制用于噪音抑制的最大抑制量,所以在目标谱的形状以及功率与输入信号的推测噪音谱的形状以及功率大幅不同的情况下,发生极端地抑制过剩的带宽、以及极端地抑制不足的带宽。其结果,具有在声音中产生失真以及噪音感的课题。
本发明是为了解决上述那样的课题而完成的,其目的在于提供一种高质量的噪音抑制装置。
本发明的噪音抑制装置构成为使用将输入信号从时域变换到频域而得到的谱分量以及根据该输入信号推测的推测噪音谱来计算用于噪音抑制的抑制系数,使用该抑制系数对该输入信号的谱分量进行振幅抑制,生成变换到时域的噪音抑制信号,该噪音抑制装置具备:校正谱计算部,求出表示推测噪音谱的特征的统计性信息,根据该统计性信息来校正推测噪音谱而生成校正谱;抑制量限制系数计算部,根据校正谱计算部生成的校正谱,生成对噪音抑制的上下限进行规定的抑制量限制系数;以及抑制量计算部,使用抑制量限制系数计算部生成的抑制量限制系数,控制抑制系数。
根据本发明,能够提供高质量的噪音抑制装置,通过校正从输入信号推测的噪音谱来得到校正谱,使用从该校正谱得到的抑制量限制系数来进行谱增益的限制处理,从而能够抑制乐音的发生,并且也不会产生极端地抑制过剩以及抑制不足的带宽而能够进行良好的噪音抑制。
附图说明
图1是示出本发明的实施方式1的噪音抑制装置的结构的框图。
图2是示出实施方式1中的校正谱计算部的内部结构的框图。
图3是示意地示出实施方式1中的校正谱计算部中的平滑化处理的情况的图形,图3的(a)示出平滑化前的推测噪音谱,图3的(b)示出平滑化后的推测噪音谱。
图4是示出实施方式1中的抑制量限制系数计算部的内部结构的框图。
图5是示意地示出通过实施方式1的噪音抑制装置进行了噪音抑制的残留噪音谱的情况的图形。
图6是示意地示出通过专利文献2的噪音抑制方法进行了噪音抑制的残留噪音谱的情况的图形。
(符号说明)
1:输入端子;2:傅立叶变换部;3:功率谱计算部;4:声音/噪音区间判定部;5:噪音谱推测部;6:校正谱计算部;7:抑制量限制系数计算部;8:SN比计算部;9:抑制量计算部;10:谱抑制部;11:逆傅立叶变换部;12:输出端子;61:噪音谱分析部;62:噪音谱校正部;63:校正谱更新部;71:功率计算部;72:系数校正部。
具体实施方式
以下,为了更详细地说明本发明,依照附图,说明用于实施本发明的方式。
实施方式1.
图1所示的噪音抑制装置具备输入端子1、傅立叶变换部2、功率谱计算部3、声音/噪音区间判定部4、噪音谱推测部5、校正谱计算部6、抑制量限制系数计算部7、SN比计算部8、抑制量计算部9、谱抑制部10、逆傅立叶变换部11、以及输出端子12。
作为该噪音抑制装置的输入而使用如下信号,其中,该信号是在对通过麦克风(未图示)等而取入的声音以及音乐等进行了A/D(模拟/数字)变换之后以规定的采样频率(例如,8kHz)进行采样并且分割为帧单位(例如,10ms)而得到的信号。
以下,根据图1,说明实施方式1的噪音抑制装置的动作原理。
输入端子1接受上述那样的信号,并作为输入信号而输出到傅立叶变换部2。
傅立叶变换部2在对输入信号附加了例如汉宁窗之后,如下式(1)那样进行256点的快速傅立叶变换,从时域的信号x(t)变换为谱分量X(λ,k)。所得到的谱分量X(λ,k)被分别输出到功率谱计算部3以及谱抑制部10。
X(λ,k)=FT[x(t)]      (1)
此处,λ表示对输入信号进行了帧分割时的帧编号,k表示对功率谱的频率带宽的频率分量进行指定的编号(以下,称为谱编号),FT[·]表示傅立叶变换处理。另外,t表示离散时间编号。
功率谱计算部3使用下式(2),根据输入信号的谱分量X(λ,k)计算功率谱Y(λ,k)。所得到的功率谱Y(λ,k)被分别输出到声音/噪音区间判定部4、噪音谱推测部5、抑制量限制系数计算部7以及SN比计算部8。
Y ( &lambda; , k ) = Re { X ( &lambda; , k ) } 2 + Im { X ( &lambda; , k ) } 2 ; 0 &le; k < 128 - - - ( 2 )
此处,Re{X(λ,k)}以及Im{X(λ,k)}分别表示傅立叶变换后的输入信号谱的实数部以及虚数部。
声音/噪音区间判定部4将功率谱计算部3所输出的功率谱Y(λ,k)、和后述的噪音谱推测部5所输出的1帧前推测的推测噪音谱N(λ-1,k)用于输入,进行当前帧λ的输入信号是声音还是噪音的判定,并将其结果作为判定标志来输出。判定标志被分别输出到噪音谱推测部5以及校正谱计算部6。
作为声音/噪音区间判定部4的声音/噪音区间的判定方法,例如有如下方法:在满足下式(3)以及式(4)中的某一方或者两方的情况下,设为是声音而将判定标志Vflag设置为“1(声音)”,在除此以外的情况下设为是噪音而将判定标志Vflag设置为“0(噪音)”。
其中, S pow = &Sigma; k = 0 127 Y ( &lambda; , k ) . N pow = &Sigma; k = 0 127 N ( &lambda; - 1 , k )
Figure BDA00003239888500054
此处,在上式(3)中,N(λ-1,k)是前帧的推测噪音谱,Spow和Npow分别是输入信号的功率谱的总和、推测噪音谱的总和。另外,在上式(4)中,ρmax(λ)是标准化自相关函数的最大值。而且,THFR_SN以及THACF是判定用的规定的常数阈值,作为优选的例子是THFR_SN=3.0以及THACF=0.3,但还能够根据输入信号的状态以及噪音电平而适当变更。
另外,在上式(4)中,能够如以下那样求出标准化自相关函数的最大值ρmax(λ)。
首先,使用下式(5),根据功率谱Y(λ,k)求出标准化自相关函数ρN(λ,τ)。
&rho; N ( &lambda; , &tau; ) = &rho; ( &lambda; , &tau; ) &rho; ( &lambda; , 0 ) - - - ( 5 )
其中,p(λ,τ)=FT[Y(λ,k)]
此处,τ表示延迟时间,FT[·]表示与上述相同的傅立叶变换处理,例如以与上式(1)相同的点数=256来进行快速傅立叶变换即可。另外,式(5)是维纳-辛钦(Wiener-Khintchine)定理,所以省略说明。
接下来,能够使用下式(6),得到标准化自相关函数的最大值ρmax(λ)。
ρmax(λ)=max[ρN(λ,τ)];16≤τ≤96         (6)
此处,上式(6)意味着在τ=16~96的范围内检索标准化自相关函数ρN(λ,τ)的最大值。另外,在自相关函数的分析中,除了上式(3)所示的方法以外,还能够使用倒谱分析等公知的手法。
噪音谱推测部5将功率谱计算部3输出的功率谱Y(λ,k)、和声音/噪音区间判定部4输出的判定标志Vflag用于输入,依照下式(7)和该判定标志Vflag进行噪音谱的推测和更新,输出当前帧的推测噪音谱N(λ,k)。推测噪音谱N(λ,k)被分别输出到校正谱计算部6、抑制量限制系数计算部7以及SN比计算部8,并且如上所述作为前帧的推测噪音谱N(λ-1,k)还被输出到声音/噪音区间判定部4。
Figure BDA00003239888500071
此处,N(λ-1,k)是前帧中的推测噪音谱,被保持于噪音谱推测部5内的RAM(Random Access Memory,随机存取存储器)等存储单元(未图示)。另外,α是更新系数,是0<α<1的范围的规定的常数。作为优选的例子是α=0.95,但还能够根据输入信号的状态以及噪音电平而适当变更。
在上式(7)中,在判定标志Vflag=0的情况下,当前帧的输入信号被判定为噪音,所以使用输入信号的功率谱Y(λ,k)和更新系数α,进行前帧的推测噪音谱N(λ-1,k)的更新,并作为当前帧的推测噪音谱N(λ,k)而输出。
另一方面,在判定标志Vflag=1的情况下,当前帧的输入信号被判定为声音而并非噪音,所以将前帧的推测噪音谱N(λ-1,k)直接作为当前帧的推测噪音谱N(λ,k)而输出。
校正谱计算部6将声音/噪音区间判定部4输出的判定标志Vflag、和噪音谱推测部5输出的推测噪音谱N(λ,k)用于输入,计算用于计算后述的抑制量限制系数而所需的校正谱R(λ,k)。所得到的校正谱R(λ,k)被输出到抑制量限制系数计算部7。
在后述的抑制量限制系数计算部7中,为了决定抑制量限制系数的频率特性而使用该校正谱R(λ,k)。
此处,根据图2,说明校正谱计算部6的动作。
图2所示的校正谱计算部6具备噪音谱分析部61、噪音谱校正部62、以及校正谱更新部63。
噪音谱分析部61将推测噪音谱N(λ,k)用作输入,分析推测噪音谱的偏差程度。更具体而言,例如通过统计性手法对谱分量间的凹凸的程度进行分析。作为偏差程度的分析法,有例如如下式(8)那样使用谱分量的方差的方法。
V ( &lambda; ) = 1 N &Sigma; k = 0 N - 1 ( N AVE ( &lambda; ) - N ( &lambda; , k ) ) 2 - - - ( 8 )
此处,N是谱的个数,设为N=128。另外,NAVE(λ)表示当前帧λ的推测噪音谱N(λ)的平均。
使用上式(8),噪音谱分析部61计算当前帧的方差V(λ),并作为分析结果而输出到噪音谱校正部62。
噪音谱校正部62将噪音谱分析部61输出的方差V(λ)、和声音/噪音区间判定部4输出的判定标志Vflag用作统计性信息,进行推测噪音谱N(λ,k)的校正(平滑化),输出校正了的推测噪音谱N ̄(λ,k)。
在推测噪音谱的校正中,使用例如下式(9)那样的中值滤波(median filter),根据方差V(λ)的大小来切换滤波。另外,中值滤波是指,通过按照功率的大小顺序对规定的区域内的信号进行重新排列并取其中值从而进行平滑化的处理。
此处,由于电子申请的关系,将下式(9)中的“ ̄”(上划线)记载为“ ̄”,在这以后所示的式的说明中也记载为“ ̄”。
Figure BDA00003239888500082
此处,Fsm[N(λ,k),L]表示中值滤波。L表示区域的大小,
区域L越大,利用中值滤波进行的平滑化的程度越强。另外,VH以及VL是用于切换具有VH>VL的关系的滤波的规定的阈值,VH意味着方差大、即谱的偏差极其大的情况,另一方的VL意味着虽然谱的偏差不比VH的情况大但仍能确认谱的偏差的情况,能够根据分别输入的噪音的种类及其电平而适当变更。
在上式(9)中,例如L=3意味着使用该谱分量及其相邻的谱的3个点来进行滤波处理,针对各个谱分量N(k)实施滤波处理,但是关于作为端点的N(λ,0)和N(λ,N-1),不进行滤波处理而保持其值。
另外,在方差V(λ)小的情况下(VL>V(λ)),不进行推测噪音谱的平滑化。另外,在判定标志Vflag=1的情况下,当前帧是声音,所以输出前帧的平滑化了的推测噪音谱N ̄(λ-1,k)。由此,停止过度的平滑化,并且,在推测噪音谱中错误地混入了声音信号的情况下,能够防止向校正谱的影响,所以能够实现良好的噪音抑制。
另外,前帧的平滑化了的推测噪音谱N ̄(λ-1,k)被存储到例如校正谱计算部6内的RAM等存储单元(未图示)。
图3是示意地示出噪音谱校正部62的处理的图,图3的(a)是作为输入的推测噪音谱N(λ,k),图3的(b)是作为输出的通过中值滤波进行了平滑化的推测噪音谱N ̄(λ,k)。
根据图3可知,在平滑化了的推测噪音谱N ̄(λ,k)中,残留噪音的成为刺耳的乐音的主要原因的细微的凹凸减小,并且尖锐的波峰以及波谷消失。
另外,在上式(9)中,为了简化说明,使用谱的方差,以VH、VL这2个电平进行分类来切换中值滤波,但不限于该方法,也可以例如作为滤波使用移动平均滤波以及其他公知的平滑化滤波,滤波的切换条件也可以进一步细分化或者连续地变更。
另外,还能够代替根据谱的方差来切换滤波的种类,而通过施加多次例如区域L=3的中值滤波来增强平滑化。而且,上式(9)的滤波处理的各要素的全部权重是相等的,但也可以进行不相等的加权,例如考虑对该谱分量大幅进行加权。
另外,在上式(9)中,通过1个中值滤波对谱的全部带宽分量进行了平滑化,但也可以例如针对每个频率,使用不同的滤波、或者变更滤波的平滑化强度。作为一个例子,能够随着频率变高而增强平滑化,但在该结构的情况下,能够进一步缓和噪音的紊乱大的高频区域分量的凹凸,能够实现更良好的噪音抑制。
另外,根据滤波的种类以及平滑化强度,在平滑化前后,有时推测噪音谱的低频区域和高频区域的功率的平衡发生变化,但在该情况下,使用频率均衡器以及强调滤波器等来适当调整谱的倾斜等即可。
在本实施方式1中,作为由噪音谱分析部61进行的推测噪音谱的偏差程度的分析方案,使用了谱的方差,但不限于该方法,例如既可以使用谱熵等公知的分析方案,也可以组合使用多个方法。关于此时的滤波切换阈值,与所使用的分析方案、所组合的分析方案配合地适当调整即可。
另外,在本实施方式1中,检测谱的方差、即频率方向的变动性而进行了谱的平滑化控制,但还能够加入时间方向的变动性,例如考虑如下等的结构:计算前帧与当前帧的功率之差,如果其高于规定的阈值,则进行平滑化。
校正谱更新部63将噪音谱分析部61输出的分析结果(谱的方差V(λ))、噪音谱校正部62输出的平滑化了的推测噪音谱N ̄(λ,k)、声音/噪音区间判定部4输出的判定标志Vflag、后述的抑制量限制系数计算部7输出的前帧的校正谱R(λ-1,k)、以及用户任意地设定的规定的最小增益量(噪音抑制中的最大抑制量)GMIN用于输入,生成并输出校正谱R(λ,k)。
通过下式(10)而生成该校正谱R(λ,k)。
R ( &lambda; , k ) = &alpha; &CenterDot; R ( &lambda; - 1 , k ) + ( 1 - &alpha; ) &CenterDot; GMIN &CenterDot; N &OverBar; ( &lambda; , k ) , Vflag = 0 R ( &lambda; - 1 , k ) , Vflag = 1 ; k = 0 , . . . N - 1 - - - ( 10 )
此处,α是规定的帧间平滑化系数,α=0.9是优选的值,但根据方差V(λ)的值也可以变更α的值。例如,在方差大的情况下,能够通过减小α来加快校正谱的更新速度,能够追踪输入信号中的噪音的急剧的变化。另外,在判定标志Vflag=1的情况下,并非噪音而是声音,所以通过输出前帧的校正谱R(λ-k,k),从而停止校正谱的更新。
另外,前帧的校正谱R(λ-1,k)被存储到抑制量限制系数计算部7内的RAM等存储单元(未图示)。
另外,在上式(10)中,还能够按频率将帧间平滑化系数α设定为不同的值,例如通过随着从低频区域成为高频区域而使值变小,从而能够加快频率/时间变化大的高频区域分量的更新速度。
在图1中,抑制量限制系数计算部7将校正谱计算部6输出的校正谱R(λ-1,k)、功率谱计算部3输出的功率谱Y(λ,k)、以及与图2的校正谱更新部63同样地由用户设定的规定的值即最小增益量GMIN用于输入,以使得适合当前帧中的推测噪音谱N(λ,k)的方式修正校正谱R(λ,k)的增益,并将其结果作为抑制量限制系数Gfloor(λ,k)而输出。所得到的抑制量限制系数Gfloor(λ,k)被输出到抑制量计算部9。
此处,根据图4,说明抑制量限制系数计算部7的动作。
图4所示的功率计算部71具备功率计算部71和系数校正部72。
功率计算部71依照下式(11),计算校正谱计算部6输出的校正谱R(λ,k)的功率POWR(λ),另外计算噪音谱推测部5输出的推测噪音谱N(λ,k)的功率POWN(λ)。这些功率POWR(λ)、POWN(λ)被输出到系数校正部72。
POW R ( &lambda; ) = 1 N &Sigma; k = 0 N - 1 ( R ( &lambda; , k ) ) 2
                          (11)
POW N ( &lambda; ) = 1 N &Sigma; k = 0 N - 1 ( N ( &lambda; , k ) ) 2
此处,POWR(λ)是当前帧的校正谱R(λ,k)的功率、POWN(λ)是当前帧的推测噪音谱N(λ,k)的功率,另外N=128。
系数校正部72依照下式(12),比较校正谱的功率POWR(λ)与对推测噪音谱的功率POWN(λ)乘以最小增益量GMIN而得到的值,并根据其结果来决定校正谱R(λ,k)的修正量D(λ)。
Figure BDA00003239888500121
此处,DUP以及DDOWN是规定的常数,在本实施方式1中DUP=1.05、DDOWN=0.95分别是优选的,但能够根据噪音的种类以及噪音电平而适当变更。另外,DUP、DDOWN的值分别不限于仅为1种,也可以使用多个来决定修正量D(λ)。例如,在上式(12)中仅通过功率的大小比较来决定修正量D(λ),但在功率的差大于(或者小于)规定的阈值的情况下,作为DUP=1.2(或者在小的情况下DDOWN=0.8),能够设定更大的修正量。这样,通过利用功率的差来变更修正量D(λ)的值,从而能够进一步减小修正误差,并且还加快修正速度。
另外,在本实施方式1中,通过上式(11)求出了全部带宽的功率,但并不限于此,还能够求出一部分带宽分量、例如200Hz~800Hz的功率,并通过上式(12)进行比较。
接下来,系数校正部72通过下式(13),使用所得到的修正量D(λ)来进行校正谱R(λ,k)的增益的修正,得到增益修正了的校正谱R^(λ,k)。该增益修正了的校正谱R^(λ,k)被输出到校正谱计算部6,在该校正谱计算部6中作为前帧的校正谱R(λ-1,k)而被处理。
另外,此处,由于电子申请的关系,将下式(13)中的“^”(hatmark,帽子记号)记载为“^”,在以后所示的式的说明中也记载为“^”。
R ^ ( &lambda; , k ) = D ( &lambda; ) &CenterDot; R ( &lambda; , k ) ; k = 0 , . . . , N - 1 - - - ( 13 )
最后,系数校正部72将增益修正了的校正谱R^(λ,k)、和功率谱计算部3输出的输入信号的功率谱Y(λ,k)用于输入,通过下式(14)以及式(15)来计算抑制量限制系数Gfloor(λ,k)。下式(14)是决定抑制量的上限和下限的式子,下式(15)是进行抑制量限制系数的帧间平滑的式子。所得到的抑制量限制系数Gfloor(λ,k)被输出到抑制量计算部9。
G ^ floor ( &lambda; , k ) =min ( max ( GMIN , R ^ ( &lambda; , k ) / Y ( &lambda; , k ) ) , GMAX ) , k = 0 , . . . , N - 1 - - - ( 14 )
G floor ( &lambda; , k ) = &beta; &CenterDot; G ^ floor ( &lambda; - 1 , k ) + ( 1 - &beta; ) &CenterDot; G ^ floor ( &lambda; , k ) , k = 0 , . . . , N - 1 - - - ( 15 )
此处,GMAX是最大增益量、即成为噪音抑制装置的最小的抑制量的1以下的规定的常数。另外,β表示规定的平滑化系数,优选β=0.1。
在图1中,SN比计算部8将功率谱计算部3输出的功率谱Y(λ,k)、噪音谱推测部5输出的推测噪音谱N(λ,k)、以及后述的抑制量计算部9输出的前帧的谱抑制量G(λ-1,k)用于输入,计算每个谱分量的后验SNR(a posteriori SNR)和先验SNR(a prioriSNR)。
能够使用功率谱Y(λ,k)和推测噪音谱N(λ,k),通过下式(16)来求出后验SNRγ(λ,k)。
&gamma; ( &lambda; , k ) = | Y ( &lambda; , k ) | 2 N ( &lambda; , k ) - - - ( 16 )
另外,能够使用前帧的谱抑制量G(λ-1,k)、和前帧的后验SNRγ(λ-1,k),通过下式(17)来求出先验SNRξ(λ,k)。
ξ(λ,k)=δ·γ(λ-l,k),G2(λ-l,k)+(1-δ)·F[γ(λ,k)-1]        (17)
其中
Figure BDA00003239888500134
此处,δ是遗忘系数且是0<δ<1的范围的规定的常数,在本实施方式1中优选δ=0.98。另外,F[·]意味着半波整流,当后验SNRγ(λ,k)在分贝值下是负的情况下,使值归零。
以上,所得到的后验SNRγ(λ,k)以及先验SNRξ(λ,k)被分别输出到抑制量计算部9。
抑制量计算部9将SN比计算部8输出的先验SNRξ(λ,k)以及后验SNRγ(λ,k)、和抑制量限制系数计算部7输出的抑制量限制系数Gfloor(λ,k)用于输入,求出作为每个谱的噪音抑制量的谱抑制量G(λ,k)。所求出的谱抑制量G(λ,k)被输出到谱抑制部10。
作为在抑制量计算部9中求出谱抑制量G(λ,k)的手法,能够应用例如Joint MAP(Maximum A Posteriori,最大后验)法。JointMAP法是将噪音信号和声音信号假设为是高斯分布而推测谱抑制量G(λ,k)的方法,使用先验SNRξ(λ,k)以及后验SNRγ(λ,k),求出使附带条件的概率密度函数成为最大的振幅谱和相位谱,将其值用作推测值。在该结构的情况下,能够将决定概率密度函数的形状的ν和μ作为参数,通过下式(18)来表示谱抑制量G(λ,k)。
G ^ ( &lambda; , k ) = u ( &lambda; , k ) + u 2 ( &lambda; , k ) + v 2 &gamma; ( &lambda; , k ) - - - ( 18 )
其中, u ( &lambda; , k ) = 1 2 - &mu; 4 &gamma; ( &lambda; , k ) &xi; ( &lambda; , k )
抑制量计算部9在通过上式(18)得到了虚拟的谱抑制量G^(λ,k)之后,使用抑制量限制系数Gfloor(λ,k)和下式(19)来进行谱增益的最小值的限制(归零处理),得到谱抑制量G(λ,k)。
G ( &lambda; , k ) = max ( G ^ ( &lambda; , k ) , G floor ( &lambda; , k ) ) - - - ( 19 )
另外,关于Joint MAP法中的谱抑制量导出法的详细内容,参照《T.Lotter,P.Vary,“Speech Enhancement by MAP SpectralAmplitude Using a Super-Gaussian Speech Model”,EURASIPJournal on Applied Signal Processing,pp.1110-1126,No.7,2005》,此处省略说明。
谱抑制部10将抑制量计算部9输出的谱抑制量G(λ,k)用于输入,依照下式(20),将输入信号的谱分量X(λ,k)针对该谱的每一个进行抑制,求出噪音抑制了的声音信号谱S(λ,k)。所求出的声音信号谱S(λ,k)被输出到逆傅立叶变换部11。
S(λ,k)=G(λ,k)·X(λ,k)       (20)
逆傅立叶变换部11在使用谱抑制部10输出的声音信号谱S(λ,k)、和声音信号的相位谱进行逆傅立叶变换,并与前帧的输出信号进行了重叠处理之后,将噪音抑制了的声音信号s(t)输出到输出端子12。
输出端子12将噪音抑制了的声音信号s(t)输出到外部。
图5是示意地示出作为本实施方式1的噪音抑制装置的输出信号的残留噪音谱(即,声音信号谱S(λ,k))的一个例子的图。与之前说明的图6同样地,点线是推测噪音谱,断续线是全部带宽以一定的抑制量进行了抑制的情况的残留噪音谱。相对于此,实线是通过本实施方式1的噪音抑制装置进行了噪音抑制的残留噪音谱。
关于在实际的噪音环境、例如汽车行驶时的车室内观测的行驶噪音,由于风噪以及引擎加速音等而产生复杂的波峰,不会成为单纯的右侧下降的形状的情况较多。在这样的噪音混入到输入信号的情况下,在以往的方法(在图6中实线所示)中,为了以使噪音抑制处理后的残留噪音与规定的目标谱的形状一致的方式决定整体的抑制量,存在出现极端地抑制过剩的带宽以及抑制不足的带宽的情况。相对于此,在本实施方式1的方法(在图5中实线所示)中,根据从输入信号推测的噪音谱N(λ,k)来计算抑制量限制系数Gfloor(λ,k),使用该系数进行谱增益的限制处理,所以一定的抑制量的情况(在图5以及图6中断续线所示)那样的成为乐音以及异常音的原因的波峰分量以及波谷(凹凸)等不会残留,并且也不会产生极端地抑制过剩以及抑制不足的带宽,而能够进行良好的噪音抑制。
通过以上,根据实施方式1,噪音抑制装置构成为具备:傅立叶变换部2,将时域的输入信号变换为频域的谱分量;功率谱计算部3,根据谱分量来计算功率谱;声音/噪音区间判定部4,判定输入信号的噪音区间;噪音谱推测部5,根据噪音区间的输入信号来推测噪音谱;校正谱计算部6,求出表示推测噪音谱的偏差程度的方差值,根据方差值和声音/噪音区间的判定结果来校正推测噪音谱而生成校正谱;抑制量限制系数计算部7,根据校正谱,生成规定噪音抑制的上下限的抑制量限制系数;SN比计算部8,计算推测噪音谱的SN比;抑制量计算部9,使用SN比和抑制量限制系数来控制抑制系数;谱抑制部10,使用抑制系数对输入信号的谱分量进行振幅抑制;以及逆傅立叶变换部11,将振幅抑制了的谱分量变换到时域而生成噪音抑制信号。因此,能够提供高质量的噪音抑制装置,抑制乐音的发生,并且也不会产生极端地抑制过剩以及抑制不足的带宽,而实现良好的噪音抑制。
另外,根据实施方式1,校正谱计算部6根据推测噪音谱的方差值来变更滤波器或者变更处理次数等而控制校正量,从而能够实现良好的噪音抑制。
另外,作为针对推测噪音谱的校正处理,能够进行频率方向平滑化以及帧间平滑化中的某一方或者其两方。通过进行频率方向平滑化的校正,能够减小噪音的每个频率的凹凸来抑制乐音的发生。另外,通过进行帧间平滑化的校正,能够追踪输入信号中的噪音的急剧的变化。因此,能够实现更良好的噪音抑制。
另外,根据实施方式1,校正谱计算部6在推测噪音谱的方差值是规定的阈值以下的情况下,停止该推测噪音谱的校正,或者另外在由声音/噪音区间判定部4判定为声音区间的情况下停止校正,所以能够阻止过度的平滑化,并且在推测噪音谱中错误地混入了声音信号的情况下,能够防止向校正谱的影响,能够实现更良好的噪音抑制。
另外,根据实施方式1,校正谱计算部6通过对推测噪音谱进行随着频率变高而使平滑化变强的校正,能够进一步缓和噪音的紊乱大的高频区域分量的凹凸,能够实现更良好的噪音抑制。
而且,通过随着从低频区域成为高频区域而减小校正谱的更新速度,从而能够加快频率/时间变化大的高频区域分量的更新速度,能够实现更良好的噪音抑制。
另外,在上述实施方式1中,校正谱计算部6依照上式(10),使用平滑化了的推测噪音谱来生成校正谱,但例如也可以构成为预先学习并保持规定的校正谱,在动作初始状态以及输入信号中的噪音骤变了的情况下,代替平滑化了的推测噪音谱而将预先学习的规定的校正谱用于输入。通过该结构,在初始状态以及输入信号骤变了的情况下,能够加快校正谱的学习结束速度,能够使输出信号的音质变化成为最小限。
另外,也可以针对在上式(10)中得到的校正谱,始终少量混入预先学习的规定的校正谱。通过混入少量规定的校正谱,能够抑制校正谱的过度学习(逐渐地遗忘校正谱),能够进行更良好的噪音抑制。
另外,在上述实施方式1中,以使用最大后验概率法(MAP法)作为由抑制量计算部9以及谱抑制部10执行的噪音抑制的方法的情况为例子进行了说明,但不限于该方法,还能够应用于使用其他方法的情况。例如,有在非专利文献1中详细叙述的最小均方差短时间谱振幅法、以及在S.F.Boll,“Suppression of Acoustic Noise in Speech UsingSpectral Subtraction”(IEEE Trans.on ASSP,Vol.27,No.2,pp.113-120,Apr.1979)中详细叙述的谱减法等。
另外,在上述实施方式1中,针对输入信号的全部带宽进行了抑制量控制,但不限于此,例如也可以根据需要仅控制低频区域或者高频区域,另外例如也可以仅控制500~800Hz附近这样的特定的频率带宽。这样的针对限定的频率带宽的抑制量控制对于风噪以及汽车引擎音等窄带宽性噪音是有效的。
而且,在图示例中,说明了窄带宽电话(0~4000Hz)的情况,但噪音抑制对象不限于窄带宽电话声音,还能够应用于例如0~8000Hz的宽带宽电话声音以及音响信号。
另外,在上述实施方式1中,将噪音抑制了的声音信号以数字数据形式送出到声音编码装置、声音识别装置、声音储存装置、免提通话装置等各种声音音响处理装置,但实施方式1的噪音抑制装置能够通过单独或者与上述其他装置一起利用DSP(数字信号处理处理器)来实现、或者作为软件程序执行来实现。程序既可以存储于执行软件程序的计算机的存储装置,也可以是通过CD-ROM等存储介质分发的形式。另外,还能够通过网络来提供程序。另外,除了向各种声音音响处理装置送出以外,还能够在D/A(数字/模拟)变换之后,通过放大装置进行放大,并从扬声器等直接作为声音信号而输出。
除了上述以外,本申请发明能够在本发明的范围内实现实施方式的任意的构成要素的变形、或者实施方式的任意的构成要素的省略。
产业上的可利用性
如以上那样,本发明的噪音抑制装置能够实现高质量的噪音抑制,所以适用于导入了声音通信、声音储存、声音识别系统的车辆导航、便携电话、对讲机等声音通信系统、免提通话系统、TV会议系统、监视系统等的音质改善、以及声音识别系统的识别率的提高。

Claims (5)

1.一种噪音抑制装置,使用将输入信号从时域变换到频域而得到的谱分量以及根据该输入信号推测的推测噪音谱来计算用于噪音抑制的抑制系数,使用该抑制系数对该输入信号的谱分量进行振幅抑制,生成变换到时域的噪音抑制信号,其特征在于,具备:
校正谱计算部,求出表示所述推测噪音谱的特征的统计性信息,根据该统计性信息来校正所述推测噪音谱而生成校正谱;
抑制量限制系数计算部,根据所述校正谱计算部生成的校正谱,生成对所述噪音抑制的上下限进行规定的抑制量限制系数;以及
抑制量计算部,使用所述抑制量限制系数计算部生成的抑制量限制系数,控制所述抑制系数。
2.根据权利要求1所述的噪音抑制装置,其特征在于,
所述校正谱计算部根据统计性信息的值,控制推测噪音谱的校正量。
3.根据权利要求1所述的噪音抑制装置,其特征在于,
所述校正谱计算部在统计性信息的值是规定的阈值以下的情况下,停止推测噪音谱的校正。
4.根据权利要求1所述的噪音抑制装置,其特征在于,
所述校正谱计算部对推测噪音谱,进行频率方向平滑化以及帧间平滑化中的某一方或者其两方的校正。
5.根据权利要求1所述的噪音抑制装置,其特征在于,
所述校正谱计算部对推测噪音谱进行随着频率变高而使平滑化变强的校正。
CN201180056553.3A 2011-01-19 2011-01-19 噪音抑制装置 Active CN103238183B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/000257 WO2012098579A1 (ja) 2011-01-19 2011-01-19 雑音抑圧装置

Publications (2)

Publication Number Publication Date
CN103238183A true CN103238183A (zh) 2013-08-07
CN103238183B CN103238183B (zh) 2014-06-04

Family

ID=46515235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180056553.3A Active CN103238183B (zh) 2011-01-19 2011-01-19 噪音抑制装置

Country Status (5)

Country Link
US (1) US8724828B2 (zh)
JP (1) JP5265056B2 (zh)
CN (1) CN103238183B (zh)
DE (1) DE112011104737B4 (zh)
WO (1) WO2012098579A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105139860A (zh) * 2014-06-05 2015-12-09 宝马股份公司 通信设备及其运行方法
CN105830152A (zh) * 2014-01-28 2016-08-03 三菱电机株式会社 集音装置、集音装置的输入信号校正方法以及移动设备信息系统
TWI715139B (zh) * 2019-08-06 2021-01-01 原相科技股份有限公司 聲音播放裝置及其透過遮噪音訊遮蓋干擾音之方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2546025B (en) 2010-10-01 2017-08-23 Asio Ltd A Transaction authenticating device and method
US10107893B2 (en) * 2011-08-05 2018-10-23 TrackThings LLC Apparatus and method to automatically set a master-slave monitoring system
KR101253708B1 (ko) * 2012-08-29 2013-04-12 (주)알고코리아 보청장치의 외부 소음을 차폐하는 방법
JP6051701B2 (ja) * 2012-09-05 2016-12-27 ヤマハ株式会社 エンジン音加工装置
WO2014084000A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
JP6263890B2 (ja) * 2013-07-25 2018-01-24 沖電気工業株式会社 音声信号処理装置及びプログラム
JP6337519B2 (ja) 2014-03-03 2018-06-06 富士通株式会社 音声処理装置、雑音抑圧方法、およびプログラム
EP3079151A1 (en) * 2015-04-09 2016-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and method for encoding an audio signal
JP6559576B2 (ja) * 2016-01-05 2019-08-14 株式会社東芝 雑音抑圧装置、雑音抑圧方法及びプログラム
GB201617409D0 (en) 2016-10-13 2016-11-30 Asio Ltd A method and system for acoustic communication of data
GB201617408D0 (en) 2016-10-13 2016-11-30 Asio Ltd A method and system for acoustic communication of data
GB201704636D0 (en) 2017-03-23 2017-05-10 Asio Ltd A method and system for authenticating a device
GB2565751B (en) 2017-06-15 2022-05-04 Sonos Experience Ltd A method and system for triggering events
US10586529B2 (en) * 2017-09-14 2020-03-10 International Business Machines Corporation Processing of speech signal
US10587983B1 (en) * 2017-10-04 2020-03-10 Ronald L. Meyer Methods and systems for adjusting clarity of digitized audio signals
GB2570634A (en) 2017-12-20 2019-08-07 Asio Ltd A method and system for improved acoustic transmission of data
US11146607B1 (en) * 2019-05-31 2021-10-12 Dialpad, Inc. Smart noise cancellation
JP2021135422A (ja) * 2020-02-28 2021-09-13 沖電気工業株式会社 信号処理装置および信号処理方法
US11988784B2 (en) 2020-08-31 2024-05-21 Sonos, Inc. Detecting an audio signal with a microphone to determine presence of a playback device

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1193644C (zh) * 2000-01-28 2005-03-16 艾利森电话股份有限公司 用频谱减少来降低双送话器信号噪声的系统和方法
JP2005202222A (ja) * 2004-01-16 2005-07-28 Toshiba Corp ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置
JP3858668B2 (ja) * 2001-11-05 2006-12-20 日本電気株式会社 ノイズ除去方法及び装置
CN1905006A (zh) * 2005-07-27 2007-01-31 日本电气株式会社 噪声抑制系统与方法及程序
JP4454591B2 (ja) * 2006-02-09 2010-04-21 学校法人早稲田大学 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置
EP2192579A1 (en) * 2007-09-19 2010-06-02 Nec Corporation Noise suppression device, its method, and program
CN101853666A (zh) * 2009-03-30 2010-10-06 华为技术有限公司 一种语音增强的方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6175602B1 (en) 1998-05-27 2001-01-16 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using linear convolution and casual filtering
JP3459363B2 (ja) 1998-09-07 2003-10-20 日本電信電話株式会社 雑音低減処理方法、その装置及びプログラム記憶媒体
JP2003058186A (ja) 2001-08-13 2003-02-28 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 雑音抑圧方法および雑音抑圧装置
JP4670483B2 (ja) * 2005-05-31 2011-04-13 日本電気株式会社 雑音抑圧の方法及び装置
US8233636B2 (en) * 2005-09-02 2012-07-31 Nec Corporation Method, apparatus, and computer program for suppressing noise
JP2008216720A (ja) * 2007-03-06 2008-09-18 Nec Corp 信号処理の方法、装置、及びプログラム
EP1995722B1 (en) 2007-05-21 2011-10-12 Harman Becker Automotive Systems GmbH Method for processing an acoustic input signal to provide an output signal with reduced noise
JP2009038136A (ja) 2007-07-31 2009-02-19 Panasonic Corp 半導体装置およびその製造方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1193644C (zh) * 2000-01-28 2005-03-16 艾利森电话股份有限公司 用频谱减少来降低双送话器信号噪声的系统和方法
JP3858668B2 (ja) * 2001-11-05 2006-12-20 日本電気株式会社 ノイズ除去方法及び装置
JP2005202222A (ja) * 2004-01-16 2005-07-28 Toshiba Corp ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置
CN1905006A (zh) * 2005-07-27 2007-01-31 日本电气株式会社 噪声抑制系统与方法及程序
JP4454591B2 (ja) * 2006-02-09 2010-04-21 学校法人早稲田大学 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置
EP2192579A1 (en) * 2007-09-19 2010-06-02 Nec Corporation Noise suppression device, its method, and program
CN101853666A (zh) * 2009-03-30 2010-10-06 华为技术有限公司 一种语音增强的方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105830152A (zh) * 2014-01-28 2016-08-03 三菱电机株式会社 集音装置、集音装置的输入信号校正方法以及移动设备信息系统
CN105139860A (zh) * 2014-06-05 2015-12-09 宝马股份公司 通信设备及其运行方法
TWI715139B (zh) * 2019-08-06 2021-01-01 原相科技股份有限公司 聲音播放裝置及其透過遮噪音訊遮蓋干擾音之方法

Also Published As

Publication number Publication date
US20130216058A1 (en) 2013-08-22
WO2012098579A1 (ja) 2012-07-26
US8724828B2 (en) 2014-05-13
JP5265056B2 (ja) 2013-08-14
CN103238183B (zh) 2014-06-04
DE112011104737B4 (de) 2015-06-03
DE112011104737T5 (de) 2013-11-07
JPWO2012098579A1 (ja) 2014-06-09

Similar Documents

Publication Publication Date Title
CN103238183B (zh) 噪音抑制装置
CN104067339B (zh) 噪音抑制装置
CN103109320B (zh) 噪声抑制装置
CN103827965B (zh) 自适应语音可理解性处理器
CN112767963B (zh) 一种语音增强方法、装置、系统及计算机可读存储介质
JP2714656B2 (ja) 雑音抑圧システム
JP4753821B2 (ja) 音信号補正方法、音信号補正装置及びコンピュータプログラム
CN112242147A (zh) 一种语音增益控制方法及计算机存储介质
US20230267947A1 (en) Noise reduction using machine learning
CN103544961A (zh) 语音信号处理方法及装置
CN113838471A (zh) 基于神经网络的降噪方法、系统、电子设备及存储介质
JP2000330597A (ja) 雑音抑圧装置
US8254590B2 (en) System and method for intelligibility enhancement of audio information
EP2660814B1 (en) Adaptive equalization system
Bao et al. A novel speech enhancement method using power spectra smooth in wiener filtering
Unoki et al. MTF-based power envelope restoration in noisy reverberant environments
EP4258263A1 (en) Apparatus and method for noise suppression
Yang et al. Environment-Aware Reconfigurable Noise Suppression
US20230402050A1 (en) Speech Enhancement
Tsukamoto et al. Speech enhancement based on MAP estimation with a variable speech distribution
Liu et al. An improved generalized weighted Bayesian estimator for speech enhancement
Li et al. An improved β-order WEDM spectral amplitude estimator for speech enhancement
Sasaoka et al. A variable step size algorithm for speech noise reduction method based on noise reconstruction system
Harvilla Compensation for Nonlinear Distortion in Noise for Robust Speech Recognition
Kamaraju et al. Speech Enhancement Technique Using Eigen Values

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant