CN102132343A - 噪声抑制装置 - Google Patents

噪声抑制装置 Download PDF

Info

Publication number
CN102132343A
CN102132343A CN200880130856.3A CN200880130856A CN102132343A CN 102132343 A CN102132343 A CN 102132343A CN 200880130856 A CN200880130856 A CN 200880130856A CN 102132343 A CN102132343 A CN 102132343A
Authority
CN
China
Prior art keywords
squelch
noise
spectrum
frequency
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200880130856.3A
Other languages
English (en)
Other versions
CN102132343B (zh
Inventor
田崎裕久
古田训
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN102132343A publication Critical patent/CN102132343A/zh
Application granted granted Critical
Publication of CN102132343B publication Critical patent/CN102132343B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

针对各个频率分量的每一个比较多个噪声抑制部(4、5)输出的多个噪声抑制频谱(105、106)的值,选择值最大的噪声抑制频谱作为该频率分量的值而得到输出频谱(107)。另外,第一噪声抑制部(4)通过对输入频谱(102)乘以振幅抑制增益来生成噪声抑制频谱(105),将该振幅抑制增益设定为比第二噪声抑制部(5)的噪声信号区间中的大半的振幅抑制增益大的值。

Description

噪声抑制装置
技术领域
本发明涉及在各种噪声环境下使用的语音通信系统、语音识别系统等中,抑制语音·声音信号等目的信号以外的噪声,进行移动电话等语音通信系统·免提通话系统·TV会议系统等音质改善、语音识别系统的识别率的提高等的噪声抑制装置。
背景技术
作为通过从混入了噪声的输入信号中抑制作为目的外信号的噪声,来强调作为目的信号的语音信号等的噪声抑制处理的代表性手法,例如有谱减(Spectral Subtraction:SS)法,这是通过从振幅频谱中减去另行推定的平均噪声频谱来进行噪声抑制的方法(例如,非专利文献1)。
在进行了谱减法等噪声抑制处理时,噪声频谱的推定误差作为失真残留在噪声抑制处理后的信号中,其具有与处理前的信号大不相同的特性,作为刺耳的噪声(也被称为人工性噪声、乐音(musical tone))出现,因此有时使输出信号的主观品质较大地劣化。
作为抑制如上所述的主观性劣化感的方法例如有专利文献1所公开的方法。专利文献1的目的在于提供一种在噪声区间不发生音乐噪音(musical noise)、在语音区间也不发生失真的噪声抑制装置,包括:语音·噪声判定部,根据输入信号判定目的信号区间与噪声信号区间;噪声抑制部,根据输入信号和推定噪声信号按照第一抑制系数进行噪声抑制;噪声过剩抑制部,根据输入信号和推定噪声信号按照大于第一抑制系数的第二抑制系数进行噪声抑制;以及切换部,按照语音·噪声判定部的判定结果切换噪声抑制部的输出信号与噪声过剩抑制部的输出信号。
非专利文献1:Steven F.Boll,″Suppression of Acoustic noisein speech using spectral subtraction″,IEEE Trans.ASSP,Vol.ASSP-27,No.2,April 1979.
专利文献1:日本特开2005-195955号公报(第8页~第9页、图1、图2)
由于现有的噪声抑制装置是如上那样构成的,因此按照语音·噪声判定部的判定结果进行噪声抑制部的输出信号与噪声过剩抑制部的输出信号的切换,存在无法避免因错误判定造成的品质劣化的课题。另外,由于语音信号、噪声信号是千差万别的,并伴随着时间变动,因此存在难以100%正确判定的课题。
特别是,若将噪声信号区间错误判定为语音信号区间,则在同一区间发生音乐噪音,存在品质较大劣化的课题。
另外,即使是语音信号区间,在按频率频带看时,若语音分量极小,噪声分量有主导频带,则该频带中发生音乐噪音,存在品质较大劣化的课题。
进而,在将语音信号区间错误判定为噪声信号区间时,通过输入信号的加法来减轻了语音的抑制,但是若在相同语音信号区间内频繁地插入错误判定,则感觉到不稳定的变动,存在品质劣化的课题。
本发明是为了解决如上所述的课题而作出的,其目的在于提供一种较大减轻了音乐噪音的发生的高音质的噪声抑制装置。
发明内容
本发明所涉及的噪声抑制装置包括:多个噪声抑制部,对输入频谱进行噪声抑制处理,输出得到的噪声抑制频谱;以及选择部,针对各个频率分量的每一个,比较所述多个噪声抑制频谱的值,选择具有最大值的噪声抑制频谱,并作为该频率分量的频谱进行输出。
根据本发明,由于构成为包括:对输入频谱进行噪声抑制处理,输出得到的噪声抑制频谱的多个噪声抑制部;以及针对各个频率分量的每一个比较多个噪声抑制频谱的值,选择具有最大值的噪声抑制频谱,并作为该频率分量的频谱进行输出的选择部,因此未被过抑制的频谱被选择,从而能够较大地减轻音乐噪音,能够实现语音信号区间中的不稳定的变动少的高品质的噪声抑制装置。
附图说明
图1是表示实施方式1的噪声抑制装置的结构的框图;
图2是表示实施方式1中的频谱分量的时间推移的一例的示意图;
图3是表示实施方式2的噪声抑制装置的结构的框图;
图4是表示实施方式2中的频谱分量的时间推移的一例的示意图。
具体实施方式
下面,为了更详细地说明本发明,根据附图对实施本发明的优选方式进行说明。
实施方式1.
图1是表示实施方式1所涉及的噪声抑制装置的结构的框图。
噪声抑制装置包括:时间·频率转换部1、语音相似性分析部2、噪声频谱推定部3、第一噪声抑制部4、第二噪声抑制部5、最大振幅选择部6、以及频率·时间转换部7。
另外,第一噪声抑制部4包括SN推定部4a和频谱振幅抑制部4b,第二噪声抑制部5包括频谱减法部5a和频谱振幅抑制部5b。
接下来,对该噪声抑制装置的动作原理进行说明。
首先,对输入信号101以规定的采样频率(例如,8kHz)进行采样,以规定的帧周期(例如,20msec)进行帧分割,并输入到时间·频率转换部1和语音相似性分析部2。
时间·频率转换部1对以帧周期分割的输入信号101进行加窗处理,对加窗后的信号使用例如256点的FFT(Fast Fourier Transform:快速傅里叶变换),转换为每个频率的频谱分量即输入频谱102,向语音相似性分析部2、噪声频谱推定部3、SN推定部4a、频谱振幅抑制部4b、频谱减法部(减法部)5a、以及频谱振幅抑制部(振幅抑制部)5b输出。在加窗处理中,例如可以使用汉宁窗、梯形窗等公知的手法。另外,由于FFT为周知的手法因此省略说明。
语音相似性分析部2使用输入信号101、时间·频率转换部1输出的输入频谱102、以及存储在后述的噪声频谱推定部3的内部存储器等中的前一帧的推定噪声频谱104,作为当前帧的输入信号是否为语音或噪音的程度计算语音相似性评价值103,并将其输出到噪声频谱推定部3,该语音相似性评价值103例如在语音的可能性高时取大的评价值,在语音的可能性低时取小的评价值。
作为语音相似性评价值103的计算方法,例如可以分别单独或组合使用输入信号101的自相关分析结果的最大值、可根据输入频谱102的功率与推定噪声频谱104的功率之比计算出的帧SN比。这里,输入信号101的自相关分析的最大值ACFmax通过式(1)计算,帧SN比SNRfr通过式(2)计算。推定噪声频谱104读出并使用存储在后述的噪声频谱推定部3的内部存储器中的前一帧。
ACF max = max j = 0 N ( Σ t = 0 N - k x ( t ) x ( t + j ) Σ t = 0 N ( x ( t ) ) 2 , 0 ) 式(1)
SNR fr = max { 20 log 10 ( Σ k = 0 M S ( k ) ) - 20 log 10 ( Σ k = 0 M N ( k ) ) , 0 } 式(2)
这里,x(t)为时间t中的被帧分割的输入信号101,N为自相关分析区间长度,S(k)为输入频谱102的第k个分量,N(k)为推定噪声频谱104的第k个分量,M为FFT点数。
根据由上式(1)求出的自相关分析的最大值ACFmax与由式(2)求出的帧SN比SNRfr,通过下式计算出语音相似性评价值VAD。
VAD=wACF·ACFmax+wSNR·SNRfr·SNRnorm    式(3)
这里,SNRnorm为用于将SNRfr的值标准化为0~1的范围内的规定值,wACF和wSNR为用于加权的规定值,分别可以按照噪音的种类、噪音的功率,预先进行调整以能够适当地判定语音相似性评价值。ACFmax根据式(1)的性质取0~1的范围的值。通过以上的处理计算出的语音相似性评价值103输出到噪声频谱推定部3。
另外,在式(3)中,也可以通过将wACF或wSNR的值的某一个设定为0,由此由设定为0以外的一方的参数单独计算出语音相似性评价值103。具体而言,在将wSNR设为0时,仅由自相关分析的最大值ACFmax求出语音相似性评价值103。
进而,在语音相似性评价值103的计算中,也可以追加式(3)所示的指标·值以外的分析参数。例如,利用如下参数等可以适当进行变更:使用输入频谱102和推定噪声频谱104,计算出每个频率的频谱分量的SN比,并取了该每个频率的频谱分量的SN比的总和的值(总和越大,语音的可能性越高)、每个频率的频谱分量的SN比的方差(方差越大,语音的谐波构造越是显现,语音的可能性越高)。
噪声频谱推定部3参照从语音相似性分析部2输入的语音相似性评价值103,在当前帧的输入信号的形态为语音的可能性低时,使用当前帧的输入频谱102,进行存储在内部存储器(未图示)等中的前一帧的推定噪声频谱的更新,将更新的结果作为推定噪声频谱104,输出到SN推定部4a和频谱减法部5a。推定噪声频谱的更新例如通过根据下式(4)反映输入频谱来进行。
N ~ ( n , k ) = ( 1 - α ( k ) ) · N ( n - 1 , k ) + α ( k ) · S noise ( n , k ) ; k = 0 , . . . , M
式(4)
这里,n为帧编号,N(n-1,k)为更新前的推定噪声频谱,Snoise(n,k)为判断为语音的可能性低的当前帧的输入频谱,N(n,k)波浪号为更新后的推定噪声频谱。另外,α(k)为取0~1的值的规定的更新速度系数,较佳为设定为比较接近0的值。另外,随着变为高域,有时稍稍增大系数值较好,较佳为按照噪声的种类等进行调整。
此外,关于该推定噪声频谱的更新方法,为了进一步提高推定精度、推定追随性,可以适当地进行如下的变更:按照语音相似性评价值103的值,适用多个更新速度系数;参照帧间的输入频谱的功率、推定噪声频谱的功率的变动性,在这些变动大时,适用加快更新速度这样的更新速度系数;在某一定时间中,用功率最小、或语音相似性评价值最小的帧的输入频谱置换(重置)推定噪声频谱等。另外,在语音相似性评价值103的值足够大时,即当前帧的输入信号在概率上为语音的可能性高时,也可以不进行推定噪声频谱的更新。
在第一噪声抑制部4中,SN推定部4a基于输入频谱102和推定噪声频谱104计算出推定SN比,频谱振幅抑制部4b基于该推定SN比计算出振幅抑制增益,并且对该振幅抑制增益乘以输入频谱102,将得到的结果作为第一噪声抑制频谱105输出到最大振幅选择部6。
此外,SN推定部4a中的推定SN比的计算例如可以与上式(2)的帧SN比的计算同样地实施。在由语音相似性分析部2计算出了帧SN比时,可以将该帧SN比直接或进行时间方向的平滑化等适当的加工后作为推定SN比。
频谱振幅抑制部4b中的振幅抑制增益的计算是以如下方式进行:在推定SN比高的帧中成为大的振幅抑制增益,在推定SN比低的帧中成为小的振幅抑制增益。但是,关于该振幅抑制增益,事先设定为比后述的第二噪声抑制部5的噪声信号区间中的大半的振幅抑制增益(输入频谱102与后述的第二噪声抑制频谱106的振幅比)大的值。
例如,使用推定SN比和输入频谱102的功率,推定该帧的语音功率,即去除了噪声时的功率,求出振幅抑制增益以使第一噪声抑制频谱105的功率与其一致,在该振幅抑制增益成为规定的下限值以下时,置换为下限值即可。
另一方面,在第二噪声抑制部5中,对于输入频谱102,由频谱减法部5a进行基于推定噪声频谱104的频谱减法处理,对于减法后的频谱,由频谱振幅抑制部5b进行对每个频率的频谱分量给予衰减量的频谱振幅抑制,将得到的结果作为第二噪声抑制频谱106输出到最大振幅选择部6。
这里,进行频谱振幅抑制部5b的衰减量的适应控制,以使噪声信号区间中的第二噪声抑制部5整体的振幅抑制增益(输入频谱102与第二噪声抑制频谱106的振幅比)的变动减少。
此外,作为该第二噪声抑制部5的结构,例如可以适用日本专利第3454190号“噪声抑制装置以及方法”中记载的结构。
另外,也可以是如下结构:颠倒频谱振幅抑制部5b与频谱减法部5a的顺序,对于输入频谱102,由频谱振幅抑制部5b进行对每个频率的频谱分量给予衰减量的频谱振幅抑制,对于振幅抑制后的频谱,由频谱减法部5a进行基于推定噪声频谱104的频谱减法处理,将得到的结果作为第二噪声抑制频谱106输出到最大振幅选择部6。
最大振幅选择部6比较第一噪声抑制频谱105与第二噪声抑制频谱106,针对每个频率选择大的一方的频谱分量,集中所选择的大的一方的频谱分量作为输出频谱107输出到频率·时间转换部7。
频率·时间转换部7对从最大振幅选择部6输入的输出频谱107进行逆FFT处理而返回到时域信号,进行用于与前后帧的平滑连接的加窗处理,并且进行连结,将得到的信号作为输出信号108输出。
图2表示某个频率的频谱分量的时间推移。图2(a)表示输入频谱,图2(b)表示第一噪声抑制频谱,图2(c)表示第二噪声抑制频谱,图2(d)表示输出频谱的时间推移。在各图中,横轴表示时间,纵轴表示振幅。进而,空白的柱状图表示噪声的振幅,斜线的柱状图表示语音的振幅,相对于时间轴前半部分的5个区间为噪声信号区间,后半部分的3个区间为噪声重叠的语音信号区间。
在第一噪声抑制部4中,如上所述根据推定SN比计算出振幅抑制增益,对图2(a)所示的输入频谱102乘以该振幅抑制增益,从而得到图2(b)所示的第一噪声抑制频谱105。在噪声信号区间中,由于推定SN低,因此计算出小的振幅抑制增益,第一噪声抑制频谱的振幅值减小。在语音信号区间中,由于推定SN高,因此计算出大的振幅抑制增益,第一噪声抑制频谱的振幅值不怎么减小。此外,在语音信号区间的开头附近,容易将推定SN弄错为低,因此如图2(b)所示,抑制为实际的语音的振幅以上,有时会发生语音的断续感。
在第二噪声抑制部5中,根据图2(a)所示的输入频谱102进行基于推定噪声频谱104的减法以及振幅抑制,从而如图2(c)所示,噪声信号区间的振幅大致减小,得到语音信号区间的振幅接近语音的振幅的第二噪声抑制频谱106。但是,因噪声的变动、语音相似性评价值的误差造成推定噪声频谱104增大为实际的值以上时,如图2(c)所示,在噪声信号区间中,残留噪声残留为岛状,发生刺耳的人工性噪声(音乐噪音),在语音信号区间中,因过抑制导致发生语音的断续感。
图2(d)表示在最大振幅选择部6中,选择图2(b)的第一噪声抑制频谱105和图2(c)的第二噪声抑制频谱106的大的一方而得到的输出频谱107。由于将第一噪声抑制部4中的振幅抑制增益设定为比第二噪声抑制部5的噪声信号区间中的大半的振幅抑制增益大的值,因此在噪声信号区间中,大半的第一噪声抑制频谱105的振幅增大,被选择为输出频谱107。据此,噪声信号区间中的岛状的残留噪声消失,音乐噪音消除。另外,在语音信号区间中,由于过抑制少的一方被选择,因此得到过抑制被抑制的输出频谱107,语音的断续感得以减轻。
此外,在上述的实施方式1中,采用了包括第一噪声抑制部4和第二噪声抑制部5这两个噪声抑制部的结构,但也可以构成为如下:包括三个以上的噪声抑制部,最大振幅选择部6从三个以上的噪声抑制频谱,针对每个频率选择频谱分量的最大值。
另外,采用了在第二噪声抑制部5中包括频谱减法部5a和频谱振幅抑制部5b的结构,但并不限于此,例如也可以采用仅包括频谱减法部5a的结构。
进而,在上述的实施方式1中,构成为语音相似性分析部2和噪声频谱推定部3进行推定噪声频谱104的推定,但作为得到推定噪声频谱104的手段并不限于这种结构。
例如,还可以采用如下方法:构成为将噪声频谱推定部3中的更新速度设为非常慢,并经常进行更新,从而省略语音相似性分析部2,或者推定噪声频谱104的推定不是根据输入信号101进行,而是根据仅输入了噪声的噪声推定用的输入信号另行分析·推定。
如上所述,根据本实施方式1,由于构成为针对各个频率分量的每一个,比较第一和第二噪声抑制部4、5输出的第一和第二噪声抑制频谱105、106的值,选择值最大的噪声抑制频谱作为该频率分量的值而得到输出频谱107,因此未被过抑制的频谱被选择,从而能够较大地减轻音乐噪音,能够实现语音信号区间中的不稳定的变动少的高品质的噪声抑制装置。
另外,由于基于每个频率分量的大小比较进行频谱选择,因此不会如基于语音·噪声判定等选择噪声抑制部的输出的一方的现有技术那样由噪声抑制部一并切换全部频率分量,能够抑制频谱大变动的发生,并防止因语音·噪声判定的错误导致品质劣化,进而能够抑制语音信号区间的噪声分量占主导的频带中发生音乐噪音。
另外,根据本实施方式1,由于构成为将第一噪声抑制部4的振幅抑制增益设定为比第二噪声抑制部5的噪声信号区间中的大半的振幅抑制增益大的值,在噪声信号区间中大致选择第一噪声抑制部4的输出,因此在噪声信号区间中,成为仅进行了不发生音乐噪音的振幅抑制的输出,能够提高品质。
另外,在包括多个噪声抑制部时,由于在其他噪声抑制部中能够容忍噪声信号区间发生音乐噪音,适用语音信号区间的品质好的方式,因此在语音信号区间中也能够实现高品质的噪声抑制。
进而,根据本实施方式1,由于构成为将第一噪声抑制部4的振幅抑制增益在推定SN比高时设定为大的值,在推定SN比低时设定为小的值,因此在语音信号区间中成为小的振幅抑制增益,当其他噪声抑制部引起过抑制时选择第一噪声抑制部的输出,因此能够提高品质。
进而,根据本实施方式1,由于构成为第二噪声抑制部5组合频谱减法与频谱振幅抑制来生成噪声抑制频谱,因此能够适应控制其内部的频谱振幅抑制部5b的衰减量以使作为噪声信号区间中的第二噪声抑制部5整体的振幅抑制增益的变动减少,并且设定为在噪声信号区间中大致选择第一噪声抑制部的输出变得容易。据此,能够进一步抑制噪声信号区间的音乐噪音。
实施方式2.
图3是表示本发明的实施方式2所涉及的噪声抑制装置的结构的框图。实施方式2所涉及的噪声抑制装置中,仅由频谱振幅抑制部构成第一噪声抑制部。下面对与实施方式1相同的结构标注与在图1使用的符号相同的符号,省略或简化说明。
在第一噪声抑制部4中,频谱振幅抑制部4b’对从时间·频率转换部1输入的输入频谱102乘以固定的振幅抑制增益,将得到的结果作为第一噪声抑制频谱105’输出到最大振幅选择部6。
图4表示某个频率的频谱分量的时间推移。图4(a)表示输入频谱,图4(b)表示第一噪声抑制频谱,图4(c)表示第二噪声抑制频谱,图4(d)表示输出频谱的时间推移。在各图中,横轴表示时间,纵轴表示振幅。进而,空白的柱状图表示噪声的振幅,斜线的柱状图表示语音的振幅,相对于时间轴前半部分的5个区间为噪声信号区间,后半部分的3个区间为噪声重叠的语音信号区间。
此外,图4(a)的输入频谱与实施方式1中的图2(a)相同。另外,实施方式2的噪声抑制装置包括与实施方式1相同的第二噪声抑制部5,所以图4(a)的噪声抑制频谱与实施方式1中的图3(c)相同,因此省略说明。
在第一噪声抑制部4的频谱振幅抑制部4b’中,通过对图4(a)所示的输入频谱102乘以固定的振幅抑制增益,从而得到图4(b)所示的第一噪声抑制频谱105’。由于乘以固定的振幅抑制增益,因此也不会发生刺耳的人工性噪声(音乐噪音),仅仅是振幅减小。
图4(d)表示在最大振幅选择部6中选择图4(b)的第一噪声抑制频谱105’与图4(c)的第二噪声抑制频谱106的大的一方而得到的输出频谱107。由于将第一噪声抑制部4中的振幅抑制增益设定为比第二噪声抑制部5的噪声信号区间中的大半的振幅抑制增益大的值,因此在噪声信号区间中,大半的第一噪声抑制频谱105’的振幅增大,被选择为输出频谱107。据此,噪声信号区间中的岛状的残留噪声消失,音乐噪音消除。另外,在语音信号区间中,大半的第二噪声抑制频谱106的振幅增大,被选择为输出频谱107。虽未图示,但在语音信号区间中,当第二噪声抑制频谱106的振幅变得极小时,第一噪声抑制频谱105’被选择。据此,能够输出一定级别的语音而减轻语音的断续感。
此外,在上述的实施方式2中,采用了包括第一噪声抑制部4和第二噪声抑制部5这两个噪声抑制部的结构,但也可以构成为包括三个以上的噪声抑制部,最大振幅选择部6从三个以上的噪声抑制频谱中,针对每个频率选择频谱分量的最大值。
另外,采用了在第二噪声抑制部5中包括频谱减法部5a和频谱振幅抑制部5b的结构,但并不限于此,例如可以采用仅包括频谱减法部5a的结构。
进而,在上述的实施方式2中,构成为语音相似性分析部2和噪声频谱推定部3进行推定噪声频谱104的推定,但作为得到推定噪声频谱104的手段并不限于这种结构。
例如,也可以采取如下方法:通过构成为将噪声频谱推定部3中的更新速度设为非常慢,经常进行更新,从而省略语音相似性分析部2,或推定噪声频谱104的推定不是根据输入信号101进行,而是根据仅输入了噪声的噪声推定用的输入信号另行分析·推定。
如上所述,根据本实施方式2,由于构成为针对各个频率分量的每一个,比较第一和第二噪声抑制部4、5输出的第一和第二噪声抑制频谱105’、106的值,选择值最大的噪声抑制频谱作为该频率分量的值而得到输出频谱107,因此未被过抑制的频谱被选择,从而能够较大地减轻音乐噪音,能够实现语音信号区间中的不稳定的变动少的高品质的噪声抑制装置。
另外,由于基于每个频率分量的大小比较进行频谱选择,因此不会如基于语音·噪声判定等选择噪声抑制部的输出的一方的现有技术那样噪声抑制部一并切换全部频率分量,能够抑制频谱大变动的发生,并防止因语音·噪声判定的错误导致品质劣化,进而能够抑制语音信号区间的噪声分量占主导的频带中发生音乐噪音。
另外,根据本实施方式2,由于构成为将第一噪声抑制部4的振幅抑制增益设定为比第二噪声抑制部5的噪声信号区间中的大半的振幅抑制增益大的值,在噪声信号区间中大致选择第一噪声抑制部4的输出,因此在噪声信号区间中,成为仅进行不发生音乐噪音的振幅抑制的输出,能够提高品质。
另外,在包括多个噪声抑制部时,由于在其他噪声抑制部中能够容忍噪声信号区间发生音乐噪音,适用语音信号区间的品质好的方式,因此在语音信号区间中也能够实现高品质的噪声抑制。
进而,根据本实施方式2,由于构成为第二噪声抑制部5组合频谱减法与频谱振幅抑制来生成噪声抑制频谱,因此能够适应控制其内部的频谱振幅抑制部5b的衰减量以使作为噪声信号区间中的第二噪声抑制部5整体的振幅抑制增益的变动减少,并且容易设定为在噪声信号区间中大致选择第一噪声抑制部的输出。据此,能够进一步抑制噪声信号区间的音乐噪音。
实施方式3.
在上述的实施方式1和实施方式2中,示出了针对各个频率分量的每一个比较多个噪声抑制部4、5输出的多个噪声抑制频谱105(105’)、106的值,选择值最大的噪声抑制频谱作为该频率分量的值而得到输出频谱107的结构,但也可以构成为将多个噪声抑制频谱分别返回到时域信号,在得到的多个时域信号之中选择最大的。
作为将噪声抑制频谱返回到时域信号的手段,可以适用与频率·时间转换部7相同的手段。另外,也可以构成为在进行用于与前后帧的平滑连接的加窗处理之前,选择值最大的噪声抑制频谱。
如上所述,根据本实施方式3,由于构成为将多个噪声抑制部输出的多个噪声抑制频谱返回到时域信号,在得到的多个时域信号之中选择值最大的,因此未被过抑制的信号被选择,从而能够较大地减轻音乐噪音,能够实现语音信号区间中的不稳定的变动少的高品质的噪声抑制装置。
另外,由于基于时域信号的大小比较进行信号选择,因此不会如基于语音·噪声判定等选择噪声抑制部的输出的一方的现有技术那样噪声抑制部一并切换全部频率分量,能够抑制信号大变动的发生,并防止因语音·噪声判定的错误导致的品质劣化。
产业上的可利用性
如上所述,本发明在减轻刺耳的噪声(音乐噪音)的发生的高品质的噪声抑制方面优异,能够广泛适用于在各种噪声环境下也能使用的语音通信系统、语音识别系统。

Claims (4)

1.一种噪声抑制装置,其特征在于,包括:
多个噪声抑制部,对输入频谱进行噪声抑制处理,输出得到的噪声抑制频谱;以及
选择部,针对各个频率分量的每一个,比较所述多个噪声抑制频谱的值,选择具有最大值的噪声抑制频谱,并作为该频率分量的频谱进行输出。
2.根据权利要求1所述的噪声抑制装置,其特征在于,
所述噪声抑制部具有第一噪声抑制部,
所述第一噪声抑制部通过对输入频谱乘以振幅抑制增益来生成噪声抑制频谱,
所述第一噪声抑制部的振幅抑制增益大于其他噪声抑制部的噪声信号区间中的振幅抑制增益。
3.根据权利要求2所述的噪声抑制装置,其特征在于,
第一噪声抑制部在基于根据输入频谱和过去的帧推定的噪声频谱计算出的推定SN比高时,将振幅抑制增益设为大的值,在所述推定SN比低时,将振幅抑制增益设为小的值。
4.根据权利要求2所述的噪声抑制装置,其特征在于,
噪声抑制部具有第二噪声抑制部,
所述第二噪声抑制部包括:减法部,进行频谱减法处理;以及振幅抑制部,进行频谱振幅的抑制。
CN200880130856.3A 2008-11-04 2008-11-04 噪声抑制装置 Expired - Fee Related CN102132343B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2008/003162 WO2010052749A1 (ja) 2008-11-04 2008-11-04 雑音抑圧装置

Publications (2)

Publication Number Publication Date
CN102132343A true CN102132343A (zh) 2011-07-20
CN102132343B CN102132343B (zh) 2014-01-01

Family

ID=42152566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880130856.3A Expired - Fee Related CN102132343B (zh) 2008-11-04 2008-11-04 噪声抑制装置

Country Status (5)

Country Link
US (1) US8737641B2 (zh)
EP (1) EP2362389B1 (zh)
JP (1) JP5300861B2 (zh)
CN (1) CN102132343B (zh)
WO (1) WO2010052749A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103718241A (zh) * 2011-11-02 2014-04-09 三菱电机株式会社 噪音抑制装置
CN104081640A (zh) * 2012-01-27 2014-10-01 三菱电机株式会社 高频电流降低装置
CN108292501A (zh) * 2015-12-01 2018-07-17 三菱电机株式会社 声音识别装置、声音增强装置、声音识别方法、声音增强方法以及导航系统

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5528538B2 (ja) * 2010-03-09 2014-06-25 三菱電機株式会社 雑音抑圧装置
JP5588233B2 (ja) * 2010-06-10 2014-09-10 日本放送協会 雑音抑圧装置およびプログラム
JP5724361B2 (ja) * 2010-12-17 2015-05-27 富士通株式会社 音声認識装置、音声認識方法および音声認識プログラム
JP6182895B2 (ja) * 2012-05-01 2017-08-23 株式会社リコー 処理装置、処理方法、プログラム及び処理システム
JP6027804B2 (ja) * 2012-07-23 2016-11-16 日本放送協会 雑音抑圧装置およびそのプログラム
JP2014145838A (ja) * 2013-01-28 2014-08-14 Honda Motor Co Ltd 音響処理装置及び音響処理方法
US9601130B2 (en) * 2013-07-18 2017-03-21 Mitsubishi Electric Research Laboratories, Inc. Method for processing speech signals using an ensemble of speech enhancement procedures
CN103824563A (zh) * 2014-02-21 2014-05-28 深圳市微纳集成电路与系统应用研究院 一种基于模块复用的助听器去噪装置和方法
JP6379839B2 (ja) * 2014-08-11 2018-08-29 沖電気工業株式会社 雑音抑圧装置、方法及びプログラム
US20160379661A1 (en) * 2015-06-26 2016-12-29 Intel IP Corporation Noise reduction for electronic devices
JP6668995B2 (ja) * 2016-07-27 2020-03-18 富士通株式会社 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
CN107786709A (zh) * 2017-11-09 2018-03-09 广东欧珀移动通信有限公司 通话降噪方法、装置、终端设备及计算机可读存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3327058A (en) * 1963-11-08 1967-06-20 Bell Telephone Labor Inc Speech wave analyzer
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
JP2950260B2 (ja) * 1996-11-22 1999-09-20 日本電気株式会社 雑音抑圧送話装置
US6122384A (en) * 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
US6088668A (en) 1998-06-22 2000-07-11 D.S.P.C. Technologies Ltd. Noise suppressor having weighted gain smoothing
JP3454190B2 (ja) 1999-06-09 2003-10-06 三菱電機株式会社 雑音抑圧装置および方法
FR2797343B1 (fr) * 1999-08-04 2001-10-05 Matra Nortel Communications Procede et dispositif de detection d'activite vocale
JP2004341339A (ja) * 2003-05-16 2004-12-02 Mitsubishi Electric Corp 雑音抑圧装置
JP3907194B2 (ja) 2003-05-23 2007-04-18 株式会社東芝 音声認識装置、音声認識方法及び音声認識プログラム
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
JP4162604B2 (ja) * 2004-01-08 2008-10-08 株式会社東芝 雑音抑圧装置及び雑音抑圧方法
CN101904097B (zh) * 2007-12-20 2015-05-13 艾利森电话股份有限公司 噪声抑制方法和设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103718241A (zh) * 2011-11-02 2014-04-09 三菱电机株式会社 噪音抑制装置
CN103718241B (zh) * 2011-11-02 2016-05-04 三菱电机株式会社 噪音抑制装置
CN104081640A (zh) * 2012-01-27 2014-10-01 三菱电机株式会社 高频电流降低装置
CN108292501A (zh) * 2015-12-01 2018-07-17 三菱电机株式会社 声音识别装置、声音增强装置、声音识别方法、声音增强方法以及导航系统

Also Published As

Publication number Publication date
EP2362389A4 (en) 2012-07-25
EP2362389A1 (en) 2011-08-31
JPWO2010052749A1 (ja) 2012-03-29
EP2362389B1 (en) 2014-03-26
US20110123045A1 (en) 2011-05-26
CN102132343B (zh) 2014-01-01
JP5300861B2 (ja) 2013-09-25
WO2010052749A1 (ja) 2010-05-14
US8737641B2 (en) 2014-05-27

Similar Documents

Publication Publication Date Title
CN102132343B (zh) 噪声抑制装置
KR101266894B1 (ko) 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법
CN103325386B (zh) 用于信号传输控制的方法和系统
US8989403B2 (en) Noise suppression device
CN104067339B (zh) 噪音抑制装置
US9460731B2 (en) Noise estimation apparatus, noise estimation method, and noise estimation program
EP2346032B1 (en) Noise suppressor and voice decoder
JP4753821B2 (ja) 音信号補正方法、音信号補正装置及びコンピュータプログラム
CN103578477B (zh) 基于噪声估计的去噪方法和装置
US20140177853A1 (en) Sound processing device, sound processing method, and program
EP3118852B1 (en) Method and device for detecting audio signal
CN112242147A (zh) 一种语音增益控制方法及计算机存储介质
EP4189677B1 (en) Noise reduction using machine learning
Islam et al. Speech enhancement based on a modified spectral subtraction method
Petkov et al. Spectral dynamics recovery for enhanced speech intelligibility in noise
EP2660814B1 (en) Adaptive equalization system
WO2015084658A1 (en) Systems and methods for enhancing an audio signal
US20230186943A1 (en) Voice activity detection method and apparatus, and storage medium
US11922933B2 (en) Voice processing device and voice processing method
Bao et al. A novel speech enhancement method using power spectra smooth in wiener filtering
CN113593604A (zh) 检测音频质量方法、装置及存储介质
EP2816818A1 (en) Sound field spatial stabilizer with echo spectral coherence compensation
US11462231B1 (en) Spectral smoothing method for noise reduction
JP2007025296A (ja) 音声特徴量算出装置およびプログラム
EP2816817B1 (en) Sound field spatial stabilizer with spectral coherence compensation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140101

Termination date: 20191104