CN1122970C - 由时域频谱减法减少信号噪声的降噪处理器、方法和电话 - Google Patents
由时域频谱减法减少信号噪声的降噪处理器、方法和电话 Download PDFInfo
- Publication number
- CN1122970C CN1122970C CN00808495A CN00808495A CN1122970C CN 1122970 C CN1122970 C CN 1122970C CN 00808495 A CN00808495 A CN 00808495A CN 00808495 A CN00808495 A CN 00808495A CN 1122970 C CN1122970 C CN 1122970C
- Authority
- CN
- China
- Prior art keywords
- gain function
- processor
- subtraction gain
- spectral subtraction
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 96
- 230000009467 reduction Effects 0.000 title claims description 19
- 230000006870 function Effects 0.000 claims abstract description 192
- 238000001914 filtration Methods 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 26
- 230000008859 change Effects 0.000 claims abstract description 6
- 238000001228 spectrum Methods 0.000 claims description 57
- 238000004891 communication Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 7
- 238000012544 monitoring process Methods 0.000 claims description 3
- 230000009131 signaling function Effects 0.000 claims description 2
- 230000008929 regeneration Effects 0.000 claims 4
- 238000011069 regeneration method Methods 0.000 claims 4
- 230000001172 regenerating effect Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 16
- 230000001934 delay Effects 0.000 abstract 2
- 230000001629 suppression Effects 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 9
- 206010038743 Restlessness Diseases 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000012935 Averaging Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000001364 causal effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000001066 destructive effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 125000002015 acyclic group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000005654 stationary process Effects 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Noise Elimination (AREA)
- Complex Calculations (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
为了抑制噪声,利用在频域中以逐块方式计算的频谱减法增益函数的时域表达式、在时域中逐个样值地执行频谱减法滤波。通过逐个样值地连续进行时域滤波,所公开的方法和装置避免了与基于频域的频谱减法系统相联系的块处理延迟。因此,所公开的方法和装置特别适用于要求非常短的处理延迟的应用场合。在仅存在平稳低能量背景噪声的应用场合下,通过在初始化周期中产生多个单独的频谱减法增益函数来减小计算复杂性,每个增益函数适合于输入信号的几个预定类别其中之一(例如,几个预定信号能级范围其中之一),此后选定这几个增益函数直至输入信号特性改变。
Description
发明领域
本发明涉及通信系统,更具体地说,涉及用于减轻通信信号中破坏性背景噪声分量的影响的方法和装置。
发明背景
现在的通信是在各种各样的潜在破坏性的环境中进行的,因此往往配备现代通信解决方案以补偿这样的环境。例如,典型的有线电话或移动电话中的传声器往往不仅拾取近端电话用户的语音,而且拾取任何周围可能存在的近端背景噪声。在办公室和汽车免提解决方案的环境中尤为如此。由于这种背景噪声可能令远端用户讨厌、甚至难以忍受,所以许多现今的电话配备有降噪处理器,试图在容许讲话者的语音无失真地通过的同时抑制背景噪声。这种降噪处理器常常是基于众所周知的频谱减法技术,其中分析有噪声的语音信号的频谱内容,并且使那些具有低信噪比的频率分量衰减。例如,参阅S.F.Boll的《利用频谱减法抑制语音中的噪声)》,IEEE Trans.Acoust.Speech and Sig.Proc.,27:113-120,1979。
实现降噪处理器时,重要的是把可能引入的任何后生现象(artifact)或延迟减到最小,因为这种后生现象和延迟如背景噪声一样可能令远端用户讨厌。因此,上面结合的专利申请公开了一些与传统频谱减法技术相比、引入较小信号失真的频谱减法降噪系统。具体地说,未决的申请09/084,387公开了一种基于块的频谱减法降噪处理器,其中在频域中利用减小方差减小分辨率的增益函数滤波器实现对信号滤波。最好这样选择增益函数的阶、使得频域滤波相当于时域中的真非循环卷积,并且给增益函数加上相位、使得增益函数是因果函数。结果,所公开的降噪处理器与传统的频谱减法技术相比、引入较少的声音后生现象和较少的块间不连续性。另外,未决申请09/084,503公开了进一步减小滤波器增益函数的方差、从而进一步减小语音后生现象的引入的技术。具体地说,例如,根据有噪声的语音信号的频谱密度与噪声自身的频谱密度之间的测量差异,在块与块之间对滤波器增益函数进行平均。
尽管申请09/084,387和09/084,503的频域频谱减法滤波技术在基于块的系统的情况下(即比如众所周知的全球移动通信系统或GSM,其中根据定义、信号是逐个采样块处理的)很适用,但是与这些技术相关的块处理时间不适合于要求极短信号处理器延迟的应用场合。例如,在有线电话系统中,最大容许的信号延迟可能短到2毫秒(相当于标准8kHz电话抽样率下的16次抽样)。因此,需要改进的、通过频谱减法进行降噪的方法和装置。
在美国专利No.4,630,305中,描述了一种供噪声抑制系统使用的自动增益选择器,它通过频谱增益修改、对可在输入端上得到的有噪声的语音信号进行音质改善、从而在输出端上产生噪声抑制后的语音信号。信道增益控制器产生包括各个信道增益值的修改信号,以便加到信道增益修改器上。响应多信道噪声参数、如输入信号的总平均背景噪声电平,通过选择开关和噪声电平量化器从多个增益表其中之一自动选择具体的增益表设置。
发明概述
本发明通过提供以下的降噪技术来满足上述及其他要求,其中频谱减法滤波是利用在频域中以逐块方式计算的频谱减法增益函数的时域表达式、在时域中以逐个样本的方式进行的。通过按一个样本接一个样本的方式连续进行时域滤波,所公开的方法和装置可以避免与基于频域的频谱减法系统相联系的块处理延迟。结果,所公开的方法和装置特别适合于要求非常短的处理延迟的应用场合。此外,因为频谱减法增益函数是在频域中以逐块的方式(例如,利用以上结合的共同未决的申请09/084,387和09/084,503的技术)计算的,所以保留了在减少声音后生现象和降低信号失真方面的高品质性能。在仅仅存在平稳低能量背景噪声的应用场合下,通过在初始化周期中产生若干单独的频谱减法增益函数、每个增益函数适用于几种预定类型的输入信号中的一种(例如,几种预定信号能量范围中的一种)、然后在输入信号的特性改变之前一直选定这几个增益函数,就可以减小计算的复杂程度。
在一个示例性的实施例中,降噪处理器包括:配置成用时域频谱减法增益函数对有噪声的输入信号进行卷积运算、以便提供降噪后的输出信号的时域滤波器;配置成计算作为有噪声输入信号的函数的频域频谱减法增益函数的频谱减法增益函数处理器;以及配置成通过变换频域频谱减法增益函数来提供时域频谱减法增益函数的变换处理器,其中所述频谱减法增益函数处理器从若干个可用的频谱减法增益函数中选择频域频谱减法增益函数。例如,频谱减法增益函数处理器可以在初始化周期中产生可用的频谱减法增益函数,然后在初始化周期后选定可用的频谱减法增益函数。因此,在初始化之后,不必连续地重新计算瞬时频谱减法增益函数。
按照示例性实施例,可用的频谱减法增益函数中的每一个都对应于有噪声的输入信号的多个可能类别其中之一。例如,有噪声的输入信号可按其测量能级落在若干预定能级范围其中之一来分类。另外,可以在初始化周期之后定期地再生可用的频谱减法增益函数、或者当有噪声的输入信号的噪声分量的特征改变时再生。噪声分量的特征是否已改变可通过(例如,以伪随机间隔)测量噪声分量的频谱含量的估计值来确定。
根据本发明的第二方面,提供一种用于抑制通信信号的噪声分量的方法,其特征在于以下步骤:用时域频谱减法增益函数对所述通信信号进行卷积运算,从而提供噪声抑制后的输出信号;计算多个频域频谱减法增益函数;根据所述通信信号的值、从所述多个频谱减法增益函数中选择频域频谱减法增益函数;以及对所述选择的频域频谱减法增益函数进行变换,从而提供所述时域频谱减法增益函数。
根据本发明的第三方面,提供一种电话,它包括:接收近端声音并且提供相应的近端信号的传声器;以及配置成抑制所述近端信号的噪声分量的频谱减法处理器,所述频谱减法处理器包括:时域滤波器,配置成用时域频谱减法增益函数对所述近端信号进行卷积运算、从而提供降噪后的近端信号;频谱减法增益函数处理器,配置成根据所述近端信号的噪声分量的函数、从多个可用的频谱减法增益函数中选择频域频谱减法增益函数;以及变换处理器,配置成通过对所述频域频谱减法增益函数进行变换来提供所述时域频谱减法增益函数。
下面参照附图中所示的实例详细说明本发明的上述及其他特征和优点。本专业的技术人员会认识到,所描述的实施例是为举例说明和理解而提供的,在此可想到大量等效的实施例。
附图简介
图1是按照本发明的示例性降噪系统的框图。
图2是可用在图1的系统中的、示例性的频谱减法增益函数处理器的框图。
图3是按照本发明的另一种降噪系统的框图。
图4是可用于图3系统中的示例性的增益函数处理器的框图。
发明的详细描述
图1描述按照本发明的示例性的降噪系统100。如图所示,示例性的系统100包括延迟缓冲器110、帧缓冲器120、频域频谱减法增益函数处理器130、反快速傅里叶变换(IFFT)处理器140和时域频谱减法滤波器150。本专业的技术人员会认识到,在实践中、以下描述的图1的系统100的各个块的功能可采用任何已知的各种硬件配置、包括通用数字计算机、标准数字信号处理元件和一个或一个以上专用集成电路来实现。
在图1中,有噪声的语音信号x(n)耦合到延迟缓冲器110的输入端和帧缓冲器120的输入端。延迟缓冲器110的输出端耦合到时域频谱减法滤波器150的信号输入端,而帧缓冲器120的输出端耦合到频域增益函数处理器130的信号输入端。增益函数处理器130的输出端耦合到IFFT处理器140的输入端,而IFFT处理器140的输出端耦合到时域滤波器150的增益函数输入端。滤波器150提供噪声抑制后的语音信号y(n)。
在工作中,把有噪声的语音信号x(n)的连续样值(例如包括近端背景噪声的近端传声器信号)馈送到延迟缓冲器110和帧缓冲器120。帧缓冲器120收集输入的样值,并且把它们一帧一帧地送到增益函数处理器130(这里把一帧理解为整数L个连续信号样值的集合)。另外,延迟缓冲器110引入0至L个样值的可调延迟,并且把延迟后的样值一个一个地送到时域频谱减法滤波器150。频谱减法滤波器150用主要的时域频谱减法增益函数
(正如以下详细描述的、式中M是整数子帧长度而i是整数帧计数)连续地对延迟后的样值进行卷积运算,从而提供降噪后的语音信号y(n)。因此,正如本领域中众所周知的,可以认为M-样值时域增益函数
是时域滤波器150的冲激响应。
按照本发明,时域增益函数
是由增益函数处理器130和IFFT处理器140逐帧计算的。更具体地说,对于每一帧i,增益函数处理器130使用帧样值xL(i)来计算M个二进制数(M-bin)的频域频谱减法增益函数
(正如以下详细描述的),而IFFT处理器140把频域增益函数
变换成相应的时域增益函数
然后用后者来更新时域滤波器150的冲激响应[即用新算出的系数
代替以前存在的滤波器系数
但是,由于滤波器150连续地使用主要的增益函数对有噪声的语音样值进行操作,所以噪声抑制后的输出y(n)和有噪声的输入x(n)之间的信号延迟仅由延迟缓冲器110和滤波器150来决定,而不由帧缓冲器120、增益函数处理器130或IFFT处理器140来决定。
以上描述的图1的示例系统100的工作可以与在频域中进行滤波的频谱减法系统(诸如以上结合的专利申请09/084,387和09/084,503中所描述的那些系统)的工作对照。在这类系统中,有噪声的语音样值帧的频域表达式与频域增益函数相乘(对应于时域中的卷积),从而提供降噪后的输出信号的频域表达式,然后把后者反变换到时域。结果,有噪声的语音信号x(n)与降噪后的输出信号y(n)的对应样值之间的延迟大到一个帧周期(因为输入帧中的所有样值是一起处理的、以便提供相应的输出帧)加上总的帧处理时间(即把一帧有噪声的语音样值从时域变换到频域、然后计算频域增益函数、执行频域乘法以及把结果重新变换到时域所需的时间)。
图1的示例性系统最好允许信号延迟为得到针对特定应用的最佳结果而设置。例如,在信号延迟不太关键的应用场合中,可以设置延迟缓冲器110而引入一个帧周期的延迟,使得有噪声的语音信号x(n)的每一个样值利用根据该样值算出的增益函数来滤波。这样做使图1的系统100的工作相当于以上结合的申请09/084,387和09/084,503的工作,并且提供最优的音质。或者,在短信号延迟很关键的应用场合中,可以把延迟缓冲器110设置得引入小的延迟或没有延迟,以便使用根据此前的样值算出的增益函数对有噪声的语音信号的每一样值x(n)滤波。尽管音质可能略微变差,但是获得了极短的信号延迟。音质与信号延迟之间的权衡将是对每个特定应用的设计选择的问题。
为了确保由滤波器150完成的时域滤波相当于频域滤波,在构造频域频谱减法增益函数
时必须小心。在以上结合的申请09/084,387和09/084,503中详细描述了构造频域增益函数的适当方法(即为了实现图1的增益函数处理器130)。简言之,频谱减法是基于这样的假设:语音信号和背景噪声信号是随机的、不相关的,并且加在一起而形成有噪声的语音信号x(n)。换言之,如果s(n)、w(n)和x(n)是分别代表语音、噪声以及有噪声的语音的随机短时间平稳过程,则:
x(n)=s(n)+w(n)
并且
Rx(f)=Rs(f)+Rw(f)式中f∈[0,N-1]是对应于一个频率二进制数(frequency bin)的离散变量,而R(·)(f)表示随机过程的功率谱密度。
然后利用例如众所周知的Bartlett方法估计短时间的频谱密度如下: 式中xL,P(i)是第i个长度为L的具有p子帧的帧,每个子帧有M个数据样值。这种计算方法减小了所得频谱的方差和频率分辨率。实际上,在方差减小与分辨率之间的权衡是设计选择的问题,试验表明,M=64个频率二进制数的分辨率一般提供优质的结果。
为了简化符号,把
定义为幅度谱估计值。因而,在语音停顿期间可用下式来估计短时间的噪声幅度谱:
式中μ是指数平均时间常数。为了检测语音停顿,如本领域中众所周知的,可以采用话音激活检测器(VAD)。
然后由下式给出频域增益函数的表达式:
式中k控制减去的程度,而a控制是采用幅度谱还是功率谱作减数。因而,参数k和a的结合控制了噪声减少的量。
为了进一步减小增益函数的可变性,可以自适应地对原始的频域增益函数GM(f,i)求平均,从而产生平滑后的频域增益函数
GM(f,i)。例如,自适应可根据噪声频谱和有噪声的语音频谱之间的频谱差异做出。这样做往往随着输入信号变得更平稳而增大平均过程,因而为平稳噪声和低能量语音提供减小的增益函数可变性。
为了简化短延迟的因果滤波器,可以在算出的零相位增益函数GM(f,i)上加上最小相位,从而产生最终的频域增益函数
这可以例如利用Hilbert变换关系来实现。参见例如,A.V.Oppenheim和R.W.Schafer的离散时域信号处理(Discrete-time Signal Processing),Prentice-Hall,Inter.Ed.,1989。
在图2中描述了频域增益函数
的上述计算,其中示出的示例性的频域增益函数处理器200包括:话音激活检测器210、频谱估计处理器220、噪声平均处理器230、频域增益函数计算处理器240、频谱差异分析器250、自适应平均处理器260和相位处理器270。图2的示例性的增益函数处理器200例如可以用来实现图1的频域增益函数处理器130。本专业的技术人员会认识到,实际上可以用各种众所周知的硬件配置中的任何一种、包括通用数字计算机、标准数字信号处理元件和一个或多个专用集成电路来实现图2的系统的各个块的下述功能。
在图2中,把一帧有噪声的语音样值输入频谱估计处理器220,并且频谱估计处理器220的输出在话音激活检测器210的控制下可切换地耦合到噪声平均处理器230的输入端。频谱估计处理器220的输出端还像噪声平均处理器230的输出端一样,耦合到增益函数计算处理器240和频谱差异处理器250每一个的输入端。增益函数计算处理器240和频谱差异处理器250的输出端耦合到自适应平均处理器260的各输入端,而自适应平均处理器260的输出端耦合到相位处理器270的输入端。相位处理器270提供频域增益函数(例如,用作图1的IFFT处理器140的输入)。
在工作中,频谱估计处理器220产生第i帧有噪声语音信号x(n)的频谱密度的长度为M的估计值
Px,M(f,i)。另外,在语音停顿期间,话音激活检测器210使频谱估计处理器220的输出耦合到噪声平均处理器230,噪声平均处理器(例如,利用指数平均)对有噪声的语音频谱估计值求平均值。由于在语音停顿期间、频谱估计处理器220的输出是噪声本身的频谱密度的估计值,所以噪声平均处理器230提供背景噪声w(n)的频谱密度的平均估计值
Pw,M(f,i)。
然后增益函数计算处理器240同时使用有噪声语音的频谱估计值
Px,M(f,i)和平均后的噪声频谱估计值
Pw,M(f,i),结合上面定义的按照经验确定的参数a和k来计算原始频域增益函数GM(f,i)。此外,频谱差异处理器250确定频谱估计值
Px,M(f,i)和
Pw,M(f,i)之间的差异程度,该差异程度由自适应平均处理器260用来(例如,借助变量存储器、使用指数平均)对原始增益函数GM(f,i)取平均值,从而提供平均或平滑后的增益函数
GM(f,i)(参见上面结合的申请09/084,387和09/084,503,以便获得有关基于频谱差异的增益函数平均的实现和优点的其他详情)。此后,相位处理器270给平均后的增益函数
GM(f,i)强加某个最小相位,以便提供最终的频域增益函数
(再次参见上文结合的申请09/084,387和09/084,503,以便获得有关为增益函数强加相位的实现及优点的其他详情)。
一旦计算出最终的频域增益函数
就对其进行变换(例如,通过图1的IFFT处理器140),从而提供更新后的时域增益函数
(例如,供图1的滤波器150使用)。如上所述,通过用主要的时域增益函数
对有噪声的输入信号x(n)进行卷积运算,获得降噪后的输出信号y(n),如下:
经验分析表明,所观察到的滤波延迟一般在0至8个样值的范围内,这里把延迟定义为滤波器沿时间轴的质量中心(因为群时延测量无法用于宽带语音信号)。k=0.7、a=1、L=256和M=64的参数设置提供大约10dB的噪声抑制。
尽管上述技术在计算上并不复杂,但是在预期仅有能量相对较低的噪声的情况下,可以实现复杂程度的进一步降低。具体来讲,当平稳低能量噪声干扰语音信号时,经验研究表明,要得到好的语音质量,只需要少数的固定增益函数。换言之,可以根据主要信号类别的确定来动态地选择有限数目的增益函数其中之一,这每个增益函数都是专门为同等数目的预定信号类别(例如,根据与高能量元音、摩擦音、塞音等对应的信号能级)中的一个而定制的。因此,可以避免连续地重新计算滤波器增益函数。有利的是,本发明提供了用于建立或提取适当的几组固定的滤波器增益函数的方法和装置。
一般,用上述增益函数计算技术在处理器初始化周期中产生固定的滤波器增益函数。更具体地说,对于初始化周期中的每一帧,把有噪声的语音信号分类,并且训练或更新分配给该信号类别使用的增益函数(例如,用如上计算的增益函数进行指数平均)。在初始化周期结束时(例如,当小的迭代变化表明分配给每种类别的增益函数已达到适当稳定的状态时),冻结该增益函数并且此后选择性地用该函数来对有噪声的语音信号进行滤波。换言之,对于每个初始化后的帧,对有噪声的语音信号分类,并且用相应的固定的滤波器增益函数对其滤波。
有利的是,所述固定滤波器增益函数仅在信号特性改变时(即背景噪声改变时)才需要重新训练或再提取。可以在语音停顿期间、通过噪声的频谱形状的伪随机测试(例如,通过监测噪声的幅度谱估计值的变化)来检测这种噪声改变。或者,可以在当前选用的固定增益函数与动态计算的(例如用上述技术计算的)增益函数之间检测到太大差异时、通过重新开始平均来再提取固定滤波器。另外,可以通过以某个预定的或可变的速率(例如每秒这么多次)重新开始平均来再提取固定滤波器。
可以用多种方法来进行信号分类。例如,有噪声的语音信号可按其属于几个预定能级区间中的一个来分类。若是这样,则可以利用指数平均来计算有噪声的语音信号x(n)的能级e(n),如下:
然后,在初始化期间,可以在频域中把每个按类的增益函数GM(f,t,i)(t∈[0,T])平均如下:
GM(f,t,i)=
GM(f,t,i-1)·δt+GM(f,i)·(1-δt)式中δt是按类平均时间常数,而GM(f,i)是上面描述的原始频域增益函数。
初始化后,当检测到为之设计固定滤波器的信号类别时,选择该特定的固定滤波器
GM(f,t,i)。为使滤波延迟最小,如上所述,给该滤波器强加最小相位、从而提供最终的频域滤波器
把最终的频域滤波器
变换到时域,从而提供所需的时域滤波器
以上描述的固定滤波器技术可以例如、利用图3的示例性的降噪系统300来实现。如图所示,系统300包括图1的帧缓冲器120、IFFT处理器140和时域频谱减法滤波器150,还包括信号分类处理器305和可供选择的频谱减法增益函数处理器330。本专业的技术人员会认识到,实际上,图3的系统300的各块的下述功能可以利用各种已知硬件配置中的任何一种、包括通用数字计算机、标准数字信号处理元件和一个或几个专用集成电路来实现。
在图3中,把有噪声的语音信号x(n)接到帧缓冲器120、信号分类处理器305和时域滤波器150各自的输入端。帧缓冲器120和信号分类处理器305的输出端耦合到可供选择的增益函数处理器330的输入端,而增益函数处理器330的输出端耦合到IFFT处理器140的输入端。IFFT处理器140的输出端耦合到时域滤波器150的增益函数输入端,而时域滤波器150提供噪声抑制后的输出信号y(n)。
在高电平下,图3的系统300的工作与图1的系统100非常相似。具体地讲,时域滤波器150连续地处理有噪声语音信号的样值,同时帧缓冲器120收集有噪声语音样值,并且把它们一帧一帧地送到增益函数处理器330。增益函数处理器330以逐帧方式计算频域增益函数
而IFFT处理器140对频域增益函数进行变换,从而提供时域增益函数
后者用来更新时域滤波器150的抽头。而与图1的系统100不同之处在于,图3的系统300用信号分类处理器305来确定几个预定类别中哪个最佳描述了当前的有噪声语音样值(例如按照上述能级分类方案)。然后,信号分类处理器305把类别号(即t∈[0,T])提供给增益函数处理器330以用来如上所述(即通过在初始化周期中提取T个固定滤波器、然后根据信号分类处理器的输出从T个固定滤波器中选择适当的一个)、以逐帧方式计算频域增益函数
图4描述示例性的频域增益函数处理器400,该处理器可用来实现图3的增益函数处理器330。如图所示,该处理器包括图2的话音激活检测器210、频谱估计处理器220、噪声平均处理器230、增益函数计算处理器240和相位处理器270,以及多个滤波器提取器405和同等数目的滤波器平均处理器415。本专业的技术人员会认识到,图4的系统400的各块的下述功能在实践上可以利用各种已知硬件配置中的任何一种,包括通用数字计算机、标准数字信号处理元件和一个或多个专用集成电路来实现。
在图4中,把一帧有噪声的语音样值耦合到频谱估计处理器220的输入端,而频谱估计处理器220的输出端在话音激活检测器210的控制下可切换地耦合到噪声平均处理器230的输入端。频谱估计处理器220的输出端,如噪声平均处理器230的输出端一样,还耦合到增益函数计算处理器240的输入端。增益函数计算处理器240的输出端(例如,根据图3的信号分类处理器305的输出)可切换地耦合到几个滤波器提取器405其中之一,而每个滤波器提取器405的输出端耦合到几个平均处理器415中各自的输入端。相位处理器270的输入端选择性地(例如,还是根据图3的信号分类处理器305的输出)耦合到平均处理器415其中一个的输出端,而相位处理器270提供频域增益函数作为输出。
在工作中,话音激活检测器210、频谱估计处理器220、噪声平均处理器230和增益函数计算处理器240如以上就图2的系统200描述的那样工作。但是,在图4的系统400中,不采用随频谱而变的指数增益函数平均来对原始频域增益函数在各帧之间进行平滑。而是如上所述,在初始化期间,用瞬时频域增益函数GM(f,i)来更新按类增益函数405中所选择的一个(例如,由信号分类处理器305提供的信号类别号t所指出的)。
具体地说,与所选择的滤波器405相联系的平均处理器415用以前存在的被选滤波器增益函数
GM(f,t,i-1)对瞬时频域增益函数GM(f,t,i)进行指数平均,以便提供更新后的被选滤波器增益函数
GM(f,t,i)。这样,在初始化周期结束时,处理器400具有提取出的T个固定滤波器增益函数
GM(f,t,i),并且冻结进一步的更新,除非背景噪声的特征改变。在初始化之后,只要根据信号分类处理器305所提供的信号类号选择适当的固定滤波器增益函数
GM(f,t,i)。
在初始化期间及其后,正如上面就图2所描述的,相位处理器270加一个最小相位,以便提供最终的频域增益函数
然后,(例如通过图3的IFFT处理器140)对最终的频域增益函数
进行变换,从而提供更新后的时域增益函数
(例如供图3的滤波器150使用)。如前所述,通过用主要的时域增益函数
对有噪声的语音信号x(n)进行卷积运算,获得降噪后的输出信号y(n),而输入和输出之间的信号延迟小(一般约8个样值)。
一般说来,本发明提供了用于通过频谱减法执行短延迟噪声抑制的方法和装置。在示例性实施例中,使用在频域中以逐帧方式计算的频谱减法增益函数的时域表达式、在时域中以逐个样值的方式进行信号滤波。在变换到时域之前、给频域增益函数强加最小相位,使得相应的时域增益函数是因果函数,并且引入最小的滤波延迟。得到的是良好音质的噪声抑制,而一般信噪比(SNR)改善约为10dB,并且引入的延迟一般约为8个样值。这样的延迟完全在有线电话系统中允许延迟的范围以内。在低能量的长时间的平稳噪声环境下,通过提取和利用一组固定的滤波器,可以减小计算的复杂性。在这种情况下,信噪比的改善一般约为6-10dB,并且音质良好,而引入的延迟还是8个样值左右。
本专业的技术人员会认识到,本发明不限于这里为了举例说明已描述的特定示例性的实施例,还可以设想出许多供选择的实施例。例如,尽管本发明是在免提电话应用的环境下描述的,但是本专业的技术人员会认识到,本发明的论述同样适用于需要抑制特定信号分量的任何信号处理应用场合。因此,本发明的范围由所附权利要求书来定义,而不是由以上描述限定,并且本发明意在包含符合各项权利要求的意义的所有等效物。
Claims (30)
1.一种降噪处理器,包括:
频谱减法增益函数处理器,它接收有噪声的输入信号,并且计算作为所述有噪声的输入信号的函数的频域频谱减法增益函数;以及
变换处理器,它接收频域频谱减法增益函数,并且通过对所述频域频谱减法增益函数进行变换来提供所述时域频谱减法增益函数,和
时域滤波器,它接收有噪声的输入信号和时域频谱减法增益函数,并且用时域频谱减法增益函数对有噪声的输入信号进行卷积运算、从而提供降噪后的输出信号;
其中所述频谱减法增益函数处理器从多个可用的频谱减法增益函数中选择所述频域频谱减法增益函数。
2.按照权利要求1的降噪处理器,其特征在于:所述频谱减法增益函数处理器在初始化周期中产生所述可用的频谱减法增益函数。
3.按照权利要求2的降噪处理器,其特征在于:所述频谱减法增益函数处理器在所述初始化周期之后选定所述可用的频谱减法增益函数。
4.按照权利要求1的降噪处理器,其特征在于:所述可用的频谱减法增益函数中的每一个均对应于所述有噪声的输入信号的多个可能分类中的一种。
5.按照权利要求4的降噪处理器,其特征在于:所述有噪声的输入信号是按照该有噪声的输入信号的测量能级来分类的。
6.按照权利要求5的降噪处理器,其特征在于:所述有噪声的输入信号被归类为具有落在多个预定能级范围中的一个范围之内的测量能级。
7.按照权利要求3的降噪处理器,其特征在于:在所述初始化周期之后、定期再生所述可用的频谱减法增益函数。
8.按照权利要求3的降噪处理器,其特征在于:所述可用的频谱减法增益函数在所述有噪声的输入信号的噪声分量的特征改变时被再生。
9.按照权利要求8的降噪处理器,其特征在于:通过测量所述噪声分量的频谱含量的估计值来做出关于所述噪声分量的所述特征是否已改变的判定。
10.按照权利要求9的降噪处理器,其特征在于:所述噪声分量的所述频谱含量是以伪随机间隔来测试的。
11.一种用于抑制通信信号的噪声分量的方法,其特征在于以下步骤:
用时域频谱减法增益函数对所述通信信号进行卷积运算(150),从而提供噪声抑制后的输出信号;
计算多个频域频谱减法增益函数;
根据所述通信信号的值、从所述多个频谱减法增益函数中选择(130)频域频谱减法增益函数;以及
对所述选择的频域频谱减法增益函数进行变换(140),从而提供所述时域频谱减法增益函数。
12.按照权利要求11的方法,其特征在于还包括在初始化周期中产生所述可用的频谱减法增益函数的步骤。
13.按照权利要求12的方法,其特征在于还包括在所述初始化周期之后选定所述可用的频谱减法增益函数的步骤。
14.按照权利要求11的方法,其特征在于还包括对所述有噪声的输入信号分类的步骤,其中所述可用的频谱减法增益函数中的每一个对应于所述有噪声的输入信号的多个可能分类其中之一。
15.按照权利要求14的方法,其特征在于:所述有噪声的输入信号是按照该有噪声的输入信号的测量能级来分类的。
16.按照权利要求15的方法,其特征在于:所述有噪声的输入信号被分类成具有属于多个预定能级范围其中之一的测量能级。
17.按照权利要求13的方法,其特征在于还包括在所述初始化周期之后定期再生所述可用的频谱减法增益函数的步骤。
18.按照权利要求13的方法,其特征在于还包括在所述有噪声的输入信号的噪声分量的特征改变时再生所述可用的频谱减法增益函数的步骤。
19.按照权利要求18的方法,其特征在于:通过监测所述噪声分量的频谱含量的估计值来做出对于所述噪声分量的所述特征是否已改变的判定。
20.按照权利要求19的方法,其特征在于:所述噪声分量的频谱含量是以伪随机的间隔来测试的。
21.一种电话,它包括:
接收近端声音并且提供相应的近端信号的传声器;以及
配置成抑制所述近端信号的噪声分量的频谱减法处理器,所述频谱减法处理器包括:
时域滤波器(150),配置成用时域频谱减法增益函数对所述近端信号进行卷积运算、从而提供降噪后的近端信号;
频谱减法增益函数处理器(130),配置成根据所述近端信号的噪声分量的函数、从多个可用的频谱减法增益函数中选择频域频谱减法增益函数;以及
变换处理器(140),配置成通过对所述频域频谱减法增益函数进行变换来提供所述时域频谱减法增益函数。
22.按照权利要求21的电话,其特征在于:所述频谱减法增益函数处理器在初始化周期中产生所述可用的频谱减法增益函数。
23.按照权利要求22的电话,其特征在于:所述频谱减法增益函数处理器在所述初始化周期之后选定所述可用的频谱减法增益函数。
24.按照权利要求21的电话,其特征在于:所述可用的频谱减法增益函数中的每一个对应于所述近端信号的多个可能分类中的一类。
25.按照权利要求24的电话,其特征在于:所述近端信号是按照该近端信号的测量能级来分类的。
26.按照权利要求25的电话,其特征在于:所述近端信号被分类成具有属于多个预定能级范围其中之一的测量能级。
27.按照权利要求23的电话,其特征在于:在所述初始化周期之后、定期再生所述可用的频谱减法增益函数。
28.按照权利要求23的电话,其特征在于:在所述近端信号的所述噪声分量的特征改变时、再生所述可用的频谱减法增益函数。
29.按照权利要求28的电话,其特征在于:通过监测所述噪声分量的频谱含量的估计值来做出关于所述噪声分量的所述特征是否改变的判定。
30.按照权利要求29的电话,其特征在于:所述噪声分量的所述频谱含量是以伪随机间隔来测试的。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/289,554 | 1999-04-12 | ||
US09/289,554 US6487257B1 (en) | 1999-04-12 | 1999-04-12 | Signal noise reduction by time-domain spectral subtraction using fixed filters |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1354873A CN1354873A (zh) | 2002-06-19 |
CN1122970C true CN1122970C (zh) | 2003-10-01 |
Family
ID=23112033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN00808495A Expired - Fee Related CN1122970C (zh) | 1999-04-12 | 2000-04-03 | 由时域频谱减法减少信号噪声的降噪处理器、方法和电话 |
Country Status (7)
Country | Link |
---|---|
US (1) | US6487257B1 (zh) |
JP (1) | JP2002541753A (zh) |
CN (1) | CN1122970C (zh) |
AU (1) | AU4115000A (zh) |
DE (1) | DE10084453T1 (zh) |
MY (1) | MY123480A (zh) |
WO (1) | WO2000062280A1 (zh) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6760435B1 (en) * | 2000-02-08 | 2004-07-06 | Lucent Technologies Inc. | Method and apparatus for network speech enhancement |
US7480595B2 (en) * | 2003-08-11 | 2009-01-20 | Japan Science And Technology Agency | System estimation method and program, recording medium, and system estimation device |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
US8204252B1 (en) | 2006-10-10 | 2012-06-19 | Audience, Inc. | System and method for providing close microphone adaptive array processing |
US9185487B2 (en) | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US8744844B2 (en) | 2007-07-06 | 2014-06-03 | Audience, Inc. | System and method for adaptive intelligent noise suppression |
US8194880B2 (en) | 2006-01-30 | 2012-06-05 | Audience, Inc. | System and method for utilizing omni-directional microphones for speech enhancement |
US8204253B1 (en) | 2008-06-30 | 2012-06-19 | Audience, Inc. | Self calibration of audio device |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US8849231B1 (en) | 2007-08-08 | 2014-09-30 | Audience, Inc. | System and method for adaptive power control |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
US8934641B2 (en) | 2006-05-25 | 2015-01-13 | Audience, Inc. | Systems and methods for reconstructing decomposed audio signals |
US8259926B1 (en) | 2007-02-23 | 2012-09-04 | Audience, Inc. | System and method for 2-channel and 3-channel acoustic echo cancellation |
US8189766B1 (en) | 2007-07-26 | 2012-05-29 | Audience, Inc. | System and method for blind subband acoustic echo cancellation postfiltering |
US8180064B1 (en) | 2007-12-21 | 2012-05-15 | Audience, Inc. | System and method for providing voice equalization |
US8143620B1 (en) | 2007-12-21 | 2012-03-27 | Audience, Inc. | System and method for adaptive classification of audio sources |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8355511B2 (en) | 2008-03-18 | 2013-01-15 | Audience, Inc. | System and method for envelope-based acoustic echo cancellation |
US8521530B1 (en) | 2008-06-30 | 2013-08-27 | Audience, Inc. | System and method for enhancing a monaural audio signal |
US8774423B1 (en) | 2008-06-30 | 2014-07-08 | Audience, Inc. | System and method for controlling adaptivity of signal modification using a phantom coefficient |
CN101320566B (zh) * | 2008-06-30 | 2010-10-20 | 中国人民解放军第四军医大学 | 基于多带谱减法的非空气传导语音增强方法 |
JP5245714B2 (ja) * | 2008-10-24 | 2013-07-24 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
JP5648052B2 (ja) * | 2009-07-07 | 2015-01-07 | コーニンクレッカ フィリップス エヌ ヴェ | 呼吸信号のノイズ低減 |
US9008329B1 (en) | 2010-01-26 | 2015-04-14 | Audience, Inc. | Noise reduction using multi-feature cluster tracker |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
BR112015019176B1 (pt) | 2013-04-05 | 2021-02-09 | Dolby Laboratories Licensing Corporation | método e aparelho de expansão de um sinal de áudio, método e aparelho de compressão de um sinal de áudio, e mídia legível por computador |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
DE112015003945T5 (de) | 2014-08-28 | 2017-05-11 | Knowles Electronics, Llc | Mehrquellen-Rauschunterdrückung |
US10063969B2 (en) * | 2015-04-06 | 2018-08-28 | Aftermaster, Inc. | Microchip for audio enhancement processing |
CN106297813A (zh) | 2015-05-28 | 2017-01-04 | 杜比实验室特许公司 | 分离的音频分析和处理 |
US11373667B2 (en) * | 2017-04-19 | 2022-06-28 | Synaptics Incorporated | Real-time single-channel speech enhancement in noisy and time-varying environments |
US10880427B2 (en) | 2018-05-09 | 2020-12-29 | Nureva, Inc. | Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters |
JP7258228B2 (ja) * | 2019-08-27 | 2023-04-14 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 適応的平滑化を使用したダイアローグの拡張 |
US12062369B2 (en) * | 2020-09-25 | 2024-08-13 | Intel Corporation | Real-time dynamic noise reduction using convolutional networks |
CN112671358A (zh) * | 2020-11-27 | 2021-04-16 | 天津城建大学 | 一种综合信号发生处理系统设计方法 |
CN113204876B (zh) * | 2021-04-30 | 2023-01-20 | 广东电网有限责任公司电力科学研究院 | Pd控制器的噪声增益计算方法、装置、设备及介质 |
US20230412727A1 (en) * | 2022-06-20 | 2023-12-21 | Motorola Mobility Llc | Adjusting Transmit Audio at Near-end Device Based on Background Noise at Far-end Device |
CN115116232B (zh) * | 2022-08-29 | 2022-12-09 | 深圳市微纳感知计算技术有限公司 | 汽车鸣笛的声纹比较方法、装置、设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4630305A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4853903A (en) | 1988-10-19 | 1989-08-01 | Mobil Oil Corporation | Method and apparatus for removing sinusoidal noise from seismic data |
FR2726392B1 (fr) * | 1994-10-28 | 1997-01-10 | Alcatel Mobile Comm France | Procede et dispositif de suppression de bruit dans un signal de parole, et systeme avec annulation d'echo correspondant |
US5687243A (en) | 1995-09-29 | 1997-11-11 | Motorola, Inc. | Noise suppression apparatus and method |
-
1999
- 1999-04-12 US US09/289,554 patent/US6487257B1/en not_active Expired - Lifetime
-
2000
- 2000-04-03 AU AU41150/00A patent/AU4115000A/en not_active Abandoned
- 2000-04-03 CN CN00808495A patent/CN1122970C/zh not_active Expired - Fee Related
- 2000-04-03 WO PCT/EP2000/002946 patent/WO2000062280A1/en active Application Filing
- 2000-04-03 DE DE10084453T patent/DE10084453T1/de not_active Withdrawn
- 2000-04-03 JP JP2000611268A patent/JP2002541753A/ja not_active Withdrawn
- 2000-04-04 MY MYPI20001396A patent/MY123480A/en unknown
Also Published As
Publication number | Publication date |
---|---|
DE10084453T1 (de) | 2002-03-21 |
AU4115000A (en) | 2000-11-14 |
US6487257B1 (en) | 2002-11-26 |
WO2000062280A1 (en) | 2000-10-19 |
CN1354873A (zh) | 2002-06-19 |
MY123480A (en) | 2006-05-31 |
JP2002541753A (ja) | 2002-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1122970C (zh) | 由时域频谱减法减少信号噪声的降噪处理器、方法和电话 | |
CN101719969B (zh) | 判断双端对话的方法、系统以及消除回声的方法和系统 | |
US8571231B2 (en) | Suppressing noise in an audio signal | |
CN111554315B (zh) | 单通道语音增强方法及装置、存储介质、终端 | |
KR100594563B1 (ko) | 선형 컨벌루션 및 인과 필터링을 사용하는 스펙트럼 감산에 의한 신호 잡음 감소 | |
JP4210521B2 (ja) | 雑音低減法および装置 | |
US7873114B2 (en) | Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate | |
US6591234B1 (en) | Method and apparatus for adaptively suppressing noise | |
CN1727860B (zh) | 语音噪音抑制方法和语音噪音抑制器 | |
CN101027719B (zh) | 噪声抑制装置 | |
EP1080463B1 (en) | Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging | |
CN101080766A (zh) | 使用bark频带weiner滤波器和线性衰减的噪声降低和舒适噪声增益控制 | |
CN1356014A (zh) | 利用频谱减除的双拾音器信号降噪系统和方法 | |
JP2003534570A (ja) | 適応ビームフォーマーにおいてノイズを抑制する方法 | |
CN101976566A (zh) | 语音增强方法及应用该方法的装置 | |
JP2012522255A (ja) | オーディオ信号分類の方法および装置 | |
CN103905656B (zh) | 残留回声的检测方法及装置 | |
CN109920444B (zh) | 回声时延的检测方法、装置以及计算机可读存储介质 | |
CN113593599A (zh) | 一种去除语音信号中噪声信号的方法 | |
CN104981870A (zh) | 声音增强装置 | |
CN1134768C (zh) | 由时域频谱相减进行信号噪声减小的电话机、处理器及方法 | |
CN112165558B (zh) | 一种双讲状态检测方法、装置、存储介质及终端设备 | |
EP2230664B1 (en) | Method and apparatus for attenuating noise in an input signal | |
US20060184361A1 (en) | Method and apparatus for reducing an interference noise signal fraction in a microphone signal | |
CN1330790A (zh) | 移动通信系统中的噪声抑制 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |