CN100397781C

CN100397781C - 声音增强系统

Info

Publication number: CN100397781C
Application number: CNB018170285A
Authority: CN
Inventors: Z·利希特
Original assignee: Clear Audio Ltd
Current assignee: Clear Audio Ltd
Priority date: 2000-08-14
Filing date: 2001-08-14
Publication date: 2008-06-25
Anticipated expiration: 2021-08-14
Also published as: EP1526639A3; EP1312162B1; EP1312162A1; KR100860805B1; EP1526639A2; US20040057586A1; DE60108401T2; KR20030040399A; IL154397A0; JP2004507141A; CN1620751A; DE60108401D1; AU2001282454A1; WO2002015395A1; ATE287141T1

Abstract

一种处理声频信号的方法，其目的是克服与声频信号无关的背景噪声的影响。此方法包括将声频信号频率分量中声频信号的度量与背景噪声频率分量中噪声的度量相比较，根据比较确定增益因数并利用所确定的增益因数放大至少一部分声频信号，包括至少一个不包含于声频信号频率分量中的频率段。

Description

声音增强系统

相关申请案

本专利申请要求2000年8月14日申报的美国第60/224,513号和2000年10月2日申报的第60/236,721号临时申请的优先权，基于美国专利法(35USC)第一一九条第五项的规定，其所公开的内容以引用的方式并入本文。此外，本专利申请为2000年7月27日申报的PCT(专利合作条约)申请案PCT/US00/20395的部份接续申请案(CIP)，其所公开的内容以引用的方式并入本文。

技术领域

本发明关于声音增强系统。

背景技术

电话机通常用于嘈杂环境中，在此环境中背景噪声会干扰对通过电话机接收的声音信号的理解。

戈德堡(Goldberg)的第4,829,565号美国专利，其所公开的内容将以引用的方式并入本文，其描述了一种具有自动音量控制系统的电话，系统根据背景噪声调整用户所听到的远程信号的音量。但是，此系统会导致音量太频繁的变化，以及不精确的变化，这将使人的耳朵感到不舒服。

米勒(Miller)等人的第5,615,270号美国专利，其所公开的内容将以引用的方式并入本文，其描述了一种用于车辆的噪声补偿系统。系统基于从车中感应的信号中过滤出所期望的音乐信号的过程产生的噪声信号来确定所需的放大率。

艾伦(Allen)等人的第5,524,148号和第5,526,419号美国专利，其所公开的内容将以引用的方式并入本文，其描述了噪声补偿系统，其放大提供给电话机的远端信号，增益因数根据背景噪声等级和远端信号的平均语音功率而确定。在一实施例中，计算远端信号所有频带的背景噪声等级和平均语音功率并且将相同的增益因数应用于远端信号的所有频带。归因于所使用的确定增益因数的方法，增益因数不会足够或可能过度。

在艾伦(Allen)的专利的另一实施例中，远端信号被分成多个频率分量并且利用相应的增益因数分别放大每个频率分量。根据相应频率分量中的背景噪声和平均语音功率或总的平均语音功率确定每个频率分量的增益因数。在此实施例中，由于对信号不同频率分量的不同的独立的放大，导致发声信号失真。此外，将执行许多不必要的振幅调整，这导致所消耗操作功率的浪费，尤其对于电池供电系统来说。

1999年1月14日出版的PCT第99/01863号世界专利，其所公开的内容将以引用的方式并入本文，其描述了一种用于吵杂环境的语音增强系统。第99/01863号世界专利公开的系统能比较语音和背景噪声的频谱分析，以确定是否有一个或多个语音的频率被背景噪声掩蔽。如果发生这样的掩蔽，则改变一个或多个语音线频谱对(LSPs)，以基于此LSP(线频谱对)消除对语音的掩蔽。LSP(线频谱对)的改变包括移动其频率，增加其带宽或增加其振幅。LSPs(线频谱对)的移位将干扰语音信号。

拉斯穆森(Rasmusson)的第5,636,272号美国专利，其所公开的内容将以引用的方式并入本文，其描述了一种使语音变得更无形的系统，系统使用一种非背景噪声函数的矫正法。

发明内容

本发明的一些实施例的一个方面涉及一种噪声补偿系统，其用于调整所需声频信号，以便克服背景噪声的影响。系统基于对信号频率分量中声频和噪声信号的分析来确定是否放大和/或声频信号的增益因数。但是，所确定的增益因数将应用于整个声频信号或包括多个频率分量的一部分声频信号。基于频率分量的增益因数的确定提供了对所需增益因数的更精确的确定，同时对整个声频信号应用增益因数防止了将失真引入信号。

在本发明的一些实施例中，增益因数的确定包括在一个或多个频率分量中将声频信号的功率与噪声信号的功率相比较，并根据比较确定增益因数。在本发明的一些实施例中，声频和噪声信号被分成多个频率分量，其大体上可选择性的覆盖信号的整个语音频谱，并且在大体上所有的频率分量中执行比较过程。作为选择或补充，可以不在所有的频率分量中执行比较过程，例如仅在包括声音信号共振峰(即，频谱中的包络波峰)的频率分量中执行。在本发明的一些实施例中，不在所有的包括声音信号共振峰的频率分量中执行比较过程。在本发明的一个具体实施例中，在声音信号中找寻满足预定数量的不同共振峰，例如三个共振峰。在包括所找寻共振峰的频率分量中执行比较过程。

在本发明的一些实施例中，基于涉及比较过程的频率分量中的信号噪声比(SNR)来选择增益因数。视情况而定，增益因数可应用于整个声频信号。或者，增益因数大体上应用于声频信号的所有频谱，已知声频信号包括语音信号。在本发明的一些实施例中，在根据增益因数放大信号后，压缩信号以避免失真，防止放大信号超出其所允许的动态范围。

本发明的一些实施例的一个方面涉及一种噪声补偿系统，其放大声音信号的一个或多个第一频率分量，响应对声音信号需要放大其一个或多个第二频率分量的确定，这不同于第一频率分量。系统将声音信号分成多个频率分量并且至少一个频率分量确定了频率分量的振幅是否足够。如果确定第一频率分量的振幅不足够，则至少调整一个第二频率分量的振幅。在本发明的一些实施例中，根据确定，可能按照相同的调整因数调整大部分或所有频率分量的振幅。

本发明的一些实施例的一个方面涉及一种噪声补偿系统，其用于调整所需声频信号，以便克服背景噪声的影响。声频信号被分成多个频率分量并且根据噪声依赖增益因数和非噪声依赖增益因数增强每个频率分量。将噪声依赖增益因数和非噪声依赖增益因数共同应用于由相同划分产生的频率分量中，提供了两种增益因数的优点，而并不需要双倍的成本和划分信号所需的延迟。在本发明的一些实施例中，至少一部分非噪声依赖增益因数包含也独立于信号的增益因数，如预定的固定增益因数。在本发明的一些实施例中，大体上所有频率分量的噪声依赖增益因数都相同。

在本发明的一些实施例中，通过一个单一的放大单元将噪声依赖增益因数和非噪声依赖增益因数应用于声频信号。或者，使用多个放大单元，其将相应的增益因数部分应用于声频信号。视情况而定，一个第一放大单元仅应用非噪声依赖增益因数，而一个第二放大单元应用噪声依赖和非噪声依赖增益因数。作为选择或补充，第一放大单元仅提供非信号依赖增益因数，并且第二放大单元仅提供信号依赖增益因数。

应注意在此使用的术语“增益因数”也包括“衰减因数”，即增益因数小于1。

本发明的一些实施例的一个方面涉及一种噪声补偿系统，其用于调整所需声频信号，以便克服背景噪声的影响。噪声补偿系统基于背景噪声计算校正的声频信号。系统的输出等于原始声频信号和补偿信号的加权和。通过发出加权和而不仅是补偿信号，提供了介于原始信号(具有原始信号的优点)和增强信号(具有增强信号的优点)之间的折中。

在本发明的一些实施例中，加权和给予原始声频信号和补偿信号预定的权。视情况而定，可将偶数权给予原始声频信号和补偿信号。作为选择或补充，可根据应用于校正声频信号的增益因数的范围和/或背景噪声的程度来调整加权和的权。

本发明的一些实施例的一个方面涉及一种识别声频信号的共振峰的方法。方法包括确定声频信号多个频率分量的功率值，低通过滤频率分量的功率值，以便计算每个频率分量的功率与其相邻(在频率上)频率分量的平均值，并找寻所过滤功率值的峰值功率。

视情况而定，可使用多个滤波器产生频率分量。或者，使用一个傅里叶(Fourier)变换产生多个频率分量。在本发明的一些实施例中，多个频率分量包含10-24个频率分量，可视情况包含12-15个。或者，多个频率分量的数量包含所使用FFT(快速傅里叶变换)的FFT接收器的数量。本发明的一个具体实施例中，通过执行一个FFT(快速傅里叶变换)计算多个频率分量的值并将多个相邻接收器的值组成一个单一频率分量值。

本发明的一些实施例的一个方面涉及一种噪声补偿系统，其用于双向通信送受话机，如电话，在确定近端的用户没有说话的基础上，执行接收自远端的噪声补偿。因此，减少了噪声补偿系统的功率消耗。通常，当近端用户说话而远端用户沉默时，近端用户不在收听接收自远端的信号或噪声补偿无效。

本发明的一些实施例的一个方面涉及一种确定增益因数的方法，其用于增强所需声频信号，以便克服背景噪声的影响。方法包括在不同的时间周期确定至少两个声频信号的振幅极限值。将极限值平均并与噪声指数相比较。视情况而定，可根据比较确定增益因数。在本发明的一些实施例中，从背景噪声信号中计算噪声指数的方法与计算声频信号极限值平均数的方法相似。

在本发明的一些实施例中，极限值平均包括几何或算术平均值的计算。作为选择或补充，可以使用任何其他平均法。

视情况而定，极限值可包括各个周期中的最大值。作为选择或补充，一个或多个极限值可包括衰减最大值。也就是说，储存一个最大值并且所储存的值根据预定的函数随着时间衰减。将衰减最大值与新值比较，如果新值大于当前的衰减最大值，则新值将取代衰减最大值。作为选择或补充，极限值包括声频信号加权形式的最大值，其中越新近的值的加权数越高。

本发明的一些实施例的一个方面涉及一种执行回波消除的方法。方法包括找寻产生回波的信号与经受回波消除的信号之间的关系，并仅消除产生回波的信号的单一复制。此方法相对于所属技术领域中熟知的方法而言十分简单，尽管其性能较低。由于声学条件，当回波为直接回波时，此方法尤其有利。

因此，根据本发明的一个实施例，其提供了一种处理声频信号的方法，以克服与声频信号无关的背景噪声的影响，方法包括将声频信号频率分量中声频信号的度量与背景噪声频率分量中噪声的度量相比较，根据比较确定增益因数并利用所确定的增益因数放大至少一部分声频信号，包括至少一个不包含于声频信号频率分量中的频率段。

视情况而定，声频信号的度量可包含许多的声频信号。视情况而定，背景噪声频率分量中噪声的度量可包含许多噪声的掩蔽形式。放大至少一部分信号可能包括放大进行比较的声频信号的频率分量部分。

视情况而定，放大至少一部分信号可包括按确定的增益因数放大整个声频信号。在本发明的一些实施例中，增益因数的确定包括确定可以使声频信号的频率分量的频带中的信号噪声比超过阈值的增益因数。

视情况而定，当信号和/或噪声度量随时间变化时，可对阈值进行动态调整。或者，阈值为一个预定值。视情况而定，比较声频信号频率分量中声频信号的度量包括在含有声频信号共振峰的频率分量中的比较过程。视情况而定，在含有声频信号共振峰的频率分量中的比较过程包括，在多个声频信号频率分量中具有最小信号噪声比(SNR)的频带的频率分量中的比较过程。

视情况而定，方法可包括将声频信号分成多个频率分量并选择部分频率分量。选择部分频率分量可能包括选择含有声频信号共振峰的频率分量。视情况而定，选择含有声频信号共振峰的频率分量可包括选择预定数量的含有共振峰的频率分量。

视情况而定，方法可包括从所选频率分量中选择声频信号的频率分量。放大至少一部分声频信号可能包括利用由多个增益因数(包括根据比较确定的增益因数)合成的增益因数进行的放大。视情况而定，方法可包括在有背景噪声的情况下发出放大信号。

声频信号的频率分量和噪声的频率分量可能跨越大体上相同的频带。视情况而定，声频信号的频率分量可包括一个频率带。

根据本发明的一个实施例，其还提供了一种处理声频信号的方法，以克服与声频信号无关的背景噪声的影响，方法包括将声频信号分成多个频率分量，通过相应的频率分量的非噪声依赖增益因数来增强每个频率分量，并通过相应的频率分量的噪声依赖增益因数来倍增每个频率分量。

方法可能包括将多个频率分量重新合成为增强的声频信号。

视情况而定，将声频信号分成多个频率分量可包括将其分成10-24个频率分量或超过100个频率分量。视情况而定，将声频信号分成多个频率分量可包括将其分成大体上不重叠的多个频率分量。通过相应的非噪声依赖增益因数来增强每个频率分量可能包括通过预定的非信号依赖增益因数增强频率分量。

通过相应的噪声依赖增益因数来倍增每个频率分量可能包括利用相同的噪声依赖增益因数倍增大体上所有的频率分量。可能由一个单一功能元件执行增强与倍增。视情况而定，可由独立的功能元件执行增强与倍增。

视情况而定，如果声频信号包含有声语音，则非噪声依赖增益因数可包括有声语音增强因数。将声频信号分成多个频率分量可能包括对声频信号运用傅里叶(Fourier)变换。作为选择或补充，将声频信号分成多个频率分量包括使声频信号通过一个带通滤波器阵列。

根据本发明的一个实施例，其还提供了一种处理声频信号的方法，以克服与声频信号无关的背景噪声的影响，方法包括接收声频信号，根据背景噪声的度量增强声频信号，并提供一个输出，其等于增强声频信号和接收声频信号的加权和。

视情况而定，增强声频信号可包括利用相应的增益因数倍增多个声频信号的频率分量。视情况而定，提供加权和可包括提供利用动态调整的加权数产生的加权和。视情况而定，可根据声频信号增强的程度确定动态调整的加权数。在本发明的一些实施例中，增强声频信号包括计算多个不同的增益因数并利用多个增益因数倍增声频信号，并且其中根据一个增益因数确定动态调整的加权数。

视情况而定，至少不同增益因数中的一个可包括历史依赖增益因数。视情况而定，提供加权和可包括提供利用预定加权数产生的加权和。视情况而定，提供加权和可包括在确定与所提供加权和有关的听众正在说话的基础上提供以所接收声频信号为主的加权和。视情况而定，提供加权和可包括在确定声频信号不包含语音信号的基础上提供以所接收声频信号为主的加权和。

根据本发明的一个实施例，其还提供了一种噪声补偿系统，系统包括适合于接收声频信号的输入接口，适合于发出增强声频信号的扬声器，适合于收集背景噪声的话筒，背景噪声会干扰听众对增强信号的收听，以及适合于将声频信号频率分量中声频信号的度量与相同频率分量中背景噪声的度量相比较的控制器，根据比较确定增益因数并利用所确定的增益因数放大至少一部分声频信号，包括至少一个不在频率分量中的频率段，以便提供增强的声频信号。

视情况而定，扬声器和话筒可为电话手机的一部分。系统可选择性的包括一个回波消除器，其至少从背景噪声中消除一个增强声频信号的回波。视情况而定，回波消除器仅从背景噪声中消除增强声频信号的单一回波。

因此，根据本发明的一个实施例，其提供了一种确定增益因数的方法，用于增强声频信号，以克服与声频信号无关的背景噪声的影响，方法包括在声频信号的度量中确定多个极限值，计算极限值的平均值，将平均值与噪声度量相比较，并根据比较确定增强声频信号的增益因数。

视情况而定，确定多个极限值可包括在声频信号的不同时间段中确定极限值。视情况而定，确定多个极限值可包括在声频信号的具有不同长度的时间段中确定极限值。视情况而定，确定多个极限值可包括确定最大值。作为选择或补充，确定多个极限值可包括确定声频信号加权形式的最大值，其中越新近的值的加权数越高。视情况而定，计算极限值的平均值可包括计算其几何平均值。

附图说明

将结合附图以及下面对实施例的描述，进一步说明本发明的非限定性具体实施例。在多个图中出现的相同结构，元件或部分最好由相同或类似数字表示，其中：

图1为根据本发明实施例的噪声补偿系统的示意图；

图2A为根据本发明实施例的噪声补偿系统的控制器的结构示意图；

图2B为根据本发明另一实施例的噪声补偿系统的控制器的结构示意图；

图3为根据本发明实施例的，如图2A或图2B所示控制器的逻辑单元示意图；

图4为根据本发明实施例的图3所示逻辑单元的增益因数确定单元示意图；

图5A和5B根据本发明实施例，显示了在利用由共振峰单元产生的增益因数进行校正之前和之后的示范声音信号图；

图6为根据本发明实施例的增强滤波器的增益因数示意图；

图7为根据本发明实施例的示范噪声功率谱和其掩蔽形式的示意图；以及

图8为根据本发明实施例的语音检测器的结构示意图。

具体实施方式

图1为根据本发明实施例的噪声补偿系统30的示意图。系统30接收由扬声器32发出的输入声音信号Sinput(t)。例如，接收来自电话通话中远程方的Sinput(t)。控制器40接收输入声音信号Sinput(t)和扬声器32附近噪声的估计值N(t)，并提供噪声补偿输入信号S’(t)，其为输入声音信号Sinput(t)的噪声补偿形式。

在本发明的一些实施例中，输入声音信号Sinput(t)将通过噪声净化器95，其负责提供输入声音信号Sinput(t)的噪声滤波形式S(t)。噪声净化器95的操作与扬声器32附近的噪声等级无关。噪声净化器95当没有语音信号时可视情况对噪声进行测量并确定噪声的频谱形式。接着，噪声净化器95可视情况从包括语音的信号部分的谱表示中去除噪声的谱表示。作为选择或补充，也可以使用所属技术领域中已知的任何其他噪声净化器，例如海尔夫(Helf)等人的第5,550,924号美国专利中所描述的和/或在友(Yoo)的“利用带间声学信息模拟有噪声语音的固定时间频率范围”(1999年，IEEE会议论文集809-812页，卷2，[声学，语音和信号处理])中所描述的噪声净化器，其所公开的内容将以引用的方式并入本文。作为选择或补充，在确定频率分量之后，将噪声净化器与控制器40相邻安置。因此，由控制器40执行的频谱选取也可供噪声净化器使用。

在本发明的一些实施例中，根据输入噪声信号n(t)生成噪声估计值N(t)，输入噪声信号由在扬声器32附近的话筒34收集。视情况而定，输入噪声信号n(t)可由放大器36放大并通过回波消除器(EC)96以便获得噪声估计值N(t)。回波消除器96从输入噪声信号n(t)中消除输出信号S’(t)的回波，其由话筒34收集和/或其由于声耦合而进入n(t)。

在本发明的一些实施例中，回波消除器96在新近预定大小的输出信号S’(t)段(例如几毫秒)中找寻噪声信号n(t)中的最大相关段。回波消除器96可视情况确定段的相关值以及它们之间的时差。在本发明的一些实施例中，回波消除器96利用段之间的时差来延迟声音信号S’(t)并利用所确定的自相关值倍增延迟声音信号。噪声估计值N(t)可视情况被当作所检测的噪声信号n(t)来计算，从中减去倍增的和延迟的声音信号。因此，回波消除器96比所属领域中其他已知的回波消除器要简单，尽管其代价是精确性较低。作为选择或补充，可以使用任何其他的回波消除器，包括例如利用自适应滤波的回波消除器。

另外，作为选择或补充，噪声n(t)可不通过回波消除器。在本发明的一个具体实施例中，当话筒34并不靠近扬声器32时，例如当话筒34的位置靠近噪声源而不是扬声器32时，不使用回波消除器。例如，当主要噪声源(如汽车发动机)已知，话筒34的位置靠近发动机时。在本发明的一个具体实施例中，话筒34和扬声器32之间至少呈90度安置于电话中，例如垂直或反向相对。在这些具体实施例中，系统30视情况可不包括回波消除器。

在本发明的一些实施例中，噪声补偿系统30补偿在有线或移动电话机附近的噪声。视情况而定，系统30可安置于电话机之中。作为选择或补充，系统30或其部分可安置于电话网的服务电话机之中。话筒34视情况可为普通的电话机话筒，除了常规使用外，还用于收集输入噪声信号n(t)。作为选择或补充，话筒34为附着于电话机上的免提话筒。另外，作为选择或补充，话筒34可独立于电话机上的常规话筒。

在本发明的其他实施例中，系统30与其他的音响和/或声频系统一同使用，例如广播系统，音乐系统，电视会议系统，收音机和/或电视机。在本发明的一些实施例中，使用多个话筒收集用于估算噪声N(t)的噪声信号。可将一个或多个话筒34安置于靠近噪声源，靠近听众的位置和/或任何其他适合确定将被补偿的噪声等级的位置。在本发明的一些实施例中，由多个扬声器32发出单一输入信号Sinput(t)。从而，系统30根据相应的噪声估计值N(t)以不同的方式校正每个扬声器32的输入信号。

图2A为根据本发明实施例的控制器40的结构示意图。控制器40视情况可以数字样本流的方式接收输入信号S(t)和噪声估计值信号N(t)，并以预定速率接收，例如每10或12.5毫秒一个样本。作为选择或补充，输入信号S(t)和/或噪声信号N(t)以模拟信号的形式提供，可通过适合的模拟数字转换器(未图示)将其转换为数字流。在本发明的一些实施例中，在缓冲器110和116中分别积累预定数量的输入信号S(t)和噪声信号N(t)样本。积累的样本视情况可分别通过快速傅里叶变换(FFT)单元111和115，以便提供输入信号S(t)的多个频率分量值S1，S2，…，Sn以及噪声信号N(t)的多个频率分量值N1，N2，…，Nm。作为选择或补充，可以使用除FFT(快速傅里叶变换)以外的其他傅里叶变换方法。

在本发明的一些实施例中，FFT(快速傅里叶变换)的每个接收器对应于一个单独的频率分量。或者，每个频率分量包含一组独立的接收器。在本发明的一些实施例中，大体上所有的频率分量，除了极限情况外，都由相同数量的接收器形成。作为选择或补充，频率分量的频带是预定的，如下文中结合图2B所描述的一样，并利用每个频带中包括的接收器的值确定频率分量的值。

频率分量值S1，S2，…，Sn视情况可由增强滤波器112滤波，其根据预定的加重方案加重特定的频率分量，以便增加声音信号S(t)的清晰度。增强滤波器112视情况可增强包含主要语音频率的频率分量的振幅，以便加重语音信号。将在下文中结合图6描述增强滤波器112的具体实施例。此后，如下文中所述，对应于噪声N(t)和声音信号S(t)，在倍增单元117中利用由逻辑单元77确定的相应增益因数(gi，线路121)倍增增强的频率分量值。因此，在增强滤波器112中利用非噪声依赖值，在倍增单元117中利用噪声依赖值倍增每个频率分量。

在执行噪声依赖校正之前，通过利用增强滤波器112加重语音信号，噪声依赖校正集中于处理声音信号S(t)的语音分量。如下文描述，应注意噪声依赖校正通常对于所有的频率分量均相同，以便不会导致声音信号的失真。另一方面，非噪声依赖校正对于不同的频率分量使用不同的增益因数。尽管对不同的频率分量应用不同的增益因数会导致声音信号的失真，但此失真具有已知的影响并且不依赖于已调整信号之外的值，如噪声。在本发明的一些实施例中，如下文所述，倍增单元117的增益因数{gi}是噪声依赖和非噪声依赖校正的合成。

增强滤波器112安置于倍增单元117之前，作为选择或补充，增强滤波器112(或第二增强滤波器)可在倍增单元117的输出端工作。基于频率分量的单一选取执行噪声依赖和非噪声依赖校正，将减小噪声补偿系统30的复杂性。

倍增的频率分量值视情况可通过反向FFT(快速傅里叶变换)(IFFT)单元118变换回时域中，以便提供调整的声音信号S”(t)。在本发明的一些实施例中，如下文所述，基于由逻辑单元77产生的相应加权数b1和b2(b1+b2＝1)，加权平均单元133生成调整的声音信号S”(t)和输入声音信号S(t)的加权和S^w(t)。加权和视情况可输入软限幅器100中，其根据需要调整加权和，使得加权和不会超过扬声器32的工作范围。限幅器100输出的信号视情况可通过数字模拟(D/A)转换器31转换成模拟信号，再由功率放大器52放大，通过扬声器32发出。或者，D/A转换器31可安置于加权平均单元133的加法器或限幅器100之前。

在本发明的一些实施例中，限幅器100将加权和S^w(t)限制在放大器52的预定操作极限之间的范围中。作为选择或补充，可基于放大器52的当前动态范围周期性的确定限幅器100限制加权和S^w(t)的范围。视情况而定，限幅器100可被限制在对称极限之间，即，-极限＜S^w(t)＜+极限。在本发明的一个具体实施例中，限幅器100执行下列功能：

其中A为0到1之间的任意值，x为将被限幅的信号，F(x)为限幅信号。

除了使用限幅器100，作为选择或补充，功率放大器52的动态范围可大于进入控制器40的信号的动态范围，使得控制器40大体上不会产生超出功率放大器52动态范围的信号。另外，作为选择或补充，如下文所述，由逻辑单元77产生的增益因数包括压缩因数，其大体上消除了对限幅器100的需要。但是，应注意在本发明的一些实施例中，即使逻辑单元77产生的增益因数包括压缩因数，仍使用限幅器100，以便防止任何失真。

在本发明的一些实施例中，逻辑单元77为声音信号S(t)的每个频率分量接收功率等级ESi，为噪声信号N(t)的每个频率分量接收功率等级ENi。视情况而定，一个产生信号绝对值的平方(ABS²)的功率确定单元113，其可从增强滤波器112接收S(t)频率分量的增强值并从其中确定每个频率分量的功率ESi。在本发明的一些实施例中，由FFT(快速傅里叶变换)单元115产生的噪声信号N(t)的频率分量将通过功率确定单元114(ABS²)，其计算噪声信号N(t)在其每个频率分量中的功率ENi。如下文中结合图7所述，视情况而定，噪声功率信号ENi可通过掩蔽单元119，其根据人类的声学条件调整噪声功率信号ENi。

在本发明的一些实施例中，声音信号S(t)和噪声信号N(t)根据相同的频率分量划分被分成相同数量的频率分量(即，n＝m)。或者，声音信号S(t)和噪声信号N(t)被分成不同数量的频率分量。在本发明的一些实施例中，噪声信号N(t)转化成包括较大带宽的频谱。视情况而定，在这些实施例中，噪声信号N(t)与声音信号S(t)相比被分成更多的频率分量，视情况可多出1或2个频率分量。在本发明的一些实施例中，噪声信号N(t)的附加频率分量被掩蔽单元119使用，以便考虑影响低频带的高频带噪声频率。视情况而定，提供给逻辑单元77的噪声和声音信号可包括相同数量的频率分量。

在本发明的一些实施例中，以共用的足够高的采样率对声音信号S(t)和噪声信号n(t)进行采样，这允许了更多数量噪声信号频率分量的产生。或者，噪声信号n(t)与声音信号S(t)相比具有更高的采样频率，使得从采样信号n(t)中产生更多数量的频率分量。视情况而定，噪声信号n(t)接着把采样速率降低到声音信号S(t)的采样率，以便容易进行信号的比较。或者，通过向高频添加零值来填塞声音信号S(t)。

在本发明的一些实施例中，语音激活检测(VAD)单元250确定S(t)什么时候不包括语音信号(例如，在词语之间的沉默时期)，并且当S(t)不包括语音信号时大体上禁用逻辑单元77。因此，声音信号S(t)中词语之间的噪声不被放大去“克服”背景噪声n(t)。视情况而定，当VAD单元250确定输入不包括语音信号时，逻辑单元77可提供来自声音信号S(t)中包括语音的先前时间的输出增益因数{gi}。作为选择或补充，逻辑单元77的一个或多个元件不提供输出以减小功率消耗。视情况而定，当确定声音信号S(t)不包括语音时，提供给扬声器32的声音信号S(t)大体上没有改变。或者，切断声音信号S(t)并且当声音信号不包括语音信号时不发送信号。

在本发明的一些实施例中，VAD单元250基于信号振幅和声音阈值的比较确定声音信号S(t)是否包括语音信号。视情况而定，根据在对话期间启动噪声等级的等级(例如在电话交谈开始时的测量)设置声音阈值。或者，声音阈值为工厂测定或另外预定的。再或者，可根据连续和/或周期性获得的噪声测量值来自适应的调整声音阈值。在本发明的一些实施例中，将阈值设置为所测量噪声的预定倍数，例如噪声的3-5倍之间。作为选择或补充，可以使用所属领域中已知的任何其他的VAD(语音激活检测)操作方法。

在本发明的一些实施例中，将控制器40的处理迭代应用在预定数量的样本上，例如100-1000个样本之间，这依赖于采样速率。视情况而定，可将控制器40的处理迭代应用在为2的乘方的样本上，例如128，256或512，以便执行使用快速傅里叶变换(FFT)方法的傅里叶(Fourier)变换。在本发明的一些实施例中，在每个重复中使用的样本数量要调整到既满足所需的精确性(这需要较大数量的样本)又满足缩短延迟(这要求较小数量的样本)的需要。视情况而定，用户可在特定时间调整处理迭代中使用的样本数量。在本发明的一些实施例中，根据信号从其起源到扬声器32的总延迟设置延迟。例如，当电话中使用系统30时，如果信号的环路延迟(RTD)相对较低，则可以使用具有较大样本数量的快速傅里叶变换(FFT)，导致一个相对较大的延迟，如20ms。但是，如果信号的环路延迟(RTD)相对较高，则通过减小用于执行FFT的样本数量将系统30的延迟限制为5或10ms。

视情况而定，可在非重叠样本组上执行每个处理迭代。或者，执行每个处理迭代的样本组与在前一个处理迭代中使用的一个或多个样本部分重叠。在本发明的一个具体实施例中，每次执行处理迭代将收集128个样本，执行发生在一组256个最新样本上。在本发明的一些实施例中，调整重叠样本的数量作为语音质量对功率消耗的函数。当期望最小化功率消耗时，执行较少的处理迭代，重叠率较低或没有重叠。当期望获得高的语音质量时，频繁的执行处理迭代，重叠率较高。用户视情况可选择期望的处理迭代速率。

除了使用傅里叶(Fourier)变换产生频率分量值，如现在结合图2B所述，还可使用带通滤波器阵列产生声音和噪声信号的频率分量信号。使用滤波器阵列，使得系统30的操作大体上不会产生延迟。

图2B为根据本发明实施例的控制器40’的结构示意图。控制器40’类似于控制器40并可以代替控制器40用于系统30中。在下面的描述中，仅介绍控制器40’中不同于控制器40的元件。在控制器40’中，声音信号S(t)和噪声信号N(t)将分别通过相应的带通滤波器(BPF)阵列62和64，其生成多个频率分量声音信号S 1(t)，S2(t)，…，Sn(t)以及多个频率分量噪声信号N1(t)，N2(t)，…，Nm(t)。

声音和噪声频率分量的数量将与上述控制器40中的等同物一致。在本发明的一些实施例中，根据所需质量和控制器40所覆盖的频率范围，滤波器阵列62中的滤波器数量大约在10-60之间。视情况而定，控制器40的频率范围可包括声频范围，如20Hz到20KHz之间。或者，控制器40的频率范围包括人类声频范围，如高达4到7kHz之间。再作为选择或补充，频率范围可包括较小或较大范围的频率，例如当系统30用于宠物时。

在本发明的一些实施例中，高达1kHz的频率分量具有大约100Hz的带宽，并且在更高范围的频率分量的带宽与频率呈对数关系。视情况而定，可根据声学和/或人耳的其他特性选择频率分量的频率，例如使人耳产生大体上不同感知的频率包含在不同的频率分量中。

在本发明的一些实施例中，根据临界的音频划分频率分量，这在所属领域中已知。在这些具体实施例中使用的频率分量的数量依赖于被认为是重要的频率的范围。对于0-20kHz的范围，这些具体实施例视情况可使用约24个频率分量。对于300-4000Hz的范围，这些实施例视情况可使用围绕下列频率的频率分量：450，570，630，700，840，1000，1170，1370，1600，1850，2150，2500和2900Hz。视情况而定，也可以使用一个或两个围绕350Hz和/或3400Hz的附加频率分量。

在本发明的另一具体实施例中，频率分量包括下列频率范围，400-540，510-630，630-770，770-920，920-1080，1080-1270，1270-1480，1480-1720，1720-2000，2000-2320，2320-2700和2700-3150Hz。应注意第一和最后频率分量将覆盖低于400Hz和高于3150Hz的频率，尽管其重要性低于频率分量的频率范围中的频率。

应注意上述例子并非限制，可以使用任何其他频率分量组。特别的是，可以使用更多数量的频率分量，如32，48或甚至65个。作为选择或补充，频率分量的范围可能部分重叠或不完全覆盖声音信号的整个频率范围。

在本发明的一些实施例中，阵列62和64中的滤波器包含巴特沃斯(Butterworth)滤波器，视情况可具有至少两个，三个，四个，五个或甚至六个级。在本发明的一个具体实施例中，当需要低功率消耗的系统30时，使用两个或三个级。当需要高精确性时，视情况可使用至少五个或六个级。在本发明的一些实施例中，选择级的数量使得滤波器可模拟人耳内对于噪声的掩蔽效用。

视情况而定，频率分量的极限为滤波器的-3dB点。在本发明的一些实施例中，滤波器的最大放大率约为1。作为选择或补充，阵列62和/或阵列64中的一些或所有滤波器可为其他型号，例如柴比雪夫多(Chebyshev)，贝塞尔(Bessel)或椭圆滤波器。视情况而定，相应频率分量的噪声和声音滤波器可具有相同特性。作为选择或补充，至少一些相应频率分量的噪声和声音滤波器具有不同特性。例如，在本发明的一些实施例中，滤波器阵列62中的滤波器执行增强滤波器112的一些或所有的增强处理(视情况可在这些实施例中省略增强滤波器112)。在这些实施例中，阵列62的滤波器所执行的增强处理将不同于阵列64的滤波器。

在本发明的一些实施例中，控制器40’包括倍增器阵列70，其将每个声音频率分量信号Si(t)平方以获得功率信号ESi(t)。功率信号ESi(t)视情况可由独立的低通滤波器(LPF)76滤波并接着由采样器(未图示)采样以产生频率分量功率值ESi。除了使用采样器，当在其输入端读取值时，还可用逻辑单元77执行采样。低通滤波器76视情况可在采样之前使功率信号ESi(t)变平滑，使得采样时不会取到非典型的波动值。同样的，噪声频率分量信号Ni(t)将通过相应的倍增器阵列68中的倍增器，其将每个信号平方。平方的信号视情况可由低通滤波器(LPFs)73阵列滤波并被采样以产生频率分量功率值ENi。

在本发明的一些实施例中，LPFs73和/或76包含一或二阶滤波器。视情况而定，低通滤波器具有依赖于相应频率分量低频边界Fmin的-3dB点。在本发明的一个具体实施例中，-3dB点约在Fmin/k上，其中k约在1.5到2之间，以便获取功率值的DC分量。作为选择或补充，一个或多个低通滤波器具有依赖于相应频率分量高频边界的-3dB点。再作为选择或补充，可以使用任何其他适合的低通滤波器。再作为选择或补充，可以使用任何其他适合的方法和/或滤波器，用于动态选取功率值(其通常等于平均功率)的DC分量。

在倍增单元117之后，视情况可通过如信号加法器65合成频率分量信号S1(t)，S2(t)，…，Sn(t)。

图3为根据本发明实施例的逻辑单元77的示意图。逻辑单元77包含多个增益因数确定单元，其确定增益因数并根据对声音信号S(t)的不同测定(如功率向量{ESi}所表示)倍增声音信号S(t)的频率分量。在图3所示实施例中，多个增益因数确定单元包括一个有声语音增强单元91，一个自动增益单元92，一个共振峰单元93和一个压缩器单元94。但是，应注意根据本发明的不同实施例，逻辑单元77可以包括更少的单元和/或附加单元。倍增器99视情况可接收由增益因数确定单元确定的增益因数并向倍增单元117(图2A或2B)提供增益因数{gi}。或者，单元91，92，93和94中的每一个都接收前一单元的增益因数并提供一个累积的增益因数。

逻辑单元77视情况可包括一个有声识别单元89，其确定声音信号S(t)在当前是包括有声信号还是无声信号，就如功率向量{ESi}所表示的一样。在所属领域中已知，由声门脉冲的谱组成产生的声音被称为有声声音，在无声带帮助下发出的声音被称为无声声音。

在本发明的一些实施例中，识别单元89识别声音信号S(t)的共振峰并由此确定声音信号是否包括有声语音。视情况而定，如果声音信号S(t)包括显著的音调，如具有大体上比其他所有音调都大的振幅，则认为信号包含有声语音。作为选择或补充，识别单元89可以比较声音信号S(t)的低频和高频中的功率。视情况而定，如果低频中的功率较高，通过来自高频功率的预定阈值，认为声音信号S(t)有声。在本发明的一个具体实施例中，声音信号S(t)的频带大体上均匀的划分于低频和高频之间。或者，根据声学原因可在任何其他点进行低频和高频之间的划分。

在本发明的一些实施例中，仅当信号具有明显的有声特性时识别单元89才确定信号包含有声语音。这是因为有声语音增强单元91仅在确定信号包含有声语音后生成改变信号的增益因数。

作为选择或补充，可以使用任何其他方法识别有声语音，例如上述提及的Yoo(友)的论文和/或Kates(凯茨)等人的第4,468,804号美国专利中描述的方法，其所公开的内容将以引用的方式并入本文。

有声语音增强单元91视情况可接收来自识别单元89的表明声音信号S(t)是否包含有声语音的指示信号。在本发明的一些实施例中，如果声音信号S(t)包含有声语音，则增强单元91将选择一个有声语音增强向量(p1，p2，…，pn)，向量适合强调包含有声语音的声音信号S(t)频率分量。视情况而定，有声语音增强向量(p1，p2，…，pn)可包含大体上用于所有有声语音信号的预定向量。或者，语音增强向量(p1，p2，…，pn)可为功率向量{ESi}的函数。

在本发明的一些实施例中，语音增强向量(p1，p2，…，pn)提高低频功率和/或降低高频功率。例如，语音增强向量(p1，p2，…，pn)可以是非增单调函数。在本发明的一些实施例中，当识别单元89提供一个无声语音指示信号时，语音增强向量(p1，p2，…，pn)等于一个不改变声音信号S(t)振幅的单位向量。

在本发明的一些实施例中，增强单元91也提供一个改进的功率向量{ESMi}，其等于由增强向量(p1，p2，…，pn)倍增的功率向量{ESi}。视情况而定，可通过自动增益单元92，用改进的功率向量{ESMi}表示声音信号S(t)的功率。

在本发明的一些实施例中，自动增益单元92基于声音信号S(t)典型功率和噪声信号N(t)典型功率的比较确定信号S(t)的第一增益因数(Gain1)。视情况可基于信号在近期的历史来确定典型功率。视情况可设计第一增益因数，使声音信号S(t)一般高于噪声信号N(t)，同时共振峰单元93对当前时间的声音和噪声信号执行一次特殊的比较。在本发明的一个具体实施例中，自动增益单元92与下文中结合图4所介绍的一样。视情况而定，自动增益单元92还可提供一个放大的功率向量{Gain1xESMi}，共振峰单元93使用其代表信号S(t)。

在本发明的一些实施例中，共振峰单元93识别声音信号S(t)的一个或多个共振峰，并由此产生一个第二增益因数(Gain2)。第二增益因数(Gain2)视情况可为最小的增益因数，此因数确保对应于声音信号S(t)的预定共振峰组的频率分量的功率值比噪声信号N(t)中相应频率分量的功率至少高出一个预定余量。视情况而定，预定余量可对所有的频率分量均相同。或者，对不同的频率分量使用不同的余量。在本发明的一些实施例中，预定余量大约在3-10dB之间，视情况可等于6dB。在本发明的一个具体实施例中，共振峰单元93与下文中结合图5A和5B所介绍的一样。视情况而定，共振峰单元93也可提供一个放大的功率向量{Gain2xGain1xESMi}，压缩单元94使用其代表信号S(t)。

在本发明的一些实施例中，来自自动增益单元92的放大的功率向量{Gain1xESMi}将通过前共振峰平滑器97，其使放大的功率向量{Gain1xESMi}变得平滑。视情况可执行平滑处理，因为是在声音信号S(t)频谱的包络线上而不是声音信号上找寻共振峰，这包括了许多不重要的波峰。

平滑向量(记做{ESMi’})中的每个频率分量值视情况可等于与其邻接频率分量的加权平均值。在本发明的一个具体实施例中，前共振峰平滑器97根据下列方程进行操作：

ESMi’＝Gain1x(0.5x ESMi+0.25x ESM_i+1+0.25x ESM_i-1)2≤i≤n-1

ESM1’＝Gain1x(0.66x ESM1+0.34x ESM₂)

ESMn’＝Gain1x(0.66x ESMn+0.34x ESM_n-1)

或者，使用任何其他的平滑函数，例如考虑更多数量邻接频率分量和/或使用其他加权因数的函数。

在本发明的一些实施例中，共振峰单元93接收噪声功率向量{ENi}的平滑化形式，在此称为{ENi’}。视情况而定，可由噪声平滑器98产生平滑化的噪声功率向量{ENi’}，平滑器98与前共振峰平滑器97执行相同的函数。或者，噪声平滑器98与前共振峰平滑器97执行不同的函数，视情况可产生一个平滑性稍差的信号。视情况可将噪声功率向量{ENi}平滑化，使其匹配{Gain1xESMi}的平滑形式。

在本发明的一些实施例中，压缩单元94产生适合减小校正声音信号S(t)功率的压缩向量(c1，c2，…，c_n)。视情况而定，压缩向量(c1，c2，…，c_n)可适合于将校正声音信号S(t)功率减小到功率放大器52和/或扬声器32的操作极限之中。作为选择或补充，压缩向量(c1，c2，…，c_n)可适合于将校正声音信号S(t)功率减小到一个大体上等于原始声音信号S(t)的水平或任何其他期望的水平。

视情况而定，压缩单元94可为每个频率分量确定频率分量中的信号噪声比(SNR)。视情况而定，如果频率分量的信号噪声比(SNR)大于约6dB，则向量ci的压缩增益可开始利用衰减量(负增益)衰减频带中的声音信号，衰减量为信号噪声比(SNR)的函数。在本发明的一些实施例中，根据单调函数确定负增益的大小，在SNR为6dB时，其为0dB(无衰减)，在SNR约为24dB时，其为5dB。视情况而定，负增益的最大值可为5dB。在本发明的一个具体实施例中，根据下列函数确定负增益(Y)的大小：

Y＝-2.95·10^-11·x⁸+5.67·10^-9·x⁷-4.43·10^-7·x⁶+1.80·10^-5·x⁵-4.0·10^-4·x⁴++0.0046·x³-0.026·x²-0.073·x+4.92·10^-13

其中x指示SNR。

作为选择或补充，压缩单元94可寻找峰值频率分量，其中由{ESi}表示的声音信号S(t)的振幅大体上大于其相邻频率分量或所有其他频率分量(例如，大8-10dB)。视情况而定，压缩向量(c1，c2，…，c_n)可使峰值频率分量减少约5dB或减少一个百分比，其程度使得峰值频率分量的振幅大于其他频率分量。

再作为选择或补充，压缩向量(c1，c2，…，c_n)还衰减被噪声掩蔽的频率分量。视情况而定，可利用零倍增一些频率分量，使其基本上被去除，这些频率分量中声音信号S(t)的振幅大体上低于噪声的振幅(例如，低至少6dB)。

再作为选择或补充，可以使用任何其他大体上不会使输出信号失真的压缩函数。再作为选择或补充，可不使用压缩单元94并依靠限幅器100执行压缩。再作为选择或补充，可不使用限幅器100并依靠压缩单元94执行压缩。再或者，既不使用限幅器100也不使用压缩单元94并且不执行压缩。视情况而定，在此选择中，功率放大器52的工作范围大于输入声音信号的信号范围，以便允许输入信号的放大，其由扬声器32发出。

在本发明的一些实施例中，在将来自共振峰单元93的放大功率向量{Gain2xGain1xESMi}提供给压缩单元94之前，由前压缩平滑器107对其进行平滑处理。视情况而定，前压缩平滑器107可与前共振峰平滑器97执行相同或类似的平滑函数。除了使用平滑器107，压缩单元94可以接收由Gain2倍增的前共振峰平滑器97的平滑化输出，其表示声音信号S(t)。在本发明的一些实施例中，压缩单元94使用平滑化的噪声功率向量{ENi’}来表示噪声信号N(t)。作为选择或补充，压缩单元94可使用噪声功率向量{ENi}的不同平滑形式。再作为选择或补充，压缩单元94可使用未被平滑的噪声功率向量{ENi}。

在本发明的一些实施例中，倍增器99接收输出因数，例如增强向量{pi}，Gain1，Gain2和压缩向量{ci}，并且产生增益向量(g1，g2，g_n)作为所接收值的乘积，如g_i＝pi*Gain1*Gain2*ci。除了包括倍增器99的逻辑单元77，作为选择或补充，一个或多个自动增益单元92，共振峰单元93和压缩器单元94可接收一个或多个前一单元的输出因数。在本发明的一个具体实施例中，共振峰单元93接收Gain1并提供Gain1与Gain2的乘积，压缩器单元94接收增强向量，Gain1和Gain2，生成压缩向量(c1，c2，…，c_n)并由此产生增益向量(g1，g2，g_n)。

除了单元92，93和94对功率向量{ESi}的校正形式进行操作外，作为选择或补充，一个或多个单元可对原始功率向量{ESi}或部分校正功率向量进行操作。

在本发明的一些实施例中，逻辑单元77包括一个加权确定单元138，其动态的确定由加权平均单元133使用的加权数b1和b2。视情况而定，给予改进的声音信号S”(t)的加权数b1可相对较高，即，高于0.5，当背景相对嘈杂时，Gain1相对较高。视情况而定，给予改进的声音信号S”(t)的加权数b1可为Gain1的非减函数。也就是说，当Gain1增加时，给予改进的声音信号S”(t)更多的权。在本发明的一个具体实施例中，加权数b1＝Gain1/max，其中max为Gain1的最大可能值。作为选择或补充，当Gain1低于预定值时，例如0.3，可将b1设置为0。再作为选择或补充，当Gain1高于预定值时，例如3，可将b1设置为1。

或者，加权数b1和b2为噪声{ENi}的函数或具有预定值，例如0.5。作为选择或补充，一个用户控制使得用户可以根据其偏好调整b1和b2的值。

在本发明的一些实施例中，b1和b2在通过低通滤波器之后进入加权平均单元133，其防止权数频繁的波动。作为选择或补充，由加权确定单元138执行的函数可包括一个时间平滑作用。

图4为根据本发明实施例的自动增益单元92的示意图。自动增益单元92视情况可包括一个信号历史单元406，其为由改进的功率向量{ESMi}表示的声音信号S(t)确定有代表性的典型功率Hs。此外，自动增益单元92包括一个噪声历史单元411，其为由噪声功率向量{ENi}表示的噪声信号N(t)确定有代表性的典型功率Hn。视情况可计算有代表性的典型值，作为不同时期多个最大值的平均数。在本发明的一些实施例中，信号历史单元406和噪声历史单元411大体上等同。或者，历史单元406和噪声历史单元411彼此不同。举例来说，声音典型功率Hs与噪声典型功率Hn相比将给予先前信号更高的等待。

在本发明的一些实施例中，每个历史单元406包含一个加法器408，其生成所有接收的频率分量功率的功率和。或者，加法器408生成来自滤波器62的频率分量信号之和并计算和的功率和/或原始信号S(t)的功率。视情况可将和提供给短期最大值寄存器410和长期最大值寄存器412。在本发明的一些实施例中，寄存器410和412以下列方式确定其新值。如果接收值大于内部储存值，则新值等于储存值。否则，新值等于内部储存值的衰减形式，其中短期寄存器410中的值比长期寄存器412中的值衰减的要快。在本发明的一些实施例中，短期寄存器410中的值在大约一个单词的时间内衰减，使得寄存器410中的值与一个单词上的最大功率相关。在本发明的一些实施例中，长期寄存器412中的值一个或几个句子的时间内衰减，使得寄存器412中的值与较长时期上的最大功率相关。

在本发明的一些实施例中，历史单元406的寄存器410和412分别与历史单元411的寄存器410和412具有相同的衰减值。或者，历史单元406的寄存器410和412与历史单元411的寄存器410和412具有不同的衰减值。在本发明的一个具体实施例中，信号历史单元406的长期寄存器412中的值在大约256ms的时间内约衰减到其值的10-30％，同时信号历史单元406的短期寄存器410中的值在大约64ms的时间内衰减。视情况而定，噪声历史单元411的长期寄存器412中的值在大约1秒的时间内约衰减到其值的10-30％，同时噪声历史单元411的短期寄存器410中的值在大约25-100ms的时间内衰减。

在本发明的一些实施例中，当VAD单元250提供一个指示信号表明声音信号不包括语音时，信号历史单元406的寄存器410和412中的值不衰减。视情况而定，当声音信号不包括语音时，可不更新寄存器410，即使输入值具有比寄存器中内容更高的功率。为选择或此外，在确定声音信号不包括语音的基础上，可将短期寄存器410中的值调零。在本发明的一些实施例中，在噪声历史单元411中执行类似的动作。

在本发明的一些实施例中，如果接收值大于寄存器中的值，则不立刻更新一个或多个寄存器410和412中的值，而是阶段的执行更新，以防止导致更新太急。视情况而定，可将更新限制在比衰减斜率更陡的预定斜率中。

自动增益单元92除了基于功率信号{ESMi}和/或{ENi}工作外，其还可基于频率分量的样本来工作。视情况而定，可将频率分量的值相加并取其平方，此平方值被自动增益单元92使用。

在本发明的一些实施例中，平均值单元414计算短期寄存器410和长期寄存器412中的值的平均值，以便产生典型功率值Hs或Hn。在本发明的一些实施例中，平均值单元414计算几何平均值。或者，平均值单元414计算任何其他的平均值，例如算术平均值或中值。视情况而定，自动增益单元92可进一步包括一个除法器108和一个平方根单元109，其负责计算历史值比率的平方根，即

以便从功率的比率中获得增益值。

除了寄存器410和412以外，历史单元406和/或411可包括更多的具有不同衰减时间的寄存器。再作为选择或补充，可以使用任何其他的方法确定一个或多个有代表性的典型功率值。

在本发明的一些实施例中，自动增益单元92包括一个噪声平稳单元407，其在噪声N(t)的频率展开上提供一个平稳(或密度)指示值(FLAT)。增益因数Gain1视情况可随着平稳指示值线性增加，使得当噪声频谱更广时，增益因数也越大。视情况而定，当噪声N(t)类似于白噪声时，Gain1可具有接近1值，当噪声类似于具有特定频率的正弦波时，Gain1的值较低，如0.2。

在本发明的一些实施例中，噪声平稳单元407计算频率分量噪声功率值{ENi}的标准化平均值NA。视情况而定，通过除以最大功率值，即max_i{ENi}，可将平均值标准化。在本发明的一个具体实施例中，根据下列方程利用标准化平均值NA计算平稳指示值FLAT：

FLAT = \{\begin{matrix} NA / 2 & NA < 0.5 \\ 1 - (na - 0.5) / 2 & NA &GreaterEqual; 0.5 \end{matrix}

在本发明的一些实施例中，及时将平稳指示值FLAT与先前FLAT值平均，以防止其值的强烈波动。视情况而定，可使用第一或第二级低通滤波器随先前时间值将平稳指示值滤波。作为选择或补充，可使用任何其他合适的时间依赖滤波器，以防止强烈波动。

视情况而定，倍增器405产生Gain1，其为噪声平稳指示值FLAT，历史值比率的平方根

和预定恒定放大率(min_gain)的乘积。在本发明的一些实施例中，预定恒定放大率(min_gain)约为1。或者，预定恒定放大率(min_gain)约为2-2.5。

图5A和5B根据本发明实施例，显示了在利用由共振峰单元93产生的增益因数进行校正之前和之后的示范声音信号209的图。视情况而定，共振峰单元93可识别等于预定数量(如，3个)的声音信号S(t)的共振峰，即包络波峰。选择等于预定数量的共振峰视情况可包括从较频带开始选择，直到不再发现共振峰或已发现预定数量的共振峰为止。在本发明的一个具体实施例中，共振峰单元93基于功率信号{ESMi}识别存在共振峰的频率分量。例如，在信号209中，共振峰单元93识别频率分量3(S3)，频率分量8(S8)和频率分量12(S12)，作为其中的三个第一共振峰。

对于每个存在预定数量共振峰的频率分量，共振峰单元93视情况可确定频率分量中的SNR，即频率分量中噪声信号ENi208的功率和声音信号ESMi 209的功率之间的差异。视情况而定，共振峰单元93可选择SNR最小(包括大部分负值)的频率分量。对于信号209来说，频率分量8的SNR最小。在本发明的一些实施例中，共振峰单元93的输出增益(Gain2)等于使最小SNR成为预定值的所需增益，比如，约在3-6dB之间。作为选择或补充，共振峰单元93的输出增益(Gain2)可使SNR成为动态调整等级。视情况而定，可根据噪声等级，声音信号S(t)等级和/或Gain1的值调整动态调整等级。视情况而定，可通过取噪声和信号功率比的比率的平方根并利用约在2-4(等同于3-6dB)之间的恒定余量进行倍增来计算输出增益(Gain2)。

在利用Gain2倍增信号209之后，信号209的频谱将为图5B所示。视情况而定，如果最低的SNR超过预定阈值，如3-6dB之间，则可将Gain2设置为1。在本发明的一个具体实施例中，如果需要放大，预定阈值则为一个可使Gain2产生最低SNR的等级。或者，如果需要放大，预定阈值则不为一个可使Gain2产生最低SNR的等级，例如一个更低的预定阈值。使用一个低的预定阈值限制了振幅变化的发生，以及限制了那些真正需要变化的情况。

在本发明的一些实施例中，共振峰的预定数量包括小于声音信号S(t)的共振峰数量的情况。视情况而定，共振峰的预定数量包括在2-4之间的情况，可能为3。应注意声音信号S(t)的共振峰数量可能小于共振峰的预定数量。在此情况下，从找到的共振峰中执行最小SNR的确定，即使所发现的数量小于共振峰的预定数量。

应注意，即使当系统30与不包括语音，例如音乐信号的声频信号结合工作时，一些实施例也可使用共振峰单元93。

图6为根据本发明实施例的增强滤波器112的增益因数示意图。如图所示，视情况而定，可利用增强滤波器112衰减低频和高频，同时放大中间频率。在本发明的一些实施例中，增强滤波器112未改变声音信号S(t)的总功率。视情况而定，增强滤波器112可包括一个倍增器，为每个频率分量Si(t)分配相应的增益因数。或者，利用增强滤波器112的单一增益因数至少倍增一组多个频率分量。

增强滤波器112除了具有如图6所示的增益因数以外，增强滤波器112的增益因数也可以按照任何其他的函数确定，这些函数可以增强语音信号和/或减小噪声。在本发明的一些实施例中，基于模拟确定增强滤波器112的增益因数。作为选择或补充，可在工厂校准期调整增强滤波器112的增益因数。再作为选择或补充，可根据现场试验周期性的更新增强滤波器112的增益因数。再作为选择或补充，用户可以调整增强滤波器112的增益因数。此选择尤其适用于听力受损的用户。

图7为根据本发明实施例的示范噪声功率信号谱122和掩蔽噪声功率信号谱123的示意图。掩蔽单元119视情况可发现信号谱122的谱峰并为每个波峰计算一对以预定斜率从波峰沿相反方向下降的线301和302。视情况而定，预定斜率可在约40-60dB/十个之间。作为选择或补充，根据声学因素，不同波峰的线301和302具有不同的斜率。再作为选择或补充，相同波峰的线301和302可具有不同的斜率，例如根据声学因素。掩蔽噪声功率信号谱123在每点上视情况可等于线301和302在此点上的最大值。或者，掩蔽噪声功率信号谱123在每点上视情况可等于线301和302以及频谱122在此点上的最大值。视情况而定，掩蔽单元119以实时方式工作，其为每个频率分量提供掩蔽值，取代原始噪声功率值。

或者，可以使用任何其他考虑到频率在人耳中的相互影响的掩蔽单元。再或者，不使用掩蔽单元119，例如当频率分量的数量相对较少和/或使用如图2B所示的滤波器64产生频率分量值时。当滤波器64产生频率分量值时，所设计的滤波器结构通常可以执行掩蔽功能。

在本发明的一些实施例中，例如其中话筒34和扬声器32属于一部电话，系统30包括一个确定电话用户在何时说话的语音检测器。视情况而定，当用户说话时，系统30可停止校正远程声音信号S(t)。因此，系统30不会将用户的语音当作噪音并从而不会促使接受的远程声音信号的振幅高于用户的说话声音。

图8为根据本发明实施例的语音检测器81的结构示意图。语音检测器81视情况可从话筒34接收信号，并确定所接收信号何时包括语音。在本发明的一些实施例中，语音检测器81包括一个峰值检测器82和/或一个斜率检测器84，其确定所接收信号何时包括语音。视情况而定，峰值检测器82可将所接收信号与阈值相比较并当所接收信号高于阈值时提供一个语音指示信号。斜率检测器84视情况可跟踪所接收信号振幅的斜率。在本发明的一些实施例中，斜率检测器84当斜率超过预定递增斜率时提供一个语音开始指示信号，当斜率超过预定递减斜率时提供一个语音结束指示信号。

视情况而定，语音逻辑单元86可接收指示信号。在本发明的一些实施例中，当语音开始指示信号和语音指示信号均被接收时，逻辑单元86停止系统30的信号校正功能。视情况而定，当接收到语音结束指示信号而未接收到语音指示信号时，逻辑单元86在系统30的信号校正功能开启后，可开始一个大约0.5-1.2秒间的计数周期，视情况可为1秒。系统30的信号校正功能视情况可仅在于计数周期内未接收到语音开始指示信号和语音指示信号的情况下开启。因此，当用户说话时，未增强来自远端的声音信号S(t)而使其超过用户语音。

在本发明的一些实施例中，停止系统30的信号校正功能包括将远端声音信号S(t)的VAD信号设置为无语音，不管远端声音信号S(t)是否包括语音信号。作为选择或补充，停止系统30的信号校正功能还可包括将b1设置为零。

在本发明的一些实施例中，当无语音存在时，可根据所接收信号的度量动态调整峰值检测器82使用的阈值。视情况而定，一个噪声平均单元87可在一个新近的周期内平均所接收信号的振幅，此周期中逻辑单元86确定从话筒所接收的信号不包括语音。在本发明的一些实施例中，由一个积分器执行平均操作。峰值检测器82使用的阈值视情况可为高于噪声平均单元87的平均噪声等级的一个预定间隙。当环境噪声高时用户声音较高，当环境噪声低时用户声音较低，在此情况下使用自适应的阈值较为有利。

在本发明的一些实施例中，进入峰值检测器82的信号将先经过一个低通滤波器(LPF)88，以便防止所接收信号的瞬时改变影响逻辑单元86的输出。作为选择或补充，进入峰值检测器82和/或斜率检测器84的信号可通过一个滞后函数，以防止瞬时信号影响输出。

在本发明的一些实施例中，预定递增和递减斜率具有相同的大小，如大约0.5*Max_amplitude(最大_振幅)/200毫秒，其中Max_amplitude为话筒34所接收语音信号的预定最大值或当前扬声器的最大振幅。作为选择或补充，预定递增和递减斜率可具有不同的大小。

除了使用语音检测器81，还可以使用任何其他的语音检测器81或VAD，例如类似于VAD250和/或如上所述的第5,524,148号美国专利的检测器。再作为选择或补充，可使用语音检测器81或其变型来代替VAD250。再或者，不使用语音检测器81。当扬声器32与话筒34相邻安置时，此选择将导致系统30对用户通话的补偿，于是，即使当用户通话时，仍增强所接收的信号。

在上述实施例中，所述系统30包括七个单元，它们是增强单元91，自动增益单元92，共振峰单元93，压缩单元94，限幅器100，增强滤波器112和加权确定单元138，其通过为声音信号S(t)计算增益因数来直接或间接的影响声音信号S(t)。应注意在本发明的一些实施例中，增强单元91，增强滤波器112和限幅器100不考虑输入噪声进行工作，而自动增益单元92，加权确定单元138，共振峰单元93和压缩单元94则依赖噪声提供增益因数值。

因此，在本发明的这些实施例中，相对于输入噪声改变声音信号S(t)的单元既利用相同的增益因数改变了整个的声音信号S(t)(如单元92和93)又不导致声音信号峰值的相对位置的改变(如单元94)。因此，噪声依赖校正不导致信号失真。在本发明的一些实施例中，不使用压缩单元94，并且因此，所有的噪声依赖校正利用相同的增益因数放大了基本上整个信号。

通常，单元92和93确定增益因数，增强单元91和增强滤波器112执行不依赖于输入噪声的预矫正，并且压缩单元94，限幅器100和加权确定单元138储存能量。

除了倍增单元117的增益因数{gi}包括噪声依赖和非噪声依赖因数外，在本发明的一些实施例中，倍增单元117的增益因数仅包括噪声依赖因数。如增强单元91所产生的非噪声依赖因数视情况可由增强滤波器112和/或一个独立的倍增器使用。作为选择或补充，可不使用增强单元91。在本发明的一些实施例中，例如其中不使用压缩单元94，倍增单元117的增益因数对大体上所有的频率分量均相同。

在本发明的一些实施例中，本发明的噪声补偿与主动噪声抑制方法相结合。视情况而定，根据本发明实施例的用于校正声音信号S(t)的噪声估算可基于主动抑制的噪声。或者，噪声估算可基于在校正前的原始噪声。

应注意将使用硬件，软件或其组合实现上述实施例。过程可包括数字处理，模拟处理或其组合。特别的是，上述滤波器可为模拟或数字滤波器。

应了解上述方法可以有多种不同的形式，包括同时执行多个步骤，改变步骤的顺序以及改变所使用的具体实现方法。例如，当使用FFT产生频率分量值时，将少量相邻FFT值相加以产生数量较少的频率分量的频率分量值。还应了解上述对方法和设备的描述应解释为执行此方法的设备和使用此设备的方法。

以举例的方式，通过对本发明的非限定性实施例的详细描述说明了本发明的内容，这些实施例不会限制本发明的范围。应理解所描述的关于一个实施例的特点和/或步骤也可使用在其他实施例上，并且并非本发明的所有实施例都具有如具体图中所示或某一实施例中所述的所有特点和/或步骤。所属技术领域的人员可以构想到所述的实施例的变体。

应注意一些上述实施例描述了发明人所构想的最佳模式，并且在其中包括结构，动作或结构的细节以及以举例形式给出非本发明所必要的动作。如所属领域中已知的一样，在此所述的结构和动作可由执行相同功能的等同物取代，即使结构和动作不同。因此，权利要求书中使用的元件和限制对本发明的范围做了限定。当在下面的权利要求书中使用术语“包括”，“包含”，“具有”和它们的结合时，其表示“包括但不局限于”。

Claims

1.一种处理声频信号以克服与声频信号无关的背景噪声影响的方法，其包括：

将声频信号频率分量中声频信号的度量与背景噪声频率分量中噪声的度量相比较；

根据比较确定增益因数；以及

利用所确定的增益因数放大至少一部分声频信号，包括至少一个不包含于声频信号频率分量中的频率段。

2.如权利要求1所述的方法，其中声频信号的度量包括声频信号的功率。

3.如权利要求1所述的方法，其中如果声频信号包含有声语音，则增益因数包括有声语音增强因数。

4.如权利要求1或2所述的方法，其中背景噪声频率分量中噪声的度量包括噪声的掩蔽形式的功率。

5.如权利要求1所述的方法，其中放大至少一部分信号包括放大进行比较的声频信号的频率分量部分。

6.如权利要求5所述的方法，其中放大至少一部分信号包括按确定的增益因数放大整个声频信号。

7.如权利要求1所述的方法，其中增益因数的确定包括确定可以使声频信号的频率分量的频带中的信号噪声比超过阈值的增益因数。

8.如权利要求7所述的方法，其中当信号和/或噪声度量随时间变化时，可对阈值进行动态调整。

9.如权利要求7所述的方法，其中阈值为一个预定值。

10.如权利要求1所述的方法，其中比较声频信号频率分量中声频信号的度量包括在含有声频信号共振峰的频率分量中的比较过程。

11.如权利要求10所述的方法，其中在含有声频信号共振峰的频率分量中的比较过程包括，在多个声频信号频率分量中具有最小信号噪声比(SNR)的频带的频率分量中的比较过程。

12.如权利要求1所述的方法，其包括将声频信号分成多个频率分量并选择部分频率分量。

13.如权利要求12所述的方法，其包括将多个频率分量重新结合成增强的声频信号。

14.如权利要求12所述的方法，其中增强包括通过预定的非信号依赖增益因数进行增强。

15.如权利要求12所述的方法，包括通过相同的噪声依赖增益因数，倍增所有的频率分量。

16.如权利要求12所述的方法，其中将声频信号分成多个频率分量包括对声频信号运用傅里叶变换。

17.如权利要求12所述的方法，其中将声频信号分成多个频率分量包括使声频信号通过一个带通滤波器阵列。

18.如权利要求13所述的方法，其中增强声频信号包括通过相应的增益因数，倍增多个声频信号的频率分量。

19.如权利要求12所述的方法，其中选择部分频率分量包括选择含有声频信号共振峰的频率分量。

20.如权利要求19所述的方法，其中选择含有声频信号共振峰的频率分量包括选择预定数量的含有共振峰的频率分量。

21.如权利要求1所述的方法，其包括从所选频率分量中选择声频信号的频率分量。

22.如权利要求1所述的方法，其中放大至少一部分声频信号包括利用由多个增益因数合成的增益因数进行的放大，所述多个增益因数包括根据比较确定的增益因数。

23.如权利要求1或22所述的方法，其包括在存在背景噪声的情况下发出放大信号。

24.如权利要求1所述的方法，其中声频信号的频率分量和噪声的频率分量跨越相同的频带。

25.如权利要求1所述的方法，其中声频信号的频率分量包括一个频率带。

26.如权利要求3所述的方法，其中增强因数包括历史依赖增益因数。

27.一种噪声补偿系统，其包括：

适合于接收声频信号的输入接口；

适合于发出增强声频信号的扬声器；

适合于收集背景噪声的话筒，背景噪声会干扰听众对增强信号的收听；以及

适合于将声频信号频率分量中声频信号的度量与相同频率分量中背景噪声的度量相比较的控制器，根据比较确定增益因数并利用所确定的增益因数放大至少一部分声频信号，包括至少一个不在频率分量中的频率段，以便提供增强的声频信号。

28.如权利要求27所述的系统，其中扬声器和话筒为电话听筒的一部分。

29.如权利要求27或28所述的系统，其包括一个回波消除器，可至少从背景噪声中消除一个增强声频信号的回波。

30.如权利要求29所述的系统，其中回波消除器仅从背景噪声中消除增强声频信号的单一回波。