CN101641735A - 估计通信系统中的噪声电平的方法 - Google Patents

估计通信系统中的噪声电平的方法 Download PDF

Info

Publication number
CN101641735A
CN101641735A CN200780051547A CN200780051547A CN101641735A CN 101641735 A CN101641735 A CN 101641735A CN 200780051547 A CN200780051547 A CN 200780051547A CN 200780051547 A CN200780051547 A CN 200780051547A CN 101641735 A CN101641735 A CN 101641735A
Authority
CN
China
Prior art keywords
data
signal
noise
conversion
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200780051547A
Other languages
English (en)
Other versions
CN101641735B (zh
Inventor
科恩·沃斯
卡斯滕·范德伯格·瑟恩森
约恩·伯根海姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Skype Ltd Ireland
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Skype Ltd Ireland filed Critical Skype Ltd Ireland
Publication of CN101641735A publication Critical patent/CN101641735A/zh
Application granted granted Critical
Publication of CN101641735B publication Critical patent/CN101641735B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Dc Digital Transmission (AREA)
  • Near-Field Transmission Systems (AREA)

Abstract

一种估计包括语音信息和噪声的数据中的噪声的方法,包括以下步骤:接收数据作为输入值序列;通过对输入值应用第一非线性映射来变换数据,其中,映射的导函数的大小随输入值大小的增加而减小,对经过变换的数据进行平滑;以及通过应用与第一非线性映射相反的第二非线性映射来对经过平滑变换的数据进行变换,以确定输入数据中的噪声的估计。

Description

估计通信系统中的噪声电平的方法
技术领域
本发明涉及通信系统。更具体地,本发明涉及一种估计通信系统中的噪声电平的方法和装置。
发明背景
在通信系统中提供了这样一种通信网络:该通信网络能够将两个通信终端连接在一起,从而这两个终端可以在呼叫或者其它通信事件中互相发送信息。该信息可包括语音、文本、图像或者视频。
现代通信系统基于数字信号的传输。将诸如由麦克风采集到的语音的模拟信息输入到一个终端的发送器处的模数转换器中,并将所述模拟信息转换成数字信号。然后,对该数字信号进行编码并置于数据包中,以通过信道传输到目的终端的接收器。
在输入语音的终端附近的背景噪声和数字信号中的语音信息被一起传输。这导致在目的终端处输出的语音信息受到与信号一起传输的噪声的影响而模糊不清。此外,信号中噪声的存在干扰了语音信号编码,导致可听见的编码失真增加或者传输速率增加。
人们已经尝试对信号进行滤波以减小输入到发送终端处的编码器中的噪声的强度。为了从输入到编码器中的信号中去除噪声,需要对噪声电平进行估计。
用于诸如移动设备的终端的低复杂性的噪声电平估计通常利用递归低通滤波器或者时间平均对频域输入信号进行平滑来估计噪声电平。
低通滤波器的一个示例是如等式1所示的一阶自回归滤波器:
y[n]=αy[n-1]+(1-α)x[n]    等式(1)
其中,y[n]是已滤波元素n的输出,x[n]是已滤波元素n的输入,而α是平滑系数,其值介于0和1之间。通过增加平滑系数α来获得平滑(smoothing)的增加。
低通滤波器的另一示例是相同的自回归滤波器的快速实施,如等式(2)所示:
y[n]=x[n]+α(y[n-1]-x[n]),    等式(2)
低复杂性的噪声电平估计技术具有低内存需求,非常适用于具有低计算能力和有限内存空间的装置。
但是,使用低通滤波器产生噪声电平估计的一个问题是,当输入信号由背景噪声和语音组成时,由于多个语音时段而引起的信号能量的增加导致偏高的噪声值估计。
在现有技术的方法中,当检测到语音存在时,通过调整噪声电平估计来减小这个问题。在现有技术的方法中,在检测到语音活动期间增加的平滑用于解决由于信号中的语音存在而引起的信号能量的增加。但是,由于多种原因,语音存在检测并不总是可靠的。当语音检测器最近刚刚被初始化时,可能没有足够的历史信息来可靠地把噪声和语音区别开。此外,语音和噪声电平可能会被混淆。这尤其出现在当语音的最初几帧具有的能量低而被误认为背景噪声时。此外,当噪声和/或语音电平随时间变化时,语音和噪声电平也可能会被混淆。当语音被误检测为噪声时,会导致偏高的噪声电平估计。另一方面,当噪声被误检测为语音时,噪声电平估计器将无法有效地利用可用信息,导致不太精确的估计。
因此,本发明的目的之一在于克服现有技术所呈现的问题。本发明的另一目的在于,在不使用具有大内存需求的复杂计算方法的情况下,提供一种提高输出信号的质量的方法。
发明内容
根据本发明的第一方案,提供了一种估计包括语音信息和噪声的数据中的噪声的方法,所述方法包括以下步骤:接收数据作为输入值序列;通过对输入值应用第一非线性映射来变换数据,其中,映射的导函数的大小随输入值大小的增加而减小;对经过变换的数据进行平滑;以及,通过应用与第一非线性映射相反的第二非线性映射来对经过平滑且经过变换的数据进行变换,以确定输入数据中的噪声的估计。
根据本发明的第二方案,提供了一种用于估计包括语音信息和噪声的数据中的噪声的噪声估计装置,所述装置包括:接收器件,其用于接收数据作为输入值序列;第一变换器件,其用于通过对输入值应用第一非线性映射来变换数据,其中,映射的导函数的大小随输入值大小的增加而减小;平滑器件,其用于对经过转换的数据进行平滑;以及,第二变换器件,其用于通过应用与第一非线性映射相反的第二非线性映射来对经过变换且经过平滑的数据进行变换,以确定输入数据中的噪声的估计。
根据本发明的第三方案,提供了一种用于估计包括语音信息和噪声的数据中的噪声的噪声估计装置,所述装置包括:接收器,其被设置为接收数据作为输入值序列;第一变换器,其被设置为通过对输入值应用第一非线性映射来变换数据,其中,映射的导函数的大小随输入值大小的增加而减小;平滑器,其被设置为对经过变换的数据进行平滑;以及,第二变换器,其被设置为通过应用与第一非线性映射相反的第二非线性映射来对经过变换且经过平滑的数据进行变换,以确定输入数据中的噪声的估计。
本发明的实施方式提供了多个优点。
根据本发明的实施方式提供的方法,对已经经过变换的信号进行平滑以确定噪声估计的一个优点是,当发生语音存在检测误差时,对输入信号值大的增加的敏感性减小导致噪声电平估计的较小偏差。这提高了噪声电平估计的精度,并允许将简单的语音检测方法用于本发明的实施方式。
在已知的噪声电平估计方法中,对高能量信号电平来说,需要改变滤波器中的平滑系数,以补偿语音检测误差。但是,在本发明的实施方式中,响应于语音存在的检测,降低了平滑系数需要改变的程度。这改善了对变化的噪声电平的追踪,并加快了噪声电平估计的初始收敛。
由于噪声电平估计的精度得到了提高,因此可在本发明中使用简单的递归滤波器,以获得否则只有更复杂的方法才可获得的结果。
由于可在本发明的实施方式中使用简单的低通滤波器和简单的语音检测方法,因此需要的计算复杂性也较小。
附图说明
为了更好地理解本发明以及表示本发明如何实施,下面将参考随后的附图对本发明的实施方式进行描述:
图1(a)所示的是具有大的突然的能量变化的信号的图表;
图1(b)所示的是经过低通滤波器滤波的具有大的突然的能量变化的信号的图表;
图1(c)所示的是当输入信号1(a)的值在通过低通滤波器对该信号进行滤波之前反转为倒数值并且之后再次反转时的具有大的突然的能量变化的信号的图表;
图2(a)所示的是具有小的突然的能量变化的信号的图表;
图2(b)所示的是经过低通滤波器滤波的具有小的突然的能量变化的信号的图表;
图2(c)所示的是当输入信号1(a)的值在通过低通滤波器对该信号进行滤波之前反转为倒数值并且之后再次反转时的具有小的突然的能量变化的信号的图表;
图3所示的是通信网络;
图4所示的是根据本发明的一个实施方式的发送终端;以及
图5所示的是根据本发明的一个可选实施方式的发送终端。
具体实施方式
首先参照图1,该图所示的是对具有大的突然的能量变化的信号随时间进行平滑的效果。图1(a)所示的是以分贝(dB)为测量单位的输入信号的能量电平。信号的能量电平显示为从0dB急剧增加到10dB并保持在该电平,直到信号的能量急剧减小到0dB。这样,输入信号可被视为包括信号增加到10dB的正步(positive step)和信号从10dB开始减小的负步(negative step)。
图1(b)所示的是当利用低通滤波器对输入信号1(a)进行滤波时的信号的能量电平。在本发明的一个优选实施方式中,该低通滤波器是递归滤波器。
如图所示,当通过低通滤波器对信号进行滤波时,与输入信号增加到10dB相比,经过滤波的信号更加缓慢地增加到10dB。如图1(b)所示,可以看到,与输入信号从10dB开始减小相比,经过滤波的信号更加缓慢地从10dB开始减小。
图1(c)所示的是当输入信号1(a)的值在通过低通滤波器对信号进行滤波之前反转为倒数值时的信号的能量电平。更具体地,图1(c)所示的是在对信号进行滤波反转所得到的值再次反转以逆转之前对该信号的反转操作的输出。
当平滑系数α为0.9时,图1(c)所示的图表还可由等式(3)表示:
y ( n ) = 1 / ( α y ( n - 1 ) + 1 - α x ( n ) ) 等式(3)
其中,x(n)是如图1(a)所示的输入信号的输入能量,并且其中,y(n)是如图1(c)所示的经过了再次反转以逆转之前对信号的反转操作的经过滤波的输出能量。
等式(3)表示三个连续步骤的组合:(i)如下列等式4所示的输入信号的反转,(ii)如等式5所示的平滑,以及(iii)如等式6所示的输出信号的反转。这三个步骤可用下面的算术形式进行描述:
v ( n ) = 1 x ( n ) 等式4
w(n)=αw(n-1)+(1-α)v(n)    等式5
y ( n ) = 1 w ( n ) 等式6
其中,v(n)是输入能量x(n)的倒数值,并且其中,w(n)是倒数值v(n)经过平滑的输出。将等式4和等式6带入等式5中得到等式3。
本发明的发明人已经发现,对于能量信号的强烈变化,当对输入信号的反转能量值执行滤波操作时,与图1(b)所示的未经过反转滤波的信号增加的速率相比,信号按10dB增加的速率明显地减小。但是,与未经过反转滤波的信号按10dB减小的速率相比,经过反转滤波的信号按10dB减小的速率增加。
例如,如图1(b)所示,未经过反转滤波的信号的输出值沿输入值的正步比输出值沿负步快。相反地,如图1(c)所示,经过反转滤波的信号的输出值沿输入值的负步比输出值沿负步快。因此,经过反转滤波的信号的输出值对输入信号值的大的增加较不敏感。这是由于Jensen(延森)不等式而引起的,该不等式是一种公知的数学定理,在此将不做进一步的描述。
现在参照图2。图2示出了对具有小的突然的能量变化的信号随时间进行平滑的效果。图2(a)示出了最大增加到1dB的输入信号。图2(b)所示的是从低通滤波器输出的信号,其中在滤波之前不对经过滤波的值进行反转。图2(c)所示的是从低通滤波器输出的信号,其中在滤波之前对经过滤波的值进行反转。如图2(b)和图2(c)所示,与高能量信号相比,输出值沿低能量输入信号的正步和负步时的速率之间的差要小得多。此外,如图2(c)所示的经过滤波反转的信号可由上述等式(3)表示。
图1(b)和图1(c)分别表示对于输入信号中大的能量变化,经过滤波未反转的信号的输出和经过滤波反转的信号的输出,将这两个附图进行比较,发明人已经确定出,经过反转滤波的信号的输出值沿输入值的正变化比未经过反转滤波的信号的输出值沿输入信号的变化慢。因此,经过滤波反转的信号的输出对大的正能量变化较不敏感。
相反地,图2(b)和图2(c)分别表示对于小的能量变化,经过滤波未反转的信号的输出和经过滤波反转的信号的输出,将这两个附图进行比较,发明人已经确定出,经过反转滤波的信号的输出值沿输入信号的变化的速率与未经过反转滤波的信号的输出值沿输入信号的变化的速率相同。因此,对于小的能量变化,经过滤波反转的信号的输出与经过滤波未反转的信号的输出具有相同的敏感性。
此外,发明人已经发现,具有随输入值大小增加而大小减小的导函数的任何非线性映射都可用于在对信号进行平滑之前对该信号进行反转或者变换。
根据本发明的实施方式,根据对经过反转的输入信号进行平滑来确定噪声估计。下面将对本发明的实施方式可以实施的方式进行描述。
现在将参照图3,图3所示的是本发明的一个实施方式中使用的通信网络104。通信网络104可以是由因特网提供的VoIP(因特网协议上的语音技术)网络。应当意识到的是,即使在此显示和更详细描述的示例性的通信系统使用了VoIP网络的术语,本发明的实施方式也可用于有助于数据传输的任何其它合适的通信系统。例如,本发明可用于移动通信网络,例如GSM、UMTS和CDMA网络。
图3所示的是连接网络104的源终端100和目的终端112。该源终端被设置为经由通信网络104将数据传输到目的终端112。
终端100和112可以是,例如,个人计算机、游戏设备、个人数字助理、适当激活的移动电话、电视或者能够连接到网络104的其它设备。
图4所示的是根据本发明的一个实施方式的源终端100。该源终端具有发送电路10,发送电路10用于经由网络104将信号发送到目的终端。
发送电路10包括模数转换器38、噪声电平估计器块34和编码器14。模数字转换器38接收来自麦克风32的语音输入,并将该信号转换为数字信号。从模数转换器14输出的数字信号s(n)由具有背景噪声的语音的数字采样组成。
将从模数转换器输出的数字信号s(n)输入到噪声电平估计器块34中的语音存在检测块22中。语音存在检测块22判定输入信号s(n)中是否存在语音信息。语音电平存在检测块22向设置在噪声电平估计器块34中的滤波器块26输出是否存在语音的指示。该语音存在指示可以是二进制信号(存在或者不存在语音)或者是概率信号(语音存在的可能性的指示)。语音存在检测块判定是否存在语音的方式在本领域中是已知的,这里将不再对此做进一步的描述。
还将从模数转换器38输出的数字信号s(n)输入到变换块16中。变换块16将输入信号s(n)转换为变换域信号。该变换可以是实施为例如快速傅立叶变换、离散余弦变换、滤波器组变换或者例如Karhunen Loève变换的任何其它变换的频率变换。
将变换域信号输入到噪声电平估计器块34中的能量块18中。能量块18将从变换块16输出的变换域信号转换为正信号。这可以通过例如计算每个变换域采样的能量来实现以产生功率谱。
然后,将从能量块18输出的功率谱输入到第一非线性函数块24中,第一非线性函数块24将非线性函数应用在功率谱上。随着功率谱的大小增加,块24中应用的非线性函数的导数的大小减小。等式7是这样一种非线性函数的一个示例:
f(x)=(x+b)-1    等式(7)
其中,偏差b与输入功率谱值相加,将得到的有偏输入功率谱变换为其倒数值。使功率谱与偏差相加确保了正在变换为其倒数值的值总是大于0。确保信号总是大于0避免了等式7中除数为0的情况。增加偏差还降低了噪声电平估计器对极小输入信号的敏感性。
等式8是具有值随输入值增加而减小的导数的函数的另一示例:
f(x)=log(x+b)    等式(8)
其中,偏差b与输入功率谱相加,将得到的有偏输入功率谱变换为其对数值。使功率谱与偏差相加确保了正在变换为其对数值的值总是大于0。确保信号总是大于0避免了等式8中对0取对数的情况。增加偏差还降低了噪声电平估计器对极小输入信号的敏感性。
等式7和等式8是具有大小随输入大小增加而减小的导数的非线性函数的示例。根据本发明的实施方式,非线性函数块24可应用具有大小随输入大小增加而减小的导数的任何非线性函数。
在本发明一个实施方式中,非线性函数块24可将等式7和等式8中不同的偏差值b应用于功率谱的不同频段。
从非线性函数块24输出的经过变换的功率谱将称为反向功率谱。
将反向功率谱输入到滤波器块26中。如前所述,滤波器块26还接收来自语音存在检测块22的输入,语音存在检测块22指示信号中是否存在语音。在滤波器块26中,反向功率谱的每个频段都经过了时间滤波。
滤波器块26可应用对输入信号随时间进行平滑的任何平滑操作。在一个优选实施方式中,可通过低通滤波器来执行平滑操作。在本发明的一个可选实施方式中,通过时间平均来执行平滑操作。
在本发明的一个实施方式中,平滑操作可应用时间重采样(resampling),其中,滤波器块26的输出的采样速率与滤波器块26的输入的采样速率不同。
在本发明的一个实施方式中,滤波器块26应用的滤波可通过递归滤波器来实施:
y(t,k)=αy(t-1,k)+(1-α)x(t,k)    等式9
其中,x(t,k)是频段k在时间t时的滤波器输入,y(t,k)是频段k在时间t时的滤波器输出,α是该滤波器的平滑系数。
滤波器块26由语音存在指示来控制,使得当存在或者很可能存在语音时由滤波器应用的平滑的量增加。这样,当存在语音时,噪声估计的敏感性下降。在本发明的一个实施方式中,当语音存在检测块指示不存在语音时,平滑系数α设定为0.99。当语音存在检测块指示存在语音时,滤波器块26将平滑系数α增加到1。
将平滑系数增加到1保持了指示语音存在期间的噪声电平估计的恒定。如等式10所示,当α为1时,等式9变为:
y(t,k)=y(t-1,k)    等式10
将滤波器块26的输出输入到第二非线性函数块28中。在第二非线性函数块处,将反向功率谱映射回到功率谱域中。第二非线性函数28被设置为应用与第一非线性函数24对信号应用的变换相反的变换。
例如,如果由非线性函数块24应用的第一变换根据等式7将输入映射到其有偏乘法逆元素,则由非线性函数28应用的第二变换将根据等式11将滤波器块的输出映射到其无偏乘法逆元素:
f(x)=x-1-b    等式(11)
其中,b是与第一非线性函数块24中应用的偏差的值相同的偏差。
类似地,如果第一变换是根据等式8的有偏对数映射,则第二变换是根据等式12的负偏差之后的指数映射:
f(x)=exp(x)-b    等式(12)
其中,b是与第一非线性函数块24中应用的偏差的值相同的偏差。
此外,如果第一非线性函数块24在滤波之前将输入映射到其反正切(arctangent),则第二非线性函数块28会将滤波器块的输出映射到滤波器块26的输出的正切。
从第二非线性函数28输出的信号是变换频段k中在时间t时的噪声电平估计信号R(t,k)。
将噪声电平估计信号R(t,k)输入到计算衰减增益(CAG)块40中。CAG块40还接收来自能量块18的功率谱E(t,k)。CAG块40通过比较从能量块18输出的功率谱E(t,k)的每个频段的能量和噪声电平估计信号R(t,k)的每个频段的能量来计算噪声降低增益。该增益可通过等式12来计算:
G ( t , k ) = max ( 1 - R ( t , k ) E ( t , k ) , 0 ) 等式(13)
其中,G(t,k)是变换频段k在时间t时的衰减增益。由于噪声估计信号R(t,k)和功率谱信号E(t,k)总是为正,因此保证了衰减增益G(t,k)在0和1之间。
当功率谱信号E(t,k)的频段能量与估计出的噪声电平信号R(t,k)的频段能量相类似时,衰减增益将接近于0。相反地,当功率谱信号E(t,k)的频段能量比噪声电平估计信号R(t,k)的频段能量大得多时,衰减增益将接近于1。将在CAG块40处计算出的每个频段的噪声降低增益G(t,k)输出到应用增益块42。
将从变换块16输出的变换域信号输入到应用增益块42。在应用增益块42处,将由CAG块40计算出的每个频段的增益应用于变换域信号的每个频段。通过将变换域信号的每个频段与相应的增益相乘来应用该增益。
将信号从应用增益块42输出到反向变换块44,在反向变换块44处,用反向变换将该信号变换回到时域信号。由反向变换块44应用的反向变换使得,由变换块16、应用增益块42应用的变换以及由反向变换块44应用的反向变换的序列主要再现输入到变换块16中的信号,所述信号具有时间延迟并通过噪声电平估计器块34校正噪声。反向变换的示例有反向快速傅立叶变换、反向离散余弦变换、滤波器组变换和转置Karhunen Loève变换。
然后,将从反向变换块输出的时域信号输入到编码器14中,在编码器14处根据编码模式对该信号进行编码。然后,经由通信网络104将编码的信号传输到目的终端112。
图5所示的是根据本发明的一个可选实施方式的源终端100。与图4中相关描述的组成部分在图5中使用相同的附图标记来表示。
根据图5所示的实施方式,在滤波器块26’中对信号的功率谱的每个频段进行独立地平滑。在本发明的该实施方式中,在通过能量块18将信号转换为功率谱之后,将该信号输入到语音存在检测块22’中。这允许语音存在检测块22’对功率谱的每个频段判定语音存在。然后,该语音存在检测块向滤波器块26’输出对于功率谱的每个频率的语音电平指示信号。
根据由语音存在检测块指示的每个频率上的语音存在,滤波器块26’对反向功率谱的每个频率进行滤波。因此,如果在信号的一个频段上而非在另一频段上检测到语音,则与在其上检测到语音的频段相比,对在其上未检测到语音的频段可使用较小的平滑系数。
在本发明的一个可选实施方式中,噪声电平估计块可被设置在目的终端112的接收电路中。
在本发明的一个可选实施方式中,可在信号处理系统中实施本发明,该信号处理系统不涉及经由通信网络向目的终端传输数据。例如,如在公共广播系统(Public Address system)中使用的,上述发送电路可用于直接向扬声器输出信号。可选择地,如在听写机器和音乐记录设备中使用的,输出可被记录在数字或者模拟记录介质上,以在随后进行播放。
在本发明的实施方式中,噪声电平估计器块的组成部分可在终端中实施为硬件,或者实施为运行在终端中的处理器上的软件。这是实施问题。
虽然已经结合优选实施方式对本发明进行了具体地表示和描述,但是,本领域技术人员应当理解的是,在不脱离权利要求书限定的本发明的范围的情况下可以进行形式和细节的各种变化。特别地,当非线性函数块24描述为应用具有大小随输入大小增加而减小的导数的非线性函数时,应当意识到的是,这包括具有大小通常随输入大小增加而减小的导数的任何非线性函数,在输入值序列从最小到最大的期间,该导数从较大值改变为较小值,但是事实上,在输入值序列内可能存在某些值不遵循这种模式。

Claims (19)

1、一种估计包括语音信息和噪声的数据中的噪声的方法,包括以下步骤:
接收数据作为输入值序列;
通过对输入值应用第一非线性映射来变换数据,其中,映射的导函数的大小随输入值大小的增加而减小;
对经过变换的数据进行平滑;以及
通过应用与第一非线性映射相反的第二非线性映射来对经过变换且经过平滑的数据进行变换,以确定输入数据中的噪声的估计。
2、如权利要求1所述的方法,其中,通过低通滤波器来对经过变换的数据进行平滑。
3、如权利要求1所述的方法,其中,通过时间平均来对经过变换的数据进行平滑。
4、如前述任一项权利要求所述的方法,其中,所述平滑步骤使用平滑系数。
5、如前述任一项权利要求所述的方法,其中,数据被设置在包括多个频段的信号中。
6、如权利要求4所述的方法,还包括以下步骤:检测数据中语音信息存在的指示,并且,当检测到语音存在的指示时,增加平滑步骤中应用的平滑。
7、如权利要求6所述的方法,其中,在语音存在的检测期间应用的平滑是恒定的。
8、如权利要求6或者7所述的方法,其中,通过增加平滑系数来增加平滑。
9、如权利要求8所述的方法,其中,所述平滑系数为增加到1的值。
10、如权利要求4和5所述的方法,所述方法还包括以下步骤:
对信号的每个频段应用平滑系数,
对信号的每个频段检测语音存在的指示;以及
如果在信号的某个频段中检测到语音存在的指示,则增加应用于所述频段的平滑系数。
11、如前述任一项权利要求所述的方法,其中,所应用的第一非线性映射为对数映射。
12、如权利要求11所述的方法,其中,所应用的第二非线性映射为指数映射。
13、如权利要求1到10所述的方法,其中,第一和第二非线性映射将数据映射到其乘法逆元素。
14、如前述任一项权利要求所述的方法,其中,通过应用第一非线性映射来变换信号的步骤、平滑经过变换的信号的步骤以及通过应用第二非线性映射来变换经过平滑的信号的步骤由下面等式表示:
y ( n ) = 1 / ( α y ( n - 1 ) + 1 - α x ( n ) )
其中x(n)是数据序列的输入值,其中y(n)是噪音估计值,并且其中α是平滑系数。
15、一种用于估计包括语音信息和噪声的数据中的噪声的噪声估计装置,包括:
接收器件,其用于接收数据作为输入值序列;
第一变换器件,其用于通过对输入值应用第一非线性映射来变换数据,其中,映射的导函数的大小随输入值大小的增加而减小;
平滑器件,其用于对经过变换的数据进行平滑;以及
第二变换器件,其用于通过应用与第一非线性映射相反的第二非线性映射来对经过变换且经过平滑的数据进行变换,以确定输入数据中的噪声的估计。
16、如权利要求15所述的装置,还包括用于将数据变换为包括多个频段的频域信号的器件。
17、如权利要求16所述的装置,还包括用于检测语音存在的语音检测器件。
18、如权利要求17所述的装置,其中,所述语音检测器件被设置为对信号的每个频段检测语音存在的指示;并且其中
所述平滑器件被设置为对信号的每个频段进行平滑,由此,应用于检测到语音存在的信号的频段的平滑比应用于未检测到语音存在的信号的频段的平滑大。
19、一种用于估计包括语音信息和噪声的数据中的噪声的噪声估计装置,包括:
接收器,其被设置为接收数据作为输入值序列;
第一变换器,其被设置为通过对输入值应用第一非线性映射来变换数据,其中,映射的导函数的大小随输入值大小的增加而减小;
平滑器,其被设置为对经过变换的数据进行平滑;以及
第二变换器,其被设置为通过应用与第一非线性映射相反的第二非线性映射来对经过变换且经过平滑的数据进行变换,以确定输入数据中的噪声的估计。
CN2007800515472A 2007-02-20 2007-12-20 估计通信系统中的噪声电平的方法 Expired - Fee Related CN101641735B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB0703275.8A GB0703275D0 (en) 2007-02-20 2007-02-20 Method of estimating noise levels in a communication system
GB0703275.8 2007-02-20
PCT/IB2007/004498 WO2008102207A2 (en) 2007-02-20 2007-12-20 Method of estimating noise levels in a communication system

Publications (2)

Publication Number Publication Date
CN101641735A true CN101641735A (zh) 2010-02-03
CN101641735B CN101641735B (zh) 2012-01-25

Family

ID=37908947

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800515472A Expired - Fee Related CN101641735B (zh) 2007-02-20 2007-12-20 估计通信系统中的噪声电平的方法

Country Status (10)

Country Link
US (1) US8838444B2 (zh)
EP (1) EP2132734B1 (zh)
JP (1) JP4927957B2 (zh)
CN (1) CN101641735B (zh)
AT (1) ATE498887T1 (zh)
BR (1) BRPI0721316A2 (zh)
CA (1) CA2679476C (zh)
DE (1) DE602007012596D1 (zh)
GB (1) GB0703275D0 (zh)
WO (1) WO2008102207A2 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5229234B2 (ja) 2007-12-18 2013-07-03 富士通株式会社 非音声区間検出方法及び非音声区間検出装置
GB0919672D0 (en) 2009-11-10 2009-12-23 Skype Ltd Noise suppression
US9589580B2 (en) 2011-03-14 2017-03-07 Cochlear Limited Sound processing based on a confidence measure
JP5732976B2 (ja) * 2011-03-31 2015-06-10 沖電気工業株式会社 音声区間判定装置、音声区間判定方法、及びプログラム
JP6201043B2 (ja) 2013-06-21 2017-09-20 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. エラー封じ込め中の切替音声符号化システムについての向上した信号フェードアウトのための装置及び方法
US20170365255A1 (en) 2016-06-15 2017-12-21 Adam Kupryjanow Far field automatic speech recognition pre-processing
US10104464B2 (en) 2016-08-25 2018-10-16 Bragi GmbH Wireless earpiece and smart glasses system and method
US10200780B2 (en) 2016-08-29 2019-02-05 Bragi GmbH Method and apparatus for conveying battery life of wireless earpiece
US11490858B2 (en) 2016-08-31 2022-11-08 Bragi GmbH Disposable sensor array wearable device sleeve system and method
EP3573058B1 (en) * 2018-05-23 2021-02-24 Harman Becker Automotive Systems GmbH Dry sound and ambient sound separation

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2897628B2 (ja) * 1993-12-24 1999-05-31 三菱電機株式会社 音声検出器
JPH07193548A (ja) * 1993-12-25 1995-07-28 Sony Corp 雑音低減処理方法
EP1071081B1 (en) * 1996-11-07 2002-05-08 Matsushita Electric Industrial Co., Ltd. Vector quantization codebook generation method
FR2768544B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de detection d'activite vocale
US6826528B1 (en) * 1998-09-09 2004-11-30 Sony Corporation Weighted frequency-channel background noise suppressor
US6718301B1 (en) * 1998-11-11 2004-04-06 Starkey Laboratories, Inc. System for measuring speech content in sound
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
DE19948308C2 (de) * 1999-10-06 2002-05-08 Cortologic Ag Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung
US20020041678A1 (en) * 2000-08-18 2002-04-11 Filiz Basburg-Ertem Method and apparatus for integrated echo cancellation and noise reduction for fixed subscriber terminals
US6873732B2 (en) * 2001-07-09 2005-03-29 Xerox Corporation Method and apparatus for resolving perspective distortion in a document image and for calculating line sums in images
US20030187637A1 (en) * 2002-03-29 2003-10-02 At&T Automatic feature compensation based on decomposition of speech and noise
US7242762B2 (en) * 2002-06-24 2007-07-10 Freescale Semiconductor, Inc. Monitoring and control of an adaptive filter in a communication system
KR20040044217A (ko) * 2002-11-19 2004-05-28 주식회사 인티스 디지털 통신의 음성 품질 향상 장치 및 방법
WO2005009019A2 (en) 2003-07-16 2005-01-27 Skype Limited Peer-to-peer telephone system and method
TWI233590B (en) * 2003-09-26 2005-06-01 Ind Tech Res Inst Energy feature extraction method for noisy speech recognition
EP1676261A1 (en) * 2003-10-16 2006-07-05 Koninklijke Philips Electronics N.V. Voice activity detection with adaptive noise floor tracking
CN1322488C (zh) * 2004-04-14 2007-06-20 华为技术有限公司 一种语音增强的方法
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression
US7496138B2 (en) * 2004-11-08 2009-02-24 Interdigital Technology Corporation Method and apparatus for estimating the step-size of an adaptive equalizer
EP2104451A4 (en) * 2006-01-25 2010-01-06 Pipex Inc DROPLET COLLECTION DEVICES AND METHODS FOR DETECTING AND CONTROLLING AIR-TRANSMISSIBLE DISEASES USING AN RFID
US20090012786A1 (en) * 2007-07-06 2009-01-08 Texas Instruments Incorporated Adaptive Noise Cancellation

Also Published As

Publication number Publication date
WO2008102207A2 (en) 2008-08-28
EP2132734A2 (en) 2009-12-16
CN101641735B (zh) 2012-01-25
WO2008102207A3 (en) 2008-10-30
GB0703275D0 (en) 2007-03-28
BRPI0721316A2 (pt) 2014-02-18
ATE498887T1 (de) 2011-03-15
JP4927957B2 (ja) 2012-05-09
EP2132734B1 (en) 2011-02-16
JP2010519583A (ja) 2010-06-03
US20080201137A1 (en) 2008-08-21
DE602007012596D1 (de) 2011-03-31
US8838444B2 (en) 2014-09-16
CA2679476A1 (en) 2008-08-28
CA2679476C (en) 2015-11-24

Similar Documents

Publication Publication Date Title
CN101641735B (zh) 估计通信系统中的噪声电平的方法
CN101719969B (zh) 判断双端对话的方法、系统以及消除回声的方法和系统
CN1727860B (zh) 语音噪音抑制方法和语音噪音抑制器
CN111048119B (zh) 通话音频混音处理方法、装置、存储介质和计算机设备
CN101027719B (zh) 噪声抑制装置
US6324502B1 (en) Noisy speech autoregression parameter enhancement method and apparatus
US8010355B2 (en) Low complexity noise reduction method
CN101826892B (zh) 回声消除器
US20050108004A1 (en) Voice activity detector based on spectral flatness of input signal
CN111149370B (zh) 会议系统中的啸叫检测
US8270633B2 (en) Noise suppressing apparatus
JP4660578B2 (ja) 信号補正装置
CN101141533B (zh) 用于提供具有扩展带宽的声音信号的方法和系统
CN1354873A (zh) 利用固定滤波器通过时域频谱减法减少信号噪声
CN103270740A (zh) 声音控制装置、声音控制方法、声音控制程序以及移动终端装置
CN101421780A (zh) 音频编码和解码中的激励处理
CN113744748B (zh) 一种网络模型的训练方法、回声消除方法及设备
CN104981870A (zh) 声音增强装置
CN114530160A (zh) 模型训练方法、回声消除方法、系统、设备及存储介质
JP4542790B2 (ja) ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置
EP1278185A2 (en) Method for improving noise reduction in speech transmission
CN1122971C (zh) 通信终端、抑制干扰信号的干扰抑制装置及其方法
US7260526B2 (en) Method of filtering noise of source digital data
JP3255077B2 (ja) 電話機
KR0171004B1 (ko) Samdf를 이용한 기본 주파수와 제1포만트의 비율 측정방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: SKYPE LTD.

Free format text: FORMER NAME: SKYPER LTD.

CP01 Change in the name or title of a patent holder

Address after: Dublin, Ireland

Patentee after: SKYPE Ltd.

Address before: Dublin, Ireland

Patentee before: Skype Ltd.

TR01 Transfer of patent right

Effective date of registration: 20200511

Address after: Washington State

Patentee after: MICROSOFT TECHNOLOGY LICENSING, LLC

Address before: Ai Erlandubailin

Patentee before: SKYPE Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120125

CF01 Termination of patent right due to non-payment of annual fee