CN100512038C - 用于回波抵消器的噪声匹配 - Google Patents
用于回波抵消器的噪声匹配 Download PDFInfo
- Publication number
- CN100512038C CN100512038C CNB2003101183660A CN200310118366A CN100512038C CN 100512038 C CN100512038 C CN 100512038C CN B2003101183660 A CNB2003101183660 A CN B2003101183660A CN 200310118366 A CN200310118366 A CN 200310118366A CN 100512038 C CN100512038 C CN 100512038C
- Authority
- CN
- China
- Prior art keywords
- adaptive
- noise
- background
- valuation
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000003044 adaptive effect Effects 0.000 claims abstract description 89
- 238000000034 method Methods 0.000 claims description 31
- 230000006978 adaptation Effects 0.000 claims description 21
- 230000007774 longterm Effects 0.000 claims description 16
- 238000013139 quantization Methods 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 8
- 230000006835 compression Effects 0.000 claims description 8
- 238000007906 compression Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 3
- 230000008676 import Effects 0.000 claims 2
- 230000013011 mating Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 28
- 230000008569 process Effects 0.000 description 19
- 238000005516 engineering process Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000006837 decompression Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 239000004576 sand Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B3/00—Line transmission systems
- H04B3/02—Details
- H04B3/20—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
- H04B3/23—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明的一个实施例包括自适应预测器、系统白噪声发生器、和背景噪声估值器。该自适应预测器估值在回波抵消器中作为背景样本的背景噪声的自回归(AR)模型的自适应权重。该自适应预测器生成自适应误差。该系统白噪声发生器通过使用该自适应误差生成白噪声。背景噪声估值器通过使用该白噪声和该估值的自适应权重来估值背景噪声。
Description
技术领域
本发明的实施例涉及通信领域,更具体地,涉及回波抵消。
背景技术
回声是在语音处理设备(诸如电话网和无线手机)的设计中的固有问题。回波抵消是一种通过估值在发送端、在话筒或线路上拾取的回波以及在接收端从耳机或免提扬声器中减去该回波从而减小话音传输中的回波量的技术。由于环境的精确模型是未知的和时变的,故自适应技术通常被使用来估值回波。
当发送的输入语音数据中的远端信号被抵消到低于某个门限电平时,残余回波被非线性处理器减小。由于多种原因,这种抵消通常是不完美的。首先,没有足够的训练时间用于适配。第二,远端残余回波至多可以被抵消到背景噪声电平。通常,非线性处理器通过不产生输出信号而去除这种远端残余回波以及背景噪声。这些空的时段让人耳听起来很不自然。
附图说明
通过参照以下说明和被使用来图示本发明的实施例的附图,可以最好地理解本发明。在这些图中:
图1是图示在其中可以实施本发明的一个实施例的系统的图。
图2是图示按照本发明的一个实施例的噪声匹配器的图。
图3是图示按照本发明的一个实施例的、如图2所示的背景噪声建模器的图。
图4是图示按照本发明的一个实施例的、如图2所示的自适应预测器的图。
图5是图示按照本发明的一个实施例的、如图2所示的系统AR模型白噪声发生器的图。
图6是图示按照本发明的一个实施例的、如图2所示的背景噪声估值器的图。
图7是图示按照本发明的一个实施例的、生成背景噪声的过程的流程图。
图8是图示按照本发明的一个实施例的非线性处理器的特性的图。
图9是图示按照本发明的一个实施例的近端输入波形的图。
图10是图示按照本发明的一个实施例的远端输入波形的图。
图11是图示按照本发明的一个实施例的输出误差波形的图。
图12是图示按照本发明的一个实施例的自适应预测器的转移函数的绝对值的图。
图13是图示按照本发明的一个实施例的自适应预测器的零点的绝对值的图。
图14是图示按照本发明的一个实施例的、白噪声功率波形的估值的图。
具体实施方式
本发明的一个实施例包括自适应预测器、系统白噪声发生器、和背景噪声估值器。自适应预测器估值在回波抵消器中用作背景样本的背景噪声的自回归(AR)模型的自适应权重。自适应预测器生成自适应误差。系统白噪声发生器通过使用该自适应误差生成白噪声。背景噪声估值器通过使用该白噪声和该估值的自适应权重来估值背景噪声。
在下面的说明中,阐述了多个具体细节。然而,应当明白,本发明的实施例可以不用这些具体细节来实施。在其它实例中公知的电路、结构和技术没有被示出,以免遮蔽对本说明的理解。
本发明的一个实施例的单元可以用硬件、固件、软件或它们的任何组合来实现。当用软件来实现时,本发明的实施例的这些单元实质上是执行必要任务的代码段。该软件可以包括执行在本发明一个实施例中描述的那些操作的实际代码,即仿真或模拟那些操作的代码。这些程序或代码段可以被存储在处理器或机器可存取的媒体中,或者通过以载波体现的计算机数据信号或由载波调制的信号经由传输媒体被发送。“处理器可读的或可存取的媒体”或“机器可读的或可存取的媒体”可以包括任何能够存储、发送、或传送信息的媒体。处理器可读的媒体的例子包括电子电路、半导体存储器件、只读存储器(ROM)、快速存储器、可擦除ROM(EROM)、软盘、压密盘(CD)ROM、光盘、硬盘、光纤媒体、射频(RF)链路等等。计算机数据信号可包括能够通过传输媒体(诸如,电子网络信道、光纤、空中、电磁波、RF链路等等)传播的任何信号。这些代码段可以通过计算机网络(诸如互联网,内部网等等)被下载。机器可存取的媒体可以实现为制造的产品。机器可存取的媒体可以包括当其被机器存取时,使得该机器执行下面描述的操作的数据。术语“数据”在这里是指为了机器可读的目的而被编码的任何类型的信息。所以,它可以包括程序、代码、数据、文件等等。
本发明的实施例的全部或一部分可以用软件来实现。该软件可以具有互相联系的几个模块。一个软件模块与另一个模块相联系,以便接收变量、参量、变元、指示字等等,和/或产生或传送结果、更新的变量、指示字等等。软件模块也可以是软件驱动程序或接口,以便与在该平台上运行的操作系统交互作用。软件模块也可以是硬件驱动器,以便用来配置、建立、初始化、发送和接收去往和来自硬件装置的数据。
本发明的一个实施例可被描述为一个过程,该过程通常被描绘为流程图、操作程序图、结构图、或方框图。虽然流程图可以把这些操作描述为一个顺序的过程,但许多操作能够并行地或同时地执行。另外,这些操作的次序可被重新安排。当一个过程的操作完成时,该过程被终结。一个过程可相应于一个方法、一个程序、一个规程等等。
图1是图示在其中可实施本发明的一个实施例的系统100的图。系统100包括发送输入译码器110、回波信道120、发送输出编码器130、接收输入译码器140、接收输出编码器150、网络145、发送输入译码器160、回波信道170、发送输出编码器180、接收输入译码器190、和接收输出编码器195。
发送输入译码器110接收来自第一近端的编码的语音,以及把该编码的语音译码成线性语音数据Sin。在一个实施例中,发送输入译码器110是μ-律/A-律译码器。回波信道120包括回波抵消器125和噪声匹配器127。回波抵消器125去除来自线性数据样本Sin的回波估值信号,以生成线性数据样本Sout。当非线性处理器抵消该回波时,噪声匹配器127提供背景噪声到回波抵消器125。发送输出编码器130在分组化之前提供语音压缩。在一个实施例中,发送输出编码器130是G.7xx编码器,它通过使用任何一个用于低比特速率话音(LBRV)的压缩标准(包括国际电信联盟(ITU)-T国际标准化的G.7xx系列)对来自回波信道120的语音数据Sout进行压缩。该压缩的语音数据经由网络被发送到远端。接收输入译码器140解压缩通过网络145从第一远端接收到的语音数据。该解压缩技术与在发送输出编码器130中使用的压缩相一致。回波信道120接收来自接收输入译码器140的Rin,以及发送出Rout线性数据样本。接收输出编码器150把线性数据样本Rout编码成μ-律和A-律编码的语音,以便被发送出到第一近端。
网络145是有能力发送分组化数据的任何网络,其中所述分组化数据来自和去往该发送输出译码器130、发送输入译码器160、接收输入译码器140、和接收输出编码器195。网络145可以是互联网、内联网、外联网、局域网(LAN)、或广域网(WAN)。发送输入译码器160接收来自网络145的编码的语音,以及把该编码的语音译码成线性语音数据Sin。在一个实施例中,发送输入译码器160是μ-律/A-律译码器。回波信道170包括回波抵消器175和噪声匹配器177。回波抵消器175去除来自线性数据样本Sin的回波估值信号,以生成线性数据样本Sout。噪声匹配器177实质上是与噪声匹配器127相同的。在下文中,噪声匹配器127的说明可应用于噪声匹配器177。发送输出编码器180在分组化之前提供语音压缩。在一个实施例中,发送输出编码器180是G.7xx编码器,它通过使用任何一个用于低比特速率话音(LBRV)的压缩标准(包括国际电信联盟(ITU)-T国际标准化的G.7xx系列)对来自回波信道170的语音数据Sout进行压缩。该压缩的语音数据被发送到第二远端处的接收设备。接收输入译码器190解压缩从第二远端接收到的语音数据。该解压缩技术与在发送输出编码器180中使用的压缩相一致。回波信道170接收来自接收输入译码器190的Rin,以及发送出Rout线性数据样本。接收输出编码器195把线性数据样本Rout编码成μ-律/A-律编码的语音,以便被向外发送到第二近端到网络145。在一个实施例中,发送输入译码器160、回波信道170、发送输出编码器180、接收输入译码器190、接收输出编码器195被集成为数字信号处理器165。
图2是图示按照本发明的一个实施例的噪声匹配器127的图。噪声匹配器127包括背景噪声建模器210、自适应预测器220、系统AR模型白噪声发生器230、和背景噪声估值器240。背景噪声建模器210从输入样本Sin生成背景样本bg(k)。自适应预测器220从背景样本bg(k)估值背景噪声的自回归(AR)的自适应权重。自适应预测器220生成自适应误差e(k)和自适应权重矢量W。自适应权重矢量W包括该预测器的自适应权重wi。系统AR模型白噪声发生器230通过使用自适应误差e(k)和背景样本bg(k)来生成白噪声。背景噪声估值器240通过使用该白噪声和该估值的自适应权重W来估值背景噪声。
该技术的基本理论是:如果背景噪声的估值的AR模型用与预测误差功率相同的功率的白噪声来驱动,则这个系统的输出是一个随机过程的样本函数,其中该随机过程的频谱是所述背景噪声的功率谱的相当好的估值。所以,这个输出应当听起来就象是真实的背景噪声那样。
图3是图示按照本发明的一个实施例的、如图2所示的背景噪声建模器210的图。背景噪声建模器210包括短期功率估值器310、长期功率估值器320、和门限器(thresholder)330。
短期和长期功率估值器310和320估值在远端输入数据Sin中的输入样本x(n)的短期和长期功率。令pS和pL分别是短期和长期功率。pS和pL的计算可以如下地实行:
x1(k)=x(k)2 (1)
如果x1(k)>pS(k):pS(k)=(1-γr)x1(k)+γrpS(k-1) (2)
否则pS(k)=(1-γf)x1(k)+γfpS(k-1) (3)
如果pS(k)<βpL(k-1):pL(k)=(1-α)x1(k)+αpL(k-1) (4)
否则pL(k)=pL(k-1) (5)
其中γr和γf分别是用于增加和减小输入功率的时间常数;β是用于功率测量的门限;α是用于长期功率估值的时间常数。在一个实施例中,γr=1-1/24以及γf=1-1/240;β=4;以及α=1-1/24000。
门限器330响应于短期功率小于该长期功率的指示符,而生成背景样本。长期功率pL的指示符是长期功率的倍数,诸如kpL,其中k是正整数。在一个实施例中,k=2。当输入样本Sin不可能包含背景噪声时,背景样本bg(k)等于零,或某个标志值。输入样本Sin很可能包含背景噪声的情况是在短期功率pS>kpL时。换句话说:
如果pS<kpL时,bg(k)=x(k) (6)
否则bg(k)=0
背景样本bg(k)然后被转发到自适应预测器220和系统AR模型白噪声发生器230。
图4是图示按照本发明的一个实施例的、如图2所示的自适应预测器220的图。自适应预测器220包括矢量化器410、权重更新器420、和误差估值器430。
矢量化器410把背景样本bg(k)延迟P个样本延时,以及把该延迟的样本进行矢量化,以形成矢量u(k)。在一个实施例中,P=1,即:矢量化器410是单位延迟。矢量化器410可以用同步器、触发器、移位寄存器、存储器单元、或任何其他适当的数据结构来实现。
权重更新器420通过使用自适应误差e(k)来更新自适应权重W。权重更新器420是自适应滤波器。在一个实施例中,权重更新器420使用归一化线性均方(NLMS)来更新权重。当输入样本很可能包含背景噪声时,执行权重的更新。如公式(6)所示,当背景样本不等于零时,这可被确定。当背景样本等于零时,权重保持旧的数值。换句话说,当输入样本很可能包含背景噪声时,权重矢量W被更新。给出NLMS更新法则如下:
W(k+1)=W(k)+μe(k)[u(k)/(1+u(k)uT(k))] (7)
其中k是迭代指数,W(k)是权重矢量,μ是步长,e(k)是自适应误差,u(k)是延迟的背景样本的矢量。上标T表示转置。
误差估值器430估值自适应误差e(k)。它包括减法器432和乘法器434。乘法器434把延迟的背景样本u(k)与自适应权重W相乘,以提供一个误差乘积。减法器432从背景样本bg(k)中减去该误差乘积,以提供如下的自适应误差e(k):
e(k)=bg(k)-u(k)WT (8)
图5是图示按照本发明的一个实施例的、如图2所示的系统AR模型白噪声发生器230的图。系统AR模型白噪声发生器230包括功率估值器510、随机数发生器550、和乘法器560。
功率估值器510通过使用指数的加权来估值自适应误差e(k)的功率。功率估值器510包括选择器520、话音功率估值器530、和误差功率估值器540。选择器520根据背景样本bg(k)选择话音功率估值器530和误差功率估值器540的输出之一。当bg(k)不等于零、表示输入样本很可能包含背景噪声时,通过使用指数的加权来计算误差e(k)的功率。当bg(k)等于零时,在没有误差项的影响的情况下误差e(k)的功率被加权。令s(k)是白噪声的功率,该功率估值被如下地执行:
如果bg(k)=0,s(k)=δs(k-1) (9)
否则 s(k)=(1-φ)e(k)2+φs(k-1) (10)
其中δ和φ是用于指数加权的时间常数,以及它们按照要被加权的、过去的样本的数目被选择。在一个实施例中,δ=1-1/80000和φ=1-1/NS,其中NS相应于过去的样本的数目。NS的典型的数值是2400。
话音功率估值器530按照公式(9)计算功率,以及误差功率估值器540按照公式(10)计算功率。选择器520也计算从(9)和(10)选择的s(k)的平方根。随机数发生器550生成正态分布的随机数,该随机数处在与功率值相一致的适当的范围内。乘法器560把估值的功率s(k)的平方根与由随机数发生器550生成的随机数据相乘,以产生想要的白噪声h(k)。
图6是图示按照本发明的一个实施例的、如图2所示的背景噪声估值器240的图。背景噪声估值器240包括系数生成器610和滤波器620。
系数生成器610从估值的自适应权重W生成系数。这些系数a(j)和b(j)被滤波器620使用来滤波由系统AR模型白噪声发生器230提供的白噪声h(k)。系数a(j)实际上是自适应权重W。系数b(j)被设置为常数1。
滤波器620通过使用系数a(j)和b(j)来滤波白噪声h(k)。滤波器620是标准差分方程的直接形式II转置实施方案。滤波器620包括N个乘法器6301到630N、N个加法器6401到640N、(N-1)个延迟单元6502到650N、以及(N-1)个乘法器6601到660N-1。这些单元被如此安排,使得背景噪声按照下式被计算:
y(k)=b(1)h(k)+b(2)h(k-1)+...b(r+1)h(k-r)
-a(2)y(k-1)-...a(k-j) (11)
图7是图示按照本发明的一个实施例的、生成背景噪声的过程700的流程图。
在开始以后,过程700从输入样本生成背景样本(方框710)。这可以通过如图3所示计算短期和长期功率来完成。接着,过程700延迟该背景样本以及生成该背景样本矢量(方框715)。
然后,过程700通过使用如以上公式(7)中给出的归一化LMS(NLMS)更新法则来更新自适应权重。接着,过程700通过使用公式(8)生成自适应误差(方框725)。然后,过程700通过使用公式(9)和(10)根据该背景样本来估值误差功率(方框730)。接着,过程700通过使用该误差功率估值和一个随机值来生成白噪声(方框735)。
然后,过程700从自适应权重确定滤波器系数a(j)和b(j)(方框740)。接着,过程700通过使用该滤波器系数a(j)和b(j)来滤波白噪声(方框745)。然后,过程700被终结。
图8是图示按照本发明的一个实施例的非线性处理器的特性的图。
对于大幅度信号来说该转移特性是线性的,而对于小幅度信号来说它几乎是零。门限是可调整的以及取决于Rin中的短期平均功率。当信号是由于回波抵消后在Sin中的残余回波引起的时,非线性处理器的误差输出用由噪声匹配器127生成的背景噪声代替。这可以通过用预定的门限来对误差输出的绝对值定限而确定。如果没有超过该门限,则该信号是由于残余回波引起的。
该技术通过使用Rin和Sin数据文件被演示。这些是大约30秒的数据文件,包含一个远端男性讲话者、一个近端女性讲话者和高电平背景噪声。
图9是图示按照本发明的一个实施例的近端输入波形的图。Rin数据显示:初始训练时间间隔在大约14.5K次迭代时开始,直至大约45K次迭代为止。
图10是图示按照本发明的一个实施例的远端输入波形的图。Sin数据的头两秒是背景噪声。其后跟随远端讲话者的大约5秒的有价值的训练样本。剩余的数据文件由双方的正常谈话和任何一方都不讲话时的偶尔的安静时段组成。
图9和10的相关示出了:近端讲话者大约在初始训练完成时开始讲话。图9还显示有许多远端讲话者安静的时段。另外,可以看到,当远端讲话者安静时近端讲话者常常在讲话。偶尔地,两个讲话者都是活动的。也有一些间隔两个讲话者都不活动。
图11是图示按照本发明的一个实施例的输出误差波形的图。把输出误差波形与Sin进行比较表明:远端讲话者被抵消,以及如期望的那样被低电平背景噪声代替。
图12是图示按照本发明的一个实施例的自适应预测器的转移函数的绝对值的图。该波形显示了在260K次迭代时的特性。该波形表示了对于一些谐波分量的大的响应,其中一个是背景中的电话振铃。这可以在约164K-167K迭代时的Sin数据文件中清楚地听见。这也可以清楚地出现在图11上的误差输出波形中,不仅是在当时,而且也在随后的时间中,从而模拟实际的背景噪声的特性。
图13是图示按照本发明的一个实施例的自适应预测器的零点的绝对值的图。该图显示自适应预测器的零点对于单位圆的接近程度。这些根的角度多半相应于图12中的峰值。这些根在延长的时间周期内没有移出单位圆以外,以避免从属AR参量估值器的不稳定性。
图14是图示按照本发明的一个实施例的、白噪声功率波形的估值的图。白噪声功率波形可被使用来识别两个讲话者都不讲话的时间间隔。这些时间间隔相应于在白噪声功率波形中的尖峰脉冲。
虽然本发明是依据一些实施例来描述的,但本领域的普通技术人员将会看到:本发明并不限于所描述的这些实施例,而是可以用在所附加的权利要求的精神和范围内的修改和替换来实施。因此,本说明被看作是说明性的,而不是限制性的。
Claims (21)
1.一种噪声匹配器,包括:
背景噪声建模器,用来从输入样本生成背景样本,
自适应预测器,被耦合到该背景噪声建模器,用来为在回波抵消器中作为该背景样本的背景噪声估值自回归(AR)模型的自适应权重,该自适应预测器生成自适应误差;
系统白噪声发生器,被耦合到该背景噪声建模器和该自适应预测器,通过使用该自适应误差来生成一个白噪声;以及
背景噪声估值器,被耦合到该自适应预测器和该系统白噪声发生器,通过使用该白噪声和该估值的自适应权重来估值该背景噪声。
2.权利要求1的噪声匹配器,其中该自适应预测器包括:
矢量化器,用来矢量化背景样本,
误差估值器,被耦合到该矢量化器,用来估值该自适应误差;以及
权重更新器,被耦合到该矢量化器和该误差估值器,通过使用该自适应误差来更新该自适应权重。
3.权利要求2的噪声匹配器,其中该误差估值器包括:
乘法器,用来把该矢量化的背景样本与该自适应权重相乘,以提供一个误差乘积;以及
减法器,用来从该背景样本中减去该误差乘积,以提供自适应误差。
4.权利要求2的噪声匹配器,其中该权重更新器包括:
归一化最小均方误差(NLMS)估值器,用来更新该自适应权重。
5.权利要求1的噪声匹配器,其中该系统白噪声发生器包括:
功率估值器,通过使用指数加权来估值自适应误差的功率;以及
乘法器,用来把该估值的功率的平方根与一个随机数据相乘,以生成该白噪声。
6.权利要求1的噪声匹配器,其中该背景噪声估值器包括:
系数生成器,用来从估值的自适应权重生成系数;以及
滤波器,通过使用该系数来滤波该白噪声。
7.权利要求1的噪声匹配器,其中该背景噪声建模器包括:
短期功率估值器,用来估值输入样本中的短期功率;
长期功率估值器,用来估值输入样本中的长期功率;以及
门限器,用来当短期功率小于长期功率的指示符时,生成该背景样本。
8.权利要求7的噪声匹配器,其中该门限器把背景样本设置为等于输入样本,以响应短期功率小于该长期功率的指示符。
9.一种方法,包括:
从输入样本生成背景样本,
由自适应预测器对于在回波抵消器中用作该背景样本的背景噪声,而估值自回归(AR)模型的自适应权重,该自适应预测器生成自适应误差;
使用该自适应误差生成一个白噪声;以及
使用该白噪声和该估值的自适应权重,而估值该背景噪声。
10.权利要求9的方法,其中估值自适应权重包括:
矢量化该背景样本,
估值自适应误差;以及
使用该自适应误差来更新该自适应权重。
11.权利要求10的方法,其中估值自适应误差包括:
把该矢量化的背景样本与该自适应权重相乘,以提供一个误差乘积;
从该背景样本中减去该误差乘积,以提供自适应误差。
12.权利要求10的方法,其中更新自适应权重包括:
使用归一化最小均方误差(NLMS)估值器来更新该自适应权重。
13.权利要求9的方法,其中生成白噪声包括:
使用指数加权来估值自适应误差的功率;以及
把该估值的功率的平方根与一个随机数据相乘,以生成该白噪声。
14.权利要求9的方法,其中估值背景噪声包括:
从估值的自适应权重生成系数;以及
使用该系数来滤波该白噪声。
15.权利要求9的方法,其中生成背景样本包括:
估值输入样本中的短期功率;
估值输入样本中的长期功率;以及
当该短期功率小于该长期功率的指示符时,生成该背景样本。
16.权利要求15的方法,其中生成背景样本包括把背景样本设置为等于输入样本,以响应该短期功率小于该长期功率的指示符。
17.一种系统,包括:
发送输入译码器,用于译码在近端处的近端信号,该译码器生成输入样本;以及
耦合到该发送输入译码器的回波信道,该回波信道包括:
回波抵消器,用来执行回波抵消;以及
噪声匹配器,用来匹配背景噪声,该噪声匹配器包括:
背景噪声建模器,用来从输入样本生成背景样本,
自适应预测器,被耦合到该背景噪声建模器,用来估值在回波抵消器中作为该背景样本的背景噪声的自回归(AR)模型的自适应权重,该自适应预测器生成自适应误差;
系统白噪声发生器,其被耦合到该背景噪声建模器和自适应预测器,以使用该自适应误差生成白噪声;以及
背景噪声估值器,其被耦合到系统白噪声发生器和自适应预测器,以使用该白噪声和该估值的自适应权重来估值该背景噪声。
18.权利要求17的系统,还包括:
发送输出编码器,用来提供语音压缩。
19.权利要求18的系统,还包括:
接收输入译码器,用来解压缩从远端接收到的语音数据;以及接收输出编码器,用来编码来自回波信道的线性数据样本,该编码的线性数据样本被发出到近端。
20.权利要求19的系统,其中发送输入译码器是μ-律和A-律译码器之一。
21.权利要求20的系统,其中发送输出编码器压缩来自回波信道的语音数据,该压缩的语音数据被发送到远端。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/305,222 US7627111B2 (en) | 2002-11-25 | 2002-11-25 | Noise matching for echo cancellers |
US10/305222 | 2002-11-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1503467A CN1503467A (zh) | 2004-06-09 |
CN100512038C true CN100512038C (zh) | 2009-07-08 |
Family
ID=32325382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2003101183660A Expired - Fee Related CN100512038C (zh) | 2002-11-25 | 2003-11-25 | 用于回波抵消器的噪声匹配 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7627111B2 (zh) |
EP (1) | EP1566048A1 (zh) |
CN (1) | CN100512038C (zh) |
AU (1) | AU2003287422A1 (zh) |
TW (1) | TWI234941B (zh) |
WO (1) | WO2004049687A1 (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8374851B2 (en) * | 2007-07-30 | 2013-02-12 | Texas Instruments Incorporated | Voice activity detector and method |
US8160240B2 (en) * | 2008-05-28 | 2012-04-17 | Microsemi Semiconductor (U.S.) Inc. | Echo cancellation balance using noise generator and average power detection |
RU2546717C2 (ru) * | 2009-06-02 | 2015-04-10 | Конинклейке Филипс Электроникс Н.В. | Многоканальное акустическое эхоподавление |
CN101807047B (zh) * | 2010-03-19 | 2011-11-09 | 北京航空航天大学 | 基于模糊奇偶方程及ar模型的非线性系统故障预测方法 |
CN101888252B (zh) * | 2010-04-20 | 2013-04-10 | 宁波成电泰克电子信息技术发展有限公司 | 一种提高rf系统中动态范围的方法及系统 |
US20150078564A1 (en) * | 2012-06-08 | 2015-03-19 | Yongfang Guo | Echo cancellation algorithm for long delayed echo |
US9495951B2 (en) * | 2013-01-17 | 2016-11-15 | Nvidia Corporation | Real time audio echo and background noise reduction for a mobile device |
US9691413B2 (en) * | 2015-10-06 | 2017-06-27 | Microsoft Technology Licensing, Llc | Identifying sound from a source of interest based on multiple audio feeds |
CN110047519B (zh) * | 2019-04-16 | 2021-08-24 | 广州大学 | 一种语音端点检测方法、装置及设备 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2947093B2 (ja) * | 1994-11-02 | 1999-09-13 | 日本電気株式会社 | 適応フィルタによるシステム同定の方法および装置 |
US5521908A (en) * | 1995-04-20 | 1996-05-28 | Tellabs Operations Inc. | Method and apparatus for providing reduced complexity echo cancellation in a multicarrier communication system |
US5771440A (en) * | 1996-05-31 | 1998-06-23 | Motorola, Inc. | Communication device with dynamic echo suppression and background noise estimation |
KR100233463B1 (ko) * | 1997-03-07 | 1999-12-01 | 윤종용 | 반향제거장치 및 방법 |
US5857167A (en) * | 1997-07-10 | 1999-01-05 | Coherant Communications Systems Corp. | Combined speech coder and echo canceler |
US6240180B1 (en) * | 1997-11-14 | 2001-05-29 | Tellabs Operations, Inc. | Echo canceller employing dual-H architecture having split adaptive gain settings |
US6028929A (en) * | 1997-11-14 | 2000-02-22 | Tellabs Operations, Inc. | Echo canceller employing dual-H architecture having improved non-linear echo path detection |
US6163608A (en) * | 1998-01-09 | 2000-12-19 | Ericsson Inc. | Methods and apparatus for providing comfort noise in communications systems |
US7423983B1 (en) * | 1999-09-20 | 2008-09-09 | Broadcom Corporation | Voice and data exchange over a packet based network |
DE19935808A1 (de) * | 1999-07-29 | 2001-02-08 | Ericsson Telefon Ab L M | Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit |
US6526139B1 (en) | 1999-11-03 | 2003-02-25 | Tellabs Operations, Inc. | Consolidated noise injection in a voice processing system |
US6606382B2 (en) * | 2000-01-27 | 2003-08-12 | Qualcomm Incorporated | System and method for implementation of an echo canceller |
US6909782B2 (en) * | 2000-09-08 | 2005-06-21 | Intel Corporation | Fast converging affine projection based echo canceller for sparse multi-path channels |
US6700978B2 (en) * | 2000-09-08 | 2004-03-02 | Intel Corporation | Method and apparatus for fast converging affine projection based echo canceller |
GB2379369B (en) * | 2001-08-29 | 2005-06-29 | Zarlink Semiconductor Inc | Subband echo location and double-talk detection in communication systems |
US20030219113A1 (en) * | 2002-05-21 | 2003-11-27 | Bershad Neil J. | Echo canceller with double-talk and channel impulse response adaptation |
-
2002
- 2002-11-25 US US10/305,222 patent/US7627111B2/en not_active Expired - Fee Related
-
2003
- 2003-10-30 AU AU2003287422A patent/AU2003287422A1/en not_active Abandoned
- 2003-10-30 EP EP03781657A patent/EP1566048A1/en not_active Withdrawn
- 2003-10-30 WO PCT/US2003/034804 patent/WO2004049687A1/en not_active Application Discontinuation
- 2003-11-13 TW TW092131811A patent/TWI234941B/zh not_active IP Right Cessation
- 2003-11-25 CN CNB2003101183660A patent/CN100512038C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7627111B2 (en) | 2009-12-01 |
US20040100916A1 (en) | 2004-05-27 |
EP1566048A1 (en) | 2005-08-24 |
WO2004049687A1 (en) | 2004-06-10 |
CN1503467A (zh) | 2004-06-09 |
TWI234941B (en) | 2005-06-21 |
TW200412728A (en) | 2004-07-16 |
AU2003287422A1 (en) | 2004-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101964670B (zh) | 回声抑制方法及回声抑制设备 | |
US8594173B2 (en) | Method for determining updated filter coefficients of an adaptive filter adapted by an LMS algorithm with pre-whitening | |
CN101304460B (zh) | 用于免提语音通信的声音回声抑制器 | |
RU2109408C1 (ru) | Сетевой эхоподавитель | |
CN1084976C (zh) | 回波消除器及回波路径估测方法 | |
EP0853844B1 (en) | Echo cancelling system for digital telephony applications | |
JPH08506434A (ja) | 通信システムにおける伝送ノイズ低減 | |
CN104052526A (zh) | 用于声学回声抵消器的基于倒谱距离的消波 | |
CN101026392A (zh) | 对滤波器的调整进行控制的方法 | |
CN100593287C (zh) | 回音消除方法、回音消除器和系统设备 | |
CN100512038C (zh) | 用于回波抵消器的噪声匹配 | |
CN101272161B (zh) | 一种自适应回声消除的方法 | |
CA2328006C (en) | Linear predictive coding based acoustic echo cancellation | |
CN104601837A (zh) | 一种鲁棒凸组合自适应电话回声消除方法 | |
US6909782B2 (en) | Fast converging affine projection based echo canceller for sparse multi-path channels | |
CN1473403B (zh) | 用于基于回波消除器的快速收敛仿射投影的装置和方法 | |
CN109712637A (zh) | 一种混响抑制系统及方法 | |
KR100738713B1 (ko) | 스파스 채널 에코 소거 장치, 방법, 머신 판독 가능 저장 매체 및 시스템 | |
Halimeh et al. | Nonlinear acoustic echo cancellation using elitist resampling particle filter | |
Lu et al. | Acoustic echo cancellation over a non-linear channel | |
Huang et al. | Effects of vocoder distortion on network echo cancellation | |
Jones et al. | University of Liverpool | |
TW583851B (en) | Fast converging affine projection based echo canceller for sparse multi-path channels | |
EP1341365A1 (en) | Method and arrangement for processing a speech signal | |
Shah | Adaptation algorithms for data echo cancellation using nonquadratic cost functions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090708 Termination date: 20131125 |