CN100512038C

CN100512038C - 用于回波抵消器的噪声匹配

Info

Publication number: CN100512038C
Application number: CNB2003101183660A
Authority: CN
Inventors: N·J·伯沙德; A·比斯特; S·希
Original assignee: Intel Corp
Current assignee: Intel Corp
Priority date: 2002-11-25
Filing date: 2003-11-25
Publication date: 2009-07-08
Anticipated expiration: 2023-11-25
Also published as: US7627111B2; US20040100916A1; EP1566048A1; WO2004049687A1; CN1503467A; TWI234941B; TW200412728A; AU2003287422A1

Abstract

本发明的一个实施例包括自适应预测器、系统白噪声发生器、和背景噪声估值器。该自适应预测器估值在回波抵消器中作为背景样本的背景噪声的自回归(AR)模型的自适应权重。该自适应预测器生成自适应误差。该系统白噪声发生器通过使用该自适应误差生成白噪声。背景噪声估值器通过使用该白噪声和该估值的自适应权重来估值背景噪声。

Description

用于回波抵消器的噪声匹配

技术领域

本发明的实施例涉及通信领域，更具体地，涉及回波抵消。

背景技术

回声是在语音处理设备(诸如电话网和无线手机)的设计中的固有问题。回波抵消是一种通过估值在发送端、在话筒或线路上拾取的回波以及在接收端从耳机或免提扬声器中减去该回波从而减小话音传输中的回波量的技术。由于环境的精确模型是未知的和时变的，故自适应技术通常被使用来估值回波。

当发送的输入语音数据中的远端信号被抵消到低于某个门限电平时，残余回波被非线性处理器减小。由于多种原因，这种抵消通常是不完美的。首先，没有足够的训练时间用于适配。第二，远端残余回波至多可以被抵消到背景噪声电平。通常，非线性处理器通过不产生输出信号而去除这种远端残余回波以及背景噪声。这些空的时段让人耳听起来很不自然。

附图说明

通过参照以下说明和被使用来图示本发明的实施例的附图，可以最好地理解本发明。在这些图中：

图1是图示在其中可以实施本发明的一个实施例的系统的图。

图2是图示按照本发明的一个实施例的噪声匹配器的图。

图3是图示按照本发明的一个实施例的、如图2所示的背景噪声建模器的图。

图4是图示按照本发明的一个实施例的、如图2所示的自适应预测器的图。

图5是图示按照本发明的一个实施例的、如图2所示的系统AR模型白噪声发生器的图。

图6是图示按照本发明的一个实施例的、如图2所示的背景噪声估值器的图。

图7是图示按照本发明的一个实施例的、生成背景噪声的过程的流程图。

图8是图示按照本发明的一个实施例的非线性处理器的特性的图。

图9是图示按照本发明的一个实施例的近端输入波形的图。

图10是图示按照本发明的一个实施例的远端输入波形的图。

图11是图示按照本发明的一个实施例的输出误差波形的图。

图12是图示按照本发明的一个实施例的自适应预测器的转移函数的绝对值的图。

图13是图示按照本发明的一个实施例的自适应预测器的零点的绝对值的图。

图14是图示按照本发明的一个实施例的、白噪声功率波形的估值的图。

具体实施方式

本发明的一个实施例包括自适应预测器、系统白噪声发生器、和背景噪声估值器。自适应预测器估值在回波抵消器中用作背景样本的背景噪声的自回归(AR)模型的自适应权重。自适应预测器生成自适应误差。系统白噪声发生器通过使用该自适应误差生成白噪声。背景噪声估值器通过使用该白噪声和该估值的自适应权重来估值背景噪声。

在下面的说明中，阐述了多个具体细节。然而，应当明白，本发明的实施例可以不用这些具体细节来实施。在其它实例中公知的电路、结构和技术没有被示出，以免遮蔽对本说明的理解。

本发明的一个实施例的单元可以用硬件、固件、软件或它们的任何组合来实现。当用软件来实现时，本发明的实施例的这些单元实质上是执行必要任务的代码段。该软件可以包括执行在本发明一个实施例中描述的那些操作的实际代码，即仿真或模拟那些操作的代码。这些程序或代码段可以被存储在处理器或机器可存取的媒体中，或者通过以载波体现的计算机数据信号或由载波调制的信号经由传输媒体被发送。“处理器可读的或可存取的媒体”或“机器可读的或可存取的媒体”可以包括任何能够存储、发送、或传送信息的媒体。处理器可读的媒体的例子包括电子电路、半导体存储器件、只读存储器(ROM)、快速存储器、可擦除ROM(EROM)、软盘、压密盘(CD)ROM、光盘、硬盘、光纤媒体、射频(RF)链路等等。计算机数据信号可包括能够通过传输媒体(诸如，电子网络信道、光纤、空中、电磁波、RF链路等等)传播的任何信号。这些代码段可以通过计算机网络(诸如互联网，内部网等等)被下载。机器可存取的媒体可以实现为制造的产品。机器可存取的媒体可以包括当其被机器存取时，使得该机器执行下面描述的操作的数据。术语“数据”在这里是指为了机器可读的目的而被编码的任何类型的信息。所以，它可以包括程序、代码、数据、文件等等。

本发明的实施例的全部或一部分可以用软件来实现。该软件可以具有互相联系的几个模块。一个软件模块与另一个模块相联系，以便接收变量、参量、变元、指示字等等，和/或产生或传送结果、更新的变量、指示字等等。软件模块也可以是软件驱动程序或接口，以便与在该平台上运行的操作系统交互作用。软件模块也可以是硬件驱动器，以便用来配置、建立、初始化、发送和接收去往和来自硬件装置的数据。

本发明的一个实施例可被描述为一个过程，该过程通常被描绘为流程图、操作程序图、结构图、或方框图。虽然流程图可以把这些操作描述为一个顺序的过程，但许多操作能够并行地或同时地执行。另外，这些操作的次序可被重新安排。当一个过程的操作完成时，该过程被终结。一个过程可相应于一个方法、一个程序、一个规程等等。

图1是图示在其中可实施本发明的一个实施例的系统100的图。系统100包括发送输入译码器110、回波信道120、发送输出编码器130、接收输入译码器140、接收输出编码器150、网络145、发送输入译码器160、回波信道170、发送输出编码器180、接收输入译码器190、和接收输出编码器195。

发送输入译码器110接收来自第一近端的编码的语音，以及把该编码的语音译码成线性语音数据S_in。在一个实施例中，发送输入译码器110是μ-律/A-律译码器。回波信道120包括回波抵消器125和噪声匹配器127。回波抵消器125去除来自线性数据样本S_in的回波估值信号，以生成线性数据样本S_out。当非线性处理器抵消该回波时，噪声匹配器127提供背景噪声到回波抵消器125。发送输出编码器130在分组化之前提供语音压缩。在一个实施例中，发送输出编码器130是G.7xx编码器，它通过使用任何一个用于低比特速率话音(LBRV)的压缩标准(包括国际电信联盟(ITU)-T国际标准化的G.7xx系列)对来自回波信道120的语音数据S_out进行压缩。该压缩的语音数据经由网络被发送到远端。接收输入译码器140解压缩通过网络145从第一远端接收到的语音数据。该解压缩技术与在发送输出编码器130中使用的压缩相一致。回波信道120接收来自接收输入译码器140的R_in，以及发送出R_out线性数据样本。接收输出编码器150把线性数据样本R_out编码成μ-律和A-律编码的语音，以便被发送出到第一近端。

网络145是有能力发送分组化数据的任何网络，其中所述分组化数据来自和去往该发送输出译码器130、发送输入译码器160、接收输入译码器140、和接收输出编码器195。网络145可以是互联网、内联网、外联网、局域网(LAN)、或广域网(WAN)。发送输入译码器160接收来自网络145的编码的语音，以及把该编码的语音译码成线性语音数据S_in。在一个实施例中，发送输入译码器160是μ-律/A-律译码器。回波信道170包括回波抵消器175和噪声匹配器177。回波抵消器175去除来自线性数据样本S_in的回波估值信号，以生成线性数据样本S_out。噪声匹配器177实质上是与噪声匹配器127相同的。在下文中，噪声匹配器127的说明可应用于噪声匹配器177。发送输出编码器180在分组化之前提供语音压缩。在一个实施例中，发送输出编码器180是G.7xx编码器，它通过使用任何一个用于低比特速率话音(LBRV)的压缩标准(包括国际电信联盟(ITU)-T国际标准化的G.7xx系列)对来自回波信道170的语音数据S_out进行压缩。该压缩的语音数据被发送到第二远端处的接收设备。接收输入译码器190解压缩从第二远端接收到的语音数据。该解压缩技术与在发送输出编码器180中使用的压缩相一致。回波信道170接收来自接收输入译码器190的R_in，以及发送出R_out线性数据样本。接收输出编码器195把线性数据样本R_out编码成μ-律/A-律编码的语音，以便被向外发送到第二近端到网络145。在一个实施例中，发送输入译码器160、回波信道170、发送输出编码器180、接收输入译码器190、接收输出编码器195被集成为数字信号处理器165。

图2是图示按照本发明的一个实施例的噪声匹配器127的图。噪声匹配器127包括背景噪声建模器210、自适应预测器220、系统AR模型白噪声发生器230、和背景噪声估值器240。背景噪声建模器210从输入样本S_in生成背景样本bg(k)。自适应预测器220从背景样本bg(k)估值背景噪声的自回归(AR)的自适应权重。自适应预测器220生成自适应误差e(k)和自适应权重矢量W。自适应权重矢量W包括该预测器的自适应权重w_i。系统AR模型白噪声发生器230通过使用自适应误差e(k)和背景样本bg(k)来生成白噪声。背景噪声估值器240通过使用该白噪声和该估值的自适应权重W来估值背景噪声。

该技术的基本理论是：如果背景噪声的估值的AR模型用与预测误差功率相同的功率的白噪声来驱动，则这个系统的输出是一个随机过程的样本函数，其中该随机过程的频谱是所述背景噪声的功率谱的相当好的估值。所以，这个输出应当听起来就象是真实的背景噪声那样。

图3是图示按照本发明的一个实施例的、如图2所示的背景噪声建模器210的图。背景噪声建模器210包括短期功率估值器310、长期功率估值器320、和门限器(thresholder)330。

短期和长期功率估值器310和320估值在远端输入数据S_in中的输入样本x(n)的短期和长期功率。令p_S和p_L分别是短期和长期功率。p_S和p_L的计算可以如下地实行：

x₁(k)＝x(k)² (1)

如果x₁(k)>p_S(k)：p_S(k)＝(1-γ_r)x₁(k)+γ_rp_S(k-1) (2)

否则p_S(k)＝(1-γ_f)x₁(k)+γ_fp_S(k-1) (3)

如果p_S(k)<βp_L(k-1)：p_L(k)＝(1-α)x₁(k)+αp_L(k-1) (4)

否则p_L(k)＝p_L(k-1) (5)

其中γ_r和γ_f分别是用于增加和减小输入功率的时间常数；β是用于功率测量的门限；α是用于长期功率估值的时间常数。在一个实施例中，γ_r＝1-1/24以及γ_f＝1-1/240；β＝4；以及α＝1-1/24000。

门限器330响应于短期功率小于该长期功率的指示符，而生成背景样本。长期功率p_L的指示符是长期功率的倍数，诸如kp_L，其中k是正整数。在一个实施例中，k＝2。当输入样本S_in不可能包含背景噪声时，背景样本bg(k)等于零，或某个标志值。输入样本S_in很可能包含背景噪声的情况是在短期功率p_S>kp_L时。换句话说：

如果p_S<kp_L时，bg(k)＝x(k) (6)

否则bg(k)＝0

背景样本bg(k)然后被转发到自适应预测器220和系统AR模型白噪声发生器230。

图4是图示按照本发明的一个实施例的、如图2所示的自适应预测器220的图。自适应预测器220包括矢量化器410、权重更新器420、和误差估值器430。

矢量化器410把背景样本bg(k)延迟P个样本延时，以及把该延迟的样本进行矢量化，以形成矢量u(k)。在一个实施例中，P＝1，即：矢量化器410是单位延迟。矢量化器410可以用同步器、触发器、移位寄存器、存储器单元、或任何其他适当的数据结构来实现。

权重更新器420通过使用自适应误差e(k)来更新自适应权重W。权重更新器420是自适应滤波器。在一个实施例中，权重更新器420使用归一化线性均方(NLMS)来更新权重。当输入样本很可能包含背景噪声时，执行权重的更新。如公式(6)所示，当背景样本不等于零时，这可被确定。当背景样本等于零时，权重保持旧的数值。换句话说，当输入样本很可能包含背景噪声时，权重矢量W被更新。给出NLMS更新法则如下：

W(k+1)＝W(k)+μe(k)[u(k)/(1+u(k)u^T(k))] (7)

其中k是迭代指数，W(k)是权重矢量，μ是步长，e(k)是自适应误差，u(k)是延迟的背景样本的矢量。上标T表示转置。

误差估值器430估值自适应误差e(k)。它包括减法器432和乘法器434。乘法器434把延迟的背景样本u(k)与自适应权重W相乘，以提供一个误差乘积。减法器432从背景样本bg(k)中减去该误差乘积，以提供如下的自适应误差e(k)：

e(k)＝bg(k)-u(k)W^T (8)

图5是图示按照本发明的一个实施例的、如图2所示的系统AR模型白噪声发生器230的图。系统AR模型白噪声发生器230包括功率估值器510、随机数发生器550、和乘法器560。

功率估值器510通过使用指数的加权来估值自适应误差e(k)的功率。功率估值器510包括选择器520、话音功率估值器530、和误差功率估值器540。选择器520根据背景样本bg(k)选择话音功率估值器530和误差功率估值器540的输出之一。当bg(k)不等于零、表示输入样本很可能包含背景噪声时，通过使用指数的加权来计算误差e(k)的功率。当bg(k)等于零时，在没有误差项的影响的情况下误差e(k)的功率被加权。令s(k)是白噪声的功率，该功率估值被如下地执行：

如果bg(k)＝0，s(k)＝δs(k-1) (9)

否则 s(k)＝(1-φ)e(k)²+φs(k-1) (10)

其中δ和φ是用于指数加权的时间常数，以及它们按照要被加权的、过去的样本的数目被选择。在一个实施例中，δ＝1-1/80000和φ＝1-1/NS，其中NS相应于过去的样本的数目。NS的典型的数值是2400。

话音功率估值器530按照公式(9)计算功率，以及误差功率估值器540按照公式(10)计算功率。选择器520也计算从(9)和(10)选择的s(k)的平方根。随机数发生器550生成正态分布的随机数，该随机数处在与功率值相一致的适当的范围内。乘法器560把估值的功率s(k)的平方根与由随机数发生器550生成的随机数据相乘，以产生想要的白噪声h(k)。

图6是图示按照本发明的一个实施例的、如图2所示的背景噪声估值器240的图。背景噪声估值器240包括系数生成器610和滤波器620。

系数生成器610从估值的自适应权重W生成系数。这些系数a(j)和b(j)被滤波器620使用来滤波由系统AR模型白噪声发生器230提供的白噪声h(k)。系数a(j)实际上是自适应权重W。系数b(j)被设置为常数1。

滤波器620通过使用系数a(j)和b(j)来滤波白噪声h(k)。滤波器620是标准差分方程的直接形式II转置实施方案。滤波器620包括N个乘法器630₁到630_N、N个加法器640₁到640_N、(N-1)个延迟单元650₂到650_N、以及(N-1)个乘法器660₁到660_N-1。这些单元被如此安排，使得背景噪声按照下式被计算：

y(k)＝b(1)h(k)+b(2)h(k-1)+...b(r+1)h(k-r)

-a(2)y(k-1)-...a(k-j) (11)

图7是图示按照本发明的一个实施例的、生成背景噪声的过程700的流程图。

在开始以后，过程700从输入样本生成背景样本(方框710)。这可以通过如图3所示计算短期和长期功率来完成。接着，过程700延迟该背景样本以及生成该背景样本矢量(方框715)。

然后，过程700通过使用如以上公式(7)中给出的归一化LMS(NLMS)更新法则来更新自适应权重。接着，过程700通过使用公式(8)生成自适应误差(方框725)。然后，过程700通过使用公式(9)和(10)根据该背景样本来估值误差功率(方框730)。接着，过程700通过使用该误差功率估值和一个随机值来生成白噪声(方框735)。

然后，过程700从自适应权重确定滤波器系数a(j)和b(j)(方框740)。接着，过程700通过使用该滤波器系数a(j)和b(j)来滤波白噪声(方框745)。然后，过程700被终结。

对于大幅度信号来说该转移特性是线性的，而对于小幅度信号来说它几乎是零。门限是可调整的以及取决于R_in中的短期平均功率。当信号是由于回波抵消后在S_in中的残余回波引起的时，非线性处理器的误差输出用由噪声匹配器127生成的背景噪声代替。这可以通过用预定的门限来对误差输出的绝对值定限而确定。如果没有超过该门限，则该信号是由于残余回波引起的。

该技术通过使用R_in和S_in数据文件被演示。这些是大约30秒的数据文件，包含一个远端男性讲话者、一个近端女性讲话者和高电平背景噪声。

图9是图示按照本发明的一个实施例的近端输入波形的图。R_in数据显示：初始训练时间间隔在大约14.5K次迭代时开始，直至大约45K次迭代为止。

图10是图示按照本发明的一个实施例的远端输入波形的图。S_in数据的头两秒是背景噪声。其后跟随远端讲话者的大约5秒的有价值的训练样本。剩余的数据文件由双方的正常谈话和任何一方都不讲话时的偶尔的安静时段组成。

图9和10的相关示出了：近端讲话者大约在初始训练完成时开始讲话。图9还显示有许多远端讲话者安静的时段。另外，可以看到，当远端讲话者安静时近端讲话者常常在讲话。偶尔地，两个讲话者都是活动的。也有一些间隔两个讲话者都不活动。

图11是图示按照本发明的一个实施例的输出误差波形的图。把输出误差波形与S_in进行比较表明：远端讲话者被抵消，以及如期望的那样被低电平背景噪声代替。

图12是图示按照本发明的一个实施例的自适应预测器的转移函数的绝对值的图。该波形显示了在260K次迭代时的特性。该波形表示了对于一些谐波分量的大的响应，其中一个是背景中的电话振铃。这可以在约164K-167K迭代时的S_in数据文件中清楚地听见。这也可以清楚地出现在图11上的误差输出波形中，不仅是在当时，而且也在随后的时间中，从而模拟实际的背景噪声的特性。

图13是图示按照本发明的一个实施例的自适应预测器的零点的绝对值的图。该图显示自适应预测器的零点对于单位圆的接近程度。这些根的角度多半相应于图12中的峰值。这些根在延长的时间周期内没有移出单位圆以外，以避免从属AR参量估值器的不稳定性。

图14是图示按照本发明的一个实施例的、白噪声功率波形的估值的图。白噪声功率波形可被使用来识别两个讲话者都不讲话的时间间隔。这些时间间隔相应于在白噪声功率波形中的尖峰脉冲。

虽然本发明是依据一些实施例来描述的，但本领域的普通技术人员将会看到：本发明并不限于所描述的这些实施例，而是可以用在所附加的权利要求的精神和范围内的修改和替换来实施。因此，本说明被看作是说明性的，而不是限制性的。

Claims

1.一种噪声匹配器，包括：

背景噪声建模器，用来从输入样本生成背景样本，

自适应预测器，被耦合到该背景噪声建模器，用来为在回波抵消器中作为该背景样本的背景噪声估值自回归(AR)模型的自适应权重，该自适应预测器生成自适应误差；

系统白噪声发生器，被耦合到该背景噪声建模器和该自适应预测器，通过使用该自适应误差来生成一个白噪声；以及

背景噪声估值器，被耦合到该自适应预测器和该系统白噪声发生器，通过使用该白噪声和该估值的自适应权重来估值该背景噪声。

2.权利要求1的噪声匹配器，其中该自适应预测器包括：

矢量化器，用来矢量化背景样本，

误差估值器，被耦合到该矢量化器，用来估值该自适应误差；以及

权重更新器，被耦合到该矢量化器和该误差估值器，通过使用该自适应误差来更新该自适应权重。

3.权利要求2的噪声匹配器，其中该误差估值器包括：

乘法器，用来把该矢量化的背景样本与该自适应权重相乘，以提供一个误差乘积；以及

减法器，用来从该背景样本中减去该误差乘积，以提供自适应误差。

4.权利要求2的噪声匹配器，其中该权重更新器包括：

归一化最小均方误差(NLMS)估值器，用来更新该自适应权重。

5.权利要求1的噪声匹配器，其中该系统白噪声发生器包括：

功率估值器，通过使用指数加权来估值自适应误差的功率；以及

乘法器，用来把该估值的功率的平方根与一个随机数据相乘，以生成该白噪声。

6.权利要求1的噪声匹配器，其中该背景噪声估值器包括：

系数生成器，用来从估值的自适应权重生成系数；以及

滤波器，通过使用该系数来滤波该白噪声。

7.权利要求1的噪声匹配器，其中该背景噪声建模器包括：

短期功率估值器，用来估值输入样本中的短期功率；

长期功率估值器，用来估值输入样本中的长期功率；以及

门限器，用来当短期功率小于长期功率的指示符时，生成该背景样本。

8.权利要求7的噪声匹配器，其中该门限器把背景样本设置为等于输入样本，以响应短期功率小于该长期功率的指示符。

9.一种方法，包括：

从输入样本生成背景样本，

由自适应预测器对于在回波抵消器中用作该背景样本的背景噪声，而估值自回归(AR)模型的自适应权重，该自适应预测器生成自适应误差；

使用该自适应误差生成一个白噪声；以及

使用该白噪声和该估值的自适应权重，而估值该背景噪声。

10.权利要求9的方法，其中估值自适应权重包括：

矢量化该背景样本，

估值自适应误差；以及

使用该自适应误差来更新该自适应权重。

11.权利要求10的方法，其中估值自适应误差包括：

把该矢量化的背景样本与该自适应权重相乘，以提供一个误差乘积；

从该背景样本中减去该误差乘积，以提供自适应误差。

12.权利要求10的方法，其中更新自适应权重包括：

使用归一化最小均方误差(NLMS)估值器来更新该自适应权重。

13.权利要求9的方法，其中生成白噪声包括：

使用指数加权来估值自适应误差的功率；以及

把该估值的功率的平方根与一个随机数据相乘，以生成该白噪声。

14.权利要求9的方法，其中估值背景噪声包括：

从估值的自适应权重生成系数；以及

使用该系数来滤波该白噪声。

15.权利要求9的方法，其中生成背景样本包括：

估值输入样本中的短期功率；

估值输入样本中的长期功率；以及

当该短期功率小于该长期功率的指示符时，生成该背景样本。

16.权利要求15的方法，其中生成背景样本包括把背景样本设置为等于输入样本，以响应该短期功率小于该长期功率的指示符。

17.一种系统，包括：

发送输入译码器，用于译码在近端处的近端信号，该译码器生成输入样本；以及

耦合到该发送输入译码器的回波信道，该回波信道包括：

回波抵消器，用来执行回波抵消；以及

噪声匹配器，用来匹配背景噪声，该噪声匹配器包括：

背景噪声建模器，用来从输入样本生成背景样本，

自适应预测器，被耦合到该背景噪声建模器，用来估值在回波抵消器中作为该背景样本的背景噪声的自回归(AR)模型的自适应权重，该自适应预测器生成自适应误差；

系统白噪声发生器，其被耦合到该背景噪声建模器和自适应预测器，以使用该自适应误差生成白噪声；以及

背景噪声估值器，其被耦合到系统白噪声发生器和自适应预测器，以使用该白噪声和该估值的自适应权重来估值该背景噪声。

18.权利要求17的系统，还包括：

发送输出编码器，用来提供语音压缩。

19.权利要求18的系统，还包括：

接收输入译码器，用来解压缩从远端接收到的语音数据；以及接收输出编码器，用来编码来自回波信道的线性数据样本，该编码的线性数据样本被发出到近端。

20.权利要求19的系统，其中发送输入译码器是μ-律和A-律译码器之一。

21.权利要求20的系统，其中发送输出编码器压缩来自回波信道的语音数据，该压缩的语音数据被发送到远端。