CN102136271B

CN102136271B - 舒适噪声生成器、方法及回声抵消装置

Info

Publication number: CN102136271B
Application number: CN2011100377682A
Authority: CN
Inventors: 邱洪
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2011-02-09
Filing date: 2011-02-09
Publication date: 2012-07-04
Anticipated expiration: 2031-02-09
Also published as: CN102136271A

Abstract

本发明实施方式提供一种舒适噪声生成器、方法及回声抵消装置，属语音通信技术领域。该生成器包括：背景噪声估计模块，用于判断输入信号的当前帧信号是背景噪声时，在频域对当前帧信号的频谱特征与能量水平进行估计，得到频谱特征估计值和能量水平估计值；白噪声生成模块，用于在频域生成白噪声；白噪声整形模块，用于根据得到的所述频谱特征估计值和能量水平估计值，对白噪声生成模块生成的白噪声进行整形后得到舒适噪声，得到的舒适噪声的频谱特征和能量水平均与背景噪声的相匹配；舒适噪声填充模块，用于用整形后得到的所述舒适噪声对残留回声抑制后输出的频域信号的当前帧信号进行填充。该生成器可保证语音的质量。

Description

舒适噪声生成器、方法及回声抵消装置

技术领域

本发明涉及语音通信技术领域，尤其涉及一种舒适噪声生成器、方法及回声抵消装置。

背景技术

在现代语音通信系统(如VOIP、手机、视频会议系统等)中，经常存在回声现象，目前是通过在语音通信系统中设置AEC(Acoustic Echo Cancellation，声学回声抵消器)模块来解决回声及提高双讲能力。

目前如图1所示的通信系统中应用的AEC模块如图2所示，包括：Adaptive Filter(自适应滤波器)、NLP(Non-Linear Process，非线性处理)与CNG(Comfort NoiseGenerator，舒适噪声生成器)等子模块，其中，Adaptive Filter消除的是线性回声，NLP消除的是非线性回声及残留的线性回声。CNG的功能是补偿被抑制掉的背景噪声，使语音中的背景噪声连续一致，避免背景噪声“断断续续”的现象。

在图2中，y(n)表示回声，v(n)表示near-end(语音通话中的远端)语音，z(n)则表示near-end(语音通话中的近端)的背景噪声，near-end的语音信号由这三个分量组成。经过NLP模块处理后，回声分量y(n)被抑制，同时背景噪声分量z(n)也被抑制，z(n)被抑制后，导致near-end语音中的背景噪声出现“断断续续”的现象，严重影响语音质量，因此，在NLP模块后需要CNG模块来补偿被抑制掉的背景噪声，使near-end语音中的背景噪声连续一致，避免出现背景噪声“断断续续”的现象。

现有技术提供的CNG实现方案是在时域生成一定能量水平的hoth噪声(根据室内环境噪声描述模型建立的舒适噪声，命名的hoth为研究者D.F Hoth的名字)，用hoth噪声来填充被抑制的背景噪声。其原理如图3所示，首先使用白噪声生成器生成白噪声，白噪声生成器可使用组合线性同余法生成白噪声，然后，将生成的白噪声通过hoth滤波器，生成hoth噪声，Hoth滤波器是一个2阶IIR滤波器，其系统传递函数如公式1所示：

H (z) = \frac{1 + b_{1} z^{- 1} + b_{2} z^{- 2}}{1 + a_{1} z^{- 1} + a_{2} z^{- 2}}

(公式1)

其中，滤波器系数a1、a2、b1、b2是常量。

该CNG的实现方案中至少存在下述缺点：(1)hoth噪声与背景噪声的频谱特征不匹配，主要是由于near-end语音的背景噪声，来自于周围的环境，如打印机、空调等，因此，其频谱特征多种多样，且随时间变化，而hoth噪声的频谱特征是固定的(因为公式(1)中的滤波器系数是常量)，因此，hoth噪声与背景噪声的频谱特征不匹配，意味着near-end语音中存在着两种时间上相互交替出现的背景噪声，这种背景噪声会恶化语音质量。(2)hoth噪声与背景噪声的能量水平不匹配，主要由于hoth噪声使用固定的能量水平，而背景噪声的能量水平是随周围环境变化的，因此，hoth噪声无法与多变的背景噪声的能量水平相匹配，则可能会出现人为产生的“凸凹不平”的噪声现象，影响语音质量。

发明内容

本发明实施方式的目的是提供一种舒适噪声生成方法、生成器及回声抵消装置，能生成与背景噪声的频谱特征、能量水平均匹配的作为补偿噪声的舒适噪声，避免因生成的补偿用舒适噪声与背景噪声的频谱特征、能量水平不匹配，出现不良噪声影响语音质量的问题。

本发明的目的是通过以下技术方案实现的：

本发明实施方式提供一种舒适噪声生成器，包括：

背景噪声估计模块，用于判断输入信号的当前帧信号是否是背景噪声，若是，则在频域对所述当前帧信号的频谱特征与能量水平进行估计，得到频谱特征估计值和能量水平估计值；

白噪声生成模块，用于在频域生成白噪声；

白噪声整形模块，用于根据所述背景噪声估计模块得到的所述频谱特征估计值和能量水平估计值，对所述白噪声生成模块生成的所述白噪声进行整形后得到舒适噪声，得到的所述舒适噪声的频谱特征和能量水平均与是背景噪声的所述当前帧信号相匹配；

舒适噪声填充模块，用于在确认需用舒适噪声填充时，用整形后得到的所述舒适噪声对残留回声抑制后输出的频域信号的当前帧信号进行填充。

本发明实施方式还提供一种舒适噪声生成方法，包括：

判断输入信号的当前帧信号是否是背景噪声，若是，则在频域对所述当前帧信号的频谱特征与能量水平进行估计，得到频谱特征估计值和能量水平估计值；

在频域生成白噪声；

根据得到的所述频谱特征估计值和能量水平估计值，对在频域生成的所述白噪声进行整形后得到舒适噪声，所述舒适噪声的频谱特征和能量水平均与是背景噪声的所述当前帧信号相匹配；

在确认需用舒适噪声填充时，用整形后得到的所述舒适噪声对残留回声抑制后输出的频域信号的当前帧信号进行填充。

本发明实施方式进一步提供一种回声抵消装置，包括：

自适应滤波器，用于在时域对输入信号进行线性回声抑制并输出；

频域转换处理模块，用于将所述自适应滤波器处理后输出的时域信号转换成频域信号；

非线性处理器，用于对所述频域转换处理模块转换的频域信号进行残留回声抑制并输出；

舒适噪声生成器，采用上述的舒适噪声生成器，用于在确定输入信号的当前帧信号是背景噪声时，生成与是背景噪声的所述当前帧信号的频谱特征、能量水平相匹配的舒适噪声，并在确定非线性处理器输出的信号中需用舒适噪声填充处，用生成的所述舒适噪声填充；

时域转换处理模块，用于将所述舒适噪声生成器填充所述舒适噪声后输出的频域信号转换成时域信号后输出。

由上述本发明实施方式提供的技术方案可以看出，本发明实施方式通过背景噪声估计模块准确估计输入信号的背景噪声的频谱特征和能量水平，从而通过白噪声整形模块将估计得到的频谱特征估计值和能量水平估计值，应用于白噪声生成模块在频域生成的白噪声后，形成频谱特征及能量水平均与背景噪声相匹配的舒适噪声，解决了因生成的舒适噪声的频谱特征与能量水平与背景噪声不匹配，导致将生成的舒适噪声填充到输入信号中后影响语音质量的问题。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他附图。

图1为现有技术提供的免提语音通信系统中产生的回声的示意图；

图2为现有技术提供的免提语音通信系统设置AEC模块的示意图；

图3为现有技术提供的AEC模块的舒适噪声生成器的示意图；

图4为本发明实施例一提供的舒适噪声生成器的结构框图；

图5为本发明实施例一提供的舒适噪声生成器的背景噪声估计模块的结构框图；

图6为本发明实施例一提供的背景噪声估计模块的判断子模块的结构框图；

图7为本发明实施例一提供的背景噪声估计模块的估计处理子模块的结构框图；

图8为本发明实施例二提供的舒适噪声生成方法的流程图；

图9为本发明实施例二提供的舒适噪声生成器内部处理流程图；

图10为本发明实施例二提供的舒适噪声生成方法中判断当前帧信号是否是背景噪声的流程图；

图11为本发明实施例二提供的舒适噪声生成方法中确认当前帧信号是否是背景噪声的判断流程图；

图12为本发明实施例二提供的舒适噪声生成方法的判断是否允许填充背景噪声的流程图；

图13为本发明实施例三提供的回声抵消装置的结构框图；

图14为本发明实施例提供的回声抵消装置内部的结构示意图。

具体实施方式

下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明的保护范围。

下面将结合附图对本发明实施例作进一步地详细描述。

实施例一

本实施例提供一种舒适噪声生成器，可用在AEC模块中作为AEC模块的CNG子模块，如图4所示，该舒适噪声生成器包括：

背景噪声估计模块1，用于判断输入信号(语音通信中传输的信号)的当前帧信号是否是背景噪声，如果是，则在频域对所述输入信号的当前帧信号的频谱特征与能量水平进行估计，得到频谱特征估计值和能量水平估计值；其中，输入信号包括：经线性回声抑制后输出的时域信号和频域信号；

若该背景噪声估计模块1判断结果为当前帧信号不是背景噪声，则舒适噪声生成器不对输入信号的当前帧信号的频谱特征与能量水平进行估计；

白噪声生成模块2，用于在频域生成白噪声；

白噪声整形模块3，用于根据所述频谱特征估计值和能量水平估计值，对所述白噪声进行整形后得到舒适噪声，得到的所述舒适噪声的频谱特征和能量水平均与所述当前帧信号(即背景噪声)相匹配；

舒适噪声填充模块4，用于在确认残留回声抑制后输出的频域信号的当前帧信号需用舒适噪声填充时，用所述白噪声整形模块整形后得到的所述舒适噪声填充。

上述舒适噪声生成器中的背景噪声估计模块1的构成，如图5所示，包括：

判断子模块11，用于判断所述输入信号的当前帧信号是否是背景噪音，如果是，则确定允许对所述当前帧信号进行估计，若否，则确定不允许对所述当前帧信号进行估计；

估计处理子模块12，用于在所述判断子模块11判断确定允许对所述当前帧信号进行估计时，在频域对所述当前帧信号的频谱特征与能量水平进行估计，得到背景噪声的频谱特征估计值和能量水平估计值。

上述背景噪声估计模块的判断子模块11的构成，如图6所示，包括：

能量计算子模块111，用于计算得出输入信号的当前帧信号的能量值；

最大值计算子模块112，用于计算得出当前帧信号所处的滑窗的帧信号中的最大能量值；

在本发明实施例中，所述滑窗中包括当前帧信号以及当前帧信号之前的N-1个帧信号，N为预设值。

最小值计算子模块113，用于计算得所述滑窗的帧信号中的最小能量值；

判断处理子模块114，用于根据计算得出的所述当前帧信号的能量值、所述滑窗的帧信号中的最大能量值、所述滑窗的帧信号中的最小能量值和设定的常数门限值，来判断当前帧信号是否是背景噪声。

在本发明实施例中，判断所述当前帧信号是否为背景噪声包括：

判断所述当前帧信号所处的滑窗的帧信号中的最大能量值和最小能量值的差值是否小于预设的第一常数门限值；

判断所述当前帧信号的能量值是否小于预设的第二常数门限值，

如果当前帧信号所处的滑窗的帧信号的最大能量值和最小能量值的差值小于预设的第一常数门限值，并且所述当前帧信号的能量值小于预设的第二常数门限值，则当前帧信号为背景噪声，否则当前帧信号不是背景噪声。具体可通过下述判断式进行判断，若判断结果为是，则当前帧信号是背景噪声，若判断结果为否，则当前帧信号不是背景噪声，判断式如下：

((maxE-minE)＜Th1)&&(E(k)＜Th2)

其中，Th1为第一常数门限值，Th2为第二常数门限值，连接符&&表示左、右两个不等式之间是与的关系，maxE为输入信号的滑窗的帧信号中的最大能量值，minE为输入信号的滑窗的帧信号中的最小能量值，E(k)为输入信号的当前帧信号的能量值。在本发明实施例中，所述Th1与Th2可根据所在语音通信系统的情况及对处理的语音质量要求进行设定，如设定的Th1的值越大，则当前帧信号被确认为背景噪声的可能性越大(如Th1过大会将语音也作为背景噪声)，而设定的Th2的值越大，则能估计背景噪声的幅度越大；具体可参见图11的流程图，在判断上述判断式结果为是时，将标志位Vad_flag置1，表示判断结果是背景噪声；若判断上述判断式结果为否时，将标志位Vad_flag置0，表示判断结果不是背景噪声。

上述判断子模块11还可以包括：子带信号能量计算子模块115，用于计算对应最小能量值的一帧信号的每个子带信号的能量值。

上述背景噪声估计模块的估计处理子模块12的构成，如图7所示，包括：

频谱特征估计值处理子模块121，用于在判断子模块判断当前帧信号是背景噪声时，按下述公式2：noise_band(w)_k＝(1-alpha)×noise_band(w)_k-1+alpha×minP(w)，1＜＝w＜＝64，计算得出当前帧信号的频谱特征估计值；所述公式2中，noise_band(w)_k为当前帧信号的频谱特征估计值，noise_band(w)_k-1为过去一帧信号的频谱特征估计值，w表示子带序号，k表示当前帧信号的序号，alpha为设定的平滑系数，minP(w)为当前帧信号所处的滑窗中的最小能量值的帧信号的第w个子带的能量值；

能量水平估计值处理子模块122，用于在判断子模块判断当前帧信号是背景噪声时，按下述公式3：noise_floor_k＝(1-alpha)×noise_floor_k-1+alpha×minE，计算得出所述当前帧信号的能量水平估计值；所述公式3中，noise_floor_k为当前帧信号的能量水平估计值，noise_floor_k-1过去一帧信号的能量水平估计值，k表示当前帧信号的序号，alpha为设定的平滑系数，minE为当前帧信号所处的滑窗的帧信号中的最小能量值。

上述舒适噪声生成器中的白噪声生成模块2在频域生成白噪声的方式具体如下：

采用线性同余法生成3个独立的均匀分布随机序列：

w0(n)＝[a0×w0(n-1)+b0]MOD(M0)；

w1(n)＝[a1×w1(n-1)+b1]MOD(M1)；

w2(n)＝[a2×w2(n-1)+b2]MOD(M2)；

对上述生成的3个独立的均匀分布随机序列w0(n)、w1(n)、w2(n)进行线性组合：w(n)＝alpha0×w0(n)+alpha1×w1(n)+alpha2×w2(n)，得到时域的白噪声序列w(n)(1＜＝n＜＝128)；

其中，MOD为取模操作，M0、M1、M2为取模运算的分母，均为常量，如可取16字节内的较大的质数，并使M0、M1、M2均不相同；a0、a1、a2为取模运算的分子中的步长因子，均为常量；b0、b1、b2为取模运算的分子的初始值，均为常量；alpha0、alpha1、alpha2为加权系数，均为常量，alpha0、alpha1、alpha2三者之和为1.0；

上述生成白噪声的方式与现有生成白噪声的技术基本相同，是通过取模运算生成3个伪随机序列w0(n)、w1(n)和w2(n)后，再通过三个加权系数alpha0、alpha1、alpha2按权重使3个伪随机序列w0(n)、w1(n)和w2(n)形成一个随机性更强的随机序列w(n)作为白噪声序列；

与现有技术不同的是：在上述生成时域的白噪声序列w(n)(1＜＝n＜＝128)后，按下述公式将时域的白噪声序列w(n)赋值给频域的作为白噪声序列的复数信号wn(w)，包括：

w＝n；

wn(w)的实部＝w(n)，1＜＝n＜＝64；

wn(w)的虚部＝w(n)，65＜＝n＜＝128；

经上述赋值后，即得到频域的白噪声。

上述舒适噪声生成器中的白噪声整形模块3可通过下述公式4，对白噪声进行整形处理后，得到频谱特征和能量水平均与背景噪声相匹配的舒适噪声；

cn (w) = \sqrt{noise_{floor}_{n}} \times wn (w) \times \sqrt{noise_band {(w)}_{n}},

1＜＝w＜＝64(公式4)

上述公式4中，w表示子带序号，cn(w)为得到的当前帧信号的第w个子带的舒适噪声，noise_floor_k为所述当前帧信号的能量水平估计值，wn(w)为所述白噪声生成模块生成的所述白噪声，noise_band(w)_k为所述当前帧信号的频谱特征估计值。

本发明实施例的舒适噪声生成器通过背景噪声估计模块准确估计输入信号中的背景噪声的频谱特征和能量水平，从而通过白噪声整形模块将估计得到的背景噪声的频谱特征估计值和能量水平估计值，应用于白噪声生成模块在频域对白噪声整形得到频谱特征及能量水平均与背景噪声相匹配的舒适噪声，解决了现有技术中因生成的舒适噪声的频谱特征与能量水平与背景噪声不匹配，导致将生成的舒适噪声填充到输出信号中后影响语音质量的问题。

实施例二

本实施例提供一种舒适噪声生成方法，是基于上述实施例一给出的舒适噪声生成器生成舒适噪声的方法，如图8、9所示，该方法包括：

步骤S1，判断输入信号的当前帧信号是否是背景噪声，若是，则在频域对所述当前帧信号的频谱特征与能量水平进行估计，得到频谱特征估计值和能量水平估计值；其中，输入信号包括：线性回声抑制后输出的时域信号和频域信号；

步骤S2，在频域生成白噪声；

步骤S3，根据得到的所述频谱特征估计值和能量水平估计值，对在频域生成的所述白噪声进行整形后得到舒适噪声，所述舒适噪声的频谱特征和能量水平均与是背景噪声的所述当前帧信号相匹配；

步骤S4，在确认需用舒适噪声填充时，用整形后得到的所述舒适噪声对残留回声抑制后输出的频域信号的当前帧信号进行填充。

上述方法中，步骤S1中判断输入信号的当前帧信号是否是背景噪音，如果是，则允许对所述当前帧信号的频谱特征与能量水平进行估计，如何不是，则不允许对所述当前帧信号的频谱特征与能量水平进行估计。

其中，上述步骤S1具体可采用如图10所示的步骤，包括：VAD(Voice ActivationDetection，语音活动侦测)判断步骤和背景噪声频谱特征与能量水平的估计与更新步骤；

其中，VAD判断步骤具体包括：步骤S11和步骤S12，

步骤S11，计算输入信号的当前帧信号的能量值E(k)、输入信号的当前帧信号所处的滑窗(该滑窗包括当前帧信号及当前帧信号之前的N-1个帧信号)的帧信号中的最大能量值maxE及最小能量值minE；

(1)计算输入信号的当前帧信号的能量值E(k)，可以设定为包括80个采样点作为一帧数据，按下述公式计算当前帧信号的能量E(k)：

E (k) = Σ_{n = k * 80 - 80}^{n = k * 80 - 1} e {(n)}^{2}

其中，k为当前帧信号的序号，e(n)为当前帧的时域采样信号，n为采样点的序号；

(2)计算输入信号的当前帧信号所处的滑窗(该滑窗包括当前帧信号及当前帧信号之前的N-1个帧信号)的帧信号中的最大能量值maxE，可按下述公式计算：

maxE＝max(E(i))，k＜＝i＜＝k-(N-1)

其中，k为当前帧信号的序号，N为常数，N可以设为100；

(3)计算输入信号的当前帧信号所处的滑窗(该滑窗包括当前帧信号及当前帧信号之前的N-1个帧信号)的帧信号中的最小能量值minE，可按下述公式计算：

minE＝min(E(i))，k＜＝i＜＝k-(N-1)

其中，k为当前帧信号的序号，N为常数，N可以设为100；

步骤S12，根据计算得出的所述当前帧信号的能量值E(k)、所述滑窗中的最大能量值maxE、所述滑窗中的最小能量值minE和设定的常数门限值Th1、Th2，确定当前帧信号是否是背景噪声；具体可采用下述判断式来判断当前帧信号是否是背景噪声，若判断结果为是，则当前帧信号是背景噪声，若判断结果为否，则当前帧信号不是背景噪声，判断式如下：

((maxE-minE)＜Th1)&&(E(k)＜Th2)

上述判断式中，通过选取输入信号中随时间滑动的滑窗(滑窗包括当前帧信号及当前帧信号之前的N-1个帧信号，N为预设值)，利用该滑窗中的最大能量值和最小能量值，可以准确判断出当前帧信号是否是背景噪声。Th1与Th2为常数门限值，Th1与Th2可根据所在语音通信系统的情况及对处理的语音质量要求进行设定，如设定的Th1的值越大，则当前帧信号被确认为背景噪声的可能性越大(如Th1过大会将语音也作为背景噪声)，而设定的Th2的值越大，则能估计背景噪声的幅度越大；连接符&&表示左、右两个不等式之间是与的关系；具体可参见图11的流程图，在判断上述判断式结果为是时，将标志位Vad_flag置1，表示判断结果是背景噪声；若判断上述判断式结果为否时，将标志位Vad_flag置0，表示判断结果不是背景噪声。

上述步骤S11中，还可以包括：按下述公式计算得出当前帧信号所处的滑窗中的最小能量值的帧信号的每个子带信号的能量minP(w)的步骤，公式为：

minP(w)＝|e2(w)|²，1＜＝w＜＝64

其中，e2(w)为NLP模块输出的频域信号，即进行残留回声抑制后输出的频域信号。

上述方法的步骤S1中，在频域对所述当前帧信号的频谱特征与能量水平进行估计，得到频谱特征估计值和能量水平估计值中，当前帧信号的频谱特征估计值，按下述公式2计算得出：

noise_band(w)_k＝(1-alpha)×noise_band(w)_k-1+alpha×minP(w)，1＜＝w＜＝64(公式2)

上述公式2中，noise_band(w)_k为当前帧信号的频谱特征估计值，noise_band(w)_k-1为过去一帧信号的频谱特征估计值，w表示子带序号，k表示当前帧信号的序号，alpha为设定的平滑系数，minP(w)为当前帧信号所处的滑窗中的最小能量值的帧信号的第w个子带的能量值；

当前帧信号的能量水平估计值按下述公式3计算得出：

noise_floor_k＝(1-alpha)×noise_floor_k-1+alpha×minE (公式3)

上述公式3中，noise_floor_k为当前帧信号的能量水平估计值，noise_floor_k-1过去一帧信号的能量水平估计值，k表示当前帧信号的序号，alpha为设定的平滑系数，minE为输入信号的当前帧信号所处的滑窗(该滑窗包括当前帧信号及当前帧信号之前的N-1个帧信号)的帧信号中的最小能量值。

通过上述步骤S1的处理后，可以准确估计出输入信号中的背景噪音的频谱特征和能量水平，以用于后续对生成的白噪声整形得到频谱特征和能量水平均与背景噪音相匹配的舒适噪音。

上述步骤S2中的在频域生成白噪声，具体可采用线性同余法生成3个独立的均匀分布随机序列w0(n)、w1(n)、w2(n)：

w0(n)＝[a0×w0(n-1)+b0]MOD(M0)；

w1(n)＝[a1×w1(n-1)+b1]MOD(M1)；

w2(n)＝[a2×w2(n-1)+b2]MOD(M2)；

对上述生成的3个独立的均匀分布随机序列w0(n)、w1(n)、w2(n)进行线性组合：w(n)＝alpha0×w0(n)+alpha1×w1(n)+alpha2×w2(n)，得到时域的白噪声序列w(n)(1＜＝n＜＝128)；其中，MOD为取模操作，M0、M1、M2为取模运算的分母，均为常量，如可取16字节内的较大的质数，并使M0、M1、M2均不相同；a0、a1、a2为取模运算的分子中的步长因子，均为常量；b0、b1、b2为取模运算的分子的初始值，均为常量；alpha0、alpha1、alpha2为加权系数，均为常量，alpha0、alpha1、alpha2三者之和为1.0；

w＝n；

wn(w)的实部＝w(n)，1＜＝n＜＝64；

wn(w)的虚部＝w(n)，65＜＝n＜＝128；

赋值后即得到在频域的白噪声。

上述方法步骤S3中的根据所述背景噪声估计模块输出的背景噪声的频谱特征估计值和能量水平估计值与所述白噪声生成模块生成的白噪声形成频谱特征和能量水平均与语音信号中的背景噪声相匹配的舒适噪声包括：

通过公式4对白噪声整形处理后，即得到频谱特征和能量水平均与语音信号中的背景噪声相匹配的舒适噪声；

cn (w) = \sqrt{noise_{floor}_{k}} \times wn (w) \times \sqrt{noise_band {(w)}_{k}},

1＜＝w＜＝64(公式4)

上述公式4中，w表示子带序号，cn(w)为得到的当前帧信号的第w个子带的舒适噪声，noise_floor_k为所述当前帧信号的能量水平估计值，wn(w)为在频域生成的白噪声，noise_band(w)_k为所述当前帧信号的频谱特征估计值。

上述方法的步骤S4，在在确认需用舒适噪声填充时，用整形后得到的所述舒适噪声对残留回声抑制后输出的频域信号的当前帧信号进行填充的处理流程如图12所示，当填充标志StFlag＝1时，则用当前帧信号的第w个子带的舒适噪声cn(w)填充输出的当前帧信号，即输出out(w)＝cn(w)，否则使输出out(w)＝e2(w)(e2(w)为NLP模块输出的频域信号，即进行残留回声抑制后输出的频域信号)。

本实施例的方法中，通过准确估计输入信号的背景噪声的频谱特征和能量水平，从而可将估计得到的背景噪声的频谱特征估计值和能量水平估计值，应用于在频域生成的白噪声后，得到频谱特征及能量水平均与背景噪声相匹配的舒适噪声，解决了现有技术中因生成的舒适噪声的频谱特征与能量水平与背景噪声不匹配，导致将生成的舒适噪声填充到信号中后影响语音质量的问题。

实施例三

本实施例提供一种回声抵消装置，用在语音通信终端或系统中，对语音信号进行处理，提高语音质量，如图13所示，该回声抵消装置包括：

自适应滤波器21，用于对输入信号的时域信号进行线性回声抑制后输出；

频域转换处理模块22，用于将所述自适应滤波器处理后输出的时域信号转换成频域信号；该频域转换处理模块22可采用快速傅里叶变换(FFT)方式将所述自适应滤波器21处理后输出的时域信号转换成频域信号；

非线性处理器23，用于对所述频域转换处理模块22转换后输出频域信号进行残留回声抑制后输出；

舒适噪声生成器24，采用上述实施例一给出的舒适噪声生成器，用于在确定输入信号的当前帧信号是背景噪声时，生成与是背景噪声的所述当前帧信号的频谱特征、能量水平相匹配的舒适噪声，并在确定非线性处理器输出的信号中需用舒适噪声填充处，用生成的所述舒适噪声填充后输出；

时域转换处理模块25，用于将所述舒适噪声生成器填充所述舒适噪声后输出的频域信号转换成时域信号后输出。该时域转换处理模块可采用快速傅里叶逆变换(IFFT)方式将所述舒适噪声生成器向背景噪声中填充舒适噪声后输出的频域信号转换成时域信号后输出。

本实施例的回声抵消装置，通过设置频域转换处理模块可将自适应滤波器处理后输出的时域信号转换成频域信号后，再由非线性处理器和舒适噪声生成器进行处理，并且，由于舒适噪声生成器可以准确估计输入信号的背景噪声的频谱特征和能量水平，从而通过将估计得到的背景噪声的频谱特征估计值和能量水平估计值，应用于在频域生成的白噪声后，形成频谱特征及能量水平均与背景噪声相匹配的舒适噪声，解决了现有技术中因生成的舒适噪声的频谱特征与能量水平与背景噪声不匹配，导致将生成的舒适噪声填充到输出信号中后影响语音质量的问题。该回声抵消装置由于在频域进行NLP处理能够对子带进行残留回声的抑制，可以比在时域处理获得更好的语音质量；并且在频域做背景噪声估计，比时域更稳定，实现也更简单。该回声抵消装置可用在语音通信终端或系统中，抑制声学回声或电学回声。

下面结合图14，以回声抵消装置对输入信号(语音通信系统中传输的信号)的处理过程为例，对上述回声抵消装置及舒适噪声生成器进一步说明。

该回声抵消装置可作为ACE模块，具体是由Adapative Filter模块(自适应滤波器)、NLP模块(非线性处理器)、CNG模块(舒适噪声生成器)组成，由AdapativeFilter模块与NLP之间设置FFT模块(频域转换处理模块)，CNG模块输出端设有IFFT模块(时域转换处理模块)，使得NLP与CNG在频域实现。

图14中，x(n)表示far-end信号，d(n)表示near-end信号，d(n)＝y(n)+v(n)+z(n)，y(n)表示x(n)产生的回声，v(n)表示near-end侧的人发出的说话声，z(n)表示near-end侧的背景噪声。

n表示时域中的采样点序号，w表示当前帧频域信号的子带序号。

在图14所示的AEG模块中，Adapative Filter模块计算出回声估计信号y_est(n)，运算d(n)-y_est(n)完成线性回声的抑制，并作为FFT模块的输入；

FFT模块的输出信号是e1(w)，FFT模块的功能是将e(n)变换到频域，在频域完成NLP模块的处理与CNG模块的舒适噪声补偿处理，FFT模块的阶数是128；

NLP模块负责残留回声的抑制，其输出是e2(w)信号；

CNG模块负责产生与背景噪声频谱特征、能量水平相匹配的舒适噪声，并且将舒适噪声插入到near-end语音中去；CNG模块的输入有4个信号，分别是NLP模块的输入信号e1(w)与输出信号e2(w)、NLP模块输出的语音单讲标志StFlag、FFT模块的输入信号e(n)，CNG模块的输出信号是out(w)；

IFFT模块完成将频域信号转换成时域信号，IFFT模块的输入是CNG模块输出的out(w)信号，IFFT模块的输出是out(n)信号。

其中，CNG模块的内部处理流程图可参见图9，其输入信号包括e1(w)、e2(w)与StFlag，输出信号是IFFT模块的输入信号；CNG模块包括四个子模块，分别是“背景噪声估计模块”，“白噪声生成模块”，“白噪声整形模块”，“舒适噪声填充模块”；

其中，背景噪声估计模块的输入信号是e1(w)和e(n)，输出信号是背景噪声的频谱特征估计值noise_band(w)_k和背景噪声的能量水平估计值noise_floor_k；

该背景噪声估计模块的功能是判断输入信号的当前帧信号是否是背景噪声，若是则估计并更新背景噪声的频谱特征估计值和能量水平估计值，达到准确估计并跟踪背景噪声的频谱特征和能量水平的目的。该背景噪声估计模块两个子模块，判断子模块和估计处理子模块，其中，判断子模块主要是进行VAD判断，并根据判断结果输出vad_flag标志位，以使估计处理子模块根据vad_flag标志位，确定是否进行背景噪声的频谱特征与能量水平的估计与更新。

判断子模块进行VAD判断的功能是判断当前帧信号是语音还是背景噪声，如果是背景噪声，则输出vad_flag＝1，否则vad_flag＝0，若vad_flag＝1表示可以进行背景噪声估计；

VAD判断的流程如下：

(1)计算当前帧信号(一般设定为包括80个采样点为一帧信号)的能量E(k)，k为当前帧信号的序号，e(n)为当前帧信号的时域采样点信号，n为采样点的序号(即图14中的e(n))：

E (k) = Σ_{n = k * 80 - 80}^{n = k * 80 - 1} e {(n)}^{2}

(2)计算输入信号的当前帧信号所处的滑窗(该滑窗包括：当前帧信号及当前帧信号之前的N-1个帧信号)的帧信号中的最大能量值与最小能量值：

maxE＝max(E(i)) k＜＝i＜＝k-(N-1)

minE＝max(E(i)) k＜＝i＜＝k-(N-1)

并可计算当前帧信号所处滑窗中的最小能量值的帧信号的每个子带信号的能量minP(w)：

minP(w)＝|e2(w)|² 1＜＝w＜＝64

其中，e2(w)为NLP模块输出的频域信号，即在进行残留回声抑制后输出的频域信号。

(3)vad标志(vad_flag)判决采用图10的流程进行判断，即对判断式“((maxE-minE)＜Th1)&&(E(k)＜Th2)”进行判断，若判断的结果为是，则vad_flag＝1，表示当前帧信号是背景噪声，可以进行频谱特征与能量水平的估计与更新；否则vad_flag＝0，表示当有帧信号不是背景噪声，而是语音，不允许进行频谱特征与能量水平的估计与更新。

上述各步骤处理用到的公式中，N为常数，如N可以设为100；Th1与Th2为常数门限值，Th1与Th2可根据所在语音通信系统的情况及对处理的语音质量要求进行设定，如设定的Th1的值越大，则当前帧被确认为背景噪声的可能性越大(如Th1过大会将语音也作为背景噪声)，而设定的Th2的值越大，则能估计背景噪声的幅度越大；连接符&&表示左、右两个不等式之间是与的关系，maxE为输入信号的当前帧信号所处滑窗的帧信号中的最大能量值，minE为输入信号的当前帧信号所处滑窗的帧信号中的最小能量值，E(k)为输入信号的当前帧信号的能量值。

该背景噪声估计模块的估计处理子模块能实现在允许背景噪声估计时，对背景噪声进行估计，得出当前帧信号(是背景噪声)的频谱特征估计值和能量水平估计值，具体如下：

当判断子模块输出的vad_flag等于1时，则通过下述公式估计得出当前帧信号的频谱特征估计值noise_band(w)_k和能量水平估计值noise_floor_k，并对新得到的频谱特征估计值noise_band(w)_k和能量水平估计值noise_floor_k对上一帧信号的频谱特征估计值(noise_band(w)_k-1)和能量水平估计值(noise_floor_k-1)进行更新，公式如下：

noise_floor_k＝(1-alpha)×noise_floor_k-1+alpha×minE

noise_band(w)_k＝(1-alpha)×noise_band(w)_k-1+alpha×minP(w)，1＜＝w＜＝64

上述公式中，k为当前帧信号的序号，minE为输入信号的当前帧信号所处滑窗的帧信号中的最小能量值；minP(w)为当前帧信号所处的滑窗中的最小能量值的帧信号的第w个子带的能量值，w为子带序号，1＜＝w＜＝64；alpha为平滑系数，如alpha可设为0.1。

白噪声生成模块无输入信号，其输出信号为在频域生成的白噪声wn(w)；该白噪声生成模块的功能是在频域生成白噪声，可采用线性同余法生成3个独立的均匀分布随机序列：

w0(n)＝[a0×w0(n-1)+b0]MOD(M0)；

w1(n)＝[a1×w1(n-1)+b1]MOD(M1)；

w2(n)＝[a2×w2(n-1)+b2]MOD(M2)；

与现有技术不同的是：将上述生成时域的白噪声序列w(n)(1＜＝n＜＝128)，按下述公式将时域的白噪声序列w(n)赋值给频域的作为白噪声序列的复数信号wn(w)，包括：

w＝n；

wn(w)的实部＝w(n)，1＜＝n＜＝64；

wn(w)的虚部＝w(n)，65＜＝n＜＝128；

赋值后即得到频域的白噪声。

白噪声整形模块的输入信号是wn(w)、noise_floor_k与noise_band(w)_k，输出信号是频谱特征和能量水平均与背景噪声相同的的当前帧信号的第w个子带的舒适噪声cn(w)。白噪声整形模块的功能是利用noise_floor_k与noise_band(w)_k对白噪声的频谱进行修正得到舒适噪声，使得到的舒适噪声与背景噪声的频谱特征相同，并使得到的舒适噪声与背景噪声的能量水平相同，具体按下述公式进行处理：

cn (w) = \sqrt{noise_{floor}_{k}} \times wn (w) \times \sqrt{noise_band {(w)}_{k}},

1＜＝w＜＝64。

舒适噪声填充模块的输入是cn(w)、e2(w)与StFlag，输出信号是out(w)，out(w)作为IFFT模块的输入信号。该舒适噪声填充模块的功能是在需要填充舒适噪声的输出信号的当前帧信号填充白噪声整形模块整形得到的当前帧信号的第w个子带的舒适噪声cn(w)。舒适噪声填充模块的处理流程如图12所示，当插入标志StFlag＝1时，则用得到的当前帧信号的第w个子带的舒适噪声cn(w)填充，即输出out(w)＝cn(w)，否则使输出out(w)＝e2(w)(e2(w)为NLP的输出信号)。

使用该回声抵消装置进行处理，可产生与背景噪声频谱特征和能量水平均相同的舒适噪声，避免了舒适噪声出现幅度上的“凸凹不平”现象与频谱上的不匹配，影响语音质量的问题。

本发明实施例的舒适噪声生成器可应用于手机中的AEC、VOIP电话中的AEC模块、视频会议系统的AEC模块中，也可应用于语音通信系统中需要填充舒适噪声的其他模块中，如VOIP中丢帧补偿，需要填充舒适噪声时，均可使用该舒适噪声生成器。

综上所述，本发明实施例中的舒适噪声生成器通过准确估计语音信号的背景噪声的频谱特征和能量水平，从而将估计得到的背景噪声的频谱特征估计值和能量水平估计值，应用于在频域生成的白噪声后，形成频谱特征及能量水平均与背景噪声相匹配的舒适噪声，解决了现有技术中因生成的舒适噪声的频谱特征与能量水平与背景噪声不匹配，导致将生成的舒适噪声插入到语音信号中后影响语音质量的问题。

本领域普通技术人员可以理解实现上述实施例中涉及的处理流程的全部或部分步骤是可以通过程序来指令相关硬件完成，所述的程序可以存储于一可读取存储介质中，所述的存储介质可以是如：ROM/RAM、磁碟、光盘等的存储介质。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求书的保护范围为准。

Claims

1.一种舒适噪声生成器，其特征在于，包括：

白噪声生成模块，用于在频域生成白噪声；

2.根据权利要求1所述的舒适噪声生成器，其特征在于，所述背景噪声估计模块包括：

判断子模块，用于判断输入信号的当前帧信号是否是背景噪音；

估计处理子模块，用于在所述判断子模块判断当前帧信号是背景噪音时，在频域对所述当前帧信号的频谱特征与能量水平进行估计，得到频谱特征估计值和能量水平估计值。

3.根据权利要求2所述的舒适噪声生成器，其特征在于，所述判断子模块包括：

能量计算子模块，用于计算得出输入信号的当前帧信号的能量值；

最大值计算子模块，用于计算得出当前帧信号所处的滑窗的帧信号中的最大能量值；所述滑窗包括所述当前帧信号，以及所述当前帧信号之前的N-1个帧信号，N为预设值；

最小值计算子模块，用于计算得出当前帧信号所处的滑窗中的最小能量值；所述窗包括当前帧信号，以及所述当前帧信号之前的N-1个帧信号，N为预设值；

判断处理子模块，用于根据计算得出的所述当前帧信号的能量值、所述当前帧信号所处的滑窗的帧信号中的最大能量值、所述当前帧信号所处的滑窗的帧信号中的最小能量值，确定输入信号的当前帧信号是否是背景噪声。

4.根据权利要求2所述的舒适噪声生成器，其特征在于，所述估计处理子模块包括：

频谱特征估计值处理子模块，用于在判断子模块判断当前帧信号是背景噪音时，按下述公式2：noise_band(w)_k＝(1-alpha)×noise_band(w)_k-1+alpha×minP(w)，1＜＝w＜＝64，计算得出所述当前帧信号的频谱特征估计值；所述公式2中，noise_band(w)_k为所述当前帧信号的频谱特征估计值，noise_band(w)_k-1为过去一帧信号的频谱特征估计值，w表示子带序号，k表示当前帧信号的序号，alpha为设定的平滑系数，minP(w)为当前帧信号所处的滑窗中的最小能量值的帧信号的第w个子带的能量值；

能量水平估计值处理子模块，用于在判断子模块判断当前帧信号是背景噪音时，按下述公式3：noise_floor_k＝(1-alpha)×noise_floor_k-1+alpha×minE，计算得出所述当前帧信号的能量水平估计值；所述公式3中，noise_floor_k为所述当前帧信号的能量水平估计值，noise_floor_k-1过去一帧信号的能量水平估计值，k表示当前帧信号的序号，alpha为设定的平滑系数，minE为当前帧信号所处的滑窗的帧信号中的最小能量值。

5.根据权利要求1所述的舒适噪声生成器，其特征在于，所述白噪声生成模块在频域生成白噪声包括：

采用线性同余法生成3个独立的均匀分布随机序列：

w0(n)＝[a0×w0(n-1)+b0]MOD(M0)；

w1(n)＝[a1×w1(n-1)+b1]MOD(M1)；

w2(n)＝[a2×w2(n-1)+b2]MOD(M2)；

对上述生成的3个独立的均匀分布随机序列w0(n)、w1(n)、w2(n)进行线性组合：w(n)＝a1pha0×w0(n)+a1pha1×w1(n)+alpha2×w2(n)，得到时域的白噪声序列w(n)(1＜＝n＜＝128)；

其中，MOD为取模操作，M0、M1、M2为取模运算的分母，均为常量；a0、a1、a2为取模运算的分子中的步长因子，均为常量；b0、b1、b2为取模运算的分子的初始值，均为常量；alpha0、alpha1、alpha2为加权系数，均为常量，alpha0、alpha1、alpha2三者之和为1.0；

在上述生成时域的白噪声序列w(n)(1＜＝n＜＝128)后，按下述公式将时域的白噪声序列w(n)赋值给频域的作为白噪声序列的复数信号wn(w)，包括：

w＝n；

wn(w)的实部＝w(n)，1＜＝n＜＝64；

wn(w)的虚部＝w(n)，65＜＝n＜＝128。

6.根据权利要求1所述的舒适噪声生成器，其特征在于，所述白噪声整形模块通过公式4：

cn (w) = \sqrt{{noise_floor}_{k}} \times wn (w) \times \sqrt{{noise_band (w)}_{k}},

对所述白噪声生成模块生成的所述白噪声整形处理后，得到频谱特征和能量水平均与是背景噪声所述当前帧信号的频谱特征和能量水平相匹配的舒适噪声，

其中，w表示子带序号，cn(w)为得到的当前帧信号的第w个子带的舒适噪声，noise_floor_k为所述当前帧信号的能量水平估计值，wn(w)为所述白噪声生成模块生成的对应于第w个子带的白噪声，noise_band(w)_k为所述当前帧信号的第w个子带的频谱特征估计值。

7.一种舒适噪声生成方法，其特征在于，包括：

在频域生成白噪声；

8.根据权利要求7所述的舒适噪声生成方法，其特征在于，所述判断输入信号的当前帧信号是否是背景噪音包括：

计算输入信号的当前帧信号的能量值、输入信号的当前帧信号所处的滑窗的帧信号中的最大能量值、所述当前帧信号所处的滑窗的帧信号中的最小能量值；其中，所述滑窗包括所述当前帧信号，以及所述当前帧信号之前的N-1个帧信号，N为预设值；

根据计算得出的所述当前帧信号的能量值、所述当前帧信号所处的滑窗的帧信号中的最大能量值、所述当前帧信号所处的滑窗的帧信号中的最小能量值和设定的常数门限值，确定输入信号的当前帧信号是否是背景噪声。

9.根据权利要求8所述的舒适噪声生成方法，其特征在于，所述计算输入信号的当前帧信号的能量值包括：

以80个采样点作为一帧信号，按下述公式计算当前帧信号的能量E(k)：

E (k) = Σ_{n = k * 80 - 80}^{n = k * 80 - 1} e {(n)}^{2}

其中，k为当前帧信号的序号，e(n)为当前帧信号的时域采样点信号，n为采样点序号。

10.根据权利要求9所述的舒适噪声生成方法，其特征在于，所述计算输入信号的当前帧信号所处的滑窗的帧信号中的最大能量值包括：

按下述公式计算当前帧信号所处的包括当前帧信号以及所述当前帧信号之前的N-1个帧信号的滑窗的帧信号中的最大能量值maxE：

maxE＝max(E(i))，k＜＝i＜＝k-(N-1)

其中，k为当前帧信号序号，N为常数。

11.根据权利要求9所述的舒适噪声生成方法，其特征在于，所述输入信号的当前帧信号所处的滑窗的帧信号中的最小能量值包括：

按下述公式计算当前帧信号所处的包括当前帧信号以及所述当前帧信号之前的N-1个帧信号的滑窗的帧信号中的最小能量值minE：

minE＝min(E(i))，k＜＝i＜＝k-(N-1)

其中，k为当前帧信号的序号，N为常数。

12.根据权利要求9所述的舒适噪声生成方法，其特征在于，所述判断输入信号的当前帧信号是否是背景噪音还包括：

按下述公式计算得出当前帧信号所处滑窗中的最小能量值的帧信号的每个子带信号的能量minP(w)的步骤，公式为：

minP(w)＝|e2(w)|²，1＜＝w＜＝64；

所述公式中，w为子带的序号，e2(w)为进行残留回声抑制后输出的频域信号。

13.根据权利要求9所述的舒适噪声生成方法，其特征在于，所述根据计算得出的所述当前帧信号的能量值、所述当前帧信号所处的滑窗的帧信号中的最大能量值、所述当前帧信号所处的滑窗的帧信号中的最小能量值和设定的常数门限值，确定输入信号的当前帧信号是否是背景噪声包括：

通过下述判断式进行判断，若判断结果为是，则当前帧信号是背景噪声，若判断结果为否，则当前帧信号不是背景噪声，判断式如下：

((maxE-minE)＜Th1)&&(E(k)＜Th2)

上述判断式中，Th1与Th2为常数门限值，maxE为输入信号的当前帧信号所处的滑窗的帧信号中的最大能量值，minE为输入信号的当前帧信号所处的滑窗的帧信号中的最小能量值，E(k)为输入信号的当前帧信号的能量值。

14.根据权利要求7所述的舒适噪声生成方法，其特征在于，所述得到频谱特征估计值和能量水平估计值包括：

频谱特征估计值按公式2：noise_band(w)_k＝(1-alpha)×noise_band(w)_k-1+alpha×minP(w)，1＜＝w＜＝64，计算得出；所述公式2中，noise_band(w)_k为当前帧信号的频谱特征估计值，noise_band(w)_k-1为过去一帧信号的频谱特征估计值，w表示子带序号，k表示当前帧信号的序号，alpha为设定的平滑系数，minP(w)为计算得出的当前帧信号所处的滑窗中的最小能量值的帧信号的第w个子带的能量值；

能量水平估计值按公式3：noise_floor_k＝(1-alpha)×noise_floor_k-1+alpha×minE，计算得出；所述公式3中，noise_floor_k为当前帧信号的能量水平估计值，noise_floor_k-1过去一帧信号的能量水平估计值，k表示当前帧信号的序号，alpha为设定的平滑系数，minE为计算得出的输入信号的当前帧信号所处的滑窗的帧信号中的最小能量值。

15.根据权利要求7所述的舒适噪声生成器，其特征在于，所述在频域生成白噪声包括：

采用线性同余法生成3个独立的均匀分布随机序列：

w0(n)＝[a0×w0(n-1)+b0]MOD(M0)；

w1(n)＝[a1×w1(n-1)+b1]MOD(M1)；

w2(n)＝[a2×w2(n-1)+b2]MOD(M2)；

其中，MOD为取模操作，M0、M1、M2为取模运算的分母，均为常量；a0、a1、a2为取模运算的分子中的步长因子，，均为常量；b0、b1、b2为取模运算的分子的初始值，均为常量；alpha0、alpha1、alpha2为加权系数，均为常量，alpha0、alpha1、alpha2三者之和为1.0；

w＝n；

wn(w)的实部＝w(n)，1＜＝n＜＝64；

wn(w)的虚部＝w(n)，65＜＝n＜＝128。

16.根据权利要求7所述的舒适噪声生成方法，其特征在于，所述根据得到的频谱特征估计值和能量水平估计值，对在频域生成的所述白噪声进行整形舒适噪声，所述舒适噪声的频谱特征和能量水平均与是背景噪声的所述当前帧信号相匹配包括：

按公式4：

cn (w) = \sqrt{{noise_floor}_{k}} \times wn (w) \times \sqrt{{noise_band (w)}_{k}},

1＜＝w＜＝64，对所述白噪声进行整形处理后，得到频谱特征和能量水平均与是背景噪声的所述当前帧信号相匹配的舒适噪声；

所述公式4中，w表示子带序号，cn(w)为得到的当前帧信号的第w个子带的舒适噪声，noise_floor_k为当前帧信号的能量水平估计值，wn(w)为在频域生成的白噪声，noise_band(w)_k为当前帧信号的频谱特征估计值。

17.一种回声抵消装置，其特征在于，包括：

自适应滤波器，用于对输入信号的时域信号进行线性回声抑制后输出；

频域转换处理模块，用于将所述自适应滤波器处理后输出的时域信号转换成频域信号后输出；

非线性处理器，用于对所述频域转换处理模块转换后输出的频域信号进行残留回声抑制后输出；

舒适噪声生成器，采用上述权利要求1～6任一项所述的舒适噪声生成器，用于在确定输入信号的当前帧信号是背景噪声时，生成与是背景噪声的所述当前帧信号的频谱特征、能量水平相匹配的舒适噪声，并在确定非线性处理器输出的信号中需用舒适噪声填充处，用生成的所述舒适噪声填充后输出；

18.根据权利要求17所述的回声抵消装置，其特征在于，所述频域转换处理模块为采用快速傅里叶变换方式将所述自适应滤波器处理后输出的时域信号转换成频域信号。

19.根据权利要求17所述的回声抵消装置，其特征在于，所述时域转换处理模块为采用快速傅里叶逆变换方式将所述舒适噪声生成器填充所述舒适噪声后输出的频域信号转换成时域信号。