WO2008138263A1

WO2008138263A1 - Procédé et dispositif de génération de paramètres de bruit de confort

Info

Publication number: WO2008138263A1
Application number: PCT/CN2008/070925
Authority: WO
Inventors: Wei Li; Xiaogang Sun; Li Liu; Junbin Cao; Qing Zhang; Lijing Xu; Jianfeng Xu; Zhengzhong Du; Chen Hu; Lei Miao; Yi Yang
Original assignee: Huawei Technologies Co., Ltd.
Priority date: 2007-05-11
Filing date: 2008-05-09
Publication date: 2008-11-20
Also published as: CN101303855B; CN101303855A

Description

一种舒适噪声参数产生方法和装置技术领域

本发明涉及音频处理技术，特别涉及一种舒适噪声参数产生方法和装置。背景技术

在当前的移动通信系统中，通常釆用 DTX ( Discontinuous Transmission, 不连续传输模式）对语音信息进行传输。所谓 DTX, 是指在语音暂停的情况下，发送方移动终端（以下简称发送端）只发送相对于正常情况下极少的数据量，而接收方移动终端（以下简称接收端）根据接收到的数据中所包含的参数产生舒适噪声。这种方式有利于节省移动终端和基站的电能以及带宽，并降低传输数据的比特率和减少冲突，从而保证移动通信的通信质量。

在 DTX传输模式中，当语音暂停时，伴随语音信息一起传输的背景噪声也会随之消失，造成背景噪声的不连续性。如果这种切换快速发生，尤其是当发生在车用环境中或是背景噪声水平比较高的时候，会给接收端用户造成主观感觉上语音质量的严重下降。为避免这种情况的发生，在语音暂停的情况下，发送端会计算背景噪声的参数, 比如信号帧的能量参数以及 LPC ( Linear Prediction Coding, 线性预测编码）参数，并且将计算出的参数以非常低的码率传输至接收端。接收端利用接收到的参数尽可能地重构出接近于发送端背景噪声的舒适噪声。具体来说，接收端产生高斯随机噪声信号，通过生成的高斯随机噪声信号激励 LPC滤波器，并根据接收自发送端的能量参数，合成舒适噪声信号，以消除切换造成的影响，从而使用户有更舒适的现有技术中比较常用的舒适噪声生成方法为自适应多速率宽带编码方法。该方法中发送端通过计算当前帧以及之前的 7帧（以下简称前 8 帧）的平均值，得到代表当前背景噪声的 SID ( Silence Descriptor, 静音描述）帧中的能量参数 e« 。"和频谱参数 f^msan ,接收端根据接收到的 e _g ^a"和 f ^mean生成舒适噪声。

现有技术通过在接收端生成舒适噪声，解决了当语音暂停的情况下，接收端用户主观感觉上语音质量下降的问题。但是，这种方法技术难度大，实现较为复杂。发明内容

有鉴于此，本发明实施例的主要目的在于提供一种舒适噪声参数产生方法，以便于能够简单方便地生成舒适噪声参数。

本发明实施例的另一个目的在于提供一种舒适噪声参数产生装置，应用该装置能够简单方便地生成舒适噪声参数。

一种舒适噪声参数产生方法，该方法包括以下步骤：

获取包括当前帧的一组连续帧中各帧的能量特征值以及频谱特征值；

从所述获取的各帧能量特征值中选择一个能量特征值，作为当前舒适噪声的能量参数；

从所述获取的各帧频谱特征值中选择一个频谱特征值，将所述选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数。

一种舒适噪声参数产生装置，所述装置，包括：获取模块，用于获取包括当前帧的一组连续帧中各帧的能量特征值以及频谱特征值 , 并将获取到的各帧的能量特征值以及频谱特征值分别输出至所述能量参数生成模块以及频谱参数生成模块；

能量参数生成模块，用于接收来自所述获取模块的各帧的能量特征值，并从所述各帧的能量特征值中选择一个能量特征值，作为当前舒适噪声的能量参数；

频谱参数生成模块，用于接收来自所述获取模块的各帧的频谱特征值，并从所述各帧的频谱特征值中选择一个频谱特征值，将所述选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数。

一种舒适噪声参数产生方法，包括以下步骤：

接收发送端将语音暂停之后的一组连续帧按照语音帧编码输出的静音描述 SID帧；

根据所述 SID帧获取当前舒适噪声的能量参数和频谱参数；根据所述当前舒适噪声的能量参数和频谱参数生成舒适噪声。一种舒适噪声参数产生装置，所述装置，包括：

能量参数获取模块，用于接收发送端输出的 SID 帧，获取所述 SID帧对应的一组连续帧中各帧的能量参数，并选取所述一组连续帧最后一帧的能量参数作为当前舒适噪声的能量参数；

频谱参数接收模块，用于接收发送端输出的 SID 帧，获取所述 SID帧对应的一组连续帧中各帧的频语参数，并选取所述一组连续帧最后一帧的频谱参数作为当前舒适噪声的频谱参数；

舒适噪声生成模块，用于根据所述当前舒适噪声的能量参数和频谱参数生成舒适噪声。

一种舒适噪声参数产生系统，包括：发送端和接收端；所述发送端，用于生成当前舒适噪声的能量参数和频谱参数，并将生成的能量参数和频谱参数生成 SID帧发送给接收端；

所述接收端，用于接收接收端发送 SID帧，获取当前舒适噪声的能量参数和频谱参数，根据所述能量参数以及频谱参数生成舒适噪声。

可见，釆用本发明实施例的技术方案，在获取包括当前帧的一组连续帧的能量特征值以及频谱特征值以后，从中选择出最能代表当前背景噪声水平的能量特征值以及频谱特征值对应的帧的能量以及倒谱频率参数作为生成当前舒适噪声的参数。与现有技术中的舒适噪声参数生成方法相比，本发明实施例所述方法无需进行剔除频谱差异较大帧以及求倒谱频率参数均值的运算，从而实现简单方便地生成所需舒适噪声参数。附图说明

图 1为现有接收端舒适噪声生成过程示意图；

图 2为本发明方法实施例的总体流程图；

图 3为本发明方法较佳实施例的流程图；

图 4为本发明装置实施例发送端的组成结构示意图；

图 5为本发明装置实施例接收端的组成结构示意图；

图 6为本发明系统实施例中舒适噪声生成系统的结构示意图。具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下参照附图并举实施例，对本发明作进一步地详细说明。

本发明实施方式中，获取包括当前帧的一组连续帧中各帧的能量特征值以及频谱特征值；从所述获取的各帧能量特征值中选择一个能量特征值，作为当前舒适噪声的能量参数；从所述获取的各帧频谱特征值中选择一个频语特征值，将选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数。

图 2为本发明方法实施例的总体流程图。本发明方法实施例应用于移动通信系统中的语音通信发生暂停的情况下。如图 2所示，该方法包括以下步骤：

步骤 S201: 计算当前一组连续帧中各帧的能量特征值以及频谱特征值。

本步骤中，各帧的能量特征值是指各帧的能量值 e _g(0, 计算方式如公式（9)所示： en_loB(i) = (9)

其中，为经过高通滤波后的语音帧信号， ^为每一帧的釆样点数目。

各帧的频谱特征值是指各帧与除自身以外的其它帧的总频谱差 AS, , 计算方式为：

首先，计算各帧相互之间的频谱差 .，计算方式如公式（10) 所示：

然后，计算总频谱差计算方式如公式（11 )所示：

M,.= ∑ Δ^_}. (ID 其中，公式（10)和（11 ) 中，的取值范围为从零到 N; N 的取值为当前一组连续帧中所包括的帧的个数减一；为第 i帧的 ISF ( Immittance Spectral Frequency, 导抗谱频率 )参数矢量的第 k个值。步骤 S202: 从计算出的各帧能量特征值中选择出一个能量特征值，作为当前舒适噪声的能量参数输出；从计算出的各帧频谱特征值中选择出一个频谱特征值，将选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数输出。本步骤中，对计算出的各帧的按照大小顺序进行排序，并选择排序后处于中间位置的作为当前舒适噪声的能量参数。

从计算得到的各帧的总频谱差 Μ,.中选出取值最小的 Μ,. , 并选择取值最 d、的 Μ,.对应的帧的 I SF参数作为当前舒适噪声的频谱参数。

上述步骤 S201和 S202均是由发送端完成的。在得到所需的能量参数以及频谱参数以后，发送端向接收端发送携带有能量参数以及频谱参数的 SID帧。接收端接收该 SID帧，并根据其中的能量参数和频谱参数生成舒适噪声。

需要说明的是，在实际应用中，语音暂停之后的 7个连续帧被称为 Hangover, 对于这 7个连续帧，发送端仍然会按照语音帧的方式进行编码和传输，这种情况下，接收端可以直接获得这 7帧的参数。由于 Hangover作为语音信号的语尾，一般情况下越是往后的帧会越接近纯背景噪声，所以，本发明实施例中，接收端接收并选取七个连续帧中最后一帧的能量特征值和倒谱频率参数作为当前舒适噪声的能量参数和频谱参数，并根据所述能量参数和频谱参数生成舒适噪声。

图 3为本发明方法较佳实施例的流程图。本实施例中，将每 8个连续帧（当前帧以及之前 7帧，以下简称前 8帧）看成一组连续语音帧，即针对每 8帧计算一次舒适噪声参数。如图 3所示，包括以下步骤：

步骤 S301 : 发送端按照普通的语音帧处理方式对语音暂停之后的 7个连续帧进行编码并传输至接收端。

步骤 S302: 接收端选取最后一帧的能量和 ISF参数作为生成舒适噪声的能量参数和频谱参数。

由于 Hangover作为语音信号的语尾，一般情况下越往后的帧越接近纯背景噪声，所以，本步骤中，接收端直接选取接收到的 7个连续帧中的最后一帧的能量参数和 ISF 参数作为生成舒适噪声的能量参数和频谱参数。

步骤 S303: 接收端生成舒适噪声。

本步骤中，接收端根据步骤 S302中获取到的能量参数和频谱参数生成舒适噪声，生成方式与现有技术相同。

步骤 S304: 发送端生成能量参数。

本步骤中，发送端计算前 8帧中每一帧的能量值 ^e"i。g⁽) , 计算方式如公式（9) 所示。然后，对计算出的每一帧的^ · = 0,...,7按照升序顺序进行排序， 4艮设排序后的各帧能量值为 e«；。 _gC/) ( = 0,...,7 ), 则选取处于中间位置的^ ( 作为生成舒适噪声的能量参数^^ 。

本实施例中，假设选取排序后位于第四个位置上的 e«；。 _g(j')作为 e * , 则有： o _g(3)。

步骤 S305: 发送端生成频谱参数。

本步骤中，发送端首先计算前 8帧相互之间的频谱差 .，计算方式 ¾口公式 ( 12 )所示：

AR_1]

= 0,...,7J = 0,...,7,i≠j (12) 其中是第 i帧的 ISF参数矢量的第 A个值。

然后，计算第 ⁷'帧与其它 7帧的总频谱差 Μ,.，计算公式如公式（ 13 ) 所示： M,. = Z / = 0, ..., 7, = 0, ..., 7 ( 13 )

J=0,j≠i

计算出各帧的 M,.后，发送端从中选出取值最小的一个 AS,. , 记为 m_n , 并用 M_mn对应的帧的 ISF参数 /( )作为当前生成舒适噪声的频谱参数 f^back , 即 f^back = f(i)。

步骤 S306: 发送端向接收端发送 SID帧。

SID 帧中携带有生成的反映背景噪声水平的能量参数 <^ck以及频谱参数 f^hack。

步骤 S307: 接收端生成舒适噪声。

本步骤中，接收端生成舒适噪声的方式与现有技术相同，此处不再赘述。

后续过程，发送端和接收端之间不断重复步骤 S304 ~ S307。基于上述方法，如图 4所示，为本发明装置实施例发送端的组成结构示意图。该装置包括：获取模块 401、能量参数生成模块 402以及频谱参数生成模块 403 , 其中：

获取模块 401 , 用于获取包括当前帧的一组连续帧中各帧的能量特征值以及频谱特征值，并将获取到的各帧的能量特征值以及频谱特征值分别输出至能量参数生成模块 402以及频谱参数生成模块 403 ; 获取模块 401 还可进一步划分为能量参数获取模块以及频谱参数获取模块；

能量参数生成模块 402 , 用于接收来自获取模块 401的各帧的能量特征值，并从各帧的能量特征值中选择一个能量特征值，作为当前舒适噪声的能量参数；

频谱参数生成模块 403 , 用于接收来自获取模块 401的各帧的频谱特征值，并从各帧的频谱特征值中选择一个频谱特征值，将选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数。其中，各帧的能量特征值为各帧的能量值 e _g(0 ; 能量参数生成模块 402具体包括：排序模块 4021以及选择模块 4022:

排序模块 4021 , 用于接收来自获取模块 401的各帧的^{£ (} ) , 将各帧的按照大小顺序进行排序后发送至选择模块 4022;

选择模块 4022,用于从接收自排序模块 4021的排序后的 e _g ( )中选择处于中间位置的 e (0 , 作为当前舒适噪声的能量参数。

各帧的频谱特征值为各帧与除自身以外的其它帧的总频谱差 AS,；频谱参数生成模块 403用于接收来自获取模块 401的各帧的 Μ,.，选取各帧的 Μ,.中取值最小的 Μ,.对应的帧的 ISF参数作为当前舒适噪声的频谱参数。

基于上述方法，如图 5所示，为本发明装置实施例接收端的组成结构示意图。该装置包括：频谱参数接收模块 501、能量参数获取模块 502和舒适噪声生成模块 503 , 其中：

频谱参数接收模块 501 , 用于接收发送端输出的 SID帧，获取所述 SID帧对应的一组连续帧中各帧的频谱参数，并选取所述一组连续帧最后一帧的频谱参数作为当前舒适噪声的频谱参数。

能量参数获取模块 502, 用于接收发送端输出的 SID帧，获取所述 SID帧对应的一组连续帧中各帧的能量参数，并选取所述一组连续帧最后一帧的能量参数作为当前舒适噪声的能量参数。

舒适噪声生成模块 503 , 用于根据所述当前舒适噪声的能量参数和频谱参数生成舒适噪声。

将上述发送端和接收端应用到实际移动通信系统中，可得到如图 6所示的系统结构示意图。该系统包括：发送端 601和接收端 602。其中：

发送端 601 , 用于生成当前舒适噪声的能量参数和频谱参数，并将生成的能量参数和频谱参数生成 SID帧发送给接收端 602。

接收端 602, 用于接收接收端 601发送 SID帧，获取当前舒适噪声的能量参数和频谱参数，根据所述能量参数以及频谱参数生成舒适噪声。

可见，釆用本发明实施例的技术方案，在获取包括当前帧的一组连续帧的能量特征值以及频谱特征值以后，从中选择最能代表当前背景噪声水平的能量特征值以及频谱特征值对应的帧的能量以及 ISF 参数作为生成当前舒适噪声的参数。相比于现有技术中的舒适噪声参数生成方法，本发明实施例方法无需进行剔除频谱差异较大帧以及求 ISF参数平均值的运算，从而实现了简单方便地生成所需舒适噪声参数。

本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中，也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明可以通过硬件实现，也可以可借助软件加必要的通用硬件平台的方式来实现基于这样的理解，本发明的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质（可以是 CD-ROM, U盘，移动硬盘等）中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述的方法。

综上所述，以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

权利要求

1、一种舒适噪声参数产生方法，其特征在于，该方法包括以下步骤：

2、根据权利要求 1所述的方法，其特征在于，所述从获取的各帧能量特征值中选择一个能量特征值，作为当前舒适噪声的能量参数包括如下步骤：

对所述获取的各帧的能量特征值大小进行排序；

选取所述排序后处于中间位置的能量特征值作为所述当前舒适噪声的能量参数。

3、根据权利要求 2所述的方法，其特征在于，所述包括当前帧的一组连续帧包括八帧，所述选取排序后处于中间位置的能量特征值为排序后处于第四位置的能量特征值。

4、根据权利要求 1所述的方法，其特征在于，所述从获取的各帧频谱特征值中选取一个频谱特征值，将所述选择出的频谱特征值对应帧的倒谱频率参数作为当前舒适噪声的频谱参数包括如下步骤：从所述获取的各帧的总频谱差中选出取值最小的总频谱差；选择所述取值最小的总频谱差对应的帧的倒谱频率参数作为当前舒适噪声的频谱参数。

5、一种舒适噪声参数产生装置，其特征在于，所述装置包括：获取模块，用于获取包括当前帧的一组连续帧中各帧的能量特征值以及频谱特征值，并将获取到的各帧的能量特征值以及频谱特征值分别输出至所述能量参数生成模块以及频谱参数生成模块；

能量参数生成模块，用于接收来自所述获取模块的各帧的能量特征值，并从所述各帧的能量特征值中选择出一个能量特征值，作为当前舒适噪声的能量参数；

6、根据权利要求 5所述的装置，其特征在于，所述各帧的能量特征值为各帧的能量值^{£ (} )；所述能量参数生成模块具体包括：排序模块，用于接收来自所述获取模块的各帧的^{£ (} ) , 将所述各帧的 ^e"i。g ⁽ )按照大小顺序进行排序后发送至选择模块；

选择模块，用于从接收自所述排序模块的排序后的 ^e"i。g ⁽ )中选择出处于中间位置的，作为所述当前舒适噪声的能量参数。

7、根据权利要求 5或 6所述的装置，其特征在于，所述各帧的频谱特征值为各帧与除自身以外的其它帧的总频谱差 ^；

所述频谱参数生成模块具体用于，接收来自所述获取模块的各帧的 ^ , 选取所述各帧的^''中取值最小的^Δ ^对应的帧的倒谱频率参数作为当前舒适噪声的频谱参数。

8、一种舒适噪声产生方法，其特征在于，包括以下步骤：接收发送端将语音暂停之后的一组连续帧按照语音帧编码输出的静音描述 SID帧；

根据所述 SID帧获取当前舒适噪声的能量参数和频谱参数；根据所述当前舒适噪声的能量参数和频谱参数生成舒适噪声。

9、根据权利要求 8所述舒适噪声产生方法，其特征在于，所述根据 SID帧获取当前舒适噪声的能量参数和频谱参数，具体包括：根据所述 SID 帧获取所述一组连续帧中各帧的能量参数和频谱参数；

选取所述一组连续帧中最后一帧的能量参数和频谱参数作为当前舒适噪声的能量参数和频谱参数。

10、一种舒适噪声参数产生装置，其特征在于，所述装置，包括：能量参数获取模块，用于接收发送端输出的 SID 帧，获取所述

SID帧对应的一组连续帧中各帧的能量参数，并选取所述一组连续帧最后一帧的能量参数作为当前舒适噪声的能量参数；

频谱参数接收模块，用于接收发送端输出的 SID 帧，获取所述 SID帧对应的一组连续帧中各帧的频语参数，并选取所述一组连续帧最后一帧的频谱参数作为当前舒适噪声的频谱参数；舒适噪声生成模块，用于根据所述当前舒适噪声的能量参数和频谱参数生成舒适噪声。

11、一种舒适噪声参数产生系统，其特征在于，包括：发送端和接收端；

所述发送端，用于生成当前舒适噪声的能量参数和频谱参数，并将生成的能量参数和频谱参数生成 SID帧发送给接收端；