WO2008148321A1

WO2008148321A1 - Appareil de codage et de décodage et procédé de traitement du bruit de fond et dispositif de communication utilisant cet appareil

Info

Publication number: WO2008148321A1
Application number: PCT/CN2008/070886
Authority: WO
Inventors: Zhe Wang; Libin Zhang
Original assignee: Huawei Technologies Co., Ltd.
Priority date: 2007-06-05
Filing date: 2008-05-06
Publication date: 2008-12-11
Also published as: CN101320563A; CN101320563B

Description

一种背景噪声编码 /解码装置、方法和通信设备技术领域

本发明涉及语音通信技术，特别涉及一种背景噪声编码 /解码装置、方法和通信设备。背景技术

语音通信过程中，被传输的语音信号可以分为有声信号和无声信号两类，其中：有声信号是在检测到有效语音时发送的语音信号，主要包括通信方的语音以及当时的背景噪声等信息；无声信号在没有检测到有效语音的间隙发送的背景噪声信号，主要包括各种背景噪声，比如白噪声、背景嘈杂声和静音等。对通信双方来说，有声信号为有用信号，是主要通信信息的载体，而无声信号为无用信号，不包含主要通信信息。

在语音通信过程中，由于通信双方主要关注的是有用的有声信号，因此考虑到带宽的压力，不希望传送无用的无声信号，以降低传输带宽，增加系统容量。但是如果只传有声信号，会导致背景噪声的不连续，使收听的一方感觉非常不舒服，尤其在背景噪声较强的情况下更加明显，甚至会令语音难以理解，所以只能尽量减少传送无用的无声信号，在保证用户感受度的基础上尽量降低带宽，为此应运而生了 CNG ( Comfort Noise generation, 舒适噪声生成）技术， CNG技术中，发送端在无声信号阶段采用静音压缩编码技术编码背景噪声帧，并采用 DTX ( Discontinuous Transmission, 非连续传输 ) 方式传输，接收端采用内插的方式产生连续的背景噪声信号，以增加收听方的舒适感。

现有的背景噪声编码方式可对背景噪声进行筒单编码，并在解码端合成出筒单的舒适背景噪声，可以在一定程度上较好满足接听质量的要求。然而随着通信技术的发展，语音编码质量越来越高，相应的，有声阶段的背景噪声的编码质量也越来越高，在这种情况下，为使得语音通信时的背景噪声更加连续，也需要提高无声阶段背景噪声的编码质量。现有较为单一的 SID帧编码方式和非连续传输机制显然无法满足多种通信环境的具体要求。发明内容本发明实施例提供一种背景噪声编码 /解码装置、方法和通信设备，以实现根据通信环境的背景噪声情况灵活调整 SID 帧编码方式和非连续传输机制。

一种背景噪声编码装置，包括：

背景噪声分析单元，用于获取背景噪声信号的至少一个信号特征参数值；背景噪声分类单元，用于根据所述至少一个信号特征参数值确定背景噪声类型；

编码切换单元和至少两个非连续传输单元，所述编码切换单元用于根据所述背景噪声类型将背景噪声信号输入对应的非连续传输单元，每一个非连续传输单元用于将背景噪声信号编码为包含非连续传输单元指示信息的静音描述帧并非连续传输，其中各非连续传输单元的静音描述帧编码方式和 /或静音描述帧非连续传输机制不相同。

一种背景噪声解码装置，包括：

第一识别单元，用于识别静音描述帧中的非连续传输单元指示信息；解码切换单元和至少两个舒适噪声生成单元，所述解码切换单元用于根据所述识别单元的识别结果，将所述静音描述帧输入对应的舒适噪声生成单元，每一个舒适噪声生成单元根据接收的静音描述帧的编码方式对应解码静音描述帧，并重构背景噪声信号。

一种通信设备，包括：

第一语音检测器，用于检测采集的信号中是否包含有效语音并分类输出；语音编码器，用于将包含有效语音的信号编码为语音帧并连续输出；还包括背景噪声编码装置，该背景噪声编码装置具体包括：背景噪声分析单元，用于获取不包含有效语音的背景噪声信号的至少一个信号特征参数值；

背景噪声分类单元，用于根据所述至少一个信号特征参数值确定背景噪声类型；

一种通信设备，包括背景噪声解码装置，所述背景噪声解码装置包括：第一识别单元，用于识别静音描述帧中的非连续传输单元指示信息；解码切换单元和至少两个舒适噪声生成单元，所述解码切换单元用于根据所述识别单元的识别结果，将所述静音描述帧输入对应的舒适噪声生成单元，每一个舒适噪声生成单元根据接收的静音描述帧的编码方式对应解码静音描述帧，并重构背景噪声信号。

一种背景噪声编码方法，包括：

获取背景噪声信号的至少一个信号特征参数值；

根据所述至少一个信号特征参数值确定背景噪声类型；

根据所述背景噪声类型选择一种非连续传输机制将背景噪声信号编码为包含非连续传输机制指示信息的静音描述帧并非连续发送，其中每一种非连续传输机制中的静音描述帧编码方式和 /或静音描述帧非连续发送方式不相同。

一种解码方法，包括：

识别静音描述帧中的非连续传输机制指示信息，其中每一种非连续传输机制中的静音描述帧编码方式不相同；

根据所述非连续传输机制指示信息，采用对应的解码方式解码静音描述帧，并重构为背景噪声信号。附图说明

图 1为本发明实施例的一个应用场景中采用静音压缩编码技术的通信系统原理示意图；

图 2、图 3、图 5和图 6分别为本发明实施例提供的一种背景噪声编码装置主要结构示意图；

图 4为本发明实施例提供的切换模式原理示意图；

图 7、图 8和图 9分别为本发明实施例提供的一种通信设备主要结构示意图。具体实施方式

进一步分析现有背景噪声编码，每一种编解码系统中都采用单一的背景噪声帧编码方式，无法针对性的描述各种特性的通信环境的具体背景噪声信号，从而满足通信环境多样性的需求；单一非连续传输机制也无法对不同特性的背景噪声帧有针对性的传输背景噪声帧，以至无法在解码端针对性的产生较好的舒适噪声；并且非连续传输机制的单一性也无法自适应于通信系统的实际状况，例如通信带宽，以至通信系统的资源不能被合理应用。

因此，本发明实施例提供的一种编解码技术方案，可以针对性的根据背景噪声特性进行相应处理，在编码端对背景噪声进行分析，根据背景噪声的特性采用不同的 DTX方案编码发送 SID帧，并在接收端采用相对应的 CNG 方案重构背景噪声信号。

如图 1所示，为本发明实施例的一个应用场景中采用静音压缩编码技术的通信系统原理示意图，其中，发送端包括：

VAD ( Voice Activity Detector, 语音检测器），原始信号经一定预处理后输入 VAD, VAD通常根据每一帧信号的特征值，例如信噪比，检测信号中是否包含有效语音，并根据检测结果将信号送入不同的编码器进行编码；语音编码器，用于将包含有效语音的有声信号编码为语音帧并输出，语音帧通过通信信道被传输给接收端；

非语音编码器，采用静音压缩技术将不包含有效语音的无声信号编码为背景噪声帧；

背景噪声帧发送器，采用设定的 DTX方式将背景噪声帧通过通信信道传输给接收端，例如每隔几帧发送一个背景噪声帧，或者根据背景噪声的特征参数变化情况决定是否发送一个背景噪声帧；

相应的，接收端包括：

语音解码器，用于解码从通信信道接收的语音帧，并重构为有声信号后输出；

非语音解码器，用于解码从通信信道接收的背景噪声帧；

重构器，用于采用内插的方式将解码数据重构为连续的背景噪声信号，以增加收听方的舒适感。

发送端的非语音编码器和背景噪声帧发送器组成 DTX单元，接收端的非语音解码器和重构器组成 CNG单元，静音压缩技术通过位于发送端的 VAD 和 DTX , 以及位于接收端的 CNG实现。

以常用的 CELP ( Code-Excited Linear Prediction, 码激励线性预测 )语音编码技术为例， CELP是一种高效率的语音编码技术。由于采用了感觉加权、分析合成、矢量量化和后滤波等技术， CELP能够在中低速率上给出高质量的合成语音。 CELP语音编码技术中，在发送端进行语音信号分析以获取语音的特征参数，将语音的特征参数编码到码流中发送；接收端根据码流中的特征参数进行语音合成，重构语音信号。语音信号被分成短的时间段，称为帧，发送端的语音分析和接收端的语音合成都是逐帧进行的。

在发送端，原始信号可以看成是一个激励信号激励一个滤波器所产生的输出，即^ = * ν(") , 接收端使用相同的滤波器对语音进行合成，称为合成滤波器。因此语音信号的编码码流中传输的特征参数包括合成滤波器参数和激励参数，其中：合成滤波器参数主要为线谱频率 LSF ( Line Spectrum Frequency )量化参数，而激励信号参数包括：自适应码本参数 (包括基音延迟参数和基音增益参数）和固定码本参数 (包括固定码本中非零脉沖的位置和符号以及固定码本增益参数）。

与语音编码参数不同，背景噪声编码参数描述的是背景噪声特性，由于背景噪声的激励信号可以认为是筒单的噪声随机序列，而这些序列在编解码端均可以筒单的用随机噪声产生装置产生，然后用能量参数控制这些序列的幅度，就可产生最终的激励信号，因此激励信号特征参数可以筒单的用能量参数来表示，而不需要用其它的一些特征参数来进一步描述，所以在背景噪声编码码流中与语音帧不同的是，其激励参数为当前背景噪声帧的能量参数；而背景噪声编码码流中与语音帧相同的是，编码码流中的合成滤波器参数也为线谱频率 LSF量化参数，只是具体的量化方法有所差别。通过以上分析，可以认为对背景噪声的编码方式本质上就是一种筒单的语音编码方式。

经 DTX压缩编码并被非连续传输的背景噪声帧一般称为 SID ( Silence Descriptor, 静音描述帧）帧。在当前的各种语音编码系统中，每一系统内的背景噪声信号都使用 SID帧格式和非连续传输机制。

其中， G.729B静音压缩方案是一种具有代表性的静音压缩技术， G.729B 是基于 CELP算法模型的，因此其所传输的背景噪声参数也是基于 CELP模型获取的，包括用于描述背景噪声的合成滤波器参数与激励参数。在编码端，例如 VAD的判决结果为 0时，表示当前的信号为噪声，则经一定预处理的原始信号被送入背景噪声编码装置，在背景噪声编码装置对背景噪声参数进行提取和量化，组成 SID帧，然后背景噪声编码装置 ^据 SID帧内的参数变化情况来决定是否发送一帧 SID帧，例如 SID帧中的滤波器参数和能量参数变化较大时发送一帧 SID帧。 G.729B中，两个相邻 SID帧的间隔至少为 2帧。在解码端，若进入背景噪声解码重构阶段，则在背景噪声解码装置中根据接收的 SID帧合成出描述编码端背景噪声特性的舒适噪声。 G.729B的 SID帧中为各参数分配的比特数如下表 1所示：

表 1.

AMR ( Adaptive Multi-Rate speech codec, 自适应多码率语音编码器）和 AMR-WB ( Adaptive Multi-Rate Wide Band speech codec, 宽带自适应多码率语音编码器 )静音压缩方案中的 DTX则采用固定的发送机制，无论背景噪声的特性如何变化，每 8帧发送一次 SID帧。 AMR的 SID帧中为各参数分配的比特数如下表 2所示， AMR-WB的 SID帧中为各参数分配的比特数如下表 3所示。

表 2.

比特分配（从高位到低位）参数描述

S1-S3 量化预测器索引

S4-S11 一級 LSF量化矢量索引

S12-S20 二級 LSF量化矢量索引

S21-S29 三級 LSF量化矢量索引

S30-S35 对数帧能量索引表 3.

比特分配（从高位到低位）参数描述

S1-S6 一級 LSF量化矢量索引

S7-S12 二級 LSF量化矢量索引

S13-S18 三級 LSF量化矢量索引

S19-S23 四級 LSF量化矢量索引 S24-S28 五級 LSF量化矢量索引

S29-S34 对数帧能量索引

S35 抖动标志如图 2所示，为本发明实施例提供的一种背景噪声编码装置 20, 该背景噪声编码装置 20用于静音压缩编码通信系统中，主要结构包括：

至少两个 DTX单元 21 , 包括 DTX单元 211、 DTX单元 2 12 DTX单元 21η,各 DTX单元 21用于根据不同的 DTX机制将背景噪声信号编码为 SID 帧并非连续输出，其中，不同的 DTX机制之间的区别包括： SID帧编码方式不相同、 SID帧非连续传输机制不相同，或者二者都不相同；

背景噪声分析单元 22, 用于根据背景噪声信号计算至少一个信号特征参数值；

背景噪声分类单元 23, 用于根据所述至少一个信号特征参数值确定背景噪声类型；

编码切换单元 24, 用于根据所述背景噪声类型将接收的背景噪声信号输入对应的 DTX单元 21。

背景噪声分析单元 22 的功能是分析输入的背景噪声信号以获得背景信号的特征参数，分析方法是计算出一个或多个能够表征背景噪声信号的信号特征参数值，这些信号特征参数可以是如下参数之一或任意组合：长时 SNR ( signal to Noise Ratio ), 背景噪声估计电平、背景噪声能量波动估计、背景噪声谱波动估计、背景噪声波动频率等。其它可以表征信号背景的大小、种类（稳态 /非稳态，变化大小，变化快慢）、 SNR (长时，短时，峰值）的参数也可以被计算出来用于分析。除将背景噪声信号输入背景噪声分析单元 22 外，还可以将 VAD判决当前信号是背景信号的指示信号输入背景噪声分析单元 22, 背景噪声分析单元 22根据背景噪声信号指示信息触发计算信号特征参数值。背景噪声分类单元 23的功能是根据背景噪声分析单元 22计算得到的信号特征参数值，划分当前背景噪声信号的类型。背景噪声类型至少定义两种，可以根据背景噪声的稳定与否定义，例如：将背景噪声划分为稳态背景噪声信号和非稳态背景噪声信号两类；又如根据背景噪声的稳定与否及长时 SNR 的大小定义：将背景噪声划分为稳态大 SNR背景噪声信号、稳态小 SNR背景噪声信号、非稳态大 SNR背景噪声信号、非稳态小 SNR背景噪声信号四类。还可以根据背景噪声所包含信息意义的大小定义背景噪声类型，比如背景噪声信号可被分为悦耳背景噪声信号（如音乐，流水，鸟语等）、环境背景噪声信号（如酒会，街边，机场等）或其它背景噪声信号三类。总之，背景噪声的划分类型可以根据需要设定，并不限定本发明技术方案的实施。

编码切换单元 24中预先存储了每一种背景噪声类型适用的 DTX单元 21 , 根据背景噪声分类单元 23确定的背景噪声类型，在至少两个 DTX单元 21之间进行切换，选择和当前背景噪声类型相对应的 DTX单元 21进行处理。

一般情况下各背景噪声类型分别对应一种不同的 DTX方案，但是考虑到具体通信场景的需求或通信信道资源变化情况，还可以设定不同的切换模式，每一种切换模式对应不同的切换控制方案，可以将每一种切换模式所对应的具体切换控制方案预先存储到编码切换单元 24中，并通过切换模式控制指令指示编码切换单元 24所需的切换模式，切换模式控制指令可以是反映当前信道资源状况的有限个指令集，每一特定的切换模式控制指令对应一种切换模式，即一种 DTX单元的分配方法。也可以在每一次切换模式控制指令时，将所需的切换模式对应的具体切换控制方案同时发送给编码切换单元 24。

编码切换单元 24根据具体原因的指示信息确定出对应切换模式。对于本领域技术人员来说，具体的切换模式转换控制方法很多，这里不再一一列举。

因此如图 3所示，图 2所示背景噪声编码装置 20中还可以增加设置指令接收单元 25, 接收切换模式控制指令并转发给编码切换单元 24, 切换模式控制指令可以是操作人员从外部输入的，也可以是发送端根据检测的信道资源情况产生等。

编码切换单元 24可以根据切换模式控制指令选择恰当的切换模式，任意两个切换模式之间至少有一个背景噪声类型对应的 DTX单元 21不相同。以背景噪声编码装置 20中包括四个 DTX单元 21为例，切换模式的设定例如图 4所示：

当没有设置指令接收单元 25时，编码切换单元 24仅根据背景噪声类型为背景噪声选择恰当的 DTX单元，例如切换模式 1;

当设置有指令接收单元 25时，编码切换单元 24根据切换模式控制指令确定选择 DTX单元的模式。例如：

接收到切换模式控制指令 1时，根据切换模式 1进行切换；

接收到切换模式控制指令 2时，根据切换模式 2进行切换；

接收到切换模式控制指令 3时，根据切换模式 3进行切换。

切换模式控制指令可以根据当前信道资源情况发出，例如当前信道资源紧张时，其中部分背景噪声类型的背景噪声可能使用同一个较低速率的 DTX 单元，甚至所有的背景噪声类型都使用最低速率 DTX单元。又例如，当没有切换模式控制指令时，只有其中部分 DTX单元会被使用，但当切换模式控制指令表示当前信道资源充裕或紧张时，另一部分 DTX单元被使用。

由图 4所示的例子可见：

指令 1指示进入切换模式 1 , 此时每一种背景噪声类型都对应一种不同的 DTX单元，指令 1可以是表示当前的信道资源正常；

指令 2指示进入切换模式 2, 此时部分背景噪声类型会对应相同的 DTX 单元，如背景噪声类型 1和背景噪声类型 2均对应 DTX单元 212, 背景噪声类型 3和背景噪声类型 4均对应 DTX单元 214, 指令 2可以表示当前信道资源较丰富（DTX单元 212较 DTX单元 211编码速率高，占用资源多； DTX 单元 214较 DTX单元 213编码速率高，占用资源多），或者可以表示当前信道资源较紧张（ DTX单元 212较 DTX单元 211编码速率的低，占用资源少； DTX单元 214较 DTX单元 213编码速率低，占用资源少；)；

指令 3指示进入切换模式 3, 此时所有的背景噪声类型均只对应 DTX单元 214, 指令 3可以表示当前信道资源十分丰富（DTX单元 214编码速率最高，占用资源最多 ), 或者可以表示当前信道资源十分紧张（DTX单元 214 编码速率最低，占用资源最少）。

如图 5所示，在当前信道资源非常充足或者背景噪声特别悦耳时，还可以在背景噪声编码装置 20中再设置语音编码器，利用语音编码器对特定背景噪声进行全速率编码。特定背景噪声的信号特征参数值满足设定条件，背景噪声分类单元 23 根据至少一个信号特征参数值是否满足设定条件来判断特定背景噪声类型，并指示编码切换单元 24在特定背景噪声时切换到语音编码器，语音编码器将该特定背景噪声信号编码为语音帧并连续输出。当然，也可以利用发送端已有的语音编码器 7 担该功能。

参阅图 1所示，每一个 DTX单元 21中包括两部分，其一为非语音编码器，用于将背景噪声信号编码为 SID帧，其二为背景噪声帧发送器，用于根据设定的非连续方式发送背景噪声帧。 DTX单元间的不同可以是 SID帧编码方式的不同，也可以是非连续传输机制的不同，或者二者皆不同。其中： SID

1、编码参数的不同

不同的 SID帧可以采用不同种类的参数和不同数量的参数；

2、相同参数量化精度的不同

对于同一参数不同 SID帧可以采用不同的量化精度；

因此，不同 SID帧编码方式产生的 SID帧的结构和长度可能不同，例如：稳态背景噪声信号噪声的编码参数可以相对筒单，参数的量化精度可以相对较低， SID 帧的长度可以相对较短。相对应的，非稳态背景噪声信号的编码参数可以相对较多，一种方法是在现有的 SID帧中增加语音编码参数中的激励参数，如自适应码本参数（基音延迟和增益）和固定码本参数（非零脉沖的位置和符号以及增益）等，参数的量化精度可以相对较高，如增加现有 SID 帧中滤波器参数和激励参数的量化精度等， SID 帧的长度也可相应增加。又如，悦耳背景噪声信号的 SID帧应使用最复杂的编码方式（可以是全速率编码），环境背景噪声信号的 SID帧使用次复杂的编码方式，其它背景噪声信号的 SID帧则使用较筒单的编码方式。

不同的背景噪声类型还可以使用不同的非连续传输机制，不同背景噪声类型的 SID帧发送机制的不同主要体现在相邻两个 SID帧的传输间隔上。例如对于稳态背景噪声信号，由于背景的变动较小，人类听觉系统对该类背景噪声经 DTX/CNG之后的质量下降敏感度不高，只需用相对较长的非连续传输间隔即可。对于非稳态背景噪声信号，由于背景在时间上的变动较大，为了保证该类背景噪声经 DTX/CNG之后能拥有一个较高的主观质量，需要使用相对较短的非连续传输间隔甚至是连续的传输。又如，对于悦耳背景，由于其本身的非噪声性质，主观质量的要求相当高，因此 DTX系统就需要将其进行连续的传输。对于环境背景噪声，由于其本身携带了一定的环境信息，为了确保不丟失这些信息， DTX系统也需要以较高的速度来更新 SID帧。对于其它背景噪声，由于还原背景的真实面貌并非主要的目的，因此 DTX系统就可以相对较慢的进行 SID帧的更新。

SID 帧的传输间隔分为固定传输间隔和自适应传输间隔两种。在固定传输间隔的机制下，相邻两个 SID帧间的间隔是固定的，间隔的大小就取决于背景噪声的类型。在自适应传输间隔的机制下，虽然 SID帧的发送是自适应于噪声变化的快慢，但也有最小传输间隔的限制。本发明实施例中，根据不同背景噪声类型可决定采用不同的最小间隔。

如图 6所示，为本发明提供的第一种通信设备的主要结构示意图，包括： VAD10、背景噪声编码装置 20、语音编码器 30和通信接口 40, 其中：

VAD10用于检测有效语音，将有声信号送入语音编码器 30编码为语音帧，通信接口通过通信信道发送语音帧；将背景噪声信号送入背景噪声编码装置 20,背景噪声编码装置 20输出 SID帧，通信接口通过通信信道发送 SID 帧。

背景噪声编码装置 20中，编码切换单元 24根据背景噪声信号的类型切换适用的 DTX单元 21。

如图 7所示，为本发明实施例提供的第二种通信设备主要结构示意图，其中：背景噪声编码装置 20中的编码切换单元 24根据指令接收单元 25的指令确定切换模式，并根据背景噪声信号的类型以及当前使用的切换模式切换适用的 DTX单元 21。

参见图 5所示，图 6和图 7所示的通信设备中的背景噪声编码装置 20中还可以设置语音编码器，语音编码器完成背景噪声的全速率编码。

如图 8所示，如果利用已有的语音编码器 30完成背景噪声的全速率编码，则编码切换单元 24连接到语音编码器 30上，将背景噪声信号送入语音编码器 30中编码为全速率的语音帧并连续输出。

采用本发明实施例提供的技术方案，需要对应每一种 SID帧的编码发送方式，在 SID帧中设置相应的 DTX单元指示信息， DTX单元指示信息供解码端确定对应的解码重构方案。对于语音帧，由语音解码器进行解码并连续输出。

由于背景噪声分析单元 22对计算背景特征参数值的计算和各 DTX单元 21在编码 SID帧时的部分计算相同，因此背景噪声分析单元 22还可以连接各 DTX单元 21 ,将分析计算结果输出给各 DTX单元 21 ,从而部分减少 DTX 单元 21的计算量。

如图 9所示，为本发明实施例提供的一种通信设备结构示意图，完成接收端功能的单元主要包括：背景噪声解码装置 50、识别单元 60、解码切换单元 70、语音解码器 80以及通信接口，其中：

该背景噪声解码装置 50中包括至少两个 CNG单元（51、 52...5n ), 每一个 CNG单元根据一种设定的解码重构方案解码 SID帧并重构为背景噪声；识别单元 60, 用于识别通过通信接口所接收的语音帧和 SID帧，并进一步识别 SID帧中的 DTX单元指示信息；

解码切换单元 70, 用于根据识别单元 60的识别结果进行切换，将语音帧送入语音解密器 80, 将 SID帧送入对应的 CNG单元进行解码重构。

其中，参阅图 1所示，每一个 CNG单元中包括非语音解码器，用于解码从通信信道接收的背景噪声帧；重构器，用于采用内插的方式将解码数据重构为连续的背景噪声信号，以增加收听方的舒适感。

识别单元 60首先识别接收到的编码帧是全速率编码的语音帧还是 SID帧并且若是 SID帧，进一步识别该 SID帧中的 DTX单元指示信息。在这里， SID帧的码流中应存在 1或几个用于携带 DTX单元指示信息的比特位，比特位的位置既可在 SID帧的开头也可在末尾，或者在 SID帧的其它指定位置，例如下表 3或表 4所示：

表 3.

识别单元 60中可以包括两个识别子单元，一个识别子单元用于识别接收到的编码帧是全速率编码的语音帧还是 SID帧，如果识别出语音帧则通知解码切换单元 70, 解码切换单元将语音帧送入语音解码器 80解码并连续输出；如果识别出是 SID帧，则将 SID帧送入另一个识别子单元进一步识别 SID帧中的 DTX单元指示信息。

由于不同的背景噪声类型有不同的 SID帧格式或更新机制，根据 DTX单元指示信息选择适当的 DTX解码方案解码 SID帧，不同解码方案中中的噪声内插方法不同，最终得到恢复出的舒适噪声。

通信设备可以即具备发送端功能，也可以具体接收端功能，图 9所示结构通常和图 7或图 8所示结构合并设置在一个通信设备中。

下面再以具体实施例进行详细说明。

实施例一

在编码端，背景噪声信号被逐帧输入背景噪声分析单元 22, 背景噪声分析单元 22计算每一个当前信号帧的子带电平 levd[k,i] , 其中 k和 i分别表示是第 i帧第 k子带的电平并保存在内存中。子带的计算可以通过滤波器组实现也可以通过变换的方法实现。

当信号帧积累够一定数量时，背景噪声分析单元 22开始根据保存在内存中的子带电平，计算背景噪声谱波动参数 ^ec— rar /，并在之后收到每一帧背景噪声帧时更新计算结果。

背景噪声谱波动参数 ^ec— rar /的计算方法为： spec _ var[/] =

其中 N为子带的数量， L为被选为做长时平均的背景噪声信号帧数量背景噪声谱波动参数 spec_var[i]的计算也可以于 LSF系数，即： spec _ var[/] = lsf[k, i]

其中 lsf[k,i]K i帧的第 k hf t, N为系数数量， L为被选为做长时平均的背景噪声信号帧数量。

背景噪声分析单元 22 将计算得到的背景噪声谱波动参数输出至背景噪声分类单元 23。

编码切换单元 24根据背景噪声分类单元 23输出的背景噪声类型信息为当前背景噪声帧选择对应的 DTX单元。

本实施例中，定义了两种背景类型：稳态背景噪声信号和非稳态背景噪声信号。背景噪声分类单元 23 通过将背景噪声谱波动参数与一个门限 spec— var— thr 做比较将当前背景噪声划归为稳态或非稳态中的一种。若 spec—var [i] < spec—var—thr , 当前背景噪声信号被归为稳态背景噪声信号，否则被归为非稳态背景噪声信号。

本实施例中， DTX系统有两种不同的工作方案：

方案一采用每 8帧发送一个 SID帧的非连续传输机制， SID帧中只包含滤波器和能量参数；

方案二采用每 3帧发送一个 SID帧的非连续传输机制， SID帧中除了包含滤波器，能量参数外还增加了固定码本参数 (属于激励参数）。

当前背景噪声属于稳态类时，编码切换单元 24选择工作方案一。当前背景噪声属于非稳态类时，编码切换单元 24选择工作方案二。

每种 SID帧组装时在帧内设置一个 DTX单元指示信息以声明该 SID帧属于哪种 DTX单元。本实施例中， DTX单元指示信息可以用 1比特来表示， 0和 1分别表示 DTX单元一和 DTX单元二。

在解码端，识别单元 60首先根据 SID帧中的 DTX单元指示信息判断出该 SID帧所属的 DTX单元，解码切换单元 70将 SID帧输入对应的 CNG单元 50进行解码重构。其中：

若 DTX单元指示信息为 0,对应的 CNG单元则按照上述 DTX工作方案一中的 SID帧格式解码得到滤波器参数和能量参数并对其后的 8个背景噪声信号帧进行内插；

若 DTX单元指示信息为 1 ,对应的 CNG单元则按照上述 DTX工作方案二中的 SID帧格式解码得到滤波器参数、能量参数和固定码本参数并对其后的 3个背景噪声信号帧进行内插。

实施例二

在编码端，背景噪声信号被逐帧输入至背景噪声分析单元 22, 背景噪声分析单元 22计算当前背景噪声信号帧的子带电平 level[k,i] , 帧能量 pow[i]和短时信噪比 ^wr T/, 并保存在内存中。其中：

子带电平 level[k， i]的计算可以通过滤波器组实现也可以通过变换的方法实现；帧能量的计算方式为： / ₀H{ ] = f w/[ ]² , 其中 N表示总的子带数；短时信噪比的计算方式为： [ ] = ^ , 其中 bckr _ noise _ po¾[i] bckr— noise _pow[i]为长时背景噪声能量估计。

当背景噪声信号帧积累够一定数量时，背景噪声分析单元 22开始根据保存在内存中的短时特征参数（子带电平，帧能量，短时信噪比）计算背景噪声能量波动 pow—var[i]、长时信噪比 snr—long[i]、长时背景噪声能量估计 bckr— noise _pow[i] , 并在收到每一个背景噪声信号帧时更新计算结果。

除长时信噪比以外，其余参数计算结果的更新仅发生在当前信号帧为背景噪声信号帧时，长时信噪比的更新仅发生在当前信号帧为非背景噪声信号帧时。

长时信噪比 s«r— 的计算方法为： s_nr lonsli] = ^m=i—^L+1

" L ，其中为被选为做长时平均的非背景噪声信号帧数量。

背景噪声能量波动 pow—var[i]的计方法为

，其中为被选为做长时平均的背景噪声信号帧数量。

长时背景噪声能量估计 bckr— noise ^mv T/的计算方法为：

bckr _ noise _ 个 0

到 1间的比例因子，本实施例中取值为 5 %。

背景噪声分析单元 22将计算得到的背景噪声能量波动 pow—ναφ] , 长时信噪比 ^r— 输出至背景噪声分类单元 23。

本实施例中，定义了四种背景类型：稳态大 SNR背景噪声信号、稳态小 SNR背景噪声信号、非稳态大 SNR背景噪声信号和非稳态小 SNR背景噪声信号。

背景噪声分类单元 23通过将 pow—var[i] 和 snr—long[i]分与一个能量波动门限 pow—var—thr和一个信噪比门限 snr—thr做比较，将当前背景噪声划归为 4种背景噪声类型种的一类，其中：

当 pow—var[ i] > pow—var—thr且 snr—long > snr—thr时, 当前背景为非稳、态大 SNR背景噪声信号；

当 pow var[i] >pow_var_thr且 snr—long < snr—thr时, 当前背景为非稳、态小 SNR背景噪声信号；

当 pow var[i] <pow_var_thr L snrjong >snr_thr H† , 当前背景为稳、态大 SNR背景噪声信号；

当 pow var[i] <pow_var_thr JL snrjong <snr_thr H† , 当前背景为稳、态小 SNR背景噪声信号。

本实施例中，一共有四种不同的 DTX单元，其中：

DTX单元一采用每 8帧发送一个 SID帧的非连续传输机制， SID帧中只包含滤波器参数和能量参数；

DTX单元二采用每 8帧发送一个 SID帧的非连续传输机制， SID帧中除包含滤波器参数和能量参数外还包含固定码本参数；

DTX单元三采用每 3帧发送一个 SID帧的非连续传输机制， SID帧中除包含滤波器参数和能量参数外还包含固定码本参数；

DTX单元四采用全速率编码的连续传输机制。

编码切换单元 24除了接收背景噪声分类单元 23的背景噪声类型信息外，还与一个切换模式控制指令接口相连。切换模式控制指令有 5种指示，分别表示带宽正常、带宽较多、带宽较少、带宽很多和带宽很少。

切换模式控制指令与 DTX系统的切换模式关系如下：

当切换模式控制指令表示带宽正常时， DTX系统的切换模式为：对稳态大 SNR类背景采用 DTX单元一；对稳态小 SNR类背景采用 DTX单元二；对非稳态大 SNR类背景采用 DTX单元三；对非稳态小 SNR类背景采用 DTX 单元四。

当切换模式控制指令表示带宽较多时， DTX系统的切换模式为：对稳态大 SNR类背景和稳态小 SNR类背景均采用 DTX单元二；对非稳态大 SNR 类背景和非稳态小 SNR类背景均采用 DTX单元四；

当切换模式控制指令表示带宽较少时， DTX系统的切换模式为：对稳态大 SNR类背景和稳态小 SNR类背景均采用 DTX单元一；对非稳态大 SNR 类背景和非稳态小 SNR类背景均采用 DTX单元三；

当切换模式控制指令表示带宽很多时， DTX系统的切换模式为：对四种背景噪声类型均采用 DTX单元四；

当切换模式控制指令表示带宽很少时， DTX系统的切换模式为：对四种背景噪声类型均采用 DTX单元一。

每种 SID帧组装时在帧内设置一个 DTX单元指示信息以声明该 SID帧属于哪种 DTX单元。本实施例中的 DTX单元指示信息可用 2比特来表示，其中： 00、 01和 10分别表示 DTX单元一、 DTX单元二和 DTX单元三，方案四由于是全速率编码所以无需标识出来。在解码端，识别单元 60首先根据 SID帧中的 DTX单元指示信息判断出该 SID帧所属的 DTX单元，并指示对应的 CNG单元解码重构，其中：

若 DTX单元指示信息为 00,则按照上述 DTX工作方案一中的 SID帧格式解码得到滤波器参数和能量参数并对其后的 8 个背景噪声信号帧进行内插；

若 DTX单元指示信息为 01 ,则按照上述 DTX工作方案二中的 SID帧格式解码得到激励参数，滤波器参数和能量参数并对其后的 8个背景噪声信号帧进行内插。

若 DTX单元指示信息为 10,则按照上述 DTX工作方案三中的 SID帧格式解码得到滤波器参数、能量参数和固定码本参数并对其后的 3个背景噪声信号帧进行内插。

本领域技术人员可以灵活根据信号特征参数划分背景噪声类型，并设定切换模式，这里不再——列举。

综上所述，本发明实施例提供一种编码方法，包括：

获取待发送背景噪声信号的至少一个信号特征参数值；

根据所述至少一个信号特征参数值确定背景噪声类型；

根据所述背景噪声类型选择一种 DTX机制将背景噪声信号编码为包含

DTX机制指示信息的 SID帧并非连续发送，其中每一种 DTX机制中的 SID 帧编码方式和 /或 SID帧非连续发送方式不相同。

进一步，所述编码方法还包括：设定不同的 DTX机制选择模式，即不同的切换模式，任意两个 DTX机制选择模式之间至少有一个背景噪声类型对应的 DTX机制不相同；并根据选定的 DTX机制选择模式，为各背景噪声类型确定对应的 DTX机制。

更近一步，所述方法还包括：当所述至少一个信号特征参数值为的设定值时，将背景噪声信号编码为全速率的语音帧并连续发送。

其中，信号特征参数值包括如下之一或任意组合：长时 SNR、背景噪声估计电平、背景噪声能量波动估计、背景噪声谱波动估计和背景噪声波动频率。

本发明实施例还提供一种对对应的 SID帧进行解码的方法，包括：识别 SID帧中的 DTX机制指示信息，其中每一种 DTX机制中的 SID帧编码方式不相同；

根据所述 DTX机制指示信息，采用对应的解码方式解码 SID帧，并重构为背景噪声信号。

应用本发明实施例提出的技术方案，可以根据背景噪声的不同类型以及通信系统的实际状况，采用不同的 SID帧编码方法和非连续传输机制，在合理利用通信系统实际资源的情况下自适应于不同类型背景噪声所要求的编码精度和时间分辨力，来达到在合理利用信道资源的前提下在解码端高质量的提供各种类型背景噪声的目的。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括： R0M、 RAM, 磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

权利要求

1、一种背景噪声编码装置，其特征在于，包括：

2、根据权利要求 1所述的背景噪声编码装置，其特征在于，还包括：指令接收单元，用于接收切换模式控制指令并转发给编码切换单元，所述切换模式控制指令用于指示编码切换单元使用一种切换模式，任意两个切换模式之间至少有一个背景噪声类型对应不同的非连续传输单元。

3、根据权利要求 1所述的背景噪声编码装置，其特征在于，还包括：语音编码器，所述编码切换单元根据背景噪声分类单元识别出的其中一种指定背景噪声类型，将背景噪声信号输入语音编码器编码为语音帧并连续输出。

4、根据权利要求 1、 2或 3所述的背景噪声编码装置，其特征在于，所述非连续传输单元具体包括：

非语音编码器，用于将背景噪声信号编码为静音描述帧；

静音描述帧发送器，用于非连续发送所述静音描述帧。

5、一种对权利要求 1所述背景噪声编码装置输出的静音描述帧进行解码的背景噪声解码装置，其特征在于，包括：

6、根据权利要求 5所述的背景噪声解码装置，其特征在于，还包括：第二识别单元，所述第二识别单元用于识别语音帧和静音描述帧，并将所述静音描述帧送入第一识别单元，或者在识别出语音帧时通知所述解码切换单元；

语音解码器，所述解码切换单元将第二识别单元识别出的语音帧送入语音解码器解码并连续输出。

7、根据权利要求 6所述的背景噪声解码装置，其特征在于，所述第一识别单元和第二识别单元合并设置。

8、一种通信设备，包括：

第一语音检测器，用于检测采集的信号中是否包含有效语音并分类输出；第一语音编码器，用于将包含有效语音的信号编码为语音帧并连续输出；其特征在于，还包括背景噪声编码装置，该背景噪声编码装置具体包括：背景噪声分析单元，用于获取不包含有效语音的背景噪声信号的至少一个信号特征参数值；

9、根据权利要求 8所述的通信设备，其特征在于，所述背景噪声解码装置还包括：指令接收单元，用于接收切换模式控制指令并转发给编码切换单元，所述切换模式控制指令用于指示编码切换单元使用一种切换模式，任意两个切换模式之间至少有一个背景噪声类型对应不同的非连续传输单元。

10、根据权利要求 8所述的通信设备，其特征在于，所述编码切换单元还连接所述第一语音编码器，所述编码切换单元根据背景噪声分类单元识别出的其中一种指定背景噪声类型，将背景噪声信号输入第一语音编码器编码为语音帧并连续输出。

11、根据权利要求 8所述的通信设备，其特征在于，所述背景噪声解码装置还包括：第二语音编码器，所述编码切换单元根据背景噪声分类单元识别出的其中一种指定背景噪声类型，将背景噪声信号输入第二语音编码器编码为语音帧并连续输出。

12、根据权利要求 8、 9 、 10或 11所述的通信设备，其特征在于，所述非连续传输单元具体包括：

非语音编码器，用于根据设定的静音描述帧编码方式将背景噪声信号编码为静音描述帧；

静音描述帧发送器，用于根据设定的非连续传输机制发送所述静音描述帧。

13、根据权利要求 8所述的通信设备，其特征在于，还包括：

14、根据权利要求 13所述的通信设备，其特征在于，还包括：第二识别单元，所述第二识别单元用于识别语音帧和静音描述帧，并将所述静音描述帧送入第一识别单元，或者在识别出语音帧时通知所述解码切换单元；语音解码器，所述解码切换单元将第二识别单元识别出的语音帧送入语音解码器解码并连续输出。

15、根据权利要求 14所述的通信设备，其特征在于，所述第一识别单元和第二识别单元合并设置。

16、一种通信设备，包括背景噪声解码装置，其特征在于，所述背景噪声解码装置包括：

17、根据权利要求 16所述的通信设备，其特征在于，还包括：第二识别单元，所述第二识别单元用于识别语音帧和静音描述帧，并将所述静音描述帧送入第一识别单元，或者在识别出静音描述帧时通知所述解码切换单元；

语音解码器，所述解码切换单元将第二识别单元识别出的语音帧送入语音解码器解码并输出。

18、根据权利要求 17所述的通信设备，其特征在于，所述第一识别单元和第二识别单元合并设置。

19、一种背景噪声编码方法，其特征在于，包括：

获取背景噪声信号的至少一个信号特征参数值；

根据所述至少一个信号特征参数值确定背景噪声类型；

20、根据权利要求 19所述的编码方法，其特征在于，所述根据背景噪声类型选择一种非连续传输机制是：根据设定的非连续传输机制选择模式中背景噪声类型和非连续传输机制之间的对应关系进行选择的，任意两个切换模式之间至少有一个背景噪声类型对应的非连续传输机制不相同。

21、根据权利要求 19所述的编码方法，其特征在于，还包括：当所述至少一个信号特征参数值满足设定条件时，将背景噪声信号编码为全速率的语音帧并连续发送。

22、根据权利要求 19、 20或 21所述的编码方法，其特征在于，所述信号特征参数包括如下之一或任意组合：长时 SNR、背景噪声估计电平、背景噪声能量波动估计、背景噪声谱波动估计和背景噪声波动频率。

23、根据权利要求 22所述的编码方法，其特征在于，根据各信号特征参数值的大小，所述背景噪声类型包括稳态背景噪声信号和非稳态背景噪声信号。

24、根据权利要求 23所述的编码方法，其特征在于，当所述信号特征参数包括长时 SNR时：

所述稳态背景噪声信号进一步包括：稳态大 SNR背景噪声信号和稳态小 SNR背景噪声信号；

所述非稳态背景噪声信号进一步包括：非稳态大 SNR背景噪声信号和非稳态小 SNR背景噪声信号。

25、根据权利要求 19所述的编码方法，其特征在于，不同静音描述帧编码方式之间的区别包括：至少一个静音描述帧编码参数不相同，或者同一静音描述帧编码参数的量化精度不相同。

26、根据权利要求 25所述的编码方法，其特征在于，所述的静音描述帧编码参数包括合成滤波器参数和激励参数。

27、根据权利要求 26所述的编码方法，其特征在于，所述的激励参数包括自适应码本参数和 /或固定码本参数。

28、根据权利要求 19所述的编码方法，其特征在于，不同静音描述帧非连续发送方式之间的区别包括：发送的相邻两个静音描述帧之间的传输间隔不相同。

29、根据权利要求 28所述的编码方法，其特征在于，所述的传输间隔根据背景信号的变化自适应确定，并且不同静音描述帧非连续发送方式之间的最小间隔不相同。

30、根据权利要求 28所述的编码方法，其特征在于，各静音描述帧非连续发送方式的传输间隔为不相同的固定值。

31、一种对权利要求 19所述方法生成的静音描述帧进行解码的方法，其特征在于，包括：

根据所述非连续传输机制指示信息，采用对应的解码方式解码静音描述帧，并重构为背景噪声信号。

32、一种计算机可读取存储介质，其特征在于，所述计算机可读取存储介质包括计算机程序代码，当所述计算机程序代码被一个计算机执行的时候，所述计算机程序代码可以使得所述计算机执行权利要求 19至 31项中任意一项的步骤。