WO2009056035A1

WO2009056035A1 - Method and apparatus for judging dtx

Info

Publication number: WO2009056035A1
Application number: PCT/CN2008/072774
Authority: WO
Inventors: Jinliang Dai; Eyal Shlomot; Deming Zhang
Original assignee: Huawei Technologies Co., Ltd.
Priority date: 2007-11-02
Filing date: 2008-10-21
Publication date: 2009-05-07
Also published as: EP2202726A1; US9047877B2; EP2202726A4; CN100555414C; EP2202726B1; US20100268531A1; AU2008318143B2; CN101335001A; AU2008318143A1

Description

一种 DTX判决方法和装置

技术领域

本发明涉及信号处理技术领域，尤其涉及一种 DTX ( Discontinuous Transmission System, 非连续传输系统 )判决方法和装置。背景技术

语音编码技术可以压缩语音信号的传输带宽，增加通信系统的容量。由于语音通信中只有大约 40 %是包含语音的，其它时间都是静音或背景噪声，为了进一步节省传输带宽， DTX/CNG ( Comfortable Noise Generation, 舒适噪声生成）技术应运而生。该技术使得编码器可以对背景噪声信号釆用不同于语音信号的编解码算法，降低了平均码率。简单说来， DTX/CNG技术就是在编码端对背景噪声段进行编码时，不需要像语音帧那样进行全速率的编码，也不需要对每一帧背景噪声进行编码，而是相隔若干帧才发送一次相比于语音帧更少量的编码参数（SID帧）即可；而在解码端，则根据接收到的非连续的背景噪声帧的参数，恢复出连续的背景噪声，并且不会明显影响主观听觉质量。

非连续的背景噪声编码帧通常称为 SID ( Silence Insertion Descriptor, 静音插入描述）帧， SID帧中一般只包含谱参数和信号能量参数，相对于语音编码帧没有固定码本、自适应码本等相关参数，并且 SID帧不会连续传输，从而降低了平均码率。背景噪声编码阶段，一般是通过提取出的噪声参数进行检测，确定是否需要发送 SID帧。这一过程可以称为 DTX ( Discontinuous Transmission, 不连续发射) 判决， DTX判决的输出是 "1 "或" 0", 表示需要或不需要发送 SID帧。 DTX判决的结果也反映出了当前噪声的性质是否出现了明显的变化。

G.729.1是 ITU最新发布的新一代语音编解码标准，这种嵌入式语音编解码标准最大的特点是具有分层编码的特性，能够提供码率范围在 8kb/s~32kb/s的窄带到宽带的音频质量，允许在传输过程中，根据信道状况丟弃外层码流，具有良好的信道自适应性。

在 G.729.1标准中，通过将码流构造成嵌入式的分层结构来达到分级性，其核心层使用 G.729标准进行编码，是一种新型的嵌入式可分层的多速率语音编解码器编码器。 G.729.1 各层编码器系统框图如图 1所示。输入为 20ms的超帧，当釆样率为 16000Hz,帧长为 320点，输入信号首先经过 QMF滤波 ^^)，^^))分成两个子带，低子带信号⁵ 经过 50Hz截止频率的高通滤波器进行预处理，输出信号使用 8kb/s~12kb/s的窄带嵌入式 CELP编码器进行编码 , (") 和 12Kb/s码率下 CELP编码器的本地合成信号之间的差值信号 (")经过知觉加权滤波（ W_LB (z) )后的信号^ s( "：)通过 MDCT变换到频域。加权滤波器 ^ ^( 包含了增益补偿，用来保持滤波器输出^ ^(") 与高子带输入信号 ^ (")之间的谱连续性。加权后的差值信号要变换到频域内。

高子带分量乘上进行谱反转之后的信号 »通过截止频率为 3000HZ 的低通滤波器进行预处理，滤波后的信号使用 TDBWE编码器进行编码。进入 TDAC编码模块的^ (")也要先使用 MDCT变换到频域上。

两组 MDCT系数和最后使用 TDAC进行编码。另外，还有一些参数用 FEC (丟帧错误隐蔽 )编码器进行传输，用以改进在传输中出现丟帧时造成的错误。

G.729.1 编码器编码出的全速率码流共有 12 层，核心层速率为 8kb/s, 是 G.729的码流；低带增强层编码速率为 12kb/s, 是对核心层固定码本编码的增强， 12kb/s与 8kb/s都对应着窄带的信号分量；编码速率为 14kb/s的层釆用 TDBWE编码器，对应的是宽带信号分量；从 16kb/s~32kb/s是对全带信号的增强编码。

3GPP ( the 3rd Generation Partner Project, 第三代合作伙伴计划）的语音编解码标准 AMR ( Adaptive Multi-Rate , 自适应多码率声码器）釆用的 DTX策略是在语音段结束时，使用一个只有 1比特有效数据的 SID— FIRST帧表示噪声段的开始，在 SID— FIRST帧之后第三帧发送第一个包含具体噪声信息的 SID— UPDATE帧，以后按照固定间隔每 8帧发送一次 SID— UPDATE帧。只有 SID— UPDATE帧包含有舒适噪声参数的编码数据。

AMR中使用固定间隔发送 SID帧的策略无法根据噪声的实际特性自适应地发送 SID帧，即无法保证在必需的时候才发送 SID帧。在实际通信系统中使用该方法的缺点在于，一方面，噪声特性已经发生明显变化，但是由于没有发送 SID帧，解码端无法及时得到已经变化的噪声信息；另一方面，到了可以发送 SID帧的时候，可能噪声特性在相当长一段时间内（大于 8帧）维持稳定，并不需要发送 SID帧，这样就造成了带宽的浪费。

ITU ( International Telecom Union, 国际电信联盟）的语音编码标准一共轭结构代数码本激励线性预测声码器（G.729 ) 定义的静音压缩方案中，在编码端的 DTX策略使用的是根据窄带噪声参数的变化情况，自适应地确定是否发送 SID, 前后两帧 SID的间隔最小为 20 毫秒，最大则不限。该方法的缺点在于，仅利用了从窄带信号中提取出的能量参数和谱参数来指导 DTX判决，而没有使用宽带分量的信息，因此对于宽带语音应用场景可能无法给出全面恰当的 DTX判决结果。

另外，随着宽带语音编码器的日益广泛应用，以及超宽带技术的逐步发展，类似 G.729.1这样的嵌入式分层结构的宽带声码器标准已经发布并走向应用。在这种分层结构的宽带声码器中，上述 AMR中的 DTX机制以及 ITU中的 G.729无法最大限度地利用噪声窄带和宽带分量的信息，可能无法给出全面反映实际噪声性质的 DTX判决结果，也就无法体现分层编码的优势。发明内容本发明实施例提供一种 DTX判决方法和装置，以实现对噪声信号的分带及分层处理，得到全面合理的 DTX判决结果。

为达到上述目的，本发明实施例提供一种 DTX判决方法，包括以下步骤：

根据输入的信号获取分带信号；

获取每一所述分带信号的特征信息变化量；

根据每一所述分带信号的特征信息变化量进行 DTX判决。

本发明的实施例还提供一种 DTX判决装置，包括：

分带模块，用于根据输入的信号获取分带信号；

特征信息变化量获取模块，用于获取所述分带模块分带后每一分带信号的特征信息变化量；

判决模块，用于根据所述特征信息变化量获取模块获取的每一分带信号的特征信息变化量进行 DTX判决。

通过全面利用语音编解码带宽内的噪声特性，使用分带及分层处理的方法在噪声编码阶段给出全面、合理的 DTX判决结果，从而使得 SID编码 /CNG解码更能贴近实际噪声的特性变化。附图说明

图 1是现有技术中 G.729.1各层编码器系统框图；

图 2是本发明的实施例一中一种 DTX判决方法的流程图；图 3是本发明的实施例五中一种 DTX判决装置的结构示意图；图 4是本发明的实施例五中 DTX判决装置的低带特征信息变化量获取子模块的结构示意图；

图 5是本发明的实施例五中 DTX判决装置的使用场景示意图；图 6是本发明的实施例五中 DTX判决装置的另一使用场景示意图。

具体实施方式

本发明的实施例一中，一种 DTX判决方法如图 1所示，包括：步骤 Sl01、对输入的信号进行分带。

该步骤中，当输入的信号为宽带信号时，可以将该宽带信号分成低带和高带两个子带；当输入的信号为超宽带信号时，可以将该超宽带信号一次分为低带、高带和超高带信号；或先分为超高带信号和宽带信号，再将宽带信号分为低带和高带信号。对于低带信号，可以进一步分为低带核心层信号和低带增强层信号；对于高带信号，可以进一步分为高带核心层信号和高带增强层信号。该分带可以通过 QMF ( Quadrature Mirror Filter, 正交镜像滤波器组）实现。具体的划分标准可以为：窄带信号是指频带 0~4000Hz的信号，宽带信号是指频带在 0~8000Hz的信号，超宽带信号是指频带在 0~16000Hz的信号。窄带或低带（宽带分量 )信号均指 0~4000Hz的信号，高带（宽带分量 ) 信号是指 4000~8000Hz 的信号，超高带（超宽带分量）信号是指 8000-16000Hz的信号。

该步骤前还包括：当 VAD ( Voice Activity Detector, 语音激活检测）功能检测到信号从语音变为噪声后，编码算法进入拖尾阶段。在拖尾阶段，编码器仍然按照语音帧编码算法对输入的信号进行编码，其主要作用是估计噪声的特性，对后续的噪声编码算法进行初始化。拖尾阶段结束后启动噪声编码，对输入的信号进行分带。

步骤 sl02、获取每一分带信号的特征信息和特征信息变化量。具体的，对于低带信号，特征信息包括低带信号的能量信息和谱信息，可以通过使用线性预测分析模型获取。

对于高带信号和超高带信号，特征信息包括时域包络信息和频域包络信息，可以通过 TDB WE ( Time Domain Band Width Extension , 时域带宽扩展）编码算法获取。

根据获取的分带内信号的特征信息，与过去时刻获取的分带内信号的特征信息进行比较，可以得到分带内信号的变化度量。

步骤 sl03、根据获取的分带信号的特征信息变化量进行 DTX判决。

对于宽带信号，将低带噪声特性变化度量和高带噪声特性变化度量进行综合作为宽带的 DTX判决结果；对于超宽带信号，将宽带信号特性变化度量和超高带信号特性变化度量进行综合作为整个超宽带的 DTX判决结果。

4叚设将输入的噪声信号的全速率的编码信息分为低带核心层、低带增强层、高带核心层、高带增强层和超高带层，对应的编码速率依次增大。则噪声分层结构可以映射为实际的编码速率。

如果实际编码仅涉及低带核心层，则 DTX判决仅计算低带核心层对应的特征信息变化量，如果判决函数值大于一定阔值，则发送 SID帧，否则不发。

如果实际编码到了低带增强层，则 DTX判决可以使用低带核心层及低带增强层的特征信息变化量进行联合判决，如果判决函数值大于一定阔值，则发送 SID帧，否则不发。

如果实际编码到高带核心层，则使用低带分量的联合特征信息变化量与高带核心层对应的特征信息变化量进行综合 DTX判决，如果判决函数值大于一定阔值，则发送 SID帧，否则不发。

如果实际编码到了高带增强层，则使用低带分量的联合特征信息变化量与宽带分量的联合特征信息变化量进行综合 DTX判决，如果判决函数值大于一定阔值，则发送 SID帧，否则不发。

如果实际编码到了超高带，那么可以使用全带信号的联合特征信息变化量进行 DTX判决，如果判决函数值大于一定阔值，则发送 SID 帧，否则不发。

基于上述描述，全带信号的特征信息变化量可用式（1 )表示：

J = oJ_x + β + 7J₃ ( 1 ) 根据该式，可以得到 DTX判决的第一种方法：

其中， + + y= l , AAA分别表示计算出的低带、高带和超高带的特诊信息变化量。则 DTX判决规则如式（2 )表示，当^ > 1时，

DTX判决输出^ 为 1 , 表示需要对噪声帧编码信息进行传输；否则 dtxjag为表示不需要对噪声帧编码信息进行传输： dtx _ flag = 1 J >\

dtx _ flag = 0 J <\ (2) 当只需要编码到低带核心层或低带增强层时，则式（1) 简化为

^{J= J}\ (3) 当需要编码到高带核心层或高带增强层时，式（1) 简化为

J= α/,+ ^J₂ (4 ) 其中， + β= 1。当然也可以使用另外的 DTX判决方式，如以下的第二种 DTX判决方法：

使用 Α， Α分别表示计算出的低带、高带和超高带的特征信息变化量：当编码到低带核心层或低带增强层时，同公式（3), 使用 ^作为 DTX判决标准；当需要编码到高带核心层或高带增强层时，使用 ^和 ^作为 DTX 判决标准，当 ^和均小于 1时， DTX判决输出⁶ ^-^g为 0, 表示不需要对噪声帧编码信息进行传输；当 ^和 ^均大于 1 时， DTX判决输出^ 为 1,表示需要对噪声帧编码信息进行传输；当 ^和 ^ 不同时大于 1或小于 1时，按照公式（4 )将 ^j= ₂作为 DTX判决标准；

当需要编码到超高带时，使用 ^、 ^和 Λ作为 DTX判决标准，当 Λ和 Λ均小于 i时， DTX判决输出⁶ ^-^g为 0, 表示不需要对噪声帧编码信息进行传输；当 ^、 ^和 Λ均大于 1 时， DTX判决输出为 L表示需要对噪声帧编码信息进行传输；当 Λ和不同时大于 1或小于 1时，按照公式（1)将 ^ ^+^ ) ^作为 DTX判决标准。

上述两种方法都可以用于 DTX的判决输出。

以下结合具体的应用场景，对本发明实施例的实施方式作进一步描述。

本发明的实施例二中，以对输入的宽带信号进行的 DTX判决为例，说明本发明中一种 DTX判决方法的实施方式。

本实施例中使用的 SID帧的结构如表 1所示：表 1 : SID帧的比特分配

系统工作在 16k釆样率，输入信号带宽 8kHz。 SID帧的全速率帧包含 3层，分别是低带核心层、低带增强层和高带核心层。低带核心层使用的编码参数与 G.729附录 B中的 SID帧编码参数基本类似，分别是对能量参数釆用 5比特进行量化，对于谱参数 LSF釆用 10比特进行量化；低带增强层是在低带核心层的基础上，对能量和谱参数的量化误差进行进一步量化，也就是说对能量釆用第二级量化，对谱釆用第三级量化，其中能量的第二级量化使用 3比特，谱的第三级量化使用 6比特；高带核心层釆用类似 G.729.1中 TDBWE算法中的编码参数，不过将 16点时域包络简化为 1个时域能量增益，使用 6比特进行量化，频域包络仍然是 12个，分裂为 3个矢量共使用 14比特进行量化。

首先对输入的信号进行分带，即分成高低两个子带，低带频率范围为 0~4kHz, 高带频率范围为 4kHz~8kHz。具体的，使用 QMF滤波器组对输入的 16kHz 釆样率的信号进行分带，低通滤波器 (^z)是一个 64抽头的对称的 FIR滤波器，高通滤波器 ( 可以由得到：

/¾(«) = (-1)"/¾(«) ( 5 ) 则窄带分量可由式（6)得到：

31

t (") =∑ A U) wB (n + l + j) + _m (n - j)]

( 6 ) 宽带分量可由式（7)得到：

31

y_h (") =∑^2 U) wB (n + l + j) + _m (n― j)]

( 7 ) 低带分量进行 LPC分析，得到 LPC 系数 ^α'' (i=l...M), M 是 LPC分析的阶数，以及残差能量参数 E; 緩存区中保存上一个 SID 帧量化后的 LPC系数 ^')和残差能量

如果编码器只需要编码到低带核心层或低带增强层，则 DTX判决仅需要针对低带分量进行即可。

利用式（8)计算出低带的变化量

E_t ^q-E\ ∑¾( ^()

thr\ E? - thrl (8) 其中分别表示对能量变化和谱变化的加权系数，分别表示当前帧和上一个 SID帧量化后的能量参数， (0为当前帧窄带信号分量的自相关系数，

分别表示能量参数和谱参数变化的阔值，该阔值反映了人耳对能量和谱变化的敏感程度， M是线性预测的阶数，由上一个 SID帧量化后的 LPC系数用式（9) 计算得到：

则可以利用式（8)计算出低带信号的变化量，并利用式（3)和式（2)得到 DTX判决结果。

由于本实施例中低带核心层和低带增强层使用的参数完全相同，增强层仅仅是对核心层的参数进行了进一步量化，因此如果编码速率达到了低带增强层， DTX判决的过程与式（8)和式（9)基本相同，只是使用的能量参数和谱参数是增强层中的量化结果，这里对此判决过程不做重复描述。

如果编码器需要编码高带核心层，则除了要按照式（ 8 )计算出 ^ 以夕卜，还要计算出宽带的变化量 ^。宽带部分用简化的 TDBWE编码算法对宽带信号分量提取出时域包络和频域包络进行编码。其中时域包络由式（10)计算：

1

(10) 其中，为帧长，在 G.729.1中 = 160。

频域包络由式（11)、式（12)、式（13)和式（14)计算得到。首先使用一个 128抽头的汉宁窗对宽带信号进行加窗，窗函数表达式如式（ 11 ) 所示：

加窗后的信号为:

n)-w (n + 3l). « = -31 96 (12) 对加窗后的信号进行 128点的 FFT, 使用多项结构实现：

Y (k ) = FFT₆₄ (y (n) + y (n + 64)), A: = 0_,63;" =— 3 ,… ,32 利用计算出的 FFT系数求取加权的频域包络:

内存中緩存了上一个 SID帧的量化后的时域包络⁷ ^和频域包络 Fmv , 则当前帧宽带分量相比于上一个 _SID帧的变化量可用式

( 15a )或 (15b)计算得到：

或：

J

分别得到窄带的变化量 ^和宽带的变化量 ^ ,则窄带和宽带的联合变化量可以用式（4 )求得。利用式（2 )所示的判决规则，即可判决出当前帧是否需要编码发送 SID帧。

本发明的实施例三中，以对输入的超宽带信号进行的 DTX判决为例，说明本发明中一种 DTX判决方法的实施方式。

本实施例处理的信号为 32kHz釆样，经过分带处理分别得到低带、高带和超高带噪声分量。对于分带处理，可以给予树形结构实现，即经过一次 QMF分成超高带和宽带信号，再经过一次 QMF将宽带信号分成低带和高带信号；也可以基于一个非等宽子带滤波器组直接将输入信号分成低带、高带和超高带信号分量。显然，树形结构的分带器具有更好的可扩展性能。分带得到的窄带和宽带信息可以输入到实施例二的系统进行宽带 DTX判决，并最终得到（4 )式所示的宽带噪声特征信息变化度量 J, 对于本实施例就是联合超宽带噪声特征信息变化量 ^及宽带的 J得到全带噪声特征变化度量 Jfl, 如（16 ) 式所示：

J_a = r- J + ^_s ( 16 ) 利用全带的噪声特征变化度量 Ja进行 DTX判决，输出全带 DTX 判决结果 dtx_flag, 如（17 ) 式所示：

Λ 下面叙述超高带噪声特性变化度量 ^, 本实施例中使用的 SID 帧低带和高带部分的结构如表 1中所示，不做重复描述；超高带部分的结构如表 2所示：表 2: SID帧超高带比特分配

超高带的时域能量包络由式（19 ) 式计算得到

其中 N在 20ms帧处理时为 320 , ys为超高带信号。对于频域包络 F v人 j、的计算类似高带的频域包络计算，不同的是频谱宽度不一样，因此频域包络的点数也可以不一样，如式（20 )所示：

Fenv_s =— log.

其中 Ys为超高带频谱，可以通过 FFT ( Fast Fourier Transform , 快速傅里叶变换）计算，也可以通过 MDCT ( Modified Discrete Cosine Transform, 改进型离散余弦变换）计算，式（ 20 )中是以 320点频谱宽度为例的，并且计算频域包络为 8Khz~14KHz共 280个频点。为了量化的方便，仍然可以将频域包络分裂为 3个子矢量进行量化。内存中緩存了上一个 SID帧的量化后的超高带时域包络⁷ ^ 和频域包络^"¹^^^，则当前帧超高带分量相比于上一个 SID帧的变化量可用式（21a )或 (21b)计算得到：

再用式（16 )计算全带噪声特征变化度量。再利用式（17 )所示的判决规则，即可判决出当前帧是否需要编码发送 SID帧。

上述实施例二和实施例三中所涉及的 DTX判决流程，使用的均为实施例一的步骤 sl03中描述的第一种 DTX判决方法。对于实施例二和实施例三，也可以使用实施例一的步骤 sl03 中描述的第二种 DTX 判决方法，具体的判决过程于上述实施例二和实施例三种描述的过程相似，在此不进行重复描述。

本发明的实施例四中，以对输入的宽带信号进行的 DTX判决为例，说明本发明中一种 DTX判决方法的实施方式。

本实施例中使用的 SID帧的结构如表 3所示：表 3: SID帧的比特分配

第三级 LSF量化矢量 6 宽带分量时域包络 6 宽带分量频域包络矢量 1 5

高带核心层宽带分量频域包络矢量 2 5 宽带分量频域包络矢量 3 4

/¾(«) = (-1)"/¾(«) ( 22 ) 则窄带分量可由式（23 )得到：

31

t (") =∑ A U) wB (n + l + j) + _m (n - j)]

( 23 ) 宽带分量可由式（24 )得到： y_h (") =∑^2 Ui^swB (" + 1 + _/') + s (n― )]

( 24 ) 低带分量进行 LPC分析，得到 LPC 系数 ^α'' (i=l...M), M 是 LPC分析的阶数，以及残差能量参数 E; 緩存区中保存上一个 SID 帧量化后的 LPC系数 ^')和残差能量

利用式（25)得出低带分量的 DTX判决结果：

MM

1 > t/zrl或者 Z R】_id (/) · R' (/) > E_t ^q · thrl

dtx nb

0 其他（ ₂₅ ) 其中分别表示对能量变化和谱变化的加权系数，分别表示当前帧和上一个 SID帧量化后的能量参数，如果当前编码速率仅为低带核心层，则使用核心层的量化结果，如果当前编码速率为低带增强层或者更高，则使用增强层的量化结果，为当前帧窄带信号分量的自相关系数，

分别表示能量参数和谱参数变化的阔值，该阔值反映了人耳对能量和谱变化的敏感程度， M是线性预测的阶数， ^R 由上一个 SID帧量化后的 LPC系数用式（ 26 )计算得到：

Rn , j = o

k=° ( 26 ) 如果编码器需要编码高带核心层，宽带部分用简化的 TDBWE编码算法对宽带信号分量提取出时域包络和频域包络进行编码。其中时域包络由式（27)计算：

1 N-1

² ^ (27) 其中，为帧长，在 G.729.1中 = 160

频域包络由式（28)、式（29)、式（30)和式（31)计算得到。首先使用一个 128抽头的汉宁窗对宽带信号进行加窗，窗函数表达式如式（ 11 ) 所示:

(28 )

加窗后的信号为：

y_h ^w(n) = y_h(n)-w_F(n + \), " = _31,...,96 (29 ) 对加窗后的信号进行 128点的 FFT, 使用多项结构实现：

Y (k) = FFT₆₄ iy (n) + y_h ^w (n + 64)), A: = 0,...,63;« = _31"..,32 ( 30 ) 利用计算出的 FFT系数求取加权的频域包络:

内存中緩存了噪声信号短时时域包络 ^Tm 和频域包络 (0 , 则当前帧宽带分量的短时 DTX判决由式（32 )给出：

- Fenv_st (/)| > thrA

dtx wb.

其他（ 32 ) 短时时域包络按下式更新：

Tenv_st = px Tenv _st +(\- p)x Tenv

短时频域包络按下式更新：

Fenv_st (/') = px Fenv_st (/') + (\- p)x Fenv(i)

内存中还緩存了噪声信号长时时域包络和频域包络

^Fenv^K则当前帧宽带分量的长时 DTX判决由式（33 )给出：

- Fenv_lt > thr6

否则 ( 33 ) 分别得到宽带分量的短时 DTX判决和长时 DTX判决之后 ,用下式获得宽带分量的综合判决：

当^ - = l时，长时时域包络按下式更新: Tenv_lt - ψχ Tenv_lt + (1 - x Tenv

长时频域包络按下式更新：

Fenv_lt (/) = y x Fenv_lt (/) + (l - ^)x Fenv{i)

^口果 i i — ^) = dtx _nb , 贝,】 dtx _flag - dtx _wb - dtx _nb · 否贝 ij , 需要进行综合判决，具体方法如下：

首先使用式（8 ) 所示的方法，求得低带的变化量然后使用式（15a )或（15b )所示的方法，求得高带的变化量；再用式（4 ) 求得低带、高带的联合变化量^ 最后使用式（2 )所示的判决准则，得到最终的 DTX判决结果^ 。

在本实施例中，还可以使用上述实施例一中描述的第二种 DTX 判决方法：在低带、高带分别进行独立判决的基础上，如果两个带独立判决的结果不一致时，则使用低带分量、高带分量的特征参数的变化量进行联合判决，对独立判决的结果进行修正。

上述实施例提供的方法，全面的利用了语音编解码带宽内的噪声特性，使用分带及分层处理的方法在噪声编码阶段给出全面、合理的 DTX判决结果，从而使得 SID编码 /CNG解码更能贴近实际噪声的特性变化。

本发明的实施例五还提供了一种 DTX判决装置，如图 3所示，包括：

分带模块 10, 用于根据输入的信号获取分带信号；可以利用使用 QMF滤波器组对输入的特定釆样率的信号进行分带。所述信号为窄带信号时，所述分带信号为低带信号，所述低带信号进一步包括低带核心层信号、或低带核心层信号和低带增强层信号；所述信号为宽带信号时，所述分带信号为低带信号和高带信号，所述低带信号进一步包括低带核心层信号和低带增强层信号，所述高带信号进一步包括高带核心层信号、或高带核心层信号和高带增强层信号；所述信号为超宽带信号时，所述分带信号为低带信号、高带信号和超高带信号，所述低带信号进一步包括低带核心层信号和低带增强层信号，所述高带信号进一步包括高带核心层信号和高带增强层信号。特征信息变化量获取模块 20 , 用于获取所述分带模块分带后每一分带信号的特征信息变化量。

判决模块 30 , 用于根据所述特征信息变化量获取模块 20获取的每一分带信号的特征信息变化量进行 DTX判决。该判决模块 30进一步包括：

加权判决子模块 31 , 用于将特征信息变化量获取模块 20获取的每一分带信号的特征信息变化量进行加权 ,将加权后的结果进行联合判决，作为 DTX判决标准。分带判决子模块 32, 用于将特征信息变化量获取模块 20获取的每一分带信号的特征信息变化量作为所述分带信号的判决标准，不同分带信号的判决结果一致时，将所述判决结果作为 DTX判决标准；不同分带信号的判决结果不一致时，通知所述加权判决子模块进行联合判决。

具体的，根据所处理的信号的不同，特征信息变化量获取模块 20的结构不同。

当用于低带信号时，特征信息变化量获取模块 20进一步包括：低带特征信息变化量获取子模块 21 , 用于获取低带信号的特征信息变化量。具体的，使用线性预测分析模型，获取低带分带信号的特征信息，该特征信息包括低带信号的能量信息和谱信息；根据低带信号当前时刻的特征信息和过去时刻的特征信息获取低带信号的特征信息变化量。

当用于宽带信号时，特征信息变化量获取模块 20进一步包括：低带特征信息变化量获取子模块 21 , 用于获取低带信号的特征信息变化量；高带特征信息变化量获取子模块 22, 用于获取高带信号的特征信息变化量。具体的，使用时域带宽扩展编码算法 TDB WE, 获取高带信号的特征信息，该特征信息包括高带信号的时域包络信息和频域包络信息。根据高带信号当前时刻的特征信息和过去时刻的特征信息获取高带信号的特征信息变化量。

当用于超宽带信号时，特征信息变化量获取模块 20进一步包括：低带特征信息变化量获取子模块 21 , 用于获取低带信号的特征信息变化量；高带特征信息变化量获取子模块 22, 用于获取高带信号的特征信息变化量；超高带特征信息变化量获取子模块 23 , 用于获取超高带信号的特征信息变化量。具体的，使用时域带宽扩展编码算法

TDBWE, 获取超高带信号的特征信息，该特征信息包括超高带信号的时域包络信息和频域包络信息。根据超高带信号当前时刻的特征信息和过去时刻的特征信息获取超高带信号的特征信息变化量。

具体的，当低带信号进一步包括低带核心层信号和低带增强层信号时，低带特征信息变化量获取子模块 21的结构如图 4所示，进一步包括：

低带分层单元，用于将输入的低带信号分层为低带核心层信号和低带增强层信号，并分别发送到低带核心层特征信息变化量获取单元和低带增强层特征信息变化量获取单元；

低带核心层特征信息变化量获取单元，用于获取低带核心层信号的特征信息变化量；

低带增强层特征信息变化量获取单元，用于获取低带增强层信号的特征信息变化量；

低带综合单元，用于将所述低带核心层特征信息变化量获取单元获取的低带核心层信号的特征信息变化量、和所述低带增强层特征信息变化量获取单元获取的低带增强层信号的特征信息变化量进行综合作为低带的特征信息变化量；

低带控制单元，用于当所述低带信号仅涉及低带核心层时，将所述低带核心层判决子模块的输出作为低带信号的特征信息变化量；当所述分带信号到达低带增强层时，将所述低带综合单元的输出作为低带信号的特征信息变化量。

具体的，当高带信号进一步包括高带核心层信号和高带增强层信号时，高带特征信息变化量获取子模块 22的结构与图 4所示低带特征信息变化量获取子模块 21的结构相似，进一步包括：

高带分层单元，用于将输入的高带信号分层为高带核心层信号和高带增强层信号，并分别发送到高带核心层特征信息变化量获取单元和高带增强层特征信息变化量获取单元；

高带核心层特征信息变化量获取单元，用于获取高带核心层信号的特征信息变化量；

高带增强层特征信息变化量获取单元，用于获取高带增强层信号的特征信息变化量；

高带综合单元，用于将所述高带核心层特征信息变化量获取单元获取的高带核心层信号的特征信息变化量、和所述高带增强层特征信息变化量获取单元获取的高带增强层信号的特征信息变化量进行综合作为高带的特征信息变化量；

高带控制单元，用于当所述高带信号仅涉及高带核心层时，将所述高带核心层判决子模块的输出作为高带信号的特征信息变化量；当所述分带信号到达高带增强层时，将所述高带综合单元的输出作为高带信号的特征信息变化量。

使用如上述图 3所示的 DTX判决装置的一应用场景如图 5所示，输入的信号经过 VAD判决为语音帧或静音帧 (背景噪音帧 ),对于语音帧则按照下面一条分支进行语音帧编码，输出语音帧码流；对于静音帧（背景噪音帧），则按照上面一条分支进行噪音的编码，在这条路径中，本发明实施例四提供的 DTX判决装置用于确定编码器是否将当前噪音帧进行编码传输。

使用如上述图 3所示的 DTX判决装置的另一应用场景如图 6所示，输入的信号经过 VAD判决为语音帧或静音帧（背景噪音帧），对于语音帧则按照下面一条分支进行语音帧编码，输出语音帧码流；对于静音帧（背景噪音帧），则按照上面一条分支进行噪音的编码，在这条路径中，本发明实施例四提供的 DTX判决装置用于确定编码器是否传输已编码的噪音帧数据。

通过使用上述实施例提供的装置，全面的利用了语音编解码带宽内的噪声特性，使用分带及分层处理的方法在噪声编码阶段给出全面、合理的 DTX判决结果，从而使得 SID编码 /CNG解码更能贴近实际噪声的特性变化。通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明，可以通过硬件实现，也可以借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质 (可以是 CD-ROM, U盘，移动硬盘等）中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述的方法。

总之，以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

权利要求

1、一种 DTX判决方法，其特征在于，包括：

根据输入的信号获取分带信号；

获取每一所述分带信号的特征信息变化量；

根据每一所述分带信号的特征信息变化量进行 DTX判决。

2、如权利要求 1所述 DTX判决方法，其特征在于，所述根据输入的信号获取分带信号前还包括：

检测到信号从语音变为噪声后获取噪声的特性，对后续的 DTX 判决进行初始化。

3、如权利要求 1所述 DTX判决方法，其特征在于，所述信号为窄带信号，所述分带信号为低带信号。

4、如权利要求 3所述 DTX判决方法，其特征在于，

所述低带信号进一步包括低带核心层信号；或

所述低带信号进一步包括低带核心层信号和低带增强层信号。

5、如权利要求 1所述 DTX判决方法，其特征在于，所述信号为宽带信号，所述分带信号为低带信号和高带信号。

6、如权利要求 5所述 DTX判决方法，其特征在于，

所述低带信号进一步包括低带核心层信号；或所述低带信号进一步包括低带核心层信号和低带增强层信号；

所述高带信号进一步包括高带核心层信号；或所述高带信号进一步包括高带核心层信号和高带增强层信号。

7、如权利要求 1所述 DTX判决方法，其特征在于，所述信号为超宽带信号，所述分带信号为低带信号、高带信号和超高带信号。

8、如权利要求 7所述 DTX判决方法，其特征在于，

9、如权利要求 3至 8中任一项所述 DTX判决方法，其特征在于，所述分带信号为低带信号时，获取所述分带信号的特征信息包括：使用线性预测分析模型，获取所述分带信号的特征信息，所述特征信息包括低带信号的能量信息和谱信息。

10、如权利要求 5至 8中任一项所述 DTX判决方法，其特征在于，所述分带信号为高带信号或超宽带信号时，获取所述分带信号的特征信息包括：

使用时域带宽扩展编码算法 TDBWE, 获取所述分带信号的特征信息，所述特征信息包括高带信号或超高带信号的时域包络信息和频域包络信息。

11、如权利要求 10所述 DTX判决方法，其特征在于，所述频域包络信息通过快速傅里叶变换 FFT或改进型离散余弦变换 MDCT获取。

12、如权利要求 3至 8中任一项所述 DTX判决方法，其特征在于，所述根据每一所述分带信号的特征信息变化量进行 DTX判决包括：

对每一所述分带信号的特征信息变化量进行联合判决，将所述联合判决结果作为 DTX判决标准：若结果大于一特定阔值则判断为需要发送 SID帧，否则判断为不需要发送 SID帧。

13、如权利要求 12所述 DTX判决方法，其特征在于，所述信号为窄带信号时，所述联合判决包括：

所述分带信号仅涉及低带核心层时，根据低带核心层信号对应的特征信息变化量作为 DTX判决标准；

所述分带信号到达低带增强层时，根据低带核心层信号及低带增强层信号的特征信息变化量进行联合判决，作为 DTX判决标准。

14、如权利要求 12所述 DTX判决方法，其特征在于，所述信号为宽带信号时，所述联合判决包括：

所述分带信号到达高带核心层时，根据低带信号的联合特征信息变化量与高带核心层信号对应的特征信息变化量进行联合判决，作为 DTX判决标准；

所述分带信号到达高带增强层时，根据低带信号的联合特征信息变化量与宽带信号的联合特征信息变化量进行联合判决，作为 DTX 判决标准。

15、如权利要求 12所述 DTX判决方法，其特征在于，所述信号为超宽带信号时，所述联合判决包括：

根据低带信号、高带信号和超高带信号的联合特征信息变化量进行联合判决，作为 DTX判决标准。

16、如权利要求 12述 DTX判决方法，其特征在于，所述对每一所述分带信号的特征信息变化量进行联合判决包括：

将每一所述分带信号的所述特征信息变化量进行加权，将加权后的结果进行联合判决，作为 DTX判决标准；或

将每一所述分带信号的所述特征信息变化量作为当前分带信号的判决标准，不同分带信号的判决结果一致时，将所述判决结果作为 DTX 判决标准；不同分带信号的判决结果不一致时，将每一所述分带信号的所述特征信息变化量进行加权，将加权后的结果进行联合判决，作为 DTX判决标准。

17、一种 DTX判决装置，其特征在于，包括：

分带模块，用于根据输入的信号获取分带信号；

18、如权利要求 17所述 DTX判决装置，其特征在于，所述信号为窄带信号，所述分带信号为低带信号。

19、如权利要求 18所述 DTX判决装置，其特征在于，所述低带信号进一步包括低带核心层信号；或

20、如权利要求 17所述 DTX判决装置，其特征在于，所述信号为宽带信号，所述分带信号为低带信号和高带信号。

21、如权利要求 20所述 DTX判决装置，其特征在于，所述低带信号进一步包括低带核心层信号；或所述低带信号进一步包括低带核心层信号和低带增强层信号；

22、如权利要求 17所述 DTX判决装置，其特征在于，所述信号为超宽带信号，所述分带信号为低带信号、高带信号和超高带信号。

23、如权利要求 22所述 DTX判决装置，其特征在于，所述低带信号进一步包括低带核心层信号；或所述低带信号进一步包括低带核心层信号和低带增强层信号；

24、如权利要求 17所述 DTX判决装置，其特征在于，所述特征信息变化量获取模块进一步包括：

低带特征信息变化量获取子模块，用于获取低带信号的特征信息变化量。

25、如权利要求 17所述 DTX判决装置，其特征在于，所述特征信息变化量获取模块进一步包括：

低带特征信息变化量获取子模块，用于获取低带信号的特征信息变化量；

高带特征信息变化量获取子模块，用于获取高带信号的特征信息变化量。

26、如权利要求 17所述 DTX判决装置，其特征在于，所述特征信息变化量获取模块进一步包括：

高带特征信息变化量获取子模块，用于获取高带信号的特征信息变化量；超高带特征信息变化量获取子模块，用于获取超高带信号的特征信息变化量。

27、如权利要求 24至 26中任一项所述 DTX判决装置，其特征在于，所述低带特征信息变化量获取子模块进一步包括：

28、如权利要求 25或 26所述 DTX判决装置，其特征在于，所述高带特征信息变化量获取子模块进一步包括：

29、如权利要求 17所述 DTX判决装置，其特征在于，所述判决模块进一步包括：

加权判决子模块，用于将所述特征信息变化量获取模块获取的每一分带信号的特征信息变化量进行加权，将加权后的结果进行联合判决，作为 DTX判决标准。

30、如权利要求 29所述 DTX判决装置，其特征在于，所述判决模块还包括：

分带判决子模块，用于将所述特征信息变化量获取模块获取的每一分带信号的特征信息变化量作为所述分带信号的判决标准，不同分带信号的判决结果一致时，将所述判决结果作为 DTX判决标准；不同分带信号的判决结果不一致时，通知所述加权判决子模块进行联合判决。