WO2010000179A1

WO2010000179A1 - 频带扩展的方法、系统和设备

Info

Publication number: WO2010000179A1
Application number: PCT/CN2009/072371
Authority: WO
Inventors: 张德明; 张立斌; 张琦
Original assignee: 华为技术有限公司
Priority date: 2008-06-30
Filing date: 2009-06-22
Publication date: 2010-01-07
Also published as: CN101620854B; CN101620854A

Description

频带扩展的方法、系统和设备

本申请要求于 2008 年 6 月 30 日提交中国专利局、申请号为 200810130702.6、发明名称为 "频带扩展的方法、系统和设备" 的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及信号承载技术领域，具体涉及频带扩展的方法、系统和设备。背景技术

现有承载技术中，宽带、超宽带部分资源受限制的情况下，通常只能对宽带、超宽带部分的频谱包络、时域包络、部分谱系数进行编码，然后在解码端通过这些参数方法进行频带扩展，重构宽带、超宽带部分的信号。

现有的频带扩展的方法主要以 AMRWB+ ( Adaptive multi-rate wide band plus自适应多速率宽带编码 + ) 为代表的，利用窄带的激励信号和高带的合成滤波器生成高带信号，实现频带扩展。

在对现有技术的研究和实践过程中，本发明的发明人发现，现有技术需要消耗较多的比特资源来描述高带合成滤波器参数，存在着消耗比特资源多，在比特资源有限的情况下不适用或重构的效果不好的问题。

发明内容

本发明实施例提供一种频带扩展的方法、系统和设备，解决消耗比特资源多的问题。

一种解码方法，包括：

获取音调特征参数和原始高带信号；

根据所述音调特征参数生成激励谱；

根据所述激励谱和所述原始高带信号中的轮廓信息生成重构高带信号。一种编码方法，包括：

对超宽带部分的频域信号进行音调特征分析提取音调特征参数；将所述音调特征参数进行量化编码。

一种频带扩展系统，包括：

编码端，用于发送原始高带信号和音调特征参数；解码端，用于接收编码端发送的音调特征参数和原始高带信号；根据所述音调特征参数生成激励谱；根据所述激励谱和所述原始高带信号中的轮廓信息生成重构高带信号。

一种解码端，包括：

接收单元，用于接收音调特征参数和原始高带信号；

激励谱生成单元，用于根据所述音调特征参数生成激励谱；

高带信号生成单元，用于根据所述激励谱和所述原始高带信号中的轮廓信息生成重构高带信号。

一种编码端，包括：

音调特征参数提取单元，用于对超宽带部分的频域信号进行音调特征分析提取音调特征参数；

量化单元，用于将所述音调特征参数进行量化编码。

本发明实施例采用在编码端提取原始高带信号的关键特征参数：音调特征参数，用极少的比特资源进行编码传输。在解码端，根据音调特征参数生成激励谱，并根据原始高带信号的轮廓信息最终生成重构的高带信号，实现频带扩展。由于在解码端进行高带信号的重构时，基于原始高带信号的细节特征进行操作，重构的高带信号除了轮廓和原始高带信号接近之外，在细节上有较好的匹配，通过较少的比特资源消耗就能达到较好的听觉效果。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储（ ROM, Read Only Memory )、随机存取存储器（RAM, Random Access Memory ), 磁盘或光盘等。

附图说明

图 1是本发明一种解码方法的第一个实施例的流程图；

图 2是本发明一种解码方法的第二个实施例的流程图；

图 3是本发明一种编码方法的一个实施例的流程图；

图 4是本发明一种频带扩展系统的一个实施例的结构图；

图 5是本发明一种频带扩展解码端的一个实施例的结构图；图 6是本发明一种频带扩展编码端的一个实施例的结构图。

具体实施方式

请参阅图 1为本发明一种解码方法的第一个实施例的信令流程图。

本发明实施例运用在超宽带编解码器中。编码器的输入信号是 32kHz采样率，处理帧长为 20ms。对输入信号进行分频带、下采样处理后，对应于 0~8kHz 频带的信号有 320个采样点，对应于 8~16kHz频带的信号有 320个采样点。其中 0~8kHz频带内的信号由核心编码器处理，核心编码器可以是 G.729.1编解码器，也可以是其它宽带信号编解码器。

对于 8~16kHz频带内的时域信号 {yjU (l), ······ ,y_hi( \9)} , 经过 MDCT变换后得到了一组 MDCT系数，即该频带对应的频域信号 {y_swb(0),y_swb(l), ······ ,y_swb(319)} , 由于超宽带部分仅处理 8~14kHz频带内的信号，所以对频 i或信号仅处理 {y― b(0),y― b(l), ······ ,y_swb(239)}。在编码端会将这组频域信号分为 N个子带，提取每个子带的频域包络并量化，得到一组量 4匕后的频 i或包终 {spec _ env(0), spec _ env(l),…… ,spec_ env(N - 1) } , 这组包终经过编码传输到解码端。

对于宽带核心编码器 G.729.1, 7~8kHz部分信号已不在其处理范围之内，为了确保在解码端解码信号频谱的连续性，在编码端需要提取 7~8kHz部分信号的特征参数。由于 G.729.1编码器对 4~8kHz的信号进行了 MDCT变换，对应的频域信号 {y _ wb(0), y _ wb(l),…… ,y _ wb(l59)} , 其中 7~8kHz对应的频域信号为 {y -wb(\2Q),y _wb(\2\),……，y_wb(159)} , 在编码端将其分为 M个子带，提取每个子带的频域包络并量化，得到一组量化后的频域包络

{spec _ env _ extra(0), spec _ env _ extra(\), , spec _ env _ extra(M - 1) } , 这组包终经过编码传输到解码端。在本实施例中 N=15, M=3。

本频带扩展方法实施例包括编码方法和解码方法：先由编码端提取音调特征参数，并发送给解码端，由解码端根据音调特征参数和原始高带信号的轮廓信息重构高带信号。具体包括以下步骤：

步骤 101：编码端发送提取的音调特征参数到解码端；

对超宽带部分的频域信号 { «(0), speed), .… , «(239)}进行音调特征分析，提取音调特征参数，并将所述音调特征参数进行量化编码，将编码传输到解码端。

具体步骤如下：

la、计算超宽带部分频域信号的自相关函数 Corr[«]= spec(n)xspec(n + i) , ne[MIN,MAX] , 在本实施例中 ΜΙΝ=5 ΜΑΧ=70。 '—。 lb、超宽带部分的音调特征参数为画 =^^^。

max(Corr[n ) lc、将音调特征参数量化，得到量化后的音调特征参数将其编码传输至解码端。

步骤 102: 解码端解码得到音调特征参数；

解码端对接收到的编码进行解码后得到音调特征参数

。

步骤 103: 解码端根据音调特征参数生成激励谱；

具体可以包括以下步骤：

步骤 103A: 解码端生成初始激励谱；

具体为解码端根据解码重构的窄带谱和宽带谱生成初始激励谱；生成初始激励谱时可以加入随机噪声得到 E = {e;td (0),e;cd (l),……， e;cd (279) }。

步骤 103B: 解码端可以对初始激励谱进行白化，使初始激励谱的能量分布均衡；

解码端提取初始激励谱 E的谱包络后，对初始激励谱进行白化，。具体步骤如下：

a将初始激励谱分为 7个子带，计算每个子带的平均能量，即谱包络，

b 为了使白化后的初始激励谱有更好的连续性，对谱包络还可以进行平滑内插，得到一组归一化因子 { (0), (1),··· (279)}。平滑内插的过程如下： ) = 79 , 其中 W为一

χ 40 + 20, i = 1, 2, 3, 4, 5 个 40点对称窗函数。 c 对初始激励谱进行白化，白化后的初始激励谱为 E ' = {excit '(0), excit '(1), · · · excit '(279) } , 白 4匕过程为： excit i) = excit(i) I β(ί)。

103C: 解码端根据原始频带信号谱对初始激励谱进行音调整形得到激励谱；需要说明的是如果初始激励谱经过了 103B的白化操作，该步骤输入的初始激励谱是白化后的初始激励谱。

具体步骤如下：

■>Jy_swb²(0) + y_swb²(l),i = 0

a根据公式 _ swb² (239) + y_ swb² (238) , i = 239 由 E, 计算 jy _ swb² (i) + (y _ swb(i + T)-y _ swb(i + 1))² , otherwise 出初始激励谱的伪谱 SE = {s _ excit(0), s _ excit(l),…… ,s_ excit{219) } b 采用如下的方法计算初始激励谱的伪谱 SE的音调特征参数1\

240

计算伪谱 SE频域信号的自相关函数 Corr[n] = ^ spec(n)xspec(n + i) , n e [MIN, MAX ] , 在本实施例中 MIN=5 M AX=70。初始激励谱的伪谱 SE的音调特征参数 Γ= ^min(Q)/TW) 。

max(Corr[n])

C 计算音调整形因子 _a = _x(_to/¾^-r) , rl = l-« , r2 = /max(D。在本实施例中 =—1.9/0.6。

d 利用音调整形因子对初始激励谱进行调整。具体为：如果《>0 , 即 tona^T , 即原始超宽带频谱的音调特性比初始激励谱的音调特性要强，则对初始激励谱进行锐化调整，即; F = E'_Xd><r2 + rl) , 得到音调整形后的激励谱 Y = {y _ excit (0), y _ excit(V), ---y _ excit(219) }。

如果"≤0 , 即

即原始超宽带频谱的音调特性比初始激励谱的音调特性要弱，则对初始激励谱自适应的加入噪声，进行平滑调整，调整过程如下：

生成随机噪声 Noise= { noise(O) , noise( 1 ),…… ,noise(279) }。

计算激励信号和噪声信号的能量， energyE' = _XCit'(i) 和 energyN =

。根据下式对激励信号进行音调调整，

_{Y =} , 得到音调整形后的激励谱

Y -{y _ excit(O), y _ excitil), ---y _ excit{219) }。音调整形后的激励谱的音调特性和原始超宽带信号谱的音调特性更加匹配。

步骤 104: 解码端可以对最终生成的激励谱进行频带调整，以获得频带更加精确的激励谱；

具体步骤如下：

4a Y _ extra = {y _ extra(0), y _ extra(l), ---,y _ extra(39) } , y_extra(i) = y _excit(219 -i) , 对应于 7~8kHz的激励信号。

4b Y_swb = {y_ swb(0), y _ swb(\ ---,y_ swb(2 9) } , y _ swb(i) = y_ excitiSTART + i) , 对应于 8~14kHz的激励信号。其中 START为激励信号起始位置参数，在本实施例中 START=30。

步骤 105: 解码端根据所述激励谱和原始高带信号中的轮廓信息（如频域包络信息 )生成重构高带信号。即对激励谱进行能级匹配调整得到重构高带信号；具体步骤如下：

5a获取激励谱的频域包络（本实施例中为频域能量），即按照和编码端相同的子带划分，提取激励谱的子带能量， 7~8kHz部分的激励谱子带能量为： {excit _ energy _ extra(O), excit _ energy _ extra(\), excit _ energy _ extra } , 8~ 14kHz邵分的激励谱子带能量为 {e;cd _ energy(O), excit _ energy(l),……， excit _ energy (14) }。子带能量的计算过程为： _er^ = J _«(0² , 即对每个子带内的频谱系数求平方和。

5b解码得到原始高带信号的频域包络信息：

{spec _ env _ extra(O), spec _ env _ extra(V), spec _ env _ extra(2) } 和 {spec _ env(0), spec _ env(l),…… ,spec _env(U)}。由于频域包终代表了本子带的平均能量，所以将频域包络乘以本子带内的频谱系数的个数可以得到原始高带信号的频域能量： {orig _ energy _ extra(0),orig _ energy _ extrail), orig _ energy _ extra(2) }和 {orig _ energy(O), orig _ energy (I), ， orig _ energy (I A) }。 5c 可以对激励谱的频域能量和原始高带信号的频域能量，按照原始高带信号的音调特征参数进行平滑处理，得到平滑后的激励谱的频域能量

{excit _ energy _ extra _ sm(0), excit _ energy _ extra _ s (l), excit _ energy _ extra _ sm(2) } 、 {excit _ energy _ (0)， excit _ energy _麓 (1)， , excit _ energy _ (14) }和原始 τ¾带信号的频域能量

{orig _ energy _ extra _ sm(0),orig _ energy _ extra _ sm(l),orig _ energy _ extra _ sm(2) }、 {orig _ energy _ sm(0),orig _ energy _ (1)， , orig _ energy _ (14) }。

5d 根据平滑后的频域能量计算每个子带的能级匹配增益因子

I orig _ energy _ extra _ sm{i) · _Q ^ 2

excit _ energy _ extra _ sm{i)

Ψ = {Ζ(0),_/Τ(1),···,_/Τ(17)} , χ{ί) I 当然，如果没 orig _ energy _ sm(i) _Ί .

.otherwise

excit _ energy _ sm(i) 有进行平滑处理，输入的为 5a、 5b中的频域能量。

5e对激励谱进行能级匹配整形：对每个子带的激励谱的谱系数乘以本子带相应的能级匹配增益因子，即}^_^(0 = }^_ ，得到重构的高带激励谱，包括 7 ~ 8kHz部分的重构谱 { H extra(0), y_re_ extra(\), ---,y_re_ extra(39) } , 8~ 14kHz部分的重构语 { y _ re(0), y _ re(l),- --,y_ re(239) } , 即最终的重构高带信号，完成频带的扩展。

解码端对激励谱进行能级匹配调整，使合成谱的能量包络和原始超宽带谱相接近。

本发明实施例采用在编码端提取原始高带信号的关键特征参数：音调特征参数，用极少的比特资源进行编码传输。在解码端，根据音调特征参数生成控制重构高带信号的激励谱，并根据原始高带信号的轮廓信息（例如频域包络）最终生成重构的高带信号，实现频带扩展。由于在解码端进行高带信号的重构时，基于原始高带信号的细节特征即音调特征参数进行操作，重构的高带信号除了轮廓和原始高带信号接近之外，在细节上有较好的匹配，通过较少的比特资源消耗就能达到较好的听觉效果。

请参阅图 2为本发明一种解码方法的第二个实施例的信令流程图。本发明实施例运用在超宽带编解码器中。编码器的输入信号是 32kHz采样率，处理帧长为 20ms。对输入信号进行分频带、下采样处理后，对应于 0~8kHz 频带的信号有 320个采样点，对应于 8~16kHz频带的信号有 320个采样点。其中 0~8kHz频带内的信号由核心编码器处理，核心编码器可以是 G.729.1编解码器，也可以是其它宽带信号编解码器。

对于 8~16kHz频带内的时域信号 {yjU (l), ······ ,y_hi( \9)} , 经过

MDCT变换后得到了一组 MDCT系数，即该频带对应的频域信号 {y_swb(0),y_swb(l), ······ ,y_swb(319)} , 由于超宽带部分仅处理 8~14kHz频带内的信号，所以对频 i或信号仅处理 {y― b(0),y_ b(l), ······ ,y_swb(239)}。在编码端会将这组频域信号分为 N个子带，提取每个子带的频域包络并量化，得到一组量 4匕后的频 i或包终 {spec _ env(0), spec _ env(l),…… ,spec_ env(N - 1) } , 这组包终经过编码传输到解码端。

对于宽带核心编码器 G.729.1, 7~8kHz部分信号已不在其处理范围之内，为了确保在解码端解码信号频谱的连续性，在编码端需要提取 7~8kHz部分信号的特征参数。由于 G.729.1编码器对 4~8kHz的信号进行了 MDCT变换，对应的频域信号 {y _ wb(0), y _ wb(l),…… ,y _ wb(l59)} , 其中 7~8kHz对应的频域信号为 {y_wb(l20),y_wb(l2l),…… ,y_wb(l59)} , 在编码端将其分为 M个子带，提取每个子带的频域包络并量化，得到一组量化后的频域包络

{spec _ env _ extra(0), spec _ env _ extra{l), , spec _ env _ extra{M _ 1) } , 这组包络经过编码传输到解码端。在本实施例中 N=15, M=3。

步骤 201：编码端发送提取的音调特征参数到解码端；

对超宽带部分的频域信号 {¾?«(0), speed),… . , «(239)}进行音调特征分析，提取音调特征参数，并将该参数量化编码，传输到解码端。

具体的提取过程如下：

( 1 )计算每个子带的音调特征参数：

A(l)将频域信号 {¾^c(0),¾^c(l)， ······ , «(239)}均分为 K个子带，在本实施例中， K=4, 第 i组频域信号为：

S_{ = {spec(i x 60 + 0)， spec(i x 60 + 1)，……， spec(i x 60 + 59)},/ = 0， 1， 2， 3。

B(l)搜索每组频域信号中的最大值 p_e^=max , 并记录最大值所在位置

Pi。

C(l) 计算 A^±L范围内的频域包络的均值，即： L + l , 在本实施例中 L=7。

D(l) 本子带的音调特征参数为 flu_Ci = peak mea^。

(2) 综合提取出表征整个超宽带部分音调特征的 G个音调特征参数，在本实施例中 G=2。具体为 , = ^^。 ^{+ /}^^1)/2'''⁼⁽⁾ , 其中 _to 。对应于

(fluc₂ + fluc₃ ) / 2, = 1

{spec(0), speed),…… ,^c(119)} 部分的音调特征， tona, 对应于 {spec(l20), spec(121),……， spec(239) }部分的音调特征。

(3 )将音调特征参数量化，得到量化后的音调特征参数 ; ^? ，将其编码传输至解码端。

编码端对 to A量化时，对其取值范围可以限定在 1.125~4.5范围之内。在编码端提取音调特征参数时，利用到的参数可以有多种来源，具体参数的计算也可以有多种计算方法。例如：

A其中超宽带部分的频域信号 { (0), speed), ······ , spec(239) }可以是对原始频域信号直接取绝对值得到的 {|y_ b(0)|,|y_ b(l)|,…… ,|y_ b(239)|} ,也可以是由原始频域信号经过下面的公式（ 1 )计算得到的伪谱信号 {s(0),s(l)，…… ,s(239)}:

^]y_swb²(0) + y_swb²(l),i = 0

/y _ swb² (239) + y_ swb² (238) , i = 239 ( 1 ) jy _ swb² () + ( _ swb(i + l)-y _ swb(i + 1))²， otherwise B在步骤（ 1 ) 中，均值的计算也可以是根据下式计算得到。

在步骤（1 ) 中，子带音调特征参数的计算也可以是根据下式计算得到

C在步骤（ 2 ) 中，音调特征参数的综合也可以根据下式计算得到

在步骤（ 2 ) 中，音调特征参数的综合也可以根据下式计算得到

步骤 202: 解码端解码得到音调特征参数;

解码音调特征参数得到 tona^q和 to 如果在编码端对量化时，对其取值范围限定在 1.125~4.5范围之内，在解码端可以按下式对其进行非线性的增强， tona. =tona^q +tona^q xtona^q xTonality— TILT ,在本实施例中

= 2.5/22。通过对音调特征参数的非线性增强，可以更好的控制超宽带谱的合成。当然也可以不进行非线性增强。

步骤 203: 解码端根据音调特征参数生成激励谱；具体可以包括以下步骤：步骤 203A: 解码端生成初始激励谱；

在解码端可以通过多种方式生成激励谱 E = {excit(O), excitd),……， excit(V - 1) } , 可以采用例如以下方式得到激励谱：

对解码端重构的 0~4kHz频带内的时域信号做 MDCT变换，得到 0~4kHz频带内的频域信号{>^_/0(0),}^_/0(1), ······ ,y_lo(159)} ,以及解码得到的 4~7kHz频带内的频域信号{)_/<0),)_/<1),…… ,y_ <119)} , 将这两部分谱组合构成原始激励谱 {y_ lo(0), y _ lo(l), ······ ,y_ to(159), y _ h(0), y _ h(l), ······ ,y_h(U9)} .

由于在解码端需要重构出 7~8kHz的频谱，所以在激励谱中需要包含 7~8kHz的激励信息，在本实施例中 V=280。

步骤 203B 由于激励谱本身具有音调特性，为了使激励谱的音调特性和原始超宽带信号谱的音调特性相匹配，可以对初始激励谱进行音调整形，具体步骤如下:

a根据公式（ 1 )计算出激励谱的伪谱：

SE = {s _ excit(0), s _ excit(\), ,s _ excit(219) }。

b 采用和编码端步骤（1)、（2)相同的方法分别得到伪谱两个子带的音调特征参数 Γ。和 7。

c将激励谱和伪谱分为两个子带，

E₀ ={excit(Qi),excit(\), ,excit(\59)} , Ε₁ = {excit(160),excit(161), , excit(219) }；

SEQ ={s _ excit(0), s _ excit{\), ,s _ excit (159) } ,

SE^ ={s _ excit(l60), s _ excit (161), ,s _ excit{219)} ,

d计算音调整形因子：

C 利用音调整形因子对初始激励谱进行调整。具体为：令

rl_i=a_iIMAX_i , 根据激励谱的音调特性 7；和原始超宽带谱的音调特性 to 之间的关系对激励谱进行调整， , 得到音调整形后的

激励谱 Y = {Y_Q,Y₁} = {y_ excit(0), y _ excit{\ excit{219) }。步骤 203C: 解码端可以对音调整形后的激励谱进行白化，使激励谱的能量分布均衡，有利于后续的能级匹配调整；

解码端提取音调整形后的激励语 Y的谱包络，对激励谱进行白化。具体步骤如下:

a 将激励谱分为 7个子带，计算每个子带的平均能量，即谱包络,

b 为了使白化后的谱有更好的连续性，对谱包络进行平滑内插，得到一组归一化因子 W(0), (1), · · -^(279) }。平滑内插的过程如下： ) = 19 ，其中 W

-,ix40 + 20,i = 1,2,3,4,5 为一个 40点对称窗函数。 C对激励谱进行白化，白化后的激励谱为：

Y = {y _ excit '(0)， _ excit '(1)， · · · y— excit '(279) }，

白化过程为：

y _ excit '(/) = y _ excit ( ) I β{ϊ)。

此时，便生成了最终的激励谱。当然也可以不进行白化，直接用音调整形后的激励语作为最终的激励谱。

步骤 204: 解码端可以对最终生成的激励谱进行频带调整，以获得频带更加精确的激励谱；

解码端对激励谱进行频带调整采用下列公式，

4a Y _ extra = {y _ extra(0), y _ extra(l), ---,y _ extra(39) } , y _ extra(i) = y_ excit '(279 - ) , 对应于 7~8kHz的激励信号。

4b Y_swb = {y_ swb(0), y _ swb(\ ---,y_ swb(2 9) } , y _ swb(i) = y_ excit '(START + i) , 对应于 8~14kHz的激励信号。其中 START为激励信号起始位置参数，在本实施例中 START=30。

步骤 205: 解码端可以在激励谱中加入噪声谱；

为了使激励谱在谱细节上更接近原始超宽带的频谱，在原始超宽带信号的音调特征参数的控制下加入噪声谱，得到加噪之后的激励谱

Y _ extra _n = {y _ extra _ n(0), y _ extra _ η(ί),···， y _ extra _ «(39)} ,

Y _swb_n = {y _swb_ n(0), y _swb _ n(l), ---,y_swb_ «(239) }。具体过程如下：

5a 将原始超宽带信号的音调特征参数映射在 0~1的区间范围内， ton^ = tona /(4.5 + Tonality—TILT x 22)。

5b计算能量增益因子 ener, 在本实施例中 1 - (tona₀ + tona_x )x0.5

ener = 0.25

6 °

5c 对 7~8kHz 的激励信号加入噪声谱： y _ extra _ n(i) = y _ extraii) x tona₀ + ener x - tona x noise 其申 noise是一个在 ±0.⁵范围之内的随机数，即噪声谱。

5d对 8~14kHz的激励信号加入噪声谱：

y _ wb _ n(i) - y _ eb(i) x tona + ener x -Jl-tona² x noise 其申 noise是一个在

+ 0·⁵范围之内的随机数，即噪声谱； tona为综合音调特征参数，设置如下: tona₀ , i = 0, 1, · · · 95

tona = { tonaj,i = 144,145,·· -239 。 ΐοηα₀ χ(ί-μ) + tona χμ,μ= '· ^ , othersie 步骤 206: 解码端根据所述激励谱和原始高带信号中的轮廓信息（如频域包络信息 )生成重构高带信号。即解码端对激励谱进行能级匹配调整得到重构的高带信号。

对激励谱进行能级匹配调整，使合成谱的能量包络和原始超宽带谱相接近。具体步骤如下：

6a获取激励谱的频域包络（本实施例中为频域能量），即按照和编码端相同的子带划分，提取激励谱的子带能量， 7~8kHz部分的激励谱子带能量为

[excit _ energy _ extra(0), excit _ energy _ extra \), excit _ energy _ extra 2) } , 8~14kHz部分的激励谱子带能量为

[excit _ energy(0), excit _ energy(l), , excit _ energy (14) }。子带能量的计算过程为： erg} = 2 — ·)² , 即对每个子带内的频谱系数求平方和。

6b解码得到原始高带信号的频域包络信息：

{spec _ env _ extra(0), spec _ env _ extra{\), spec _ env _ extra{2) } 和

{spec _ env( ), spec _ env(l), , spec _ env 。由于频 i或包终代表了本子带的平均能量，所以将频域包络乘以本子带内的频谱系数的个数可以得到原始高带信号的频域能量： {orig _ energy _ extra(O), orig _ energy _ extra(l), orig _ energy _ extra(2) } 和 {orig _ energy(Q), orig _ energy , ， orig _ energy(l4)}。 6c 可以对激励谱的频域能量和原始高带信号的频域能量，按照原始高带信号的音调特征参数进行平滑处理，得到平滑后的激励谱的频域能量 {excit _ energy _ extra _ sm(0), excit _ energy _ extra _ (1), excit _ energy _ extra _ sm(2) } 、

{excit _ energy _纖 (0), excit _ energy _ sm(V), , excit _ energy _纖 (14) } 和原始高带信号的频域能量

{orig _ energy _ extra _ sm(0), orig _ energy _ extra _ sm(l), orig _ energy _ extra _ sm(2) }

、 {orig _ energy _腿 (0), orig _ energy _腿 (1), , orig _ energy _ (14) }。具体处理如下：

对 7~8kHz邢分的频域能量： energy _ extra _ sm(i) = energy _ extra(i) χ , 其中 ϊ ⁼— ·> g₀ = energy _ extra(i) , ¾ = ^ (tona₀ x e₀ x + (1— tona₀ ) x energy _ extra(i)) , N_t 为每个子带内的频谱系数的个数，在本实施例中为 8, 16, 16。对 8~ 14kHz部分的频域能量： energy _ sm{i) = energy (ί) χχ , 其中 ^e。

r

ei tona₀ + tona_x tona₀ + tona_x

energy(i) , ¾ = ^ (—— —— - ^x i + (1 ―—— -) ^x '

6d 根据平滑后的频域能量计算每个子带的能级匹配增益因子

' orig _ energy _ extra _ - _Q ^ 2

excit energy extra sm(i)

Ψ = { (0), υ 7)}, ): 。当然，如果

没有进行平滑处理，输入的为 6a、 6b中的频域能量

6e对激励谱进行能级匹配整形：对每个子带的激励谱的谱系数乘以本子带相应的能级匹配增益因子，即）^_/^(0 = )^_ ，得到重构的高带激励谱，包括 7~8kHz部分的重构谱 { n extra(O), y_re_ extra(\ ---,y_re_ extra(39) } , 8~14kHz部分的重构谱 {y_r_e(0),y_ /τ(1)，· ··,)_ re(239)} , 即最终的重构高带信号，完成频带的扩展。

请参阅图 3为本发明一种编码方法的一个实施例的结构图；

步骤 301:对超宽带部分的频域信号进行音调特征分析提取音调特征参数；具体步骤如下：

301A将频域信号 { (0), «(1), ······ ,¾^(239)}均分为 Κ个子带，在本实施例中 Κ=4,第 i组频域信号为：

S_t = {spec(i x 60 + 0), spec(i x 60 + 1),……， spec(i χ 60 + 59)},/ = 0, 1, 2, 3。

301B 搜索每个子带频域信号中的最大值 =max ,并记录最大值所在位置 Pi。

301C计算 _A±L范围内的频域包络的均值，即： L + l , 在本实施例中 L=7。

均值的计算也可以是根据下式计算得到 m ni = speed X 60+ j)卜。 301D 本子带的音调特征参数为 flu_Ci = peak, I mean,。

子带音调特征参数的计算也可以是根据下式计算得到 fluc_t = 。

301E 综合每个子带音调特征参数得到音调特征参数。

提取出表征整个超宽带部分音调特征的 G个音调特征参数，在本实施例中

G=2 。具体为 _i = ^fluc。 ^{+ flu l2},^{i = Q} , 其中 1画₀ 对应于

I ( fluc₂ + fluc₃ ) / 2, = 1 {spec(0), speed),…… ,^c(119)} 部分的音调特征， tona, 对应于

{spec(l20), spec(l2l),……， spec(239) }部分的音调特征。音调特征参数的综合也可以根据下式计算得到 _t(mai = \^ fl^flu_Cl i = 0。

msLx(fluc₂ , fluc₃ ),i = 1 步骤 301还可以采用下列方式完成，

计算超宽带部分频域信号的自相关函数；

240- κ

计算超宽带部分频域信号的自相关函数 Corr[n] = ^ spec(n) x spec(n + i) , η e [ΜΙΝ, MAX ] , 在本实施例中 ΜΙΝ=5 Μ ΑΧ=70。

。

步骤 302: 将所述音调特征参数进行量化编码。

请参阅图 4为本发明一种频带扩展系统的一个实施例的结构图；

编码端 401, 用于发送原始高带信号和音调特征参数；

编码端 401对超宽带部分的频域信号 { (0), «(1),… . ,¾^c(239)}进行音调特征分析，提取音调特征参数，并将所述音调参数进行量化编码，将编码传输到解码端。

具体步骤如下：

240- κ

a、计算超宽带部分频域信号的自相关函数 Corr[«]= ^ spec(n)xspec(n + i), n e [MIN, MAX ] , 在本实施例中 MIN=5 M AX=70。

b、超宽带部分的音调特征参数为^ =^^1 。

max(Corr[n]) c、将音调特征参数 to 量化，得到量化后的音调特征参数 _toWfl 将其编码传输至解码端。

解码端 402, 用于接收编码端 401发送的音调特征参数和原始高带信号；根据所述音调特征参数生成激励谱；根据所述激励谱和所述原始高带信号中的轮廓信息生成重构高带信号。解码端 402进一步可以包括：

接收单元 40201 , 用于接收编码端 401发送的音调特征参数和原始高带信号；

激励谱生成单元 40202, 用于根据所述音调特征参数生成重构高带信号的激励 i脊;

高带信号生成单元 40203 , 用于根据所述激励谱和所述原始高带信号中的轮廓信息生成重构高带信号；

激励谱生成单元 40202进一步可以包括：激励谱整形单元 40202a, 用于生成初始激励谱，对所述初始激励谱进行整形得到音调整形后的激励谱。

激励谱生成单元 40202进一步可以包括：

白化单元 40202b,用于对所述初始激励谱或音调整形后的激励谱进行白化得到白化后的激励谱。

解码端 402进一步可以包括：

频带调整单元 40204, 用于对生成的激励谱进行频带调整。

噪声加入单元 40205 , 用于在所述激励谱中加入使激励谱更接近原始高带信号谱结构的噪声谱。

所述高带信号生成单元 40203进一步还可以包括：

谱包络提取单元 40203a, 用于提取激励谱的谱包络；

平滑单元 40203b,用于对激励谱的谱包络和原始高带信号解码谱包络进行平滑内插生成连续的频域包络；

增益因子计算单元 40203c,用于根据所述频域包络计算能级匹配的增益因子；

生成单元 40203d, 用于根据所述增益因子对激励谱进行整形，生成重构的高带信号。

请参阅图 5为本发明一种频带扩展解码端的一个实施列的结构图；包括：接收单元 501 , 用于接收编码端发送的音调特征参数和原始高带信号；激励谱生成单元 502, 用于根据所述音调特征参数生成重构高带信号的激励谱；

高带信号生成单元 503 , 用于根据所述激励谱和所述原始高带信号中的轮廓信息生成重构高带信号的频域信息。

所述激励谱生成单元 502进一步包括：

激励谱整形单元 502a, 用于根据所述普特性对生成的激励谱进行整形。白化单元 502b, 用于对生成的激励谱进行白化。

所述解码端还可以包括：

频带调整单元 504, 用于对激励谱进行频带调整。

噪声加入单元 505, 用于在所述激励谱中加入使激励谱更接近原始高带信号谱结构的噪声谱。

所述高带信号生成单元 503进一步可以包括：

谱包络提取单元 503a, 用于提取激励谱的谱包络；

平滑单元 503b,用于对激励谱的谱包络和原始高带信号解码谱包络进行平滑内插生成连续的频域包络；

增益因子计算单元 503c, 用于根据所述频域包络计算能级匹配的增益因子；

生成单元 503d, 用于根据所述增益因子对激励谱进行整形，生成重构的高带信号。

请参阅图 6为本发明一种频带扩展编码端的一个实施例的结构图；该编码端可以应用在图 4所示的系统中，其包括：

音调特征参数提取单元 601 , 用于对超宽带部分的频域信号进行音调特征分析提取音调特征参数；

具体步骤如下：

将频域信号 {spec(0),spec(l), ······ ,spec(239)}均分为 K个子带，在本实施例中

Κ=4,第 i组频域信号为：

搜索每个子带频域信号中的最大值 =max , 并记录最大值所在位置

Pi。

计算 A ^±L范围内的频域包络的均值，即： , 在本实施例中 L=7。

均值的计算也可以是根据下式计算得到 mea^ =^¾^_C(ix60+ j) ^60„ 本子带的音调特征参数为 fl_UCi = peak mea^。

综合每个子带音调特征参数得到音调特征参数。

_G=2 。具体为 , ^ 。 +

flucm , 其中。对应于 (fluc₂ + ₃ )12 =1

{spec(Q), spec(\),…… ,^ec(119)} 部分的音调特征， tona, 对应于

{spec(120), spec(121),……， spec(239) }部分的音调特征。

音调特征参数的综合也可以根据下式计算得到 _tom =

。

max(/Zwc₂ , fluc₃ ), 还可以采用下列方式完成：

计算超宽带部分频域信号的自相关函数；计算超宽带部分频域信号的自相关函数 Corr[n] = spec(n) x spec(n + i) , n e [MIN, MAX ] , 在本实施例中 MIN=5 M AX=70。 _ -_m j min(Corr[wl)

晋调特征参数为 tona =—— ―。

max(Corr[n]) 量化单元 602, 用于将所述音调特征参数进行量化编码发送所述音调特征参数。

其中，音调特征参数提取单元 601可以包括：

自相关函数单元 601a,用于通过计算超宽带部分频域信号的自相关函数得提取单元 601c, 综合提取出表征整个超宽带部分音调特征的音调特征参数。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括： ROM、 RAM, 磁盘或光盘等。

施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

权利要求

1、一种解码方法，其特征在于，包括：

获取音调特征参数和原始高带信号；

根据所述音调特征参数生成激励谱；

根据所述激励谱和所述原始高带信号中的轮廓信息生成重构高带信号。

2、根据权利要求 1所述的解码方法，其特征在于,所述根据所述音调特征参数生成激励谱包括：

生成初始激励谱；

对所述初始激励谱进行音调整形得到音调整形后的激励谱。

3、根据权利要求 2所述的解码方法，其特征在于，所述对所述初始激励谱进行音调整形得到音调整形后的激励谱包括：

计算初始激励谱的伪谱；

计算初始激励谱的伪谱的音调特征参数；

根据所述音调特征参数和所述伪谱的音调特征参数计算音调整形因子；利用所述音调整形因子对初始激励谱进行调整。

4、根据权利要求 2所述的解码方法，其特征在于，所述根据所述音调特征参数生成激励谱进一步包括：对所述初始激励谱或音调整形后的激励谱进行白化得到白化后的激励谱。

5、根据权利要求 1、 2或 4任一所述的解码方法，其特征在于，所述根据所述音调特征参数生成激励谱后进一步包括：对生成的所述激励谱进行频带调

6、根据权利要求 1、 2或 4任一所述的解码方法，其特征在于，所述根据所述音调特征参数生成激励语后进一步包括：在所述激励谱中加入噪声谱。

7、根据权利要求 1、 2或 4任一所述的解码方法，其特征在于，所述根据激励谱和原始高带信号中的轮廓信息生成重构高带信号包括：

获取所述激励谱的频域包络和原始高带信号的频域包络；

根据所述频域包络计算能级匹配的增益因子；

根据所述增益因子对所述激励谱进行整形，生成重构的高带信号。

8、根据权利要求 7所述的解码方法，其特征在于，所述获取所述激励谱和原始高带信号的频域包络之后进一步包括：

对所述激励谱的频域包络和所述原始高带信号的频域包络进行平滑处理，得到平滑后的激励谱的频域包络和原始高带信号的频域包络。

9、一种编码方法，其特征在于：

10、根据权利要求 9所述的编码方法，其特征在于，所述对超宽带部分的频域信号进行音调特征分析提取音调特征参数包括：通过计算超宽带部分频域信号的自相关函数得到所述音调特征参数。

11 , 根据权利要求 9所述的编码方法，其特征在于，所述对超宽带部分的频域信号进行音调特征分析提取音调特征参数包括：

计算每个子带频域信号音调特征参数；

综合提取出表征整个超宽带部分音调特征的音调特征参数。

12、根据权利要求 11所述的编码方法，其特征在于，所述计算子带频域信号音调特征参数包括：

将频域信号平均分成多个子带频域信号；

搜索每个子带频域信号的最大值和所在位置；

计算每个子带频域信号最大值设定范围内的频域包络平均值；

子带频域信号的音调特征参数为子带频域信号最大值与频域包络平均值的比值。

13、一种频带扩展系统，其特征在于，包括：

编码端，用于发送原始高带信号和音调特征参数；

解码端，用于接收编码端发送的音调特征参数和原始高带信号；根据所述音调特征参数生成激励谱；根据所述激励谱和所述原始高带信号中的轮廓信息生成重构高带信号。

14、一种解码端，其特征在于包括：

接收单元，用于接收音调特征参数和原始高带信号；

激励谱生成单元，用于根据所述音调特征参数生成激励谱；

15、根据权利要求 14所述的频带扩展解码端，其特征在于，所述激励谱生成单元包括：

激励谱整形单元，用于生成初始激励谱，对所述初始激励谱进行音调整形得到音调整形后的激励谱。

16、根据权利要求 15所述的频带扩展解码端，其特征在于，所述解激励谱生成单元包括：

白化单元，用于对所述初始激励谱或音调整形后的激励谱进行白化得到白化后的激励谱。

17、根据权利要求 14、 15或 16任一所述的频带扩展解码端，其特征在于所述解码端进一步包括：

频带调整单元，用于对生成的所述激励谱进行频带调整。

18、根据权利要求 14或 16所述的频带扩展解码端，其特征在于，所述解码端进一步包括：

噪声加入单元，用于在所述激励谱中加入噪声谱。

19、一种编码端，其特征在于，包括：

量化单元，用于将所述音调特征参数进行量化编码。

20、根据权利要求 19所述的编码端，其特征在于，所述音调特征参数提取单元包括：

自相关函数单元，用于通过计算超宽带部分频域信号的自相关函数得到所述音调特征参数。

21、根据权利要求 19所述的编码端，其特征在于，所述音调特征参数提取单元包括：

计算单元，用于计算每个子带频域信号音调特征参数；

提取单元，综合提取出表征整个超宽带部分音调特征的音调特征参数。