CN101281748A - 用编码索引实现的空缺子带填充方法及编码索引生成方法 - Google Patents

用编码索引实现的空缺子带填充方法及编码索引生成方法 Download PDF

Info

Publication number
CN101281748A
CN101281748A CNA2008100477227A CN200810047722A CN101281748A CN 101281748 A CN101281748 A CN 101281748A CN A2008100477227 A CNA2008100477227 A CN A2008100477227A CN 200810047722 A CN200810047722 A CN 200810047722A CN 101281748 A CN101281748 A CN 101281748A
Authority
CN
China
Prior art keywords
subband
enhancement layer
index
signal
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008100477227A
Other languages
English (en)
Other versions
CN101281748B (zh
Inventor
胡瑞敏
周成
杨玉红
高戈
谢昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN2008100477227A priority Critical patent/CN101281748B/zh
Publication of CN101281748A publication Critical patent/CN101281748A/zh
Application granted granted Critical
Publication of CN101281748B publication Critical patent/CN101281748B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供的空缺子带填充方法包括:接收编码码流,获取第一增强层编码索引和第二增强层编码索引;根据第一增强层编码索引确定解码信息,根据第二增强层编码索引确定解码信息;根据解码信息对未量化子带进行填充并作平滑处理,根据第一增强层解码信息初步填充第二增强层未能解码的高频成分,对填充子带和邻接子带做平滑处理。编码索引生成时第一增强层使用带宽扩展参数编码方法,带宽扩展参数编码索引作为第一增强层编码索引;第二增强层将低频残差信号和高频信号转换到频域后并量化,矢量量化编码索引作为第二增强层编码索引。本发明可以有效减少频谱空洞现象对解码信号产生的不良影响,提升解码信号的音质效果。

Description

用编码索引实现的空缺子带填充方法及编码索引生成方法
技术领域
本发明属于可分级编解码,特别涉及利用编码索引实现的空缺子带填充方法及编码索引生成方法。
背景技术
可分级编解码技术将码流划分为一个核心层及多个增强层,其中核心层保证信号的最低重建质量,增强层则通过提高信噪比或者扩展频带的方式渐次改善重建质量。接收到的增强层数越多,解码的编码音质越高。可分级编码方法通过直接丢弃增强层码流的方式适应网络带宽波动。
在可分级编解码过程中,如果码率较低,编码比特不足以对全频带信号进行编码时,会使解码信号在频谱上出现空洞,从而由于频谱上的不连贯导致噪声的出现,使最终的解码效果大打折扣。
现有技术中,为应对频谱空洞现象所设计的空缺子带填充方法机制比较简单,在提升音质方面效果不佳。例如3GPP的AMR-WB+中,通过生成高斯随机噪声并依据能量进行调整后来填充空缺子带,此方法计算复杂度低,但是效果甚微。还有ITU-T的G729.1中,采用带宽扩展的数据并依据能量进行调整后来填充空缺子带,在一定程度上利用了填充子带的原始信息,但是由于调整的手段单一,填充效果不佳。因此如何解决频谱空洞问题,避免其对解码信号产生的不良影响,是当前可分级编解码研究的重点。
发明内容
本发明提供了利用编码索引实现的空缺子带填充方法及编码索引生成方法,以便解决可分级编解码过程中的频谱空洞问题,提升解码音质。
本发明提供了一种利用编码索引实现的空缺子带填充方法,包括以下步骤:
步骤1,接收编码码流,获取编码码流中的核心层编码索引、第一增强层编码索引和第二增强层编码索引;
步骤2,根据第一增强层编码索引确定第一增强层解码信息,根据第二增强层编码索引确定第二增强层解码信息;
步骤3,根据第一增强层解码信息和第二增强层解码信息对未量化子带进行填充并作平滑后处理,包括以下2个步骤,
步骤3.1,根据第一增强层解码信息初步填充第二增强层未能解码的高频成分;
步骤3.2,在完成初步填充之后,对填充子带和其邻接子带做平滑处理。
而且,所述平滑处理的具体方式为,选取邻接子带平滑点,将填充子带以及两端邻接子带的平滑点纳入平滑范围内;计算填充子带的平均能量threshold作为门限,计算平滑范围内的平均能量Ek;令变量tmp=Ek,若tmp低于threshold,则将其增大1.5db,若tmp高于threshold,则将其降低1.5db;最后将平滑范围内的点按比例因子 θ = tmp E k 进行统一缩放。
而且,根据空缺子带与邻接子带的能量差值和邻接子带的平滑程度选取邻接子带平滑点。
本发明还提供了用于上述空缺子带填充方法的编码索引生成方法,技术方案为:将当前输入信号分解为低频信号和高频信号分别进行编码;核心层对低频信号进行编码,生成核心层编码索引;第一增强层使用带宽扩展参数编码方法对高频信号进行编码实现频带扩展,带宽扩展参数编码索引作为第一增强层编码索引;第二增强层将低频残差信号和高频信号转换到频域后并量化,矢量量化编码索引作为第二增强层编码索引,所述低频残差信号由低频信号转换得到。
本发明提供的技术方案符合音频信号的连续性和邻接子带相关性原则,并且以空缺子带能量为基本依据,结合空缺子带邻接子带信息共同完成对空缺子带的填充。因而,本发明可以有效减少频谱空洞现象对解码信号产生的不良影响,提升解码信号的音质效果。
附图说明
图1为本发明实施例的编码原理示意图;
图2为本发明实施例的第一增强层编码原理示意图;
图3为本发明实施例的第二增强层编码原理示意图;
图4为本发明实施例的解码原理示意图;
图5为本发明实施例的第一增强层解码原理示意图;
图6为本发明实施例的第二增强层解码原理示意图;
图7为本发明实施例的空缺子带填充流程图。
具体实施方式
本发明提供了一种利用编码索引实现的空缺子带填充方法,包括以下步骤:
步骤1,接收编码码流,获取编码码流中的核心层编码索引、第一增强层编码索引和第二增强层编码索引;
步骤2,根据第一增强层编码索引确定第一增强层解码信息,根据第二增强层编码索引确定第二增强层解码信息;
步骤3,根据第一增强层解码信息和第二增强层解码信息对未量化子带进行填充并作平滑后处理,包括以下2个步骤,
步骤3.1,根据第一增强层解码信息初步填充第二增强层未能解码的高频成分;
步骤3.2,在完成初步填充之后,对填充子带和其邻接子带做平滑处理。
第一增强层编码索引是高频空缺子带填充的重建参考信息,可被视为子带粗略重建参考信息;第二增强层编码索引可被视为子带精确重建参考信息。联合子带粗略重建参考信息和精确重建参考信息可以确定需要填充的子带以及填充内容,最后还需要对精确重建信号中由于比特数的限制而未能量化的子带进行填充,即是所谓空缺子带填充。本发明提出的空缺子带填充方案,在根据第一增强层解码信息初步填充第二增强层未能解码的高频成分之后,对填充子带和其邻接子带做平滑处理。这种平滑处理手段巧妙符合音频信号连续性和邻接子带相关性原则,因此填充效果非常好,并且实施时计算复杂度不高,具有良好的实用效果。
具体实施时,第一增强层编码索引和第二增强层编码索引根据编码时第一增强层和第二增强层的具体编码处理方式而决定生成内容。本发明提供了编码索引生成优选方案:选择第一增强层使用带宽扩展参数编码方法对高频信号进行编码实现频带扩展,带宽扩展参数编码索引作为第一增强层编码索引,提供高频空缺子带填充的重建参考信息;第二增强层将低频残差信号和高频信号转换到频域后并量化,量化信号用于增强全频带编码信号感知质量,使合成信号编码信噪比逐级提升,矢量量化编码索引作为第二增强层编码索引。带宽扩展参数编码方法为现有技术,具体实施时若选用其他编码方式,生成的第一增强层编码索引和第二增强层编码索引也能用于本发明提供的空缺子带填充方法。
在实际运用中,本发明提供的空缺子带填充技术方案是可分级编解码过程的一部分,具体实施时可分级编解码过程的核心层编解码等其他部分可以采用编解码领域现有技术内容。为了便于对本发明的技术方案进行详细说明,以下提供实施例的完整可分级编解码过程。
参见图1,可分级编码过程具体包括以下5个步骤:
(11)对输入的音频信号进行正交镜像滤波;
具体将采样率为16kHz,帧长为20ms的输入音频信号sWB(n)通过下采样滤波后,经正交镜像滤波器分解为低频信号和高频信号,正交镜像滤波器由低通滤波器H1(z)和高通滤波器H2(z)构成,将音频信号SWB(n)通过H1(z)得到低频信号SLB(n),通过H2(z)得到高频信号SHB(n)。低通滤波器H1(z)为一对称的64阶FIR滤波器,且H2(z)和H1(z)存在以下关系:
             H2(n)=(-1)nH1(n)
(12)将低频信号SLB(n)送入核心层进行CELP编码;
具体将低频信号SLB(n)通过核心层CELP编码器得到输出合成信号
Figure A20081004772200081
用以保证基本编码质量,并将编码索引写入编码码流。
(13)将高频信号SHB(n)送入第一增强层进行编码;
第一增强层提取一系列高频参数(这一系列参数粗略的表征高频信号SHB(n)特征),如图2所示,这一系列高频参数包括一组时域包络参数以及一组频域包络参数。具体包括以下过程:
(131)计算时域包络参数。以每10样点的对数域能量来表征高频信号SHB(n)时域包络,具体计算如下:
T env ( i ) = 1 2 log 2 ( Σ n = 0 9 s HB 2 ( n + i · 10 ) ) , i = 0 , . . . , 15
(132)计算频域包络参数。为高频信号SHB(n)计算12个频域包络参数Fenv(j),j=0,...,11,首先对SHB(n)加窗wF(n)。窗wF(n)形式如下:
w F ( n ) = 1 2 ( 1 - cos ( 2 πn 143 ) ) , n = 0 , · · · , 71 1 2 ( 1 - cos ( 2 π ( n - 16 ) 111 ) ) , n = 72 , · · · , 127
可以看到,这是一个128阶长(16ms)的窗,其中上升沿是一个144阶的Hanning窗,滚降沿是一个112阶的Hanning窗。
wF(n)对每10ms帧加窗一次,加窗时,将wF(n)的最大样值点至于当前10ms帧的中心,即:
s HB w ( n ) = s HB ( n ) · w F ( n + 31 ) , n = - 31 , . . . , 96
加窗后,对加窗后信号sHB w(n)做64阶FFT变换,FFT变换式如下:
S HB fft ( k ) = FFT 64 ( s HB w ( n ) + s HB w ( n + 64 ) ) , k = 0 , . . . , 63 , n = - 31 , . . . , 32
对计算得到的FFT系数,由下式计算得到对数域的12个频域包络参数:
F env ( j ) = 1 2 log 2 ( Σ k = 2 j 2 ( j + 1 ) W F ( k - 2 j ) · | S HB fft ( k ) | 2 ) , j = 0 , . . . , 11 .
其中WF(k)为一个频域加权窗,窗值如下:
          WF(0)=0.5,WF(1)=1,WF(2)=0.5
(133)时域包络参数量化。在量化时域包络参数Tenv(i),i=0,...,15前,首先计算时域包络均值参数MT,再通过分裂矢量量化进行量化。MT计算如下:
M T = 1 16 Σ i = 0 15 T env ( i )
然后,从Tenv(i)中移除量化值
Figure A20081004772200102
T env M ( i ) = T env ( i ) - M ^ T , i = 0 , . . . , 15
将均值移除后时域包络参数分裂为以下2个8维矢量分别进行量化:
T env , 1 = ( T env M ( 0 ) , T env M ( 1 ) 1 , . . . , T env M ( 7 ) ) and T env , 2 = ( T env M ( 8 ) , T env M ( 9 ) , . . . , T env M ( 15 ) )
(134)频域包络参数量化。在量化频域包络参数Fenv(j),j=0,...,11前,首先计算频域包络均值参数MF,再通过分裂矢量量化进行量化。MF计算如下:
M F = 1 12 Σ j = 0 11 F env ( j )
然后,从Fenv(j)中移除量化值
Figure A20081004772200106
F env M ( j ) = F env ( j ) - M ^ F , j = 0 , . . . . . , 11
将均值移除后频域包络参数分裂为以下3个4维矢量分别进行量化:
F env , 1 = ( F env M ( 0 ) , F env M ( 1 ) 1 , F env M ( 2 ) , F env M ( 3 ) ) F env , 2 = ( F env M ( 4 ) , F env M ( 5 ) 1 , F env M ( 6 ) , F env M ( 7 ) ) F env , 3 = ( F env M ( 8 ) , F env M ( 9 ) 1 , F env M ( 10 ) , F env M ( 11 ) )
步骤(133)和步骤(134)分别得到的时域包络参数量化索引和频域包络参数量化索引共同构成带宽扩展参数编码索引,作为第一增强层编码索引。
(14)计算低频加权残差信号dLB w(n);
首先计算低频残差信号dLB(n),具体为将低频信号SLB(n)减去合成信号
Figure A20081004772200109
得到:
d LB ( n ) = S LB ( n ) - S LB ^ ( n ) , n = 0 , . . . . 159
然后将低频残差信号dLB(n)通过感知加权滤波器WLB(Z)得到低频加权残差信号dLB w(n),WLB(Z)表达式如下:
W LB ( z ) = fac A ^ ( z / γ 1 ′ ) A ^ ( z / γ 2 ′ )
其中γ1′和γ2′为常数,fac为增益补偿,且:
fac = | A ^ ( z / γ 2 ′ ) A ^ ( z / γ 1 ′ ) | , 其中为量化线性预测滤波器。
(15)将全频带信号送入第二增强层进行编码。如图3所示,第二增强层对全频带信号进行编码,使合成信号编码信噪比逐级提升,具体包括以下过程:
(151)谱整合。第二增强层输入由两部分构成:低频加权残差信号dLB w(n)和高频信号SHB(n),这两个信号均为时域信号,需要进行频域转换,得到低频频域加权残差信号dLB w(k)和高频频域信号SHB(k)并进行谱整合,组成全频段频域信号,记作Y(k);
(152)子带划分。将全频带频域信号Y(k)(320个样点)平均划分为40个子带,每个子带8个样点,对应一个8维矢量,以便进行格型矢量量化。定义sb_bound(j)为第j个子带的起始点,则有:
       sb_bound(j)≤k<sb_bound(j+1),j=0,...,39
(153)谱包络计算及编码;
为了在量化Y(k)时根据各子带的感知重要性指导比特分配,需要计算各子带频谱包络,频谱包络表达子带的平均能量信息,可以用于在解码端重建频谱数据。各子带频谱包络计算如下:
log _ rms ( j ) = 1 2 log 2 [ 1 8 Σ k = sb _ bound ( j ) sb _ bound ( j + 1 ) - 1 Y ( k ) 2 + ϵ rms ] , j = 0 , . . . , 39
其中,εrms为一微小偏移以防止log函数输入为0,这里采用差分哈夫曼方法量化频谱包络,rms_index(j)为频谱包络量化索引;
(154)子带比特分配;
定义ip(j)为第j个子带的感知重要性:
ip ( j ) = 1 2 log 2 ( 1 8 rms _ q ( j ) 2 ) + offset , j = 0 , . . . , 39
其中, rms _ q ( j ) = 2 1 / 2 rms _ index ( j ) 为量化的频谱包络,offset为偏移量,
Figure A20081004772200123
为信号的子带能量,为方便比较感知重要性,设定 offset = 3 2 , 则:
ip ( j ) = 1 2 rms _ index ( j ) , j = 0 , . . . , 39
然后按子带感知重要性ip(j)从高到低分配各子带编码比特数,存于nbit(j)中;
(155)频谱数据量化。
根据已分配好的各子带编码比特数nbit(j),运用格型矢量量化方法量化频谱数据Y(k),并将该量化索引写入码流。此格型矢量量化索引和频域包络量化索引rms_index(j)共同构成矢量量化编码索引,作为第二增强层编码索引。
参见图4,相应的可分级解码过程具体包括以下4个步骤:
(21)核心层CELP解码;
根据从收到的码流中解析获得的码本索引,计算出代数码本,然后通过LP合成滤波器以及长时相关合成滤波器,得到输出合成信号
(22)第一增强层解码;
如图5所示,第一增强层解码具体包括以下过程,包括5个步骤:
(221)时域/频域包络参数解码。时域包络参数量化索引和频域包络参数量化索引共同构成带宽扩展参数编码索引,因此时域/频域包络参数解码的根据即为带宽扩展参数编码索引。需要解码的包络参数包括:时域均值参数
Figure A20081004772200127
频域均值参数以及下列矢量 T env , 1 , ^ T env , 2 , ^ F env , 1 , ^ F env . 2 ^ , F env , 3 ^ .
由分裂矢量
Figure A20081004772200131
Figure A20081004772200132
合并得到均值移除矢量
Figure A20081004772200133
然后再加上时域均值参数得到时域包络参数
Figure A20081004772200135
T env ( i ) ^ = T env M ( i ) ^ + M ^ T , i = 0 , . . . . . , 15
由分裂矢量
Figure A20081004772200137
Figure A20081004772200138
合并得到均值移除矢量
Figure A20081004772200139
然后再加上频域均值参数
Figure A200810047722001310
得到频域包络参数
Figure A200810047722001311
F env ( j ) ^ = F env M ( j ) ^ + M ^ F , j = 0 , . . . . . , 11
(222)高频激励生成。将由核心层参数模拟生成的激励信号exc(n)通过一个截至频率为4kHz的低通滤波器,得到最终的高频激励信号SHB exc(n);
(223)时域包络整形。通过对激励信号SHB exc(n)时域包络整形,得到的信号
Figure A200810047722001313
将具有和原始高频信号SHB(n)相近的时域包络形状,整形通过如下方式实现:
S HB T ^ ( n ) = g T ( n ) * S HB exc ( n ) , n = 0 , . . . . , 159
gT(n)的计算如下:
首先对激励信号
Figure A200810047722001315
进行时域包络参数计算,得到一组激励信号时域包络参数 T ~ env ( i ) , i = 0 , . . . , 15 .
然后,利用解码时域包络参数和激励信号时域包络参数
Figure A200810047722001318
计算一组预增益参数:
g ′ T ( i ) = 2 T ^ env ( i ) - T ~ env ( i ) , i = 0 , . . . , 15
最后,对这组预增益参数进行插值得到gT(n):
g T ( n + i · 10 ) = w t ( n ) · g ′ T ( i ) + w t ( n + 10 ) · g ′ T ( i - 1 ) n = 0 , . . . , 4 w t ( n ) · g ′ T ( i ) n = 5 , . . . , 9
其中,g′T(-1)定义为上一帧最后1.25ms计算得到的g′T(15),wt(n)为一平顶Hanning窗,窗表达式如下:
w t ( n ) = 1 2 · [ 1 - cos ( ( n + 1 ) · π 6 ) ] n = 0 , . . . , 4 1 n = 5 , . . . , 9 1 2 · [ 1 - cos ( ( n + 9 ) · π 6 ) ] n = 10 , . . . , 14
(224)频域包络整形。解码得到的频域包络参数 F env ( j ) , ^ j = 0 , . . . , 11 表征的是每一个20ms帧第二个10ms帧的频域包络,而第一个10ms帧的频域包络参数通过插值得到:
F ^ env , int ( j ) = 1 2 ( F ^ env , old ( j ) + F ^ env ( j ) ) , j = 0 , . . . , 11
其中
Figure A20081004772200144
为当前帧的频域包络参数,
Figure A20081004772200145
为上一帧的频域包络参数。
然后,将时域包络已调激励信号
Figure A20081004772200146
分为2个10ms帧进行频域包络参数计算,得到分别对应帧号l=1,2的频域包络参数 F ~ env , l ( j ) , j = 0 , . . . , 11 , 再得到频域预增益:
G F , 1 ( j ) = 2 F ^ env , int ( j ) - F ~ env , 1 ( j ) G F , 2 ( i ) = 2 F ^ env ( j ) - F ~ env , 2 ( j ) , j = 0 , . . . , 11
接着利用此预测增益计算得到两个FIR滤波器冲击响应:
h F , l ( n ) = Σ i = 0 11 G F , l ( i ) · h F ( i ) ( n ) + 0.1 · h HP ( n ) , n = 0 , . . . , 32 , l = 1,2
最后对时域包络已调激励信号进行频域包络整形:
s ^ HB F ( n ) = Σ m = 0 32 s ^ HB T ( n - m ) h F , 1 ( m ) , n = 0 , . . . , 79
s ^ HB F ( n ) = Σ m = 0 32 s ^ HB T ( n - m ) h F , 2 ( m ) , n = 80 , . . . , 159
(225)自适应幅度压缩后处理。经过时域/频域包络整形后的信号
Figure A200810047722001414
可能伴随有一些咔-嗒的噪声,有必要对
Figure A200810047722001415
进行后处理。后处理的方法为:将
Figure A20081004772200151
中每1.25ms块的能量与对应的时域包络参数
Figure A20081004772200152
进行比较,然后压缩得到合成信号
Figure A20081004772200153
具体处理原则如下:
Figure A20081004772200154
(23)包括本发明实施例声明空缺子带填充方法的第二增强层解码;
第二增强层解码后,频谱信号将被分为高频和低频两个部分,分别进行时域转换后得到时域信号。高频部分的时域信号即为原信号,低频信号的时域信号将作为扩展核心层CELP解码的补充,来改进低频合成信号的效果,其中一个关键的过程即为本发明实施例声明的空缺子带填充方法。如图6所示,解码具体包括以下过程:
(231)包谱络解码。
从码流中得到包谱络量化索引rms_index(j),并得到频谱包络:
rms _ q ( j ) = 2 1 / 2 rms _ index ( j ) , j = 0 , . . . , 39
(232)子带比特分配。首先计算第j个子带的感知重要性ip(j):
ip ( j ) = 1 2 rms _ index ( j ) , j = 0 , . . . , 39
然后按子带感知重要性ip(j)从高到低分配各子带编码比特数,存于nbit(j)中;
(233)矢量量化解码。根据各子带编码比特数nbit(j)以及格型矢量量化索引码流,通过查找码本得到量化频谱数据
Figure A20081004772200157
(234)空缺子带填充平滑。受限于码率,在编码时如果没有足够的比特对所有子带进行量化,解码得到的量化信号就会出现频谱空洞现象,较大地影响解码音质,因此需要对未量化子带进行填充以保证频谱连续。
如图7所示,本发明实施例提出了一种新的空缺子带填充方案,结合空缺子带邻接子带信息共同完成对空缺子带的平滑填充,符合音频信号的连续性和邻接子带相关性原则,可以有效减少频谱空洞现象对解码信号产生的不良影响,提升解码信号的音质效果。具体实现过程可以包括:
(2341)空缺子带初步填充。在比特数不够的情况下,高频部分有可能未能编码从而导致频谱空洞,这里用第一增强层参数编码频谱信息初步填补第二增强层未能编码的高频成分,则第j个子带的填充如下:
Y exc ^ ( sb _ bound ( j ) + k ) = S HB ^ ( sb _ bound ( j ) - 160 + k ) , k = 0 , . . . 7
(2342)平滑填充子带和邻接子带。在完成初步填充之后,需要对填充子带和邻接子带一起做平滑处理以避免边界噪声的出现。本发明提供了进一步技术方案,以空缺子带能量为基本依据实现平滑,是提升解码信号音质效果的最优选平滑方案:
首先选取邻接子带所需平滑点的数量N,选取可以参考两个因素决定,一是空缺子带与邻接子带的能量差值,另一个是邻接子带的平滑程度。假设邻接子带为A=(a1,a2....a16),其平均能量为EA;而填充子带为B=(b1,b2...b16),其通过编码端传递的能量值为EB,则选取的点数由下式决定:
N = 16 / lg &alpha; &beta; &alpha; > 10 &beta; 16 &beta; ( 1 - &alpha; ) &alpha; < 10 &beta; (N>=0且N<=16)
其中 &alpha; = &Sigma; i = 1 i = 16 ( a i - M ) 2 / &Sigma; i = 1 i = 16 a i 2 , M = &Sigma; i = 1 i = 16 a i 2 / 16 , α表征临近子带的平滑程度。 &beta; = | E B - E A | E B , β表征填充子带与临近子带的能量差异的大小。
然后将填充子带以及两端邻接子带需平滑的点纳入平滑范围内,进行统一平滑。平滑范围为:
                 Nsum=N+8+N
平滑思想是将这Nnum个点的能量水平调整至填充子带的能量水平,计算填充子带的平均能量threshold作为门限,即:
threshold = &Sigma; i = 1 8 b i 2 / 8
并计算平滑范围内的平均能量Ek
E k = &Sigma; i = 1 N sum a i 2 / N sum
若Ek低于门限值threshold,则将其增大1.5db;若高于,则降低1.5db。由此来进行谱线平滑。具体包括以下操作:
首先,设定变量tmp以便进行平滑调整,首先对tmp进行初始赋值,令tmp=Ek
然后,根据判断结果,
若tmp<threshold,令tmp=tmp*1.414(即增大1.5db),此时,若tmp>threshold,则令tmp=threshold。
若tmp>=threshold,令tmp=tmp/1.414(即降低1.5db),此时,若tmp<threshold,则令tmp=threshold。
最后,根据变量tmp的值计算比例因子 &theta; = tmp E k , 再将平滑范围内的点按比例因子θ进行统一缩放。本发明实施例选取了1.5db作为调整幅度,具体实施时,对Ek的调整可根据具体需要选取其他数值,在0.5db~2.0db范围内取值为佳。
经过上述空缺子带填充平滑处理后,频谱空洞现象得以解决,同时由于对重建信号进行能量平滑,消除了重建信号中“毛刺”噪声,有效提升了解码音质。
(235)幅度调整。
根据量化频谱包络信息rms_q(j)对信号
Figure A20081004772200181
进行能量调整得到最终解码信号
Figure A20081004772200182
(24)生成重构合成音频信号
Figure A20081004772200183
将低频合成信号
Figure A20081004772200184
和高频合成信号
Figure A20081004772200185
通过正交镜像滤波器生成重构音频信号
Figure A20081004772200186
S HB ^ ( k ) = S HB ^ ( n ) 即为高频信号SHB(n)的量化信号,又称高频合成信号。对低频合成信号
Figure A20081004772200188
的处理还涉及到低频加权残差信号dLB w(n), d LB w ^ ( k ) = d LB w ^ ( n ) 即为低频加权残差信号dLB w(n)的量化信号,又称量化加权残差信号。
可见,通过上述本发明实施例可以在编解码端提供了一种性能良好的空缺子带填充实现方案。本发明实施例联合带宽扩展参数编码信息以及频谱数据量化信息对未量化子带进行填充,从而有效地消除了解码合成信号频谱空洞现象,实现了编码后的感知音质的提高。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (4)

1.一种用编码索引实现的空缺子带填充方法,其特征在于,包括以下步骤:
步骤1,接收编码码流,获取编码码流中的核心层编码索引、第一增强层编码索引和第二增强层编码索引;
步骤2,根据第一增强层编码索引确定第一增强层解码信息,根据第二增强层编码索引确定第二增强层解码信息;
步骤3,根据第一增强层解码信息和第二增强层解码信息对未量化子带进行填充并作平滑后处理,包括以下2个步骤,
步骤3.1,根据第一增强层解码信息初步填充第二增强层未能解码的高频成分;
步骤3.2,在完成初步填充之后,对填充子带和其邻接子带做平滑处理。
2.如权利要求1所述的空缺子带填充方法,其特征在于:所述平滑处理的具体方式为,选取邻接子带平滑点,将填充子带以及两端邻接子带的平滑点纳入平滑范围内;计算填充子带的平均能量threshold作为门限,计算平滑范围内的平均能量Ek;令变量tmp=Ek,若tmp低于threshold,则将其增大1.5db,若tmp高于threshold,则将其降低1.5db;最后将平滑范围内的点按比例因子 &theta; = tmp E k 进行统一缩放。
3.如权利要求2所述的空缺子带填充方法,其特征在于:根据空缺子带与邻接子带的能量差值和邻接子带的平滑程度选取邻接子带平滑点。
4.用于权利要求1或2或3所述的空缺子带填充方法的编码索引生成方法,其特征在于:将当前输入信号分解为低频信号和高频信号分别进行编码;核心层对低频信号进行编码,生成核心层编码索引;第一增强层使用带宽扩展参数编码方法对高频信号进行编码实现频带扩展,带宽扩展参数编码索引作为第一增强层编码索引;第二增强层将低频残差信号和高频信号转换到频域后并量化,矢量量化编码索引作为第二增强层编码索引,所述低频残差信号由低频信号转换得到。
CN2008100477227A 2008-05-14 2008-05-14 用编码索引实现的空缺子带填充方法及编码索引生成方法 Expired - Fee Related CN101281748B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100477227A CN101281748B (zh) 2008-05-14 2008-05-14 用编码索引实现的空缺子带填充方法及编码索引生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100477227A CN101281748B (zh) 2008-05-14 2008-05-14 用编码索引实现的空缺子带填充方法及编码索引生成方法

Publications (2)

Publication Number Publication Date
CN101281748A true CN101281748A (zh) 2008-10-08
CN101281748B CN101281748B (zh) 2011-06-15

Family

ID=40014176

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100477227A Expired - Fee Related CN101281748B (zh) 2008-05-14 2008-05-14 用编码索引实现的空缺子带填充方法及编码索引生成方法

Country Status (1)

Country Link
CN (1) CN101281748B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102194457A (zh) * 2010-03-02 2011-09-21 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
CN102542541A (zh) * 2011-12-31 2012-07-04 浙江大学 深度图像后处理的方法
CN104269173A (zh) * 2014-09-30 2015-01-07 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
CN105229738A (zh) * 2013-01-29 2016-01-06 弗劳恩霍夫应用研究促进协会 用于使用能量限制操作产生频率增强信号的装置及方法
CN105706166A (zh) * 2013-10-31 2016-06-22 弗劳恩霍夫应用研究促进协会 通过在频域插入时间预整形噪声进行音频带宽扩展
CN106796798A (zh) * 2014-07-28 2017-05-31 弗劳恩霍夫应用研究促进协会 用于使用独立噪声填充生成增强信号的装置和方法
CN107527628A (zh) * 2013-07-12 2017-12-29 皇家飞利浦有限公司 用于在音频信号解码器中进行频带扩展的优化缩放因子
CN107770511A (zh) * 2016-08-15 2018-03-06 中国移动通信集团山东有限公司 一种多视点视频的编解码方法、装置和相关设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7469206B2 (en) * 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102194457A (zh) * 2010-03-02 2011-09-21 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
CN102542541A (zh) * 2011-12-31 2012-07-04 浙江大学 深度图像后处理的方法
CN102542541B (zh) * 2011-12-31 2014-04-16 浙江大学 深度图像后处理的方法
CN105229738B (zh) * 2013-01-29 2019-07-26 弗劳恩霍夫应用研究促进协会 用于使用能量限制操作产生频率增强信号的装置及方法
CN105229738A (zh) * 2013-01-29 2016-01-06 弗劳恩霍夫应用研究促进协会 用于使用能量限制操作产生频率增强信号的装置及方法
US10354665B2 (en) 2013-01-29 2019-07-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a frequency enhanced signal using temporal smoothing of subbands
CN107527628A (zh) * 2013-07-12 2017-12-29 皇家飞利浦有限公司 用于在音频信号解码器中进行频带扩展的优化缩放因子
CN107527628B (zh) * 2013-07-12 2021-03-30 皇家飞利浦有限公司 用于在音频信号解码器中进行频带扩展的优化缩放因子
CN105706166A (zh) * 2013-10-31 2016-06-22 弗劳恩霍夫应用研究促进协会 通过在频域插入时间预整形噪声进行音频带宽扩展
CN105706166B (zh) * 2013-10-31 2020-07-14 弗劳恩霍夫应用研究促进协会 对比特流进行解码的音频解码器设备和方法
CN106796798A (zh) * 2014-07-28 2017-05-31 弗劳恩霍夫应用研究促进协会 用于使用独立噪声填充生成增强信号的装置和方法
US10885924B2 (en) 2014-07-28 2021-01-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
US11264042B2 (en) 2014-07-28 2022-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling information which comprises energy information and is included in an input signal
US11908484B2 (en) 2014-07-28 2024-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling at random values and scaling thereupon
CN104269173B (zh) * 2014-09-30 2018-03-13 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
CN104269173A (zh) * 2014-09-30 2015-01-07 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
CN107770511A (zh) * 2016-08-15 2018-03-06 中国移动通信集团山东有限公司 一种多视点视频的编解码方法、装置和相关设备

Also Published As

Publication number Publication date
CN101281748B (zh) 2011-06-15

Similar Documents

Publication Publication Date Title
CN101281748B (zh) 用编码索引实现的空缺子带填充方法及编码索引生成方法
KR101147878B1 (ko) 코딩 및 디코딩 방법 및 장치
US9111532B2 (en) Methods and systems for perceptual spectral decoding
US9251800B2 (en) Generation of a high band extension of a bandwidth extended audio signal
EP3174049B1 (en) Audio signal coding method and device
JP4861196B2 (ja) Acelp/tcxに基づくオーディオ圧縮中の低周波数強調の方法およびデバイス
EP2571024B1 (en) Adaptive transition frequency between noise fill and bandwidth extension
CN101263553B (zh) 分级编码/解码设备
CA2347735C (en) High frequency content recovering method and device for over-sampled synthesized wideband signal
CN102985969B (zh) 编码装置、解码装置和编码方法、解码方法
CN102511062B (zh) 用于改进数字音频信号的分级编码/解码的增强编码/解码中的比特分配
AU2003299395B2 (en) Method for encoding and decoding audio at a variable rate
CN102436819B (zh) 无线音频压缩、解压缩方法及音频编码器和音频解码器
CN101521014A (zh) 音频带宽扩展编解码装置
CN109313908B (zh) 用于对音频信号进行编码的音频编码器以及方法
US9047877B2 (en) Method and device for an silence insertion descriptor frame decision based upon variations in sub-band characteristic information
CN101430880A (zh) 一种背景噪声的编解码方法和装置
CN104025189A (zh) 编码语音信号的方法、解码语音信号的方法,及使用其的装置
TW201401268A (zh) 產生帶寬延伸訊號的裝置與方法
CN101281749A (zh) 可分级的语音和乐音联合编码装置和解码装置
CN104978970A (zh) 一种噪声信号的处理和生成方法、编解码器和编解码系统
KR101610765B1 (ko) 음성 신호의 부호화/복호화 방법 및 장치
CN101572087B (zh) 嵌入式语音或音频信号编解码方法和装置
CN101622667B (zh) 用于分层编解码器的后置滤波器
US9390722B2 (en) Method and device for quantizing voice signals in a band-selective manner

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110615

Termination date: 20150514

EXPY Termination of patent right or utility model