CN101089951B - 频带扩展编码方法及装置和解码方法及装置 - Google Patents
频带扩展编码方法及装置和解码方法及装置 Download PDFInfo
- Publication number
- CN101089951B CN101089951B CN2006100870946A CN200610087094A CN101089951B CN 101089951 B CN101089951 B CN 101089951B CN 2006100870946 A CN2006100870946 A CN 2006100870946A CN 200610087094 A CN200610087094 A CN 200610087094A CN 101089951 B CN101089951 B CN 101089951B
- Authority
- CN
- China
- Prior art keywords
- frequency
- high frequency
- signal
- domain
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本发明提出一种频带扩展编码方法,包括如下步骤:A、将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;根据原始高频时域信号获得原始高频激励谱;根据原始高频激励谱对高频拷贝激励谱进行调整,得到谱调整参数以及调整之后的高频拷贝激励谱,再对其进行IDFT变换得到高频拷贝激励信号;B、对所述调整后的高频拷贝激励信号进行综合滤波,得到重建高频时域信号,并根据所述重建高频时域信号的时域增益与原始高频时域信号的时域增益提取时域增益调整参数;输出包括步骤A所得调整参数以及所述时域增益调整参数在内的高频参数。本发明还提出了相应的解码方法以及编解码装置。本发明方案可以有效提高编码声音质量。
Description
技术领域
本发明涉及宽带声音的编码、解码和声音合成领域,特别涉及频带扩展编码方法及装置和解码方法及装置。
背景技术
经过多年的技术发展,数字声音编码技术已经非常成熟,目前,很多声音编码技术已经成为工业标准被大量应用,融入人们的日常生活中。这些技术如Dolby实验室的AC-3、数字影院系统公司的数字家庭影院系统(Digital Theater Systems,DTS)、移动图象专家组(Moving Picture Experts Group,MPEG)组织的MP3和高级音频编码(Advanced Audio Coding,AAC)、微软公司的视窗媒体音频(Windows Media Audio,WMA)、索尼公司的ATRAC、国际电联(International Telecommunication Union,ITU)的G.723和G.729等,是数字声音编码技术在不同阶段发展的结果。
由于声音产生的复杂性,广义的声音,包括语音、音乐、自然声音和人工合成声音等人耳可感知的信号等,通常无法采用简单有效的参数模型,如传统的语音编码技术普遍采用“预测+激励”模型来实现,而常采用以波形编码为基础的“波形-参数”编码方案。其中,最典型的例子是被第三代合作伙伴项目(Three Generation Partnership Project,3GPP)采纳的扩展的宽带自适应多速率(Extended Adaptive Multi-Rate-Wideband,AMR-WB+)编解码方案。在AMR-WB+方案中,在传统语音编码的“预测+激励”编码框架即代数码本激励预测编码(Algebraic Code Enhance Excited Linear Predictive,ACELP)中,增加了预测残差的变换波形编码(Transform Coded Excitation,TCX)和简单的高频扩展编码(Band Width Extension,BWE)技术,其中残差实际就是语音编码中的激励信号。
图1所示为AMR WB+编码器结构框图。首先,输入的模拟声音信号被预处理及分析滤波器组101分解为两个子带,第一个子带为低频(Low Frequency,LF)信号,经临界采样,其采样频率为Fs/2,其中Fs是经AMR WB+编码器的重采样模块所获得信号的采样频率;第二个子带为高频(High Frequency,HF)信号,同样被临界采样,使其采样频率为Fs/2。此后,LF信号和HF信号采用不同的方法编码:即LF信号采用ACELP/TCX编码器102进行编码,所述ACELP/TCX编码器102所使用的编码方法可以在ACELP或TCX这两种编码方法中进行切换;高频编码器103采用一种带宽扩展方法(BWE)对HF信号进行编码,以有效降低编码所需要的比特数。最后,比特流复用器104将编码方法选择信息即模式信息、LF参数和HF参数复用为数字音频信号比特流输出。
图2是AMR WB+解码器结构框图。其中,解复用模块201将所收到的数字音频信号比特流解复用成LF参数、HF参数以及模式信息,这两部分信号再分别通过ACELP/TCX解码器202和高频解码模块203进行解码,解码后通过综合滤波器组204组合成全频带的数字音频信号。
由于波形和参数相结合的编码技术可以有效的提高编码效率,因此,AMR WB+技术适合于很低码率的声音编码应用,并且AMR WB+与目前已有的其他低码率声音编码技术相比,更适合语音信号的编码、以及语音和音乐混合信号的编码。
AMR WB+技术实际上是ACELP技术针对音乐信号的一个改进方案,其典型的特征包括采用了激励信号的变换编码,以及高频信号扩展技术。下面重点介绍AMR WB+的高频信号扩展技术。
图1所示采用BWE方法对HF信号进行处理的高频编码器103,其结构如图3所示。其中,原始高频信号SHF(n)的分析带宽为Fs/4,可视为临界采样之前的高频信号的折叠。由线性预测分析编码(Linear Predictive Code,LPC)、量化与插值模块305对原始高频信号SHF(n)做LPC,获得一组8阶的线性预测器系数(LP系数)作为信号SHF(n)谱的包络参数。将这些LP系数变换成线谱对(Linear Spectrum Pair,LSP)系数并量化编码;再由估计增益计算模块306根据线性预测分析获得的预测器系数及其插值与低频激励信号估计一组增益,简称“估计增益”;另一方面,高频合成滤波器301将低频激励信号拷贝为高频拷贝激励信号,并由子帧能量计算模块302计算高频拷贝激励信号的能量,再由子帧能量计算模块303计算原始高频信号的能量,真实增益计算模块304将所得两种子帧能量进行比较,确定高频增益,简称“真实增益”,高频增益以64个时域样值为一个子帧(subframe)进行计算;最后,由增益差值处理模块模块将真实增益减去估计增益,对获得的增益差值,每4个一组进行矢量量化得到并输出增益因子,从而降低量化代价,即量化所需的比特数。
图2所示的采用BWE方法对HF信号进行处理的高频解码模块202,其结构如图4所示。其中,子帧时域增益调整模块401接收来自低频解码器的低频激励信号拷贝到特定的高频频段并进行时域增益调整,得到高频拷贝激励信号;由于时域增益调整以N个样值为一个子帧(subframe)进行,为了去除由此引起的块噪声,需要由噪声处理模块402进行去噪声(Buzziness)处理;最后,由高频综合预测器403对所述高频拷贝激励信号进行滤波,获得高频时域信号
AMR WB+的编码和解码详细细节参见标准文本《3GPP TS26.290V6.3.0(2005-06)Technical Specification》。
现有的AMR WB+的频带扩展技术是一个时域的实现方法,不能对低频激励信号拷贝获得的高频拷贝激励信号进行有效的频谱结构调整,特别是在局部频率区域内的音调性。而音乐信号的频谱结构丰富,往往低频谱结构和高频谱结构的差异很大,这些结构特征包括显著影响声音质量的音调、音色的频谱包络形状信息。因此,AMR WB+的频带扩展技术有相当大的局限性,编码后生成的声音质量较低,特别是对一些音乐信号的编码声音会出现较大失真。
发明内容
有鉴于此,本发明的目的在于,提出一种频带扩展编码方法和解码方法,能够有效地提高编码声音信号的质量。
频带扩展编码方法包括如下步骤:
A、将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;对一个超帧的原始高频时域信号进行信号类型分析,并根据得到的信号类型信息将所述一个超帧的原始高频时域信号划分成一个或一个以上的预测帧;对所划分的每一个预测帧进行线性预测分析,获得每个预测帧的原始高频激励信号,然后再把各个预测帧组合生成一个超帧的原始高频激励信号,并将原始高频激励信号作离散傅立叶变换DFT得到原始高频激励谱;根据原始高频激励谱对高频拷贝激励谱进行调整,得到谱调整参数以及调整之后的高频拷贝激励谱;对调整后的高频拷贝激励谱进行逆离散傅立叶变换IDFT得到调整后的高频拷贝激励信号;
B、对所述调整后的高频拷贝激励信号进行综合滤波,得到重建高频时域信号,并根据所述重建高频时域信号的时域增益与原始高频时域信号的时域增益提取时域增益调整参数;输出包括步骤A所得调整参数以及所述时域增益调整参数在内的高频参数。
所述低频激励谱为变换激励编码TCX模式生成的TCX帧的低频激励谱,或代数码本激励预测编码ACELP模式形成ACELP帧的低频激励信号经DFT变换得到的ACELP帧的低频激励谱。
较佳地,预设两种高频编码模式,分别为模式1和模式2,其中模式1对于低频编码器输出的TCX帧低频激励谱或ACELP帧的低频时域激励信号都既进行频域调整也进行时域调整;而模式2对TCX帧低频激励谱进行频域调整和时域调整,对ACELP帧的低频时域激励信号仅进行时域调整;步骤A之前进一步包括:
对预设的高频编码模式进行判断,若为模式1,则依次执行步骤A和步骤B;若为模式2,则进一步判断低频激励谱的编码模式,若为TCX模式,则依次执行步骤A和步骤B,若为ACELP模式,则转至步骤C:
C、对ACELP帧的低频时域激励信号进行综合滤波,得到重建高频时域信号,并根据所述重建高频时域信号的时域增益与原始高频时域信号的时域增益提取时域增益调整参数;将所述时域增益调整参数作为高频参数输出,并结束本方法流程。
所述信号类型分析为:判断所述原始高频时域信号的类型是缓变信号还是快变信号,若是快变信号则进一步分析快变点发生的位置;所述信号类型信息包括信号类型;若信号类型为快变信号,则进一步包括快变点发生的位置信息。
所述谱调整参数包括调性调整参数和频域增益调整参数,步骤A所述调整包括:
A3、计算所述原始高频激励谱的调性,根据所得原始高频激励谱的调性对所述高频拷贝激励谱进行调性调整,得到调性调整后的高频拷贝激励谱和调性调整参数;
A4、根据所述原始高频激励谱,对所述调性调整后的高频拷贝激励谱进行频域增益调整,得到频域增益调整后的高频拷贝激励谱和频域增益调整参数。
步骤A3所述调性调整包括:
A31、将原始高频激励谱以及所述高频拷贝激励谱按照相同的划分方式分别划分为一个以上的频段,并计算每个频段的原始高频激励谱的调性Tref以及相应频段的高频拷贝激励谱的调性Test,判断高频拷贝激励谱的调性Test与原始高频激励谱的调性Tref的大小,若Test<Tref-T0,则执行步骤A32;若Tref-T0≤Test≤Tref+T1,则调整类型设置为不进行调性调整,将调整类型作为调性调整参数并转至步骤A4;若Test>Tref+T1,则执行步骤A33;其中T0、T1为预先设置的常数;
步骤B所述对原始高频激励信号进行综合滤波,得到重建高频时域信号包括:
B1、对一个超帧的原始高频时域信号进行信号类型分析,并根据分析结果将一个超帧的原始高频时域信号划分成一个或一个以上的预测帧;
B2、对所述每一个预测帧,得到该预测帧内一组线谱频率,并做矢量量化,将所得量化后的线谱频率转化为量化后的线性预测滤波器系数,并由所得的这些系数构成线性预测综合滤波器;
B3、将所述原始高频激励信号通过所述线性预测综合滤波器的滤波,得到重建高频时域信号。
步骤B所述提取时域增益调整参数包括:
根据所述对原始高频时域信号进行信号类型分析的分析结果,将所得的每个预测帧的重建高频时域信号划分为一个或一个以上的子帧;计算每个子帧的重建高频时域信号的能量平均值和该子帧对应的原始高频时域信号的能量平均值的比值,将所述比值的平方根作为调整该子帧时域增益的参数。
频带扩展解码方法包括如下步骤:
a、将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;
b、读取谱调整参数,并根据谱调整参数对所述高频拷贝激励谱进行调整;对调整后的高频拷贝激励谱进行IDFT变换,得到高频拷贝激励信号;
c、对所述高频拷贝激励信号进行时域增益调整,得到调整后的高频拷贝激励信号,再对调整后的高频拷贝激励信号进行综合滤波,得到并输出重建高频时域信号。
所述低频激励谱为采用TCX解码模式得到的TCX帧低频激励谱,或ACELP解码模式得到的ACELP帧的低频激励信号进行DFT变换得到的ACELP帧低频激励谱。
较佳地,该方法还可以预设两种高频解码模式,分别为模式1和模式2,其中模式1对于低频编码器输出的TCX帧低频激励谱或ACELP帧的低频时域激励信号都既进行频域调整也进行时域调整;而模式2对TCX帧低频激励谱进行频域调整和时域调整,对ACELP帧的低频时域激励信号仅进行时域调整;所述步骤a之前进一步包括:对预设的高频解码模式进行判断,若为模式1,则执行步骤a;若为模式2,则进一步判断低频解码模式信息,若为TCX模式,则执行步骤a;若为ACELP模式,则对来自低频编码器的ACELP帧的低频激励信号进行综合滤波,得到重建高频时域信号,并根据时域增益调整参数对所得重建高频时域信号进行时域增益调整,输出所得调整后的重建高频时域信号并结束本流程。
步骤b所述调整参数包括调性调整参数和频域增益调整参数,所述调整包括调性调整和频域增益调整。
所述调性调整参数包括调整类型和调整参数则所述调性调整包括:
b1、将高频拷贝激励谱划分为一个或一个以上的频带,并分别计算每个频带的能量Eest;
b2、对于每一个频带判断调整类型,若调整类型为不调整,则对该频带不作处理;若调整类型为加弦处理,则在该频带的正中位置加弦,所加弦的能量为并使所加弦的相位与前一帧对应相位连续;若调整类型为加噪调整,则在该频带加随机噪声,加噪能量为处理完毕所有频带后则结束调性调整。
所述频域增益调整包括:
b3、将高频拷贝激励谱划分为一个或一个以上的频带;
b4、对于任一个频带,用该频带对应的增益调整参数乘以该频带内的每根谱线,得到该频带的频域增益调整后的高频拷贝激励谱,将所有频带组合起来即为频域增益调整后的高频拷贝激励谱。
步骤c所述综合滤波包括:
c1、读取信号类型信息,并根据所读取的信号类型信息将一个超帧的高频拷贝激励信号划分成一个或一个以上的预测帧;
c2、对所述每一个预测帧,读取量化后的线谱频率构成线性预测综合滤波器;
c3、由所述线性预测综合滤波器对所述高频拷贝激励信号进行滤波,得到重建高频时域信号。
步骤c所述时域增益调整包括:
c4、将高频拷贝激励信号划分为一个或一个以上的子帧;
c5、读取时域增益调整参数,将每个子帧的高频拷贝激励信号分别乘以相应的时域增益调整参数,得到时域增益调整后的高频拷贝激励信号。
频带扩展解码方法还可以采用如下替代方案:
a、将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;
b、读取调整参数,并根据调整参数对所述高频拷贝激励谱进行调整;对调整后的高频拷贝激励谱进行IDFT变换,得到高频拷贝激励信号;
c、对所述高频拷贝激励信号进行综合滤波,得到重建高频时域信号,再对所得重建高频时域信号进行时域增益调整,得到并输出时域增益调整后的重建高频时域信号。
本发明的目的还在于,提出一种频带扩展编码装置和解码装置,能够有效地提高编码声音信号的质量。
其中,频带扩展编码装置位于扩展的宽带自适应多速率AMR-WB+编码器中,用于接收来自预处理与分析滤波器组的高频时域信号以及来自低频编码器的低频激励谱,输出高频参数至比特流复用器。该装置包括如下部分:
谱参数编码模块,用于接收低频激励谱,将所接收的低频激励谱转换为高频拷贝激励谱;根据来自时变预测分析模块的原始高频激励信号对所述高频拷贝激励谱进行调整,将调整参数输出至比特流复用器,将调整后的高频拷贝激励谱转换为高频拷贝激励信号并输出至时变预测综合模块;
时变预测分析模块,用于接收原始高频时域信号,对所接收的高频时域信号进行线性预测分析,获得每个预测帧的时变预测滤波器系数和原始高频激励信号;将时变预测滤波器系数输出到时变预测综合模块;将所生成的原始高频激励信号输出到谱参数编码模块;
时变预测综合模块,用于对所收到的高频拷贝激励信号进行综合滤波得到重建高频时域信号,并将所得重建高频时域信号输出至时域自适应增益调整参数提取模块;
时域自适应增益调整参数提取模块,接收原始高频时域信号以及来自时变预测综合模块的重建高频时域信号,将所接收的原始高频时域信号与重建高频时域信号进行比较得到时域增益调整参数,并将所述时域增益调整参数输出至比特流复用器。
所述谱参数编码模块进一步包括:
谱拷贝器,用于接收来自低频编码器的低频激励谱,将所接收的低频激励谱的特定频段拷贝到高频的特定频段得到高频拷贝激励谱,并将所得高频拷贝激励谱输出至调性调整和参数提取器以及频域调整和参数提取器;
DFT变换器,用于将所接收的原始高频激励信号进行DFT变换得到原始高频激励谱,并将所得原始高频激励谱输出至调性调整和参数提取器以及频域调整和参数提取器;
调性调整和参数提取器,用于根据来自DFT变换器的原始高频激励谱,对来自谱拷贝模块的高频拷贝激励谱进行调性调整,并将得到的调性调整的参数输出到比特流复用器,调性调整后的高频拷贝激励谱输出至频域增益调整和参数提取器;
频域增益调整和参数提取器,根据来自DFT变换器的原始高频激励谱,对来自调性调整和参数提取器的高频拷贝激励谱进行频域增益调整,并将频域增益调整参数输出至比特流复用器,频域增益调整后的高频拷贝激励谱输出至IDFT变换器;
IDFT变换器,用于对来自频域增益调整和参数提取器的高频拷贝激励谱进行IDFT变换,得到调整后的原始高频激励信号,并将所得原始高频激励信号输出至时变预测综合模块。
较佳地,该装置还可以进一步包括信号类型分析模块,用于接收原始高频时域信号,对所接收的每个超帧的原始高频时域信号进行信号类型分析,判断该超帧高频时域信号是快变信号还是缓变信号,若是快变信号则进一步分析快变点发生的位置,并将分析结果作为信号类型信息发送至时变预测分析模块、时变预测综合模块,以及时域自适应增益调整参数提取模块;所述分析结果包括信号类型,若信号类型为快变类型,则进一步包括快变点发生的位置信息。
所述时变预测分析模块进一步包括:
线性预测分析器,用于接收原始高频时域信号,并对所接收的原始高频时域信号进行线性预测分析,将所得到的预测系数输出至转换器;
转换器,用于将来自线性预测分析器的预测系数转换为线谱频率,并将所得线谱频率输出至矢量量化器;
矢量量化器,用于将所接收的线谱频率进行矢量量化得到矢量量化索引,将矢量量化索引输出至时变预测综合模块和比特流复用器;并根据所得矢量量化索引得到量化后的线谱频率,将所得量化后的线谱频率输出至逆转换器;
逆转换器,用于根据所接收的量化后的线谱频率得到量化后的预测系数,并根据预测系数生成线性预测滤波器;
线性预测滤波器,用于接收原始高频时域信号,并将所接收的原始高频时域信号进行滤波,将滤波后所得原始高频激励信号输出至谱参数编码模块;
所述时变预测综合模块进一步包括:
逆矢量量化器,用于将所接收的线谱频率矢量量化索引进行解量化得到量化的线谱频率,并将所得量化的线谱频率输出至转换器;
转换器,用于将量化的线谱频率转换为量化后的线性预测滤波器系数,并将所述量化后的线性预测滤波器系数构成线性预测综合滤波器;
线性预测综合滤波器,用于接收来自谱参数编码模块的高频拷贝激励信号,并对所接收的高频拷贝激励信号进行滤波得到重建的高频时域信号,将所得高频时域信号输出至时域自适应增益调整参数提取模块。
所述时域自适应增益调整参数提取模块进一步包括:
子帧划分模块,用于根据来自信号类型分析模块的信号类型信息,将来自时变预测综合模块的每个预测帧的重建高频时域信号划分为一个或一个以上子帧,并将所述各个子帧发送至参数提取模块;
参数提取模块,用于接收每一个子帧的重建高频时域信号,计算其时域增益,并计算所接收的原始高频时域信号对应子帧的时域增益,将所述两种时域增益进行比较,提取时域增益调整参数,并将该参数输出到比特流复用器。
该装置还可以进一步包括DFT变换模块,用于接收来自低频编码器的ACELP帧的低频时域激励信号,并对所接收的低频时域激励信号进行DFT变换得到低频激励谱,并将所得低频激励谱输出至谱参数编码模块。
较佳地,该装置进一步包括高频编码模式选择模块,用于接收来自低频编码器的低频编码模式信息,以及低频时域激励信号或低频激励谱,根据预设的高频编码模式进行处理:预设的高频编码模式分别为模式1和模式2,其中模式1对于低频编码器输出的TCX帧低频激励谱或ACELP帧的低频时域激励信号都既进行频域调整也进行时域调整;而模式2对TCX帧低频激励谱进行频域调整和时域调整,对ACELP帧的低频时域激励信号仅进行时域调整;若预设的高频编码模式为模式1,则将来自低频编码器的TCX帧的低频激励谱输出至谱参数编码模块,或者将来自低频编码器的ACELP帧的低频激励信号进行DFT变换得到低频激励谱输出到谱参数编码模块;若预设的高频编码模式为模式2,则将来自低频编码器的TCX帧的低频激励谱输出至谱参数编码模块,或者将来自低频编码器的ACELP帧的低频激励信号输出至时变预测综合模块。
频带扩展解码装置位于AMR-WB+解码器中,用于接收来自比特流解复用器的高频参数以及来自低频解码器的低频激励谱,输出重建高频时域信号至综合滤波器组和后处理模块。该装置包括如下部分:
谱参数解码模块,用于将所接收的低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱,同时根据从解比特流复用器得到的谱调整参数对所述高频拷贝激励谱进行相应的调整,将调整后的高频拷贝激励谱进行IDFT转换为高频拷贝激励信号并输出到时变预测综合模块;
时变预测综合模块,用于根据从解比特流复用器中得到的时变预测滤波器系数的矢量量化索引构成时变预测综合滤波器,对来自谱参数解码模块的高频拷贝激励信号进行综合滤波,得到重建高频时域信号,并将所述重建高频时域信号输出到自适应时域增益解码模块;
自适应时域增益解码模块,用于根据从解比特流复用器得到的时域增益调整参数对来自时变预测综合模块的重建高频时域信号进行增益调整,将时域增益调整后的重建高频时域信号输出至AMR-WB+解码器中的综合滤波器组和后处理器。
所述谱参数解码模块进一步包括:
谱拷贝器,用于将所接收的低频激励谱的特定频段拷贝到高频的特定频段得到高频拷贝激励谱,将所得高频拷贝激励谱输出至调性调整器;
调性调整器,用于从解比特流复用器中获得调性调整的调整类型和调整参数,并根据调整类型和调整参数对来自谱拷贝模块高频拷贝激励谱进行调性调整,将调性调整后的高频拷贝激励谱输出至频域增益调整器;
频域增益调整器,用于从解比特流复用器获得频域增益调整参数,并根据所述频域增益调整参数对来自调性调整模块高频拷激励贝谱进行频域增益调整,将频域增益调整后的高频拷贝激励谱输出到IDFT变换器;
IDFT变换器,用于将来自频域增益调整器高频拷贝激励谱进行IDFT变换,得到高频拷贝激励信号,并将所述高频拷贝激励信号输出至时变预测综合模块。
较佳地,该装置进一步包括:
高频解码模式选择模块,用于接收来自低频解码器的TCX帧的低频激励谱或ACELP帧的低频激励信号,根据预先设置的高频解码模式进行处理:预设的高频解码模式分别为模式1和模式2,其中模式1对于低频编码器输出的TCX帧低频激励谱或ACELP帧的低频时域激励信号都既进行频域调整也进行时域调整;而模式2对TCX帧低频激励谱进行频域调整和时域调整,对ACELP帧的低频时域激励信号仅进行时域调整;若预设的高频解码模式为模式1,则将所述TCX帧的低频激励谱输出至谱参数解码模块,或者将所述ACELP帧的低频激励信号进行DFT变换得到ACELP帧的低频激励谱输出至谱参数解码模块;若预设的高频解码模式为模式2,则将所述TCX帧的低频激励谱输出至谱参数解码模块,或者将所述ACELP帧的低频激励信号转换为高频激励信号并输出至时变预测综合模块。
所述频带扩展解码装置的各个组成部分还可以采用如下替代方案:
谱参数解码模块,用于将所接收的低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱,同时根据从解比特流复用器得到的谱调整参数对所述高频拷贝激励谱进行相应的调整,将调整后的高频拷贝激励谱进行IDFT转换为高频拷贝激励信号并输出到自适应时域增益解码模块;
自适应时域增益解码模块,用于根据从解比特流复用器得到的时域增益调整参数,对来自谱参数解码模块的高频拷贝激励信号进行时域增益调整,将时域增益调整后的高频拷贝激励信号输出至时变预测综合模块;
时变预测综合模块,用于根据从解比特流复用器中得到的时变预测滤波器系数的矢量量化索引构成时变预测综合滤波器,对来自自适应时域增益解码模块的高频拷贝激励信号进行综合滤波,得到重建高频时域信号,并将所述重建高频时域信号输出至AMR-WB+解码器中的综合滤波器组和后处理器。
从以上技术方案可以看出,本发明的频带扩展编解码方案中,除了保留原有的对高频激励信号进行时域增益调整之外,还增加了对高频激励信号的调性和频域增益调整,因此,本发明方案可以更加有效地对高频激励信号进行频谱结构调整,使解码后的声音信号的音调、音色的频谱包络形状更加接近编码前的真实声音,大大降低声音失真,提高编码声音信号的质量。
附图说明
图1为AMR WB+编码器结构框图;
图2为AMR WB+解码器结构框图;
图3为现有技术AMR WB+编码器的高频编码器结构示意图;
图4为现有技术AMR WB+解码器的高频解码器结构示意图;
图5为本发明实施例一的高频编码器结构示意图;
图6为本发明实施例一的高频编码器的谱参数编码模块503的结构示意图;
图7为高频参数编码-频谱映射示意图;
图8为本发明实施例一的高频编码器的时变预测分析模块501的结构示意图;
图9为本发明实施例一的高频编码器的时变预测综合模块504的结构示意图;
图10为本发明实施例一实现频带扩展编码的处理流程图;
图11为本发明实施例二的高频编码器结构示意图;
图12为本发明实施例三的高频解码器结构示意图;
图13为本发明实施例三的高频解码器的谱参数解码模块1202的结构示意图;
图14为本发明实施例三实现频带扩展解码的处理流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细阐述。
实施例一:第一类频带扩展编码装置。
本实施例的频带扩展编码装置的结构示意图如图5所示。本发明的频带扩展编码方法包括时变预测分析模块501、信号类型分析模块502、谱参数编码模块503、时变预测综合模块504和时域自适应增益调整参数提取模块505。
时变预测分析模块501,用于接收预处理及分析滤波器组101输出的原始高频时域信号,并根据来自信号类型分析模块502的分析结果,将所接收的原始高频时域信号划分为一个或一个以上的预测帧,预测帧为一组时域信号样本,是线性预测分析的单位;所述预测帧与低频编码中的TCX帧或ACELP帧不一定相同;该模块还用于对每个预测帧进行线性预测分析,获得每个预测帧的时变预测滤波器系数和原始高频激励信号,原始高频激励信号有时也被称为高频残差信号;将时变预测滤波器系数变换为线谱频率(Linear Spectrum Frequency,LSF)系数并矢量量化后,将LSF系数矢量量化索引输出到时变预测综合模块504以及比特流复用器506;并将所有预测帧组合生成一个超帧(Super-Frame),并将所生成的一个超帧的原始高频激励信号输出到谱参数编码模块503。
信号类型分析模块502,用于接收原始高频时域信号,对所接收的每个超帧的原始高频时域信号进行信号类型分析,判断该超帧原始高频时域信号是快变信号还是缓变信号,若是快变信号则进一步分析快变点发生的位置,并将分析结果作为信号类型信息发送至时变预测分析模块501、时变预测综合模块504、时域自适应增益调整参数提取模块505以及比特流复用器506;所述分析结果包括信号类型,若信号类型为快变类型,则进一步包括快变点发生的位置信息。由信号类型分析模块502指向比特流复用器506的,用于表示信号类型信息传递方向的箭头并未在图5中标出。
谱参数编码模块503,用于将所接收的TCX/ACELP帧的低频激励谱的特定频段拷贝到高频的特定频段,得到TCX/ACELP帧的高频拷贝激励谱;同时将从时变预测分析模块501得到的一个超帧的原始高频激励信号中,与所述TCX/ACELP帧的高频拷贝激励谱对应的部分作离散傅立叶变换(Discrete Fourier Transform,DFT)得到原始高频激励谱,然后根据所得原始高频激励谱对所述高频拷贝激励谱进行谱调整,谱调整包括调性调整和增益调整;最后将谱调整参数输出到比特流复用器506,并将谱调整后的高频拷贝激励谱作逆离散傅立叶变换(IDFT),得到谱调整后的高频拷贝激励信号输出到时变预测综合模块504。
谱参数编码模块503的具体结构如图6所示,进一步包括:
谱拷贝器503a,用于接收来自低频编码器的低频激励谱,将所接收的低频激励谱的特定频段拷贝到高频的特定频段生成高频拷贝激励谱,并将所述高频拷贝激励谱输出至调性调整和参数提取模块503b。
其中,若低频编码器采用TCX模式,则低频编码器输出的TCX帧的低频激励谱可直接输入谱拷贝器503a;若低频编码器采用ACELP模式,则低频编码器输出ACELP帧的低频时域激励信号,因此需要在低频编码器和谱参数编码模块503之间增加一个DFT变换模块,用于对ACELP帧的低频时域激励信号进行DFT变换,生成ACELP帧的低频激励谱并输出至谱拷贝器503a。
DFT变换器503c,用于按照低频编码器中的编码模式(mode)将由所述的时变预测分析模块501输出的一个超帧的原始高频激励信号划分为一个或多个变换帧,每个变换帧为一组原始高频激励信号样本,是DFT变换的单位,变换帧的划分与TCX帧/ACELP帧相同;并将每个变换帧的原始高频激励信号作DFT获得该变换帧的频谱,以下称为原始高频激励谱,并将所得原始高频激励谱输出至调性调整和参数提取器503b以及频域增益调整和参数提取器505;
调性调整和参数提取器503b,用于根据DFT变换器503c输出的变换帧的原始高频激励谱,对所述的谱拷贝器503a输出的对应TCX帧/ACELP帧的高频拷贝激励谱进行调性调整,并将得到的调性调整的参数输出到比特流复用器506,调性调整后的高频拷贝激励谱输出至频域增益调整和参数提取器503d;
频域增益调整和参数提取器503d,根据来自DFT变换器503c的变换帧的原始高频激励谱,对来自调性调整和参数提取器503b的对应TCX帧/ACELP帧的高频拷贝激励谱进行频域增益调整,并将频域增益调整参数输出至比特流复用器506,频域增益调整后的高频拷贝激励谱输出至IDFT变换器503e;
IDFT变换器503e,用于对来自频域增益调整和参数提取模块503d的TCX帧/ACELP帧的高频拷贝激励谱进行IDFT变换,得到调整后的TCX帧/ACELP帧高频拷贝激励信号,并将每个TCX帧/ACELP帧的高频拷贝激励信号重新组合成一个超帧的高频拷贝激励信号,最后该信号输出到时变预测综合模块504。
时变预测综合模块504,根据来自信号类型分析模块502分析结果,将来自谱参数编码模块503的一个超帧的高频拷贝激励信号重新划分为一个或多个预测帧,预测帧的划分与时变预测分析模块501相同;再根据来自时变预测分析模块501的LSF系数的矢量量化索引获得时变预测综合滤波器,并对每个预测帧的高频拷贝激励信号进行综合滤波,得到重建高频时域信号,该信号输出至时域自适应增益调整参数提取模块505;
时域自适应增益调整参数提取模块505,根据来自信号类型分析模块502的信号类型和快变点发生的位置信息,将来自时变预测综合模块504的每个预测帧的重建高频时域信号划分为一个或一个以上子帧,每个子帧为一组重建高频时域信号样本,是时域增益调整的单位;并根据每个子帧的重建高频时域信号的时域增益和该子帧对应的原始高频时域信号的时域增益提取时域增益调整参数,并将该参数输出到比特流复用器506。所述时域增益指子帧内信号能量的平均值。
比特流复用器506可采用现有AMR WB+编码器的比特流复用器。
下面对频带扩展编码装置的组成模块及其内部各组成部分的功能及其实现原理进行详细说明。
时变预测分析模块501根据信号类型分析模块的分析结果,将一个超帧的高频时域信号划分为一个或几个预测帧的方法为:如果信号类型为缓变信号,一个超帧只划分一个预测帧;如果信号类型为快变信号,根据快变点发生的位置,快变点之前的若干个256采样点帧划分为一个预测帧,包括快点256采样点帧划分为一个预测帧,快变点发生后的若干个256采样点帧划分为一个预测帧。
时变预测分析模块501实现对每个预测帧的高频时域信号进行线性预测分析的结构如图8所示,包括线性预测分析器501a、转换器501b、矢量量化器501c、线性预测滤波器501d、以及逆转换器501e。首先由线性预测分析器501a对输入的原始高频时域信号y(n)进行线性预测分析,求出预测系数A(z),然后由转换器501b将A(z)转换成线谱频率(LSF),再将LSF参数送入矢量量化器501c中进行矢量量化并得到矢量量化的索引Index,根据Index得到量化后的线谱频率将得到的经过逆转换器501e求出量化后的预测系数,最后用量化后的预测系数生成线性预测滤波器由线性预测滤波器501d对原始高频时域信号y(n)进行滤波,得到原始高频激励信号e(n)。最后将每个预测帧的原始高频激励信号重新组合成一个超帧,输出到DFT变换器503c,将量化索引输出到时变预测综合模块504,量化索引做为辅助参数输出到比特流复用器506。由时变预测分析模块505指向比特流复用器506的用于表示Index的箭头并未在图5中标出。
信号类型分析模块502对信号类型分析有许多种方法,例如,通过信号感知熵判断信号类型,通过计算信号子帧的能量判断信号类型等。本发明具体实施例对通过计算信号子帧能量判断信号类型的方法进行说明。
步骤a、将原始高频时域信号分成若干个子帧yi(n),i为自帧的序号;本方法中,该子帧为256采样点帧(256-sample frame);并分别计算每个子帧的能量Ei;
步骤b、计算当前子帧与前一子帧的能量比,并判断能量比是否大于预先得到的阈值Te,若是,则该超帧信号类型为快变信号;若所有子帧与前一帧的能量比均小于Te,则该超帧信号类型为缓变信号。对于快变信号,将能量最大的子帧设为快变点发生的位置。
在该方法中,阈值Te可采用一些信号处理中的常用方法获得,如统计已编码信号能量的平均比值,并乘以某个设定常数得到Te。当信号类型为缓变信号时,信号类型分析的结果只包含信号类型;当信号类型为快变信号时,信号类型分析结果包含信号类型和快变点位置。
谱参数编码模块503中包括谱拷贝器503a、调性调整和参数提取器503b、DFT变换器503c、频域增益调整和参数提取器503d和IDFT变换器503e。
在低频编码器采用TCX编码模式时,谱参数编码模块503中的谱拷贝器503a直接接收来自低频编码器的TCX帧的低频激励谱;若低频编码器采用ACELP模式,则低频编码器输出ACELP帧的低频时域激励信号,因此需要在低频编码器和谱参数编码模块503之间增加一个DFT变换模块,用于对ACELP帧的低频时域激励信号进行DFT变换,生成ACELP帧的低频激励谱并输出至谱拷贝器503a。谱拷贝器503a将所接收的低频激励谱的特定频段拷贝到高频的特定频段,可采用的拷贝方法包括折叠拷贝、线性拷贝、倍频拷贝等。本发明具体实施例对线性拷贝方法进行说明。假设原始信号的低频频谱的范围为[0,Fs/4],其中Fs是经AMR WB+编码器的重采样模块所获得信号的采样频率,高频频谱的范围为[Fs/4,Fs/2],如图7中的a)所示,则通过线性拷贝得到的频谱如图7中的b)所示。这里仅为对拷贝方法的一个举例,并未对本发明方案所采用的拷贝方法进行限定。拷贝后得到的高频拷贝激励谱输出到调性调整和参数提取器503b。
DFT变换器503c按照低频编码器中的编码模式(mode),将由时变预测分析模块501输出的一个超帧的原始高频激励信号按照低频TCX帧/ACELP帧的划分相同的方式对应划分为一个或多个变换帧,并将每个变换帧的原始高频激励信号作DFT变换,获得原始高频激励谱,原始高频激励谱输出到调性调整和参数提取器503b和频域增益调整和参数提取器503d;
调性调整和参数提取器503b首先分别计算DFT变换器503c输出的原始高频激励谱和谱拷贝器503a输出的高频拷贝激励谱的调性,然后根据原始高频激励谱的调性来调整高频拷贝激励谱。可采用的调性计算方法包括但不限于在时域通过线性预测的方法、谱平坦度的方法和MPEG中心理声学模型2利用不可预测度得到调性的方法。本发明具体实施例采用了MPEG中心理声学模型2(以下简称为模型2)利用不可预测度得到调性的方法。模型2的音调性是根据信号频谱的幅值和相位,将信号频谱分成若干频段,每个频段至少有一个谱线,计算谱线的“不可预测测度”获得的。
设当前帧信号的幅数谱为:
X[k]=r[k]ejφ[k],k=1,...,K (1)
其中r[k]为幅值,φ[k]为相位。根据公式(2)计算每个频段的能量:
其中kl和kh为每个k频段的上下边界。
每个谱线的不可预测测度为当前值和基于前两帧的预测值的相对距离。设预测值的幅值和相位为:
rpred[k]=rt-1[k]+(rt-1[k]-rt-2[k])
φpred[k]=φt-1[k]+(φt-1[k]-φt-2[k])。(3)
则不可预测测度c[k]定义为:
则频段的不可预测度为该频段的谱线能量乘以不可预测测度的总和,即
定义归一化分区不可预测度为:
由归一化不可预测度计算分区音调性有:
t[b]=-0.299-0.43loge(cs[b]) (7)
并且限制0≤t[b]≤1,当t[b]等于1时为纯弦,当t[b]等于0时为白噪声。
本实施方法中,调性调整的方法如下所述:
设拷贝生成的高频拷贝激励谱的某频段的调性为Test,能量为Eest,原始高频激励谱中对应频段的调性Tref。其中Test和Tref可以通过上述计算方法得到。对拷贝后的高频谱的调性调整可以分以下几种情况处理:
情况1,当拷贝后的得到的高频拷贝激励谱中的某频段的调性Test和原始高频激励谱中的对应频段的调性Tref大约相等时,即Tref-T0≤Test≤Tref+T1,调整类型为不调整,将调整类型编码并输出到比特流复用模块;其中T0、T1为预先设置的常数。
情况2,当拷贝后的得到的高频拷贝激励谱中的某频段的调性Test和原始高频激励谱中的对应频段的调性Tref小一定的值T0时,即Test<Tref-T0,则调整类型为加弦调整,加弦的位置为当前频段中央。具体需要加弦的能量ΔET计算如下:
情况3,当拷贝后的得到的高频拷贝激励谱中的某频段的调性Test比原始高频激励谱中的对应频段的调性Tref大一定的值T1时,即Test>Tref+T1,则调整类型为加噪调整。具体需要加噪的能量ΔEN计算如下:
频域增益调整和参数提取器503d根据DFT变换器503c输出的一个变换帧的原始高频激励谱对调性调整和参数提取器503b输出的对应TCX帧的高频拷贝激励谱进行增益调整的具体方法可以为:将原始高频激励谱和高频拷贝激励谱划分为若干个频带,所述频带类似于MPEG AAC中的尺度因子带(Scale Factor Band),分别计算原始高频激励谱和高频拷贝激励谱中每个频带的能量,计算能量比的平方根作为增益调整参数p,并将高频拷贝激励谱该频带中的每根谱线均乘以该参数p,该参数经标量量化后输出到比特流复用器506编码,并将调整后的原始高频激励谱输出到IDFT变换器503e;所述标量量化的精度可取为0.5dB。
IDFT变换器503e,用于对来自频域增益调整和参数提取模块503d的TCX帧/ACELP帧的高频拷贝激励谱进行IDFT变换,得到调整后的FCX帧/ACELP帧高频拷贝激励信号,并将每个TCX帧/ACELP帧的高频拷贝激励信号重新组合成一个超帧的高频拷贝激励信号,最后该信号输出到时变预测综合模块504。
时变预测综合模块504首先根据信号类型分析模块502的分析结果将来自IDFT变换器503e的一个超帧的高频拷贝激励信号划分为一个或几个预测帧,预测帧的划分方法与时变预测分析模块501中所用的帧划分方法相同;然后对每个预测帧进行预测综合。时变预测综合模块504的结构如图9所示,包括逆矢量量化器504a、转换器504b和线性预测综合滤波器504c。首先逆矢量量化器504a由线谱频率的矢量量化索引index解出量化后的线谱频率然后通过转换器504b将转化为量化后的线性预测滤波器系数并由这些系数构成线性预测综合滤波器最后将从IDFT变换器503e输出的高频拷贝激励信号通过线性预测综合滤波器504c得到重建的高频时域信号。该信号输出到时域自适应增益调整参数提取模块505。
时域自适应增益调整参数提取模块505根据来自信号类型分析模块502的信号类型和快变点发生的位置信息,将来自时变预测综合模块504的每个预测帧的重建高频时域信号划分为一个或若干个子帧。所述子帧的划分方法如下:若该256点采样点帧为快变点发生点,则将该256点采样点帧划分为4个子帧;否则,将该256点采样点帧划分为一个子帧。根据每个子帧的重建高频时域信号的时域增益和该子帧对应的原始高频时域信号的时域增益提取调整该子帧时域增益的参数;所述时域增益指子帧内信号能量的平均值。本发明具体实施例中,调整时域增益参数的计算方法为:首先计算子帧的时域增益,然后计算原始高频时域信号同重建高频时域信号的增益比值的平方根,该平方根作为时域增益调整的参数,并将该参数经标量量化输出到比特流复用器编码。所述标量量化的精度可取为3dB。
由本实施例频带扩展编码装置实现对高频时域信号进行编码处理的流程如图10所示,包括如下步骤:
步骤1001:将来自低频编码器的低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;对原始高频时域信号进行信号类型分析,获得信号类型信息。
若低频编码器采用TCX模式,则所述低频激励谱为低频编码器输出的TCX帧的低频激励谱;若低频编码器采用ACELP模式,则所述低频激励谱为低频编码器输出ACELP帧的低频时域激励信号经过DFT变换,生成的ACELP帧的低频激励谱。
所述信号类型分析为:判断所述原始高频时域信号的类型是缓变信号还是快变信号,若是快变信号则进一步分析快变点发生的位置;所述信号类型信息包括信号类型;若信号类型为快变信号,则进一步包括快变点发生的位置信息。
步骤1002:根据原始高频时域信号及其信号类型信息获得原始高频时域信号的线谱频率矢量量化索引以及原始高频激励信号,并将原始高频激励信号作离散傅立叶变换DFT得到原始高频激励谱。
其中,根据原始高频时域信号及其信号类型信息获得原始高频时域信号的线谱频率矢量量化索引以及原始高频激励信号包括:
步骤1002a:根据信号类型信息,将所述一个超帧的原始高频时域信号划分成一个或一个以上的预测帧;
步骤1002b:对预测帧的高频时域信号进行线性预测分析,求出预测系数;
步骤1002c:将预测系数转换成线谱频率,在将线谱频率进行矢量量化得到量化后的线谱频率以及矢量量化索引;
步骤1002d:根据量化后的线谱频率求出量化后的预测系数,并用量化后的预测系数生成线性预测滤波器;
步骤1002e:由线性预测滤波器对原始高频时域信号进行滤波,得到原始高频激励信号;
步骤1002f:把各个预测帧组合生成一个超帧的原始高频激励信号。
步骤1003:根据原始高频激励谱对高频拷贝激励谱进行调整,得到谱调整参数以及谱调整之后的高频拷贝激励谱;所述调整包括调性调整和频域增益调整。
其中,调性调整包括:
步骤1003a、将原始高频激励谱以及所述高频拷贝激励谱按照相同的划分方式分别划分为一个以上的频段,并计算每个频段的原始高频激励谱的调性Tref以及相应频段的高频拷贝激励谱的调性Test,判断高频拷贝激励谱的调性Test与原始高频激励谱的调性Tref的大小,若Test<Tref-T0,则执行步骤A32;若Tref-T0≤Test≤Tref+T1,则调整类型设置为不进行调性调整,将调整类型作为调性调整参数并转至频域增益调整;若Test>Tref+T1,则执行步骤A33;其中T0、T1为预先设置的常数;
所述频域增益调整包括:
1003d、将所述原始高频激励谱和高频拷贝激励谱按照相同的方式分别划分成一个以上的频带,并分别计算原始高频激励谱和高频拷贝激励谱中每个频带的能量;
1003e、对于任意一个频带,计算该频带原始高频激励谱和高频拷贝激励谱能量之比的平方根,将所述能量比平方根作为该频带的频域增益调整参数;
1003f、对于高频拷贝激励谱的每一个频带,将该频带内的每根谱线分别乘以与该频带对应的频域增益调整参数,得到频域增益调整后的高频拷贝激励谱;并将各个频带的频域增益调整参数的集合作为频域增益调整参数。
步骤1004:对调整后的高频拷贝激励谱进行IDFT变换,得到调整后的高频拷贝激励信号。
步骤1005:根据信号类型信息,对所述调整后的高频拷贝激励信号进行综合滤波,得到重建高频时域信号;本步骤具体包括:
步骤1005a:根据信号类型信息将一个超帧的高频拷贝激励信号划分成一个或一个以上的预测帧;
步骤1005b:对所述每一个预测帧,得到该预测帧内一组线谱频率的矢量量化索引,并作逆矢量量化得到矢量量化的线谱频率,并将所述线谱频率转化为矢量量化后的线性预测滤波器系数,并由所得的这些系数构成线性预测综合滤波器;
步骤1005c:将所述高频拷贝激励信号通过所述线性预测综合滤波器的滤波,得到重建高频时域信号。
步骤1006:根据信号类型信息,以及所述重建高频时域信号的时域增益与原始高频时域信号的时域增益提取时域增益调整参数。具体做法为:根据所述信号类型信息,将所得的每个预测帧的重建高频时域信号划分为一个或一个以上的子帧;计算每个子帧的重建高频时域信号的能量平均值和该子帧对应的原始高频时域信号的能量平均值的比值,将所述比值的平方根作为调整该子帧时域增益的参数。
步骤1007:输出包括步骤1001获得的信号类型信息、步骤1002获得的线谱频率矢量量化索引、步骤1003所得谱调整参数以及所述时域增益调整参数在内的高频参数。
实施例二:第二类频带扩展编码装置。
本实施例的频带扩展编码装置的结构示意图如图11所示,与图5比较,增加了编码模式选择模块507,而其他各个模块与图5中的同名模块完全相同。所述编码模式选择模块507用于接收来自低频编码器的低频编码模式信息和低频激励信号或谱,根据预设的高频编码模式进行处理,预设的高频编码模式分为模式1和模式2,其中模式1对于低频编码器输出的TCX帧低频激励谱或ACELP帧的低频时域激励信号都既进行频域调整也进行时域调整;而模式2对TCX帧低频激励谱进行频域调整和时域调整,对ACELP帧的低频时域激励信号仅进行时域调整。具体处理过程如下:
若预设的高频编码模式为模式1,则将来自低频编码器的TCX帧的低频激励谱输出至谱参数编码模块503,和/或将来自低频编码器的ACELP帧的低频激励信号进行DFT变换得到低频激励谱输出到谱参数编码模块503;若预设的高频编码模式为模式2,则将来自低频编码器的TCX帧的低频激励谱输出至谱参数编码模块503,和/或将来自低频编码器的ACELP帧的低频激励信号输出至时变预测综合模块504。
时变预测综合模块504的线性预测综合滤波器504c对所收到的低频激励信号进行综合滤波后,输出重建高频时域信号。
本实施例的实现流程可在图10所示的实施例一流程的步骤1001之前增加模式选择的步骤:
接收来自低频编码器的低频编码模式信息和低频激励信号或谱,根据预设的高频编码模式进行处理:
若预设的高频编码模式为模式1,则根据低频编码模式信息进行处理:若为TCX模式,则直接执行步骤1001及后续步骤;若为ACELP模式,则将ACELP帧的低频激励信号进行DFT变换生成ACELP帧的低频激励谱,再执行步骤1001及后续步骤;
若预设的高频编码模式为模式2,则根据低频编码模式信息进行处理:若为TCX模式,则直接执行步骤1001及后续步骤;若为ACELP模式,则将来自低频编码器的ACELP帧的低频激励信号进行综合滤波,得到重建高频时域信号,并执行步骤1006及后续步骤。
实施例三:第一类频带扩展解码装置。
本实施例装置为与实施例二的编码装置相对应的解码装置,其结构示意图如图12所示,包括高频解码模式选择模块1201、谱参数解码模块1202、自适应时域增益解码模块1203和时变预测综合模块1204。
高频解码模式选择模块1201首先选择高频解码模式,高频解码模式与实施例二的高频编码模式相对应,包括模式1和模式2,选择的方法与编码端相同。当选择模式1时,将从TCX解码器得到的TCX帧的低频激励谱输出到谱参数解码模块1202,或者将从ACELP解码器得到的ACELP帧的低频激励信号经过DFT变换得到ACELP帧的低频激励谱,并将所得ACELP帧的低频激励谱输出到谱参数解码模块1202;当选择模式2时,将从TCX解码器得到的TCX帧的低频激励谱输出到谱参数解码模块1202,或者将从ACELP解码器得到的ACELP帧的低频激励信号直接输出到自适应时域增益解码模块1203。
谱参数解码模块1202首先将从高频解码模式选择模块1201得到的TCX/ACELP帧低频激励谱的特定频段拷贝到高频的特定频段,得到该TCX/ACELP帧的高频拷贝激励谱,同时根据从解比特流复用器1205得到的谱调整参数(包括调性调整参数和增益调整参数)对高频拷贝激励谱进行相应的调整和IDFT变换,最后将所得调整后的高频拷贝激励信号输出到自适应时域增益解码模块1203;
自适应时域增益解码模块1203根据从解比特流复用器1205得到的信号类型信息,将来自谱参数解码模块1202的高频拷贝激励信号划分为一个或多个子帧;所述信号类型信息包括信号类型和快变信号时的快变点发生的位置,子帧的划分方法与编码端的时域自适应增益调整参数提取模块505中的划分方法相同;
若高频解码模式选择模块1201选择模式1,则自适应时域增益解码模块1203还用于根据从解比特流复用器1205得到的对应子帧的时域增益调整参数对每一个子帧的高频拷贝激励信号进行时域增益调整,并将所得到的时域增益调整后的高频拷贝激励信号输出至时变预测综合模块1204;
若高频解码模式选择模块1201选择模式2,则自适应时域增益解码模块1203还用于根据从解比特流复用器1205得到的对应TCX子帧的时域增益调整参数对每一个TCX子帧的高频拷贝激励信号进行时域增益调整,并将所得到的时域增益调整后的高频拷贝激励信号输出至时变预测综合模块1204;或者将来自高频解码模式选择模块1201的ACELP帧的低频激励信号划分为一个或多个子帧(子帧的划分方法与编码端相同),并根据从解比特流复用器1205得到的对应子帧的时域增益调整参数对每一个子帧的低频激励信号进行时域增益调整,并将所得到的时域增益调整后的低频激励信号输出至时变预测综合模块1204;
所述时域增益调整方法为:首先从解比特流复用器1205中获得的所要进行时域增益调整的子帧的量化后的时域增益调整参数,解量化该调整参数,并将该子帧内的激励信号均乘以解量化后的该调整参数。所得结果即为时域增益调整后的激励信号。
时变预测综合模块1204将来自自适应时域增益解码模块1203的一个或若干个TCX/ACELP帧的高频拷贝激励信号或/和低频激励信号根据其时间顺序组合成一个超帧的时域激励信号,并根据从解比特流复用器1205得到的信号类型信息将该超帧时域激励信号重新划分为预测帧,预测帧的划分方法与编码端的时变预测综合模块504中的方法相同;再根据从解比特流复用器1205中得到的线谱频率矢量量化索引构成每个预测帧的时变预测综合滤波器,并对对应预测帧的时域激励信号进行综合滤波,综合滤波的方法与编码端的时变预测综合模块504相同;并将所得对应预测帧的重建高频时域信号作为高频解码后的数据输出到解码器中的综合滤波器组和后处理器(synthsis filter band and post processing)1206,综合滤波器组和后处理器和AMR WB+解码器的对应部分相同。
谱参数解码模块1202的结构如图13所示,包括由谱拷贝器1202a、调性调整器1202b、频域增益调整器1203c和IDFT变换器1202d。
其中,谱拷贝器1202a将从高频解码模式选择模块1201得到的TCX/ACELP帧的低频激励频谱的特定频段拷贝到高频谱的特定频段,得到该TCX/ACELP帧的高频拷贝激励谱,拷贝的规则同与编码端谱拷贝器503a的规则相同;
调性调整器1202b从解比特流复用器1205中获得的调性调整的调整类型和调整参数,并根据调整类型和调整参数对所述的谱拷贝器1202a输出的TCX/ACELP帧的高频拷贝激励谱进行调性调整;在本发明实施方法中,调性调整首先将信号频谱划分成频带,划分方法与编码端谱调性调整和参数提取器503b所采用的方法相同;对于每个频带,计算能量Eest,根据调整类型信息进行以下调整:
当调整类型为不调整时,不做处理;
将调性调整后的高频拷贝激励谱输出到频域增益调整器1202c;
频域增益调整器1202c用于从解比特流复用器1205中获得频域增益调整参数,并根据所述参数对调性调整器1202b输出的TCX/ACELP帧的高频拷贝激励谱进行频域增益调整。本实施方法中,首先将TCX/ACELP帧的高频拷贝激励谱划分为若干个频带,频带的划分与编码端的频域增益调整与参数提取器503d中的划分方法相同;然后对于每个频带,解量化从解比特流复用器1205中得到的该频带的调整参数,并将该频带内的每根谱线均乘以解量化后的该参数,最后将频域增益调整后的TCX/ACELP帧的高频拷贝激励谱输出到IDFT变换器1202d;
IDFT变换器1202d将频域增益调整器1202c输出的TCX/ACELP帧的高频拷贝激励谱进行IDFT变换,得到TCX/ACELP帧的高频拷贝激励信号,并将该信号输出到自适应时域增益解码模块1203。
本实施例的频带扩展解码装置实现频带扩展解码的处理流程如图14所示,包括如下步骤:
步骤1401:对预设的高频解码模式进行判斯,若为模式1,则执行步骤1403;若为模式2执行步骤1402;
步骤1402:对低频解码模式进行判断,若为TCX模式,则执行步骤1403,若为ACELP模式,则转至步骤1408。
步骤1403:将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱。其中,若低频解码器采用TCX解码模式,则将来自低频解码器的TCX帧的低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;若低频解码器采用ACELP方式,则对来自低频解码器的ACELP帧的低频激励信号先进行DFT变换得到ACELP帧的低频激励谱,再将所述ACELP帧的低频激励谱拷贝到高频的特定频段,得到高频拷贝激励谱。
步骤1404:读取调整参数,并根据所述调整参数对所述高频拷贝激励谱进行调整。
所述调整参数包括调性调整参数和频域增益调整参数,所述调整包括调性调整和频域增益调整。
则所述调性调整包括:
步骤1404a:将高频拷贝激励谱划分为一个或一个以上的频带,并分别计算每个频带的能量Eest;
步骤1404b:对于每一个频带判断调整类型,若调整类型为不调整,则对该频带不作处理;若调整类型为加弦处理,则在该频带的正中位置加弦,加弦能量为所加弦的相位与前一帧相位连续;若调整类型为加噪调整,则在该频带加随机噪声,加噪能量为处理完毕所有频带后则结束调性调整。
所述频域增益调整包括:
步骤1404c:将高频拷贝激励谱划分为一个或一个以上的频带;
步骤1404d:对于任一个频带,用该频带对应的增益调整参数乘以该频带内的每根谱线,得到该频带的频域增益调整后的高频拷贝激励谱,将所有频带组合起来即为频域增益调整后的高频拷贝激励谱。
步骤1405:对调整后的高频拷贝激励谱进行IDFT变换,得到高频拷贝激励信号。
步骤1406:根据对应的时域增益调整参数对所得高频拷贝激励信号进行时域增益调整,并输出所得调整后的高频拷贝激励信号。具体做法为:先将高频拷贝激励信号划分为一个或一个以上的子帧;再读取时域增益调整参数,将每个子帧的高频拷贝激励信号分别乘以相应的时域增益调整参数,得到时域增益调整后的高频拷贝激励信号。
步骤1407:对所得时域增益调整后的高频拷贝激励信号进行综合滤波,得到重建高频时域信号,并将所得重建高频时域信号输出至后续处理模块。具体包括:
步骤1407a:读取信号类型信息,并根据所读取的信号类型信息将一个超帧的高频拷贝激励信号划分成一个或一个以上的预测帧;
步骤1407b:对所述每一个预测帧,读取量化后的线谱频率构成线性预测综合滤波器;
步骤1407c:由所述线性预测综合滤波器对所述高频拷贝激励信号进行滤波,得到重建高频时域信号;则实现频带扩展解码,并继续执行后续处理步骤。
步骤1408:根据对应的时域增益调整参数对ACELP解码模式得到的ACELP帧的低频激励信号进行时域增益调整,并输出所得时域增益调整后的低频激励信号;时域增益调整的方法与步骤1405所采用的调整方法相同。
步骤1409:对所得时域增益调整后的低频激励信号进行综合滤波,得到重建高频时域信号,并将所得重建高频时域信号;则实现频带扩展解码,并继续执行后续处理步骤。综合滤波的具体做法与步骤1406相同。
实施例四:第二类频带扩展解码装置。
本实施例作为实施例三所述频带扩展解码装置的一种替换方案,可以不进行高频解码模式选择,而直接进行时频域高频解码,则装置中可去掉高频解码模式选择模块1201。对于TCX低频解码器,则将来自低频解码器的TCX帧低频时域激励谱直接输入谱参数解码模块1202;对于ACELP低频解码器,则需要增加在高频解码模式选择模块1201的位置上增加一个DFT模块,用于将来自低频解码器的ACELP帧的低频时域激励信号先进行DFT,转换为ACELP帧的低频时域激励谱后再输入谱参数解码模块1202。该替换方案解码装置与实施例一的编码装置相对应。
图14所述流程中去掉步骤1401、步骤1407和步骤1408,即为该替换方案的实施流程。
实施例五:第三类频带扩展解码装置。
本实施例的频带扩展解码装置与图12所示的实施例三的频带扩展解码装置的不同之处在于,将自适应时域增益解码模块1203和时变预测综合模块1204调换一下位置,而各个模块的功能基本保持不变。本实施例装置的各个模块功能如下:
高频解码模式选择模块1201首先选择高频解码模式,高频解码模式与实施例二的高频编码模式相对应,包括模式1和模式2,选择的方法与编码端相同。当选择模式1时,将从TCX解码器得到的TCX帧的低频激励谱输出到谱参数解码模块1202,或者将从ACELP解码器得到的ACELP帧的低频激励信号经过DFT变换得到低频激励谱输出到谱参数解码模块1202;当选择模式2时,将从TCX解码器得到的TCX帧的低频激励谱输出到谱参数解码模块1202,或将从ACELP解码器得到的ACELP帧的低频激励信号直接输出到时变预测综合模块1204;
谱参数解码模块1202首先将从高频解码模式选择模块1201得到的TCX/ACELP帧低频激励谱的特定频段拷贝到高频的特定频段,得到该TCX/ACELP帧的高频拷贝激励谱,同时根据从解比特流复用器1205得到的谱调整参数(包括调性调整参数和增益调整参数)对高频拷贝激励谱进行相应的调整和IDFT变换,最后将调整后的高频拷贝激励信号输出到时变预测综合模块1204;
时变预测综合模块1204将从高频解码模式选择模块1201得到的一个或若干个ACELP帧的低频激励信号和/或从谱参数解码模块1202得到的一个或若干个TCX/ACELP帧的高频拷贝激励信号根据其时间顺序组综合一超帧的时域激励信号,并根据从解比特流复用器1205得到的信号类型信息将该超帧时域激励信号重新划分为预测帧(预测帧的划分方法与编码端相同),再根据从解比特流复用器1205中得到的线谱频率矢量量化索引构成每个预测帧的时变预测综合滤波器,并对对应预测帧的时域激励信号进行综合滤波,得到对应预测帧的重建高频时域信号,并将该信号输出到自适应时域增益解码模块1203;
自适应时域增益解码模块1203根据从解比特流复用器1205得到的信号类型信息将时变预测综合模块1204输出的每个预测帧的重建高频时域信号划分为一个或多个子帧(子帧的划分方法与编码端相同),并根据从解比特流复用器得到的对应子帧的时域增益调整参数对该子帧的重建高频时域信号进行增益调整,时域增益调整后的重建高频时域信号即为高频解码后的数据输出到解码器中的综合滤波器组和后处理器(synthsis filter band and post processing)1206,综合滤波器组和后处理器和AMR WB+解码器的对应部分相同。
将本实施例的装置与实施例三的装置进行比较可以看出:实施例三的装置是先对时域激励信号进行时域增益调整,再对调整后的时域激励信号进行综合滤波,得到重建的高频时域信号;而本实施例是先对时域激励信号进行综合滤波,得到重建的高频时域信号,再对重建高频时域信号进行时域增益调整,得到调整后的重建高频时域信号。因此,将图14所示的流程中步骤1406和步骤1407,以及步骤1408和步骤1409的时域增益调整和综合滤波这两个步骤对调,即得到本实施例的实现流程。
本发明专利声明了一种基于AMR-WB+编解码方案的改进频带扩展方法,用以替换AMR WB+现有的频带扩展方案。因此,本发明专利说明书将现有AMR WB+标准文本作为基础的参考文献。除了本发明专利声明的一个用于AMR WB+技术框架的改进频带扩展方法外,AMR WB+技术框架中的其他技术仍然适用。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (27)
1.一种频带扩展编码方法,其特征在于,该方法包括如下步骤:
A、将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;对一个超帧的原始高频时域信号进行信号类型分析,并根据得到的信号类型信息将所述一个超帧的原始高频时域信号划分成一个或一个以上的预测帧;对所划分的每一个预测帧进行线性预测分析,获得每个预测帧的原始高频激励信号,然后再把各个预测帧组合生成一个超帧的原始高频激励信号,并将原始高频激励信号作离散傅立叶变换DFT得到原始高频激励谱;根据原始高频激励谱对高频拷贝激励谱进行调整,得到谱调整参数以及调整之后的高频拷贝激励谱;对调整后的高频拷贝激励谱进行逆离散傅立叶变换IDFT得到调整后的高频拷贝激励信号;
B、对所述调整后的高频拷贝激励信号进行综合滤波,得到重建高频时域信号,并根据所述重建高频时域信号的时域增益与原始高频时域信号的时域增益提取时域增益调整参数;输出包括步骤A所得调整参数以及所述时域增益调整参数在内的高频参数。
2.根据权利要求1所述的方法,其特征在于,所述低频激励谱为变换激励编码TCX模式生成的TCX帧的低频激励谱,或代数码本激励预测编码ACELP模式形成ACELP帧的低频激励信号经DFT变换得到的ACELP帧的低频激励谱。
3.根据权利要求1所述的方法,其特征在于,预设两种高频编码模式,分别为模式1和模式2,其中模式1对于低频编码器输出的TCX帧低频激励谱或ACELP帧的低频时域激励信号都既进行频域调整也进行时域调整;而模式2对TCX帧低频激励谱进行频域调整和时域调整,对ACELP帧的低频时域激励信号仅进行时域调整;步骤A之前进一步包括:
对预设的高频编码模式进行判断,若为模式1,则依次执行步骤A和步骤B;若为模式2,则进一步判断低频激励谱的编码模式,若为TCX模式,则依次执行步骤A和步骤B,若为ACELP模式,则转至步骤C:
C、对ACELP帧的低频时域激励信号进行综合滤波,得到重建高频时域信号,并根据所述重建高频时域信号的时域增益与原始高频时域信号的时域增益提取时域增益调整参数;将所述时域增益调整参数作为高频参数输出,并结束本方法流程。
4.根据权利要求1所述的方法,其特征在于,所述信号类型分析为:判断所述原始高频时域信号的类型是缓变信号还是快变信号,若是快变信号则进一步分析快变点发生的位置;所述信号类型信息包括信号类型;若信号类型为快变信号,则进一步包括快变点发生的位置信息。
5.根据权利要求1所述的方法,其特征在于,所述谱调整参数包括调性调整参数和频域增益调整参数,步骤A所述调整包括:
A3、计算所述原始高频激励谱的调性,根据所得原始高频激励谱的调性对所述高频拷贝激励谱进行调性调整,得到调性调整后的高频拷贝激励谱和调性调整参数;
A4、根据所述原始高频激励谱,对所述调性调整后的高频拷贝激励谱进行频域增益调整,得到频域增益调整后的高频拷贝激励谱和频域增益调整参数。
6.根据权利要求5所述的方法,其特征在于,步骤A3所述调性调整包括:
A31、将原始高频激励谱以及所述高频拷贝激励谱按照相同的划分方式分别划分为一个以上的频段,并计算每个频段的原始高频激励谱的调性Tref以及相应频段的高频拷贝激励谱的调性Test,判断高频拷贝激励谱的调性Test与原始高频激励谱的调性Tref的大小,若Test<Tref-T0,则执行步骤A32;若Tref-T0≤Test≤Tref+T1,则调整类型设置为不进行调性调整,将调整类型作为调性调整参数并转至步骤A4;若Test>Tref+T1,则执行步骤A33;其中T0、T1为预先设置的常数;
7.根据权利要求1至6任一项所述的方法,其特征在于,步骤B所述对原始高频激励信号进行综合滤波,得到重建高频时域信号包括:
B1、对一个超帧的原始高频时域信号进行信号类型分析,并根据分析结果将一个超帧的原始高频时域信号划分成一个或一个以上的预测帧;
B2、对所述每一个预测帧,得到该预测帧内一组线谱频率,并做矢量量化,将所得量化后的线谱频率转化为量化后的线性预测滤波器系数,并由所得的这些系数构成线性预测综合滤波器;
B3、将所述原始高频激励信号通过所述线性预测综合滤波器的滤波,得到重建高频时域信号。
8.根据权利要求7所述的方法,其特征在于,步骤B所述提取时域增益调整参数包括:
根据所述对原始高频时域信号进行信号类型分析的分析结果,将所得的每个预测帧的重建高频时域信号划分为一个或一个以上的子帧;计算每个子帧的重建高频时域信号的能量平均值和该子帧对应的原始高频时域信号的能量平均值的比值,将所述比值的平方根作为调整该子帧时域增益的参数。
9.一种频带扩展解码方法,其特征在于,该方法包括如下步骤:
a、将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;
b、读取谱调整参数,并根据谱调整参数对所述高频拷贝激励谱进行调整;对调整后的高频拷贝激励谱进行IDFT变换,得到高频拷贝激励信号;
c、对所述高频拷贝激励信号进行时域增益调整,得到调整后的高频拷贝激励信号,再对调整后的高频拷贝激励信号进行综合滤波,得到并输出重建高频时域信号。
10.根据权利要求9所述的方法,其特征在于,所述低频激励谱为采用TCX解码模式得到的TCX帧低频激励谱,或ACELP解码模式得到的ACELP帧的低频激励信号进行DFT变换得到的ACELP帧低频激励谱。
11.根据权利要求9所述的方法,其特征在于,预设两种高频解码模式,分别为模式1和模式2,其中模式1对于低频编码器输出的TCX帧低频激励谱或ACELP帧的低频时域激励信号都既进行频域调整也进行时域调整;而模式2对TCX帧低频激励谱进行频域调整和时域调整,对ACELP帧的低频时域激励信号仅进行时域调整;所述步骤a之前进一步包括:对预设的高频解码模式进行判断,若为模式1,则执行步骤a;若为模式2,则进一步判断低频解码模式信息,若为TCX模式,则执行步骤a;若为ACELP模式,则对来自低频编码器的ACELP帧的低频激励信号进行综合滤波,得到重建高频时域信号,并根据时域增益调整参数对所得重建高频时域信号进行时域增益调整,输出所得调整后的重建高频时域信号并结束本流程。
12.根据权利要求9所述的方法,其特征在于,步骤b所述调整参数包括调性调整参数和频域增益调整参数,所述调整包括调性调整和频域增益调整。
14.根据权利要求12所述的方法,其特征在于,所述频域增益调整包括:
b3、将高频拷贝激励谱划分为一个或一个以上的频带;
b4、对于任一个频带,用该频带对应的增益调整参数乘以该频带内的每根谱线,得到该频带的频域增益调整后的高频拷贝激励谱,将所有频带组合起来即为频域增益调整后的高频拷贝激励谱。
15.根据权利要求9至14任一项所述的方法,其特征在于,步骤c所述综合滤波包括:
c1、读取信号类型信息,并根据所读取的信号类型信息将一个超帧的高频拷贝激励信号划分成一个或一个以上的预测帧;
c2、对所述每一个预测帧,读取量化后的线谱频率构成线性预测综合滤波器;
c3、由所述线性预测综合滤波器对所述高频拷贝激励信号进行滤波,得到重建高频时域信号。
16.根据权利要求9至14任一项所述的方法,其特征在于,步骤c所述时域增益调整包括:
c4、将高频拷贝激励信号划分为一个或一个以上的子帧;
c5、读取时域增益调整参数,将每个子帧的高频拷贝激励信号分别乘以相应的时域增益调整参数,得到时域增益调整后的高频拷贝激励信号。
17.一种频带扩展解码方法,其特征在于,该方法包括如下步骤:
a、将低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱;
b、读取调整参数,并根据调整参数对所述高频拷贝激励谱进行调整;对调整后的高频拷贝激励谱进行IDFT变换,得到高频拷贝激励信号;
c、对所述高频拷贝激励信号进行综合滤波,得到重建高频时域信号,再对所得重建高频时域信号进行时域增益调整,得到并输出时域增益调整后的重建高频时域信号。
18.一种频带扩展编码装置,位于扩展的宽带自适应多速率AMR-WB+编码器中,用于接收来自预处理与分析滤波器组的高频时域信号以及来自低频编码器的低频激励谱,输出高频参数至比特流复用器,其特征在于,该装置包括如下部分:
谱参数编码模块,用于接收低频激励谱,将所接收的低频激励谱转换为高频拷贝激励谱;根据来自时变预测分析模块的原始高频激励信号对所述高频拷贝激励谱进行调整,将调整参数输出至比特流复用器,将调整后的高频拷贝激励谱转换为高频拷贝激励信号并输出至时变预测综合模块;
时变预测分析模块,用于接收原始高频时域信号,对所接收的高频时域信号进行线性预测分析,获得每个预测帧的时变预测滤波器系数和原始高频激励信号;将时变预测滤波器系数输出到时变预测综合模块;将所生成的原始高频激励信号输出到谱参数编码模块;
时变预测综合模块,用于对所收到的高频拷贝激励信号进行综合滤波得到重建高频时域信号,并将所得重建高频时域信号输出至时域自适应增益调整参数提取模块;
时域自适应增益调整参数提取模块,接收原始高频时域信号以及来自时变预测综合模块的重建高频时域信号,将所接收的原始高频时域信号与重建高频时域信号进行比较得到时域增益调整参数,并将所述时域增益调整参数输出至比特流复用器。
19.根据权利要求18所述的装置,其特征在于,所述谱参数编码模块进一步包括:
谱拷贝器,用于接收来自低频编码器的低频激励谱,将所接收的低频激励谱的特定频段拷贝到高频的特定频段得到高频拷贝激励谱,并将所得高频拷贝激励谱输出至调性调整和参数提取器以及频域调整和参数提取器;
DFT变换器,用于将所接收的原始高频激励信号进行DFT变换得到原始高频激励谱,并将所得原始高频激励谱输出至调性调整和参数提取器以及频域调整和参数提取器;
调性调整和参数提取器,用于根据来自DFT变换器的原始高频激励谱,对来自谱拷贝模块的高频拷贝激励谱进行调性调整,并将得到的调性调整的参数输出到比特流复用器,调性调整后的高频拷贝激励谱输出至频域增益调整和参数提取器;
频域增益调整和参数提取器,根据来自DFT变换器的原始高频激励谱,对来自调性调整和参数提取器的高频拷贝激励谱进行频域增益调整,并将频域增益调整参数输出至比特流复用器,频域增益调整后的高频拷贝激励谱输出至IDFT变换器;
IDFT变换器,用于对来自频域增益调整和参数提取器的高频拷贝激励谱进行IDFT变换,得到调整后的原始高频激励信号,并将所得原始高频激励信号输出至时变预测综合模块。
20.根据权利要求18所述的装置,其特征在于,该装置进一步包括信号类型分析模块,用于接收原始高频时域信号,对所接收的每个超帧的原始高频时域信号进行信号类型分析,判断该超帧高频时域信号是快变信号还是缓变信号,若是快变信号则进一步分析快变点发生的位置,并将分析结果作为信号类型信息发送至时变预测分析模块、时变预测综合模块,以及时域自适应增益调整参数提取模块;所述分析结果包括信号类型,若信号类型为快变类型,则进一步包括快变点发生的位置信息。
21.根据权利要求20所述的装置,其特征在于,所述时变预测分析模块进一步包括:
线性预测分析器,用于接收原始高频时域信号,并对所接收的原始高频时域信号进行线性预测分析,将所得到的预测系数输出至转换器;
转换器,用于将来自线性预测分析器的预测系数转换为线谱频率,并将所得线谱频率输出至矢量量化器;
矢量量化器,用于将所接收的线谱频率进行矢量量化得到矢量量化索引,将矢量量化索引输出至时变预测综合模块和比特流复用器;并根据所得矢量量化索引得到量化后的线谱频率,将所得量化后的线谱频率输出至逆转换器;
逆转换器,用于根据所接收的量化后的线谱频率得到量化后的预测系数,并根据预测系数生成线性预测滤波器;
线性预测滤波器,用于接收原始高频时域信号,并将所接收的原始高频时域信号进行滤波,将滤波后所得原始高频激励信号输出至谱参数编码模块;
所述时变预测综合模块进一步包括:
逆矢量量化器,用于将所接收的线谱频率矢量量化索引进行解量化得到量化的线谱频率,并将所得量化的线谱频率输出至转换器;
转换器,用于将量化的线谱频率转换为量化后的线性预测滤波器系数,并将所述量化后的线性预测滤波器系数构成线性预测综合滤波器;
线性预测综合滤波器,用于接收来自谱参数编码模块的高频拷贝激励信号,并对所接收的高频拷贝激励信号进行滤波得到重建的高频时域信号,将所得高频时域信号输出至时域自适应增益调整参数提取模块。
所述时域自适应增益调整参数提取模块进一步包括:
子帧划分模块,用于根据来自信号类型分析模块的信号类型信息,将来自时变预测综合模块的每个预测帧的重建高频时域信号划分为一个或一个以上子帧,并将所述各个子帧发送至参数提取模块;
参数提取模块,用于接收每一个子帧的重建高频时域信号,计算其时域增益,并计算所接收的原始高频时域信号对应子帧的时域增益,将所述两种时域增益进行比较,提取时域增益调整参数,并将该参数输出到比特流复用器。
22.根据权利要求18至21任一项所述的装置,其特征在于,该装置进一步包括DFT变换模块,用于接收来自低频编码器的ACELP帧的低频时域激励信号,并对所接收的低频时域激励信号进行DFT变换得到低频激励谱,并将所得低频激励谱输出至谱参数编码模块。
23.根据权利要求18至21任一项所述的装置,其特征在于,该装置进一步包括高频编码模式选择模块,用于接收来自低频编码器的低频编码模式信息,以及低频时域激励信号或低频激励谱,根据预设的高频编码模式进行处理:预设的高频编码模式分别为模式1和模式2,其中模式1对于低频编码器输出的TCX帧低频激励谱或ACELP帧的低频时域激励信号都既进行频域调整也进行时域调整;而模式2对TCX帧低频激励谱进行频域调整和时域调整,对ACELP帧的低频时域激励信号仅进行时域调整;若预设的高频编码模式为模式1,则将来自低频编码器的TCX帧的低频激励谱输出至谱参数编码模块,或者将来自低频编码器的ACELP帧的低频激励信号进行DFT变换得到低频激励谱输出到谱参数编码模块;若预设的高频编码模式为模式2,则将来自低频编码器的TCX帧的低频激励谱输出至谱参数编码模块,或者将来自低频编码器的ACELP帧的低频激励信号输出至时变预测综合模块。
24.一种频带扩展解码装置,位于AMRWB+解码器中,用于接收来自比特流解复用器的高频参数以及来自低频解码器的低频激励谱,输出重建高频时域信号至综合滤波器组和后处理模块,其特征在于,该装置包括如下部分:
谱参数解码模块,用于将所接收的低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱,同时根据从解比特流复用器得到的谱调整参数对所述高频拷贝激励谱进行相应的调整,将调整后的高频拷贝激励谱进行IDFT转换为高频拷贝激励信号并输出到时变预测综合模块;
时变预测综合模块,用于根据从解比特流复用器中得到的时变预测滤波器系数的矢量量化索引构成时变预测综合滤波器,对来自谱参数解码模块的高频拷贝激励信号进行综合滤波,得到重建高频时域信号,并将所述重建高频时域信号输出到自适应时域增益解码模块;
自适应时域增益解码模块,用于根据从解比特流复用器得到的时域增益调整参数对来自时变预测综合模块的重建高频时域信号进行增益调整,将时域增益调整后的重建高频时域信号输出至AMR-WB+解码器中的综合滤波器组和后处理器。
25.根据权利要求24所述的装置,其特征在于,所述谱参数解码模块进一步包括:
谱拷贝器,用于将所接收的低频激励谱的特定频段拷贝到高频的特定频段得到高频拷贝激励谱,将所得高频拷贝激励谱输出至调性调整器;
调性调整器,用于从解比特流复用器中获得调性调整的调整类型和调整参数,并根据调整类型和调整参数对来自谱拷贝模块高频拷贝激励谱进行调性调整,将调性调整后的高频拷贝激励谱输出至频域增益调整器;
频域增益调整器,用于从解比特流复用器获得频域增益调整参数,并根据所述频域增益调整参数对来自调性调整模块高频拷激励贝谱进行频域增益调整,将频域增益调整后的高频拷贝激励谱输出到IDFT变换器;
IDFT变换器,用于将来自频域增益调整器高频拷贝激励谱进行IDFI变换,得到高频拷贝激励信号,并将所述高频拷贝激励信号输出至时变预测综合模块。
26.根据权利要求24或25所述的装置,其特征在于,该装置进一步包括:
高频解码模式选择模块,用于接收来自低频解码器的TCX帧的低频激励谱或ACELP帧的低频激励信号,根据预先设置的高频解码模式进行处理:预设的高频解码模式分别为模式1和模式2,其中模式1对于低频编码器输出的TCX帧低频激励谱或ACELP帧的低频时域激励信号都既进行频域调整也进行时域调整;而模式2对TCX帧低频激励谱进行频域调整和时域调整,对ACELP帧的低频时域激励信号仅进行时域调整;若预设的高频解码模式为模式1,则将所述TCX帧的低频激励谱输出至谱参数解码模块,或者将所述ACELP帧的低频激励信号进行DFT变换得到ACELP帧的低频激励谱输出至谱参数解码模块;若预设的高频解码模式为模式2,则将所述TCX帧的低频激励谱输出至谱参数解码模块,或者将所述ACELP帧的低频激励信号转换为高频激励信号并输出至时变预测综合模块。
27.一种频带扩展解码装置,位于AMR-WB+解码器中,用于接收来自比特流解复用器的高频参数以及来自低频解码器的低频激励谱,输出重建高频时域信号至综合滤波器组和后处理模块,其特征在于,该装置包括如下部分:
谱参数解码模块,用于将所接收的低频激励谱的特定频段拷贝到高频的特定频段,得到高频拷贝激励谱,同时根据从解比特流复用器得到的谱调整参数对所述高频拷贝激励谱进行相应的调整,将调整后的高频拷贝激励谱进行IDFT转换为高频拷贝激励信号并输出到自适应时域增益解码模块;
自适应时域增益解码模块,用于根据从解比特流复用器得到的时域增益调整参数,对来自谱参数解码模块的高频拷贝激励信号进行时域增益调整,将时域增益调整后的高频拷贝激励信号输出至时变预测综合模块;
时变预测综合模块,用于根据从解比特流复用器中得到的时变预测滤波器系数的矢量量化索引构成时变预测综合滤波器,对来自自适应时域增益解码模块的高频拷贝激励信号进行综合滤波,得到重建高频时域信号,并将所述重建高频时域信号输出至AMR-WB+解码器中的综合滤波器组和后处理器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2006100870946A CN101089951B (zh) | 2006-06-16 | 2006-06-16 | 频带扩展编码方法及装置和解码方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2006100870946A CN101089951B (zh) | 2006-06-16 | 2006-06-16 | 频带扩展编码方法及装置和解码方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101089951A CN101089951A (zh) | 2007-12-19 |
CN101089951B true CN101089951B (zh) | 2011-08-31 |
Family
ID=38943280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006100870946A Active CN101089951B (zh) | 2006-06-16 | 2006-06-16 | 频带扩展编码方法及装置和解码方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101089951B (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI350653B (en) | 2007-10-19 | 2011-10-11 | Realtek Semiconductor Corp | Automatic gain control device and method |
PL3598447T3 (pl) | 2009-01-16 | 2022-02-14 | Dolby International Ab | Transpozycja harmonicznych rozszerzona o iloczyn wektorowy |
CN101521014B (zh) * | 2009-04-08 | 2011-09-14 | 武汉大学 | 音频带宽扩展编解码装置 |
CN101996640B (zh) * | 2009-08-31 | 2012-04-04 | 华为技术有限公司 | 频带扩展方法及装置 |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
MX350162B (es) * | 2011-06-30 | 2017-08-29 | Samsung Electronics Co Ltd | Aparato y método para generar señal extendida de ancho de banda. |
EP2761616A4 (en) * | 2011-10-18 | 2015-06-24 | Ericsson Telefon Ab L M | IMPROVED METHOD AND DEVICE FOR AN ADAPTIVE MULTIRATE CODEC |
EP2830062B1 (en) * | 2012-03-21 | 2019-11-20 | Samsung Electronics Co., Ltd. | Method and apparatus for high-frequency encoding/decoding for bandwidth extension |
RU2725416C1 (ru) * | 2012-03-29 | 2020-07-02 | Телефонактиеболагет Лм Эрикссон (Пабл) | Расширение полосы частот гармонического аудиосигнала |
US9711156B2 (en) * | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
CN103165134B (zh) * | 2013-04-02 | 2015-01-14 | 武汉大学 | 音频信号高频参数编解码装置 |
KR20220140002A (ko) * | 2013-04-05 | 2022-10-17 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 향상된 스펙트럼 확장을 사용하여 양자화 잡음을 감소시키기 위한 압신 장치 및 방법 |
US9666202B2 (en) * | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
CN104517611B (zh) | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
US9858941B2 (en) * | 2013-11-22 | 2018-01-02 | Qualcomm Incorporated | Selective phase compensation in high band coding of an audio signal |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
CN111312277B (zh) * | 2014-03-03 | 2023-08-15 | 三星电子株式会社 | 用于带宽扩展的高频解码的方法及设备 |
CN106463133B (zh) | 2014-03-24 | 2020-03-24 | 三星电子株式会社 | 高频带编码方法和装置,以及高频带解码方法和装置 |
KR102593442B1 (ko) * | 2014-05-07 | 2023-10-25 | 삼성전자주식회사 | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 |
EP3309781B1 (en) * | 2015-06-10 | 2023-10-04 | Sony Group Corporation | Signal processing device, signal processing method, and program |
CN107545900B (zh) * | 2017-08-16 | 2020-12-01 | 广州广晟数码技术有限公司 | 带宽扩展编码和解码中高频弦信号生成的方法和装置 |
CN107945811B (zh) * | 2017-10-23 | 2021-06-01 | 北京大学 | 一种面向频带扩展的生成式对抗网络训练方法及音频编码、解码方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1527995A (zh) * | 2001-11-14 | 2004-09-08 | ���µ�����ҵ��ʽ���� | 编码设备和解码设备 |
WO2006049205A1 (ja) * | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | スケーラブル復号化装置およびスケーラブル符号化装置 |
-
2006
- 2006-06-16 CN CN2006100870946A patent/CN101089951B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1527995A (zh) * | 2001-11-14 | 2004-09-08 | ���µ�����ҵ��ʽ���� | 编码设备和解码设备 |
WO2006049205A1 (ja) * | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | スケーラブル復号化装置およびスケーラブル符号化装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101089951A (zh) | 2007-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101089951B (zh) | 频带扩展编码方法及装置和解码方法及装置 | |
US20190043522A1 (en) | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework | |
CN107077858B (zh) | 使用具有全带隙填充的频域处理器以及时域处理器的音频编码器和解码器 | |
US9495972B2 (en) | Multi-mode audio codec and CELP coding adapted therefore | |
CN101067931B (zh) | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 | |
CN101276587B (zh) | 声音编码装置及其方法和声音解码装置及其方法 | |
US8718804B2 (en) | System and method for correcting for lost data in a digital audio signal | |
CN105719655B (zh) | 用于高频带宽扩展的对信号进行编码和解码的设备和方法 | |
CN101086845B (zh) | 声音编码装置及方法以及声音解码装置及方法 | |
DK2791937T3 (en) | Generation of an højbåndsudvidelse of a broadband extended buzzer | |
CN101432802B (zh) | 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备 | |
TWI605448B (zh) | 產生帶寬延伸訊號的裝置 | |
WO2006003891A1 (ja) | 音声信号復号化装置及び音声信号符号化装置 | |
CN102623014A (zh) | 变换编码装置和变换编码方法 | |
CN112786063A (zh) | 使用频域处理器、时域处理器和用于连续初始化的交叉处理器的音频编码器和解码器 | |
CN102144259A (zh) | 用于产生带宽扩展输出数据的装置和方法 | |
CN103366750B (zh) | 一种声音编解码装置及其方法 | |
JP5629319B2 (ja) | スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法 | |
AU2013377891A1 (en) | Systems and methods of performing noise modulation and gain adjustment | |
CN105280189B (zh) | 带宽扩展编码和解码中高频生成的方法和装置 | |
JP4354561B2 (ja) | オーディオ信号符号化装置及び復号化装置 | |
Jung et al. | An embedded variable bit-rate coder based on GSM EFR: EFR-EV |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20080201 Address after: Beijing city Haidian District Danleng Street No. 611 room 10 Applicant after: Beijing Tianlai Chuanyin Digital Technology Co., Ltd. Address before: Cangxian, Hebei Province Zhang Fu Tun Village, Ma Zhuang Applicant before: Xu Guangsuo |
|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |