CN101197577A - 一种用于音频处理框架中的编码和解码方法 - Google Patents
一种用于音频处理框架中的编码和解码方法 Download PDFInfo
- Publication number
- CN101197577A CN101197577A CNA2006101193011A CN200610119301A CN101197577A CN 101197577 A CN101197577 A CN 101197577A CN A2006101193011 A CNA2006101193011 A CN A2006101193011A CN 200610119301 A CN200610119301 A CN 200610119301A CN 101197577 A CN101197577 A CN 101197577A
- Authority
- CN
- China
- Prior art keywords
- signal
- lpc
- sinusoidal
- residual error
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
一种用于音频处理框架中的编码和解码方法,该编码方法步骤为:A经预处理后的低频段信号先通过PCX/ACELP模式选择,再对信号进行LPC分析;B依据选择的结果,进入ACELP或PCX模式进行编码;对于PCX模式,先对输入低频信号进行LPC综合及感知加权处理,获取LPC残差;再对LPC残差进行模型参数提取,最后将LPC系数及模型参数一起进行量化编码。解码步骤为:C输入码流经过解析和反量化获得编码模式,ACELP参数或PCX参数;D依据解码获得的模式进入不同的解码分支;对于PCX的解码,通过模型参数使用和编码端相应模型的合成方法,合成LPC激励信号,该信号通过时域LPC滤波,获取最终低频信号。
Description
技术领域
本发明涉及信号处理中的编、解码技术,特别是一种用于音频处理框架中的编码和解码方法。
背景技术
音频编解码技术主要包括可以很好利用心理声学模型的T/F(时/频)转换的方法,和对音频信号模型参数提取的方法。现有的音频处理框架中,AAC(Advance Audio Coding,高级音频编码)框架利用的是T/F转换的方法,而AMR-WB+(Extended Adaptive Multi-rate wideband Codec,多码率可调宽带扩展编解码)框架则同时利用了这两种方法从而对不同信号进行不同处理。
该AMR-WB+框架包括预处理,TCX/ACELP复合激励编解码,立体声处理,带宽扩展4个部分。其中,该TCX/ACELP复合激励编码方法流程如图1所示:预处理后的低频信号将将继续进行模式选择,该模式选择是对各TCX(Transform coded excitation,变换编码激励)模式和ACELP(Algebraic Code Excited Linear Prediction,线性预测及代数码本激励)模式的选择;然后再对信号进行LPC(linear prediction coding,线性预测编码)分析,然后依据上述模式选择的结果进行TCX80、TCX40、TCX20、ACELP中某一种模式进行编码流程后将编码码流输出。该TCX20、TCX40、TCX80三种模式均依次包括加权滤波、T/F转换、参数量化步骤。再请参阅图2,它是对应于上述编码方法的解码方法。如图所示:该方法依次包括码流解析、TCX和ACELP模式选择、TCX80或TCX40或TCX20或ACELP解码流程后输出低频码流;其中,TCX80、TCX40、TCX20解码流程进一步包括F/T转换和LPC综合等步骤。
在上述AMR-WB+采用的TCX/ACELP复合激励编解码方法中,TCX所采用变换编码激励方法主要适合较高码率的音频编解码,可以在大于24kbps的情况对宽带音频获得较好的输出。而AMR-WB+的比特率范围是6kbps到48kbps,这样在极低码率的情况下,TCX方法对信号频谱直接量化,将会使得较大的量化误差存在于信号的整个频谱范围内,因此使得最终解码输出的主观质量降低。
发明内容
本发明的目的在于提供一种用于音频处理框架中的编码和解码方法,主要解决上述现有技术中所存在的技术问题,它基于信号的产生机理出发,对信号的产生模型进行模拟,使用模型参数来对信号信息进行提取,以此减少所需量化的参数,提高各参数的量化比特数;同时可以依据各模型参数的重要性不同来进行比特分配,进一步保证对信号中重要信息的保留,提高压缩信号的主观质量。
为解决上述问题,本发明是这样实现的:
一种用于音频处理框架中的编码方法,其特征是该方法步骤为:
A经过预处理后的低频段信号首先通过PCX(Parametric Codedexcitation,模型参数编码激励)/ACELP模式选择,然后对信号进行LPC分析;
B依据模式选择的结果,进入ACELP或PCX其中一种模式进行编码;对于PCX模式,首先对输入低频信号进行LPC综合及感知加权处理,获取LPC残差;然后对LPC残差进行模型参数提取,最后将LPC系数及模型参数一起进行量化编码。
所述的用于音频处理框架中的编码方法,其特征是所述步骤B中的模型参数提取步骤为:
B1对信号进行正弦模型参数提取,提取参数包括正弦频率及其对应幅度、相位;
B2结合B1中提取的参数对正弦残差进行编码。
所述的用于音频处理框架中的编码方法,其特征是所述步骤B2进一步包括:
B21对提取的正弦分量进行合成,合成过程中,要充分考虑前后帧的频率分量的连续性,并对前后帧相应幅度,相位做相应插值平滑;LPC残差和正弦合成信号之差包含了信号中的暂态及噪声分量即正弦残差;
B22正弦残差经过暂态信号处理提取暂态分量;
B23暂态提取后的残差,即信号的噪声分量,提取频谱LPC残差频谱对应的BARK BAND能量作为噪声分量参数。
所述的用于音频处理框架中的编码方法,其特征是所述步骤B22进一步包括:
B221将正弦残差经过T/F变换转换到频域;
B222对残差信号频谱进行LPC线性预测分析,从而达到对信号时域包络的提取。
所述的用于音频处理框架中的编码方法,其特征是所述步骤B中在获取LPC残差后,首先对LPC残差进行暂态判定,并采用不同帧长的模型参数编码方法,使用短帧来提高时域分辨率,以减少暂态信号编码时造成的预回声现象;或者对判定出的暂态使用幅度按指数衰减的正弦模型来提取。
所述的用于音频处理框架中的编码方法,其特征是所述步骤B中将LPC残差通过滤波器组将信号分成多频带,以不同的分析长度对信号不同频带进行模型参数编码,实现多分辨率的模型参数编码激励。
一种用于音频处理框架中的解码方法,对应于如上所述的编码方法,其特征是它包括如下步骤:
C输入码流经过解析和反量化获得编码模式,ACELP参数或PCX参数;
D依据解码获得的模式进入不同的解码分支;对于PCX的解码,通过模型参数使用和编码端相应模型的合成方法,合成LPC激励信号,该信号通过时域LPC滤波,获取最终低频信号。
所述的用于音频处理框架中的解码方法,其特征是步骤D中通过模型参数使用和编码端相应模型的合成方法进一步包括:
D1通过模型参数进行残差合成,通过BARK BAND(频带)能量加上随机相位获取重构残差频谱;
D2通过暂态参数和重构的残差信号合成获得除正弦外的信号分量;用残差频谱通过频域LPC滤波器重构暂态频谱,再通过F/T转换获取正弦残差;
D3通过正弦频率、幅度、相位参数进行正弦合成;
D4正弦合成后的正弦分量与重构的正弦残差相加即时域LPC分析的激励信号,该信号通过时域LPC滤波,获取最终低频信号。
所述的用于音频处理框架中的解码方法,其特征是所述步骤D3的合成过程中要考虑到前后帧的正弦连续性,对相应参数进行平滑插值;或者使用编码端传输的前后帧正弦连续性的信息,直接进行合成。
藉由上述技术方案,本发明的有益效果是:
本发明方法减少了所需量化的参数,提高了各参数的量化精度,保证了编码信号的主观质量。实施例中所描述正弦暂态噪声模型为例,所需量化参数包括正弦频率、幅度、相位、频域LPC系数、BARK BAND噪声能量。对512个样值将提取32个正弦频率/幅度/相位,使用8阶频域LPC,20个BARK BAND能量,总计124个参数。而对于TCX编码激励,所需量化参数为512个频谱值,是模型参数编码激励所需量化参数的4倍多。
附图说明
图1是现有AMR-WB+框架编码方法流程示意图;
图2是现有AMR-WB+框架解码方法流程示意图;
图3是本发明方法的AMR-WB+框架编码实施例的流程示意图;
图4是本发明编码实施例中模型参数编码激励编码流程示意图;
图5是本发明方法的AMR-WB+框架解码实施例的流程示意图;
图6是本发明解码实施例中模型参数编码激励解码流程示意图。
具体实施方式
本发明提供了一种用于音频处理框架中的编码和解码方法。以下结合图3-4,通过一基于AMR-WB+框架的编码实施例介绍本发明的编码流程。
如图3,经过预处理后的低频段信号,将首先通过PCX/ACELP模式选择,然后对信号进行LPC分析,然后依据模式选择的结果,进入ACELP或PCX其中一种模式进行编码。对于ACELP编码,将使用AMR-WB+中原有方法;对于PCX编码,首先对输入低频信号进行LPC综合及感知加权处理,获取LPC残差。然后对LPC残差进行模型参数提取,最后将LPC系数及模型参数一起进行量化编码即完成了对低频段信号的编码过程。
再请结合参阅图4,该模型参数提取步骤是:首先对信号进行正弦模型参数提取,提取参数将包括正弦频率及其对应幅度相位。然后对正弦残差进行编码,为了对残差进行编码,需要对提取的正弦分量进行合成,合成过程中,要充分考虑前后帧的频率分量的连续性,并对前后帧相应幅度,相位做相应插值平滑。LPC残差和正弦合成信号之差包含了信号中的暂态及噪声分量--正弦残差。正弦残差经过暂态信号处理提取暂态分量,提取方法可以首先将正弦残差经过T/F变换转换到频域,然后对残差信号频谱进行LPC线性预测分析,从而达到对信号时域包络的提取。经过暂态提取后的残差,即信号的噪声分量即非周期性分量,可以利用人耳听觉对非周期性信号的具体频谱形状及相位不敏感,不能区分非周期性信号在一定频带(BARK BAND)中的能量变化的特性,提取频谱LPC残差频谱对应的BARK BAND能量作为噪声分量参数。这里,首次将频域线性预测方法提取暂态信号的方法应用到了模型参数编码中.
基于以上方法,还可以使用对LPC残差,首先进行暂态判定,采用不同帧长的模型参数编码方法,使用短帧来提高时域分辨率,以减少暂态信号编码时造成的预回声现象。或者使用对判定出的暂态信号采取短时时频变换编码的方法,进行编码。或者使用将LPC残差通过滤波器组将信号依据频率分成多个频带,依据不同频带,使用不同的帧长进行模型参数分析的方法,以提高模型参数分析的准确度。或者对判定出的暂态使用幅度按指数衰减的正弦模型来提取。
再请参阅图5、6,它是对应于上述编码实施例的解码实施例。如图5所示:首先,将输入码流经过解析和反量化获得编码模式,ACELP参数或PCX参数。再依据解码获得的模式进入不同的解码分支;其中,对于ACELP的解码,将使用AMR-WB+相同的方法;对于PCX的解码,通过模型参数使用和编码端相应模型的合成方法,合成LPC激励信号,该信号通过时域LPC滤波,获取最终低频信号。从而实现对应PCX核心编码的解码过程。
对应以上所描述PCX编码示例方法,如图6所示,可以首先通过模型参数进行残差合成,通过BARK BAND能量加上随机相位获取重构残差频谱。然后通过暂态参数和重构的残差信号合成获得除正弦外的信号分量,可以用残差频谱通过频域LPC滤波器重构暂态频谱,再通过F/T转换获取正弦残差。通过正弦频率、幅度、相位参数进行正弦合成,合成过程中要考虑到前后帧的正弦连续性,对相应参数进行平滑插值。或者使用编码端传输的前后帧正弦连续性的信息,直接进行合成。正弦合成后的正弦分量与重构的正弦残差相加即时域LPC分析的激励信号,该信号通过时域LPC滤波,获取最终低频信号。
综上所述仅为本发明的较佳实施例而已,并非用来限定本发明的实施范围。即凡依本发明申请专利范围的内容所作的等效变化与修饰,都应为本发明的技术范畴。
Claims (9)
1.一种用于音频处理框架中的编码方法,其特征是该方法步骤为:
A经过预处理后的低频段信号首先通过PCX/ACELP模式选择,然后对信号进行LPC分析;
B依据模式选择的结果,进入ACELP或PCX其中一种模式进行编码;对于PCX模式,首先对输入低频信号进行LPC综合及感知加权处理,获取LPC残差;然后对LPC残差进行模型参数提取,最后将LPC系数及模型参数一起进行量化编码。
2.根据权利要求1所述的用于音频处理框架中的编码方法,其特征是所述步骤B中的模型参数提取步骤为:
B1对信号进行正弦模型参数提取,提取参数包括正弦频率及其对应幅度、相位;
B2结合B1中提取的参数对正弦残差进行编码。
3.根据权利要求2所述的用于音频处理框架中的编码方法,其特征是所述步骤B2进一步包括:
B21对提取的正弦分量进行合成,合成过程中,要充分考虑前后帧的频率分量的连续性,并对前后帧相应幅度,相位做相应插值平滑;LPC残差和正弦合成信号之差包含了信号中的暂态及噪声分量即正弦残差;
B22正弦残差经过暂态信号处理提取暂态分量;
B23暂态提取后的残差,即信号的噪声分量,提取频谱LPC残差频谱对应的BARK BAND能量作为噪声分量参数。
4.根据权利要求3所述的用于音频处理框架中的编码方法,其特征是所述步骤B22进一步包括:
B221将正弦残差经过T/F变换转换到频域;
B222对残差信号频谱进行LPC线性预测分析,从而达到对信号时域包络的提取。
5.根据权利要求1所述的用于音频处理框架中的编码方法,其特征是所述步骤B中在获取LPC残差后,首先对LPC残差进行暂态判定,并采用不同帧长的模型参数编码方法,使用短帧来提高时域分辨率,以减少暂态信号编码时造成的预回声现象;或者对判定出的暂态使用幅度按指数衰减的正弦模型来提取。
6.根据权利要求5所述的用于音频处理框架中的编码方法,其特征是所述步骤B中将LPC残差通过滤波器组将信号分成多频带,以不同的分析长度对信号不同频带进行模型参数编码,实现多分辨率的模型参数编码激励。
7.一种用于音频处理框架中的解码方法,对应于如权利要求1或2或3或4或5或6所述的编码方法,其特征是它包括如下步骤:
C输入码流经过解析和反量化获得编码模式,ACELP参数或PCX参数;
D依据解码获得的模式进入不同的解码分支;对于PCX的解码,通过模型参数使用和编码端相应模型的合成方法,合成LPC激励信号,该信号通过时域LPC滤波,获取最终低频信号。
8.根据权利要求7所述的用于音频处理框架中的解码方法,其特征是步骤D中通过模型参数使用和编码端相应模型的合成方法进一步包括:
D1通过模型参数进行残差合成,通过BARK BAND能量加上随机相位获取重构残差频谱;
D2通过暂态参数和重构的残差信号合成获得除正弦外的信号分量;用残差频谱通过频域LPC滤波器重构暂态频谱,再通过F/T转换获取正弦残差;
D3通过正弦频率、幅度、相位参数进行正弦合成;
D4正弦合成后的正弦分量与重构的正弦残差相加即时域LPC分析的激励信号,该信号通过时域LPC滤波,获取最终低频信号。
9.根据权利要求8所述的用于音频处理框架中的解码方法,其特征是所述步骤D3的合成过程中要考虑到前后帧的正弦连续性,对相应参数进行平滑插值;或者使用编码端传输的前后帧正弦连续性的信息,直接进行合成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2006101193011A CN101197577A (zh) | 2006-12-07 | 2006-12-07 | 一种用于音频处理框架中的编码和解码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2006101193011A CN101197577A (zh) | 2006-12-07 | 2006-12-07 | 一种用于音频处理框架中的编码和解码方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101197577A true CN101197577A (zh) | 2008-06-11 |
Family
ID=39547764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006101193011A Pending CN101197577A (zh) | 2006-12-07 | 2006-12-07 | 一种用于音频处理框架中的编码和解码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101197577A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010022661A1 (zh) * | 2008-08-28 | 2010-03-04 | 华为技术有限公司 | 音频编码、解码方法及装置、系统 |
WO2010075792A1 (zh) * | 2008-12-31 | 2010-07-08 | 华为技术有限公司 | 信号编码、解码方法及装置、系统 |
CN101436406B (zh) * | 2008-12-22 | 2011-08-24 | 西安电子科技大学 | 音频编解码器 |
CN102098057B (zh) * | 2009-12-11 | 2015-03-18 | 华为技术有限公司 | 一种量化编解码方法和装置 |
CN105355209A (zh) * | 2010-07-02 | 2016-02-24 | 杜比国际公司 | 音高增强后置滤波器 |
CN107517593A (zh) * | 2015-02-26 | 2017-12-26 | 弗劳恩霍夫应用研究促进协会 | 用于使用目标时域包络来处理音频信号以获得经处理的音频信号的装置和方法 |
CN108550369A (zh) * | 2018-04-14 | 2018-09-18 | 全景声科技南京有限公司 | 一种可变长度的全景声信号编解码方法 |
CN111312265A (zh) * | 2014-01-15 | 2020-06-19 | 三星电子株式会社 | 对线性预测编码系数进行量化的加权函数确定装置和方法 |
WO2023051370A1 (zh) * | 2021-09-29 | 2023-04-06 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序 |
-
2006
- 2006-12-07 CN CNA2006101193011A patent/CN101197577A/zh active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010022661A1 (zh) * | 2008-08-28 | 2010-03-04 | 华为技术有限公司 | 音频编码、解码方法及装置、系统 |
CN101436406B (zh) * | 2008-12-22 | 2011-08-24 | 西安电子科技大学 | 音频编解码器 |
WO2010075792A1 (zh) * | 2008-12-31 | 2010-07-08 | 华为技术有限公司 | 信号编码、解码方法及装置、系统 |
US8515744B2 (en) | 2008-12-31 | 2013-08-20 | Huawei Technologies Co., Ltd. | Method for encoding signal, and method for decoding signal |
US8712763B2 (en) | 2008-12-31 | 2014-04-29 | Huawei Technologies Co., Ltd | Method for encoding signal, and method for decoding signal |
CN102098057B (zh) * | 2009-12-11 | 2015-03-18 | 华为技术有限公司 | 一种量化编解码方法和装置 |
CN105355209A (zh) * | 2010-07-02 | 2016-02-24 | 杜比国际公司 | 音高增强后置滤波器 |
CN111312265A (zh) * | 2014-01-15 | 2020-06-19 | 三星电子株式会社 | 对线性预测编码系数进行量化的加权函数确定装置和方法 |
CN111312265B (zh) * | 2014-01-15 | 2023-04-28 | 三星电子株式会社 | 对线性预测编码系数进行量化的加权函数确定装置和方法 |
CN107517593A (zh) * | 2015-02-26 | 2017-12-26 | 弗劳恩霍夫应用研究促进协会 | 用于使用目标时域包络来处理音频信号以获得经处理的音频信号的装置和方法 |
CN107517593B (zh) * | 2015-02-26 | 2021-03-12 | 弗劳恩霍夫应用研究促进协会 | 用于使用目标时域包络来处理音频信号以获得经处理的音频信号的装置和方法 |
CN108550369A (zh) * | 2018-04-14 | 2018-09-18 | 全景声科技南京有限公司 | 一种可变长度的全景声信号编解码方法 |
CN108550369B (zh) * | 2018-04-14 | 2020-08-11 | 全景声科技南京有限公司 | 一种可变长度的全景声信号编解码方法 |
WO2023051370A1 (zh) * | 2021-09-29 | 2023-04-06 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180068667A1 (en) | Apparatus for encoding and decoding of integrated speech and audio | |
AU2018217299B2 (en) | Improving classification between time-domain coding and frequency domain coding | |
CN101197577A (zh) | 一种用于音频处理框架中的编码和解码方法 | |
JP6214160B2 (ja) | マルチモードオーディオコーデックおよびそれに適応されるcelp符号化 | |
CN105679327B (zh) | 用于对音频信号进行编码和解码的方法及设备 | |
CN101622661B (zh) | 一种数字语音信号的改进编解码方法 | |
CN101521014B (zh) | 音频带宽扩展编解码装置 | |
CN101583994B (zh) | 对音频和/或语音信号进行编码和/或解码的方法和设备 | |
CN105706166B (zh) | 对比特流进行解码的音频解码器设备和方法 | |
EP2772909B1 (en) | Method for encoding voice signal | |
JP6980871B2 (ja) | 信号符号化方法及びその装置、並びに信号復号方法及びその装置 | |
KR102105305B1 (ko) | 계층형 정현파 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치 | |
CN103000178A (zh) | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 | |
CN101281749A (zh) | 可分级的语音和乐音联合编码装置和解码装置 | |
CN101405792B (zh) | 用于在音频解码器中对信号进行后处理的方法 | |
US9390722B2 (en) | Method and device for quantizing voice signals in a band-selective manner | |
CN103137135B (zh) | Lpc系数量化方法和装置及多编码核音频编码方法和设备 | |
Jia et al. | A novel super-wideband embedded speech and audio codec based on ITU-T Recommendation G. 729.1 | |
Jeong et al. | Bandwidth Scalable Wideband Codec Using Hybrid Matching Pursuit Harmonic/CELP Scheme |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20080611 |
|
C20 | Patent right or utility model deemed to be abandoned or is abandoned |