CN102262881A - 基于avs有损音频的无损编解码扩展方法 - Google Patents
基于avs有损音频的无损编解码扩展方法 Download PDFInfo
- Publication number
- CN102262881A CN102262881A CN2010101895985A CN201010189598A CN102262881A CN 102262881 A CN102262881 A CN 102262881A CN 2010101895985 A CN2010101895985 A CN 2010101895985A CN 201010189598 A CN201010189598 A CN 201010189598A CN 102262881 A CN102262881 A CN 102262881A
- Authority
- CN
- China
- Prior art keywords
- coding
- data
- avs
- audio
- lossless
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及基于AVS有损音频的无损编解码扩展方法。一种基于AVS有损音频的无损编码扩展方法,该方法基于AVS音频标准进行分析,对AVS音频标准中的保留字进行重定义,扩展无损功能选项,并且通过复用AVS音频有损数据区域之后的填充区域,将无损音频数据存放于填充区域来实现有损无损信号的并存。因该方法改进技术具有简单,高效的特点,很容易被应用到数字音频领域,提供无损音频解码方案。
Description
技术领域
本发明涉及音频编解码技术,尤其涉及基于AV S有损音频的无损编解码扩展方法。
背景技术
中国数字音视频标准已经在各个领域内逐步展开应用,其中AVS标准的第三部分音频标准也在一些领域被采用,例如,中国自主的CBHD标准指定采用AVS音频为其音频格式之一。但现有的AVS音频为了实现更高的压缩效果,采用感知编码技术,属于有损音频编解码。在获得较高压缩效果的同时,将牺牲一定的音频质量。近年来,随着信息技术的发展及用户对高质量音频的需求,对无损音频的需求越来越强烈。因此在AVS原有损标准的基础上,扩展对无损音频的支持,并且还能实现对原有损音频的后向兼容的应用需求将越来越多。
发明内容
针对此类需求,本发明的重点在于提出一种保证向AVS音频标准后向兼容的基于AVS有损音频的无损编解码扩展方法方法,并且基于此方法提出实现AVS音频无损扩展技术的两种技术方案,基于本发明提供的技术方案可以在实现后向兼容AVS音频标准的同时获得优化的压缩效果和系统复杂度。
有鉴于此,本发明的主要目的是基于AVS音频标准,提出扩展无损音频的技术方案,提供一种灵活简便的扩展方法,可 以在现有AVS有损技术基础上扩展无损音频的支持,最终实现一套兼容AVS音频标准的完整的无损音频编解码系统。并且利用本发明同样可以将多种成熟的无损编解码方案在AVS有损技术基础上进行扩展。
具体地,本发明可以采用如下技术方案。
一种基于AVS有损音频的无损编码扩展方法,该方法基于AVS音频标准进行分析,对AVS音频标准中的保留字进行重定义,扩展无损功能选项,并且通过复用AVS音频有损数据区域之后的填充区域,将无损音频数据存放于填充区域来实现有损无损信号的并存。
优选地,该方法实现一种独立的无损音频编码,有损编码与无损编码独立,两部分音频成分共存在编码的码流中,通过标志位来标识编码数据类型。
优选地,该方法利用残差编码实现无损编码扩展,将原始音频数据与通过有损编码之后再解码出来的有损解码数据相减以获取残差信号,对残差信号进行熵编码,然后在编码数据中保存压缩的残差信号。
优选地,所述方法组合了有损编码方法、独立的无损编码方法和残差编码方法;有损编码与独立的无损编码独立,两部分音频成分共存在编码的码流中,通过标志位来标识编码数据类型;在残差编码时,将原始音频数据与通过有损编码之后再解码出来的有损解码数据相减以获取残差信号,对残差信号进行熵编码,然后在编码数据中保存压缩的残差信号。
优选地,首先对输入音频进行分帧处理;接着,进行声道间去相关;然后,如果经声道间去相关后某个通道一帧的所有样本均为固定值,则进行游程编码,最后输出编码后的比特流; 否则,则先进行线性预测,然后进行Golomb-Rice编码,最后输出编码后的比特流。
优选地,在AVS音频的RAW格式中,帧结构包括声道数、FS索引和帧数据,其中的帧数据包括有损数据、无损数据和填充比特,该无损数位于现有AVS标准的填充比特内。
优选地,AVS音频存储和/或传输格式中的Coding_profile字段包括表示纯有损编码框架的标识、表示纯无损编码框架的标识和表示有损、无损并存编码框架的标识。
优选地,对声道间去相关后的每个通道的样本独立进行线性预测,生成样本残差。
一种基于AVS有损音频的无损解码扩展方法,其特征在于,该方法用于对权利要求1至8中任一项所述的方法编码的音频数据进行解码,
其中,通过标志位来标识编码数据类型;和/或
在解码时,对有损信号和残差信号进行组装,以恢复出压缩前的原始信号。
一种基于AVS有损音频的无损编解码扩展方法,该方法基于AVS音频标准进行分析,对AVS音频标准中的保留字进行重定义,扩展无损功能选项,并且通过复用AVS音频有损数据区域之后的填充区域,将无损音频数据存放于填充区域来实现有损无损信号的并存;在解码时,通过码流拆分器对输入的编码码流进行识别、拆分,然后由有损解码器或无损解码器进行相应的有损或无损解码。
附图说明
图1是根据本发明的一个方案的独立编码框架的示意图。
图2是根据本发明的另一方案的残差编码框架的示意图。
图3是根据本发明的还一方案的组合编码框架的示意图。
图4是根据本发明的一个方案的独立方案解码框架的示意图。
图5是根据本发明的另一方案的残差方案解码框架的示意图。
图6是根据本发明的还一方案的组合方案解码框架的示意图。
图7示出本发明的编码方法概要的框图。
图8示出本发明的解码方法概要的框图。
图9是2.1声道去相关的示意图。
图10是3.1声道去相关的示意图。
图11是5.1声道去相关的示意图。
图12是7.1声道去相关的示意图。
图13是采样率Fs<=48kHz下的音频样本分区示意图。
图14是采样率Fs>48kHz下的音频样本分区示意图。
图15是Golomb-Rice码字结构示意图。
图16是修改前AVS音频RAW格式下的帧格式示意图。
图17是修改后AVS音频RAW格式下的帧格式示意图。
图18是修改前AVS音频存储格式下的帧格式示意图。
图19是修改后AVS音频存储格式下的帧格式示意图。
图20是修改前AVS音频传输格式下的帧格式示意图。
图21是修改后AVS音频传输格式下的帧格式示意图。
具体实施方式
下面结合附图,对本发明的具体实施方式作进一步的详细说明。对于所属技术领域的技术人员而言,从对本发明的详细说明中,本发明的上述和其他目的、特征和优点将显而易见。
一、概述
本发明由以下部分构成:
1)AVS音频后向兼容无损扩展:基于AVS音频标准进行分析,针对已经固定的码流结构的编解码器语法,本发明的基于AVS有损音频的无损编解码扩展方法充分利用AVS音频标准中的保留字,对其中保留字进行重定义,扩展无损功能选项,并且通过复用AVS音频有损数据区域之后的填充区域,将无损音频数据存放于填充区域来实现有损无损信号的并存。
后向兼容上的关键技术点:
(1)对AVS有损音频技术标准中的保留字部分进行扩展 定义,例如CodingProfile中扩展有损无损并存模式,纯无损模式;根据需要对于残差无损扩展或独立无损扩展仍可以追加编码模式定义。
(2)针对AVS有损音频技术标准中定义的Raw格式,AASF格式,AATF格式,经过扩展后的无损数据与有损数据并存于相同码流或文件中。
(3)为了保证附加在有损填充区域的无损数据能够在解码时被正确识别,在基于独立无损扩展方法中,无损数据区以同步字(SyncWord)和无损附加信息起始,利用同步字实现对无损数据的定位或随机访问功能;在基于残差无损扩展方法中,可以复用有损同步字结合无损数据区长度的办法来定位无损数据,或使用与独立扩展方法相同的处理,在无损数据区以同步字(SyncWord)和无损附加信息起始,这样便于残差无损扩展方法进行数据定位和随机访问。
(4)无损数据帧长度,为了保证与有损部分兼容,本方法指定无损部分数据帧长度与有损部分数据帧一样,一帧原始样本数大小为1024个。
(5)利用本方法,可以将包括本发明给出的独立无损编码方案在内的符合如上码流布置的无损编解码器内嵌到AVS有损编解码器中来执行基于AVS音频技术对其他无损技术的支持。例如将流行的开源FLAC无损编解码器扩展到AVS编解码器中。
2)AVS音频后向兼容的无损音频编解码方案
通过对AVS-P3音频标准的分析,基于有损音频压缩原理,在原有有损编码方案基础上扩展无损音频支持有两种方法,下面,给出本发明实现AVS音频无损扩展的两种框架。
上两种方法可以根据需要自由选择或组合使用,以便实现 最佳的压缩效率和适应灵活的使用需求。
方案一
方案一是实现一种独立的无损音频编码器,有损编解码与无损编解码独立,两部分音频成分可以共存在编码的码流中,通过标志位来标识编码数据类型;在解码时根据码流中编码数据的类型来选择使用有损解码还是无损解码。
方案二
方案二是利用对残差编码实现无损编码扩展,即将原始音频数据与通过有损编码之后再解码出来的有损数据相减以获取残差信号,对残差信号进行熵编码,然后在编码数据中保存压缩的残差信号,当解码时,对有损信号和残差信号进行组装,以便恢复出压缩前的原始信号。
二、后向兼容的两种有损无损混合编码框架及其组合编码框架
1.独立编码框架
图1是根据本发明的一个方案的独立编码框架的示意图。下面参照图1说明根据本发明的一个方案的独立编码框架的结构和独立编码方法。
参照图1,输入的原始音频101首先流入模式选择器102,该模式选择器102用于选择有损编码和/或无损编码。也就是,两个开关S1和S2可以是一个打开一个闭合,从而最终生成有损编码码流或者无损编码码流;或者,两个开关S1和S2也可以是同时闭合,以同时生成有损编码和无损编码,有损编码和无损编码共存于编码码流111中。其中,通过标志位来标识编码数据类型。
当选择有损编码模式时,开关S1闭合而开关S2打开,原 始音频101经由闭合的开关S1流入AVS有损编码器104。AVS有损编码器104对原始音频进行有损编码,从而生成有损编码数据106。生成的有损编码数据106流入码流合成器110,然后码流合成器110对有损编码数据106进行合成而生成(有损)编码码流111。
当选择无损编码模式时,开关S2闭合而开关S1打开,原始音频101经由闭合的开关S2首先流入缓冲区105。原始音频101在缓冲区105中缓冲一定量,经缓冲的原始音频数据流入AVS无损编码器107。AVS无损编码器107对原始音频进行无损编码,从而生成无损编码数据109。生成的无损编码数据109流入码流合成器110,然后码流合成器110对无损编码数据109进行合成而生成(无损)编码码流111。
当然,还可以选择有损编码和无损编码共存的编码模式,此时开关S1和开关S2同时闭合。有损编码数据106和无损编码数据109都流入码流合成器110,在码流合成器110中,通过标志位来标识编码数据类型(有损编码或无损编码),从而生成有损编码和无损编码共存的编码码流111。这样,在解码时,既可以进行无损解码,以提供高品质的音频,也可以进行有损解码,从而实现对AVS有损音频编解码的后向兼容。
2.残差编码框架
图2是根据本发明的另一方案的残差编码框架的示意图。下面参照图2说明根据本发明的另一方案的残差编码框架的结构和残差编码方法。
参照图2,输入的原始音频201首先经过两个开关S1和S2,经由该两个开关可以决定进行的是有损编码还是有损编码及残差编码(无损编码)。
当选择有损编码模式时,开关S1闭合而开关S2打开(后述的开关S3也打开),原始音频201经由闭合的开关S1流入AVS有损编码器204。AVS有损编码器204对原始音频进行有损编码,从而生成有损编码数据206。生成的有损编码数据206流入码流合成器210,然后码流合成器210对有损编码数据206进行合成而生成(有损)编码码流211。
当选择残差编码(无损编码)模式时,开关S1和开关S2都闭合(后述的开关S3也闭合)。
一方面,原始音频201经由闭合的开关S1流入AVS有损编码器204。AVS有损编码器204对原始音频进行有损编码,从而生成有损编码数据206。生成的有损编码数据206流入码流合成器210,然后码流合成器210对有损编码数据206进行合成而生成(有损)编码码流211。
同时,经有损编码的有损编码数据206还经由闭合的开关S3流入AVS有损定点解码器203。AVS有损定点解码器203对有损编码数据206进行解码,解码出有损音频数据。
另一方面,原始音频201还经由闭合的开关S2首先流入缓冲区205。原始音频201在缓冲区205中缓冲一定量,经缓冲的原始音频数据与AVS有损定点解码器203解码出的相对应的有损音频数据相减,从而得到残差音频数据。得到的残差音频数据流入AVS无损编码器207。AVS无损编码器207对残差音频数据进行无损编码,生成的无损编码数据流入码流合成器210,然后码流合成器210对无损编码数据进行合成而生成(无损)编码码流211。
在这种情况下,编码码流211中同时存在有损编码数据和残差编码数据。
3.组合编码框架
图3是根据本发明的还一方案的组合编码框架的示意图。参照图3可见,其中组合了有损编码、独立的无损编码和残差编码。
参照图3,原始音频301可以流经模式选择器302、开关S1、AVS有损编码器304(生成有损编码数据306)、码流合成器310,而生成(有损)编码码流311。
另外,原始音频301还可以流经模式选择器302、开关S2、无损编码器307(生成无损编码数据309)、码流合成器310,而生成(无损)编码码流311。
另外,在对原始音频301进行有损编码的同时,还可以生成残差编码数据。具体地,有损编码数据306经由开关S3流入AVS有损定点解码器303,AVS有损定点解码器303对有损编码数据306进行解码,原始音频数据与解码出的有损编码数据相减,从而得到残差音频数据,由无损编码器307对残差音频数据进行无损编码,从而生成无损编码数据309。
其中,无损编码器307包括独立无损预处理模块307A和无损编码核心模块307B两个模块。当进行独立的无损编码时,原始音频301首先经独立无损预处理模块307A预处理,然后由无损编码核心模块307B进行无损编码。当进行残差编码时,由无损编码核心模块307B对残差音频数据进行残差编码。
三、解码器框架
图4是根据本发明的一个方案的独立方案解码框架的示意图。图5是根据本发明的另一方案的残差方案解码框架的示意图。图6是根据本发明的还一方案的组合方案解码框架的示意 图。
由于解码是编码的逆过程,在上面详细描述本发明的编码方案的情况下,本领域的技术人员当可以参照图4至图6而明了本发明的解码方案,故下面仅作简单描述。
图4所示的独立方案解码框架对应于有损数据和无损数据独立存在的编码方案。
其中,有损解码的码流如下:
编码码流401→码流拆分器402→有损编码数据404→AVS有损解码器406→有损解码数据408→输出控制器409→解码数据输出410。
无损解码的码流如下:
编码码流401→码流拆分器402→无损编码数据403→无损解码器405→无损解码数据407→输出控制器409→解码数据输出410。
也就是,由码流拆分器402识别编码码流401的码流为有损编码、无损编码、以及有损编码和无损编码共存。在有损编码和无损编码共存的情况下,码流拆分器402对有损编码和无损编码进行拆分,从而进行相应的有损或无损解码。
图5所示的残差方案解码框架对应于有损数据和残差数据的无损编码方案。
其中,有损解码的码流如下:
编码码流501→码流拆分器502→有损编码数据504→AVS有损解码器506→有损解码数据508→输出控制器509→解码数据输出510。其与图4中的有损解码码流基本相同。
下面对残差解码的码流说明如下。
在编码码流501中同时存在有损编码数据和无损(残差)编码数据503的情况下,码流拆分器502对有损编码数据和无 损编码数据进行拆分。有损编码数据504流入AVS有损定点解码器513进行解码,解码出有损解码数据;同时,由无损解码器505对无损编码数据503进行解码,解码出无损解码数据。然后对解码出的有损编码数据和无损编码数据进行残差(相加),而得到完整的无损解码数据507。
图6是根据本发明的还一方案的组合方案解码框架的示意图。
其中,有损解码的码流如下:
编码码流601→码流拆分器602→有损编码数据604→AV S有损解码器606→有损解码数据608→输出控制器609→解码数据输出610。
独立的无损解码的码流如下:
编码码流601→码流拆分器602→无损编码数据603→无损解码器605→无损解码数据607B→输出控制器609→解码数据输出610。
也就是,由码流拆分器602识别编码码流601的码流为有损编码、独立的无损编码、有损编码和独立的无损编码共存、还是有损编码与残差无损编码共存。在有损编码和独立的无损编码共存的情况下,码流拆分器402对有损编码和无损编码进行拆分,从而进行相应的有损或无损解码。
有损编码与残差无损编码共存的情况下,进行残差解码,下面对残差解码的码流说明如下。
在编码码流601中同时存在有损编码数据604和无损(残差)编码数据603的情况下,码流拆分器602对有损编码数据和无损编码数据进行拆分。有损编码数据604流入AVS有损定点解码器613进行解码,解码出有损解码数据;同时,由无损解码器605对无损编码数据603进行解码,解码出无损(残差) 解码数据。然后对解码出的有损编码数据和无损编码数据进行残差(相加),而得到完整的无损解码数据607A。
四、无损音频编码方案
本方案利用音频信号的特性,通过声道间去相关和线性预测等手段消除声道间及声道内信号的相关性,并对得到的残差信号进行Golomb-Rice编码,最终达到对音频信号进行压缩的目的。实验结果表明该方案对音频信号进行无损压缩是非常有效的。
另外,本方案支持多声道(2声道以上)音频无损压缩,并且为保持后向兼容,解码端可以选择只解码多声道中的左右声道的编码数据。
图7示出本发明的编码方法概要的框图。
图8示出本发明的解码方法概要的框图。
参照图7,对本发明的编码方法可以简述如下。首先对音频x(n)进行分帧处理,接着,进行声道间去相关。然后,如果经声道间去相关后某个通道一帧的所有样本均为一固定值,则进行游程编码,最后输出编码后的比特流(bit stream);否则,则先进行线性预测,然后进行Golomb-Rice编码,最后输出编码后的比特流。
参照图8,对本发明的解码方法简述如下。首先,解压输入的编码比特流的帧头,然后,判定是存在固定值标记(Const flag)。如果判定结果为是,则进行游程解码,然后进行声道间去相关的反转,即恢复声道间的相关,最后输出得到的比特流;如果判定结果为否,则进行Golomb-Rice解码,然后进行线性预测的反转,然后进行声道间去相关的反转,即恢复声道间的相关,最后输出得到的比特流。
注意,因为解码过程为编码过程的逆过称,下面将详细说明本发明的编码方案,而省略对解码方案的具体说明。
编码方案详述
下面将参照图3对本发明的编码方法进行详细说明。
分帧
AVS P3现有的有损音频编码方案中,每帧包含1024个音频样本。为保持后向兼容,无损音频编码扩展的帧长度与有损部分保持一致,即:每帧包含1024个音频样本。
声道间去相关(Inter channel decorrelation)
1.对单声道(Mono)输入,不做声道间去相关
2.对立体声(Stereo)输入,声道间去相关方法如下:
Mid=(L+R)/2
Side=(L-R)
即把左右声道输入转换为Mid和Side通道并传送至下一级编码单元,然后对Mid和Side通道进行独立编码。图5示意性地示出了该立体声输入时的声道间去相关的方法。
3.对多声道(Multi channel)输入,声道间去相关方法如下:
■如果L和R声道同时存在,则L和R声道转换为Mid和Side通道。
■如果L,R和C声道同时存在,则L,R和C声道转换为Mid,Side和CDif通道。
其中:CDif=C-Mid
■如果Ls和Rs同时存在,则Ls和Rs声道转换为SMid和SSide通道。
其中:
SMid=(Ls+Rs)/2
SSide=Ls-Rs
■如果Lb和Rb同时存在,则Lb和Rb声道转换为BMid和BSide通道。
其中:
BMid=(Lb+Rb)/2
BSide=Lb-Rb
■如果LFE声道存在,LFE声道不做任何处理
■如果C声道存在并且L和R声道不存在,C声道不做任何处理。
几种典型声道模式的声道间去相关示意图如图9~12所示。
4.针对具体的某一帧样本,通过决策机制来决定是否对相应的声道对做声道间去相关。
线性预测(LPC)
对声道间去相关后的每个通道的样本独立进行LPC,生成样本残差。本编码方案中采用三类线性预测方法,分别如下:
1.固定系数线性预测(Fixed LPC)
本方案采用1-6阶固定系数线性预测,预测公式如下表所示。
表1
n-6 | n-5 | n-4 | n-3 | n-2 | n-1 | 预测值 | |
0阶 | x’[n]=0 | ||||||
1阶 | 1 | x’[n]=x[n-1] | |||||
2阶 | -1 | 2 | x’[n]=2*x[n-1]-x[n-2] | ||||
3阶 | 1 | -3 | 3 | x’[n]=3*x[n-1]-3*x[n-2]+x[n-3] | |||
4阶 | -1 | 4 | -6 | 4 | x’[n]= 4*x[n-1]-6*x[n-2]+4*x[n-3]-x[n-4] | ||
5阶 | 1 | -5 | 10 | -10 | 5 | x’[n]=5*x[n-1]-10*x[n-2]+10*x[n-3] -5*x[n-4]+x[n-5] | |
6阶 | -1 | 6 | -15 | 20 | -15 | 6 | x’[n]=6*x[n-1]-15*x[n-2]+20*x[n-3] -15*x[n-4]+6*x[n-5]-x[n-6] |
注:x’[n]为x[n]的预测值
2.自适应线性预测(Adaptive LPC)
最优线性预测器系数的求解过程如下:
1)对1024样本序列进行加窗处理(窗函数选择Hanning 窗)。
2)计算1024样本序列的自相关序列。
3)对1~16阶预测器,分别进行下面步骤4)的操作。
4)利用LeVinson-Durbin迭代算法解下列方程式,求解最优线性预测系数c。
Rc=-r
其中:
5)根据步骤4解出的1~16阶的最优线性预测系数,对1~16阶预测器分别计算预测误差,根据预测误差决定最优的预测阶数。
6)对最优线性预测系数(由步骤5决定的那个阶数的预测器)进行量化。
注:
(1)最优是指基于最小均方预测误差准则的最优
(1)本编码方案限定最大预测器阶数为16阶
3.固定-自适应双重线性预测(Fixed-Adaptive LPC)
首先对样本进行固定系数的线性预测,得到一级残差,然后对一级残差再进行自适应线性预测,得到二级残差,然后把二级残差送往熵编码单元。
Golomb-Rice编码(Golomb-Rice Coding)
对每个通道线性预测生成的样本残差分别进行
Golomb-Rice编码,具体如下:
1.如果输入音频源的采样率Fs<=48kHz
1024个音频样本残差均分为32个分区,每个分区包含1024/32=32个样本残差(第一个分区为32-lpc_order 个),对每个分区的样本残差独立进行Golomb-Rice编码,如图13所示。
注:1pc_order为LPC预测阶数
2.如果输入音频源的采样率Fs>48kHz
把每帧1024个音频样本残差均分为16个分区,每个分区包含1024/16=64个样本残差(第一个分区为64-lpc_order个),对每个分区的样本残差独立进行Golomb-Rice编码,如图14所示。
3.Golomb-Rice码字结构
本编码方案中采用的Golomb-Rice编码码字结构如图15所示:
[0166]其中:
Sign:1bit。Data为负则等于1,非负等于0。
Lead_zero:(|Data|>>M)bit。恒为0。
Delimiter:1bit。恒为1。
Remainder:M bit。值为(|Data|&((1<<M)-1))。
(注:Data为待编码的数据;|Data|为Data的绝对值;M是Golomb-Rice编码参数,由分区内所有样本残差的分布决定。)
在实现中,对于解码处理器性能允许的条件下,为了提高压缩效率,也可以采用动态计算M值进行Golomb-Rice编码,即:对根据输入的样本数据设计M初始值,在编码过程中根据后续输入的样本数值更新M值,这样可以提高压缩效率,节省掉Golomb-Rice编码码字的存储空间,但需要在解码过程中增加一些运算量。
游程编码(Run-Level Coding)
如果经声道间去相关后某个通道一帧的1024个样本为一固定值,则对该通道采用游程编码,把该固定值直接打包入码流。
五、关于AVS音频
1)对于AVS音频RAW格式
修改前的frame(分帧)结构如图16所示。
修改后的frame结构如图17所示。
为了使AVS音频能够支持无损功能,在兼容原比特流格式基础上,在有损数据后增加无损数据,并通过调整帧长度和填 充比特部分的大小使比特流符合原AVS音频格式要求。
2)对于AVS音频存储格式
修改前的frame结构如图18所示。
修改后的frame结构如图19所示。
为了使AVS音频能够支持无损功能,在兼容原比特流格式基础上,在有损数据后增加无损数据,并通过调整帧长度和填充比特部分的大小使比特流符合原AVS音频格式要求。
3)AVS音频传输格式:
修改前的frame结构如图20所示。
修改后的frame结构如图21所示。
为了使AVS音频能够支持无损功能,在兼容原比特流格式基础上,在有损数据后增加无损数据,并通过调整帧长度和填充比特部分的大小使比特流符合原AVS音频格式要求。
注:在CBR下才存在填充比特,VBR下不存在填充比特。在纯有损编码框架下不存在无损数据;在纯无损编码框架下,不存在有损数据;而在有损、无损并存编码框架下同时存在有损和无损数据。在新解码器中,解码无损数据时,采用的是寻找同步字的方法。
六、有益效果
1)因本发明在考虑AVS音频兼容的前提下实现的无损音频编解码系统,对于使用AVS音频技术的厂商只需进行简单修改就可以在产品中扩展无损音频的支持,含有无损音频支持的产品将可以大大提高音频质量。
2)因本发明在考虑AVS音频兼容的前提下实现无损音频编码,对终端产品用户,尤其是已经购买支持AVS音频产品的用户这种技术改进是透明的,新的AVS音频码流在老的碟机上可以被继续使用。
3)因改进技术具有简单,高效的特点,很容易被应用到数字音频领域,提供无损音频解码方案。
虽然,本发明已通过以上实施例及其附图而清楚说明,然而在不背离本发明精神及其实质的情况下,所属技术领域的技术人员当可根据本发明作出各种相应的变化和修正,但这些相应的变化和修正都应属于本发明的权利要求的保护范围。
Claims (10)
1.一种基于AVS有损音频的无损编码扩展方法,该方法基于AVS音频标准进行分析,对AVS音频标准中的保留字进行重定义,扩展无损功能选项,并且通过复用AVS音频有损数据区域之后的填充区域,将无损音频数据存放于填充区域来实现有损无损信号的并存。
2.根据权利要求1所述的方法,其特征在于,
该方法实现一种独立的无损音频编码,有损编码与无损编码独立,两部分音频成分共存在编码的码流中,通过标志位来标识编码数据类型。
3.根据权利要求1所述的方法,其特征在于,
该方法利用残差编码实现无损编码扩展,将原始音频数据与通过有损编码之后再解码出来的有损解码数据相减以获取残差信号,对残差信号进行熵编码,然后在编码数据中保存压缩的残差信号。
4.根据权利要求1所述的方法,其特征在于,所述方法组合了有损编码方法、独立的无损编码方法和残差编码方法;
有损编码与独立的无损编码独立,两部分音频成分共存在编码的码流中,通过标志位来标识编码数据类型;
在残差编码时,将原始音频数据与通过有损编码之后再解码出来的有损解码数据相减以获取残差信号,对残差信号进行熵编码,然后在编码数据中保存压缩的残差信号。
5.根据权利要求1至4中任一项所述的方法,其特征在于,
首先对输入音频进行分帧处理;
接着,进行声道间去相关;
然后,如果经声道间去相关后某个通道一帧的所有样本均为固定值,则进行游程编码,最后输出编码后的比特流;否则,则先进行线性预测,然后进行Golomb-Rice编码,最后输出编码后的比特流。
6.根据权利要求5所述的方法,其特征在于,
在AVS音频的RAW格式中,帧结构包括声道数、FS索引和帧数据,其中的帧数据包括有损数据、无损数据和填充比特,该无损数位于现有AVS标准的填充比特内。
7.根据权利要求5所述的方法,其特征在于,
AVS音频存储和/或传输格式中的Coding_profile字段包括表示纯有损编码框架的标识、表示纯无损编码框架的标识和表示有损、无损并存编码框架的标识。
8.根据权利要求5所述的方法,其特征在于,
对声道间去相关后的每个通道的样本独立进行线性预测,生成样本残差。
9.一种基于AVS有损音频的无损解码扩展方法,其特征在于,该方法用于对权利要求1至8中任一项所述的方法编码的音频数据进行解码,
其中,通过标志位来标识编码数据类型;和/或
在解码时,对有损信号和残差信号进行组装,以恢复出压缩前的原始信号。
10.一种基于AVS有损音频的无损编解码扩展方法,该方法基于AVS音频标准进行分析,对AVS音频标准中的保留字进行重定义,扩展无损功能选项,并且通过复用AVS音频有损数据区域之后的填充区域,将无损音频数据存放于填充区域来实现有损无损信号的并存;
在解码时,通过码流拆分器对输入的编码码流进行识别、拆分,然后由有损解码器或无损解码器进行相应的有损或无损解码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101895985A CN102262881A (zh) | 2010-05-24 | 2010-05-24 | 基于avs有损音频的无损编解码扩展方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101895985A CN102262881A (zh) | 2010-05-24 | 2010-05-24 | 基于avs有损音频的无损编解码扩展方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102262881A true CN102262881A (zh) | 2011-11-30 |
Family
ID=45009488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010101895985A Pending CN102262881A (zh) | 2010-05-24 | 2010-05-24 | 基于avs有损音频的无损编解码扩展方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102262881A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104217726A (zh) * | 2014-09-01 | 2014-12-17 | 东莞中山大学研究院 | 一种无损音频压缩编码方法及其解码方法 |
CN105915228A (zh) * | 2016-04-08 | 2016-08-31 | 苏州大学 | 自适应的混合的数据无损压缩方法 |
CN105915227A (zh) * | 2016-04-08 | 2016-08-31 | 苏州大学 | 自适应的混合的数据无损压缩系统 |
CN107896136A (zh) * | 2017-10-27 | 2018-04-10 | 中国电子科技集团公司第二十八研究所 | 一种雷达航迹报文编码方法 |
CN107911196A (zh) * | 2017-10-27 | 2018-04-13 | 中国电子科技集团公司第二十八研究所 | 一种雷达航迹报文传输方法 |
CN109218849A (zh) * | 2018-10-30 | 2019-01-15 | 广州虎牙科技有限公司 | 一种直播数据的处理方法、装置、设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6807528B1 (en) * | 2001-05-08 | 2004-10-19 | Dolby Laboratories Licensing Corporation | Adding data to a compressed data frame |
JP2007142547A (ja) * | 2005-11-15 | 2007-06-07 | Oki Electric Ind Co Ltd | 符号化方法及び復号化方法とその符号器及び復号器 |
CN101090273A (zh) * | 2006-06-13 | 2007-12-19 | 北京凯诚高清电子技术有限公司 | 独立16通道音频编解码算法 |
CN101635146A (zh) * | 2009-06-05 | 2010-01-27 | 中山大学 | 一种在avs音频流中嵌入稳健水印的方法 |
-
2010
- 2010-05-24 CN CN2010101895985A patent/CN102262881A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6807528B1 (en) * | 2001-05-08 | 2004-10-19 | Dolby Laboratories Licensing Corporation | Adding data to a compressed data frame |
JP2007142547A (ja) * | 2005-11-15 | 2007-06-07 | Oki Electric Ind Co Ltd | 符号化方法及び復号化方法とその符号器及び復号器 |
CN101090273A (zh) * | 2006-06-13 | 2007-12-19 | 北京凯诚高清电子技术有限公司 | 独立16通道音频编解码算法 |
CN101635146A (zh) * | 2009-06-05 | 2010-01-27 | 中山大学 | 一种在avs音频流中嵌入稳健水印的方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104217726A (zh) * | 2014-09-01 | 2014-12-17 | 东莞中山大学研究院 | 一种无损音频压缩编码方法及其解码方法 |
CN105915228A (zh) * | 2016-04-08 | 2016-08-31 | 苏州大学 | 自适应的混合的数据无损压缩方法 |
CN105915227A (zh) * | 2016-04-08 | 2016-08-31 | 苏州大学 | 自适应的混合的数据无损压缩系统 |
CN105915228B (zh) * | 2016-04-08 | 2018-12-14 | 苏州大学 | 自适应的混合的数据无损压缩方法 |
CN105915227B (zh) * | 2016-04-08 | 2019-03-15 | 苏州大学 | 自适应的混合的数据无损压缩系统 |
CN107896136A (zh) * | 2017-10-27 | 2018-04-10 | 中国电子科技集团公司第二十八研究所 | 一种雷达航迹报文编码方法 |
CN107911196A (zh) * | 2017-10-27 | 2018-04-13 | 中国电子科技集团公司第二十八研究所 | 一种雷达航迹报文传输方法 |
CN107911196B (zh) * | 2017-10-27 | 2020-07-14 | 南京莱斯电子设备有限公司 | 一种雷达航迹报文传输方法 |
CN107896136B (zh) * | 2017-10-27 | 2020-09-08 | 南京莱斯电子设备有限公司 | 一种雷达航迹报文编码方法 |
CN109218849A (zh) * | 2018-10-30 | 2019-01-15 | 广州虎牙科技有限公司 | 一种直播数据的处理方法、装置、设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100936498B1 (ko) | 스테레오 호환성의 멀티채널 오디오 코딩 | |
CN101218628B (zh) | 编码和解码音频信号的装置和方法 | |
EP1987594B1 (en) | Method and apparatus for processing an audio signal | |
AU2009209444B2 (en) | Lossless multi-channel audio codec using adaptive segmentation with random access point (RAP) and multiple prediction parameter set (MPPS) capability | |
CN101241701B (zh) | 用于对音频信号进行解码的方法和设备 | |
CN102262881A (zh) | 基于avs有损音频的无损编解码扩展方法 | |
KR100954180B1 (ko) | 보장된 최대 비트 레이트를 가지는 정보의 무손실 인코딩 | |
EP2036204B1 (en) | Method and apparatus for an audio signal processing | |
KR20170134475A (ko) | 오디오 인코더, 오디오 디코더, 오디오 신호를 인코딩하기 위한 방법 및 인코딩된 오디오 신호를 디코딩하기 위한 방법 | |
JP2023126886A (ja) | 変換長切替えをサポートする周波数ドメインオーディオ符号化 | |
KR20150040997A (ko) | 멀티채널 다운믹스/업믹스 케이스들에 대해 매개변수 개념을 이용한 멀티-인스턴스 공간-오디오-오브젝트-코딩을 위한 디코더 및 방법 | |
WO2007097551A1 (en) | Method and apparatus for processing an audio signal | |
Fejzo et al. | DTS-HD: Technical Overview of Lossless Mode of Operation | |
Truman | Surround Sound Encoding for Consumer Applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20111130 |