基于DRA编码器的多声道数字音频编码方法及其编码系统
技术领域
本发明涉及在低码率条件下的数字音频编码方法及其编码系统,更具体地,涉及基于DRA音频编解码技术的低码率数字音频编码方法及其编码系统。
背景技术
如图1A-1B所示,作为中国音频编码电子行业标准的DRA音频编、解码技术近年来已为业内所熟知。有关DRA(Digital Rise Audio)音频编解码技术更详细的内容可参见信息产业部2007年1月4日发布的、标准序号SJ/T 11368-2006的行业标准,该标准的全部内容在此以引用的方式并入本文。另外,为了叙述方便,下文中将该标准简称为“DRA标准”,并将与DRA标准相应的DRA音频编解码技术简称为“DRA技术”。
DRA是一种高质量的多声道音频编码算法,其编码的典型比特率为立体声128kbps(或单声道64kbps),能够提供透明的主观声音质量。但是随着编码压缩倍数增加,输出比特率降低,声音质量有明显下降,当低于每声道32kbps(即,低码率情况)时,主观声音质量存在明显编码失真,因此有必要基于现有的DRA算法开发一种低码率编码方法及其系统。
国际上已经有相关结构的低码率音频编码结构,即在核心音频编码器的基础上,通过SBR(Spectral Band Replication)和PS(Parametric Stereo)增强技术得到低码率音频编码器。如MPEG-4HE-AACv2是MPEG-4AAC+SBR+PS。另外,mp3Pro音频编码技术采用了MP3+SBR的模式在低码率下进行工作。
SBR技术是一种公知的带宽扩展技术,其可在核心编码器仅仅编码低频带,通过从低频信息和一些参数信息来扩展出高频信息的一种技术。PS是一种公知的参数立体声编码技术,即对两个声道通过缩混为单个声道,然后通过核心编码器编码,对于其他声道仅仅传输一些立体声参数信息,在解码端通过单声道和立体声参数信息恢复出其他声道信号。
发明内容
本发明的目的在于解决高质量音频编码算法DRA在低比特率(高压缩)下,主观声音质量有明显下降和失真的问题。
本发明提供了一种基于DRA编码器的多声道数字音频编码方法,其首先利用参数多声道编码方法,将多个声道缩混成更少的声道,然后利用DRA编码器处理缩混后声道的低频部分,并对缩混后声道的高频部分进行带宽扩展处理。
优选地,参数多声道编码方法是参数立体声编码方法。进一步优选地,带宽扩展处理是采用SBR技术进行处理。
本发明提供了一种基于DRA编码器的多声道数字音频编码系统,包括DRA编码器和将多个声道缩混成更少声道的参数多声道编码模块,以及对缩混后声道进行进一步带宽扩展处理的带宽扩展处理模块。
优选地,DRA编码器处理缩混后声道的低频部分,并且带宽扩展模块处理缩混后声道的高频部分。进一步优选地,参数多声道编码模块是参数立体声编码模块。更进一步地,带宽扩展模块是用于进行SBR技术模块
基于上述技术方案,在现有DRA编码技术的基础上,通过附加一些现有的或未来开发的带宽扩展技术和参数立体声技术实现低码率DRA增强编码的目的。
更具体地,本发明的效果在于实现了DRA音频编码算法从高码率向低码率扩展,使得基于DRA的核心编码技术可用于低码率编码的应用范围,同时保证了DRA高码率算法和低码率算法前后兼容性;基于新发明的低码率算法在低码率下,其主观声音质量明显高于原DRA在低码率下的编码质量。
附图说明
图1A和1B是方框图,其分别示出了DRA音频编码器和解码器;
图2是流程图,其示出了根据本发明实施例的一种基于DRA编码器的多声道数字音频编码方法;以及
图3是方框图,其示出了根据本发明实施例的一种基于DRA编码器的多声道数字音频编码系统。
具体实施方式
通过借助附图在下文中将描述本发明的优选实施例。在以下描述中,将不详细描述已成为现有技术的功能或结构,因为不必要的细节将导致本发明的介绍含混不清。
在图1A中示出了典型的DRA音频编码器,其可通过硬件、软件、和/或韧件来实现。简言之,DRA标准所涉及的技术就是以多个技术模块对源音(例如,输入PCM样本)进行信号处理,以达到几乎无损压缩源音的目的。上述多个技术模块包括但不限于:暂态分析模块120、多分辨率滤波器组模块122、线性标量量化模块130、量化指数编码模块132、码书选择模块134、人耳听觉模型模块140、全局比特分配模块142及多路复用模块150。按照DRA标准的相关规定,上述技术模块为必选模块,即符合标准的DRA输出码流(即,DRA标准码流)一定是经过上述模块处理后的码流。与之相对应地,图1B中示出了典型的DRA音频解码器,它用于接收被DRA编码器处理后的码流,并通过执行编码的逆过程而将编码码流还原为PCM样本输出。
主观听音测试表明,在码率合适的情况下(例如,大于单声道64kbps或立体声128kbps),被还原的PCM样本输出与输入PCM样本相比是“透明的”,即收听者通过直接听音的方式几乎无法区分两者。但是,随着编码码率不断降低,可分配给DRA音频编码器的资源大为减少,进而导致了编码质量的下降。
为了解决上述问题,本发明提供了将DRA核心编码技术与带宽扩展技术BWE(Band Width Extension)、参数多声道技术PMC(parametric multichannel coding)相结合的DRA-plus音频编码技术。
如图2所示,本发明提供了一种在低码率条件下的数字音频编码方法10。本实施例中所描述的音频编码方法始于步骤11,然后在步骤12中接收来自外界的多声道码流,如2声道码流或5.1声道码流等。在步骤13,对步骤12输入的多声道码流进行PMC处理,使其在步骤14缩混为较少声道的码流。在步骤15和16,依据缩混后较少声道码流的频率高低,分别采用BWE和DRA音频编码器进行处理。最终,步骤13、16中产生的边信息及通过步骤15、16处理的数据被共同在步骤17中打包、输出。整个方法最后在步骤18结束。
根据本发明的一个优选实施例,BWE可以采用公知的SBR技术,PMC可以采用公知的PS技术(对于输入为立体声的情况),或采用MPEG-4空间音频编码标准中的多声道参数编码技术(对于输入为多于2个声道的情况)。
更具体地,对于BWE,可设定高、低频段之间的分界线为f0,其优选地小于或等于采样频率的1/5-1/3,更优选地等于采样频率的1/4。
如图3所示,本发明提供了一种在低码率条件下的数字音频编码系统20。本实施例中所描述的音频编码系统在输入端21接收输入PCM多声道音频数据,如2声道码流或5.1声道码流等。输入的PCM音频数据通过模块22进行PMC处理,输出为较少声道的码流。在模块23和24,依据缩混后较少声道码流的频率高低,分别采用BWE和DRA音频编码器进行处理。最终,模块22、24中产生的边信息及通过模块23、24处理的数据被共同在模块25中打包,并在输出端26被输出。
根据本发明的一个优选实施例,BWE可以采用公知的SBR技术,PMC可以采用公知的PS技术(对于输入为立体声的情况),或采用MPEG-4空间音频编码标准中的多声道参数编码技术(对于输入为多于2个声道的情况)。
更具体地,对于BWE,可设定高、低频段之间的分界线为f0,其优选地小于或等于采样频率的1/5-1/3,更优选地等于采样频率的1/4。
虽然结合目前被认为是最实际和最优的实施例描述了本发明,但本领域技术人员应当理解本发明不限于所公开的实施例,相反,本发明旨在覆盖所附权利要求的精神和范畴之内包括的各种各样的修改和等价结构。本领域技术人员能够理解的是:可如示于特定实施例地将多种变形和/或改进使用到本发明,而这并不脱离以宽广方式描述的本发明精神或范围。因此,本文的实施例被认为在各个方面是描述性的而非限定性的。