CN101800048A - 基于dra编码器的多声道数字音频编码方法及其编码系统 - Google Patents

基于dra编码器的多声道数字音频编码方法及其编码系统 Download PDF

Info

Publication number
CN101800048A
CN101800048A CN200910077641A CN200910077641A CN101800048A CN 101800048 A CN101800048 A CN 101800048A CN 200910077641 A CN200910077641 A CN 200910077641A CN 200910077641 A CN200910077641 A CN 200910077641A CN 101800048 A CN101800048 A CN 101800048A
Authority
CN
China
Prior art keywords
dra
sound channel
channel
module
coding method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910077641A
Other languages
English (en)
Inventor
闫建新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DIGITAL WAVE Co Ltd
Original Assignee
DIGITAL WAVE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DIGITAL WAVE Co Ltd filed Critical DIGITAL WAVE Co Ltd
Priority to CN200910077641A priority Critical patent/CN101800048A/zh
Publication of CN101800048A publication Critical patent/CN101800048A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明涉及一种基于DRA编码器的多声道数字音频编码方法,其特征在于:首先利用参数多声道编码方法,将多个声道缩混成更少的声道,然后利用DRA编码器处理缩混后声道的低频部分,并对缩混后声道的高频部分进行带宽扩展处理。

Description

基于DRA编码器的多声道数字音频编码方法及其编码系统
技术领域
本发明涉及在低码率条件下的数字音频编码方法及其编码系统,更具体地,涉及基于DRA音频编解码技术的低码率数字音频编码方法及其编码系统。
背景技术
如图1A-1B所示,作为中国音频编码电子行业标准的DRA音频编、解码技术近年来已为业内所熟知。有关DRA(Digital Rise Audio)音频编解码技术更详细的内容可参见信息产业部2007年1月4日发布的、标准序号SJ/T 11368-2006的行业标准,该标准的全部内容在此以引用的方式并入本文。另外,为了叙述方便,下文中将该标准简称为“DRA标准”,并将与DRA标准相应的DRA音频编解码技术简称为“DRA技术”。
DRA是一种高质量的多声道音频编码算法,其编码的典型比特率为立体声128kbps(或单声道64kbps),能够提供透明的主观声音质量。但是随着编码压缩倍数增加,输出比特率降低,声音质量有明显下降,当低于每声道32kbps(即,低码率情况)时,主观声音质量存在明显编码失真,因此有必要基于现有的DRA算法开发一种低码率编码方法及其系统。
国际上已经有相关结构的低码率音频编码结构,即在核心音频编码器的基础上,通过SBR(Spectral Band Replication)和PS(Parametric Stereo)增强技术得到低码率音频编码器。如MPEG-4HE-AACv2是MPEG-4AAC+SBR+PS。另外,mp3Pro音频编码技术采用了MP3+SBR的模式在低码率下进行工作。
SBR技术是一种公知的带宽扩展技术,其可在核心编码器仅仅编码低频带,通过从低频信息和一些参数信息来扩展出高频信息的一种技术。PS是一种公知的参数立体声编码技术,即对两个声道通过缩混为单个声道,然后通过核心编码器编码,对于其他声道仅仅传输一些立体声参数信息,在解码端通过单声道和立体声参数信息恢复出其他声道信号。
发明内容
本发明的目的在于解决高质量音频编码算法DRA在低比特率(高压缩)下,主观声音质量有明显下降和失真的问题。
本发明提供了一种基于DRA编码器的多声道数字音频编码方法,其首先利用参数多声道编码方法,将多个声道缩混成更少的声道,然后利用DRA编码器处理缩混后声道的低频部分,并对缩混后声道的高频部分进行带宽扩展处理。
优选地,参数多声道编码方法是参数立体声编码方法。进一步优选地,带宽扩展处理是采用SBR技术进行处理。
本发明提供了一种基于DRA编码器的多声道数字音频编码系统,包括DRA编码器和将多个声道缩混成更少声道的参数多声道编码模块,以及对缩混后声道进行进一步带宽扩展处理的带宽扩展处理模块。
优选地,DRA编码器处理缩混后声道的低频部分,并且带宽扩展模块处理缩混后声道的高频部分。进一步优选地,参数多声道编码模块是参数立体声编码模块。更进一步地,带宽扩展模块是用于进行SBR技术模块
基于上述技术方案,在现有DRA编码技术的基础上,通过附加一些现有的或未来开发的带宽扩展技术和参数立体声技术实现低码率DRA增强编码的目的。
更具体地,本发明的效果在于实现了DRA音频编码算法从高码率向低码率扩展,使得基于DRA的核心编码技术可用于低码率编码的应用范围,同时保证了DRA高码率算法和低码率算法前后兼容性;基于新发明的低码率算法在低码率下,其主观声音质量明显高于原DRA在低码率下的编码质量。
附图说明
图1A和1B是方框图,其分别示出了DRA音频编码器和解码器;
图2是流程图,其示出了根据本发明实施例的一种基于DRA编码器的多声道数字音频编码方法;以及
图3是方框图,其示出了根据本发明实施例的一种基于DRA编码器的多声道数字音频编码系统。
具体实施方式
通过借助附图在下文中将描述本发明的优选实施例。在以下描述中,将不详细描述已成为现有技术的功能或结构,因为不必要的细节将导致本发明的介绍含混不清。
在图1A中示出了典型的DRA音频编码器,其可通过硬件、软件、和/或韧件来实现。简言之,DRA标准所涉及的技术就是以多个技术模块对源音(例如,输入PCM样本)进行信号处理,以达到几乎无损压缩源音的目的。上述多个技术模块包括但不限于:暂态分析模块120、多分辨率滤波器组模块122、线性标量量化模块130、量化指数编码模块132、码书选择模块134、人耳听觉模型模块140、全局比特分配模块142及多路复用模块150。按照DRA标准的相关规定,上述技术模块为必选模块,即符合标准的DRA输出码流(即,DRA标准码流)一定是经过上述模块处理后的码流。与之相对应地,图1B中示出了典型的DRA音频解码器,它用于接收被DRA编码器处理后的码流,并通过执行编码的逆过程而将编码码流还原为PCM样本输出。
主观听音测试表明,在码率合适的情况下(例如,大于单声道64kbps或立体声128kbps),被还原的PCM样本输出与输入PCM样本相比是“透明的”,即收听者通过直接听音的方式几乎无法区分两者。但是,随着编码码率不断降低,可分配给DRA音频编码器的资源大为减少,进而导致了编码质量的下降。
为了解决上述问题,本发明提供了将DRA核心编码技术与带宽扩展技术BWE(Band Width Extension)、参数多声道技术PMC(parametric multichannel coding)相结合的DRA-plus音频编码技术。
如图2所示,本发明提供了一种在低码率条件下的数字音频编码方法10。本实施例中所描述的音频编码方法始于步骤11,然后在步骤12中接收来自外界的多声道码流,如2声道码流或5.1声道码流等。在步骤13,对步骤12输入的多声道码流进行PMC处理,使其在步骤14缩混为较少声道的码流。在步骤15和16,依据缩混后较少声道码流的频率高低,分别采用BWE和DRA音频编码器进行处理。最终,步骤13、16中产生的边信息及通过步骤15、16处理的数据被共同在步骤17中打包、输出。整个方法最后在步骤18结束。
根据本发明的一个优选实施例,BWE可以采用公知的SBR技术,PMC可以采用公知的PS技术(对于输入为立体声的情况),或采用MPEG-4空间音频编码标准中的多声道参数编码技术(对于输入为多于2个声道的情况)。
更具体地,对于BWE,可设定高、低频段之间的分界线为f0,其优选地小于或等于采样频率的1/5-1/3,更优选地等于采样频率的1/4。
如图3所示,本发明提供了一种在低码率条件下的数字音频编码系统20。本实施例中所描述的音频编码系统在输入端21接收输入PCM多声道音频数据,如2声道码流或5.1声道码流等。输入的PCM音频数据通过模块22进行PMC处理,输出为较少声道的码流。在模块23和24,依据缩混后较少声道码流的频率高低,分别采用BWE和DRA音频编码器进行处理。最终,模块22、24中产生的边信息及通过模块23、24处理的数据被共同在模块25中打包,并在输出端26被输出。
根据本发明的一个优选实施例,BWE可以采用公知的SBR技术,PMC可以采用公知的PS技术(对于输入为立体声的情况),或采用MPEG-4空间音频编码标准中的多声道参数编码技术(对于输入为多于2个声道的情况)。
更具体地,对于BWE,可设定高、低频段之间的分界线为f0,其优选地小于或等于采样频率的1/5-1/3,更优选地等于采样频率的1/4。
虽然结合目前被认为是最实际和最优的实施例描述了本发明,但本领域技术人员应当理解本发明不限于所公开的实施例,相反,本发明旨在覆盖所附权利要求的精神和范畴之内包括的各种各样的修改和等价结构。本领域技术人员能够理解的是:可如示于特定实施例地将多种变形和/或改进使用到本发明,而这并不脱离以宽广方式描述的本发明精神或范围。因此,本文的实施例被认为在各个方面是描述性的而非限定性的。

Claims (7)

1.一种基于DRA编码器的多声道数字音频编码方法,其特征在于:首先利用参数多声道编码方法,将多个声道缩混成更少的声道,然后利用DRA编码器处理所述缩混后声道的低频部分,并对所述缩混后声道的高频部分进行带宽扩展处理。
2.如权利要求1所述的方法,其特征在于,所述参数多声道编码方法是参数立体声编码方法。
3.如权利要求1或2所述的方法,其特征在于,所述带宽扩展处理是采用SBR技术进行处理。
4.一种基于DRA编码器的多声道数字音频编码系统,包括DRA编码器,其特征在于,所述多声道数字音频编码系统还包括:将多个声道缩混成更少声道的参数多声道编码模块以及对缩混后声道进行进一步带宽扩展处理的带宽扩展处理模块。
5.如权利要求4所述的系统,其特征在于:所述DRA编码器处理所述缩混后声道的低频部分,并且所述带宽扩展模块处理所述缩混后声道的高频部分。
6.如权利要求5所述的系统,其特征在于,所述参数多声道编码模块是参数立体声编码模块。
7.如权利要求5或6所述的系统,其特征在于,所述带宽扩展模块是用于进行SBR技术模块。
CN200910077641A 2009-02-10 2009-02-10 基于dra编码器的多声道数字音频编码方法及其编码系统 Pending CN101800048A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910077641A CN101800048A (zh) 2009-02-10 2009-02-10 基于dra编码器的多声道数字音频编码方法及其编码系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910077641A CN101800048A (zh) 2009-02-10 2009-02-10 基于dra编码器的多声道数字音频编码方法及其编码系统

Publications (1)

Publication Number Publication Date
CN101800048A true CN101800048A (zh) 2010-08-11

Family

ID=42595696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910077641A Pending CN101800048A (zh) 2009-02-10 2009-02-10 基于dra编码器的多声道数字音频编码方法及其编码系统

Country Status (1)

Country Link
CN (1) CN101800048A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779518A (zh) * 2012-07-27 2012-11-14 深圳广晟信源技术有限公司 用于双核编码模式的编码方法和系统
CN102915738A (zh) * 2011-08-03 2013-02-06 三星电子株式会社 用于对多声道音频信号进行缩混的方法和设备
WO2013189030A1 (zh) * 2012-06-19 2013-12-27 深圳广晟信源技术有限公司 对单声道或立体声进行编码的方法
CN105164749A (zh) * 2013-04-30 2015-12-16 杜比实验室特许公司 多声道音频的混合编码
CN110099351A (zh) * 2019-04-01 2019-08-06 中车青岛四方机车车辆股份有限公司 一种声场回放方法、装置和系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915738A (zh) * 2011-08-03 2013-02-06 三星电子株式会社 用于对多声道音频信号进行缩混的方法和设备
CN102915738B (zh) * 2011-08-03 2017-05-10 三星电子株式会社 用于对多声道音频信号进行缩混的方法和设备
WO2013189030A1 (zh) * 2012-06-19 2013-12-27 深圳广晟信源技术有限公司 对单声道或立体声进行编码的方法
CN104170007A (zh) * 2012-06-19 2014-11-26 深圳广晟信源技术有限公司 对单声道或立体声进行编码的方法
CN104170007B (zh) * 2012-06-19 2017-09-26 深圳广晟信源技术有限公司 对单声道或立体声进行编码的方法
CN102779518A (zh) * 2012-07-27 2012-11-14 深圳广晟信源技术有限公司 用于双核编码模式的编码方法和系统
CN102779518B (zh) * 2012-07-27 2014-08-06 深圳广晟信源技术有限公司 用于双核编码模式的编码方法和系统
CN105164749A (zh) * 2013-04-30 2015-12-16 杜比实验室特许公司 多声道音频的混合编码
CN105164749B (zh) * 2013-04-30 2019-02-12 杜比实验室特许公司 多声道音频的混合编码
CN110099351A (zh) * 2019-04-01 2019-08-06 中车青岛四方机车车辆股份有限公司 一种声场回放方法、装置和系统
CN110099351B (zh) * 2019-04-01 2020-11-03 中车青岛四方机车车辆股份有限公司 一种声场回放方法、装置和系统

Similar Documents

Publication Publication Date Title
CN101933086B (zh) 处理音频信号的方法和设备
CN102754151B (zh) 用于对便携式装置内的音频信号的响度进行非破坏性标准化的系统和方法
RU2665887C1 (ru) Декодирование битовых аудиопотоков с метаданными расширенного копирования спектральной полосы по меньшей мере в одном заполняющем элементе
TWI521502B (zh) 多聲道音訊的較高頻率和降混低頻率內容的混合編碼
CN105074818A (zh) 用于参数化多声道编码的方法
US20140358554A1 (en) Audio encoding method and system for generating a unified bitstream decodable by decoders implementing different decoding protocols
CN102394063B (zh) 运动图像专家组环绕解码器和恢复多通道音频信号的方法
CN100571043C (zh) 一种空间参数立体声编解码方法及其装置
CN1922657B (zh) 用于可变块尺寸信号的解码方案
CN101292428B (zh) 用于编码/解码的方法和装置
WO2007011157A1 (en) Virtual source location information based channel level difference quantization and dequantization method
KR20070001139A (ko) 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들
JP2016531327A (ja) 先進的結合のための非一様パラメータ量子化
CN100489965C (zh) 音频编码系统
CN101485094A (zh) 最大熵意义下的后向兼容多通道音频编码与解码方法和系统
CN101800048A (zh) 基于dra编码器的多声道数字音频编码方法及其编码系统
CN101290774B (zh) 音频编码和解码系统
EP2242047B1 (en) Method and apparatus for identifying frame type
CN101202042A (zh) 可扩展的数字音频编码框架及其扩展方法
US20110311063A1 (en) Embedding and extracting ancillary data
CN101814289A (zh) 低码率dra数字音频多声道编码方法及其系统
CN101361122B (zh) 处理媒体信号的装置及其方法
KR20080066537A (ko) 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치
CN113948094A (zh) 音频编解码方法和相关装置及计算机可读存储介质
CN101685636B (zh) Dra数据格式转换方法及其实现装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
DD01 Delivery of document by public notice

Addressee: Digital Wave Co., Ltd.

Document name: Notification of before Expiration of Request of Examination as to Substance

C53 Correction of patent for invention or patent application
CB02 Change of applicant information

Address after: 100081, room 2402, building C, Zhongguancun science and technology building, 34 South Avenue, Beijing, Haidian District, Zhongguancun

Applicant after: Digital Wave Co., Ltd.

Address before: 100031, 503/504 building, Capital Times Square, 88 West Chang'an Avenue, Beijing, Xicheng District

Applicant before: Digital Wave Co., Ltd.

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100811