CN109801639A - 一种符合ac-3格式的全景声信号的编解码方法 - Google Patents

一种符合ac-3格式的全景声信号的编解码方法 Download PDF

Info

Publication number
CN109801639A
CN109801639A CN201711140755.1A CN201711140755A CN109801639A CN 109801639 A CN109801639 A CN 109801639A CN 201711140755 A CN201711140755 A CN 201711140755A CN 109801639 A CN109801639 A CN 109801639A
Authority
CN
China
Prior art keywords
panorama
sound
code stream
decoded
obtains
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711140755.1A
Other languages
English (en)
Other versions
CN109801639B (zh
Inventor
潘兴德
吴超刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing panoramic sound information technology Co.,Ltd.
Original Assignee
Panorama Technology Nanjing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panorama Technology Nanjing Co Ltd filed Critical Panorama Technology Nanjing Co Ltd
Priority to CN201711140755.1A priority Critical patent/CN109801639B/zh
Publication of CN109801639A publication Critical patent/CN109801639A/zh
Application granted granted Critical
Publication of CN109801639B publication Critical patent/CN109801639B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

本发明公开一种符合AC‑3格式的全景声信号的编解码方法,包括如下步骤:将全景声信号划分为全景声扩展数据和基础声道;将全景声扩展数据进行编码得到全景声扩展码流;将基础声道采用AC‑3编码方法进行编码,并将全景声扩展码流作为填充数据填入到填充位skipfield,得到符合AC‑3格式的全景声音频节目码流;解码时,从符合AC‑3码流格式的全景声码流中解码得到基础声道信号并恢复出全景声扩展码流,解码全景声扩展码流恢复出全景声信息。本发明实现了兼容已有的环绕声系统,并具备全景声的处理和呈现能力。

Description

一种符合AC-3格式的全景声信号的编解码方法
技术领域
本发明属于全景声信号编解码处理技术领域,具体涉及一种符合AC-3格式的全景声信号的编解码方法。
背景技术
经过多年发展,立体声、5.1、7.1环绕声等系统已经获得了广泛的应用,这些系统因缺乏声音的高度信息,最多只能呈现二维的声音。在真实的世界中,全景声(也称三维声)是声音最真实的呈现和表达方式,无论自然界、艺术领域或视听娱乐领域,全景声都是未来的发展趋势。
在现有的系统中,全景声可以是多声道信号(如9.1、11.1、13.1和22.2等),可以是多个声音对象,也可以是两者的组合。在全景声系统中,多声道信号可以是环绕声信号,如5.1、7.1等,也可以是多层多声道信号(即多层声道信号分布在不同高度平面)。例如,有些全景声系统采用中间层及顶层的两层平面,有些全景声系统采用三层系统等。有些全景声系统只有多层多声道信号,但没有声音对象,例如SMPTE的22.2三维声系统和AURO 9.1系统等。有些全景声系统则既有多层多声道信号,也有声音对象,例如MPEG-H、Dolby Atmos和WANOS系统。当然,作为一个极端的例子,全景声也可以全部是声音对象信号。在全景声系统中,声音对象由声音对象波形数据、声音对象渲染信息(也称元数据或metadata)组成,具体可以参考ATMOS、WANOS、AVS2-P3或MPEG-H等相关的技术文献。
全景声作为刚刚出现的新技术和系统,还没有获得广泛的应用,其推广需要一个很长的发展阶段。因立体声、环绕声系统的普遍存在,全景声系统只有最大限度的兼容已经普遍存在的立体声或环绕声系统,例如应用广泛的AC-3环绕声系统(ATSC标准A52/A:Digital Audio Compression Standard(AC-3),修订版A,先进电视系统委员会,2001年8月20日),才能获得市场的快速接受,并逐步成为主流。
发明内容
发明目的:本发明目的在于针对现有技术的不足,提供一种符合AC-3格式的全景声信号的编解码方法,该方法可以更好兼容已有的环绕声系统,同时具备全景声的处理和呈现能力。特别的,采用本发明方法所获得的符合AC-3格式的全景声音频节目码流,可以在任何支持AC-3格式的软件和硬件系统解码,并提供立体声或环绕声节目;在支持全景声格式的软件和硬件系统中,可以从本发明方法所获得的符合AC-3格式的全景声音频节目码流解码获得全景声节目。
技术方案:本发明所述符合AC-3格式的全景声信号的编码方法,包括如下步骤:
(1)将全景声信号划分为全景声扩展数据和基础声道;
(2)将全景声扩展数据进行编码得到全景声扩展码流;
(3)将基础声道采用AC-3编码方法进行编码,并将全景声扩展码流作为填充数据填入到填充位skipfield,得到符合AC-3格式的全景声音频节目码流。
进一步完善上述技术方案,所述全景声扩展数据包括声道数据、声音对象波形数据、声音对象渲染信息中的一种或多种。
本发明还提供了符合AC-3格式的全景声信号的下混兼容编码方法,包括如下步骤:
(31)按照下混策略,将全景声扩展数据下混到基础声道,得到下混基础声道;
(32)将全景声扩展数据进行编码,得到全景声扩展码流;
(33)采用AC-3编码方法对下混基础声道进行编码,编码过程中将全景声扩展码流填入到填充位skipfield,得到符合AC-3码流格式的全景声音频节目码流。
以及另一种符合AC-3格式的全景声信号的下混兼容编码方法,包括如下步骤:
(41)将全景声信号划分为全景声扩展数据和基础声道;
(42)将全景声扩展数据进行编码,得到全景声扩展码流,并对全景声扩展数据码流进行解码得到解码的全景声扩展数据;
(43)按照下混策略,将解码的全景声扩展数据下混到基础声道,得到下混基础声道;
(44)采用AC-3编码方法对下混基础声道进行编码,编码过程中将全景声扩展码流填入入到码流的填充位skipfield,得到符合AC-3码流格式的全景声音频节目码流。
上述编码方法所得全景声音频节目码流的全景声信号的解码方法,包括如下步骤:
(51)对全景声音频节目码流进行解码,得到解码的基础声道,并将填充位skipfield进行组合,得到全景声扩展码流;
(52)对全景声扩展码流进行解码,得到解码的全景声扩展数据;
(53)对解码的基础声道与全景声扩展数据进行组合,得到解码的全景声音频节目。
上述下混兼容编码方法所得全景声音频节目码流的全景声信号的解码方法,包括如下步骤:
(61)对全景声音频节目码流进行解码,得到解码的下混基础声道,并从填充位skipfield中恢复全景声扩展码流;
(62)对全景声扩展码流进行解码,得到解码的全景声扩展数据;
(63)对解码的下混基础声道进行去下混,得到解码的基础声道,解码的基础声道与解码的全景声扩展数据进行组合,得到解码的全景声音频节目。
有益效果:本发明提供的全景声信号的解码方法,将包含全景声信息的全景声扩展码流嵌入到AC-3码流中的填充字段skipfield中,得到符合AC-3码流格式的全景声码流;解码时,从符合AC-3码流格式的全景声码流中解码得到基础声道信号并恢复出全景声扩展码流,解码全景声扩展码流恢复出全景声信息,从而实现了兼容已有的环绕声系统,并具备全景声的处理和呈现能力;且方案灵活,适用于包括声道数据、声音对象波形数据、对象渲染信息的一种或多种的全景声扩展数据。
附图说明
图1为AC-3码流结构的示意图;
图2为实施例1的方法框图;
图3为实施例2的方法框图;
图4为实施例3的方法框图;
图5为实施例4的方法框图;
图6为实施例5的方法框图;
图7为实施例6的方法框图;
图8为实施例7的方法框图。
具体实施方式
下面通过附图对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
实施例1:将全景声节目中与所要兼容的环绕声系统相一致的声道称为基础声道,将不包含在环绕声系统中的声道(如顶置声道)、声音对象波形数据及声音对象渲染信息称为全景声扩展数据,全景声扩展数据可以包括不包含在环绕声系统中的声道数据、声音对象波形数据、声音对象渲染信息的一种或多种。
如图2所示的符合AC-3码流格式的5.1.2全景声节目的编码方法,包括如下步骤:
(1)将全景声音频的顶置声道(.2)进行编码得到全景声扩展码流;
顶置声道(.2)的编码器可以是任何一种可行的编码,例如AAC系列编码器、AVS编码器、AC3等,因AC-3码流填充位skipfield的限制,优选高效率编码器。
(2)对全景声音节目中的5.1基础声道采用AC-3的编码方式进行编码,并将全景声扩展码流作为填充数据填入到填充位skipfield,得到全景声音频的AC-3码流。图1是AC-3码流结构的示意图,表1是AC-3码流中填充字段skipfield的语法结构。
表1AC-3码流中skipfield的语法结构
实施例2:如图3所示符合AC-3码流格式的5.1.2全景声节目的解码方法,包括如下步骤:
(1)对全景声音频的AC-3码流进行解码,得到解码的AC-3 5.1声道信号,并将填充位skipfield进行组合,得到全景声扩展码流;
(2)对全景声扩展码流进行解码,得到解码的全景声扩展数据;
(3)将解码的AC-3 5.1声道信号与全景声扩展数据进行组合,得到解码的全景声音频节目。
实施例3:如图4所示符合AC-3码流格式的5.1.2和4个声音对象全景声节目的编码方法,包括如下步骤:
(1)将全景声音频的顶置声道(.2)和4个声音对象进行编码得到全景声扩展码流;
(2)对全景声音节目中的5.1声道采用AC-3的编码方式进行编码,并将全景声扩展码流作为填充数据填入到填充位skipfield,得到全景声音频的AC-3码流。
实施例4:如图5所示符合AC-3码流格式的5.1.2和4个声音对象全景声节目的解码方法,包括如下步骤:
(1)对全景声音频的AC-3码流进行解码,得到解码的AC-3 5.1声道信号,并将填充位skipfield进行组合,得到全景声扩展码流;
(2)对全景声扩展码流进行解码,得到解码的全景声扩展数据(顶置声道(.2)和4个声音对象);
(3)将解码的AC-3 5.1声道信号与全景声扩展数据顶置声道(.2)和4个声音对象)进行组合,得到解码的全景声音频节目。
实施例5:如图6所示符合AC-3码流格式的5.1.2全景声节目的下混兼容编码方法,包括如下步骤:
(1)按照下混策略,将顶置声道信号下混到基础声道,得到下混的基础声道信号。
下混策略可以是任何一种合理的下混方法,比如一种可能的策略是:左顶信号下混到左声道,右顶信号下混到右声道,后左顶信号下混到后左声道,后右顶信号下混到后右声道。
(2)采用AC-3编码方法对顶置声道进行编码,得到顶置声道码流;
(3)采用AC-3编码方法对下混基础声道进行编码,编码过程中将顶置声道码流嵌入到码流的填充位skipfield部分,得到符合AC-3码流格式的全景声音频节目码流。
实施例6:如图7所示符合AC-3码流格式的5.1.2全景声音频节目的下混兼容解码方法,包括如下步骤:
如果是普通的AC3解码器则对符合AC-3码流格式的全景声音频节目码流,得到解码的基础声道信号;如果是全景声解码器则:
(1)对符合AC-3码流格式的全景声音频节目码流进行解码,得到解码的下混基础声道信号,并从skipfield部分中恢复顶置声道码流;
(2)对顶置声道码流进行解码,得到解码的顶置声道信号;
(3)对解码的下混基础声道信号进行去下混,得到解码的基础声道信号,解码的基础声道信号与解码的顶置声道信号构成解码的全景声节目;去下混是下混的逆过程。
实施例7:如图8所示符合AC-3码流格式的全景声音频节目的下混兼容编码方法,包括如下步骤:
(1)采用AC-3编码方法对顶置声道进行编码,得到顶置声道码流,并对顶置声道码流进行解码得到解码的顶置声道信号;
(2)按照下混策略,将解码的顶置声道信号下混到基础声道,得到下混的基础声道信号。
一种可能的策略,左顶信号下混到左声道,右顶信号下混到右声道,后左顶信号下混到后左声道,后右顶信号下混到后右声道。
(3)采用AC-3编码方法对下混基础声道进行编码,编码过程中将顶置声道码流嵌入到码流的skipfield部分,得到符合AC-3码流格式的全景声音频节目码流。
如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下,可对其在形式上和细节上作出各种变化。

Claims (6)

1.一种符合AC-3格式的全景声信号的编码方法,其特征在于,包括如下步骤:
(1)将全景声信号划分为全景声扩展数据和基础声道;
(2)将全景声扩展数据进行编码得到全景声扩展码流;
(3)将基础声道采用AC-3编码方法进行编码,并将全景声扩展码流作为填充数据填入到填充位skipfield,得到符合AC-3格式的全景声音频节目码流。
2.根据权利要求1所述符合AC-3格式的全景声信号的编码方法,其特征在于:所述全景声扩展数据包括声道数据、声音对象波形数据、声音对象渲染信息中的一种或多种。
3.一种符合AC-3格式的全景声信号的下混兼容编码方法,其特征在于,包括如下步骤:
(31)按照下混策略,将全景声扩展数据下混到基础声道,得到下混基础声道;
(32)将全景声扩展数据进行编码,得到全景声扩展码流;
(33)采用AC-3编码方法对下混基础声道进行编码,编码过程中将全景声扩展码流填入到填充位skipfield,得到符合AC-3码流格式的全景声音频节目码流。
4.一种符合AC-3格式的全景声信号的下混兼容编码方法,其特征在于,包括如下步骤:
(41)将全景声信号划分为全景声扩展数据和基础声道;
(42)将全景声扩展数据进行编码,得到全景声扩展码流,并对全景声扩展码流进行解码得到解码的全景声扩展数据;
(43)按照下混策略,将解码的全景声扩展数据下混到基础声道,得到下混基础声道;
(44)采用AC-3编码方法对下混基础声道进行编码,编码过程中将全景声扩展码流填入到码流的填充位skipfield,得到符合AC-3码流格式的全景声音频节目码流。
5.一种用于权利要求1所述编码方法所得全景声音频节目码流的全景声信号的解码方法,其特征在于,包括如下步骤:
(51)对全景声音频节目码流进行解码,得到解码的基础声道,并将填充位skipfield进行组合,得到全景声扩展码流;
(52)对全景声扩展码流进行解码,得到解码的全景声扩展数据;
(53)对解码的基础声道与全景声扩展数据进行组合,得到解码的全景声音频节目。
6.一种用于权利要求3或4所述编码方法所得全景声音频节目码流的全景声信号的解码方法,其特征在于,包括如下步骤:
(61)对全景声音频节目码流进行解码,得到解码的下混基础声道,并从填充位skipfield中恢复全景声扩展码流;
(62)对全景声扩展码流进行解码,得到解码的全景声扩展数据;
(63)对解码的下混基础声道进行去下混,得到解码的基础声道,解码的基础声道与解码的全景声扩展数据进行组合,得到解码的全景声音频节目。
CN201711140755.1A 2017-11-16 2017-11-16 一种符合ac-3格式的全景声信号的编解码方法 Active CN109801639B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711140755.1A CN109801639B (zh) 2017-11-16 2017-11-16 一种符合ac-3格式的全景声信号的编解码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711140755.1A CN109801639B (zh) 2017-11-16 2017-11-16 一种符合ac-3格式的全景声信号的编解码方法

Publications (2)

Publication Number Publication Date
CN109801639A true CN109801639A (zh) 2019-05-24
CN109801639B CN109801639B (zh) 2020-12-18

Family

ID=66555938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711140755.1A Active CN109801639B (zh) 2017-11-16 2017-11-16 一种符合ac-3格式的全景声信号的编解码方法

Country Status (1)

Country Link
CN (1) CN109801639B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021203753A1 (zh) * 2020-04-10 2021-10-14 全景声科技南京有限公司 音频信号的增量编码方法及装置
CN115691515A (zh) * 2022-07-12 2023-02-03 南京拓灵智能科技有限公司 一种音频编解码方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000079520A1 (en) * 1999-06-21 2000-12-28 Digital Theater Systems, Inc. Improving sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
CN203352780U (zh) * 2013-06-20 2013-12-18 深圳市小马奔腾科技有限公司 车载3d环绕音质处理数字功放
CN105323702A (zh) * 2014-07-09 2016-02-10 九次元科技有限公司 混音方法及系统
CN105895108A (zh) * 2016-03-18 2016-08-24 南京青衿信息科技有限公司 一种全景声处理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000079520A1 (en) * 1999-06-21 2000-12-28 Digital Theater Systems, Inc. Improving sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
CN203352780U (zh) * 2013-06-20 2013-12-18 深圳市小马奔腾科技有限公司 车载3d环绕音质处理数字功放
CN105323702A (zh) * 2014-07-09 2016-02-10 九次元科技有限公司 混音方法及系统
CN105895108A (zh) * 2016-03-18 2016-08-24 南京青衿信息科技有限公司 一种全景声处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙立军: "《动画声音创作》", 31 May 2015 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021203753A1 (zh) * 2020-04-10 2021-10-14 全景声科技南京有限公司 音频信号的增量编码方法及装置
CN115691515A (zh) * 2022-07-12 2023-02-03 南京拓灵智能科技有限公司 一种音频编解码方法及装置

Also Published As

Publication number Publication date
CN109801639B (zh) 2020-12-18

Similar Documents

Publication Publication Date Title
CN104429102B (zh) 使用3d音频分层译码的扩音器位置补偿
CN104471640B (zh) 基于对象的环绕声编码解码器的具有反馈的可缩放降混设计
TWI595785B (zh) 用於螢幕相關音訊物件再對映之裝置及方法
CN104541524B (zh) 一种用于处理音频信号的方法和设备
CN106463121B (zh) 较高阶立体混响信号压缩
CN105580072B (zh) 用于音频数据的压缩的方法、装置及计算机可读存储媒体
EP2954703B1 (en) Determining renderers for spherical harmonic coefficients
CN105247612B (zh) 相对于球面谐波系数执行空间掩蔽
ES2738490T3 (es) Especificación de coeficientes ambisónicos de orden superior y/o armónicos esféricos en flujos de bits
CN106104680B (zh) 将音频信道插入到声场的描述中
CN104471960B (zh) 用于向后兼容音频译码的系统、方法、设备和计算机可读媒体
CN106796794A (zh) 环境高阶立体混响音频数据的归一化
UA106598C2 (uk) Спосіб і пристрій для кодування і оптимальної реконструкції тривимірного акустичного поля
EP3839946A1 (en) Signaling audio rendering information in a bitstream
CN105264914B (zh) 音频再生装置以及方法
CN106575506A (zh) 高阶立体混响音频数据的中间压缩
CN106663433A (zh) 减少高阶立体混响(hoa)背景信道之间的相关性
MY165933A (en) System and method for adaptive audio signal generation, coding and rendering
CN108140389A (zh) 空间向量的量化
CN109887517A (zh) 对音频场景进行解码的方法、解码器及计算机可读介质
CN111630593B (zh) 用于译码声场表示信号的方法和装置
CN1717955A (zh) 用于描述音频信号的合成的方法
CN106415712B (zh) 用于渲染高阶立体混响系数的装置和方法
CN109801639A (zh) 一种符合ac-3格式的全景声信号的编解码方法
CN108141690A (zh) 在多个转变期间译码高阶立体混响系数

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220414

Address after: 101399 room 1001, building 1, No. 8, jinmayuan Third Street, Gaoliying Town, Shunyi District, Beijing

Patentee after: Beijing panoramic sound information technology Co.,Ltd.

Address before: No. 69, shitoucheng, Nanjing, Jiangsu 210029

Patentee before: WAVARTS TECHNOLOGIES CO.,LTD.