CN112233684A - 用于对多声道信号进行编码或解码的装置与方法 - Google Patents

用于对多声道信号进行编码或解码的装置与方法 Download PDF

Info

Publication number
CN112233684A
CN112233684A CN202011242898.5A CN202011242898A CN112233684A CN 112233684 A CN112233684 A CN 112233684A CN 202011242898 A CN202011242898 A CN 202011242898A CN 112233684 A CN112233684 A CN 112233684A
Authority
CN
China
Prior art keywords
channel
channels
pair
processing
mch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011242898.5A
Other languages
English (en)
Other versions
CN112233684B (zh
Inventor
萨沙·迪克
弗洛里安·舒
尼古拉斯·里特尔博谢
托比亚斯·施威格勒
理查德·福格
约翰内斯·希尔珀特
马蒂亚斯·诺伊辛格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority to CN202011242898.5A priority Critical patent/CN112233684B/zh
Publication of CN112233684A publication Critical patent/CN112233684A/zh
Application granted granted Critical
Publication of CN112233684B publication Critical patent/CN112233684B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved

Abstract

实施例提供了一种对具有至少三个声道的多声道信号进行编码的装置。该装置包括迭代处理器、声道编码器和输出接口。迭代处理器被配置为在第一迭代步骤中计算至少三个声道中的每对之间的声道间相关值,选择具有最高值或具有高于阈值的值的对,并且使用多声道处理操作处理所选择的对,以导出针对所选择的对的第一多声道参数并导出第一处理声道。迭代处理器被配置为在第二迭代步骤中通过使用处理声道的至少一个而执行所述计算、所述选择和所述处理,以导出第二多声道参数和第二处理声道。声道编码器被配置为对根据迭代处理得到的声道进行编码以获得编码声道。输出接口被配置为产生具有编码声道以及第一多声道参数和第二多声道参数的编码多声道信号。

Description

用于对多声道信号进行编码或解码的装置与方法
本申请是申请日为2016年3月8日、国际申请号为PCT/EP2016/054900、中国申请号为“201680026823.9”、发明名称为“用于对多声道信号进行编码或解码的装置与方法”的申请的分案申请。
技术领域
本发明涉及音频编码/解码,具体地,涉及利用声道间信号依赖性的音频编码。
背景技术
音频编码是关于处理音频信号中的冗余和无关的压缩的领域。在MPEG USAC[ISO/IEC 23003-3:2012-Information technology-MPEG audio technologies Part 3:Unified speech and audio coding]中,两声道的联合立体声编码通过使用复预测、MPS2-1-2或具有有限频带或全频带残差信号的统一立体声来进行。MPEG surround[ISO/IEC23003-1:2007-Information technology-MPEG audio technologies Part1:MPEGSurround]在有或没有残差信号传输的情况下针对多声道音频的联合编码分层地结合OTT与TTT盒。MPEG-H四声道元素分层地应用MPS 2-1-2立体声盒,之后是构建固定的4×4再混合树的复预测/MS立体声盒。AC4[ETSI TS 103 190V1.1.1(2014-04)-Digital AudioCompression(AC-4)Standard]引入了新的3-声道、4-声道、5-声道元素,所述元素考虑经由被传输的混合矩阵与后续的联合立体声编码信息而对被传输声道进行再混合。此外,现有出版物建议使用正交变换,如针对增强的多声道音频编码的Karhunen-Loeve变换(KLT)[Yang,Dai and Ai,Hongmei and Kyriakakis,Chris and Kuo,C.-C.Jay,2001:AdaptiveKarhunen-Loeve Transform for Enhanced Multichannel Audio Coding,http://ict.usc.edu/pubs/Adaptive%20Karhunen-Loeve%20Transfor m%20for%20Enhanced%20Multichannel%20Audio%20Coding.pdf]。
在3D音频上下文中,扬声器声道分布在多个高度层中,导致水平与竖直的声道对。如在USAC中所定义的仅两个声道的联合编码不足以考虑声道之间的空间和感知关系。MPEG环绕被应用于附加的预/后处理步骤,残差信号在没有联合立体声编码的可能性的情况下被单独传输,以例如利用左与右竖直残差信号之间的依赖性。在AC-4中,专用的N声道元素被引入以考虑联合编码参数的高效率编码,但无法考虑针对新的浸入回放场景(7.1+4,22.2)而提出的具有更多声道的一般扬声器设定。MPEG-H四声道元素还被限制为仅仅4个声道并且无法动态地应用于任意的声道而只能应用于预配置且固定数量的声道。
发明内容
本发明的目的在于提供改善的编码/解码构思。
该目的通过根据一种用于对具有至少三个声道的多声道信号进行编码的装置而达到;或通过一种用于对具有编码声道以及至少第一和第二多声道参数的编码多声道信号进行解码的装置而达到;或通过一种用于对具有至少三个声道的多声道信号进行编码方法而达到;或通过一种用于对具有编码声道以及至少第一和第二多声道参数的编码多声道信号进行解码的方法而达到;或通过一种计算机程序而达到。
实施例提供了一种对具有至少三个声道的多声道信号进行编码的装置。所述装置包括迭代处理器、声道编码器和输出接口。迭代处理器被配置为在第一迭代步骤中计算在至少三个声道的每对之间的声道间相关值,在第一迭代步骤中选择具有最高值或具有高于阈值的值的对,并且通过使用多声道处理操作而处理所选择的对,以导出针对所选择的对的第一多声道参数并导出第一处理声道。此外,迭代处理器被配置为在第二迭代步骤中通过使用所述处理声道的至少一个而执行所述计算、所述选择和所述处理,以导出第二多声道参数和第二处理声道。声道编码器被配置为对根据通过迭代处理器执行的迭代处理得到的声道进行编码以获得编码声道。输出接口被配置为产生具有编码声道以及第一和第二多声道参数的编码多声道信号。
另外,实施例提供了一种用于对编码多声道信号进行解码的装置,所述编码多声道信号具有编码声道以及至少第一和第二多声道参数。所述装置包括声道解码器以及多声道处理器。声道解码器被配置为对编码声道进行解码以获得解码声道。多声道处理器被配置为通过使用由第二多声道参数标识的解码声道的第二对和通过使用第二多声道参数来执行多声道处理,以获得处理声道,并通过使用由第一多声道参数标识的声道的第一对和使用第一多声道参数来执行进一步的多声道处理,其中声道的第一对包括至少一个处理声道。
与使用固定信号路径(例如立体声编码树)的常见多声道编码构思相比,本发明的实施例使用动态信号路径,其适应多声道输入信号的至少三个输入声道的特性。具体地说,迭代处理器102可适于在第一迭代步骤中基于至少三个声道CH1至CH3中的每对之间的声道间相关值建立信号路径(例如立体声树),以在第一迭代步骤中选择具有最高值或高于阈值的值的对,并且在第二迭代步骤中基于在所述至少三个声道的每对与相应的先前处理声道之间的声道间相关值,在第二迭代步骤中选择具有最高值或高于阈值的值的对。
进一步的实施例提供了一种用于对具有至少三个声道的多声道信号进行编码的方法。该方法包括:
-在第一迭代步骤中计算至少三个声道中的每对之间的声道间相关值,在第一迭代步骤中选择具有最高值或具有高于阈值的值的对,并且通过使用多声道处理操作而处理所选择的对,以导出针对所选择的对的第一多声道参数并导出第一处理声道;
-在第二迭代步骤中通过使用所述处理声道的至少一个而执行所述计算、所述选择和所述处理,以导出第二多声道参数和第二处理声道;
-对根据通过迭代处理器执行的迭代处理得到的声道进行编码以获得编码声道;以及
-产生具有编码声道以及第一和第二多声道参数的编码多声道信号。
进一步的实施例提供了一种用于对具有编码声道以及至少第一和第二多声道参数的编码多声道信号进行解码的方法。该方法包括:
-对编码声道进行解码以获得解码声道;和
-通过使用由第二多声道参数标识的解码声道的第二对和通过使用第二多声道参数来执行多声道处理,以获得处理声道,并通过使用由第一多声道参数标识的声道的第一对和使用第一多声道参数来执行进一步的多声道处理,其中声道的第一对包括至少一个处理声道。
附图说明
这里通过参考附图来描述本发明的实施例。
图1示出了根据实施例的对具有至少三个声道的多声道信号进行编码的装置的示意性框图。
图2示出了根据实施例的对具有至少三个声道的多声道信号进行编码的装置的示意性框图。
图3示出了根据实施例的立体声盒的示意性框图。
图4示出了根据实施例的对具有编码声道以及至少第一和第二多声道参数的编码多声道信号进行解码的装置的示意性框图。
图5示出了根据实施例的对具有至少三个声道的多声道信号进行编码的方法的流程图。
图6示出了根据实施例的对具有编码声道以及至少第一和第二多声道参数的编码多声道信号进行解码的方法的流程图。
具体实施方式
具有相同或等效功能的相同或等效组件在下面的描述中由相同或等效的附图标记来表示。
在下面的描述中,阐述多个细节以提供对本发明的实施例的更完全的解释。然而,本领域技术人员将清楚,可以在不具有这些具体细节的情况下实现本发明的实施例。在其他示例中,公知结构和设备以框图形式而不是详细地被示出,以避免模糊本发明的实施例。此外,在下文中描述的不同实施例可以彼此结合,除非另外详细说明。
图1示出了对具有至少三个声道CH1至CH3的多声道信号101进行编码的装置(编码器)100的示意性框图。装置100包括迭代处理器102、声道编码器104以及输出接口106。
迭代处理器102被配置为在第一迭代步骤中计算至少三个声道CH1至CH3中的每对之间的声道间相关值,在第一迭代步骤中选择具有最高值或具有高于阈值的值的对,并且通过使用多声道处理操作而处理所选择的对,以导出针对所选择的对的第一多声道参数MCH_PAR1并导出第一处理声道P1和P2。此外,迭代处理器102被配置为在第二迭代步骤中通过使用处理声道P1或P2的至少一个而执行该计算、该选择和该处理,以导出第二多声道参数MCH_PAR2与第二处理声道P3和P4。
例如,如图1所示,迭代处理器102可在第一迭代步骤中计算至少三个声道CH1至CH3中的第一对之间的声道间相关值、至少三个声道CH1至CH3中的第二对之间的声道间相关值、和至少三个声道CH1至CH3中的第三对之间的声道间相关值,其中第一对由第一声道CH1与第二声道CH2组成,第二对由第二声道CH2与第三声道CH3组成,第三对由第一声道CH1与第三声道CH3组成。
在图1中,假设由第一声道CH1与第三声道CH3组成的第三对包括最高声道间相关值,从而迭代处理器102在第一迭代步骤中选择具有最高声道间相关值的第三对并且通过使用多声道处理操作来处理所选择的对,即第三对,以导出针对所选择的对的第一多声道参数MCH_PAR1并且导出第一处理声道P1和P2。
此外,迭代处理器102是可被配置为在第二迭代步骤中计算在至少三个声道CH1至CH3的每对之间的声道间相关值与处理声道P1和P2,以用于在第二迭代步骤中选择具有最高声道间相关值或具有高于阈值的值的对。由此,迭代处理器102可被配置为在第二迭代步骤中(或在任何进一步的迭代步骤中)不选择在第一迭代步骤中所选择的对。
参考图1所示的示例,迭代处理器102还可以计算声道的由第一声道CH1与第一处理声道P1所组成的第四对之间的声道间相关值、由第一声道CH1与第二处理声道P2所组成的第五对之间的声道间相关值、由第二声道CH2与第一处理声道P1所组成的第六对之间的声道间相关值、由第二声道CH2与第二处理声道P2所组成的第七对之间的声道间相关值、由第三声道CH3与第一处理声道P1所组成的第八对之间的声道间相关值、由第三声道CH3与第二处理声道P2所组成的第九对之间的声道间相关值以及由第一处理声道P1与第二处理声道P2所组成的第十对之间的声道间相关值。
在图1中,假设在第二迭代步骤中由第二声道CH2与第一处理声道P1所组成的第六对具有最高声道间相关值,使得迭代处理器102在第二迭代步骤中选择第六对并且通过使用多声道处理操作来处理所选择的对,即第六对,以导出针对所选择的对的第二多声道参数MCH_PAR2并且导出第二处理声道P3和P4。
迭代处理器102可被配置为仅在对的电平差(1evel difference)小于阈值时选择该对,该阈值小于40dB、25dB、12dB、或小于6dB。由此,25dB或40dB的阈值对应于3度或0.5度的旋转角度。
迭代处理器102可被配置为计算归一化(normalized)整数相关值,其中迭代处理器102可被配置为当整数相关值大于例如0.2或优选为0.3时选择对。
此外,迭代处理器102可向声道编码器104提供由多声道处理所产生的声道。例如,参考图1,迭代处理器102可向声道编码器104提供由在第二迭代步骤中执行的多声道处理所产生的第三处理声道P3和第四处理声道P4,以及由在第一迭代步骤中执行的多声道处理所产生的第二处理声道P2。因此,迭代处理器102可仅向声道编码器104提供那些未在后续迭代步骤中被(进一步)处理的处理声道。如图1所示,第一处理声道P1未被提供给声道编码器104,这是因为它在第二迭代步骤中被另外处理。
声道编码器104可被配置为对由迭代处理器102执行的迭代处理(或多声道处理)所产生的声道P2至P4进行编码,以获得编码声道E1至E3。
例如,声道编码器104可被配置为使用单声道编码器(或单声道盒或单声道工具)120_1至120_3来对由迭代处理(或多声道处理)产生的声道P2至P4进行编码。单声道盒可被配置为编码声道,使得与对具有较高能量(或较高振幅)的声道编码相比,对具有较少能量(或较小振幅)的声道编码需要较少的比特。单声道盒120_1至120_3可例如为基于变换的音频编码器。此外,声道编码器104可被配置为使用立体声编码器(例如参数立体声编码器或损耗立体声编码器)来对由迭代处理(或多声道处理)产生的声道P2至P4进行编码。
输出接口106可被配置为产生编码多声道信号107,所述编码多声道信号107具有编码声道E1至E3以及第一与第二多声道参数MCH_PAR1、MCH_PAR2。
例如,输出接口106可被配置为将编码多声道信号107产生为串行信号(serialsignal)或串行比特流(serial bit stream),从而第二多声道参数MCH_PAR2在编码信号107内并位于第一多声道参数MCH_PAR1之前。因此,解码器(其实施例将在下文结合图4描述)将在第一多声道参数MCH_PAR1之前接收第二多声道参数MCH_PAR2。
在图1中,迭代处理器102示例性地执行两个多声道处理操作,其中多声道处理操作在第一迭代步骤中,而另一多声道处理操作在第二迭代步骤中。自然地,迭代处理器102还可在后续的迭代步骤中执行其他的多声道处理操作。因此,迭代处理器102可被配置为执行迭代步骤直到达到了迭代终止标准。迭代终止标准可以是迭代步骤的最大数量等于多声道信号101的声道总数量或比多声道信号101的声道总数量大两个,或者其中迭代终止标准可以是当声道间相关值不具有大于阈值的值时,而阈值优选大于0.2或阈值优选等于0.3。在其他实施例中,迭代终止标准可以是迭代步骤的最大数量等于或大于多声道信号101的声道总数量,或者其中迭代终止标准是为当声道间相关值不具有大于阈值的值时,而阈值优选大于0.2或阈值优选等于0.3。
为了说明目的,由迭代处理器102在第一迭代步骤与第二迭代步骤中执行的多声道处理操作示例性地由图1中的处理盒110、112来说明。处理盒110、112可以硬件或软件实现。处理盒110、112可例如为立体声盒。
因此,声道间信号依赖性可通过分层地应用已知的联合立体声编码工具而被利用。与先前的MPEG方法相比,要被处理的信号不由固定信号路径(例如立体声编码树)预先确定,而是可被动态地改变以适应于输入信号特性。实际立体声盒的输入可为(1)未处理声道,例如声道CH1至CH3、(2)前立体声盒的输出,例如被处理的信号P1至P4、或(3)未处理声道与前立体声盒的输出的组合。
在立体声盒110、112内的处理可为基于预测的(如在USAC中的复预测盒)或基于KLT/PCA的(输入声道在编码器中被旋转(例如经由2×2旋转矩阵)以最大化能量浓缩,即将信号能量集中于一个声道内,在解码器内被旋转信号将会再被变换到原始输入信号方向)。
在编码器100的可能的实现中,(1)该编码器计算在各声道对之间的声道间相关性并从输入信号选择合适的信号对,并且将立体声工具应用于所选择声道;(2)该编码器再计算在所有声道(未处理声道以及被处理的中间输出声道)之间的声道间相关性并从输入信号选择合适的信号对,并且将立体声工具应用于所选择声道;以及(3)该编码器重复步骤(2)直到所有声道间相关性低于阈值或如果应用了最大数量的变换。
如前所述,要被编码器100(更精确地说是迭代处理器102)处理的信号对不被固定信号路径(例如立体声编码树)所确定,而是可以动态地改变以适应于输入信号特性。因此,编码器100(或迭代处理器102)可被配置为根据多声道(输入)信号101的至少三个声道CH1至CH3而构建立体声树。换言之,编码器100(或迭代处理器102)可被配置为基于声道间相关性而构建立体声树(例如通过在第一迭代步骤中计算在至少三个声道CH1至CH3的每对之间的声道间相关值,以在第一迭代步骤中选择具有最高值或高于阈值的值的对,并且通过在第二迭代步骤中计算在至少三个声道的每对之间的声道间相关值以在第二迭代步骤中选择具有最高值或高于阈值的值的对)。根据单步骤方法,可针对可能包含所有在先前迭代中可能被处理的声道的相关性的每个迭代而计算相关矩阵。
如前所述,迭代处理器102可被配置为在第一迭代步骤中导出针对所选择的对的第一多声道参数MCH_PAR1并在第二迭代步骤中导出针对所选择的对的第二多声道参数MCH_PAR2。第一多声道参数MCH_PAR1可包括第一声道对标识(或索引),其标识(或标示(signal))在第一迭代步骤中被选择的声道对,其中第二多声道参数MCH_PAR2可包括第二声道对标识(或索引),其标识(或标示)在第二迭代步骤中选择的声道对。
以下描述了输入信号的高效率索引。例如,声道对可通过根据声道的总数量使用针对每对的唯一索引而被有效地标示。例如,针对六声道的对的索引可以在下表中示出:
0 1 2 3 4 5
0 0 1 2 3 4
1 5 6 7 8
2 9 10 11
3 12 13
4 14
5
例如,在上表中,索引5可标示由第一和第二声道组成的对。相似地,索引6可标示由第一和第三声道组成的对。
针对n个声道的可能声道对索引的总数量可如下计算:
numPairs=numChannels×(numChannels-1)/2
因此,需要用来标示声道对的比特数量为如下:
numBits=floor(log2(numPairs-1))+1
此外,编码器100可使用声道掩码。多声道工具的配置可包含对该工具对于哪些声道是有效的加以指示的声道掩码。因此,在考虑更有效率的编码时,可从该声道对索引中移除LFE(LFE=低频效应/增强声道)。例如,对于11.1设定,在允许以6比特而非7比特进行标示的情况下,这可使声道对索引的数量从12×11/2=66减少到11×10/2=55。该机制还可被用于排除意图作为单声道对象(例如多语言音轨)的声道。关于对声道掩码的解码,可产生声道图(channelMap)以允许声道对索引再映射(re-mapping)至解码器声道。
此外,迭代处理器102可被配置为导出针对第一帧的多个选择对指示,其中输出接口106可被配置为在多声道信号107中包括针对第一帧之后的第二帧的保持指示符,该指示符指示第二帧具有与第一帧相同的多个选择对指示。
保持指示符或保持树标志可被配置为标示没有新的树被传送,但是最后的立体声树应被使用。如果声道相关性在一段较长时间维持不变,则这可用来避免相同的立体声树配置的多次传送。
图2示出了立体声盒110、112的示意性框图。立体声盒110、112包括针对第一输入信号I1与第二输入信号I2的输入,并包括针对第一输出信号O1与第二输出信号O2的输出。如图2所示,来自输入信号I1、I2的输出信号O1、O2的依赖性可通过s-参数S1至S4来描述。
迭代处理器102可使用(或包括)立体声盒110、112以执行对输入声道和/或处理声道的多声道处理操作,从而导出(进一步)处理声道。例如,迭代处理器102可被配置为使用一般性的、基于预测的或基于KLT(Karhunen-Loève变换)的旋转立体声盒110、112。
一般性的编码器(或编码器侧的立体声盒)可被配置为对输入信号I1、I2进行编码以获得基于下列方程式的输出信号O1、O2:
Figure BDA0002768009920000101
一般性的解码器(或解码器侧的立体声盒)可被配置为对输入信号I1、I2进行解码以获得基于下列方程式的输出信号O1、O2:
Figure BDA0002768009920000102
基于预测的编码器(或编码器侧的立体声盒)可被配置为对输入信号I1、I2进行编码以获得基于下列方程式的输出信号O1、O2:
Figure BDA0002768009920000111
其中p是为预测系数。
基于预测的解码器(或解码器侧的立体声盒)可被配置为对输入信号I1、I2进行解码以获得基于下列方程式的输出信号O1、O2:
Figure BDA0002768009920000112
基于KLT的旋转编码器(或编码器侧的立体声盒)可被配置为对输入信号I1、I2进行编码以获得基于下列方程式的输出信号O1、O2:
Figure BDA0002768009920000113
基于KLT的旋转解码器(或解码器侧的立体声盒)可被配置为对输入信号I1、I2进行解码以获得基于下列方程式的输出信号O1、O2(反向旋转):
Figure BDA0002768009920000114
在下文中,描述了对基于KLT的旋转的旋转角度α的计算。
针对基于KLT的旋转的旋转角度α可如下定义:
Figure BDA0002768009920000115
其中cxy是为非归一化相关矩阵的元素,其中c11、c22是为声道能量。
这可通过使用atan2函数来实现,以考虑到在分子中的负相关之间的区别以及在分母中的负能量差:
alpha=0.5×atan2(2×correlation[ch1][ch2],
(correlation[ch1][ch1]-correlation[ch2][ch2]))。
此外,迭代处理器102可被配置为通过使用包括多个频带在内的每个声道的帧而计算声道间相关性,从而可获得针对多个频带的单个声道间相关值,其中迭代处理器102可被配置为针对多个频带中的每个频带执行多声道处理,使得可从每个频带获得第一或第二多声道参数。
因此,迭代处理器102可被配置为计算在多声道处理中的立体声参数,其中迭代处理器102可被配置为仅在立体声参数高于由立体声量化器(例如基于KLT的旋转编码器)所定义的量化到零阈值的频带中执行立体声处理。立体声参数可例如为MS开/关、或旋转角度、或预测系数。
例如,迭代处理器102可被配置为计算在多声道处理中的旋转角度,其中迭代处理器102可被配置为仅在旋转角度高于由立体声量化器(例如基于KLT的旋转编码器)所定义的量化到零阈值的频带中执行旋转处理。
因此,编码器100(或输出接口106)可被配置为发送变换/旋转信息,作为针对完整频谱(全频盒(full band box))的参数或针对部分频谱的多个频率依赖参数。
编码器100可被配置为基于下表而产生比特流107:
表1-mpegh3daExtElementConfig()的语法
Figure BDA0002768009920000121
Figure BDA0002768009920000131
表21-MCCConfig()的语法
Figure BDA0002768009920000132
表32-MultichannelCodingBoxBandWise()的语法
Figure BDA0002768009920000141
Figure BDA0002768009920000151
表4-MultichannelCodingBoxFullband()的语法
Figure BDA0002768009920000152
表5-MultichannelCodingFrame()的语法
Figure BDA0002768009920000153
Figure BDA0002768009920000161
表6-usacExtElementType的值
Figure BDA0002768009920000162
表7-用于扩展有效载荷解码的数据块的解释
usacExtElementType 连接的usacExtElementSegmentData表示:
ID_EXT_ELE_FILL Series of fill_byte
ID_EXT_ELE_MPEGS SpatialFrame()
ID_EXT_ELE_SAOC SaocFrame()
ID_EXT_ELE_AUDIOPREROLL AudioPreRo||()
ID_EXT_ELE_UNI_DRC uniDrcGain()as defined in ISO/IEC 23003-4
ID_EXT_ELE_OBJ_METADATA object_metadata()
ID_EXT_ELE_SAOC_3D SaoCH3DFrame()
ID_EXT_ELE_HOA HOAFrame()
ID_EXT_ELE_FMT_CNVRTR FormatConverterFrame()
ID_EXT_ELE_MCC MultichannelCodingFrame()
未知 未知数据,该数据块应被丢弃。
图3示出了根据实施例的迭代处理器102的示意性框图。在图3所示的实施例中,多声道信号101是为5.1声道信号,其具有六个声道:左声道L、右声道R、左环绕声道Ls、右环绕声道Rs、中间声道C以及低频效果声道LFE。
如图3所示,LFE声道不被迭代处理器102处理。这可能是由于在LFE声道与其他五个声道L、R、Ls、Rs、C中的每个之间的的声道间相关值太小,或是由于声道掩码指示不要处理LFE声道,这种情况在下文中假设。
在第一迭代步骤中,迭代处理器102计算五个声道L、R、Ls、Rs、C中的每对之间的声道间相关值,以在第一迭代步骤中选择具有最高值或具有高于阈值的值的对。在图3中,假设左声道L与右声道R具有最高值,使得迭代处理器102通过使用执行多声道操作处理操作的立体声盒(或立体声工具)110而处理左声道L与右声道R,以导出第一和第二处理声道P1和P2。
在第二迭代步骤中,迭代处理器102计算五个声道L、R、Ls、Rs、C的每对之间与处理声道P1和P2之间的声道间相关值,以在第二迭代步骤中选择具有最高值或具有高于阈值的值的对。在图3中,假设左环绕声道Ls与右环绕声道Rs具有最高值,使得迭代处理器102通过使用立体声盒(或立体声工具)112而处理左环绕声道Ls与右环绕声道Rs,以导出第三和第四处理声道P3和P4。
在第三迭代步骤中,迭代处理器102计算五个声道L、R、Ls、Rs、C的每对之间与处理声道P1至P4之间的声道间相关值,以在第三迭代步骤中选择具有最高值或具有高于阈值的值的对。在图3中,假设第一处理声道P1与第三处理声道P3具有最高值,使得迭代处理器102通过使用立体声盒(或立体声工具)114而处理第一处理声道P1与第三处理声道P3,以导出第五和第六处理声道P5和P6。
在第四迭代步骤中,迭代处理器102计算五个声道L、R、Ls、Rs、C的每对之间与处理声道P1至P6之间的声道间相关值,以在第四迭代步骤中选择具有最高值或具有高于阈值的值的对。在图3中,假设第五处理声道P5与中间声道C具有最高值,使得迭代处理器102通过使用立体声盒(或立体声工具)115而处理第五处理声道P5与第中间声道C,以导出第七和第八处理声道P7和P8。
立体声盒110至116可以是MS立体声盒,即被配置为提供中声道与侧声道的中/侧立体声盒。中声道可以是立体声盒的输入声道的总和,其中侧声道可以是立体声盒的输入声道之间的差。此外,立体声盒110、116可以是旋转盒或立体声预测盒。
在图3中,第一处理声道P1、第三处理声道P3与第五处理声道P5可以是中声道,其中第二处理声道P2、第四处理声道P4与第六处理声道P6可以是侧声道。
另外,如图3所示,迭代处理器102可被配置为执行在第二迭代步骤中的计算、选择和处理,并且如果可行的话,在任何进一步的迭代步骤中使用输入声道L、R、Ls、Rs、C和处理声道的(仅仅)中声道P1、P3、P5。换言之,迭代处理器102可被配置为在第二迭代步骤中的计算、选择和处理中不使用处理声道的侧声道P1、P3、P5,并且如果可行的话,也不在任何进一步的迭代步骤中使用该所选择的对。
图4示出了对具有编码声道E1至E3以及至少第一和第二多声道参数MCH_PAR1和MCH_PAR2的编码多声道信号107进行解码的装置(解码器)200的示意性框图。装置200包括声道解码器202与多声道处理器204。
声道解码器202被配置为对编码声道E1至E3进行解码以获得解码声道D1至D3。
例如,声道解码器202可包括至少三个单声道解码器(或单声道盒、或单声道工具)206_1至206_3,其中单声道解码器206_1至206_3中的每个可被配置为对至少三个编码声道E1至E3之一进行解码,以获得相应的解码声道E1至E3。单声道解码器206_1至206_3可例如为基于变换的音频解码器。
多声道处理器204被配置为通过使用由第二多声道参数MCH_PAR2所标识的解码声道的第二对并通过使用第二多声道参数MCH_PAR2来执行多声道处理,以获得处理声道,并且通过使用由第一多声道参数MCH_PAR1所标识的声道的第一对并通过使用第一多声道参数MCH_PAR1来执行进一步的多声道处理,其中声道的第一对包括至少一个处理声道。
如图4所示的示例,第二多声道参数MCH_PAR2可指示(或标示)解码声道的第二对由第一解码声道D1和第二解码声道D2组成。因此,多声道处理器204通过使用由第一解码声道D1和第二解码声道D2(由第二多声道参数MCH_PAR2标识)组成的解码声道的第二对并通过使用第二多声道参数MCH_PAR2来执行多声道处理,以获得处理声道P1*和P2*。第一多声道参数MCH_PAR1可指示解码声道的第一对由第一处理声道P1*和第三解码声道D3组成。因此,多声道处理器204通过使用由第一处理声道P1*和第三解码声道D3(由第一多声道参数MCH_PAR1标识)组成的解码声道的第一对并通过使用第一多声道参数MCH_PAR1来执行多声道处理,以获得处理声道P3*和P4*。
此外,多声道处理器204可提供第三处理声道P3*作为第一声道CH1、第四处理声道P4*作为第三声道CH3、以及第二处理声道P2*作为第二声道CH2。
假设图4所示的解码器200从图1所示的编码器100接收编码多声道信号107,解码器200的第一解码声道D1可等效于编码器100的第三处理声道P3,其中解码器200的第二解码声道D2可等效于编码器100的第四处理声道P4,并且解码器200的第三解码声道D3可等效于编码器100的第二处理声道P2。另外,解码器200的第一处理声道P1*可等效于编码器100的第一处理声道P1。
另外,编码多声道信号107可为串行信号,其中第二多声道参数MCH_PAR2在第一多声道参数MCH_PAR1之前在解码器200处被接收。在此情况下,多声道处理器204可被配置为按照多声道参数MCH_PAR1、MCH_PAR2被解码器接收的顺序来处理解码声道。在图4所示的示例中,解码器在第一多声道参数MCH_PAR1之前接收第二多声道参数MCH_PAR2,并且因此在通过使用由第一多声道参数MCH_PAR1标识的解码声道的第一对(由第一处理声道P1*和第三解码声道D3组成)来执行多声道处理之前,通过使用由第二多声道参数MCH_PAR2标识的解码声道的第二对(由第一和第二解码声道D1和D2组成)来执行多声道处理。
在图4中,多声道处理器204示例性地执行两个多声道处理操作。为了说明目的,由多声道处理器204执行的多声道处理操作在图4中以处理盒208、210来说明。处理盒208、210可以硬件或软件来实现。处理盒208、210可例如为如上文关于编码器100所述的立体声盒,例如一般解码器(或解码器侧的立体声盒)、基于预测的解码器(或解码器侧的立体声盒)、或基于KLT的旋转解码器(或解码器侧的立体声盒)。
例如,编码器100可使用基于KLT的旋转编码器(或编码器侧的立体声盒)。在此情况下,编码器100可导出第一和第二多声道参数MCH_PAR1、MCH_PAE2,使得第一和第二多声道参数MCH_PAR1、MCH_PAE2包括旋转角度。旋转角度可被差分编码。因此,解码器200的多声道处理器204可包括差分解码器以用于对被差分编码的旋转角度进行差分解码。
装置200还可以包括输入接口212,其被配置为接收并处理编码多声道信号107,以向声道解码器202提供编码声道E1至E3并向多声道处理器204提供第一和第二多声道参数MCH_PAR1、MCH_PAR2。
就如前述,保持指示符(或保持树标志)可被用来标示没有新的树要被传送,但是最后的立体声树应被使用。如果声道相关性在一段较长时间维持不变,则这可用来避免相同的立体声树配置的多次传送。
因此,当编码多声道信号107包括针对第一帧的第一或第二多声道参数MCH_PAR1、MCH_PAR2以及针对第一帧之后的第二帧的保持指示符时,多声道处理器204可被配置为对如同在第一帧中所使用的声道的第二对或第一对执行在第二帧中的多声道处理或进一步的多声道处理。
多声道处理与进一步的多声道处理可包括使用立体声参数的立体声处理,其中针对各个比例因子频带(scale factor band)或解码声道D1至D3的比例因子频带的组,第一立体声参数被包括在第一多声道参数MCH_PAR1中并且第二立体声参数被包括在第二多声道参数MCH_PAR2中。因此,第一立体声参数与第二立体声参数可属于相同类型,例如旋转角度或预测系数。自然地,第一立体声参数与第二立体声参数可属于不同类型。例如,第一立体声参数可以是旋转角度,其中第二立体声参数可以是预测系数,反的亦可。
另外,第一或第二多声道参数MCH_PAR1、MCH_PAR2可包括多声道处理掩码,其指示哪些比例因子频带经过多声道处理以及哪些比例因子频带未经过多声道处理。因此,多声道处理器204可被配置为不执行在由多声道处理掩码指示的比例因子频带中的多声道处理。
第一与第二多声道参数MCH_PAR1、MCH_PAR2可分别包括声道对标识(或索引),其中多声道处理器204可被配置为通过使用预定义的解码规则或在编码多声道信号中所指示的解码规则而对该声道对标识(或索引)进行解码。
例如,声道对可通过根据声道的总数量来使用针对每对的唯一索引而被有效地标示,如上文关于编码器100的描述。
此外,解码规则可以是霍夫曼(Huffman)解码规则,其中多声道处理器204可被配置为对声道对标识执行霍夫曼解码。
编码多声道信号107还可以包括多声道处理允许指示符,其指示多声道处理可被允许的解码声道的仅仅子组并且指示多声道处理不被允许的至少一个解码声道。因此,多声道处理器204可被配置为不对该至少一个解码声道执行任何多声道处理,对于该至少一个解码声道而言,如多声道处理允许指示符所指示的那样,多声道处理不被允许。
例如,当多声道信号为5.1声道信号时,多声道处理允许指示符可指示多声道处理仅允许用于5声道,即右声道R、左声道L、右环绕声道Rs、左环绕声道Ls和中间声道C,其中多声道处理不被允许用于LFE声道。
对于解码处理(声道对索引的解码),可使用下面的c代码。因此,对于所有的声道对,需要具有有效KLT处理的声道的数量(nChannels)以及当前帧的声道对的数量(numPairs)。
Figure BDA0002768009920000211
Figure BDA0002768009920000221
为了对针对非分频段的角度的预测系数进行解码,可使用下面的c代码:
Figure BDA0002768009920000222
Figure BDA0002768009920000231
为了对针对非分频段的KLT角度的预测系数进行解码,可使用下面的c代码:
Figure BDA0002768009920000232
Figure BDA0002768009920000241
为了避免不同平台上的三角函数的浮点差异,可使用下面的用于将角度索引直接转换成sin/cos的查找表:
tabIndexToSinAlpha[64]={
-1.000000f,-0.998795f,-0.995185f,-0.989177f,-0.980785f,-0.970031f,-0.956940f,-0.941544f,
-0.923880f,-0.903989f,-0.881921f,-0.857729f,-0.831470f,-0.803208f,-0.773010f,-0.740951f,
-0.707107f,-0.671559f,-0.634393f,-0.595699f,-0.555570f,-0.514103f,-0.471397f,-0.427555f,
-0.382683f,-0.336890f,-0.290285f,-0.242980f,-0.195090f,-0.146730f,-0.098017f,-0.049068f,
0.000000f,0.049068f,0.098017f,0.146730f,0.195090f,0.242980f,0.290285f,0.336890f,
0.382683f,0.427555f,0.471397f,0.514103f,0.555570f,0.595699f,0.634393f,0.671559f,
0.707107f,0.740951f,0.773010f,0.803208f,0.831470f,0.857729f,0.881921f,0.903989f,
0.923880f,0.941544f,0.956940f,0.970031f,0.980785f,0.989177f,0.995185f,0.998795f
};
tabIndexToCosAlpha[64]={
0.000000f,0.049068f,0.098017f,O.146730f,0.195090f,O.242980f,0.290285f,0.336890f,
0.382683f,0.427555f,0.471397f,0.514103f,0.555570f,0.595699f,0.634393f,0.671559f,
0.707107f,0.740951f,0.773010f,0.803208f,0.831470f,0.857729f,0.881921f,0.903989f,
0.923880f,0.941544f,0.956940f,0.970031f,0.980785f,0.989177f,0.995185f,0.998795f,
1.000000f,0.998795f,0.995185f,0.989177f,0.980785f,0.970031f,0.956940f,0.941544f,
0.923880f,0.903989f,0.881921f,0.857729f,0.831470f,0.803208f,0.773010f,0.740951f,
0.707107f,0.671559f,0.634393f,0.595699f,0.555570f,0.514103f,0.471397f,0.427555f,
0.382683f,0.336890f,0.290285f,0.242980f,0.195090f,0.146730f,0.098017f,0.049068f
};
为了对多声道编码进行解码,可以使用下面的c代码以用于基于KLT旋转的方法:
Figure BDA0002768009920000261
Figure BDA0002768009920000271
为了分频段处理,可以使用下面的c代码:
Figure BDA0002768009920000272
Figure BDA0002768009920000281
为了应用KLT旋转,可以使用下面的c代码:
Figure BDA0002768009920000282
图5显示了用于对具有至少三个声道的多声道信号进行编码的方法300的流程图。方法300包括步骤302,在第一迭代步骤中计算在至少三个声道中的每对之间的声道间相关值,在第一迭代步骤中选择具有最高值或具有高于阈值的值的对,并且通过使用多声道处理操作而处理所选择的对,以导出针对所选择的对的第一多声道参数并导出第一处理声道;步骤304,在第二迭代步骤中通过使用处理声道的至少一个而执行所述计算、所述选择和所述处理,以导出第二多声道参数和第二处理声道;步骤306,对根据通过迭代处理器执行的迭代处理得到的声道进行编码以获得编码声道;以及步骤308,产生具有编码声道以及第一和第二多声道参数的编码多声道信号。
图6示出了对具有编码声道以及至少第一和第二多声道参数的编码多声道信号进行解码的方法400的流程图。方法400包括步骤402,对编码声道进行解码以获得解码声道;以及步骤404,通过使用由第二多声道参数标识的解码声道的第二对和通过使用第二多声道参数来执行多声道处理,以获得处理声道,并通过使用由第一多声道参数标识的声道的第一对和使用第一多声道参数来执行进一步的多声道处理,其中声道的第一对包括至少一个处理声道。
尽管已在框图的背景(其中,所述块表示真实的或逻辑的硬件组件)下描述了本发明,但本发明也可以实现为计算机实施方法。在后者的情况下,块表示相应方法步骤,其中这些步骤代表由对应逻辑或实体硬件块执行的功能性。
虽然已经在装置的上下文中描述了一些方面,但是将清楚的是,这些方面还表示对应方法的描述,其中,块或设备对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也表示对相应块或项或者相应装置的特征的描述。可以由(或使用)硬件装置(诸如,微处理器、可编程计算机或电子电路)来执行一些或全部方法步骤。在一些实施例中,可以由这种装置来执行最重要方法步骤中的某一个或多个方法步骤。
本发明的经传输或编码的信号可以存储在数字存储介质上或可以在诸如无线传输介质的传输介质或诸如因特网的有线传输介质上传输。
取决于某些实现要求,可以在硬件中或在软件中实现本发明的实施例。可以通过使用其上存储有电子可读控制信号的数字存储介质(例如,软盘、DVD、Blu-Ray、CD、ROM、PROM和EPROM、EEPROM或闪存)来执行所述实现方案,所述控制信号与可编程计算机系统合作(或能够与之合作),使得执行各个方法。因此,数字存储介质可以是计算机可读的。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,该电子可读控制信号能够与可编程计算机系统协作从而执行本文所述的方法之一。
通常,本发明的实施例可以实现为具有程序代码的计算机程序产品,程序代码可操作以在计算机程序产品在计算机上运行时执行方法之一。程序代码可以例如存储在机器可读载体上。
其他实施例包括存储在机器可读载体上的计算机程序,该计算机程序用于执行本文所述的方法之一。
换言之,本发明方法的实施例因此是具有程序代码的计算机程序,该程序代码用于在计算机程序在计算机上运行时执行本文所述的方法之一。
因此,本发明方法的另一实施例是数据载体(或诸如数字存储介质或计算机可读介质的非暂时性存储介质),包含记录于其上的用于执行本文所述方法之一的计算机程序。数据载体、数字存储介质或记录的介质通常是有形的和/或非暂时性的。
因此,本发明方法的另一实施例是表示用于执行本文所述的方法之一的计算机程序的数据流或信号序列。数据流或信号序列可以例如被配置为经由数据通信连接(例如,经由互联网)传送。
另一实施例包括处理装置,例如,配置为或适用于执行本文所述的方法之一的计算机或可编程逻辑器件。
另一实施例包括其上安装有计算机程序的计算机,该计算机程序用于执行本文所述的方法之一。
根据本发明的另一实施例包括被配置为向接收机(例如,以电子方式或以光学方式)传输计算机程序的装置或系统,该计算机程序用于执行本文所述的方法之一。接收机可以是例如计算机、移动设备、存储设备等。装置或系统可以例如包括用于向接收机传送计算机程序的文件服务器。
在一些实施例中,可编程逻辑器件(例如,现场可编程门阵列)可以用于执行本文所述的方法的一些或全部功能。在一些实施例中,现场可编程门阵列可以与微处理器协作以执行本文所述的方法之一。通常,方法优选地由任意硬件装置来执行。
上述实施例对于本发明的原理仅是说明性的。应当理解的是:本文所述的布置和细节的修改和变形对于本领域其他技术人员将是显而易见的。因此,旨在仅由所附专利权利要求的范围来限制而不是由借助对本文的实施例的描述和解释所给出的具体细节来限制。

Claims (27)

1.一种用于对具有至少三个声道(CH1至CH3)的多声道信号(101)进行编码的装置(100),包括:
迭代处理器(102),用于在第一迭代步骤中计算所述至少三个声道(CH1至CH3)中的每对之间的声道间相关值,在第一迭代步骤中选择具有最高值或具有高于阈值的值的对,以及使用多声道处理操作(110、112)处理所选择的对,以导出针对所选择的对的第一多声道参数(MCH_PAR1)并导出第一处理声道(P1、P2),
其中,所述迭代处理器(102)被配置为在第二迭代步骤中使用处理声道(P1)中的至少一个执行所述计算、所述选择和所述处理,以导出第二多声道参数(MCH_PAR2)和第二处理声道(P3、P4);
声道编码器,用于对从根据所述迭代处理器(104)执行的迭代处理得到的声道(P2至P4)进行编码以获得编码声道(E1至E3);以及
输出接口(106),用于产生具有所述编码声道(E1至E3)以及第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)的编码多声道信号(107)。
2.根据权利要求1所述的装置(100),其中,所述输出接口(106)被配置为将所述编码多声道信号(107)产生为串行比特流,使得第二多声道参数(MCH_PAR2)在所述编码信号中位于第一多声道参数(MCH_PAR1)之前。
3.根据权利要求1所述的装置(100),其中,所述迭代处理器(102)被配置为执行包括包含以下各项的组中的至少一项在内的立体声处理:使用根据所选择的对的旋转角度计算的旋转处理以及预测处理。
4.根据权利要求1所述的装置(100),其中,第一多声道参数(MCH_PAR1)包括在第一迭代步骤中所选择的对中的声道的第一标识,并且第二多声道参数(MCH_PAR2)包括在第二迭代步骤中所选择的对中的声道的第二标识。
5.根据权利要求1所述的装置(100),其中,所述迭代处理器(102)被配置为使用包括多个频带的每个声道的帧计算声道间相关性,以便获得针对所述多个频带的单个声道间相关值,并且
其中,所述迭代处理器(104)被配置为针对所述多个频带中的每个频带执行所述多声道处理,从而针对所述多个频带中的每个频带获得第一多声道参数或第二多声道参数(MCH_PAR1、MCH_PAR2)。
6.根据权利要求1所述的装置(100),其中,所述迭代处理器(102)被配置为针对第一帧导出多个选择对指示,并且所述输出接口(106)被配置为针对第一帧之后的第二帧在所述多声道信号(107)中包括保持指示符,所述保持指示符指示第二帧与第一帧具有相同的多个选择对指示。
7.根据权利要求1所述的装置(100),其中,所述迭代处理器(102)被配置为仅在对的电平差小于阈值时才选择所述对,所述阈值小于40dB或25dB或12dB,或者小于6dB。
8.根据权利要求1所述的装置(100),其中,所述迭代处理器(102)被配置为计算归一化相关值,并且所述迭代处理器(102)被配置为在所述相关值大于0.2并且优选为0.3时选择对。
9.根据权利要求1所述的装置(100),其中,所述迭代处理器(102)被配置为在所述多声道处理中计算立体声参数,并且所述迭代处理器(102)被配置为仅在立体声参数高于由立体声参数量化器定义的量化到零阈值的频带中执行立体声处理。
10.根据权利要求1所述的装置(100),其中,所述迭代处理器(102)被配置为在所述多声道处理中计算旋转角度,并且所述迭代处理器(102)被配置为仅在旋转角度高于解码器侧去量化到零阈值的频带中执行旋转处理。
11.根据权利要求1所述的装置(100),其中,所述迭代处理器(102)被配置为在第二迭代步骤中不选择在第一迭代步骤中所选择的对,并且如果可行的话,在任何进一步的迭代步骤中也不选择该所选择的对。
12.根据权利要求1所述的装置(100),其中,所述迭代处理器(102)被配置为执行迭代步骤直到达到迭代终止标准,其中,所述迭代终止标准是迭代步骤的最大数量等于所述多声道信号(101)的声道的总数量或比所述多声道信号(101)的声道的总数量大两个,或者所述迭代终止标准是当所述声道间相关值不具有大于所述阈值的值时。
13.根据权利要求1所述的装置(100),其中,所述迭代处理器(102)被配置为在第一迭代步骤中使用所述多声道处理来处理所选择的对,使得所述处理声道(P1、P2)是中声道(P1)和侧声道(P2);以及
其中,所述迭代处理器(102)被配置为在第二迭代步骤中通过仅使用所述处理声道(P1、P2)的中声道(P1)作为所述处理声道(P1、P2)的所述至少一个来执行所述计算、所述选择和所述处理,以导出第二多声道参数(MCH_PAR2)与第二处理声道(P3、P4)。
14.根据权利要求1所述的装置(100),其中,所述声道编码器包括用于对根据所述迭代处理得到的声道(P2至P4)进行编码的声道编码器(120_1至120_3),其中,所述声道编码器被配置为对声道(P2至P4)进行编码,使得与对具有较多能量的声道进行编码相比,使用较少的比特来对具有较少能量的声道进行编码。
15.一种用于对具有编码声道(E1至E3)以及至少第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)的编码多声道信号(107)进行解码的装置(200),包括:
声道解码器(202),用于对所述编码声道(E1至E3)进行解码以获得解码声道(D1至D3);以及
多声道处理器(204),用于使用通过第二多声道参数(MCH_PAR2)标识的解码声道(D1至D3)中的第二对并且使用第二多声道参数(MCH_PAR2)来执行多声道处理,以获得处理声道(P1*、P2*),以及用于使用通过第一多声道参数(MCH_PAR1)标识的声道(D1至D3、P1*、P2*)中的第一对并且使用第一多声道参数(MCH_PAR1)来执行进一步的多声道处理,其中,声道的第一对包括至少一个处理声道(P1*、P2*)。
16.根据权利要求15所述的装置(200),其中,所述编码多声道信号(107)包括针对第一帧的第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)以及针对第一帧之后的第二帧的保持指示符,并且
其中,所述多声道处理器(204)被配置为在第二帧中对与在第一帧中所使用的声道的第二对和第一对相同的第二对和第一对执行所述多声道处理和所述进一步的多声道处理。
17.根据权利要求15所述的装置(200),其中,所述多声道处理和所述进一步的多声道处理包括使用立体声参数的立体声处理,其中,针对解码声道(D1至D3)的单独比例因子频带或比例因子频带组,第一立体声参数包括在第一多声道参数(MCH_PAR1)中并且第二立体声参数包括在第二多声道参数(MCH_PAR2)中。
18.根据权利要求15所述的装置(200),其中,第一多声道参数或第二多声道参数(MCH_PAR1、MCH_PAR2)包括多声道处理掩码,所述多声道处理掩码指示哪些比例因子频带经过多声道处理以及哪些比例因子频带未经过多声道处理,并且
其中,所述多声道处理器(204)被配置为在由所述多声道处理掩码指示的比例因子频带中不执行多声道处理。
19.根据权利要求15所述的装置(200),其中,第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)均包括声道对标识,并且
其中,所述多声道处理器(204)被配置为通过使用预定义解码规则或在编码多声道信号中指示的解码规则对所述声道对标识进行解码。
20.根据权利要求19所述的装置(200),其中,所述解码规则是霍夫曼解码规则,并且所述多声道处理器(204)被配置为对所述声道对标识执行霍夫曼解码。
21.根据权利要求15所述的装置(200),其中,所述编码多声道信号(107)包括多声道处理允许指示符,所述多声道处理允许指示符仅指示解码声道的允许进行所述多声道处理的子组并且指示不允许进行所述多声道处理的至少一个解码声道,并且
其中,所述多声道处理器(204)被配置为不对如所述多声道处理允许指示符所指示的那样不允许进行多声道处理的所述至少一个解码声道执行任何多声道处理。
22.根据权利要求15所述的装置(200),其中,第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)包括立体声参数,并且所述立体声参数被差分编码,并且所述多声道处理器(204)包括用于对经过差分编码的立体声参数进行差分解码的差分解码器。
23.根据权利要求15所述的装置,其中,所述编码多声道信号(107)是串行信号,其中,在解码器(200)处,第二多声道参数(MCH_PAR2)在第一多声道参数(MCH_PAR1)之前被接收,并且
其中,所述多声道处理器(204)被配置为按照所述解码器(200)接收多声道参数(MCH_PAR1、MCH_PAR2)的顺序来处理所述解码声道(D1至D3)。
24.一种用于对具有至少三个声道的多声道信号进行编码的方法(300),包括:
在第一迭代步骤中计算(302)至少三个声道中的每对之间的声道间相关值,在第一迭代步骤中选择具有最高值或具有高于阈值的值的对,并且使用多声道处理操作处理所选择的对,以导出针对所选择的对的第一多声道参数并导出第一处理声道;
在第二迭代步骤中使用所述处理声道中的至少一个来执行(304)所述计算、所述选择和所述处理,以导出第二多声道参数和第二处理声道;
对根据由迭代处理器执行的迭代处理得到的声道进行编码(306)以获得编码声道;以及
产生(308)具有编码声道以及第一多声道参数和第二多声道参数的编码多声道信号。
25.一种用于对具有编码声道以及至少第一多声道参数和第二多声道参数的编码多声道信号进行解码的方法(400),包括:
对编码声道进行解码(402)以获得解码声道;以及
使用通过第二多声道参数标识的解码声道的第二对并且使用第二多声道参数来执行(404)多声道处理,以获得处理声道,以及使用由第一多声道参数标识的声道的第一对并且使用第一多声道参数来执行进一步的多声道处理,其中,声道的第一对包括至少一个处理声道。
26.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于当在计算机或处理器上运行时使所述计算机或处理器执行根据权利要求24所述的对多声道信号进行编码的方法或根据权利要求25所述的对编码多声道信号进行解码的方法。
27.根据权利要求1或15所述的装置、根据权利要求24或25所述的方法或根据权利要求26所述的计算机可读存储介质,其中,多声道处理意味着对多于两个声道进行联合立体声处理或联合处理,并且多声道信号具有两个声道或多于两个声道。
CN202011242898.5A 2015-03-09 2016-03-08 用于对多声道信号进行编码或解码的装置与方法 Active CN112233684B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011242898.5A CN112233684B (zh) 2015-03-09 2016-03-08 用于对多声道信号进行编码或解码的装置与方法

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP15158234 2015-03-09
EP15158234.3 2015-03-09
EP15172492.9 2015-06-17
EP15172492.9A EP3067885A1 (en) 2015-03-09 2015-06-17 Apparatus and method for encoding or decoding a multi-channel signal
CN201680026823.9A CN107592937B (zh) 2015-03-09 2016-03-08 用于对多声道信号进行编码或解码的装置与方法
CN202011242898.5A CN112233684B (zh) 2015-03-09 2016-03-08 用于对多声道信号进行编码或解码的装置与方法
PCT/EP2016/054900 WO2016142375A1 (en) 2015-03-09 2016-03-08 Apparatus and method for encoding or decoding a multi-channel signal

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201680026823.9A Division CN107592937B (zh) 2015-03-09 2016-03-08 用于对多声道信号进行编码或解码的装置与方法

Publications (2)

Publication Number Publication Date
CN112233684A true CN112233684A (zh) 2021-01-15
CN112233684B CN112233684B (zh) 2024-03-19

Family

ID=52692421

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201680026823.9A Active CN107592937B (zh) 2015-03-09 2016-03-08 用于对多声道信号进行编码或解码的装置与方法
CN202011242898.5A Active CN112233684B (zh) 2015-03-09 2016-03-08 用于对多声道信号进行编码或解码的装置与方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201680026823.9A Active CN107592937B (zh) 2015-03-09 2016-03-08 用于对多声道信号进行编码或解码的装置与方法

Country Status (17)

Country Link
US (4) US10388289B2 (zh)
EP (3) EP3067885A1 (zh)
JP (3) JP6600004B2 (zh)
KR (1) KR102109159B1 (zh)
CN (2) CN107592937B (zh)
AR (1) AR103873A1 (zh)
AU (1) AU2016231238B2 (zh)
BR (6) BR122023021817A2 (zh)
CA (1) CA2978818C (zh)
ES (1) ES2769032T3 (zh)
MX (1) MX364419B (zh)
PL (1) PL3268959T3 (zh)
PT (1) PT3268959T (zh)
RU (1) RU2711055C2 (zh)
SG (1) SG11201707180SA (zh)
TW (1) TWI584271B (zh)
WO (1) WO2016142375A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
CN106710600B (zh) * 2016-12-16 2020-02-04 广州广晟数码技术有限公司 多声道音频信号的去相关编码方法和装置
US10650834B2 (en) * 2018-01-10 2020-05-12 Savitech Corp. Audio processing method and non-transitory computer readable medium
JP6888172B2 (ja) 2018-01-18 2021-06-16 ドルビー ラボラトリーズ ライセンシング コーポレイション 音場表現信号を符号化する方法及びデバイス
JP7384893B2 (ja) * 2018-07-04 2023-11-21 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチシグナルエンコーダ、マルチシグナルデコーダ、および信号白色化または信号後処理を使用する関連方法
US10547927B1 (en) * 2018-07-27 2020-01-28 Mimi Hearing Technologies GmbH Systems and methods for processing an audio signal for replay on stereo and multi-channel audio devices
US11538489B2 (en) * 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
US11361776B2 (en) 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components
CN112233682A (zh) * 2019-06-29 2021-01-15 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置
CN112151045A (zh) 2019-06-29 2020-12-29 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置
EP4243015A4 (en) * 2021-01-27 2024-04-17 Samsung Electronics Co Ltd AUDIO PROCESSING APPARATUS AND METHOD
CN115410584A (zh) * 2021-05-28 2022-11-29 华为技术有限公司 多声道音频信号的编码方法和装置

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050074127A1 (en) * 2003-10-02 2005-04-07 Jurgen Herre Compatible multi-channel coding/decoding
US20060190247A1 (en) * 2005-02-22 2006-08-24 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP2006323314A (ja) * 2005-05-20 2006-11-30 Matsushita Electric Ind Co Ltd マルチチャネル音声信号をバイノーラルキュー符号化する装置
CN101031959A (zh) * 2005-04-15 2007-09-05 弗劳恩霍夫应用研究促进协会 带有压缩侧面信息的多声道分级音频编码
US20070280485A1 (en) * 2006-06-02 2007-12-06 Lars Villemoes Binaural multi-channel decoder in the context of non-energy conserving upmix rules
CN101133680A (zh) * 2005-03-04 2008-02-27 弗劳恩霍夫应用研究促进协会 用于产生音频片段或音频数据流的已编码立体声信号的装置及方法
WO2009146734A1 (en) * 2008-06-03 2009-12-10 Nokia Corporation Multi-channel audio coding
CN101872618A (zh) * 1995-12-01 2010-10-27 Dts(Bvi)有限公司 多通道音频编码器
JP2011501544A (ja) * 2007-10-17 2011-01-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ダウンミックスを用いたオーディオコーディング
US20110224993A1 (en) * 2004-12-01 2011-09-15 Junghoe Kim Apparatus and method for processing multi-channel audio signal using space information
CN102656628A (zh) * 2009-10-15 2012-09-05 法国电信公司 优化的低吞吐量参数编码/解码
US20130077793A1 (en) * 2010-03-29 2013-03-28 Samsung Electronics Co., Ltd. Method and apparatus for down-mixing multi-channel audio
JP2015011076A (ja) * 2013-06-26 2015-01-19 日本放送協会 音響信号符号化装置、音響信号符号化方法、および音響信号復号化装置
CN104364842A (zh) * 2012-04-18 2015-02-18 诺基亚公司 立体声音频信号编码器

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3404837B2 (ja) * 1993-12-07 2003-05-12 ソニー株式会社 多層符号化装置
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4369140B2 (ja) * 2003-02-17 2009-11-18 パナソニック株式会社 オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体
DE102004009628A1 (de) * 2004-02-27 2005-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD
CN1973319B (zh) * 2004-06-21 2010-12-01 皇家飞利浦电子股份有限公司 编码和解码多通道音频信号的方法和设备
DE102004042819A1 (de) * 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
ATE521143T1 (de) * 2005-02-23 2011-09-15 Ericsson Telefon Ab L M Adaptive bitzuweisung für die mehrkanal- audiokodierung
CN101151659B (zh) * 2005-03-30 2014-02-05 皇家飞利浦电子股份有限公司 多通道音频编码器、设备、方法及其解码器、设备和方法
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
CA2613885C (en) * 2005-06-30 2014-05-06 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
WO2007010451A1 (en) * 2005-07-19 2007-01-25 Koninklijke Philips Electronics N.V. Generation of multi-channel audio signals
WO2007055464A1 (en) * 2005-08-30 2007-05-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
WO2007049881A1 (en) * 2005-10-26 2007-05-03 Lg Electronics Inc. Method for encoding and decoding multi-channel audio signal and apparatus thereof
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
FR2898725A1 (fr) 2006-03-15 2007-09-21 France Telecom Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale
US7606716B2 (en) * 2006-07-07 2009-10-20 Srs Labs, Inc. Systems and methods for multi-dialog surround audio
PL2068307T3 (pl) * 2006-10-16 2012-07-31 Dolby Int Ab Udoskonalony sposób kodowania i odtwarzania parametrów w wielokanałowym kodowaniu obiektów poddanych procesowi downmiksu
JP2008129250A (ja) * 2006-11-20 2008-06-05 National Chiao Tung Univ Aacのためのウィンドウ切り替え方法およびm/s符号化の帯域決定方法
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
US8218775B2 (en) * 2007-09-19 2012-07-10 Telefonaktiebolaget L M Ericsson (Publ) Joint enhancement of multi-channel audio
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101137360B1 (ko) * 2009-01-28 2012-04-19 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
JP5793675B2 (ja) * 2009-07-31 2015-10-14 パナソニックIpマネジメント株式会社 符号化装置および復号装置
US9031850B2 (en) * 2009-08-20 2015-05-12 Gvbb Holdings S.A.R.L. Audio stream combining apparatus, method and program
US8942989B2 (en) 2009-12-28 2015-01-27 Panasonic Intellectual Property Corporation Of America Speech coding of principal-component channels for deleting redundant inter-channel parameters
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
US8908874B2 (en) * 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
EP2612321B1 (en) 2010-09-28 2016-01-06 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
US9154896B2 (en) * 2010-12-22 2015-10-06 Genaudio, Inc. Audio spatialization and environment simulation
EP2717262A1 (en) 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
BR112015021520B1 (pt) * 2013-03-05 2021-07-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Aparelho e método para criar um ou mais sinais do canal de saída de áudio dependendo de dois ou mais sinais do canal de entrada de áudio
US9659569B2 (en) * 2013-04-26 2017-05-23 Nokia Technologies Oy Audio signal encoder
EP2830334A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
TWI774136B (zh) * 2013-09-12 2022-08-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
DE112015003108B4 (de) * 2014-07-01 2021-03-04 Electronics And Telecommunications Research Institute Verfahren und Vorrichtung zur Verarbeitung eines Mehrkanal-Audiosignals
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872618A (zh) * 1995-12-01 2010-10-27 Dts(Bvi)有限公司 多通道音频编码器
US20050074127A1 (en) * 2003-10-02 2005-04-07 Jurgen Herre Compatible multi-channel coding/decoding
US20110224993A1 (en) * 2004-12-01 2011-09-15 Junghoe Kim Apparatus and method for processing multi-channel audio signal using space information
US20060190247A1 (en) * 2005-02-22 2006-08-24 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
CN101133680A (zh) * 2005-03-04 2008-02-27 弗劳恩霍夫应用研究促进协会 用于产生音频片段或音频数据流的已编码立体声信号的装置及方法
CN101031959A (zh) * 2005-04-15 2007-09-05 弗劳恩霍夫应用研究促进协会 带有压缩侧面信息的多声道分级音频编码
JP2006323314A (ja) * 2005-05-20 2006-11-30 Matsushita Electric Ind Co Ltd マルチチャネル音声信号をバイノーラルキュー符号化する装置
US20070280485A1 (en) * 2006-06-02 2007-12-06 Lars Villemoes Binaural multi-channel decoder in the context of non-energy conserving upmix rules
JP2011501544A (ja) * 2007-10-17 2011-01-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ダウンミックスを用いたオーディオコーディング
WO2009146734A1 (en) * 2008-06-03 2009-12-10 Nokia Corporation Multi-channel audio coding
CN102656628A (zh) * 2009-10-15 2012-09-05 法国电信公司 优化的低吞吐量参数编码/解码
US20130077793A1 (en) * 2010-03-29 2013-03-28 Samsung Electronics Co., Ltd. Method and apparatus for down-mixing multi-channel audio
CN104364842A (zh) * 2012-04-18 2015-02-18 诺基亚公司 立体声音频信号编码器
JP2015011076A (ja) * 2013-06-26 2015-01-19 日本放送協会 音響信号符号化装置、音響信号符号化方法、および音響信号復号化装置

Also Published As

Publication number Publication date
AR103873A1 (es) 2017-06-07
US11955131B2 (en) 2024-04-09
BR122023021855A2 (pt) 2023-12-26
EP3268959A1 (en) 2018-01-17
JP2018513402A (ja) 2018-05-24
CN107592937B (zh) 2021-02-23
BR122023021774A2 (pt) 2023-12-26
US10762909B2 (en) 2020-09-01
BR112017019187A2 (pt) 2018-04-24
KR20170130458A (ko) 2017-11-28
US11508384B2 (en) 2022-11-22
AU2016231238A1 (en) 2017-09-21
KR102109159B1 (ko) 2020-05-12
RU2017134964A (ru) 2019-04-05
MX2017011495A (es) 2018-01-25
EP3506259A1 (en) 2019-07-03
AU2016231238B2 (en) 2018-08-02
JP2020034920A (ja) 2020-03-05
EP3268959B1 (en) 2019-08-14
PL3268959T3 (pl) 2020-01-31
TW201642248A (zh) 2016-12-01
CN107592937A (zh) 2018-01-16
JP7208126B2 (ja) 2023-01-18
RU2017134964A3 (zh) 2019-04-05
CA2978818A1 (en) 2016-09-15
SG11201707180SA (en) 2017-10-30
BR122023021854A2 (pt) 2023-12-26
US20210012783A1 (en) 2021-01-14
ES2769032T3 (es) 2020-06-24
US10388289B2 (en) 2019-08-20
TWI584271B (zh) 2017-05-21
MX364419B (es) 2019-04-25
EP3067885A1 (en) 2016-09-14
JP2023052219A (ja) 2023-04-11
WO2016142375A1 (en) 2016-09-15
JP6600004B2 (ja) 2019-10-30
PT3268959T (pt) 2019-11-11
CN112233684B (zh) 2024-03-19
CA2978818C (en) 2020-09-22
BR122023021787A2 (pt) 2023-12-26
US20230134993A1 (en) 2023-05-04
BR122023021817A2 (pt) 2023-12-26
US20180090151A1 (en) 2018-03-29
US20190333524A1 (en) 2019-10-31
RU2711055C2 (ru) 2020-01-14

Similar Documents

Publication Publication Date Title
CN107592937B (zh) 用于对多声道信号进行编码或解码的装置与方法
JP7122076B2 (ja) マルチチャネル符号化におけるステレオ充填装置及び方法
JP6573640B2 (ja) オーディオ・エンコーダおよびデコーダ
EP2973551B1 (en) Reconstruction of audio scenes from a downmix
US20160241981A1 (en) Rendering of multichannel audio using interpolated matrices
EP3005352A1 (en) Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant