CN101233568A - 生成经编码的音频信号的方法以及处理音频信号的方法 - Google Patents
生成经编码的音频信号的方法以及处理音频信号的方法 Download PDFInfo
- Publication number
- CN101233568A CN101233568A CNA2006800274861A CN200680027486A CN101233568A CN 101233568 A CN101233568 A CN 101233568A CN A2006800274861 A CNA2006800274861 A CN A2006800274861A CN 200680027486 A CN200680027486 A CN 200680027486A CN 101233568 A CN101233568 A CN 101233568A
- Authority
- CN
- China
- Prior art keywords
- configuration information
- layer
- channel
- information
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 98
- 230000005236 sound signal Effects 0.000 title claims abstract description 19
- 239000000470 constituent Substances 0.000 claims description 4
- 108091006146 Channels Proteins 0.000 description 154
- 230000011664 signaling Effects 0.000 description 43
- 230000011218 segmentation Effects 0.000 description 33
- 238000006243 chemical reaction Methods 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000005755 formation reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 208000035126 Facies Diseases 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mobile Radio Communication Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Time-Division Multiplex Systems (AREA)
- Stereophonic System (AREA)
Abstract
公开一种生成经编码的音频信号的方法,以及在多声道音频编码过程中对其进行处理的方法。本发明提供一种生成经编码的音频信号的方法,其包括:生成基本空间信息,所述基本空间信息包括多声道音频编码处理所必需的基本配置信息以及与基本配置信息对应的基本数据;以及生成扩展空间信息,所述扩展空间信息包括多声道音频编码处理选择性地要求的扩展配置信息以及与扩展配置信息对应的扩展数据。
Description
技术领域
本发明涉及一种多声道编码方法,尤其涉及一种生成经编码的音频信号的方法以及一种处理音频信号的方法。
背景技术
一般来说,信号可以各种方式(例如块、频带和声道)配置。在信号得保持预定的统计特性的静态时段内,上述信号无需分成若干单元即可被处理,因为这对于压缩信号是有利的。
在信号特性陡然改变的瞬态时段内优选以分割方式处理信号,因为防止了信号失真。
然而,如果用户想要以分割方式处理前述信号,却没有将经分割的信息信令化的详细方法。因此,难以有效地处理所述信号。
发明内容
因此,本发明涉及一种能本质上消除由于相关技术的局限和缺陷造成的一个或多个问题的将分割信息信令化的方法。
用于解决问题的本发明的一个目的在于一种有效地将经分割的信号信令化的方法。
本发明的目的可通过提供一种生成经编码的音频信号的方法来达成,所述方法包括:生成基本空间信息,所述基本空间信息包括多声道音频编码过程所必需的基本配置信息以及与所述基本配置信息对应的基本数据;以及生成扩展空间信息,所述扩展空间信息包括上述多声道音频编码过程选择性要求的扩展配置信息以及与所述扩展配置信息对应的扩展数据。
附图简述
包括在这里以提供对本发明的进一步理解的附图示出本发明的实施方式,可与说明书一起解释本发明的原理。在附图中:
图1是示出根据本发明一个实施方式的块分割信息的信令化方法的概念图;
图2和图3是示出根据本发明一个实施方式的频带和声道分割信息的信令化方法的概念图;
图4是示出根据本发明另一实施方式的创建多声道信号的方法的概念图;
图5是示出根据本发明另一个实施方式的声道分割信息的信令化方法的概念图。
发明的最佳实施模式
下面将详细参考本发明的优选实施方式,其具体示例图示于附图中。
下面结合附图对根据本发明的分割信息(也称为“分拆信息”)的信令化方法进行说明。
根据本发明的分割信息的信令化方法是根据信号类别予以分类的。
在描述本发明之前,应当指出所述信号以各种方式配置,例如块、频带和声道。
所述的“信令化方法”可包括“信令化”的含义或者“识别信令化的信号”的含义。
术语“节点”是指示信号已分割还是未分割的点。
术语“空间信息”是能够声道缩减混音或声道扩展混音多声道信号的信息。
应当指出,“空间信息”可表示空间参数,然而它不局限于所述示例,而是在需要时能应用于其它示例。
所述空间参数是指示两个声道之间能量差的声道电平差(CLD)、指示两个声道之间相关性的声道间相干性(ICC)、以及用于从两个声道创建三个声道的声道预测系数(CPC)。
下面对块分割、频带分割和声道分割进行详细说明。
1)块分割
要求用块处理来以与音频信号相同的方式压缩时域中的连续数据。
术语“块处理”表示在预定距离的间隔上以分割方式处理输入信号。
在这种情形下,所述间隔被定义为“块”,而一个或多个块组合起来构成“帧”。
所述帧可表示用于发送/存储数据的单位。
术语“块分割”或“块分拆”可表示一种具体过程,在该过程中在信号处理期间将输入信号变为不同长度的块。
术语“块长度信息”是指示在处理输入信号将输入信号变为不同长度的多个块的时候所获得的块长度的特定信息。
一般来说,如果信号以块的形式配置,则信号处理用长块或短块完成。
在使用短块的情形下,将若干短块组合,并使组合后的块对应于单个长块。
然而,对于每个间隔,信号具有各种不同的特性,因此难以决定性地确定所有信号均能根据长块信号处理方案和短块信号处理方案予以处理。
优选地,在特定间隔内从适合信号特性的不同长度的块中选择一个特定长度的块,随后在所选块上执行块分割。
更详细地,诸块被配置成具有两种或多种不同的长度。可以各种方式从帧中选择这两种或多种不同长度块中的预定长度的块。
为此,需要指明当前帧中包含哪些块,所以需要用于上述操作的信令化方法。
所述信令化方法被分成顺序信令化方法和分级信令化方法。
顺序信令化方法预定义帧长度(即由“N”表示的长度)并使用最小长度块的数目M执行信令化过程。
在这种情形下,帧长度“N”是特定M的倍数。帧长度可以是固定值或可以是作为附加信息被发送至目的地的特定值。
例如,假设N是2048(N=2048),M是256(M=256),而诸个块以256→256→1024→512的次序排列,则块长度信息可以按M*1、M*1、M*4、M*2→1、1、4、2→0、0、3、1的次序进行信令化处理。
分级信令化方法可分为发送层深度信息的方法和不发送层深度信息的方法,下面结合附图对其进行详细说明。
图1是示出根据本发明一个实施方式的块分割信息的信令化方法的概念图;
参照图1,每个层用“层”表示,且层深度被设为“5”。
“层1”包括第一块210,它是用作块分割的基本单位的最长块,并且第一块210的长度是N。
附图标记(1)、(2)、……、(a)、(b)、(c)和(d)表示示例性的二进制信令化序列。
根据本实施方式,指示块是否被分割的块分割信息由分割ID(标识符)和不分割ID表示。特定数字“1”被用作分割ID,而特定数字“0”被用作不分割ID。
所述分割ID和不分割ID在每个层的节点中表示。
分割ID指示包含在上级层中的预定块被分割成下级层中的二等份,且还指示向该下级层分配了下级节点。
不分割ID指示上级层中的预定块不被下级层分割,还指示没有向该下级层分配与由该不分割ID表示的节点相对应的任何下级节点。不分配下级节点意味着不执行其它信令化操作。
由于在最高层(即层1)中第一块210的块分割信息(1)的值为1,因此对第一层210执行块分割。
作为层1之下级层的层2包括两个块220和221,每个块的长度为N/2。
包含在层2中的块220的块分割信息(2)具有值“1”,而块221的块分割信息(3)具有值“1”,从而作为层2之下级层的层3包括四个块230、231、232和233,每个块长度为N/4。
与包含在层3中的块230相关联的块分割信息(4)的值为“0”。与块23 1相关联的块分割信息(5)的值为“1”。与块232相关联的块分割信息(6)的值为“1”。与包含在层3中的块233相关联的块分割信息(7)的值为“0”。
因此,根据层3的块分割信息,不对层3的块230和233执行块分割,但对层3的块231和232执行块分割。
在这种情形下,没有向作为层3的所述未经块分割的块230和233的下级层的层4分配下级节点。
层3的经块分割的块231和232向下级层分配下级节点。块分割的存在与否在下级节点中表示出来。
层4的长度为N/8,并包括在层3的块231的基础上分割出的块240和241,还包括在层3的块232的基础上分割出的其它块242和243。
与层4的块240相关联的块分割信息(8)的值为“0”。与层4的块241相关联的块分割信息(9)的值为“1”。与层4的块242相关联的块分割信息(a)的值为“0”。与层4的块243相关联的块分割信息(b)的值为“0”。
因此,根据层4的块分割信息,不在层4的块240、242和243上执行块分割,但在层4的块241上执行块分割。
在这种情形下,没有向作为层4的所述未经块分割的块240、242和243的下级层的层5分配下级节点。
层4的经块分割的块241向层5分配一个下级节点,从而其在所述下级节点中指示是否存在块分割。
层5的长度为N/16,且包括在层4的块241的基础上分割出的块250和251。
与层5的块250相关联的块分割信息(c)的值为“0”。与层5的块251相关联的块分割信息(d)的值为“0”。
因此,层4中所含的每个块的值为“0”,从而不再执行分级块分割,所以块的块分割深度能够识别出来。
能被分级块分割的块的布局结构包括N/4块(即长度为N/4的块)、N/8块、N/16块、N/16块、N/8块、N/8块和N/8块。
如果信号长度为N,则经块分割的块具有式“N/xi”表示(其中i=1、2、……、P,P是整数而x=2)表示的长度中的任何一个(即N/2、N/4、N/8、N/16和N/32……)。
在表示能根据二进制信令化序列(1)(2)(3)(4)(5)(6)(7)(8)(9)(a)(b)(c)(d)由二进制数表示的块分割的信息的情形下,块分割信息可由13个比特“1110110010000”表示。
上面的说明已公开了一个示例性情形,其中层的深度信息不被另行表示而是只通过由分割ID和不分割ID表示的块分割信息即可予以识别。
然而,应当注意,另外表示层深度信息的其它块分割信息也可进行信令化处理。
例如,层的深度信息由分割终止ID和分割继续ID表示。
所述分割终止ID可表示在其中不再执行块分割的最低层。所述分割继续ID可表示除却最低层之外的剩余各层。在这种情形下,分割继续ID由“1”表示,而分割终止ID由“0”表示。
图1中示出的层深度为“5”,也可使用分割终止ID“0”和分割继续ID“1”以“11110”来表示。
子块长度可由所述信令化方法予以识别。
这样,在另行表示深度信息的情形下,在向最低层分配的节点处仅可表示不分割ID,从而信令化处理过程可在从当前层至最低层的上一层的范围内执行。
例如,假设分割ID由“1”表示而不分割ID由“0”表示,且分割继续ID由“1”表示而分割终止ID由“0”表示,指示向最低层分配的节点是否被分割的特定值可由指示分割终止的“0”表示。
2)频带分割
下面结合图2-3描述频带分割。
图2是示出根据本发明另一个实施方式的频带分割信息的信令化方法的概念图。
图2示出配置成子带滤波器组的树形结构的分级频带分割。子带的频率分辨率可以各种方式定义,下面将对其进行详细说明。
相比图1的块分割,图2的频带分割在最高层中包括多个频带,而图1的最高层却由一个长块构成。
根据本实施方式,指示频带是否被分割的频带分割信息由分割ID和不分割ID表示。值“1”作为分割ID,而值“0”作为不分割ID。
分割ID和不分割ID可在每层的节点处指明。
分割ID指示第M层的频带在第(M+1)层被分割成二等份。
不分割ID指示第M层的频带在第(M+1)层不被分割,还指示没有向下级层分配与由不分割ID表示的节点相对应的任何下级节点。不分配下级节点意味着不执行其它信令化操作。
作为最高层的层1包括第一至第六频带310、311、312、313、314和315。
第一频带310的频带分割信息(1)由“1”表示。第二频带311的频带分割信息(2)由“1”表示。第三频带312的频带分割信息(3)由“0”表示。第四频带313的频带分割信息(4)由“0”表示。第五频带314的频带分割信息(5)由“0”表示。第四频带313的频带分割信息(6)由“0”表示。
所述频带分割信息被标示在向层1分配的节点处。
根据频带分割信息(1)和(2),第一频带310产生信号转换模块310T,而第二频带311产生信号转换模块311T,从而在层2中产生下级频带320、321、322和323。向下级频带320、321、322和323分配下级节点。应当注意所述信号转换模块在本实施方式中也被称为“频带转换模块”。
同时,未对其进行频带分割的第三、第四、第五或第六频带312、313、314或315不产生频带转换模块。同样,在第三、第四、第五或第六频带312、3 13、314或315中不产生与层2相对应的下级频带。因此,未向层2分配与312、313、314和315相对应的任何下级节点。
层2包括在层1的频带310基础上分割出的两个频带320、321,并且还包括在层1的频带311上分割出的两个频带322和323。
频带320的频带分割信息(7)由“1”表示。频带321的频带分割信息(8)由“1”表示。频带322的频带分割信息(9)由“0”表示。频带323的频带分割信息(10)由“0”表示。
根据所述频带分割信息(7)和(8),频带320产生频带转换模块320T,而频带321产生频带转换模块321T,从而在层3中产生下级频带330、331、332和333。向下级频带330、331、332和333分配了下级节点。
同时,未对其进行频带分割的频带322和323不产生频带转换模块。在频带322和323中也不产生与层3相对应的下级频带。因此,未向频带322和323分配下级节点。
层3包括在层2的频带320基础上分割出的两个频带330、331,并且还包括在层2的频带321上分割出的两个频带332和333。
频带330的频带分割信息(11)由”1”表示。频带331的频带分割信息(12)由″0″表示。第三频带332的频带分割信息(13)由″0″表示。频带333的频带分割信息(14)由″0″表示。
根据所述频带分割信息(11),频带330产生信号转换模块330T,且在层4中产生下级频带340和341。向下级频带340和341分配了下级节点。
同时,未对其进行频带分割的频带331、332和333不产生频带转换模块。在频带331、332和333中也不产生与层4相对应的下级层。因此,也未向频带322和323分配下级节点。因此,也未向频带331、332和333分配下级节点。
层4包括在层3的频带330的基础上分割出的两个频带340和341。
频带340的频带分割信息(15)由″0″表示。频带341的频带分割信息(16)由″0″表示。
因此,不再有能够执行频带分割的下级层,信令化处理过程终止。在这种情形下,最低层等于层4。
在表示能够由根据二进制信令化序列(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)(13)(14)(15)(16)由二进制数表示块分割信息的情形下,块分割信息可由16个比特“1100001100100000”来表示。
图3是示出根据本发明另一实施方式的频带分割信息的信令化方法的方框图。
与图2相比,就执行频带分割的方法而言,图3的频带分割与图2的情形相似。
然而,如图3所示,图3中的频带分割信息的二进制信令化序列与图2中的不同。
因此,在表示能够由根据二进制信令化序列(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(11)(12)(13)(14)(15)(16)由二进制数表示块分割信息的情形下,块分割信息可由16个比特″1110001001000000″来表示。上面的说明已公开了一个示例性情况,其中未另行表示层深度信息,而是可仅通过由分割ID和不分割ID表示的频带分割信息来识别层深度信息。
然而,应当注意另行表示层深度信息的其它频带分割信息也可被进行信令化处理。
例如,层深度信息由分割终止ID和分割继续ID表示。
所述的分割终止ID表示不再执行频带分割的最低层。所述分割继续ID表示除最低层之外的剩余各层。在这种情形下,分割继续ID由“1”表示,而分割终止ID由“0表示。”
图2~3中示出的层深度为“4”,也可使用分割终止ID“0”和分割继续ID“1”以“1110”表示。
子带长度可由所述的信令化方法予以识别。
这样,在另行表示深度信息的情形下,在向最低层的节点分配的节点处仅可表示不分割ID,从而信令化处理过程可在从当前层至最低层的上一层的范围内执行。
例如,假设分割ID由“1”表示而不分割ID由“0”表示,分割继续ID由“1”表示而分割终止ID由“0”表示,则指示向最低层分配的节点是否被分割的特定值可由指示分割终止的“0”表示。
3)声道分割
声道分割信息涉及用于声道配置的声道配置信息,因此下文将参照所述的声道配置信息对声道分割进行详细说明。
特别地,将详细地阐述当对多声道音频信号进行编码和解码时所获得的声道配置的一个示例。
基本空间信息是对多声道音频信号进行编码时所需要的。所述基本空间信息包括能够表示与基本环境相关联的配置信息的基本配置信息以及与所述基本配置信息相对应的基本数据。
另外,多声道音频编码选择性地要求扩展空间信息。所述扩展空间信息包括指示与扩展环境相关联的配置信息的扩展配置信息以及与所述扩展配置信息相对应的扩展数据。所述扩展环境的配置信息可以存在一个或多个。所述扩展环境可由类型ID标识。
同时,由所述多声道信号编码参照的声道配置主要分为两种声道配置,即基本声道配置和扩展声道配置。
一个或多个声道配置信息被用作所述基本声道配置信息。特别地,基本声道配置信息指示从若干声道配置信息中选出的一个声道配置信息。
为便于说明,基本声道配置信息被称为“固定声道配置信息”,且根据固定的声道配置信息创建的多个声道(即多声道)被称为“固定输出声道”。
固定声道配置信息和相关联的声道配置数据是创建所述固定的输出声道所要求的。
固定声道配置信息可表示若干预先建立的声道配置组元中的一个声道配置组元。所述预先建立的声道配置可以各种方式来表示。例如,声道可以配置成“5-1-5”、“5-2-5”、“7-2-7”或“7-5-7”的形式。
所述“5-2-5”配置可表示一种具体声道结构,其中六个输入声道被声道缩减混音(downmixed)成两个声道,且经声道缩减混音的声道被输出至六个声道。“5-2-5”配置以外的其余声道配置具有与“5-2-5”配置相同的声道结构。
所述固定声道配置信息被包含在基本配置信息中,而与固定声道配置信息相关联的数据被包含在基本数据中。
各种各样的参数可用作所述基本数据,例如,指示两个声道之间能量差的声道电平差(CLD)参数、指示两个声道之间的相关性的声道间相干性(ICC)参数、以及用来从两个声道创建三个声道的声道预测系数(CPC)参数。
所述扩展声道配置指示依照固定声道配置形成的声道配置。
所述扩展声道配置是由经编码的信号任意形成的。为便于说明,扩展声道配置信息被称为任意声道配置信息,而由任意声道配置信息创建的多声道被称为任意输出声道。
所述任意声道配置信息被包含在扩展配置信息中,并由称为声道ID的类型ID所标识。
与任意声道配置信息相对应的任意声道配置数据被包含在扩展数据中。
如果需要,为了操作简单,所述任意声道配置数据可仅使用表示两个声道之间能量差的CLD参数。
任意声道配置信息由分割ID和不分割ID表示。作为所述任意声道配置信息的组成部分的分割ID指示声道个数的增加。不分割ID指示一种特定情况,其中声道个数没有改变。
例如,分割ID指示一个输入声道被转换成两个输出声道。不分割ID指示输入声道在声道个数上不作任何改变即被输出。
在向上级层声道分配的上级层节点处表示了分割ID的情形下,在下级层中创建下级声道,并且向下级层分配与所创建的声道对应的下级节点。
然而,在向上级层的声道分配的上级层节点处表示了不分割ID的情形中,在下级层中不创建下级声道,因此没有向下级层分配与下级声道相对应的下级节点。
下面结合图2-3对使用分割ID和不分割ID表示所述任意声道配置信息的方法进行说明。
图2~3不仅示出所述频带分割还示出声道分割。
首先对图2详细说明如下。
作为最高层的层1包括六个频带310、311、312、313、314和315。所述频带310、311、312、313、314和315可分别充当所述固定的多声道。根据本发明,分割ID由“1”表示而不分割ID由“0”表示。
表示任意声道配置信息的方法顺序地表示包含在向层1的声道310、311、312、313、314和315分配的节点中的值“0”或“1”。
表示任意声道配置信息的方法顺序地表示包含在向层2的声道320、321、322和323分配的节点中的值“0”或“1”。
表示任意声道配置信息的方法顺序地表示包含在向层3的声道330、331、332和333分配的节点中的值“0”或“1”。
表示任意声道配置信息的方法顺序地表示包含在向层4的声道340和341分配的节点中的值“0”或“1”。
换句话说,所述方法在上级层的节点处顺序地指示声道个数是否增加,并随后在下级层的节点处顺序地指示声道个数是否增加。
根据所述方法的任意声道配置信息由16比特“1100001100100000”表示。
为便于说明,表示任意声道配置信息的方法被称为“分级优先级方法”。
根据图3所示表示任意声道配置信息的方法,如果当从上级层的第一节点获得信令化结果时上级层的第一节点由“1”表示,则与上级层的第一节点相对应的诸下级节点指示声道个数是否顺序地增加。如果当从上级层的第一节点获得信令化结果时上级层的第一节点由“0”表示,则当前节点移至上级的第二节点,以使第二节点指示声道个数是否顺序地增加。因此,由所述方法获得的任意声道配置信息由16比特“1110001001000000”表示。
为便于说明,表示任意声道配置信息的方法被称为“分支优先级方法”。
下面参照图4详细说明创建固定输出声道和任意输出声道的方法。
图4是示出根据本发明的创建多声道信号的方法的概念图。
参照图4,通过声道缩减混音信号(x)与基本矩阵(m1)之间的计算创建出任意输出声道(y),并通过固定输出声道(y)与后置矩阵(m2)之间的计算创建出另一任意输出声道(z)。在必要时可以存在两个或多个基本矩阵(m1)。
可使用CLD、ICC、CPC中的至少一个以及所述固定声道配置信息来获取基本矩阵(m1)的配置元素。
可使用CLD和所述任意声道配置信息来获取后置矩阵(m2)的配置元素。
下面将对创建任意输出声道的方法进行详细说明。
首先,对使用任意声道配置信息配置任意声道的方法进行详细说明。
下面对使用所述分支优先级方法表示所述任意声道配置信息的示例性方法进行说明。
所述示例性方法顺序地识别作为任意声道配置信息的配置组元的分割ID和不分割ID,并根据所识别出的ID执行信号处理。
如果所识别出的ID被确定为分割ID,则一个输入声道被连接至作为信号转换的一个示例的声道转换模块,其结果是创建出两个下级信道。
否则,如果所识别出的ID被确定为不分割ID,则不对声道个数作出任何改变地输出前述输入声道。
下面将给出其详细说明。
在第一阶段,要被解码的ID个数的初始值被置为“1”,且任意输出声道个数的初始值被置为“0”,并且声道变换模块个数的初始值被置为“0”。
在第二阶段,识别要被解码的ID。在第三阶段,如果所识别出的ID被确定为分割ID,则声道转换模块个数递增1,并且要被识别的ID个数递增1。
如果所识别出的ID被确定为不分割ID,则任意输出声道个数递增1,并且要被识别的ID个数递减1。
重复前述第二和第三阶段,直到要被解码的ID个数到达“0”。根据固定的输出声道个数重复前述信号处理方法。例如,当任意声道配置信息由“11100010010000”表示时获得的任意声道配置示出于图3中。在这种情形下,“1”表示分割ID而“0”表示不分割ID。
“1”的个数表示声道转换模块(即图3的信号转换模块)的个数,而“0”的个数表示任意输出声道的个数。
同时,固定输出声道可以按不同次序重排(即,重映射),并可随后如图5所示那样创建出任意输出声道。
图5是示出根据本发明的声道分割信息的信令化方法的概念图。
参照图5,固定输出声道310、311、312、313、314和315由重映射模块110重排。重排后的固定输出声道310’、311’、312’、313’、314’和315’作为最上层的声道,以创建所述任意输出声道。勿庸赘言,可以不同次序重排或重映射所述任意输出声道。
同时,如果在任意声道配置信息中包含了将任意声道配置信息的声道映射至扬声器的声道映射信息,则任意输出声道也可被映射至该扬声器。
前面的说明公开了一种示例性情况,其中不另行表示层深度信息,而是可通过由分割ID和不分割ID表示的任意声道配置信息来识别层深度信息。
然而,应当注意,也可表示其他能另行表示层深度信息的任意声道配置信息。
例如,层深度信息可由分割终止ID和分割继续ID来表示。所述分割终止ID可表示在其中不再进行声道分割的最低层。所述分割继续ID可表示除最低层之外的其余各层。在这种情形中,分割继续ID由“1”表示而分割终止ID由“0”表示。
图2~3中示出的层深度为“4”,也可使用分割终止ID“0”和分割继续ID“1”以“1110”予以表示。
这样,在另行表示深度信息的情形中,在向最低层分配的节点处仅可表示不分割ID,从而信令化处理过程可在从当前层至最低层的上一层的范围之内执行。
例如,假设分割ID由“1”表示而不分割ID由“0”表示,分割继续ID由“1”表示而分割终止ID由“0”表示,则指示向最低层分配的节点是否被分割的特定值可由指示分割终止的“0”表示。
尽管前述情形是实际发生的,但最低层可通过所述深度信息来识别,并推定存在省却的值“0”,从而所述任意输出声道得以配置。
同时,尽管所述任意声道配置信息被发送至解码器,但应当注意,解码器必要时可以不使用接收到的任意声道配置信息。解码器的前述操作可能会发生在一种示例性情况中,其中解码器识别出任意声道配置信息和任意声道配置信息的大小,但跳过与所述大小相对应的一个预定范围。本领域内技术人员可以理解,可对本发明作出各种修改和变化而不脱离本发明的精神或范围。因此,本发明旨在覆盖本发明的修改和变化,只要它们落在所附权利要求书及其等效方案的范围内。
工业应用性
根据本发明的分割信息的信令化方法具有下列效果。
首先,如果预定长度的长块被分割成不同长度的短块,则根据本发明的所述信令化方法可使用最少的比特数来实现分级块分割信息的信令化。
其次,根据本发明的信令化方法不需要另行发送指示信号处理所使用的比特数的特定信息,并且不仅可根据经信令化的信号识别出分割后的层深度而且能识别经信令化的信号的结束。
再者,根据本发明的信令化方法可使用最少的比特数将多个子带分割成多个不同大小的子带(例如具有不同频率带宽的子带)。
第四,根据本发明的信令化方法可执行与声道扩展混音处理过程相关联的特定信息的信令化,这允许在输入声道中接收到的信号经由比输入声道个数多得多的输出声道输出。
Claims (20)
1.一种生成经编码的音频信号的方法,其包括:
生成基本空间信息,所述基本空间信息包括多声道音频编码处理过程所必需的基本配置信息以及与所述基本配置信息相对应的基本数据;以及
生成扩展空间信息,所述扩展空间信息包括多声道音频编码处理过程选择性地要求的扩展配置信息以及与所述扩展配置信息相对应的扩展数据。
2.如权利要求1所述的方法,其特征在于,所述扩展配置信息包括由声道标识符(ID)标识的任意声道配置信息,并且对应于所述任意声道配置信息的所述扩展数据指示两个声道之间的能量差。
3.如权利要求2所述的方法,其特征在于,所述基本配置信息包括作为预定输出声道的配置信息的固定声道配置信息。
4.如权利要求3所述的方法,其特征在于,所述任意声道配置信息使用分割标识符(ID)和不分割标识符(ID)指示在层的节点处声道个数是否增加,并且如果上级层的节点由分割ID表示,则向下级层分配了个数等于分割数的下级节点,而如果上级层的节点由不分割ID表示,则没有向下级层分配下级节点。
5.如权利要求4所述的方法,其特征在于,所述任意声道配置信息顺序地指示在上级层的节点处声道个数是否增加,并顺序地指示在下级层的下级节点处声道个数是否增加。
6.如权利要求4所述的方法,其特征在于,如果上级层的第一节点由分割ID表示,则所述任意声道配置信息指示向下级层分配的与所述上级层的第一节点相对应的下级节点的声道个数是否增加,而如果上级层的所述第一节点由不分割ID表示,则所述任意声道配置信息指示所述上级层的第二节点的声道个数是否增加。
7.如权利要求4所述的方法,其特征在于,所述任意声道配置信息进一步包括声道映射信息,所述声道映射信息使用所述任意声道配置信息将任意输出声道映射至扬声器位置。
8.一种处理音频信号的方法,包括:
接收包括多声道音频编码处理过程所必需的基本空间信息以及所述多声道音频编码处理过程选择性地要求的扩展空间信息的经编码的音频信号;以及
根据所述经编码的音频信号配置多声道音频信号的声道。
9.如权利要求8所述的方法,其特征在于,所述基本空间信息包括扩展配置信息,所述扩展配置信息包括由声道标识符(ID)标识的任意声道配置信息以及与所述任意声道配置信息相对应的扩展数据。
10.如权利要求9所述的方法,其特征在于,所述扩展数据指示两个声道间的能量差。
11.如权利要求10所述的方法,其特征在于,所述基本空间信息包括作为预定输出声道的配置信息的固定声道配置信息。
12.如权利要求11所述的方法,其特征在于,所述任意声道配置信息使用分割标识符(ID)和不分割标识符(ID)指示在层的节点处声道个数是否增加,并且如果上级层的节点由分割ID表示,则向下级层分配了个数等于分割数的下级节点,而如果上级层的节点由不分割ID表示,则没有向下级层分配下级节点。
13.如权利要求12所述的方法,其特征在于,所述任意声道配置信息顺序地指示在上级层的节点处声道个数是否增加,并顺序地指示在下级层的下级节点处声道个数是否增加。
14.如权利要求12所述的方法,其特征在于,如果上级层的第一节点由分割ID表示,则所述任意声道配置信息指示向下级层分配的与上级层的所述第一节点相对应的下级节点的声道个数是否增加,而如果上级层的所述第一节点由不分割ID表示,则所述任意声道配置信息指示上级层的第二节点的声道个数是否增加。
15.如权利要求12或14所述的方法,其特征在于,所述任意声道配置信息还包括声道映射信息,所述声道映射信息使用所述任意声道配置信息将任意输出声道映射至扬声器位置。
16.如权利要求15所述的方法,其特征在于,所述配置多声道音频信号的声道包括使用所述固定声道配置信息生成固定输出声道,以及使用所述任意声道配置信息生成任意输出声道。
17.如权利要求16所述的方法,其特征在于,所述任意输出声道包括:顺序地识别作为所述任意声道配置信息的配置组元的分割ID或不分割ID,并根据识别出的ID执行信号处理,并且如果识别出的ID是分割ID,则一个输入声道连接于声道转换模块并产生两个下级声道,而如果识别出ID的是不分割ID,则输入声道在不对声道个数作任何改变的情况下被输出。
18.如权利要求17所述的方法,其特征在于,所述生成任意输出声道包括设定ID个数的初始值、任意输出声道个数的初始值、以及声道转换模块个数的初始值;识别ID;如果识别出的ID是分割ID,则将ID个数和声道转换模块个数增加预定的增量单位,如果识别出的ID是不分割ID,则将任意输出声道个数增加预定的增量单位并将ID个数减少预定的增量单位;并重复进行所述识别、增加ID个数和声道转换模块个数、以及增加任意输出声道个数并减少ID个数,直到ID个数到达“0”为止。
19.如权利要求18所述的方法,其特征在于,所述生成任意输出声道还包括根据所述声道映射信息将任意输出声道映射至扬声器。
20.如权利要求12所述的方法,还包括:
不经解码所述任意声道配置信息和与所述任意声道配置信息对应的任意声道配置数据的长度地来识别所述任意声道配置信息以及任意声道配置数据的长度。
Applications Claiming Priority (16)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US70346305P | 2005-07-29 | 2005-07-29 | |
US60/703,463 | 2005-07-29 | ||
US71652605P | 2005-09-14 | 2005-09-14 | |
US60/716,526 | 2005-09-14 | ||
KR1020060004048A KR20070031212A (ko) | 2005-09-14 | 2006-01-13 | 오디오 신호의 인코딩/디코딩 방법 및 장치 |
KR10-2006-0004048 | 2006-01-13 | ||
KR1020060004048 | 2006-01-13 | ||
KR1020060017660 | 2006-02-23 | ||
KR1020060017659 | 2006-02-23 | ||
KR1020060017659A KR20070014936A (ko) | 2005-07-29 | 2006-02-23 | 오디오 신호의 인코딩/디코딩 방법 및 장치 |
KR10-2006-0017659 | 2006-02-23 | ||
KR1020060017660A KR20070014937A (ko) | 2005-07-29 | 2006-02-23 | 오디오 신호의 인코딩/디코딩 방법 및 장치 |
KR10-2006-0017660 | 2006-02-23 | ||
US81602206P | 2006-06-22 | 2006-06-22 | |
US60/816,022 | 2006-06-22 | ||
PCT/KR2006/002974 WO2007013775A1 (en) | 2005-07-29 | 2006-07-28 | Mehtod for generating encoded audio signal and method for processing audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101233568A true CN101233568A (zh) | 2008-07-30 |
CN101233568B CN101233568B (zh) | 2010-10-27 |
Family
ID=37683623
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800274861A Active CN101233568B (zh) | 2005-07-29 | 2006-07-28 | 生成经编码的音频信号的方法以及处理音频信号的方法 |
CN2006800277662A Active CN101233570B (zh) | 2005-07-29 | 2006-07-28 | 生成经编码的音频信号的方法以及处理音频信号的方法 |
CN2006800277709A Active CN101233571B (zh) | 2005-07-29 | 2006-07-28 | 处理音频信号的方法和装置 |
CN2006800274908A Active CN101233569B (zh) | 2005-07-29 | 2006-07-28 | 分拆信息的信令化方法 |
CN2006800274842A Active CN101233567B (zh) | 2005-07-29 | 2006-07-28 | 生成经编码的音频信号的方法以及处理音频信号的方法 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800277662A Active CN101233570B (zh) | 2005-07-29 | 2006-07-28 | 生成经编码的音频信号的方法以及处理音频信号的方法 |
CN2006800277709A Active CN101233571B (zh) | 2005-07-29 | 2006-07-28 | 处理音频信号的方法和装置 |
CN2006800274908A Active CN101233569B (zh) | 2005-07-29 | 2006-07-28 | 分拆信息的信令化方法 |
CN2006800274842A Active CN101233567B (zh) | 2005-07-29 | 2006-07-28 | 生成经编码的音频信号的方法以及处理音频信号的方法 |
Country Status (7)
Country | Link |
---|---|
EP (5) | EP1920439A4 (zh) |
KR (5) | KR100888970B1 (zh) |
CN (5) | CN101233568B (zh) |
AU (1) | AU2006273012B2 (zh) |
CA (1) | CA2617050C (zh) |
RU (1) | RU2414741C2 (zh) |
WO (5) | WO2007013784A1 (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2280736T3 (es) | 2002-04-22 | 2007-09-16 | Koninklijke Philips Electronics N.V. | Sintetizacion de señal. |
EP1853092B1 (en) | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
EP2084901B1 (en) | 2006-10-12 | 2015-12-09 | LG Electronics Inc. | Apparatus for processing a mix signal and method thereof |
WO2008060111A1 (en) | 2006-11-15 | 2008-05-22 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
JP5450085B2 (ja) | 2006-12-07 | 2014-03-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ処理方法及び装置 |
KR101062353B1 (ko) | 2006-12-07 | 2011-09-05 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 그 장치 |
KR20080082916A (ko) | 2007-03-09 | 2008-09-12 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 이의 장치 |
EP2278582B1 (en) * | 2007-06-08 | 2016-08-10 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
JP2010538571A (ja) * | 2007-09-06 | 2010-12-09 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
JP2011507013A (ja) | 2007-12-06 | 2011-03-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号処理方法及び装置 |
WO2011027494A1 (ja) | 2009-09-01 | 2011-03-10 | パナソニック株式会社 | デジタル放送送信装置、デジタル放送受信装置およびデジタル放送送受信システム |
TWI444989B (zh) | 2010-01-22 | 2014-07-11 | Dolby Lab Licensing Corp | 針對改良多通道上混使用多通道解相關之技術 |
WO2014175617A1 (ko) | 2013-04-23 | 2014-10-30 | ㈜ 소닉티어 | 직접 오디오 채널 데이터 및 간접 오디오 채널 데이터를 이용한 스케일러블 디지털 오디오 인코딩/디코딩 방법 및 장치 |
KR101421201B1 (ko) * | 2013-04-23 | 2014-07-22 | 한국산업은행 | 비압축 오디오 채널 데이터 및 압축 오디오 채널 데이터를 이용한 스케일러블 디지털 오디오 인코딩/디코딩 방법 및 장치 |
TWI693594B (zh) * | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
ES2904275T3 (es) | 2015-09-25 | 2022-04-04 | Voiceage Corp | Método y sistema de decodificación de los canales izquierdo y derecho de una señal sonora estéreo |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG49883A1 (en) * | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
DE4209544A1 (de) * | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
KR100265112B1 (ko) * | 1997-03-31 | 2000-10-02 | 윤종용 | 디브이디 디스크와 디브이디 디스크를 재생하는 장치 및 방법 |
CN1214690C (zh) * | 1997-09-05 | 2005-08-10 | 雷克西康公司 | 5-2-5矩阵编码器和解码器系统 |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
ES2268340T3 (es) * | 2002-04-22 | 2007-03-16 | Koninklijke Philips Electronics N.V. | Representacion de audio parametrico de multiples canales. |
DE60326782D1 (de) * | 2002-04-22 | 2009-04-30 | Koninkl Philips Electronics Nv | Dekodiervorrichtung mit Dekorreliereinheit |
ES2280736T3 (es) * | 2002-04-22 | 2007-09-16 | Koninklijke Philips Electronics N.V. | Sintetizacion de señal. |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
-
2006
- 2006-07-28 WO PCT/KR2006/002985 patent/WO2007013784A1/en active Application Filing
- 2006-07-28 KR KR1020087004586A patent/KR100888970B1/ko active IP Right Grant
- 2006-07-28 CA CA2617050A patent/CA2617050C/en active Active
- 2006-07-28 KR KR1020087004585A patent/KR100857102B1/ko active IP Right Grant
- 2006-07-28 EP EP06769319A patent/EP1920439A4/en not_active Ceased
- 2006-07-28 EP EP06769316A patent/EP1920437A4/en not_active Ceased
- 2006-07-28 KR KR1020087004587A patent/KR100857103B1/ko active IP Right Grant
- 2006-07-28 EP EP06769318A patent/EP1915757A4/en not_active Ceased
- 2006-07-28 WO PCT/KR2006/002974 patent/WO2007013775A1/en active Application Filing
- 2006-07-28 CN CN2006800274861A patent/CN101233568B/zh active Active
- 2006-07-28 WO PCT/KR2006/002982 patent/WO2007013781A1/en active Application Filing
- 2006-07-28 CN CN2006800277662A patent/CN101233570B/zh active Active
- 2006-07-28 WO PCT/KR2006/002984 patent/WO2007013783A1/en active Application Filing
- 2006-07-28 CN CN2006800277709A patent/CN101233571B/zh active Active
- 2006-07-28 KR KR1020087004588A patent/KR100841332B1/ko active IP Right Grant
- 2006-07-28 AU AU2006273012A patent/AU2006273012B2/en active Active
- 2006-07-28 KR KR1020087004589A patent/KR100857104B1/ko active IP Right Grant
- 2006-07-28 WO PCT/KR2006/002981 patent/WO2007013780A1/en active Application Filing
- 2006-07-28 RU RU2008107773/28A patent/RU2414741C2/ru not_active Application Discontinuation
- 2006-07-28 CN CN2006800274908A patent/CN101233569B/zh active Active
- 2006-07-28 EP EP06769309A patent/EP1915756A4/en not_active Ceased
- 2006-07-28 EP EP06769317A patent/EP1920438A4/en not_active Ceased
- 2006-07-28 CN CN2006800274842A patent/CN101233567B/zh active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101233568B (zh) | 生成经编码的音频信号的方法以及处理音频信号的方法 | |
US7761177B2 (en) | Method for generating encoded audio signal and method for processing audio signal | |
CN101199121B (zh) | 编码输入信号方法和编码器/译码器 | |
RU2007141934A (ru) | Адаптивная группировка параметров для улучшенной эффективности кодирования | |
CN101868821A (zh) | 用于处理信号的方法和装置 | |
KR20100134084A (ko) | 다수의 출력 오디오 채널들을 생성하기 위한 장치 및 방법과, 그 장치를 포함하는 수신기 및 오디오 재생 디바이스, 데이터 스트림 수신 방법, 및 컴퓨터 프로그램 제품 | |
CN101253807A (zh) | 用于编码和解码音频信号的装置及其方法 | |
JP5135205B2 (ja) | 多チャンネル音響信号の音響圧縮符号化装置及び復号装置 | |
KR102488129B1 (ko) | 고속으로 데이터를 인코딩하는 장치 | |
WO2002103608A3 (en) | Method of expanding a biological network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |