CN102549656A - 通过选择性通道解码的高效多通道信号处理 - Google Patents
通过选择性通道解码的高效多通道信号处理 Download PDFInfo
- Publication number
- CN102549656A CN102549656A CN2010800448770A CN201080044877A CN102549656A CN 102549656 A CN102549656 A CN 102549656A CN 2010800448770 A CN2010800448770 A CN 2010800448770A CN 201080044877 A CN201080044877 A CN 201080044877A CN 102549656 A CN102549656 A CN 102549656A
- Authority
- CN
- China
- Prior art keywords
- channel
- voice
- grade
- channel selecting
- selecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims description 14
- 238000000034 method Methods 0.000 claims description 34
- 230000005540 biological transmission Effects 0.000 claims description 14
- 230000014509 gene expression Effects 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 5
- 238000007689 inspection Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000936936 Opitutaceae Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
传输表示一个或更多个音频通道的编码信息的输入信号通过如下操作被解码,即确定由编码的信息表示的通道的配置、从通道配置获得规定一个或更多个音频通道中的哪些音频通道要被解码的通道选择掩模、从输入信号提取编码的信息并且对于在通道选择掩模中规定的那些音频通道解码提取的编码信息。
Description
技术领域
本发明总体涉及音频和视频编码系统,并且,更特别地,属于改进的处理并解码代表音频和视频信息的数据的方式。
背景技术
大量的国际标准定义了对于记录和传送可如何编码和格式化代表听觉和视觉刺激的信息以及对于重放可如何接收并解码编码的信息。为了便于讨论,代表听觉和视觉刺激的信息在这里分别被称为音频和视频信息。
符合这些标准的许多的应用以串行的方式作为二进制数据传送编码的音频和视频信息。作为结果,编码数据常被称为比特流,但是,数据的其它的布置是允许的。为了便于讨论,这里,不管使用什么数据格式或记录或传送技术,都使用术语“比特流”以表示编码数据。
由国际标准组织(International Standards Organization(ISO))公开的这些标准的两个例子是也称为MPEG-2的ISO/IEC 13818-7、高级音频编码(Advanced Audio Coding(AAC))和也称为MPEG-4音频的ISO/IEC 14496-3,子部分(subpart)4。出于本公开的目的,这两个标准共享使得它们相互类似的技术特征。
诸如MPEG-2AAC和MPEG-4音频标准的标准定义了能够传输代表一个或更多个音频通道的编码数据的比特流。音频通道的概念是公知的。常规的具有两个扬声器的立体声重放系统是能够再现常称为左(L)和右(R)通道的两个音频通道的重放系统的公知的例子。用于所谓的家庭影院应用的多通道重放系统能够再现诸如中心(C)、后左环绕(BL)、后右环绕(BR)和低频效果(LFE)通道的附加的通道。
能够从编码比特流重放音频的系统必须包括能够从比特流提取编码数据并将提取的数据解码为代表各个音频通道的信号的装置。解码数据并应用合成滤波器以获得输出信号所需要的存储和处理的硬件资源的成本是解码装置的总制造成本的相当大的部分。作为结果,解码器的功率需求和购买价格明显受解码器能够解码的通道的数量影响。在降低功率需求和购买价格的努力中,音频系统制造商构建能够仅解码在比特流标准中定义的所有通道中的希望的子集的解码器。参照MPEG-2AAC和MPEG-4音频标准作为例子,比特流可传输代表1~48个音频通道的编码数据,但是,大多数的实际的解码器,如果不是所有的话,可只解码最大数量的通道中的一小部分。
典型的解码器将只有在其具有将在特定比特流中传输的所有编码通道解码的能力时才处理该特定比特流。如果典型的解码器接收传输代表比它可解码的音频通道多的音频通道的数据,那么,该解码器基本上舍弃比特流中的编码数据,并且不解码通道中的任一个。由于解码器不具有以智能的方式选择和处理由比特流传输的通道的子集所需要的逻辑,因此存在这种不幸的情况。
发明内容
本发明的目的是提供如下这样的解码器,该解码器能够处理并解码传输代表其数量超过解码器能够解码的通道的数量的多个通道的数据的比特流。
本发明的另一目的是,以高效的并且使处理比特流所需要的计算资源最小化的方式提供该能力。
通过本发明实现这些目的。根据本发明的一个方面,解码器接收传输表示一个或更多个音频通道的编码信息的输入信号,对于由编码信息表示的一个或更多个音频通道确定通道配置图,使用通道配置图以获得规定一个或更多个音频通道中的哪些要被解码的通道选择掩模,并且,根据通道选择掩模从输入信号提取编码的信息并且解码提取的编码的信息。
通过参照以下的讨论和附图,可以更好地理解本发明及其优选实施例的各种特征,在这些附图中,类似的附图标记指的是类似的元素。作为例子阐述以下的讨论的内容和附图。对于本领域技术人员来说,包含于本发明的范围内的替代性的实现和等同的特征应是容易想到的。
附图说明
图1是音频解码器的示意性框图。
图2是用于图1的音频解码器中的通道选择部件的示意性框图。
图3和图4是示出通道选择部件的示意性实现的操作的示意性框图。
图5是可用于实现本发明的各方面的装置的示意性框图。
具体实施方式
A.引言
图1是音频解码器10的示意性框图,该音频解码器10从通信路径11接收传输代表编码音频信息的一个或更多个通道的比特流的输入信号并且沿通信路径19产生代表解码音频信息的一个或更多个通道的输出信号。解码器10具有从输入信号比特流提取编码数据的一系列的块或语法元素的分析部件12,这些块或语法元素然后沿路径13被转送到选择部件14。选择部件14确定编码数据的哪些语法元素沿路径15被转送到解码部件16,该解码部件16向编码数据的块应用解码处理以沿路径17产生解码数据。滤波器部件18向解码数据应用一个或更多个合成滤波器以沿路径19产生解码音频信息。
在解码器10的常规的实现中,选择部件14检查从路径13接收的语法元素的内容,以确定在输入信号中传输的编码音频信息的输入通道的数量,并将该数量与解码器10能够解码的音频通道的数量相比。如果在输入信号中传输的输入通道的数量小于等于解码器10能够解码的通道的数量,那么选择部件14沿路径15将所有通道的语法元素转送到解码部件16;否则,选择部件14不将任何语法元素转送到解码部件16,或者它向解码部件16提供表示没有通道要被解码的一些信号。
解码部件16向包含于沿路径15转送的语法元素中的数据应用适当的解码处理。解码处理应与用于产生在语法元素中传输的编码数据的编码处理互补。如果输入信号符合MPEG-2AAC和MPEG-4音频标准,那么,例如,解码部件16应用分别符合ISO/IEC 13818-7或ISO/IEC 14496-3,子部分4,标准的处理。
从由语法元素传输的数据导出的解码数据沿路径17被转送到滤波器部件18,该滤波器部件18向解码的语法元素中的数据应用作为由编码语法元素中的数据的编码器使用的分析滤波器的逆的合成滤波器。可以以各种方式实现合成滤波器,包括诸如逆修正离散余弦变换(Inverse Modified Discrete Cosine Transform)的变换或诸如正交镜像滤波器(QMF)的滤波器。
B.增强通道选择
包括本发明的各方面的解码器使用增强的选择部件14,以确定限定了要被选择和处理以便重放的输入比特流中的音频通道的通道选择掩模。以下描述从使用一组的一个或更多个通道选择图(channelselection map)的处理构建通道选择掩模的一种实现。这些图限定了可在不对于输入比特流中的通道的数量施加任何限制的情况下被解码的输出通道的数量和类型的配置。替代性的实现是可能的。
由于在启动计算密集的解码算法之前的接收/解码处理的早期阶段基本舍弃不被选择用于解码的那些通道的数据,因此,该通道选择处理是高效的。换句话说,仅向被选择用于解码的那些通道应用全部接收/解码处理的计算密集部分。
这些方面可与符合MPEG-2AAC和MPEG-4音频标准的所有当前限定的变型以及具有类似的数据结构的其它标准的比特流一起使用。可以在需要接收具有任意的数量的通道的输入比特流并处理该比特流以获得通过解码比特流中的一些或所有通道获得的输出通道的最佳配置的基本上任何解码装置中使用本发明。
1.分析部件
分析部件12从输入信号比特流提取编码数据的一系列的块或语法元素。它可使用在现有技术中公知的常规的技术以提取这些语法元素。
符合包含上述的MPEG-2AAC和MPEG-4音频标准的许多不同的标准的比特流在逻辑上被分成称为帧的段。AAC相容比特流中的数据例如限定继而在逻辑上分成不同的类型的一系列的块或语法元素的一系列的可变长度帧。各语法元素中的前3个比特规定元素类型。存在8种不同类型的元素。这里描述这些类型中的一些。
单通道元素(SCE)传输用于单一音频通道的数据。通道对元素(CPE)传输用于一对音频通道的数据。程序配置元素(PCE)描述由比特流传输的数据的通道。低频效果元素(在本公开中称为LFEE)传输用于LFE通道或特殊效果通道的数据。终端元素(TERM)表示帧中的最后的语法元素。
特定的AAC相容比特流可能不包含所有类型的语法元素。例如,仅传输用于单一音频通道的数据的比特流不具有任何CPE,并且,不传输用于特殊效果或LFE通道的数据的比特流不具有LFEE。
2.选择部件
图2是可实现选择部件14以实施本发明的一种方式的示意图。在该实现中,部件32确定比特流的通道配置。在后面更详细地描述这一点。
部件34使用该配置以产生通道配置图(channel configurationmap)。在一个实现中,该图限定输入比特流中的各音频通道与要再现该通道的扬声器位置之间的关系。
部件38提供可规定哪些扬声器位置可被解码的一组的一个或更多个通道选择图。在一个实现中,通道选择图的格式和布置与通道配置图的格式和布置相同。这可有利于由部件36执行的处理,该部件36选择对于输入比特流的通道配置提供最佳匹配的通道选择图。
部件42使用选择的通道选择图,以构建限定解码输入比特流中的哪些音频通道以及如何将它们引导到解码器10的输出通道的通道选择掩模。
将在后面更详细地讨论这些部件。
对于两个或更多个通道选择图中的每一个构建通道选择掩模并且对于解码选择最佳的选择掩模的替代性的实现是可能的。不进一步讨论该实现。
a)提取通道配置
部件32可以以三种方式中的一种确定由特定的MPEG-2AAC或MPEG-4音频相容比特流表示的音频通道的配置。两种方式与符合MPEG-2AAC或MPEG-4音频标准的比特流有关。第三种方式仅与符合MPEG-2AAC标准的比特流有关。
MPEG-2AAC或MPEG-4音频符合比特流可通过使用表示在表I中列出的大量的预定通道配置中的一个的一般称为通道配置指数(channel configuration index)的指数值用信号通知通道配置。对于MPEG-2AAC相容比特流,指数值包含3个比特并且可仅表示表I的前8个条目中的一个。对于MPEG-4音频相容比特流,指令值是4个比特,并且,可表示表I的16个条目中的任一个。配置中的各通道被用扬声器应相对于收听者被放置以再现该通道的位置来描述。MPEG-4音频相容比特流中的指数值0表示通道配置由PCE规定。MPEG-2AAC相容比特流中的指数值0表示通道配置由PCE规定或者它被隐含地规定。如果在任一类型的比特流中存在PCE,则它将在配置过程中取得优先。
表I
使用以下的通道注释:
(C)中前通道;(L)左前通道;(R)右前通道
(BC)后中通道;(BL)后左通道;(BR)后右通道
(SL)侧左通道;(SR)侧右通道;(LFE)低频效果通道处于前部通道和侧面通道之间的另外提到的附加的通道被称为“宽”通道。左宽(wide left,WL)通道处于L位置和SL位置之间,并且,右宽(wide right)通道处于R位置与SR位置之间。
MPEG-2AAC和MPEG-4音频相容比特流也可通过使用承载比特流中的一个音频程序专用的配置信息的PCE来用信号通知通道配置。为了通过使用该方法用信号通知通道配置,通道配置指数必须被设为零。可从ISO/IEC 14496-3标准的部分4.5.1.2获得更多的细节。这些细节不是理解本发明所需要的。
对于MPEG-2AAC相容比特流,可不使用前面描述的通道信号通知(signaling)方法中的任一个。在这种情况下,通道配置指数被设为零,但是,不存在PCE以限定该配置。MPEG-2相容解码器必须通过使用在ISO/IEC 13818-7的部分8.5.3.3中限定的规则从通过音频通道语法元素规定的音频通道的数量和布置推断通道配置。这些规则的细节不是理解本发明所需要的。
b)通道配置图
部件34产生限定输入比特流中的音频通道与要再现通道的扬声器的位置之间的关系的通道配置图。部件38提供规定可解码哪些扬声器位置的一组的一个或更多个通道选择图。优选地,通道配置图和通道选择图具有相同的通道的格式和布置。
关于主通道选择图中的通道的次序限定通道配置图中的项目。主通道选择图限定解码器10可处理和解码的所有可能的通道。
MPEG-2AAC和MPEG-4音频相容比特流可传输多达48个通道。该数量远大于典型的解码器可处理的通道的最大数量。解码器的典型的最大值为约10个通道或更少。在优选的实现中,主通道选择图不包含限定所有的48个通道的条目,原因是这些图中的空间一般不被使用。十个条目的量级的较小的图通常是足够的。如果遇到传输不在主通道选择图中限定的一个或更多个通道的比特流,那么那些过量的通道中的每一个可被舍弃。
在表II中示出假设的限定11个通道的主通道选择图。在大多数的实现中,不是主通道选择图中的所有通道都可在同时被解码。例如,5通道解码器不能对于给定的比特流解码表II的主选择图的所有11个通道,但是,它可解码这些通道中的多达5个通道的各种组合。
表II还示出对于不同的比特流配置的若干示意性通道配置图。各通道配置图限定比特流中的通道与主通道选择图中的通道之间的关系。
对于MPEG-2AAC和MPEG-4音频相容比特流,解码器10可使用比特流中的通道的位置作为对于通道配置图的指数。通道配置图中的相应的条目可表示主通道选择图中的指数。主通道选择图中的条目最终规定与比特流中的给定通道相关的扬声器位置。
表II
示出用于5个不同的比特流配置的通道配置图。在“立体声”标题下的列中表示了用于立体声比特流的通道配置图。比特流的两个通道被映射到L通道和R通道。在“5.0”标题下的列中表示了所谓的5.0比特流的通道配置图。比特流的5个通道被映射到C、L、R、BL和BR通道。在“7.1”标题下的列中表示了用于所谓的7.1比特流的通道配置图。比特流的8个通道被映射到C、L、R、SL、SR、BL、BR和LFE通道。
c)通道选择图
由部件38提供的通道选择图限定解码器10可处理和解码的主通道选择图中的通道的组合。这些图中的一个将由部件36选择,以规定比特流中的哪些通道要被解码。
参照图3,在该附图的右上角示出由部件38提供的4个通道选择图。各图具有用于主通道选择图中的各通道的项目(item)。由符号“1”表示的项目表示相应的通道可被处理和解码。由符号“0”表示的项目表示相应的通道将不被解码。从左向右的前三个通道选择图均具有5个“1”项目。如果对于处理选择这些图中的一个,那么,可以解码最多5个通道。右侧最远的通道选择图具有4个“1”项目。如果对于处理选择该图,那么可以解码最多4个通道。
d)选择通道选择图
部件36检查由部件38提供的所有的通道选择图,并且选择对于由部件34产生的通道配置图提供最佳的匹配的通道选择图。在一个实现中,通过识别允许解码最大数量的通道的通道选择图来确定最佳匹配。在图3和图4中示意性地示出这一点。
参照图3,部件34生成与表II中所示图一致的8通道比特流的通道配置图。以黑体字体表示存在于比特流中的配置图中的通道。以斜体字体表示不存在于比特流中的通道。在该示意性实现中,部件38如上面讨论的那样提供4个通道选择图。部件36将与通道配置图中的通道对应的各通道选择图中的“1”项目的数量计数,并且识别该计数。各通道选择图的计数从左到右为5、5、3和3。
部件36选择可解码最大数量的通道的通道选择图。在本例子中,最大数量为5个,并且,两个图可解码5个通道。在优选的实现中,通道选择图被赋予优先级,并且,在同等(tie)的情况下,选择更高优先级的通道选择图。在本例子中,从左到右以优先级的次序示出通道选择图。作为结果,对于处理比特流选择第一通道选择图。
在图4中表示另一例子。在本例子中,部件34生成用于4通道比特流的通道配置图。分别以黑体和斜体字体表示存在和不存在于比特流中的通道。部件38同样如上面讨论的那样提供4个通道选择图。部件36将与通道配置图中的通道对应的各通道选择图中的“1”项目的数量计数。各通道选择图的计数从左到右为3、3、3和4。部件36选择解码4个通道的通道选择掩模。
e)通道选择掩模
部件42使用选择的通道选择图,以构建通道选择掩模,该通道选择掩模限定解码输入比特流中的哪些音频通道以及如何将它们引导到解码器10的输出通道。掩模禁止某些通道的解码并且允许其它通道的解码。在图3和图4所示的实现中,掩模包含分别由“O”和“X”符号表示的项目。掩模中的“O”项目允许通道被解码。掩模中的“X”项目禁止通道被解码。
对于比特流中的各通道该通道选择掩模均具有项目。如果通道选择图中的项目是“1”,那么通道选择掩模被构建以对于相应的项目具有“O”。如果通道选择图中的项目是“0”,那么,通道选择掩模被构建为对于相应的项目具有“X”。
参照图3,通道选择掩模具有8个项目,各项目用于比特流中的各通道,并且,掩模中的5个“O”项目与选择的通道选择图中的5个“1”项目对应。参照图4,通道选择掩模具有4个项目,各项目用于比特流中的各通道,并且,掩模中的4个“O”项目与选择的通道选择图中的4个“1”项目对应。
f)提取并选择通道元素
部件44和46根据通道选择掩模处理比特流。部件44从比特流提取音频通道语法元素并将它们转送到部件46。部件46相对于通道选择掩模检查各音频通道语法元素。如果相应的掩模项目被启用(enabled),或者是图示的“O”项目,那么该语法元素沿路径15被转送以供解码。如果相应的掩模项目被禁用,或者为图示的“X”项目,那么语法项目被舍弃。
如果通过产生可变长度符号的诸如Huffmann编码或算术编码的编码处理来编码帧中的或语法元素中的数据,那么必须向所有编码的数据应用适当的解码,使得各语法元素和帧的端部可被正确地确定。被选择用于解码的通道的数据以正常的方式被处理。被禁止进一步的解码的通道的数据可如希望的那样被舍弃或者被暂时存储以及重写。
如果在编码的数据中检测到不能被校正的任何误差,那么可能希望减弱(mute)解码器的输出或者采取其它的行动以消除误差。由于误差可导致解码器丧失与帧的同步,因此,即使在与被舍弃的通道对应的数据中检测到误差,这可能也是必须的。可以使用常规的误差恢复技术。
如果隐含地确定通道配置图,那么必须在可确定通道配置之前检查比特流的整个帧。作为结果,第一帧中的音频通道语法元素不能如上面描述的那样被解码,原因是它们在可构建通道选择掩模之前已被处理。仅对于比特流的第一接收帧出现这种情况。而由于根据ISO/IEC13818-7标准的部分8.5.3.3“不允许隐含的重构”,因此,不需要隐含地对于比特流的任何随后的帧确定通道配置图。如果通道配置改变,那么必须通过使用PCE来指示。
可以以下面描述的各种方法根据隐含地确定的通道配置来处理比特流的第一接收帧中的音频通道语法元素。
一个方法禁止从第一接收帧解码音频。如上所述从第一接收帧确定通道选择掩模,并且,对于第二和随后的帧的解码使用该掩模。
另一方法在处理之前缓存(buffer)各帧的语法元素。该方法需要可能与现有技术的解码器那样多的附加的存储器,但是,它提供了与如上面描述的那样从比特流中的明确的信息构建其通道配置的解码器所实现的计算复杂性的降低基本上相同的计算复杂性的降低。
又一方法通过使用“平(flat)”通道选择掩模处理第一帧中的音频通道语法元素。平通道选择掩模使得能够对于前N个通道进行解码,这里,N是由部件38提供的通道选择图中的任一个允许的通道的最大数量。该方法只能保证对于第一接收帧,输出通道的数量被有效地限制为解码器可解码的最大数量。该方法不能确保各解码通道与存在于由部件38提供的通道选择图中的一个中的通道对应。
一般地,使扬声器位置与隐含地配置的通道相关联的尝试应被视为猜测,这是因为在比特流中没有明确地传输关于预期的扬声器位置的信息。然而,由于在ISO/IEC 13818-7部分8.5.3.3中概括的用于分配被隐含地信号通知的通道的过程提供某些指导,因此,这些猜测在许多的情况下产生良好的结果。
C.实现
包含本发明的各种方面的装置可被以各种方式实现,包括由计算机执行的软件或包含诸如与与在通用计算机中发现的部件类似的部件耦合的数字信号处理器(DSP)电路的更多的专用部件的一些其它的装置。图5是可用于实现本发明的各方面的装置70的示意性框图。处理器72提供计算资源。RAM 73是由处理器72对于处理而使用的系统随机存取存储器(RAM)。ROM 74表示用于存储操作装置70所需要的程序并且可能用于实施本发明的各种方面的诸如只读存储器(ROM)的一些形式的持久存储器。I/O控制76表示用于通过通信路径11、19接收和传送信号的接口电路。在所示的实施例中,所有的主要系统部件与可表示多于一个的物理或逻辑总线的总线71连接;但是,总线结构不是实现本发明所需要的。
实施本发明的各方面所需要的功能可由以多种方式实现的部件执行,包括离散逻辑部件、集成电路、一个或更多个ASIC和/或程序控制处理器。对于本发明,这些部件的实现方式是不重要的。
可通过各种机器可读介质(诸如贯穿包含超声波到紫外频率的频谱的基带或调制通信路径、或包含磁带、卡或盘、光卡或盘和包含纸的介质上的可检测标记的通过使用基本任何记录技术传输信息的存储介质)传输本发明的软件实现。
Claims (13)
1.一种用于解码编码音频信息的方法,其中,所述方法包括:
接收传输表示一个或更多个音频通道的编码信息的输入信号;
对于由编码信息表示的一个或更多个音频通道确定通道配置图;
从使用通道配置图的处理获得通道选择掩模,其中所述通道选择掩模规定所述一个或更多个音频通道中的哪些音频通道要被解码;
从所述输入信号提取编码信息;以及
对于在所述通道选择掩模中规定的那些音频通道解码所提取的编码信息。
2.根据权利要求1的方法,通过使用多个通道选择图获得通道选择掩模,其中,
通道配置图限定所述输入信号中的各个音频通道中的每一个与打算再现该音频通道的相应的扬声器位置之间的关系;
各通道选择图规定哪些扬声器位置能够被解码,并且,
该方法包括:
选择对于通道配置图提供最佳匹配的通道选择图;以及
构建通道选择掩模,使得它规定通道配置图中的在所选择的通道选择图中具有相应的扬声器位置的各通道。
3.根据权利要求2的方法,包括:
选择具有最大数量的存在于通道配置图中的扬声器位置的通道选择图;以及
选择所选择的通道选择图作为对于通道配置图提供最佳匹配的通道选择图。
4.根据权利要求3的方法,其中,
各通道选择图具有各自的优先级;
两个或更多个通道选择图具有其数量等于所述最大数量的存在于通道配置图中的多个扬声器位置;并且,
该方法包括从所述两个或更多个通道选择图选择具有最高的优先级的通道选择图。
5.根据权利要求1的方法,通过使用多个通道选择图获得通道选择图,其中,
通道配置图限定所述输入信号中的各个音频通道中的每一个与打算再现该音频通道的相应的扬声器位置之间的关系;
各通道选择图规定哪些扬声器位置能够被解码,并且,
该方法包括:
构建分别规定在各通道选择图中具有相应的扬声器位置的通道的两个或更多个通道选择掩模;
从所述两个或更多个通道选择掩模选择对于通道配置图提供最佳匹配的通道选择掩模,其中,所选择的通道选择掩模是规定所述一个或更多个音频通道中的哪些音频通道要被解码的通道选择掩模。
6.根据权利要求1~5中的任一项的方法,其中,编码音频信息表示第一数量的音频通道,通道选择掩模规定第二数量的要被解码的音频通道,并且,第一数量比第二数量大。
7.根据权利要求1~6中的任一项的方法,通过检查在输入信号中传输的数据确定通道配置图。
8.根据权利要求7的方法,从规定一组预定义的通道配置的一个通道配置的输入信号中的数据确定通道配置图。
9.根据权利要求7的方法,从明确地规定在输入信号中表示的各音频通道的输入信号中的数据确定通道配置图。
10.根据权利要求7的方法,通过确定在输入信号中表示的音频通道的数量和布置确定通道配置图。
11.根据权利要求10的方法,其中,
在多个帧中布置在输入信号中传输的编码音频信息,
通过从第一接收帧确定音频通道的数量和布置来确定通道配置图并且,
该方法包括:
根据在平通道选择掩模中规定的音频通道解码从第一接收帧提取的编码信息,其中,所述平通道选择掩模规定能够被解码的音频通道的最大数量;以及
对于在通道选择掩模中规定的那些音频通道解码从第一接收帧后面的帧提取的编码信息。
12.一种用于解码编码音频信息的设备,其中,该设备包括用于执行权利要求1~11中的任一项中的方法的所有步骤的手段。
13.一种存储介质,记录能够由装置执行以执行权利要求1~11中的任一项中的方法的所有步骤的指令的程序。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US24918509P | 2009-10-06 | 2009-10-06 | |
US61/249,185 | 2009-10-06 | ||
PCT/EP2010/006059 WO2011042149A1 (en) | 2009-10-06 | 2010-10-05 | Efficient multichannel signal processing by selective channel decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102549656A true CN102549656A (zh) | 2012-07-04 |
CN102549656B CN102549656B (zh) | 2013-04-17 |
Family
ID=43428208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800448770A Active CN102549656B (zh) | 2009-10-06 | 2010-10-05 | 用于解码编码音频信息的方法和设备 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8738386B2 (zh) |
EP (1) | EP2486563B1 (zh) |
JP (1) | JP5193397B2 (zh) |
CN (1) | CN102549656B (zh) |
AR (1) | AR079287A1 (zh) |
TW (1) | TWI413110B (zh) |
WO (1) | WO2011042149A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112071324A (zh) * | 2019-06-10 | 2020-12-11 | 谷歌有限责任公司 | 音频通道混合 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102754159B (zh) | 2009-10-19 | 2016-08-24 | 杜比国际公司 | 指示音频对象的部分的元数据时间标记信息 |
EP2830332A3 (en) | 2013-07-22 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration |
US10356759B2 (en) * | 2016-03-11 | 2019-07-16 | Intel Corporation | Parameter encoding techniques for wireless communication networks |
GB2568274A (en) * | 2017-11-10 | 2019-05-15 | Nokia Technologies Oy | Audio stream dependency information |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005101905A1 (en) * | 2004-04-16 | 2005-10-27 | Coding Technologies Ab | Scheme for generating a parametric representation for low-bit rate applications |
US20070011004A1 (en) * | 2005-07-11 | 2007-01-11 | Lg Electronics Inc. | Apparatus and method of processing an audio signal |
US20070233296A1 (en) * | 2006-01-11 | 2007-10-04 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with scalable channel decoding |
US20080221907A1 (en) * | 2005-09-14 | 2008-09-11 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
CN101490743A (zh) * | 2006-07-08 | 2009-07-22 | 诺基亚公司 | 对立体声音频信号的动态解码 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6128597A (en) | 1996-05-03 | 2000-10-03 | Lsi Logic Corporation | Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor |
JP2004194100A (ja) * | 2002-12-12 | 2004-07-08 | Renesas Technology Corp | オーディオ復号再生装置 |
KR100512943B1 (ko) * | 2003-10-14 | 2005-09-07 | 삼성전자주식회사 | 위성 방송 수신기 및 그의 위성 방송 수신 방법 |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7536299B2 (en) * | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US7965848B2 (en) * | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
CN102203854B (zh) | 2008-10-29 | 2013-01-02 | 杜比国际公司 | 使用预先存在的音频增益元数据的信号削波保护 |
TWI501580B (zh) | 2009-08-07 | 2015-09-21 | Dolby Int Ab | 資料串流的鑑別 |
RU2526745C2 (ru) | 2009-12-16 | 2014-08-27 | Долби Интернешнл Аб | Низведение параметров последовательности битов sbr |
TWI529703B (zh) | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
-
2010
- 2010-09-21 TW TW099132007A patent/TWI413110B/zh active
- 2010-09-29 AR ARP100103537A patent/AR079287A1/es active IP Right Grant
- 2010-10-05 EP EP10767932.6A patent/EP2486563B1/en active Active
- 2010-10-05 US US13/393,584 patent/US8738386B2/en active Active
- 2010-10-05 CN CN2010800448770A patent/CN102549656B/zh active Active
- 2010-10-05 JP JP2012531290A patent/JP5193397B2/ja active Active
- 2010-10-05 WO PCT/EP2010/006059 patent/WO2011042149A1/en active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005101905A1 (en) * | 2004-04-16 | 2005-10-27 | Coding Technologies Ab | Scheme for generating a parametric representation for low-bit rate applications |
US20070011004A1 (en) * | 2005-07-11 | 2007-01-11 | Lg Electronics Inc. | Apparatus and method of processing an audio signal |
US20080221907A1 (en) * | 2005-09-14 | 2008-09-11 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
US20070233296A1 (en) * | 2006-01-11 | 2007-10-04 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with scalable channel decoding |
CN101490743A (zh) * | 2006-07-08 | 2009-07-22 | 诺基亚公司 | 对立体声音频信号的动态解码 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112071324A (zh) * | 2019-06-10 | 2020-12-11 | 谷歌有限责任公司 | 音频通道混合 |
CN112071324B (zh) * | 2019-06-10 | 2023-12-08 | 谷歌有限责任公司 | 应用语音级别估计模型来选择输出通道的方法、系统 |
Also Published As
Publication number | Publication date |
---|---|
AR079287A1 (es) | 2012-01-18 |
JP2013506860A (ja) | 2013-02-28 |
US20120209615A1 (en) | 2012-08-16 |
EP2486563B1 (en) | 2020-02-26 |
WO2011042149A1 (en) | 2011-04-14 |
CN102549656B (zh) | 2013-04-17 |
US8738386B2 (en) | 2014-05-27 |
TWI413110B (zh) | 2013-10-21 |
JP5193397B2 (ja) | 2013-05-08 |
EP2486563A1 (en) | 2012-08-15 |
TW201140560A (en) | 2011-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240304193A1 (en) | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder | |
CN102576559B (zh) | 数据流的认证 | |
CA2566366C (en) | Audio signal encoder and audio signal decoder | |
CN100525513C (zh) | 用于处理两个或更多个初始解码音频信号的方法和设备 | |
CN102549656B (zh) | 用于解码编码音频信息的方法和设备 | |
CA2918641C (en) | Renderer controlled spatial upmix | |
CN101926181B (zh) | 用于处理音频信号的方法和装置 | |
CN103493127B (zh) | 用于参数空间音频编码和解码的方法、参数空间音频编码器和参数空间音频解码器 | |
CN101160619A (zh) | 适应性残余音频编码 | |
CN101292428B (zh) | 用于编码/解码的方法和装置 | |
CN101297353A (zh) | 编码和解码多声道音频信号的方法及其装置 | |
CN108140390A (zh) | 用于压缩高阶高保真度立体声响复制声音或声场表示的分层编码和数据结构 | |
US11869523B2 (en) | Method and apparatus for decoding a bitstream including encoded higher order ambisonics representations | |
CN102369573A (zh) | 嵌入和提取辅助数据 | |
US20230145725A1 (en) | Multi-channel audio signal encoding and decoding method and apparatus | |
WO2007081155A1 (en) | Method, medium, and system encoding and/or decoding audio data | |
CN1312961C (zh) | 音频信号处理器和音频信号处理方法 | |
US8654901B2 (en) | Decoding apparatus, decoding method, and computer-readable storage medium | |
KR101048407B1 (ko) | 디코딩 장치, 디코딩 방법 및 컴퓨터로 판독 가능한 기록 매체 | |
KR100983054B1 (ko) | 디코딩 장치, 디코딩 방법, 인코딩 방법 및 컴퓨터로 판독가능한 기록 매체 | |
JP2007310087A (ja) | 音声符号化装置及び音声復号装置 | |
WO2018001500A1 (en) | Apparatuses and methods for encoding and decoding a multichannel audio signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |