CN101371298A

CN101371298A - 用于解码信号的方法和装置

Info

Publication number: CN101371298A
Application number: CNA2007800027924A
Authority: CN
Inventors: 吴贤午; 房熙锡; 金东秀; 林宰显; 郑亮源
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2006-01-19
Filing date: 2007-01-19
Publication date: 2009-02-18
Also published as: CN101361120A; CN101361120B; CN101361115A; CN101361116B; CN101361117A; CN101361119B; CN101361118B; CN101361118A; CN101361119A; CN101361121B; CN101361117B; CN101361121A; CN101361116A

Abstract

公开了一种用于解码信号的装置及其方法，通过该装置和方法音频信号可按改变/赋予音频信号的空间特性(例如，听众的虚拟位置、特定源的虚拟位置)的方式来控制。本发明包括：接收对象参数；通过解析所接收的对象参数来提取对象信息；使用所提取的对象信息与包括用户控制信息、默认控制信息、设备控制信息和设备信息的至少之一的控制信息来生成控制参数；以及使用对象参数和控制参数生成确定输出信号中对象的位置和电平的渲染参数。

Description

用于解码信号的方法和装置

技术领域

本发明涉及用于解码信号的方法和装置，尤其涉及用于解码音频信号的方法和装置。尽管本发明适于宽泛范围的应用，但它尤其适用于解码音频信号。

背景技术

一般而言，通过从使用由编码器生成的渲染参数(例如声道电平信息)渲染缩减混音信号而生成输出信号(例如多声道音频信号)，来对音频信号进行解码。

发明公开

技术问题

然而，在将由编码器生成的渲染参数用于如实渲染的情形中，解码器不能根据设备信息(例如可用输出声道的数目)来生成输出信号，改变音频信号的空间特性，并将空间特性赋予音频信号。具体地，不能针对符合解码器的可用输出声道数目的声道数目生成音频信号，将听众的虚拟位置移至舞台或最后一排座位，或给出特定源信号(例如钢琴信号)的虚拟位置(例如左侧)。

技术方案

因此，本发明涉及一种基本上消除由于相关技术的限制和缺点造成的一个或多个问题的用于解码信号的装置及其方法。

本发明的一目的在于提供用于解码信号的装置及其方法，藉此可按照改变/给出音频信号的空间特性(例如，听众的虚拟位置、特定源的虚拟位置)的方式控制音频信号。

本发明的另一目的在于提供用于解码信号的装置及其方法，籍此可生成解码器的输出可用声道的信息相匹配的输出信号。

有益效果

因此，本发明提供以下效果或优点。

首先，因为在转换对象参数时考虑控制信息和/或设备信息，所以能够以各种方式改变听众的虚拟位置或源的虚拟位置，并生成与可用于输出的声道数目相匹配的输出信号。

其次，在已生成输出信号之后并不向该输出信号赋予空间特性或修改空间特性。相反，在转换了对象参数之后，输出信号使用经转换的对象参数(渲染参数)生成。因此，能够减少相当的计算量。

附图简述

包括在内以提供本发明的进一步理解、并结合其中构成本说明书的一部分的附图例示了本发明的各个实施方式，并与描述一起用来说明本发明的原理。

在附图中：

图1是根据本发明一实施方式的用于编码信号的装置和用于解码信号的装置的框图；

图2是根据本发明另一实施方式的用于解码信号的装置的框图；

图3是说明在5-1-5₁树状配置的情形中声道电平差与经转换声道差之间的关系的框图；

图4是根据ITU标准的扬声器排列的示图；

图5和6分别是根据三维音效的虚拟扬声器位置的示图；

图7是说明扬声器之间虚拟声源的位置的示图；以及

图8和9是分别说明源信号的虚拟位置的示图。

发明最佳实施方式

本发明的附加特征和优点将在以下描述中阐述，其一部分将从描述中显而易见，或者可通过本发明的实践获知。本发明的目的和其它优点将由在书面描述及其权利要求和附图中具体指出的结构实现或达成。

为了实现这些和其它优点并根据本发明的用途，如所体现和广泛描述地，一种根据本发明的用于解码信号的方法包括以下步骤：接收包括与至少一个对象信号相对应的电平信息的对象参数，通过将控制参数应用到对象参数将与至少一个对象信号相对应的电平信息转换成与输出声道相对应的电平信息，并生成包括与输出声道相对应的电平信息的渲染参数以控制因缩减混音至少一个对象信号而得到的对象缩减混音信号。

优选地，至少一个对象信号包括声道信号或源信号。

优选地，至少一个对象信号包括对象电平信息或对象间相关信息的至少之一。

更为优选地，如果至少一个对象信号是声道信号，则对象电平信息包括声道电平差。

并且，如果至少一个对象信号是源信号，则对象电平信息包括源电平差。

优选地，控制参数使用控制信息来生成。

更为优选地，控制信息包括从编码器接收的控制信息、用户控制信息、默认控制信息、设备控制信息、以及设备信息的至少之一。

并且，该控制信息包括HRTF滤波器信息、对象位置信息、以及对象电平信息的至少之一。

此外，如果该至少一个对象信号是声道信号，则控制信息包括听众的虚拟位置信息和多声道扬声器的虚拟位置信息的至少之一。

除此之外，如果该至少一个对象信号是源信号，则控制信息包括该源信号的至少一个电平信息和该源信号的虚拟位置信息。

优选地，控制参数基于对象参数使用对象信息来生成。

优选地，该方法进一步包括以下步骤：基于至少一个对象信号接收对象缩减混音信号，并通过将渲染参数应用于对象缩减混音信号来生成输出信号。

为了进一步实现这些和其它优点并根据本发明的用途，一种用于解码信号的装置包括：对象参数接收单元，接收包括与至少一个对象信号相对应的电平信息的对象参数；渲染参数生成单元，通过将控制参数应用到对象参数将与至少一个对象信号相对应的电平信息转换成与输出声道相对应的电平信息，该渲染参数生成单元生成包括与输出声道相对应的电平信息的渲染参数以控制因缩减混音至少一个对象信号而得到的对象缩减混音信号。

优选地，该装置进一步包括：通过将渲染参数应用于对象缩减混音信号来基于至少一个对象信号生成输出信号的渲染单元。

优选地，该装置进一步包括通过编码渲染参数生成渲染参数流的渲染参数编码单元。

可以理解，前面的一般描述和以下的详细描述是示例性和说明性的，并且旨在提供对所要求保护发明的进一步说明。

发明实施方式

现在将详细参考本发明的优选实施方式，其示例在附图中例示。

首先，为了通过改变对象缩减混音信号的空间特性、将空间特性赋予对象缩减混音信号、或根据解码器的设备信息来修改音频信号来控制对象缩减混音信号，通过转换对象参数来生成渲染参数。在该情形中，对象缩减混音信号(下文中称为缩减混音信号)通过缩减混音多个对象信号(声道信号或源信号)生成。因此，能通过将渲染参数应用于缩减混音信号来生成输出信号。

图1是根据本发明一实施方式的用于编码信号的装置和用于解码信号的装置的框图。

参看图1，根据本发明一实施方式的用于编码信号的装置100可包括缩减混音单元110、对象参数提取单元120、以及控制信息生成单元130。并且，根据本发明一实施方式的用于解码信号的装置200可包括接收单元210、控制参数生成单元220、渲染参数生成单元230、以及渲染单元240。

信号编码装置100的缩减混音单元110缩减混音多个对象信号以生成对象缩减混音信号(下文中称为缩减混音信号DX)。在该情形中，对象信号是声道信号或源信号。具体地，该源信号可以是特定乐器的信号。

对象参数提取单元120从多个对象信号中提取对象参数OP。该对象参数包括对象电平信息和对象间相关信息。如果对象信号是声道信号，则对象电平信息可包括声道电平差(CLD)。如果对象信号是源信号，则对象电平信息可包括源电平信息。

控制信息生成单元130生成至少一个控制信息。在该情形中，控制信息是所提供的改变听众的虚拟位置或多声道扬声器的虚拟位置、或将空间特性赋予源信号的信息，并可包括HRTF滤波器信息、对象位置信息、对象电平信息等。具体地，如果对象信号是声道信号，则控制信息包括听众的虚拟位置信息、多声道扬声器的虚拟位置信息。如果对象信号是源信号，则控制信息包括源信号的电平信息、该源信号的虚拟位置信息等。

同时，在听众的虚拟位置改变的情形中，一控制信息被生成以对应于听众的特定虚拟位置。在空间特性被赋予源信号的情形中，一控制信息被生成以对应于诸如现场模式、俱乐部乐队模式、卡拉OK模式、爵士模式、节奏模式等的特定模式。提供该控制信息是为了调节各个源信号或统一调节多个源信号的至少一个(归组源信号)。例如，在节奏模式的情形中，它能统一调节与节奏乐器相关联的源信号。在该情形中，‘统一调节’表示同时调节数个源信号而不将同一参数应用于各个源信号。

在生成控制信息之后，控制信息生成单元130能生成包含多个控制信息(即音效的数目)、标记和控制信息的控制信息比特流。

信号解码装置200的接收单元210包括缩减混音接收单元211、对象参数接收单元212、以及控制信息接收单元213。在该情形中，缩减混音接收单元211、对象参数接收单元212、以及控制信息接收单元213分别接收缩减混音信号DX、对象参数OP、以及控制信息CI。同时，接收单元210能进一步对所接收信号执行多路分解、解析、解码等。

对象参数接收单元212从对象参数OP中提取对象信息OI。如果对象信号是源信号，则对象信息包括多个源、源类型、源索引等。如果对象信号是声道信号，则对象信息可包括声道信号的树状配置(例如5-1-51配置)等。随后，对象参数接收单元212将所提取的对象信息OI输入到参数生成单元220。

控制参数生成单元220使用控制信息、设备信息DI、以及对象信息OI的至少之一来生成控制参数CP。如在前面对控制信息生成单元130的描述中所提及的，控制信息可包括HRTF滤波器信息、对象位置信息、对象电平信息等。如果对象信号是声道信号，则控制信息可包括听众的虚拟位置信息和多声道扬声器的虚拟位置信息的至少之一。如果控制信号是源信号，则控制信息可包括该源信号的电平信息和该源信号的虚拟位置信息。此外，控制信息可进一步包括设备信息DI的概念。

同时，控制信息可根据其出处分类成不同类型，诸如1)由控制信息生成单元130生成的控制信息(CI)、2)由用户输入的用户控制信息(UCI)、3)由控制参数生成单元220本身生成的设备控制信息(未在示图中示出)、以及4)储存在信号解码装置中的默认控制信息(DCI)。

控制参数生成单元220能通过选择针对特定缩减混音信号接收的控制信息CI、用户控制信息UCI、设备控制信息、以及默认控制信息DCI中的一个来生成控制参数。在该情形中，所选控制信息可对应于a)由控制参数生成单元220随机选择的控制信息，或b)由用户选择的控制信息。

设备信息DI是储存在解码装置200中的信息，并包括可用于输出的声道的数目。并且，设备信息DI可属于广义的控制信息。

对象信息OI是有关缩减混音成缩减混音信号的至少一个对象信号的信息，并且可对应于由对象参数接收单元212输入的对象信息。

渲染参数生成单元230通过使用控制参数CP转换对象参数OP来生成渲染参数RP。同时，渲染参数生成单元230能生成渲染参数RP以供使用相关性来将立体声添加到输出信号中，这在以下详细说明。

渲染单元240通过使用渲染参数RP渲染缩减混音信号DX来生成输出信号。在该情形中，缩减混音信号DX可通过信号编码装置100的缩减混音单元110来生成，并且可以是由用户任意缩减混音的任意缩减混音信号。

图2是根据本发明另一实施方式的用于解码信号的装置的框图。

参看图2，根据本发明另一实施方式的用于解码信号的装置是扩展图1所示的本发明的前一实施方式的信号解码装置的A区的一个示例，并且进一步包括渲染参数编码单元232和渲染参数解码单元234。

除此之外，渲染参数解码单元234和渲染单元240可被实现为独立于包括渲染参数编码单元232的信号解码装置200的设备。

渲染参数编码单元232通过编码由渲染参数生成单元230生成的渲染参数来生成渲染参数比特流RPB。

渲染参数解码单元234解码渲染参数比特流RPB，然后将经解码渲染参数输入到渲染单元240。

渲染单元240通过使用由渲染参数解码单元234解码的渲染参数渲染缩减混音信号DX来输出一输出信号。

根据本发明的一个和另一个实施方式的解码装置各自包括上述元件。在以下描述中，将说明1)对象信号是声道信号；以及2)对象信号是源信号的情形的细节。

1.声道信号(修改空间特性)的情形

首先，如果对象信号是声道信号，则对象参数可包括声道电平信息和声道相关信息。通过使用控制参数转换声道电平信息(和声道相关信息)，能生成转换成渲染参数的声道电平信息(和声道相关信息)。

因而，用于生成渲染参数的控制参数可以是使用设备信息、控制信息、或设备信息和控制信息两者生成的一个控制参数。以下分别说明考虑设备信息的情形、考虑控制信息的情形以及考虑设备信息和控制信息两者的情形。

1-1.考虑设备信息(可缩放)的情形

如果控制参数生成单元220使用设备信息DI，更具体地是可输出声道数目生成控制参数，则由渲染单元240生成的输出信号可被生成为具有相同数目的可输出声道。通过使用控制参数转换对象参数OP的声道电平差(以及声道相关性)，可生成经转换的声道电平差。这如下进行说明。具体地，假定可输出声道数目为2，并且对象参数OP对应于5-1-5₁树状配置。

图3是说明在5-1-5₁树状配置情形中声道电平差与经转换声道差之间的关系的框图。

如果声道电平差和声道相关性符合5-1-5₁树状配置，则声道电平差CLD如图3的左侧所示为CLD₀～CLD₄，而声道相关性ICC为ICC₀～ICC₄(未在示图中示出)。例如，左声道L和右声道R之间的电平差为CLD₀，其相应的声道相关性为ICC₀。

如果诸如图3右侧所示，可输出声道数目为2(即，左总声道Lt和右总声道Rt)，使用声道差CLD₀～CLD₄和声道相关性ICC₀～ICC₄(未在示图中示出)来表示经转换的声道电平差CLD和经转换的声道相关性ICC。

[公式1]

{CLD}_{α} = 10 * \log_{10} (P_{L_{t}} / P_{R_{t}})

在该情形中，

L_t的幂而

是R_t的幂。

[公式2]

P_{L_{t}} = P_{L} + P_{L_{s}} + P_{C} / 2 + P_{LFE} / 2

P_{R_{t}} = P_{R} + P_{R_{s}} + P_{C} / 2 + P_{LFE} / 2

[公式3]

[\begin{matrix} P_{L} \\ P_{R} \\ P_{C} \\ P_{LFE} \\ P_{Ls} \\ P_{Rs} \end{matrix}] = [\begin{matrix} {(c_{1, OTT 3} c_{1, OTT 1} c_{1, OTT 0})}^{2} \\ {(c_{2, OTT 3} c_{1, OTT 1} c_{1, OTT 0})}^{2} \\ {(c_{1, OTT 4} c_{2, OTT 1} c_{1, OTT 0})}^{2} \\ {(c_{2, OTT 4} c_{2, OTT 1} c_{1, OTT 0})}^{2} \\ {(c_{1, OTT 2} c_{2, OTT 0})}^{2} \\ {(c_{2, OTT 2} c_{2, OTT 0})}^{2} \end{matrix}] m^{2}

c_{1, OTTx}^{l, m} = \sqrt{\frac{10^{\frac{{CLD}_{X}^{l, m}}{10}}}{1 + 10^{\frac{{CLD}_{X}^{l, m}}{10}}}}

c_{2, OTTx}^{l, m} = \sqrt{\frac{1}{1 + 10^{\frac{{CLD}_{X}^{l, m}}{10}}}}

[公式4]

P_C/2+P_LFE/2＝(c_2，OTT1*c_1，OTT0)²*m²/2

通过将公式4和公式3插入公式2，然后将公式2插入公式1，能够表示经转换的电平差CLD。

[公式5]

{ICC}_{α} = Re {\frac{P_{L_{t} R_{t}}}{\sqrt{P_{L_{t}} P_{R_{t}}}}},

其中

P_{x 1 x 2} = Σ x_{1} x_{2}^{*}

[公式6]

P_{L_{t} R_{t}} = P_{LR} + P_{L_{s} R_{s}} + P_{C} / 2 + P_{LFE} / 2

[公式7]

P_LR＝ICC₃*c_1，OTT3*c_2，OTT3*(c_1，OTT1*c_1，OTT0)²*m²

P_{L_{S} R_{S}} = {ICC}_{2} * c_{1, OTT 2} * c_{2, OTT 2} * {(c_{2, OTT 0})}^{2} * m^{2}

通过将公式7和公式3插入公式6，然后将公式6和公式2插入公式5，能够使用声道差CLD₀～CLD₄和声道相关性ICC₀～ICC₄表示经转换的电平相关性ICC。

1-2.考虑控制信息的情形

在控制参数生成单元220使用控制信息生成控制参数的情形中，由渲染单元240生成的输出信号可提供各种音效。例如，在流行音乐音乐会的情形中，可提供观众席音效或舞台音效。

图4是根据ITU标准的扬声器排列的示图，而图5和图6分别是根据三维音效的虚拟扬声器位置的示图。

参看图4，根据ITU标准，扬声器位置应当被定位于例如各距离和角度的相应点，而听众应当处于中心点。

如果位于图4所示点处的听众尝试体验到与位于图5所示点处的相同音效，则包括观众叫声的环绕声道L和R的增益被减小，角度向后方移动，并且左右声道L和R的位置被移到靠近听众的耳朵。为了带来与图6所示点处相同的音效，左声道L和中央声道C之间的角度被减小，且左声道L与中央声道C之间的增益被增大。

为此，在通过与扬声器(L、R、L_S、R_S、C)对于听众的位置相对应的声音路径(H_L、H_R、H_C、H_Ls、H_Rs)的逆函数之后，可通过与虚拟扬声器(L’、R’、L_S’、R_S’、C’)位置相对应的声音路径(H_L’、H_R’、H_C’、H_Ls，、H_Rs，)。具体地，左声道信号可由公式8表示。

[公式8]

L_新＝函数(H_L，H_L′，L)＝函数(H_{L_tot}，L)

如果存在数个H_L，即如果存在多种音效，则公式8可被表达为公式9。

[公式9]

L_{新_i}＝函数(H_{L_tot_i}，L)

在该情形中，与H_{x_tot_I}(x是任意声道)相对应的控制信息可由编码装置的控制信息生成单元130或控制参数生成单元220生成。

以下说明用于通过改变对象参数，更具体为声道电平差CLD来改变音效的原理的细节。

图7是说明扬声器之间的虚拟声源的位置的示图。一般而言，任意声道信号x_i具有如公式10所示的增益g_i。

[公式10]

x_i(k)＝g_ix(k)

在该情形中，x_i是第i个声道的输入信号，g_i是第i个声道的增益，而x是源信号。

参看图7，如果虚拟源VS与切线之间的角度为

两个声道ch1和ch2之间的角度为

且声道ch1和ch2的增益分别为g₁和g₂，则建立以下公式11的关系。

[公式11]

根据公式11，通过调节g₁和g₂，能改变虚拟源VS的位置

因为g₁和g₂取决于声道电平差CLD，所以能通过调节声道电平差来改变虚拟源VS的位置。

1-3.考虑设备信息和控制信息两者的情形

首先，控制参数生成单元240能通过考虑设备信息和控制信息两者来生成控制参数。如果解码器的可输出声道数目是‘M’，则控制参数生成单元220根据所输入的控制信息CI、UCI和DCI选出与可输出声道数目M相匹配的控制信息，或者控制参数生成单元220能自己生成与可输出声道数目M相匹配的控制参数。

例如，如果缩减混音信号的树状配置为5-1-5₁树状配置，并且如果可输出声道数目为2，则控制参数生成单元220根据所输入的控制信息CI、UCI和DCI选出与立体声声道相匹配的控制信息，或者控制参数生成单元220能自己生成与立体声声道相匹配的控制参数。

因而，控制参数可通过考虑设备信息和控制信息两者而生成。

2.源信号的情形

如果对象信号是源信号，则对象参数可包括源电平信息。在使用对象参数原样渲染时，输出信号变成不具有空间特性的多个源信号。

为了将空间特性赋予对象参数，可在通过转换对象参数来生成渲染参数时考虑控制信息。当然，类似于声道信号的情形，能够考虑设备信息(可输出声道数目)以及控制信息。

一旦空间特性被赋予各个源信号，源信号就可各自再现以提供各种效果。例如，如图8所示的歌声V从左侧再现，鼓D从中央再现，而键盘K从右侧再现。例如，如图9所示的歌声V和鼓D从中央再现，而键盘K从左侧再现。

因而，以下说明一种使用相关性IC来在源信号已被放置在特定位置处之后通过赋予空间特性来将特定立体声给予源信号的方法。

2-1.使用相关性IC来给出立体声

首先，人类能使用进入一对耳朵的声音之间的电平差(IID/ILD，耳间强度/电平差)和通过一对耳朵听到的声音的时间延迟(ITD，耳间时间差)来感知声音的方向。并且，三维感觉可通过经由一对耳朵听到的声音之间的相关性(IC，耳间互相关)来感知。

同时，通过一对耳朵听到的声音之间的相关性(IC，耳间互相关)可如公式12定义。

[公式12]

{IC}_{x_{1} x_{2}} = \frac{E [x_{1} x_{2}^{*}]}{\sqrt{E [x_{1} x_{1}^{*}] E [x_{2} x_{2}^{*}]}}

在该情形中，x₁和x₂是声道信号，而E[x]指示声道x的能量。

同时，通过将立体声添加到声道信号，公式10可被变换成公式13。

[公式13]

x_i，新(k)＝g_i(α_ix(k)+s_i(k))

在该情形中，α_i是乘以原始信号分量的增益，而s_i是添加到第i个声道信号的立体声。除此之外，α_i和g_i分别是α_i(k)和g_i(k)的缩写。

立体声s_i可使用解相关器生成。并且，全通滤波器可被用作解相关器。尽管添加了立体声，仍应当满足幅值相移律(Amplitude Panning′s Law)。因此，g_i可总体地应用于公式13。

同时，s_i是调节相关性IC的值。尽管独立值可用于每个声道，但它可被表示为代表性立体声值和每声道增益的乘积。

[公式14]

s_i(k)＝β_is(k)

在该情形中，β_i是第i个声道的增益，而s(k)是代表性立体声值。

或者，可被表达为图15所示的各个立体声的组合。

[公式15]

s_i(k)＝β_iz₁(k)+xiz₂(k)+δ_iz₃(k)+…

在该情形中，z_n(k)是任意立体声值。并且，β_i、χ_i和δ_i是各个立体声的第i个声道的增益。

因为立体声值s(k)或z_n(k)(下文中称为s(k))是与声道信号x_i的相关性低的信号，所以立体声值s(k)与声道信号x_i的相关性IC基本上可接近于0。即，立体声值s(k)或z_n(k)应当考虑x(k)或x_i(k)。具体地，因为声道信号与立体声之间的相关性理想地为0，所以它可被表示为公式16。

[公式16]

C_{x_{i} S_{i}} = \frac{E [x_{i} s_{i}^{*}]}{\sqrt{E [Σ x_{1} x_{1}^{*} Σ s_{i} s_{i}^{*}]]}} = 0

在该情形中，各种信号处理方案可用于配置立体声值s(k)。这些方案包括：1)配置具有噪音分量的立体声值s(k)；2)在时间轴上向x(k)添加噪音；3)在频率轴上向x(k)的幅值分量添加噪音；4)向x(k)的相位分量添加噪音；5)使用x(k)的回音分量；以及6)使用1)到5)的适当组合。除此之外，在添加噪音时，所添加噪音的量使用信号大小信息来调节，或者未经识别幅值使用心理声学模型来添加。

同时，立体声值s(k)应当符合以下条件。

条件为：即使立体声值被添加到该声道信号中，声道信号的幂也应当保持原样。即，x_i的幂应当等于x_{i_新}的幂。

为了符合以上条件，表示为公式10和公式13的x_i和x_{i_新}应当符合公式17。

[公式17]

E[xx^*]＝E[(α_ix+s_i)(α_ix+s_i)^*]

然而，公式17的右侧可被展开成公式18。

[公式18]

E [(α_{i} x + s_{i}) (α_{i} x + s_{i}) *] = E [(α_{i} α_{i}^{*} x x^{*} + α_{i} {xs}_{i}^{*} + α_{i}^{*} x^{*} s_{i} + s_{i} s_{i}^{*})]

= E [α_{i} α_{i}^{*} {xx}^{*} + s_{i} s_{i}^{*}]

因此，公式18被插入公式17以提供公式19。

[公式19]

E [{xx}^{*}] = α_{i}^{2} E [x_{i} x_{i}^{*}] + E [s_{i} s_{i}^{*}]

如果符合公式1则该条件可符合。因此，满足公式19的α_i被表示为公式20。

[公式20]

α_{i} = \sqrt{1 - \frac{E [s_{i} s_{i}^{*}]}{E [{xx}^{*}]}}

在该情形中，假定s_i被表示为公式14，且s_i的幂等于x_i的幂，公式20可被归纳为公式21。

[公式21]

α_{i}^{2} + β_{i}^{2} = 1

因为cos²θ_i+sin²θ_i＝1，所以公式21可被表示为公式22。

[公式22]

α_i＝cosθ_i，β_i＝sinθ_i

这样，如果x_{i_新}被表示为公式13，如果s_i被表示为公式14，并且如果s_i的幂等于x_i的幂，则符合条件的s_i是符合公式2的s_i。

同时，x_{1_新}与x_{2_新}之间的相关性可被展开成公式23。

[公式23]

= \frac{g_{1} g_{2}^{*} E [α_{1} α_{2}^{*} {xx}^{*} + β_{1} β_{2}^{*} {ss}^{*}]}{\sqrt{g_{1}^{2} E [α_{1}^{2} {xx}^{*} + β_{1}^{2} {ss}^{*}] g_{2}^{2} E [α_{2}^{2} {xx}^{*} + β_{2}^{2} {ss}^{*}]}}

= \frac{E [α_{1} α_{2}^{*} {xx}^{*} + β_{1} β_{2}^{*} {ss}^{*}]}{\sqrt{E [α_{1}^{2} {xx}^{*} + β_{1}^{2} {ss}^{*}] E [α_{2}^{2} {xx}^{*} + β_{2}^{2} {ss}^{*}]}}

类似于上述假定，假定s_i的幂等于x_i的幂，公式23可被归纳为公式24。

[公式24]

并且，公式24可使用公式21表示为公式25。

[公式25]

或者

θ_{1} - θ_{2} = \cos^{- 1} ({IC}_{x_{1} x_{2}})

这样，能使用θ₁和θ₂得到x_{1_新}与x_{2_新}。

因此，该方法能通过以将相同方法应用于具有独立源x₁和x₂的情形、以及在单个源x内使用幅值相移律的情形的方式具体调节相关性IC值来增强或削弱三维感觉。

工业实用性

因此，本发明适用于通过以各种方式转换音频信号以适于用户需要(听众的虚拟位置、源的虚拟位置)或用户的环境(可输出声道数目)来进行音频再现。

并且，本发明对内容供应商而言可用于根据包括游戏等的内容的特性向用户提供各种播放模式。

尽管在本文中已参照本发明各优选实施方式对本发明进行了描述和例示，但对本领域技术人员将显而易见的是，可作出各种修改和变体而不背离本发明的精神和范围。因而，本发明旨在涵盖本发明中落在所附权利要求及其等效方案的范围内的修改和变体。

Claims

1.一种解码信号的方法，包括：

接收对象参数；

通过解析所接收的对象参数来提取对象信息；

使用所提取的对象信息与包括用户控制信息、默认控制信息、设备控制信息和设备信息的至少之一的控制信息来生成控制参数；以及

使用所述对象参数和所述控制参数生成确定输出信号中对象的位置和电平的渲染参数。

2.如权利要求1所述的方法，其特征在于，所述渲染参数要将对象信号映射到多个声道的输出信号。

3.如权利要求1所述的方法，其特征在于，进一步包括：

基于至少一个对象信号接收对象缩减混音信号；以及

通过将所述渲染参数应用于所述对象缩减混音信号来生成所述输出信号。

4.如权利要求1所述的方法，其特征在于，所述对象参数对应于至少一个对象信号，并且其中如果所述对象信号是源信号，则所述控制参数对应于所述源信号的虚拟位置或所述源信号的电平。

5.如权利要求1所述的方法，其特征在于，所述控制参数要统一地调节至少一个源信号。

6.如权利要求1所述的方法，其特征在于，所述渲染参数要使用相关性将立体声添加到所述输出信号。

7.如权利要求6所述的方法，其特征在于，所述立体声与对象缩减混音信号之间的相关性几乎为零。

8.如权利要求6所述的方法，其特征在于，所述立体声不影响所述输出信号的功率。

9.如权利要求6所述的方法，其特征在于，所述立体声是根据全通滤波器系统的解相关信号。

10.一种用于解码信号的装置，包括：

对象参数接收单元，用于接收对象参数、通过解析所接收的对象参数来提取对象信息；

控制参数生成单元，用于使用所提取的对象信息与包括用户控制信息、默认控制信息、设备控制信息和设备信息的至少之一的控制信息来生成控制参数；以及

渲染参数生成单元，用于使用所述对象参数和所述控制参数生成确定输出信号中对象的位置和电平的渲染参数。

11.如权利要求10所述的装置，其特征在于，进一步包括渲染单元，用于通过将所述渲染参数应用于对象缩减混音信号来基于至少一个对象信号生成所述输出信号。

12.如权利要求10所述的装置，其特征在于，进一步包括渲染参数编码单元，用于通过编码所述渲染参数生成渲染参数比特流。