CN101361115A

CN101361115A - 解码信号的方法和装置

Info

Publication number: CN101361115A
Application number: CNA2007800015240A
Authority: CN
Inventors: 郑亮源; 房熙锡; 吴贤午; 金东秀; 林宰显
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2006-01-19
Filing date: 2007-01-19
Publication date: 2009-02-04
Also published as: CN101361120A; CN101361116B; CN101361119A; CN101361116A; CN101361118A; CN101361117A; CN101361121B; CN101361118B; CN101361120B; CN101361121A; CN101361117B; CN101371298A; CN101361119B

Abstract

本发明公开了一种用于解码信号的装置及其方法，藉之音频信号能以改变/赋予该音频信号的空间特性(例如，听众的虚拟位置、特定源的虚拟位置)的方式来控制。本发明包括：接收包括对应于至少一个对象信号的电平信息在内的对象参数；通过将控制参数应用于所述对象参数，将对应于对象信号的电平信息变换成对应于输出声道的电平信息；以及生成包括对应于所述输出声道的电平信息在内的渲染参数，以控制通过对至少一个对象信号进行声道缩减混音处理得到的对象声道缩减混音信号。

Description

解码信号的方法和装置

技术领域

本发明涉及解码信号的方法和装置，尤其涉及解码音频信号的方法和装置。尽管本发明适用于范围宽泛的应用范围很宽，但它尤其适用于解码音频信号。

背景技术

一般而言，音频信号通过利用由编码器生成的渲染参数(例如，声道电平信息)渲染(render)声道缩减混音信号生成输出信号(例如，多声道音频信号)来解码。

发明内容

技术问题

然而，在将由编码器生成的渲染参数按原样用于渲染的情形中，解码器不能根据设备信息(例如，可用输出声道数)生成输出信号、改变音频信号的空间特性、以及向音频信号给出空间特性。具体地，不能生成声道数满足解码器的可用输出声道数的音频信号，不能将听众的虚拟位置移至舞台或座位的最后一排，或不能给出特定源信号(例如，钢琴信号)的虚拟位置(例如，左侧)。

技术解决方案

因此，本发明涉及一种基本上消除一个或多个由于有关技术的局限和缺点引起的问题的解码信号的装置及其方法。

本发明的一个目的是提供一种解码信号的装置及其方法，藉之音频信号能以改变/赋予音频信号空间特性(例如，听众的虚拟位置、特定源的虚拟位置)的方式来控制。

本发明的一个目的是提供一种解码信号的装置及其方法，藉之可生成匹配解码器的输出可用声道信息的输出信号。

有益效果

因此，本发明具有以下的效果和优点。

首先，因为在变换对象参数时考虑了控制信息和/或设备信息，所以能以各种方式改变听众的虚拟位置或源的虚拟位置并生成匹配可用于输出的声道数的输出信号。

其次，不是向输出信号提供了空间特性或在生成了输出信号之后修改空间信号。相反，是在变换了对象参数后，利用变换的对象参数(渲染参数)生成输出信号。因此，可显著减少计算量。

附图简述

包括于此以提供对本发明的进一步理解、并被结合在本申请中且构成其一部分的附图示出本发明的实施方式，其与说明书一起可用来解释本发明的原理。

附图中：

图1是根据本发明的一个实施例用于编码信号的装置和用于解码信号的装置的框图；

图2是根据本发明的另一个实施例用于解码信号的装置的框图；

图3是用于解释在5-1-5₁树状结构的情形中声道电平差与经变换的声道差之间的关系的框图；

图4是根据ITU建议的扬声器配置的图；

图5和图6分别是根据3维效果的虚拟扬声器位置的图；

图7是用于解释扬声器之间的虚拟声源的位置的图；

图8和图9分别是用于解释源信号的虚拟位置的图。

本发明的最佳实施方式

本发明的其它特征和优点将在以下的描述中阐述，并部分地从描述中显而易见，或者可从本发明的实践中认识到。本发明的目的和其它优点可由书面说明书及其权利要求书和附图中具体指出的结构来实现并获得。

为了实现这些和其它优点且根据本发明的目的，如具体表达并广泛描述的，一种根据本发明的解码信号的方法包括以下步骤：接收包括对应于至少一个对象信号的电平信息在内的对象参数；通过将控制参数应用于所述对象参数，将对应于所述至少一个对象信号的电平信息变换成对应于输出声道的电平信息；以及生成包括对应于所述输出声道的电平信息在内的渲染参数，以控制通过对所述至少一个对象信号进行声道缩减混音处理得到的对象声道缩减混音信号。

较佳的是，所述至少一个对象信号包括声道信号或源信号。

较佳的是，所述至少一个对象信号包括对象电平信息和对象间相关性信息中的至少一个。

更佳的是，如果所述至少一个对象信号是声道信号，则对象电平信息包括声道电平差。

并且，如果所述至少一个对象信号是源信号，则对象电平信息包括源电平差。

较佳的是，所述控制参数是利用控制信息生成的。

更佳的是，所述控制信息包括从编码器接收的控制信息、用户控制信息、缺省控制信息、设备控制信息以及设备信息中的至少一个。

并且，所述控制信息包括HRTF滤波器信息、对象位置信息以及对象电平信息中的至少一个。

此外，如果所述至少一个对象信号是声道信号，则控制信息包括听众的虚拟位置信息和多声道扬声器的虚拟位置信息中的至少一个。

此外，如果所述至少一个对象信号是源信号，则控制信息包括所述源信号的电平信息和所述源信号的虚拟位置信息中的至少一个。

较佳的是，控制参数是基于所述对象参数利用对象信息生成的。

较佳的是，该方法还包括基于所述至少一个对象信号接收对象声道缩减混音信号；以及通过将渲染参数应用于所述对象声道缩减混音信号来生成输出信号。

为了进一步实现这些和其它优点且根据本发明的目的，一种解码信号的装置包括：对象参数接收单元，其接收包括对应于至少一个对象信号的电平信息在内的对象参数；以及渲染参数生成单元，其通过将控制参数应用于所述对象参数，将对应于所述至少一个对象信号的电平信息变换成对应于输出声道的电平信息，该渲染参数生成单元生成包括对应于所述输出声道的电平信息在内的渲染参数，以控制通过对所述对象信号进行声道缩减混音处理得到的对象声道缩减混音信号。

较佳的是，该装置还包括渲染单元，其基于至少一个对象信号通过将渲染参数应用于对象声道缩减混音信号来生成输出信号。

较佳的是，该装置还包括渲染参数编码单元，其通过编码所述渲染参数来生成渲染参数比特流。

应理解，以上的一般描述和以下的详细描述是示例性和说明性的，并且旨在提供对如权利要求所述的本发明的进一步解释。

本发明的实施方式

下面将详细参考本发明的较佳实施方式，其具体示例图示于附图中。

首先，为了通过改变对象声道缩减混音信号的空间特性、通过向对象声道缩减混音信号赋予空间特性、或通过根据解码器的设备信息修改音频信号来控制对象声道缩减混音信号，通过变换对象参数来生成渲染参数。在这种情形中，对象声道缩减混音信号(在下文中称为声道缩减混音信号)通过对多个对象信号(声道信号或源信号)进行声道缩减混音处理来生成。所以，可通过将渲染参数应用于声道缩减混音信号来生成输出信号。

图1是根据本发明的一个实施例用于编码信号的装置和用于解码信号的装置的框图。

参考图1，根据本发明的一个实施例用于编码信号的装置100可包括声道缩减混音单元110、对象参数提取单元120以及控制信息生成单元130。并且，根据本发明的一个实施例用于解码信号的装置200可包括接收单元210、控制参数生成单元220、渲染参数生成单元230以及渲染单元240。

信号编码装置100的声道缩减混音单元110对多个对象信号进行声道缩减混音处理，以生成对象声道缩减混音信号(在下文中称为声道缩减混音信号DX)。在这种情形中，对象信号是声道信号或源信号。具体地，源信号可以是特定乐器(instrument)的信号。

对象参数提取单元120从多个对象信号提取对象参数OP。对象参数包括对象电平信息和对象间相关性信息。如果对象信号是声道信号，则对象电平信息可包括声道电平差(CLD)。如果对象信号是源信号，则对象电平信息可包括源电平信息。

控制信息生成单元130生成至少一个控制信息。在这种情形中，控制信息是用于改变听众的虚拟位置或多声道扬声器的虚拟位置或向源信号赋予空间特性的信息，并可包括HRTF滤波器信息、对象位置信息、对象电平信息等。具体地，如果对象信号是声道信号，则控制信息包括听众虚拟位置信息、多声道扬声器的位置信息。如果对象信号是源信号，则控制信息包括源信号的电平信息、源信号的虚拟位置信息等。

同时，在听众虚拟位置信息被改变的情形中，生成一个控制信息以对应于听众的特定虚拟位置。在向源信号赋予空间特性的情形中，生成一个控制信息以对应于诸如直播模式、俱乐部乐队模式、卡拉OK模式、爵士乐模式、韵律模式(rhythmic mode)等的特定模式。控制信号被用来以集体方式调节每一个源信号或多个源信号中的至少一个(编组源信号)。例如，在韵律模式的情形中，可以以集体方式调节与韵律乐器相关联的源信号。在这种情形中，“以集体方式调节”是指若干个源信号被同时调节而不是将相同的参数应用于各个源信号。

在生成控制信息后，控制信息生成单元130可生成包括控制信息的数目(即，音响效果的数目)、标志和控制信息在内的控制信息比特流。

信号解码装置200的接收单元210包括声道缩减混音接收单元211、对象参数接收单元212以及控制信息接收单元213。在这种情形中，声道缩减混音接收单元211、对象参数接收单元212以及控制信息接收单元213分别接收声道缩减混音信号DX、对象参数OP以及控制信息CI。与此同时，接收单元210可对所接收的信号进一步执行多路分解、语法分析、解码等。

对象参数接收单元212从对象参数OP提取对象信息OI。如果对象信号是源信号，则对象信息包括源的数目、源类型、源索引等。如果对象信号是声道信号，则对象信息可包括声道信号的树状配置(例如，5-1-5₁配置)等。随后，对象参数接收单元212将所提取的对象信息OI输入至参数生成单元220。

控制参数生成单元220利用控制信息、设备信息DI以及对象信息OI中的至少一个生成控制参数CP。如在以上控制信息生成单元130的描述中所提及的，控制信息可包括HRTF滤波器信息、对象位置信息、对象电平信息等。如果对象信号是声道信号，则控制信息可包括听众虚拟位置信息和多声道扬声器的虚拟位置信息中的至少一个。如果控制信息是源信号，则控制信息可包括源信号的电平信息和源信号的虚拟位置信息。此外，控制信息还可包括设备信息DI的概念。

同时，可根据起源将控制信息分成各种类型，诸如1)由控制信息生成单元130生成的控制信息(CI)、2)由用户输入的用户控制信息(UCI)、3)由控制参数生成单元220自身生成的设备控制信息(附图中未示出)、以及4)存储在信号解码装置中的缺省控制信息(DCI)。

控制参数生成单元220可通过选择针对特定声道缩减混音信号所接收的控制信息CI、用户控制信息UCI、设备控制信息以及缺省控制信息DCI中的一个来生成控制参数。在这种情形中，所选的控制信息可对应于a)由控制参数生成单元220随机选择的控制信息或b)由用户选择的控制信息。

设备信息DI是存储在解码装置200中的信息，并包括可用于输出的声道数等。且，设备信息DI可属于广义的控制信息。

对象信息OI是关于被声道缩减混音处理成声道缩减混音信号的至少一个对象信号的信息，并可对应于由对象参数接收单元212输入的对象信息。

渲染参数生成单元230通过使用控制参数CP变换对象参数OP来生成渲染参数RP。与此同时，渲染参数生成单元230可生成用于利用相关性将立体声(sterophony)添加至输出信号的渲染参数RP，这将在稍后详细解释。

渲染单元240通过使用渲染参数RP渲染声道缩减混音信号DX来生成输出信号。在这种情形中，声道缩减混音信号DX可由信号编码装置100的声道缩减混音单元110生成，并且可以是被用户任意地声道缩减混音处理过的任意声道缩减混音信号。

图2是根据本发明的另一个实施例用于解码信号的装置的框图。

参考图2，根据本发明的另一个实施例用于解码信号的装置是对图1所示的本发明的先前实施例的信号解码装置的区域-A进行扩展的例子，且还包括渲染参数编码单元232和渲染参数解码单元234。

此外，渲染参数解码单元234和渲染单元240可被实现为与包括渲染参数编码单元232的信号解码装置200分开的设备。

渲染参数编码单元232通过对由渲染参数生成单元230生成的渲染参数进行编码来生成渲染参数比特流RPB。

渲染参数解码单元234解码渲染参数比特流RPB，然后将经解码的渲染参数输入到渲染单元240。

渲染单元240通过使用由渲染参数解码单元234解码的渲染参数渲染声道缩减混音信号DX将输出信号输出。

根据本发明的一个及另一个实施例的解码装置中的每一个包括以上解释的元件。在以下的描述中，解释1)对象信号是声道信号和2)对象信号是源信号的情形的细节。

1.声道信号的情形(空间特性的修改)

首先，如果对象信号是声道信号，对象参数可包括声道电平信息和声道相关性信息。通过使用控制参数对声道电平信息(以及声道相关性信息)做变换处理，可生成变换成渲染参数的声道电平信息(和声道相关性信息)。

因此，用于渲染参数的生成的控制参数可以是利用设备信息、控制信息、或设备信息和控制信息生成的控制参数。考虑设备信息的情形、考虑控制信息的情形、和考虑设备信息和控制信息的情形分别解释如下。

1-1 考虑设备信息的情形(可伸缩)

如果控制参数生成单元220使用设备信息DI——尤其是可输出的声道数——生成控制参数，则由渲染单元240生成的输出信号可以具有相同的可输出声道数。通过使用控制参数变换对象参数OP的声道电平差(和声道相关性)，可生成经变换的声道电平差。这将解释如下。具体地，假设可输出声道数是2，对象参数OP对应于5-1-5₁树状配置。

图3是用于解释在5-1-5₁树状配置的情形中的声道电平差和经变换的声道差之间的关系的框图。

如果声道电平差和声道相关性满足5-1-5₁树状配置，则如图3左部所示，声道电平差CLD是CLD₀至CLD₄，声道相关性ICC是ICC₀至ICC₄(附图中未示出)。例如，左声道L和右声道R之间的电平差上CLD₀，且相应的声道相关性是ICC₀。

如果如图3的右部所示，可输出的声道数是2(即，左总声道Lt和右总声道Rt)，则经变换的声道电平差CLD和经变换的声道相关性ICC可利用声道差CLD₀至CLD₄和声道相关性ICC₀至ICC₄(附图中未示出)来表示。

[公式1]

CLD_α＝10*log₁₀(P_Lt/P_Rt)

其中P_Lt是L_t的功率，P_Rt是R_t的功率。

[公式2]

P_Lt＝P_L+P_Ls+P_C/2+P_LFE/2

P_Rt＝P_R+P_Rs+P_C/2+P_LFE/2

[公式3]

[\begin{matrix} P_{L} \\ P_{R} \\ P_{C} \\ P_{LFE} \\ P_{Ls} \\ P_{Rs} \end{matrix}] [\begin{matrix} {(c_{1, OTT 3} c_{1, OTT 1}, c_{1, OTT 0})}^{2} \\ {(c_{2, OTT 3} c_{1, OTT 1} c_{1, OTT 0})}^{2} \\ {(c_{1, OTT 4}, c_{2, OTT 1} c_{1, OTT 0})}^{2} \\ {(c_{2, OTT 4} c_{2, OTT 1} c_{1, OTT 0})}^{2} \\ {(c_{1, OTT 2} c_{2, OTT 0})}^{2} \\ {(c_{2, OTT 2} c_{2, OTT 0})}^{2} \end{matrix}] m^{2}

其中，

c_{1, OT T_{x}}^{l, m} = \sqrt{\frac{10^{\frac{{CLD}_{X}^{l, m}}{10}}}{1 + 10^{\frac{{CLD}_{X}^{l, m}}{10}}}},

c_{2, O {TT}_{X}}^{l, m} = \sqrt{\frac{1}{1 + 10^{\frac{{CLD}_{X}^{l, m}}{10}}}}

[公式4]

P_C/2+P_LFE/2＝(c_2，OTT1*c_1，OTT0)²*m²/2

通过将公式4和公式3代入公式2，然后将公式2代入公式1，可表示经变换的电平差CLD。

[公式5]

{ICC}_{α} = Re {\frac{P_{LtRt}}{\sqrt{P_{Lt} P_{Rt}}}},

其中

P_{x_{1} x_{2}} = Σ x_{1} x_{2}^{*}

[公式6]

P_LtRt＝P_LR+P_LsRs+P_C/2+P_LFE/2

[公式7]

R_LR＝ICC₃*c_1，OTT3*c_2，OTT3*(c_1，OTT1*c_1，OTT0)²*m²

P_LsRs＝ICC₂*c_1，OTT2*c_2，OTT2*(c_2，OTT0)²*m²

通过将公式7和公式3代入公式6，然后将公式6和公式2代入公式5，可使用声道差CLD₀至CLD₄和声道相关性ICC₀至ICC₄来表示经变换的声道相关性ICC。

1-2.考虑控制信息的情形

在控制参数生成单元220使用控制信息生成控制参数的情形中，由渲染单元240生成的输出信号可提供各种音响效果。例如，在流行音乐音乐会的情形中，可提供观众席上的音响效果和舞台上的音响效果。

图4是是根据ITU建议的扬声器配置的图，图5和图6分别是根据3维效果的虚拟扬声器位置的图。

参考图4，根据ITU建议，为了例如距离和角度，扬声器位置应位于相应点，听众应处于中心点处。

如果位于图4所示的点处的听众试图体验与图5所示点处相同的效果，包括听众呼喊声在内的环绕声道Ls和Rs的增益被减小，角度沿后向偏移，左声道L和右R的位置被移动接近听众的耳朵。为了产生如图6所示的点处的相同的效果，左声道L和中心声道C之间的角度被减小，且左声道L和中心声道C的增益增加。

为此，在对应于扬声器位置(L，R，Ls，Rs，C)至听众的音响路径(H_L，H_R，H_C，H_Ls，H_Rs)的反函数被通过(pass)后，对应于虚拟扬声器位置(L′，R′，Ls′，Rs′，C′)的音响路径(H_L′，H_R′，H_C′，H_Ls′，H_Rs′)可以被通过。具体地，左声道信号可由公式8来表示。

[公式8]

L_new＝函数(H_L，H_L′，L)＝函数(H_{L_tot}，L)

如果存在几个H_L，即，如果存在各种音响效果，可将公式8表达为公式9。

[公式9]

L_new＝函数(H_{L_tot_i}，L)

在这种情形中，对应于H_{X_tot_I}(X是任意声道)的控制信息可通过编码装置的控制信息生成单元130或控制参数生成单元220来生成。

如下解释通过变换对象参数——尤其地是声道电平差来改变音响效果的原理的细节。

图7是用于解释扬声器之间的虚拟声源的位置的图。一般而言，任意声道信号x_i具有如公式10所示的增益g_i。

[公式10]

x_i(k)＝g_ix(k)

在这种情形中，x_i是第i声道的输入信号，g_i是第i声道的增益，x是源信号。

参考图7，如果虚拟源VS和切线之间的角度是

则两声道ch 1和ch 2之间的角度是

声道ch 1和ch 2的增益分别是g1和g2，则建立了以下的公式11的关系。

[公式11]

根据公式11，通过调节g1和g2，可改变虚拟源VS的位置

因为g1和g2取决于声道电平差CLD，所以能够通过调节声道电平差来改变虚拟源VS的位置。

1-3.考虑设备信息和控制信息的情形

首先，控制参数生成单元240可通过考虑设备信息和控制信息来生成控制参数。如果解码器的可输出声道数是“M”，则控制参数生成单元220从输入的控制信息CI、UCI和DCI中选择与可输出声道数M匹配的控制信息，或者控制参数生成单元220本身可生成与可输出声道数M匹配的控制参数。

例如，声道缩减混音信号的树状配置是5-1-51配置，且如果可输出声道数是2，则控制参数生成单元220从输入的控制信息CI、UCI和DCI中选择与立体声声道匹配的控制信息，或控制参数生成单元220本身可生成与立体声声道匹配的控制参数。

因此，控制参数可通过考虑设备信息和控制信息两者来生成。

2.源信号的情形

如果对象信号是源信号，则对象参数可包括源电平信息。在使用完整的渲染参数渲染的情形中，输出信号成为不具有空间特性的多个源信号。

为了向对象参数赋予空间特性，在通过变换对象参数生成渲染参数时可以考虑控制信息。当然，类似于声道信号的情形，可考虑设备信息(可输出声道数)以及控制信息。

一旦向相应的源信号赋予空间特性，可对源信号中的每一个加以再现以提供各种效果。例如，如图8所示，人声V从左侧再现，鼓声D从中心再现，而键盘类乐器K从右侧再现。例如，如图9所示，人声V和鼓声D从中心再现，键盘类乐器K可从左侧再现。

如此，在通过赋予空间特性将源信号置于特定位置之后通过使用相关性IC来将特定立体声给予源信号的方法解释如下。

2-1.使用相关性IC给予立体声

首先，人类能够使用进入双耳的声音之间的电平差(IID/ILD，耳间强度/电平差)和通过双耳听到的声音的时间延迟(ITD，耳间时间差)察觉到声音的方向。并且，可由通过双耳听到的声音之间的相关性(IC，耳间交叉相关性)可察觉到3维感觉。

与此同时，通过双耳听到的声音之间的相关性(IC，耳间交叉相关性)可被定义为公式12

[公式12]

{IC}_{x_{1} x_{2}} = \frac{E [x_{1} {x_{2}}^{*}]}{\sqrt{E [x_{1} {x_{2}}^{*}] E [x_{2} {x_{2}}^{*}]}}

在这种情形中，x₁和x₂是声道信号，E[x]指示声道x的能量。

同时，通过向声道信号增加立体声，公式10可被转换成公式13。

[公式13]

x_i，new(k)＝g_i(α_ix(k)+s_i(k))

在这种情形中，_i是倍增到原始信号分量的增益，s_i是添加到第i声道信号的立体声。此外，_i和g_i是i(k)和g_i(k)的缩写。

可使用去相关器来生成立体声s_i。且，可将全通滤波器用作去相关器。尽管添加了立体声，也应满足振幅扫调规则(Amplitude Panning′s Law)。所以，g_i可整体地用于公式13。

与此同时，s_i是用于调节相关性IC的值。尽管独立值可用于各个声道，但可将其表示为相应的立体声值和每个声道增益的乘积。

[公式14]

s_i(k)＝β_is(k)

在这种情形中，i是第i声道的增益，s(k)是代表性的立体声值。

或者，可将其表达为公式15所示的各种立体声的组合。

[公式15]

s_i(k)＝β_iz₁(k)+χ_iz₂(k)+δ_iz₃(k)+…

在这种情形中，z_n(k)是任意立体声值。且β_i、χ_i和δ_i是对于相应的立体声的第i声道的增益。

因为立体声值s(k)或z_n(k)(在下文中称为s(k))是具有与声道信号x_i低相关性的信号，立体声值s(k)与声道信号x_i的相关性IC可几乎接近零。即，立体声值s(k)或z_n(k)应考虑x(k)或(x_i(k))。具体地，由于声道信号和立体声之间的相关性理想地为0，可将其表示为公式16。

[公式16]

C_{x_{i} s_{i}} = \frac{E [x_{i} {s_{i}}^{*}]}{E [Σ x_{i} {x_{i}}^{*} Σ s_{i} {s_{i}}^{*}]} = 0

在这种情形中，各种信号处理方案可用于配置立体声值s(k)。这些方案包括：1)用噪声分量配置立体声值s(k)；2)将噪声添加到时间轴上的x(k)；3)将噪声添加到频率轴上的振幅分量x(k)；4)将噪声添加到x(k)的相位分量；5)使用x(k)的回声分量；以及6)使用1)至5)的适当组合。此外，在增加噪声时，使用信号大小信息来调节添加的噪声的量，或使用音质模型来添加未识别的振幅。

同时，立体声值s(k)应满足以下的条件。

该条件是声道信号的功率应保持完整，即使将立体声值添加到声道信号。即，功率x_i应当等于x_{i_new}。

为了满足以上条件，被表示为公式10和公式13的x_i和x_{i_new}应满足公式17。

[公式17]

E[xx^*]＝E[(α_ix+s_i)(α_ix+s_i)^*]

然而，公式17的右侧可被展开为公式18。

[公式18]

E [(α_{i} x + s_{i}) {(α_{i} x + s_{i})}^{*}] = E [α_{i} {α_{i}}^{*} {xx}^{*} + α_{i} {xs}_{i}^{*} + {α_{i}}^{*} x^{*} s_{i} + s_{i} {s_{i}}^{*}] = E [α_{i} {α_{i}}^{*} x_{i} {x_{i}}^{*} + s_{i} {s_{i}}^{*}]

所以，将公式18代入公式17以提供公式19。

[公式19]

E [{xx}^{*}] = {α_{i}}^{2} E [x_{i} {x_{i}}^{*}] + E [s_{i} {s_{i}}^{*}]

如果公式1被满足则可满足该条件。所以，可将满足公式19表示为公式20。

[公式20]

α_{i} = \sqrt{1 - \frac{E [s_{i} {s_{i}}^{*}]}{E [{xx}^{*}]}}

在这种情形中，假设s_i被表示为公式14且s_i的功率等于x_i，则可将公式20概括为公式21。

[公式21]

α_{i}^{2} + β_{i}^{2} = 1

因为cos²θ_i+sin²θ_i＝1，所以公式21可被表示为公式22。

[公式22]

α_i＝cosθ_i，β_i＝sinθ_i

可以说，如果x_{i_new}被表示为公式13，如果s_i被表示为公式14，且如果s_i的功率等于x_i，则满足条件的s_i是满足公式2的一个。

与此同时，x_{1_new}和x_{2_new}之间的相关性可被展开为公式23。

[公式23]

{IC}_{x_{1_new} x_{2_new}} = \frac{E [x_{1_new} x_{2_new}^{*}]}{\sqrt{E [x_{1_new} x_{1_new}^{*} E [x_{2_new} x_{2_new}^{*}]}}

= \frac{g_{1} g_{2}^{*} E [α_{1} α_{2}^{*} {xx}^{*} + β_{1} β_{2}^{*} {ss}^{*}]}{\sqrt{g_{1}^{2} E [α_{1}^{2} {xx}^{*} + β_{1}^{2} {ss}^{*}]} g_{2}^{2} E [α_{2}^{2} {xx}^{*} + β_{2}^{2} {ss}^{*}]}

= \frac{E [α_{1} α_{2}^{*} {xx}^{*} + β_{1} β_{2}^{*} {ss}^{*}}{\sqrt{E [α_{1}^{2} {xx}^{*} + β_{1}^{2} {ss}^{*}]} E [α_{2}^{2} {xx}^{*} + β_{2}^{2} {ss}^{*}]}

类似于上述的假设，假设s_i的功率等于x_i，则公式23可被概括为公式24。

[公式24]

{IC}_{x_{1_new} x_{2, new}} = α_{1} α_{2}^{*} + β_{1} β_{2}^{*}

且，利用公式21可将公式24表示为公式25。

[公式25]

{IC}_{x_{1_new} x_{2_new}} = {\cos θ}_{1} {\cos θ}_{2} + {\sin θ}_{1} {\sin θ}_{2} = \cos (θ_{1} - θ_{2})

或者

θ_{1} - θ_{2} = \cos^{- 1} ({IC}_{x_{1} x_{2}})

可以说，可利用θ₁和θ₂找到x_{i_new}和x_{2_new}。

因此，该方法可通过调节相关性值IC增强或减小3维感觉，尤其是以将相同的方法应用于具有独立源x1和x2的情形以及在单个源x内使用振幅扫调规则的情形中方式。

工业实用性

因此本发明适用于通过以各种方式将音频信号变换成适用于用户需要(听众虚拟位置，源虚拟位置)或用户环境(可输出声道数)的音频再现。

并且，本发明可用于内容提供商根据包括游戏等内容特性向用户提供各种播放模式。

尽管已参考本发明的较佳实施例描述并说明了本发明，但本领域内技术人员可以理解，可对本发明作出各种修改和变化而不脱离本发明的精神或范围。因此，本发明旨在涵盖所附权利要求书及其等价技术方案的范围内的本发明的所有这些修改和变化。

Claims

1.一种解码信号的方法，其包括以下步骤：

接收包括对应于至少一个对象信号的电平信息在内的对象参数；

通过将控制参数应用于所述对象参数，将对应于所述对象信号的电平信息变换成对应于输出声道的电平信息；以及

生成包括对应于所述输出声道的电平信息在内的渲染参数，以控制通过对所述对象信号进行声道缩减混音处理得到的对象声道缩减混音信号。

2.如权利要求1所述的方法，其特征在于，所述一个对象信号包括声道信号或源信号。

3.如权利要求1所述的方法，其特征在于，所述对象参数包括对象电平信息和对象间相关性信息中的至少一个。

4.如权利要求3所述的方法，其特征在于，如果所述对象信号是声道信号，则所述对象电平信息包括声道电平差。

5.如权利要求3所述的方法，其特征在于，如果所述对象信号是源信号，则对象电平信息包括源电平信息。

6.如权利要求1所述的方法，其特征在于，所述控制参数是利用控制信息生成的。

7.如权利要求6所述的方法，其特征在于，所述控制信息包括从编码器接收的控制信息、用户控制信息、缺省控制信息、设备控制信息以及设备信息中的至少一个。

8.如权利要求6所述的方法，其特征在于，所述控制信息包括HRTF滤波器信息、对象位置信息以及对象电平信息中的至少一个。

9.如权利要求6所述的方法，其特征在于，如果所述对象信号是声道信号，则所述控制信息包括听众的虚拟位置信息和多声道扬声器的虚拟位置信息中的至少一个。

10.如权利要求6所述的方法，其特征在于，如果对象信号是源信号，则控制信息包括所述源信号的电平信息和所述源信号的虚拟位置信息中的至少一个。

11.如权利要求1所述的方法，其特征在于，所述控制参数是基于所述对象参数利用对象信息生成的。

12.如权利要求1所述的方法，其特征在于，还包括基于所述至少一个对象信号接收所述对象声道缩减混音信号；以及

通过将所述渲染参数应用于所述对象声道缩减混音信号来生成输出信号。

13.一种用于解码信号的装置，包括：

对象参数接收单元，其接收包括对应于对象信号的电平信息在内的对象参数；以及

渲染参数生成单元，其通过将控制参数应用于所述对象参数，将对应于至少一个对象信号的电平信息变换成对应于输出声道的电平信息，并生成包括对应于所述输出声道的电平信息在内的渲染参数，以控制通过对所述对象信号进行声道缩减混音处理得到的对象声道缩减混音信号。

14.如权利要求13所述的装置，其特征在于，还包括渲染单元，其基于所述至少一个对象信号，通过将所述渲染参数应用于所述对象声道缩减混音信号来生成输出信号。

15.如权利要求13所述的装置，其特征在于，还包括渲染参数编码单元，其通过编码所述渲染参数来生成渲染参数比特流。