CN1647156B

CN1647156B - 参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备

Info

Publication number: CN1647156B
Application number: CN038089777A
Authority: CN
Inventors: A·W·J·奥门; E·G·P·舒杰斯; D·J·布里巴尔特; S·L·J·D·E·范德帕
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2002-04-22
Filing date: 2003-04-22
Publication date: 2010-05-26
Anticipated expiration: 2023-04-22
Also published as: BR0304542A; DE60306512D1; KR20040102163A; AU2003216686A1; EP1500083B1; DE60306512T2; JP2005523479A; ATE332003T1; CN1647156A; US8498422B2; KR101021079B1; WO2003090207A1; JP4714415B2; EP1500083A1; ES2268340T3; BRPI0304542B1; US20050226426A1

Abstract

将多声道音频信号编码成单耳音频信号和能够实现多声道音频信号还原的信息，通过所述单耳信号和信息能够还原所述多声道音频信号。所述信息是通过针对所述多声道音频信号的第一频率范围来确定该信息的第一部分、针对所述多声道音频信号的第二频率范围来确定所述信息的第二部分而产生的。所述第二频率范围是所述第一频率范围的一部分，并且因此是所述第一频率范围的一个子范围。所述信息是多层信息，能够针对位速率调整解码质量。

Description

参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备

技术领域

本发明涉及一种对多声道音频信号进行编码的方法、一种用于对多声道音频信号进行编码的编码器、一种用于提供音频信号的设备、一种经编码的音频信号、一种其上存储有经编码的音频信号的存储介质、一种对经编码的音频信号进行解码的方法、一种用于对经编码的音频信号进行解码的解码器以及一种用于提供解码后的音频信号的设备。

背景技术

EP-A-1107232公开了一种参数编码方案，用于产生立体声音频信号表示，所述立体声音频信号由左声道信号和右声道信号构成。为了有效利用传输带宽，这种表示包含了仅与单耳信号相关的信息以及参数信息，所述单耳信号可以是左声道信号或右声道信号。可以在单耳信号和参数信息相结合的基础上还原其它立体声信号。参数信息包括立体声音频信号的定位提示，该定位提示包含左声道和右声道信号的强度和相位特征。

菲利浦研究室的R.van der Waal，R.Veldhuis在IEEE，1991，卷2第3601-3604页(ISBN：0-7803-0003-3)发表的文献“立体声数字音频信号的次能带编码”公开了一种次能带编码算法。在该次能带编码算法中，将被编码的频谱被分为多个非重叠次能带。对每个次能带执行编码，每个次能带的编码包括一个旋转式同质多象转变。

发明内容

本发明的目的在于提供一种参数多声道音频系统，其能够以可用的位速率来调整编码音频信号的质量或，以编码器的复杂度或有效传输带宽来调整编码音频信号的质量。

按照本发明的第一方面提供了一种对包括至少两个音频声道的多声道音频信号进行参数编码的方法，该方法包括：产生一个包括至少两个音频声道的特定组合的单一声道音频信号，并且将该单一声道音频信号编码到位流中，作为经编码单一声道音频信号，从所述至少两个音频声道中产生参数信息，使得从所述单一声道音频信号和所述参数信息中还原所述多声道音频信号，所述信息的产生包括，针对所述多声道音频信号的第一频率范围确定所述参数信息的第一部分，并且将所述参数信息的所述第一部分编码到位流中，作为经编码的信息的第一部分，和针对所述多声道音频信号的第二频率范围确定所述参数信息的第二部分，所述第二频率范围是所述第一频率范围的一部分，并且将所述参数信息的所述第二部分编码到位流中，作为经编码的信息第二部分。

按照本发明的第二方面提供了一种用于对包括至少两个音频声道的多声道音频信号进行编码的参数编码器，该编码器包括：用于产生一个包括至少两个音频声道的特定组合的单一声道音频信号的装置，用于从所述至少两个音频声道中产生参数信息的装置，通过所述单一声道音频信号和所述参数信息能够实现以期望的音质等级对所述多声道音频信号进行还原，产生所述参数信息的装置包括，用于针对所述多声道音频信号的第一频率范围来确定所述参数信息的第一部分的装置，和用于针对所述多声道音频信号的第二频率范围来确定所述参数信息的第二部分的装置，所述第二频率范围是所述第一频率范围的一部分。

按照本发明的第三方面提供了一种用于提供音频信号的设备，该设备包括：一个用于接收多声道音频信号的输入端，一个编码器，用于对所述多声道音频信号进行编码，以获得经编码的多声道音频信号，和一个用于提供所述经编码的多声道音频信号的输出端。

按照本发明的第四方面提供了一种对多声道音频信号进行解码的方法，该解码方法包括：获得一个包括至少两个音频声道的特定组合的解码的单一声道音频信号，从这样的参数信息中获取解码的信息：该参数信息使得通过所述经解码的单一声道音频信号和所述解码信息能够还原所述多声道音频信号，所述解码信息包括所述参数信息的第一部分和所述参数信息的第二部分，和对所述单一声道音频信号应用所述参数信息的第一部分或者所述参数信息的第一部分和第二部分，以产生解码后的多声道音频信号。

按照本发明的第五方面提供了一种对编码的编码音频信号进行解码的解码器，该解码器包括：用于获得一个包括至少两个音频声道的特定组合的解码的单一声道音频信号的装置，用于从这样的参数信息中获取解码信息的装置：该信息使得通过所述被解码的单一声道音频信号和所述解码信息能够对所述多声道音频信号进行还原，所述解码信息包括所述参数信息的第一部分和所述参数信息的第二部分，和用于对所述单一声道音频信号应用所述参数信息的第一部分或所述参数信息的第一部分和第二部分的装置，以产生解码的多声道音频信号。

按照本发明的第六方面提供了一种用于提供解码的多声道音频信号的设备，该设备包括：一个用于接收编码音频信号的输入端，一个按照本发明的第五方面提供的解码器，用于对所述编码的音频信号进行解码，以获得多声道输出信号，和一个用于提供或再现所述多声道输出信号的输出端。

在按照本发明第一方面的对多声道音频信号进行编码的方法中，产生一个单一声道信号。此外，从所述多声道音频信号中产生这样的信息：通过所述单一声道音频信号和所述信息能够实现以期望的音质等级对所述多声道音频信号进行还原。最好，所述信息包括参数组，例如，如从EP-A-1107232中所获知的参数组。

按照本发明的第一方面，所述信息是通过针对所述多声道音频信号的第一频率范围确定所述信息的第一部分，并且针对所述多声道音频信号的第二频率范围确定所述信息的第二部分而产生的。所述第二频率范围是所述第一频率范围的一部分并且因此是所述第一频率范围的子范围。现在，可以得到两种级别的解码音质。对于解码多声道音频信号的低质量等级而言，解码器使用的是经编码的单一声道音频信号和所述信息的第一部分。对于解码多声道音频信号的较高质量等级而言，解码器使用的是经编码的单一声道音频信号和所述信息的第一部分和第二部分。当然，如果存在大量各自与不同的频率范围相关的信息部分，也可以从大量的等级中选取解码音质。例如，所述第一部分可以包括单独一组在覆盖了多声道音频信号的全部带宽的频率范围内确定的参数。而第二部分可以包括多组参数，每组参数是针对全部带宽的子范围或部分而确定的。这些部分合在一起最好能够覆盖全部带宽。不过也存在其它多种可行的方案。例如，所述第一部分可以包括两组参数，第一组是针对覆盖了全部带宽的低端部分频率范围而确定的，而第二组参数是针对覆盖了全部带宽的其余部分的频率范围而确定的。所述第二部分可以包括针对全部带宽中的低端部分中的两个频率范围而确定的两组参数。并不要求针对全部带宽的低端的参数组的数量与针对高端的参数组的数量相等。

编码音频信号的这种表达使得解码音频信号的质量取决于解码器的复杂程度。例如，在简单的便携式解码器中，可以使用低复杂程度的解码器，该解码器的能耗较低，并且因此仅能够使用所述信息的一部分。在高端应用设备中，使用了复杂的解码器，这种解码器能够使用编码信号中所有的可用信息。

解码音频信号的质量还取决于可用的传送带宽。如果传送带宽较高，解码器就可以对所有的可用层进行解码，这是由于所有的可用层都可以得到传送。如果传送带宽较低，发送器可以决定仅发送有限数量的层。

按照本发明的第二方面，解码器会接收编码多声道音频信号的最大允许位速率。该最大允许位速率可以由传输信道(比如因特网)或者存储介质的可用位速率进行定义。在传输带宽时常变化并且因此最大允许位速率随时间变化的应用系统中，能够适应传输带宽的波动以防止解码音频信号质量过低是非常重要的。在正常情况下，编码器会对所有的层进行编码。在发送端，根据可用的信道能力决定发送哪些层。这也可以通过环路中的解码器来实现，不过在发送之前正确地除去某些层是件比较复杂的事情。

如果包括单一声道音频信号和信息的第一和第二部分的编码多声道音频信号的位速率不高于最大允许位速率的话，则本发明的编码器仅将用于多声道音频信号的第二频率范围的信息的第二部分加入到经编码的音频信号中。这样，如果传输带宽不足以支持第二部分的传送的话，第二部分将不会存在于经编码的音频信号中。

按照本发明的第七方面中所限定的实施方式，所述信息包括多个参数组，所述信息的每个部分由一个或多个参数组表示。在所述信息的各部分中存在的参数组的数量取决于频率范围的数量。

按照本发明的第八方面所限定的实施方式，所述参数组包括至少一个定位提示。

按照本发明的第九方面所限定的实施方式，所述第一频率范围基本上覆盖了所述多声道音频信号的全部带宽。按照这种方式，一组参数足以提供将单一信道音频信号解码为多声道音频信号所需的基本信息。这样，保障了经解码的音频信号质量的基本等级。第二频率范围覆盖全部带宽的一部分。这样，当经编码的音频信号中存在第二部分时，该第二部分提高了这一频率范围内的解码音频信号质量。

按照本发明的第十方面所限定的实施方式，所述信息的第二部分包括至少两个频率范围，它们合在一起基本上覆盖了多声道音频信号的全部带宽。这样，将会在整个带宽上表现出第二部分提供的质量提高。

按照本发明的第十一方面所限定的实施方式，包括单一声道音频信号和所述信息的第一部分的基本层总是存在于经编码的音频信号中。包括所述信息的第二部分的增强层仅当经编码音频信号的位速率不超过最大允许位速率的情况下才进行编码。这样，解码音频信号的音质将取决于最大允许位速率。如果最大允许位速率过低而无法包含增强层，将会从基本层获取解码音频信号，这样会产生比编码音频信号的不可预知部分无法到达解码器的情况下更好的解码音频信号质量。

按照本发明的第十二到十四方面中任何一项所限定的实施方式，下一帧中的所述信息的各部分(通常包含多个参数组，每个参数组对应于所表达的每个频段)是在前一帧的参数的基础上进行编码的。按常理，这减小了经编码的所述信息的各部分的位速率，因为，由于相关性，两个连续帧中的信息基本上差别不大。

按照本发明的第十五方面所限定的实施方式，对两个连续帧的参数的差值进行编码，而非参数本身。

目前已经提出来用于降低立体声节目素材的位速率的音频解码器的解决方案包括强度立体声和M/S立体声。

按照强度立体声算法，高频(一般高于5kHz)由与时变和取决于频率的缩放因子或强度因子结合在一起的单一音频信号(即，单声道)表示，这能够对于这些频率范围实现可与原始立体声信号相比拟的解码音频信号的还原。按照M/S算法，将信号分解为一个和(或中间，或公共)信号和一个差(或边带，或非公共)信号。这一分解有时要与主分量分析或时变缩放因素结合起来进行。然后对这些信号独立地进行编码，这一编码是通过变换编码器或子带编码器[它们都是波形编码器]来进行的。通过这种算法实现的信息量减少强烈依赖于源信号的空间属性。例如，如果源信号是单声道的，那么差信号为零并且可以被丢弃。不过，如果左右音频信号的相关性很低(对于高频范围而言，这是经常发生的情况)，这种方案仅仅能够实现很小的位速率降低。对于低频区域，M/S编码通常具有提供显著的优点。

近年来，音频信号的参数表达得到了关注，尤其是在音频编码领域。已经证明，表述音频信号的传送(量化)参数仅需要很小的输送能力，以在接收端再合成感觉上相等的信号。不过，当前的参数音频编码器重点放在了对单耳信号进行编码上，而立体声信号被当作双单声道信号来进行处理。

附图说明

通过下文中介绍的实施方式，本发明的这些和其它优点将会显而易见，并且将会参照下文中介绍的实施方式对本发明的这些和其它优点进行解释说明。

附图中：

图1表示用于立体声音频信号的多声道编码器的方框图，

图2表示用于立体声音频信号的多声道编码器的方框图，

图3示出了编码数据流的表示，

图4表示根据本发明的频率范围的实施方式，

图5表示根据本发明的频率范围的另一实施方式，

图6表示根据本发明的一个实施方式的基于前一帧内的参数确定参数组的过程，

图7表示一组参数，

图8表示基本层的参数的差分确定，和

图9表示与增强层的频率范围相应的参数的求差确定。

具体实施方式

图1示出了多声道编码器的方框图。编码器接收多声道音频信号，所述多声道音频信号图示为立体声信号RI、LI，编码器提供编码多声道音频信号EBS。

下混频器1将立体声信号或立体声通道信号RI、LI混频为单一声道音频信号(也称为单耳信号)SC。例如，下混频器1可以确定输入音频信号RI、LI的平均值。

编码器3对单耳信号SC进行编码，以获得经编码的单耳信号ESC。编码器3可以是已知种类的编码器，例如，MPEG编码器(MPEG-LII，MPEG-LIII(mp3)，或MPEG2-AAC)。

参数确定电路2根据输入音频信号RI、LI来确定表征信息INF的参数组S1、S2......。根据需要，参数确定电路2接收最大允许位速率MBR，以仅仅确定参数组S1、S2......，这些参数组在由参数编码器4编码的时候，与编码的单耳信号ESC一起不超过该最大允许位速率MBR。经编码参数由EIN表示。

格式器5将经过编码的单耳信号SC与经过编码的参数EIN以一种期望的格式合成在一个数据流中，以获得经过编码的多声道音频信号EBS。

下面将针对一种实施方式借助实例对编码器的操作进行详细地说明。将多声道音频信号L1、R1编码在一个单一的单耳信号SC(此外也称为单一声道音频信号)中。由参数确定电路2执行多声道音频信号的LI、RI的空间属性的参数。这些参数包含如何从单耳信号SC中还原多声道音频信号LI、RI的信息。这些参数通常是在将它们与经编码的单一单耳信号ESC进行合成之前由参数编码器4加以编码的。这样，对于一般的音频编码应用而言，发送或存储的是仅与一个单耳音频信号合成在一起的这些参数。合成后的编码信号是经编码的多声道音频信号EBS。与单独地处理多个声道的音频编码器相比，发送或存储该经编码的多声道音频信号EBS所需的发送或存储能力得到了大幅降低。不过，借助含有参数(组)的信息INF，原始的空间感得到了保留。

特别是，多声道音频RI、LI的参数描述与一个双声道处理模块有关，该模块旨在描述双耳立体声听觉系统的有效信号处理。

该模块将输入音频LI、RI分成数个限带信号，这些限带信号最好是以ERB比例刻度线性隔开的。这些信号的带宽取决于中心频率，满足ERB比例。其次，最好，对于每个频率带宽，对输入信号的下述属性进行分析：

-耳间电平差，或ILD，由源于左耳和右耳的限带信号的相对电平定义，

-耳间时间(或相位)差ITD(或IPD)，由与耳间交叉相关函数中的峰值对应的耳间延迟(或相移)定义，

-无法由ITD或ILD说明的波形的相似(相异)性，这可以借助最大耳间交叉相关IC来实现参数(例如，在最大峰值位置上的交叉相关值)。

这三个参数的组S1、S2......随时间变化，对于每个频带FR1、FR2......各有一个组。不过，由于双耳立体声听觉系统就其处理而言是非常缓慢的，故而这些属性的更新速度是相当低的(一般为几十毫秒)。

可以假设(缓慢的)时间变化参数是双耳立体声听觉系统可以利用的仅有的空间信号属性，并且通过这些与时间和频率相关的参数，所感觉到的听觉世界是借助更高级别的听觉系统进行重建的。

附图2表示一个多声道解码器的框图。该解码器接收经过编码的多声道音频信号EBS并且给出经过还原的解码多声道音频信号，后者被表示为立体声信号RO、LO。

去格式器6从数据流EBS中恢复经过编码的单耳信号ESC’和经过编码的参数EIN’。解码器7把经过编码的单耳信号ESC’解码为输出单耳信号SCO。解码器7可以是任何公知类型的解码器(当然需要与所使用的编码器相匹配)，例如，解码器7是一个MPEG解码器。解码器8将经过编码的参数EIN’解码为输出参数INO。

解多路复用器9通过对输出单耳信号SCO应用输出参数INO的参数组S1、S2......来还原输出立体声音频信号LO和RO。

附图3表示经过编码的数据流的表述。例如，在每一帧F1、F2......中，数据包以报头H开始，其后紧随着经过编码的单耳信号ECS(现在由A表示)、编码信息EIN的第一部分P1、编码信息EIN的第二部分P2和编码信息EIN的第三部分P3。

如果帧F1、F2......仅包括报头H和经过编码的单耳信号ECS，那么将仅发送单耳信号SC。

如EP-A-1107232中所述，将存在输入音频信号的全频段划分为多个子频段，这些子频段的总体覆盖了全频段。按照本发明的术语，多声道信息INF编码在了多个参数组S1、S2...中，对应于每个子频段FR1、FR2...。这多个参数组S1、S2...被编码成编码信息EIN的第一部分P1。这样，要发送基本水平音质的多声道音频信号，位流要包括报头H、部分A(经过编码的单耳信号ESC)和第一部分P1。

在按照本发明的一种实施方式的位流中，第一部分P1可以仅由单组参数S1组成。该单组参数是针对整个带宽FR1确定的。这个位流包括报头H和部分A以及P1，该位流提供了音质的基本层，由附图3中的BL表示。

为了支持增强音质，在位流中还存在有编码信息EIN的附加部分P2、P3。这些附加部分构成了增强层EL。该位流可以包括单独一个附加部分P2或者多于一个的附加部分。该附加部分P2最好包括多个参数组S2、S3...，对应于每个子频段FR2、FR3...，这些子频段FR2、FR3...最好覆盖整个频段FR1。增强后的音质还可以以逐步的方式表现出来，第一增强等级是由包括第一部分的增强层EL1提供的。而第二增强层EL包括第一增强层EL1和第二增强层EL2，第二增强层EL2包括部分P3。

附加部分P2还可以包括一个与单个频段FR2对应的单个参数组S2，频段FR2是全频段FR1的一个子频段。附加部分P2也可以包括多个参数组S2、S3...，这些参数组对应于频段FR2、FR3...，这些频段合在一起没有覆盖整个全频段FR1。

附加部分P3最好包含与再分了至少附加部分P2的子频段之一的频段相应的参数组。

按照本发明的这种位流的格式使得在传送信道上，或者在解码器端，能够依据传送信道的位速率或者解码器的解码复杂程度，来调整解码音频信号的音质。例如，如果音频解码器应当具有较低的功耗，比如这一点在便携式应用设备中很重要，解码器可以具有较低的复杂程度并且仅使用部分H、A和P1。如果用户表示，他希望得到解码音频信号的更高的音质，那么解码器能够以较高的功耗进行更为复杂的操作，同样也是可行的。

还有可能编码器知道最大允许位速率MBR，该位速率可以通过传送信道传送，或者可以保存在存储介质上。现在，编码器能够决定多少个(如果有的话)附加部分P1、P2...能够与所述最大允许位速率MBR相符。编码器仅将这些允许的部分P1、P2...编码在位流中。

附图4表示按照本发明的频率范围的实施方式。按照这种实施方式，频段FR1等于多声道音频信号LI、RI的全部带宽FBW，而频带FR2是全部带宽FBW的子频带。

如果这些是用于确定参数组S1、S2...的仅有的频率范围，那么将会针对频带FR1确定参数组S1，并且该参数组S1存在于部分P1中，而且针对频带FR2确定参数组S2，并且该参数组S2存在于部分P2中。通过使用或者不使用部分P2，音质调整可以得到实现。

附图5表示按照本发明的频率范围的另一种实施方式。按照这一实施方式，频带FR1再次等于全部带宽FBW，并且子频带FR2和FR3一起覆盖了全部带宽FBW。或者换句话说，将频带FR1再分成了子频带FR2和FR3。

如果这些是用于确定参数组S1、S2...的仅有的频率范围，那么部分P1包括一个针对频带FR 1确定的单个参数组S1，而部分P2包括两个分别针对频带FR2和FR3确定的参数组S2和S3。质量调整可以通过使用或不使用部分P2来实现。

附图6表示按照本发明的一种实施方式，基于在前帧中的参数来确定参数组的过程。

附图6表示一个数据流，该数据流在每个帧F1、F2...中包括编码信息EIN，该编码信息EIN包括部分P1和P2，其中P1是基本层BL的一部分，而P2形成了增强层EL。

在帧F1中，部分P1包括一个单个的参数组S1，该参数组S1是针对全部带宽FR1而确定的。部分P2，作为例子，包括四组参数S2、S3、S4和S5，它们分别是针对子频带FR2、FR3、FR4和FR5确定的。这四个子频段FR2、FR3、FR4和FR5再分了频带FR1。

在紧随帧F1之后的帧F2中，部分P1包括一个单个的参数组S1’，该参数组S1’是针对全部带宽FR1而确定的，并且是基本层BL’的一部分。部分P2包括四组参数S2’、S3’、S4’和S5’，它们分别是针对子频带FR2、FR3、FR4和FR5确定的，并且它们形成了增强层EL’。

可以为帧F1、F2...的每一个独立地对每个参数组S1、S2...进行编码。也可以相对于部分P1的参数而对部分P2的参数组进行编码。这由帧F1中始于S1终于S2到S5的箭头表示。当然这在其它帧F2...中也是可行的(未示出)。按照相同的方式，可以相对于S1对参数组S1’进行编码。最终，可以相对于参数组S2、S3、S4和S5对参数组S2’、S3’、S4’和S5’进行编码。

按照这种方式，编码信息EIN的位速率将会得到降低，因为使用了参数组之间的冗余性和相关性。

最好，将新的参数组S1’、S2’、S3’、S4’和S5’的新参数编码为它们的值与在前面的参数组S1、S2、S3、S4和S5的参数值之间的差值。

每隔一段有规律的时间间隔，至少要将参数组S1绝对地编码而不进行求差，以防止错误延续过长时间。

附图7表示一组参数。每个参数组Si可以包括一个或多个参数。一般来说这些参数是定位提示，这些定位提示给出了有关声音对象在音频信息中的定位的信息。一般来说，所述定位提示是耳间电平差ILD、耳间时间或相位差ITD或IPD和耳间交叉相关IC。有关这些参数的更加详细的信息在由Christof Faller等人在2002年5月10-13日于德国慕尼黑召开的第112届音响工程协会会议(AdioEngineering Society Convention)中递交的论文5574号《应用于立体声和多声道音频信号压缩的耳间提示编码(Binaural Cue CodingApplied to Stereo and Multi-channel Audio Compression)》中给出。

附图8表示基本层的参数的差值求算。横轴表示连续的帧F1到F5。纵轴表示基本层BL的参数组S1的参数值PVG。这个参数对于帧F1到F5分别具有值A1到A5。如果不对该参数的实际值A2到A5进行编码，而是对较小的差值D1、D2...进行编码，那么这个参数对编码信息EIN的位速率的影响将会得到降低。

附图9表示与增强层的频率范围相应的参数的差值求算。横轴代表两个连续的帧F1和F2。纵轴代表基本层BL和增强层EL的特定参数的值。在这个例子中，基本层BL包括信息INF的部分P1，具有针对全部频率范围FBW而确定的单个参数组，部分P1的特定参数对于帧F1具有值A1，而对于帧F2具有值A2。增强层EL包括信息I NF的部分P2，该部分P2具有为三个单独的频率范围FR2、FR3和FR4而确定的三组参数，其中所述三个频率范围合在一起占满了全部频率范围FBW。这三个特定的参数(例如，代表ILD的参数)在帧F1中具有值B11、B12、B13，而在帧F2中具有值B21、B22、B23。

如果不是对特定参数的实际值B11到B23进行编码，而是对差值D11、D12...进行编码，这三个参数对编码信息EIN的位速率的影响将会降低，这是因为这些差值的编码效率要比实际值高。

为了进行总结，在按照本发明的优选实施方式中，建议如此组织立体声参数信息INF：基本层BL包含一组参数(最好是时间/电平差和相关性)S1，该参数组是针对多声道音频信号LI、RI的全部带宽FBW确定的。增强层EL包含多组参数S2、S3...，这些参数组对应于全部带宽FBW中的连续频率间隔FR2、FR3...。为了位速率效率，可以相对于基本层BL中的参数组S1对增强层EL中的参数组S2、S3...进行差分编码。

采用多层方式对信息INF进行编码，以使得解码音质对位速率的按比例调节成为可能。

为了得出结论，下面，将会结合程序代码及其解释对按照本发明的优选实施方式进行说明。

首先，对于帧F1、F2...中的所有的子帧(部分P1、P2...)，确定用于单耳表达SC的数据ESC、用于全部带宽FBW的立体声参数组S1的数据EIN、和针对频率段(frequency bins)(或区域)FR2、FR3...的立体声参数S2、S3...。

左边给出的是程序代码，而在右边的说明下面给出了程序代码的解释。

代码说明

{

for(f＝0；f＜nrof_frames；f++) 对于所有的帧进行：

{

example_mono_frame(f) 取得用于单耳信号表

达的数据(附图3中的部

分A)

example_stereo_extension_layer_1(f) 取得全部带宽立体声

参数数据(部分P1)

example_stereo_extension_layer2(f) 取得频率段立体声参

} 数数据(部分P2)

}

其次，取决于位refresh_stereo的值，对全部带宽的立体声参数进行独立编码(对实际值进行编码)，或者对与在前值的差值进行编码。下面的代码适用于耳间电平差ILD。

代码说明

example_stereo_extension_layer_1(f)

{

refresh_stereo 1位，指示是否对数

据进行绝对编码

if(refresh_stereo＝1) 如果要对数据进行

{ 绝对编码

ild_global[f] 对整个频率域(全

局)的实际的耳间强度

} 差(ild)进行编码

else 如果不是刷新

{

ild_global_diff[f] 相对于在前的帧对

} ild进行编码

}

再次，取决于位refresh_stereo的值，对所有频率段的立体声参数进行绝对编码(对实际值进行编码)，或者对全部带宽的相应参数的差值进行编码。下面的代码适用于耳间电平差ILD。

代码说明

example_stereo_extension_layer_2(f)

{

if(refresh_stereo＝1) 如果刷新

{

for(b＝0；b＜nrof_bins；b++) 针对所有的频率段

{

ild_bin[f，b] 相对于全局值对该段

中的ild进行编码

}

else 如果不刷新

{

for(b＝0；b＜nrof_bins；b++) 针对所有段

{

ild_bin_diff[f，b] 相对于在前一帧的该

} 段中的值对特定段中的

} ild进行编码

}

其中：

项目“refresh_stereo”是指示是否对立体声参数进行刷新的标志(0＝FALSE，1＝TRUE)。

项目“ild_global[sf]”表示针对帧f的整个频率域的ILD的霍夫曼编码绝对表示级。

项目“ild_global_diff[f]”表示针对帧f的整个频率域的ILD的霍夫曼编码相对表示级。

项目“ild_bin[f，b]”表示针对帧f和段b的ILD的霍夫曼编码绝对表示级。

项目“ild_bin_diff[f，b]”表示针对帧f和段b的ILD的霍夫曼编码相对表示级。

应当注意到，上面给出的实施方式是用于解释说明，而非限制本发明，并且本领域的技术人员将能够设计出许多其它的实施方式，而不会超出所附的权利要求书的范围。

虽然在附图中针对立体声信号对本发明进行了说明，但是本领域技术人员能够很容易地将其扩展到多于两个声道的音频信号上。

在权利要求书中，放置在括号中的任何附图标记都不应理解为是对权利要求的限定。词“包括”并不排除除了权利要求中所列的元件或步骤之外还存在其它的元件或步骤。本发明可以借助包括数个性质不同元件的硬件来实现，也可以借助适当编程的计算机来实现。在列举了数个装置的产品权利要求中，这些装置中的某一些可以由同一硬件来实现。在相互不同的从属权利要求中引用了某些手段这一表面现象并不表示这些手段的组合不能有益地使用。

总之，将多声道音频信号编码成了单耳音频信号和能够实现多声道音频信号还原的信息。所述信息是通过针对所述多声道音频信号的第一频率范围来确定该信息的第一部分、针对所述多声道音频信号的第二频率范围来确定所述信息的第二部分而产生的。所述第二频率范围是所述第一频率范围的一部分，并且因此是所述第一频率范围的一个子范围。所述信息是多层次的，能够实现根据位速率而对解码质量进行的按比例调整。

Claims

1.一种对包括至少两个音频声道(RI，LI)的多声道音频信号进行参数编码的方法，该方法包括：

产生(1)一个包括至少两个音频声道(RI，LI)的特定组合的单一声道音频信号(SC)，并且将该单一声道音频信号(SC)编码到位流(EBS)中，作为经编码的单一声道音频信号(ESC)，

从所述至少两个音频声道(RI，LI)中产生(2)参数信息(INF)，使得通过所述单一声道音频信号(SC)和所述参数信息(INF)还原所述多声道音频信号，所述参数信息的产生(2)包括，

针对所述多声道音频信号的第一频率范围(FR1)确定(2)所述参数信息的第一部分(P1)，并且将所述参数信息的所述第一部分(P1)编码到位流(EBS)中，作为经编码的信息(EIN)的第一部分，和

针对所述多声道音频信号的第二频率范围(FR2)确定(2)所述参数信息的第二部分(P2)，所述第二频率范围(FR2)是所述第一频率范围(FR1)的一部分，并且将所述参数信息的所述第二部分(P2)编码到位流(EBS)中，作为经编码的信息(EIN)的第二部分。

2.按照权利要求1所述的对多声道音频信号进行参数编码的方法，该方法包括：

如果包括所述单一声道音频信号(SC)、所述参数信息的第一部分(P1)、和所述参数信息的第二部分(P2)的经编码多声道音频信号的位速率不高于所述最大允许位速率(MBR)，则仅针对所述多声道音频信号的第二频率范围(FR2)确定(2)所述参数信息的第二部分(P2)。

3.按照权利要求1所述的参数编码方法，其特征在于，所述参数信息(INF)包括多个参数组(S1、S2、...)，所述第一部分(P1)至少包括所述参数组(S1、S2、...)的第一参数组(S1)，所述第二部分(P2)至少包括所述参数组(S1、S2、...)的第二参数组(S2)，其中每个所述参数组与相应的频率范围(FR1、FR2、...)相关。

4.按照权利要求3所述的参数编码方法，其特征在于，所述参数组至少包括一个定位提示(ILD、ITD、IPD、IC)。

5.按照权利要求4所述的参数编码方法，其特征在于，所述至少一个定位提示(ILD、ITD、IPD、IC)是从下述各项中选择出来的：耳间电平差(ILD)、耳间时间或相位差(ITD、IPD)或者耳间交叉相关(IC)。

6.按照权利要求1或2所述的参数编码方法，其特征在于，所述第一频率范围(FR1)覆盖了所述多声道音频信号的全部带宽(FBW)。

7.按照权利要求1所述的参数编码方法，其特征在于，所述第一频率范围(FR1)基本上覆盖了所述多声道音频信号的全部带宽(FBW)，所述第二频率范围(FR2)覆盖了所述全部带宽(FBW)的一部分，并且在于，所述参数信息的第二部分(P2)的确定(2)适用于针对所述第二频率范围(FR2)和一组附加频率范围(FR3、FR4、FR5)来确定参数组(S2、S3、...)，所述第二频率范围(FR2)和所述一组附加频率范围(FR3、FR4、FR5)基本上覆盖了全部带宽(FBW)，其中在所述一组附加频率范围(FR3、FR4、FR5)中至少包括一个附加频率范围(FR3)。

8.按照权利要求7所述的参数编码方法，其特征在于，所述单一声道音频信号(SC)和所述参数信息(INF)的第一部分(P1)构成了参数信息的基本层(BL)，该基本层总是存在于所述经编码的多声道音频信号(EBS)中，并且在于，所述方法包括接收(2)所述经编码多声道音频信号(EBS)的最大允许位速率(MBR)，所述参数信息的第二部分(P2)构成了信息的增强层(EL)，该第二部分仅当经编码的基本层(DL)和增强层(EL)的位速率不高于所述最大允许位速率(MBR)时才进行编码。

9.按照权利要求3所述的参数编码方法，其特征在于，经编码的信息(EIN)的特定帧(F2)中的参数信息的第一部分(P1)的确定(2)包括，确定(2)所述特定帧(F2)中的参数组中的第一个参数组(S1’)，并且根据在所述特定帧(F2)之前的帧(F1)的参数组中的第一个参数组(S1)对所述参数组中的第一个参数组(S1’)进行编码。

10.按照权利要求7所述的参数编码方法，其特征在于，经编码的信息(EIN)的特定帧(F2)中的参数信息的第二部分(P2)的确定(2)包括，确定(2)所述特定帧(F2)中的第二部分的参数组(S2’、S3’、...)，并且根据在所述特定帧(F2)之前的帧(F1)的参数组(S2、S3、...)对所述特定帧(F2)中的第二部分(P2)的参数组(S2、S3、...)进行编码。

11.按照权利要求7所述的参数编码方法，其特征在于，经编码的信息(EIN)的特定帧(F2)中的参数信息的第二部分(P2)的确定(2)包括，确定所述特定帧(F2)中的第二部分(P2)的参数组(S2’、S3’、...)，并且根据在所述特定帧(F2)之前的帧(F1)的参数组中的第一个参数组(S1)对所述特定帧(F2)中的第二部分(P2)的参数组(S2’、S3’、...)进行编码。

12.按照权利要求9到11中任何一项所述的参数编码方法，其特征在于，所述确定(2)包括，计算所述特定帧(F2)与在所述特定帧(F2)之前的帧(F1)中的相应参数之间的差值。

13.一种用于对包括至少两个音频声道(RI，LI)的多声道音频信号进行编码的参数编码器，该编码器包括：

用于产生(1)一个包括至少两个音频声道(RI，LI)的特定组合的单一声道音频信号(SC)的装置，

用于从所述至少两个音频声道(RI，LI)中产生(2)参数信息(INF)，使得通过所述单一声道音频信号(SC)和所述参数信息(INF)还原所述多声道音频信号的装置，产生(2)所述参数信息的装置包括：

用于针对所述多声道音频信号的第一频率范围(FR1)来确定(2)所述参数信息的第一部分(P1)的装置，和

用于针对所述多声道音频信号的第二频率范围(FR2)来确定(2)所述参数信息的第二部分(P2)的装置，所述第二频率范围(FR2)是所述第一频率范围(FR1)的一部分。

14.如权利要求13所述的用于对多声道音频信号进行编码的参数编码器，还包括：

如果包括所述单一声道音频信号(SC)、所述参数信息的第一部分(P1)、和所述参数信息的第二部分(P2)的经编码多声道音频信号的位速率不高于所述最大允许位速率(MBR)，则仅针对所述多声道音频信号的第二频率范围(FR2)确定(2)所述参数信息的第二部分(P2)的装置。

15.一种用于提供音频信号的设备，该设备包括：

一个用于接收多声道音频信号的输入端，

一个如权利要求13或14所述的编码器，用于对所述多声道音频信号进行编码，以获得经编码的多声道音频信号，和

一个用于提供所述经编码的多声道音频信号的输出端。

16.一种对如权利要求14中所述的那样编码的多声道音频信号进行解码的方法，该解码方法包括：

获得(6、7)一个包括至少两个音频声道(RI，LI)的特定组合的解码的单一声道音频信号(SCO)，

从这样的参数信息(INF)中获取(6、8)解码的信息(INO)：该参数信息(INF)使得通过所述经解码的单一声道音频信号(SCO)和所述解码信息(INO)能够还原所述多声道音频信号，所述解码信息(INO)包括所述参数信息的第一部分(P1)和所述参数信息的第二部分(P2)，和

对所述单一声道音频信号(SCO)应用(9)所述参数信息的第一部分(P1)或者所述参数信息的第一部分(P1)和第二部分(P2)，以产生解码后的多声道音频信号(LO，RO)。

17.如权利要求14所述的那样编码的编码多声道音频信号进行解码的解码器，该解码器包括：

用于获得(6、7)一个包括至少两个音频声道(RI，LI)的特定组合的解码的单一声道音频信号(SCO)的装置，

用于从这样的参数信息(INF)中获取(6、8)解码信息(INO)的装置：该参数信息(INF)使得通过所述被解码的单一声道音频信号(SCO)和所述解码信息(INO)能够还原所述多声道音频信号，所述解码信息(INO)包括所述参数信息的第一部分(P1)和所述参数信息的第二部分(P2)，和

用于对所述单一声道音频信号(SCO)应用(9)所述参数信息的第一部分(P1)和所述参数信息的第二部分(P2)，以产生解码的多声道音频信号(LO，RO)的装置。

18.一种用于提供解码的多声道音频信号的设备，该设备包括：

一个用于接收编码音频信号的输入端，

一个如权利要求17中所述的解码器，用于对所述编码的音频信号进行解码，以获得多声道输出信号，和

一个用于提供或再现所述多声道输出信号的输出端。