CN105103225A

CN105103225A - 立体声音频编码器和解码器

Info

Publication number: CN105103225A
Application number: CN201480019354.9A
Authority: CN
Inventors: H·普恩哈根; K·克约尔林
Original assignee: Dolby International AB
Current assignee: Dolby International AB
Priority date: 2013-04-05
Filing date: 2014-04-04
Publication date: 2015-11-25
Anticipated expiration: 2034-04-04
Also published as: CN105103225B; US12080307B2; RU2019116192A; US11631417B2; US20160027446A1; JP2016519786A; US20230245667A1; US20200286497A1; KR20230020553A; US20190088266A1; EP2981960A1; RU2645271C2; EP4300488A3; BR122021009022B1; CN116741187A; US20170133025A1; BR122017006701A2; EP2981960B1; CN116741186A; HK1214882A1

Abstract

本公开提供用于基于输入信号编码和解码立体声音频信号的方法、装置和计算机程序产品。根据本公开，使用同时使用参数化立体声编码和立体声音频信号的离散表示的混合方法，该混合方法可提高某些比特率的编码和解码音频的质量。

Description

立体声音频编码器和解码器

技术领域

本公开在这里一般地涉及立体声音频编码。具体而言，它涉及用于包含下混和离散立体声编码的混合编码的解码器和编码器。

背景技术

在常规的立体声音频编码中，可能的编码方案包括在低比特率应用中使用的参数化立体声编码技术。在中间速率上，常常使用左/右(Left/Right，L/R)或中间/侧(Mid/Side，M/S)波形立体声编码。现有的分发格式和相关的编码技术可在它们的带宽效率的观点上得到提高，特别是在具有低比特率和中间比特率之间的比特率的应用中。

在UnifiedSpeechandAudioCoding(USAC)标准中尝试提高立体声音频系统中的音频分发的效率。USAC标准与参数化立体声编码器技术组合地引入基于低带宽波形编码的立体声编码。但是，由USAC提出的方案使用参数化立体声参数以在改进的离散余弦变换(MDCT)域中引导立体声编码，从而比普通M/S或L/R编码更有效地完成一些事情。该方案的缺点在于，可能难以基于在正交镜像滤波器(QMF)域中提取和计算的参数化立体声参数得到在MDCT域中基于低带宽波形的立体声编码中的最佳输出。

鉴于以上，可能需要进一步的改善，以解决或至少减小以上讨论的缺点的一个或更多个。

附图说明

现在参照附图描述示例性实施例，其中，

图1是根据示例性实施例的解码系统的一般化框图；

图2示出图1中的解码系统的第一部分；

图3示出图1中的解码系统的第二部分；

图4示出图1中的解码系统的第三部分；

图5是根据第一示例性实施例的编码系统的一般化框图；

图6是根据第二示例性实施例的编码系统的一般化框图。

所有附图是示意性的，并且，为了阐明本公开，一般仅表示必要的部分，而其它的部分可能被省略或仅仅被建议。除非另外指示，否则，类似的附图标记在不同的附图中指的是类似的部分。

具体实施方式

I.概要－解码器

如这里使用的，左右编码(codingorencoding)意味着不在信号之间执行任何变换的情况下编码左(L)和右(R)立体声信号。

这里，和差(sum-and-difference)编码意味着，左和右立体声信号的和M被编码为一个信号(和)，并且，左和右立体声信号之间的差S被编码为一个信号(差)。和差编码也可被称为中间侧编码。由此，左右形式和和差形式之间的关系是M＝L+R和S＝L-R。应当注意，当将左和右立体声信号变换成和差形式或者执行相反的变换时，只要沿两个方向的变换匹配，不同的归一化或缩放就是可能的。在本公开中，主要使用M＝L+R和S＝L-R，但是，使用不同的缩放、例如使用M＝(L+R)/2和S＝(L-R)/2的系统也同样很好地工作。

这里，下混互补(downmix-complemetary，dmx/comp)编码意味着，在编码之前根据加权参数a使左和右立体声信号经历矩阵乘法。dmx/comp编码由此也可被称为dmx/comp/a编码。下混互补形式、左右形式和和差形式之间的关系一般是dmx＝L+R＝M和comp＝(1-a)L-(1+a)R＝-aM+S。注意，下混互补表示中的下混信号由此等于和差表示的和信号M。

这里，音频信号可以是纯音频信号、音频视觉信号或多媒体信号的音频部分或与元数据组合的这些信号中的任一个。

根据第一方面，示例性实施例提出用于基于输入信号解码立体声声道音频信号的方法、装置和计算机程序产品。提出的方法、装置和计算机程序产品可一般具有相同的特征和优点。

根据示例性实施例，提供用于解码两个音频的解码器。解码器包括被配置为接收与两个音频信号的时间帧对应的第一信号和第二信号的接收级，其中，第一信号包含含有与直到第一分频频率(cross-overfrequency)的频率对应的频谱数据的第一波形编码信号和含有与高于第一分频频率的频率对应的频谱数据的波形编码下混信号，并且其中，第二信号包含含有与直到第一分频频率的频率对应的频谱数据的第二波形编码信号。

解码器还包括接收级的下游的混合级。混合级被配置为检查第一和第二信号波形编码信号是否对于直到第一分频频率的所有频率为和差形式，并且，如果不是，那么将第一和第二波形编码信号变换成和差形式，使得第一信号是含有与直到第一分频频率的频率对应的频谱数据的波形编码和信号及含有与高于第一分频频率的频率对应的频谱数据的波形编码下混信号的组合，并且，第二信号包含含有与直到第一分频频率的频率对应的频谱数据的波形编码差信号。

解码器还包括混合级的下游的被配置成上混第一和第二信号以产生立体声信号的左右声道的上混级，其中，对于低于第一分频频率的频率，上混级被配置为执行第一和第二信号的逆和差变换，并且，对于高于第一分频频率的频率，上混级被配置为执行第一信号的下混信号的参数化上混。

具有纯波形编码的较低频率即立体声音频信号的离散表示的优点可能在于，人耳对音频的具有低频率的部分更敏感。通过以更好的质量编码该部分，可以增大解码音频的整体效果。

具有第一信号的参数化立体声编码部分即波形编码下混信号和提到的立体声音频信号的离散表示的优点在于，与使用常规的参数化立体声方法相比，对某些比特率，可提高解码音频信号的质量。在约32～40千比特每秒(kbps)的比特率上，参数化立体声模型可饱和，即，解码音频信号的质量由参数化模型的缺点限制，而不是由于缺少编码比特。因此，对于从约32kbps起的比特率，在波形编码较低频率方面使用比特可能更有益。同时，使用第一信号的参数化立体声编码部分和分发的立体声音频信号的离散表示的混合方法在于，与使用在波形编码较低频率方面使用所有比特的方法和对剩余的频率使用频谱带复制(SBR)相比，这可对于例如低于48kbps的某些比特率提高解码音频的质量。

因此，解码器有利地用于解码二声道立体声音频信号。

根据另一实施例，在重叠加窗变换域中，执行在混合级中的将第一和第二波形编码信号变换成和差形式。重叠加窗变换域可例如是改进的离散余弦变换域(MDCT)域。这可能是有利的，原因是，在MDCT域中，很容易实现诸如左/右形式或dmx/comp形式的其它可用的音频分布格式向和差形式的变换。因此，可通过根据编码的信号的特性对低于第一分频频率的频率的至少一子集使用不同的格式来编码信号。这可允许提高编码质量和编码效果。

根据又一实施例，在正交镜像滤波器域即QMF域中执行上混级中的第一和第二信号的上混。执行上混，以产生左和右立体声信号。

根据另一实施例，波形编码下混信号包含与在第一分频频率和第二分频频率之间的频率对应的频谱数据。高频重构(HFR)参数例如在接收级上通过解码器被接收并然后被发送到高频重构级，该HFR参数用于通过用高频重构参数执行高频重构来将第一信号的下混信号扩展到高于第二分频频率的频率范围。高频重构可例如包含执行频谱带复制SBR。

具有仅包含与在第一分频频率和第二分频频率之间的频率对应的频谱数据的波形编码下混信号的优点在于，可减小立体声系统的需要的比特传送率。作为替代方案，可在波形编码较低频率方面使用通过具有带通滤波的下混信号而节省的比特，例如，这些频率的量化可更细，或者第一分频频率可增大。

由于如上面描述的那样人耳对音频信号的具有低频率的部分更敏感，因此，可在不降低解码音频信号的感觉音频质量的情况下通过高频重构重新创建诸如音频信号的具有高于第二分频频率的频率的部分的高频。

根据另一实施例，在执行第一和第二信号的上混之前，将第一信号的下混信号扩展到高于第二分频频率的频率范围。这可能是有利的，原因是，上混级将具有并输入具有与所有频率对应的频谱数据的和信号。

根据另一实施例，在将第一和第二波形编码信号变换成和差形式之后，将第一信号的下混信号扩展到高于第二分频频率的频率范围。这可能是有利的，原因是，给定下混信号与和差表示中的和信号对应，则高频重构级将具有有着以相同的形式即以和形式表示的与直到第二分频频率的频率对应的频谱数据的输入信号。

根据另一实施例，通过使用上混参数完成上混级中的上混。上混参数例如在接收级上通过解码器被接收并且发送到上混级。产生下混信号的去相关版本，并且，使下混信号和下混信号的去相关版本经历矩阵运算。矩阵运算的参数由上混参数给出。

根据另一实施例，在接收级上接收的第一和第二波形编码信号以左右形式、和差形式和/或下混互补形式被波形编码，其中，互补信号依赖于具有信号自适应性的加权参数a。波形编码的信号可由此根据信号的特性以不同的形式被编码，并且仍可通过解码器被解码。这样，给定系统的一定比特率，可允许提高编码质量并由此提高解码音频立体声信号的质量。在另一实施例中，加权参数a被取实数值。这可简化解码器，原因是不需要接近信号的虚部的额外级。另一优点在于，可降低解码器的计算复杂性，这也可导致减小的解码延迟/解码器反应时间。

根据另一实施例，在接收级上接收的第一和第二波形编码信号以和差形式被波形编码。这意味着，第一和第二信号可分别通过使用对第一和第二信号进行独立加窗的重叠加窗变换被编码，并且仍可通过解码器被解码。这样，给定系统的一定比特率，可允许提高的编码质量并由此允许提高的解码音频立体声信号的质量。例如，如果在和信号中而不是在差信号中检测到瞬变，那么波形解码器可用较短的窗编码和信号，而对于差信号，可以保持较长的缺省窗。与侧信号也通过较短的窗序列被编码的情况相比，这可提供更高的编码效率。

II.概要－编码器

根据第二方面，示例性实施例提出用于基于输入信号编码立体声声道音频信号的方法、装置和计算机程序产品。

提出的方法、装置和计算机程序产品可一般具有相同的特征和优点。

对于编码器的相应的特征和设置，关于在以上的解码器的概要中给出的特征和设置的优点可一般是有效的。

根据示例性实施例，提供用于编码两个音频信号的编码器。编码器包括被配置为接收要被编码的与两个信号的时间帧对应的第一信号和第二信号。

编码器还包括被配置为从接收级接收第一和第二信号并且将它们变换成作为和信号的第一变换信号和作为差信号的第二变换信号的变换级。

编码器还包括被配置为从变换级接收第一和第二变换信号并且分别将它们波形编码成第一和第二波形编码信号的波形编码级，其中，对于高于第一分频频率的频率，波形编码级被配置为波形编码第一变换信号，并且，对于直到第一分频频率的频率，波形编码级被配置为波形编码第一和第二变换信号。

编码器还包括被配置为从接收级接收第一和第二信号并且为了提取参数化立体声参数从而使得能够对高于第一分频频率的频率重构第一和第二信号的频谱数据而使第一和第二信号经历参数化立体声编码的参数化立体声编码级。

编码器还包括被配置为从波形编码级接收第一和第二波形编码信号并从参数化立体声编码级接收参数化立体声参数并且产生包含第一和第二波形编码信号和参数化立体声参数的比特流的比特流产生级。

根据另一实施例，在时间域中执行变换级中的第一和第二信号的变换。

根据另一实施例，对于低于第一分频频率的频率的至少一子集，编码器可通过执行逆和差变换将第一和第二波形编码信号变换成左/右形式。

根据另一实施例，对于低于第一分频频率的频率的至少一子集，编码器可通过对第一和第二波形编码信号执行矩阵运算来将第一和第二波形编码信号变换成下混/互补形式，矩阵运算依赖于加权参数a。加权参数a可然后包含于比特流产生级中的比特流中。

根据又一实施例，对于高于第一分频频率的频率，在变换级中波形编码第一和第二变换信号包含：对第一分频频率与第二分频频率之间的频率，波形编码第一变换信号，和在第二分频频率以上将第一波形编码信号设定为零。然后，为了产生使得能够实现下混信号的高频重构的高频重构参数，可使第一的下混信号和第二信号在高频重构级中经历高频重构。高频重构参数可然后包含在比特流产生级中的比特流中。

根据另一实施例，基于第一和第二信号计算下混信号。

根据另一实施例，通过首先将第一和第二信号变换成作为和信号的第一变换信号和作为差信号的第二变换信号并然后使第一和第二变换信号经历参数化立体声编码，来在参数化立体声编码级中使第一和第二信号经历参数化立体声编码，其中，经历高频重构编码的下混信号是第一变换信号。

III.示例性实施例

图1是包括三个概念部分200、300、400的解码系统100的一般化框图，将结合下图2～4更详细地解释这些概念部分。在第一概念部分200中，比特流被接收并且被解码为第一和第二信号。第一信号包含如下两个信号：含有与直到第一分频频率的频率对应的频谱数据的第一波形编码信号，和含有与高于第一分频频率的频率对应的频谱数据的波形编码下混信号。第二信号仅包含含有与直到第一分频频率的频率对应的频谱数据的第二波形编码信号。

在第二概念部分300中，在第一和第二信号的波形编码部分不是例如M/S形式的和差形式的情况下，第一和第二信号的波形编码部分变换成和差形式。然后，第一和第二信号变换到时域并然后变换成正交镜像滤波器域即QMF域。在第三概念部分400中，第一信号被高频重构(HRF)。第一和第二信号二者然后被上混以创建具有与正通过解码系统100解码的编码信号的整个频带对应的频谱系数的左和右立体声信号输出。

图2示出图1中的解码系统100的第一概念部分200。解码系统100包含接收级212。在接收级212中，比特流帧202被解码并且去量化为第一信号204a和第二信号204b。比特流帧202与正被解码的两个音频信号的时间帧对应。第一信号204a包含含有与直到第一分频频率k_y的频率对应的频谱数据的第一波形编码信号208和含有与高于第一分频频率k_y的频率对应的频谱数据的波形编码下混信号206。作为例子，第一分频频率k_y是1.1kHz。

根据一些实施例，波形编码下混信号206包含与第一分频频率k_y和第二分频频率k_x之间的频率对应的频谱数据。作为例子，第二分频频率k_x位于5.6～8kHz的范围内。

接收的第一和第二波形编码信号208、210可以按左右形式、和差形式和/或下混互补形式被波形编码，其中，互补信号依赖于具有信号自适应性的加权参数a。波形编码下混信号206与适用于参数化立体声的下混对应，根据以上，该下混与和形式对应。但是，信号204b不具有高于第一分频频率k_y的内容。在改进的离散余弦变换(MDCT)域中表示信号206、208、210中的每一个。

图3示出图1中的解码系统100的第二概念部分300。解码系统100包含混合级302。解码系统100的设计要求：对于高频重构级(将在后面更详细地描述)的输入需要为和格式。因此，混合级被配置为检查第一和第二信号波形编码信号208、210是否为和差形式。如果第一和第二信号波形编码信号208、210不对于直到第一分频频率k_y的所有频率为和差形式，那么混合级302将整个波形编码信号208、210变换成和差形式。在到混合级302的输入信号208、210的频率的至少一子集为下混互补形式的情况下，需要加权参数a作为到混合级302的输入。应当注意，输入信号208、210可包含以下混互补形式编码的频率的几个子集，并且，在这种情况下，各子集不必通过使用加权参数a的相同值被编码。在这种情况下，需要几个加权参数a作为到混合级302的输入。

如上所述，混合级302总是输出输入信号204a～b的和差表示。为了能够将以MDCT域表示的信号变换成和差表示，MDCT编码信号的加窗(windowing)需要相同。这意味着，在第一和第二信号波形编码信号208、210为L/R或下混互补形式的情况下，用于信号204a的加窗和用于信号204b的加窗不能是独立的。

因此，在第一和第二信号波形编码信号208、210为和差形式的情况下，用于信号204a的加窗和用于信号204b的加窗可以是独立的。

在混合级302之后，通过应用改进的逆离散余弦变换(MDCT^-1)312，和差信号变换成时域。

两个信号304a～b然后通过两个QMF组(bank)314被分析。由于下混信号306不包含较低频率，因此，不需要用Nyquist滤波器组分析信号以增大频率分辨率。这可与下混信号包含低频率的系统(例如诸如MPEG-4参数化立体声的常规的参数化立体声解码)比较。在那些系统中，为了超出由QMF组实现的频率分辨率地增大频率分辨率并由此更好地匹配例如由Bark频率标尺表示的人听觉系统的频率选择性，需要用Nyquist滤波器组分析下混信号。

来自QMF组314的输出信号304包含第一信号304a，该第一信号304a是如下信号的组合：含有与直到第一分频频率k_y的频率对应的频谱数据的波形编码和信号308，和含有与在第一分频频率k_y和第二分频频率k_x之间的频率对应的频谱数据的波形编码下混信号306。输出信号304还包含第二信号304b，该第二信号304b含有包含与直到第一分频频率k_y的频率对应的频谱数据的波形编码差信号310。信号304b不具有高于第一分频频率k_y的内容。

如将在后面描述的，高频重构级416(结合图4示出)使用较低频率(即，输出信号304中的第一波形编码信号308和波形编码下混信号306)来重构高于第二分频频率k_x的频率。高频重构级416对其进行操作的信号是跨较低频率的类似类型的信号，这是有利的。根据该观点，使得混合级302总是输出第一和第二信号波形编码信号208、210的和差表示是有利的，原因是这意味着输出的第一信号304a的第一波形编码信号308和波形编码下混信号306具有类似的特性。

图4示出图1中的解码系统100的第三概念部分400。高频重构(HRF)级416通过执行高频重构将第一信号输入信号304a的下混信号306扩展到高于第二分频频率k_x的频率范围。根据HFR级416的配置，到HFR级416的输入是整个信号304a或者仅仅是下混信号306。通过以任何适当的方式使用可通过高频重构级416接收的高频重构参数来完成高频重构。根据一实施例，执行的高频重构包含执行频谱带复制SBR。

来自高频重构级413的输出是包含施加了SBR扩展412的下混信号406的信号404。高频重构信号404和信号304b然后被馈送到上混级420中，以产生左L和右R立体声信号412a-b。对于与低于第一分频频率k_y的频率对应的频谱系数，上混包含执行第一和第二信号408、310的逆和差变换。这只意味着如上面概述的那样从中间侧表示前进到左右表示。对于与超出第一分频频率k_y的频率对应的频谱系数，通过去相关器418馈送下混信号406和SBR扩展412。下混信号406和SBR扩展412及下混信号406和SBR扩展412的去相关版本然后通过使用参数化混合参数被上混，以对于高于第一分频频率k_y的频率重构左和右声道416、414。可以应用在本领域中已知的任何参数化上混过程。

应当注意，在图1～4所示的编码器的以上的示例性实施例100中，需要高频重构，原因是第一接收信号204a仅包含与直到第二分频频率k_x的频率对应的频谱数据。在其它的实施例中，第一接收信号包含与编码信号的所有频率对应的频谱数据。根据这种实施例，不需要高频重构。本领域技术人员理解如何在这种情况下调整示例性编码器100。

图5作为例子示出根据一实施例的编码系统500的一般化框图。

在编码系统中，要被编码的第一和第二信号540、542由接收级(未示出)接收。这些信号540、542代表左540和右542立体声音频声道的时间帧。在时域中表示信号540、542。编码系统包含变换级510。信号540、542在变换级510中变换成和差格式544、546。

编码系统还包含被配置为从变换级510接收第一和第二变换信号544、546的波形编码级514。波形编码级一般在MDCT域中操作。出于这种原因，变换信号544、546在波形编码级514之前经历MDCT变换512。在波形编码级中，第一和第二变换信号544、546分别被波形编码成第一和第二波形编码信号518、520。

对于高于第一分频频率k_y的频率，波形编码级514被配置为将第一变换信号544波形编码成第一波形编码信号518的波形编码信号552。波形编码级514可被配置为在第一分频频率k_y以上将第二波形编码信号520设定为零或者根本不编码这些频率。对于高于第一分频频率k_y的频率，波形编码级514被配置为将第一变换信号544波形编码成第一波形编码信号518的波形编码信号552。

对于低于第一分频频率k_y的频率，在波形编码级514中判定对于两个信号548、550使用什么类型的立体声编码。根据低于第一分频频率k_y的变换信号544、546的特性，可对波形编码信号548、550的不同子集做出不同的判定。编码可任意地为左/右编码、中间/侧编码(即，对和差编码)、或者dmx/comp/a编码。在在波形编码级514中通过和差编码波形编码信号548、550的情况下，可分别对信号518、520使用具有独立加窗的重叠加窗变换来编码波形编码信号518、520。

示例性第一分频频率k_y是1.1kHz，但该频率可根据立体声音频系统的比特传送率或者根据要被编码的音频的特性而改变。

由此，从波形编码级514输出至少两个信号518、520。在根据加权参数a，通过执行矩阵运算而在下混/互补形式中编码低于第一分频频率k_y的信号的一个或几个子集或者整个频带的情况下，该参数也作为信号522被输出。在以下混/互补形式编码几个子集的情况下，各子集不必通过使用加权参数a的相同值被编码。在这种情况下，几个加权参数作为信号522被输出。

这两个或三个信号518、520、522被编码并且量化524为单个复合信号558。

为了能够在解码器侧对于高于第一分频频率的频率重构第一和第二信号540、542的频谱数据，需要从信号540、542提取参数化立体声参数536。出于这种目的，编码器500包含参数化立体声(PS)编码级530。PS编码级530一般在QMF域中操作。因此，在输入到PS编码级530之前，第一和第二信号540、542通过QMF分析级526变换到QMF域。PS编码器级530适于仅对于高于第一分频频率k_y的频率提取参数化立体声参数536。

应当注意，参数化立体声参数536反映被参数化立体声编码的信号的特性。因此，它们具有频率选择性，即，参数536的各参数可与左或右输入信号540、542的频率的子集对应。PS编码级530计算参数化立体声参数536并且以均匀或非均匀的方式量化它们。如上面提到的那样，参数被频率选择地计算，这里，输入信号540、542的整个频率范围分成例如15个参数带。它们可根据人听觉系统的频率分辨率的模型(例如Bark尺度)分开。

在图5所示的编码器500的示例性实施例中，波形编码级514被配置为对于第一分频频率k_y与第二分频频率k_x之间的频率波形编码第一变换信号544，并且，在第二分频频率k_x之上将第一波形编码信号518设定为零。可以完成这一点，以进一步减小编码器500是一部分的音频系统的需要的传送率。为了能够重构高于第二分频频率k_x的信号，需要产生高频重构参数538。根据本示例性实施例，通过在下混级534处下混以QMF域表示的两个信号540、542完成这一点。然后，为了产生高频重构参数538，在高频重构HFR编码级532处，使得到的例如等于信号540、542的和的下混信号经历高频重构。如本领域技术人员公知的那样，参数538可例如包含高于第二分频频率k_x的频率的频谱包络、噪声添加信息等。

示例性第二分频频率k_x为5.6～8kHz，但该频率可根据立体声音频系统的比特传送率或者根据要被编码的音频的特性而改变。

编码器500还包括比特流产生级即比特流多路复用器524。根据编码器500的示例性实施例，比特流产生级被配置为接收编码且量化的信号544和两个参数信号536、538。它们通过比特流产生级562被变换成比特流560，以进一步在立体声音频系统中分发。

根据另一实施例，波形编码级514被配置为对于高于第一分频频率k_y的所有频率波形编码第一变换信号544。在这种情况下，不需要HFR编码级532，因此，在比特流中不包含高频重构参数538。

图6作为例子示出根据另一实施例的编码器系统600的一般化框图。本实施例与图5所示的实施例的不同在于，通过QMF分析级526变换的信号544、546为和差格式。因此，不需要单独的下混级534，原因是和信号544已为下混信号的形式。因此，SBR编码级532只需要对和信号544操作以提取高频重构参数538。PS编码器530适于对和信号544和差信号546二者操作以提取参数化立体声参数536。

等同物、扩展、替代和混杂

本领域技术人员在研究以上的描述之后很容易想到本公开的其它实施例。尽管本说明书和附图公开了实施例和例子，但本公开不限于这些特定的例子。在不背离由所附的权利要求限定的本公开的范围的情况下，可以做出大量的修改和变化。在权利要求中出现的任何附图标记不应被理解为限制它们的范围。

另外，本领域技术人员在通过研究附图、本公开和所附的权利要求实践本公开时可以理解和实施公开的实施例的变更例。在权利要求中，词语“包括”不排除其它的要素或步骤，并且，不定冠词“一个”或“一种”不排除多个。在多个不同的从属权利要求中仅仅记载某些措施不表示这些措施的组合不能被充分利用。

以上公开的系统和方法可实现为软件、固件、硬件或它们的组合。在硬件实现中，在以上的描述中提到的功能单元之间的任务的分割未必与分成多个实体单元对应；相反，一个实体部件可具有多个功能，并且，可通过协作的几个实体部件来实现一个任务。某些部件或所有部件可实现为由数字信号处理器或微处理器执行的软件，或者实现为硬件或依应用而定的集成电路。这种软件可分布于可包含计算机存储介质(或非暂时性介质)或通信介质(或暂时性介质)的计算机可读介质上。本领域技术人员很容易理解，术语计算机存储介质包括以任何方法或技术实现的易失性和非易失性、可去除和不可去除介质，这些介质用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字万用盘(DVD)或其它光盘存储器、磁盒、磁带、磁盘存储器或其它磁存储装置或可用于存储希望的信息并且可通过计算机访问的任何其它介质。并且，本领域技术人员公知，通信介质一般在诸如载波或其它传输机制的调制数据信号中体现计算机可读指令、数据结构、程序模块或其它数据，并且包含任何信息递送介质。

Claims

1.一种用于解码两个音频信号的解码方法，包括以下步骤：

接收与两个音频信号的时间帧对应的第一信号和第二信号，其中，第一信号包含第一波形编码信号和波形编码下混信号，该第一波形编码信号含有与直到第一分频频率的频率对应的频谱数据，该波形编码下混信号含有与高于第一分频频率的频率对应的频谱数据，并且其中，第二信号包含第二波形编码信号，该第二波形编码信号含有与直到第一分频频率的频率对应的频谱数据；

如果第一波形编码信号和第二波形编码信号对于直到第一分频频率的所有频率不是和差形式，那么将第一波形编码信号和第二波形编码信号变换成和差形式，使得第一信号是含有与直到第一分频频率的频率对应的频谱数据的波形编码和信号及含有与高于第一分频频率的频率对应的频谱数据的波形编码下混信号的组合，并且第二信号包含含有与直到第一分频频率的频率对应的频谱数据的波形编码差信号；和

上混第一信号和第二信号，以产生立体声信号的左声道和右声道，其中，对于低于第一分频频率的频率，上混包含执行第一信号和第二信号的逆和差变换，并且对于高于第一分频频率的频率，上混包含执行第一信号的下混信号的参数化上混。

2.根据权利要求1所述的解码方法，其中，在重叠加窗变换域中执行将第一波形编码信号和第二波形编码信号变换成和差形式的步骤。

3.根据权利要求2所述的解码方法，其中，重叠加窗变换域是改进的离散余弦变换MDCT域。

4.根据前面的权利要求中的任一项所述的解码方法，其中，在正交镜像滤波器QMF域中执行上混第一信号和第二信号以产生左立体声信号和右立体声信号的步骤。

5.根据前面的权利要求中的任一项所述的解码方法，其中，波形编码下混信号包含与在第一分频频率和第二分频频率之间的频率对应的频谱数据，该方法还包括：

接收高频重构参数；和

通过用高频重构参数执行高频重构，来将第一信号的下混信号扩展到高于第二分频频率的频率范围。

6.根据权利要求5所述的解码方法，其中，通过执行高频重构来将第一信号的下混信号扩展到高于第二分频频率的频率范围的步骤包含执行频谱带复制SBR。

7.根据权利要求5或6中的任一项所述的解码方法，其中，在上混第一信号和第二信号的步骤之前，执行将第一信号的下混信号扩展到高于第二分频频率的频率范围的步骤。

8.根据权利要求5到7中任一项所述的解码方法，其中，在将第一波形编码信号和第二波形编码信号变换成和差形式的步骤之后，执行将第一信号的下混信号扩展到高于第二分频频率的频率范围的步骤。

9.根据前面的权利要求中的任一项所述的解码方法，其中，第一信号的下混信号的参数化上混的步骤包含：

接收上混参数；

产生下混信号的去相关版本；和

使下混信号和下混信号的去相关版本经历矩阵运算，其中，矩阵运算的参数由上混参数给出。

10.根据前面的权利要求中的任一项所述的解码方法，其中，接收的第一波形编码信号和第二波形编码信号以左右形式、和差形式和/或下混互补形式被波形编码，其中，互补信号依赖于具有信号自适应性的加权参数a。

11.根据权利要求10所述的解码方法，其中，加权参数a取实数值。

12.根据权利要求10所述的解码方法，其中，接收的第一波形编码信号和第二波形编码信号以和差形式被波形编码，并且其中，第一信号和第二信号分别通过使用对于第一信号和第二信号进行独立加窗的重叠加窗变换而被编码。

13.一种计算机程序产品，包括具有用于执行前面的权利要求中的任一项的方法的指令的计算机可读介质。

14.一种用于解码两个音频信号的解码器，包括：

接收级，被配置为接收与两个音频信号的时间帧对应的第一信号和第二信号，其中，第一信号包含第一波形编码信号和波形编码下混信号，该第一波形编码信号含有与直到第一分频频率的频率对应的频谱数据，该波形编码下混信号含有与高于第一分频频率的频率对应的频谱数据，并且其中，第二信号包含含有与直到第一分频频率的频率对应的频谱数据的第二波形编码信号；

在接收级下游的混合级，被配置为检查第一信号波形编码信号和第二信号波形编码信号对于直到第一分频频率的所有频率是否是和差形式的，并且，如果不是，那么将第一波形编码信号和第二波形编码信号变换成和差形式，使得第一信号是含有与直到第一分频频率的频率对应的频谱数据的波形编码和信号及含有与高于第一分频频率的频率对应的频谱数据的波形编码下混信号的组合，并且第二信号包含含有与直到第一分频频率的频率对应的频谱数据的波形编码差信号；和

在混合级下游的上混级，被配置为上混第一信号和第二信号以产生立体声信号的左声道和右声道，其中，对于低于第一分频频率的频率，上混级被配置为执行第一信号和第二信号的逆和差变换，并且对于高于第一分频频率的频率，上混级被配置为执行第一信号的下混信号的参数化上混。

15.一种用于编码两个音频信号的编码方法，包括以下步骤：

接收要被编码的第一信号和第二信号，第一信号和第二信号与两个音频信号的时间帧对应；

将第一信号和第二信号变换成作为和信号的第一变换信号和作为差信号的第二变换信号；

分别将第一变换信号和第二变换信号波形编码成第一波形编码信号和第二波形编码信号，其中，对于高于第一分频频率的频率，波形编码包含对第一变换信号进行波形编码，并且其中，对于直到第一分频频率的频率，波形编码包含对第一变换信号和第二变换信号进行波形编码；

使第一信号和第二信号经历参数化立体声编码，以提取参数化立体声参数从而使得能够对于高于第一分频频率的频率重构第一信号和第二信号的频谱数据；

产生包含第一波形编码信号和第二波形编码信号及参数化立体声参数的比特流。

16.根据权利要求15所述的编码方法，其中，在时域中执行变换第一信号和第二信号的步骤。

17.根据权利要求15～16中的任一项所述的编码方法，还包括：对于低于第一分频频率的频率的至少一子集，通过执行逆和差变换，来将第一波形编码信号和第二波形编码信号变换成左/右形式。

18.根据权利要求15～17中的任一项所述的编码方法，还包括：

对于低于第一分频频率的频率的至少一子集，通过对第一波形编码信号和第二波形编码信号执行矩阵运算，将第一波形编码信号和第二波形编码信号变换成下混/互补形式，其中矩阵运算依赖于加权参数a；和

使加权参数a包含在比特流中。

19.根据权利要求15～18中的任一项所述的编码方法，其中，

对于高于第一分频频率的频率，对第一变换信号和第二变换信号进行波形编码的步骤包含：对于在第一分频频率和第二分频频率之间的频率对第一变换信号进行波形编码，和在第二分频频率以上将第一波形编码信号设定为零；该方法还包括：

使第一信号的下混信号和第二信号经历高频重构编码，以产生使得能够实现下混信号的高频重构的高频重构参数；和

使高频重构参数包含在比特流中。

20.根据权利要求19所述的编码方法，还包括基于第一信号和第二信号计算下混信号。

21.根据权利要求19所述的编码方法，其中，通过首先执行将第一信号和第二信号变换成作为和信号的第一变换信号和作为差信号的第二变换信号的步骤、并然后使第一变换信号和第二变换信号经历参数化立体声编码，来执行使第一信号和第二信号经历参数化立体声编码的步骤，其中，经历高频重构的下混信号是第一变换信号。

22.一种计算机程序产品，包括具有用于执行权利要求15～21中的任一项的方法的指令的计算机可读介质。

23.一种用于编码两个音频信号的编码器，包括：

接收级，被配置为接收要被编码的第一信号和第二信号，第一信号和第二信号与两个音频信号的时间帧对应；

变换级，被配置为从接收级接收第一信号和第二信号并且将它们变换成作为和信号的第一变换信号和作为差信号的第二变换信号；

波形编码级，被配置为从变换级接收第一变换信号和第二变换信号并且分别将它们波形编码成第一波形编码信号和第二波形编码信号，其中，对于高于第一分频频率的频率，波形编码级被配置为对第一变换信号进行波形编码，并且其中，对于直到第一分频频率的频率，波形编码级被配置为对第一变换信号和第二变换信号进行波形编码；

参数化立体声编码级，被配置为从接收级接收第一信号和第二信号，并且使第一信号和第二信号经历参数化立体声编码以提取参数化立体声参数从而使得能够对于高于第一分频频率的频率重构第一信号和第二信号的频谱数据；

比特流产生级，被配置为从波形编码级接收第一波形编码信号和第二波形编码信号并从参数化立体声编码级接收参数化立体声参数，并且产生包含第一波形编码信号和第二波形编码信号及参数化立体声参数的比特流。