CN105981101B

CN105981101B - 对编码音频信号进行解码的装置、方法和计算机存储介质

Info

Publication number: CN105981101B
Application number: CN201480066827.0A
Authority: CN
Inventors: 安德鲁斯·尼德梅尔; 斯蒂凡·维尔德; 丹尼尔·费歇尔; 马赛厄斯·希尔登布兰德; 麦克·盖尔; 马克斯·诺伊恩多夫
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2013-12-09
Filing date: 2014-11-28
Publication date: 2020-04-10
Anticipated expiration: 2034-11-28
Also published as: KR101854298B1; MX2016007430A; CN105981101A; EP3080803B1; RU2644135C2; US20170278522A1; BR112016012689B1; US9799345B2; JP2016539377A; ES2650941T3; EP3080803A1; JP6286554B2; US20160284359A1; WO2015086351A1; CA2931958A1; US10332536B2; KR20160079878A; EP2881943A1; MX353703B; CA2931958C

Abstract

一种用于对包括指示第一谐波带宽扩展模式或第二非谐波带宽扩展模式的带宽扩展控制数据在内的编码音频信号(101)进行解码的装置包括：输入接口(100)，用于接收包括指示第一谐波带宽扩展模式或第二非谐波带宽扩展模式的带宽扩展控制数据在内的编码音频信号；处理器(102)，用于使用第二非谐波带宽扩展模式对音频信号(101)进行解码；以及控制器(104)，用于即使在带宽扩展控制数据指示第一谐波带宽扩展模式用于编码信号的情况下，也控制处理器(102)使用第二非谐波带宽扩展模式对音频信号进行解码。

Description

对编码音频信号进行解码的装置、方法和计算机存储介质

技术领域

本发明涉及音频处理，且具体地涉及使用减少的计算资源对编码音频信号进行解码的概念。

背景技术

“统一语音和音频编码”(USAC)标准[1]对谐波带宽扩展工具HBE进行了标准化，该谐波带宽扩展工具HBE采用了谐波变调器(transposer)，且其是频段复现(SBR)系统的扩展，它们在[1]和[2]中分别被标准化。

SBR通过将给定的低频部分与给定的边信息一起使用，来合成带宽受限的音频信号的高频内容。在[2]中描述了SBR工具，在[1]中描述了增强SBR(eSBR)。采用了相位音码器(vocoder)的谐波带宽扩展HBE是eSBR的一部分，且已被发展以避免在的经历过如在常规SBR处理中执行的向上复制(copy-up)修补的信号中经常观察到的听觉粗糙度。HBE的主要范围是在应用eSBR的同时保持给定音频信号的合成高频区域中的谐波结构。

鉴于编码器可以选择对HBE工具的使用，符合[1]的解码器应当提供解码并应用HBE相关数据。

听力测试[3]已经表明使用HBE将增强根据[1]的解码比特流的感知音频质量。

HBE工具将传统SBR系统的简单向上复制修补替换为高级信号处理例程。这就要求将相当大量的处理能力和存储器用于滤波器状态和延迟线路。相对地，向上复制修补的复杂度可被忽略。

观察到的使用HBE所增加的复杂度对于个人计算机设备来说不是问题。然而，设计解码器芯片的芯片制造商正需要与计算工作负载和存储器消耗有关的严格的且低复杂度的约束。否则，需要HBE处理以避免听觉粗糙度。

如[1]中描述的那样对USAC比特流进行解码。这必然暗示了对HBE解码器工具的实现，如[1]，7.5.3中描述的那样。可以在包含eSBR处理的所有编解码器操作点中发信号通知该工具。对于满足[1]的简档和合规标准的解码器设备来说，这意味着计算工作负载和存储器消耗的整体最坏情况显著增加。

计算复杂度的实际增加是依赖于实现和平台的。在当前的存储器优化实现中，每音频声道的存储器消耗的增加对于实际HBE处理来说是至少15干字(kWord)。

发明内容

本发明的目标是提供一种用于对编码音频信号进行解码的增强概念，其较不复杂且仍然适用于处理现有的编码音频信号。

该目的是由根据权利要求1的用于对编码音频信号进行解码的装置、根据权利要求13的对编码音频信号进行解码的方法、或根据权利要求14的计算机程序来实现的。

本发明基于以下发现：在整个信号中，仅使用非谐波带宽扩展模式对音频信号(该音频信号由要使用谐波带宽扩展模式来解码的部分构成并附加地包含要使用非谐波带宽扩展模式来解码的部分)进行解码时，实现了要求减少的存储器资源的音频解码概念。换言之，即使当信号包括被信号通知为要使用谐波带宽扩展模式来解码的部分或帧时，也使用非谐波带宽扩展模式对这些部分或帧进行解码。为此，提供了用于使用非谐波带宽扩展模式对音频信号进行解码的处理器，且附加地在装置内实现控制器或者在用于控制处理器执行以下操作的解码方法中实现控制步骤：即使编码音频信号中包括的带宽扩展控制数据指示第一(即，谐波)带宽扩展模式用于音频信号，也使用第二非谐波带宽扩展模式对音频信号进行解码。从而，处理器仅必须使用对应硬件资源(例如，仅应付计算非常高效的非谐波带宽扩展模式的存储器和处理能力)来实现。然而另一方面，音频解码器能够以可接受的质量对要求谐波带宽扩展模式的编码音频信号进行接受和解码。换言之，对于需求较低计算资源的应用，控制器被配置为：即使编码音频信号本身由于所包括的带宽扩展控制数据而要求使用谐波带宽扩展模式对该信号的至少若干部分进行解码，也控制处理器使用非谐波带宽扩展模式对整个音频信号进行解码。从而，获得了在计算资源(一方面)和音频质量(另一方面)之间的良好折中，同时针对要求这两种带宽扩展模式的编码音频信号保持了完全后向兼容性。由于本发明降低了USAC解码器的计算复杂度和存储器需求，因此本发明是有利的。此外，在优选实施例中，使用比特流中发送的谐波带宽扩展模式数据来修改预定的或标准化的非谐波带宽扩展模式，以尽可能重复使用对于非谐波带宽扩展模式来说基本不必要的带宽扩展模式数据，以进一步增强非谐波带宽扩展模式的音频质量。从而，在本优选实施例中提供了备选解码方案，以减轻由省略谐波带宽扩展模式所引起的对感知质量的损害，该谐波带宽扩展模式通常基于如USAC标准[1]中讨论的相位音码器处理。

在实施例中，当编码音频信号是编码立体声或多声道音频信号时，处理器具有足以用于使用第二非谐波带宽扩展模式对编码音频信号进行解码的存储器和处理资源，其中，该存储器或处理资源不足以用于使用第一谐波带宽扩展模式对编码音频信号进行解码。与此相反，由于与用于立体声或多声道解码的资源相比用于单声道解码的资源减少，因此当编码音频信号是编码单声道信号时，处理器具有足以用于使用第二非谐波带宽扩展模式和使用第一谐波带宽扩展模式对编码音频信号进行解码的存储器和处理资源。因此，可用资源取决于比特流配置，即工具组合、采样率等。例如，资源足以用于使用谐波BWE对单声道比特流进行解码，但是处理器缺少用于使用谐波BWE对立体声比特流进行解码的资源。

附图说明

随后，在附图的上下文中讨论优选实施例，在附图中：

图1a示出了用于使用受限资源处理器对编码音频信号进行解码的装置的实施例；

图1b示出了用于两种带宽扩展模式的编码音频信号数据的示例；

图1c示出了表格，该表格示出了USAC标准解码器和新式解码器；

图2示出了用于实现图1a的控制器的实施例的流程图；

图3a示出了具有公共带宽扩展有效载荷数据和附加谐波带宽扩展数据的编码音频信号的另一结构；

图3b示出了用于修改标准的非谐波带宽扩展模式的控制器的实现；

图3c示出了控制器的另一实现；

图4示出了用于改进的非谐波带宽扩展模式的实现；

图5示出了处理器的优选实现；

图6示出了针对单声道要素的解码过程的语法；

图7a和7b示出了针对声道对要素的解码过程的语法；

图8a示出了用于改进的非谐波带宽扩展模式的另一实现；

图8b示出了图8a中指示的数据的总结；

图8c示出了由控制器执行的非谐波带宽扩展模式的改进的另一实现；

图8d示出了修补缓冲区和对修补缓冲区的内容的偏移；以及

图9示出了对非谐波带宽扩展模式的优选修改的解释。

具体实施方式

图1a示出了用于对编码音频信号进行解码的装置的实施例。编码音频信号包括指示第一谐波带宽扩展模式或第二非谐波带宽扩展模式的带宽扩展控制数据。在线路101上向输入接口100中输入编码音频信号。输入接口经由线路108连接到受限资源处理器102。此外，提供控制器104，其至少可选地经由线路106连接到输入接口100，并附加地经由线路110连接到处理器102。处理器102的输出是在112处指示的解码音频信号。输入接口100被配置为接收编码音频信号，该编码音频信号包括指示第一谐波带宽扩展模式或第二非谐波带宽扩展模式用于编码部分(例如，编码音频信号的帧)的带宽扩展控制数据。处理器102被配置为仅使用第二非谐波带宽扩展模式对音频信号进行解码，如图1a中接近线路110所指示的。这是由控制器104来确保的。控制器104被配置为即使在带宽扩展控制数据指示第一谐波带宽扩展模式用于编码音频信号的情况下，也控制处理器102使用第二非谐波带宽扩展模式对音频信号进行解码。

图1b示出了数据流或比特流内编码音频信号的优选实现。编码音频信号包括整个音频项的报头114，且整个音频项被组织为若干帧，例如帧1116、帧2118和帧3120。每个帧附加地具有相关联的报头，例如帧1的报头1116a和帧1的有效载荷数据116b。此外，第二帧118同样具有报头118a和有效载荷数据118b。类似地，第三帧120同样具有报头120a和有效载荷数据块120b。在USAC标准中，报头114具有标志(flag)“harmonicSBR”。如果该标志harmonicSBR为零，则使用如USAC标准中定义的非谐波带宽扩展模式对整个音频项进行解码，在该上下文中，其引用回作为ISO/IEC 1449-3：2009音频部分的高效-AAC标准(HE-AAC)。然而，如果harmonicSBR标志具有值1，则启用谐波带宽扩展模式，但然后可以针对每个帧通过单独的标志sbrPatchingMode来发信号通知谐波带宽扩展模式，该单独的标志sbrPatchingMode可以是0或1。在该上下文中，参考指示了两个标志的不同值的图1c。从而，当标志harmonicSBR为1且标志sbrPatchingMode为0，则USAC标准解码器执行谐波带宽扩展模式。然而在图1c中130处指示的该情况下，图1a的控制器104用于控制处理器102执行非谐波带宽扩展模式。

图2示出了该发明过程的优选实施方式。在步骤200中，用于解码的装置内的输入接口100或任何其他实体从编码音频信号中读取带宽扩展控制数据，且该带宽扩展控制数据可以是每帧一个指示，或者是每项的附加指示(如果提供了这样的附加指示)，如在图1b的上下文中针对USAC标准所讨论的。在步骤202中，处理器102接收带宽扩展控制数据并在图1a的处理器102内实现的特定控制寄存器中存储带宽扩展控制数据。然后，在步骤204中，控制器104访问该处理器控制寄存器，并如206处所示，使用指示非谐波带宽扩展的值来改写控制寄存器。这在图6中600处的单声道要素的USAC语法中示例性示出，或者在图7a中步骤700和图7b中步骤702、704处分别指示的sbr_channel_pair_element(SBR声道对要素)的USAC语法中示例性示出。具体地，如图2的框206中示出的“改写”可以通过在USAC语法中插入行600、700、702、704来实现。具体地，图6的其余部分对应于ISO/IEC DIS 23003-3的表41，且图7a、7b对应于ISO/IEC DIS 23003-3的表42。该国际标准以全文引用的方式并入此处。在该标准中，给出了图6和图7a、7b中所有参数/值的详细定义。

具体地，600、700、702、704处指示的高级语法中的附加行指示了：不考虑602中从比特流读取的值sbrPatchingMode，而是将sbrPatchingMode标志设为1，即向解码器中的另一进程发信号通知要执行非谐波带宽扩展模式。重要的是，语法行600被放在604处指示的解码器侧读入由sbrOversampllingFlag、sbrPitchInBinsFlag和sbrPitchInBins构成的特定谐波带宽扩展数据之后。从而，如图6所示，且在图7a中类似地，编码音频信号包括针对两种带宽扩展模式(即，非谐波带宽扩展模式和谐波带宽扩展模式)的公共带宽扩展有效载荷数据606，以及附加地包括604处示出的专用于谐波带宽扩展模式的数据。这稍后将在图3a的上下文中讨论。变量“lpHBE”示出了该发明过程，即作为非谐波带宽扩展模式的“低功率谐波带宽扩展”模式，但是具有稍后将针对“谐波带宽扩展”来讨论的附加修改。

优选地，如图1a所指示，处理器102是受限资源处理器。具体地，受限资源处理器102具有足以用于使用第二非谐波带宽扩展模式对音频信号进行解码的处理资源和存储器资源。然而，该存储器或处理资源具体地不足以用于使用第一谐波带宽扩展模式对编码音频信号进行解码。如图3a所指示，帧包括报头300、公共带宽扩展有效载荷数据302、附加谐波带宽扩展数据304(例如，与音调有关的信息、谐波网格等)，以及附加地包括编码核心数据306。然而数据项的顺序可以与图3a不同。在不同的优选实施例中，编码核心数据是第一个。然后，具有sbrPatchingMode标志/比特的报头300之后是附加的HBE数据304，且最后是公共BW扩展数据302。

在USAC示例中，如在图6的上下文中讨论的，附加谐波带宽扩展数据是项604，由7比特构成的sbrPitchInBins信息。具体地，如USAC标准中指示的，数据sbrPitchInBins控制在SBR谐波变调器中添加叉积(cross-product)项。sbrPitchInBins是在范围0到127中的整数值，并表示针对在核心编码器的采样频率上动作的1536-DFT的频率区间中测量的距离。具体地，已经发现通过使用sbrPitchInBins信息，可以确定音调或谐波网格。这在图8b的公式(1)中示出。为了计算谐波网格，计算sbrPitchInBins和sbrRatio(SBR比率)的值，其中，SBR比率可以如上面图8b中指示的一样。

自然地，在比特流中可以包括对谐波网格、音调或定义谐波网格的基音的其他指示。该数据用于控制第一谐波带宽扩展模式，且在本发明的一个实施例中可以被丢弃，使得执行没有任何修改的非谐波带宽扩展模式。然而在其他实施例中，使用如图3b和其它附图中示出的用于谐波带宽扩展模式的控制数据来修改直接的非谐波带宽扩展模式。换言之，编码音频信号包括用于第一谐波带宽扩展模式和第二非谐波带宽扩展模式的公共带宽扩展有效载荷数据302以及用于第一谐波带宽扩展模式的附加有效载荷数据304。在该上下文中，图1所示的控制器104被配置为：与没有任何修改的第二非谐波带宽扩展模式下的修补操作相比，将附加有效载荷数据用于控制处理器102来修改由处理器执行的修补操作。为此，优选的是处理器102包括图3b所示的修补缓冲区，且缓冲区的具体实现是针对图8d来示例解释的。

在另一实施例中，用于第一谐波带宽扩展模式的附加有效载荷数据304包括与编码音频信号的谐波特性有关的信息，且该谐波特性可以是sbrPitchInBins数据、其他谐波网格数据、基音数据或任何其他数据，根据这些数据可以导出编码音频信号的对应部分的谐波网格或基音或音调。控制器104被配置为修改由处理器102使用的修补缓冲区的修补缓冲区内容，以在对编码音频信号进行解码时执行修补操作，使得修补信号的谐波特性比在不修改修补缓冲区的情况下修补的信号更接近该谐波特性。

为此，参考图9，其在900处示出了具有在谐波网格k·f₀上的谱线的原始频谱，且谐波线从1延伸至N。此外，在本示例中，基音f₀等于3，使得谐波网格包括所有3的倍数。此外，项902指示了修补之前的解码核心频谱。具体地，交叉频率x0在16处指示，且修补源被指示为从频率线4延伸至频率线10。修补源开始和/或停止频率优选地在编码音频信号中发信号通知，通常作为图3a的公共带宽扩展有效载荷数据302内的数据。项904指示了与项902中相同的情况，但是具有906处附加计算的谐波网格k·f₀。此外，指示了修补目标908。在图3a的公共带宽扩展有效载荷数据302中优选地附加包括该修补目标。从而，修补源指示了如903处指示的源范围的较低频率，且修补目标指示了修补目标的较低边界。如果典型地如910所指示应用非谐波修补，则将看到在经修补的数据的音调线或谐波线与计算出的谐波网格906之间将存在失配。从而，传统SBR修补或直接的USAC或高效AAC非谐波修补模式插入了具有伪(false)谐波网格的修补。为了处理该问题，对该直接非谐波修补的修改由处理器来执行。一种修改方式是旋转修补缓冲区的内容，或换言之，是在修补频段内移动谐波线，但是不改变谐波线的频率上的距离。将修补的谐波网格与修补之前的解码频谱的计算出的谐波网格加以匹配的其他方式对于本领域技术人员是清楚的。在本发明的该优选实施例中，不简单地丢弃与公共带宽扩展有效载荷数据一起被包括在编码音频信号中的附加谐波带宽扩展数据，而是将其加以重用，以通过修改通常在比特流中信号通知的非谐波带宽扩展模式来进一步增强音频质量。然而，由于经修改的非谐波带宽扩展模式依然是依赖于将相邻频率区间的集合向上复制到相邻频率区间的集合中的操作的非谐波带宽扩展模式，与执行直接的非谐波带宽扩展模式相比，该过程不导致附加的存储器资源量，但由于图9中在912处指示的匹配谐波网格而显著增强了经重构的信号的音频质量。

图3c示出了由图3b的控制器104执行的优选实施方式。在步骤310中，控制器104根据附加谐波带宽扩展数据来计算谐波网格，且为此可以执行任何计算，但是在USAC的上下文中，执行图8b中公式(1)。此外，在步骤312中，确定修补源频段和修补目标频段，即，这基本上可以包括从公共带宽扩展数据中读取修补源数据903和修补目标数据908。然而在其他实施例中，该数据可以是预定义的，且因此对于解码器来说可以是已知的，且不一定必须发送该数据。

在步骤314中，在频率边界内修改修补源频段，即与发送数据相比，不改变修补源的修补边界。这要么可以在修补之前进行，即，在修补数据关于902处指示的修补之前的核心或解码频谱时，要么在已经将修补内容变调到较高频率范围中时进行，即如图9中910和912处所示，其中，在修补之后执行旋转，其中，由箭头914对修补加以符号表示。

通过将包括六个频率增量在内的修补源的宽度与目标范围中的相同六个频率增量(即，在910或912处)进行比较，该修补914或“向上复制”是可以在图9中看到的非谐波修补。

以下述方式来执行该修改：在修补之后，在与谐波网格相一致的目标频率部分中定位修补源频段中与谐波网格相一致的频率部分。

优选地，如图8d所示，在处理器102内提供在三个不同状态828、830、832处指示的修补缓冲区。处理器被配置为加载图4中400所指示的修补缓冲区。然后，控制器被配置为使用附加带宽扩展数据和公共带宽扩展数据来计算402缓冲区偏移值。然后，在步骤404中，将缓冲区内容偏移计算出的缓冲区偏移值。项830指示了将偏移值计算为“-2”时的情况，且项832指示了在步骤404中计算出偏移值2且在步骤404中已执行了偏移+2的缓冲区状态。然后，如图4的406所示，使用经偏移的修补缓冲区内容来执行修补，且该修补仍然以非谐波方式来执行。然后，在步骤408中，使用公共带宽扩展数据来修改修补结果。根据高效AAC或USAC所已知的，这种附加使用的公共扩展带宽数据可以是频谱包络数据、噪声数据、与特定谐波线相关的数据、逆向滤波数据等。

为此，参考图5，其示出了图1a的处理器102的更详细的实现。处理器通常包括核心解码器500、具有修补缓冲区的修补器502、修补修改器504和组合器506。核心解码器被配置为对编码音频信号进行解码，以获得图9中902所示的修补之前的解码频谱。然后，具有修补缓冲区的修补器502执行图9中的操作914。如在图9的上下文中所讨论的，修补器502在修补之前或之后执行对修补缓冲区的修改。修补修改器504最终使用附加带宽扩展数据来修改修补结果，如图4中408所概述的。然后，可以作为例如具有合成滤波器组形式的频域组合器的组合器506将修补修改器504的输出和核心解码器500的输出(即低频段信号)加以组合，以最终获得在图1a的线112处输出的经带宽扩展的音频信号。

如已经在图1b的上下文中讨论的，带宽扩展控制数据可以包括音频项的第一控制数据实体，例如图1b中示出的harmonicSBR，其中，该音频项包括多个音频帧116、118、120。第一控制数据实体指示第一谐波带宽扩展模式对于多个帧是否激活。此外，提供第二控制数据实体，对应于在USAC标准中示例的SBR修补模式，其在各个帧的报头116a、118a、120a中每一个报头中提供。

图1a的输入接口100被配置为读取音频项的第一控制数据和多个帧中每个帧的第二控制数据实体，以及图1a的控制器104被配置为控制处理器102使用第二非谐波带宽扩展模式对音频信号进行解码，而不考虑第一控制数据实体的值，且不考虑第二控制数据实体的值。

在本发明的实施例中，且如图6和图7a、7b所示，USAC解码器被迫跳过相对高度复杂的谐波带宽扩展计算。从而，如果在600和700、702、704处指示的标志lpHBE被设置为非零值，则进行带宽扩展或“低功率HBE”。取决于可用的硬件资源，解码器可以个别设置1pHBE标志。零值意味着解码器将完全符合标准的方式来行动，即如图1b的第一和第二控制数据实体所指示的那样。然而，如果值为1，则即使在发信号通知谐波带宽扩展模式时，处理器也将执行非谐波带宽扩展模式。

从而，本发明提供了要求较低计算复杂度和较低存储器消耗的处理器连同新式解码过程。如[1]中定义的eSBR的比特流语法分享了HBE[1]和传统SBR解码[2]这二者的公共基础。然而在HBE的情况下，将附加信息编码到比特流中。本发明的优选实施例中的“低复杂度HBE”解码器根据[1]对USAC编码数据进行解码，并丢弃所有的HBE专用信息。然后剩余的eSBR数据被馈送到传统SBR[2]算法并由传统SBR[2]算法加以解释，即该数据用于应用向上复制修补[2]，而不是谐波变调。对eSBR解码机制的修改是关于图6和7a、7b所示的语法改变的。此外，在优选实施例中，对特定HBE信息加以重复使用，例如，由比特流携带的sbrPitchInBins信息。

对于传统的USAC编码比特流数据，可能在USAC帧内发送sbrPitchInBins值。该值反映了由编码器确定的用于发送描述当前USAC帧的谐波结构的信息的频率值。为了在不使用标准HBE功能的情况下利用该值，应当逐步骤地应用以下发明方法：

1、从比特流中提取sbrPitchInBins

针对如何从USAC比特流[1]中提取比特流要素sbrPitchInBins，分别参见表44和表45。

2、根据公式(1)来计算谐波网格

公式(1)

3、计算源修补开始子频段和目标修补开始子频段这二者到谐波网格的距离

图8a中的流程图给出了对如何计算开始和停止修补到谐波网格的距离的发明算法的详细描述。

随后，更详细地讨论图8b。优选地，该控制(即整个计算)在图1a的控制器104中执行。在步骤800中，如图8b所示，根据公式(1)来计算谐波网格。然后，确定谐波网格hg是否低于2。如果不是这种情况，则控制进行至步骤810。然而当确定谐波网格低于2，则步骤804确定源频段值是偶数。如果是这种情况，则将谐波网格确定为2，但是如果不是这种情况，则将谐波网格确定为等于3。然后，在步骤810中，执行模计算。在步骤812中，确定两个模计算是否不同。如果结果相同，过程结束，且如果结果不同，则如框814所指示，将偏移值计算为两个模计算结果之差。然后，同样如步骤814所指示，执行具有环回的缓冲区偏移。值得注意的是：当应用偏移时，优选地要考虑相位旋转。控制在框816中停止。

总而言之，如图8c所示，整个过程包括如820所指示的从比特流中提取sbrPitchInBins信息的步骤。然后，如822处所指示的，控制器计算谐波网格。然后，在步骤824中，计算源开始子频段和目标开始子频段到谐波网格的距离，其在优选实施例中对应于步骤810。最终，如框826中所指示，QMF缓冲区偏移，即执行高效AAC非谐波带宽扩展的QMF域中的环回偏移。

在QMF缓冲区偏移中，即使已执行了非谐波带宽扩展过程，也根据已发送的sbrPitchInBins来重构信号的谐波结构。

虽然已经在用于编码或解码的装置的上下文中描述了一些方案，但是将清楚的是：这些方案还表示对相应方法的描述，其中，框或设备对应于方法步骤或方法步骤的特征。类似地，在方法步骤的上下文中描述的方案也表示对相应块或项或者相应装置的特征的描述。可以由(或使用)硬件装置(诸如，微处理器、可编程计算机或电子电路)来执行一些或全部方法步骤。在一些实施例中，可以由这种装置来执行最重要方法步骤中的某一个或多个方法步骤。

取决于某些实现要求，可以在硬件中或在软件中实现本发明的实施例。可以通过使用其上存储有电子可读控制信号的数字存储介质(例如，软盘、硬盘驱动器(HDD)、DVD、Blu-Ray、CD、ROM、PROM和EPROM、EEPROM或闪存)来执行实现，该电子可读控制信号与可编程计算机系统合作(或能够与之合作)，使得执行各个方法。因此，数字存储介质可以是计算机可读的。

根据本发明的一些实施例包括具有电子可读控制信号的数据载体，该电子可读控制信号能够与可编程计算机系统协作从而执行本文所述的方法之一。

通常，本发明的实施例可以实现为具有程序代码的计算机程序产品，程序代码可操作以在计算机程序产品在计算机上运行时执行方法之一。程序代码可以例如存储在机器可读载体上。

其他实施例包括存储在机器可读载体上的计算机程序，该计算机程序用于执行本文所述的方法之一。

换言之，本发明方法的实施例因此是具有程序代码的计算机程序，该程序代码用于在计算机程序在计算机上运行时执行本文所述的方法之一。

因此，本发明方法的另一实施例是其上记录有计算机程序的数据载体(或者数字存储介质或计算机可读介质)，该计算机程序用于执行本文所述的方法之一。数据载体、数字存储介质或记录介质通常是有形的及/或非暂时性的。

因此，本发明方法的另一实施例是表示用于执行本文所述的方法之一的计算机程序的数据流或一系列信号。数据流或信号序列可以例如被配置为经由数据通信连接(例如，经由互联网)传输。

另一实施例包括处理装置，例如，配置为或适用于执行本文所述的方法之一的计算机或可编程逻辑器件。

另一实施例包括其上安装有计算机程序的计算机，该计算机程序用于执行本文所述的方法之。

根据本发明的另一实施例包括被配置为向接收机(例如，以电子方式或以光学方式)传输计算机程序的装置或系统，该计算机程序用于执行本文所述的方法之一。接收机可以是例如计算机、移动设备、存储设备等。该装置或系统可以例如包括用于向接收机传输计算机程序的文件服务器。

在一些实施例中，可编程逻辑器件(例如，现场可编程门阵列)可以用于执行本文所述的方法的一些或全部功能。在一些实施例中，现场可编程门阵列可以与微处理器协作以执行本文所述的方法之一。通常，方法优选地由任意硬件装置来执行。

上述实施例对于本发明的原理仅是说明性的。应当理解的是：本文所述的布置和细节的修改和变形对于本领域其他技术人员将是显而易见的。因此，旨在仅由所附专利权利要求的范围来限制而不是由借助对本文的实施例的描述和解释所给出的具体细节来限制。

参考文献

[1]ISO/IEC 23003-3：2012：“统一语音和音频编码”

[2]ISO/IEC 14496-3：2009：“音频”

[3]ISO/IEC JTCI/SC29/WG11 MPEG2011/N12232：“USAC验证测试报告”

Claims

1.一种用于对编码音频信号(101)进行解码的装置，所述编码音频信号(101)包括指示第一谐波带宽扩展模式或第二非谐波带宽扩展模式的带宽扩展控制数据，所述装置包括：

输入接口(100)，用于接收包括指示第一谐波带宽扩展模式或第二非谐波带宽扩展模式的带宽扩展控制数据在内的编码音频信号(101)；

处理器(102)，用于使用第二非谐波带宽扩展模式对编码音频信号(101)进行解码；以及

控制器(104)，用于即使在带宽扩展控制数据指示第一谐波带宽扩展模式用于编码音频信号(101)的情况下，也控制处理器(102)使用第二非谐波带宽扩展模式对编码音频信号(101)进行解码。

2.根据权利要求1所述的装置，其中，处理器(102)具有足以用于使用第二非谐波带宽扩展模式对编码音频信号(101)进行解码的存储器和处理资源，其中，所述存储器或所述处理资源不足以用于使用第一谐波带宽扩展模式对编码音频信号(101)进行解码。

3.根据权利要求1所述的装置，

其中，所述输入接口(100)被配置为读取所述带宽扩展控制数据，以确定要使用第一谐波带宽扩展模式还是第二非谐波带宽扩展模式对所述编码音频信号(101)进行解码，以及在处理器控制寄存器中存储所述带宽扩展控制数据，以及

所述控制器(104)被配置为：访问所述处理器控制寄存器，以及当所述输入接口(100)已存储了指示第一谐波带宽扩展模式的值时，用指示第二非谐波带宽扩展模式的值来改写所述处理器控制寄存器中的值。

4.根据权利要求1所述的装置，其中，所述编码音频信号(101)包括用于所述第一谐波带宽扩展模式和所述第二非谐波带宽扩展模式的公共带宽扩展有效载荷数据(302)以及仅用于所述第一谐波带宽扩展模式的附加有效载荷数据(304)，以及

所述控制器(104)被配置为：与所述第二非谐波带宽扩展模式下的修补操作相比，将所述附加有效载荷数据(304)用于控制所述处理器(102)来修改由所述处理器执行的修补操作，其中，经修改的修补操作是非谐波修补操作。

5.根据权利要求4所述的装置，

其中，所述附加有效载荷数据(304)包括与所述编码音频信号(101)的谐波特性有关的信息，以及

所述控制器(104)被配置为修改由所述处理器(102)使用的修补缓冲区的修补缓冲区内容(828、830、832)，以在对所述编码音频信号(101)进行解码时执行修补操作，使得经修补的信号的谐波特性比在不修改所述修补缓冲区内容的情况下的经修补的信号的谐波特性更接近所述谐波特性。

6.根据权利要求4所述的装置，

其中，所述控制器(104)被配置为：

根据所述附加有效载荷数据来计算(310)指示音调频率的谐波网格，

确定(312)用于具有频率边界的修补源频段和具有频率边界的修补目标频段的修补源信息和修补目标信息；以及

在修补(914)操作之前或之后修改(314)所述频率边界内的所述修补源频段内的数据，使得在修补(914)之后，在与所述谐波网格相一致的目标频率部分(912)中定位所述修补源频段中与所述谐波网格相一致的频率部分。

7.根据权利要求4所述的装置，

其中，所述处理器(102)包括修补缓冲区，

其中，所述处理器被配置为使用所述公共带宽扩展有效载荷数据来加载(400)所述修补缓冲区，

所述控制器被配置为使用附加带宽扩展数据(304)来计算(402)缓冲区偏移值，所述附加带宽扩展数据使用修补源频段信息(903)和修补目标频段信息(908)来指示所述编码音频信号(101)的谐波网格，

其中，所述控制器被配置为引起(404)针对缓冲区内容的缓冲区偏移操作；以及

所述处理器(102)被配置为使用被偏移了所述缓冲区偏移值的缓冲区内容来生成(406、408)经修补的数据。

8.根据权利要求7所述的装置，其中，所述控制器被配置为：引起(404)具有环回的缓冲区偏移操作。

9.根据权利要求1所述的装置，

其中，所述处理器包括：

核心解码器(500)，用于对核心编码音频信号(902)进行解码；

修补器(502)，用于根据非谐波带宽扩展模式，使用来自编码音频信号(101)的带宽扩展数据将所述核心编码音频信号(902)的源频率区域修补为目标频率区域；以及

修补修改器(504)，用于使用来自所述编码音频信号(101)的带宽扩展数据来修改所述目标频率区域中的经修补的信号。

10.根据权利要求1所述的装置，

其中，所述带宽扩展控制数据包括：包括多个音频帧在内的音频项的第一控制数据实体(114)和所述编码音频信号(101)的每个帧的第二控制数据实体(116a、118a、120a)，所述第一控制数据实体指示所述第一谐波带宽扩展模式对于所述多个帧是激活的还是非激活的，所述第二控制数据实体(116a、118a、120a)指示所述第一谐波带宽扩展模式对于所述编码音频信号(101)的每个单独的帧是激活的还是非激活的，

所述输入接口(100)被配置为读取所述音频项的所述第一控制数据实体和所述多个帧中每个帧的所述第二控制数据实体，以及

所述控制器(104)被配置为控制所述处理器(102)使用所述第二非谐波带宽扩展模式对所述编码音频信号(101)进行解码，而不考虑所述第一控制数据实体的值且不考虑所述第二控制数据实体的值。

11.根据权利要求1所述的装置，

其中，所述编码音频信号(101)是USAC标准所定义的比特流，

所述处理器(102)被配置为执行所述USAC标准所定义的所述第二非谐波带宽扩展模式，以及

所述输入接口被配置为根据所述USAC标准对包括所述编码音频信号(101)在内的比特流进行解析。

12.根据权利要求1所述的装置，其中，所述处理器(102)具有足以用于使用第二非谐波带宽扩展模式对编码音频信号(101)进行解码的存储器和处理资源，其中，当所述编码音频信号(101)是编码立体声或多声道音频信号时，所述存储器或处理资源不足以用于使用第一谐波带宽扩展模式对编码音频信号(101)进行解码，以及

当所述编码音频信号(101)是编码单声道信号时，所述处理器(102)具有足以用于使用第二非谐波带宽扩展模式和使用第一谐波带宽扩展模式对编码音频信号(101)进行解码的存储器和处理资源。

13.一种对包括指示第一谐波带宽扩展模式或第二非谐波带宽扩展模式的带宽扩展控制数据在内的编码音频信号(101)进行解码的方法，包括：

接收(100)包括指示第一谐波带宽扩展模式或第二非谐波带宽扩展模式的带宽扩展控制数据在内的编码音频信号(101)；

使用第二非谐波带宽扩展模式对编码音频信号(101)进行解码(102)；以及

控制(104)对所述编码音频信号(101)的解码，使得即使所述带宽扩展控制数据指示所述第一谐波带宽扩展模式用于所述编码音频信号(101)，在解码中也使用所述第二非谐波带宽扩展模式。

14.一种存储有计算机程序的计算机存储介质，用于在计算机上运行时执行根据权利要求13所述的对编码音频信号(101)进行解码的方法。