CN113544773A

CN113544773A - 用于包括全丢帧隐藏和部分丢帧隐藏的lc3隐藏的解码器和解码方法

Info

Publication number: CN113544773A
Application number: CN202080014143.1A
Authority: CN
Inventors: 阿德里安·托马舍克; 拉尔夫·施佩尔施奈德; 扬·比特; 康拉德·本多夫; 马丁·迪茨; 马库斯·施内尔; 马克西米利安·施莱格尔
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2019-02-13
Filing date: 2020-02-12
Publication date: 2021-10-22
Also published as: AU2020221602A1; TW202044231A; US20210366498A1; EP3925103A1; EP4239924A2; MX2021009728A; CN113490981A; TW202044779A; AU2023226770A1; SG11202108672XA; JP7358490B2; TWI745862B; TWI748339B; MX2021009729A; KR20210125534A; KR20230098370A; AU2020220383B2; CA3231339A1; AU2023204176A1; EP3924963A1

Abstract

图1示出根据实施例的用于对当前帧进行解码以重构音频信号的解码器(100)。音频信号在当前帧内被编码。当前帧包括当前比特流有效载荷。当前比特流有效载荷包括多个有效载荷比特。多个有效载荷比特对音频信号的频谱的多条谱线进行编码。有效载荷比特中的每一个呈现在当前比特流有效载荷内的位置。解码器(100)包括解码模块(110)和输出接口(120)。解码模块(110)被配置成重构音频信号。输出接口(120)被配置成输出音频信号。解码模块(110)包括错误隐藏模式，其中，如果解码模块(110)处于所述错误隐藏模式，则解码模块(110)被配置成通过对音频信号的频谱的那些谱线进行错误隐藏来重构音频信号，这些谱线呈现大于阈值频率的频率。和/或，如果解码模块(110)进行错误隐藏，则解码模块(110)被配置成以取决于当前帧之前的先前帧的先前比特流有效载荷是否对音频信号的作为调性或谐波的信号分量进行编码的方式进行错误隐藏。

Description

用于包括全丢帧隐藏和部分丢帧隐藏的LC3隐藏的解码器和解码方法

技术领域

本发明涉及一种用于包括全丢帧隐藏和部分丢帧隐藏的LC3丢帧隐藏的解码器和解码方法。

背景技术

基于变换的音频编解码器依赖于音频帧频谱的编码表示。这种频谱由多条谱线组成。由于各种原因，一些或甚至所有谱线在解码器端可能不可用。频域中的音频错误隐藏概念例如可以提供减轻由此类缺失谱线引起的伪影的方法。常见的方法是找到尽可能好的缺失谱线的替代品。

在现有技术中，可以使用各种丢帧隐藏技术。

例如在[1]中讨论了频域中的丢帧隐藏概念，其中特别提到了静音、重复、噪声替代和预测。那些技术总是与淡出过程相结合，从而通常在几个丢帧上使信号朝向零或朝向某种背景噪音/舒适噪音渐变。

在[2]中，根据频带中的能量提出了不同的频带衰减因子：例如，可以对能量高于阈值的频带应用较大的衰减因子，可以对能量低于阈值的频带应用较小的衰减因子。此外，在[2]中，观察到最后良好帧的能量进展，如果最后良好帧中的能量小于倒数第二良好帧，则应用较强的衰减。

此外，信号的频谱形状还可以朝向某种常见形状渐变。这种方法特别用于基于线性预测编码(LPC)的编解码器，例如EVS(增强型语音服务)，其中LPC系数被混合到一些提供的平均系数。

发明内容

本发明的目的是提供改进的错误隐藏的构思。通过根据权利要求1所述的解码器、根据权利要求39所述的方法和根据权利要求40所述的计算机程序来解决本发明的目的。

提供了一种用于对当前帧进行解码以重构音频信号的解码器。音频信号在当前帧内被编码。当前帧包括当前比特流有效载荷。当前比特流有效载荷包括多个有效载荷比特。多个有效载荷比特对音频信号的频谱的多条谱线进行编码。有效载荷比特中的每一个呈现在当前比特流有效载荷内的位置。解码器包括解码模块和输出接口。解码模块被配置成重构音频信号。输出接口被配置成输出音频信号。解码模块包括错误隐藏模式，其中，如果解码模块处于所述错误隐藏模式，则解码模块被配置成通过对音频信号的频谱的如下谱线进行错误隐藏来重构音频信号：所述谱线呈现大于阈值频率的频率。和/或，如果解码模块进行错误隐藏，则解码模块被配置成以取决于当前帧之前的先前帧的先前比特流有效载荷是否对音频信号的作为调性或谐波的信号分量进行编码的方式进行错误隐藏。

此外，提供了一种对当前帧进行解码以重构音频信号的方法。音频信号在当前帧内被编码，其中当前帧包括当前比特流有效载荷，其中当前比特流有效载荷包括多个有效载荷比特。多个有效载荷比特对音频信号的频谱的多条谱线进行编码。有效载荷比特中的每一个呈现在当前比特流有效载荷内的位置。该方法包括：

重构音频信号，其中，在错误隐藏模式中，通过对音频信号的频谱中的如下谱线进行错误隐藏来进行重构音频信号：所述谱线呈现大于阈值频率的频率；和/或，如果进行错误隐藏，则以取决于当前帧之前的先前帧的先前比特流有效载荷是否对音频信号的作为调性或谐波的信号分量进行编码的方式进行错误隐藏；以及

-输出音频信号。

此外，提供了一种用于在计算机或信号处理器上执行时实现上述方法的计算机程序。

在一些情况下，例如，如果整个帧丢失或被标记为无效，或者-即使部分频谱可用-如果全丢帧隐藏被认为是可能的最好的错误隐藏策略，则错误隐藏构思可以应用于整个帧。

然而，在其他情况下，如果部分频谱可用，则错误隐藏技术可以例如仅应用于帧的一部分。

部分频谱可用的情况例如可能出现在可缩放编码中，例如AAC可缩放、AAC SLS或BSAC，其中一些层被接收，但其他层未被接收(AAC＝高级音频编码，SLS＝可扩展到无损，BSAC＝比特切片算术编码)。

或者，部分频谱可以例如在冗余帧编码中可用，其中丢帧的冗余低质量副本可用，即在VoIP或VoLTE背景下(例如参见[3]和[4]以获得有关VoIP和VoLTE中的稳健性和错误恢复能力的更多信息；VoIP＝IP语音/互联网协议语音；VoLTE＝LTE语音/长期演进的语音)。

或者，部分频谱可以例如在进行选择性错误检测时可用，例如在AAC中，对缩放因子数据使用RVLC(可逆可变长度编码)，其中某些缩放因子可能被检测到损坏，导致一定数量的损坏谱线；或者，例如，在用于DECT(数字增强型无电线电信)的LC3中，其中可以单独检测部分频谱(表示心理声学上不太重要的频谱范围)的编码表示中的错误。

附图说明

下面结合附图对本发明的实施例进行更详细的描述，其中：

图1示出了根据实施例的用于对当前帧进行解码以重构音频信号的音频信号部分的解码器。

图2示出了根据特定实施例的解码模块。

图3示出了根据用于干净信道解码的实施例的解码模块概览。

图4示出了根据用于全丢帧隐藏的实施例的解码模块概览。

图5示出了根据用于部分丢帧隐藏的实施例的解码模块概览。

图6示出了根据实施例的衰落函数，该衰落函数取决于一行中丢帧的数量，并且还取决于帧长度。

图7示出了根据实施例的用于符号加扰的阈值，该阈值取决于一行中丢帧的数量，并且还取决于帧长度。

图8示出了根据实施例的能量阈值因子，该能量阈值因子取决于一行中丢帧的数量，并且还取决于帧长度。

图9示出了根据实施例的非线性衰减，该非线性衰减取决于一行中丢帧的数量。

具体实施方式

图1示出了根据实施例的用于对当前帧进行解码以重构音频信号的解码器100。

音频信号在当前帧内被编码。当前帧包括当前比特流有效载荷。当前比特流有效载荷包括多个有效载荷比特。多个有效载荷比特对音频信号的频谱的多条谱线进行编码。有效载荷比特中的每一个呈现在当前比特流有效载荷内的位置。

解码器100包括解码模块110和输出接口120。

解码模块110被配置成重构音频信号。

输出接口120被配置成输出音频信号。

解码模块110包括错误隐藏模式，其中，如果解码模块110处于所述错误隐藏模式，则解码模块110被配置成通过对音频信号频谱的如下谱线进行错误隐藏来重构音频信号：所述谱线呈现大于阈值频率的频率。

和/或，如果解码模块110进行错误隐藏，则解码模块110被配置成以取决于当前帧之前的先前帧的先前比特流有效载荷是否对音频信号的作为调性(tonal)或谐波的信号分量进行编码的方式进行错误隐藏。

在一些实施例中，如果当前帧的当前比特流有效载荷包括不可纠正的错误和/或如果当前帧丢失，则解码模块可以例如处于所述错误隐藏模式。如果在解码器100已经进行纠正之后仍然存在错误；或者，如果当前比特流有效载荷包括错误并且根本不进行纠正，则当前比特流有效载荷可以例如包括不可纠正的错误。包括不可纠正错误的帧可以例如被称为损坏帧。

例如，根据实施例，可以例如取决于当前帧之前的所述先前帧的所述先前比特流有效载荷是否对音频信号的作为调性或谐波的所述信号分量进行编码来配置特定的错误隐藏参数。

根据实施例，先前帧可以例如是在没有以全丢帧隐藏模式进行错误隐藏的情况下已由解码模块110解码的最后接收帧。

在下文中，更详细地描述实施例。

例如，可以认为频谱被细分为可用且应使用的那些谱线，以及不可用或不应使用的那些谱线(例如，但它们可能例如可用)。

根据一些实施例，例如可以如下进行：

在一些情况下，所有谱线都可用并且应使用，因此，例如可以不进行丢帧隐藏。

在其他情况下，某些谱线可用并且应使用，并且可以例如对丢失的谱线进行部分丢帧隐藏。

在其他情况下，没有谱线可用或不应使用，并且可以例如进行全丢帧隐藏。

在下文中，描述了根据一些实施例的取决于调性的错误隐藏。

在实施例中，如果解码模块110进行错误隐藏，则解码模块110可以例如被配置成通过使用音频信号的先前频谱的多个符号进行错误隐藏来重构音频信号的当前频谱，所述多个符号在先前帧内被编码，其中解码模块110例如可以被配置成以取决于所述先前帧是否对作为调性或谐波的信号分量进行编码的方式进行错误隐藏。例如，可以例如取决于信号分量是调性还是谐波以不同方式选择用于错误隐藏的参数。

在实施例中，所述先前帧可以例如是在不进行错误隐藏的情况下已由解码模块110解码的最后接收帧。或者，所述先前帧可以例如是在没有以全丢帧隐藏模式进行错误隐藏的情况下已由解码模块110解码的最后接收帧。或者，所述先前帧可以例如是在没有以部分丢帧隐藏模式或全丢帧隐藏模式进行错误隐藏的情况下已由解码模块110解码的最后接收帧。

根据实施例，如果解码模块110进行错误隐藏，并且如果先前帧的先前比特流有效载荷对作为调性或谐波的信号分量进行编码，则解码模块110可以例如被配置成翻转(flip)先前频谱的多个符号中的一个或多个符号以重构当前频谱，其中指示先前频谱的多个符号中的符号要被解码模块110翻转以重构当前频谱的概率的百分比值p可以例如在0％≤p≤50％之间，其中解码模块110可以例如被配置成确定百分比值p。在实施例中，解码模块110可以例如采用伪随机数序列来取决于百分比值p确定先前频谱的所考虑的符号是否应该被实际翻转。

在实施例中，解码模块110可以例如被配置成取决于后续帧的数量增大百分比值p。所述后续帧的数量可以例如指示解码模块110已进行了多少后继(部分或完全)丢帧错误隐藏；或者其中所述后续帧的数量可以例如指示解码模块110已进行了多少在特定错误隐藏模式下的后续帧错误隐藏。

在实施例中，解码模块110可以例如被配置成根据取决于所述后续帧的数量的函数来确定百分比值p，所述后续帧的数量是所述函数的自变量。

根据实施例，解码模块110可以例如被配置成确定百分比值p，使得如果所述后续帧的数量小于第一阈值，则p为0％；如果所述后续帧的数量大于或等于第一阈值并且小于第二阈值，则0％≤p≤50％，并且使得如果所述后续帧的数量大于第二阈值，则p＝50％。

在实施例中，解码模块110可以例如被配置成确定百分比值p，使得百分比值p取决于后续帧的数量在第一阈值与第二阈值之间的范围内线性增大。

根据实施例，如果解码模块110进行错误隐藏，并且如果先前帧的先前比特流有效载荷未对作为调性或谐波的信号分量进行编码，则解码模块110可以例如被配置成翻转先前频谱的多个符号的50％以重构当前频谱。

在实施例中，如果解码模块110进行错误隐藏，则解码模块110可以例如被配置成取决于先前帧是否对作为调性或谐波的信号分量进行编码，通过使用音频信号的先前频谱的多个幅度进行错误隐藏来重构音频信号的当前频谱，所述多个幅度被编码在所述先前帧内。

根据实施例，如果解码模块110进行错误隐藏，则解码模块110可以例如被配置成根据非线性衰减特性对先前频谱的多个幅度进行衰减以重构当前频谱，其中非线性衰减特性取决于先前帧的先前比特流有效载荷是否对作为调性或谐波的信号分量进行编码。例如，非线性衰减特性的参数可以例如取决于信号分量是调性还是谐波以不同方式来选择。

在实施例中，如果解码模块110进行错误隐藏，并且如果先前帧的先前比特流有效载荷对作为调性或谐波的信号分量进行编码，则解码模块110可以例如被配置成取决于稳定性因子对先前频谱的多个幅度进行衰减，其中所述稳定性因子指示当前频谱与先前频谱之间的相似性；或者其中稳定性因子指示先前频谱与先前帧之前的前先前帧的前先前频谱之间的相似性。

根据实施例，所述前先前帧可以例如是在先前帧之前的在不进行错误隐藏的情况下已由解码模块110解码的最后接收帧。或者，所述前先前帧可以例如是先前帧之前的在没有以全丢帧隐藏模式进行错误隐藏的情况下已由解码模块110解码的最后接收帧(例如，倒数第二接收帧)。或者，所述前先前帧可以例如是先前帧之前的在没有以部分丢帧隐藏模式或全丢帧隐藏模式进行错误隐藏的情况下已由解码模块110解码的最后接收帧。

在实施例中，如果解码模块110被设置为进行部分丢帧隐藏，则所述稳定性因子可以例如指示当前频谱与先前频谱之间的所述相似性。如果解码模块110被设置为进行全丢帧隐藏，则所述稳定性因子可以例如指示先前频谱与前先前频谱之间的所述相似性。

根据实施例，解码模块110可以例如被配置成确定先前频谱的频谱区间(spectralbin)的能量。此外，解码模块110可以例如被配置成确定所述频谱区间的所述能量是否小于能量阈值。如果所述能量小于所述能量阈值，则解码模块110可以例如被配置成以第一衰落因子对多个幅度中的分配给所述频谱区间的幅度进行衰减。如果所述能量大于或等于所述能量阈值，则解码模块110可以例如被配置成以小于第一衰落因子的第二衰落因子对多个幅度中的分配给所述频谱区间的所述幅度进行衰减。解码模块110可以例如被配置成进行衰减，使得通过对多个幅度中的一个幅度的衰减使用较小的衰落因子，增加幅度中的所述一个幅度的衰减。

在实施例中，解码模块110可以例如被配置成确定包括先前频谱的多个频谱区间在内的频谱带的能量。解码模块110可以例如被配置成确定所述频谱带的所述能量是否小于能量阈值。如果所述能量小于所述能量阈值，则解码模块110可以例如被配置成以第一衰落因子对多个幅度中的分配给所述频谱带的所述频谱区间的幅度进行衰减。如果所述能量大于或等于所述能量阈值，则解码模块110可以例如被配置成以小于第一衰落因子的第二衰落因子对多个幅度中的分配给所述频谱带的所述频谱区间的所述幅度进行衰减。解码模块110可以例如被配置成进行衰减，使得通过对多个幅度中的一个幅度的衰减使用较小的衰落因子，增加幅度中的所述一个幅度的衰减。

根据实施例，解码模块110可以例如被配置成确定第一衰落因子，使得取决于所述后续帧的数量，第一衰落因子变得更小。此外，解码模块110可以例如被配置成确定第二衰落因子，使得取决于所述后续帧的数量，第二衰落因子变得更小。

在实施例中，解码模块110可以例如被配置成确定第一衰落因子和第二衰落因子，使得

如果当前帧是后续帧中的第一帧，

cum_fading_slow＝1，以及

cum_fading_fast＝1，

并且使得如果当前帧是后续帧中的第一帧之后的帧之一，则可以例如取决于所述后续帧的数量根据以下公式来确定第一衰落因子和第二衰落因子：

cum_fading_slow＝cum_fading_slow*slow；

cum_fading_fast＝cum_fading_fast*fast；

其中公式右侧的cum_fading_slow是先前帧的第一衰落因子(例如，在第一丢帧处初始化为1)，其中公式左侧的cum_fading_slow是当前帧的第一衰落因子，其中公式右侧的cum_fading_fast是先前帧的第二衰落因子(例如，在第一丢帧处初始化为1)，其中公式左侧的cum_fading_fast是当前帧的第二衰落因子，其中1>slow>fast>0。

根据实施例，1>slow>fast>0.3。

在实施例中，解码模块110可以例如被配置成确定所述能量阈值，使得如果所述后续帧的数量小于第三阈值，则所述能量阈值等于第一能量值；使得如果所述后续帧的数量大于或等于第三阈值且小于第四阈值，则所述能量阈值小于所述第一能量值且大于第二能量值；以及使得如果所述后续帧的数量大于第四阈值，则所述能量阈值等于所述第二能量值。

根据实施例，解码模块110可以例如被配置成确定能量阈值，使得能量阈值根据后续帧的数量在第三阈值与第四阈值之间的范围内线性减小。

对于那些不可用或不应使用的谱线，将生成替换，而–取决于先前接收信号的调性，并且，如果该信息可用，则取决于当前接收信号的调性，保留了一定程度的调性：

如果指示器指示最后良好信号是调性，则保留更多的调性。

如果指示器指示最后良好信号不是调性，则保留较少的调性。

主要由一帧内的各个区间之间的相位关系和/或后续帧的相同区间的相位关系来表示调性。

一些实施例关注于第一方面，即调性主要由一帧内的各个区间之间的相位关系来表示。

一帧内的各个区间的相位主要用它们的符号来表征，但也可以用相邻区间的幅度关系来表征。因此，幅度关系的保留以及符号的保留导致高度保留的调性。反之亦然，后续区间之间的幅度和/或符号关系改变得越多，保留的调性就越少。

现在描述根据一些实施例的符号的操纵。

根据现有技术，已知两种方法：

根据第一种方法，应用帧重复：保留来自先前频谱的符号。

在第二种方法中，进行噪声替代：相对于先前频谱对符号进行加扰；随机翻转50％的符号。

对于清音(unvoiced)信号，噪声替代提供了良好的结果。

对于浊音信号，可以反而使用帧重复，但对于更长的损失，保留的调性(在损失开始时优选)可能会变得烦人。

实施例基于以下发现：对于浊音信号，帧重复与噪声替代之间的过渡阶段是合乎需要的。

根据一些实施例，这可以例如通过随机翻转每帧一定百分比的符号来实现，其中该百分比位于0％与50％之间，并且随着时间增加。

现在，描述根据一些实施例的幅度的操纵。

在现有技术中经常使用的最简单的方法是将某个衰减因子应用于所有频率区间。该衰减因子逐帧增加，以实现平滑的淡出。淡出速度可以是固定的，或者可以取决于信号特性。通过这种方法，保留相邻区间的幅度以及整个帧的频谱形状的关系。

在现有技术中还已知的是取决于每个频带内的能量使用不同衰减因子的逐频带衰减。虽然这种方法也保留了每个频带内的相邻区间的幅度的关系，但整个帧的频谱形状是平坦的。

根据一些实施例，具有较大值的区间比具有较小值的区间衰减得更强。为此，一些实施例可以例如定义非线性衰减特性。这种非线性衰减特性可防止过冲，否则可能会发生过冲，因为在重叠相加期间不确保混叠消除，并且改变相邻区间的幅度关系，从而导致更平坦的频谱形状。为了使频谱形状平坦。一些实施例基于以下发现：如果相邻区间的幅度的比率事先高于1，则该比率应保持高于1；并且如果该比率事先低于1，该比率应保持低于1。

为了优雅地应用这种衰减，在一些实施例中，非线性特性可以例如在丢失开始时较小并且可以例如随后增加。在实施例中，其随时间的调整可以例如取决于信号的调性：根据一些实施例，对于清音信号，非线性可以例如比对于浊音信号更强。

这种非线性衰减特性影响频谱形状。在实施例中，频谱可以例如随着时间变得更平坦，这降低了在突发丢失期间恼人的合成声音伪影的机会。

在下文中，描述了根据一些实施例的部分丢帧隐藏。

根据实施例，所述错误隐藏模式可以例如是部分丢帧隐藏模式，其中，如果解码模块110处于部分丢帧隐藏模式，则解码模块110可以例如被配置成在不对频谱的多条谱线中的一条或多条第一谱线进行错误隐藏的情况下重构音频信号，所述一条或多条第一谱线呈现小于或等于阈值频率的频率，其中所述一条或多条第一谱线已由多个有效载荷比特中的第一组一个或多个有效载荷比特进行编码。此外，解码模块110可以例如被配置成通过对频谱的多条谱线中的一条或多条第二谱线进行错误隐藏来重构音频信号，所述一条或多条第二谱线呈现大于阈值频率的频率，其中所述一条或多条第二谱线已由多个有效载荷比特中的第二组一个或多个有效载荷比特进行编码。

在实施例中，解码模块110可以例如被配置成检测当前帧是否不包括对音频信号的频谱的所述一条或多条第一谱线进行编码的任何损坏比特，所述一条或多条第一谱线呈现小于或等于阈值频率的频率。此外，解码模块110可以例如被配置成检测当前帧是否包括对音频信号的频谱的所述一条或多条第二谱线进行编码的一个或多个损坏比特，所述一条或多条第二谱线呈现大于阈值频率的频率。所述一个或多个损坏比特是有效载荷比特中的失真或可能失真的一个或多个有效载荷比特。如果当前帧不包括对音频信号的频谱的所述一条或多条第一谱线进行编码的任何损坏比特，所述一条或多条第一谱线呈现小于或等于阈值频率的频率，并且如果当前帧包括对音频信号的频谱的所述一条或多条第二谱线进行编码的所述一个或多个损坏比特，所述一条或多条第二谱线呈现大于阈值频率的频率，则解码模块110可以例如被配置成在部分丢帧隐藏模式下通过对大于阈值频率的频谱的所述一条或多条第二谱线进行错误隐藏来进行错误隐藏。

根据实施例，如果当前帧不包括对音频信号的频谱的所述一条或多条第一谱线进行编码的任何损坏比特，所述一条或多条第一谱线呈现小于或等于阈值频率的频率，并且如果当前帧包括对音频信号的频谱的所述一条或多条第二谱线进行编码的所述一个或多个损坏比特，所述一条或多条第二谱线呈现大于阈值频率的频率，则所述解码模块110可以例如被配置成通过对多个有效载荷比特中的所述第一组一个或多个有效载荷比特进行解码来重构音频信号，所述第一组一个或多个有效载荷比特对音频信号的频谱的所述一条或多条第一谱线进行编码，所述一条或多条第一谱线呈现小于或等于阈值频率的频率。

在实施例中，解码模块110可以例如被配置成检测当前帧是否丢失，其中，如果解码器100已检测到当前帧丢失，则解码模块110可以例如被配置成通过对呈现大于阈值频率的频率的音频信号的频谱的所述一条或多条第二谱线进行错误隐藏来重构音频信号。此外，解码模块110可以例如被配置成在不对所述第一组进行错误隐藏的情况下，对多个有效载荷比特中的所述第一组一个或多个有效载荷比特进行解码，所述第一组一个或多个有效载荷比特对音频信号的频谱的小于或等于阈值频率的所述一个或多个第一频率的所述一条或多条第一谱线进行编码，其中多个有效载荷比特中的所述第一组一个或多个有效载荷比特是与当前帧不同的冗余帧的一个或多个有效载荷比特。

在实施例中，冗余帧可以例如是当前帧的带宽受限版本。例如，冗余帧可以例如提供在与当前帧相同的时间段内对音频信号进行编码的数据(例如，与当前帧相比减少的数据集)。该数据可以例如对于多个有效载荷比特不同，所述多个有效载荷比特对音频信号的频谱的小于或等于阈值频率的所述一个或多个第一频率的所述一条或多条第一谱线的音频信号进行编码，因为它们在当前帧的相同时间段内用比频谱的所述第一频率的当前帧少的比特进行编码。

在实施例中，如果解码模块110被配置成在全丢帧隐藏模式下进行错误隐藏，则解码模块110被配置成对(整个)频谱的所有谱线进行错误隐藏(否则可由当前帧的当前比特流有效载荷的所有有效载荷比特重构)。

根据实施例，多个有效载荷比特是多个当前有效载荷比特。如果解码模块110处于部分丢帧隐藏模式，则解码模块110可以例如被配置成使用一条或多条存储的谱线对音频信号的频谱的所述一条或多条第二谱线进行错误隐藏，所述一条或多条第二谱线呈现大于阈值频率的频率，所述一条或多条存储的谱线已由先前帧的先前比特流有效载荷的一个或多个先前有效载荷比特进行编码。

在实施例中，频谱可以例如是当前量化频谱。如果解码模块110在部分丢帧隐藏模式下进行错误隐藏，则解码模块110可以例如被配置成对音频信号的频谱的所述一条或多条第二谱线进行错误隐藏，以获得所述当前量化频谱的一条或多条中间谱线，所述一条或多条第二谱线呈现大于阈值频率的频率。

根据实施例，频谱是当前量化频谱。如果解码模块110在部分丢帧隐藏模式下进行错误隐藏，则解码模块110可以例如被配置成对音频信号的频谱的所述一条或多条第二谱线进行错误隐藏，以获得所述当前量化频谱的一条或多条中间谱线，所述一条或多条第二谱线呈现大于阈值频率的频率，其中解码模块110可以例如被配置成使用重新缩放因子重新缩放一条或多条中间谱线以重构音频信号。

在实施例中，解码模块110可以例如被配置成取决于以下至少一项确定重新缩放因子：

·被编码在所述当前比特流有效载荷内的全局增益，以及

·被编码在所述先前比特流有效载荷内的全局增益，以及

·所述先前帧的先前量化频谱的能量，所述先前帧的先前解码频谱的能量，以及

·所述当前帧的所述当前量化频谱的能量。

根据实施例，解码模块110可以例如被配置成取决于是否有以下情况来确定重新缩放因子：

·从在不进行错误隐藏的情况下无法重构的第一频谱区间开始直到频谱顶部的先前帧的先前解码频谱的频谱区间的平均能量大于或等于从零开始直到在不进行错误隐藏的情况下可以重构的所述最后频谱区间的先前帧的先前解码频谱的频谱区间的平均能量，或者

·从零开始直到在不进行错误隐藏的情况下可以重构的所述最后频谱区间的当前帧的所述当前量化频谱的频谱区间的能量大于或等于从零开始直到在不进行错误隐藏的情况下可以重构的所述最后频谱区间的先前帧的先前量化频谱的频谱区间的能量。

在实施例中，

·如果从在不进行错误隐藏的情况下无法重构的所述第一频谱区间开始直到频谱顶部的先前帧的先前解码频谱的频谱区间的平均能量小于从零开始直到在不进行错误隐藏的情况下可以重构的所述最后频谱区间的先前帧的先前解码频谱的频谱区间的平均能量，以及

·如果从零开始直到在不进行错误隐藏的情况下可以重构的所述最后频谱区间的当前帧的所述当前量化频谱的频谱区间的能量小于从零开始直到在不进行错误隐藏的情况下可以重构的所述最后频谱区间的先前帧的先前量化频谱的频谱区间的能量，

则解码模块110可以例如被配置成确定重新缩放因子，使得重新缩放因子等于以下比率的平方根，

·从零开始直到在不进行错误隐藏的情况下可以重构的所述最后频谱区间的当前量化频谱的频谱区间的能量乘以当前帧的增益因子的平方，

比

·从零开始直到在不进行错误隐藏的情况下可以重构的所述最后频谱区间的先前量化频谱的频谱区间的能量乘以先前帧的增益因子的平方。

根据实施例，解码模块110可以例如被配置成根据全局增益重新缩放因子来确定重新缩放因子，该重新缩放因子是总重新缩放因子，其中解码模块110可以例如被配置成根据下式来确定全局增益重新缩放因子

其中指示当前帧的全局增益，以及其中gg_prev指示所述先前帧的全局增益，以及其中fac_gg是全局增益重新缩放因子。

在实施例中，

如果

或者

如果

则解码模块110可以例如被配置成确定总重新缩放因子等于全局增益重新缩放因子，其中k指示频谱区间，其中k_be指示无法恢复的第一频谱区间，其中_F指示谱线数量，其中

指示先前帧的先前量化频谱是最后非全丢帧隐藏帧，其中

指示当前帧的当前量化频谱，其中

指示先前帧的先前解码频谱是所述最后非全丢帧隐藏帧。

根据实施例，

如果

并且

如果

则解码模块110可以例如被配置成确定总重新缩放因子还取决于能量重新缩放因子：

例如，该能量重新缩放因子可以用于形成总重新缩放因子：

其中fac_ener指示能量重新缩放因子，其中k指示频谱区间，其中k_be指示无法恢复的第一频谱区间，其中_F指示谱线数量，其中

指示先前帧的先前量化频谱是最后非全丢帧隐藏帧，其中

指示当前帧的当前量化频谱，其中

指示先前帧的先前解码频谱是所述最后非全丢帧隐藏帧。

在应用部分丢帧隐藏的场景中，假设或已经确定比特流有效载荷的更敏感比特是无错误的。

在实施例中，当前帧的量化频谱

可以例如被恢复到某个频率区间，本文称为频率区间k_be-1。因此，部分丢帧隐藏仅隐藏了该频率以上的量化谱线。

当根据一些实施例进行部分丢帧隐藏时，最后非FFLC帧

的量化频谱的谱线可以例如被重新使用(FFLC＝全丢帧隐藏)。

为了防止能量变化的过渡帧中的高能量伪影，隐藏的谱线随后被重新缩放，而所得重新缩放因子可以例如取决于以下至少一个：

a)全局增益；

b)频谱能量；

优选地，所得重新缩放因子可以例如取决于频谱的全局增益和能量两者。

基于全局增益的重新缩放因子等于先前全局增益与当前全局增益的比率。

基于能量的重新缩放因子初始化为1(例如，不进行重新缩放/例如，重新缩放无效)：

·如果从频率区间k_be(在不进行错误隐藏的情况下无法重构的第一个频谱区间)开始直到频谱顶部的先前解码频谱的频谱区间的平均能量大于或等于从零开始直到频率区间k_be-1(在不进行错误隐藏的情况下可以重构的最后频谱区间)的先前解码频谱的频谱区间的平均能量；或者

·如果从零开始直到频率区间k_be-1的当前量化频谱的频谱区间的能量大于或等于从零开始直到频率区间k_be-1的先前量化频谱的频谱区间的能量。

否则，重新缩放因子等于以下比率的平方根：

·从零开始直到频率区间k_be-1的当前量化频谱的频谱区间的能量乘以当前帧的增益因子的平方；比

·从零开始直到频率区间k_be-1的先前量化频谱的频谱区间的能量乘以先前帧的增益因子的平方。

当在这种情况下两个因子相乘时，增益因子会相互抵消。因此，重新缩放因子随后等于以下比率的平方根：

·从零开始直到频率区间k_be-1的当前量化频谱的频谱区间的能量；比

·从零开始直到频率区间k_be-1的先前量化频谱的频谱区间的能量。

之后，隐藏的量化频谱可以例如被处理为无错误量化频谱。这意味着可以例如在之后应用随后的解码器操作，如噪声填充、噪声成形、或参数存储在无错误比特流有效载荷中的任何其他操作。因此，减轻了可能的隐藏伪影。

随后，例如可以在从频率区间k_be开始直到频谱顶部的频谱上应用如上所述的类似衰落过程，例如，可能可用的调性特征可以例如朝噪声衰落；和/或，例如可能显著的频谱形状可以例如变平；和/或能量可以例如减少。

下面对实施例进行详细描述。

图2示出了根据特定实施例的解码模块110。

图2的解码模块110包括解码频谱存储模块330，以及可选的量化频谱存储模块310、部分帧重复和重新缩放模块320以及淡出和符号加扰模块340。参考图3至图5描述图2的特定解码模块110的这些(子)模块的具体细节。

图3至图5提供了根据实施例的LC3解码器(示例性地用作以创造性方式修改的最先进的变换编码器)的高级概览。具体地，图3至图5针对解码模块110提供了不同种类的具体实施例。

在实施例中，解码模块110可以例如包括量化频谱存储模块310，该量化频谱存储模块被配置用于存储音频信号的量化频谱，其中量化频谱存储模块310被配置成提供最后的非全丢帧隐藏量化频谱。此外，解码模块110可以例如包括解码频谱存储模块330，该解码频谱存储模块被配置用于存储音频信号的解码频谱，其中解码频谱存储模块330被配置成提供最后的非全丢帧隐藏解码频谱。

图3示出了根据用于干净信道解码的实施例的解码模块110概览。具体地，图3示出了正常的解码器操作。全丢帧隐藏以及部分丢帧隐藏所需的处理块是处理块310和330。

量化频谱存储模块310可以例如被配置用于量化频谱的存储：量化频谱存储模块310存储最后的非FFLC量化频谱以允许其在部分丢帧隐藏的情况下重新使用。

解码频谱存储模块330被配置成存储频谱(例如，称为解码频谱)：该处理块存储最后的非FFLC频谱以允许其在全丢帧隐藏的情况下重新使用。例如，它还可以用于在部分丢帧隐藏期间的重新缩放。

在实施例中，解码模块110可以例如包括解码频谱存储模块330，该解码频谱存储模块被配置用于存储音频信号的解码频谱，其中解码频谱存储模块330被配置以提供最后非全丢帧隐藏解码频谱。此外，解码模块110可以例如包括淡出和符号加扰模块340，该淡出和符号加扰模块被配置用于在频谱的谱线上进行淡出和符号加扰。

此外，根据实施例，解码模块110可以例如包括量化频谱存储模块310，该量化频谱存储模块被配置用于存储音频信号的量化频谱，其中量化频谱存储模块310被配置成提供最后非全丢帧隐藏量化频谱。此外，解码模块110可以例如包括部分帧重复和重新缩放模块320，该部分帧重复和重新缩放模块被配置用于部分帧重复和重新缩放，其中部分帧重复和重新缩放模块320被配置成通过添加谱线来补充频谱，这些谱线可以不被解码模块110解码，其中部分帧重复和重新缩放模块320被配置成重新缩放所述谱线。

图4示出了根据用于全丢帧隐藏的实施例的解码模块110概览。特别地，图4描绘了被配置用于进行全丢帧隐藏的实施例。全丢帧隐藏所需的处理块是处理块330和340。处理块330和340可以例如具有以下任务。

解码频谱存储模块330可以例如被配置用于存储频谱(例如，再次称为解码频谱)：该处理块330提供最后的非FFLC频谱。

淡出和符号加扰模块340可以例如被配置用于淡出和符号加扰：该处理块被配置成通过处理最后的非FFLC帧的谱线来创建频谱，如下所述。

图5示出了根据用于部分丢帧隐藏的实施例的解码模块110概览。

特别地，图5示出了部分丢帧隐藏的应用。部分丢帧隐藏所需的处理块是处理块310、320、330和340。这些处理块310、320、330和340具有以下任务：

量化频谱存储模块310可以例如被配置成用于存储量化频谱：量化频谱存储模块310可以例如被配置成提供最后的非FFLC量化频谱。

部分帧重复和重新缩放模块320可以例如被配置用于部分帧重复和重新缩放：该处理块可以例如被配置成通过添加那些不能被解码的谱线来补充频谱。之后，那些谱线可以例如被重新缩放并且低于某个阈值的值被量化为零，如下所述。

解码频谱存储模块330可以例如被配置用于频谱的存储(例如，再次被称为解码频谱)：解码频谱存储模块330可以例如被配置成提供最后的非FFLC频谱，最后的非FFLC频谱例如可以用于计算重新缩放因子。

淡出和符号加扰模块340可以例如被配置用于淡出和符号加扰：淡出和符号加扰模块340可以例如被配置成处理先前通过部分丢帧隐藏提供的谱线。下面进行说明。

在下文中，更详细地描述根据一些实施例的取决于调性的错误隐藏。

首先，提供根据一些实施例的衰落函数。

对于如下所述的针对符号加扰和非线性衰减实施的衰落过程，可以例如采用取决于随后丢帧的数量的函数(nbLostFramesInRow)，即一(1)直到某个值(plc_start_inFrames)，即从某个值(plc_end_inFrames)开始为零(0)；并且在plc_start_inFrames和plc_end_inFrames之间在1和0(1>x>0)之间线性下降。

特定的实施例可以例如如下实现：

plc_duration_inFrames＝plc_end_inFrames-plc_start_inFrames；

x＝max(plc_start_inFrames,(min(nbLostFramesInRow,plc_end_inFrames)))；

m＝-1/plc_duration_inFrames；

b＝-plc_end_inFrames；

linFuncStartStop＝m*(x+b)；

其中：

plc_start_inFrames–随后丢帧的数量，linFuncStartStop的值等于1直到该数量

plc_end_inFrames–随后丢帧的数量，从该数量开始linFuncStartStop的值等于0

linFuncStartStop–衰落函数的值

起始值和结束值可能不同地被选择，取决于信号特性(例如浊音与清音)并且取决于丢帧隐藏(例如PFLC与FFLC)(PFLC＝部分丢帧隐藏；FFLC＝全帧丢失隐藏)。

图6示出了根据实施例的衰落函数，其取决于一行中丢帧的数量(随后丢帧的数量)。

具体地，图6提供了这种衰落函数的示例，该衰落函数被配置成在20ms与60ms之间线性减小。

在下文中，更详细地描述根据一些实施例的符号的操纵。

作为先决条件，符号加扰的阈值可以例如基于如上导出的衰落值(linFuncStartStop)来确定。

randThreshold＝-32768*linFuncStartStop；

图7示出了根据实施例的用于符号加扰的阈值，该阈值取决于一行中丢帧的数量(随后丢帧的数量)并且还取决于帧长度。

特别地，图7提供了阈值示例，该阈值取决于使用衰落函数的连续丢帧的数量，其中阈值0对应于50％符号翻转，而阈值-32768对应于0％符号翻转。

实施例可以例如通过以下伪代码实现：

其中：

k –频谱区间

k_be –无法恢复的第一频谱区间

N_F –谱线数量

seed –随机值，示例性初始值为24607

pitch_present –信息，当前帧中的信号是否有调性

spec_prev(k) –最后良好帧中的区间k的频谱值(也称为

)

spec(k) –当前帧中的区间k的频谱值。

在该示例中，seed(即随机值)在32768与-32768之间变化。对于清音信号(pitch_present＝＝0)，符号反转的阈值为零，这导致50％的概率。对于浊音信号，应用了可变阈值(randThreshold)，该阈值介于-32768(符号反转的概率为0％)与零(符号反转的概率为50％)之间。

在下文中，更详细地描述根据一些实施例的幅度的操纵。

在特定实施例中，两个衰减因子可以例如取决于稳定性测量来例如如下定义：

slow＝0.8+0.2*stabFac；

fast＝0.3+0.2*stabFac；

其中stabFac指示FFLC情况下的最后一帧和倒数第二帧之间或PFLC情况下的当前帧和最后一帧之间的稳定性值。

例如，稳定性因子可以表示两个信号之间的相似性，例如当前信号与过去信号之间的相似性。例如，稳定性因子可以例如以[0:1]为界。例如，接近于1或为1的稳定性因子可能例如意味着两个信号非常相似，而接近于0或为0的稳定性因子可能例如意味着两个信号非常不同。例如，可以在两个音频信号的频谱包络上计算相似性。

例如，稳定性因子θ可以计算为：

其中：

scfQ_curr指示当前帧的缩放因子向量，以及

scfQ_prev指示先前帧的缩放因子向量

N指示缩放因子向量内的缩放因子数量

θ指示稳定性因子，其以0≤θ≤1为界

k指示缩放因子向量的索引

在一些实施例中，stabFac可以例如不同地用于FFLC和PFLC；即，可以取决于FFLC的稳定性设置为0到1之间的值，而对于PFLC，可以设置为1。

随后，例如可以导出对应的累积衰减因子(cum_fading_slow和cum_fading_fast，在每个突发丢失开始时用1初始化)，其可以例如从帧到帧例如如下变化：

cum_fading_slow＝cum_fading_slow*slow；

cum_fading_fast＝cum_fading_fast*fast；

其中：cum_fading_slow指示缓慢累积阻尼因子；并且其中cum_fading_fast指示快速累积阻尼因子。

在实施例中，累积可以例如仅对FFLC而不对PFLC进行。

此外，根据实施例，例如可以定义第一阈值(ad_ThreshFac_start)和最后阈值(ad_ThreshFac_end)的值。在一些实施例中，可以例如启发式地选择这些值。通常，两个值可以例如大于一(1)，并且第一阈值大于最后阈值。基于这两个阈值限制，当前帧的阈值(ad_threshFac)可以例如基于如上导出的衰落值(linFuncStartStop)来确定：

ad_ThreshFac_start＝10；

ad_ThreshFac_end＝1.2；

ad_threshFac＝(ad_ThreshFac_start-ad_ThreshFac_end)*linFuncStartStop+ad_ThreshFac_end；

其中ad_ThreshFac_start指示表示能量的第一因子，高于该第一因子应用

更强的衰减；并且其中ad_ThreshFac_stop指示表示能量的最后因子，高于该最后因子应用更强的衰减。

阈值调整可以只对FFLC进行，但不对PFLC进行。在这种情况下，对于后续帧，阈值将是固定的。

图8示出了根据实施例的能量阈值因子，其取决于一行中丢帧的数量并且进一步取决于帧长度。

具体地，图8提供了使用衰落函数取决于连续丢帧的数量的阈值因子的示例，其中阈值因子在20ms和60ms之间从10减小到1.2。

在特定实施例中，自适应衰落在区间粒度上操作。可以如下实现：

其中：

k –频谱区间

k_be –无法恢复的第一频谱区间

N_F –谱线数量

spec_prev(k) –最后良好帧中的区间k的频谱值(以下称为

)

spec(k) –当前帧中区间k的频谱值。

else路径中n的推导确保衰减曲线使较大的值保持较大，并且使较小的值保持较小。

图9描绘了应用累积阻尼的示例。示例中可能的输入值介于0与1000之间。n＝0是指接收到的帧并且提供某种参考。在示例中，初始缓慢衰减因子被设置为0.9，而初始快速衰减因子被设置为0.4(stabFac＝0.5)。在第二帧中，使用那些值的平方，依此类推，这使得后续曲线更平坦。同时，例如可以减小阈值，这将连续曲线的扭曲进一步向左移动。

在另一特定实施例中，自适应衰落是逐频带操作的。在该示例中，导出了逐频带能量，并且自适应阻尼仅应用于频带中的区间，这些区间高于所有频带的平均值。在那些情况下，该频带的能量可以例如用作逐区间自适应阻尼的阈值。例如，示例性实现方式可以如下实现：

其中：

k,j –频谱区间

k_be –无法恢复的第一频谱区间

N_F –谱线数量

spec_prev(k) –最后良好帧中的区间k的频谱值(以下称为

)

spec(k) –当前帧中的区间k的频谱值

idx –频带索引

bin_energy_per_band –每个频带的区间能量

在接收帧期间存储谱线以及在(部分或完全)丢帧期间插入谱线通常可以在基于比特流中提供的信息的频谱解码与转换回时域之间的任何地方执行。参考LC3，可以特别例如在SNS解码(SNS＝频谱噪声整形)之前或之后，例如在TNS解码(TNS＝时间噪声整形)之前或之后，例如在应用全局增益之前或之后，和/或例如在噪声填充之前或之后执行。

优选位置的选择也可以取决于部分丢帧或全丢帧的附加信息的可用性而变化。例如，在部分丢帧(部分丢帧隐藏)的情况下，可以在信号处理开始时执行；因为在这种情况下，后续信号处理步骤的参数可用。例如，可以在全丢帧(全丢帧隐藏)的情况下在稍后阶段执行，因为在这种情况下没有后续信号处理步骤的参数可用。然而，可以例如仍然在SNS解码之前执行，因为该步骤允许专用频谱整形。

下面更详细地描述根据一些实施例的部分丢帧隐藏。

部分丢帧隐藏的特定实现方式可以例如首先应用重新缩放因子，然后可以例如将低于某个阈值的频谱区间量化为零。这在以下示例伪代码中示出：

其中：

k –频谱区间

N_F –谱线数量

k_be –无法恢复的第一频谱区间

–当前帧的量化谱线k

–最后非FFLC帧的量化谱线k

fac –重新缩放因子

threshold –阈值，示例值为0.625以量化为零。

取决于全局增益的重新缩放因子fac_gg被推导出为当前全局增益与过去全局增益之间的比率：

取决于能量的重新缩放因子fac_ener被初始化为1。如果满足以下条件：

1.

2.

该重新缩放因子被设置为当前量化频谱乘以其对应的全局增益的平方与过去量化频谱乘以其对应的全局增益的平方之间的比率的根：

总重新缩放因子被推导为：

fac＝fac_gg·fac_ener。

当fac_ener≠1时，这导致(全局增益值相互抵消)：

上述等式中的变量具有以下含义：

k –频谱区间

k_be –无法恢复的第一频谱区间

_F –谱线数量

–最后非FFLC帧的量化频谱

–当前帧的量化频谱

–最后非FFLC帧的解码频谱

gg –当前帧的全局增益(如果在比特流中编码的量化频谱用全局增益进行重新缩放)

gg_prev –最后非FFLC帧的全局增益(如果在比特流中编码的量化频谱用全局增益进行重新缩放)。

以下示例伪代码示出了根据示例性实现方式的重新缩放因子的确定：

其中：

fac –重新缩放因子

gg_prev –最后非FFLC帧的全局增益(如果在比特流中编码的量化频谱用全局增益进行重新缩放)

k_be –无法恢复的第一频谱区间

N_F –谱线数量

–最后非FFLC帧的解码频谱

–最后非FFLC帧的量化频谱

–当前帧的量化频谱

sqrt –平方根函数。

尽管已经在装置背景下描述了一些方面，但很明显，这些方面也表示对应方法的描述，其中块或设备对应于方法步骤或方法步骤的特征。类似地，在方法步骤背景下描述的各方面也表示对应装置的对应块或项或特征的描述。一些或所有方法步骤可以通过(或使用)硬件装置(例如微处理器、可编程计算机或电子电路)来执行。在一些实施例中，一个或多个最重要的方法步骤可以由这种装置执行。

取决于某些实现方式要求，本发明的实施例可以以硬件或以软件或至少部分以硬件或至少部分以软件来实现。该实现方式可以使用存储有电子可读控制信号的数字存储介质(例如软盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或闪存)来执行，所述电子可读控制信号与可编程计算机系统协作(或能够协作)，从而执行相应的方法。因此，数字存储介质可以是计算机可读的。

根据本发明的一些实施例包括具有电子可读控制信号的数据载体，所述电子可读控制信号能够与可编程计算机系统协作，从而执行本文所述的方法之一。

通常，本发明的实施例可以实现为具有程序代码的计算机程序产品，当该计算机程序产品在计算机上运行时，该程序代码可操作用于执行方法之一。程序代码可以例如被存储在机器可读载体上。

其他实施例包括存储在机器可读载体上的用于执行本文描述的方法之一的计算机程序。

换言之，本发明方法的实施例因此是具有程序代码的计算机程序，当该计算机程序在计算机上运行时，该程序代码用于执行本文描述的方法之一。

因此，本发明方法的另一实施例是数据载体(或数字存储介质，或计算机可读介质)，该数据载体包括记录有用于执行本文所述方法之一的计算机程序。数据载体、数字存储介质或记录介质通常是有形的和/或非暂时性的。

因此，本发明方法的另一实施例是数据流或信号序列，该数据流或信号序列表示用于执行本文描述的方法之一的计算机程序。数据流或信号序列可以例如被配置成经由数据通信连接(例如经由互联网)来传输。

另一实施例包括被配置成或适于执行本文所述的方法之一的处理装置，例如计算机或可编程逻辑设备。

另一实施例包括安装有用于执行本文所述的方法之一的计算机程序的计算机。

根据本发明的另一实施例包括被配置成向接收器(例如，电子地或光学地)传递用于执行本文所述的方法之一的计算机程序的装置或系统。例如，接收器可以是计算机、移动设备、存储设备等。该装置或系统可以例如包括用于将计算机程序传递到接收器的文件服务器。

在一些实施例中，可编程逻辑设备(例如现场可编程门阵列)可以用于执行本文所述的方法的一些或全部功能。在一些实施例中，现场可编程门阵列可以与微处理器协作以执行本文所述的方法之一。通常，这些方法优选地由任何硬件装置执行。

本文描述的装置可以使用硬件装置实现，或者使用计算机实现，或者使用硬件装置和计算机的组合实现。

本文描述的方法可以使用硬件装置执行，或者使用计算机执行，或者使用硬件装置和计算机的组合执行。

上述实施例仅用于说明本发明的原理。应当理解，对本领域技术人员而言，本文描述的布置和细节的修改和变化将是显而易见的。因此，其意图是仅受限于所附专利权利要求的范围，而不是受限于通过本文实施例的描述和解释而呈现的具体细节。

参考资料：

[1]P.Lauber and R.Sperschneider,“Error Concealment for CompressedDigital Audio,”in Audio Engineering Society,2001。

[2]J.Lecomte and A.Tomasek,“ERRORCONCEALMENT UNIT,AUDIO DECODER,ANDRELATED METHOD AND COMPUTER PROGRAM FADING OUT A CONCEALED AUDIO FRAME OUTACCORDING TO DIFFERENT DAMPING FACTORS FOR DIFFERENT FREQUENCY BANDS”,WO2017/153299 A2,published 2017。

[3]A.

A.Kurittu and H.Toukomaa,“EVS Channel Aware ModeRobustness to Frame Erasures,”in Interspeech 2016,San Francisco,CA,USA,2016。

[4]A.Venkatraman,D.J.Sinder,S.Shaminda,R.Vivek,D.Duminda,C.Venkata,V.Imre,K.Venkatesh,S.Benjamin,L.Jeremie,Z.Xingtao and M.Lei,“Improved ErrorResilience for VoLTE and VoIP with 3GPP EVS Channel Aware Coding,”in ICASSP2015。

[5]M.Schnabel,G.Markovic,R.Sperschneider,C.Helmrich and J.Lecomte,“Apparatus and method realizing a fading of an mdct spectrum to white noiseprior to fdns application”.European Patent EP 3 011 559 B1,published 2017。

Claims

1.一种用于对当前帧进行解码以重构音频信号的解码器(100)，其中所述音频信号被编码在所述当前帧内，其中所述当前帧包括当前比特流有效载荷，其中所述当前比特流有效载荷包括多个有效载荷比特，其中所述多个有效载荷比特对所述音频信号的频谱的多条谱线进行编码，其中所述有效载荷比特中的每一个呈现在所述当前比特流有效载荷内的位置，

其中所述解码器(100)包括：

解码模块(110)，被配置成重构所述音频信号，以及

输出接口(120)，被配置成输出所述音频信号，

其中所述解码模块(110)包括错误隐藏模式，其中，如果所述解码模块(110)处于所述错误隐藏模式，则所述解码模块(110)被配置成通过对所述音频信号的所述频谱的如下谱线进行错误隐藏来重构所述音频信号：所述谱线呈现大于阈值频率的频率；和/或

其中，如果所述解码模块(110)进行错误隐藏，则所述解码模块(110)被配置成以取决于所述当前帧之前的先前帧的先前比特流有效载荷是否对所述音频信号的作为调性或谐波的信号分量进行编码的方式进行错误隐藏。

2.根据权利要求1的解码器(100)，

其中所述错误隐藏模式为部分丢帧隐藏模式，其中，如果所述解码模块(110)处于所述部分丢帧隐藏模式，则所述解码模块(110)被配置成：

在不对所述频谱的所述多条谱线中的一条或多条第一谱线进行错误隐藏的情况下重构所述音频信号，所述一条或多条第一谱线呈现小于或等于所述阈值频率的频率，其中所述一条或多条第一谱线已由所述多个有效载荷比特中的第一组一个或多个有效载荷比特进行编码，以及

通过对所述频谱的所述多条谱线中的一条或多条第二谱线进行错误隐藏来重构所述音频信号，所述一条或多条第二谱线呈现大于所述阈值频率的频率，其中所述一条或多条第二谱线已由所述多个有效载荷比特中的第二组一个或多个有效载荷比特进行编码。

3.根据权利要求2所述的解码器(100)，

其中所述解码模块(110)被配置成检测所述当前帧是否不包括对所述音频信号的所述频谱的所述一条或多条第一谱线进行编码的任何损坏比特，所述一条或多条第一谱线呈现小于或等于所述阈值频率的频率，

其中所述解码模块(110)被配置成检测所述当前帧是否包括对所述音频信号的所述频谱的所述一条或多条第二谱线进行编码的一个或多个损坏比特，所述一条或多条第二谱线呈现大于所述阈值频率的频率，

其中所述一个或多个损坏比特是所述有效载荷比特中的失真或可能失真的一个或多个有效载荷比特，以及

其中，如果所述当前帧不包括对所述音频信号的所述频谱的所述一条或多条第一谱线进行编码的任何损坏比特，所述一条或多条第一谱线呈现小于或等于所述阈值频率的频率，并且如果所述当前帧包括对所述音频信号的所述频谱的所述一条或多条第二谱线进行编码的所述一个或多个损坏比特，所述一条或多条第二谱线呈现大于所述阈值频率的频率，则所述解码模块(110)被配置成在所述部分丢帧隐藏模式下通过对所述频谱的大于所述阈值频率的所述一条或多条第二谱线进行错误隐藏来进行错误隐藏。

4.根据权利要求3所述的解码器(100)，

其中，如果所述当前帧不包括对所述音频信号的所述频谱的所述一条或多条第一谱线进行编码的任何损坏比特，所述一条或多条第一谱线呈现小于或等于所述阈值频率的频率，并且如果所述当前帧包括对所述音频信号的所述频谱的所述一条或多条第二谱线进行编码的所述一个或多个损坏比特，所述一条或多条第二谱线呈现大于所述阈值频率的频率，则所述解码模块(110)被配置成通过对所述多个有效载荷比特中的所述第一组一个或多个有效载荷比特进行解码来重构所述音频信号，所述第一组一个或多个有效载荷比特对所述音频信号的所述频谱的所述一条或多条第一谱线进行编码，所述一条或多条第一谱线呈现小于或等于所述阈值频率的频率。

5.根据权利要求2至4中的一项所述的解码器(100)，

其中所述解码模块(110)被配置成检测所述当前帧是否丢失，

其中，如果所述解码器(100)已检测到所述当前帧丢失，则所述解码模块(110)被配置成通过以下重构所述音频信号：

对所述音频信号的所述频谱的呈现大于所述阈值频率的频率的所述一条或多条第二谱线进行错误隐藏，以及

在不进行错误隐藏的情况下，对所述多个有效载荷比特中的所述第一组一个或多个有效载荷比特进行解码，所述第一组一个或多个有效载荷比特对所述音频信号的所述频谱的小于或等于所述阈值频率的所述一个或多个第一频率的所述一条或多条第一谱线进行编码，其中所述多个有效载荷比特中的所述第一组一个或多个有效载荷比特是与所述当前帧不同的冗余帧的一个或多个有效载荷比特。

6.根据权利要求2至5中的一项所述的解码器(100)，

其中，如果所述解码模块(110)被配置成在全丢帧隐藏模式下进行错误隐藏，则所述解码模块(110)被配置成对所述频谱的所有谱线进行错误隐藏。

7.根据权利要求6所述的解码器(100)，

其中所述多个有效载荷比特是多个当前有效载荷比特，

其中，如果所述解码模块(110)处于部分丢帧隐藏模式，则所述解码模块(110)被配置成使用一条或多条存储的谱线对所述音频信号的所述频谱的所述一条或多条第二谱线进行错误隐藏，所述一条或多条第二谱线呈现大于所述阈值频率的频率，所述一条或多条存储的谱线已由所述先前帧的所述先前比特流有效载荷的一个或多个先前有效载荷比特进行编码。

8.根据权利要求7的解码器(100)，

其中所述频谱是当前量化频谱，

其中，如果所述解码模块(110)在所述部分丢帧隐藏模式下进行错误隐藏，则所述解码模块(110)被配置成对所述音频信号的所述频谱的所述一条或多条第二谱线进行错误隐藏，以获得所述当前量化频谱的一条或多条中间谱线，所述一条或多条第二谱线呈现大于所述阈值频率的频率，其中所述解码模块(110)被配置成使用重新缩放因子重新缩放所述一条或多条中间谱线以重构所述音频信号。

9.根据权利要求8所述的解码器(100)，

其中所述解码模块(110)被配置成取决于以下至少一项确定所述重新缩放因子：

被编码在所述当前比特流有效载荷内的全局增益，以及

被编码在所述先前比特流有效载荷内的全局增益，以及

所述先前帧的先前量化频谱的能量，所述先前帧的先前解码频谱的能量，以及

所述当前帧的所述当前量化频谱的能量。

10.根据权利要求8或9所述的解码器(100)，

其中所述解码模块(110)被配置成取决于是否有以下情况来确定所述重新缩放因子：

从在不进行错误隐藏的情况下无法重构的第一频谱区间开始直到所述频谱的顶部的所述先前帧的所述先前解码频谱的频谱区间的平均能量大于或等于从零开始直到在不进行错误隐藏的情况下能够重构的最后频谱区间的所述先前帧的所述先前解码频谱的频谱区间的平均能量，或者

从零开始直到在不进行错误隐藏的情况下能够重构的所述最后频谱区间的所述当前帧的所述当前量化频谱的频谱区间的能量大于或等于从零开始直到在不进行错误隐藏的情况下能够重构的所述最后频谱区间的所述先前帧的所述先前量化频谱的频谱区间的能量。

11.根据权利要求10所述的解码器(100)，其中，

如果从在不进行错误隐藏的情况下无法重构的所述第一频谱区间开始直到所述频谱的顶部的所述先前帧的所述先前解码频谱的所述频谱区间的所述平均能量小于从零开始直到在不进行错误隐藏的情况下能够重构的所述最后频谱区间的所述先前帧的所述先前解码频谱的所述频谱区间的所述平均能量，以及

如果从零开始直到在不进行错误隐藏的情况下能够重构的所述最后频谱区间的所述当前帧的所述当前量化频谱的频谱区间的所述能量小于从零开始直到在不进行错误隐藏的情况下能够重构的所述最后频谱区间的所述先前帧的所述先前量化频谱的所述频谱区间的所述能量，

则所述解码模块(110)被配置成确定所述重新缩放因子，使得所述重新缩放因子等于以下比率的平方根：

从零开始直到在不进行错误隐藏的情况下能够重构的所述最后频谱区间的所述当前量化频谱的所述频谱区间的所述能量乘以所述当前帧的增益因子的平方，

比

从零开始直到在不进行错误隐藏的情况下能够重构的所述最后频谱区间的所述先前量化频谱的所述频谱区间的所述能量乘以所述先前帧的增益因子的平方。

12.根据权利要求9至11中的一项所述的解码器(100)，

其中所述解码模块(110)被配置成取决于全局增益重新缩放因子来确定所述重新缩放因子，所述重新缩放因子是总重新缩放因子，

其中所述解码模块(110)被配置成根据下式确定所述全局增益重新缩放因子：

其中gg指示被编码在所述当前比特流有效载荷内的所述全局增益，以及

其中gg_prev指示被编码在所述先前比特流有效载荷内的所述全局增益，以及

其中fac_gg是所述全局增益重新缩放因子。

13.根据权利要求12所述的解码器(100)，

其中，

如果

或者

如果

则所述解码模块(110)被配置成确定所述总重新缩放因子等于所述全局增益重新缩放因子，

其中k指示频谱区间，其中k_be指示无法恢复的第一频谱区间，其中N_F指示谱线数量，其中

指示所述先前帧的所述先前量化频谱是最后非全丢帧隐藏帧，其中

指示所述当前帧的所述当前量化频谱，其中

指示所述先前帧的所述先前解码频谱是所述最后非全丢帧隐藏帧。

14.根据权利要求12或13所述的解码器(100)，

其中，

如果

并且

如果

则所述解码模块(110)被配置成确定所述总重新缩放因子还取决于能量重新缩放因子

其中fac_ener指示所述能量重新缩放因子，

指示所述当前帧的所述当前量化频谱，其中

15.根据权利要求14所述的解码器(100)，

其中，

如果

并且

如果

则所述解码模块(110)被配置成根据下式确定所述总重新缩放因子fac

fac＝fac_gg·fac_ener，

或

或

16.根据前述权利要求中的一项所述的解码器(100)，

其中，如果所述解码模块(110)进行错误隐藏，则所述解码模块(110)被配置成通过使用所述音频信号的先前频谱的多个符号进行错误隐藏来重构所述音频信号的当前频谱，所述多个符号被编码在所述先前帧内，其中所述解码模块(110)被配置成以取决于所述先前帧是否对作为调性或谐波的信号分量进行编码的方式进行错误隐藏。

17.根据权利要求16所述的解码器(100)，

其中所述先前帧是在不进行错误隐藏的情况下已由所述解码模块(110)解码的最后接收帧，或者

其中所述先前帧是在没有以全丢帧隐藏模式进行错误隐藏的情况下已由所述解码模块(110)解码的最后接收帧，或者

其中所述先前帧是在没有以部分丢帧隐藏模式或全丢帧隐藏模式进行错误隐藏的情况下已由所述解码模块(110)解码的最后接收帧。

18.根据权利要求16或17所述的解码器(100)，

其中，如果所述解码模块(110)进行错误隐藏，并且如果所述先前帧的所述先前比特流有效载荷对作为调性或谐波的信号分量进行编码，则所述解码模块(110)被配置成翻转所述先前频谱的所述多个符号中的一个或多个符号以重构所述当前频谱，其中指示所述先前频谱的所述多个符号中的符号要被所述解码模块(110)翻转以重构所述当前频谱的概率的百分比值p在0％≤p≤50％之间，其中所述解码模块(110)被配置成确定所述百分比值p。

19.根据权利要求18所述的解码器(100)，

其中所述解码模块(110)被配置成取决于后续帧的数量来增大所述百分比值p；

其中所述后续帧的数量指示已由所述解码模块(110)进行了多少后继部分丢帧错误隐藏或全丢帧错误隐藏；或者其中所述后续帧的数量指示已由所述解码模块(110)进行了多少在特定错误隐藏模式下的后续帧错误隐藏。

20.根据权利要求19所述的解码器(100)，

其中所述解码模块(110)被配置成根据取决于所述后续帧的数量的函数来确定所述百分比值p，所述后续帧的数量是所述函数的自变量。

21.根据权利要求20所述的解码器(100)，

其中所述解码模块(110)被配置成确定所述百分比值p，

使得如果所述后续帧的数量小于第一阈值，则p为0％；

使得如果所述后续帧的数量大于或等于所述第一阈值且小于第二阈值，则0％≤p≤50％，以及

使得如果所述后续帧的数量大于所述第二阈值，则p＝50％。

22.根据权利要求21所述的解码器(100)，

其中所述解码模块(110)被配置成确定所述百分比值p，使得所述百分比值p取决于所述后续帧的数量在所述第一阈值与所述第二阈值之间的范围内线性增大。

23.根据权利要求18至22中的一项所述的解码器(100)，

其中，如果所述解码模块(110)进行错误隐藏，并且如果所述先前帧的所述先前比特流有效载荷未对作为调性或谐波的信号分量进行编码，则所述解码模块(110)被配置成翻转所述先前频谱的所述多个符号中的50％以重构所述当前频谱。

24.根据前述权利要求中的一项所述的解码器(100)，

其中，如果所述解码模块(110)进行错误隐藏，则所述解码模块(110)被配置成取决于所述先前帧是否对作为调性或谐波的信号分量进行编码，通过使用所述音频信号的所述先前频谱的多个幅度进行错误隐藏来重构所述音频信号的当前频谱，所述多个幅度被编码在所述先前帧内。

25.根据权利要求24所述的解码器(100)，

其中，如果所述解码模块(110)进行错误隐藏，则所述解码模块(110)被配置成根据非线性衰减特性对所述先前频谱的所述多个幅度进行衰减以重构所述当前频谱，其中所述非线性衰减特性取决于所述先前帧是否对作为调性或谐波的信号分量进行编码。

26.根据权利要求24或25所述的解码器(100)，

其中，如果所述解码模块(110)进行错误隐藏，并且如果所述先前帧的所述先前比特流有效载荷对作为调性或谐波的信号分量进行编码，则所述解码模块(110)被配置成取决于稳定性因子对所述先前频谱的所述多个幅度进行衰减，其中所述稳定性因子指示所述当前频谱与所述先前频谱之间的相似性；或者其中所述稳定性因子指示所述先前频谱与所述先前帧之前的前先前帧的前先前频谱之间的相似性。

27.根据权利要求26所述的解码器(100)，

其中所述前先前帧是在所述先前帧之前的在不进行错误隐藏的情况下已由所述解码模块(110)解码的最后接收帧，或者

其中所述前先前帧是在所述先前帧之前的在没有以全丢帧隐藏模式进行错误隐藏的情况下已由所述解码模块(110)解码的最后接收帧，或者

其中所述前先前帧是在所述先前帧之前的在没有以部分丢帧隐藏模式或全丢帧隐藏模式进行错误隐藏的情况下已由所述解码模块(110)解码的最后接收帧。

28.根据权利要求26或27所述的解码器(100)，

其中如果所述解码模块(110)被设置为进行部分丢帧隐藏，则所述稳定性因子指示所述当前频谱与所述先前频谱之间的所述相似度；

如果所述解码模块(110)被设置为进行全丢帧隐藏，则所述稳定性因子指示所述先前频谱与所述前先前频谱之间的所述相似性。

29.根据权利要求26到28中的一项所述的解码器(100)，

其中所述解码模块(110)被配置成确定所述先前频谱的频谱区间的能量；

其中所述解码模块(110)被配置成确定所述频谱区间的所述能量是否小于能量阈值；

其中，如果所述能量小于所述能量阈值，则所述解码模块(110)被配置成以第一衰落因子对所述多个幅度中的分配给所述频谱区间的幅度进行衰减，

其中，如果所述能量大于或等于所述能量阈值，则所述解码模块(110)被配置成以小于所述第一衰落因子的第二衰落因子对所述多个幅度中的分配给所述频谱区间的所述幅度进行衰减，

其中，所述解码模块(110)被配置成进行衰减，使得通过对所述多个幅度中的一个幅度的衰减使用较小的衰落因子，增加所述一个幅度的衰减。

30.根据权利要求26到28中的一项所述的解码器(100)，

其中所述解码模块(110)被配置成确定包括所述先前频谱的多个频谱区间在内的频谱带的能量；

其中所述解码模块(110)被配置成确定所述频谱带的所述能量是否小于能量阈值；

其中，如果所述能量小于所述能量阈值，则所述解码模块(110)被配置成以第一衰落因子对所述多个幅度中的分配给所述频谱带的所述频谱区间的幅度进行衰减，

其中，如果所述能量大于或等于所述能量阈值，则所述解码模块(110)被配置成以小于所述第一衰落因子的第二衰落因子对所述多个幅度中的分配给所述频谱带的所述频谱区间的所述幅度进行衰减，

31.根据进一步引用权利要求19的权利要求30所述的解码器(100)，

其中所述解码模块(110)被配置成确定所述第一衰落因子，使得取决于所述后续帧的数量，所述第一衰落因子变得更小，以及

其中所述解码模块(110)被配置成确定所述第二衰落因子，使得取决于所述后续帧的数量，所述第二衰落因子变得更小。

32.根据权利要求31所述的解码器(100)，

其中所述解码模块(110)被配置成确定所述第一衰落因子和所述第二衰落因子，使得

如果所述当前帧是所述后续帧中的第一帧，

cum_fading_slow＝1，以及

cum_fading_fast＝1，

并且使得

如果所述当前帧是所述后续帧中的所述第一帧之后的帧之一，则取决于所述后续帧的数量根据以下公式确定所述第一衰落因子和所述第二衰落因子：

cum_fading_slow＝cum_fading_slow*slow；

cum_fading_fast＝cum_fading_fast*fast；

其中所述公式右侧的cum_fading_slow是所述先前帧的所述第一衰落因子，

其中所述公式左侧的cum_fading_slow是所述当前帧的所述第一衰落因子，

其中所述公式右侧的cum_fading_fast是所述先前帧的所述第二衰落因子，

其中所述公式左侧的cum_fading_fast是所述当前帧的所述第二衰落因子，

其中1>slow>fast>0。

33.根据权利要求32所述的解码器(100)，其中1>slow>fast>0.3。

34.根据进一步引用权利要求19的权利要求29到33中的一项所述的解码器(100)，

其中所述解码模块(110)被配置成确定所述能量阈值，

使得如果所述后续帧的数量小于第三阈值，则所述能量阈值等于第一能量值；

使得如果所述后续帧的数量大于或等于所述第三阈值且小于第四阈值，则所述能量阈值小于所述第一能量值且大于第二能量值；以及

使得如果所述后续帧的数量大于所述第四阈值，则所述能量阈值等于所述第二能量值。

35.根据权利要求34所述的解码器(100)，

其中所述解码模块(110)被配置成确定所述能量阈值，使得所述能量阈值取决于所述后续帧的数量在所述第三阈值与所述第四阈值之间的范围内线性减小。

36.根据权利要求1或根据权利要求15至35中的一项所述的解码器(100)，

其中所述解码模块(110)包括解码频谱存储模块(330)，所述解码频谱存储模块被配置用于存储所述音频信号的解码频谱，其中所述解码频谱存储模块(330)被配置成提供最后非全丢帧隐藏解码频谱，以及

其中所述解码模块(110)包括淡出和符号加扰模块(340)，所述淡出和符号加扰模块被配置用于对所述频谱的谱线进行淡出和符号加扰。

37.根据权利要求36所述的解码器(100)，

其中所述解码模块(110)包括量化频谱存储模块(310)，所述量化频谱存储模块被配置用于存储所述音频信号的量化频谱，其中所述量化频谱存储模块(310)被配置成提供最后非全丢帧隐藏量化频谱，以及

其中所述解码模块(110)包括部分帧重复和重新缩放模块(320)，所述部分帧重复和重新缩放模块被配置用于部分帧重复和重新缩放，其中所述部分帧重复和重新缩放模块(320)被配置成通过添加谱线来补充所述频谱，所述谱线不能够被所述解码模块(110)解码，其中所述部分帧重复和重新缩放模块(320)被配置成重新缩放所述谱线。

38.根据权利要求2到14中的一项所述的解码器(100)，

其中所述解码模块(110)包括解码频谱存储模块(330)，所述解码频谱存储模块被配置用于存储所述音频信号的解码频谱，其中所述解码频谱存储模块(330)被配置成提供最后非全丢帧隐藏解码频谱。

39.一种对当前帧进行解码以重构音频信号的方法，其中所述音频信号被编码在所述当前帧内，其中所述当前帧包括当前比特流有效载荷，其中所述当前比特流有效载荷包括多个有效载荷比特，其中所述多个有效载荷比特对所述音频信号的频谱的多条谱线进行编码，其中所述有效载荷比特中的每一个呈现在所述比特流有效载荷内的位置，其中所述方法包括：

重构所述音频信号，其中，在错误隐藏模式中，通过对所述音频信号的所述频谱中的如下谱线进行错误隐藏来重构所述音频信号：所述谱线呈现大于阈值频率的频率；和/或其中，如果进行错误隐藏，则以取决于所述当前帧之前的先前帧的先前比特流有效载荷是否对所述音频信号的作为调性或谐波的信号分量进行编码的方式进行错误隐藏；以及

输出所述音频信号。

40.一种用于在计算机或信号处理器上执行时实现权利要求39所述的方法的计算机程序。