CN102282611B

CN102282611B - 数字音频信号的分级编码方法和分级编码器

Info

Publication number: CN102282611B
Application number: CN2009801546871A
Authority: CN
Inventors: 巴拉兹.科维西; 斯蒂芬.拉戈特; 阿兰.勒古亚德
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2008-11-18
Filing date: 2009-11-17
Publication date: 2013-05-08
Anticipated expiration: 2029-11-17
Also published as: JP5474088B2; KR20110095387A; US20110224995A1; EP2366177A1; EP2366177B1; KR101339857B1; FR2938688A1; WO2010058117A1; CN102282611A; US8965773B2; JP2012509515A

Abstract

本发明涉及一种用于对音频数字信号进行可伸缩编码的方法，该方法针对输入信号的公共部分包括：核心编码步骤，其产生用于公共部分的每个采样n的标量量化的索引(I^B(n))；以及至少一个增强编码步骤，其产生用于增强信号的每个编码后采样的标量量化

的索引(J_k(n))。该方法使得，该增强编码步骤包括以下步骤：获得用于确定目标信号的用于对编码噪声进行变换的滤波器(W(z))，并且使得，通过使可能标量量化值的集合与所述目标信号之间的误差最小化，来确定用于所述增强信号的标量量化

的索引(J_k(n))。根据本发明的编码方法还可以包括用于对核心流进行编码的编码噪声的变换。本发明还涉及一种用于实现诸如所描述的编码方法的编码器。

Description

数字音频信号的分级编码方法和分级编码器

技术领域

本发明涉及数字信号的编码领域。

根据本发明的编码特别适于诸如音频信号（语音、音乐或其他）之类的数字信号的传送和/或存储。

本发明更具体地有关于ADPCM（代表“自适应差分脉冲编码调制”）编码类型的波形编码，且特别有关于使得可能利用可伸缩二进制串来传递量化索引的、利用嵌入码的ADPCM类型的编码。

背景技术

诸如，参考图1和2来描述协议ITU-T G.722或ITU-T G.727所规定的嵌入码ADPCM编码/解码的一般原理。

因而，图1表现了ADPCM类型的嵌入码编码器。

它包括：

-预测模块110，用于使得可能基于量化误差信号

（其中v(n′)是比例因子（scale factor））的先前采样并且基于重构信号r^B(n′)n′=n-1,...,n-N_P（其中n是当前时刻）来给出信号的预测

-减法模块120，用于从输入信号x(n)中减去其预测

以获得表示为e(n)的预测误差信号。

-用于误差信号的量化模块130Q^B+K，用于接收误差信号e(n)作为输入，从而给出由B+K个比特组成的量化索引I^B+K(n)。量化模块Q^B+K是嵌入码类型的，即，它包括具有B个比特的核心量化器、和嵌入在该核心量化器上的具有B+k k=1,...,K个比特的量化器。

在ITU-T G.722标准的情况下，通过X.Maitre.编著的用于描述G.722标准的概述文章"7kHz audio coding within 64 kbit/s".IEEE Journal on SelectedAreas in Communication,Vol.6-2,February 1988的表格IV和VI来定义量化器Q^B、Q^B+1、Q^B+2（令B=4）的判决等级和重构等级。

量化模块Q^B+K的输出端的B+K个比特的量化索引I^B+K(n)经由传送信道140而传送到诸如参考图2所描述的解码器。

该编码器同样包括：

-模块150，用于删除索引I^B+K(n)的K个低阶比特，从而给出低比特率索引I^B(n)；

-逆量化模块120(Q^B)^-1，用于给出B个比特上的量化误差信号

e_{Q}^{B} (n) = y_{I^{B}}^{B} (n) v (n)

作为输出；

-用于量化器和逆量化器的适配模块170Q_Adapt，用于针对接下来的时刻而给出也称为比例因子的等级控制参数v(n)；

-加法模块180，用于将预测与量化误差信号相加，以给出低比特率重构信号r^B(n)；

-用于预测模块的适配模块190P_Adapt，基于B个比特上的量化误差信号

并且基于通过1+P_z(z)所滤波的信号

可以观察出，在图1中，附图标记为155的虚线部分表现了包含预测器165和175以及逆量化器120的低比特率本地解码器。因而，此本地解码器使得可能基于低比特率索引I^B(n)来在170处对逆量化器进行适配，并且基于所重构的低比特率数据来对预测器165和175进行适配。

此部分一致地存在于诸如参考图2所描述的嵌入码ADPCM解码器中。

图2的嵌入码ADPCM解码器接收源自于传送信道140的索引I^B+K（I^B+K的可能被二进制误差干扰的版本）作为输入，并且通过比特率为每个采样B比特的逆量化模块210(Q^B)^-1来进行逆量化，以获得信号符号“′”指示在解码器处接收到的、由于传送误差而导致可能与编码器所传送的值不同的值。

B个比特的输出信号r′^B(n)将等于该信号的预测与具有B个比特的逆量化器的输出之和。解码器的此部分255与图1的低比特率本地解码器155一致。

采用比特率指示符“模式（mode）”和选择器220，解码器可以增强所恢复的信号。

确实，如果“模式”指示出已经传送了B+l个比特，则该输出将等于预测

和具有B+l个比特的逆量化器230的输出

之和。

如果“模式”指示出已经传送了B+2个比特，则该输出将等于预测

和具有B+2个比特的逆量化器240的输出

之和。

通过使用z变换表示法，针对此循环结构可以写出以下表达式：

R^B+k(z)=X(Z)+Q^B+k(z)

其中，通过使用下式来定义具有B+k个比特的量化噪声Q^B+k(z)：

Q^{B + k} (z) = E_{Q}^{B + k} (z) - E (z)

ITU-T G.722标准（在下文中，命名为G.722）的嵌入码ADPCM编码进行宽带中的信号编码，其被定义有[50-7000Hz]的最小带宽，并且以16kHz来进行采样。G.722编码是通过使用正交镜像滤波器来对信号进行分解所获得的信号的两个子波段[50-4000Hz]和[4000-7000Hz]中每一个的ADPCM编码。通过6个、5个和4个比特上的嵌入码ADPCM编码来对低波段进行编码，而通过每个采样2比特的ADPCM编码器来对高波段进行编码。根据用于对低波段进行解码所使用的比特的数目，总比特率将为64、56或48比特/秒（bit/s）。

此编码首先使用在ISDN（综合服务数字网）中，并然后使用在IP网络上的音频编码的应用中。

作为示例，在G.722标准中，诸如图3所表现的，按照以下方式来对所述8个比特进行分派（apportion）：

2个比特I_h1和I_h2，用于高波段；

6个比特I_L1 I_L2 I_L3 I_L4 I_L5 I_L6，用于低波段。

比特I_L5和I_L6可以被“窃用（stolen）”或者利用数据来取代，并且它们构成低波段增强比特。比特I_L1 I_L2 I_L3 I_L4构成低波段核心比特。

因而，根据G.722标准所量化的信号的帧由在8个、7个或6个比特上编码的量化索引组成。在该索引的传送频率为8kHz的情况下，该比特率将为64、56或48kbit/s。

对于具有许多等级的量化器，量化噪声的谱将是相对平坦的，如图4所示。还在图4中表现了该信号的谱（这里，话音信号块）。此谱具有大的动态振幅（swing）（~40dB）。可以看出，在低能量地带中，噪声非常接近于信号，并因此，不再必须被屏蔽（mask）。于是，在图4中，在这些区域中（尤其是在频率[2000-2500Hz]的地带中）,它可能变为可听得见的。

因此，编码噪声的整形是必须的。而且，适于嵌入码编码的编码噪声整形将也是期望的。

在协议ITU-T G.711.1″Wideband embedded extension for G.711 pulse codemodulation"或"G.711.1:A wideband extension to ITU-T G.711″.Y.Hiwasaki,S.Sasaki,H.Ohmuro,T.Mori,J.Seong,M.S.Lee,B.S.Ragot,J.-L.Garcia,C.Marro,L.M.,J.Xu,V.Malenovsky,J.Lapierre,R.Lefebvre.EUSIPCO,Lausanne,2008中描述了用于利用嵌入码的PCM（代表“脉冲编码调制”）类型编码的噪声整形技术。

因而，此协议描述了具有用于核心比特率编码的编码噪声的整形的编码。基于源自于逆核心量化器的过去的解码信号来计算用于对编码噪声进行整形的感知滤波器。因此，核心比特率本地解码器使得可能计算噪声整形滤波器。因而，在解码器处，可能基于核心比特率解码信号来计算此噪声整形滤波器。

在编码器处使用用于传递增强比特的量化器。

用于接收核心二进制流和增强比特的解码器基于核心比特率解码信号、按照与编码器处相同的方式、来计算用于对编码噪声进行整形的滤波器，并且将此滤波器应用于来自增强比特的逆量化器的输出信号，所整形的高比特率信号是通过将所滤波的信号与所解码的核心信号进行相加而获得的。

因而，噪声的整形增强了核心比特率信号的感知质量。它在增强比特方面供应了质量的有限增强。确实，在增强比特的编码方面不执行编码噪声的整形，量化器的输入对于核心量化与对于增强量化是相同的。

然后，当除了核心比特之外、还对增强比特进行解码时，解码器必须通过合适适配的滤波来删除所得到的乱真分量（spurious component）。

在解码器处的滤波器的附加计算增加了解码器的复杂性。

在已经现有的G.722或G.727解码器类型的标准可伸缩解码器中没有使用此技术。因此，存在一种对于无论比特率是多少都增强信号质量、同时维持与现有标准可伸缩解码器的兼容性的需求。

发明内容

本发明旨在增强此情形。

为此目的，本发明提出了一种对数字音频信号进行分级编码的方法，该方法针对输入信号的当前帧包括：

-核心编码，用于传递用于当前帧的每个采样的标量量化索引；以及

-至少一个增强编码，传递用于增强信号的每个编码采样的标量量化的索引。该方法使得，该增强编码包括以下步骤：获得用于确定目标信号的用于对编码噪声进行整形的滤波器，并且通过使标量量化的可能值的集合与所述目标信号之间的误差最小化，来确定所述增强信号的标量量化的索引。

因而，执行更高比特率的增强信号的编码噪声的整形。形成本发明主题的基于合成的分析方案使得不必如可能作为现有技术的编码噪声整形解决方案的情况一样地、在解码器处执行任何补足（complementary）信号处理。

因此，在解码器处接收到的信号将可能通过标准解码器来解码，该标准解码器能够对核心比特率的和嵌入比特率的信号进行解码，而不需要任何噪声整形计算或者任何校正项。

因此，无论在解码器处可用的比特率是多少，都增强了解码信号的质量。

可以独立地或者彼此组合地将在下文中提及的各种具体实施例添加到在上文中定义的方法的步骤中。

因而，该目标信号的确定的实现模式使得，针对当前增强编码级，该方法针对当前采样包括以下步骤：

-通过组合分级编码的输入信号、与部分地基于前一编码级的编码并且基于当前增强编码级的重构信号的过去采样所重构的信号，来获得增强编码误差信号；

-通过所获得的噪声整形滤波器来对增强编码误差信号进行滤波，从而获得该目标信号；

-通过将源自于前一级的编码的重构信号与源自于量化步骤的信号相加，来计算用于当前采样的重构信号；

-基于源自于该量化步骤的信号来对该噪声整形滤波器的存储器进行适配。

这里所描述的操作的安排导致了通过复杂性被显著减少的操作进行的编码噪声的整形。

在具体的实施例中，可能标量量化值的集合和用于当前采样的误差信号的量化值是用于表示通过相对于核心比特率量化索引所计算的等级控制参数来标称的量化重构等级的值。

因而，所述值适于核心编码的输出等级。

在具体的实施例中，通过用于表示具有B+k个比特的嵌入式量化器的量化的重构等级的值（B表示了核心编码的比特的数目）与用于表示具有B+k-1个比特的嵌入式量化器的量化重构等级的值之差，来定义表示出用于增强级k的量化重构等级的值，具有B+k个比特的嵌入式量化器的重构等级通过将具有B+k-1个比特的嵌入式量化器的重构等级一分为二来定义。

而且，将表示出用于增强级k的量化重构等级的值存储在存储器空间中，并且作为核心比特率量化和增强索引的函数来对其添加索引。

通过从具有B+k-1个比特的量化器的输出值中减去具有B+k个比特的量化器的输出值，不必针对每个采样时刻来重新计算直接存储在ROM中的增强量化器的输出值。而且，例如将它们两个两个地安排在通过前一级的索引可容易地检索到（indexable）的表格中。

在具体的实施例中，标量量化的可能值的数目针对每个采样而变化。

因而，可能作为要编码的采样的函数来对增强比特的数目进行适配。

在另一变化实施例中，给出标量量化索引的所述增强信号的编码采样的数目小于该输入信号的采样的数目。

例如，当针对某些采样而将所分配的增强比特的数目设置为零时，情况可能如此。

例如，该核心编码的可能实现模式是使用标量量化和预测滤波器的ADPCM编码。

例如，该核心编码的另一可能实现模式是PCM编码。

该核心编码还可以包括编码噪声的整形，例如针对当前采样具有以下步骤：

-基于过去量化噪声采样并且基于预定噪声整形滤波器所滤波的量化噪声的过去采样，来获得用于编码噪声的预测信号；

-组合核心编码的输入信号与编码噪声预测信号，从而获得要量化的修改后的输入信号。

因而，针对核心编码进行具有较小复杂性的编码噪声的整形。

在具体实施例中，通过ARMA滤波器或者一连串ARMA滤波器来定义该噪声整形滤波器。

因而，包括分子中的值和分母中的值的这种类型的加权函数具有这样的优点，其通过考虑信号峰值的分母中的值并且通过衰减这些峰值的分子中的值，因而提供了量化噪声的最优整形。ARMA滤波器的级联序列允许通过用于对信号的谱的包络进行建模的分量以及周期性或者准周期性分量，来对屏蔽滤波器进行更好地建模。

在具体的实施例中，将该噪声整形滤波器分解为解耦的谱斜率和共振峰（formantic）形状的两个级联的ARMA滤波单元。

因而，作为输入信号的谱特性的函数来对每个滤波器进行适配，并因此，每个滤波器适于呈现出各种类型的谱斜率的信号。

有利地，增强编码所使用的所述噪声整形滤波器（W(z)）还被核心编码所使用，因而减少了实现的复杂性。

在具体的实施例中，作为所述输入信号的函数来计算该噪声整形滤波器，从而最佳地适于不同的输入信号。

在变型实施例中，基于由核心编码所本地解码的信号来计算该噪声整形滤波器。

本发明还有关于一种数字音频信号的分级编码器，该分级编码器针对输入信号的当前帧包括：

-核心编码级，传递用于当前帧的每个采样的标量量化索引；以及

-至少一个增强编码级，传递用于增强信号的每个编码后采样的标量量化的索引。

该编码器使得，该增强编码级包括：用于获得用于确定目标信号的用于对编码噪声进行整形的滤波器的模块；以及量化模块，用于通过使标量量化的可能值的集合与所述目标信号之间的误差最小化，来传递所述增强信号的标量量化的索引。

本发明还有关于一种计算机程序，包括代码指令，用于当由处理器来执行这些指令时，实现根据本发明的编码方法的步骤。

本发明最终有关于一种处理器可读的存储部件，用于存储诸如所描述的计算机程序。

附图说明

一旦阅读了单独借助于非限制性示例并参考附图而给出的以下描述，本发明的其他特性和优点就将更加清楚明显，在所述附图中：

-图1图示了根据现有技术的诸如先前所描述的嵌入码ADPCM类型的编码器；

-图2图示了根据现有技术的诸如先前所描述的嵌入码ADPCM类型的解码器；

-图3图示了根据现有技术的诸如先前所描述的嵌入码ADPCM类型的编码器的量化索引的示范帧；

-图4表现了相对于在没有实现本发明的编码器中存在的量化噪声的谱的信号块的谱；

-图5表现了根据本发明一般实施例的嵌入码编码器和编码方法的框图；

-图6a和6b表现了根据本发明的增强编码级和增强编码方法的框图；

-图7图示了适于对源自于根据本发明的编码的信号进行解码的解码器的各种配置；

-图8表现了根据本发明的编码器和根据本发明的编码方法的第一详细实施例的框图；

-图9图示了用于根据本发明的编码器的核心编码级的编码噪声的示范计算；

-图10图示了用于计算图9的编码噪声的详细功能；

-图11图示了根据本发明的编码方法的获得量化重构等级的集合的示例；

-图12图示了根据本发明的编码方法的增强信号的表现；

-图13图示了用于表现计算用于根据本发明的编码的屏蔽滤波器的第一实施例的步骤的流程图；

-图14图示了用于表现计算用于根据本发明的编码的屏蔽滤波器的第二实施例的步骤的流程图；

-图15表现了根据本发明的编码器和根据本发明的编码方法的第二详细实施例的框图；

-图16表现了根据本发明的编码器和根据本发明的编码方法的第三详细实施例的框图；和

-图17表现了根据本发明的编码器的可能实施例。

具体实施方式

在本文档的下文中，系统地采用术语“预测”来描述仅仅使用过去采样的计算。

参考图5，现在描述根据本发明的嵌入码编码器。重要的是，要注意到，利用用于提供每个附加采样一比特的增强级来执行编码。这里，此约束仅仅用于简化本发明的表现。然而，清楚的是，容易地将在下文中描述的本发明归纳为其中增强级提供每个采样多于一比特的情况。

此编码器包括具有B个比特上的量化的核心比特率编码级500，该核心比特率编码级500例如是诸如标准化的G.722或G.727编码器之类的ADPCM编码类型的，或者是诸如G.711标准化编码器之类的PCM（“脉冲编码调制”）编码器，其作为块520的输出的函数而修改。

附图标记为510的块表现了此核心编码级，该核心编码级具有随后参考图8、15或16而更加详细描述的编码噪声的整形，即核心编码的噪声的屏蔽。

诸如所表现的本发明还有关于其中不执行核心部分中的编码噪声的屏蔽的情况。而且，在此文档中广义地使用术语“核心编码器”。因而，可以将诸如具有56或64kbit/s的ITU-T G.722之类的现有多比特率编码认为是“核心编码器”。极端地，还可能考虑具有0kbit/s的核心编码器，即从编码的第一步骤开始就应用用于形成本发明的主题的增强编码技术。在后者情况下，增强编码成为核心编码。

这里参考图5所描述的、具有噪声整形的核心编码级包括滤波模块520，该滤波模块520基于量化噪声q^B(n)和滤波后的量化噪声

来执行预测P_r(z)，以提供预测信号

例如，通过将滤波后噪声的K_M个部分预测与量化噪声相加，来获得滤波后的量化噪声

诸如随后参考图9所描述的。

如参考图1所描述的，在例如ADPCM编码的情况下，核心编码级接收信号x(n)作为输入，并且提供量化索引I^B(n)、基于I^B(n)所重构的信号r^B(n)和量化器的比例因子v(n)作为输出。

诸如图5所表现的编码器还包括几个增强编码级。这里，表现了级EA1（530）、级EAk（540）和级EAk2（550）。

随后，将参考图6a和6b来详述如此表现的增强编码级。

一般地，每个增强编码级k具有作为输入的信号x(n)、最优索引I^B+k-1(n)、核心编码的索引I^B(n)和先前增强级的索引J₁(n),...,J_k-1(n)或等效地这些索引的集合的级联、在前一步骤中重构的信号r^B+k-1(n)、屏蔽滤波器的参数、以及当必要时的自适应编码情况下的比例因子v(n)。

此增强级提供用于此编码级的增强比特的量化索引J_k(n)作为输出，该量化索引J_k(n)将在级联模块560中与索引I^B+k-1(n)进行级联。增强级k还提供重构信号r^B+k(n)作为输出。应该注意到，这里，索引J_k(n)表现了用于索引n的每个采样的一个比特；然而，在一般的情况下，如果可能的量化值的数目大于2，则J_k(n)可以表现每个采样几比特。

所述各级中的一些级对应于要传送的比特J₁(n),...,J_k1(n)，所述要传送的比特J₁(n),...,J_k1(n)将与索引I^B(n)进行级联，使得可以通过诸如随后图7所表现和描述的标准解码器来对所得到的索引进行解码。因此，不必改变远程解码器；而且，不需要附加的信息以用于向远程解码器“通知”在编码器处执行的处理。

其他比特J_k1+1(n),..,J_k2(n)通过增加比特率和屏蔽而对应于增强比特，并且它们需要参考图7所描述的附加的解码模块。

图5的编码器还包括模块580，该模块580用于基于输入信号或基于编码器的合成滤波器的系数来计算噪声整形滤波器或屏蔽滤波器，如稍后参考图13和14所描述的。要注意，模块580可以具有本地解码的信号、而不是原始信号，作为输入。

诸如这里所表现的增强编码级使得可能提供增强比特，用于供应解码器处信号的增加质量，而无论解码信号的比特率是多少，且无需修改解码器，并因此无需解码器处的任何额外复杂性。

因而，现在参考图6a来描述表现了根据本发明一个实施例的增强编码级k的图5的模块Eak。

此编码级所执行的增强编码包括量化步骤该量化步骤

传递索引和量化值作为输出，该量化值使得可能量化值的集合与通过使用编码噪声整形滤波器所确定的目标信号之间的误差最小化。

在这里考虑包括嵌入码量化器的编码器。

第k级使得可能获得增强比特J_k或者比特组J_k k＝1,...,G_K。

它包括模块EAk-1，该模块EAk-1用于从输入信号x(n)中减去用于当前帧的每个前一采样n′=n-1,...,n-N_D的在第k级处合成的信号r^B+k(n)、以及用于采样n的前一级的信号r^B+k-1(n)，从而给出编码误差信号e^B+k(n)。

替代利用如参考图4所表现的平坦谱来使将引起量化噪声的二次误差准则最小化，将在量化步骤中使加权二次误差准则最小化，使得谱整形的噪声不太听得见。

因而，第k级包括滤波模块EAk-2，该滤波模块EAk-2用于通过加权函数W(z)来对误差信号e^B+k(n)进行滤波。还可以将此加权函数用于核心编码级中噪声的整形。

这里，噪声整形滤波器等于谱加权的反转，即：

H^{M} (z) = \frac{1 - P_{N}^{M} (z)}{1 - P_{D}^{M} (z)} = \frac{1}{W (z)} - - - (1)

此整形滤波器为ARMA类型（“自回归移动平均数”）。其转移函数包括阶N_N的分子和阶N_D的分母。因而，块EAk-1实质上用来定义与H^M(z)的分母对应的、滤波器W(z)的非递归部分的存储器。虽然为了简洁的缘故而没有示出W(z)的递归部分的存储器的定义，但是可以根据

并且根据

来推导它。

此滤波模块给出与目标信号对应的滤波后的信号

作为输出。

谱加权的作用在于对编码误差的谱进行整形，这是通过使加权误差的能量最小化来进行的。

量化模块EAk-3执行量化步骤，该量化步骤基于量化输出的可能值来寻求根据以下等式来使加权误差准则最小化：

E_{j}^{B + k} = [e_{w}^{B + k} (n) - {enh}_{VCj}^{B + k} (n)]^{2} j = 0,1 - - - (2)

此等式表现了以下情况，其中针对每个采样n来计算增强比特。于是，量化器的两个输出值是可能的。随后，我们将看到如何来定义量化步骤的可能输出值。

因而，此模块EAk-3进行增强量化

该增强量化

具有要与前一级的索引I^B+k-1进行级联的最优比特J_k的值作为第一输出，并且具有用于最优索引J_k的量化器的输出信号作为第二输出

其中v(n)表现了核心编码所定义的比例因子，从而对量化器的输出等级进行适配。

最终地，增强编码级包括模块EAk-4，该模块EAk-4用于将量化误差信号与在前一级处合成的信号r^B+k-1(n)相加，从而给出第k级处的合成信号r^B+k(n)。

按照等效的方式，可以通过优选地按照有限精度对索引I^B+k(n)进行解码（即，通过计算

）、并且通过添加预测

而取代EAk-4来获得r^B+k(n)。在此情况下，适当的是，在存储器中存储具有B个比特、B+l、...的量化器的量化值

并且通过

{[{enh}_{2 I^{B + k - 1}}^{B + k} v (n)]}_{F} = {[y_{2 I^{B + k - 1} + j}^{B + k} v (n)]}_{F} - {[y_{I^{B + k - 1}}^{B + k - 1} v (n)]}_{F}

来计算增强量化器的值。

根据用于以下采样时刻的以下关系，来对具有等于x(n′)-r^B+k-1(n′)（令n′＝n）的值的信号e^B+k(n)进行补充：

e^{B + k} (n) &LeftArrow; e^{B + k} (n) - {enh}_{2 I^{B + k - 1} + J_{k}}^{B + k} (n) v (n) - - - (3)

其中e^B+k(n)也是滤波器的存储器MA（代表“移动平均数”）。因此，要在存储器中保存的采样的数目等于噪声整形滤波器的分母的系数的数目。

然后，根据以下等式来对滤波的AR（代表“自回归”）部分的存储器进行更新：

e_{w}^{B + k} (n) &LeftArrow; e_{w}^{B + k} (n) - {enh}_{2 I^{B + k - 1} + J_{k}}^{B + k} (n) v (n) - - - (5)

在通过串联地安排几个ARMA单元（cell）来进行滤波的情况下，按照相同的方式来适配参考图10的滤波器的内部变量：

q_{f}^{k} (n) &LeftArrow; q_{f}^{k} (n) - {enh}_{2 I^{B + k - 1} + J_{k}}^{B + k} (n) v (n)

索引n递增一个单位。一旦已经针对最初N_D个采样执行了初始化步骤，就将通过对用于e^B+k(n)的储存存储器进行移位（其涉及了对最旧的采样进行改写）并且通过将值e^B+k(n)=x(n)-r^B+k-1(n)插入到保留空闲的时隙中，来进行e^B+k(n)的计算。

可以注意到，图6a所示的本发明可以通过等效的变型来进行。确实，可以将所重构的信号分解为单单通过已经可用的采样（过去采样n＝n-1,...,n-N_D、先前级的目前采样、滤波器的存储器）而确定的部分s_det(n)、和单单取决于要优化的目前采样的要确定的另一部分s_opt(n)。因而，为了对计算的负荷进行优化，还可以将要最小化的误差

（其是输入信号x(n)与重构信号r^B+k(n)之间的加权误差）的计算分解为两个部分。在第一步骤中，对输入采样x(n)与s_det(n)之间的W(z)的加权差进行计算（图6a的模块EAK-1和EAK-2）。如此获得的值

是减少为单一目标值的时刻n的目标信号，针对每个可能的量化值

仅仅需要计算该目标信号一次。接下来，在优化循环中，必须简单地从所有可能的标量量化值之中找到在欧氏（Euclidian）距离方面与此目标值最接近的一个标量量化值。

用于对目标值进行计算的另一变型在于进行两次加权滤波W(z)。第一滤波对输入信号与前一级的重构信号r^B+k-1(n)之差进行加权。虽然第二滤波器具有零输入，但是借助于

来对这些存储器进行更新。这两次滤波的输出之间的差给出了相同的目标信号。

在图6b中对图6a中描述的本发明的原理进行了归纳。块601给出前一级的编码误差ε^B+k-1(n)。块602逐一地推导出所有可能的标量量化值

块603从ε^B+k-1(n)中减去所述标量量化值，以获得当前级的编码误差ε^B+k(n)。通过噪声整形滤波器W(z)（块604）来对此误差进行加权并且使之最小化（块605），从而对块602进行控制。最后，增强编码级所本地编码的值是

r^{B + k} (n) = r^{B + k - 1} (n) + {enh}_{2 I^{B + k - 1} + J_{k}}^{B + k} (n) v (n)

（块606）。

重要的是，这里要注意，符号^B+k假设了每个采样的比特率是B+k个比特。因此，图6应对以下情况，其中通过增强编码级来添加每个采样的单一比特，因而涉及块602中的2个可能的量化值。显然，图6b中描述的增强编码可以生成每个采样任何数目个比特k；在此情况下，块602中的可能标量量化值的数目是2^k。

参考图7，现在我们应该描述能够对作为来自根据本发明的诸如参考图5所描述的编码器的输出所获得的信号进行解码的嵌入码解码器的各种配置。

所实现的解码装置取决于信号传送比特率，并且例如取决于信号的信源，该信源取决于该信号是从例如ISDN网络710、还是从IP网络720发起的。

针对具有低比特率（48、56或64kbit/s）的传送信道，将可能使用例如G.722标准化ADPCM解码器类型的标准解码器700，来对B+k1比特的二进制串进行解码，其中k1=0、1、2，并且B是核心比特率的比特数目。源自于此解码的恢复信号r^B+k1(n)将受益于由于在编码器中实现的增强编码级而带来的增强质量。

针对具有更高比特率（80、96kbit/s）的传送信道，如果二进制串I^B+k1+k2(n)具有比标准解码器700的比特率更大的并且由模式指示符740指示的比特率，则除了参考图2所描述的具有B+1和B+2个比特的逆量化之外，额外的解码器730还执行

的逆量化，从而提供量化后的误差，该量化后的误差当与预测信号

相加时，将给出高比特率的增强信号r^B+k1+k2(n)。

现在，参考图8来描述根据本发明的编码器的第一实施例。在此实施例中，核心比特率编码级800执行具有编码噪声整形的ADPCM类型的编码。

核心编码级包括模块810，该模块810用于对基于经由核心层的低比特率索引I^B(n)的量化误差信号的先前采样、并且基于重构信号r^B(n′)n′=n-1,...,n-N_P（像参考图1所描述的重构信号）所进行的信号预测

进行计算。

提供用于从输入信号x(n)中减去预测

的减法模块801，从而获得预测误差信号

核心编码器还包括模块802，该模块802用于预测P_r(z)噪声

该预测基于量化噪声q^B(n′)n′=n-1,...,n-N_NH的先前采样并且基于滤波后的噪声

q_{f}^{B K_{M}} (n^{'}) n^{'} = n - 1, . . ., n - N_{DH}

来进行。

还提供用于将噪声预测

与预测误差信号相加的加法模块803，从而获得表示为e^B(n)的误差信号。

核心量化Q^B模块820接收误差信号e^B(n)作为输入，从而给出量化索引I^B(n)。最优量化索引I^B(n)和量化值

使误差准则最小化，其中值

是重构等级，而v(n)是源自于量化器适配模块804的比例因子。

作为G.722编码器的示例，通过X.Maitre.编著的文章"7kHz audio codingwithin 64 kbit/s",IEEE Journal on Selected Areas in Communication,Vol.6-2,February 1988的表格VI来定义核心量化器Q^B的重构等级。

在经由传送信道840而传送到诸如参考图7所描述的解码器之前，量化模块Q^B所输出的B个比特的量化索引I^B(n)将在多路复用模块830中与增强比特J₁，...,J_K多路复用。

核心编码级还包括：模块805，用于对量化噪声进行计算，这是量化器的输入与其输出之差

模块806，用于对通过将量化噪声与量化噪声的预测相加

所滤波的量化噪声进行计算；和模块807，用于通过将信号的预测与量化噪声相加

来对重构信号进行计算。

量化器Q^B适配

模块804给出了用于接下来的时刻n+1的等级控制参数v(n)，其也称为比例因子。

预测模块810包括适配P_Adapt模块811，该模块811用于基于所重构的量化误差信号

的采样并且可选地基于通过1+P_z(z)所滤波的重构量化误差信号

来进行适配。

将随后详述的模块850 Calc Mask设计为提供以下滤波器，该滤波器用于基于输入信号、或者基于核心编码（按照核心比特率）所本地解码的信号、或者基于通过简化梯度算法在ADPCM编码中计算的预测滤波器系数，来对可能由核心编码级和增强编码级两者所使用的编码噪声进行整形。在后者情况下，可以通过添加阻尼常数并且添加去加重（de-emphasis）滤波器，基于用于核心比特率编码的预测滤波器的系数，来获得该噪声整形滤波器。

还可能将屏蔽模块单独地使用在增强级中；此替换方案在核心编码使用每个采样少数比特的情况下有利，在该情况下，编码误差不是白噪声，并且信噪比非常低——此情形可以在G.722标准中高波段（4000-8000Hz）的每个采样2比特的ADPCM编码中发现，在此情况下，反馈所进行的噪声整形是无效的。

要注意，与图8中的块802、803、805、806对应的核心编码的噪声整形是可选的。诸如图16中表现的本发明甚至在被缩减为块801、804、807、810、811、820的ADPCM核心编码方面应用。

图9更加详细地描述了模块802，该模块802用于通过具有以下一般表达式的ARMA（代表“自回归移动平均数”）滤波器来执行量化噪声的预测

的计算：

H^{M} (z) = \frac{1 - P_{N}^{M} (z)}{1 - P_{D}^{M} (z)} - - - (6)

为了简化的缘故，这里使用了z变换符号。

为了获得可以同时考虑音频信号的短期和长期特性的噪声的整形，通过串联的ARMA滤波单元900、901、902来表现滤波器H^M(z)：

H^{M} (z) = Π_{j = 1}^{K_{M}} F^{j} (z) = Π_{j = 1}^{K_{M}} \frac{1 - P_{N}^{j} (z)}{1 - P_{D}^{j} (z)} - - - (7)

源自于此滤波器串联的图9的滤波后的量化噪声将通过下式、作为量化噪声Q^B(z)的函数来给出：

Q_{f}^{B K_{M}} (z) = Π_{j = 1}^{K_{M}} \frac{1 - P_{N}^{j} (z)}{1 - P_{D}^{j} (z)} Q^{B} (z) - - - (8)

图10更加详细地示出了模块F^k(z)901。通过下式来给出此单元k的输出端的量化噪声：

Q_{f}^{k} (z) = Q_{f}^{k - 1} (z) - P_{N}^{k} (z) Q_{f}^{k - 1} (z) + P_{D}^{k} (z) Q_{f}^{k} (z) - - - (9)

利用k=1,...,K_M进行迭代产生了：

Q_{f}^{B K_{M}} (z) = Q^{B} (z) + Σ_{k = 1}^{K_{M}} P_{D}^{k} (z) Q_{f}^{k} (z) - P_{N}^{k} (z) Q_{f}^{k - 1} (z) - - - (10)

即：

Q_{f}^{{BK}_{M}} (z) = Q^{B} (z) + P_{R}^{B K_{M}} (z) - - - (11)

其中噪声预测

通过下式来给出：

P_{R}^{{BK}_{M}} (z) = Σ_{k = 1}^{K_{M}} P_{D}^{k} (z) Q_{f}^{k} (z) - P_{N}^{k} (z) Q_{f}^{k - 1} (z) - - - (12)

因而，通过以下等式而容易地验证了图8的核心编码噪声的整形是有效的：

E^{B} (z) = X (z) - X_{P}^{B} (z) + P_{R}^{{BK}_{M}} (z) - - - (13)

Q^B(z)＝E_Q(z)-E^B(z) （14）

R^{B} (z) = E_{Q} (z) + X_{P}^{B} (z) - - - (15)

据此：

R^{B} (z) = X (z) + Q_{f}^{{BK}_{M}} (z) - - - (16)

R^{B} (z) = X (z) + Π_{j = 1}^{K_{M}} \frac{1 - P_{N}^{j} (z)}{1 - P_{D}^{j} (z)} Q^{B} (z) - - - (17)

由于量化噪声几乎是白噪声，所以所感知的编码噪声的谱被滤波器

整形，并因此不太听得见。

如随后所描述的，可以通过按照以下方式来对系数g₁和g₂进行赋值，根据用于输入信号的线性预测的逆滤波器来推导ARMA滤波单元：

\frac{1 - P_{N}^{j} (z)}{1 - P_{D}^{j} (z)} = \frac{A_{g 1} (z)}{A_{g 2} (z)} = \frac{1 - Σ_{k = 1}^{N_{j}} a_{g} (k) g_{1}^{k} z^{- k}}{1 - Σ_{k = 1}^{D_{j}} a_{g} (k) g_{2}^{k} z^{- k}} - - - (18)

包括分子中的值和分母中的值的这种类型的加权函数具有以下优点，通过考虑信号峰值的分母中的值并且通过衰减这些峰值的分子中的值，因而提供了量化噪声的最优整形。g₁和g₂的值使得：

1>g₂>g₁>0

特定值g₁=0给出了纯自回归屏蔽滤波器，而g₂=0的特定值给出了MA移动平均数滤波器。

而且，在话音信号的情况和高保真度的数字音频信号的情况下，基于展现出信号周期性的信号的精细结构的轻微整形减少了在信号谐波之间感知的量化噪声。该增强在信号具有相对高的基频或者音调（pitch）（例如，大于200Hz）的情况下特别显著。

通过下式来给出长期噪声整形ARMA单元：

\frac{1 - P_{N}^{j} (z)}{1 - P_{D}^{j} (z)} = \frac{1 - Σ_{k = - M_{P}}^{M_{P}} p_{2 M_{P}} (k) z^{- (Pitch + k)}}{1 - Σ_{k = - M_{P}}^{M_{P}} p_{1 M_{P}} (k) z^{- (Pitch + k)}} - - - (19)

返回到图8的描述，该编码器还包括几个增强编码级。这里，表现了两级EAl和EAk。

增强编码级Eak使得可能获得增强比特J_k或比特组J_k k=1,G_K，并且它诸如参考图6a和6b来进行描述。

此编码级包括模块EAk-1，该模块EAk-1用于从输入信号x(n)中减去由用于采样时刻n-1,...,n-N_D的级k处的合成信号r^B+k(n)和用于时刻n的级k-1处所合成的信号r^B+k-1(n)形成的信号r^B+k(n)，从而给出编码误差信号e^B+k(n)。

还在编码级k中包括模块EAk-2，该模块EAk-2用于通过加权函数W(z)来对e^B+k(n)进行滤波。此加权函数等于通过诸如先前所描述的核心编码给出的屏蔽滤波器H^M(z)的反转。在模块EAk-2的输出端，获得滤波后的信号

增强编码级k包括模块EAk-3，该模块EAk-3用于使误差准则（令j=0,1）最小化，该模块EAk-3进行增强量化

该增强量化

级k还包括加法模块EAk-4，该加法模块EAk-4用于将量化误差信号

与前一级处的合成信号r^B+k-1(n)相加，从而给出级k处的合成信号r^B+k(n)。

在单一整形ARMA滤波器的情况下，于是通过下式、按照z变换符号来给出滤波后的误差信号：

E_{W} (z) = W^{1} (z) E (z) = \frac{1 - P_{D} (z)}{1 - P_{N} (z)} E (z) - - - (20)

因而，针对每个采样时刻n，基于在前一级处合成的信号r^B+k-1(n)并且基于信号r^B+k(n)的过去采样，来计算部分重构的信号r^B+k(n)。

从信号x(n)中减去此信号，以给出误差信号e^B+k(n)。

通过具有滤波ARMA单元W¹的滤波器来对误差信号进行滤波，以给出：

e_{w}^{B + k} (n) = e^{B + k} (n) - Σ_{k = 1}^{N_{D}} p_{D} (k) e^{B + k} (n - k) + Σ_{k = 1}^{N_{N}} p_{N} (k) e_{w}^{B + k} (n - k) - - - (21)

加权误差准则相当于使量化器的可能输出的两个值（或者如果是几个比特的话，则N_G个值）的二次误差最小化：

E_{j}^{B + k} = {[e_{w}^{B + k} (n) - {enh}_{VCj}^{B + k}]}^{2} j = 0,1 - - - (22)

此最小化步骤给出了最优索引J_k和用于最优索引的量化值

{enh}_{{VCJ}_{k}}^{B + k} (n) = {enh}_{2 I^{B + k - 1} + J_{k}}^{B + k} (n) v (n),

其也表示为

在屏蔽滤波器由几个串联的ARMA单元组成的情况下，执行串联的滤波。

例如，针对串联的短期滤波和音调单元，我们将具有：

E_{w}^{B + k} (z) = \frac{1 - Σ_{k = 1}^{N_{D}} p_{D} (k) z^{- k}}{1 - Σ_{k = 1}^{N_{N}} p_{N} (k) z^{- k}} \frac{1 - Σ_{k = - M_{P}}^{M_{P}} p_{2 M_{P}} (k) z^{- (Pitch + k)}}{1 - Σ_{k = - M_{P}}^{M_{P}} p_{1 M_{P}} (k) z^{- (Pitch + k)}} E^{B + k} (z) - - - (23)

第一滤波单元的输出将等于：

e_{1 w}^{B + k} (n) = e^{B + k} (n) - Σ_{k = 1}^{N_{D}} p_{D} (k) e^{B + k} (n - k) + Σ_{k = 1}^{N_{N}} p_{N} (k) e_{1 w}^{B + k} (n - k) - - - (24)

并且第二单元的输出：

e_{2 w}^{B + k} (n) = e_{1 w}^{B + k} (n) - Σ_{k = - M_{P}}^{k = M_{P}} p_{2 M_{P}} (k) e_{1 w}^{B + k} (n - Pitch + k) + Σ_{k = - M_{P}}^{k = M_{P}} p_{1 M_{P}} (k) e_{2 w}^{B + k} (n - Pitch + k)

(25)

一旦通过使该准则最小化而获得了

就通过根据e^B+k(n)推导

来对e^B+k(n)进行适配，并然后将储存存储器向左移位，并且值r^B+k+1(n+1)在接下来的时刻n+1加入到最新位置中。

其后，通过下式来对滤波器的存储器进行适配：

e_{1 w}^{B + k} (n) = e_{1 w}^{B + k} (n) - {enh}_{v J_{k}}^{B + k} (n) v (n) - - - (28)

e_{2 w}^{B + k} (n) = e_{2 w}^{B + k} (n) - {enh}_{v J_{k}}^{B + k} (n) v (n) - - - (29)

在一般情况下，对前一过程进行迭代，其中：

E_{w}^{B + k} (z) = Π_{j = 1}^{K_{M}} \frac{1 - P_{N}^{j} (z)}{1 - P_{D}^{j} (z)} E^{B + k} - - - (30)

因而，在串联的增强级中逐比特地或逐比特组地获得增强比特。

与其中如图1所表现的、通过对误差信号e(n)进行量化来直接获得编码器的核心比特和增强比特的现有技术相对比，按照利用量化噪声的整形对标准解码器输出处的增强信号进行重构的这种方式，来计算根据本发明的增强比特。

在知道核心量化器输出处所获得的索引I^B(n)的情况下，因为具有B+l个比特的ADPCM类型的量化器是嵌入码量化器，所以对于具有B+l个比特的量化器，仅仅两个输出值是可能的。

相同的推理在作为具有B+k-1个比特的增强级的函数的具有B+k个比特的增强级的输出方面适用。

图11表现了G.722编码器的低波段编码的具有B个比特（令B=4个比特）的核心量化器的最初4个等级和具有B+l和B+2个比特的量化器的等级、以及用于B+2个比特的增强量化器的输出值。

如此图中所图示的，通过将具有B=4个比特的量化器的等级一分为二来获得具有B+l=5个比特的嵌入式量化器。通过将具有B+l=5个比特的量化器的等级一分为二来获得具有B+2=6个比特的嵌入式量化器。

在本发明的实施例中，通过用于表示具有B+k个比特的嵌入式量化器的量化的重构等级的值（B表示核心编码的比特的数目）与用于表示具有B+k-1个比特的嵌入式量化器的量化重构等级的值之间的差，来定义用于表示增强级k的量化重构等级的值，具有B+k个比特的嵌入式量化器的重构等级通过将具有B+k-1个比特的嵌入式量化器的重构等级一分为二来定义。

因此，我们具有以下关系：

y_{2 I^{B + k - 1} + j}^{B + k} = y_{I^{B + k - 1}}^{B + k - 1} + {enh}_{2 I^{B + k - 1} + j}^{B + k} k = 1, . . ., K; j = 0,1 - - - (31)

表现了具有B+k个比特的嵌入式量化器的可能重构等级，

表现了具有B+k-1个比特的嵌入式量化器的重构等级，而表现了用于级k的增强项或者重构等级。作为示例，作为用于B+k=5个比特的嵌入式编码器的函数，在图11中给出了级k=2（即，令B+k=6）的输出处的等级。

通过下式来给出具有B+k个比特的量化器的可能输出：

e_{Q 2 I^{B + k - 1} + j}^{B + k} = y_{I^{B + k - 1}}^{B + k - 1} v (n) + {enh}_{2 I^{B + k - 1} + j}^{B + k} v (n) k = 1, . . ., K; j = 0,1 - - - (32)

v(n)表现了比例因子，该比例因子由核心编码所定义，从而对固定量化器的输出等级进行适配。

利用现有技术方案，通过对其中存在要量化的值e(n)的具有B+k个比特的量化器的判决跨度（span）进行标记，仅仅执行一次用于具有B、B+l、...、B+K个比特的量化器的量化。

本发明提出了不同的方案。在知道源自于具有B+k-1个比特的量化器的量化值的情况下，通过使量化误差最小化并且无需访问（call upon）判决阈值，来进行量化器输入处的信号

的量化，由此有利地使得可能减少用于乘积

的固定点实现的计算噪声，使得：

E_{j}^{B + k} = {[(e_{w}^{B + k} (n) - y_{I^{B + k - 1}}^{B + k - 1} v (n) - {enh}_{2 I^{B + k - 1} + j}^{B + k} v (n)]}^{2} j = 0,1 - - - (33)

替代利用如参考图4所表现的平坦谱来使将引起量化噪声的二次误差准则最小化，将使加权二次误差准则最小化，使得谱整形的噪声不太听得见。

所使用的谱加权函数是W(z)，其也可以用于核心编码级中的噪声整形。

返回到图8的描述，可以看出，所恢复的核心信号等于预测与逆量化器的输出之和，即：

r^{B} (n) = x_{p}^{B} (n) + y_{I^{B}}^{B} v (n) - - - (34)

因为基于核心ADPCM编码器来执行信号预测，所以通过以下等式，作为在级k-1处实际重构的信号的函数，来给出在级k处可能的两个重构信号：

r_{j}^{B + k} = x_{P}^{B} (n) + y_{I^{B + k - 1}}^{B + k - 1} v (n) + {enh}_{2 I^{B + k - 1} + j}^{B + k} v (n) - - - (35)

据此推导出要在级k处最小化的误差准则：

E_{j}^{B + k} = {[x (n) - x_{P}^{B} (n) - y_{I^{B + k - 1}}^{B + k - 1} v (n) - {enh}_{2 I^{B + k - 1} + j}^{B + k} v (n)]}^{2} j = 0,1 - - - (36)

即：

E_{j}^{B + k} = {[(x (n) - r^{B + k - 1} (n)) - {enh}_{2 I^{B + k - 1} + j}^{B + k} v (n)]}^{2} j = 0,1 - - - (37)

替代利用如先前所描述的平坦谱来使将引起量化噪声的二次误差准则最小化，将仅仅对于核心编码来使加权二次误差准则最小化，使得谱整形的噪声不太听得见。所使用的谱加权函数是W(z)，其已用于所给出示例中的核心编码——然而，可能单单在增强级中使用此加权函数。

根据图12，将信号

定义为等于以下两个信号之和：

表现所有值

的级联（令n′<n）并且等于0（令n′=n）；

以及

等于

（令n′=n）并且等于零（令n′<n）。

然后，通过以下表达式来给出在z变换域中更易于阐释的误差准则：

其中，

是

的z变换。

通过对

进行分解，我们获得：

例如，为了使此准则最小化，我们通过对以下信号进行计算来开始：

R_{P}^{B + k} (z) = R^{B + k - 1} (z) + {Enh}_{VP}^{B + k} (z) - - - (40)

其中这是由于我们尚不知道量化后的值。前一级的信号与

之和等于第k级的重构信号。

因此，是等于r^B+k(n′)（令n′<n）并且等于r^B+k-1(n′)（令n′=n）的信号的z变换，使得：

r_{P}^{B + k} (n^{'}) = r^{B + k} (n^{'}) n^{'} = n - 1, . . ., n - N_{D}

= r^{B + k - 1} (n^{'}) n^{'} = n

针对处理器上的实现，一般将不明确地计算信号r^B+k(n)，但是将有利地计算误差信号e^B+k(n)，此误差信号e^B+k(n)是x(n)与r^B+k(n)之间的差：

e^B+k(n′)=x(n′)-r^B+k(n′)n′=n-1,...,n-N_D

=x(n′)-r^B+k-1(n′)n′=n （41）

e^B+k(n)是基于r^B+k-1(n)和r^B+k(n)而形成的，并且用于随后的滤波的要在存储器中保存的采样的数目是N_D个采样，即屏蔽滤波器的分母的系数的数目。

滤波后的误差信号

将等于：

E_{w}^{B + k} (z) = E^{B + k} (z) W (z) - - - (42)

据此推导出加权二次误差准则：

E_{j}^{B + k} = {[e_{w}^{B + k} (n) - {enh}_{VCj}^{B + k}]}^{2} - - - (43)

最优索引J_k是以下索引，其使准则

（令j=0,1）最小化，因而基于两个增强等级

来进行标量量化

所述两个增强等级是基于具有B+k个比特的标量量化器的重构等级、并且在知道最优核心的一个索引和多个索引J_i i＝1,...,k-1（或等效地，I^B+k-1）的情况下计算的。

用于最优索引的量化器的输出值等于：

{enh}_{VC J_{k}}^{B + k} (n) = {enh}_{2 I^{B + k - 1} + J_{k}}^{B + k} (n) v (n) - - - (44)

并且，将通过下式来给出时刻n处的重构信号的值：

r^{B + k} (n) = r^{B + k - 1} (n) + {enh}_{2 I^{B + k - 1} + J_{k}}^{B + k} (n) v (n) - - - (45)

在知道量化后的输出的情况下，针对采样时刻n来对差信号e^B+k(n)进行更新：

e^{B + k} (n) &LeftArrow; e^{B + k} (n) - {enh}_{2 I^{B + k - 1} + J_{k}}^{B + k} (n) v (n)

并且对滤波器的存储器进行适配。

n的值递增一个单位。然后认识到，e^B+k(n)的计算是极其简单的：在尚不知道量化值的情况下，通过将用于e^B+k(n)的储存存储器向左移位一个时隙来丢弃最旧采样、并且插入r^B+k-1(n+1)作为最新采样就足够了。可以明智地（judiciously）通过使用指针来避免存储器的移位。

图13和14图示了通过屏蔽滤波器计算模块850实现的屏蔽滤波器计算的两种实现模式。

在图13所图示的第一实现模式中，考虑了信号当前块，该信号当前块对应于利用前一帧的采样片段S(n),n=-N_s,....,-1,0,...,N_T来补充的当前帧块。

为了强调（accentuate）屏蔽滤波器的谱的峰值，在E60处通过滤波器A₁(z)来计算相关系数之前，对该信号进行预处理（预加重处理），该滤波器A₁(z)的一个或多个系数是固定的或者是通过如专利FR2742568所描述的线性预测来适配的。

在使用预加重的情况下，通过逆滤波来计算要分析的信号S_p(n)：

S_P(z)=A₁(z)S(z)。

其后，在E 61处通过如根据现有技术已知的、汉宁（Hanning）窗或者由子窗的级联形成的窗来对信号块进行加权。

其后，在E62处通过下式来计算K_c2+1个相关系数：

Cor (k) = Σ_{n = 0}^{N - 1} s_{p} (n) s_{p} (n - k) k = 0, . . ., K_{c 2} - - - (46)

在E63处通过Levinson-Durbin算法来给出用于对预加重信号的包络进行建模的AR滤波器（代表自回归）A₂(z)的系数。

因此，在E64处获得了滤波器A(z)，所述滤波器具有转移函数

用于对输入信号的包络进行建模。

当针对根据本发明的编码器的两个滤波器1-A₁(z)和1-A₂(z)来实现此计算时，因而在E65处获得整形滤波器，其通过下式来给出：

H^{M} (z) = \frac{1 - P_{N 1} (z)}{1 - P_{D 1} (z)} \frac{1 - P_{N 2} (z)}{1 - P_{D 2} (z)} = \frac{1 - Σ_{k = 1}^{K_{c 1}} a_{1} (k) g_{N 1}^{k} z^{- k}}{1 - Σ_{k = 1}^{K_{c 1}} a_{1} (k) g_{D 1}^{k} z^{- k}} \frac{1 - Σ_{k = 1}^{K_{c 2}} a_{2} (k) g_{N 2}^{k} z^{- k}}{1 - Σ_{k = 1}^{K_{c 2}} a_{2} (k) g_{D 2}^{k} z^{- k}} - - - (47)

系数g_N1、g_D1、g_N2和g_D2使得可能对屏蔽滤波器的谱进行拟合，特别地是用于对该滤波器的谱的斜率进行调整的前两个系数。

如此获得了通过对两个滤波器进行串联所形成的屏蔽滤波器，其中已经对斜率滤波器和共振峰滤波器进行了解耦。此建模特别适于呈现出任何类型的谱斜率的信号，在此建模中，作为输入信号的谱特性的函数来对每个滤波器进行适配。在g_N1和g_N2是零的情况下，获得足以作为第一近似的两个自回归滤波器的串联屏蔽滤波。

参考图14来图示低复杂性的屏蔽滤波器的第二示范实现。

这里的原理在于，在取决于输入信号斜率由补偿滤波器施加去强调（deaccentuation）的情况下，直接使用对解码信号进行重构的ARMA滤波器的合成滤波器。

通过下式来给出屏蔽滤波器的表达式：

H^{M} (z) = \frac{1 - P_{z} (z / g_{z 1})}{1 - P_{P} (z / g_{z 2})} [1 - P_{Com} (z)] - - - (48)

在G.722、G.726和G.727标准中，ADPCM ARMA预测器拥有分母中的2个系数。在此情况下，在E71处计算的补偿滤波器将具有以下形式：

1 - P_{Com} (z) = 1 - Σ_{i = 1}^{2} p_{P} (i) g_{Com}^{i} z^{- i} - - - (49)

并且，在E70处给出的滤波器P_z(z)和P_P(z)将由在E72处给出的阻尼常数g_Z1和g_P1所约束的所述滤波器的版本来取代，以给出以下形式的噪声整形滤波器：

H^{M} (z) = \frac{1 + Σ_{i = 1}^{N_{Z}} p_{Z} (i) g_{Z 1}^{i} z^{- i}}{1 - Σ_{i = 1}^{N_{P}} p_{P} (i) g_{P 1}^{i} z^{- i})} [1 - Σ_{i = 1}^{2} p_{Com} (i) g_{Com}^{i} z^{- i}] - - - (50)

其中，通过进行如下取值：

p_Com(i)=0 i＝1,2

获得了由ARMA单元组成的屏蔽滤波器的简化形式。

屏蔽滤波器的另一非常简化的形式是通过仅仅取出具有轻微阻尼的ARMA预测器的分母所获得的屏蔽滤波器：

H^{M} (z) = \frac{1}{1 - P_{P} (z / g_{P})} - - - (51)

其中例如g_P=0.92。

用于信号的部分重构的此AR滤波器导致了减少的复杂性。

在具体的实施例中并且为了避免在每个采样时刻对滤波器进行适配，将可能把滤波器的系数固定（freeze）为在信号帧上或者每个帧几次地进行阻尼，从而保持平滑的效果。

执行此平滑的一种方式在于检测量化器输入处信号上的动态振幅的突变，或者按照等效的但是具有最小复杂性的方式，直接检测量化器输出处的索引。在索引的两个突变之间，获得了以下地带，其中谱特性波动较小，并因此，具有为了进行屏蔽而较好适配的ADPCM系数。

用于量化噪声的长期整形的单元的系数的计算

F^{j} (z) = \frac{1 - Σ_{k = - M_{P}}^{M_{P}} p_{2 M_{P}} (k) z^{- (Pitch + k)}}{1 - Σ_{k = - M_{P}}^{M_{P}} p_{1 M_{P}} (k) z^{- (Pitch + k)}} - - - (52)

是基于包括（contain）浊音（voiced sound）的周期分量的量化器的输入信号来进行的。可以注意到，如果我们期望获得用于周期信号的（具体地，用于浊语言声信号的）质量上的有价值的增强，则长期噪声整形是重要的。事实上，这是考虑用于编码器的周期信号的周期性的唯一方式，所述编码器的合成模型不包括任何长期预测器。

例如，通过使相关系数最大化，通过使图8的量化器Q^B输入处的长期二次预测误差e^B(n)最小化，来计算音调周期：

{Cor (i)}^{2} = \frac{{(Σ_{n = - 1}^{- N_{P}} e^{B} (n) e^{B} (n - i))}^{2}}{Σ_{n = - 1}^{- N_{P}} e^{B} {(n)}^{2} Σ_{n = - 1}^{- N_{P}} e^{B} {(n - i)}^{2}} i = P_{Min}, . . ., P_{Max} - - - (53)

音调使得：

Cor(Pitch)=Max{Cor(i)}i＝P_Min，...,P_Max

通过下式来给出用于生成屏蔽滤波器的音调预测增益Cor_f(i)：

{Cor}_{f} (Pitch + i) = \frac{Σ_{n = - 1}^{- N_{P}} e^{B} (n) e^{B} (n - Pitch + i)}{\sqrt{Σ_{n = - 1}^{- N_{P}} e^{B} {(n)}^{2} Σ_{n = - 1}^{- N_{P}} e^{B} {(n - Pitch + i)}^{2}}}

将通过下式来给出长期屏蔽滤波器的系数：

p_{2 M_{P}} (i) = g_{2 Pitch} {Cor}_{f} (Pitch + i) i = - M_{P}, . . ., M_{P}

以及

p_{1 M_{P}} (i) = g_{1 Pitch} {Cor}_{f} (Pitch + i) i = - M_{P}, . . ., M_{P}

通过ITU-T G.711.1标准"Wideband embedded extension for G.711 pulsecode modulation"的图8-4来描述用于减少音调的值的计算复杂性的方案。

图15提出了根据本发明的编码器的第二实施例。

针对核心编码级并且针对增强编码级两者，此实施例使用预测模块来取代参考图8所描述的滤波模块。

在此实施例中，具有核心量化噪声整形的ADPCM类型的编码器包括：预测模块1505，用于对重构噪声P_D(z)[X(z)-R^B(z)]进行预测，此重构噪声是输入信号x(n)与低比特率合成信号r^B(n)之间的差；以及加法模块1510，用于将该预测与输入信号x(n)相加。

它还包括用于信号

的预测模块810，其与参考图8所描述的预测模块一致，其基于经由低比特率量化索引I^B(n)所量化的误差信号

的先前采样并且基于重构的信号r^B(n′)n′=n-1,...,n-N_P来进行预测。用于从修改后的输入信号x(n)中减去预测的减法模块1520提供了预测误差信号。

核心编码器还包括：模块P_N(z)1530，用于计算基于量化噪声q^B(n′)n′=n-1,...,n-N_NH的先前采样来进行的噪声预测；以及减法模块1540，用于从该预测误差信号中减去如此获得的预测，以获得表示为e^B(n)的误差信号。

1550处的核心量化模块Q^B执行二次误差准则

E_{j}^{B} {[e^{B} (n) - y_{j}^{B} (n) v (n)]}^{2} j = 0, . . ., N_{Q} - 1

的最小化，其中值

是重构的等级，并且v(n)是源自于量化器适配模块1560的比例因子。量化模块接收误差信号e^B(n)作为输入，从而给出量化索引I^B(n)和量化后的信号

作为输出。作为G.722的示例，通过X.Maitre.编著的文章"7 kHz audio coding within64 kbit/s".IEEE Journal on Selected Areas in Communication,Vol.6-2,February1988的表格VI来定义核心量化器Q^B的重构等级。

在经由传送信道840而传送到诸如参考图7所描述的解码器之前，在量化模块Q^B输出处的B个比特的量化索引I^B(n)将在830处与增强比特J₁、...、J_k多路复用。

用于计算量化噪声的模块1570计算量化器的输入与量化器的输出之间的差

模块1580通过将信号的预测与量化后误差相加

来计算重构的信号。

量化器的适配模块Q_Adapt1560给出了用于接下来的时刻的等级控制参数v(n)，其也称为比例因子。

预测模块的适配模块P_Adapt 811基于重构信号r^B(n)的过去采样并且基于重构的量化误差信号

来执行适配。

增强级EAk包括模块EAk-10，该模块EAk-10用于从输入信号x(n)中减去在在先级处重构的信号r^B+k-1(n)，以给出信号

滤波模块EAk-11通过滤波器

来执行信号

的滤波，以给出滤波后的信号

还提供了用于计算预测信号的模块EAk-12，该计算是基于量化误差信号

的量化后先前采样并且基于通过所滤波的此信号的采样来执行的。增强级EA-k还包括减法模块EA-k13，用于从信号

中减去预测

以给出目标信号

增强量化模块EAk-14

执行使二次误差准则最小化的步骤：

E_{j}^{B + k} = {[e_{w}^{B + k} (n) - {enh}_{vj}^{B + k} (n) v (n)]}^{2} j = 0,1

此模块接收信号

作为输入，并且提供量化后信号

作为第一输出，并且提供索引J_k作为第二输出。

通过将具有B+k-1个比特的量化器的嵌入式输出等级一分为二来计算具有B+k个比特的嵌入式量化器的重构等级。对具有B+k个比特的嵌入式量化器的这些重构等级与具有B+k-1个比特的量化器的重构等级之间的差值进行计算。其后，将差值只此一次地存储在处理器存储器中，并且通过组合核心量化索引和先前级的增强量化器的索引来对其添加索引。

因而，这些差值构成了字典，级k的量化模块使用该字典来获得可能的量化值。

还将加法模块EAk-15以及模块EAk-16集成到增强级k中，该加法模块EAk-15用于将量化器输出处的信号

与预测相加，并且模块EAk-16用于将在先信号与在前一级处重构的信号r^B+k-1(n)相加，以给出级k处的重构信号r^B+k(n)。

正如参考图8所描述的编码器一样，先前所详述的模块Calc Mask 850基于输入信号（图13）或者基于如参考图14所解释的ADPCM合成滤波器的系数，来提供屏蔽滤波器。

因而，增强级k针对当前采样实现以下步骤：

-通过计算分级编码的输入信号x(n)与源自于前一增强编码级的增强编码的重构信号r^B+k-1(n)之间的差，来获得差信号

-通过预定的屏蔽滤波器W(z)，来对该差信号进行滤波；

-从滤波后的差信号

中减去预测信号以获得目标信号

-通过将信号

与源自于量化步骤的信号

相加，来计算通过

所滤波的量化器输出处的信号；

-通过将源自于前一增强编码级的增强编码的重构信号与先前滤波后的信号相加，来计算用于当前采样的重构信号r^B+k(n)。

为了简单解释的目的而给出了图15，以用于由单一ARMA单元组成的屏蔽滤波器。要理解，将根据等式7到17所描述的、图9和10中的方案来做出到几个串联的ARMA单元的归纳。

在屏蔽滤波器仅包括1-P_D(z)类型的一个单元（即，P_N(z)=0）的情况下，将根据

来推导出基值（contribution）

或更佳地，将通过使用下式取代EAk-11和EAk-13，来给出量化器的输入信号：

E^{B + k} (z) = D_{P}^{B + k} (z) - P_{D} (z) [D_{P}^{B + k} (z) - E_{Q}^{B + k} (z)]

要理解，到几个串联的单元AR的归纳将根据等式7到17所描述的、图9和10中的方案来做出。

图16表现了本发明的第三实施例，这次其具有PCM类型的核心编码级。核心编码级1600包括借助于预测模块P_r(z)1610的编码噪声的整形，该预测模块P_r(z)1610基于G.711标准化PCM量化噪声

的先前采样并且基于滤波后的噪声

来计算噪声的预测

要注意，与图16中的块1610、1620、1640和1650对应的核心编码的噪声整形是可选的。诸如图16所表现的本发明甚至应用于被缩减为块1630的PCM核心编码。

模块1620进行预测

与输入信号x(n)的相加，以获得表示为e(n)的误差信号。

核心量化模块

1630接收误差信号e(n)作为输入，以给出量化索引I^B(n)。最优量化索引I^B(n)和量化后的值

使误差准则最小化，其中值

是G.711 PCM量化器的重构等级。

作为示例，通过ITU-T协议G.711,"Pulse Code Modulation(PCM)ofvoice frequencies"的用于A律的表格1a和用于μ律的表格2a来定义用于B=8的G.711标准的核心量化器

的重构等级。

在经由传送信道840而传送到G.711类型的标准解码器之前，在量化模块输出处的B个比特的量化索引I^B(n)将在830处与增强比特J₁,...,J_K进行级联。

用于计算量化噪声的模块1640计算PCM量化器的输入与量化后的输出之间的差

q_{QMIC}^{B} (n) = e_{QMIC}^{B} (n) - e^{B} (n) .

用于计算滤波后的量化噪声的模块1650执行量化噪声与量化噪声的预测的相加

q_{MICf}^{{BK}_{M}} (n) = q^{B} (n) + p_{R}^{{BK}_{M}} (n) .

增强编码在于，通过连续地对量化比特进行相加、同时保持用于中间比特率的重构噪声的最优整形，来增强解码信号的质量。

通过块EAk来描述级k，其使得可能获得增强PCM比特J_k或比特组J_k k=1,G_K。

此增强编码级与参考图8所描述的增强编码级相似。

它包括减法模块EAk-1，该减法模块EAk-1用于从由用于采样n-N_D,...,n-1的级k处合成的信号r^B+k(n)以及用于时刻n的级k-1处合成的信号r^B+k-1(n)形成的信号r^B+k(n)中减去输入信号x(n)，以给出编码误差信号e^B+k(n)。

它还包括滤波模块EAk-2，该滤波模块EAk-2用于通过与屏蔽滤波器H^M(z)的逆相等的加权函数W(z)来对e^B+k(n)进行滤波，以给出滤波后的信号

量化模块EAk-3执行误差准则

（令j=0、1）的最小化，其进行增强量化

该增强量化

具有要与前一步骤的PCM索引I^B+k-1级联的最优PCM比特J_k的值作为第一输出，并且具有用于最优PCM比特J_k的增强量化器的输出信号作为第二输出

用于将量化误差信号

与在前一步骤处合成的信号r^B+k-1(n)相加的加法模块EAk-4给出了步骤k处的合成信号r^B+k(n)。如先前针对图6和8所描述地，对信号e^B+k(n)和滤波器的存储器进行适配。

按照参考图8所描述的和参考图15所描述的相同方式，模块850计算用于核心编码并且用于增强编码两者的屏蔽滤波器。

可能设想图8、15或16所表现的分级编码器的其他版本。在变型（variant）中，增强编码中可能量化值的数目针对每个编码采样而变化。增强编码作为要编码的采样的函数来使用可变的比特数目。可以根据固定的或者可变的分配规则来对分配的增强比特的数目进行适配。例如，通过ITU-T G.711.1标准中的低波段的增强PCM编码来给出示范的可变分配。优选地，如果分配算法是可变的，则它必须使用远程解码器可用的信息，使得不需要传送附加的信息，这是例如ITU-T G.711.1标准中的情况。

相似地，并且在另一变型中，给出增强编码中的标量量化索引（J_k(n)）的增强信号的编码采样的数目可以小于输入信号的采样的数目。当针对某些采样而将分配的增强比特的数目设置为零时，根据前一变型来推导出此变型。

现在，参考图17来描述根据本发明的编码器的示范实施例。

在硬件项目中，诸如根据处于本发明意图内的第一、第二或第三实施例所描述的编码器典型地包括处理器μP，该处理器μP用于与存储器块BM进行协作，该存储器块BM包括储存器和/或工作存储器、以及前述缓冲存储器MEM，以作为用于存储例如在先编码级的量化值、亦或量化重构的等级的字典、或者用于实现诸如参考图6、8、15和16所描述的编码方法所需的任何其他数据的部件。此编码器接收数字信号x(n)的连续帧作为输入，并且传递级联的量化索引I^B+K。

存储器块BM可以包括计算机程序，该计算机程序包括以下代码指令，当编码器的处理器μP执行这些指令时，所述代码指令用于实现根据本发明的方法的步骤，且具体地为：具有称作核心比特率的预定比特率的编码，其传递用于当前帧的每个采样的标量量化索引；以及至少一个增强编码，其传递用于增强信号的每个编码后采样的标量量化索引。此增强编码包括以下步骤：获得用于确定目标信号的用于对编码噪声进行整形的滤波器。通过使标量量化的可能值集合与所述目标信号之间的误差最小化，来确定所述增强信号的标量量化的索引。

更一般地，计算机或处理器可读的、可以或者可以不与该编码器集成到一起的、可选地为可移动的存储部件存储用于实现根据本发明的编码方法的计算机程序。

例如，图8、15或16可以图示这样的计算机程序的算法。

Claims

1.一种对数字音频信号进行分级编码的方法，该方法针对输入信号的当前帧包括：

-核心编码，其传递用于当前帧的每个采样（x(n)）的标量量化索引（I^B(n)）；以及

-至少一个增强编码，其传递用于增强信号的每个编码后采样

的标量量化的索引（J_k(n)），

其特征在于，该增强编码包括以下步骤：获得用于确定目标信号的用于对编码噪声进行整形的滤波器（W(z)），并且其特征在于，通过使标量量化的可能值的集合与所述目标信号之间的误差最小化，来确定所述增强信号的标量量化

的索引（J_k(n)）。

2.根据权利要求1的方法，其特征在于，该方法进一步包括确定用于当前增强编码级的目标信号的步骤，该步骤针对当前采样包括以下步骤：

-通过组合分级编码的输入信号（x(n)）、与部分地基于前一编码级并且基于当前增强编码级的重构信号的过去采样所重构的信号，来获得增强编码误差信号（e^B+k(n)）；

-通过所获得的噪声整形滤波器（W(z)）来对增强编码误差信号进行滤波，从而获得该目标信号

-通过将源自于前一编码级的编码的重构信号（r^B+k-1(n)）与源自于量化步骤的信号

相加来计算用于当前采样的重构信号（r^B+k(n)）；

3.根据权利要求1的方法，其特征在于，可能标量量化值的集合和用于当前采样的误差信号的量化值是用于表示通过相对于核心比特率量化索引所计算的等级控制参数来标称的量化重构等级的值。

4.根据权利要求3的方法，其特征在于，通过用于表示具有B+k个比特的嵌入式量化器的量化的重构等级的值与用于表示具有B+k-1个比特的嵌入式量化器的量化重构等级的值之间的差来定义表示出用于增强级k的量化重构等级的值，其中B表示了核心编码的比特的数目，具有B+k个比特的嵌入式量化器的重构等级通过将具有B+k-1个比特的嵌入式量化器的重构等级一分为二来定义。

5.根据权利要求4的方法，其特征在于，表示用于增强级k的量化重构等级的值被存储在存储空间中，并且作为核心比特率量化和增强索引的函数来对其添加索引。

6.根据权利要求1的方法，其特征在于，可能标量量化值的数目针对每个采样而变化。

7.根据权利要求1的方法，其特征在于，给出标量量化索引（J_k(n)）的所述增强信号的编码后采样的数目小于该输入信号的采样的数目。

8.根据权利要求1的方法，其特征在于，该核心编码是使用标量量化和预测滤波器的ADPCM编码。

9.根据权利要求1的方法，其特征在于，该核心编码是PCM编码。

10.根据权利要求8和9之一的方法，其特征在于，该核心编码针对当前采样还包括以下步骤：

-基于过去量化噪声采样并且基于预定噪声整形滤波器所滤波的量化噪声的过去采样，来获得用于编码噪声的预测信号

11.根据权利要求10的方法，其特征在于，增强编码所使用的所述噪声整形滤波器（W(z)）还被核心编码所使用。

12.根据权利要求1的方法，其特征在于，作为所述输入信号的函数来计算该噪声整形滤波器。

13.根据权利要求1的方法，其特征在于，基于由核心编码所本地解码的信号，来计算该噪声整形滤波器。

14.一种数字音频信号的分级编码器，该分级编码器针对输入信号的当前帧包括：

-核心编码级（800、1500、1600），其传递用于当前帧的每个采样的标量量化索引（I^B(n)）；以及

-至少一个增强编码级（EA-k），其传递用于增强信号的每个编码后采样的标量量化

的索引（J_k(n)），

其特征在于，该增强编码级包括：模块（850），用于获得用于确定目标信号的用于对编码噪声进行整形的滤波器（W(z)）；以及量化模块（EAk-3、EAk-4），用于通过使标量量化的可能值的集合与所述目标信号之间的误差最小化，来传递所述增强信号的标量量化的索引（J_k(n)）。