CN101385079B

CN101385079B - 在音频编码/解码中用于知觉加权的设备

Info

Publication number: CN101385079B
Application number: CN200780005513XA
Authority: CN
Inventors: 斯蒂芬·拉戈特; 罗曼·特里林
Original assignee: France Telecom SA
Current assignee: Orange SA
Priority date: 2006-02-14
Filing date: 2007-02-07
Publication date: 2012-08-29
Anticipated expiration: 2027-02-07
Also published as: JP5117407B2; US20090076829A1; KR20080093450A; WO2007093726A3; EP1989706B1; WO2007093726A2; EP1989706A2; CN101385079A; US8260620B2; JP2009527017A; KR101366124B1; ATE531037T1

Abstract

一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频编码器，所述编码器包括：用于编码在所述频带的第一子带中的原始信号的核心编码器(305)；用于从所述原始信号和来自所述核心编码器的信号中计算残差信号(e)的级(306)；用于对所述残差信号(e)进行知觉加权的设备。根据本发明，所述知觉加权设备包括具有增益补偿的知觉加权滤波器(307)，其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和在第二子带中的信号之间的频谱的连续性。应用于传输和存储诸如音频语音、音乐等信号之类的数字信号。

Description

在音频编码/解码中用于知觉加权的设备

技术领域

本发明涉及一种用于在给定频带中编码/解码音频信号的知觉加权设备(perceptual weighting device)。也涉及包括本发明的编码/解码设备的分级音频编码器和分级音频解码器。

本发明在传输和存储诸如音频语音、音乐等信号之类的数字信号方面具有特别有利的应用。

背景技术

存在用于数字化和压缩音频语音、音乐等信号的各种技术。最常用的方法是：

·诸如PCM和ADPCM编码的“波形编码”方法；

·“参数分析/合成编码”方法，诸如码本激励线性预测(CELP)编码；

·“子带或变换知觉(perceptual)编码”方法。

在编者W.B.Kleijn和K.K.Paliwal的″Speech Coding and Synthesis″，Elsevier，1995一书中描述了这些用于编码音频-频率信号的传统技术。

在这里，本发明更具体地关注包括CELP编码和变换编码技术的预测变换编码方法。

在传统语音编码中，编码器按照固定的比特率产生比特流。这种固定的比特率对简化的实现和通常被组合地称为“编解码器”的编码器和解码器的使用方面存在限制。这样的系统的示例是：64千比特每秒(kbps)的ITU-T G.711编码系统、8kbps的UIT-T G.729编码系统和12.2kbps的GSM-EFR编码系统。

然而，在诸如移动电话、IP话音、以及专用(ad hoc)网络上的通信之类的某些应用中，其优选按照可变比特率产生比特流，具有由预定义的集合中取得的比特率。许多比固定比特率编码更灵活的多比特率编码技术因此能够被区分为：

·源和/或信道控制的多模编码，如用于AMR-NB、AMR-WB、SMV、和VMR-WB系统；

·分级编码，也叫作“分层(scalable)”编码，其产生分级的比特流，在此意义上，其包括核心比特率和一个或多个增强层。在48kbps、56kbps和64kbps的G.722系统是比特率分层编码的简单示例。MPEG-4CELP编解码器是在比特率和带宽中的分层；此类编解码器的其它示例能够在以下论文中找到：B.Kovesi、D.Massaloux、A.Sollaud的″A Scalable Speech and AudioCoding Scheme with Continuous Bitrate Flexibility″，ICASSP 2004；

·多描述编码。

本发明更具体地涉及分级编码。

分级或“分层”音频编码的基本概念在例如以下论文中说明：Y. Hiwasaki、T.Mori、H.Ohmuro、J.Ikedo、D.Tokumoto以及A.Kataoka的″Scalable SpeechCoding Technology for High-Quality Ubiquitous Communications″，NTTTechnical Review，2004年3月。

在此类型的编码中，比特流包括基本层或核心层，以及一个或多个增强层。基本层由已知为核心“编解码器”的编解码器按低的固定比特率产生，所述低的固定比特率保证编码质量的某最小级别并且必须被解码器接收以便维持可接受级别的质量。

增强层被用来增强质量；它们将不会全部被解码器接收。分级编码的主要好处是能够简单通过截断该比特流来适配比特率。层的可能数量(即，比特流截断的可能数量)定义编码颗粒度：在强颗粒度编码中比特流包括较少的层(达到2-4层)，同时精细颗粒度编码提供达例如1kbps级的增量。

本发明更具体涉及使用电话带中的CELP类型的核心编码器和一个或多个宽带增强层的比特率和带宽分层编码技术。该系统的示例在以下论文中给出：H.Taddéi等人的″A Scalable Three Bitrate(8，14.2，and 24kbps)AudioCoder″，107^th Convention AES，1999，具有8kbps、14.2kbps、和24kbps的粗糙颗粒度；并且在B.Kovesi等人的前述论文中参考6.4kbps到32kbps的精细颗粒度。

在2004，ITU-T启动了标准化分级核心编码器的项目。该G.729EV编码器(EV表示“嵌入的可变比特率”)是已知的G.729编码器的补充。G.729EV标准的目标是获得G.729核心分级编码器，G.729核心分级编码器为对话服务产生在8kbps到32kbps的比特率的具有从窄带(300赫兹(Hz)到3400Hz)到宽带(50Hz到7000Hz)扩展的频带的信号。该编码器固有地能够与G.729建议(recommendation)互通，这确保了与现有IP话音装备的兼容性。

图1所示的8kbps到32kbps分级音频编码器被提出以响应以上项目并在以下ITU-T文档中描述：ITU-T document COM 16，D135(WP 3/16)，“France Telecom G.729EV Candidate：High level description and complexityevaluation”，Q.10/16，2005-2008研究期，日内瓦，2005年7月26日-8月5日。该编码器实现三层编码，包括级联CELP编码、通过全频带线性预测编码(LPC)的频带扩展和预测变换编码。在施加改进离散余弦变换(MDCT)之后施加TDAC(时域声音混叠(aliasing)消除)编码。预测变换编码层使用全频带知觉加权滤波器

在前述的W.B.Kleijn等人的出版物中解释了通过知觉加权滤波修整编码噪声的概念。本质上，知觉加权滤波通过削弱噪声密度高且噪声更容易被屏蔽的频率处的信号来修整该编码噪声。

在窄带CELP编码中最广泛地使用的知觉加权滤波器具有

的形式，其中，0≤γ₂≤γ₁＜1并且表示具有5毫秒(ms)到30ms长度的信号段的LPC频谱。因此在CELP编码中的合成分析等于(amounts to)在由该类型的滤波器知觉加权的信号域中最小化二次误差。

然而，在G.729EV标准的情况下提出的该技术具有使用全频带知觉加权滤波器的缺点。该关联的滤波器就计算时间而言相对复杂。

因此要由本发明的主题解决的技术问题是提出一种用于在给定频带中编码/解码音频信号的知觉加权设备，其提供全频带知觉加权滤波，即，在所述给定频带的整个之上，尤其在分级音频编码器的0到8000Hz的宽带上，没有此操作将导致长时间计算，就资源而言其代价是高的。

发明内容

对于所述的技术问题的根据本发明的解决方案是，所述编码/解码在所述给定频带中的多个相邻子带中实现，所述设备包括，在至少一个子带中，具有增益补偿的知觉加权滤波器，其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和与所述子带相邻的子带中的信号之间的频谱的连续性。

因此本发明的知觉加权设备实现一个或多个子带上所需的滤波，其限制了计算的复杂性。而且，通过增益补偿消除了在知觉加权滤波的增益之间的从一个子带到另一个的不一致，这确保在整个频带上的频谱连续性。本发明由此在知觉加权滤波之后产生同质(homogeneous)的频带，即便从组成其的子带是被单独处理的观点来看也如此。

这样的特别重要的优点是全频带变换编码能够被施加在子带上，否则这些子带不是同质的，因为它们被单独的滤波。

当然，每个子带能够使用知觉加权或不使用知觉加权滤波。由此能够在滤波的子带和另一个没有滤波的子带之间或在两个滤波的子带之间提供频谱的连续性。

在一个实施例中，所述具有增益补偿的知觉加权滤波器包括知觉加权滤波器和增益补偿模块。

在另一个实施例中，所述具有增益补偿的知觉加权滤波器包括合并增益补偿的知觉加权滤波器。

那么在第一子带的所述知觉加权滤波器能够具有形式

其中

表示线性预测滤波器。在此情形中，本发明示教所述增益补偿应当地的实现依据以下定义的因子fac的乘法，

fac = | \frac{Σ_{i = 0}^{p} {(- γ_{2})}^{i} {\hat{a}}_{i}}{Σ_{i = 0}^{p} {({- γ}_{1})}^{i} {\hat{a}}_{i}} | .

其中

是所述线性预测滤波器

的系数。

阶为p和具有系数

的线性预测滤波器

定义如下：

\hat{A} (z) = {\hat{a}}_{0} + {\hat{a}}_{1} z^{- 1} + {\hat{a}}_{2} z^{- 2} + . . . + {\hat{a}}_{p} z^{- p}

本发明也涉及一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频编码器，所述编码器包括：

·用于编码在所述频带的第一子带中的原始信号的核心编码器；

·用于从所述原始信号和来自所述核心编码器的信号中计算残差信号的级；

·用于对所述残差信号进行知觉加权的设备；

值得注意的是所述知觉加权设备包括具有增益补偿的知觉加权滤波器，其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和在第二子带中的信号之间的频谱的连续性。

在该实施例中，仅第一子带经历知觉加权滤波，而第二子带没有被滤波。

此外，如果所述增益补偿的所述知觉加权滤波器包括在第一子带中的知觉加权滤波器，则本发明示教在在第一子带的所述知觉加权滤波器具有形式

其中表示线性预测滤波器。在此情形中，在第一子带中的增益补偿的实现依据等于下式的因子fac₁的乘法，

fa c_{1} = | \frac{Σ_{i = 0}^{p} {(- γ_{2})}^{i} {\hat{a}}_{i}}{Σ_{i = 0}^{p} {({- γ}_{1})}^{i} {\hat{a}}_{i}} | .

其中

是所述线性预测滤波器

的系数。

有利地，在第一子带的来自知觉加权设备的信号和在第二子带中的原始信号被施加到各自的变换分析模块，并且所述变换分析模块被连接到在所述频带的变换编码器。

在本发明的分级音频编码器的变型中，所述编码器也包括用于知觉加权在第二子带的原始信号的知觉加权设备，其包括具有增益补偿的知觉加权滤波器，被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和在第一子带中的知觉加权滤波器的输出信号之间的频谱的连续性。

因此，这是在两个子带中单独实现知觉加权滤波的编码器。

如果所述具有增益补偿的知觉加权滤波器包括在第二子带中的知觉加权滤波器，则在第二子带的知觉加权滤波器具有形式

其中

表示线性预测滤波器。在此例中，所述在第二子带中的增益补偿的实现依据等于下式的因子fac₂的乘法，

fa c_{2} = | \frac{Σ_{i = 0}^{p} {({γ^{'}}_{2})}^{i} {\hat{a}}^{'}_{i}}{Σ_{i = 0}^{p} {({γ^{'}}_{1})}^{i} {\hat{a}}^{'}_{i}} | .

其中

是所述线性预测滤波器的系数。

在第一子带的来自知觉加权设备的信号和在第二子带中的来自知觉加权设备的信号被有利地施加到各自的变换分析模块，并且所述变换分析模块被连接到在所述频带的变换编码器。

本发明还涉及一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频解码器，所述解码器包括：

·核心解码器，适配来在所述频带的第一子带中解码接收的由根据本发明的编码器编码的信号；

·反向知觉加权设备，用于对代表在第一子带中由所述编码器的知觉加权设备加权的残差信号的信号进行反向知觉加权；

值得注意的是，所述反向知觉加权设备包括具有增益补偿的知觉加权滤波器，这是在第一子带的编码器的具有增益补偿的知觉加权滤波器的反向过程。

可替换地，本发明示教所述解码器也包括在第二子带的解码信号的反向知觉加权设备，其包括具有增益补偿的知觉加权滤波器，这是在第二子带的编码器的具有增益补偿的知觉加权滤波器的反向过程。

在后一情形中，如果所述具有增益补偿的知觉加权滤波器包括在第二子带中的知觉加权滤波器，则所述具有增益补偿的反向知觉加权滤波器包括在第二子带中的反向知觉加权滤波器。尤其，所述在第二子带的反向知觉加权滤波器具有形式并且通过频带扩展模块提供该线性预测滤波器

的系数。

本发明还涉及一种在给定频带中编码音频信号的知觉加权方法，值得注意的是，所述编码在所述频带中的多个相邻子带中实现，所述方法包括，在至少一个子带中，具有增益补偿的知觉加权的步骤，被适配来实现在来自所述具有增益补偿的知觉加权步骤的输出信号和与所述子带相邻的子带中的信号之间的频谱的连续性。

最后，本发明涉及一种用于解码在给定频带中根据用于编码所述信号的知觉加权的方法编码的音频信号的知觉加权方法，值得注意的是，所述方法包括在所述子带中具有增益补偿的知觉加权的步骤，这是具有增益补偿的知觉加权步骤的反向过程。

附图说明

通过非限制性示例提供的参照附图的以下说明清楚地解释本发明的组成和其如何能够被简化实现。

图1是现有技术中分级音频编码器的图，在变换编码之前进行全频带知觉加权滤波；

图2是本发明的分级音频编码器的高层的图；

图3是图2的编码器的知觉加权设备的图；

图4示出展示在第一子带依照本发明被滤波然后增益补偿的信号的幅度以及在第二子带中没有被滤波的信号的幅度的频谱；

图5是本发明的分级音频解码器的高层的图；

图6是图2的分级音频编码器的变型的图；

图7是图5的分级音频解码器的变型的图；

图8示出展示在第一子带依照本发明被滤波然后增益补偿的信号的幅度以及在第二子带中依照本发明被滤波然后均衡的信号的幅度的频谱。

具体实施方式

图2示出关于比特率从8kbps到32kbps的子带分级音频编码器。该图示出相应编码方法的各种步骤。

在从50Hz到7000Hz的“宽”频带中的并按16kHz采样的输入信号首先由二次镜像滤波器(quadrature mirror filter QMF)划分成两个相邻的子带。通过低通(L)滤波300和抽选301获得第一子带，其从0到4000Hz，也叫做低频带，通过高通(H)滤波302和抽选303获得第二子带，其从4000Hz到8000Hz，也叫做高频带。在优选实施例中，L滤波器300和H滤波器302具有长度64并且在以下论文中描述：J.Johnston，″A filter family designed foruse in quadrature mirror filter banks″，ICASSP，vol.5，pp.291-294，1980。

第一子带在由窄带CELP核心编码器305编码之前由消除50Hz以下的分量的高通滤波器304进行预处理。高通滤波器考虑宽带定义为涵盖范围50Hz到7000Hz的事实。在该实施例中，窄带CELP编码对应于图1所示的并且由使用修改的G.729编码的级联的CELP编码组成，其中第一级(ITU-TRecommendation G.729，“Coding of Speech at 8kbps using Conjugate StructureAlgebraic Code Excited Linear Prediction(CS-ACELP)”，1996年3月)没有预处理滤波器，而第二级由附加的固定字典(dictionary)组成。通过级306计算与由CELP编码导致的误差关联的残余信号e然后由包括知觉加权滤波器的设备307对其进行知觉加权以获得时域信号x_lo，利用改进离散余弦变换(MDCT)308分析x_lo以获得在频域的离散频谱X_lo。

图3示出知觉加权设备307，其中W₁(z)包括包含分别为

和

滤波级501和502的知觉加权滤波器

如图2所示，线性预测滤波器

是基于窄带CELP编码的。知觉加权设备307也包括增益补偿模块503，用于将来自滤波器501、502的知觉加权信号与如下定义的因子fac₁相乘，

fa c_{1} = | \frac{Σ_{i = 0}^{p} {(- γ_{2})}^{i} {\hat{a}}_{i}}{Σ_{i = 0}^{p} {({- γ}_{1})}^{i} {\hat{a}}_{i}} |

其中，

是滤波器的系数，

\hat{A_{1}} (z) = {\hat{a}}_{0} + {\hat{a}}_{1} z^{- 1} + {\hat{a}}_{2} z^{- 2} + . . . + {\hat{a}}_{p} z^{- p}

在优选实施例中，系数

按每5ms子帧更新，γ₁＝0.96、且γ₂＝0.6。

因子fac₁的等价定义对应于滤波器

在尼奎斯特频率(Nyquist frequency)(4kHz)处的增益的倒数，也就是说，对于z＝-1：

{fac}_{1} = 1 / | {\hat{A}}_{1} (z / γ_{1}) / {\hat{A}}_{1} (z / γ_{2}) |

在第二子带或高频带的频谱混叠消除309被首先实现用于结合抽选303补偿由高通滤波302导致的混叠。该高频带然后被由低通滤波器310预处理以消除在原始信号中介于7000到8000Hz的分量。然后MDCT变换311被施加到在时域的生成信号x_hi以获得在频域的离散频谱X_hi。然后是基于x_hi和X_hi的频带扩展312。

信号x_lo和x_hi被分成N个采样的帧并且长度L＝2N的MDCT变换分析当前的和以后的帧。在优选的实施例中，x_lo和x_hi是按8kHz采样的窄带信号并且N＝160(20ms)。MDCT变换x_lo和X_hi因此包括N 160系数，每个系数表示4000/160＝25Hz的频带。在优选的实施例中，通过由以下论文描述的算法实现该MDCT变换：P. Duhamel、Y. Mahieux、J.P. Petit的“A fast algorithmfor the implementation of filter banks based on time domain aliasingcancellation”，ICASSP，vol.3，pp.2209-2212，1991。

在变换编码模块313中编码低频带和高频带MDCT频谱X_lo和X_hi。

由编码模块305产生的比特流312和313在复用器314中被复用和组织成分级比特流。

通过20ms帧(即320个采样的块)实现编码。编码比特率是8kbps、12kbps、14kbps到32kbps。

下面参考图4解释具有因子fac₁的增益补偿的知觉加权步骤的优点。

该图示出总频带分成第一子带(即，由0到4kHz的低频带)和第二子带(即，由4到8kHz的高频带)。在优选实施例中，MDCT编码器313被施加到这两个子带，包括：

·在应用MDCT变换于低频带中之前的知觉加权滤波W₁(z)和增益补偿；

·在高频带应用直接MDCT变换，没有知觉加权滤波。

子带中的这两个操作在图4中通过分别为低频带的

的幅度响应和高频带中在0dB的平坦响应(flat response)被图解地示出。该后面的平直响应示出在施加MDCT变换之前没有处理被施加在高频带中。因子fac₁的增益补偿移动的幅度响应来确保4kHz处的连续性。此连续性十分重要，因为其随后使得两种离散频谱X_lo和X_hi的同质编码(homogeneous coding)能够结合成单个矢量X，由此其代表全频带离散频谱。

重要的是要注意到这里使用值0dB来定义低频带和高频带之间的连续性仅是说明性的。

与刚刚参照图2、3和4描述的编码器关联的分级音频解码器在图5中示出，其展示解码由所述编码器编码的信号的步骤。

定义每个20ms帧的比特在解复用器700中被解复用。以下描述在8kbps到32kbps的解码，虽然在实践中比特流能够被截断为8kbps、12kbps、14kbps或在14kbps和32kbps之间。

在8kbps和12kbps的各层的比特流被CELP解码器701用来产生从0到4000Hz的第一子带(窄频带)中的第一合成。与在14kbps的层关联的比特流部分被频带扩展模块702解码，并且MDCT变换703被施加到从4000Hz到7000Hz的第二子带(高频带)中获得的信号以生成频谱MDCT解码704从与介于14kbps到32kbps的比特率关联的比特流中产生在低频带的重建频谱

和在高频带的重建频谱

这两种频谱通过施加方框705和706中的MDCT逆变换被转换时域信号

和

在由反向知觉加权设备707滤波之后信号通过加法器708与CELP合成相加。然后在709处对该结果进行后滤波。

依靠施加过采样的合成QMF滤波器排(bank)(710和712)、低通滤波(711)、高通滤波(713)和求和(714)获得在宽频带的、按16kHz采样的输出信号。

通过反向知觉加权设备707W₁(z)^-1实现含增益补偿的知觉解码的步骤，其中反向知觉加权设备707W₁(z)^-1包括反向知觉加权滤波器

和增益补偿模块，该增益补偿模块用于将来自所述反向知觉加权滤波器的信号与以下因子1/fac₁相乘：

1 / fa c_{1} = | \frac{Σ_{i = 0}^{p} {(- γ_{1})}^{i} {\hat{a}}_{i}}{Σ_{i = 0}^{p} {({- γ}_{2})}^{i} {\hat{a}}_{i}} |

其中，

是滤波器

的系数，自窄频带的CELP编码中产生。如在编码器一样，系数在每个5ms子帧中维持恒定。

图6示出编码器的图2实施例的变型。

该图示出分析滤波器排900到903、通过方框904到908的低频带的处理、通过方框909到910的高频带的预处理、MDCT编码器913和复用器915。

在此变型和图2的实施例之间的主要区别是在第二子带(高频带)中的线性预测(LPC)分析和量化的并入。通过频带扩展模块911提供在高频带量化的LPC系数

这里不详细描述基于LPC的频带扩展，因为其超出本发明的范围。这些LPC系数使得在施加MDCT变换913之前能够在设备912中应用具有增益补偿W₂(z)的知觉加权滤波。因此，该变型在于低频带的差分信号e和高频带的信号x_hi的知觉加权，然而先前描述的实施例仅对低频带的差分信号e进行知觉加权。

在该变型中，在高频带具有增益补偿W₂(z)的知觉加权设备912采用与在低频带的滤波器W₁(z)的相同的形式。由此它是类型

的滤波器，带有如下定义的增益补偿因子fac₂：

fa c_{2} = | \frac{Σ_{i = 0}^{p} {({γ^{'}}_{2})}^{i} {\hat{a}}^{'}_{i}}{Σ_{i = 0}^{p} {({γ^{'}}_{1})}^{i} {\hat{a}}^{'}_{i}} | .

其中，

是滤波器的系数：

{\hat{A}}_{2} (z) = {\hat{a}}^{'}_{0} + {\hat{a}}^{'}_{1} z^{- 1} + {\hat{a}}^{'}_{2} z^{- 2} + . . . + {\hat{a}}^{'}_{p} z^{- p}

并且γ′₁＝0.96和γ′₂＝0.6。

此因子对应于：

{fac}_{2} = 1 / | {\hat{A}}_{2} (z / {γ^{'}}_{1}) / {\hat{A}}_{2} (z / {γ^{'}}_{2}) |

对于z＝1，即，频率0Hz或在高频带的DC分量，一旦该频率回复到在QMF滤波之前的输入信号的频率，其实际对应于4kHz。

参考图8解释在两个子带中具有增益补偿的知觉加权的好处，图8示出划分的低频带(0到4kHz)和高频带(4kHz到8kHz)。在这里考虑的变型中，MDCT编码器被施加到两个子带，包括：

·在低频带中早于MDCT的滤波W₁(z)；

·在高频带中早于MDCT的滤波W₂(z)。

这两种子带操作分别由低频带中

的幅度响应和高频带中

的幅度响应表示。

在低频带和高频带中增益补偿通过各自的因子fac₁和fac₂确保在4kHz处的滤波器的响应的连续性。正是此连续性使得这两类离散频谱X_lo和X_hi随后能够被编码在单个矢量中。再次，很重要的是注意到这里使用值0dB来定义低频带和高频带之间的连续性仅是说明性的。

对应于此变型的分级音频解码器在图7示出。与先前实施例的解码器相比的唯一区别是由频带扩展模块1002使用的量化LPC系数

的恢复和对信号应用反向知觉加权滤波器W₂(z)^-1。在高频带使用的反向滤波器W₂(z)^-1是类型的，带有增益补偿因子1/fac₂，其中fac₂如上定义。

本发明也涵盖计算机程序，其包括存储在介质上的、用于由计算机或专用设备执行的一系列指令，值得注意的是这些指令的执行是执行用于编码和/或解码的本发明的知觉加权方法。

前述的计算机程序是可直接执行的程序，例如，安装在本发明的知觉加权设备中。

当然，本发明并不局限于刚刚已经描述的各实施例。尤其注意的是：

·参数γ₁、γ₂、γ′₁、和γ′₂的数值能够与以上选择的那些不同；

·补偿因子fac₁能够被施加在

滤波之前或在

和

滤波之间或集成在

或

滤波中；同样施加到因子fac₂和相应的反向滤波器；

·知觉加权滤波器并非必须是的形式；

·在整个频带中能够定义不止两个子带。

Claims

1.一种用于在给定频带中编码/解码音频信号的知觉加权设备，其特征在于，所述编码/解码在所述给定频带中的多个相邻子带中被实现，所述设备包括，在至少一个子带中，具有增益补偿的知觉加权滤波器，其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和与所述子带相邻的子带中的信号之间的频谱的连续性，

其中，所述知觉加权滤波器具有形式

其中

表示线性预测滤波器且0≤γ₂≤1和0≤γ₁≤1，并且fac表示增益补偿因子，是所述

滤波器的系数的函数，

所述增益补偿的实现依据等于下式的因子fac的乘法，

fac = | \frac{Σ_{i = 0}^{p} {(- γ_{2})}^{i} {\hat{a}}_{i}}{Σ_{i = 0}^{p} {(- γ_{1})}^{i} {\hat{a}}_{i}} |

其中

是所述线性预测滤波器的系数，

其中

\hat{A} (z) = {\hat{a}}_{0} + {\hat{a}}_{1} z^{- 1} + {\hat{a}}_{2} z^{- 2} + . . . + {\hat{a}}_{p} z^{- p},

p是所述线性预测滤波器

\hat{A} (z) = {\hat{a}}_{0} + {\hat{a}}_{1} z^{- 1} + {\hat{a}}_{2} z^{- 2} + . . . + {\hat{a}}_{p} z^{- p}

的阶数。

2.如权利要求1所述的设备，其特征在于，所述具有增益补偿的知觉加权滤波器包括知觉加权滤波器和增益补偿模块。

3.如权利要求2所述的设备，其特征在于，所述增益补偿模块是布置在所述知觉加权滤波器的输出端。

4.如权利要求2所述的设备，其特征在于，所述增益补偿模块是布置在所述知觉加权滤波器的输入端。

5.如权利要求1所述的设备，其特征在于，所述具有增益补偿的知觉加权滤波器包括合并增益补偿的知觉加权滤波器。

6.一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频编码器，所述编码器包括：

·用于从所述原始信号和来自所述核心编码器的信号中计算残差信号的装置；

·用于知觉加权所述残差信号的设备；

其特征在于，所述知觉加权设备包括具有增益补偿的知觉加权滤波器，具有形式其中

滤波器的系数的函数，并被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和在所述第二子带中的信号之间的频谱的连续性，

所述增益补偿的实现依据等于下式的因子fac的乘法，

fac = | \frac{Σ_{i = 0}^{p} {(- γ_{2})}^{i} {\hat{a}}_{i}}{Σ_{i = 0}^{p} {(- γ_{1})}^{i} {\hat{a}}_{i}} |

其中

是所述线性预测滤波器

的系数，

其中

\hat{A} (z) = {\hat{a}}_{0} + {\hat{a}}_{1} z^{- 1} + {\hat{a}}_{2} z^{- 2} + . . . + {\hat{a}}_{p} z^{- p},

p是所述线性预测滤波器

\hat{A} (z) = {\hat{a}}_{0} + {\hat{a}}_{1} z^{- 1} + {\hat{a}}_{2} z^{- 2} + . . . + {\hat{a}}_{p} z^{- p}

的阶数。

7.如权利要求6所述的编码器，其特征在于，所述具有增益补偿的所述知觉加权滤波器包括在第一子带中的具有增益补偿的知觉线性加权滤波器

8.如权利要求7所述的编码器，其特征在于，通过所述核心编码器提供所述线性预测滤波器的系数。

9.如权利要求6到8中任何一项所述的编码器，其特征在于，在第一子带的来自知觉加权设备的信号和在第二子带中的原始信号被施加到各自的变换分析模块，并且所述变换分析模块被连接到在所述频带的变换编码器。

10.如权利要求6到8中任何一项所述的编码器，其特征在于，所述编码器也包括用于对第二子带的原始信号进行知觉加权的知觉加权设备，其包括具有增益补偿的知觉加权滤波器，被适配来实现在用于对第二子带的原始信号进行知觉加权的所述具有增益补偿的所述知觉加权滤波器的输出信号和在第一子带中的知觉加权设备的输出信号之间的频谱的连续性。

11.如权利要求10所述的编码器，其特征在于，用于对第二子带的原始信号进行知觉加权的所述具有增益补偿的所述知觉加权滤波器包括在第二子带中的具有增益补偿的知觉加权滤波器。

12.如权利要求11所述的编码器，其特征在于，在第二子带的所述知觉加权滤波器具有形式其中表示线性预测滤波器且0≤γ′₂≤1和0≤γ′₁≤1。

13.如权利要求12所述的编码器，其特征在于，所述在第二子带的增益补偿的实现依据等于下式的因子fac₂的乘法，