CN101385079B - 在音频编码/解码中用于知觉加权的设备 - Google Patents

在音频编码/解码中用于知觉加权的设备 Download PDF

Info

Publication number
CN101385079B
CN101385079B CN200780005513XA CN200780005513A CN101385079B CN 101385079 B CN101385079 B CN 101385079B CN 200780005513X A CN200780005513X A CN 200780005513XA CN 200780005513 A CN200780005513 A CN 200780005513A CN 101385079 B CN101385079 B CN 101385079B
Authority
CN
China
Prior art keywords
perceptual weighting
subband
gain compensation
wave filter
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200780005513XA
Other languages
English (en)
Other versions
CN101385079A (zh
Inventor
斯蒂芬·拉戈特
罗曼·特里林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of CN101385079A publication Critical patent/CN101385079A/zh
Application granted granted Critical
Publication of CN101385079B publication Critical patent/CN101385079B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Abstract

一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频编码器,所述编码器包括:用于编码在所述频带的第一子带中的原始信号的核心编码器(305);用于从所述原始信号和来自所述核心编码器的信号中计算残差信号(e)的级(306);用于对所述残差信号(e)进行知觉加权的设备。根据本发明,所述知觉加权设备包括具有增益补偿的知觉加权滤波器(307),其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和在第二子带中的信号之间的频谱的连续性。应用于传输和存储诸如音频语音、音乐等信号之类的数字信号。

Description

在音频编码/解码中用于知觉加权的设备
技术领域
本发明涉及一种用于在给定频带中编码/解码音频信号的知觉加权设备(perceptual weighting device)。也涉及包括本发明的编码/解码设备的分级音频编码器和分级音频解码器。
本发明在传输和存储诸如音频语音、音乐等信号之类的数字信号方面具有特别有利的应用。
背景技术
存在用于数字化和压缩音频语音、音乐等信号的各种技术。最常用的方法是:
·诸如PCM和ADPCM编码的“波形编码”方法;
·“参数分析/合成编码”方法,诸如码本激励线性预测(CELP)编码;
·“子带或变换知觉(perceptual)编码”方法。
在编者W.B.Kleijn和K.K.Paliwal的″Speech Coding and Synthesis″,Elsevier,1995一书中描述了这些用于编码音频-频率信号的传统技术。
在这里,本发明更具体地关注包括CELP编码和变换编码技术的预测变换编码方法。
在传统语音编码中,编码器按照固定的比特率产生比特流。这种固定的比特率对简化的实现和通常被组合地称为“编解码器”的编码器和解码器的使用方面存在限制。这样的系统的示例是:64千比特每秒(kbps)的ITU-T G.711编码系统、8kbps的UIT-T G.729编码系统和12.2kbps的GSM-EFR编码系统。
然而,在诸如移动电话、IP话音、以及专用(ad hoc)网络上的通信之类的某些应用中,其优选按照可变比特率产生比特流,具有由预定义的集合中取得的比特率。许多比固定比特率编码更灵活的多比特率编码技术因此能够被区分为:
·源和/或信道控制的多模编码,如用于AMR-NB、AMR-WB、SMV、和VMR-WB系统;
·分级编码,也叫作“分层(scalable)”编码,其产生分级的比特流,在此意义上,其包括核心比特率和一个或多个增强层。在48kbps、56kbps和64kbps的G.722系统是比特率分层编码的简单示例。MPEG-4CELP编解码器是在比特率和带宽中的分层;此类编解码器的其它示例能够在以下论文中找到:B.Kovesi、D.Massaloux、A.Sollaud的″A Scalable Speech and AudioCoding Scheme with Continuous Bitrate Flexibility″,ICASSP 2004;
·多描述编码。
本发明更具体地涉及分级编码。
分级或“分层”音频编码的基本概念在例如以下论文中说明:Y. Hiwasaki、T.Mori、H.Ohmuro、J.Ikedo、D.Tokumoto以及A.Kataoka的″Scalable SpeechCoding Technology for High-Quality Ubiquitous Communications″,NTTTechnical Review,2004年3月。
在此类型的编码中,比特流包括基本层或核心层,以及一个或多个增强层。基本层由已知为核心“编解码器”的编解码器按低的固定比特率产生,所述低的固定比特率保证编码质量的某最小级别并且必须被解码器接收以便维持可接受级别的质量。
增强层被用来增强质量;它们将不会全部被解码器接收。分级编码的主要好处是能够简单通过截断该比特流来适配比特率。层的可能数量(即,比特流截断的可能数量)定义编码颗粒度:在强颗粒度编码中比特流包括较少的层(达到2-4层),同时精细颗粒度编码提供达例如1kbps级的增量。
本发明更具体涉及使用电话带中的CELP类型的核心编码器和一个或多个宽带增强层的比特率和带宽分层编码技术。该系统的示例在以下论文中给出:H.Taddéi等人的″A Scalable Three Bitrate(8,14.2,and 24kbps)AudioCoder″,107th Convention AES,1999,具有8kbps、14.2kbps、和24kbps的粗糙颗粒度;并且在B.Kovesi等人的前述论文中参考6.4kbps到32kbps的精细颗粒度。
在2004,ITU-T启动了标准化分级核心编码器的项目。该G.729EV编码器(EV表示“嵌入的可变比特率”)是已知的G.729编码器的补充。G.729EV标准的目标是获得G.729核心分级编码器,G.729核心分级编码器为对话服务产生在8kbps到32kbps的比特率的具有从窄带(300赫兹(Hz)到3400Hz)到宽带(50Hz到7000Hz)扩展的频带的信号。该编码器固有地能够与G.729建议(recommendation)互通,这确保了与现有IP话音装备的兼容性。
图1所示的8kbps到32kbps分级音频编码器被提出以响应以上项目并在以下ITU-T文档中描述:ITU-T document COM 16,D135(WP 3/16),“France Telecom G.729EV Candidate:High level description and complexityevaluation”,Q.10/16,2005-2008研究期,日内瓦,2005年7月26日-8月5日。该编码器实现三层编码,包括级联CELP编码、通过全频带线性预测编码(LPC)的频带扩展和预测变换编码。在施加改进离散余弦变换(MDCT)之后施加TDAC(时域声音混叠(aliasing)消除)编码。预测变换编码层使用全频带知觉加权滤波器
Figure G200780005513XD00031
在前述的W.B.Kleijn等人的出版物中解释了通过知觉加权滤波修整编码噪声的概念。本质上,知觉加权滤波通过削弱噪声密度高且噪声更容易被屏蔽的频率处的信号来修整该编码噪声。
在窄带CELP编码中最广泛地使用的知觉加权滤波器具有
Figure G200780005513XD00032
的形式,其中,0≤γ2≤γ1<1并且表示具有5毫秒(ms)到30ms长度的信号段的LPC频谱。因此在CELP编码中的合成分析等于(amounts to)在由该类型的滤波器知觉加权的信号域中最小化二次误差。
然而,在G.729EV标准的情况下提出的该技术具有使用全频带知觉加权滤波器的缺点。该关联的滤波器就计算时间而言相对复杂。
因此要由本发明的主题解决的技术问题是提出一种用于在给定频带中编码/解码音频信号的知觉加权设备,其提供全频带知觉加权滤波,即,在所述给定频带的整个之上,尤其在分级音频编码器的0到8000Hz的宽带上,没有此操作将导致长时间计算,就资源而言其代价是高的。
发明内容
对于所述的技术问题的根据本发明的解决方案是,所述编码/解码在所述给定频带中的多个相邻子带中实现,所述设备包括,在至少一个子带中,具有增益补偿的知觉加权滤波器,其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和与所述子带相邻的子带中的信号之间的频谱的连续性。
因此本发明的知觉加权设备实现一个或多个子带上所需的滤波,其限制了计算的复杂性。而且,通过增益补偿消除了在知觉加权滤波的增益之间的从一个子带到另一个的不一致,这确保在整个频带上的频谱连续性。本发明由此在知觉加权滤波之后产生同质(homogeneous)的频带,即便从组成其的子带是被单独处理的观点来看也如此。
这样的特别重要的优点是全频带变换编码能够被施加在子带上,否则这些子带不是同质的,因为它们被单独的滤波。
当然,每个子带能够使用知觉加权或不使用知觉加权滤波。由此能够在滤波的子带和另一个没有滤波的子带之间或在两个滤波的子带之间提供频谱的连续性。
在一个实施例中,所述具有增益补偿的知觉加权滤波器包括知觉加权滤波器和增益补偿模块。
在另一个实施例中,所述具有增益补偿的知觉加权滤波器包括合并增益补偿的知觉加权滤波器。
那么在第一子带的所述知觉加权滤波器能够具有形式
Figure G200780005513XD00041
其中
Figure G200780005513XD00042
表示线性预测滤波器。在此情形中,本发明示教所述增益补偿应当地的实现依据以下定义的因子fac的乘法,
fac = | Σ i = 0 p ( - γ 2 ) i a ^ i Σ i = 0 p ( - γ 1 ) i a ^ i | .
其中
Figure G200780005513XD00044
是所述线性预测滤波器
Figure G200780005513XD00045
的系数。
阶为p和具有系数
Figure G200780005513XD00046
的线性预测滤波器
Figure G200780005513XD00047
定义如下:
A ^ ( z ) = a ^ 0 + a ^ 1 z - 1 + a ^ 2 z - 2 + . . . + a ^ p z - p
本发明也涉及一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频编码器,所述编码器包括:
·用于编码在所述频带的第一子带中的原始信号的核心编码器;
·用于从所述原始信号和来自所述核心编码器的信号中计算残差信号的级;
·用于对所述残差信号进行知觉加权的设备;
值得注意的是所述知觉加权设备包括具有增益补偿的知觉加权滤波器,其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和在第二子带中的信号之间的频谱的连续性。
在该实施例中,仅第一子带经历知觉加权滤波,而第二子带没有被滤波。
此外,如果所述增益补偿的所述知觉加权滤波器包括在第一子带中的知觉加权滤波器,则本发明示教在在第一子带的所述知觉加权滤波器具有形式
Figure G200780005513XD00051
其中表示线性预测滤波器。在此情形中,在第一子带中的增益补偿的实现依据等于下式的因子fac1的乘法,
fa c 1 = | Σ i = 0 p ( - γ 2 ) i a ^ i Σ i = 0 p ( - γ 1 ) i a ^ i | .
其中
Figure G200780005513XD00054
是所述线性预测滤波器
Figure G200780005513XD00055
的系数。
有利地,在第一子带的来自知觉加权设备的信号和在第二子带中的原始信号被施加到各自的变换分析模块,并且所述变换分析模块被连接到在所述频带的变换编码器。
在本发明的分级音频编码器的变型中,所述编码器也包括用于知觉加权在第二子带的原始信号的知觉加权设备,其包括具有增益补偿的知觉加权滤波器,被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和在第一子带中的知觉加权滤波器的输出信号之间的频谱的连续性。
因此,这是在两个子带中单独实现知觉加权滤波的编码器。
如果所述具有增益补偿的知觉加权滤波器包括在第二子带中的知觉加权滤波器,则在第二子带的知觉加权滤波器具有形式
Figure G200780005513XD00056
其中
Figure G200780005513XD00057
表示线性预测滤波器。在此例中,所述在第二子带中的增益补偿的实现依据等于下式的因子fac2的乘法,
fa c 2 = | Σ i = 0 p ( γ ′ 2 ) i a ^ ′ i Σ i = 0 p ( γ ′ 1 ) i a ^ ′ i | .
其中
Figure G200780005513XD00059
是所述线性预测滤波器的系数。
在第一子带的来自知觉加权设备的信号和在第二子带中的来自知觉加权设备的信号被有利地施加到各自的变换分析模块,并且所述变换分析模块被连接到在所述频带的变换编码器。
本发明还涉及一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频解码器,所述解码器包括:
·核心解码器,适配来在所述频带的第一子带中解码接收的由根据本发明的编码器编码的信号;
·反向知觉加权设备,用于对代表在第一子带中由所述编码器的知觉加权设备加权的残差信号的信号进行反向知觉加权;
值得注意的是,所述反向知觉加权设备包括具有增益补偿的知觉加权滤波器,这是在第一子带的编码器的具有增益补偿的知觉加权滤波器的反向过程。
可替换地,本发明示教所述解码器也包括在第二子带的解码信号的反向知觉加权设备,其包括具有增益补偿的知觉加权滤波器,这是在第二子带的编码器的具有增益补偿的知觉加权滤波器的反向过程。
在后一情形中,如果所述具有增益补偿的知觉加权滤波器包括在第二子带中的知觉加权滤波器,则所述具有增益补偿的反向知觉加权滤波器包括在第二子带中的反向知觉加权滤波器。尤其,所述在第二子带的反向知觉加权滤波器具有形式并且通过频带扩展模块提供该线性预测滤波器
Figure G200780005513XD00062
的系数。
本发明还涉及一种在给定频带中编码音频信号的知觉加权方法,值得注意的是,所述编码在所述频带中的多个相邻子带中实现,所述方法包括,在至少一个子带中,具有增益补偿的知觉加权的步骤,被适配来实现在来自所述具有增益补偿的知觉加权步骤的输出信号和与所述子带相邻的子带中的信号之间的频谱的连续性。
最后,本发明涉及一种用于解码在给定频带中根据用于编码所述信号的知觉加权的方法编码的音频信号的知觉加权方法,值得注意的是,所述方法包括在所述子带中具有增益补偿的知觉加权的步骤,这是具有增益补偿的知觉加权步骤的反向过程。
附图说明
通过非限制性示例提供的参照附图的以下说明清楚地解释本发明的组成和其如何能够被简化实现。
图1是现有技术中分级音频编码器的图,在变换编码之前进行全频带知觉加权滤波;
图2是本发明的分级音频编码器的高层的图;
图3是图2的编码器的知觉加权设备的图;
图4示出展示在第一子带依照本发明被滤波然后增益补偿的信号的幅度以及在第二子带中没有被滤波的信号的幅度的频谱;
图5是本发明的分级音频解码器的高层的图;
图6是图2的分级音频编码器的变型的图;
图7是图5的分级音频解码器的变型的图;
图8示出展示在第一子带依照本发明被滤波然后增益补偿的信号的幅度以及在第二子带中依照本发明被滤波然后均衡的信号的幅度的频谱。
具体实施方式
图2示出关于比特率从8kbps到32kbps的子带分级音频编码器。该图示出相应编码方法的各种步骤。
在从50Hz到7000Hz的“宽”频带中的并按16kHz采样的输入信号首先由二次镜像滤波器(quadrature mirror filter QMF)划分成两个相邻的子带。通过低通(L)滤波300和抽选301获得第一子带,其从0到4000Hz,也叫做低频带,通过高通(H)滤波302和抽选303获得第二子带,其从4000Hz到8000Hz,也叫做高频带。在优选实施例中,L滤波器300和H滤波器302具有长度64并且在以下论文中描述:J.Johnston,″A filter family designed foruse in quadrature mirror filter banks″,ICASSP,vol.5,pp.291-294,1980。
第一子带在由窄带CELP核心编码器305编码之前由消除50Hz以下的分量的高通滤波器304进行预处理。高通滤波器考虑宽带定义为涵盖范围50Hz到7000Hz的事实。在该实施例中,窄带CELP编码对应于图1所示的并且由使用修改的G.729编码的级联的CELP编码组成,其中第一级(ITU-TRecommendation G.729,“Coding of Speech at 8kbps using Conjugate StructureAlgebraic Code Excited Linear Prediction(CS-ACELP)”,1996年3月)没有预处理滤波器,而第二级由附加的固定字典(dictionary)组成。通过级306计算与由CELP编码导致的误差关联的残余信号e然后由包括知觉加权滤波器的设备307对其进行知觉加权以获得时域信号xlo,利用改进离散余弦变换(MDCT)308分析xlo以获得在频域的离散频谱Xlo
图3示出知觉加权设备307,其中W1(z)包括包含分别为
Figure G200780005513XD00071
Figure G200780005513XD00072
滤波级501和502的知觉加权滤波器
Figure G200780005513XD00073
如图2所示,线性预测滤波器
Figure G200780005513XD00074
是基于窄带CELP编码的。知觉加权设备307也包括增益补偿模块503,用于将来自滤波器501、502的知觉加权信号与如下定义的因子fac1相乘,
fa c 1 = | Σ i = 0 p ( - γ 2 ) i a ^ i Σ i = 0 p ( - γ 1 ) i a ^ i |
其中,
Figure G200780005513XD00082
是滤波器的系数,
A 1 ^ ( z ) = a ^ 0 + a ^ 1 z - 1 + a ^ 2 z - 2 + . . . + a ^ p z - p
在优选实施例中,系数
Figure G200780005513XD00085
按每5ms子帧更新,γ1=0.96、且γ2=0.6。
因子fac1的等价定义对应于滤波器
Figure G200780005513XD00086
在尼奎斯特频率(Nyquist frequency)(4kHz)处的增益的倒数,也就是说,对于z=-1:
fac 1 = 1 / | A ^ 1 ( z / γ 1 ) / A ^ 1 ( z / γ 2 ) |
在第二子带或高频带的频谱混叠消除309被首先实现用于结合抽选303补偿由高通滤波302导致的混叠。该高频带然后被由低通滤波器310预处理以消除在原始信号中介于7000到8000Hz的分量。然后MDCT变换311被施加到在时域的生成信号xhi以获得在频域的离散频谱Xhi。然后是基于xhi和Xhi的频带扩展312。
信号xlo和xhi被分成N个采样的帧并且长度L=2N的MDCT变换分析当前的和以后的帧。在优选的实施例中,xlo和xhi是按8kHz采样的窄带信号并且N=160(20ms)。MDCT变换xlo和Xhi因此包括N 160系数,每个系数表示4000/160=25Hz的频带。在优选的实施例中,通过由以下论文描述的算法实现该MDCT变换:P. Duhamel、Y. Mahieux、J.P. Petit的“A fast algorithmfor the implementation of filter banks based on time domain aliasingcancellation”,ICASSP,vol.3,pp.2209-2212,1991。
在变换编码模块313中编码低频带和高频带MDCT频谱Xlo和Xhi
由编码模块305产生的比特流312和313在复用器314中被复用和组织成分级比特流。
通过20ms帧(即320个采样的块)实现编码。编码比特率是8kbps、12kbps、14kbps到32kbps。
下面参考图4解释具有因子fac1的增益补偿的知觉加权步骤的优点。
该图示出总频带分成第一子带(即,由0到4kHz的低频带)和第二子带(即,由4到8kHz的高频带)。在优选实施例中,MDCT编码器313被施加到这两个子带,包括:
·在应用MDCT变换于低频带中之前的知觉加权滤波W1(z)和增益补偿;
·在高频带应用直接MDCT变换,没有知觉加权滤波。
子带中的这两个操作在图4中通过分别为低频带的
Figure G200780005513XD00091
的幅度响应和高频带中在0dB的平坦响应(flat response)被图解地示出。该后面的平直响应示出在施加MDCT变换之前没有处理被施加在高频带中。因子fac1的增益补偿移动的幅度响应来确保4kHz处的连续性。此连续性十分重要,因为其随后使得两种离散频谱Xlo和Xhi的同质编码(homogeneous coding)能够结合成单个矢量X,由此其代表全频带离散频谱。
重要的是要注意到这里使用值0dB来定义低频带和高频带之间的连续性仅是说明性的。
与刚刚参照图2、3和4描述的编码器关联的分级音频解码器在图5中示出,其展示解码由所述编码器编码的信号的步骤。
定义每个20ms帧的比特在解复用器700中被解复用。以下描述在8kbps到32kbps的解码,虽然在实践中比特流能够被截断为8kbps、12kbps、14kbps或在14kbps和32kbps之间。
在8kbps和12kbps的各层的比特流被CELP解码器701用来产生从0到4000Hz的第一子带(窄频带)中的第一合成。与在14kbps的层关联的比特流部分被频带扩展模块702解码,并且MDCT变换703被施加到从4000Hz到7000Hz的第二子带(高频带)中获得的信号以生成频谱MDCT解码704从与介于14kbps到32kbps的比特率关联的比特流中产生在低频带的重建频谱
Figure G200780005513XD00094
和在高频带的重建频谱
Figure G200780005513XD00095
这两种频谱通过施加方框705和706中的MDCT逆变换被转换时域信号
Figure G200780005513XD00096
Figure G200780005513XD00097
在由反向知觉加权设备707滤波之后信号通过加法器708与CELP合成相加。然后在709处对该结果进行后滤波。
依靠施加过采样的合成QMF滤波器排(bank)(710和712)、低通滤波(711)、高通滤波(713)和求和(714)获得在宽频带的、按16kHz采样的输出信号。
通过反向知觉加权设备707W1(z)-1实现含增益补偿的知觉解码的步骤,其中反向知觉加权设备707W1(z)-1包括反向知觉加权滤波器
Figure G200780005513XD00099
和增益补偿模块,该增益补偿模块用于将来自所述反向知觉加权滤波器的信号与以下因子1/fac1相乘:
1 / fa c 1 = | Σ i = 0 p ( - γ 1 ) i a ^ i Σ i = 0 p ( - γ 2 ) i a ^ i |
其中,
Figure G200780005513XD00102
是滤波器
Figure G200780005513XD00103
的系数,自窄频带的CELP编码中产生。如在编码器一样,系数在每个5ms子帧中维持恒定。
图6示出编码器的图2实施例的变型。
该图示出分析滤波器排900到903、通过方框904到908的低频带的处理、通过方框909到910的高频带的预处理、MDCT编码器913和复用器915。
在此变型和图2的实施例之间的主要区别是在第二子带(高频带)中的线性预测(LPC)分析和量化的并入。通过频带扩展模块911提供在高频带量化的LPC系数
Figure G200780005513XD00105
这里不详细描述基于LPC的频带扩展,因为其超出本发明的范围。这些LPC系数使得在施加MDCT变换913之前能够在设备912中应用具有增益补偿W2(z)的知觉加权滤波。因此,该变型在于低频带的差分信号e和高频带的信号xhi的知觉加权,然而先前描述的实施例仅对低频带的差分信号e进行知觉加权。
在该变型中,在高频带具有增益补偿W2(z)的知觉加权设备912采用与在低频带的滤波器W1(z)的相同的形式。由此它是类型
Figure G200780005513XD00106
的滤波器,带有如下定义的增益补偿因子fac2
fa c 2 = | Σ i = 0 p ( γ ′ 2 ) i a ^ ′ i Σ i = 0 p ( γ ′ 1 ) i a ^ ′ i | .
其中,
Figure G200780005513XD00108
是滤波器的系数:
A ^ 2 ( z ) = a ^ ′ 0 + a ^ ′ 1 z - 1 + a ^ ′ 2 z - 2 + . . . + a ^ ′ p z - p
并且γ′1=0.96和γ′2=0.6。
此因子对应于:
fac 2 = 1 / | A ^ 2 ( z / γ ′ 1 ) / A ^ 2 ( z / γ ′ 2 ) |
对于z=1,即,频率0Hz或在高频带的DC分量,一旦该频率回复到在QMF滤波之前的输入信号的频率,其实际对应于4kHz。
参考图8解释在两个子带中具有增益补偿的知觉加权的好处,图8示出划分的低频带(0到4kHz)和高频带(4kHz到8kHz)。在这里考虑的变型中,MDCT编码器被施加到两个子带,包括:
·在低频带中早于MDCT的滤波W1(z);
·在高频带中早于MDCT的滤波W2(z)。
这两种子带操作分别由低频带中
Figure G200780005513XD00111
的幅度响应和高频带中
Figure G200780005513XD00112
的幅度响应表示。
在低频带和高频带中增益补偿通过各自的因子fac1和fac2确保在4kHz处的滤波器的响应的连续性。正是此连续性使得这两类离散频谱Xlo和Xhi随后能够被编码在单个矢量中。再次,很重要的是注意到这里使用值0dB来定义低频带和高频带之间的连续性仅是说明性的。
对应于此变型的分级音频解码器在图7示出。与先前实施例的解码器相比的唯一区别是由频带扩展模块1002使用的量化LPC系数
Figure G200780005513XD00113
的恢复和对信号应用反向知觉加权滤波器W2(z)-1。在高频带使用的反向滤波器W2(z)-1类型的,带有增益补偿因子1/fac2,其中fac2如上定义。
本发明也涵盖计算机程序,其包括存储在介质上的、用于由计算机或专用设备执行的一系列指令,值得注意的是这些指令的执行是执行用于编码和/或解码的本发明的知觉加权方法。
前述的计算机程序是可直接执行的程序,例如,安装在本发明的知觉加权设备中。
当然,本发明并不局限于刚刚已经描述的各实施例。尤其注意的是:
·参数γ1、γ2、γ′1、和γ′2的数值能够与以上选择的那些不同;
·补偿因子fac1能够被施加在
Figure G200780005513XD00116
滤波之前或在
Figure G200780005513XD00117
Figure G200780005513XD00118
滤波之间或集成在
Figure G200780005513XD00119
Figure G200780005513XD001110
滤波中;同样施加到因子fac2和相应的反向滤波器;
·知觉加权滤波器并非必须是的形式;
·在整个频带中能够定义不止两个子带。

Claims (24)

1.一种用于在给定频带中编码/解码音频信号的知觉加权设备,其特征在于,所述编码/解码在所述给定频带中的多个相邻子带中被实现,所述设备包括,在至少一个子带中,具有增益补偿的知觉加权滤波器,其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和与所述子带相邻的子带中的信号之间的频谱的连续性,
其中,所述知觉加权滤波器具有形式
Figure FSB00000818827600011
其中
Figure FSB00000818827600012
表示线性预测滤波器且0≤γ2≤1和0≤γ1≤1,并且fac表示增益补偿因子,是所述
Figure FSB00000818827600013
滤波器的系数的函数,
所述增益补偿的实现依据等于下式的因子fac的乘法,
fac = | Σ i = 0 p ( - γ 2 ) i a ^ i Σ i = 0 p ( - γ 1 ) i a ^ i |
其中
Figure FSB00000818827600015
是所述线性预测滤波器的系数,
其中 A ^ ( z ) = a ^ 0 + a ^ 1 z - 1 + a ^ 2 z - 2 + . . . + a ^ p z - p ,
p是所述线性预测滤波器 A ^ ( z ) = a ^ 0 + a ^ 1 z - 1 + a ^ 2 z - 2 + . . . + a ^ p z - p 的阶数。
2.如权利要求1所述的设备,其特征在于,所述具有增益补偿的知觉加权滤波器包括知觉加权滤波器和增益补偿模块。
3.如权利要求2所述的设备,其特征在于,所述增益补偿模块是布置在所述知觉加权滤波器的输出端。
4.如权利要求2所述的设备,其特征在于,所述增益补偿模块是布置在所述知觉加权滤波器的输入端。
5.如权利要求1所述的设备,其特征在于,所述具有增益补偿的知觉加权滤波器包括合并增益补偿的知觉加权滤波器。
6.一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频编码器,所述编码器包括:
·用于编码在所述频带的第一子带中的原始信号的核心编码器;
·用于从所述原始信号和来自所述核心编码器的信号中计算残差信号的装置;
·用于知觉加权所述残差信号的设备;
其特征在于,所述知觉加权设备包括具有增益补偿的知觉加权滤波器,具有形式其中
Figure FSB00000818827600022
表示线性预测滤波器且0≤γ2≤1和0≤γ1≤1,并且fac表示增益补偿因子,是所述
Figure FSB00000818827600023
滤波器的系数的函数,并被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和在所述第二子带中的信号之间的频谱的连续性,
所述增益补偿的实现依据等于下式的因子fac的乘法,
fac = | Σ i = 0 p ( - γ 2 ) i a ^ i Σ i = 0 p ( - γ 1 ) i a ^ i |
其中
Figure FSB00000818827600025
是所述线性预测滤波器
Figure FSB00000818827600026
的系数,
其中 A ^ ( z ) = a ^ 0 + a ^ 1 z - 1 + a ^ 2 z - 2 + . . . + a ^ p z - p ,
p是所述线性预测滤波器 A ^ ( z ) = a ^ 0 + a ^ 1 z - 1 + a ^ 2 z - 2 + . . . + a ^ p z - p 的阶数。
7.如权利要求6所述的编码器,其特征在于,所述具有增益补偿的所述知觉加权滤波器包括在第一子带中的具有增益补偿的知觉线性加权滤波器
Figure FSB00000818827600029
8.如权利要求7所述的编码器,其特征在于,通过所述核心编码器提供所述线性预测滤波器的系数。
9.如权利要求6到8中任何一项所述的编码器,其特征在于,在第一子带的来自知觉加权设备的信号和在第二子带中的原始信号被施加到各自的变换分析模块,并且所述变换分析模块被连接到在所述频带的变换编码器。
10.如权利要求6到8中任何一项所述的编码器,其特征在于,所述编码器也包括用于对第二子带的原始信号进行知觉加权的知觉加权设备,其包括具有增益补偿的知觉加权滤波器,被适配来实现在用于对第二子带的原始信号进行知觉加权的所述具有增益补偿的所述知觉加权滤波器的输出信号和在第一子带中的知觉加权设备的输出信号之间的频谱的连续性。
11.如权利要求10所述的编码器,其特征在于,用于对第二子带的原始信号进行知觉加权的所述具有增益补偿的所述知觉加权滤波器包括在第二子带中的具有增益补偿的知觉加权滤波器。
12.如权利要求11所述的编码器,其特征在于,在第二子带的所述知觉加权滤波器具有形式其中表示线性预测滤波器且0≤γ′2≤1和0≤γ′1≤1。
13.如权利要求12所述的编码器,其特征在于,所述在第二子带的增益补偿的实现依据等于下式的因子fac2的乘法,
fac 2 = | Σ i = 0 p ( γ ′ 2 ) i a ^ ′ i Σ i = 0 p ( γ ′ 1 ) i a ^ ′ i |
其中
Figure FSB00000818827600032
是所述线性预测滤波器
Figure FSB00000818827600033
的系数,
其中 A ^ 2 ( z ) = a ^ ′ 0 + a ^ ′ 1 z - 1 + a ^ ′ 2 z - 2 + . . . + a ^ ′ p z - p ,
p是所述线性预测滤波器 A ^ 2 ( z ) = a ^ ′ 0 + a ^ ′ 1 z - 1 + a ^ ′ 2 z - 2 + . . . + a ^ ′ p z - p 的阶数。
14.如权利要求12或13所述的编码器,其特征在于,通过频带扩展模块(911)提供在第二子带中使用的所述线性预测滤波器的系数。
15.如权利要求10所述的编码器,其特征在于,在第一子带的来自知觉加权设备的信号和在第二子带中的来自知觉加权设备的信号被施加到各自的变换分析模块,并且所述变换分析模块被连接到在所述频带的变换编码器。
16.如权利要求6到8中任何一项所述的编码器,其特征在于,所述核心编码器是基于线性预测的编码器。
17.如权利要求14所述的编码器,其特征在于,所述核心编码器是CELP编码器。
18.一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频解码器,所述解码器包括:
·核心解码器,适配来在所述频带的第一子带中解码接收的由根据权利要求6到8的任何一项权利要求的编码器编码的信号;
·反向知觉加权设备,用于对代表在第一子带中由所述编码器的知觉加权设备加权的残差信号的信号进行反向知觉加权;
其特征在于,所述反向知觉加权设备包括具有增益补偿的知觉加权滤波器,其执行在第一子带的编码器的具有增益补偿的知觉加权滤波器的反向过程。
19.如权利要求18所述的解码器,其特征在于,所述解码器也包括在第二子带的解码信号的反向知觉加权设备,其包括具有增益补偿的知觉加权滤波器,其执行在第二子带的编码器的具有增益补偿的知觉加权滤波器的反向过程。
20.如权利要求19所述的解码器,其特征在于,在第二子带中使用的所述具有增益补偿的知觉加权滤波器包括在第二子带中的反向知觉加权滤波器。
21.如权利要求20所述的解码器,其特征在于,在第二子带使用的所述具有增益补偿的知觉加权滤波器
Figure FSB00000818827600041
具有形式
Figure FSB00000818827600042
其中0≤γ′2≤1和0≤γ′1≤1。
22.如权利要求21所述的解码器,其特征在于,通过频带扩展模块提供在第二子带中使用的该线性预测滤波器的系数。
23.一种在给定频带中编码音频信号的知觉加权方法,其特征在于,所述编码在所述频带中的多个相邻子带中被实现,所述方法包括,在至少一个子带中,具有增益补偿的知觉加权的步骤,被适配来实现在来自所述具有增益补偿的知觉加权步骤的信号和与所述子带相邻的子带中的信号之间的频谱的连续性,
其中,在所述知觉加权步骤中使用的知觉加权滤波器具有形式
Figure FSB00000818827600044
其中
Figure FSB00000818827600045
表示线性预测滤波器且0≤γ2≤1和0≤γ1≤1,并且fac表示增益补偿因子,是所述
Figure FSB00000818827600046
滤波器的系数的函数,
所述增益补偿的实现依据等于下式的因子fac的乘法,
fac = | Σ i = 0 p ( - γ 2 ) i a ^ i Σ i = 0 p ( - γ 1 ) i a ^ i |
其中
Figure FSB00000818827600048
是所述线性预测滤波器
Figure FSB00000818827600049
的系数,
其中 A ^ ( z ) = a ^ 0 + a ^ 1 z - 1 + a ^ 2 z - 2 + . . . + a ^ p z - p ,
p是所述线性预测滤波器 A ^ ( z ) = a ^ 0 + a ^ 1 z - 1 + a ^ 2 z - 2 + . . . + a ^ p z - p 的阶数。
24.一种用于解码在给定频带中根据权利要求23所述的方法编码的音频信号的知觉加权方法,其特征在于,所述方法包括在所述子带中具有增益补偿的知觉加权的步骤,这是所述在给定频带中编码音频信号的知觉加权方法中的具有增益补偿的知觉加权步骤的反向过程。
CN200780005513XA 2006-02-14 2007-02-07 在音频编码/解码中用于知觉加权的设备 Expired - Fee Related CN101385079B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0650538 2006-02-14
FR0650538 2006-02-14
PCT/FR2007/050760 WO2007093726A2 (fr) 2006-02-14 2007-02-07 Dispositif de ponderation perceptuelle en codage/decodage audio

Publications (2)

Publication Number Publication Date
CN101385079A CN101385079A (zh) 2009-03-11
CN101385079B true CN101385079B (zh) 2012-08-29

Family

ID=36952401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780005513XA Expired - Fee Related CN101385079B (zh) 2006-02-14 2007-02-07 在音频编码/解码中用于知觉加权的设备

Country Status (7)

Country Link
US (1) US8260620B2 (zh)
EP (1) EP1989706B1 (zh)
JP (1) JP5117407B2 (zh)
KR (1) KR101366124B1 (zh)
CN (1) CN101385079B (zh)
AT (1) ATE531037T1 (zh)
WO (1) WO2007093726A2 (zh)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
GB2448201A (en) 2007-04-04 2008-10-08 Zarlink Semiconductor Inc Cancelling non-linear echo during full duplex communication in a hands free communication system.
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
MY155538A (en) * 2008-07-11 2015-10-30 Fraunhofer Ges Forschung An apparatus and a method for generating bandwidth extension output data
ES2396927T3 (es) * 2008-07-11 2013-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para decodificar una señal de audio codificada
KR101170466B1 (ko) 2008-07-29 2012-08-03 한국전자통신연구원 Mdct 영역에서의 후처리 방법, 및 장치
EP3373297B1 (en) * 2008-09-18 2023-12-06 Electronics and Telecommunications Research Institute Decoding apparatus for transforming between modified discrete cosine transform-based coder and hetero coder
FR2938688A1 (fr) 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
CN102725791B (zh) * 2009-11-19 2014-09-17 瑞典爱立信有限公司 用于音频编解码中的响度和锐度补偿的方法和设备
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
CN102223527B (zh) * 2010-04-13 2013-04-17 华为技术有限公司 频带加权量化编解码方法和装置
KR101747917B1 (ko) 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
FR2969360A1 (fr) * 2010-12-16 2012-06-22 France Telecom Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique
US9037456B2 (en) * 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
JP5737077B2 (ja) * 2011-08-30 2015-06-17 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN110890101B (zh) * 2013-08-28 2024-01-12 杜比实验室特许公司 用于基于语音增强元数据进行解码的方法和设备
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
EP3787270A1 (en) 2014-12-23 2021-03-03 Dolby Laboratories Licensing Corp. Methods and devices for improvements relating to voice quality estimation
WO2017050398A1 (en) 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
EP3288031A1 (en) * 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
EP3903309B1 (en) * 2019-01-13 2024-04-24 Huawei Technologies Co., Ltd. High resolution audio coding

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1138183A (zh) * 1995-05-17 1996-12-18 法国电信公司 综合分析语音编码器中噪声隐蔽电平适应性修改方法
US6691082B1 (en) * 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
CN1525439A (zh) * 2002-11-14 2004-09-01 �ž������� 广义综合分析语音编码方法和实施该方法的编码器

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6182031B1 (en) * 1998-09-15 2001-01-30 Intel Corp. Scalable audio coding system
DE60035453T2 (de) * 1999-05-11 2008-03-20 Nippon Telegraph And Telephone Corp. Auswahl des Synthesefilters für eine CELP Kodierung von breitbandigen Audiosignalen
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
WO2001075759A1 (en) 2000-03-27 2001-10-11 Russell Randall A School commerce system and method
AU2001245418A1 (en) * 2000-03-28 2001-10-08 Tellabs Operations, Inc. Perceptual spectral weighting of frequency bands for adaptive noise cancellation
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
CN1275222C (zh) * 2001-12-25 2006-09-13 株式会社Ntt都科摩 信号编码装置和信号编码方法
US7283966B2 (en) * 2002-03-07 2007-10-16 Microsoft Corporation Scalable audio communications utilizing rate-distortion based end-to-end bit allocation
KR100711989B1 (ko) * 2002-03-12 2007-05-02 노키아 코포레이션 효율적으로 개선된 스케일러블 오디오 부호화
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US8036394B1 (en) * 2005-02-28 2011-10-11 Texas Instruments Incorporated Audio bandwidth expansion
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1138183A (zh) * 1995-05-17 1996-12-18 法国电信公司 综合分析语音编码器中噪声隐蔽电平适应性修改方法
US6691082B1 (en) * 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
CN1525439A (zh) * 2002-11-14 2004-09-01 �ž������� 广义综合分析语音编码方法和实施该方法的编码器

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Balázs K&ouml
Balázs Kövesi et al.A SCALABLE SPEECH AND AUDIO CODING SCHEME WITH CONTINUOUS BITRATE FLEXIBILITY.《Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing,2004》.2004,第1卷第I-273-I-276页. *
vesi et al.A SCALABLE SPEECH AND AUDIO CODING SCHEME WITH CONTINUOUS BITRATE FLEXIBILITY.《Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing,2004》.2004,第1卷第I-273-I-276页.

Also Published As

Publication number Publication date
JP5117407B2 (ja) 2013-01-16
US20090076829A1 (en) 2009-03-19
KR20080093450A (ko) 2008-10-21
WO2007093726A3 (fr) 2007-10-18
EP1989706B1 (fr) 2011-10-26
WO2007093726A2 (fr) 2007-08-23
EP1989706A2 (fr) 2008-11-12
CN101385079A (zh) 2009-03-11
US8260620B2 (en) 2012-09-04
JP2009527017A (ja) 2009-07-23
KR101366124B1 (ko) 2014-02-21
ATE531037T1 (de) 2011-11-15

Similar Documents

Publication Publication Date Title
CN101385079B (zh) 在音频编码/解码中用于知觉加权的设备
CN101622661B (zh) 一种数字语音信号的改进编解码方法
JP5112309B2 (ja) 階層符号化/復号化装置
US8532983B2 (en) Adaptive frequency prediction for encoding or decoding an audio signal
CN101263554B (zh) 在比特率分级和带宽分级的音频解码中的比特率切换方法
CN102394066B (zh) 语音编码装置、解码装置和语音编码方法、解码方法
US8812327B2 (en) Coding/decoding of digital audio signals
US20140207445A1 (en) System and Method for Correcting for Lost Data in a Digital Audio Signal
US8965775B2 (en) Allocation of bits in an enhancement coding/decoding for improving a hierarchical coding/decoding of digital audio signals
JP2012518194A (ja) 適応的正弦波コーディングを用いるオーディオ信号の符号化及び復号化方法及び装置
US20140324417A1 (en) Method and apparatus for encoding and decoding audio signal using layered sinusoidal pulse coding
CN101405792B (zh) 用于在音频解码器中对信号进行后处理的方法
EP2132732B1 (en) Postfilter for layered codecs
Schnitzler et al. Trends and perspectives in wideband speech coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120829

Termination date: 20170207

CF01 Termination of patent right due to non-payment of annual fee