CN101385079B - 在音频编码/解码中用于知觉加权的设备 - Google Patents
在音频编码/解码中用于知觉加权的设备 Download PDFInfo
- Publication number
- CN101385079B CN101385079B CN200780005513XA CN200780005513A CN101385079B CN 101385079 B CN101385079 B CN 101385079B CN 200780005513X A CN200780005513X A CN 200780005513XA CN 200780005513 A CN200780005513 A CN 200780005513A CN 101385079 B CN101385079 B CN 101385079B
- Authority
- CN
- China
- Prior art keywords
- perceptual weighting
- subband
- gain compensation
- wave filter
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Abstract
一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频编码器,所述编码器包括:用于编码在所述频带的第一子带中的原始信号的核心编码器(305);用于从所述原始信号和来自所述核心编码器的信号中计算残差信号(e)的级(306);用于对所述残差信号(e)进行知觉加权的设备。根据本发明,所述知觉加权设备包括具有增益补偿的知觉加权滤波器(307),其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和在第二子带中的信号之间的频谱的连续性。应用于传输和存储诸如音频语音、音乐等信号之类的数字信号。
Description
技术领域
本发明涉及一种用于在给定频带中编码/解码音频信号的知觉加权设备(perceptual weighting device)。也涉及包括本发明的编码/解码设备的分级音频编码器和分级音频解码器。
本发明在传输和存储诸如音频语音、音乐等信号之类的数字信号方面具有特别有利的应用。
背景技术
存在用于数字化和压缩音频语音、音乐等信号的各种技术。最常用的方法是:
·诸如PCM和ADPCM编码的“波形编码”方法;
·“参数分析/合成编码”方法,诸如码本激励线性预测(CELP)编码;
·“子带或变换知觉(perceptual)编码”方法。
在编者W.B.Kleijn和K.K.Paliwal的″Speech Coding and Synthesis″,Elsevier,1995一书中描述了这些用于编码音频-频率信号的传统技术。
在这里,本发明更具体地关注包括CELP编码和变换编码技术的预测变换编码方法。
在传统语音编码中,编码器按照固定的比特率产生比特流。这种固定的比特率对简化的实现和通常被组合地称为“编解码器”的编码器和解码器的使用方面存在限制。这样的系统的示例是:64千比特每秒(kbps)的ITU-T G.711编码系统、8kbps的UIT-T G.729编码系统和12.2kbps的GSM-EFR编码系统。
然而,在诸如移动电话、IP话音、以及专用(ad hoc)网络上的通信之类的某些应用中,其优选按照可变比特率产生比特流,具有由预定义的集合中取得的比特率。许多比固定比特率编码更灵活的多比特率编码技术因此能够被区分为:
·源和/或信道控制的多模编码,如用于AMR-NB、AMR-WB、SMV、和VMR-WB系统;
·分级编码,也叫作“分层(scalable)”编码,其产生分级的比特流,在此意义上,其包括核心比特率和一个或多个增强层。在48kbps、56kbps和64kbps的G.722系统是比特率分层编码的简单示例。MPEG-4CELP编解码器是在比特率和带宽中的分层;此类编解码器的其它示例能够在以下论文中找到:B.Kovesi、D.Massaloux、A.Sollaud的″A Scalable Speech and AudioCoding Scheme with Continuous Bitrate Flexibility″,ICASSP 2004;
·多描述编码。
本发明更具体地涉及分级编码。
分级或“分层”音频编码的基本概念在例如以下论文中说明:Y. Hiwasaki、T.Mori、H.Ohmuro、J.Ikedo、D.Tokumoto以及A.Kataoka的″Scalable SpeechCoding Technology for High-Quality Ubiquitous Communications″,NTTTechnical Review,2004年3月。
在此类型的编码中,比特流包括基本层或核心层,以及一个或多个增强层。基本层由已知为核心“编解码器”的编解码器按低的固定比特率产生,所述低的固定比特率保证编码质量的某最小级别并且必须被解码器接收以便维持可接受级别的质量。
增强层被用来增强质量;它们将不会全部被解码器接收。分级编码的主要好处是能够简单通过截断该比特流来适配比特率。层的可能数量(即,比特流截断的可能数量)定义编码颗粒度:在强颗粒度编码中比特流包括较少的层(达到2-4层),同时精细颗粒度编码提供达例如1kbps级的增量。
本发明更具体涉及使用电话带中的CELP类型的核心编码器和一个或多个宽带增强层的比特率和带宽分层编码技术。该系统的示例在以下论文中给出:H.Taddéi等人的″A Scalable Three Bitrate(8,14.2,and 24kbps)AudioCoder″,107th Convention AES,1999,具有8kbps、14.2kbps、和24kbps的粗糙颗粒度;并且在B.Kovesi等人的前述论文中参考6.4kbps到32kbps的精细颗粒度。
在2004,ITU-T启动了标准化分级核心编码器的项目。该G.729EV编码器(EV表示“嵌入的可变比特率”)是已知的G.729编码器的补充。G.729EV标准的目标是获得G.729核心分级编码器,G.729核心分级编码器为对话服务产生在8kbps到32kbps的比特率的具有从窄带(300赫兹(Hz)到3400Hz)到宽带(50Hz到7000Hz)扩展的频带的信号。该编码器固有地能够与G.729建议(recommendation)互通,这确保了与现有IP话音装备的兼容性。
图1所示的8kbps到32kbps分级音频编码器被提出以响应以上项目并在以下ITU-T文档中描述:ITU-T document COM 16,D135(WP 3/16),“France Telecom G.729EV Candidate:High level description and complexityevaluation”,Q.10/16,2005-2008研究期,日内瓦,2005年7月26日-8月5日。该编码器实现三层编码,包括级联CELP编码、通过全频带线性预测编码(LPC)的频带扩展和预测变换编码。在施加改进离散余弦变换(MDCT)之后施加TDAC(时域声音混叠(aliasing)消除)编码。预测变换编码层使用全频带知觉加权滤波器
在前述的W.B.Kleijn等人的出版物中解释了通过知觉加权滤波修整编码噪声的概念。本质上,知觉加权滤波通过削弱噪声密度高且噪声更容易被屏蔽的频率处的信号来修整该编码噪声。
在窄带CELP编码中最广泛地使用的知觉加权滤波器具有的形式,其中,0≤γ2≤γ1<1并且表示具有5毫秒(ms)到30ms长度的信号段的LPC频谱。因此在CELP编码中的合成分析等于(amounts to)在由该类型的滤波器知觉加权的信号域中最小化二次误差。
然而,在G.729EV标准的情况下提出的该技术具有使用全频带知觉加权滤波器的缺点。该关联的滤波器就计算时间而言相对复杂。
因此要由本发明的主题解决的技术问题是提出一种用于在给定频带中编码/解码音频信号的知觉加权设备,其提供全频带知觉加权滤波,即,在所述给定频带的整个之上,尤其在分级音频编码器的0到8000Hz的宽带上,没有此操作将导致长时间计算,就资源而言其代价是高的。
发明内容
对于所述的技术问题的根据本发明的解决方案是,所述编码/解码在所述给定频带中的多个相邻子带中实现,所述设备包括,在至少一个子带中,具有增益补偿的知觉加权滤波器,其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和与所述子带相邻的子带中的信号之间的频谱的连续性。
因此本发明的知觉加权设备实现一个或多个子带上所需的滤波,其限制了计算的复杂性。而且,通过增益补偿消除了在知觉加权滤波的增益之间的从一个子带到另一个的不一致,这确保在整个频带上的频谱连续性。本发明由此在知觉加权滤波之后产生同质(homogeneous)的频带,即便从组成其的子带是被单独处理的观点来看也如此。
这样的特别重要的优点是全频带变换编码能够被施加在子带上,否则这些子带不是同质的,因为它们被单独的滤波。
当然,每个子带能够使用知觉加权或不使用知觉加权滤波。由此能够在滤波的子带和另一个没有滤波的子带之间或在两个滤波的子带之间提供频谱的连续性。
在一个实施例中,所述具有增益补偿的知觉加权滤波器包括知觉加权滤波器和增益补偿模块。
在另一个实施例中,所述具有增益补偿的知觉加权滤波器包括合并增益补偿的知觉加权滤波器。
本发明也涉及一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频编码器,所述编码器包括:
·用于编码在所述频带的第一子带中的原始信号的核心编码器;
·用于从所述原始信号和来自所述核心编码器的信号中计算残差信号的级;
·用于对所述残差信号进行知觉加权的设备;
值得注意的是所述知觉加权设备包括具有增益补偿的知觉加权滤波器,其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和在第二子带中的信号之间的频谱的连续性。
在该实施例中,仅第一子带经历知觉加权滤波,而第二子带没有被滤波。
此外,如果所述增益补偿的所述知觉加权滤波器包括在第一子带中的知觉加权滤波器,则本发明示教在在第一子带的所述知觉加权滤波器具有形式其中表示线性预测滤波器。在此情形中,在第一子带中的增益补偿的实现依据等于下式的因子fac1的乘法,
有利地,在第一子带的来自知觉加权设备的信号和在第二子带中的原始信号被施加到各自的变换分析模块,并且所述变换分析模块被连接到在所述频带的变换编码器。
在本发明的分级音频编码器的变型中,所述编码器也包括用于知觉加权在第二子带的原始信号的知觉加权设备,其包括具有增益补偿的知觉加权滤波器,被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和在第一子带中的知觉加权滤波器的输出信号之间的频谱的连续性。
因此,这是在两个子带中单独实现知觉加权滤波的编码器。
如果所述具有增益补偿的知觉加权滤波器包括在第二子带中的知觉加权滤波器,则在第二子带的知觉加权滤波器具有形式其中表示线性预测滤波器。在此例中,所述在第二子带中的增益补偿的实现依据等于下式的因子fac2的乘法,
在第一子带的来自知觉加权设备的信号和在第二子带中的来自知觉加权设备的信号被有利地施加到各自的变换分析模块,并且所述变换分析模块被连接到在所述频带的变换编码器。
本发明还涉及一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频解码器,所述解码器包括:
·核心解码器,适配来在所述频带的第一子带中解码接收的由根据本发明的编码器编码的信号;
·反向知觉加权设备,用于对代表在第一子带中由所述编码器的知觉加权设备加权的残差信号的信号进行反向知觉加权;
值得注意的是,所述反向知觉加权设备包括具有增益补偿的知觉加权滤波器,这是在第一子带的编码器的具有增益补偿的知觉加权滤波器的反向过程。
可替换地,本发明示教所述解码器也包括在第二子带的解码信号的反向知觉加权设备,其包括具有增益补偿的知觉加权滤波器,这是在第二子带的编码器的具有增益补偿的知觉加权滤波器的反向过程。
在后一情形中,如果所述具有增益补偿的知觉加权滤波器包括在第二子带中的知觉加权滤波器,则所述具有增益补偿的反向知觉加权滤波器包括在第二子带中的反向知觉加权滤波器。尤其,所述在第二子带的反向知觉加权滤波器具有形式并且通过频带扩展模块提供该线性预测滤波器的系数。
本发明还涉及一种在给定频带中编码音频信号的知觉加权方法,值得注意的是,所述编码在所述频带中的多个相邻子带中实现,所述方法包括,在至少一个子带中,具有增益补偿的知觉加权的步骤,被适配来实现在来自所述具有增益补偿的知觉加权步骤的输出信号和与所述子带相邻的子带中的信号之间的频谱的连续性。
最后,本发明涉及一种用于解码在给定频带中根据用于编码所述信号的知觉加权的方法编码的音频信号的知觉加权方法,值得注意的是,所述方法包括在所述子带中具有增益补偿的知觉加权的步骤,这是具有增益补偿的知觉加权步骤的反向过程。
附图说明
通过非限制性示例提供的参照附图的以下说明清楚地解释本发明的组成和其如何能够被简化实现。
图1是现有技术中分级音频编码器的图,在变换编码之前进行全频带知觉加权滤波;
图2是本发明的分级音频编码器的高层的图;
图3是图2的编码器的知觉加权设备的图;
图4示出展示在第一子带依照本发明被滤波然后增益补偿的信号的幅度以及在第二子带中没有被滤波的信号的幅度的频谱;
图5是本发明的分级音频解码器的高层的图;
图6是图2的分级音频编码器的变型的图;
图7是图5的分级音频解码器的变型的图;
图8示出展示在第一子带依照本发明被滤波然后增益补偿的信号的幅度以及在第二子带中依照本发明被滤波然后均衡的信号的幅度的频谱。
具体实施方式
图2示出关于比特率从8kbps到32kbps的子带分级音频编码器。该图示出相应编码方法的各种步骤。
在从50Hz到7000Hz的“宽”频带中的并按16kHz采样的输入信号首先由二次镜像滤波器(quadrature mirror filter QMF)划分成两个相邻的子带。通过低通(L)滤波300和抽选301获得第一子带,其从0到4000Hz,也叫做低频带,通过高通(H)滤波302和抽选303获得第二子带,其从4000Hz到8000Hz,也叫做高频带。在优选实施例中,L滤波器300和H滤波器302具有长度64并且在以下论文中描述:J.Johnston,″A filter family designed foruse in quadrature mirror filter banks″,ICASSP,vol.5,pp.291-294,1980。
第一子带在由窄带CELP核心编码器305编码之前由消除50Hz以下的分量的高通滤波器304进行预处理。高通滤波器考虑宽带定义为涵盖范围50Hz到7000Hz的事实。在该实施例中,窄带CELP编码对应于图1所示的并且由使用修改的G.729编码的级联的CELP编码组成,其中第一级(ITU-TRecommendation G.729,“Coding of Speech at 8kbps using Conjugate StructureAlgebraic Code Excited Linear Prediction(CS-ACELP)”,1996年3月)没有预处理滤波器,而第二级由附加的固定字典(dictionary)组成。通过级306计算与由CELP编码导致的误差关联的残余信号e然后由包括知觉加权滤波器的设备307对其进行知觉加权以获得时域信号xlo,利用改进离散余弦变换(MDCT)308分析xlo以获得在频域的离散频谱Xlo。
图3示出知觉加权设备307,其中W1(z)包括包含分别为和滤波级501和502的知觉加权滤波器如图2所示,线性预测滤波器是基于窄带CELP编码的。知觉加权设备307也包括增益补偿模块503,用于将来自滤波器501、502的知觉加权信号与如下定义的因子fac1相乘,
在第二子带或高频带的频谱混叠消除309被首先实现用于结合抽选303补偿由高通滤波302导致的混叠。该高频带然后被由低通滤波器310预处理以消除在原始信号中介于7000到8000Hz的分量。然后MDCT变换311被施加到在时域的生成信号xhi以获得在频域的离散频谱Xhi。然后是基于xhi和Xhi的频带扩展312。
信号xlo和xhi被分成N个采样的帧并且长度L=2N的MDCT变换分析当前的和以后的帧。在优选的实施例中,xlo和xhi是按8kHz采样的窄带信号并且N=160(20ms)。MDCT变换xlo和Xhi因此包括N 160系数,每个系数表示4000/160=25Hz的频带。在优选的实施例中,通过由以下论文描述的算法实现该MDCT变换:P. Duhamel、Y. Mahieux、J.P. Petit的“A fast algorithmfor the implementation of filter banks based on time domain aliasingcancellation”,ICASSP,vol.3,pp.2209-2212,1991。
在变换编码模块313中编码低频带和高频带MDCT频谱Xlo和Xhi。
由编码模块305产生的比特流312和313在复用器314中被复用和组织成分级比特流。
通过20ms帧(即320个采样的块)实现编码。编码比特率是8kbps、12kbps、14kbps到32kbps。
下面参考图4解释具有因子fac1的增益补偿的知觉加权步骤的优点。
该图示出总频带分成第一子带(即,由0到4kHz的低频带)和第二子带(即,由4到8kHz的高频带)。在优选实施例中,MDCT编码器313被施加到这两个子带,包括:
·在应用MDCT变换于低频带中之前的知觉加权滤波W1(z)和增益补偿;
·在高频带应用直接MDCT变换,没有知觉加权滤波。
子带中的这两个操作在图4中通过分别为低频带的的幅度响应和高频带中在0dB的平坦响应(flat response)被图解地示出。该后面的平直响应示出在施加MDCT变换之前没有处理被施加在高频带中。因子fac1的增益补偿移动的幅度响应来确保4kHz处的连续性。此连续性十分重要,因为其随后使得两种离散频谱Xlo和Xhi的同质编码(homogeneous coding)能够结合成单个矢量X,由此其代表全频带离散频谱。
重要的是要注意到这里使用值0dB来定义低频带和高频带之间的连续性仅是说明性的。
与刚刚参照图2、3和4描述的编码器关联的分级音频解码器在图5中示出,其展示解码由所述编码器编码的信号的步骤。
定义每个20ms帧的比特在解复用器700中被解复用。以下描述在8kbps到32kbps的解码,虽然在实践中比特流能够被截断为8kbps、12kbps、14kbps或在14kbps和32kbps之间。
在8kbps和12kbps的各层的比特流被CELP解码器701用来产生从0到4000Hz的第一子带(窄频带)中的第一合成。与在14kbps的层关联的比特流部分被频带扩展模块702解码,并且MDCT变换703被施加到从4000Hz到7000Hz的第二子带(高频带)中获得的信号以生成频谱MDCT解码704从与介于14kbps到32kbps的比特率关联的比特流中产生在低频带的重建频谱和在高频带的重建频谱这两种频谱通过施加方框705和706中的MDCT逆变换被转换时域信号和在由反向知觉加权设备707滤波之后信号通过加法器708与CELP合成相加。然后在709处对该结果进行后滤波。
依靠施加过采样的合成QMF滤波器排(bank)(710和712)、低通滤波(711)、高通滤波(713)和求和(714)获得在宽频带的、按16kHz采样的输出信号。
通过反向知觉加权设备707W1(z)-1实现含增益补偿的知觉解码的步骤,其中反向知觉加权设备707W1(z)-1包括反向知觉加权滤波器和增益补偿模块,该增益补偿模块用于将来自所述反向知觉加权滤波器的信号与以下因子1/fac1相乘:
图6示出编码器的图2实施例的变型。
该图示出分析滤波器排900到903、通过方框904到908的低频带的处理、通过方框909到910的高频带的预处理、MDCT编码器913和复用器915。
在此变型和图2的实施例之间的主要区别是在第二子带(高频带)中的线性预测(LPC)分析和量化的并入。通过频带扩展模块911提供在高频带量化的LPC系数这里不详细描述基于LPC的频带扩展,因为其超出本发明的范围。这些LPC系数使得在施加MDCT变换913之前能够在设备912中应用具有增益补偿W2(z)的知觉加权滤波。因此,该变型在于低频带的差分信号e和高频带的信号xhi的知觉加权,然而先前描述的实施例仅对低频带的差分信号e进行知觉加权。
并且γ′1=0.96和γ′2=0.6。
此因子对应于:
对于z=1,即,频率0Hz或在高频带的DC分量,一旦该频率回复到在QMF滤波之前的输入信号的频率,其实际对应于4kHz。
参考图8解释在两个子带中具有增益补偿的知觉加权的好处,图8示出划分的低频带(0到4kHz)和高频带(4kHz到8kHz)。在这里考虑的变型中,MDCT编码器被施加到两个子带,包括:
·在低频带中早于MDCT的滤波W1(z);
·在高频带中早于MDCT的滤波W2(z)。
在低频带和高频带中增益补偿通过各自的因子fac1和fac2确保在4kHz处的滤波器的响应的连续性。正是此连续性使得这两类离散频谱Xlo和Xhi随后能够被编码在单个矢量中。再次,很重要的是注意到这里使用值0dB来定义低频带和高频带之间的连续性仅是说明性的。
对应于此变型的分级音频解码器在图7示出。与先前实施例的解码器相比的唯一区别是由频带扩展模块1002使用的量化LPC系数的恢复和对信号应用反向知觉加权滤波器W2(z)-1。在高频带使用的反向滤波器W2(z)-1是类型的,带有增益补偿因子1/fac2,其中fac2如上定义。
本发明也涵盖计算机程序,其包括存储在介质上的、用于由计算机或专用设备执行的一系列指令,值得注意的是这些指令的执行是执行用于编码和/或解码的本发明的知觉加权方法。
前述的计算机程序是可直接执行的程序,例如,安装在本发明的知觉加权设备中。
当然,本发明并不局限于刚刚已经描述的各实施例。尤其注意的是:
·参数γ1、γ2、γ′1、和γ′2的数值能够与以上选择的那些不同;
·知觉加权滤波器并非必须是的形式;
·在整个频带中能够定义不止两个子带。
Claims (24)
2.如权利要求1所述的设备,其特征在于,所述具有增益补偿的知觉加权滤波器包括知觉加权滤波器和增益补偿模块。
3.如权利要求2所述的设备,其特征在于,所述增益补偿模块是布置在所述知觉加权滤波器的输出端。
4.如权利要求2所述的设备,其特征在于,所述增益补偿模块是布置在所述知觉加权滤波器的输入端。
5.如权利要求1所述的设备,其特征在于,所述具有增益补偿的知觉加权滤波器包括合并增益补偿的知觉加权滤波器。
6.一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频编码器,所述编码器包括:
·用于编码在所述频带的第一子带中的原始信号的核心编码器;
·用于从所述原始信号和来自所述核心编码器的信号中计算残差信号的装置;
·用于知觉加权所述残差信号的设备;
其特征在于,所述知觉加权设备包括具有增益补偿的知觉加权滤波器,具有形式其中表示线性预测滤波器且0≤γ2≤1和0≤γ1≤1,并且fac表示增益补偿因子,是所述滤波器的系数的函数,并被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和在所述第二子带中的信号之间的频谱的连续性,
所述增益补偿的实现依据等于下式的因子fac的乘法,
其中
p是所述线性预测滤波器 的阶数。
8.如权利要求7所述的编码器,其特征在于,通过所述核心编码器提供所述线性预测滤波器的系数。
9.如权利要求6到8中任何一项所述的编码器,其特征在于,在第一子带的来自知觉加权设备的信号和在第二子带中的原始信号被施加到各自的变换分析模块,并且所述变换分析模块被连接到在所述频带的变换编码器。
10.如权利要求6到8中任何一项所述的编码器,其特征在于,所述编码器也包括用于对第二子带的原始信号进行知觉加权的知觉加权设备,其包括具有增益补偿的知觉加权滤波器,被适配来实现在用于对第二子带的原始信号进行知觉加权的所述具有增益补偿的所述知觉加权滤波器的输出信号和在第一子带中的知觉加权设备的输出信号之间的频谱的连续性。
11.如权利要求10所述的编码器,其特征在于,用于对第二子带的原始信号进行知觉加权的所述具有增益补偿的所述知觉加权滤波器包括在第二子带中的具有增益补偿的知觉加权滤波器。
12.如权利要求11所述的编码器,其特征在于,在第二子带的所述知觉加权滤波器具有形式其中表示线性预测滤波器且0≤γ′2≤1和0≤γ′1≤1。
14.如权利要求12或13所述的编码器,其特征在于,通过频带扩展模块(911)提供在第二子带中使用的所述线性预测滤波器的系数。
15.如权利要求10所述的编码器,其特征在于,在第一子带的来自知觉加权设备的信号和在第二子带中的来自知觉加权设备的信号被施加到各自的变换分析模块,并且所述变换分析模块被连接到在所述频带的变换编码器。
16.如权利要求6到8中任何一项所述的编码器,其特征在于,所述核心编码器是基于线性预测的编码器。
17.如权利要求14所述的编码器,其特征在于,所述核心编码器是CELP编码器。
18.一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频解码器,所述解码器包括:
·核心解码器,适配来在所述频带的第一子带中解码接收的由根据权利要求6到8的任何一项权利要求的编码器编码的信号;
·反向知觉加权设备,用于对代表在第一子带中由所述编码器的知觉加权设备加权的残差信号的信号进行反向知觉加权;
其特征在于,所述反向知觉加权设备包括具有增益补偿的知觉加权滤波器,其执行在第一子带的编码器的具有增益补偿的知觉加权滤波器的反向过程。
19.如权利要求18所述的解码器,其特征在于,所述解码器也包括在第二子带的解码信号的反向知觉加权设备,其包括具有增益补偿的知觉加权滤波器,其执行在第二子带的编码器的具有增益补偿的知觉加权滤波器的反向过程。
20.如权利要求19所述的解码器,其特征在于,在第二子带中使用的所述具有增益补偿的知觉加权滤波器包括在第二子带中的反向知觉加权滤波器。
22.如权利要求21所述的解码器,其特征在于,通过频带扩展模块提供在第二子带中使用的该线性预测滤波器的系数。
24.一种用于解码在给定频带中根据权利要求23所述的方法编码的音频信号的知觉加权方法,其特征在于,所述方法包括在所述子带中具有增益补偿的知觉加权的步骤,这是所述在给定频带中编码音频信号的知觉加权方法中的具有增益补偿的知觉加权步骤的反向过程。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0650538 | 2006-02-14 | ||
FR0650538 | 2006-02-14 | ||
PCT/FR2007/050760 WO2007093726A2 (fr) | 2006-02-14 | 2007-02-07 | Dispositif de ponderation perceptuelle en codage/decodage audio |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101385079A CN101385079A (zh) | 2009-03-11 |
CN101385079B true CN101385079B (zh) | 2012-08-29 |
Family
ID=36952401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200780005513XA Expired - Fee Related CN101385079B (zh) | 2006-02-14 | 2007-02-07 | 在音频编码/解码中用于知觉加权的设备 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8260620B2 (zh) |
EP (1) | EP1989706B1 (zh) |
JP (1) | JP5117407B2 (zh) |
KR (1) | KR101366124B1 (zh) |
CN (1) | CN101385079B (zh) |
AT (1) | ATE531037T1 (zh) |
WO (1) | WO2007093726A2 (zh) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7461106B2 (en) * | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
GB2448201A (en) | 2007-04-04 | 2008-10-08 | Zarlink Semiconductor Inc | Cancelling non-linear echo during full duplex communication in a hands free communication system. |
US8576096B2 (en) * | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
US8209190B2 (en) * | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
US20090234642A1 (en) * | 2008-03-13 | 2009-09-17 | Motorola, Inc. | Method and Apparatus for Low Complexity Combinatorial Coding of Signals |
US8639519B2 (en) * | 2008-04-09 | 2014-01-28 | Motorola Mobility Llc | Method and apparatus for selective signal coding based on core encoder performance |
MY155538A (en) * | 2008-07-11 | 2015-10-30 | Fraunhofer Ges Forschung | An apparatus and a method for generating bandwidth extension output data |
ES2396927T3 (es) * | 2008-07-11 | 2013-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para decodificar una señal de audio codificada |
KR101170466B1 (ko) | 2008-07-29 | 2012-08-03 | 한국전자통신연구원 | Mdct 영역에서의 후처리 방법, 및 장치 |
EP3373297B1 (en) * | 2008-09-18 | 2023-12-06 | Electronics and Telecommunications Research Institute | Decoding apparatus for transforming between modified discrete cosine transform-based coder and hetero coder |
FR2938688A1 (fr) | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
US8140342B2 (en) * | 2008-12-29 | 2012-03-20 | Motorola Mobility, Inc. | Selective scaling mask computation based on peak detection |
US8219408B2 (en) * | 2008-12-29 | 2012-07-10 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8200496B2 (en) * | 2008-12-29 | 2012-06-12 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8175888B2 (en) * | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
CN102725791B (zh) * | 2009-11-19 | 2014-09-17 | 瑞典爱立信有限公司 | 用于音频编解码中的响度和锐度补偿的方法和设备 |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
US8428936B2 (en) * | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
CN102223527B (zh) * | 2010-04-13 | 2013-04-17 | 华为技术有限公司 | 频带加权量化编解码方法和装置 |
KR101747917B1 (ko) | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
FR2969360A1 (fr) * | 2010-12-16 | 2012-06-22 | France Telecom | Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique |
US9037456B2 (en) * | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
JP5737077B2 (ja) * | 2011-08-30 | 2015-06-17 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US9129600B2 (en) | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
FR3008533A1 (fr) * | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
CN110890101B (zh) * | 2013-08-28 | 2024-01-12 | 杜比实验室特许公司 | 用于基于语音增强元数据进行解码的方法和设备 |
FR3011408A1 (fr) * | 2013-09-30 | 2015-04-03 | Orange | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
EP3787270A1 (en) | 2014-12-23 | 2021-03-03 | Dolby Laboratories Licensing Corp. | Methods and devices for improvements relating to voice quality estimation |
WO2017050398A1 (en) | 2015-09-25 | 2017-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding |
EP3288031A1 (en) * | 2016-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using a compensation value |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
EP3903309B1 (en) * | 2019-01-13 | 2024-04-24 | Huawei Technologies Co., Ltd. | High resolution audio coding |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1138183A (zh) * | 1995-05-17 | 1996-12-18 | 法国电信公司 | 综合分析语音编码器中噪声隐蔽电平适应性修改方法 |
US6691082B1 (en) * | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
CN1525439A (zh) * | 2002-11-14 | 2004-09-01 | �ž������� | 广义综合分析语音编码方法和实施该方法的编码器 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5371853A (en) * | 1991-10-28 | 1994-12-06 | University Of Maryland At College Park | Method and system for CELP speech coding and codebook for use therewith |
JP3139602B2 (ja) * | 1995-03-24 | 2001-03-05 | 日本電信電話株式会社 | 音響信号符号化方法及び復号化方法 |
US5778335A (en) * | 1996-02-26 | 1998-07-07 | The Regents Of The University Of California | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding |
KR100261253B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
US6182031B1 (en) * | 1998-09-15 | 2001-01-30 | Intel Corp. | Scalable audio coding system |
DE60035453T2 (de) * | 1999-05-11 | 2008-03-20 | Nippon Telegraph And Telephone Corp. | Auswahl des Synthesefilters für eine CELP Kodierung von breitbandigen Audiosignalen |
US6446037B1 (en) * | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
WO2001075759A1 (en) | 2000-03-27 | 2001-10-11 | Russell Randall A | School commerce system and method |
AU2001245418A1 (en) * | 2000-03-28 | 2001-10-08 | Tellabs Operations, Inc. | Perceptual spectral weighting of frequency bands for adaptive noise cancellation |
US6523003B1 (en) * | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
CN1275222C (zh) * | 2001-12-25 | 2006-09-13 | 株式会社Ntt都科摩 | 信号编码装置和信号编码方法 |
US7283966B2 (en) * | 2002-03-07 | 2007-10-16 | Microsoft Corporation | Scalable audio communications utilizing rate-distortion based end-to-end bit allocation |
KR100711989B1 (ko) * | 2002-03-12 | 2007-05-02 | 노키아 코포레이션 | 효율적으로 개선된 스케일러블 오디오 부호화 |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7392195B2 (en) * | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
US8036394B1 (en) * | 2005-02-28 | 2011-10-11 | Texas Instruments Incorporated | Audio bandwidth expansion |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
-
2007
- 2007-02-07 WO PCT/FR2007/050760 patent/WO2007093726A2/fr active Application Filing
- 2007-02-07 AT AT07731586T patent/ATE531037T1/de not_active IP Right Cessation
- 2007-02-07 EP EP07731586A patent/EP1989706B1/fr not_active Not-in-force
- 2007-02-07 US US12/279,493 patent/US8260620B2/en not_active Expired - Fee Related
- 2007-02-07 CN CN200780005513XA patent/CN101385079B/zh not_active Expired - Fee Related
- 2007-02-07 KR KR1020087021500A patent/KR101366124B1/ko active IP Right Grant
- 2007-02-07 JP JP2008554819A patent/JP5117407B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1138183A (zh) * | 1995-05-17 | 1996-12-18 | 法国电信公司 | 综合分析语音编码器中噪声隐蔽电平适应性修改方法 |
US6691082B1 (en) * | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
CN1525439A (zh) * | 2002-11-14 | 2004-09-01 | �ž������� | 广义综合分析语音编码方法和实施该方法的编码器 |
Non-Patent Citations (3)
Title |
---|
Balázs Kö |
Balázs Kövesi et al.A SCALABLE SPEECH AND AUDIO CODING SCHEME WITH CONTINUOUS BITRATE FLEXIBILITY.《Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing,2004》.2004,第1卷第I-273-I-276页. * |
vesi et al.A SCALABLE SPEECH AND AUDIO CODING SCHEME WITH CONTINUOUS BITRATE FLEXIBILITY.《Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing,2004》.2004,第1卷第I-273-I-276页. |
Also Published As
Publication number | Publication date |
---|---|
JP5117407B2 (ja) | 2013-01-16 |
US20090076829A1 (en) | 2009-03-19 |
KR20080093450A (ko) | 2008-10-21 |
WO2007093726A3 (fr) | 2007-10-18 |
EP1989706B1 (fr) | 2011-10-26 |
WO2007093726A2 (fr) | 2007-08-23 |
EP1989706A2 (fr) | 2008-11-12 |
CN101385079A (zh) | 2009-03-11 |
US8260620B2 (en) | 2012-09-04 |
JP2009527017A (ja) | 2009-07-23 |
KR101366124B1 (ko) | 2014-02-21 |
ATE531037T1 (de) | 2011-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101385079B (zh) | 在音频编码/解码中用于知觉加权的设备 | |
CN101622661B (zh) | 一种数字语音信号的改进编解码方法 | |
JP5112309B2 (ja) | 階層符号化/復号化装置 | |
US8532983B2 (en) | Adaptive frequency prediction for encoding or decoding an audio signal | |
CN101263554B (zh) | 在比特率分级和带宽分级的音频解码中的比特率切换方法 | |
CN102394066B (zh) | 语音编码装置、解码装置和语音编码方法、解码方法 | |
US8812327B2 (en) | Coding/decoding of digital audio signals | |
US20140207445A1 (en) | System and Method for Correcting for Lost Data in a Digital Audio Signal | |
US8965775B2 (en) | Allocation of bits in an enhancement coding/decoding for improving a hierarchical coding/decoding of digital audio signals | |
JP2012518194A (ja) | 適応的正弦波コーディングを用いるオーディオ信号の符号化及び復号化方法及び装置 | |
US20140324417A1 (en) | Method and apparatus for encoding and decoding audio signal using layered sinusoidal pulse coding | |
CN101405792B (zh) | 用于在音频解码器中对信号进行后处理的方法 | |
EP2132732B1 (en) | Postfilter for layered codecs | |
Schnitzler et al. | Trends and perspectives in wideband speech coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120829 Termination date: 20170207 |
|
CF01 | Termination of patent right due to non-payment of annual fee |