CN101263554B - 在比特率分级和带宽分级的音频解码中的比特率切换方法 - Google Patents
在比特率分级和带宽分级的音频解码中的比特率切换方法 Download PDFInfo
- Publication number
- CN101263554B CN101263554B CN2006800338079A CN200680033807A CN101263554B CN 101263554 B CN101263554 B CN 101263554B CN 2006800338079 A CN2006800338079 A CN 2006800338079A CN 200680033807 A CN200680033807 A CN 200680033807A CN 101263554 B CN101263554 B CN 101263554B
- Authority
- CN
- China
- Prior art keywords
- bit rate
- signal
- aftertreatment
- post
- demoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Abstract
一种在解码由音频编码系统编码的音频信号时转换比特率的方法,所述解码包括依靠比特率的后处理步骤。根据本发明,在从初始比特率向最终比特率转换时,所述方法包括从初始比特率的信号向最终比特率的信号连续改变的转换步骤,所述信号之一或两者被后处理。应用于数据分组网络的VoIP语音和/或音频信号的传送。
Description
技术领域
本发明涉及一种在解码由多速率音频编码系统编码的音频信号的时候转换比特率的方法,更具体地涉及一种比特率分级和,适合的话,带宽分级的音频编码系统。它也涉及用于比特率分级和带宽分级的音频解码系统的所述方法的应用,以及比特率分级和带宽分级的音频解码器。
背景技术
本发明在IP类承载语音的分组网络上传送语音和/或音频信号的领域有着特别有利的应用,以便提供基于该传送信道的容量能够被修改的质量。
本发明的方法实现在比特率分级和带宽分级的音频编码器/解码器(编解码器)的各种比特率之间无人为干扰的转换,更具体地用于在具有比特率独立的后处理的电话频带宽核心和一个或多个宽带增强层的比特率分级和带宽分级的音频编码的环境中介于电话频带宽和宽带之间的转换。
在一般方式中,术语“电话频带宽”和“窄带”指示频带由300赫兹(Hz)到3400Hz而术语“宽带”预定为从50Hz到7000Hz的频带。
如今有多种用于将音频(语音和/或音频)信号转换成数字信号的技术以及以此方式处理数字化的信号。
最广泛使用的技术是诸如PCM或ADPCM编码一样的“波形编码”方法,诸如CELP(码本激励线性预测)编码一样的“通过分析与合成的参数编码”,以及“在子带或通过变换的感知编码”方法。窄带CELP编码一般采用后处理来增强质量。该后处理典型地包括自适应后滤波和高通滤波。在例如“Speech Coding and Synthesis”,编者W.B.Kleijn和K.K.Paliwal,Elsevier,1995中描述用于编码音频信号的标准技术。仅用于音频信号的双向传送的技术与此相关。
在传统的语音编码中,编码器产生固定比特率的比特流。该固定的比特率约束了该编码器和解码器的简化实现和使用。如此系统的例子有64千比特每秒(kbps)的G.711编码和8kbps的G.729编码。
在一些应用中,诸如移动电话、IP承载的话音、或ad hoc网络承载的通信,优选地产生不同比特率的比特流,该比特率值从预定义组中选取。存在各种多速率编码技术:
●由源和/或信道控制的多模编码,如在AMR-NB、AMR-WB、SMV、或VMR-WB系统中使用的。
●等级编码,也称为“分级”编码,其产生被称为分等级的比特流,因为它包括核心比特率和一个或多个增强层。48kbps、56kbps、和64kbps的G.722系统是比特率分级编码的简单例子。MPEG-4 CELP编解码器是比特率分级和带宽分级的(见T.Numura et al.,A bitrate and bandwidth scalableCELP coder,ICASSP 1998)。
●多描述编码(见A.Gersho,J.D.Gibson,V.Cuperman,H.Dong,Amultiple description speech coder based on AMR-WB for mobile ad hoc networks,ICASSP 2004)。
在多速率编码中,由必要确保从一种编码比特率到另一种的转换不产生误差或人为干扰。
如果在所有比特率处的编码是基于通过在相同带宽中的语音信号的相同编码模型的表示则比特率切换很简单。例如,在AMR-NB系统中,除了由与ACELP模型兼容的LPC(线性预测编码)类模型处理的舒适噪音(comfortnoise)的产生,在电话频带(300Hz-3400Hz)中定义信号并且编码依靠ACELP(代数码本激励线性预测)模型。注意AMR-NB编码使用传统方式的以自适应后滤波和高通滤波形式的后处理,该自适应后滤波系数取决于该解码比特率。然而,没有采用预防措施来管理与根据比特率改变的后处理参数的使用关联的任何问题。相反,AMR-WB类型的宽带CELP编码没使用后处理,主要是复杂之故。
比特率转换在比特率分级和带宽分级的音频编码中甚至更成问题。编码于是基于根据比特率而不同的模型和带宽。
例如在Y.Hiwasaki,T.Mori,H.Ohmuro,J.Ikedo,D.Tokumoto和A.Kataoka,Scalable Speech Coding Technology for High-Quality UbiqutousCommunications,NTT Technical Review,March 2004的文章中说明了等级音频编码的基本概念。在此类编码中,比特流包括基本层和一个或多个增强层。基本层通过叫做“核心编解码器”的固定低比特率编解码器产生,保证最小编码质量。该层必须被解码器接收以维持可接受的质量级别。该增强层用来增强质量。虽然它们全部由编码器送出,但是它们可能并不全被解码器接收。等级编码的主要好处是其允许仅仅通过截取比特流的比特率的调节。层的数目,即,比特流可能截取的数目,定义编码的颗粒度。如果该比特流包括数层,达到两到四层,则编码被称为具有强颗粒度,精细颗粒度编码允许达1kbps的增量。
在此对等级编码技术有极大兴趣的是具有电话频带CELP类型核心编码器和一个或多个宽带增强层的比特率分级和带宽分级。在H.Taddéi et al.,AScalable Three Bitrate(8,14.2and 24kbps)Audio Coder;107th Convention AES,1999中给出具有强颗粒度8、14.2和24kbps,和在B.Kovesi,D.Massaloux,A.Sollaud,A scalable speech and audio coding scheme with continuous bitrateflexibility,ICASSP 2004中给出具有在32kbps处精细颗粒度6.4,或MPEG-4CELP编码的此种系统的例子。
在国际申请WO 01/48931和WO 02/060075涉及与在比特率分级和带宽分级音频编码的环境中的比特率切换的问题关联。
然而,在以上两个文件中描述的技术仅应对在使用电话频带宽和宽带编码的通信网络之间互通的问题。
特别是,国际申请WO 02/060075描述一种用于从宽带到电话频带转换的优化的抽选系统。
在国际申请WO 01/48931中提出的方法是从电话频带信号中产生伪随机宽带信号,尤其通过提取“频谱包络”的频带扩展技术。现有技术中的公知类似技术主要解决与宽带向电话频带转换关联的问题,其中通过使用不传送用于从接收的电话频带信号中产生宽带信号的信息的频带扩展技术寻求避免频带减少。注意到这些方法并不真地寻求控制在各带宽之间的传送,且它们也具有依赖质量高度改变的频带扩展技术的缺点,以及它们因此无法确保稳定的输出质量。
发明内容
因此,本发明的主题要解决的技术问题是要提出一种在解码由多速率音频编码系统编码的音频信号时的切换比特率的方法,所述解码包括至少一个依靠比特率的后处理步骤,该方法允许将在不同比特率之间被处理的转换,对于该比特率,使用的后处理依靠该解码的比特率,从而如果当解码时发生比特率的快速改变时消除特别敏感的人为干扰。后处理对信号引入相移并且两种不同形式的后处理的使用意味着在转换期间的相位连续性的问题。
根据本发明,对于所述的技术问题的解决方案是,在从初始比特率到最终比特率的转换期间,所述方法包括从在初始比特率的信号向在最终比特率的信号的连续改变的转换步骤,所述信号之一或两者均被后处理。
因此本发明具有这样的优点,解码包括依靠比特率的后处理,以及在所述转换步骤期间实现从在初始比特率的后处理向在最终比特率的后处理的连续改变。本发明的该特征在下面详细介绍,并且对应于在施加到在初始比特率解码的音频信号的后处理中实现“交叉衰落”。能够看到这在电话频带(在其中后处理经解码的信号)和宽度(在其中一般没有后处理该音频信号)之间的比特率转换上特别有利。
在一个具体实施例中,通过减低处于初始比特率信号的权重和增加处于最终比特率信号的权重的加权来实现所述连续改变。
本发明也适用处于初始比特率的信号和处于最终比特率的信号均被后处理的情况。
本发明也提供一种计算机程序,其包括当所述程序由计算机执行时用于执行本发明的方法的代码指令。
本发明还对比特率分级的音频解码系统提供本发明方法的应用。
本发明还对比特率分级和带宽分级的音频解码系统提供本发明方法的应用,在该系统中通过第一频带的第一解码层获得初始比特率以及通过第二解码层(指将所述第一频带扩展成第二频带的层)获得最终比特率,该后处理步骤被施加到以初始比特率执行的解码。
本发明还对比特率分级和带宽分级的音频解码系统提供本发明方法的应用,在该系统中通过第一频带的第一解码层获得最终比特率以及通过第二解码层(指将所述第一频带扩展成第二频带的层)获得初始比特率,该后处理步骤被施加到以最终比特率执行的解码。
“扩展频带”的具体例子是以上定义的“宽带”,所述第一频带则是电话频带。
本发明还提供多速率音频解码器,在其中突出的是所述解码器包括依靠比特率的后处理阶段,当从初始比特率向最终比特率转换时适配所述后处理阶段以通过从处于初始比特率的信号向最终比特率处的信号的连续改变实现转换,其中所述信号中至少一个被后处理。
尤其,适配所述后处理阶段以通过减低处于初始比特率信号的权重和增加处于最终比特率信号的权重的加权来实现所述连续改变。
附图说明
作为非限制性示例并参考附图提供的以下说明清楚地解释本发明的构成以及如何实现本发明。
图1是4层比特率分级和带宽分级的编码器的图;
图2是与图1的编码器关联的本发明的解码器的图;
图3展示与图1的编码器关联的比特流的结构;
图4是在本发明的解码器的电话频带中后处理信号和非后处理信号之间的转换方法的流程图;
图5是依照本发明的用于在电话频带和具有频带扩展的宽带之间转换的方法的流程图;
图6是依照本发明的用于在电话频带和具有预测变换解码层的宽带之间转换的转换方法的流程图;
图7是通过本发明的方法用于为各比特率之间和各频带之间的转换管理接收的宽带帧的计数的过程的流程图;
图8是概括图7的流程图的操作的表;
图9是设置用于从电话频带向宽带切换的自适应衰减系数的表。
具体实施方式
以下在比特率分级和带宽分级的音频编码器的环境中描述本发明。在此考虑的比特率分级和带宽分级的编码结构使用电话频带CELP类型编码器作为核心编码,其一个具体的例子使用如ITU-T建议G.729,Coding of speech at8kbit/s using Cojugate Structure Algebraic Code Excited Linear Prediction(CS-ACELP),March 1996和R.Salami et al.,Description of ITU-TRecommendation G.729 Annex A:Reduced complexity 8kbit/s CS-ACELP codec,ICASSP 1997描述的G.729A编码器。
三个增强阶段被加入到CELP核心编码中,即电话频带CELP编码增强、频带扩展、和预测变换编码。
在此考虑的比特率转换是在电话频带和宽带之间的转换。
图1是使用的编码器的图。
具有以16kHz采样的50Hz-7000Hz的音频频带的音频信号被分成320个样本的20毫秒(ms)帧。具有截止频率50Hz的高通滤波101被施加到输入信号。获得的信号SWB被用于编码器的多个分支。
首先,在第一分支,将低通滤波和从16kHz到8kHz的按系数2的向下采样,102,施加到信号SWB。该操作产生以8kHz采样的电话频带信号。由使用CELP类型编码的核心编码器103处理该信号。这里该编码对应于G.729A编码器,其产生具有比特率8kbps的比特流核心。
然后第一增强层引入CELP编码的第二阶段103。尤其对非语音的声音,存在于革新者字典中的实现CELP激励的增加和提供质量增强。该第二编码阶段的比特率是4kbps并且该关联的参数是脉冲的位置和符号以及对于40个样本(5ms以8kHz)的每个子帧关联的革新者字典的增益。
进行该核心编码器和第一增强层的解码以获得在电话频带中合成的12kbps信号104。从8kHz到16kHz按系数2的过采样和低通滤波105从编码器的头两个阶段中产生以16kHz采样的版本(version)。
第三增强层实现对宽带的带宽扩展106。能够通过预加重滤波器预处理输入信号SWB。该预加重滤波器从宽带线性预测滤波器中产生高频的更好表示。为了补偿预加重滤波器的影响,于是在合成中使用反向去加重滤波器。此编码和解码结构的替代没有使用预加重或去加重滤波器。
下一步计算和量化该宽代线性预测滤波器。该线性预测滤波器是第18阶滤波器,但是能够选择比如第16阶预测的较低预测阶。能够通过使用Levinson-Durbin算法的自相关方法计算该线性预测滤波器。
使用来自电话频带核心编码器的滤波器的系数的预测量化此宽带线性预测滤波器AWB(z)。然后能够使用例如多级矢量量化和使用电话频带核心编码器的去量化LSF(线频谱频率)参数来量化该系数,如在H.Ehara,T.Morii,M.Oshikiri,和K.Yoshida,Predictive VQ for bandwidth scalable LSPquantization,ICASSP 2005文章中记载的。
从核心编码器的电话频带激励参数:音调周期延迟、关联增益和核心编码器的代数激励以及CELP激励的第一增加层和关联的增益中获得宽带激励。
使用电话频带阶段的激励参数的过采样版本产生此激励。
然后由先前已经计算的合成滤波器过滤该宽带激励。如果已经对输入信号施加预加重,则对合成滤波器的输出信号施加去加重滤波器。获得的信号是宽带信号,其能量没有被调整。为了计算用于校平该高频带(3400Hz-7000Hz)的能量的增益,向该宽带合成信号施加高通滤波器。与此并行的,相同的高通滤波器被施加到误差信号,其对应于在延迟的原始信号和先前两个阶段的合成信号之间的差别。然后这两个信号被用来计算将被施加到该合成宽带信号的增益。依靠在这两个信号之间的能量比率计算增益。然后将该量化的增益gWB施加到80个样本的子帧层级的信号S14 WB(5ms到16kHz),并且以此方式获得的信号然后被添加到来自先前阶段的合成的信号以便创建对应于14kbps比特率的宽带信号。
编码的剩余部分在频域使用预测变换编码方案实现。延迟的输入信号108和14kbps合成信号107经过的感知等待滤波器109、111滤波,一般y=0.92且μ=0.68。然后通过TDAC(时域声音混淆消除)交迭变换编码方案(Y.Mahieux and J.P.Petit,Transform coding of audiosignals at 64kbit/s,IEEE GLOBECOM 1990)编码这些信号。
施加修正的离散余弦变换(MDCT)110到具有50%(每隔20ms刷新MDCT分析)的交迭的加权的输入信号的640个样本的块,以及施加112到来自先前的频带扩展阶段的14kbps(相同块长度和相同的交迭)处的加权的合成信号。将被编码的MDCT频谱,113,对应于在14kbps处关于0到3400Hz的在加权的输入信号和合成信号之间的差异,以及对应于从3400Hz到7000Hz的加权的输入信号。通过将最后40个系数(仅编码头280个系数)设置为零来限制该频谱为7000Hz。将频谱划分为18个频带:一个含八个系数的频带和17个含16个系数的频带。对于该频谱的每个频带,MDCT系数的能量被计算(缩放因子)。该18个缩放因子构成其后被量化、编码和按帧传送的该加权信号的频谱包络。图3示出该比特流的格式。
动态比特分配基于来自频谱包络的去量化版本的频谱的频带能量。这实现了在编码器和解码器的二进制分配之间的兼容性。然后通过使用在大小和维度上字典交织的矢量量化量化在每个频带的归一化(精细结构)MDCT系数,正如C.Lamblin et al.,″Quantification vectorielle en dimension et resolutionvariables″[″Vector quantization with variable dimension and resolution″],patentPCT FR 04 00219,2004记载的,该字典包括置换代码的联合。最后,将关于核心编码器、电话频带CELP增强阶段、宽带CELP阶段和最后该频谱包络的信息和归一化的编码系数复用并且以帧来传送。
图2是与图1的编码器关联的解码器的框图。
模块2701解复用包含在比特流中的参数。作为接收的比特的数目的函数对帧解码存在多种情况,且参考图2描述了四种情况:
1.对于8kbps的接收比特率,第一关注由解码器接收最小数目的比特。在此情况下,仅解码第一阶段。因此仅涉及CELP(G.729A+)类型核心解码器202的比特流被接收和解码。能够由G.729解码器通过自适应后滤波203和高通滤波后处理204处理该合成。在该实施例中,术语“后处理”指的是这两种操作的组合。然而,显然该术语“后处理”也能够仅指自适应后滤波或仅指高通滤波型的后处理。该信号被过采样,206,和滤波,207,以产生以16kHz的采样信号。
2.对于12kbps的接收比特率,第二情况关注仅涉及第一和第二解码阶段的比特数目的接收。在此情况下,解码核心解码器和第一CELP激励增强阶段。能够由G.729解码器通过后处理203、204处理该合成。如同前面,该信号被过采样206和滤波207以产生以16kHz的采样信号。
3.对于14kbps的接收比特率,第三情况对应于涉及头三个解码阶段的比特数目的接收。在此情况下,除了没有向CELP解码输出施加后处理的事实之外,如同情况2,首先实现头两个解码阶段,在这之后频带扩展模块在解码在宽带209以及与激励关联的增益213中成对频谱线(WB-LSF)的参数后产生以16kHz的采样信号。从核心编码器和第一CELP增强阶段208中产生宽带激励。然后由合成滤波器210和适合的话(如果在编码器中使用了预加重滤波器)由去加重滤波器211滤波该激励。高通滤波器212被施加到获得的信号,且依靠关联的增益214每隔5ms适配该频带扩展信号的能量。该信号然后被加入从头两个解码阶段215中获得的以16kHz采样的电话频带信号。在反向MDCT 220和加权的合成滤波器221之前通过将最后40个MDCT系数设为0来在变换域过滤该信号,目的是获取限制在7000Hz的信号。
4.对于比16kbps大或相等的接收比特率,最后的情况对应于解码解码器的全部阶段。最后阶段由预测变换解码器构成。首先执行上述的步骤3.然后,作为额外接收比特数目的函数,预测变换解码方案被适配来:
●如果比特数目对应于仅仅部分频谱包络,或对应于其整个但是不具有接收的精细结构(fine structure),则对应于由频带扩展阶段215产生的信号,部分或完整的频谱包络被用来调整MDCT系数的频带的能量,216和217,在范围3400Hz到7000Hz中,218。此系统作为接收比特数目的函数实现音频质量的逐步改进。
●如果比特数目对应于整个频谱包络并且对应于部分或整个精细结构,则以与在编码器中相同的方式实现比特分配。在接收精细结构的频带中,从频谱包络和去量化的精细结构中计算解码的MDCT系数。在没有接收精细结构的范围3400Hz到7000Hz的频带中,使用前面段落的程序,即,基于接收的频谱包络在能量上调整根据通过频带扩展获得的信号计算的MDCT系数,216和217,218。因此由以下构成用于合成的MDCT频谱:由在头两个解码阶段被加入到在0到3400Hz之间的频带解码的误差信号中的合成信号;以及还有,对于范围3400Hz到7000Hz的频带,由已经接收精细结构的频带中解码的MDCT系数和对其它频谱频带在能量上调整的频带扩展阶段的MDCT系数。
然后反向MDCT被施加到解码的MDCT系数,220,以及由加权的合成滤波器滤波,221,产生输出信号。
以下在图2的解码器的环境中描述依照本发明的转换方法。
块205表示“交叉衰落”模块。如果由解码器接收的比特数目不足够解码除了第一阶段或第一和第二阶段,即,对于8kbps或12kbps的接收比特率,则解码器的最终输出的有效带宽是电话频带。在此情形下,为了增强合成信号的质量,在过采样之前,广义上是G.729A解码器的一部分的后处理203、204被施加到电话频带。
相反,如果也实现在宽带阶段的解码,对于接收比特率大于或等于14kbps,则该后处理没有起作用,因为在编码器中,已经从电话频带的没有后处理的版本中计算较高阶段的编码。
后处理203和204向信号引入相移。当在有和没有后处理的模式之间转换时,由此必须提供软转换。图4示出块205的实现,其通过施加交叉衰落在后处理和非后处理的电话频带信号之间提供此缓慢的转换。
步骤401检查当前帧是否是电话频带帧,即,验证当前帧的比特率是否是8kbps或12kbps。在否定答复的情况下,触发步骤402以验证先前帧是否在电话频带中被后处理(这等于验证先前帧的比特率是否是8kbps-12kbps)。在否定答复的情况下,在步骤403中,非后处理信号S1被复制到信号S3。相反,当对检测402为肯定答复时,在步骤404中,信号S3将包含交叉衰落的结果,其中非后处理分量S1的权重增加而后滤波分量S2的权重减少。步骤404之后跟着以值0来更新标志prevPF的步骤405。
当在步骤401中存在肯定答复时,在步骤406中对于在电话频带中的后处理是否在先前帧中起作用执行验证。在肯定答复时,在步骤408中,后处理信号S2被复制到信号S3。相反,在步骤406为否定答复时,在步骤407中,信号S3被计算为交叉衰落的结果,这次非后处理分量S1的权重减少而后处理分量S2的权重增加。在步骤407之后,触发步骤409以便利用值1来更新标志prevPF。
在本实施例的变体中,如果由解码器接收的比特数目仅允许解码第一阶段或第一和第二阶段,即,对于8或12kbps的接收比特率,则解码器的最终输出的有效带宽是电话频带(信号S1)。在此情形下,为了增强合成信号的质量,在过采样之前,在电话频带的后处理被施加。
相反,如果也实现宽带阶段的解码,对于接收比特率大于或等于14kbps,则在编码器中不同的后处理发生作用(信号S2),已经从具有电话频带的后处理的版本中计算较高阶段的编码。
用于8或12kbps的比特率的后处理和用于比特率大于或等于14kbps的后处理向信号引入不同的相移。当在不同版本的后处理的模式之间转换时,由此必须提供软转换。通过施加交叉衰落(其产生信号S3)实现在具有各种形式的后处理的电话频带信号之间的缓慢转换。
验证当前帧是否是电话频带帧。在否定答复的情况下,验证先前帧是否是电话频带帧。在否定答复的情况下,后处理信号S1被复制到信号S3。相反,在肯定答复的情况下,信号S3将包含交叉衰落的结果,其中后处理分量S1的权重增加而后处理分量S2的权重减少。
当存在肯定答复时,验证先前帧是否是电话频带帧。在肯定答复时,后处理信号S2被复制到信号S3。相反,在否定答复时,信号S3被计算为交叉衰落的结果,这次后处理分量S1的权重减少而后处理分量S2的权重增加。
块209计算频带扩展和预测变换解码阶段必须的宽带线性预测滤波器。如果在接收宽带帧后,一帧的比特流仅仅电话频带部分被接收则该计算是必须的,以及需要频带扩展以便维持频带效果。然后从电话频带核心解码器的LSF中外推出一组LSF。例如,8个LSF能够被一致地分布在介于来自电话频带的最后的LSF和Nyquist频率之间的频带上。然后线性预测滤波器能够趋向用于高频的平坦振幅响应滤波器。
块213依照本发明提供用于频带扩展的增益适配。参考图5和7描述对应于所述块的流程图。
参考图5描述向高频带施加自适应增益衰减的原理。首先,依照两种可能性计算第一宽带解码层的增益,501。如果已经接收对应于频带扩展层的比特流,则通过解码获得该增益,503。相反,如果在比特流中没有接收到此增益,则外推与该解码层关联的增益,502。例如,能够通过利用先前进行的电话频带的真实解码来校正宽带解码阶段的基带的能量进行增益计算。
然后根据参考图7描述的原理更新先前接收的宽带帧数目的计数器,504。
最后,该计数器被用来设置施加到第一宽带解码阶段的增益的衰减系数,505。
图7表示用于管理接收的宽带帧数目的计数的过程的流程图。按以下方式更新计数器。如果当前帧是宽带帧,则如果已经接收与第一宽带解码阶段关联的增益(图5,块501)并且先前帧也是宽带帧,则该计数器增加1并且在值MAX_COUNT_RCV处饱和。该值对应于在介于电话频带比特率和宽带比特率之间切换期间帧(在其间该宽带解码信号将被衰减)的数目。
相反,如果接收的当前帧是电话频带帧,则存在几种可能的行为。如果先前帧也是电话频带帧,则计数器置0。如果不是,如果先前帧是宽带帧且计数器具有小于MAX_COUNT_RCV的值,则计数器也置0。在所有其它情况下,计数器保持前一值。
该流程图的功能总结在图8的表中。当MAX_COUNT_RCV采用值100时,在图9的表中示出由衰减系数采用的值,该表作为示例提供。注意对应于相位扩展在电话频带的解码,衰减系数保持为0直到帧65。通过逐渐地增加该衰减系数从帧66实现适当的转换状态。
如参考图6描述的块219依照本发明通过变换的预测编码实现增强层的自适应衰减。
该图是预测变换解码层的自适应衰减程序的流程图。首先,验证该层的频谱包络是否已经完整接收,601。如果是的话,则使用接收的宽带帧计数器和图9的衰减表将0-3500Hz低频带校正MDCT校正系数衰减,602。
然后,在两种情况下,监视接收的宽带帧的数目。如果该数目小于MAX_COUNT_RCV,则对应于具有信息传送的频带扩展的第一宽带解码阶段的MDCT系数被用于预测变换解码阶段。相反,如果计数器具有最大值,则执行用于利用解码的频谱包络校平预测变换解码频带的能量的程序。
Claims (14)
1.一种在解码由多速率音频编码系统编码的音频信号时的比特率切换方法,所述解码包括依靠所述比特率的至少一个后处理步骤,其特征在于,当从初始比特率向最终比特率切换时,所述方法包括通过加权处理的交叉衰落步骤,其中根据初始比特率的后处理来确定降低处于后处理的初始比特率的信号的权重与否,根据最终比特率的后处理来确定增加处于后处理的最终比特率的信号的权重与否。
2.如权利要求1所述的方法,其特征在于后处理是高通滤波。
3.如权利要求1所述的方法,其特征在于后处理是自适应后滤波。
4.如权利要求1所述的方法,其特征在于后处理是高通滤波和自适应后滤波的组合。
5.如权利要求1所述的方法,其特征在于处于初始比特率的信号和处于最终比特率的信号之间的仅一个信号被后处理。
6.如权利要求1所述的方法,其特征在于处于初始比特率的信号和处于最终比特率的信号都被后处理。
7.一种音频信号的音频比特率分级解码系统,其特征在于它实现了根据权利要求1到6中的任何一项的比特率切换方法。
8.一种实现根据权利要求1到6中的任何一项的比特率切换方法的音频比特率分级和带宽分级解码系统,所述系统包括其中在第一频带中获得初始比特率的第一解码装置和通过作为将所述第一频带扩展成第二频带的装置的、获得最终比特率的第二解码装置。
9.一种多速率音频解码器,其特征在于,所述解码器包括至少一个后处理装置,后处理装置依靠所述比特率,所述解码器包括交叉衰落模块,所述交叉衰落模块当从初始比特率向最终比特率切换时被适配以进行通过加权处理的交叉衰落步骤,其中根据初始比特率的后处理来确定降低处于后处理的初始比特率的信号的权重与否,根据最终比特率的后处理来确定增加处于后处理的最终比特率的信号的权重与否。
10.如权利要求9所述的解码器,其特征在于后处理装置执行高通滤波。
11.如权利要求9所述的解码器,其特征在于后处理装置执行自适应后滤波。
12.如权利要求9所述的解码器,其特征在于后处理装置执行高通滤波和自适应后滤波的组合滤波。
13.如权利要求9所述的解码器,其特征在于处于初始比特率的信号和处于最终比特率的信号之间的仅一个信号被后处理。
14.如权利要求9所述的解码器,其特征在于处于初始比特率的信号和处于最终比特率的信号都被后处理。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0552286 | 2005-07-22 | ||
FR0552286 | 2005-07-22 | ||
PCT/FR2006/050697 WO2007010158A2 (fr) | 2005-07-22 | 2006-07-10 | Procede de commutation de debit en decodage audio scalable en debit et largeur de bande |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101263554A CN101263554A (zh) | 2008-09-10 |
CN101263554B true CN101263554B (zh) | 2011-12-28 |
Family
ID=36177265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800338079A Expired - Fee Related CN101263554B (zh) | 2005-07-22 | 2006-07-10 | 在比特率分级和带宽分级的音频解码中的比特率切换方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US8630864B2 (zh) |
EP (1) | EP1907812B1 (zh) |
JP (1) | JP5009910B2 (zh) |
KR (1) | KR101295729B1 (zh) |
CN (1) | CN101263554B (zh) |
AT (1) | ATE490454T1 (zh) |
DE (1) | DE602006018618D1 (zh) |
ES (1) | ES2356492T3 (zh) |
RU (1) | RU2419171C2 (zh) |
WO (1) | WO2007010158A2 (zh) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7461106B2 (en) | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
EP2096632A4 (en) * | 2006-11-29 | 2012-06-27 | Panasonic Corp | DECODING DEVICE AND AUDIO DECODING METHOD |
ES2404408T3 (es) * | 2007-03-02 | 2013-05-27 | Panasonic Corporation | Dispositivo de codificación y método de codificación |
US8571852B2 (en) | 2007-03-02 | 2013-10-29 | Telefonaktiebolaget L M Ericsson (Publ) | Postfilter for layered codecs |
WO2008120438A1 (ja) * | 2007-03-02 | 2008-10-09 | Panasonic Corporation | ポストフィルタ、復号装置およびポストフィルタ処理方法 |
US8576096B2 (en) * | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
US8209190B2 (en) * | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
KR101290622B1 (ko) | 2007-11-02 | 2013-07-29 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 오디오 복호화 방법 및 장치 |
US9872066B2 (en) * | 2007-12-18 | 2018-01-16 | Ibiquity Digital Corporation | Method for streaming through a data service over a radio link subsystem |
DE102008009720A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen |
US20090234642A1 (en) * | 2008-03-13 | 2009-09-17 | Motorola, Inc. | Method and Apparatus for Low Complexity Combinatorial Coding of Signals |
US8639519B2 (en) * | 2008-04-09 | 2014-01-28 | Motorola Mobility Llc | Method and apparatus for selective signal coding based on core encoder performance |
KR101518532B1 (ko) * | 2008-07-11 | 2015-05-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램 |
US20100057473A1 (en) * | 2008-08-26 | 2010-03-04 | Hongwei Kong | Method and system for dual voice path processing in an audio codec |
US20100063825A1 (en) * | 2008-09-05 | 2010-03-11 | Apple Inc. | Systems and Methods for Memory Management and Crossfading in an Electronic Device |
ES2671711T3 (es) * | 2008-09-18 | 2018-06-08 | Electronics And Telecommunications Research Institute | Aparato de codificación y aparato de decodificación para transformar entre codificador basado en transformada de coseno discreta modificada y hetero codificador |
US8140342B2 (en) * | 2008-12-29 | 2012-03-20 | Motorola Mobility, Inc. | Selective scaling mask computation based on peak detection |
US8219408B2 (en) * | 2008-12-29 | 2012-07-10 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8200496B2 (en) * | 2008-12-29 | 2012-06-12 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8175888B2 (en) | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
FR2947944A1 (fr) * | 2009-07-07 | 2011-01-14 | France Telecom | Codage/decodage perfectionne de signaux audionumeriques |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
US8428936B2 (en) * | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US8886523B2 (en) * | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
US9047875B2 (en) * | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
JP5489900B2 (ja) | 2010-07-27 | 2014-05-14 | ヤマハ株式会社 | 音響データ通信装置 |
NO2669468T3 (zh) * | 2011-05-11 | 2018-06-02 | ||
RU2480904C1 (ru) * | 2012-06-01 | 2013-04-27 | Анна Валерьевна Хуторцева | Способ совместной фильтрации и дифференциальной импульсно-кодовой модуляции-демодуляции сигналов |
CN103516440B (zh) | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
US9129600B2 (en) | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
CN111145767B (zh) * | 2012-12-21 | 2023-07-25 | 弗劳恩霍夫应用研究促进协会 | 解码器及用于产生和处理编码频比特流的系统 |
KR101790641B1 (ko) * | 2013-08-28 | 2017-10-26 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 하이브리드 파형-코딩 및 파라미터-코딩된 스피치 인핸스 |
KR102244612B1 (ko) | 2014-04-21 | 2021-04-26 | 삼성전자주식회사 | 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법 |
CN113259059B (zh) * | 2014-04-21 | 2024-02-09 | 三星电子株式会社 | 用于在无线通信系统中发射和接收语音数据的装置和方法 |
CN113259058A (zh) * | 2014-11-05 | 2021-08-13 | 三星电子株式会社 | 用于在无线通信系统中发射和接收语音数据的装置和方法 |
US10049684B2 (en) | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
MX2020002972A (es) | 2017-09-20 | 2020-07-22 | Voiceage Corp | Metodo y dispositivo para asignar un presupuesto de bits entre subtramas en un codec celp. |
EP3701523B1 (en) * | 2017-10-27 | 2021-10-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise attenuation at a decoder |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6496794B1 (en) * | 1999-11-22 | 2002-12-17 | Motorola, Inc. | Method and apparatus for seamless multi-rate speech coding |
CN1427989A (zh) * | 2000-05-08 | 2003-07-02 | 诺基亚有限公司 | 在具有多带宽能力的电信连接中改变源信号带宽的方法和装置 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0728494A (ja) * | 1993-07-09 | 1995-01-31 | Nippon Steel Corp | 圧縮符号化音声信号復号化方法および装置 |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
US7145898B1 (en) * | 1996-11-18 | 2006-12-05 | Mci Communications Corporation | System, method and article of manufacture for selecting a gateway of a hybrid communication system architecture |
US6904110B2 (en) * | 1997-07-31 | 2005-06-07 | Francois Trans | Channel equalization system and method |
FI980132A (fi) * | 1998-01-21 | 1999-07-22 | Nokia Mobile Phones Ltd | Adaptoituva jälkisuodatin |
JP2000259195A (ja) * | 1999-01-08 | 2000-09-22 | Matsushita Electric Ind Co Ltd | デコード回路及びそれを用いた再生装置 |
JP2000267686A (ja) * | 1999-03-19 | 2000-09-29 | Victor Co Of Japan Ltd | 信号伝送方式及び復号化装置 |
GB2357682B (en) * | 1999-12-23 | 2004-09-08 | Motorola Ltd | Audio circuit and method for wideband to narrowband transition in a communication device |
JP2003050598A (ja) * | 2001-08-06 | 2003-02-21 | Mitsubishi Electric Corp | 音声復号装置 |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
US6590833B1 (en) * | 2002-08-08 | 2003-07-08 | The United States Of America As Represented By The Secretary Of The Navy | Adaptive cross correlator |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
ATE527654T1 (de) * | 2004-03-01 | 2011-10-15 | Dolby Lab Licensing Corp | Mehrkanal-audiodecodierung |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
WO2008151408A1 (en) * | 2007-06-14 | 2008-12-18 | Voiceage Corporation | Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711 |
US8600740B2 (en) * | 2008-01-28 | 2013-12-03 | Qualcomm Incorporated | Systems, methods and apparatus for context descriptor transmission |
CN102113346B (zh) * | 2008-07-29 | 2013-10-30 | 杜比实验室特许公司 | 用于电声通道的自适应控制和均衡的方法 |
US9236063B2 (en) * | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
-
2006
- 2006-07-10 KR KR1020087004177A patent/KR101295729B1/ko not_active IP Right Cessation
- 2006-07-10 RU RU2008106750/09A patent/RU2419171C2/ru not_active IP Right Cessation
- 2006-07-10 JP JP2008522028A patent/JP5009910B2/ja not_active Expired - Fee Related
- 2006-07-10 ES ES06779036T patent/ES2356492T3/es active Active
- 2006-07-10 AT AT06779036T patent/ATE490454T1/de not_active IP Right Cessation
- 2006-07-10 CN CN2006800338079A patent/CN101263554B/zh not_active Expired - Fee Related
- 2006-07-10 EP EP06779036A patent/EP1907812B1/fr not_active Not-in-force
- 2006-07-10 DE DE602006018618T patent/DE602006018618D1/de active Active
- 2006-07-10 WO PCT/FR2006/050697 patent/WO2007010158A2/fr active Application Filing
- 2006-07-10 US US11/989,313 patent/US8630864B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6496794B1 (en) * | 1999-11-22 | 2002-12-17 | Motorola, Inc. | Method and apparatus for seamless multi-rate speech coding |
CN1427989A (zh) * | 2000-05-08 | 2003-07-02 | 诺基亚有限公司 | 在具有多带宽能力的电信连接中改变源信号带宽的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2007010158A3 (fr) | 2007-05-10 |
JP5009910B2 (ja) | 2012-08-29 |
RU2419171C2 (ru) | 2011-05-20 |
ATE490454T1 (de) | 2010-12-15 |
EP1907812B1 (fr) | 2010-12-01 |
KR20080033997A (ko) | 2008-04-17 |
DE602006018618D1 (de) | 2011-01-13 |
EP1907812A2 (fr) | 2008-04-09 |
WO2007010158A2 (fr) | 2007-01-25 |
KR101295729B1 (ko) | 2013-08-12 |
US20090306992A1 (en) | 2009-12-10 |
CN101263554A (zh) | 2008-09-10 |
ES2356492T3 (es) | 2011-04-08 |
US8630864B2 (en) | 2014-01-14 |
RU2008106750A (ru) | 2009-08-27 |
JP2009503559A (ja) | 2009-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101263554B (zh) | 在比特率分级和带宽分级的音频解码中的比特率切换方法 | |
CN101263553B (zh) | 分级编码/解码设备 | |
CN101385079B (zh) | 在音频编码/解码中用于知觉加权的设备 | |
CN101622661B (zh) | 一种数字语音信号的改进编解码方法 | |
US7778827B2 (en) | Method and device for gain quantization in variable bit rate wideband speech coding | |
CN1244907C (zh) | 宽带语音编解码器中的高频增强层编码方法和装置 | |
AU2003281378B2 (en) | Method and device for efficient in-band dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for CDMA wireless systems | |
Herre et al. | Overview of MPEG-4 audio and its applications in mobile communications | |
WO2009117967A1 (zh) | 编码、解码的方法及装置 | |
JP2006525533A5 (zh) | ||
CN101281749A (zh) | 可分级的语音和乐音联合编码装置和解码装置 | |
AU2008318143A1 (en) | Method and apparatus for judging DTX | |
CN101405792B (zh) | 用于在音频解码器中对信号进行后处理的方法 | |
CN101622667B (zh) | 用于分层编解码器的后置滤波器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111228 Termination date: 20170710 |