CN101828220B - 用于mpeg aac及mpeg aac eld编码器/解码器的分析及合成滤波器组的有效实施方法 - Google Patents
用于mpeg aac及mpeg aac eld编码器/解码器的分析及合成滤波器组的有效实施方法 Download PDFInfo
- Publication number
- CN101828220B CN101828220B CN2008801119222A CN200880111922A CN101828220B CN 101828220 B CN101828220 B CN 101828220B CN 2008801119222 A CN2008801119222 A CN 2008801119222A CN 200880111922 A CN200880111922 A CN 200880111922A CN 101828220 B CN101828220 B CN 101828220B
- Authority
- CN
- China
- Prior art keywords
- sign
- sequence
- spectral coefficient
- sample sequence
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
Abstract
一种编码器可包括可用以实施高级音频编码(AAC)算法、AAC增强型低延迟(ELD)算法或所述两种算法的核心MDCT滤波器组。对于所述AAC算法,将输入样本序列直接发送到所述MDCT滤波器组以获得输出样本序列。对于所述AAC-ELD算法,反转所述输入样本序列的输入样本的正负号,将MDCT分析滤波器组应用于所述经正负号反转的输入样本序列以获得输出样本序列,颠倒所述输出样本序列的次序,且反转所述输出样本序列的交替输出样本的正负号。类似地,一种解码器可包括可用以实施AAC-ELD或AAC及AAC-ELD算法两者的核心IMDCT合成滤波器组。用于所述解码器的步骤仅为所述编码器的颠倒。
Description
根据35U.S.C.§119主张优先权
本专利申请案主张2007年10月16日申请的题为“用于MPEG AAC及MPEG AACELD编码器/解码器的分析及合成滤波器组的有效联合实施方案(Efficient JointImplementation of analysis and Synthesis Filterbanks For MPEG AAC and MPEG AAC ELDEncoders/Decoders)”的第60/980,418号美国临时申请案的优先权,所述临时申请案转让给本受让人且特此以引用的方式明确地并入本文中。
技术领域
以下描述内容大体上涉及编码器及解码器,且明确地说,涉及用于高级音频编码(AAC)及AAC增强型低延迟(ELD)的滤波器组实施方案。
背景技术
音频编码的一个目标是在尽可能多地保持原始声音质量的同时将音频信号压缩成所要的有限信息量。在编码过程中,将时域中的音频信号变换成频域。
高级音频编码(AAC)是用于数字音频的标准化有损压缩及编码方案,其被指定为电影图片专家小组(MPEG)标准的部分。AAC为采用两个主要编码策略来大大减少表示高质量数字音频所需的数据量的宽带音频编码算法。第一,丢弃感知上不相关的信号分量。第二,消除经编码音频信号中的冗余。为了应用这些技术,首先通过改进型离散余弦变换(MDCT)来处理信号。改进型离散余弦变换(MDCT)为基于类型IV离散余弦变换(DCT-IV)配合重叠的额外属性的傅立叶相关变换。MDCT变换与DCT-IV及傅立叶变换的关系允许通过使用所谓的“快速”算法(与快速傅立叶变换(FFT)算法相关-见K·R·桡(K.R.Rao)及P·易普(P.Yip)的“离散余弦变换:算法、优势、应用(DiscreteCosine Transform:Algorithms,Advantages,Applications)”,学术出版社,1990 ISBN:012580203X)来非常有效地实施所述滤波器组。
新兴的MPEG AAC-ELD(增强型低延迟)编解码器经设计以组合感知音频编码的优点与对于双向通信为必要的低延迟。然而,与传统AAC编解码器相比,AAC-ELD使 用不同的滤波器组结构。此滤波器组与MDCT或DCT-IV变换不兼容,且无法通过现有快速算法直接计算。这增加了实施AAC-ELD的复杂性及成本。当两种类型的算法将在同一DSP核心上实施时,这也增加了复杂性及成本。因此,需要在同一DSP核心上实施AAC-ELD或AAC及AAC-ELD编解码器算法两者的较简单方式。
发明内容
下文呈现一个或一个以上实施例的简化概述,以便提供对一些实施例的基本理解。此概述并非为所有预期实施例的广泛综述,且既不希望识别所有实施例的关键或重要要素,也不希望描绘任何或所有实施例的范围。其唯一目的在于以简化形式呈现一个或一个以上实施例的一些概念作为稍后呈现的较详细描述内容的序言。
提供一种编码器,其包括可用以实施高级音频编码(AAC)算法、AAC增强型低延迟(ELD)算法或所述两种算法的核心MDCT分析滤波器组。对于AAC算法,将输入样本直接发送到MDCT分析滤波器组以获得输出样本。对于AAC-ELD算法,反转第一组输入样本的正负号的正负号,应用MDCT分析滤波器组以获得频谱系数输出样本,颠倒频谱系数输出样本的次序,且反转第二组交替频谱系数输出样本的正负号。
根据一个实例,提供一种编码器,其使用共用核心改进型离散余弦变换来实施分析滤波器组。获得输入样本序列且反转第一组交替输入样本的正负号。通过将改进型离散余弦变换(MDCT)应用于输入样本序列而产生频谱系数输出样本。颠倒频谱系数输出样本的次序,且接着反转第二组交替频谱系数输出样本的正负号。在一个实例中,输入样本序列为N个样本长,且反转第一组交替输入样本的正负号包括:(a)如果N/4为偶数,则反转序列的偶数索引输入样本的正负号;及(b)如果N/4为奇数,则反转序列的奇数索引输入样本的正负号。在另一实例中,输入样本序列为N个样本长,且反转第二组交替频谱系数输出样本的正负号包括:(a)如果N/2为偶数,则反转奇数索引频谱系数输出样本的正负号;及(b)如果N/2为奇数,则反转偶数索引频谱系数输出样本的正负号。在一种操作模式中,MDCT可作为高级音频编码(AAC)滤波器组来操作。在另一操作模式中,分析滤波器组可作为AAC增强型低延迟(ELD)滤波器组来操作。
类似地,提供一种解码器,其使用共用核心逆改进型离散余弦变换来实施合成滤波器组。获得输入频谱系数序列且反转第一组交替频谱系数的正负号。颠倒输入频谱系数的次序。通过将逆改进型离散余弦变换(IMDCT)应用于频谱系数而产生输出样本。接着反转第二组交替输出样本的正负号。在一个实例中,输入频谱系数序列为N个样本长,且反转第一组交替输入频谱系数的正负号包括:(a)如果N/2为偶数,则反转奇数索引 频谱系数的正负号;及(b)如果N/2为奇数,则反转偶数索引频谱系数的正负号。在另一实例中,输入频谱系数序列为N个样本长,且反转第二组交替输出样本的正负号包括:(a)如果N/4为奇数,则反转奇数索引输出样本的正负号;及(b)如果N/4为偶数,则反转偶数索引输出样本的正负号。在一种操作模式中,IMDCT可作为高级音频编码(AAC)滤波器组来操作。在另一操作模式中,合成滤波器组可作为AAC增强型低延迟(ELD)滤波器组来操作。
附图说明
可在结合图式阅读时从下文阐述的具体实施方式明白各种特征、本质及优点,在图式中相同参考字符始终对应地进行识别。
图1为说明编码器的实例的框图,所述编码器可在同一MDCT分析滤波器组结构中实施AAC-ELD或MPEG AAC及AAC-ELD两者。
图2为说明解码器的实例的框图,所述解码器可在同一IMDCT滤波器组结构中实施AAC-ELD或MPEG AAC及AAC-ELD两者。
图3为说明可由编码器利用的AAC分析滤波器组的框图。
图4为说明经执行以针对AAC-ELD算法再使用图3的核心MDCT的操作的图式。
图5说明针对AAC算法使用核心MDCT执行AAC-ELD算法的方法。
图6为说明适于针对AAC-ELD算法再使用AAC算法MDCT的装置、电路及/或处理器的框图。
图7为说明可由解码器利用的AAC合成滤波器组的框图。
图8为说明经执行以针对AAC-ELD算法再使用图7的核心IMDCT的操作的图式。
图9说明针对AAC算法使用核心IMDCT执行AAC-ELD算法的方法。
图10为说明适于针对AAC-ELD算法再使用AAC算法IMDCT的装置、电路及/或处理器的框图。
具体实施方式
现参看图式描述各种实施例,其中相同参考标号始终用以指代相同元件。在以下描述中,为了解释的目的,阐述众多特定细节以便提供对一个或一个以上实施例的透彻理解。然而,可显而易见,可在没有这些特定细节的情况下实践所述实施例。在其它例子中,以框图形式展示众所周知的结构及装置以便有助于描述一个或一个以上实施例。
综述
一个特征提供用以使用同一核心MDCT分析滤波器组及核心IMDCT合成滤波器组来实施AAC-ELD或AAC及AAC-ELD算法两者的方式。
编码器可包括可用以实施AAC-ELD或AAC及AAC-ELD算法两者的核心MDCT分析滤波器组。对于AAC算法,将输入样本直接发送到MDCT分析滤波器组以获得输出样本。对于AAC-ELD算法,形成输入样本的残余值的向量且反转第一组交替输入样本的正负号。通过将改进型离散余弦变换(MDCT)应用于输入样本序列而产生频谱系数输出样本。接着颠倒频谱系数输出样本的次序且反转第二组交替频谱系数输出样本的正负号。
类似地,解码器可包括可用以实施AAC-ELD或AAC及AAC-ELD算法两者的核心IMDCT合成滤波器组。对于AAC算法,将输入样本直接发送到IMDCT合成滤波器组以获得输出样本。对于AAC-ELD算法,获得输入频谱系数序列且反转第一组交替频谱系数的正负号。颠倒输入频谱系数的次序。通过将逆改进型离散余弦变换(IMDCT)应用于频谱系数而产生输出样本。接着反转第二组交替输出样本的正负号。
因为AAC及AAC-ELD滤波器组两者可使用同一MDCT及IMDCT核心模块来实施,所以这允许以仅极少微小修改来再使用现有代码。如果将仅实施AAC-ELD滤波器组,则所揭示方法提供利用已知快速MDCT滤波器组实施方案的简单解决方案。
编解码器结构
图1为说明编码器的实例的框图,所述编码器可在同一MDCT分析滤波器组结构中实施AAC-ELD或MPEG AAC及AAC-ELD两者。编码器102可接收输入音频信号104。MDCT分析滤波器组106(即,基于类型IV离散余弦变换的改进型离散余弦变换)操作以将时域输入音频信号104分解为多个子带信号且将所述信号转换到频域,其中每块每子带地将每一子带信号转换为变换系数。所得信号接着由量化器108进行量化且由熵编码器110进行编码,以产生数字化音频信号的位流112。
图2为说明解码器的实例的框图,所述解码器可在同一IMDCT滤波器组结构中实施AAC-ELD或MPEG AAC及AAC-ELD两者。解码器202可接收位流204。熵解码器206解码位流204,位流204接着由解量化器208进行解量化,以产生频域信号。IMDCT合成滤波器组210(即,基于类型IV离散余弦变换的逆改进型离散余弦变换)操作以将频域信号104转换回到时域音频信号212。
AAC-ELD
AAC ELD核心编码器分析(等式1)及合成(等式2)滤波器组可经界定如下:
MDCT及IMDCT
改进型离散余弦变换(MDCT)(等式3)及逆MDCT(IMDCT)(等式4)通常经界定如下:
编码器:AAC及AAC-ELD分析滤波器组
图3为说明可由编码器利用的AAC分析滤波器组的框图。AAC中的分析滤波器组简单地为MDCT滤波器组302,其接收输入样本zi,0到zi,N-1 304且产生输出频谱系数Xi,0到Xi,N/2-1 306,所述系数可由下式表示:
其中:
zi,n=窗型输入序列
Xi,k=输出频谱系数
n=样本索引
k=频谱系数索引
i=块索引
N=基于window_sequence值的窗长度
p0=(N/2+1)/2。
AAC-ELD中的分析滤波器组输出Xi,k可由下式表示:
其中:
zi,n=窗型输入序列
Xi,k=输出频谱系数
n=样本索引
K=频谱系数索引
I=块索引
N=基于window_sequence值的窗长度
n0=(-N/2+1)/2。
这允许针对其实施方案再使用核心MDCT滤波器组。请注意,求和的右手侧为MDCT(例如,如在等式3中)。用于分析滤波器组的算法可包括:
1.形成输入样本序列(z(n)-z(n-N)),其中0≤n<N;
2.如果N/4为偶数,则反转偶数索引样本的正负号,或如果N/4为奇数,则反转奇数索引样本的正负号;
3.将MDCT变换应用于样本以获得输出样本(频谱系数);
4.颠倒输出样本的次序;
5.如果N/2为偶数,则反转奇数索引输出样本的正负号,或如果N/2为奇数,则反转偶数索引输出样本的正负号。
图4为说明经执行以针对AAC-ELD算法再使用图3的核心MDCT的操作的图式。此图式假设N/4为偶数。为了获得分析滤波器组输出406,形成输入样本序列404(例如,[zi,n-zi,(n-N)],其中0≤n<N)。反转此输入样本序列404的偶数索引输入样本的正负号(408)。请注意,如果N/4为奇数,则改为反转奇数索引输入样本的正负号。接着,将MDCT 302应用于经正负号反转的输入样本序列以获得输出样本(频谱系数)序列。接着,颠倒输出样本序列的次序(410)。最后,反转输出样本序列的奇数索引输出样本的正负号(414)。请注意,如果N/2为奇数,则改为反转输出样本序列的偶数索引输出样本的正负号。图4中所描述的功能及/或操作可以硬件、软件或所述两者的组合来执行。
图5说明针对AAC算法使用核心MDCT执行AAC-ELD算法的方法。获得N个输入样本的序列,其中N为整数,每一输入样本具有两个正负号中的一者(502)。此N个输入样本的序列可为时域取样音频信号。在一些实施方案中,输入样本序列可为N=960或1024个样本长中的一者。接着反转频谱系数输入样本序列的交替输入样本的正负号(504)。举例来说,如果N/4为偶数,则反转输入样本序列的偶数索引输入样本的正负号,否则如果N/4为奇数,则反转输入样本序列的奇数索引输入样本的正负号。接着将MDCT变换(针对AAC)应用于经正负号反转的输入样本序列以产生频谱系数输出样本序列,频谱系数输出样本序列具有第一序列次序,每一频谱系数输出样本具有两个正负号中的一者(506)。接着颠倒频谱系数输出样本序列的第一序列次序(508)。接着反转频谱系数输出样本序列的交替输出样本的正负号(510)。举例来说,如果N/2为偶数,则反转频谱系数输出样本序列的奇数索引输出样本的正负号,否则如果N/2为奇数,则反转频谱系数输出样本序列的偶数索引输出样本的正负号。
图6为说明适于针对AAC-ELD算法再使用AAC算法MDCT的装置、电路及/或处理器的框图。装置、电路及/或处理器602可包括第一正负号反转器606以反转输入样本序列604的交替输入样本的正负号。举例来说,在窗长度为N的情况下且如果N/4为偶数,则第一正负号反转器606可反转输入样本序列604的偶数索引输入样本的正负号。或者,如果N/4为奇数,则第一正负号反转器606可反转输入样本序列604的奇数索引输入样本的正负号。MDCT分析滤波器组608接着将MDCT变换应用于经正负号反转的输入样本序列以产生频谱系数输出样本(例如,频谱系数)序列。频谱系数输出样本 序列可具有第一序列次序,其中每一频谱系数输出样本具有两个正负号中的一者。次序颠倒装置610接着颠倒频谱系数输出样本序列的第一序列次序(例如,颠倒频谱系数的序列)。接着,如果N/2为偶数,则第二正负号反转器612反转频谱系数输出样本序列的奇数索引输出样本的正负号,或如果N/2为奇数,则第二正负号反转器612反转频谱系数输出样本序列的偶数索引输出样本的正负号,以提供经正负号反转且经次序颠倒的输出样本614。
解码器:AAC及AAC-ELD合成滤波器组
图7为说明可由解码器利用的AAC合成滤波器组的框图。AAC中的合成滤波器组简单地为IMDCT滤波器组702,其接收输入样本(例如,频谱系数)spec[i][0]到spec[i][N/2-1]704且产生输出(例如,样本)xi,0到xi,2N-1 706,其可由下式表示:
其中:
X=频谱系数
n=样本索引
i=窗索引
k=频谱系数索引
N=窗长度
p0=(N/2+1)/2
其中N=1920或2048(举例来说)。
AAC-ELD合成滤波器组输出xi,n可由下式表示:
其中:
X=频谱系数
n=样本索引
i=窗索引
k=频谱系数索引
N=窗长度
n0=(-N/2+1)/2
其中N=960或1024(举例来说)。
在AAC-ELD合成滤波器组的情况下,其可展示为
Xi,n+N=-Xi,n,其中0≤n<N。
因此,对于0≤n<N,滤波器组输出xi,n可表示为:
这允许针对其实施方案再使用核心IMDCT滤波器组。请注意,的右手侧请注意,求和的右手侧为IMDCT(例如,如在等式4中)。用于合成滤波器组的算法可包括:
1.如果N/2为偶数,则反转奇数索引频谱系数X(k)的正负号,或如果N/2为奇数,则反转偶数索引频谱系数的正负号;
2.颠倒频谱系数序列的次序;
3.将IMDCT变换应用于频谱系数以获得输出样本;
4.如果N/4为偶数,则反转偶数索引输出样本的正负号;或如果N/4为奇数,则反转奇数索引输出样本的正负号;这些形成合成滤波器组的前N个输出点;
5.通过反转前N个样本的正负号而获得其余N个输出样本。
图8为说明经执行以针对AAC-ELD算法再使用图7的核心IMDCT的操作的图式。此图式假设N/4为偶数。为了获得分析滤波器组输出806x(n)(其中0≤n<N),获得输入频谱系数X(0)到X(N/2-1)804。如果N/4为偶数,则反转偶数索引输入频谱系数的正负 号(808)(否则,如果N/4为奇数,则反转奇数索引输入频谱系数的正负号)。接着颠倒经正负号反转的输入频谱系数804的次序(810)且应用IMDCT变换(702)以获得输出样本。如果N/2为偶数,则反转奇数索引输出样本的正负号(814)。请注意,如果N/2为奇数,则改为反转偶数索引样本的正负号。这些形成合成滤波器组的前N个输出样本。可通过反转前N个输出样本的正负号而获得其余输出样本。请注意,图8中描述的功能及/或操作可以硬件、软件或所述两者的组合来执行。
图9说明针对AAC算法使用核心IMDCT执行AAC-ELD算法的方法。获得N个频谱系数输入样本的序列(902),其中N为整数,频谱系数输入样本序列具有第一序列次序,每一频谱系数输入样本具有两个正负号中的一者。接着反转频谱系数输入样本序列的交替输入样本的正负号(904)。举例来说,如果N/2为偶数,则反转频谱系数输入样本的奇数索引输入样本的正负号,否则如果N/4为奇数,则反转频谱系数输入样本序列的偶数索引输入样本的正负号。颠倒频谱系数输入样本序列的第一序列次序(906)。接着将IMDCT变换应用于经正负号反转且经次序颠倒的频谱系数输入样本序列以产生输出样本序列(908)。最后,接着反转输出样本序列的交替输出样本的正负号(910)。举例来说,如果N/4为奇数,则反转输出样本序列的奇数索引输出样本的正负号,否则如果N/4为偶数,则反转输出样本序列的偶数索引输出样本的正负号。
图10为说明适于针对AAC-ELD算法再使用AAC算法IMDCT的装置、电路及/或处理器的框图。装置、电路及/或处理器1002可包括第一正负号反转器1006,其获得频谱系数输入样本序列1004,频谱系数输入样本序列具有第一序列次序,每一频谱系数输入样本具有两个正负号中的一者。第一正负号反转器1006可进一步经配置以反转输入样本1004的正负号。举例来说,在窗长度为N的情况下且如果N/2为偶数,则第一正负号反转器1006可反转频谱系数输入样本序列1004的奇数索引输入样本的正负号。或者,如果N/2为奇数,则正负号反转器1006可反转频谱系数输入样本序列1004的偶数索引输入样本的正负号。次序颠倒装置1008接着颠倒频谱系数输入样本序列的第一序列次序(例如,颠倒频谱系数的序列)。IMDCT合成滤波器组1010接着将IMDCT变换应用于频谱系数输入样本序列以产生输出样本序列。接着,如果N/4为奇数,则第二正负号反转器1012反转输出样本序列的奇数索引输出样本的正负号,或如果N/4为偶数,则第二正负号反转器1012反转输出样本序列的偶数索引输出样本的正负号,以提供经正负号反转的输出样本1014。
因此,AAC及ELD-AAC滤波器组两者可通过使用同一N点MDCT核心变换或IMDCT核心变换来实施。通过仅使用次序颠倒及正负号反转操作来使得支持两种类型 的滤波器组成为可能,其中对于实施方案的总体复杂性具有最小影响。
可使用多种不同技术及技艺中的任一者来表示信息与信号。举例来说,可由电压、电流、电磁波、磁场或磁性粒子、光场或光学粒子或其任何组合来表示贯穿上文描述可能引用的数据、指令、命令、信息、信号等。
本文中描述的各种说明性逻辑块、模块及电路以及算法步骤可实施或执行为电子硬件、软件或两者的组合。为了清楚地说明硬件与软件的此可互换性,已在上文中大体上在功能性方面描述了各种说明性组件、块、模块、电路及步骤。将此功能性实施为硬件还是软件依据特定应用及强加于整个系统的设计约束而定。请注意,可将配置描述为过程,所述过程被描绘为流程图、流程框图、结构图或框图。尽管流程图可将操作描述为顺序过程,但可并行或同时执行许多所述操作。另外,可重新布置操作的次序。过程在其操作完成时被终止。过程可对应于方法、函数、程序、子例程、子程序等。当过程对应于函数时,其终止对应于函数返回到调用函数或主函数。
当以硬件来实施时,各种实例可使用经设计以执行本文所描述的功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列信号(FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合。通用处理器可为微处理器,但在替代方案中,所述处理器可为任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。
当以软件来实施时,各种实例可使用固件、中间件或微码。用以执行必要任务的程序代码或码段可存储于例如存储媒体或其它存储装置等计算机可读媒体中。处理器可执行必要任务。码段可表示过程、函数、子程序、程序、例程、子例程、模块、软件包、类别,或指令、数据结构或程序语句的任何组合。可通过传递及/或接收信息、数据、自变量、参数或存储器内容来将一码段耦合到另一码段或硬件电路。信息、自变量、参数、数据等可经由包括存储器共享、消息传递、权标传递、网络传输等任何适当手段来传递、转发或传输。
如此申请案中所使用,术语“组件”、“模块”、“系统”等既定指代计算机相关实体:硬件、固件、硬件与软件的组合、软件或执行中的软件。举例来说,组件可为(但不限于)在处理器上运行的处理、处理器、对象、可执行程序、执行线程、程序及/或计算机。借助于说明,在计算装置上运行的应用程序及所述计算装置两者均可为组件。一个或一个以上组件可驻留于处理及/或执行线程内,且组件可定位于一个计算机上及/或分布于两个或两个以上计算机之间。另外,这些组件可从各种计算机可读媒体执行,所 述计算机可读媒体具有存储于其上的各种数据结构。所述组件可例如根据具有一个或一个以上数据包的信号(例如,来自借助于所述信号与局域系统、分布式系统中的另一组件交互及/或跨越例如因特网等网络而与其它系统交互的一个组件的数据)借助于本地及/或远程处理而通信。
在本文的一个或一个以上实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件来实施,则所述功能可作为一个或一个以上指令或代码而存储于计算机可读媒体上或经由计算机可读媒体传输。计算机可读媒体包括计算机存储媒体及通信媒体(其包括有助于将计算机程序从一处传送到另一处的任何媒体)两者。存储媒体可为可由计算机存取的任何可用媒体。借助于实例而非限制,所述计算机可读媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、或可用于以指令或数据结构的形式携载或存储所要程序代码且可由计算机存取的任何其它媒体。而且,可将任何连接适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术而从网站、服务器或其它远程源传输软件,则同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电及微波等无线技术包括于媒体的定义中。如本文所使用,磁盘及光盘包括紧密光盘(CD)、激光光盘、光学光盘、数字通用光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘通过激光以光学方式再现数据。以上各项的组合也应包括于计算机可读媒体的范围内。软件可包含单一指令或许多指令,且可分布在若干不同码段上、在不同程序当中及跨越多个存储媒体。可将示范性存储媒体耦合到处理器,使得所述处理器可从所述存储媒体读取信息及将信息写入到所述存储媒体。在替代方案中,存储媒体可与处理器成一体式。
本文所揭示的方法包含一个或一个以上步骤或动作以用于实现所描述的方法。方法步骤及/或动作可在不脱离权利要求书的范围的情况下彼此互换。换句话说,除非对于正被描述的实施例的恰当操作需要特定次序的步骤或动作,否则可在不脱离权利要求书的范围的情况下修改特定步骤及/或动作的次序及/或使用。
在图1、图2、图3、图4、图5、图6、图7、图8、图9及/或图10中所说明的组件、步骤及/或功能中的一者或一者以上可经重新布置及/或组合为单一组件、步骤或功能,或以若干组件、步骤或功能来体现。还可添加额外元件、组件、步骤及/或功能。在图1、图2、图6及图10中所说明的设备、装置及/或组件可经配置或调适以执行在图3到图5及图7到图9中所描述的方法、特征或步骤中的一者或一者以上。本文所描述的算法可有效地以软件及/或嵌入式硬件来实施。
应注意,前述配置仅为实例且不应解释为限制权利要求书。所述配置的描述既定为说明性的,且不限制权利要求书的范围。因而,本教示可容易地应用于其它类型的设备,且许多替代方案、修改及变化对于所属领域的技术人员来说将为显而易见的。
Claims (34)
1.一种提供分析滤波器组的方法,其包含:
获得输入样本序列,每一输入样本具有两个正负号中的一者;
反转所述输入样本序列的交替输入样本的所述正负号;
通过将改进型离散余弦变换MDCT应用于经正负号反转的输入样本序列而产生频谱系数输出样本序列,所述频谱系数输出样本序列具有第一序列次序,每一频谱系数输出样本具有两个正负号中的一者;
颠倒所述频谱系数输出样本序列的所述第一序列次序;及
反转所述频谱系数输出样本序列的交替输出样本的所述正负号。
2.根据权利要求1所述的方法,其中所述输入样本序列为N个样本长,且反转所述输入样本序列的交替输入样本的所述正负号包括:
如果N/4为偶数,则反转所述输入样本序列的偶数索引输入样本的所述正负号;及
如果N/4为奇数,则反转所述输入样本序列的奇数索引输入样本的所述正负号。
3.根据权利要求1所述的方法,其中所述输入样本序列为N个样本长,且反转所述频谱系数输出样本序列的交替输出样本的所述正负号包括:
如果N/2为偶数,则反转所述频谱系数输出样本序列的奇数索引输出样本的所述正负号;及
如果N/2为奇数,则反转所述频谱系数输出样本序列的偶数索引输出样本的所述正负号。
4.根据权利要求1所述的方法,其中所述MDCT为高级音频编码(AAC)滤波器组。
5.根据权利要求4所述的方法,其中所述分析滤波器组为AAC增强型低延迟(ELD)滤波器组。
6.根据权利要求1所述的方法,其中所述输入样本序列为960或1024个样本长中的一者。
7.一种经配置以提供分析滤波器组的装置,其包含:
第一正负号反转器,其经配置以获得输入样本序列,每一输入样本具有两个正负号中的一者,且反转所述输入样本序列的交替输入样本的所述正负号;
滤波器组模块,其用于通过将改进型离散余弦变换MDCT应用于经正负号反转的输入样本序列而产生频谱系数输出样本序列,所述频谱系数输出样本序列具有第一序列次序,每一频谱系数输出样本具有两个正负号中的一者;
次序颠倒装置,其经配置以颠倒所述频谱系数输出样本序列的所述第一序列次序;及
第二正负号反转器,其经配置以反转所述频谱系数输出样本序列的交替输出样本的所述正负号。
8.根据权利要求7所述的装置,其中所述输入样本序列为N个样本长,且所述第一正负号反转器经配置以:
如果N/4为偶数,则反转所述输入样本序列的偶数索引输入样本的所述正负号;及
如果N/4为奇数,则反转所述输入样本序列的奇数索引输入样本的所述正负号。
9.根据权利要求7所述的装置,其中所述输入样本序列为N个样本长,且所述第二正负号反转器经配置以:
如果N/2为偶数,则反转所述频谱系数输出样本序列的奇数索引输出样本的所述正负号;及
如果N/2为奇数,则反转所述频谱系数输出样本序列的偶数索引输出样本的所述正负号。
10.根据权利要求7所述的装置,其中第一操作模式用于提供高级音频编码(AAC)滤波器组,所述第一正负号反转器及第二正负号反转器以及所述次序颠倒装置为不起作用的,且所述
所述滤波器组模块通过将改进型离散余弦变换MDCT应用于所述输入样本序列而产生所述频谱系数输出样本序列。
11.根据权利要求10所述的装置,其中第二操作模式用于提供高级音频编码(AAC)增强型低延迟(ELD)滤波器组,所述第一正负号反转器及第二正负号反转器以及所述次序颠倒装置为起作用的。
12.一种经配置以提供分析滤波器组的装置,其包含:
用于获得输入样本序列的装置,每一输入样本具有两个正负号中的一者;
用于反转所述输入样本序列的交替输入样本的所述正负号的装置;
用于通过将改进型离散余弦变换MDCT应用于经正负号反转的输入样本序列而产生频谱系数输出样本序列的装置,所述频谱系数输出样本序列具有第一序列次序,每一频谱系数输出样本具有两个正负号中的一者;
用于颠倒所述频谱系数输出样本序列的所述第一序列次序的装置;及
用于反转所述频谱系数输出样本序列的交替输出样本的所述正负号的装置。
13.根据权利要求12所述的装置,其中所述MDCT为高级音频编码(AAC)滤波器组。
14.根据权利要求13所述的装置,其中所述分析滤波器组为AAC增强型低延迟(ELD)滤波器组。
15.一种用于提供分析滤波器组的电路,其中所述电路适于:
获得输入样本序列,每一输入样本具有两个正负号中的一者;
反转所述输入样本序列的交替输入样本的所述正负号;
通过将改进型离散余弦变换MDCT应用于经正负号反转的输入样本序列而产生频谱系数输出样本序列,所述频谱系数输出样本序列具有第一序列次序,每一频谱系数输出样本具有两个正负号中的一者;
颠倒所述频谱系数输出样本序列的所述第一序列次序;及
反转所述频谱系数输出样本序列的交替输出样本的所述正负号。
16.根据权利要求15所述的电路,其中所述MDCT为高级音频编码(AAC)滤波器组。
17.根据权利要求16所述的电路,其中所述分析滤波器组为AAC增强型低延迟(ELD)滤波器组。
18.一种提供合成滤波器组的方法,其包含:
获得频谱系数输入样本序列,所述频谱系数输入样本序列具有第一序列次序,每一频谱系数输入样本具有两个正负号中的一者;
反转所述频谱系数输入样本序列的交替输入样本的所述正负号;
颠倒所述频谱系数输入样本序列的所述第一序列次序;
通过将逆改进型离散余弦变换IMDCT应用于经正负号反转且经次序颠倒的频谱系数输入样本序列而产生输出样本序列;及
反转所述输出样本序列的交替输出样本的正负号。
19.根据权利要求18所述的方法,其中所述频谱系数输入样本序列为N个样本长,且反转交替输入样本的所述正负号包括:
如果N/2为偶数,则反转所述频谱系数输入样本序列的奇数索引输入样本的所述正负号;及
如果N/2为奇数,则反转所述频谱系数输入样本序列的偶数索引输入样本的所述正负号。
20.根据权利要求18所述的方法,其中所述频谱系数输入样本序列为N个样本长,且反转交替输出样本的所述正负号包括:
如果N/4为奇数,则反转所述输出样本序列的奇数索引输出样本的所述正负号;及
如果N/4为偶数,则反转所述输出样本序列的偶数索引输出样本的所述正负号。
21.根据权利要求18所述的方法,其中所述IMDCT为高级音频编码(AAC)滤波器组。
22.根据权利要求21所述的方法,其中所述合成滤波器组为AAC增强型低延迟(ELD)滤波器组。
23.根据权利要求18所述的方法,其中所述输出样本序列为960或1024个样本长中的一者。
24.一种经配置以提供合成滤波器组的装置,其包含:
第一正负号反转器,其经配置以获得频谱系数输入样本序列,所述频谱系数输入样本序列具有第一序列次序,每一频谱系数输入样本具有两个正负号中的一者,且所述第一正负号反转器进一步经配置以反转所述频谱系数输入样本序列的交替输入样本的所述正负号;
次序颠倒装置,其用于颠倒所述频谱系数输入样本序列的所述第一序列次序;
滤波器组模块,其用于通过将逆改进型离散余弦变换IMDCT应用于经正负号反转且经次序颠倒的频谱系数输入样本序列而产生输出样本序列;及
第二正负号反转器,其经配置以反转所述输出样本序列的交替输出样本的正负号。
25.根据权利要求24所述的装置,其中所述频谱系数输入样本序列为N个样本长,且所述第一正负号反转器经配置以:
如果N/2为偶数,则反转所述频谱系数输入样本序列的奇数索引输入样本的所述正负号;及
如果N/2为奇数,则反转所述频谱系数输入样本序列的偶数索引输入样本的所述正负号。
26.根据权利要求24所述的装置,其中所述频谱系数输入样本序列为N个样本长,且所述第二正负号反转器经配置以:
如果N/4为奇数,则反转所述输出样本序列的奇数索引输出样本的所述正负号;及
如果N/4为偶数,则反转所述输出样本序列的偶数索引输出样本的所述正负号。
27.根据权利要求24所述的装置,其中第一操作模式用于提供高级音频编码(AAC)滤波器组,所述第一及第二正负号反转器以及所述次序颠倒装置为不起作用的,且所述滤波器组模块通过将逆改进型离散余弦变换IMDCT应用于所述频谱系数输入样本序列而产生所述输出样本序列。
28.根据权利要求27所述的装置,其中第二操作模式用于提供高级音频编码(AAC)增强型低延迟(ELD)滤波器组,所述第一正负号反转器及第二正负号反转器以及所述次序颠倒装置为起作用的。
29.一种经配置以提供合成滤波器组的装置,其包含:
用于获得频谱系数输入样本序列的装置,所述频谱系数输入样本序列具有第一序列次序,每一频谱系数输入样本具有两个正负号中的一者;
用于反转所述频谱系数输入样本序列的交替输入样本的所述正负号的装置;
用于颠倒所述频谱系数输入样本序列的所述第一序列次序的装置;
用于通过将逆改进型离散余弦变换IMDCT应用于经正负号反转且经次序颠倒的频谱系数输入样本序列而产生输出样本的装置;及
用于反转所述输出样本序列的交替输出样本的正负号的装置。
30.根据权利要求29所述的装置,其中所述IMDCT为高级音频编码(AAC)滤波器组。
31.根据权利要求30所述的装置,其中所述合成滤波器组为AAC增强型低延迟(ELD)滤波器组。
32.一种用于提供合成滤波器组的电路,其中所述电路适于:
获得频谱系数输入样本序列,所述频谱系数输入样本序列具有第一序列次序,每一频谱系数输入样本具有两个正负号中的一者;
反转所述频谱系数输入样本序列的交替输入样本的所述正负号;
颠倒所述频谱系数输入样本序列的所述第一序列次序;
通过将逆改进型离散余弦变换IMDCT应用于经正负号反转且经次序颠倒的频谱系数输入样本序列而产生输出样本;及
反转所述输出样本序列的交替输出样本的正负号。
33.根据权利要求32所述的电路,其中所述IMDCT为高级音频编码(AAC)滤波器组。
34.根据权利要求33所述的电路,其中所述合成滤波器组为AAC增强型低延迟(ELD)滤波器组。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US98041807P | 2007-10-16 | 2007-10-16 | |
US60/980,418 | 2007-10-16 | ||
US12/252,195 US20090099844A1 (en) | 2007-10-16 | 2008-10-15 | Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders |
US12/252,195 | 2008-10-15 | ||
PCT/US2008/080211 WO2009052317A1 (en) | 2007-10-16 | 2008-10-16 | Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101828220A CN101828220A (zh) | 2010-09-08 |
CN101828220B true CN101828220B (zh) | 2012-06-27 |
Family
ID=40535076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008801119222A Expired - Fee Related CN101828220B (zh) | 2007-10-16 | 2008-10-16 | 用于mpeg aac及mpeg aac eld编码器/解码器的分析及合成滤波器组的有效实施方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20090099844A1 (zh) |
EP (1) | EP2227805A1 (zh) |
JP (1) | JP5215404B2 (zh) |
KR (1) | KR101137745B1 (zh) |
CN (1) | CN101828220B (zh) |
BR (1) | BRPI0818508A2 (zh) |
CA (1) | CA2701188A1 (zh) |
RU (1) | RU2442232C2 (zh) |
TW (1) | TWI420511B (zh) |
WO (1) | WO2009052317A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8392200B2 (en) * | 2009-04-14 | 2013-03-05 | Qualcomm Incorporated | Low complexity spectral band replication (SBR) filterbanks |
WO2012039920A1 (en) * | 2010-09-22 | 2012-03-29 | Dolby Laboratories Licensing Corporation | Efficient implementation of phase shift filtering for decorrelation and other applications in an audio coding system |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
CN104735512A (zh) * | 2015-03-24 | 2015-06-24 | 无锡天脉聚源传媒科技有限公司 | 一种同步音频数据的方法、设备及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1273663A (zh) * | 1998-05-26 | 2000-11-15 | 皇家菲利浦电子有限公司 | 具有改进的语音编码器的传输系统 |
EP1609084A2 (de) * | 2003-07-14 | 2005-12-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und verfahren zum umsetzen in eine transformierte darstellung oder zum inversen umsetzen der transformierten darstellung |
CN1926609A (zh) * | 2004-02-19 | 2007-03-07 | 杜比实验室特许公司 | 用于信号分析和合成的自适应混合变换 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297236A (en) * | 1989-01-27 | 1994-03-22 | Dolby Laboratories Licensing Corporation | Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder |
JP3185214B2 (ja) * | 1990-06-12 | 2001-07-09 | 日本電気株式会社 | 改良dctの順変換計算装置および逆変換計算装置 |
FR2675969B1 (fr) * | 1991-04-24 | 1994-02-11 | France Telecom | Procede et dispositif de codage-decodage d'un signal numerique. |
JP4292898B2 (ja) * | 2002-09-25 | 2009-07-08 | パナソニック株式会社 | 通信装置 |
TW594674B (en) * | 2003-03-14 | 2004-06-21 | Mediatek Inc | Encoder and a encoding method capable of detecting audio signal transient |
KR100760976B1 (ko) * | 2005-08-01 | 2007-09-21 | (주)펄서스 테크놀러지 | 프로그래머블 프로세서에서 mpeg-2 또는 mpeg-4aac 오디오 복호 알고리즘을 처리하기 위한 연산 회로및 연산 방법 |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
-
2008
- 2008-10-15 US US12/252,195 patent/US20090099844A1/en not_active Abandoned
- 2008-10-16 BR BRPI0818508A patent/BRPI0818508A2/pt not_active IP Right Cessation
- 2008-10-16 EP EP08840308A patent/EP2227805A1/en not_active Withdrawn
- 2008-10-16 KR KR1020107010294A patent/KR101137745B1/ko not_active IP Right Cessation
- 2008-10-16 CN CN2008801119222A patent/CN101828220B/zh not_active Expired - Fee Related
- 2008-10-16 TW TW097139778A patent/TWI420511B/zh not_active IP Right Cessation
- 2008-10-16 JP JP2010530119A patent/JP5215404B2/ja not_active Expired - Fee Related
- 2008-10-16 CA CA2701188A patent/CA2701188A1/en not_active Abandoned
- 2008-10-16 WO PCT/US2008/080211 patent/WO2009052317A1/en active Application Filing
- 2008-10-16 RU RU2010119449/08A patent/RU2442232C2/ru not_active IP Right Cessation
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1273663A (zh) * | 1998-05-26 | 2000-11-15 | 皇家菲利浦电子有限公司 | 具有改进的语音编码器的传输系统 |
EP1609084A2 (de) * | 2003-07-14 | 2005-12-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und verfahren zum umsetzen in eine transformierte darstellung oder zum inversen umsetzen der transformierten darstellung |
CN1926609A (zh) * | 2004-02-19 | 2007-03-07 | 杜比实验室特许公司 | 用于信号分析和合成的自适应混合变换 |
Also Published As
Publication number | Publication date |
---|---|
US20090099844A1 (en) | 2009-04-16 |
JP2011501826A (ja) | 2011-01-13 |
CA2701188A1 (en) | 2009-04-23 |
BRPI0818508A2 (pt) | 2016-07-19 |
EP2227805A1 (en) | 2010-09-15 |
KR20100083167A (ko) | 2010-07-21 |
TW200929173A (en) | 2009-07-01 |
JP5215404B2 (ja) | 2013-06-19 |
KR101137745B1 (ko) | 2012-04-25 |
RU2442232C2 (ru) | 2012-02-10 |
CN101828220A (zh) | 2010-09-08 |
TWI420511B (zh) | 2013-12-21 |
WO2009052317A1 (en) | 2009-04-23 |
RU2010119449A (ru) | 2011-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101896966B (zh) | 用于计算5点ⅱ型离散余弦变换,ⅳ型离散余弦变换和ⅳ型离散正弦变换的快速算法,以及架构 | |
CN102388418B (zh) | 低复杂度频谱带复制(sbr)滤波器组 | |
US11854559B2 (en) | Decoder for decoding an encoded audio signal and encoder for encoding an audio signal | |
CN101796578B (zh) | 用于语音和音频译码应用的mdct/imdct滤波器组的有效设计 | |
CN100416553C (zh) | 用于转换为变换表示或对变换表示进行反转换的设备和方法 | |
CN101779236A (zh) | 基于频率子频带中的频谱动态的音频译码中的时间掩蔽 | |
CN104718572A (zh) | 音频编码方法和装置、音频解码方法和装置及采用该方法和装置的多媒体装置 | |
CN101828220B (zh) | 用于mpeg aac及mpeg aac eld编码器/解码器的分析及合成滤波器组的有效实施方法 | |
JP2004531151A (ja) | 時間離散オーディオサンプル値を処理する方法と装置 | |
JP6768141B2 (ja) | スペクトル解析に続いて部分合成を用いる不均一フィルタバンクのための時間領域エイリアシング低減 | |
Britanak et al. | Cosine-/Sine-Modulated Filter Banks | |
CN102419978B (zh) | 音频解码器、音频解码的频谱重构方法及装置 | |
CN102592601B (zh) | 一种信号处理方法和装置 | |
Schuller et al. | Scalable Lossless Audio Coding | |
Takamizawa et al. | Processor-efficient implementation of a high quality MPEG-2 AAC encoder | |
Quan et al. | The application of integer MDCT in MP3 audio | |
CN103415883A (zh) | 用于低频效果声道的减少复杂性变换 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120627 Termination date: 20161016 |