CN101960515B - 用于不同滤波器组域之间进行变换的方法和设备 - Google Patents
用于不同滤波器组域之间进行变换的方法和设备 Download PDFInfo
- Publication number
- CN101960515B CN101960515B CN2009801073257A CN200980107325A CN101960515B CN 101960515 B CN101960515 B CN 101960515B CN 2009801073257 A CN2009801073257 A CN 2009801073257A CN 200980107325 A CN200980107325 A CN 200980107325A CN 101960515 B CN101960515 B CN 101960515B
- Authority
- CN
- China
- Prior art keywords
- filter
- subband
- mdct
- bank domain
- domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000001131 transforming effect Effects 0.000 title 1
- 238000013507 mapping Methods 0.000 claims abstract description 42
- 238000012937 correction Methods 0.000 claims abstract description 39
- 239000011159 matrix material Substances 0.000 claims description 44
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 6
- 239000000654 additive Substances 0.000 claims description 5
- 230000000996 additive effect Effects 0.000 claims description 5
- 230000007704 transition Effects 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 claims 2
- 239000008186 active pharmaceutical agent Substances 0.000 abstract 2
- 230000006870 function Effects 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003760 hair shine Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 208000004350 Strabismus Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
滤波器组可以具有不同的结构和不同的各自输出信号域。不同滤波器组域之间的变换是令人期望的。通常,使用映射矩阵,然而,映射矩阵可以随频率而变化。这需要大量查找表。一种用于将第一滤波器组域(DS)的第一数据帧变换到不同的第二滤波器组域(DT)的第二数据帧的方法,包括以下步骤:将第一滤波器组域(DS)的子带(mp3(m-1)、mp3(m)、mp3(m+1))转码成中间域(Di)的子带(psdo(m-1)、psdo(m)、psdo(m+1)),所述中间域与所述第二滤波器组域相对应,但是具有翘曲的相位;以及将中间域(Di)的子带(psdo(m-1)、psdo(m)、psdo(m+1))转码到第二滤波器组域(DT)的子带(MDCT(m-1)、MDCT(m)、MDCT(m+1)),其中,对中间域(Di)的子带执行相位校正(SSC、PCp、PC、PCn)。
Description
技术领域
本发明涉及一种用于在不同滤波器组域之间进行变换的方法和设备。
背景技术
滤波器组通常执行不同域信号之间(例如,在时域信号与频域信号之间)的某种类型的变换。滤波器组可以具有不同的结构和不同的单独输出信号域。在许多情况下,不同滤波器组域之间的转换是令人期望的。
欧洲专利申请EP06120969公开了一种利用不同时间-频率分析域而无需使用时域在编码格式之间进行转码的方法和设备,其中,使用线性映射。因此,仅需要执行单一转码步骤,并且计算复杂度比使用中间时域信号的系统低。在EP06120969中公开的最重要实施例之一是用于无损音频压缩的从MP3混合滤波器组到整数MDCT域的映射。转码步骤对编解码器的压缩比具有显著影响。针对该映射的直接解决方案应当将来自MP3域的源滤波器系数完全解码成时域采样,然后应用MDCT分析滤波器组。EP0612969中提供的解决方案要应用从MP3滤波器组域到MDCT域的直接映射,忽略时域。在该方法中,使用许多近似对角、但在频率上变化的矩阵。因此,该直接方法需要大量查找表。
改进的离散余弦变换(MDCT)是一种基于离散余弦变换(DCT)的傅立叶变换。由于MDCT的重迭特性具有优点,这是由于对连续帧执行MDCT,其中,后续帧交叠,并且由于MDCT对信号能量的良好压缩。在MP3编解码器中,将MDCT应用于32组多相正交滤波器(PQF)组的输出。通常通过混叠抑制对MDCT滤波器输出进行后处理,混叠抑制用于抑制PQF滤波器组的典型混叠。滤波器组与MDCT的这种组合被称作混合滤波器组或子带MDCT。
本发明要解决的问题是缩减映射矩阵的尺寸,或者相应查找表,使得可以执行更高效的实现方式。
发明内容
本发明通过将单一步骤映射分解成两个分离的步骤实现了一种映射矩阵以及相应查找表的尺寸的缩减,其中,利用中间滤波器组域。已经发现,映射的这种分解获得更简单的映射表,该映射表具有更规则的结构,并因此可以被有效率的压缩。示例性地,能够将映射表所需的存储空间量减少10倍以上。作为另一优点,计算复杂度增长非常缓慢。此外,能够实现一种通过加权装置、滤波装置以及来加法器执行特定映射的设备。
根据本发明的一个方面,用于将第一滤波器组域的第一数据帧变换到不同的第二滤波器组域的第二数据帧的方法包括以下步骤:将第一滤波器组域的子带转码成中间滤波器组域的子带,该中间滤波器组域与所述第二滤波器组域相对应,但是具有翘曲(warped)的相位;以及将中间滤波器组域的子带转码到第二滤波器组域的子带,其中,对中间域的子带执行相位校正。示例性地,第一滤波器组域是MP3混合滤波器组的滤波器组域,第二滤波器组域是整数MDCT滤波器组的滤波器组域。
通常,将时间信号转码成中间滤波器组域和第二滤波器组域的子带的步骤可以表示为包括余弦函数的变换。那么中间滤波器组域的翘曲相位与余弦函数中的频率相关附加相位项相对应。
此外,在本发明的一个实施例中,将第一滤波器组域的子带变换到中间滤波器组域的子带的转码步骤包括:从第一滤波器组域的子带中移除剩余混叠项。这种剩余混叠项通常由与第一滤波器组域(例如,MP3多相滤波器组)相对应的滤波器组产生。在一个实施例中,采用映射矩阵,映射矩阵中的每一个包括沿着它们主对角线的单独但相同的子矩阵,并且在其他位置为零。
在一个实施例中,将中间域的子带转码到第二滤波器组域的子带的步骤包括:子带组符号校正(这里也被称作子带符号校正)。一个组包括一个或多个滤波器组域子带。滤波器组域子带也被称作“段(bin)”。子带组符号校正是指段的组,并且可以包括对中间域信号的每隔一个子带组进行取反。
根据本发明的另一方面,一种用于将第一滤波器组域的第一数据帧变换到不同的第二滤波器组域的第二数据帧的设备包括:
第一转码装置,用于将第一滤波器组域的子带转码成中间域的子带,该中间域与具有翘曲相位的所述第二滤波器组域相对应,其中,移除剩余混叠项;以及
第二转码装置,用于将中间域的子带转码到第二滤波器组域的子带,其中,第二转码装置包括用于对中间域的子带执行相位校正的相位校正装置。
在一个实施例中,所述相位校正由用于应用映射矩阵的计算装置(例如,微处理器、DSP或其部件)来执行,而在另一实施例中,第二转码装置中的所述相位校正由用于加权的加权装置以及用于滤波中间域的加权子带系数的滤波装置来执行。
在所附权利要求、以下说明书以及附图中公开了本发明的有利实施例。
附图说明
参照附图描述本发明的示例实施例,在附图中:
图1是用于单步骤映射的体系架构的结构;
图2是针对长窗的相位校正步骤的示例实现方式;
图3是根据本发明的流程图的示例体系结构的结构;
图4是示例一般实现方式结构;
图5是针对较短等待时间的示例实现方式结构;
图6是用于MP3到中间伪MDCT映射(长窗)的示例全增强混叠补偿矩阵;
图7是图6的示例全增强混叠补偿矩阵中的单独的片(tile);
图8是示出了子带符号校正的图;
图9是翘曲中间滤波器组域内附加相位项的值;以及
图10是MP3滤波器组、原始MDCT以及翘曲伪MDCT的核函数(长窗)的比较。
具体实施方式
图1示出了EP0612969中公开的单步骤映射过程。具有MP3系数的每个帧mp3(m)贡献于MDCT系数的三个连续帧MDCT(m-1)、MDCT(m)、MDCT(m+1)。反之亦然,每个MDCT帧组合来自于三个MP3帧的贡献。映射由分离的矩阵Tp、T、Tn来执行,其中,一个矩阵Tp贡献于先前MDCT帧,并且一个矩阵Tn贡献于下个MDCT帧。
由于存在每个窗类型所涉及的三个矩阵Tp、T、Tn,并且在MP3滤波器组域和MDCT域中存在4个不同的窗类型(长、短、开始以及停止窗),总共必须存储12个矩阵。矩阵并非都不同:开始和长窗的Tp相同、停止和长窗的Tn也相同。然而,需要大约175k字节的总存储量来存储查找表,查找表需要实现例如大于45dB的可接受映射精度。注意,窗类型/块长度可以随时间而变化,并且在输入和输出域中可以是相同的,但也不必是相同的。
这里被称作“帧”的在MP3术语中也被称作“粒度(granule)”。然而,在下文中使用更一般的术语“帧”。
由于全映射矩阵中的特定对称性,如下所示,可以将已知的单步骤映射分解成多个子步骤的序列。该分解是基于如下文中介绍的具有翘曲相位的伪MDCT。
通常,滤波器组域可以表示为核函数和余弦函数。MP3混合滤波器组的核函数与MDCT(或者通常在两个滤波器组域之间)的接近比较获得“伪MDCT”的定义,具有与一般MDCT相同的核函数,但是具有添加至余弦函数的自变量的频率相关相位项。该伪MDCT用作两步骤转码方法中从MP3到目标(原始)MDCT滤波器组域的中间域。
原始MDCT具有以下定义:
这里,n是时间索引,i是频率索引,以及M表示MDCT的长度,即,变换产生M个频率段(子带),而时域分析窗w(n)的长度是2M。
核函数c(n,i)用于MDCT的时域混叠补偿(TDAC)特性。
根据在mp3编解码器中应用的自适应窗切换过程,窗函数w(n)可以是4个形状(即,“长”、“开始”、“短”、“停止”)中的一个形状。对于长窗
现在,通过向余弦函数的自变量添加频率相关相位项φi,来修改MDCT的定义中余弦项c(n,i)的定义:
MDCT核函数与MP3混合滤波器组的核函数的比较获得以下分段(piecewise)线性相位翘曲函数,该分段线性相位翘曲函数近似最大化具有相同索引i=1,...,M的相应核函数之间的互相关:
在图9中示出了附加相位项φi。该相位项对于所有窗形状是相同的。
注意,由于向余弦函数的自变量添加φi,伪MDCT不具有理想重构特性。这丢失其TDAD特性,因此不是真正的MDCT。如果应用新的核函数作为分析-合成滤波器组对,则存在时域混叠误差。然而,信号混叠比仅大约为50dB。该转码精度在多数应用中是足够的。
为了示意改进,图10示出了MP3滤波器组、具有原始相位的MDCT(作为中间格式)、具有翘曲相位的MDCT的前54个核函数(3个子带,每个子带18个段)。可以观察到,MDCT的相位改进获得精细结构与MP3滤波器组的结构的高级匹配。此外,考虑MP3滤波器组的子带符号变化,以下更详细描述这些变化。
图3示出了根据本发明一个方面的示例流程图的结构,至少适合于MP3到MDCT映射。然而,原理也可以应用于其他滤波器组域之间的映射。原理上,通过以下操作来在两个主要步骤中实现分解映射:首先将MP3解码的频率段转码到伪MDCT域中,伪MDCT域用作中间域,然后执行相位校正以从伪MDCT域转码到目标MDCT域。两个主要步骤同样可以在更小的子步骤中实现,或者通过特定高效实现方式来实现。
与图1的单步骤过程相比,多步骤方法看起来更复杂,并事实上,涉及算法略强的运算。然而,每个单独步骤的数学运算的结构没有单步骤矩阵的运算复杂。这使得能够显著缩减所需查找表的尺寸(以及从而缩减所需的存储器空间)。下文给出每个子步骤的更具体的内容。
由于伪MDCT域不涉及理想重构分析-合成滤波器组,两个步骤映射与至以及自该不理想滤波器组域的转码相对应,总映射精度受到中间表示的信号混叠比的约束。因此,两步骤方法(无需矩阵的剪切或量化)的最佳可实现映射精度大约为50-60dB,这对于多数应用是足够的。
在下文中,描述增强混叠补偿(EAC)。该步骤的目的在于,从MP3频率段中移除剩余混叠项,该剩余混叠项源自MP3多相滤波器组。因此,该步骤提供了从MP3滤波器组域(源滤波器组域)到如上所定义的翘曲伪MDCT(翘曲目标滤波器组域用作中间滤波器组域)的映射过程。
可以通过将MP3合成矩阵与伪MDCT滤波器组的分析矩阵相乘,来找到相应映射矩阵EACp、EAC、EACn。另外,应用时间偏移以贡献于先前帧和后续帧。
示例性地,在图6中示出了针对长窗的所得到的全矩阵。如图所见,大多数变换系数为零,并且几乎不需要计算。具体地,对于针对先前帧的贡献矩阵EACp以及针对下个帧的贡献矩阵EACn,还可以观察到,全矩阵实质上由沿着主对角线被复制31次的单独“片(tile)”或子矩阵贡献。
在图7中示出了针对所有4个窗类型tp1、tp2、tp3、tp4的三个基本片,其中的每一个分别用于增强混叠补偿矩阵EAC、EACp、EACn。原理上,片表示针对MP3混合滤波器组的一种类型的复杂混叠补偿。
在上述示例中,tp1与“长”相对应,tp2与“开始”相对应,tp3与“停止”相对应,以及tp4与“短”相对应。在该示例中,上述子矩阵对于类型“长”、“开始”以及“停止”尺寸为18×18,对于类型“短”尺寸为18×36(然而,注意在EACn和EACp的情况下,系数的数目相同,这是由于每隔一个列为零)。对于其他滤波器组域,尺寸可以不同。
在下文中,对实现高效存储和计算所得到的概率进行描述。图10中所示的12个片具有一些有利的相似性。最重要的相似性如下:
首先,EAC(tp1)仅沿主对角线和反对角线具有非零系数。因此,可以以非常有限的运算量来存储和计算该片。
第二,贯穿所有片,片EAC(tp2)和EAC(tp3)由片EAC(tp1)组成,加上一些附加低级别系数。因此,通过仅存储EAC(tp2)/EAC(tp3)与EAC(tp1)之间的差异,来节省一些存储空间。剩余的低级别系数可以以较低或者甚至非常低的精度来存储,使得每系数比特数目以及因此需要的存储区较少。
在一个实施例中,将1矩阵或单位矩阵的对角线与中间列(即,子矩阵)中所示的EAC片相加,以获得在图6的矩阵中使用的实际EAC片。即,对角线的值具有正偏移1,使得要存储的值较小。此外,针对短窗的非齐次高宽比的效应是可见的。
第三,EACp(tp2)等于EACp(tp1),EACn(tp3)等于EACn(tp1)。
第四,贡献矩阵EACp(tp1)和EACn(tp1)在通过使用它们的和以及差而可以被非常有效地存储和计算的情况下是类似的。即,差EACp(tp1)-EACn(tp1)具有与EAC(tp1)片类似的结构,该类似的结构由对角线加上反对角线组成。通过联合存储和计算EACp(tp1)和EACn(tp1),高效的存储和计算是可能的。
第五,片EACp(tp4)和EACn(tp4)在一些列为零或近似为零的情况下是稀疏的。不需要对这些列进行存储和计算。
有利地,现有技术映射矩阵的频率相关性因此已经被转换成这些片内的小变化,在增强混叠补偿矩阵EAC、EACp、EACn内,这些小变化每18个子带(或频率段)重复一次。其他频率相关性不会保留在映射中。
在下文中,描述子带符号校正(SSC),可以采用该子带符号校正作为从中间域Di到目标滤波器组域DT的第二变换步骤中的一个子步骤。注意术语子带符号校正这里是指滤波器组域子带(“段”)的组。例如,在图8和9中,被应用统一符号校正的子带包含18个滤波器组域子带或段。如图3所示,子带符号校正接收子带系数中间域(例如伪MDCT)的子带系数psdo(m-1)、psdo(m)、psdo(m+1)作为输入。
方程4和5的相位改进项φi包括MP3多相滤波器组的每隔一个子带的取反。即,在每18个段之后,φi项跳过π。这反映了MP3滤波器组的行为,这些行为是类似的。因此,子带符号校正适合于源滤波器组特性。
对于从伪MDCT到整数MDCT的映射,第一步骤包括:通过应用子带符号校正(SSC)对子带的这些交替符号进行校正,其中,伪MDCT值乘以图8所示的SSC函数。
与原始MDCT相比,需要另一映射步骤以便补偿翘曲伪MDCT的附加相位项。对于采用的窗类型(tp1-tp4,例如,长、开始、短、停止)中的每一个以及对于每次变换(长到长、短到短),单独的相位校正是必要的。例如,可以通过应用映射矩阵来执行相位校正。在一个实施例中,由于这些映射矩阵的特定结构,可以使用频率域段的加权加滤波方案。这在下文中进行描述。
在全部12个可应用的相位校正矩阵中的大部分矩阵中存在相当大的冗余。
首先,在MP3到MDCT映射示例中,以下过渡(transition)矩阵是相同的:
PCp(长)=PCp(开始)、PCp(长)=PCp(开始)
PCp(开始)=PCp(短)、PCp(停止)=PCp(短)。这种特性将不同的相位校正矩阵的数目减少到8个,这是由于冗余减小可以用于矩阵的存储。
其次,要应用于对先前帧(例如,PCp(长))和下个帧(例如,PCn(长))做贡献的矩阵是非常类似的。它们的不同之处仅在于每隔一个系数的符号。因此,在一个实施例中,将这两个矩阵实现为“蝴蝶”运算之前的两个子矩阵。这被称作使用如图2所示的加法器S1和减法器S2(或者加法器和符号取反器)的两个值的同时加法和减法。
第三,可以将多数矩阵分解成频率相关加权运算W和应用于频率段的附加卷积滤波器。这种分解具有特别有利之处在于,必须存储每频率段仅一个加权因子加上单个固定滤波器脉冲响应。因此,在一个实施例中,将上述子矩阵实现为加权运算W和两个卷积滤波器H1、H2。该卷积可以在频域中应用,因此与时域中的乘法相对应。针对该卷积的理论基础是时域加窗,时域加窗可以应用在MP3合成的传统序列、时间延迟、以及MDCT分析中。
如图2所示,所描述的实现方式在硬件使用和操作复杂性方面是非常高效的。尤其对于长窗,上述冗余获得非常高效的系统体系结构,其中,通过应用每频率段加权因子以及利用滤波器H1和H2的后续滤波,联合计算相位校正步骤PCp(长)和PCn(长)。在H1仅在奇位置中具有非零系数而H2仅在偶位置中具有非零系数的情况下,这两个滤波器是稀疏的。滤波器输出的加法获得对先前MDCT帧的相位校正贡献,减法获得对下个MDCT帧的贡献。
可以通过开发相位校正映射矩阵中(例如,PC(开始)、PC(停止)、与PC(长)之间)的更特定相似性,来导出额外效率。然而,如上所述应用相同原理。
在下文中,描述两个示例实现方式。
图4示出了上述两步骤映射过程的直接实现方式。在每个帧周期开始处,在state.pseudo1<=state.pseudo2、state.pseudo2<=state.pseudo3、以及state.pseudo3<=0的情况下,使缓冲器偏移。
类似地,在Bout<=state.pseudo1、state.out1<=state.out2、以及state.out2<=0的情况下。使用与矩阵EACp、EAC、EACn的乘法映射MP3频率段的每个输入帧,并且将结果分别与缓冲器state.pseudo1、state.pseudo2、以及state.pseudo3相加。然后,子带符号校正(SSC)和相位校正(PC)应用于缓冲器state.pseudo1。
将三个所获得的贡献PCp*SSC、PC*SSC、以及PCn*SSC分别与三个缓冲器Bout、state.out1、以及state.out2相加。缓冲器Bout准备并且可以提供给输出。
在上述实现示例中,输出向量具有相对于输入帧的两个帧周期的等待时间。如果期望低复杂性的实现方式,则图4所示的结构具体特定优势,这是由于可以联合计算EACp和EACn的贡献,并且此外,还可以联合计算PCp和PCn的贡献。
然而,期望具有较短等待时间的实现方式。在图5中示出了具有仅一个帧周期的等待时间的备选实现方式。在该实现示例中,事实在于,PCp·SSC·EACp(对应于经由矩阵EACp、SSC以及PCp直接从源域缓冲器in到目标域缓冲器Bout的路径)实质上为零。因此,PCp·SSC对输出向量的贡献已经根据缓冲器state.pseudo2计算,尽管该缓冲器还不包含经由当前输入MP3向量的EACp的贡献。
该方法的优点是,由于可以节省一个向量的存储,仅产生一个帧的等待时间。另一方面,备选实现方式通过联合计算PCp和PCn而不再开发相位校正矩阵的对称性。
上述两步骤方法的优点在于,所有查找表的大小比在从现有技术获知的体系结构中的查找表的大小更小。在上述从MP3到整数MDCT映射的示例中,与用于传统直接映射算法的174348个字节相对比,查找表合计仅12644个字节。
应理解,仅通过示例描述本发明,在不背离本发明的范围的前提下可以进行具体内容的修改。
在说明书和权利要求(适当的地方)以及附图中所公开的每个特征都可以独立提供或以任何适当组合的形式来提供。适当地,特征可以以硬件、软件或二者组合的形式实现。在适当情况下,连接可以被实现为无线连接或有线连接(不必须是直接连接或专用连接)。权利要求中出现的参考数字仅仅是说明性的,不应对权利要求的范围起到任何限制作用。
Claims (17)
1.一种用于将第一滤波器组域(DS)的第一数据帧变换到不同的第二滤波器组域(DT)的第二数据帧的方法,包括以下步骤:
-将第一滤波器组域(DS)的子带(mp3(m-1)、mp3(m)、mp3(m+1))转码成中间滤波器组域(Di)的子带(psdo(m-1)、psdo(m)、psdo(m+1)),所述中间滤波器组域与所述第二滤波器组域相对应,但是具有翘曲的相位;
-将中间滤波器组域(Di)的子带(psdo(m-1)、psdo(m)、psdo(m+1))转码到第二滤波器组域(DT)的子带(MDCT(m-1)、MDCT(m)、MDCT(m+1)),其中,对中间滤波器组域(Di)的子带执行相位校正(SSC、PCp、PC、PCn);
其中,所述帧是音频信号帧,所述第一滤波器组域是MP3混合滤波器组域,所述第二滤波器组域是MDCT滤波器组域。
2.根据权利要求1所述的方法,其中,第二数据帧由至少三个连续第一数据帧组成,第一数据帧用于至少三个连续第二数据帧的编码。
3.根据权利要求1或2所述的方法,其中,通过包括余弦函数的变换从时域信号产生至少第二滤波器组域和中间滤波器组域(DS、Di、DT),其中,中间滤波器组域(Di)的所述翘曲相位与余弦函数中的频率相关附加相位项相对应。
4.根据权利要求1或2所述的方法,其中,第一滤波器组域(DS)的子带到中间滤波器组域(Di)的子带的转码步骤包括:从第一滤波器组域(DS)的子带中移除(EAC)剩余混叠项,所述剩余混叠项源自MP3多相滤波器组。
5.根据权利要求4所述的方法,其中,在移除剩余混叠项时采用映射矩阵(EAC、EACp、EACn),每一个映射矩阵包括沿着它们主对角线的单独的但相同的子矩阵,并且其他位置为零。
6.根据权利要求1所述的方法,其中,中间滤波器组域(Di)的子带到第二滤波器组域(DT)的子带的转码步骤包括:子带符号校正(SSC)。
7.根据权利要求6所述的方法,其中,子带符号校正(SSC)包括:每隔一个子带进行取反。
8.根据权利要求1所述的方法,其中,中间滤波器组域(Di)的子带到第二滤波器组域(DT)的子带的转码步骤包括补偿中间滤波器组域的附加相位项。
9.根据权利要求1所述的方法,其中,滤波器组域使用变换时间窗,其中,对于所述时间窗,预先定义多个不同窗形状,并且第一和第二数据帧使用不同的窗形状,并且针对所述不同窗形状(tp1、...、tp4)中的每一个以及针对中间滤波器组域和第二滤波器组域的窗形状之间的过渡(tp1-tp1、tp1-tp2、...、tp4-tp4)进行单独相位校正(PC)。
10.根据权利要求1所述的方法,其中,所述相位校正是通过加权(W)和滤波(H1、H2)中间滤波器组域(Di)的子带系数来执行的。
11.根据权利要求10所述的方法,其中,所述加权(W)是频率相关的,不同的频率子带具有不同的权重,用于所述滤波的滤波器是卷积滤波器。
12.根据权利要求10所述的方法,其中,所述滤波使用两个滤波器,在一个滤波器(H1)仅在奇位置中具有非零系数并且另一滤波器(H2)仅在偶位置中具有非零系数的情况下,所述两个滤波器是稀疏的。
13.根据权利要求12所述的方法,其中,两个滤波器(H1、H2)的输出的相加(S1)对第二滤波器组域的先前帧(MDCT(m-1))的相位校正作出贡献,所述输出的相减(S2)对第二滤波器组域的下个帧(MDCT(m+1))作出贡献。
14.一种用于将第一滤波器组域(DS)的第一数据帧变换到不同的第二滤波器组域(DT)的第二数据帧的设备,包括:
-第一转码装置(EACp、EAC、EACn),用于将第一滤波器组域(DS)的子带(mp3(m-1)、mp3(m)、mp3(m+1))转码成中间滤波器组域(Di)的子带(psdo(m-1)、psdo(m)、psdo(m+1)),所述中间滤波器组域与所述第二滤波器组域相对应,但是具有翘曲的相位,其中,移除剩余混叠项;
-第二转码装置(SSC、PCp、PC、PCn),用于将中间滤波器组域(Di)的子带(psdo(m-1)、psdo(m)、psdo(m+1))转码到第二滤波器组域(DT)的子带(MDCT(m-1)、MDCT(m)、MDCT(m+1)),其中,第二转码装置包括:相位校正装置(SSC、PCp、PC、PCn),用于对中间滤波器域(Di)的子带执行相位校正;
其中,所述帧是音频信号帧,所述第一滤波器组域是MP3混合滤波器组域,所述第二滤波器组域是MDCT滤波器组域。
15.根据权利要求14所述的设备,其中,所述相位校正通过用于应用映射矩阵(PCn、PC、PCp)的计算装置来执行。
16.根据权利要求14或15所述的设备,其中,所述第二转码装置中的所述相位校正通过用于加权的加权装置(W)以及用于滤波中间滤波器组域(Di)的子带系数的滤波装置(H1、H2)来执行。
17.根据权利要求16所述的设备,其中,滤波装置(H1、H2)同时执行与两个映射矩阵(PCp(长)、PCn(长))相对应的两个相位校正子步骤,所述两个映射矩阵(PCp(长)、PCn(长))与第二滤波器组域(DT)的先前帧(MDCT(m-1))和下个帧(MDCT(m+1))有关。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP08102308A EP2099027A1 (en) | 2008-03-05 | 2008-03-05 | Method and apparatus for transforming between different filter bank domains |
EP08102308.7 | 2008-03-05 | ||
PCT/EP2009/051989 WO2009109468A1 (en) | 2008-03-05 | 2009-02-19 | Method and apparatus for transforming between different filter bank domains |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101960515A CN101960515A (zh) | 2011-01-26 |
CN101960515B true CN101960515B (zh) | 2012-07-18 |
Family
ID=39428017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009801073257A Expired - Fee Related CN101960515B (zh) | 2008-03-05 | 2009-02-19 | 用于不同滤波器组域之间进行变换的方法和设备 |
Country Status (9)
Country | Link |
---|---|
US (1) | US8620671B2 (zh) |
EP (2) | EP2099027A1 (zh) |
JP (1) | JP5490731B2 (zh) |
KR (1) | KR101589709B1 (zh) |
CN (1) | CN101960515B (zh) |
AU (1) | AU2009221366B2 (zh) |
BR (1) | BRPI0907840A2 (zh) |
CA (1) | CA2717226A1 (zh) |
WO (1) | WO2009109468A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2875351A1 (fr) * | 2004-09-16 | 2006-03-17 | France Telecom | Procede de traitement de donnees par passage entre domaines differents de sous-bandes |
US20110087494A1 (en) * | 2009-10-09 | 2011-04-14 | Samsung Electronics Co., Ltd. | Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme |
FR2969804A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Filtrage perfectionne dans le domaine transforme. |
EP2963649A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
CN112336380A (zh) * | 2020-10-29 | 2021-02-09 | 成都信息工程大学 | 一种基于Golay码的超声弹性成像应变估计方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101053019A (zh) * | 2004-11-02 | 2007-10-10 | 皇家飞利浦电子股份有限公司 | 使用复值滤波器组的音频信号的编码和解码 |
CN101069233A (zh) * | 2004-09-16 | 2007-11-07 | 法国电信公司 | 通过不同子带域之间通道进行数据处理的方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5890106A (en) * | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
GB0003954D0 (en) * | 2000-02-18 | 2000-04-12 | Radioscape Ltd | Method of and apparatus for converting a signal between data compression formats |
US6731690B2 (en) * | 2000-12-01 | 2004-05-04 | Motorola, Inc. | Methods and apparatus for transmultiplexing a multi-channel signal |
US6757648B2 (en) * | 2001-06-28 | 2004-06-29 | Microsoft Corporation | Techniques for quantization of spectral data in transcoding |
US6963842B2 (en) * | 2001-09-05 | 2005-11-08 | Creative Technology Ltd. | Efficient system and method for converting between different transform-domain signal representations |
US6982377B2 (en) * | 2003-12-18 | 2006-01-03 | Texas Instruments Incorporated | Time-scale modification of music signals based on polyphase filterbanks and constrained time-domain processing |
KR20070074546A (ko) * | 2004-08-31 | 2007-07-12 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 트랜스코딩을 위한 방법 및 디바이스 |
US20070083377A1 (en) * | 2005-10-12 | 2007-04-12 | Steven Trautmann | Time scale modification of audio using bark bands |
US7676374B2 (en) * | 2006-03-28 | 2010-03-09 | Nokia Corporation | Low complexity subband-domain filtering in the case of cascaded filter banks |
FR2901433A1 (fr) * | 2006-05-19 | 2007-11-23 | France Telecom | Conversion entre representations en domaines de sous-bandes pour des bancs de filtres variant dans le temps |
US8700387B2 (en) * | 2006-09-14 | 2014-04-15 | Nvidia Corporation | Method and system for efficient transcoding of audio data |
EP1903559A1 (en) | 2006-09-20 | 2008-03-26 | Deutsche Thomson-Brandt Gmbh | Method and device for transcoding audio signals |
DE102006051673A1 (de) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
US8185381B2 (en) * | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
KR101403340B1 (ko) * | 2007-08-02 | 2014-06-09 | 삼성전자주식회사 | 변환 부호화 방법 및 장치 |
-
2008
- 2008-03-05 EP EP08102308A patent/EP2099027A1/en not_active Withdrawn
-
2009
- 2009-02-19 WO PCT/EP2009/051989 patent/WO2009109468A1/en active Application Filing
- 2009-02-19 EP EP09716549.2A patent/EP2250642B1/en not_active Not-in-force
- 2009-02-19 KR KR1020107022192A patent/KR101589709B1/ko not_active IP Right Cessation
- 2009-02-19 AU AU2009221366A patent/AU2009221366B2/en not_active Ceased
- 2009-02-19 JP JP2010549083A patent/JP5490731B2/ja not_active Expired - Fee Related
- 2009-02-19 CA CA2717226A patent/CA2717226A1/en not_active Abandoned
- 2009-02-19 CN CN2009801073257A patent/CN101960515B/zh not_active Expired - Fee Related
- 2009-02-19 BR BRPI0907840-1A patent/BRPI0907840A2/pt not_active IP Right Cessation
- 2009-02-19 US US12/735,961 patent/US8620671B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101069233A (zh) * | 2004-09-16 | 2007-11-07 | 法国电信公司 | 通过不同子带域之间通道进行数据处理的方法 |
CN101053019A (zh) * | 2004-11-02 | 2007-10-10 | 皇家飞利浦电子股份有限公司 | 使用复值滤波器组的音频信号的编码和解码 |
Non-Patent Citations (1)
Title |
---|
Koichi Takagi, et al..Conversion of MP3 to AAC in the Compressed Domain.《2006 IEEE 8th Workshop on Multimedia Signal Processing》.2006,132-135. * |
Also Published As
Publication number | Publication date |
---|---|
AU2009221366A1 (en) | 2009-09-11 |
US8620671B2 (en) | 2013-12-31 |
EP2250642B1 (en) | 2015-10-21 |
JP5490731B2 (ja) | 2014-05-14 |
EP2250642A1 (en) | 2010-11-17 |
JP2011513781A (ja) | 2011-04-28 |
WO2009109468A1 (en) | 2009-09-11 |
CN101960515A (zh) | 2011-01-26 |
KR101589709B1 (ko) | 2016-01-28 |
EP2099027A1 (en) | 2009-09-09 |
CA2717226A1 (en) | 2009-09-11 |
BRPI0907840A2 (pt) | 2015-07-21 |
KR20100134635A (ko) | 2010-12-23 |
US20110004478A1 (en) | 2011-01-06 |
AU2009221366B2 (en) | 2011-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1805547B (zh) | 用于高效无损数据压缩的可逆重叠算子 | |
RU2557455C2 (ru) | Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала | |
CN101069233B (zh) | 通过不同子带域之间通道进行数据处理的方法 | |
CN1860527B (zh) | 一种处理具有离散值序列的信号的设备和方法 | |
US6963842B2 (en) | Efficient system and method for converting between different transform-domain signal representations | |
CN102243873B (zh) | 分解滤波器组、合成滤波器组、编码器、解码器、混合器及会议系统 | |
CN101796578B (zh) | 用于语音和音频译码应用的mdct/imdct滤波器组的有效设计 | |
CN100416553C (zh) | 用于转换为变换表示或对变换表示进行反转换的设备和方法 | |
CN101960515B (zh) | 用于不同滤波器组域之间进行变换的方法和设备 | |
CN103280221B (zh) | 一种基于基追踪的音频无损压缩编码、解码方法及系统 | |
RU2323469C2 (ru) | Устройство и способ для обработки, по меньшей мере, двух входных значений | |
CN101944362A (zh) | 一种基于整形小波变换的音频无损压缩编码、解码方法 | |
JP2004531151A (ja) | 時間離散オーディオサンプル値を処理する方法と装置 | |
CN104217726A (zh) | 一种无损音频压缩编码方法及其解码方法 | |
CN102572426B (zh) | 一种数据处理的方法和装置 | |
CN102132342A (zh) | 一种通过内插滤波器更新编码器的方法 | |
CN100570597C (zh) | 将数字信号从时间域变换到频率域及其反向变换的方法 | |
CN101546560B (zh) | 音频编解码装置及编解码方法 | |
CN100388316C (zh) | 高精度的无乘法器的数字余弦变换电路及其变换方法 | |
CN102163976B (zh) | 一种基于gdft-ii变换的快速解码方法 | |
CN104078048A (zh) | 一种声音解码装置及其方法 | |
Chang et al. | Low-complexity audio CODEC for resource-scarce embedded system with fixed-point arithmetic |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120718 Termination date: 20170219 |