CN103415883A - 用于低频效果声道的减少复杂性变换 - Google Patents
用于低频效果声道的减少复杂性变换 Download PDFInfo
- Publication number
- CN103415883A CN103415883A CN2012800119541A CN201280011954A CN103415883A CN 103415883 A CN103415883 A CN 103415883A CN 2012800119541 A CN2012800119541 A CN 2012800119541A CN 201280011954 A CN201280011954 A CN 201280011954A CN 103415883 A CN103415883 A CN 103415883A
- Authority
- CN
- China
- Prior art keywords
- centerdot
- conversion
- real number
- number value
- cos
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000694 effects Effects 0.000 title description 4
- 238000000034 method Methods 0.000 claims abstract description 25
- 230000005236 sound signal Effects 0.000 claims abstract description 23
- 238000006243 chemical reaction Methods 0.000 claims description 91
- 238000001228 spectrum Methods 0.000 claims description 5
- 238000009795 derivation Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 18
- 238000005516 engineering process Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 238000000354 decomposition reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000712 assembly Effects 0.000 description 2
- 238000000429 assembly Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/147—Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Discrete Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
- Stereophonic System (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
用于对有限带宽音频信号应用基于变换的滤波器组所需要的计算资源通过如下操作而被减少:执行将实数值的输入数据组合成复数值的数据以及对复数值的数据应用短变换的集成处理,对集成处理的输出应用非常短变换的组,以及从非常短变换的组的输出中推导出实数值的输出数据的序列。
Description
相关申请的交叉引用
本申请要求2011年3月28日提交的美国专利临时申请No.61/468,373的优先权,其整体通过参考被并入于此。
技术领域
本发明通常涉及数字信号处理,并且更特别地涉及可以被用来通过使用更少的计算资源将滤波器组(filterbank)应用于有限带宽音频声道(诸如所谓的低频效果(LFE)声道)的方法和设备。
背景技术
已经开发了若干国际性的、区域性的和国家的标准来定义可以被用来实现多声道音频编码系统的方法和系统。这种标准的三个示例包括:ISO/IEC13818-7,高级音频编码(Advanced Audio Coding,AAC),也被称为“MPEG-2 AAC”;以及由国际标准组织(ISO)公布的ISO/IEC 14496-3,分部4,也被称为“MPEG-4音频”;以及由美国高级电视业务顾问委员会(ATSC)在2005年6月14日公布的文档A/52B(题为“Digital Audio Compression Standard(AC-3,E-AC-3)”,Revision B)中公布的标准,也被称为“杜比数字(Dolby Digital)”或“AC-3”。
符合像上述那些那样的标准的音频系统通常包括发送器和接收器,该发送器将分析滤波器组应用于输入音频信号的若干声道中的每一个,将分析滤波器组的输出处理成编码的信号并且发送或者记录经编码的信号,该接收器接收经编码的信号,对它们解码并且将合成滤波器组应用于经解码的信号以便产生作为原始输入音频信号的复制品(replica)的输出音频信号的声道。许多标准指定通过在Princen,Johnson和Bradley的“Subband/Transform Coding Using Filter BankDesigns Based on Time Domain Aliasing Cancellation”,ICASSP1987Conf.Proc,May 1987,pp.2161-64中描述的修改离散变换(MDCT)和修改离散逆变换(IMDCT)来实现分析和合成滤波器组。
通过这些特别的变换实现的滤波器组具有许多吸引人的特性,但是要求显著多的处理或者计算资源来执行所需要的计算。已知可以被用来更有效地执行变换的技术,由此减少需要的计算资源的量。这些技术所共有的一个特性在于它们的计算复杂性随所谓的变换的长度而变化。已知可以通过使用更短变换长度来利用更窄带宽处理音频声道而实现计算复杂性的进一步减少的技术。
像上述那些那样的标准定义携带表示一个或更多个音频声道的编码表示的数据的数字比特流或者数字数据的序列。有时被称为“5.1声道”的声道的一个配置包括由左(L)、右(R)、中心(C)、左环绕(LS)和右环绕(RS)表示的五个全带宽声道、以及一个有限带宽声道或者低频效果(LFE)声道。全带宽声道典型地具有大约20kHz的带宽并且有限带宽LFE声道典型地具有大约100到200Hz的带宽。因为LFE声道的带宽更窄,所以与对于全带宽声道之一可以执行的相比,对于LFE声道可以使用已知技术来更有效地执行滤波器组变换。
然而,需要开发进一步提高被应用于像LFE声道那样的有限带宽声道的变换滤波器组的效率的技术。
发明内容
本发明的一个目的是,提供可以被用来比使用已知技术可能的效率更有效地执行实现对于有限带宽声道信号的滤波器组的变换的方式。
根据本发明的一个方面,通过如下步骤来处理有限带宽信号:接收一块K个实数值的变换系数,该K个实数值的变换系数中的仅仅数量L的系数表示有限带宽音频信号的频谱分量,其中1/2L<M<K,并且M是2的幂;对一块复数值的系数应用长度为R的第一变换,该块复数值的系数是从包括表示有限带宽音频信号的频谱分量的L个实数值的变换系数的M个复数值的变换系数导出的,其中并且P是2的幂;对第一变换的输出应用一组Q个长度为P的第二变换;以及从该组第二变换的输出导出N个实数值的信号样本的序列,其中N=2·K并且实数值的信号样本表示有限带宽音频信号的时间分量。
通过参考下面的讨论和附图可以更好地理解本发明的各个特征及其优选实施例,在附图中,在几个图中相似的附图标记指的是相似的元件。下面的讨论和附图的内容仅作为示例被陈述并且不应该被理解为代表对本发明的范围的限制。
附图说明
图1是在其中可以实现本发明的各个方面的音频编码系统的示意性框图。
图2是可以被用来在图1中示出的编码系统中执行合成变换的处理的示意性框图。
图3和图4是示出可以被用来执行图2中示出的处理的一部分的一些特征的示意性框图。
图5是可以被用来实现本发明的各个方面的装置的示意性框图。
具体实施方式
A.介绍
图1是包括发送器100和接收器200的双声道的音频编码系统的示意图。发送器100从路径11、12接收输入音频信号的两个声道。分析滤波器组111、112被应用于输入音频声道以便获得表示输入音频信号的频谱内容的第一组频率子带信号。这些分析滤波器组是通过时域到频域变换实现的。编码器120对第一组频率子带信号应用编码处理,以便产生经编码的信息,该经编码的信息沿着路径20传递。接收器20从路径20接收经编码的信息。解码器220对经编码的信息应用解码处理以便获得第二组频率子带信号。合成滤波器组231、232被应用于第二组频率子带信号以便产生输出音频信号的两个或更多个声道,该两个或更多个声道沿着路径31、32传递。这些合成滤波器组是通过频域到时域变换实现的。路径20可以是广播介质、点到点通信介质、记录介质或者能够传送或记录经编码的信息的任何其它介质。
编码器120和解码器220对于实践本发明而言不是必要的。如果它们被使用,它们可以执行无损的或者有损的编码处理。本发明不限于任何特别的编码和解码处理。
为了清楚说明,在附图中示出了输入和输出音频信号的仅仅两个声道。在许多实现方式中,存在输入音频信号的多于两个声道和输出音频信号的多于两个声道。输出音频信号中的至少一个具有比其它输出音频信号中的一个或更多个的带宽窄得多的带宽。
本发明涉及减少为执行实现接收器200中的用于产生更窄带宽输出音频信号的合成滤波器组231或232的变换所需要的计算资源。本发明能够实现接收器200中的更有效的合成滤波器组,该合成滤波器组保持与现有发送器100中的分析滤波器组的兼容性。
本发明也可以被用来减少用于执行实现应用于更窄带宽输入音频信号的发送器100中的分析滤波器组111或112的变换所需要的计算资源。这个实现方式能够保持与现有接收器200中的合成滤波器组的兼容性。
B.实现技术
合成滤波器组能够通过各式各样的频域到时域变换(包括上述的离散余弦逆变换(IDCT)和修改离散余弦逆变换(IMDCT)的许多变型)来实现。以直接方式定义这些变换的算法在这里被称为“直接变换(direct transform)”。
在这里称为“折叠(folding)技术”的一种技术可以被用来更有效地执行这些直接变换。折叠技术包括三个级(stage),如图2中所示出的。第二级402执行具有比这个折叠技术实现的直接变换更短的长度的变换。在第二级402中执行的变换被称为“折叠式(folded)变换”,使得以下描述能够更容易将它与直接变换区分开。
前处理器级401将一块(block)K个实数值的频域变换系数中的变换系数组合成一块1/2·K个复数值的变换系数。变换级402对该块复数值的变换系数应用长度为1/2·K的频域到时域折叠式变换,以便产生1/2·K个复数值的时域样本。后处理器级403从1/2·K复数值的时域信号样本中推导出K个实数值的时域样本的序列。除从有限精度算术运算中可能出现的任何误差之外,通过这个技术获得的K个时域信号样本与通过对该块K个实数值的频域变换系数应用长度K的直接变换而会获得的K个时域信号样本相同。这个技术提高了效率,这是因为用于执行与级402中的折叠式变换相对比的直接变换所需要的额外的计算资源大于用于实现前处理器级401和后处理器级403中执行的处理所需要的计算资源。
如果一块变换系数表示在其中大量的变换系数总是零的窄带宽信号,则额外的变换-分解(decomposition)技术可以被用来增大在级402中执行的折叠式变换的处理效率。
这个技术在以后几节里讨论。
1、直接变换
直接IMDCT被示出在表达式2中。它的互补修改离散余弦变换(MDCT)被示出在表达式1中。
其中X(k)=实数值的频域变换系数k;
K=实数值的频域变换系数的总数;
x(n)=实数值的时域信号样本n;以及
N=样本的时域窗口的长度,其中N=2K。
这些直接变换的适当操作要求使用分析窗函数和合成窗函数,其长度和形状满足在本领域中公知的特定要求。分析窗函数在MDCT的应用之前被应用于N个输入音频信号样本的段(segments)。合成窗函数被应用于根据对多块K个变换系数应用IMDCT而获得的N个样本的段,并且样本的这些加窗的(windowed)段被交迭以及相加到根据其它块的变换系数获得的样本的加窗的段。可以从上面引用的Princen等人的论文中获得额外的细节。以下段落省略分析窗函数的进一步讨论。
2、折叠技术
在前处理器级401中执行的处理可以被表示为:
其中X′(k)=复数值的频域变换系数k;以及
在变换级402中执行的折叠式变换可以被表示为:
其中 以及
x′(n)=复数值的时域信号样本。
在后处理器级403中执行的处理可以被表示为:
其中y(n)=在后续的加窗计算中使用的中间样本值;
Re[x′(n)]=复数值x′(n)的实部;以及
Im[x′(n)]=复数值x′(n)的虚部。
3、对于IMDCT的合成窗函数
IMDCT的适当操作包括对通过变换产生的时域样本应用适当地设计的合成窗函数。根据这个加窗操作获得的时域信号样本可以被表示为:
其中h(n)=合成窗函数中的点n;以及
y′(n)=加窗的中间样本n。
根据表达式6获得的加窗的中间样本y′是可以已经通过对一块频域变换系数X应用直接IMDCT继之以应用合成窗函数h而获得的中间时域样本。如上面引用的Princen论文所述,输出时域信号样本是通过交迭以及相加从“当前”块的变换系数导出的加窗的中间样本与从先前块的变换系数导出的一组“先前”的加窗的中间样本而获得的。这个交迭-相加处理可以被表示为:
x(n)=y′(n)+yprev′(n) (7)
其中yprev′(n)=先前的加窗的中间样本。
4、变换-分解技术
变换分解技术可以被用来推导更有效的用于对有限带宽信号执行折叠式变换的方法,在有限带宽信号中一块频域变换系数中的一些变换系数已知等于零。这个分解技术由将折叠式变换表达为等同的(equivalent)二维变换以及将这个二维变换分解成单维垂直变换继之以一组(bank)单维水平的离散傅里叶逆变换(IDFT)组成。垂直变换具有等于Q的长度并且该组水平复数的IDFT包括Q个变换,其中每个变换具有等于P的长度,其中P和Q是整数并且P和Q的乘积等于折叠式变换的长度。
参考折叠技术的在先讨论,可见折叠式变换的长度是J=1/4·N=1/2K;因此,P·Q=J。对于P、Q和J的值被约束为2的幂。
水平IDFT和垂直变换被分别示出在表达式8和9中:
其中 对于0≤n<Q (9)
垂直变换中的变换核WN/4可以通过使用欧拉(Euler)定律来计算:
因为直接变换系数X(k)表示具有有限带宽的LFE声道中的音频信号,所以这些系数中的仅仅L个系数可以具有除零以外的值,其中L比K小得多。结果,从前处理器级401获得的复数值的频域变换系数X′(k)中的至多个可以具有除零以外的值,并且可以减少垂直变换的长度。值M被选择为使得它是等于或大于这个数字的最小的2的幂,并且折叠处理被修改为推导M个复数值的频域变换系数X′(k),该频域变换系数X′(k)包括可以具有非零值的L个实数值的直接变换系数。这些M个复数值的频域变换系数要被变换级402处理。垂直变换的尺寸R被选择为使得变换系数X′(P·r+p)对于Pr+p≥2R,或者可替代地,r≥R时为零。通过考虑这些,表达式9可以被写为:
对于0≤n<Q,0≤p<P。
5、集成的前处理器和垂直变换
与如上所述的变换-分解技术相组合的折叠技术的效率可以通过将前处理器级401和如表达式9所示的垂直变换集成为一个处理而被进一步提高。这被示意性地示出在图3中。
垂直变换的长度R可以被选择为等于值M或者值M的2的幂分之一、即在符合上述的AC-3标准的一个实施例中,实数值的频域变换系数的数量1/2·N等于256并且LFE声道中的音频信号的频谱内容可以由七个实数值的变换系数X(k)表示,其中0≤k<7。前处理器级401将这些七个实数值的变换系数折叠成四个复数值的变换系数,该四个复数值的变换系数随后通过其长度为J=1/4·N=128的折叠式变换被处理。结果,在本实施例中给定四个复数值的变换系数,M等于4并且R可以通过将P分别设定为等于1、2或者4而被设定为等于4、2或者1。因为P·Q=J,所以在P分别等于1、2和4时水平变换长度Q等于128、64和32。在P等于1时在效率方面实现很少的增益或者没有增益。
在P被设定等于2时,假设在每个水平变换中计算少量的系数,则从垂直变换指数(index)的输出中获得的值不需要被位元反转(bit-reverse)。对用于Cooley-Tukey FFT算法的变换指数的位元反转的需要是公知的。然而,在P被设定等于2时不需要位元反转,这是因为对于长度2的复数的DFT的位元反转产生与不执行位元反转而实现的相同的系数指数。这个计算优点由于有更大量的水平变换要执行而被抵销。用于P和Q的值可以响应于各个设计考虑(诸如被选择用于实现处理的硬件方面的处理限制)而被选择。
表达式3所示出的处理与表达式9所示出的垂直变换的集成可以通过分别根据表达式3和10对于表达式9中的X′(k)和(WN/4)(P·r+p)·n进行代入而被导出。这些代入产生如下的用于垂直变换的核函数:
对于
表达式12中的正弦项和余弦项的叉积(cross product)可以被重写为:
其中s=P·q+p;
可以看出
我们将其表示为I(s,n)以简化下面的表达式。通过使用这个符号,表达式11可以被重写为:
其中v=P·r+p;以及
执行复数乘法,我们得到:
函数U(n,p)的计算复杂性可以通过利用频域系数X(v)仅仅对于0≤v<2R可以为非零的事实而被进一步减少。这个减少被反映在下面表达式中,该表达式也将函数分别分成实数和虚数分量函数UR(n,p)和UI(n,p),其中U(n,p)=UR(n,p)+j·UI(n,p):
前处理器级401和垂直变换的这个集成被示意性地示出在图4中。
为实现函数U(n,p)或者它的分量函数UR(n,p)和UI(n,p)所需的计算资源可以通过对于v、u和n的所有值预先计算函数sin(I(v,n)),cos(I(v,n),sin(I(u,n)和cos(I(u,n)而被减少。将计算结果存储在查找表中需要4·P·R·Q个条目(entry),其中4的因子说明表达式17中的正弦、余弦、v和u的所有组合。
如果这些表格的尺寸大于期望的尺寸,则它们的尺寸可以通过利用由于正弦和余弦基函数的周期性而使表格中的对于I(v,n)的条目中的许多具有重复值的事实而被减少。这个尺寸的减少可以以查找表格中的条目所需要的额外的处理资源为交换来被实现,这是因为将需要更复杂的索引方案来存取表格中的数据。
其它技术可以被用来减少表格尺寸要求。例如,如果正弦和余弦表格已经存在于特别的实现方式中,那么仅仅需要I(v,n)和I(u,n),这将表格条目的数量减少到二分之一。
C.实现方式
包括本发明的各个方面的装置可以以各种方式被实现,包括用于由计算机或者包括与类似于通用计算机中发现的那些的组件耦接的更专门组件(诸如数字信号处理器(DSP)电路)的其它某一装置运行的软件。图5是可以被用来实现本发明的各个方面的装置70的示意性框图。处理器72提供计算资源。RAM 73是由用于处理的处理器72使用的系统随机访问存储器(RAM)。ROM 74表示用于存储操作装置70所需要的程序以及可能用于实现本发明的各个方面的某种形式的持久性存储装置(诸如只读存储器(ROM))。I/O控制75表示用于经由通信信道76、77接收和发送信号的接口电路。在所示出的实施例中,所有主要系统组件与总线71连接,总线71可以表示多于一个的物理的或者逻辑的总线;然而,总线体系结构对于实现本发明是不要求的。
在通过通用计算机系统实现的实施例中,额外的组件可以被包括以用于与诸如键盘或者鼠标以及显示器之类的装置进行接口连接,以及用于控制具有诸如磁带或磁盘或者光学介质之类的存储介质的存储装置78。存储介质可以被用来记录用于操作系统、公用设施(utilities)和应用的指令的程序,并且可以包括实现本发明的各个方面的程序。
为实践本发明的各个方面所需的函数可以由以各式各样的方式实现的组件(包括分立的逻辑组件、集成电路、一个或更多个ASIC和/或程序控制的处理器)执行。实现这些组件的方式对于本发明是不重要的。
本发明的软件实现可以由各种机器可读介质传送,该机器可读介质诸如为在包括从超声波到紫外频率的频谱的整个上的基带或调制的通信路径,或使用基本上任何记录技术(包括磁性的带、卡或盘,光学的卡或盘,以及包括纸张的介质上的可检测的标记)传送信息的存储介质。
Claims (7)
1.一种用于处理数字音频信号的方法,其中所述方法包括如下步骤:
接收实数值的变换系数的块,其中该块具有数量K的实数值的变换系数,该数量K的实数值的变换系数中的仅仅数量L的实数值的变换系数表示有限带宽音频信号的频谱分量,1/2L<M<K,并且M是2的幂;
对复数值的系数的块应用长度为R的第一变换,该复数值的系数的块是从包括表示有限带宽音频信号的频谱分量的L个实数值的变换系数的M个复数值的变换系数导出的,其中并且P是2的幂;
对第一变换的输出应用一组Q个长度为P的第二变换;以及
从该组第二变换的输出导出N个实数值的信号样本的序列,其中N=2·K并且实数值的信号样本表示有限带宽音频信号的时间分量。
3.根据权利要求2所述的方法,其中第一变换等同于执行表示为如下的计算:
对于0≤n<Q和0≤p<P;
其中X表示实数值的变换系数;
r为计算中使用的指数。
4.根据权利要求2所述的方法,其中第一变换等同于执行表示为如下的计算:
对于0≤n<Q和0≤p<P;
其中X表示实数值的变换系数;
v=P·r+p;
r为计算中使用的指数。
5.根据权利要求2所述的方法,其中第一变换等同于执行表示为如下的计算:
对于0≤n<Q和0≤p<P;
其中X表示实数值的变换系数;
v=P·r+p;
r为计算中使用的指数。
6.一种用于处理数字音频信号的设备,其中所述设备包括用于执行根据权利要求1到5中的任何一个所述的方法的所有步骤的部件。
7.一种存储介质,记录可由装置运行以便执行用于处理数字音频信号的方法的指令的程序,其中该方法包括根据权利要求1到5中的任何一个所述的方法的所有步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161468373P | 2011-03-28 | 2011-03-28 | |
US61/468,373 | 2011-03-28 | ||
PCT/US2012/029603 WO2012134851A1 (en) | 2011-03-28 | 2012-03-19 | Reduced complexity transform for a low-frequency-effects channel |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103415883A true CN103415883A (zh) | 2013-11-27 |
CN103415883B CN103415883B (zh) | 2015-11-25 |
Family
ID=45931032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280011954.1A Active CN103415883B (zh) | 2011-03-28 | 2012-03-19 | 用于低频效果声道的减少复杂性变换 |
Country Status (20)
Country | Link |
---|---|
US (1) | US10410644B2 (zh) |
EP (1) | EP2691951B1 (zh) |
JP (1) | JP5762620B2 (zh) |
KR (1) | KR101411297B1 (zh) |
CN (1) | CN103415883B (zh) |
AU (1) | AU2012238001B2 (zh) |
CA (1) | CA2826018C (zh) |
CL (1) | CL2013002762A1 (zh) |
DK (1) | DK2691951T3 (zh) |
EA (1) | EA030776B9 (zh) |
ES (1) | ES2598827T3 (zh) |
HK (1) | HK1189699A1 (zh) |
HU (1) | HUE030185T2 (zh) |
IL (1) | IL227635A (zh) |
MX (1) | MX2013011131A (zh) |
MY (1) | MY166267A (zh) |
PL (1) | PL2691951T3 (zh) |
SG (1) | SG193237A1 (zh) |
UA (1) | UA107293C2 (zh) |
WO (1) | WO2012134851A1 (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1914669A (zh) * | 2004-01-28 | 2007-02-14 | 皇家飞利浦电子股份有限公司 | 使用复数值数据的音频信号解码 |
Family Cites Families (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2888554A (en) | 1955-09-06 | 1959-05-26 | Rca Corp | Diversity reception |
US3900721A (en) | 1974-02-14 | 1975-08-19 | Us Navy | Serial-access linear transform |
US4241411A (en) | 1978-11-16 | 1980-12-23 | Probe Systems, Incorporated | FFT Parallel processor having mutually connected, multiple identical cards |
US4579032A (en) | 1984-09-10 | 1986-04-01 | Kawai Musical Instrument Mfg. Co., Ltd | Computation time reduction in a polyphonic tone synthesizer |
US5394349A (en) | 1992-07-10 | 1995-02-28 | Xing Technology Corporation | Fast inverse discrete transform using subwords for decompression of information |
IL107658A0 (en) | 1993-11-18 | 1994-07-31 | State Of Israel Ministy Of Def | A system for compaction and reconstruction of wavelet data |
US5671168A (en) | 1995-07-06 | 1997-09-23 | Technion Research & Development Foundation Ltd. | Digital frequency-domain implementation of arrays |
US5742527A (en) | 1996-03-15 | 1998-04-21 | Motorola, Inc. | Flexible asymmetrical digital subscriber line (ADSL) receiver, central office using same, and method therefor |
US5781728A (en) | 1996-03-15 | 1998-07-14 | Motorola Inc. | Flexible asymmetrical digital subscriber line ADSL transmitter, remote terminal using same, and method therefor |
US5841890A (en) | 1996-05-06 | 1998-11-24 | Northrop Grumman Corporation | Multi-dimensional wavelet tomography |
US6252965B1 (en) | 1996-09-19 | 2001-06-26 | Terry D. Beard | Multichannel spectral mapping audio apparatus and method |
SE515535C2 (sv) | 1996-10-25 | 2001-08-27 | Ericsson Telefon Ab L M | En transkoder |
SG54383A1 (en) | 1996-10-31 | 1998-11-16 | Sgs Thomson Microelectronics A | Method and apparatus for decoding multi-channel audio data |
SE9703849L (sv) | 1997-03-14 | 1998-09-15 | Ericsson Telefon Ab L M | Nedskalning av bilder |
US5978647A (en) | 1997-07-10 | 1999-11-02 | The United States Of America As Represented By The Secretary Of The Navy | Method and apparatus for simulating autocorrelation coefficients in a multipath sonar system |
US5978646A (en) | 1997-07-10 | 1999-11-02 | The United States Of America As Represented By The Secretary Of The Navy | Method and apparatus for simulating a lofargram in a multipath sonar system |
US6002914A (en) | 1997-07-10 | 1999-12-14 | The United States Of America As Represented By The Secretary Of The Navy | Method and apparatus for simulating reverberation in a multipath sonar system |
US5983067A (en) | 1997-07-10 | 1999-11-09 | The United States Of America As Represented By The Secretary Of The Navy | Method and apparatus for simulating cross-correlation coefficients in a multipath sonar system |
US5995803A (en) | 1997-07-10 | 1999-11-30 | The United States Of America As Represented By The Secretary Of The Navy | Method and apparatus for simulating a multipath sonar system |
EP1016231B1 (en) | 1997-08-29 | 2007-10-10 | STMicroelectronics Asia Pacific Pte Ltd. | Fast synthesis sub-band filtering method for digital signal decoding |
US6263312B1 (en) | 1997-10-03 | 2001-07-17 | Alaris, Inc. | Audio compression and decompression employing subband decomposition of residual signal and distortion reduction |
US6081783A (en) | 1997-11-14 | 2000-06-27 | Cirrus Logic, Inc. | Dual processor digital audio decoder with shared memory data transfer and task partitioning for decompressing compressed audio data, and systems and methods using the same |
US6847737B1 (en) | 1998-03-13 | 2005-01-25 | University Of Houston System | Methods for performing DAF data filtering and padding |
US6324559B1 (en) | 1998-10-16 | 2001-11-27 | Telefonaktiebolaget Lm Ericsson (Publ) | Odd-transform fast convolution |
US6477553B1 (en) | 1999-01-13 | 2002-11-05 | Philip Druck | Measurement scale for non-uniform data sampling in N dimensions |
US6430529B1 (en) | 1999-02-26 | 2002-08-06 | Sony Corporation | System and method for efficient time-domain aliasing cancellation |
US6643406B1 (en) | 1999-07-28 | 2003-11-04 | Polaroid Corporation | Method and apparatus for performing linear filtering in wavelet based domain |
EP1236087A1 (en) | 1999-10-28 | 2002-09-04 | Philip Druck | Self-stabilizing, portable and efficient computer arithmetic using mappings of d scale points |
EP1269346B1 (en) | 2000-03-10 | 2007-10-31 | Jaber Associates, L.L.C. | Parallel multiprocessing for the fast fourier transform with pipeline architecture |
US7246143B2 (en) | 2000-04-07 | 2007-07-17 | Comsat Corporation | Traced fast fourier transform apparatus and method |
DE60132853D1 (de) | 2000-07-07 | 2008-04-03 | Nokia Siemens Networks Oy | Verfahren und Vorrichtung für die perzeptuelle Tonkodierung von einem mehrkanal Tonsignal mit Verwendung der kaskadierten diskreten Cosinustransformation oder der modifizierten diskreten Cosinustransformation |
KR100462630B1 (ko) | 2000-07-11 | 2004-12-23 | 삼성전자주식회사 | 단일-캐리어 디지털 텔레비전 방송 시스템을 위한반복-pn1023-시퀀스 반향-소거 참조 신호 |
US20020177986A1 (en) | 2001-01-17 | 2002-11-28 | Moeckel George P. | Simulation method and system using component-phase transformations |
US7020672B2 (en) | 2001-03-30 | 2006-03-28 | Koninklijke Philips Electronics, N.V. | Reduced complexity IDCT decoding with graceful degradation |
US6993547B2 (en) | 2001-05-07 | 2006-01-31 | Jaber Associates, Llc | Address generator for fast fourier transform processor |
US7366236B1 (en) | 2001-06-04 | 2008-04-29 | Cisco Sytems Canada Co. | Source adaptive system and method for 2D iDCT |
GB2383412B (en) | 2001-12-18 | 2004-06-30 | Univ Sheffield | Structural health monitoring |
US6776760B2 (en) | 2002-03-06 | 2004-08-17 | Alfred E. Mann Institute For Biomedical Engineering At The University Of Southern California | Multi-mode processing for ultrasonic imaging |
US6850589B2 (en) | 2002-03-27 | 2005-02-01 | Agilent Technologies, Inc. | Tomography of curved surfaces |
AU2003257412A1 (en) | 2002-04-13 | 2003-11-11 | I-For-T Gmbh | Vibration sensor and method for monitoring the condition of rotating components and bearings |
DE10234130B3 (de) * | 2002-07-26 | 2004-02-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals |
US7277493B2 (en) | 2003-01-28 | 2007-10-02 | Agere Systems Inc. | Equalization in orthogonal frequency domain multiplexing |
CN100546233C (zh) | 2003-04-30 | 2009-09-30 | 诺基亚公司 | 用于支持多声道音频扩展的方法和设备 |
US20040230419A1 (en) | 2003-05-15 | 2004-11-18 | Divio, Inc. | DRAM access for MDCT/IDMCT implementation |
US7606138B2 (en) | 2003-09-29 | 2009-10-20 | Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry, Through The Communications Research Centre Canada | Multi-symbol encapsulated OFDM system |
US7702002B2 (en) | 2004-01-28 | 2010-04-20 | Qualcomm Incorporated | Rapid acquisition methods and apparatus for GPS signals |
EP1895512A3 (en) | 2004-04-05 | 2014-09-17 | Koninklijke Philips N.V. | Multi-channel encoder |
US7483480B2 (en) | 2004-11-24 | 2009-01-27 | Nokia Corporation | FFT accelerated iterative MIMO equalizer receiver architecture |
RU2416129C2 (ru) | 2005-03-30 | 2011-04-10 | Конинклейке Филипс Электроникс Н.В. | Масштабируемое многоканальное кодирование звука |
US7840411B2 (en) | 2005-03-30 | 2010-11-23 | Koninklijke Philips Electronics N.V. | Audio encoding and decoding |
BRPI0608945C8 (pt) | 2005-03-30 | 2020-12-22 | Coding Tech Ab | codificador de áudio de multi-canal, decodificador de áudio de multi-canal, método de codificar n sinais de áudio em m sinais de áudio e dados paramétricos associados, método de decodificar k sinais de áudio e dados paramétricos associados, método de transmitir e receber um sinal de áudio de multi-canal codificado, mídia de armazenamento legível por computador, e, sistema de transmissão |
US7961890B2 (en) | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
MX2008000504A (es) | 2005-07-14 | 2008-03-07 | Koninkl Philips Electronics Nv | Codificacion y decodificacion de audio. |
US8443026B2 (en) * | 2005-09-16 | 2013-05-14 | Dolby International Ab | Partially complex modulated filter bank |
CN101433099A (zh) | 2006-01-05 | 2009-05-13 | 艾利森电话股份有限公司 | 多声道环绕声的个性化解码 |
US8112247B2 (en) | 2006-03-24 | 2012-02-07 | International Business Machines Corporation | Resource adaptive spectrum estimation of streaming data |
EP1999847B1 (en) | 2006-03-28 | 2012-11-14 | Telefonaktiebolaget LM Ericsson (publ) | Filter adaptive frequency resolution |
US20070286431A1 (en) | 2006-05-25 | 2007-12-13 | Microlink Communications Inc. | Headset |
US8700387B2 (en) | 2006-09-14 | 2014-04-15 | Nvidia Corporation | Method and system for efficient transcoding of audio data |
CN101192269B (zh) | 2006-11-29 | 2012-05-02 | 佳能株式会社 | 从图像估计消失点的方法和装置、计算机程序及其存储介质 |
RU2451412C2 (ru) | 2007-03-02 | 2012-05-20 | Квэлкомм Инкорпорейтед | Технологии автоматической регулировки усиления и фильтрации для использования в канальном повторителе |
US8548815B2 (en) | 2007-09-19 | 2013-10-01 | Qualcomm Incorporated | Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications |
US20090141808A1 (en) | 2007-11-30 | 2009-06-04 | Yiufai Wong | System and methods for improved video decoding |
US8497743B2 (en) | 2007-12-24 | 2013-07-30 | Telefonaktiebolaget L M Ericsson (Publ) | Passive fourier transform circuits and butler matrices |
US7940864B2 (en) | 2008-04-28 | 2011-05-10 | Newport Media, Inc. | Channel estimation for high doppler mobile environments |
US7907683B2 (en) | 2008-04-28 | 2011-03-15 | Newport Media, Inc. | Application of superfast algorithms to a pilot-based channel estimation process |
FR2938947B1 (fr) * | 2008-11-25 | 2012-08-17 | A Volute | Procede de traitement du signal, notamment audionumerique. |
US8438204B2 (en) | 2008-12-18 | 2013-05-07 | Lsi Corporation | Apparatus for calculating an N-point discrete fourier transform |
US8787501B2 (en) | 2009-01-14 | 2014-07-22 | Qualcomm Incorporated | Distributed sensing of signals linked by sparse filtering |
EP2237269B1 (en) | 2009-04-01 | 2013-02-20 | Motorola Mobility LLC | Apparatus and method for processing an encoded audio data signal |
WO2011026247A1 (en) * | 2009-09-04 | 2011-03-10 | Svox Ag | Speech enhancement techniques on the power spectrum |
RU2591011C2 (ru) | 2009-10-20 | 2016-07-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров) |
SG178320A1 (en) * | 2010-06-09 | 2012-03-29 | Panasonic Corp | Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit and audio decoding apparatus |
-
2012
- 2012-03-19 MX MX2013011131A patent/MX2013011131A/es active IP Right Grant
- 2012-03-19 AU AU2012238001A patent/AU2012238001B2/en active Active
- 2012-03-19 SG SG2013064829A patent/SG193237A1/en unknown
- 2012-03-19 EP EP12712486.5A patent/EP2691951B1/en active Active
- 2012-03-19 DK DK12712486.5T patent/DK2691951T3/en active
- 2012-03-19 KR KR1020137020501A patent/KR101411297B1/ko active IP Right Grant
- 2012-03-19 CN CN201280011954.1A patent/CN103415883B/zh active Active
- 2012-03-19 MY MYPI2013002742A patent/MY166267A/en unknown
- 2012-03-19 CA CA2826018A patent/CA2826018C/en active Active
- 2012-03-19 EA EA201370207A patent/EA030776B9/ru not_active IP Right Cessation
- 2012-03-19 US US14/005,924 patent/US10410644B2/en active Active
- 2012-03-19 HU HUE12712486A patent/HUE030185T2/en unknown
- 2012-03-19 ES ES12712486.5T patent/ES2598827T3/es active Active
- 2012-03-19 UA UAA201312169A patent/UA107293C2/ru unknown
- 2012-03-19 JP JP2014502622A patent/JP5762620B2/ja active Active
- 2012-03-19 PL PL12712486T patent/PL2691951T3/pl unknown
- 2012-03-19 WO PCT/US2012/029603 patent/WO2012134851A1/en active Application Filing
-
2013
- 2013-07-24 IL IL227635A patent/IL227635A/en active IP Right Grant
- 2013-09-26 CL CL2013002762A patent/CL2013002762A1/es unknown
-
2014
- 2014-03-20 HK HK14102791.1A patent/HK1189699A1/zh unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1914669A (zh) * | 2004-01-28 | 2007-02-14 | 皇家飞利浦电子股份有限公司 | 使用复数值数据的音频信号解码 |
Non-Patent Citations (4)
Title |
---|
PATRICK DE SMET ET AL: "OPTIMIZED MPEG AUDIO DECODING USING RECURSIVE SUBBAND SYNTHESIS WINDOWING", 《2002 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING. PROCEEDINGS. 》 * |
PRINCEN J P ET AL: "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation", 《INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH & SIGNAL PROCESSING》 * |
WINNIE LAU ET AL: "A COMMON TRANSFORM ENGINE FOR MPEG & AC3 AUDIO DECODER", 《IEEE TRANSACTIONS ON CONSUMER ELECTRONICS》 * |
杨洲等: "基于实时音频信号处理的Chirp-Z变换算法", 《通信与信息技术》 * |
Also Published As
Publication number | Publication date |
---|---|
SG193237A1 (en) | 2013-10-30 |
KR101411297B1 (ko) | 2014-06-26 |
IL227635A (en) | 2017-05-29 |
EA030776B9 (ru) | 2019-01-31 |
ES2598827T3 (es) | 2017-01-30 |
US20140012588A1 (en) | 2014-01-09 |
UA107293C2 (uk) | 2014-12-10 |
AU2012238001B2 (en) | 2015-09-17 |
CN103415883B (zh) | 2015-11-25 |
MY166267A (en) | 2018-06-22 |
US10410644B2 (en) | 2019-09-10 |
EA030776B1 (ru) | 2018-09-28 |
WO2012134851A1 (en) | 2012-10-04 |
CA2826018A1 (en) | 2012-10-04 |
KR20130116914A (ko) | 2013-10-24 |
CL2013002762A1 (es) | 2014-03-07 |
CA2826018C (en) | 2016-05-17 |
EA201370207A1 (ru) | 2014-01-30 |
IL227635A0 (en) | 2013-09-30 |
MX2013011131A (es) | 2013-10-30 |
PL2691951T3 (pl) | 2017-03-31 |
HK1189699A1 (zh) | 2014-06-13 |
EP2691951A1 (en) | 2014-02-05 |
JP2014514605A (ja) | 2014-06-19 |
DK2691951T3 (en) | 2016-11-14 |
EP2691951B1 (en) | 2016-08-24 |
HUE030185T2 (en) | 2017-04-28 |
JP5762620B2 (ja) | 2015-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3598779B1 (en) | Method and apparatus for decompressing a higher order ambisonics representation | |
CN103262164B (zh) | 叉积增强的基于子带块的谐波换位 | |
EP3496096A1 (en) | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field | |
KR100776235B1 (ko) | 변환 표시로의 변환 또는 변환 표시의 역변환을 위한 장치및 방법 | |
JPH11503240A (ja) | フェーザ測定用単一側波帯フィルタバンクの効率的実施装置 | |
CN103366749B (zh) | 一种声音编解码装置及其方法 | |
WO2010120924A1 (en) | Low complexity spectral band replication (sbr) filterbanks | |
US7512539B2 (en) | Method and device for processing time-discrete audio sampled values | |
EP3096317B1 (en) | Signal processor and method for processing a signal | |
US20160180855A1 (en) | Apparatus and method for encoding and decoding multi-channel audio signal | |
CN102483943B (zh) | 多通道音频解码方法及其设备 | |
US9257129B2 (en) | Orthogonal transform apparatus, orthogonal transform method, orthogonal transform computer program, and audio decoding apparatus | |
EP2784776B1 (en) | Orthogonal transform apparatus, orthogonal transform method, orthogonal transform computer program, and audio decoding apparatus | |
CN103415883B (zh) | 用于低频效果声道的减少复杂性变换 | |
TWI470622B (zh) | 用於低頻效應頻道降低複雜度之轉換 | |
AU2012238001A1 (en) | Reduced complexity transform for a low-frequency-effects channel | |
CN104078048A (zh) | 一种声音解码装置及其方法 | |
BR112013022988B1 (pt) | Método para processar um sinal de áudio digital, aparelho para processar um sinal de áudio digital e meio de armazenamento |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |