CN1926609B - 用于信号分析和合成的自适应混合变换 - Google Patents

用于信号分析和合成的自适应混合变换 Download PDF

Info

Publication number
CN1926609B
CN1926609B CN2005800053012A CN200580005301A CN1926609B CN 1926609 B CN1926609 B CN 1926609B CN 2005800053012 A CN2005800053012 A CN 2005800053012A CN 200580005301 A CN200580005301 A CN 200580005301A CN 1926609 B CN1926609 B CN 1926609B
Authority
CN
China
Prior art keywords
transform
signal
coefficients
spectral
spectral coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2005800053012A
Other languages
English (en)
Other versions
CN1926609A (zh
Inventor
马克·S.·温登
格兰特·A.·戴维森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN1926609A publication Critical patent/CN1926609A/zh
Application granted granted Critical
Publication of CN1926609B publication Critical patent/CN1926609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Discrete Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Resistance Or Impedance (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)
  • Control Of Eletrric Generators (AREA)
  • Control Of Motors That Do Not Use Commutators (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

诸如在音频和视频编码系统中使用的分析和合成滤波器组中每个滤波器组通过混合变换实现,该混合变换包括主变换与一个或更多次变换级联。用于滤波器组的主变换实现其中消除时域混叠赝象的分析/合成系统。对变换系数的块应用与该主变换级联的所述次变换。改变该块长度以适配分析和合成滤波器组的时间分辨率。

Description

用于信号分析和合成的自适应混合变换
技术领域
本发明通常涉及信号分析和合成滤波器组诸如可以在音频和视频编码系统中使用的那些滤波器组。更具体而言,本发明涉及通过能够适配滤波器组的时间和频率分辨率的块变换的级联而实现的分析和合成滤波器组。
背景技术
通常使用编码系统来减小充分表示源信号所需的信息量。通过减小信息容量要求,能够在具有较低带宽的信道上发送信号表示或使用较小的空间在媒体上存储信号表示。编码能够通过删除源信号中的冗余分量或不相关分量而减小源信号的信息容量要求。所谓的感知编码方法和系统通常使用滤波器组,通过使用频谱分量基本组去相关源信号来减小冗余,以及通过根据心理感知准则自适应量化频谱分量来减小不相关性。
许多感知编码系统通过块变换实现滤波器组。在音频编码系统中,例如,通过时间分段或时域采样的块表示的源音频信号被变换成表示该源信号的频谱内容的多组频域系数。这些分段的长度确立滤波器组的时间分辨率和频率分辨率。时间分辨率随分段长度的减小而增加。频率分辨率随分段长度的增加而增加。由于这种关系,分段长度的选择使得在块变换滤波器组的时间和频率分辨率之间进行折衷。
分段长度的单一选择不能够对于典型编码系统所遇到的所有源信号条件提供分辨率之间的最佳折衷。如果滤波器组具有较高的频率分辨率(如果使用较长的分段长度则能够提供),通常能够更有效地编码缓慢变化或稳定的源信号。如果滤波器组具有较高的时间分辨率(如果使用较短的分段长度则能够提供),通常能够更有效地编码快速变化或高度不稳定的源信号。通过响应于改变源信号条件适配分段长度,块变换滤波器组能够优化其时间和频率分辨率之间的折衷。
在音频编码系统中可以使用例如各种各样的变换实现滤波器组,但是广泛地使用特定的修改离散余弦变换(MDCT),因为它具有用于音频编码的若干非常有吸引力的特性,其中包括能够提供临界采样同时允许相邻的源信号分段相互重叠。MDCT也是具有吸引力的,因为它能够基本上删除在分段内基本上稳定的源信号中所有冗余分量。MDCT滤波器组的正确操作要求使用重叠的源信号分段以及满足一定准则的窗口函数,在Princen等人的“Subband/Transform CodingUsing Filter Bank Designs Based on Time Domain AliasingCancellation”(Proc.of the 1987 International Conference onAcoustics,Speech and Signal Processing(ICASSP),1987年5月,第2161-64页)中描述了这些准则。不幸的是,由于对必须应用于重叠源信号分段的窗口函数施加的要求,难以响应于信号条件适配MDCT滤波器组的时间和频率分辨率。
一种有时称为“窗口切换”的已知技术能够通过响应于检测到一定的信号条件诸如突然的信号改变或幅度瞬变而自适应地在两个不同窗口函数之间进行切换,来适配MDCT滤波器组的时间分辨率。根据于1993年5月25日授予Edler的美国专利5214742中描述的这种技术,不改变分段长度,而是通过在不同的窗口函数形状之间进行切换以减小每个分段中通过滤波器组变换的非零采样的数量,来适配时间分辨率。不幸的是,这种技术不适配滤波器组的频率分辨率,并且无论何时减小时间分辨率都将严重地恶化滤波器组的频率选择性,因为窗口切换需要的窗口函数的形状必须是次最佳的以满足MDCT正确操作的要求。
另一种有时称为“块切换”的已知技术类似于上述的窗口切换技术,因为它也在不同的窗口函数形状之间进行切换,但是块切换技术通过响应于检测到一定信号条件诸如突然的信号改变或幅度瞬变而还自适应地在两个不同的分段长度之间切换,能够适配MDCT滤波器组的时间和频率分辨率。这种技术在高级音频编码器(AAC)中使用,在Bosi等人的“ISO/IEC MPEG-2 Advanced Audio Coding”(J.AudioEng.Soc.,vol.45,no.10,1997年10月,第789-814页)中描述了该AAC。
在AAC中,MDCT滤波器组被应用于稳定的长度等于2048个采样的源信号分段,并且应用于非稳定的长度等于256个采样的源信号分段。在AAC中通过使用适于较长分段的“长窗口函数”,适于较短分段的“短窗口函数”,允许从较长分段长度切换到较短分段长度的“长到短桥接窗口函数”,以及允许从较短分段长度切换到较长分段长度的“短到长桥接窗口函数”,来实现块切换。两种桥接窗口函数允许在不同的分段长度之间进行切换,同时满足MDCT正确操作所必需的准则。从较长分段长度切换到较短分段长度以及切换回到较长长度是通过使用长到短桥接窗口函数应用MDCT于长分段,使用短窗口函数应用MDCT于八个短分段的整数倍,以及使用短到长桥接窗口函数应用MDCT于长分段来实现的。紧接着,必须应用MDCT于长分段,但可以使用长窗口函数或如果想要另一个块切换则可以使用长到短桥接窗口函数。
尽管块切换提供适配MDCT滤波器组的时间和频率分辨率的方式,由于若干原因它不是理想的解决方案。一个原因是在块长度切换期间,由于桥接窗口函数的形状必须是次最佳的以允许进行分段长度切换并满足MDCT正确操作的要求,从而恶化了变换的频率选择性。另一个原因是切换不能在任意的时间发生。如上所述,MDCT必须在切换到较长分段长度之后立即应用于另一个长分段。立即切换到较短长度是不可能的。这种块切换技术也不是一种理想的解决方案,因为这种切换机制仅提供两种分段长度,这些分段长度对于所有信号条件来说不是最佳的。例如,由于AAC中的较长和较短分段长度对于大多数语音信号分段来说都不是最佳的,从而AAC中的两种分段长度不是最佳的。对于语音的非稳定性质来说2048采样分段通常太长,256采样分段通常太短而不能有效地删除冗余的分量。而且,存在许多稳定信号,对于这些信号来说长于2048个采样的分段长度将会更佳。结果,由于块切换以适配MDCT滤波器组的时间和频率分辨率的能力有限,损害了AAC的性能。
在遵循杜比数字(Dolby Digital)编码比特流标准的编码系统中使用另一种形式的块切换。在2001年8月20日公布的高级电视系统委员会(ATSC)题为“Revision A to Digital Audio Compression(AC-3)Standard”的A/52A文件中描述了这种编码标准,有时称为“AC-3”。在AC-3编码系统中使用的块切换形式应用MDCT于对于稳定信号是512个采样而对于非稳定信号是256个采样的源信号分段。AC-3编码系统中使用的块切换技术提供当进行长度切换时更为灵活的选择。而且,编码性能对于非稳定的源信号如语音来说相当好;但是,对于更稳定的信号的编码性能受到较长分段提供的相对低的频率分辨率的限制。
在1995年2月28日授予Davidson的美国专利5394473中描述了用于MDCT滤波器组的时间和频率分辨率自适应控制的其他技术。这些技术中的部分技术允许使用窗口函数应用MDCT滤波器组于基本上任何长度的分段,这些窗口函数比其他已知技术提供好得多的频率响应。不幸的是,这些技术必须适配MDCT的核心或基本函数,所以,它们与现有的比特流标准如上述的AC-3标准不兼容。这些技术也是计算强度大的。
发明内容
需要一种效率更高和有效的方式以适配通过变换如MDCT实现的滤波器组的频率分辨率。该解决方案应该提供一种简化其包含到与现有比特流标准兼容的系统中的实现。这通过使用混合变换滤波器组来达到,该混合变换滤波器组可以通过级联块变换实现。
根据本发明的教导,分析和合成滤波器组通过包括主变换与一个或更多次变换级联的混合变换实现。在一种实现中,所述主变换是应用于相互重叠一半分段长度的源信号分段的MDCT,以及所述次变换是对于在时间上的特定频率应用于MDCT系数的非重叠块的DCT。可以通过增加由一个或更多次变换所变换的块中的系数数量,增加滤波器组的频率分辨率。该一个或更多次变换可以应用于MDCT系数的块,其具有随系数频率变化的系数数量,从而允许以各种各样的方式适配滤波器组的频率分辨率。
通过参考以下讨论和附图可以更好地理解本发明的各种特征及其优选实施例,其中在若干附图中相似的附图标记表示相似的元件。仅仅将以下讨论和附图的内容作为实例阐述,而不应该理解成表示对本发明范围的限制。
附图说明
图1是在编码系统中使用的发送机的示意方框图。
图2是在编码系统中使用的接收机的示意方框图。
图3是可以用于实现本发明各个方面的设备的示意方框图。
图4是包含本发明各个方面的分析滤波器组的示意方框图。
图5是包含本发明各个方面的分析滤波器组的示意方框图。
具体实施方式
A.引言
本发明提供了一种通过混合变换实现的能够容易地适配其频率分辨率的滤波器组。图1和2分别例示了在可以包含本发明各个方面的音频编码系统中的发送机和接收机的示意方框图。在以下部分中简要地讨论了该例示发送机和接收机的特征。在这种讨论之后,将讨论分析和合成滤波器组的有关特征。
1.发送机
图1中例示的发送机应用分析滤波器组3于从路径1接收的源信号以产生表示源信号的频谱内容的频谱系数,应用编码器5于频谱系数以产生编码的信息,以及应用格式化器8于该编码的信息以产生适于沿路径9传输的输出信号。该输出信号可以立即传送到接收机或被记录以随后传送。分析滤波器组3可以以下面描述的各种方式来实现。
在本公开中,术语如“编码器”和“编码”并无意图暗示任何特定类型的信息处理。例如,经常使用编码来减小信息容量需求;但是,本公开中的这些术语不必表示这种类型的处理。编码器5可以执行基本上任何类型的期望处理。在一种实现中,通过根据感知模型、使用各种各样的量化技术(包括在2001年6月12日授予Davidson等人的美国专利6246345中描述的向量量化和增益自适应量化)来量化频谱系数,产生编码的信息。对于本发明来说特定类型的编码并不重要。
2.接收机
图2中例示的接收机应用去格式化器23于从路径21接收的输入信号以获得编码的信息,应用解码器25于编码的信息以获得表示源信号的频谱内容的频谱系数,以及应用合成滤波器组27于该频谱系数以产生沿路径29传输的输出信号,该输出信号是源信号的复制品但可以不是精确的复制品。合成滤波器组27可以以与分析滤波器组3的实现互补的各种方式实现。
在本公开中,术语如“解码器”和“解码”并不意图暗示任何特定类型的信息处理。解码器25可以执行基本上任何类型的所需或期望的处理。在一种与上述编码处理相反的实现中,将量化的频谱分量解码成去量化的频谱系数。对于本发明来说特定类型的解码并不重要。
B.自适应混合变换
分析滤波器组3和合成滤波器组27包括混合变换,可以分别如图4和5所示来实现。
图4所示的分析滤波器组3包括主变换43以及与该主变换级联的一个或更多次变换45。该主变换被应用于源信号分段以产生表示该源信号分段的频谱内容的多组频谱系数。对于在时间上的特定频率,一个或更多次变换中的每个变换被应用于频谱系数块。响应于控制信号而适配每个块中系数的数量。
图5所示的合成滤波器组27包括一个或更多逆次变换52以及与该逆次变换级联的逆主变换54。对于在时间上的特定频率,一个或更多逆次变换中的每个变换产生频谱系数块。响应于控制信号而适配每个块中的系数数量。对于在频率上的特定时间频谱系数块被组合成多组频谱系数,以及主变换应用于该多组频谱系数以产生被组合来提供原始源信号的复制品的信号分段。
分析滤波器组和合成滤波器组的主变换实现了一种分析/合成系统,其中逆主变换消除了正向主变换产生的时域混叠赝象。例如,在上述Princen论文中描述的修改离散余弦变换(MDCT)和逆MDCT(IMDCT)实现了成奇数堆栈的临界采样的单边带分析/合成系统的时域等效。这些变换在这里称为成奇数堆栈时域混叠消除(O-TDAC)变换。另一种TDAC实现在Princen等人的“Analysis/Synthesis FilterBank Design Based on Time Domain Aliasing Cancellation”(IEEETrans.on Acoust.,Speech,Signal Proc.,vol.ASSP-34,1986,pp.1153-1161)中描述。在这种实现中的分析滤波器组包括应用MDCT和修改离散正弦变换(MDST)来交替信号分段。所述合成滤波器组包括应用IMDCT和逆MDST(IMDST)。这些变换实现了成偶数堆栈的临界采样的单边带分析/合成系统的时域等效并且称为成偶数堆栈时域混叠消除变换。
次变换可以通过许多变换包括离散余弦变换(DCT)、离散正弦变换(DST)、和离散傅里叶变换(DFT)中的任何变换实现。
在分析滤波器组3的优选实现中,类型-II DCT与上述O-TDACMDCT级联使用。在合成滤波器组27的对应实现中,O-TDAC IMDCT与类型-II逆DCT(IDCT)级联使用。在以下更详细地讨论这些实现。
1.分析滤波器组
参考图4,从路径1接收源信号采样序列并存储在缓冲器41中。分析器47是通过应用某种分析处理于所存储的采样来确定在每个分段中源信号采样数量、或分段长度以用于随后处理的可选组件。按需要可以使用基本上任何分析处理。例如,可以如以上引用的ATSCA/52A文献中所描述的那样检测幅度瞬变。表示所选择分段长度的信息沿路径2传送到格式化器7以包含在输出信号中。在省略分析器47和路径2的替换实现中使用固定长度分段。
a)分析窗口函数
窗口42通过利用分析窗口函数加权每个分段中的源信号采样而形成重叠段序列。响应于从路径2接收的分段长度信息,适配用于每个分段的分析窗口函数的长度和形状。可以使用各种各样的窗口函数,但是通常优选Kaiser-Bessel-Derived(KBD)窗口函数,因为它具有极佳的频率选择性特性。这种窗口函数从可以如下表示的Kaiser-Bessel窗口函数推导出:
W ( n ) = I 0 [ πα 1 - ( n N / 2 ) 2 ] I 0 [ πα ] , 0≤n<N    (1)
其中,α=Kaiser-Besselα因数,
n=窗口函数采样号,
N=以采样数量表示的窗口函数长度,以及
I 0 [ x ] = Σ k = 0 ∞ ( x / 2 ) k k !
从4到7的α值对于典型的音频编码应用来说所起作用良好。
上述推导利用长度等于期望窗口函数长度N减去重叠区间v的矩形窗口函数卷积Kaiser-Bessel窗口函数W(n)。参见表达式2。这种卷积可以简化为如表达式3所示。
WP ( n ) = Σ k = 0 N - 1 s ( k ) W ( n - k ) Σ k = 0 v W ( k ) , 0≤n<N    (2)
WP ( n ) = Σ k = 0 N - v - 1 W ( n - k ) Σ k = 0 v W ( k ) , 0≤n<N    (3)
其中,v=在分段重叠区间内的采样数量,
N=窗口函数的期望长度,
W(n)=长度为v+1的Kaiser-Bessel窗口函数
WP(n)=长度为N的推导积窗口,以及
Figure G2005800053012D00091
通过取推导积窗口WP(n)的平方根可以获得KBD分析窗口函数。在表达式4中示出了这种分析窗口函数。
WA ( n ) = Σ k = 0 N / 2 - 1 W ( n - k ) Σ k = 0 n / 2 W ( k ) , 0≤n<N    (4)
b)主变换
主变换43将加窗源信号采样的每个分段变换成一组频谱系数。一组系数中的每个系数表示用于特定频率的加窗分段的频谱内容。在优选实现中使用O-TDAC MDCT。这种变换可以表示为:
C ( k , m ) = Σ n = 0 N - 1 x ( n + m · N 2 ) · WA ( n ) · cos [ 2 π ( k + 1 2 ) ( n + N 4 + 1 2 ) N ] , 0≤k<N(5)
其中,k=频率系数号,
n=输入信号采样号,
m=源信号分段号,
N=源信号分段长度,
x(n)=在采样n处源信号x的值,以及
C(k)=MDCT系数k。
O-TDAC MDCT产生以下形式的一组频谱系数:
{ C ( k , m ) } = C ( k , m ) 0 &le; k < N 2 0 k = N 2 - - - ( 6 )
主变换可以直接地根据表达式5实现或者通过在计算上效率更高的处理诸如使用在美国专利5394473中描述的快速傅里叶变换(FFT)的那些处理来实现。可以响应于分段长度使用基本上任何可期望的处理来适配分析窗口函数和主变换。在美国专利5214742、美国专利5394473、上述ATSC A/52A文献以及ISO/MPEG AAC文献中公开了几种技术。
表示用于一个或更多相应频率中每个频率的加窗源信号分段的频谱内容的频谱系数沿相应信号路径传递并存储在缓冲器中。例如,图4所示的发送机沿两条信号路径中的一条传送用于两个相应频率中每个频率的频谱系数以存储在缓冲器44a和44b中。为了清楚例示,在图4中只示出了两条信号处理路径。在典型系统中使用的分析滤波器组3的实现可具有成百上千的路径。
c)频谱分量分析
参考图4所示的上部信号路径,用于分段序列中特定频率的频谱系数存储在缓冲器44a中并组合成块。分析器48a确定每个块中系数的数量,即块长度,并沿路径49a传送该长度。这个长度可以通过分析缓冲器44a中存储的系数来确定。对于本发明来说特定的分析方法不是原则上关键的。这里描述了几种分析方法。
一种基本的方法形成频谱系数的最长可能块,其中相应块中的系数在数值上充分地类似。这可以通过各种方法予以确定。一种方法是计算相邻频谱系数之间的数值差并识别平均差小于某一阈值的相邻系数的最长块。另一种方法是使用缓冲器中存储的用于多条信号路径的频谱系数。这种方法针对频谱系数带对数值差求和以及识别在该带上平均差小于某一阈值的最长块。这个带的宽度可以与所谓的人听觉系统的临界带宽相当。
另一种基本方法依赖于通过在发送机中其它地方进行的信号编码处理执行的信号分析。例如,与上述A/52A文献中描述的比特流标准兼容的发送机产生具有频谱系数的编码信号,该频谱系数表示为与定标因子相关的定标值。分析这些定标因子以识别能够共享同一组定标因子的MDCT系数组序列。分析器48a将用于其相应信号路径的块长度适配成等于共享指数的系数组的数量。
d)次变换
次变换45a将频谱系数的每个块变换成一组混合变换系数。响应于从路径49a接收的块长度信息适配该变换的长度。在优选实现中,类型-II DCT被应用于不相互重叠的频谱系数块。这种变换可以表示为:
X ( k , j ) = 2 M &CenterDot; R j &CenterDot; &Sigma; m = 0 M - 1 C ( k , m ) cos [ j ( 2 m + 1 ) &pi; 2 M ] , 0≤j<M    (7)
其中,X(k,j)=对于MDCT系数k的混合变换系数j,
M=MDCT系数k的块长度,以及
R j = 1 2 j = 0 1 j &NotEqual; 0
所述次变换可以直接根据表达式7实现或者它可以通过在计算上效率更高的已知处理诸如Rao等人的“Discrete Cosine Transform”(Academic Press,Inc.,1990)的第4章中描述的处理实现。
e)格式化器和其他信号路径
格式化器46a是可用来将混合变换系数以及块长度信息组合到编码器5和格式化器7所能够处理的数据中的可选组件。这允许图1中所示发送机中的分析滤波器组3在对发送机剩余部分的改变最小的情况下通过混合变换实现。
缓冲器44b、分析器48b、次变换45b、以及格式化器46b在下部信号路径中执行类似于以上对于上部信号路径中相应组件所讨论的处理。
f)编码
在典型的系统中,编码器5产生以某种编码形式表示混合变换系数的编码的信息。如果使用感知编码处理,混合变换系数将被编码成减小感知不相关性的形式。感知编码处理通常使得频谱信息丢失,这不能够通过接收机恢复或重建。这种丢失的概率在以下通过符号表示,它表示对混合变换产生的混合变换系数的可能修改。对于本发明而言使用这种编码处理并不是关键。
2.合成滤波器组
参考图5,去格式化器51a和51b根据分别从路径26a和26b接收的数据获得混合变换系数和块长度信息。该块长度信息沿路径59a和59b传送,以及混合变换系数被传送到逆次变换52a和52b。为了清楚例示,在图5中只示出了两个信号处理路径。在典型系统中使用的合成滤波器组27的实现可具有成百上千的路径。
去格式化器51b、逆次变换52b、缓冲器53b在下部信号路径中执行类似于以下对于上部信号路径中相应组件所讨论的处理。
a)去格式化器
参考图5所示的上部信号路径,去格式化器51a是可用于根据从去格式化器23和解码器25接收的数据分解多组混合变换系数和块长度信息的可选组件。这允许在对接收机剩余部分的改变最小的情况下将合成滤波器组27的混合变换实现包含在图2所示的现有接收机中。
b)逆次变换
逆次变换52a将一组混合变换系数变换成频谱系数块,该频谱系数表示对于源信号分段序列的特定频率的频谱内容。该频谱系数块存储在缓冲器53a中。响应于从路径59a接收的块长度信息而适配变换的长度。在优选实现中,类型-II IDCT被应用于不相互重叠的频谱系数块。这种变换可以如下表示:
C ^ ( k , m ) = 2 M &CenterDot; &Sigma; j = 0 M - 1 R j &CenterDot; X ^ ( k , j ) cos [ j ( 2 m + 1 ) &pi; 2 M ] , 0≤m<M  (8)
其中,
该逆次变换可以直接根据表达式8实现或者它可以通过在计算上效率更高的已知处理实现。
c)逆主变换
缓冲器53a和53b存储频谱系数并将这些频谱系数传送到逆主变换54,以使得该逆主变换接收多组表示相应源信号分段的频谱内容的频谱系数。通过应用逆变换于该多组频谱系数而产生信号采样的分段并存储在缓冲器55中。响应于从路径22接收的分段长度信息而适配逆主变换的长度。在优选实现中使用O-TDAC IMDCT。
在典型的应用中,在发送机中丢弃一半的MDCT系数。该丢弃的系数可以通过接收机使用以下表达式进行恢复:
C ^ ( k ) = - C ^ ( N - k ) , N/2≤k<N    (9)
O-TDAC IMDCT可以如下表示:
x ^ ( n + m &CenterDot; N 2 ) = 1 N &Sigma; k = 0 N - 1 C ^ ( k , m ) &CenterDot; cos [ 2 &pi; ( k + 1 2 ) ( n + N 4 + 1 2 ) N ] , 0≤n<N  (10)
其中,
所述逆主变换可以直接根据表达式10实现或者它可以通过在计算上效率更高的已知处理诸如使用在美国专利5394473中描述的FFT的那些处理实现。
d)合成窗口函数
窗口56通过利用合成窗口函数来加权缓冲器55中存储的信号采样分段并将加权的采样添加到在重叠部分中相互重叠的分段中,产生沿路径29的输出信号。所述逆主变换、合成窗口函数以及重叠添加处理消除了由正向变换产生的时域混叠赝象的至少相当大部分。消除可能不精确,这是因为由编码处理以及在计算主和次变换中有限的算术精度所导致的对变换系数的修改。响应于从路径22接收的分段长度信息,适配用于每个分段的合成窗口函数的长度和形状。在优选实现中使用等于以上在表达式4中示出的分析窗口函数WA的KBD窗口函数。
可以响应于分段长度信息使用诸如以上描述的处理来适配合成窗口函数以及逆主变换。
C.实现
前面的公开仅仅阐述了几种实现。可以使用各种各样的变换和变换类型。可以以各种各样的方式来应用和实现本发明的原理。
包含本发明各个方面的设备可以以各种方式实现,其中包括计算机或其他设备执行的软件,这些设备包括更专用组件诸如耦合至类似于通用计算机中的那些组件的数字信号处理器(DSP)电路。图3是可用于实现本发明各个方面的设备70的示意方框图。DSP 72提供计算资源。RAM 73是DSP 72使用的用来进行信号处理的系统随机存取存储器(RAM)。ROM 74表示某种形式的永久性存储器诸如只读存储器(ROM),用于存储操作设备70以及执行本发明各个方面所需的程序。I/O控制器75表示通过通信信道76、77接收和发送信号的接口电路。模数转换器和数模转换器可以根据接收和/或发送模拟信号的需要包括在I/O控制器75中。在所示的实施例中,所有主要的系统组件连接到总线71,该总线可以表示不止一条物理总线;但是,不需要总线体系结构实现本发明。
在以通用计算机系统实现的实施例中,可以包括附加的组件用于对接设备诸如键盘或鼠标以及显示器,以及用于控制具有存储媒体诸如磁带或磁盘、或光学媒体的存储设备。该存储媒体可用来记录用于操作系统的指令的程序、实用程序和应用程序,并且可以包括实现本发明各个方面的程序的实施例。
通过以各种各样方式实现的组件,包括离散的逻辑组件、集成电路、一个或更多ASIC和/或程序控制的处理器,能够执行实践本发明各个方面所需的功能。实现这些组件的方式对于本发明来说并不重要。
本发明的软件实现可以通过各种各样的机器可读媒体诸如包括从超声到紫外线频率的整个频谱中的基带或调制通信路径、或使用基本上任何记录技术传送信息的存储媒体包括磁带、卡或磁盘、光卡或光盘、以及在象纸这样的媒体上的可检测标记进行传送。

Claims (18)

1.一种产生输出信号的方法,包括:
接收具有频谱内容的源信号的采样;
应用主变换于所述采样的重叠分段以产生多组频谱系数,其中每组频谱系数具有时域混叠赝象并表示对于一组频率的相应源信号分段的频谱内容;
根据所述多组频谱系数获得表示该组频率中的相同频率的多个频谱系数,并将所述多个频谱系数组合成一个或更多频谱系数块,其中响应于块长度控制信号而适配在所述一个或更多块中每个块中组合的频谱系数的数量;
应用次变换于所述一个或更多频谱系数块以产生一组或更多组混合变换系数,其中响应于块长度控制信号而适配应用于所述一个或更多频谱系数块中每个块的次变换的长度;以及
将表示所述一组或更多组混合变换系数的信息以及块长度控制信号组合到输出信号中。
2.根据权利要求1所述的方法,其中所述主变换是修改离散余弦变换,而所述次变换是应用于不相互重叠的频谱系数块的离散余弦变换。
3.根据权利要求1所述的方法,包括:
产生在多组频谱分量内频谱分量幅度的相似性的度量;和
响应于该相似性的度量产生所述块长度控制信号。
4.根据权利要求1到3中任何一项所述的方法,包括:
分析源信号的采样以产生分段长度控制信号;和
应用分析窗口函数于源信号的采样的分段,其中响应于所述分段长度控制信号而适配该分析窗口函数的形状或长度。
5.根据权利要求4所述的方法,其中所述主变换具有一组基本函数,并且该方法包括响应于分段长度控制信号而适配该组基本函数。
6.一种产生输出信号的方法,包括:
接收表示源信号的频谱内容的输入信号;
从该输入信号获得一组或更多组混合变换系数和块长度控制信号;
应用逆次变换于该一组或更多组混合变换系数以产生一个或更多频谱系数块,该频谱系数表示对于在一组频率中相同频率的源信号的频谱内容,其中响应于所述块长度控制信号而适配应用于该组混合变换系数的逆次变换的长度;
将所述频谱系数组合成多组频谱系数,其中每组频谱系数具有时域混叠赝象并表示对于该组频率中所有频率的源信号的分段的频谱内容;以及
应用逆主变换于该多组频谱系数以产生对应于源信号的分段的输出信号分段,其中逆主变换基本上消除所述时域混叠赝象。
7.根据权利要求6所述的方法,其中所述逆主变换是逆修改离散余弦变换,而所述逆次变换是应用于表示不相互重叠的频谱系数块的多组混合变换系数的逆离散余弦变换。
8.根据权利要求6或7所述的方法,包括:
从所述输入信号获得分段长度控制信号;和
应用合成窗口函数于输出信号分段,其中响应于分段长度控制信号而适配该合成窗口函数的形状或长度。
9.根据权利要求8所述的方法,其中所述逆主变换具有一组基本函数,以及该方法包括响应于所述分段长度控制信号而适配该组基本函数。
10.一种用于产生输出信号的设备,包括:
(a)输入端;
(b)输出端;和
(c)耦合至输入端和输出端的信号处理电路,其中该信号处理电路适于:
从输入端接收具有频谱内容的源信号的采样;
应用主变换于所述采样的重叠分段以产生多组频谱系数,其中每组频谱系数具有时域混叠赝象并表示对于一组频率的相应源信号分段的频谱内容;
根据所述多组频谱系数获得表示该组频率中的相同频率的多个频谱系数,并将所述多个频谱系数组合成一个或更多频谱系数块,其中响应于块长度控制信号而适配在所述一个或更多块中每个块中组合的频谱系数的数量;
应用次变换于所述一个或更多频谱系数块以产生一组或更多组混合变换系数,其中响应于块长度控制信号而适配应用于所述一个或更多频谱系数块中每个块的次变换的长度;以及
将表示所述一组或更多组混合变换系数的信息以及块长度控制信号组合到被发送到输出端的输出信号中。
11.根据权利要求10所述的设备,其中所述主变换是修改离散余弦变换,而所述次变换是应用于不相互重叠的频谱系数块的离散余弦变换。
12.根据权利要求10所述的设备,其中所述信号处理电路适于:
产生在多组频谱分量内频谱分量幅度的相似性的度量;和
响应于该相似性的度量产生所述块长度控制信号。
13.根据权利要求10到12中任何一项所述的设备,其中所述信号处理电路适于:
分析源信号的采样以产生分段长度控制信号;和
应用分析窗口函数于源信号的采样的分段,其中响应于所述分段长度控制信号而适配该分析窗口函数的形状或长度。
14.根据权利要求13所述的设备,其中所述主变换具有一组基本函数,并且该信号处理电路响应于分段长度控制信号而适配该组基本函数。
15.一种用于产生输出信号的设备,包括:
(a)输入端;
(b)输出端;和
(c)耦合至输入端和输出端的信号处理电路,其中该信号处理电路适于:
从所述输入端接收表示源信号的频谱内容的输入信号;
从该输入信号获得一组或更多组混合变换系数和块长度控制信号;
应用逆次变换于该一组或更多组混合变换系数以产生一个或更多频谱系数块,该频谱系数表示对于在一组频率中相同频率的源信号的频谱内容,其中响应于所述块长度控制信号而适配应用于该组混合变换系数的逆次变换的长度;
将所述频谱系数组合成多组频谱系数,其中每组频谱系数具有时域混叠赝象并表示对于该组频率中所有频率的源信号的分段的频谱内容;以及
应用逆主变换于该多组频谱系数以产生对应于源信号的分段的输出信号分段,其中,逆主变换基本上消除所述时域混叠赝象并且输出信号分段被发送到输出端。
16.根据权利要求15所述的设备,其中所述逆主变换是逆修改离散余弦变换,而所述逆次变换是应用于表示不相互重叠的频谱系数块的多组混合变换系数的逆离散余弦变换。
17.根据权利要求15或16所述的设备,其中所述信号处理电路适于:
从所述输入信号获得分段长度控制信号;和
应用合成窗口函数于输出信号分段,其中响应于分段长度控制信号而适配该合成窗口函数的形状或长度。
18.根据权利要求17所述的设备,其中所述逆主变换具有一组基本函数,以及所述信号处理电路响应于所述分段长度控制信号而适配该组基本函数。
CN2005800053012A 2004-02-19 2005-01-21 用于信号分析和合成的自适应混合变换 Active CN1926609B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/783,951 2004-02-19
US10/783,951 US7516064B2 (en) 2004-02-19 2004-02-19 Adaptive hybrid transform for signal analysis and synthesis
PCT/US2005/001923 WO2005083682A1 (en) 2004-02-19 2005-01-21 Adaptive hybrid transform for signal analysis and synthesis

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2010101660941A Division CN101826071B (zh) 2004-02-19 2005-01-21 用于信号分析和合成的自适应混合变换

Publications (2)

Publication Number Publication Date
CN1926609A CN1926609A (zh) 2007-03-07
CN1926609B true CN1926609B (zh) 2010-05-26

Family

ID=34861377

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2005800053012A Active CN1926609B (zh) 2004-02-19 2005-01-21 用于信号分析和合成的自适应混合变换
CN2010101660941A Active CN101826071B (zh) 2004-02-19 2005-01-21 用于信号分析和合成的自适应混合变换

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN2010101660941A Active CN101826071B (zh) 2004-02-19 2005-01-21 用于信号分析和合成的自适应混合变换

Country Status (22)

Country Link
US (1) US7516064B2 (zh)
EP (3) EP2088583B1 (zh)
JP (1) JP4689625B2 (zh)
KR (1) KR101273486B1 (zh)
CN (2) CN1926609B (zh)
AT (1) ATE526660T1 (zh)
AU (2) AU2005217943B2 (zh)
BR (1) BRPI0507806B1 (zh)
CA (4) CA2860180C (zh)
CY (1) CY1122444T1 (zh)
DE (1) DE602005015427D1 (zh)
DK (1) DK1723638T3 (zh)
ES (1) ES2329384T3 (zh)
HK (2) HK1092925A1 (zh)
IL (1) IL177093A (zh)
LT (1) LT2293293T (zh)
MY (2) MY143979A (zh)
PL (1) PL1723638T3 (zh)
PT (1) PT1723638E (zh)
SI (1) SI2088583T1 (zh)
TW (2) TWI369852B (zh)
WO (1) WO2005083682A1 (zh)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050229769A1 (en) * 2004-04-05 2005-10-20 Nathaniel Resnikoff System and method for assigning visual markers to the output of a filter bank
KR101037931B1 (ko) * 2004-05-13 2011-05-30 삼성전자주식회사 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
US8744862B2 (en) 2006-08-18 2014-06-03 Digital Rise Technology Co., Ltd. Window selection based on transient detection and location to provide variable time resolution in processing frame-based data
US7895034B2 (en) * 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
CA2672165C (en) * 2006-12-12 2014-07-29 Ralf Geiger Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
US8214200B2 (en) * 2007-03-14 2012-07-03 Xfrm, Inc. Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
EP3288028B1 (en) * 2007-08-27 2019-07-03 Telefonaktiebolaget LM Ericsson (publ) Low-complexity spectral analysis/synthesis using selectable time resolution
US20090099844A1 (en) * 2007-10-16 2009-04-16 Qualcomm Incorporated Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders
ES2683077T3 (es) 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
EP2146344B1 (en) * 2008-07-17 2016-07-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding/decoding scheme having a switchable bypass
US9384748B2 (en) 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
CA2763793C (en) 2009-06-23 2017-05-09 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
JP5547810B2 (ja) 2009-07-27 2014-07-16 インダストリー−アカデミック コーペレイション ファウンデイション, ヨンセイ ユニバーシティ オーディオ信号を処理する方法及び装置
CN102667921B (zh) * 2009-10-20 2014-09-10 弗兰霍菲尔运输应用研究公司 音频编码器、音频解码器、用于将音频信息编码的方法、用于将音频信息解码的方法
EP2510515B1 (en) 2009-12-07 2014-03-19 Dolby Laboratories Licensing Corporation Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation
RU2628162C2 (ru) 2010-01-12 2017-08-15 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф., Аудио кодер, аудио декодер, способ кодирования и декодирования аудио информации и компьютерная программа, определяющая значение поддиапазона контекста на основе нормы ранее декодированных спектральных значений
ES2706061T3 (es) 2010-01-13 2019-03-27 Voiceage Corp Decodificación de audio con cancelación directa de distorsión por repliegue espectral en el dominio del tiempo usando filtrado predictivo lineal
TWI557723B (zh) 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
CA2804548C (en) 2010-07-08 2016-06-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Coder using forward aliasing cancellation
TWI480860B (zh) 2011-03-18 2015-04-11 Fraunhofer Ges Forschung 音訊編碼中之訊框元件長度傳輸技術
US9171549B2 (en) 2011-04-08 2015-10-27 Dolby Laboratories Licensing Corporation Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams
FR2977969A1 (fr) * 2011-07-12 2013-01-18 France Telecom Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
WO2013022426A1 (en) * 2011-08-08 2013-02-14 Hewlett-Packard Development Company, L.P. Method and system for compression of a real-time surveillance signal
US8527264B2 (en) 2012-01-09 2013-09-03 Dolby Laboratories Licensing Corporation Method and system for encoding audio data with adaptive low frequency compensation
JP6126006B2 (ja) * 2012-05-11 2017-05-10 パナソニック株式会社 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法
US9584804B2 (en) * 2012-07-10 2017-02-28 Qualcomm Incorporated Coding SEI NAL units for video coding
CN103714821A (zh) 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
EP2830058A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
US9349196B2 (en) 2013-08-09 2016-05-24 Red Hat, Inc. Merging and splitting data blocks
DE102014101307A1 (de) 2014-02-03 2015-08-06 Osram Opto Semiconductors Gmbh Kodierverfahren zur Datenkompression von Leistungsspektren eines optoelektronischen Bauteils und Dekodierverfahren
US10504530B2 (en) 2015-11-03 2019-12-10 Dolby Laboratories Licensing Corporation Switching between transforms
EP3276620A1 (en) * 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
KR102632136B1 (ko) * 2017-04-28 2024-01-31 디티에스, 인코포레이티드 오디오 코더 윈도우 사이즈 및 시간-주파수 변환
EP3644313A1 (en) 2018-10-26 2020-04-29 Fraunhofer Gesellschaft zur Förderung der Angewand Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5394473A (en) * 1990-04-12 1995-02-28 Dolby Laboratories Licensing Corporation Adaptive-block-length, adaptive-transforn, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
DE3902948A1 (de) * 1989-02-01 1990-08-09 Telefunken Fernseh & Rundfunk Verfahren zur uebertragung eines signals
US5107345A (en) * 1990-02-27 1992-04-21 Qualcomm Incorporated Adaptive block size image compression method and system
CA2090052C (en) * 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
JPH1175157A (ja) * 1997-08-29 1999-03-16 Sony Corp 映像信号及び音声信号の記録装置
US6430529B1 (en) * 1999-02-26 2002-08-06 Sony Corporation System and method for efficient time-domain aliasing cancellation
US6246345B1 (en) * 1999-04-16 2001-06-12 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
JP3762579B2 (ja) * 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US6678647B1 (en) * 2000-06-02 2004-01-13 Agere Systems Inc. Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution
JP2002118517A (ja) * 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
JP2002091500A (ja) * 2000-09-19 2002-03-27 Sharp Corp デジタルデータ符号化方法
JP3894722B2 (ja) * 2000-10-27 2007-03-22 松下電器産業株式会社 ステレオオーディオ信号高能率符号化装置
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
JP3725876B2 (ja) * 2002-03-27 2005-12-14 株式会社東芝 オーディオ符号化器とその符号化処理プログラム
JP2003345779A (ja) * 2003-03-26 2003-12-05 Seiko Epson Corp フィルタリング処理方法およびフィルタリング処理装置
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5394473A (en) * 1990-04-12 1995-02-28 Dolby Laboratories Licensing Corporation Adaptive-block-length, adaptive-transforn, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio

Also Published As

Publication number Publication date
MY146425A (en) 2012-08-15
EP2088583A2 (en) 2009-08-12
DK1723638T3 (da) 2009-09-07
PT1723638E (pt) 2009-09-24
JP2007526691A (ja) 2007-09-13
ES2329384T3 (es) 2009-11-25
ATE526660T1 (de) 2011-10-15
CA2924281A1 (en) 2005-09-09
EP2293293A1 (en) 2011-03-09
CN1926609A (zh) 2007-03-07
CN101826071A (zh) 2010-09-08
TWI369852B (en) 2012-08-01
CA2924281C (en) 2017-11-07
BRPI0507806B1 (pt) 2019-06-25
SI2088583T1 (sl) 2012-07-31
EP2088583A3 (en) 2009-08-19
CY1122444T1 (el) 2021-01-27
CN101826071B (zh) 2011-09-14
TW200529548A (en) 2005-09-01
JP4689625B2 (ja) 2011-05-25
EP2088583B1 (en) 2011-09-28
WO2005083682A1 (en) 2005-09-09
LT2293293T (lt) 2020-01-10
BRPI0507806A (pt) 2007-07-10
CA2880055A1 (en) 2005-09-09
KR20070001123A (ko) 2007-01-03
CA2860180A1 (en) 2005-09-09
TW201214949A (en) 2012-04-01
HK1092925A1 (en) 2007-02-16
AU2010203126B2 (en) 2012-12-13
AU2005217943B2 (en) 2010-05-13
HK1130358A1 (en) 2009-12-24
CA2880055C (en) 2016-05-31
TWI463790B (zh) 2014-12-01
US20050185850A1 (en) 2005-08-25
DE602005015427D1 (en) 2009-08-27
IL177093A0 (en) 2006-12-10
CA2860180C (en) 2015-08-11
PL1723638T3 (pl) 2009-11-30
US7516064B2 (en) 2009-04-07
EP1723638B1 (en) 2009-07-15
MY143979A (en) 2011-07-29
AU2010203126A1 (en) 2010-08-12
CA2554381C (en) 2014-11-04
AU2005217943A1 (en) 2005-09-09
EP1723638A1 (en) 2006-11-22
IL177093A (en) 2010-12-30
KR101273486B1 (ko) 2013-06-14
EP2293293B1 (en) 2019-11-27
CA2554381A1 (en) 2005-09-09

Similar Documents

Publication Publication Date Title
CN1926609B (zh) 用于信号分析和合成的自适应混合变换
USRE48271E1 (en) Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
US20220157326A1 (en) Method of generating residual signal, and encoder and decoder performing the method
CN116018640A (zh) 对过渡段编码失真具有鲁棒性的音频编码/解码设备和方法
AU2012247062B2 (en) Adaptive Hybrid Transform for Signal Analysis and Synthesis
MXPA06009424A (es) Transformada hibrida adaptiva para analisis y sintesis de señal
US10410644B2 (en) Reduced complexity transform for a low-frequency-effects channel
AU2012238001A1 (en) Reduced complexity transform for a low-frequency-effects channel

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Assignee: Guangzhou Panyu Juda Car Audio Equipment Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2010990000986

Denomination of invention: Adaptive hybrid transform for signal analysis and synthesis

Granted publication date: 20100526

License type: Common License

Open date: 20070307

Record date: 20101216

EE01 Entry into force of recordation of patent licensing contract

Assignee: Zhejiang BeresonTechnology Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2011990000044

Denomination of invention: Adaptive hybrid transform for signal analysis and synthesis

Granted publication date: 20100526

License type: Common License

Open date: 20070307

Record date: 20110117

EE01 Entry into force of recordation of patent licensing contract

Assignee: Guangzhou Panyu Juda Car Audio Equipment Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2011990000899

Denomination of invention: Adaptive hybrid transform for signal analysis and synthesis

Granted publication date: 20100526

License type: Common License

Open date: 20070307

Record date: 20110915

EE01 Entry into force of recordation of patent licensing contract

Assignee: Desai Video-Audio Science & Technology Co., Ltd., Huizhou City

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2011990000968

Denomination of invention: Adaptive hybrid transform for signal analysis and synthesis

Granted publication date: 20100526

License type: Common License

Open date: 20070307

Record date: 20111012

EE01 Entry into force of recordation of patent licensing contract

Assignee: Guangdong OPPO Mobile Communications Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2012990000215

Denomination of invention: Adaptive hybrid transform for signal analysis and synthesis

Granted publication date: 20100526

License type: Common License

Open date: 20070307

Record date: 20120411

EE01 Entry into force of recordation of patent licensing contract

Assignee: Qingdao Haier Electric Appliance Co., Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2012990000481

Denomination of invention: Adaptive hybrid transform for signal analysis and synthesis

Granted publication date: 20100526

License type: Common License

Open date: 20070307

Record date: 20120706

EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20070307

Assignee: Lenovo Mobile Communication Technology Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2012990000858

Denomination of invention: Adaptive hybrid transform for signal analysis and synthesis

Granted publication date: 20100526

License type: Common License

Record date: 20121129

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20070307

Assignee: Lenovo (Beijing) Co., Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2013990000005

Denomination of invention: Adaptive hybrid transform for signal analysis and synthesis

Granted publication date: 20100526

License type: Common License

Record date: 20130106

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20070307

Assignee: Beijing millet Communication Technology Co., Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2013990000048

Denomination of invention: Adaptive hybrid transform for signal analysis and synthesis

Granted publication date: 20100526

License type: Common License

Record date: 20130206

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20070307

Assignee: Shenzhen Maxmade Technology Co.,Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2013990000353

Denomination of invention: Adaptive hybrid transform for signal analysis and synthesis

Granted publication date: 20100526

License type: Common License

Record date: 20130627

Application publication date: 20070307

Assignee: Beijing Chaoge Digital Technology Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2013990000354

Denomination of invention: Adaptive hybrid transform for signal analysis and synthesis

Granted publication date: 20100526

License type: Common License

Record date: 20130627

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model