CN101501761B - 无需边信息对时域噪声包络的任意整形 - Google Patents

无需边信息对时域噪声包络的任意整形 Download PDF

Info

Publication number
CN101501761B
CN101501761B CN200780030179.3A CN200780030179A CN101501761B CN 101501761 B CN101501761 B CN 101501761B CN 200780030179 A CN200780030179 A CN 200780030179A CN 101501761 B CN101501761 B CN 101501761B
Authority
CN
China
Prior art keywords
frequency domain
signal
tolerance
frequency
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200780030179.3A
Other languages
English (en)
Other versions
CN101501761A (zh
Inventor
M·S·温顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN101501761A publication Critical patent/CN101501761A/zh
Application granted granted Critical
Publication of CN101501761B publication Critical patent/CN101501761B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Transducers For Ultrasonic Waves (AREA)
  • Burglar Alarm Systems (AREA)

Abstract

首先在谱域编译码系统中无需边信息提供了对噪声的时间包络的任意整形。在编码时,滤波后的量化误差度量作为反馈信号被应用于量化前的离散时域信号的频域表示,使得所述滤波的滤波参数影响在量化后的离散时域信号的频域表示在解码时从频域被逆变换回时域时在其时域中的量化噪声的整形。这可以对于多个频点或多个频点组中的每一个完成。另一方面,提供了在数字音频编码中的频域噪声反馈量化。

Description

无需边信息对时域噪声包络的任意整形
技术领域
本发明涉及数字音频编译码。具体地,本发明的各方面涉及一种数字音频编码方法;一种被配置为对通过所述数字音频编码方法生成的比特流进行解码的数字音频解码器;一种数字音频解码方法;一种在数字音频编码器中进行频域噪声反馈量化的方法,用于执行任何上述方法的装置;在计算机可读介质上存储的、使计算机控制这样的装置或执行这样的方法的计算机程序;以及一种在数字音频编码器中使用的频域噪声反馈量化器。
背景技术
在谱域音频编译码系统中在时间和频率之间的折衷已经导致几种在确保高音频编译码性能的同时最小化听得到的编译码错误的技术。这样的技术包括块交换(block switching)和时间噪声整形(TNS)(见下面的参考文献1),两者在MPEG-2/4AAC(“AAC”)(见下面的参考文献2)中都被采用。时间噪声整形(“TNS”)提供一种使用相对长的变换块长度,同时确保噪声的时间包络被控制为使听觉伪像最小化的方式。
在图1中示出使用TNS的现有技术谱域编译码系统(编码器和解码器)的简化框图。在编码器部分中,“时频变换”装置或功能2将进来的、以采样频率fs从音频源采样的、用离散时间序列x[n]表示的时域音频信号转换到谱域(或“频”域);在AAC的情况下,使用2048个样本的修正离散余弦变换(MDCT)(见下面的参考文献3)。在量化器或量化功能(“Q”)4中量化之前,编码器将滤波器或滤波功能6(“A(z)”)应用于谱域信号,滤波器或滤波功能6的转移函数在Z域中被表示为A(z)。编码器将滤波参数发送到解码器作为边信息(sideinformation)。编译码器的解码器部分对比特流进行解码并且将在Z域中转移函数被表示为1/A(z)的逆滤波器或逆滤波功能8(“1/A(z)”)应用于频谱。“频时变换”10装置或功能(时频变换2的逆变换)将谱域信号转换为离散时域信号y(n)。为了简化,图1忽略量化噪声的感知分配(perceptual allocation)以及其它已知的AAC和TNS细节。
使用TNS的量化器4的总谱域输出可以在Z变换域中用方程1的形式表示。这种分析以及下面的其它分析都是基于量化的简单加性模型。
Y ( z ) = A ( z ) X ( z ) A ( z ) + E ( z ) A ( z ) - - - ( 1 )
其中E(z)是量化误差,A(z)是TNS滤波器的转移函数。
方程1可以被简化为方程2。
Y ( z ) = X ( z ) + E ( z ) A ( z ) - - - ( 2 )
方程2示出Z域中的卷积处理(乘以1/A(z))被应用于在音频频谱的量化中被添加的噪声。因为谱域中的卷积相当于时域中的乘法,所以1/A(z)与噪声卷积的结果意味着已经将逆TNS滤波器的时域响应乘以噪声的时间形状。因此,通过适当地选择滤波器A(z),可以控制量化噪声以最小化因低时域分辨率产生的听觉伪像。已经显示TNS显著改善了AAC的性能,因此其在AAC中是非常重要的工具。
然而,TNS具有一些局限性。即,编码器必须将滤波参数传输给解码器,并且解码器必须用逆滤波器卷积解码的频谱。这些要求导致下面的限制:
1、为了传输滤波系数而增加比特率消耗;
2、需要将逆滤波器应用于频谱意味着TNS无法为现有系统例如AC-3提供后向兼容(见下面的参考文献4);
3、由于需要将逆滤波器应用于频谱而引起解码器复杂性增加。
根据本发明的多个方面,一种基于噪声反馈量化(NFQ)的新技术允许在谱域编译码系统中的量化噪声的时间包络被修改,同时克服了MPEG-2/4AAC中使用的TNS编译码工具的局限。根据本发明的多个方面,在AAC系统中不采用TNS,而采用NFQ。根据本发明的多个方面,在诸如AC-3系统的其它谱域编译码系统中也可以采用NFQ。
附图说明
图1是使用时间噪声整形(TNS)的现有技术谱域编译码系统(编码器和解码器)的简化框图。
图2是示出现有技术的现代音频编译码系统的简化示意框图,在该系统中输入被转换到谱域,并且信号的频谱表示被量化。
图3是根据本发明的多个方面采用噪声反馈量化(NFQ)的简化音频编译码系统的一个例子的功能性示意框图。
图4是本发明实施例的应用结果的一个例子,其中噪声反馈滤波器被设计用于特定变换块的音频内容以使分段信噪比近似为恒量。
图5示出没有NFQ的简单谱域编译码器(虚线)和采用示例性的10阶NFQ系统(实线)的分段SNR,其输入信号如图4所示。
图6示出现有技术的MPEG-2/4AAC编码器的简化示意框图。
图7是根据本发明的多个方面采用噪声反馈量化的简化AAC音频编译码系统的一个例子的功能性示意框图。
发明内容
根据本发明的一个方面,提供一种用于对离散时域信号进行编码的数字音频编码方法,该方法采用离散时域信号的频域表示的量化。该方法导出量化误差的度量,对该量化误差的度量进行滤波以产生滤波后的量化误差度量,以及将该滤波后的量化误差度量作为反馈信号应用于量化前的离散时域信号的频域表示,从而所述滤波的滤波参数影响在量化后的离散时域信号的频域表示从频域被逆变换回时域时在其时域中的量化噪声的整形。
数字音频编码方法可以针对一个或多个频点或频点组中的每一个,对量化误差的度量进行滤波以产生滤波后的量化误差度量,使得滤波后的量化误差度量在离散时域信号的频域表示的多段频谱上可变。滤波参数可以是动态可控的。这样的可控性可以响应于离散时域信号的度量或者离散时域信号的频域表示的度量。滤波参数也可以响应于时间掩蔽模型(附图中未示出)。接着,离散时域信号的量化后的频域表示可以被编码以产生编码的比特流。
根据本发明的另一方面,提供一种被配置为对用上述编码方法产生的比特流进行解码的数字音频解码器。
根据本发明的另一方面,提供一种对编码器产生的熵编码的比特流进行解码的数字音频解码方法,所述编码器量化离散时域信号的频域表示,导出量化噪声的度量,对该量化误差的度量进行滤波以产生滤波后的量化误差度量,将该滤波后的量化误差度量作为反馈信号应用于量化前的离散时域信号的频域表示,以及将量化后的离散时域信号的频域表示编码为比特流。该解码方法对所述比特流进行解码以产生离散时域信号的量化后的频域表示或其近似,对量化后的频域表示或其近似进行反量化,以及将该频域表示或其近似逆变换到时域以产生音频信号,从而在所述编码器中的滤波参数影响所述音频信号的量化噪声的整形。
根据本发明的另一方面,提供一种在数字音频编码器中的频域噪声反馈量化方法。该方法将从时域音频信号中导出的频域信号和噪声反馈信号合并以产生量化器输入信号,对该量化器输入信号进行量化以产生量化器输出信号,将量化器输入信号和量化器输出信号合并以产生量化误差信号,以及对该量化误差信号进行滤波以产生噪声反馈信号。
根据本发明的另一方面,提供被配置为执行在数字音频编码器中的频域噪声反馈量化方法的装置。
根据本发明的另一方面,提供一种存储在计算机可读介质上、用于使计算机控制上述装置或方法的计算机程序。
根据本发明的另一方面,提供一种在数字音频编码器中使用的频域噪声反馈量化器。该频域噪声反馈量化器包括:第一合并器,将从时域音频信号导出的频域信号和噪声反馈信号合并以产生量化器输入信号;量化器,对该量化器输入信号进行量化以产生量化器输出信号;第二合并器,将量化器输入信号和量化器输出信号合并以产生量化误差信号;以及噪声反馈滤波器,对该量化误差信号进行滤波以产生噪声反馈信号。
谱音频编译码系统中量化噪声的时域整形对于有效的音频压缩很重要。在MPEG-2/4 AAC中的TNS编译码工具提供量化噪声的时域整形;然而,由于需要将滤波系数传输给解码器而受到限制。根据本发明的多个方面,谱量化处理或设备包括反馈电路或处理,允许量化噪声的时间形状被控制为具有多种任意形状。另外,在编码器/解码器编译码系统中,不需要将滤波系数传输给解码器。本发明可以提供以下相对于MPEG-2/4 AAC TNS编译码工具的一项或多项优势,并且可以用来取代TNS:
1、与TNS相当的噪声整形性能
2、仅编码器的处理
3、不需要边信息传输
4、与现有音频编译码系统的反向兼容性
5、降低的解码器复杂性
本发明的另一优势是可以在整个频谱上改变反馈滤波器,从而噪声的时域演变可以更好地与谱群的信号特性匹配。换句话说,对于一个或多个频点或频点组中的每一个可以采用唯一的反馈滤波器,其中一个频点构成一个谱群。虽然TNS也可以提供这样的能力,但需要将滤波系数传输给解码器并且需要告知解码器想要的谱群,这限制了可以使用的频谱区域的数量。
具体实施方式
谱域噪声反馈量化(NFQ)
为了以感知相关的方式控制由量化引入的噪声,包括AAC(见下面的参考文献2)和AC-3(见下面的参考文献4)在内的最新的音频编译码技术在谱域中执行量化。典型地,使用诸如MDCT的时频变换将输入时间波形转换到谱域。与时频变换并行地计算感知模型,接着将其用于控制在时频变换的每个输出系数中出现的量化噪声。图2是示出现有技术的现代音频编译码系统(编码器和解码器)的简化示意框图,在该音频编译码系统中,输入被转换到谱域,接着信号的频谱表示被量化。将离散的时域信号x(n)应用于时频变换或变换功能(“时频变换”)12,产生频域(或谱域)信号X(k)。由量化器或量化功能(“Q”)14量化谱域信号以产生谱域信号的量化形式Y(k)。系统的解码器部分包括逆变换或逆变换功能(“频时变换”)1,其提供时域输出信号6。
典型地,为了确保良好的编译码效率,在现代音频编译码系统中使用的变换的长度为512个样本或更大;例如MPEG-2/4 AAC对于伪稳态信号采用2048点MDCT。尽管该变换提供良好的编译码效率,但长的变换长度导致量化噪声的时间扩展(量化噪声遍布变换块)以及非稳态信号的听觉恶化。已经设计诸如块交换、TNS以及增益控制的技术来应对这个问题。
根据本发明的多个方面,谱域中的噪声反馈量化(NFQ)被用来在谱域中控制量化处理期间引入的量化噪声的时间包络。图3是根据本发明的多个方面采用NFQ的简化音频编译码系统的一个例子的功能性示意框图。利用NFQ量化器或量化功能18来量化时频变换处理或装置(“时频变换”)12的输出(X(k)),NFQ量化器或量化功能18包括反馈处理或电路,该反馈处理或电路将滤波后的量化误差应用于原始变换信号。在这样的装置或处理中量化器或量化功能(“Q”)20的输出(Y(k))可以用方程3来表示。
Y ( k ) = X ( k ) + E ( k ) - Σ m = 1 M F ( m ) E ( k - m ) - - - ( 3 )
其中E(k)是量化误差,F(m)是反馈滤波器的系数,X(k)是时频变换12的频域输出,k是谱频点标号,m是滤波器抽头标号。
替代地,可以使用Z变换表示来重写方程3给出方程4:
Y(z)=X(z)+(1-z-1F(z))E(z)        (4)
因为谱域中的卷积相当于时域中的乘法,所以如图4所示,用(1-z-1F(z))卷积E(z)的结果是用NFQ反馈和量化器方案(1-z-1F(z))的对应时间等效形式乘以时间误差信号。这暗示着通过适当选择F(z),量化误差的时间包络可以被任意地修改。因此,尽管下面描述了生成有用的滤波器转移函数的两种方式,但是应该理解,本发明包含被编译码系统设计者认为对修改量化误差的时间包络有用的、导出滤波器转移函数的任何其它方式。
在参考文献5中示出F(z)必须采用方程5所示的形式。另外,参考文献5提供了一种最优求解具有方程5中给定的约束的F(z)的技术,如方程6所示。
F ( z ) = Σ m = 0 M a m z - m - - - ( 5 )
给定a0=1,
F=R-1r            (6)
其中
Figure G2007800301793D00072
r=[r(1)r(2)…r(M)]T,r(m)是可以用多种方式生成的、期望的时间噪声加权的自相关序列。一种方式是计算时间信号的包络,对其求反并计算该结果的逆DFT(离散傅立叶变换),如方程7所示。这种方法确保由于带反馈的谱域量化而产生的噪声特性导致变换块内所有样本上近似相等的分段信噪比(对少量样本计算出的信噪比)。这如下所示。
E ′ ( n ) = 1 E ( n )                        (7)
r ( m ) = 1 N Σ n = 0 N - 1 E ′ ( n ) e j 2 πnm N
其中E(n)是时间信号的包络且仅具有正值,N是变换块的长度。
替代地,另一种获得F(z)的期望解的方式是采用TNS滤波器的逆。例如,可以利用从输入音频频谱X(k)的自相关导出的LPC(线性预测编码)系数的脉冲响应生成滤波器系数。
噪声反馈滤波器的应用和计算不一定是静态的。优选地,F(z)随时间变化并且周期地更新,例如每个变换块都进行更新,以提供对量化噪声的适当的时域整形。另外,如上面提及的,对于一个或多个频点或频点组中的每一个可以采用唯一的F(z)。因此,F(z)在各频点间(频率上)和各变换块间(时间上)可具有不同的系数。
返回到图3的描述,NFQ装置或处理18在合并器22中将量化器或量化功能20的输入与它的输出减性地合并,以产生量化误差信号E(k)。接着,滤波器或滤波功能24对该误差信号进行滤波以便在合并器26中与时频变换12的频域输出X(k)合并。将NFQ装置或处理18的输出Y(k)送到频时变换装置或处理28,频时变换装置或处理28提供时频变换12的变换的逆变换。优选地,滤波器或滤波功能24是动态的,并且其滤波器系数利用(1)时域输入信号x(n)或(2)输入信号的频域形式X(k)的度量来控制,由动态噪声反馈滤波器计算装置或功能30来确定。
尽管可以由特定编译码方案的设计者从许多任意形状中选择对时间噪声的特定再整形,但一般而言,希望将噪声从音频的安静部分移动到音频的大声部分。
频谱NFQ的性能
在图4中给出应用本发明实施例的性能的一个例子,其中噪声反馈滤波器或滤波功能被设计用于特定变换块的音频内容,以使产生的分段信噪比可以近似为恒量。分段信噪比被定义为对少量样本——在这个例子中少于变换块中的样本数量——计算的SNR。另外,在这个例子中,噪声反馈滤波器的阶被设置为10。图4中上部的曲线示出在一个变换块内的输入时域波形具有急剧瞬变。中间的曲线示出简单谱域编译码器的输出,其中在瞬变开始之前量化噪声遍布变换块。下部的曲线示出根据本发明的实施例采用10阶NFQ的谱域音频编译码器的输出。对于这个例子中的NFQ处理或系统,计算反馈滤波器以使分段SNR在整个变换块内保持近似为恒量。NFQ处理或系统的输出比没有NFQ的方案具有明显更低的预回声(在瞬变之前的变换块内分布的噪声部分),展示了本发明修改量化噪声的时间包络的能力。
图5示出没有NFQ的简单谱域编译码器(虚线)和采用10阶NFQ方案的编译码器(实线)的分段SNR,编码器接收图4所示的输入信号。对于具有NFQ的处理或系统,分段SNR在整个变换块内保持近似为恒量,而没有NFQ的处理或系统在瞬变开始之前具有非常低的分段SNR。
尽管不变的分段SNR展现了采用NFQ的本发明实施例的优势,但是它没有反映采用噪声最优分配的例子。实际上,处理或装置的设计者可以根据信号的时间特性选择他认为合适的时间噪声分配。如下面建议的,本发明的多个方面视需要可以使用复杂的时间掩蔽模型来获得想要的量化噪声的时间噪声包络。
噪声反馈量化应用于感知音频编译码系统
图6示出现有技术的MPEG-2/4 AAC的简化示意框图。使用2048点MDCT 32将输入的脉冲编码调制(PCM)音频转换到谱域,使用心理声学模型34计算该块的掩蔽曲线估计。接着选择比例因子(36),以使噪声(该噪声由于频谱量化引起)掩蔽比(NMR)保持尽量低。产生的信号被量化(38),然后被熵编码(40)。格式化器或格式化处理(“比特流”)42产生编码的比特流输出。然而,这种技术忽略了在各变换块内的时间掩蔽。根据本发明的多个方面,现在存在一种在时间上分配量化噪声的方式。
如果以图7所示的方式通过添加噪声反馈量化器18和动态噪声反馈计算30,并且通过消除互补的TNS编码和解码滤波器(即图1的滤波器6和8),从而消除将TNS滤波器系数从编码器传输给解码器的需要,借此来修改图6中的AAC编码器,则如下面建议地,可以分配谱域量化噪声以便不仅适用频谱掩蔽模型(通过在谱域中应用比例因子)而且适用时间掩蔽模型(通过使用NFQ)。动态噪声反馈计算30从(1)PCM时域输入或(2)MDCT 32的频域输出接收其输入。图7没有中示出时间掩蔽模型。
根据第一种技术,为了计算NFQ滤波器以与MDCT一起使用(例如用于AAC编码器或编码器/解码器系统中),输入时域信号必须首先被混叠。假定给定的变换块上的时间序列为:
x(n)n=0,1,…N-1,
可以导出混叠的时间序列:
x ^ [ ( n ) = x ( n ) - x ( N 2 - n ) , n = 0,1 , . . . N 2 - 1 - - - ( 8 a )
以及
x ^ ( n ) = x ( n ) + x ( N 2 - n ) , n = N 2 , N 2 + 1 , . . . N - - - ( 8 b )
接着可以导出量化噪声的期望时间包络(E’[n])。虽然在理想情况下在计算期望包络时应当考虑时间掩蔽效应,但MDCT的混叠性质阻止了时间掩蔽适用于这个问题。因此,可以使用时间能量包络的逆。即,可以将更多的噪声放入信号中声音最大的区域。
E ( n ) = | x ^ ( n ) | 2 - - - ( 9 )
以及
E ′ ( n ) = 1 E ( n ) - - - ( 10 )
接着由上面的方程6和7给出噪声反馈滤波器。
替代地,可以用与TNS(见下面的参考文献1)生成其编码滤波器和反转结果相同的方式生成NFQ滤波器。首先,计算当前变换块的MDCT:
X ( k ) = MDCT { x ( n ) } , n = 0,1 , . . . , N - 1 , k = 0,1 , . . . , N 2 - 1 - - - ( 11 )
接着计算MDCT频谱的自相关:
r ( m ) = Σ k = 0 N 2 - 1 X ( k ) X ( k - m ) , m = 0,1 , . . . N 2 - 1 - - - ( 12 )
接着可以使用Levinson Durbin算法(见下面的参考文献1)来计算在TNS(A(z))中使用的线性预测系数。接着可以将噪声反馈滤波器计算为:
F(m)=a1F(m-1)+a2F(m-2)+…+aLF(m-L)for m=0,1,…M
F(0)=1                (13)
F(m)=0 for m<0
其中F是噪声反馈滤波器转移函数,M是噪声反馈滤波器的阶,L是预测系数的阶。
从方程11到13生成的NFQ滤波器提供与方程8a到10近似相同的时间噪声整形。即,噪声从音频的安静部分移动到音频的大声部分。
噪声反馈量化的可能应用
根据本发明多个方面的噪声反馈量化的应用可以包括下列应用中的至少一个或多个:
●应用于现有的音频编译码系统:本发明的多个方面可以仅应用于编码器中,因此不需要边信息,允许应用于诸如MPEG-2/4 AAC和AC-3的现有技术。
●应用于AAC以进行低复杂性的解码:因为噪声反馈量化仅在编码器中执行,所以可以用仅解码器的噪声反馈量化取代TNS来简化AAC解码器。
●应用于AAC以用于可伸缩无损:新的MPEG可伸缩无损音频编译码器(SLS)使用MPEG-4AAC作为底层,并且传输编码信号和原始信号之间的差从而可以重建原始音频的无损表示。这对可被精确求反的、诸如整数MDCT的AAC施加约束;也不能使用诸如TNS的工具,因为在解码器中没有位精确求反。然而,因为根据本发明多个方面的NFQ仅在编码器中应用,所以它可以用于MPEG-4的SLS情形。
参考文献及通过引用并入本文
上文引用的下列参考文献通过引用而将其整体并入本文中。
在Proc.101st Convention Audio Engineering.Society,1996,preprint 4384中J.Herre,J.Johnston的“Enhancing the performanceof perceptual audio coders by using temporal noise shaping(TNS)”。
MPEG-2/4 AAC的细节可以在下列参考文献中找到:
1)ISO/LEC JTCI/SC29,“Information technology-very lowbitrate audio-visual coding,”ISO/lEC IS-14496(Part 3,Audio),1996);
2)ISO/lEC 13818-7.“MPEG-2 advanced audio coding,AAC”.International Standard,1997;
3)M.Bosi,K.Brandenburg,S.Quackenbush,L.Fielder,K.Akagiri,H.Fuchs,M.Dietz,J.Herre,G.Davidson,and Y.Qikawa:“ISO/IEC MPEG-2 Advanced Audio Coding”.Proc.of the 101st AES-Convention,1996;
4)M.Bosi,K.Brandenburg,S.Quackenbush,L.Fielder,K.Akagiri,H.Fuchs,M.Dietz,J.Herre,0.Davidson,Y.Qikawa:“ISO/lEC MPEG-2 Advanced Audio Coding”,Journal of the AES,Vol.45,No.10,October 1997,pp.789-814;
5)Karlheinz Brandenburg:“MP3 and AAC explained”.Proc.of the AES 17th International Conference on High Quality AudioCoding,Florence,Italy,1999;以及
6)G.A.Soulodre等人:“Subjective Evaluation of State-of-the-Art Two-Channel Audio Codecs”.J.Audio Eng.Soc.,Vol.46,No.3,pp 164-177,March 1998.
J.Princen,A.Bradley,“Analysis/synthesis filter bank designbased on time domain aliasing cancellation,”IEEE Trans.Accoust.Speech Signal Processing.vol.ASSP-34 pp.1153-1161,Oct.1986.
AC-3,也被称为Dolby Digital(Dolby和Dolby Digital是Dolby Laboratories Licensing Corporation的商标),被定义在“A/52B”文件(“Digital Audio Compression Standard(AC-3,E-AC-3)Revision B”)及之前的“A/52A”文件(“ATSC Standard:DigitalAudio Compression(AC-3),RevisionA”)以及“A/52”文件(“DigitalAudio Compression Standard(AC-3)”)中。也见:
1)“Design and Implementation of AC-3 Coders,”by SteveVernon,IEEE Trans.Consumer Electronics,Vol.41,No.3,August1995.
2)“The AC-3Multichannel Coder”by Mark Davis,AudioEngineering Society Preprint 3774,95th AES Convention,October,1993.
3)“High Quality,Low-Rate Audio Transform Coding forTransmission and Multimedia Applications,”by Bosi et al,AudioEngineering Society Preprint 3365,93rd AES Convention,October,1992.
Werner Verheist,Dreten De Koning,“Least Squares Theoryand Design of Optimal Noise Shaping Filters,”AES 22nd InternationalConference on Virtual,Synthetic and Entertainment Audio,June2002.
实施
本发明可以用硬件或软件或两者的组合(如可编程逻辑阵列)来实施。除非另外说明,包括为本发明一部分的任何算法都不固有地与任何特定的计算机或其它装置相关联。具体而言,可以通过根据此处的教导所写的程序来使用不同的通用机器,或者构造更专用的装置(如集成电路)来执行所要求的方法步骤可能更方便。因此,本发明可被实施为在一个或多个可编程的计算机系统上运行的一个或多个计算机程序,所述计算机系统中的每个都包括至少一个处理器、至少一个数据存储系统(包括易失性和非易失性存储器和/或存储单元)、至少一个输入装置或端口以及至少一个输出装置或端口。程序代码被应用到输入数据以完成此处描述的功能并生成输出信息。输出信息以已知的方式被应用到一个或多个输出装置。
每个这样的程序都可以用任何需要的计算机语言(包括机器、汇编或高级程序语言、逻辑或面向对象的编程语言)来实施,从而与计算机系统通信。在任何情况下,语言可以是编译或解释后的语言。
每个这样的计算机程序优选地存储在或下载到通用的或专用的可编程计算机可读的存储介质或装置中(如固态存储器或介质、磁或光介质),以便在由计算机系统读取存储介质或装置以执行此处描述的过程时配置并操作计算机。本发明的系统也可以考虑被实施为配置有计算机程序的计算机可读存储介质,其中这样配置的存储介质使得计算机系统以特定的、预先定义的方式操作从而实现此处描述的功能。
已经描述了本发明的许多实施例。不过,应该理解的是可以在不偏离本发明的精神和范围内进行不同的修改。例如,此处描述的一些步骤的顺序可以互相独立,由此可以与所述的顺序不同的顺序执行。

Claims (35)

1.一种对离散时域信号进行编码的数字音频编码方法,该方法采用所述离散时域信号的频域表示的量化,包括:
在频域中导出(20,22)频域量化误差的度量,
在频域中对该频域量化误差的度量进行滤波(24)以产生滤波后的量化误差度量,以及
在频域中将该滤波后的量化误差度量作为反馈信号应用(26)于频域量化(20)前的所述离散时域信号的频域表示,从而所述滤波的滤波参数影响在量化后的所述离散时域信号的频域表示从频域被逆变换回时域时量化噪声的时间整形。
2.根据权利要求1的方法,其中对于一个或多个频点或频点组中的每一个,所述滤波对所述频域量化误差的度量进行滤波以产生滤波后的量化误差度量,使得所述滤波后的量化误差度量在所述离散时域信号的频域表示的多段频谱上可变。
3.根据权利要求1的方法,其中,所述滤波参数是动态可控的。
4.根据权利要求3的方法,其中,所述滤波参数是响应于所述离散时域信号的度量而动态可控的。
5.根据权利要求4的方法,其中,通过包括计算时间信号的包络、对其求反以及计算该求反结果的逆DFT的处理过程获得所述离散时域信号的度量。
6.根据权利要求3的方法,其中,所述滤波参数是响应于所述离散时域信号的频域表示的度量而动态可控的。
7.根据权利要求6的方法,其中,通过包括线性预测编码(LPC)计算的处理过程(30)获得所述离散时域信号的频域表示的度量。
8.根据权利要求1-7之一的方法,其中,所述滤波参数也响应于时间掩蔽模型。
9.根据权利要求8的方法,其中,所述时间掩蔽模型提供选定的量化噪声时间形状。
10.根据权利要求8的方法,其中,所述时间掩蔽模型将变换块内的时间量化噪声从所述离散时域信号的相对安静的分段移动到相对大声的分段。
11.根据权利要求1-7之一的方法,还包括:
对量化后的所述离散时域信号的频域表示进行编码,以产生编码的比特流(40,42)。
12.一种数字音频编码器中的频域噪声反馈量化方法,包括:
将从时域音频信号导出的频域信号和频域噪声反馈信号合并(26)以产生频域量化器输入信号,
对该频域量化器输入信号进行量化(20)以产生频域量化器输出信号,
将该频域量化器输入信号和该频域量化器输出信号合并(22)以产生频域量化误差信号,以及
对该频域量化误差信号进行滤波(24)以产生频域噪声反馈信号。
13.根据权利要求12的方法,还包括动态控制频域噪声反馈滤波器参数。
14.根据权利要求13的方法,其中,所述动态控制响应于从中导出所述频域信号的时域音频信号的度量来控制频域噪声反馈滤波器参数。
15.根据权利要求14的方法,其中,所述动态控制也响应于时间掩蔽模型来控制频域噪声反馈滤波器参数。
16.一种对离散时域信号进行编码的数字音频编码设备,该设备采用所述离散时域信号的频域表示的量化,包括:
用于在频域中导出频域量化误差的度量的装置,
用于在频域中对该频域量化误差的度量进行滤波以产生滤波后的量化误差度量的装置,以及
用于在频域中将该滤波后的量化误差度量作为反馈信号应用于频域量化前的所述离散时域信号的频域表示,从而所述滤波的滤波参数影响在量化后的所述离散时域信号的频域表示从频域被逆变换回时域时量化噪声的时间整形的装置。
17.根据权利要求16的设备,其中对于一个或多个频点或频点组中的每一个,所述用于滤波的装置对所述频域量化误差的度量进行滤波以产生滤波后的量化误差度量,使得所述滤波后的量化误差度量在所述离散时域信号的频域表示的多段频谱上可变。
18.根据权利要求16的设备,其中,所述滤波参数是动态可控的。
19.根据权利要求18的设备,其中,所述滤波参数是响应于所述离散时域信号的度量而动态可控的。
20.根据权利要求19的设备,其中,通过包括计算时间信号的包络、对其求反以及计算该求反结果的逆DFT的处理过程获得所述离散时域信号的度量。
21.根据权利要求18的设备,其中,所述滤波参数是响应于所述离散时域信号的频域表示的度量而动态可控的。
22.根据权利要求21的设备,其中,通过包括线性预测编码(LPC)计算的处理过程(30)获得所述离散时域信号的频域表示的度量。
23.根据权利要求17-22之一的设备,其中,所述滤波参数也响应于时间掩蔽模型。
24.根据权利要求23的设备,其中,所述时间掩蔽模型提供选定的量化噪声时间形状。
25.根据权利要求23的设备,其中,所述时间掩蔽模型将变换块内的时间量化噪声从所述离散时域信号的相对安静的分段移动到相对大声的分段。
26.根据权利要求16-22之一的设备,还包括:
用于对量化后的所述离散时域信号的频域表示进行编码,以产生编码的比特流(40,42)的装置。
27.一种数字音频编码器中的频域噪声反馈量化设备,包括:
用于将从时域音频信号导出的频域信号和频域噪声反馈信号合并以产生频域量化器输入信号的装置,
用于对该频域量化器输入信号进行量化以产生频域量化器输出信号的装置,
用于将该频域量化器输入信号和该频域量化器输出信号合并以产生频域量化误差信号的装置,以及
用于对该频域量化误差信号进行滤波以产生频域噪声反馈信号的装置。
28.根据权利要求27的设备,还包括用于动态控制频域噪声反馈滤波器参数的装置。
29.根据权利要求28的设备,其中,所述用于动态控制的装置响应于从中导出所述频域信号的时域音频信号的度量来控制频域噪声反馈滤波器参数。
30.根据权利要求29的设备,其中,所述用于动态控制的装置也响应于时间掩蔽模型来控制频域噪声反馈滤波器参数。
31.一种在数字音频编码器中使用的频域噪声反馈量化器,包括:
第一合并器(26),将从时域音频信号导出的频域信号和频域噪声反馈信号合并以产生频域量化器输入信号,
量化器(20),对该频域量化器输入信号进行量化以产生频域量化器输出信号,
第二合并器(22),将该频域量化器输入信号和该频域量化器输出信号合并以产生频域量化误差信号,以及
噪声反馈滤波器(24),对该频域量化误差信号进行滤波以产生频域噪声反馈信号。
32.根据权利要求31的量化器,还包括动态控制噪声反馈滤波器参数的频域滤波器参数控制器(30)。
33.根据权利要求32的量化器,其中,所述滤波器参数控制器(30)响应于从中导出所述频域信号的时域音频信号的一个或多个度量来控制噪声反馈滤波器参数。
34.根据权利要求33的量化器,其中,所述滤波器参数控制器(30)也响应于时间掩蔽模型来控制噪声反馈滤波器参数。
35.根据权利要求31-34之一的量化器,其中噪声反馈滤波器的阶在10到20的范围内。
CN200780030179.3A 2006-08-15 2007-08-10 无需边信息对时域噪声包络的任意整形 Active CN101501761B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US83809406P 2006-08-15 2006-08-15
US60/838,094 2006-08-15
PCT/US2007/017811 WO2008021247A2 (en) 2006-08-15 2007-08-10 Arbitrary shaping of temporal noise envelope without side-information

Publications (2)

Publication Number Publication Date
CN101501761A CN101501761A (zh) 2009-08-05
CN101501761B true CN101501761B (zh) 2012-02-08

Family

ID=38984075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780030179.3A Active CN101501761B (zh) 2006-08-15 2007-08-10 无需边信息对时域噪声包络的任意整形

Country Status (8)

Country Link
US (1) US8706507B2 (zh)
EP (1) EP2054882B1 (zh)
JP (1) JP5096468B2 (zh)
CN (1) CN101501761B (zh)
AT (1) ATE496365T1 (zh)
DE (1) DE602007012116D1 (zh)
TW (1) TWI456567B (zh)
WO (1) WO2008021247A2 (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8335684B2 (en) * 2006-07-12 2012-12-18 Broadcom Corporation Interchangeable noise feedback coding and code excited linear prediction encoders
ATE496365T1 (de) 2006-08-15 2011-02-15 Dolby Lab Licensing Corp Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation
AT504164B1 (de) * 2006-09-15 2009-04-15 Tech Universit T Graz Vorrichtung zur gerauschunterdruckung bei einem audiosignal
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
JP4603062B2 (ja) * 2008-06-26 2010-12-22 京セラ株式会社 信号変換器、無線信号送信システム及び無線信号受信システム
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
CN102667923B (zh) 2009-10-20 2014-11-05 弗兰霍菲尔运输应用研究公司 音频编码器、音频解码器、用于将音频信息编码的方法、用于将音频信息解码的方法
CA2786944C (en) * 2010-01-12 2016-03-15 Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries
EP2705516B1 (en) * 2011-05-04 2016-07-06 Nokia Technologies Oy Encoding of stereophonic signals
US8891775B2 (en) * 2011-05-09 2014-11-18 Dolby International Ab Method and encoder for processing a digital stereo audio signal
WO2013142650A1 (en) 2012-03-23 2013-09-26 Dolby International Ab Enabling sampling rate diversity in a voice communication system
WO2014161996A2 (en) * 2013-04-05 2014-10-09 Dolby International Ab Audio processing system
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP2887350B1 (en) * 2013-12-19 2016-10-05 Dolby Laboratories Licensing Corporation Adaptive quantization noise filtering of decoded audio data
EP4095854A1 (en) * 2014-01-15 2022-11-30 Samsung Electronics Co., Ltd. Weight function determination device and method for quantizing linear prediction coding coefficient
EP3105755B1 (en) 2014-02-14 2017-07-26 Telefonaktiebolaget LM Ericsson (publ) Comfort noise generation
US9576589B2 (en) * 2015-02-06 2017-02-21 Knuedge, Inc. Harmonic feature processing for reducing noise
US11232804B2 (en) * 2017-07-03 2022-01-25 Dolby International Ab Low complexity dense transient events detection and coding
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483880A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
US11295750B2 (en) * 2018-09-27 2022-04-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for noise shaping using subspace projections for low-rate coding of speech and audio

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5487086A (en) * 1991-09-13 1996-01-23 Comsat Corporation Transform vector quantization for adaptive predictive coding
CN1234896A (zh) * 1997-07-11 1999-11-10 索尼株式会社 信息解码方法和装置、信息编码方法和装置以及供应媒体
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3010663B2 (ja) 1989-12-28 2000-02-21 ソニー株式会社 ノイズシェーピング回路
JPH03201715A (ja) * 1989-12-28 1991-09-03 Sony Corp ノイズシェーピング回路
US5206884A (en) * 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
TW324762B (en) 1996-07-15 1998-01-11 Tokyo Electric Power Co Manufacturing method for concrete sections
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
JP3681105B2 (ja) * 2000-02-24 2005-08-10 アルパイン株式会社 データ処理方式
US7171355B1 (en) * 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
MXPA03009357A (es) 2001-04-13 2004-02-18 Dolby Lab Licensing Corp Escalamiento en el tiempo y escalamiento en el tono de alta calidad de senales de audio.
US7512535B2 (en) * 2001-10-03 2009-03-31 Broadcom Corporation Adaptive postfiltering methods and systems for decoding speech
JP4286666B2 (ja) * 2002-01-25 2009-07-01 エヌエックスピー ビー ヴィ Pcm信号から量子化雑音を除去するための方法及びユニット
US7483835B2 (en) 2002-12-23 2009-01-27 Arbitron, Inc. AD detection using ID code and extracted signature
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
JP4212591B2 (ja) * 2003-06-30 2009-01-21 富士通株式会社 オーディオ符号化装置
JP2006047561A (ja) * 2004-08-03 2006-02-16 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置およびオーディオ信号復号化装置
EP1864281A1 (en) * 2005-04-01 2007-12-12 QUALCOMM Incorporated Systems, methods, and apparatus for highband burst suppression
ATE496365T1 (de) 2006-08-15 2011-02-15 Dolby Lab Licensing Corp Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation
TWM324762U (en) 2007-05-11 2008-01-01 Wan-Chen Jou Externally connected type condensed water atomizer of air conditioner

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5487086A (en) * 1991-09-13 1996-01-23 Comsat Corporation Transform vector quantization for adaptive predictive coding
CN1234896A (zh) * 1997-07-11 1999-11-10 索尼株式会社 信息解码方法和装置、信息编码方法和装置以及供应媒体
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
CN1369092A (zh) * 1999-08-09 2002-09-11 多尔拜实验特许公司 高质量音频的可缩放编码方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
J HERRE.Temporal noise shaping, quantization and coding methods in perceptual audio coding: a tutorial introduction.《AES 17th International Conference on High Quality Audio Coding》.1999,1-14. *
JHERRE.Temporalnoiseshaping quantization and coding methods in perceptual audio coding: a tutorial introduction.《AES 17th International Conference on High Quality Audio Coding》.1999

Also Published As

Publication number Publication date
JP5096468B2 (ja) 2012-12-12
EP2054882A2 (en) 2009-05-06
WO2008021247A9 (en) 2008-07-10
US8706507B2 (en) 2014-04-22
US20100094637A1 (en) 2010-04-15
WO2008021247A3 (en) 2008-04-17
WO2008021247A2 (en) 2008-02-21
TW200818123A (en) 2008-04-16
TWI456567B (zh) 2014-10-11
DE602007012116D1 (de) 2011-03-03
CN101501761A (zh) 2009-08-05
JP2010500631A (ja) 2010-01-07
ATE496365T1 (de) 2011-02-15
EP2054882B1 (en) 2011-01-19

Similar Documents

Publication Publication Date Title
CN101501761B (zh) 无需边信息对时域噪声包络的任意整形
RU2608878C1 (ru) Регулировка уровня во временной области для декодирования или кодирования аудиосигналов
KR101278805B1 (ko) 엔트로피 코딩 방법 및 엔트로피 디코딩 방법
US7684981B2 (en) Prediction of spectral coefficients in waveform coding and decoding
US9728196B2 (en) Method and apparatus to encode and decode an audio/speech signal
US7693709B2 (en) Reordering coefficients for waveform coding or decoding
US8255211B2 (en) Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering
US7383180B2 (en) Constant bitrate media encoding techniques
KR101202163B1 (ko) 오디오 인코더 및 디코더
US7774205B2 (en) Coding of sparse digital media spectral data
US20080312759A1 (en) Flexible frequency and time partitioning in perceptual transform coding of audio
US20080319739A1 (en) Low complexity decoder for complex transform coding of multi-channel sound
US8447591B2 (en) Factorization of overlapping tranforms into two block transforms
CN101443842A (zh) 信息信号编码
AU2003243441C1 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
KR20150043404A (ko) 공간적 오디오 객체 코딩에 오디오 정보를 적응시키기 위한 장치 및 방법
IL165648A (en) An audio coding system that uses decoded signal properties to coordinate synthesized spectral components

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant