CN100405460C - 音频信号编码 - Google Patents
音频信号编码 Download PDFInfo
- Publication number
- CN100405460C CN100405460C CNB2003801043447A CN200380104344A CN100405460C CN 100405460 C CN100405460 C CN 100405460C CN B2003801043447 A CNB2003801043447 A CN B2003801043447A CN 200380104344 A CN200380104344 A CN 200380104344A CN 100405460 C CN100405460 C CN 100405460C
- Authority
- CN
- China
- Prior art keywords
- parameter
- value
- frequency range
- audio signal
- calculated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
Abstract
在本音频信号编码方法中,在第一时刻(ti)表示音频信号的各个方面的各第一参数(P1,1)的值被计算以获得第一计算值(A1,i)。在随后的第二时刻(t2)表示音频信号的各个方面的各第二参数(P2,i)的值被计算以获得第二计算值(A2,i)。第一参数(P1,i)的数目和第二参数(P2,i)的数目不相同。第二参数(P2,i)的一个子集(SUS2,i)与音频信号一个频率范围(FR)的一个特定部分有关。音频信号的该频率范围(FR)优选地被选择成覆盖出现在音频信号中的所有频率。第二参数(P2,i)的子集(SUS2,i)的值(A2,i)基于此子集(SUS2,i)和第一计算值(A1,i)的一个子集(SUS1,i)的差而被编码,第一计算值(A1,i)的该子集(SUS1,i)与该频率范围(FR)的基本上相同的该特定部分(SFRAi)相关。因而第二参数(P2,i)的差分编码的值(7)通过编码第二参数(P2,i)的值和第一参数(P1,i)的值的差而获得,其中第二参数(P2,i)和第一参数(P1,i)都与该基本上相同的频率子范围相关。即使参数的数目随时间改变,此方法仍允许差分编码参数(P1,IP2,i)。
Description
本发明涉及一种音频信号编码方法、一种用于编码音频信号的编码器以及一种提供音频信号的设备。
以往在音频编码器中提出的用于降低立体声节目素材的比特率的先有解决方案包括强度立体声和M/S立体声。
在强度立体声算法中,高频(典型地5kHz以上)用一个与时变且频率相关的比例因子或强度因子组合的单个音频信号(也就是单声道)来表示,上述这些因子允许恢复类似于这些频率区域的原始的立体声信号的解码音频信号。
在M/S算法中,信号被分解为一个和信号(或者说中间信号、共有信号)以及一个差信号(或者说边信号、非共有信号)。此分解有时与主分量分析或者时变比例因子结合在一起。这些信号接着通过一个变换编码器或者子带编码器(此两者都是波形编码器)而被独立编码。通过该算法获得的信息削减量依赖于源信号的空间特性。例如,如果源信号是单耳的,则差信号是零并可以被丢弃。然而,如果左边和右边的音频信号之间的相关性较低(对于更高的频率区域经常是这种情况情况),此方案仅能提供很小的比特率削减。对更低的频率区域,M/S编码通常能提供显著的优势。
在过去的几年中,音频信号的参数描述已获得关注,尤其在音频编码领域。已经表明,传输描述音频信号的(经量化)参数仅仅需要很少的传输容量,以在接收端重新合成一个感觉上基本一样的信号。参数音频编码器中的一类集中于编码单耳信号,而立体声信号被当成两个单声道信号来处理。
另外一类参数音频编码器在EP-A-1107232中被公开。这种参数音频编码器使用一种参数编码方案来生成一个由一个左声道信号和一个右声道信号组成的立体声音频信号的表示。为了充分利用传输带宽,这样一种表示包含仅关于作为左声道信号和右声道信号的组合的单耳信号的信息以及参数信息。立体声信号能够基于此单耳信号和参数信息而被恢复。参数信息包含立体声音频信号的定位提示(localizationcue),其中包括了左右声道的强度和相位特征。
参数信息通过在音频信号的某一频率范围内表征音频信号各个方面的参数来表示,其中对于该频率范围确定所述参数。编码的音频信号可以包括编码的单耳音频信号和一个单一全局参数(或一组全局参数),以及/或者一个或者更多局部参数(或多组局部参数),其中全局参数对应于要被编码的音频信号的完整带宽或频率范围而被确定,而局部参数对应于音频信号频率范围的各个相应子范围而被确定(该频率范围的各子范围也称作小频段(bin))。
许多音频编码方案使用其量随时间变化的参数,例如在类似MEPG-1 Layer-III(mp3)、AAC(高级音频编码)等波形编码器中,MDCT(改进的离散余弦变换)系数的数目能随着时间改变。
下面的出版物公开了一种用于编码用于音频和语音信号正弦编码的模型参数的算法:“Optimal time-differential encoding of sinusoidalmodel parameters”,Jensen等人,symposium on information theory inthe Benelux,May 2001,第1-8页。为连续的信号分段估计由幅度、频率和相位参数定义的正弦分量集。这些正弦分量的参数可以被直接编码或者被关于前一分段中分量的参数值进行差分编码。在一个例子中,特定的分段m有3个正弦分量,而在前的分段m-1有2个正弦分量。通过关于分段m-1中的参数对它们进行差分编码或者对它们进行直接编码,分段m中的参数被最优地编码。
尚未公布的欧洲专利申请no.2002 02076588.9(案号PHNL020356)公开了这样的内容:用于参数立体声表示的频率子范围(也称作小频段)的数目能够逐帧改变。
尚未公布的欧洲专利申请no.2002 0277869.2(案号PHNL020692)公开了这样的内容:连续帧的相应参数能够随着时间被差分编码。如此一来,在时间方向上的冗余可以消除。参数的数目在连续帧中是相同的。
在E.G.P Schuijers等人的“Advances in Parametric coding forhigh-quality audio(用于高质量音频的参数编码的进展)”(1st IEEEBenelux Workshop on Model based Processing and Coding of Audio(MPCA 2002),Leuven Belgium,Nov.15,2002)中,描述了一种已经用参数立体声描述扩展了的参数编码方案。此描述试图利用三个参数来模型化双耳提示(binaural cue):声道间强度差(IID),声道间时间差(ITD),以及声道间互相关(ICC)。这些参数在类似于人类听觉系统的非均匀频率栅格上估计得到。在这个栅格上的小频段的数目典型地为20。在欧洲专利申请no.2002 02077869.2中,一种用于编码这些参数的可扩展的方法已被提出来。
对此参数编码方案,也存在改变用于逐帧描述频谱包络的LPC(线性预测编码)系数地数目的可能性。
本发明的第一方面提供了一种编码输入音频信号的方法,此方法包括:接收该输入音频信号;计算在第一时刻表示该输入音频信号的各个方面的第一数目的第一参数的各值,以获得各第一计算值;计算在随后的第二时刻表示该输入音频信号的各个方面的第二数目的第二参数的各值,以获得各第二计算值,其中所述第一数目和第二数目不相同;对与输入音频信号的一个频率范围的一个特定部分相关的第二参数的一个子集进行编码以获得第二参数的差分编码的值,该编码是基于与所述频率范围的该特定部分相关的第二计算值的一个子集和与所述频率范围的基本上该特定部分相关的第一计算值的一个子集之间的差;计算用于输入音频信号整个频率范围的全局值,且其中第一参数当中的每一个和第二参数当中的相应的一个覆盖基本上相同的频率范围,其中第一参数的数目小于第二参数的数目,第一计算值的子集包括用于第一参数当中的每一个的一个值,第二计算值的子集包括用于第二参数当中的每一个的一个值,其中在为之计算了一个第一计算值和一个第二计算值的各频率范围中,差分编码的值是基于相应的第一和第二计算值的差,且其中在为之计算了一个第二参数而没有计算第一参数的各频率范围中,差分编码的值是基于相应的第二参数和全局值的差;以及提供包括该差分编码值的已编码音频信号。
本发明的第二方面提供了一种用于编码输入音频信号的编码器,包括:用于接收该输入音频信号输入端;用于计算在第一时刻表示该输入音频信号的各个方面的第一数目的第一参数的各值以获得各第一计算值的装置;用于计算在随后的第二时刻表示该输入音频信号的各个方面的第二数目的第二参数的各值以获得各第二计算值的装置,其中所述第一数目和第二数目不相同;用于对与输入音频信号的一个频率范围的一个特定部分相关的第二参数的一个子集进行编码以获得第二参数的差分编码的值的装置,该编码是基于与所述频率范围的该特定部分相关的第二计算值的一个子集和与所述频率范围的基本上该特定部分相关的第一计算值的一个子集之间的差;用于计算用于输入音频信号整个频率范围的全局值的装置,且其中第一参数当中的每一个和第二参数当中的相应的一个覆盖基本上相同的频率范围,其中第一参数的数目小于第二参数的数目,第一计算值的子集包括用于第一参数当中的每一个的一个值,第二计算值的子集包括用于第二参数当中的每一个的一个值,其中在为之计算了一个第一计算值和一个第二计算值的各频率范围中,差分编码的值是基于相应的第一和第二计算值的差,且其中在为之计算了一个第二参数而没有计算第一参数的各频率范围中,差分编码的值是基于相应的第二参数和全局值的差;以及用于提供包括该差分编码值的已编码音频信号的输出端。
本发明的第三方面提供了一种用于提供音频信号的设备,此设备包括:一个上述段落所述的用于编码输入音频信号以获得已编码音频信号的编码器。
在依照本发明的第一方面的方法中,当在连续帧中参数的数目不同时,差分编码被采用。这提供了对这些参数的更有效的编码,并且因此对于编码的参数将需要更少的带宽。
在该音频信号编码方法中,表示在第一时刻的音频信号的各个方面的各第一参数的值被计算以获得各第一计算值。表示在随后的第二时刻的音频信号的各个方面的各第二参数被计算以获得各第二计算值。第一参数的数目和第二参数的数目不相同。第二参数的一个子集与音频信号的频率范围的一个特定部分有关。第二参数的该子集的各值基于该子集和第一计算值的一个子集的差而被编码,第一计算值的该子集与所述频率范围的基本上相同的该特定部分相关
即使参数的数目随时间改变,此方法仍允许对参数进行差分编码。
在本发明的一个实施例中,在一个特定的频率子范围或小频段内,一个单一参数必须被计算以用于在第一时刻的第一帧中。在基本上相同的该频率子范围内,几个参数必须被计算以用于在第二时刻的第二帧中。用于第二帧中的这几个参数中的每一个基于该参数相对于所述单一参数的值的差而被差分编码。
如果各频率子范围不相同,其中几个参数中的一个与一个未完全被所述特定频率子范围覆盖的频率子范围相关联,就必须实施一个校正,其中上述参数相对于所述单一参数以及相对于一个与未被该单一参数覆盖的频率范围相关的参数而被编码。
在本发明的另一个实施例中,在一个特定的频率子范围或小频段内,几个参数必须被计算以用于在第一时刻的第一帧中。在基本上相同的该频率子范围内,一个单一参数必须被计算以用于在第二时刻的第二帧中。此单一参数的值相对于所述几个参数的平均值而被差分编码。
在本发明的另一个实施例中,该平均值被计算为所述几个参数值的加权和。
在本发明的另一个实施例中,所有权重等于一除以第一帧的所述几个参数的数目,所述几个参数对应于第二帧的该单一参数。
在本发明的另一个实施例中,对于上述几个参数中的每一个选择权重,以便对应于所述相应的频率子范围的大小。
在本发明的另一个实施例中,各个频率子范围并不相同,其中所述单一参数的频率子范围仅仅部分覆盖所述几个参数当中的一个的频率范围,这一个参数值对平均值的贡献少于所述几个参数当中的其他参数的贡献。优选地是,它对平均值的贡献依赖于所述几个参数的频率范围被所述单一参数的频率子范围覆盖的百分比,其中该单一参数的频率子范围仅仅部分地覆盖所述几个参数的该频率范围。
在本发明的另一个实施例中,音频信号通过不同的参数组而被编码。全局参数被计算用于音频信号的整个频率范围。这些全局参数允许以基本的(较低的)质量译码音频信号。为了允许译码的音频信号有改良的质量,补充的参数必须被编码。这些补充参数的数目可以随着时间改变。在第一帧期间需要的第一参数的数目比在后续的第二帧期间需要的第二参数的数目要小。第一参数当中的每一个和第二参数中相应的那一个覆盖基本上相同的频率子范围。在其中必须编码一个第二参数值的各频率子范围中,这个参数值相对于相应的第一参数的值而被差分编码,该第一参数与基本上相同的该频率子范围相关联。在第二参数必须被编码但没有相应的第一参数值可用的各频率范围中,该第二参数的值相对于所述全局值(或多个全局值)而被差分编码。
在本发明的另一个实施例中,音频信号通过不同的参数组被编码。全局参数被计算用于音频信号的整个频率范围。这些全局参数允许以基本的(较低的)质量译码音频信号。为了允许译码的音频信号有改良的质量,补充的参数必须被编码。这些补充参数的量可以随着时间改变。在第一帧期间需要的第一参数的数目比在后续的第二帧期间需要的第二参数的数目要大。第一参数当中的每一个和第二参数中相应的那一个覆盖基本上相同的频率子范围。在其中必须编码一个第二参数值的各频率子范围中,这个参数值相对于相应的第一参数的值而被差分编码,该第一参数与基本上相同的该频率子范围相关联。在第一参数值可用但没有相应的第二参数必须被编码的各频率范围中,任何操作都不必发生。
通过参考下文中描述的各实施例,本发明的以上这些和其他一些方面是显然的,且将被如下阐明。
在附图中:
图1显示了依照本发明的一个实施例的编码器的方框图,
图2显示了如下情况的示意性的表示,其中第一帧期间的参数的数目少于第二帧期间的参数的数目,
图3显示了如下情况的另外一种示意性的表示,其中第一帧期间的参数的数目少于第二帧期间的参数的数目,
图4显示了如下情况的示意性的表示,其中第一帧期间的参数的数目高于第二帧期间的参数的数目,
图5显示了如下情况的另外一种示意性的表示,其中第一帧期间的参数的数目高于第二帧期间的参数的数目;
图6显示了如下情况的示意性的表示,其中第一帧期间的参数的数目少于第二帧期间的参数的数目,以及
图7显示了如下情况的示意性的表示,其中第一帧期间的参数的数目高于第二帧期间的参数的数目。
在不同图中,相同的附图标记指示相同的信号或者执行相同功能的元件。
图1显示了依照本发明的一个实施例的编码器的方框图。输入端IN接收音频信号1。此音频信号1必须以获得数据削减的方式被编码。通过用参数来表示音频信号的某些方面,数据削减是有可能的。这些参数定义了在音频信号1的某一特定频率范围内的音频信号1的某个方面。音频信号1的该特定频率范围可以覆盖音频信号1中所存在的所有频率,或者也可以是音频信号1中所存在的频率中的一个子范围。所述参数必须被定期确定以便能够表示改变中的音频信号1。通常,所述参数以被称为帧的定期的时间间隔被确定和编码。用参数表示音频信号1以及编码参数的实际方式对本发明并不重要,许多已知的方法都可以被实现。本发明针对这样一个事实:参数被差分编码,即使当要被编码的参数的数目在连续各帧中不相同也是这样。
一个计算单元2接收音频信号1,并且在每一帧提供计算值3。计算值3表示应该被差分编码的参数。编码的值应该在一个特定帧中可用。一个存储器4存储每帧的计算值3并提供存储值5。编码器6编码当前帧的计算值3和先前帧的存储值5的差,并提供差分编码的参数值7。差分编码的参数值7可以在单元8中与一个编码的单耳音频信号组合,从而在输出端OUT处提供一个编码的音频信号9。
编码器可以包含专门的硬件,或者也可以是执行计算和其它步骤的适当编程的处理器。
图2显示了如下情况的示意性的表示,其中第一帧t1期间的参数的数目少于第二帧t2期间的参数的数目。用于第一帧t1的参数P1,1至P1,4(进一步记作P1,i)和它们的相关频率子范围SFRA1至SFRA4(进一步记作SFRAi)显示于左侧。用于第一帧t1随后的第二帧t2的参数P2,1至P2,16(进一步记作P2,i)和它们的相关频率子范围SFRB1至SFRB16(进一步记作SFRBi)显示于右侧。
参数P1,i有一计算值Ai,而参数P2,i有一计算值Bi。参数P1,i或P2,i中特定的某一个通过用一个数字替换下标i来获得。
整个频率范围用FR来表示。第一计算值的子集SUS1,i各包含一个单一计算值A1,i。第二计算值的子集SUS2,i各包含多于一个(在图2例子中所示为4)的计算值A2,i。
因此,在对应于相同频率子范围SFRAi的相关子集SUS1,i和SUS2,i中,总是有四个第二计算值Bi对应于一个第一计算值Ai。这四个第二计算值当中的每一个相对于同一个第一计算值Ai而被差分编码。这意味着四个编码的值当中的每一个都等于相应的第二计算值Bi减去第一计算值Ai。
图3显示了如下情况的另外一种示意性的表示,其中第一帧期间的参数的数目少于第二帧期间的参数数目。对比图2,图3中通过将频率子范围SFRB1到SFRB4合并在一块而获得的频率子范围不同于频率范围SFRA1,而是略微小一些。频率子范围SFRB5部分出现在频率范围SFRA1内,同时部分在频率范围SFRA2内。参数P2,1到P2,4的编码的值相对于参数P1,1的值A1而被差分编码。参数P2,5的编码的值可以相对于值A1或参数P1,2的值A2而被差分编码。将参数P2,5的值编码为值B5和值A1与A2的加权和的差也是可能的。优选地,值A1和A2根据频率范围SFRB5与频率范围SFRA1和SFRA2的重叠分别被加权。
图4显示了如下情况的示意性的表示,其中第一帧期间的参数的数目高于第二帧期间的参数数目。图4显示了一个与图2所示类似的情况,但图4中帧t1较之随后的帧t2有更多数目的参数P1,i。
用于第二帧t2的参数P2,1和P2,2(进一步记作P2,i)和它们的相关频率子范围SFRB1和SFRB2(进一步记作SFRBi)显示于右侧。用于第一帧t1的参数P1,1至P1,7(进一步记作P1,i)和它们的相关频率子范围SFRA1至SFRA7(进一步记作SFRAi)显示于左侧。
参数P1,i有一计算值Ai,而参数P2,i有一计算值Bi。参数P1,i或P2,i中特定的某一个通过用一个数字替换下标i来获得。
第二计算值的子集SUS2,i各包含一个单一计算值Bi。第一计算值的子集SUS1,i各包含多于一个(在图4例子中所示为3)的计算值Ai。
因此,在对应于相同频率子范围SFRBi的相关子集SUS1,i和SUS2,i中,总是有一个第二计算值Bi对应于三个第一计算值Ai。
第二计算值Bi相对于该组相关计算值Ai的所计算的加权平均而被差分编码。如果值Ai属于这样的参数P1,i则值Ai与值Bi有关,其中参数P1,i属于一个频率子范围SFRAi,而该频率子范围SFRAi出现在频率范围SFRBi内或至少重叠于频率范围SFRBi。
该加权平均被计算如下:
其中Vgroup表示一组参数值,M为属于该组相关计算值Ai的参数的数目,以及qi为权重函数,对此有:
例如,权重qi被选择为1/M,而且某一特定参数所属于的频率子范围或小频段的大小也是一个好的选择。
图5显示了如下情况的另外一种示意性的表示,其中第一帧期间的参数的数目高于第二帧期间的参数数目。
在图4的例子中,在帧t1中属于一组的小频段总是全部落在帧t2的一个单一小频段内。在图5中不是这样的情况,与值A3相关的小频段仅仅部分在与值B1相关的小频段内。在相对于所述加权值而差分编码值B1的过程中,用于值A3的权重可以被选择得更小。优选地,这个权重的减少和A3的小频段在B1的小频段中的部分与全部在小频段B1内的A1和A2的小频段的百分比有关。
例如,如图2至5所示的差分编码与在E.G.P Schuijers等人的“Advances in Parametric coding for high-quality audio(用于高质量音频的参数编码的进展)”(1st IEEE Benelux Workshop on Model basedProcessing and Coding of Audio(MPCA 2002),Leuven Belgium,Nov.15,2002)中提出的参数编码方案有关,其中,由于质量/比特率的折衷,用于IID/ITD/ICC参数的小频段的数目可以切换到10或40个小频段以替代典型的20个小频段。
图6显示了如下情况的示意性的表示,其中第一帧期间的参数的数目少于第二帧期间的参数数目。
图2至5显示了可变数目的参数(或参数组)P1,i和P2,i,所述参数对应于某一特定的固定频率区域SF有关。因此,如果参数的数目改变,频率子范围SFRAi或SFRBi的大小将相应地改变,以便所有的频率子范围SFRAi或SFRBi合在一起覆盖该固定的频率区域SF。
或者,如图6和7中所示,每一个参数P1,i和P2,i可以分别属于某一频率区域SFRAi和SFRBi,也就是说,一个特定参数P1,i或P2,i所应用于的频率区域SFRAi或SFRBi是恒定的。如果在帧t1或t2中参数P1,i和P2,i的数目改变,则被所有频率区域SFRAi或SFRBi合在一起所覆盖的频率范围的总体大小也会改变。这可以是ITD参数的情况。
在帧t1中,最左列指示对于整个频率范围FR来表示音频信号1的各个方面的全局参数GB1。相邻的列显示了五个由C1到C5来指示的参数(或参数组,例如IID和/或ICC参数)。这些参数(或参数组)当中的每一个Ci与整个频率范围FR的一个相关频率子范围有关。各个频率子范围合在一起覆盖整个频率范围FR。在帧t1中,最右列显示了两个频率子范围SFRA1和SFRA2,其中两个参数(或者参数组)通过值A1和A2分别定义。
在帧t2中,最左列指示与全局参数GB1相对应的全局参数GB2。中间一列指示对应于参数C1到C5的五个参数D1到D5。对应于GB1和D1到D5的各个频率范围,与对应于GB2和C1到C5的各个频率范围分别相同。在帧t2中,最右列显示了三个频率子范围SFRB1到SFRB3,以及相关参数的值B1到B3。对应于值B1和B2的各个频率子范围SFRB1和SFRB2,与对应于值A1和A2的各个频率子范围SFRA1和SFRA2分别相同。值B1和B2分别相对于值A1和A2而被差分编码。由于在帧t1中没有对应于帧t2中的频率子范围SFRB3的频率子范围,所以相对于帧t1中的值来差分编码值B3是不可能的。然而,通过相对于全局参数GB2来编码值B3从而实现数据削减是可能的。
因此,一般而言,如果在特定的一帧中值为Ai的参数的小频段数目比下一帧中值为Bi的相应参数的小频段数目少,则仅对事实上存在于全部两帧之中的小频段执行差分编码。没有原先的对应小频段的小频段则相对于全局值GB2而被差分编码。
图7显示了如下情况的示意性的表示,其中第一帧期间的参数的数目高于第二帧期间的参数数目。
在帧t1中,最左列指示对于整个频率范围FR来表示音频信号1的各个方面的全局参数GB1。相邻的中间列显示了五个由C1到C5来指示的参数(或参数组,例如IID和/或ICC参数)。这些参数(或参数组)当中的每一个Ci与整个频率范围FR的一个相关的频率子范围有关。各个频率子范围合在一起覆盖整个频率范围FR。在帧t1中,最右列显示了三个频率子范围SFRA1至SFRA3,其中三个参数(或者参数组)通过值A1至A3分别定义。
在帧t2中,最左列指示与全局参数GB1相对应的全局参数GB2。中间一列指示对应于参数C1到C5的五个参数D1到D5。对应于GB1和D1到D5的各个频率范围,与对应于GB2和C1到C5的各个频率范围分别相同。在帧t2中,最右列显示了两个频率子范围SFRB1和SFRB2,以及相关参数的值B1和B2。对应于值B1和B2的各个频率子范围SFRB1和SFRB2,与对应于值A1和A2的各个频率子范围SFRA1和SFRA2相同。值B1和B2分别相对于值A1和A2而被差分编码。
因此,一般而言,如果在特定的一帧中值为Ai的参数的小频段数目比下一帧中值为Bi的相应参数的小频段数目多,则仅对事实上存在于全部两帧之中的小频段执行差分编码。
参考图6和7描述的编码算法在比特流中不需要信令。
例如,在如图6和7中所描述的情况中,Ai和Bi值可以表示ITD小频段的数目,在实际实现中,ITD小频段的数目可以在11至16之间变化。
需要注意的是,上述各个实施例说明而不是限制本发明,同时本领域技术人员也可以在不脱离所附的权利要求书范围的情况下设计许多其它的实施例。
例如,在连续帧的相应小频段中,参数的绝对数目及其改变不过是例子。在实际情况中,小频段的数目可以取决于实际音频信号和待解码的音频质量(或可获得的最大比特流)。例如在如图6和7中所描述的情况中,Ai和Bi值可以表示ITD小频段的数目,在实际实现中,ITD小频段的数目可以在11至16之间变化。
在权利要求书中,置于圆括号间的任何附图标记不应被解释为限制此权利要求。词“包括”不排除存在权利要求中所列出的之外的那些元件或步骤。本发明能通过包括几个不同元件的硬件来实现,还可以通过适当编程的计算机来实现。在列举几种装置的设备权利要求中,这些装置中的几个能通过同一硬件项来具体实现。某些措施在相互间不同的从属权利要求中被陈述这一事实,并不表示这些措施的组合不能被使用以获得更大的好处。
Claims (3)
1.一种编码输入音频信号(1)的方法,此方法包括:
接收该输入音频信号(1),
计算(2)在第一时刻(t1)表示该输入音频信号(1)的各个方面的第一数目的第一参数(P1,i)的各值,以获得各第一计算值(Ai),
计算(2)在随后的第二时刻(t2)表示该输入音频信号(1)的各个方面的第二数目的第二参数(P2,i)的各值,以获得各第二计算值(Bi),其中所述第一数目和第二数目不相同,
对与输入音频信号(1)的一个频率范围的一个特定部分(SFRA,i)相关的第二参数(P2,i)的一个子集进行编码(7)以获得第二参数(P2,i)的差分编码的值(7),该编码是基于与所述频率范围的该特定部分(SFRAi)相关的第二计算值(Bi)的一个子集(SUS2,i)和与所述频率范围的基本上该特定部分(SFRAi)相关的第一计算值(Ai)的一个子集(SUS1,i)之间的差,
计算用于输入音频信号(1)整个频率范围的全局值(GB1,GB2),且其中第一参数(P1,i)当中的每一个和第二参数(P2,i)当中的相应的一个覆盖基本上相同的频率范围(SFRAi,SFRBi),其中第一参数(P1,i)的数目小于第二参数(P2,i)的数目,第一计算值的子集(SUS1,i)包括用于第一参数(P1,i)当中的每一个的一个值,第二计算值的子集(SUS2,i)包括用于第二参数(P2,i)当中的每一个的一个值,其中在为之计算了一个第一计算值和一个第二计算值(Ai,Bi)的各频率范围中,差分编码的值(7)是基于相应的第一和第二计算值(Ai,Bi)的差,且其中在为之计算了一个第二参数(P2,i)而没有计算第一参数(P1,i)的各频率范围(SFRAi,SFRBi)中,差分编码的值(7)是基于相应的第二参数(P2,i)和全局值(GB1,GB2)的差,以及
提供包括该差分编码值(7)的已编码音频信号(9)。
2.一种用于编码输入音频信号(1)的编码器,包括:
用于接收该输入音频信号(1)输入端(IN),
用于计算(2)在第一时刻(t1)表示该输入音频信号(1)的各个方面的第一数目的第一参数(P1,i)的各值以获得各第一计算值(Ai)的装置,
用于计算(2)在随后的第二时刻(t2)表示该输入音频信号(1)的各个方面的第二数目的第二参数(P2,i)的各值以获得各第二计算值(Bi)的装置,其中所述第一数目和第二数目不相同,
用于对与输入音频信号(1)的一个频率范围的一个特定部分(SFRA,i)相关的第二参数(P2,i)的一个子集进行编码(7)以获得第二参数(P2,i)的差分编码的值(7)的装置,该编码是基于与所述频率范围的该特定部分(SFRA,i)相关的第二计算值(Bi)的一个子集(SUS2,i)和与所述频率范围的基本上该特定部分(SFRA,i)相关的第一计算值(Ai)的一个子集(SUS1,i)之间的差,
用于计算用于输入音频信号(1)整个频率范围的全局值(GB1,GB2)的装置,且其中第一参数(P1,i)当中的每一个和第二参数(P2,i)当中的相应的一个覆盖基本上相同的频率范围(SFRAi,SFRBi),其中第一参数(P1,i)的数目小于第二参数(P2,i)的数目,第一计算值的子集(SUS1,i)包括用于第一参数(P1,i)当中的每一个的一个值,第二计算值的子集(SUS2,i)包括用于第二参数(P2,i)当中的每一个的一个值,其中在为之计算了一个第一计算值和一个第二计算值(Ai,Bi)的各频率范围中,差分编码的值(7)是基于相应的第一和第二计算值(Ai,Bi)的差,且其中在为之计算了一个第二参数(P2,i)而没有计算第一参数(P1,i)的各频率范围(SFRAi,SFRBi)中,差分编码的值(7)是基于相应的第二参数(P2,i)和全局值(GB1,GB2)的差,以及
用于提供包括该差分编码值(7)的已编码音频信号(9)的输出端(OUT)。
3.一种用于提供音频信号的设备,此设备包括:
一个根据权利要求2所述的用于编码输入音频信号(1)以获得已编码音频信号(9)的编码器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02080008.2 | 2002-11-28 | ||
EP02080008 | 2002-11-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1717577A CN1717577A (zh) | 2006-01-04 |
CN100405460C true CN100405460C (zh) | 2008-07-23 |
Family
ID=32338131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2003801043447A Expired - Fee Related CN100405460C (zh) | 2002-11-28 | 2003-10-31 | 音频信号编码 |
Country Status (14)
Country | Link |
---|---|
US (1) | US7644001B2 (zh) |
EP (1) | EP1568010B1 (zh) |
JP (1) | JP4538324B2 (zh) |
KR (1) | KR101008520B1 (zh) |
CN (1) | CN100405460C (zh) |
AT (1) | ATE348386T1 (zh) |
AU (1) | AU2003274520A1 (zh) |
BR (1) | BR0316611A (zh) |
DE (1) | DE60310449T2 (zh) |
ES (1) | ES2278192T3 (zh) |
MX (1) | MXPA05005602A (zh) |
PL (1) | PL376889A1 (zh) |
RU (1) | RU2005120236A (zh) |
WO (1) | WO2004049309A1 (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7583805B2 (en) | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7644003B2 (en) | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US20070168183A1 (en) * | 2004-02-17 | 2007-07-19 | Koninklijke Philips Electronics, N.V. | Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore |
US7805313B2 (en) | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
US8204261B2 (en) | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US7720230B2 (en) | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
KR101236259B1 (ko) | 2004-11-30 | 2013-02-22 | 에이저 시스템즈 엘엘시 | 오디오 채널들을 인코딩하는 방법 및 장치 |
EP1817767B1 (en) | 2004-11-30 | 2015-11-11 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
US7787631B2 (en) | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
US7903824B2 (en) | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
KR100707177B1 (ko) * | 2005-01-19 | 2007-04-13 | 삼성전자주식회사 | 디지털 신호 부호화/복호화 방법 및 장치 |
CN101283252B (zh) * | 2005-10-05 | 2013-03-27 | Lg电子株式会社 | 信号处理的方法和装置以及编码和解码方法及其装置 |
US8199828B2 (en) | 2005-10-13 | 2012-06-12 | Lg Electronics Inc. | Method of processing a signal and apparatus for processing a signal |
WO2007043840A1 (en) * | 2005-10-13 | 2007-04-19 | Lg Electronics Inc. | Method and apparatus for signal processing |
CN101390443B (zh) * | 2006-02-21 | 2010-12-01 | 皇家飞利浦电子股份有限公司 | 音频编码和解码 |
KR101346771B1 (ko) * | 2007-08-16 | 2013-12-31 | 삼성전자주식회사 | 심리 음향 모델에 따른 마스킹 값보다 작은 정현파 신호를효율적으로 인코딩하는 방법 및 장치, 그리고 인코딩된오디오 신호를 디코딩하는 방법 및 장치 |
KR101646650B1 (ko) * | 2009-10-15 | 2016-08-08 | 오렌지 | 최적의 저-스루풋 파라메트릭 코딩/디코딩 |
TWI759223B (zh) * | 2010-12-03 | 2022-03-21 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
EP2477418B1 (en) * | 2011-01-12 | 2014-06-04 | Nxp B.V. | Signal processing method |
KR20140117931A (ko) | 2013-03-27 | 2014-10-08 | 삼성전자주식회사 | 오디오 디코딩 장치 및 방법 |
US10692030B2 (en) * | 2016-06-21 | 2020-06-23 | Amazon Technologies, Inc. | Process visualization platform |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2982637B2 (ja) * | 1995-01-17 | 1999-11-29 | 日本電気株式会社 | スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置 |
DE19742655C2 (de) * | 1997-09-26 | 1999-08-05 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals |
US6029126A (en) * | 1998-06-30 | 2000-02-22 | Microsoft Corporation | Scalable audio coder and decoder |
US6539357B1 (en) | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
WO2000079519A1 (en) * | 1999-06-18 | 2000-12-28 | Koninklijke Philips Electronics N.V. | Audio transmission system having an improved encoder |
US6446037B1 (en) * | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
CN1647156B (zh) | 2002-04-22 | 2010-05-26 | 皇家飞利浦电子股份有限公司 | 参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备 |
-
2003
- 2003-10-31 KR KR1020057009408A patent/KR101008520B1/ko not_active IP Right Cessation
- 2003-10-31 MX MXPA05005602A patent/MXPA05005602A/es active IP Right Grant
- 2003-10-31 PL PL376889A patent/PL376889A1/pl not_active Application Discontinuation
- 2003-10-31 JP JP2004554728A patent/JP4538324B2/ja not_active Expired - Fee Related
- 2003-10-31 ES ES03758495T patent/ES2278192T3/es not_active Expired - Lifetime
- 2003-10-31 AT AT03758495T patent/ATE348386T1/de not_active IP Right Cessation
- 2003-10-31 AU AU2003274520A patent/AU2003274520A1/en not_active Abandoned
- 2003-10-31 CN CNB2003801043447A patent/CN100405460C/zh not_active Expired - Fee Related
- 2003-10-31 RU RU2005120236/09A patent/RU2005120236A/ru not_active Application Discontinuation
- 2003-10-31 US US10/536,243 patent/US7644001B2/en not_active Expired - Fee Related
- 2003-10-31 DE DE60310449T patent/DE60310449T2/de not_active Expired - Lifetime
- 2003-10-31 WO PCT/IB2003/004864 patent/WO2004049309A1/en active IP Right Grant
- 2003-10-31 EP EP03758495A patent/EP1568010B1/en not_active Expired - Lifetime
- 2003-10-31 BR BR0316611-2A patent/BR0316611A/pt not_active IP Right Cessation
Non-Patent Citations (6)
Title |
---|
Asac-Analysis/Synthesis Audio Codec For Very Low Bit Rates. EDler B ET AL.Preprints Of Papers Presented At The Aes Convention. 1996 |
Asac-Analysis/Synthesis Audio Codec For Very Low Bit Rates. EDler B ET AL.Preprints Of Papers Presented At The Aes Convention. 1996 * |
Binaural Cue Coding Applied To Stereo AndMulti-Channel Audio Compression. Faller C ET AL.Audio Engineering Society,112Th Convention. 2002 |
Binaural Cue Coding Applied To Stereo AndMulti-Channel Audio Compression. Faller C ET AL.Audio Engineering Society,112Th Convention. 2002 * |
Optimal time-differential encoding of sinusoidalmodel parameters. Jensen J ET AL.Symposium On Information Theory In The Benelux. 2001 |
Optimal time-differential encoding of sinusoidalmodel parameters. Jensen J ET AL.Symposium On Information Theory In The Benelux. 2001 * |
Also Published As
Publication number | Publication date |
---|---|
DE60310449T2 (de) | 2007-10-31 |
BR0316611A (pt) | 2005-10-11 |
KR101008520B1 (ko) | 2011-01-14 |
ES2278192T3 (es) | 2007-08-01 |
WO2004049309A1 (en) | 2004-06-10 |
KR20050086809A (ko) | 2005-08-30 |
EP1568010B1 (en) | 2006-12-13 |
ATE348386T1 (de) | 2007-01-15 |
JP4538324B2 (ja) | 2010-09-08 |
JP2006508384A (ja) | 2006-03-09 |
CN1717577A (zh) | 2006-01-04 |
PL376889A1 (pl) | 2006-01-09 |
US7644001B2 (en) | 2010-01-05 |
DE60310449D1 (de) | 2007-01-25 |
MXPA05005602A (es) | 2005-07-26 |
AU2003274520A1 (en) | 2004-06-18 |
RU2005120236A (ru) | 2006-01-20 |
US20060147047A1 (en) | 2006-07-06 |
EP1568010A1 (en) | 2005-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100405460C (zh) | 音频信号编码 | |
JP6641018B2 (ja) | チャネル間時間差を推定する装置及び方法 | |
JP4887307B2 (ja) | ニアトランスペアレントまたはトランスペアレントなマルチチャネルエンコーダ/デコーダ構成 | |
US6353808B1 (en) | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal | |
KR100283547B1 (ko) | 오디오 신호 부호화 방법 및 복호화 방법, 오디오 신호 부호화장치 및 복호화 장치 | |
EP1649723B1 (en) | Multi-channel synthesizer and method for generating a multi-channel output signal | |
RU2422987C2 (ru) | Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой | |
JP2904472B2 (ja) | ディジタル・オーディオ信号を効率的に圧縮するための方法、データ処理システムおよび装置 | |
KR101183857B1 (ko) | 다중 채널 오디오 신호를 인코딩/디코딩하기 위한 방법 및 장치 | |
CN101268351B (zh) | 健壮解码器 | |
CA2254567C (en) | Joint quantization of speech parameters | |
JP2021503628A (ja) | 量子化とエントロピーコーディングとを使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法 | |
EP0858067B1 (en) | Multichannel acoustic signal coding and decoding methods and coding and decoding devices using the same | |
CA3125246A1 (en) | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field | |
CN101010725A (zh) | 多信道信号编码装置以及多信道信号解码装置 | |
JP2002526798A (ja) | 複数チャネル信号の符号化及び復号化 | |
CN101136202B (zh) | 音频信号处理系统、方法以及音频信号收发装置 | |
CN101176147A (zh) | 语音编码装置以及频谱变形方法 | |
KR20050107812A (ko) | 다중-채널 신호들의 처리 | |
EP1385150B1 (en) | Method and system for parametric characterization of transient audio signals | |
CN101499279B (zh) | 空间参数逐级精细的比特分配方法及其装置 | |
JP2004325633A (ja) | 信号符号化方法、信号符号化プログラム及びその記録媒体 | |
CN115171709A (zh) | 语音编码、解码方法、装置、计算机设备和存储介质 | |
JP3099876B2 (ja) | 多チャネル音声信号符号化方法及びその復号方法及びそれを使った符号化装置及び復号化装置 | |
JPH09146593A (ja) | 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置及び音響信号復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080723 Termination date: 20111031 |