CN101826071B

CN101826071B - 用于信号分析和合成的自适应混合变换

Info

Publication number: CN101826071B
Application number: CN2010101660941A
Authority: CN
Inventors: 马克·S.·温登; 格兰特·A.·戴维森
Original assignee: Dolby Laboratories Licensing Corp
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 2004-02-19
Filing date: 2005-01-21
Publication date: 2011-09-14
Anticipated expiration: 2025-01-21
Also published as: PL1723638T3; BRPI0507806B1; CA2924281A1; HK1130358A1; EP2293293B1; US7516064B2; HK1092925A1; EP2088583B1; EP1723638B1; CA2860180C; ATE526660T1; CA2924281C; TW200529548A; KR101273486B1; DK1723638T3; CA2554381A1; TW201214949A; JP4689625B2; BRPI0507806A; CA2880055C

Abstract

本发明涉及用于信号分析和合成的自适应混合变换。诸如在音频和视频编码系统中使用的分析和合成滤波器组中每个滤波器组通过混合变换实现，该混合变换包括主变换与一个或更多次变换级联。用于滤波器组的主变换实现其中消除时域混叠赝象的分析/合成系统。对变换系数的块应用与该主变换级联的所述次变换。改变该块长度以适配分析和合成滤波器组的时间分辨率。

Description

用于信号分析和合成的自适应混合变换

本申请是申请号为200580005301.2、申请日为2005年1月21日、发明名称为“用于信号分析和合成的自适应混合变换”的发明专利申请的分案申请。

技术领域

本发明通常涉及信号分析和合成滤波器组诸如可以在音频和视频编码系统中使用的那些滤波器组。更具体而言，本发明涉及通过能够适配滤波器组的时间和频率分辨率的块变换的级联而实现的分析和合成滤波器组。

背景技术

通常使用编码系统来减小充分表示源信号所需的信息量。通过减小信息容量要求，能够在具有较低带宽的信道上发送信号表示或使用较小的空间在媒体上存储信号表示。编码能够通过删除源信号中的冗余分量或不相关分量而减小源信号的信息容量要求。所谓的感知编码方法和系统通常使用滤波器组，通过使用频谱分量基本组去相关源信号来减小冗余，以及通过根据心理感知准则自适应量化频谱分量来减小不相关性。

许多感知编码系统通过块变换实现滤波器组。在音频编码系统中，例如，通过时间分段或时域采样的块表示的源音频信号被变换成表示该源信号的频谱内容的多组频域系数。这些分段的长度确立滤波器组的时间分辨率和频率分辨率。时间分辨率随分段长度的减小而增加。频率分辨率随分段长度的增加而增加。由于这种关系，分段长度的选择使得在块变换滤波器组的时间和频率分辨率之间进行折衷。

分段长度的单一选择不能够对于典型编码系统所遇到的所有源信号条件提供分辨率之间的最佳折衷。如果滤波器组具有较高的频率分辨率(如果使用较长的分段长度则能够提供)，通常能够更有效地编码缓慢变化或稳定的源信号。如果滤波器组具有较高的时间分辨率(如果使用较短的分段长度则能够提供)，通常能够更有效地编码快速变化或高度不稳定的源信号。通过响应于改变源信号条件适配分段长度，块变换滤波器组能够优化其时间和频率分辨率之间的折衷。

在音频编码系统中可以使用例如各种各样的变换实现滤波器组，但是广泛地使用特定的修改离散余弦变换(MDCT)，因为它具有用于音频编码的若干非常有吸引力的特性，其中包括能够提供临界采样同时允许相邻的源信号分段相互重叠。MDCT也是具有吸引力的，因为它能够基本上删除在分段内基本上稳定的源信号中所有冗余分量。MDCT滤波器组的正确操作要求使用重叠的源信号分段以及满足一定准则的窗口函数，在Princen等人的“Subband/Transform CodingUsing Filter Bank Designs Based on Time Domain AliasingCancellation”(Proc.of the 1987International Conference onAcoustics，Speech and Signal Processing(ICASSP)，1987年5月，第2161-64页)中描述了这些准则。不幸的是，由于对必须应用于重叠源信号分段的窗口函数施加的要求，难以响应于信号条件适配MDCT滤波器组的时间和频率分辨率。

一种有时称为“窗口切换”的已知技术能够通过响应于检测到一定的信号条件诸如突然的信号改变或幅度瞬变而自适应地在两个不同窗口函数之间进行切换，来适配MDCT滤波器组的时间分辨率。根据于1993年5月25日授予Edler的美国专利5214742中描述的这种技术，不改变分段长度，而是通过在不同的窗口函数形状之间进行切换以减小每个分段中通过滤波器组变换的非零采样的数量，来适配时间分辨率。不幸的是，这种技术不适配滤波器组的频率分辨率，并且无论何时减小时间分辨率都将严重地恶化滤波器组的频率选择性，因为窗口切换需要的窗口函数的形状必须是次最佳的以满足MDCT正确操作的要求。

另一种有时称为“块切换”的已知技术类似于上述的窗口切换技术，因为它也在不同的窗口函数形状之间进行切换，但是块切换技术通过响应于检测到一定信号条件诸如突然的信号改变或幅度瞬变而还自适应地在两个不同的分段长度之间切换，能够适配MDCT滤波器组的时间和频率分辨率。这种技术在高级音频编码器(AAC)中使用，在Bosi等人的“ISO/IEC MPEG-2 Advanced Audio Coding”(J.AudioEng.Soc.，vol.45，no.10，1997年10月，第789-814页)中描述了该AAC。

在AAC中，MDCT滤波器组被应用于稳定的长度等于2048个采样的源信号分段，并且应用于非稳定的长度等于256个采样的源信号分段。在AAC中通过使用适于较长分段的“长窗口函数”，适于较短分段的“短窗口函数”，允许从较长分段长度切换到较短分段长度的“长到短桥接窗口函数”，以及允许从较短分段长度切换到较长分段长度的“短到长桥接窗口函数”，来实现块切换。两种桥接窗口函数允许在不同的分段长度之间进行切换，同时满足MDCT正确操作所必需的准则。从较长分段长度切换到较短分段长度以及切换回到较长长度是通过使用长到短桥接窗口函数应用MDCT于长分段，使用短窗口函数应用MDCT于八个短分段的整数倍，以及使用短到长桥接窗口函数应用MDCT于长分段来实现的。紧接着，必须应用MDCT于长分段，但可以使用长窗口函数或如果想要另一个块切换则可以使用长到短桥接窗口函数。

尽管块切换提供适配MDCT滤波器组的时间和频率分辨率的方式，由于若干原因它不是理想的解决方案。一个原因是在块长度切换期间，由于桥接窗口函数的形状必须是次最佳的以允许进行分段长度切换并满足MDCT正确操作的要求，从而恶化了变换的频率选择性。另一个原因是切换不能在任意的时间发生。如上所述，MDCT必须在切换到较长分段长度之后立即应用于另一个长分段。立即切换到较短长度是不可能的。这种块切换技术也不是一种理想的解决方案，因为这种切换机制仅提供两种分段长度，这些分段长度对于所有信号条件来说不是最佳的。例如，由于AAC中的较长和较短分段长度对于大多数语音信号分段来说都不是最佳的，从而AAC中的两种分段长度不是最佳的。对于语音的非稳定性质来说2048采样分段通常太长，256采样分段通常太短而不能有效地删除冗余的分量。而且，存在许多稳定信号，对于这些信号来说长于2048个采样的分段长度将会更佳。结果，由于块切换以适配MDCT滤波器组的时间和频率分辨率的能力有限，损害了AAC的性能。

在遵循杜比数字(Dolby Digital)编码比特流标准的编码系统中使用另一种形式的块切换。在2001年8月20日公布的高级电视系统委员会(ATSC)题为“Revision A to Digital Audio Compression(AC-3)Standard”的A/52A文件中描述了这种编码标准，有时称为“AC-3”。在AC-3编码系统中使用的块切换形式应用MDCT于对于稳定信号是512个采样而对于非稳定信号是256个采样的源信号分段。AC-3编码系统中使用的块切换技术提供当进行长度切换时更为灵活的选择。而且，编码性能对于非稳定的源信号如语音来说相当好；但是，对于更稳定的信号的编码性能受到较长分段提供的相对低的频率分辨率的限制。

在1995年2月28日授予Davidson的美国专利5394473中描述了用于MDCT滤波器组的时间和频率分辨率自适应控制的其他技术。这些技术中的部分技术允许使用窗口函数应用MDCT滤波器组于基本上任何长度的分段，这些窗口函数比其他已知技术提供好得多的频率响应。不幸的是，这些技术必须适配MDCT的核心或基本函数，所以，它们与现有的比特流标准如上述的AC-3标准不兼容。这些技术也是计算强度大的。

发明内容

需要一种效率更高和有效的方式以适配通过变换如MDCT实现的滤波器组的频率分辨率。该解决方案应该提供一种简化其包含到与现有比特流标准兼容的系统中的实现。这通过使用混合变换滤波器组来达到，该混合变换滤波器组可以通过级联块变换实现。

根据本发明的教导，分析和合成滤波器组通过包括主变换与一个或更多次变换级联的混合变换实现。在一种实现中，所述主变换是应用于相互重叠一半分段长度的源信号分段的MDCT，以及所述次变换是对于在时间上的特定频率应用于MDCT系数的非重叠块的DCT。可以通过增加由一个或更多次变换所变换的块中的系数数量，增加滤波器组的频率分辨率。该一个或更多次变换可以应用于MDCT系数的块，其具有随系数频率变化的系数数量，从而允许以各种各样的方式适配滤波器组的频率分辨率。

通过参考以下讨论和附图可以更好地理解本发明的各种特征及其优选实施例，其中在若干附图中相似的附图标记表示相似的元件。仅仅将以下讨论和附图的内容作为实例阐述，而不应该理解成表示对本发明范围的限制。

附图说明

图1是在编码系统中使用的发送机的示意方框图。

图2是在编码系统中使用的接收机的示意方框图。

图3是可以用于实现本发明各个方面的设备的示意方框图。

图4是包含本发明各个方面的分析滤波器组的示意方框图。

图5是包含本发明各个方面的分析滤波器组的示意方框图。

具体实施方式

A.引言

本发明提供了一种通过混合变换实现的能够容易地适配其频率分辨率的滤波器组。图1和2分别例示了在可以包含本发明各个方面的音频编码系统中的发送机和接收机的示意方框图。在以下部分中简要地讨论了该例示发送机和接收机的特征。在这种讨论之后，将讨论分析和合成滤波器组的有关特征。

1.发送机

图1中例示的发送机应用分析滤波器组3于从路径1接收的源信号以产生表示源信号的频谱内容的频谱系数，应用编码器5于频谱系数以产生编码的信息，以及应用格式化器8于该编码的信息以产生适于沿路径9传输的输出信号。该输出信号可以立即传送到接收机或被记录以随后传送。分析滤波器组3可以以下面描述的各种方式来实现。

在本公开中，术语如“编码器”和“编码”并无意图暗示任何特定类型的信息处理。例如，经常使用编码来减小信息容量需求；但是，本公开中的这些术语不必表示这种类型的处理。编码器5可以执行基本上任何类型的期望处理。在一种实现中，通过根据感知模型、使用各种各样的量化技术(包括在2001年6月12日授予Davidson等人的美国专利6246345中描述的向量量化和增益自适应量化)来量化频谱系数，产生编码的信息。对于本发明来说特定类型的编码并不重要。

2.接收机

图2中例示的接收机应用去格式化器23于从路径21接收的输入信号以获得编码的信息，应用解码器25于编码的信息以获得表示源信号的频谱内容的频谱系数，以及应用合成滤波器组27于该频谱系数以产生沿路径29传输的输出信号，该输出信号是源信号的复制品但可以不是精确的复制品。合成滤波器组27可以以与分析滤波器组3的实现互补的各种方式实现。

在本公开中，术语如“解码器”和“解码”并不意图暗示任何特定类型的信息处理。解码器25可以执行基本上任何类型的所需或期望的处理。在一种与上述编码处理相反的实现中，将量化的频谱分量解码成去量化的频谱系数。对于本发明来说特定类型的解码并不重要。

B.自适应混合变换

分析滤波器组3和合成滤波器组27包括混合变换，可以分别如图4和5所示来实现。

图4所示的分析滤波器组3包括主变换43以及与该主变换级联的一个或更多次变换45。该主变换被应用于源信号分段以产生表示该源信号分段的频谱内容的多组频谱系数。对于在时间上的特定频率，一个或更多次变换中的每个变换被应用于频谱系数块。响应于控制信号而适配每个块中系数的数量。

图5所示的合成滤波器组27包括一个或更多逆次变换52以及与该逆次变换级联的逆主变换54。对于在时间上的特定频率，一个或更多逆次变换中的每个变换产生频谱系数块。响应于控制信号而适配每个块中的系数数量。对于在频率上的特定时间频谱系数块被组合成多组频谱系数，以及主变换应用于该多组频谱系数以产生被组合来提供原始源信号的复制品的信号分段。

分析滤波器组和合成滤波器组的主变换实现了一种分析/合成系统，其中逆主变换消除了正向主变换产生的时域混叠赝象。例如，在上述Princen论文中描述的修改离散余弦变换(MDCT)和逆MDCT(IMDCT)实现了成奇数堆栈的临界采样的单边带分析/合成系统的时域等效。这些变换在这里称为成奇数堆栈时域混叠消除(O-TDAC)变换。另一种TDAC实现在Princen等人的“Analysis/Synthesis FilterBank Design Based on Time Domain Aliasing Cancellation”(IEEETrans.on Acoust.，Speech，Signal Proc.，vol.ASSP-34，1986，pp.1153-1161)中描述。在这种实现中的分析滤波器组包括应用MDCT和修改离散正弦变换(MDST)来交替信号分段。所述合成滤波器组包括应用IMDCT和逆MDST(IMDST)。这些变换实现了成偶数堆栈的临界采样的单边带分析/合成系统的时域等效并且称为成偶数堆栈时域混叠消除变换。

次变换可以通过许多变换包括离散余弦变换(DCT)、离散正弦变换(DST)、和离散傅里叶变换(DFT)中的任何变换实现。

在分析滤波器组3的优选实现中，类型-II DCT与上述O-TDACMDCT级联使用。在合成滤波器组27的对应实现中，O-TDAC IMDCT与类型-II逆DCT(IDCT)级联使用。在以下更详细地讨论这些实现。

1.分析滤波器组

参考图4，从路径1接收源信号采样序列并存储在缓冲器41中。分析器47是通过应用某种分析处理于所存储的采样来确定在每个分段中源信号采样数量、或分段长度以用于随后处理的可选组件。按需要可以使用基本上任何分析处理。例如，可以如以上引用的ATSCA/52A文献中所描述的那样检测幅度瞬变。表示所选择分段长度的信息沿路径2传送到格式化器7以包含在输出信号中。在省略分析器47和路径2的替换实现中使用固定长度分段。

a)分析窗口函数

窗口42通过利用分析窗口函数加权每个分段中的源信号采样而形成重叠段序列。响应于从路径2接收的分段长度信息，适配用于每个分段的分析窗口函数的长度和形状。可以使用各种各样的窗口函数，但是通常优选Kaiser-Bessel-Derived(KBD)窗口函数，因为它具有极佳的频率选择性特性。这种窗口函数从可以如下表示的Kaiser-Bessel窗口函数推导出：

W (n) = \frac{I_{0} [πα \sqrt{1 - {(\frac{n}{N / 2})}^{2}}]}{I_{0} [πα]},

0≤n＜N (1)

其中，α＝Kaiser-Besselα因数，

n＝窗口函数采样号，

N＝以采样数量表示的窗口函数长度，以及

I_{0} [x] = Σ_{k = 0}^{\infty} \frac{{(x / 2)}^{k}}{k!}

从4到7的α值对于典型的音频编码应用来说所起作用良好。

上述推导利用长度等于期望窗口函数长度N减去重叠区间v的矩形窗口函数卷积Kaiser-Bessel窗口函数W(n)。参见表达式2。这种卷积可以简化为如表达式3所示。

WP (n) = \frac{Σ_{k = 0}^{N - 1} s (k) W (n - k)}{Σ_{k = 0}^{v} W (k)},

0≤n＜N (2)

WP (n) = \frac{Σ_{k = 0}^{N - v - 1} W (n - k)}{Σ_{k = 0}^{v} W (k)},

0≤n＜N (3)

其中，v＝在分段重叠区间内的采样数量，

N＝窗口函数的期望长度，

W(n)＝长度为v+1的Kaiser-Bessel窗口函数

WP(n)＝长度为N的推导积窗口，以及

通过取推导积窗口WP(n)的平方根可以获得KBD分析窗口函数。在表达式4中示出了这种分析窗口函数。

WA (n) = \sqrt{\frac{Σ_{k = 0}^{N / 2 - 1} W (n - k)}{Σ_{k = 0}^{n / 2} W (k)}},

0≤n＜N (4)

b)主变换

主变换43将加窗源信号采样的每个分段变换成一组频谱系数。一组系数中的每个系数表示用于特定频率的加窗分段的频谱内容。在优选实现中使用O-TDAC MDCT。这种变换可以表示为：

C (k, m) = Σ_{n = 0}^{N - 1} x (n + m \cdot \frac{N}{2}) \cdot WA (n) \cdot \cos [\frac{2 π (k + \frac{1}{2}) (n + \frac{N}{4} + \frac{1}{2})}{N}],

0≤k＜N(5)

其中，k＝频率系数号，

n＝输入信号采样号，

m＝源信号分段号，

N＝源信号分段长度，

x(n)＝在采样n处源信号x的值，以及

C(k)＝MDCT系数k。

O-TDAC MDCT产生以下形式的一组频谱系数：

{C (k, m)} = [\begin{matrix} C (k, m) & 0 \leq k < \frac{N}{2} \\ 0 & k = \frac{N}{2} \end{matrix} - - - (6)

主变换可以直接地根据表达式5实现或者通过在计算上效率更高的处理诸如使用在美国专利5394473中描述的快速傅里叶变换(FFT)的那些处理来实现。可以响应于分段长度使用基本上任何可期望的处理来适配分析窗口函数和主变换。在美国专利5214742、美国专利5394473、上述ATSC A/52A文献以及ISO/MPEG AAC文献中公开了几种技术。

表示用于一个或更多相应频率中每个频率的加窗源信号分段的频谱内容的频谱系数沿相应信号路径传递并存储在缓冲器中。例如，图4所示的发送机沿两条信号路径中的一条传送用于两个相应频率中每个频率的频谱系数以存储在缓冲器44a和44b中。为了清楚例示，在图4中只示出了两条信号处理路径。在典型系统中使用的分析滤波器组3的实现可具有成百上千的路径。

c)频谱分量分析

参考图4所示的上部信号路径，用于分段序列中特定频率的频谱系数存储在缓冲器44a中并组合成块。分析器48a确定每个块中系数的数量，即块长度，并沿路径49a传送该长度。这个长度可以通过分析缓冲器44a中存储的系数来确定。对于本发明来说特定的分析方法不是原则上关键的。这里描述了几种分析方法。

一种基本的方法形成频谱系数的最长可能块，其中相应块中的系数在数值上充分地类似。这可以通过各种方法予以确定。一种方法是计算相邻频谱系数之间的数值差并识别平均差小于某一阈值的相邻系数的最长块。另一种方法是使用缓冲器中存储的用于多条信号路径的频谱系数。这种方法针对频谱系数带对数值差求和以及识别在该带上平均差小于某一阈值的最长块。这个带的宽度可以与所谓的人听觉系统的临界带宽相当。

另一种基本方法依赖于通过在发送机中其它地方进行的信号编码处理执行的信号分析。例如，与上述A/52A文献中描述的比特流标准兼容的发送机产生具有频谱系数的编码信号，该频谱系数表示为与定标因子相关的定标值。分析这些定标因子以识别能够共享同一组定标因子的MDCT系数组序列。分析器48a将用于其相应信号路径的块长度适配成等于共享指数的系数组的数量。

d)次变换

次变换45a将频谱系数的每个块变换成一组混合变换系数。响应于从路径49a接收的块长度信息适配该变换的长度。在优选实现中，类型-II DCT被应用于不相互重叠的频谱系数块。这种变换可以表示为：

X (k, j) = \sqrt{\frac{2}{M}} \cdot R_{j} \cdot Σ_{m = 0}^{M - 1} C (k, m) \cos [\frac{j (2 m + 1) π}{2 M}],

0≤j＜M (7)

其中，X(k，j)＝对于MDCT系数k的混合变换系数j，

M＝MDCT系数k的块长度，以及

R_{j} = [\begin{matrix} \frac{1}{\sqrt{2}} & j = 0 \\ 1 & j &NotEqual; 0 \end{matrix}

所述次变换可以直接根据表达式7实现或者它可以通过在计算上效率更高的已知处理诸如Rao等人的“Discrete Cosine Transform”(Academic Press，Inc.，1990)的第4章中描述的处理实现。

e)格式化器和其他信号路径

格式化器46a是可用来将混合变换系数以及块长度信息组合到编码器5和格式化器7所能够处理的数据中的可选组件。这允许图1中所示发送机中的分析滤波器组3在对发送机剩余部分的改变最小的情况下通过混合变换实现。

缓冲器44b、分析器48b、次变换45b、以及格式化器46b在下部信号路径中执行类似于以上对于上部信号路径中相应组件所讨论的处理。

f)编码

在典型的系统中，编码器5产生以某种编码形式表示混合变换系数的编码的信息。如果使用感知编码处理，混合变换系数将被编码成减小感知不相关性的形式。感知编码处理通常使得频谱信息丢失，这不能够通过接收机恢复或重建。这种丢失的概率在以下通过符号

表示，它表示对混合变换产生的混合变换系数的可能修改。对于本发明而言使用这种编码处理并不是关键。

2.合成滤波器组

参考图5，去格式化器51a和51b根据分别从路径26a和26b接收的数据获得混合变换系数和块长度信息。该块长度信息沿路径59a和59b传送，以及混合变换系数被传送到逆次变换52a和52b。为了清楚例示，在图5中只示出了两个信号处理路径。在典型系统中使用的合成滤波器组27的实现可具有成百上千的路径。

去格式化器51b、逆次变换52b、缓冲器53b在下部信号路径中执行类似于以下对于上部信号路径中相应组件所讨论的处理。

a)去格式化器

参考图5所示的上部信号路径，去格式化器51a是可用于根据从去格式化器23和解码器25接收的数据分解多组混合变换系数和块长度信息的可选组件。这允许在对接收机剩余部分的改变最小的情况下将合成滤波器组27的混合变换实现包含在图2所示的现有接收机中。

b)逆次变换

逆次变换52a将一组混合变换系数变换成频谱系数块，该频谱系数表示对于源信号分段序列的特定频率的频谱内容。该频谱系数块存储在缓冲器53a中。响应于从路径59a接收的块长度信息而适配变换的长度。在优选实现中，类型-II IDCT被应用于不相互重叠的频谱系数块。这种变换可以如下表示：

\hat{C} (k, m) = \sqrt{\frac{2}{M}} \cdot Σ_{j = 0}^{M - 1} R_{j} \cdot \hat{X} (k, j) \cos [\frac{j (2 m + 1) π}{2 M}],

0≤m＜M (8)

其中，

该逆次变换可以直接根据表达式8实现或者它可以通过在计算上效率更高的已知处理实现。

c)逆主变换

缓冲器53a和53b存储频谱系数并将这些频谱系数传送到逆主变换54，以使得该逆主变换接收多组表示相应源信号分段的频谱内容的频谱系数。通过应用逆变换于该多组频谱系数而产生信号采样的分段并存储在缓冲器55中。响应于从路径22接收的分段长度信息而适配逆主变换的长度。在优选实现中使用O-TDAC IMDCT。

在典型的应用中，在发送机中丢弃一半的MDCT系数。该丢弃的系数可以通过接收机使用以下表达式进行恢复：

\hat{C} (k) = - \hat{C} (N - k),

N/2≤k＜N (9)

O-TDAC IMDCT可以如下表示：

\hat{x} (n + m \cdot \frac{N}{2}) = \frac{1}{N} Σ_{k = 0}^{N - 1} \hat{C} (k, m) \cdot \cos [\frac{2 π (k + \frac{1}{2}) (n + \frac{N}{4} + \frac{1}{2})}{N}],

0≤n＜N (10)

其中，

所述逆主变换可以直接根据表达式10实现或者它可以通过在计算上效率更高的已知处理诸如使用在美国专利5394473中描述的FFT的那些处理实现。

d)合成窗口函数

窗口56通过利用合成窗口函数来加权缓冲器55中存储的信号采样分段并将加权的采样添加到在重叠部分中相互重叠的分段中，产生沿路径29的输出信号。所述逆主变换、合成窗口函数以及重叠添加处理消除了由正向变换产生的时域混叠赝象的至少相当大部分。消除可能不精确，这是因为由编码处理以及在计算主和次变换中有限的算术精度所导致的对变换系数的修改。响应于从路径22接收的分段长度信息，适配用于每个分段的合成窗口函数的长度和形状。在优选实现中使用等于以上在表达式4中示出的分析窗口函数WA的KBD窗口函数。

可以响应于分段长度信息使用诸如以上描述的处理来适配合成窗口函数以及逆主变换。

C.实现

前面的公开仅仅阐述了几种实现。可以使用各种各样的变换和变换类型。可以以各种各样的方式来应用和实现本发明的原理。

包含本发明各个方面的设备可以以各种方式实现，其中包括计算机或其他设备执行的软件，这些设备包括更专用组件诸如耦合至类似于通用计算机中的那些组件的数字信号处理器(DSP)电路。图3是可用于实现本发明各个方面的设备70的示意方框图。DSP 72提供计算资源。RAM 73是DSP 72使用的用来进行信号处理的系统随机存取存储器(RAM)。ROM 74表示某种形式的永久性存储器诸如只读存储器(ROM)，用于存储操作设备70以及执行本发明各个方面所需的程序。I/O控制器75表示通过通信信道76、77接收和发送信号的接口电路。模数转换器和数模转换器可以根据接收和/或发送模拟信号的需要包括在I/O控制器75中。在所示的实施例中，所有主要的系统组件连接到总线71，该总线可以表示不止一条物理总线；但是，不需要总线体系结构实现本发明。

在以通用计算机系统实现的实施例中，可以包括附加的组件用于对接设备诸如键盘或鼠标以及显示器，以及用于控制具有存储媒体诸如磁带或磁盘、或光学媒体的存储设备。该存储媒体可用来记录用于操作系统的指令的程序、实用程序和应用程序，并且可以包括实现本发明各个方面的程序的实施例。

通过以各种各样方式实现的组件，包括离散的逻辑组件、集成电路、一个或更多ASIC和/或程序控制的处理器，能够执行实践本发明各个方面所需的功能。实现这些组件的方式对于本发明来说并不重要。

本发明的软件实现可以通过各种各样的机器可读媒体诸如包括从超声到紫外线频率的整个频谱中的基带或调制通信路径、或使用基本上任何记录技术传送信息的存储媒体包括磁带、卡或磁盘、光卡或光盘、以及在象纸这样的媒体上的可检测标记进行传送。

Claims

1.一种产生输出信号的方法，包括：

接收具有频谱内容的源信号的采样；

应用主变换于所述采样的重叠分段以产生多组频谱系数，其中，所述主变换是修改离散余弦变换，每组频谱系数具有时域混叠赝象并表示对于一组频率的相应源信号分段的频谱内容；

根据所述多组频谱系数获得表示该组频率中的相同频率的多个频谱系数，并将所述多个频谱系数组合成一个或更多频谱系数块，其中，响应于块长度控制信号而适配在所述一个或更多块中每个块中组合的频谱系数的数量；

应用次变换于所述一个或更多频谱系数块以产生一组或更多组混合变换系数，其中，所述次变换是应用于不相互重叠的频谱系数块的离散余弦变换，响应于块长度控制信号而适配应用于所述一个或更多频谱系数块中每个块的所述次变换的长度；

通过根据感知模型用增益自适应量化来量化所述一组或更多组混合变换系数，产生编码的信息；以及

将表示所述一组或更多组混合变换系数的所述编码的信息以及所述块长度控制信号组合到输出信号中。

2.一种产生输出信号的方法，包括：

接收包含编码的信息的输入信号，该编码的信息表示源信号的频谱内容；

通过根据感知模型按照增益自适应量化的逆过程对所述编码的信息进行去量化，从该输入信号获得块长度控制信号和一组或更多组混合变换系数；

应用逆次变换于该一组或更多组混合变换系数以产生一个或更多频谱系数块，该频谱系数表示对于在一组频率中相同频率的源信号的频谱内容，其中，所述逆次变换是应用于表示不相互重叠的频谱系数块的多组混合变换系数的逆离散余弦变换，响应于所述块长度控制信号而适配应用于所述多组混合变换系数的所述逆次变换的长度；

将所述频谱系数组合成多组频谱系数，其中，每组频谱系数具有时域混叠赝象并表示对于该组频率中所有频率的源信号的分段的频谱内容；以及

应用逆主变换于该多组频谱系数以产生对应于源信号的分段的输出信号分段，其中，该逆主变换是逆修改离散余弦变换，而且该逆主变换基本上消除所述时域混叠赝象。

3.一种用于产生输出信号的设备，包括：

用于接收具有频谱内容的源信号的采样的装置；

用于应用主变换于所述采样的重叠分段以产生多组频谱系数的装置，其中，所述主变换是修改离散余弦变换，每组频谱系数具有时域混叠赝象并表示对于一组频率的相应源信号分段的频谱内容；

用于根据所述多组频谱系数获得表示该组频率中的相同频率的多个频谱系数并将所述多个频谱系数组合成一个或更多频谱系数块的装置，其中，响应于块长度控制信号而适配在所述一个或更多块中每个块中组合的频谱系数的数量；

用于应用次变换于所述一个或更多频谱系数块以产生一组或更多组混合变换系数的装置，其中，所述次变换是应用于不相互重叠的频谱系数块的离散余弦变换，响应于块长度控制信号而适配应用于所述一个或更多频谱系数块中每个块的所述次变换的长度；

用于通过根据感知模型用增益自适应量化来量化所述一组或更多组混合变换系数，产生编码的信息的装置；以及

用于将表示所述一组或更多组混合变换系数的所述编码的信息以及所述块长度控制信号组合到输出信号中的装置。

4.一种用于产生输出信号的设备，包括：

用于接收包含编码的信息的输入信号的装置，该编码的信息表示源信号的频谱内容；

用于通过根据感知模型按照增益自适应量化的逆过程对所述编码的信息进行去量化，从该输入信号获得块长度控制信号和一组或更多组混合变换系数的装置；

用于应用逆次变换于该一组或更多组混合变换系数以产生一个或更多频谱系数块的装置，该频谱系数表示对于在一组频率中相同频率的源信号的频谱内容，其中，所述逆次变换是应用于表示不相互重叠的频谱系数块的多组混合变换系数的逆离散余弦变换，响应于所述块长度控制信号而适配应用于所述多组混合变换系数的所述逆次变换的长度；

用于将所述频谱系数组合成多组频谱系数的装置，其中，每组频谱系数具有时域混叠赝象并表示对于该组频率中所有频率的源信号的分段的频谱内容；以及

用于应用逆主变换于该多组频谱系数以产生对应于源信号的分段的输出信号分段的装置，其中，该逆主变换是逆修改离散余弦变换，而且该逆主变换基本上消除所述时域混叠赝象。