CN1302458C

CN1302458C - 解码方法和解码装置

Info

Publication number: CN1302458C
Application number: CNB2004101000522A
Authority: CN
Inventors: 东山惠佑; 铃木志朗; 辻实
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2002-05-07
Filing date: 2003-04-30
Publication date: 2007-02-28
Anticipated expiration: 2023-04-30
Also published as: JP4296752B2; KR100941011B1; US7428489B2; CN1256715C; EP1503370B1; US20040196770A1; EP1503370A4; EP1503370A1; CN1629936A; JP2003323198A; KR20040101180A; CN1524261A; WO2003096325A1; DE60331729D1

Abstract

在解码装置(30)中，功率校正频谱产生/合成单元(37₁到37₄)根据量化准确度信息、归一化系数、增益控制信息、和功率调整信息调整功率校正频谱PCSP的功率。通过将低于阈值的频谱替代为功率调整之后的功率补偿频谱PCSP，或通过将功率调整之后的功率补偿频谱PCSP加入到频谱SP，来调整频谱SP的功率。

Description

解码方法和解码装置

本申请是申请日为2003年4月30日、申请号为03800620.0、发明名称为“编码方法、编码装置、解码方法、和解码装置”的发明专利申请的分案申请。

技术领域

本发明涉及一种编码方法和装置，一种解码方法和装置，一种程序，和一种记录介质，特别涉及一种用于高效率地编码声学信号(acoustic signal)和声音信号(sound signal)的数字数据以便发送如此编码的数据或记录如此编码的数据到一种记录介质的方法和装置，特别涉及一种用于接收或重现编码的数据以便解码如此接收或重现的编码的数据的方法和装置，特别涉及一种具有记录在其中能够被计算机读出的程序的记录介质。

本申请要求于2002年5月7日申请的日本专利申请No.2002-132188的优先权，其全部引用于此作为参考。

背景技术

传统上，作为高效率地编码声音信号的音频信号等的方法，所知的有不分块频带划分系统(non-blocking frequency band division system)，比如频带划分编码(子带编码，subband encoding)，分块频带划分系统，比如转换编码。

在不分块频带划分系统中，时基(time base)音频信号被划分到多个频带而不阻塞信号，并编码如此划分的信号。另一方面，在分块频带划分系统中，时基信号被转换为频基(frequency base)信号(频谱转换)，并且如此转换的信号被划分到多个频带。然后，通过频谱转换获得的系数根据预定的相应频带被加在一起(put together)，并在相应频带对如此划分的信号进行编码。

此外，作为提高编码效率的方法，这里建议了一种高效率的编码方法连带地介绍了不分块频带划分系统和分块频带划分系统。使用这种方法，在使用频带划分编码执行了频带划分之后，通过频谱转换划分到相应频带的信号被转换为频基信号，并在相应的频带对如此转换的信号进行编码。

在执行频带划分中，由于能够简单地处理信号和去除混淆失真，QMF(正交镜象滤波器)可以在很多情况下被使用。由QMF进行频带划分的详细内容被写在“1976R.E.Crochiere，Digital coding of speech in subbands(在子带中语音的数字编码)，Bell Syst.Tech.J.Vol.55，No.8 1976”。

此外，作为执行频带划分的方法，所知的PQF(多相正交滤波器)是相等频宽的滤波器划分方法。PQF的详细内容被写在“ICASSP 83 BOSTON，Polyphase Quadrature Filters-A new subband coding technique(多相正交滤波器-一种新的子带编码技术)，Joseph H.Rothweiler”。

另一方面，如上所述的频谱转换，例如用预定单元时间的帧分块输入的音频信号，而且通过在各自的块经受DFT(离散傅里叶变换)、DCT(离散余弦变换)、MDCT(改进的离散余弦变换)使时基信号转换为频基信号。

MDCT的详细内容被写在“ICASSP 1987，Subband/Transform CodingUsing Filter Bank Designs Based on Time Domain Aliasing Cancellation(使用滤波器组设计基于时域混淆的消除的子带/变换编码)，J.P.Prince，A.B.Bradley，Univ.of Surrey Royal Melbourne Inst.of Tech.”。

通过量化(quantizing)使信号划分到通过滤波器和频谱转换获得的相应的频带中，引起量化噪声的频带能够被控制，这使得能够利用掩蔽效应(maskingeffect)的性质等在听觉范围(auditory sense)内进行高效率的编码。此外，在量化之前，相应频带的信号分量由每个频带的信号分量的绝对值的最大值进行归一化(normalize)，这使得能够更高效率地进行编码。

在执行频带划分中，相应的频带带宽是考虑到人类的听觉特性而被确定的。即，一般来讲，音频信号被划分到在临界频带下的多个频带(例如，32个频带)，其中更高的频带具有更宽的带宽。

在相应频带的数据编码中，执行位分配(bit allocation)以便将预定位或自适应位(adaptable bit)分配到相应的频带。即，在通过使用位分配对通过MDCT处理所获得的系数数据进行编码中，位数被自适应地分配到通过对分块(block)到相应块中的信号执行MDCT处理所获得的相应频带的系数数据中。

作为位分配方法，已知的一种执行位分配的方法基于相应频带的信号数量(在下文中适当地将其称为第一种位分配方法)，和一种固定地(fixedly)执行位分配的方法，其中对相应频带的信噪比是通过利用听觉掩蔽(auditorymasking)(在下文中适当地将其称为第二种位分配方法)而获得的。

第一种位分配方法的详细内容被写在“Adaptive Transform Coding ofSpeech Signals(语音信号的自适应变换编码)，R.Zelinski和P.Noll，IEEE声学会报，语音和信号处理，vol.ASSP-25，No.4，1977年8月”。

第二位分配的详细内容被写在“ICASSP 1980，The critical band coderdigital encoding of the perceptual requirements of the auditory system(听觉系统的感性要求的临界频带编码器编码)，M.A.Kransner Mit”。

使用第一位分配方法，量化噪声频谱是平面化的、最小化的噪声能量。然而，由于掩蔽效应并没有利用到听觉范围内，实际的听觉噪声水平并不是最优化的。另一方面，使用第二位分配方法，例如在能量集中在一个特定频率的情况下，即使输入正弦波，由于位分配是固定地执行的，而不能获得想要性质的数值。

所以，建议高效率的编码装置把将要在位分配中使用的全部位划分到为相应小块预先确定的位分配模式的位中，和取决于相应块的信号数量的位分配的位中，而且所述装置使得划分率(division ration)取决于与输入信号相关的一个信号。即，例如，当信号的频谱平滑时，便提高了固定的位分配的划分比例。

使用这种方法，在能量集中在一个特定频谱的情况下，当输入正弦波时许多位被分配到包括所述频谱的块中，这样能大大提高总的信噪比。一般来讲，由于人类听觉对具有陡谱(steep spectrum)分量的信号极其敏感，上述信噪比的改善不但改善了测量数据值，还有效地改善了在听觉范围内声音的质量。

作为位分配的方法，除了上述方法还建议了许多其它方法，并且涉及听觉的模型变得精炼了。编码装置在操作性能上的改善使得从听觉角度的高效率编码成为可能。

在使用DFT或DCT作为转换波形信号为频谱信号的方法的情况下，当使用由M组样值组成的时间块转换信号时，能够获得M组独立的实数数据。一般来讲，为了减少时间块(帧)之间的连接失真，每个块都与两个相邻块分别交迭了预定的M1组样值。因此，当使用利用DFT或DCT的编码方法时，M组实数数据被量化以便平均为(M-M1)组样值编码。

在使用MDCT作为将时基信号转换为频谱信号的方法的情况下，M组独立的实数数据能够从每个块都与相邻块分别交迭了M组样值的2M组样值中获得。因此，在这种情况下，M组实数数据被量化以便平均为M组样值编码。然后，解码装置通过将从经过反向转换而相应块获得的波形分量和相互干扰的相应波形分量相加，从利用MDCT的上述方法中获得的代码中重建波形信号。

一般来讲，通过使用于转换的时间块(帧)更长，改善了频谱的频率分辨率，并且能量集中在一个特定的频谱分量上。在使用MDCT的情况下，其中信号使用每个块都与两个相邻的块交迭了一半的长块进行转换，并且获得的频谱的数量与原始时间样值的数量比没有增加，则与使用DFT或DCT的情况比，能够实现高效率的编码。此外，通过使邻近的块具有适当长的交迭，能够减少波形信号的块之间的失真。

在产生实际的代码序列中，首先，量化准确度信息表示用于执行量化的量化步骤，而归一化系数信息表示用于归一化相应信号分量的系数，这些信息被编码为其中将要执行归一化和量化的相应频带的预定数量的位。对归一化的和量化的频谱进行编码。

在“IDO/IEC 11172-3：1933(E)，1993”中写了一种高效率编码方法，其中位的数量表示不同频带设置了不同的量化准确度信息。根据所述方法，规定较高频带的具有较少数量的位表示量化准确度信息。

图1表示通过频带划分对音频信号等进行编码的传统编码装置100的框图。频带划分单元101接收要编码的音频信号，并且将如此接收的音频信号使用滤波器QMF、PQF等划分到例如四个频带。当使用频带划分单元101将音频信号划分到频带时，相应频带(在下文中将其适当地称为编码单元)的宽度根据临界频带可以是互相相等或不相等。在这个例子中，音频信号被划分到四个编码单元，虽然编码单元的数量并不限定于这个数字。然后，频带划分单元101将所述划分到四个编码单元(在下面全指第一到第四编码单元)的音频信号，发送到相应于相应预定时间块(帧)的增益控制单元102₁到102₄。

增益控制单元102₁到102₄根据在相应块中的相应信号的幅值产生增益控制信息，并基于增益控制信息控制在相应块中的信号的增益。然后，增益控制单元102₁到102₄将通过增益控制获得的第一到第四编码单元的信号发送到频谱转换单元103₁到103₄，同时发送所述增益控制信息到多路复用器107。

频谱转换单元103₁到103₄对相应编码单元的经过增益控制的时基信号执行例如MDCT的频谱转换以产生频基信号，并将如此产生的频基信号分别发送到归一化单元104₁到104₄，同样发送到量化准确度确定单元105。

归一化单元104₁到104₄从构成第一到第四编码单元的相应信号的相应信号分量中提取最大绝对值的信号分量，并将相应于如此提取的信号分量的系数设置为第一到第四编码单元的归一化系数。然后，归一化单元104₁到104₄使用相应于第一到第四编码单元的归一化系数的值，对构成第一到第四编码单元的相应信号的相应信号分量进行归一化或划分。因此，在这种情况下，通过归一化所获得的归一化的数据范围从-1.0到1.0。归一化单元104₁到104₄将第一到第四编码单元的归一化的数据分别发送到量化单元106₁到106₄，同时将第一到第四编码单元的归一化系数发送到多路复用器107。

量化准确度确定单元105基于从增益控制单元102₁到102₄发送的第一到第四编码单元的信号，确定将在量化第一到第四编码单元的归一化的数据中使用的量化步骤。然后，量化准确度确定单元105相应于量化步骤将第一到第四编码单元的量化准确度信息发送到量化单元106₁到106₄，以及到多路复用器107。

量化单元106₁到106₄，通过使用相应于第一到第四编码单元的量化准确度信息的量化步骤对数据进行量化，以对第一到第四编码单元的归一化的数据进行编码，并将如次获得的第一到第四编码单元的量化系数发送到多路复用器107。

多路复用器107对量化系数、量化准确度信息、归一化系数和第一到第四编码单元的增益控制信息进行编码，如果需要，对那些数据进行多路复用。然后，多路复用器107经由传输线路发送通过多路复用处理获得的编码的数据，或将编码的数据记录到未示出的记录介质。

量化准确度确定单元105能基于归一化数据确定量化步骤，或能够考虑到例如掩蔽效应的听觉现象来确定量化步骤，而不是基于通过频带划分所获得的信号来确定量化步骤。

图2表示对从编码装置100输出的编码的数据进行解码的传统解码装置120的框图。在图2中所示解码装置120中，多路分配器121将输入的编码数据解码和多路分解为量化系数、量化准确度信息、归一化系数和第一到第四编码单元的增益控制信息。然后，多路分配器121将量化系数、量化准确度信息、和第一到第四编码单元的归一化系数发送到相应于相应编码单元的信号分量构成单元122₁到122₄，同时将第一到第四编码单元的增益控制信息发送到相应于相应编码单元的增益控制单元124₁到124₄。

信号分量构成单元122₁使用相应于第一编码单元的量化准确度信息的量化步骤，对第一编码单元的量化系数进行解量化(dequantize)，以产生第一编码单元的归一化的数据。此外，分量构成单元122₁通过将数据乘以一个相应于第一编码单元的归一化系数的值来对第一编码单元的归一化数据进行解码，并将如次获得的第一编码单元的信号发送到频谱反转换单元123₁。

信号分量构成单元122₂到122₄执行类似的解码处理以产生第二到第四编码单元的信号，并将如次获得的第二到第四编码单元的信号分别发送到频谱反转换单元123₂到123₄。

频谱反转换单元123₁到123₄对解码的频基信号执行例如IMDCT的频谱反转换以产生时基信号，并将如次产生的时基信号发送到增益控制单元124₁到124₄。

增益控制单元124₁到124₄基于从多路分配器121发送的增益控制信息执行增益控制补偿处理，并将如此获得的第一到第四编码单元的信号发送到频带合成单元125。

频带合成单元125执行频带合成以合成从增益控制单元124₁到124₄发送第一到第四编码单元的信号，以恢复原始的音频信号。

由于从图1中所示的编码装置100提供或传输到图2中所示的解码装置120的编码的信号包括量化准确度信息，在解码装置120中使用的听觉模型能够被任意地设立。即，对相应编码单元的量化步骤能够在编码装置100中被自由地设立，这能够在改善编码装置100的操作性能和听觉模型的精致的同时，在不替换或升级解码装置120的情况下改善声音质量和加强压缩比。

另一方面，在这种情况下，编码量化准确度信息的位的数量本身变得不期望地大，这使得在一定程度上(from a level)很难改善整体的编码效率。

有一种方法，例如操作解码装置从归一化信息确定量化准确度信息，而不是直接编码量化准确度信息。然而，使用这种方法，归一化系数和量化准确度信息之间的关系便在确定标准的同时确定了，这使得很难引入基于未来高级的听觉模型的量化准确度的控制。而且，如果实际压缩比率具有一定的宽度，归一化系数和量化准确度信息之间的关系就必须对压缩比率的相应值来确定。

因此，为了在一定程度上改善压缩比率，不但需要改善主要信息或例如在图1中所示的音频信号的用于编码的直接对象的编码效率，而且需要改善例如量化准确度信息和归一化系数的不是编码的直接对象的次要信息的编码效率。

本发明的发明人在日本专利申请No.2000-390598和日本专利申请No.2001-182383的说明书和附图中建议了一种改善次要信息的编码效率的方法。此外，本发明的发明人在日本专利申请No.2001-182093的说明书和附图中建议了一种改善在编码系统中控制增益的增益信息的编码效率。根据那些技术，次要信息的编码效率能够通过使用利用各种相互关系等的可变代码字长度编码来改善。

然而，利用编码装置的给定位数，如果需要非常高的压缩比率，有可能不能维持可以避免量化噪声被察觉到的量化准确度。在这种情况下，编码装置常常减少分配给主要信息的位。特别的，归一化的数据(频谱)被“0”或一个很小的值取代，或者执行量化的带宽被缩窄。

结果，这就产生了一个问题，即解码的和恢复的声音由于临时的频带变化(variation)而包括了反常的声音和噪声，以及由于频谱替代为“0”或一个很小的值而功率匮乏。特别是当极大地提高了压缩比率时，那些现象就非常显著的、不期望地被觉察到，而导致听觉问题。

发明内容

相应地，本发明的一个目的是克服上述已有技术的缺点，通过提供：一种编码方法和装置、一种解码方法和装置，用于接收或重放编码的数据以对如次接收或重放的编码的数据进行解码；一种程序，用于使计算机运行编码处理和解码处理；以及一种记录介质，其中记录了能够被计算机所读出的程序。本发明能够减少由于临时的频带变化产生的反常声音和噪声，以及当提高压缩比率时引起的功率匮乏。

通过提供一种用于对经过频谱转换而从输入的数字信号中产生的频谱进行编码的编码方法能够达到以上目的，所述方法包括：功率调整信息产生步骤，产生功率调整信息以调整功率补偿频谱的功率，所述功率补偿频谱将在解码侧与所述频谱合成在一起；以及编码步骤，将功率调整信息和所述频谱一起进行编码。

在功率调整信息产生步骤中，基于输入数字信号的音调产生功率调整信息。

在编码方法中，产生功率调整信息以调整功率补偿频谱的调整功率，所述功率补偿频谱在解码侧与所述频谱合成在一起，并且功率调整信息与所述频谱一起进行编码。

通过提供一种用于对经过频谱转换而从输入的数字信号产生的频谱进行编码的编码装置也能够达到以上目的，所述装置包括：功率调整信息产生装置，用于产生功率调整信息以调整功率补偿频谱的功率，所述功率补偿频谱将在解码侧与所述频谱合成在一起；以及编码装置，用于将功率调整信息和所述频谱一起进行编码。

功率调整信息产生装置基于输入数字信号的音调产生功率调整信息。

在编码装置中，产生功率调整信息以调整功率补偿频谱的调整功率，所述功率补偿频谱在解码侧与所述频谱合成在一起，并且功率调整信息与所述频谱一起进行编码。

通过提供一种用于对经过频谱转换而和编码而从数字信号中产生的频谱进行解码的解码方法也能够达到以上目的，所述方法包括：解码步骤，对所述频谱进行解码；功率补偿频谱产生步骤，产生功率补偿频谱；以及合成步骤，将解码的频谱和功率补偿频谱合成在一起。

在功率补偿频谱产生步骤中，通过参考从预定频谱模式产生的一个表中的值，产生功率补偿频谱。在参考表中的值中，可以使用例如高斯分布(Gaussian distribution)的随机数序列，或者可以使用在编码频谱中使用的归一化信息、量化准确度信息等。

在解码方法中，可以包括调整功率补偿频谱功率的功率补偿步骤。在功率调整步骤中，基于在解码所述频谱中使用的归一化系数或量化准确度信息，或者在编码所述频谱中已经被编码了的功率调整信息，来调整功率补偿频谱的功率。在这种情况下，在合成步骤中，解码的频谱和功率调整的功率补偿频谱(power-adjusted power compensation spectrum)被合成在一起。

在合成步骤中，频谱和功率补偿频谱被加在一起，或将至少所述频谱的一部分替代为功率补偿频谱。

在解码方法中，基于量化准确度信息、归一化系数、和功率调整信息，调整功率补偿频谱的功率；并且通过将所述频谱和功率补偿频谱相加，或通过将至少所述频谱的一部分替代为功率补偿频谱，而将功率调整的功率补偿频谱和解码的频谱合成在一起。

通过提供一种用于对经过频谱转换和编码而从数字信号中产生的频谱进行解码的解码装置也能够达到以上目的，所述装置包括：解码装置，用于对所述频谱进行解码；功率补偿频谱产生装置，用于产生功率补偿频谱；以及合成装置，用于将解码的频谱和功率补偿频谱合成在一起。

功率补偿频谱产生装置通过参考从预定频谱模式产生的一个表中的值，产生功率补偿频谱。在参考表中的值中，可以使用例如高斯分布的随机数序列，或者可以使用在编码频谱中使用的归一化信息、量化准确度信息等。

在解码装置中，可以包括调整功率补偿频谱功率的功率补偿步骤。功率调整装置，基于在解码所述频谱中使用的归一化系数或量化准确度信息，或者在编码所述频谱中已经被编码了的功率调整信息，来调整功率补偿频谱的功率。在这种情况下，合成装置将解码的频谱和功率调整的功率补偿频谱合成在一起。

合成装置将频谱和功率补偿频谱加在一起，或将至少所述频谱的一部分替代为功率补偿频谱。

解码装置基于量化准确度信息、归一化系数、和功率调整信息，调整功率补偿频谱的功率；并且通过将所述频谱和功率补偿频谱相加，或通过将至少所述频谱的一部分替代为功率补偿频谱，而将功率调整的功率补偿频谱和解码的频谱合成在一起。

通过提供一种用于使计算机运行上述编码处理和解码处理的程序，以及一种具有记录在其中能够被计算机读出的程序的记录介质也能够达到以上目的。

本发明的这些目的和其它目的、特性和优点，通过下面对本发明的优选实施例的详细描述将变得更加清楚。

附图说明

图1表示传统编码装置的框图。

图2表示传统解码装置的框图。

图3表示用于解释本发明的基本概念的流程图。

图4表示根据本发明的编码装置的框图。

图5表示根据本发明的解码装置的框图。

图6表示用于解释使用解码装置产生功率补偿频谱PCSP和对功率补偿频谱PCSP的功率调整的处理的例子的流程图。

图7表示用于解释频谱SP和功率补偿频谱PCSP的合成处理的例子的流程图。

图8表示用于解释合成频谱SP和功率补偿频谱PCSP的处理的另一个例子的流程图。

图9表示用于解释产生功率补偿频谱PCSP和对所述功率补偿频谱PCSP的功率调整的处理，以及频谱SP和功率补偿频谱PCSP的合成处理的一个特定例子的图像。

图10A表示原始声音的频谱，图10B表示在经过传统编码之后的频谱，图10C表示在采用本发明使用功率补偿频谱PCSP经过合成处理之后的频谱。

具体实施方式

本发明将结合附图在下面对实现本发明的最佳模式进行进一步的描述。本发明适合下面用于高效率地编码音频信号的数字数据，以便发送如此编码的数据或将如此编码的数据记录到记录介质的编码方法和装置的实施例，以及用于接收或重放编码的数据以便对如此接收或重放的编码的数据进行解码的解码方法和装置的实施例。

图3表示用于解释本发明的基本概念的流程图。首先，在步骤S1中，对频谱SP进行解码。频谱SP可以包括由于当提高压缩比率时由于频谱的损失引起的临时的频带变化所产生的反常声音和噪声，以及功率匮乏。

然后，在步骤S2，产生了功率补偿频谱PCSP。然后，在步骤S3，将频谱SP和功率补偿频谱PCSP合成在一起以产生合成的频谱信号。

即，根据本发明的编码方法和装置、解码方法和装置，产生功率补偿频谱PCSP以便和频谱SP合成在一起。结果，如果提高压缩比率，也能够令人满意地去除由于临时的频带变化产生的反常声音和噪声，以及功率匮乏。

图4表示根据本发明的编码装置10的框图。如图4所示，频带划分单元11接收将要编码的音频信号，并使用QMF(正交镜象滤波器)、PQF(多相正交滤波器)等，将如此接收的音频信号划分为例如四个频带。当使用频带划分单元11将音频信号划分为多个频带时，相应频带(在下面全指编码单元)的宽度根据临界频带可以是互相相等或不相等。在本实施例中，音频信号被划分为四个编码单元，而编码单元的数量并不限定于这个数字。然后，频带划分单元11将划分为四个编码单元(在下面全指第一到第四编码单元)的音频信号发送到相应于相应预定时间块(帧)增益控制单元12₁到12₄。

增益控制单元12₁到12₄根据在相应块中的相应信号的振幅产生增益控制信息，并基于所述增益控制信息控制在相应块中的增益。然后，增益控制单元12₁到12₄将通过增益控制获得的第一到第四编码单元的信号发送到频谱转换单元14₁到14₄，同时将增益控制信息发送到增益控制信息编码单元13。

增益控制信息编码单元13对从增益控制单元12₁到12₄发送的增益控制信息进行编码，并将如此编码的数据发送到多路复用器22。在编码增益控制信息中，能够使用本发明的发明者建议的在日本专利申请No.2001-182093的说明书和附图中的技术。即，增益控制信息的编码效率能够通过使用利用相邻编码单元之间的各种相互关系的可变代码字长度编码来改善。

频谱转换单元14₁到14₄对从增益控制单元12₁到12₄发送的时基信号执行例如MDCT(改进的离散余弦变换)的频谱转换以产生频基频谱SP，并且将如此产生的频谱SP分别发送到归一化单元15₁到15₄和量化准确度确定单元19。

归一化单元15₁到15₄从构成第一到第四编码单元的相应谱SP的相应信号分量中提取最大绝对值的信号分量，并将相应于如此提取的信号分量的系数设置为第一到第四编码单元的归一化系数。然后，归一化单元15₁到15₄使用相应于第一到第四编码单元的归一化系数的值，对构成第一到第四编码单元的相应频谱SP的相应信号分量进行归一化或划分。因此，在这种情况下，通过归一化所获得的归一化的数据范围从-1.0到1.0。归一化单元15₁到15₄将第一到第四编码单元的归一化的数据分别发送到功率调整信息确定单元17₁到17₄和量化单元20₁到20₄，同时将第一到第四编码单元的归一化系数发送到归一化系数编码单元16。

归一化系数编码单元16对从归一化单元15₁到15₄发送的归一化系数进行编码，并将如此编码的数据发送到多路复用器22。在编码归一化系数中，能够使用本发明的发明者建议的在日本专利申请No.2000-390598和日本专利申请No.2001-182093的说明书和附图中的技术。即，归一化系数的编码效率能够通过使用利用相邻编码单元之间、相邻信道之间、相邻时间期间之间等的各种相互关系的可变代码字长度编码来改善，或通过量化草图(roughsketch)信息并对作为结果的量化误差执行可变代码字长度编码来改善。

功率调整信息确定单元17₁到17₄确定将在稍后描述的功率调整信息，以调整在解码侧的功率补偿频谱PCSP的功率。如果在频谱中存在缺失的部分或在原始声音状态中存在被设置为“0”值的部分，当频谱SP在解码侧与功率补偿频谱PCSP合成在一起时，频谱不期望地出现在原本不存在频谱的部分。特别是音调类型的信号时，希望功率补偿频谱PCSP的补偿量很小。

如果在频谱中存在缺失的部分或在例如其音调高于预定值的音调类型的信号的原始声音状态中存在被设置为“0”值的部分，功率补偿频谱PCSP压缩到一个很小的值或设置为“0”。另一方面，如果原始声音的频谱是噪声类型，例如其音调低于一个预定值的噪声类型的信号，功率补偿频谱PCSP被扩大为一个很大的值。因此，基于输入信号的音调来确定功率调整信息，并且在编码侧控制功率补偿频谱PCSP的功率。

有多种使用功率调整信息对功率补偿频谱PCSP的控制方法和控制宽度。如果功率补偿频谱PCSP用“1”位来表示，功率补偿频谱PCSP的功率能够以这样的方式来控制，即如果是音调类型的信号则不控制功率，如果是噪声类型的信号则控制功率。另一方面，如果功率调整信息用4个位来表示，功率补偿频谱PCSP的功率能够以这样的方式来控制，即如果功率调整是“0”则功率补偿频谱PCSP的功率被设置为“0”，如果功率调整不是“0”则功率补偿频谱PCSP的功率用“1”dB步距调整15dB宽度。

功率调整信息编码单元18对从功率调整信息确定单元17₁到17₄发送的功率调整信息进行编码，并将如此编码的数据发送到多路复用器22。由于功率补偿频谱PCSP的产生和合成是在相应的编码单元中执行的，功率调整信息可以在相应编码单元中编码。编码单元将在稍后描述。另一方面，功率调整信息可以在多个编码单元被加在一起(put together)的分组的(grouped)频带中进行编码。这是基于这样的事实：一般来说，信号音调在狭窄频带中的变化不大，以及在很多情况下在集合的频带中能够共享相同值的音调。

由于人类听觉对低频信号敏感，希望功率补偿频谱PCSP对频谱SP的功率补偿量最小化，或者在低频带(例如，350Hz或更低)根本不要执行功率补偿。如果在低于预定频率的频带中不执行功率补偿频谱PCSP对频谱SP的功率补偿，则不需要对相应于所述频带的功率调整信息进行编码。

量化准确度确定单元19基于从频谱转换单元14₁到14₄发送的第一到第四编码单元的频谱SP，确定将在对第一到第四编码单元的归一化的数据进行量化中使用的量化步骤。然后，量化准确度确定单元19相应于量化步骤将第一到第四编码单元的量化准确度信息发送到量化单元20₁到20₄和量化准确度信息编码单元21。

量化单元20₁到20₄通过使用相应于第一到第四编码单元的量化准确度信息的量化步骤来量化所述信息，以便对第一到第四编码单元的归一化的数据进行编码，并将如此获得的第一到第四编码单元的量化系数发送到多路复用器22。

量化准确度信息编码单元21对从量化准确度确定单元19发送的量化准确度信息进行编码，并将如此编码的数据发送到多路复用器22。而且，在编码量化准确度信息中，能够使用在日本专利申请No.2000-390598和日本专利申请No.2001-182093的说明书和附图中建议的技术。

多路复用器22对第一到第四编码单元的量化系数和增益控制信息、量化准确度信息、归一化信息、和功率调整信息一起进行多路复用。然后，多路复用器22经由传输线路发送通过多路复用处理获得的编码的数据，或将编码的数据记录到未示出的记录介质。

如以上所述，编码装置10根据本发明产生功率调整信息，以调整将要在解码侧与频谱SP合成在一起的功率补偿频谱PCSP的功率，并对功率调整信息和频谱SP一起进行编码，然后经由传输线路发送如此编码的数据，或将编码的数据记录到未示出的记录介质出。

图5表示根据本发明的用于对从编码装置10输出的编码的数据进行解码的解码装置30的框图。在图5中所示的解码装置30中，多路分配器31将输入的编码的数据多路分解为量化系数、编码的量化准确度信息数据、编码的归一化信息数据、编码的增益控制信息数据、和第一到第四编码单元的编码的功率调整信息数据。然后，多路分配器31相应于相应的编码单元将第一到第四编码单元的量化系数发送到信号分量构成单元34₂到34₄。而且，多路分配器31将编码的量化准确度信息数据、编码的归一化信息数据、编码的增益控制信息数据、和编码的第一到第四编码单元的功率调整信息数据，分别发送到量化准确度信息解码单元32、归一化信息解码单元33、增益控制信息解码单元35、和功率调整信息解码单元36。

量化准确度信息解码单元32对编码的量化准确度信息数据进行解码，并相应于相应的编码单元将如此解码的量化准确度信息发送到信号分量构成单元34₁到34₄以及功率补偿频谱产生/合成单元37₁到37₄。

归一化信息解码单元33对编码的归一化信息数据进行解码，并相应于相应的编码单元将如此解码的归一化系数发送到信号分量构成单元34₁到34₄以及功率补偿频谱产生/合成单元37₁到37₄。

信号分量构成单元34₁使用相应于第一编码单元的量化准确度信息的量化步骤对第一编码单元的量化系数进行解量化(dequantize)。此外，信号分量构成单元34₁通过将第一编码单元的归一化的数据乘以一个相应于第一编码单元的归一化信息的值来对所述数据进行解码，并将如此获得的第一编码单元的频谱SP发送到功率补偿频谱产生/合成单元37₁。

信号分量构成单元34₂到34₄执行类似的解码处理以产生第二到第四编码单元的频谱SP，并将如此获得的第二到第四编码单元的频谱SP分别发送到功率补偿频谱产生/合成单元37₂到37₄。

增益控制信息解码单元35对编码的增益控制信息数据进行解码，并相应于相应的编码单元将如此解码的增益控制信息发送到功率补偿频谱产生/合成单元37₁到37₄以及增益控制单元39₁到39₄。

功率调整信息解码单元36对编码的功率调整信息数据进行解码，并相应于相应的编码单元将如此解码的功率调整信息发送到功率补偿频谱产生/合成单元37₁到37₄。

功率补偿频谱产生/合成单元37₁到37₄产生功率补偿频谱PCSP，并基于量化准确度信息、增益控制信息、和功率调整信息调整功率补偿频谱PCSP的功率。然后，功率补偿频谱产生/合成单元37₁到37₄将功率调整的功率补偿频谱PCSP和频谱SP合成在一起以补偿频谱SP的功率。将在稍后解释产生功率补偿频谱PCSP和将功率补偿频谱PCSP与频谱SP合成在一起的方法。

频谱反转换单元38₁到38₄对从功率补偿频谱产生/合成单元37₁到37₄发送的补偿了的频谱SP执行例如IMDCT(反向MDCT)的频谱反转换，以产生时基信号，并将如此产生的时基信号发送到增益控制单元39₁到39₄。

增益控制单元39₁到39₄基于从增益控制信息解码单元35发送的增益控制信息对第一到第四编码单元的信号执行增益控制补偿处理，并将如此获得的第一到第四编码单元的信号发送到频带合成单元40。

频带合成单元40执行频带合成，将从增益控制单元39₁到39₄发送的第一到第四编码单元的信号合成在一起，以恢复原始的音频信号。

如上面所述，根据本发明的解码装置30基于包括在编码的数据中的量化准确度信息、归一化系数、增益控制信息、和功率调整信息，调整功率补偿频谱PCSP的功率，然后将功率调整的功率补偿频谱PCSP和频谱SP合成在一起。因此，即使提高了压缩比率，也能够极大地减少由于临时的频带变化产生的反常声音和噪声，以及功率匮乏。

图6表示用于解释使用解码装置产生功率补偿频谱PCSP和对功率补偿频谱PCSP的功率调整的处理的例子的流程图。首先，在步骤S10，从功率补偿频谱表产生功率补偿频谱PCSP。

功率补偿频谱表可以是例如高斯分布的随机数序列，或通过学习使用实际的各种噪声类型的频谱而准备的一序列数，等等。功率补偿频谱表并不局限于一个，并且可以是从提前准备的复数个功率补偿频谱表中选择的。

当产生功率补偿频谱PCSP时，相应于在编码单元中的频谱的数量的值是从功率补偿频谱表中参考的。在这种情况下，由于在时间上连续地参考表的同一个点会引起听觉上的反作用，所以是在时间上随机地对表进行选择。特别的，可以使用一个随机函数来随机地选择数值。另一方面，使得防止每次都产生同一个功率补偿频谱PCSP，希望使用例如归一化系数、量化准确度信息等使得能够在时间上是随机状态的其它参数来随机地选择数值。因此，同样的功率补偿频谱PCSP能够从同一个代码序列中获得而不管解码装置为何。

在下面解释中，作为这样参数的例子，使用将归一化系数的全部索引值(index value)相加的一个值。当功率补偿频谱表的大小是1024并且如果归一化系数的相加的值超过了1024时，使用它的低10位值。

而且，如果在编码单元中的频谱的数量是16，则在接下来的编码单元中不参考在相应编码单元中的同一个点，应所述参考从最初的参考点移动16的点，以防止同一个点被连续地参考。

然后，在步骤S11，基于归一化系数调整功率补偿频谱PCSP的功率。特别地，功率补偿频谱PCSP的最大功率值被调整为归一化系数。

然后，在步骤S12，基于量化准确度信息的值调整功率补偿频谱PCSP的功率。在这个处理中，调整功率补偿频谱PCSP的功率以便在量化准确度高时几乎不执行功率补偿频谱PCSP的补偿，而在量化准确度低时主动地执行功率补偿频谱PCSP的补偿。特别地，功率补偿频谱PCSP可以除以(dividedby)量化准确度信息的值，或者除以量化准确度信息的值的2次方。

然后，在步骤S13，基于功率调整信息的值调整功率补偿频谱PCSP的功率。这个过程是为了防止频谱出现在最初不存在频谱的部分，其中所述频谱是在频谱中存在缺失部分以及没有执行编码或在原始声音状态中被设置为“0”值的部分，通过合成功率补偿频谱PCSP而产生的。

然后，在步骤S14，判断是否存在增益控制信息。在步骤S14，如果存在增益控制信息(是)，处理转到步骤S15，而如果不存在增益控制信息(否)，结束产生功率补偿频谱PCSP的处理和对功率补偿频谱PCSP的功率调整。

然后，在步骤S15，基于增益控制信息的值调整功率补偿频谱PCSP的功率。这个处理是为了防止功率补偿频谱PCSP的功率补偿量过多，这是在如果在增益控制下频谱的增益被提升(lift)，当功率补偿频谱PCSP的增益同时被提升时所引起的。特别地，例如，功率补偿频谱PCSP被除以增益控制信息的最大值。

因此，执行了产生功率补偿频谱PCSP的处理和对功率补偿频谱PCSP的功率调整。在这个处理中，为频谱SP编码的值被用于归一化系数、量化准确度信息、和增益控制信息，并且不需要特别为功率补偿频谱PCSP编码其它的归一化系数，等。

然后，如此功率调整的功率补偿频谱PCSP与频谱SP合成在一起。图7表示用于解释频谱SP和功率补偿频谱PCSP的合成处理的例子的流程图。首先，在步骤S20，计数器的值“i”表示频谱的数量被复位为“0”。

然后，在步骤S21，判断第i个频谱SP[i]等于或小于阈值“Th”。在步骤S21，如果频谱SP[i]等于或小于阈值“Th”(是)，处理转到步骤S22，而如果SP[i]大于阈值“Th”(否)，处理转到步骤S23。

在步骤S22，频谱SP[i]被替代为第i个功率补偿频谱PCSP[i]，并且处理转到步骤S23。

在步骤S23，计数器的值“i”增加“1”以前进到下一个频谱。

然后，在步骤24，判断是否计数器的值“i”达到了在编码单元中频谱的数量。在步骤S24，如果计数器的值“i”达到了在编码单元中频谱的数量(是)，则结束合成处理。另一方面，如果计数器的值“i”没达到在编码单元中频谱的数量(否)，处理回到步骤S21，继续合成处理。

因此，通过将等于或小于阈值“Th”的频谱SP替代为功率补偿频谱PCSP来将频谱SP与功率补偿频谱PCSP合成在一起。

将频谱SP与功率补偿频谱PCSP合成的处理并不局限于这个例子。还可以有另一个例子，在其处理中，阈值“Th”被设置为“0”，只有在频谱SP为“0”时将频谱SP替代为功率补偿频谱PCSP。

此外，还可以有另一个例子，在其处理中，没有固定的阈值“Th”，整个频谱信号SP加入了功率补偿频谱PCSP。图8表示用于解释将功率补偿频谱PCSP加入到整个频谱信号SP中的例子的流程图。首先，在步骤S30，计数器的值“i”表示频谱的数量被复位为“0”。

然后，在步骤S31，功率补偿频谱PCSP[i]被加入到频谱SP[i]。然后，在步骤S32，计数器的值“i”增加“1”。

然后，在步骤S33，判断是否计数器的值“i”达到了在编码单元中频谱的数量。在步骤S33，如果计数器的值“i”达到了在编码单元中频谱的数量(是)，则结束合成处理。另一方面，如果计数器的值“i”没达到在编码单元中频谱的数量(否)，处理回到步骤S31，继续合成处理。

图9表示用于解释产生功率补偿频谱PCSP和对功率补偿频谱PCSP的功率调整的处理，以及频谱SP和功率补偿频谱PCSP的合成处理的一个特定例子的图像。在这个特定例子中，假设在功率补偿频谱表中的项目数量是1024，而在编码单元中的频谱数量是8。在图9中，使用图8中所述的将功率补偿频谱PCSP加入到整个频谱信号SP中的处理。

从归一化系数的索引值的相加值中检测参考功率补偿频谱表的点。即使在这个例子中归一化系数的索引值的和是1026，由于功率补偿频谱表的项目数量是1024，所以使用其低10位的值。即，参考点的值是2。因此，选择功率补偿频谱表的第三到第十个值的八个值，功率补偿频谱PCSP的值变为{-0.223，0.647，0.115，0.925，-0.254，0.247，-0.872，-0.242}。

接下来，基于归一化系数调整功率补偿频谱PCSP的功率。特别地，通过将功率补偿频谱PCSP的值乘以归一化系数来调整功率。由于归一化系数是12000，功率补偿频谱PCSP的值变为{-2676，7764，1380，11100，-3048，2964，-10464，-2904}。

接下来，基于量化准确度信息的值调整功率补偿频谱PCSP的功率。特别地，通过将功率补偿频谱PCSP的值除以量化准确度信息的值来调整功率。由于量化准确度信息的值是6，功率补偿频谱PCSP的值变为{-446，1294，230，1850，-508，494，-1744，-484}。

接下来，基于功率调整信息的值调整功率补偿频谱PCSP的功率。特别地，通过将功率补偿频谱PCSP的值提升((功率调整信息值-9)×2)dB来调整功率。如果功率调整信息值是“0”，提升值是-∞dB，由于功率调整信息的值是3，执行提升-12dB的操作，而功率补偿频谱PCSP的值变为{-112，324，58，463，-127，124，-436，-121}。

接下来，基于增益控制信息的值调整功率补偿频谱PCSP的功率。特别地，通过将功率补偿频谱PCSP的值除以增益控制信息的值的2次方来调整功率。由于增益控制信息的值是3，执行除以2的操作，而功率补偿频谱PCSP的值变为{-56，162，29，232，-64，62，-218，-61}。

然后，通过将如此产生的功率补偿频谱PCSP加入到频谱SP来获得最后合成的频谱。由于频谱SP的值是{12000，0，-800，0，9600，0，0，-3200}，通过将产生的功率补偿频谱PCSP的值加入到频谱SP的值，能够获得值为{11944，162，-771，232，9536，62，-218，-3261}的合成的频谱。

图10A到图10C表示实际频谱的图像。图10A表示原始声音的频谱，图10B表示在经过传统编码之后的频谱，图10C表示在采用本发明使用功率补偿频谱PCSP经过合成处理之后的频谱。从这些图像，如图10B所示在频谱中相应于箭头存在缺失的部分，而如图10C所示这些部分与功率补偿频谱PCSP合成以抑制功率的匮乏。

如上所述的，根据本发明的编码方法和装置、解码方法和装置，功率补偿频谱PCSP与频谱SP合成在一起。因此，即使提高了压缩比率，也能够极大地减少由于临时的频带变化产生的反常声音和噪声以及功率匮乏，因而改善了听觉质量。

本发明并不局限于上述实施例，在不脱离本发明的范围和精神的情况下能够实行各种修改、变化组织或等同物。

例如，使用硬件配置解释上述实施例。另一方面，本发明并不局限于所述配置，使用计算机程序任意处理都可以由CPU(中央处理器)运行。在这种情况下，计算机程序可以由一个记录介质提供，或可以通过互联网或其它传输媒介来提供。

尽管本发明依照其在附图中展示的和在以上描述中具体讲述的特定优选实施例进行了描述，本领域的技术人员应当理解本发明并不限制于所述实施例，在不脱离权利要求所阐述和定义的本发明的范围和精神的情况下能够实行各种修改、变化组织或等同物。

本发明的工业应用性说明如下：

如上所述，根据本发明，编码侧产生功率调整信息以调整将在解码侧与频谱合成在一起的功率补偿频谱的功率，并对功率调整信息和所述频谱一起进行编码。解码侧使用功率调整信息调整功率补偿频谱的功率，并将功率调整后的功率补偿频谱与所述频谱合成在一起。因此，即使提高了压缩比率，也能够极大地减少由于临时的频带变化产生的反常声音和噪声以及功率匮乏，因而改善了听觉质量。

Claims

1.一种解码方法，用于对利用归一化系数和量化准确度信息通过频谱转换、归一化、量化和编码而从数字信号中产生的频谱进行解码，包括：

频谱解码步骤，基于解码的归一化系数和解码的量化准确度信息对所述频谱进行解码；

功率补偿频谱产生步骤，产生功率补偿频谱；

功率调整步骤，基于解码的量化准确度信息调整所述功率补偿频谱的功率；以及

合成步骤，将解码的频谱和在功率调整步骤中调整的功率补偿频谱组合在一起。

2.权利要求1所述的解码方法，其中，在功率补偿频谱产生步骤，通过参考从预定频谱模式产生的一个表中的值，产生功率补偿频谱。

3.权利要求2所述的解码方法，其中，在功率补偿频谱产生步骤，基于在编码所述频谱中使用的数据来确定参考所述表的值的点。

4.权利要求3所述的解码方法，其中在编码所述频谱中使用的数据是归一化系数。

5.权利要求3所述的解码方法，其中在编码所述频谱中使用的数据是量化准确度信息。

6.权利要求1所述的解码方法，其中，在功率补偿频谱产生步骤，使用随机数序列产生功率补偿频谱。

7.权利要求6所述的解码方法，其中所述随机数序列是高斯分布。

8.权利要求1所述的解码方法，其中，在功率调整步骤，还基于在解码所述频谱中使用的归一化系数调整功率补偿频谱的功率。

9.权利要求1所述的解码方法，其中，在功率调整步骤，还基于已经在编码所述频谱过程中被编码的功率调整信息调整功率补偿频谱的功率。

10.权利要求1所述的解码方法，其中，在合成步骤，将所述频谱和功率补偿频谱相加。

11.权利要求1所述的解码方法，其中，在合成步骤，至少所述频谱的一部分被替代为功率补偿频谱。

12.权利要求1所述的解码方法，其中，在合成步骤，将等于或小于预定值的频谱和功率补偿频谱组合在一起。

13.一种解码装置，用于对利用归一化系数和量化准确度信息通过频谱转换、归一化、量化和编码而从数字信号中产生的频谱进行解码，包括：

解码装置，用于基于解码的归一化系数和解码的量化准确度信息对所述频谱进行解码；

功率补偿频谱产生装置，用于产生功率补偿频谱；

功率调整装置，用于基于解码的量化准确度信息调整所述功率补偿频谱的功率；以及

合成装置，用于将解码的频谱在功率调整装置中调整的功率补偿频谱组合在一起。

14.权利要求13所述的解码装置，其中功率补偿频谱产生装置通过参考从预定频谱模式产生的一个表中的值，产生功率补偿频谱。

15.权利要求14所述的解码装置，其中功率补偿频谱产生装置基于在编码所述频谱中使用的数据来确定参考所述表的值的点。

16.权利要求15所述的解码装置，其中在编码所述频谱中使用的数据是归一化系数。

17.权利要求16所述的解码装置，其中在编码所述频谱中使用的数据是量化准确度信息。

18.权利要求13所述的解码装置，其中功率补偿频谱产生装置使用随机数序列产生功率补偿频谱。

19.权利要求18所述的解码装置，其中所述随机数序列是高斯分布。

20.权利要求13所述的解码装置，其中功率调整装置还基于在解码所述频谱中使用的归一化系数调整功率补偿频谱的功率。

21.权利要求13所述的解码装置，其中功率调整装置还基于在编码所述频谱中已经被编码的功率调整信息调整功率补偿频谱的功率。

22.权利要求13所述的解码装置，其中合成装置将所述频谱和功率补偿频谱相加。

23.权利要求13所述的解码装置，其中合成装置将至少所述频谱的一部分替代为功率补偿频谱。

24.权利要求13所述的解码装置，其中合成装置将等于或小于预定值的频谱和功率补偿频谱合成在一起。