CN101656074B

CN101656074B - 音频解码装置、音频解码方法以及通信终端和基站装置

Info

Publication number: CN101656074B
Application number: CN2009101775853A
Authority: CN
Inventors: 押切正浩; 江原宏幸
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Intellectual Property Corp of America
Priority date: 2004-05-14
Filing date: 2005-05-13
Publication date: 2013-01-23
Anticipated expiration: 2025-05-13
Also published as: CN101656076A; CN101656073B; CN101656077A; CN101656074A; CN101656075A; CN1950686A; CN101656077B; CN101656075B; CN100559138C; CN101656073A; CN101656076B

Abstract

本发明公开一种解码装置，包括：变换单元，将对包含于编码装置所生成的编码中的低频频谱部分的编码进行解码所得的信号变换成频域信号而生成第一低频频谱；变形信息估计单元，使用所述第一低频频谱的频谱轮廓信息估计变形信息，所述变形信息用于对所述第一低频频谱的振幅进行一致性限制；限制单元，使用估计出的所述变形信息，对所述第一低频频谱的振幅进行一致性限制而生成第二低频频谱；以及解码单元，对包含于所述编码装置所生成的编码中的高频频谱部分的编码基于所述第二低频频谱进行解码而生成高频频谱，并且对所述编码进行解码，来调整所述高频频谱的振幅。

Description

音频解码装置、音频解码方法以及通信终端和基站装置

本申请是以下专利申请的分案申请：

申请号：200580014118.9

申请日：2005年5月13日

发明名称：编码装置、解码装置以及编码/解码方法

技术领域

本发明涉及对语音信号、音频信号等进行编码/解码的编码装置、解码装置以及编码/解码方法。

背景技术

将语音信号通过低比特率进行压缩的语音编码技术，对于移动台通信进行电波等的有效利用十分重要。特别是作为近年来的趋势来讲，对提高通话语音的质量寄予的期待日益增加，希望能够实现具有高度的真实感的通话服务。在此所指的真实感为说话者置身的环境(譬如BGM)，因此希望对音频等的语音之外的信号也能够高质量地进行编码。

在将语音信号编码的语音编码技术中，存在G726、G729等的由ITU-T(International Telecommunication Union Telecommunication Standardization Sector)标准化的方式。这些方式是以窄带信号(300Hz～3.4kHz)为对象，能够通过8kbit/s～32kbit/s进行编码。虽然这些方式可以通过低比特率进行编码，但是作为编码对象的窄带信号的频域最大只到3.4KHz，仍然太窄，因此其质量不能提高而导致缺乏真实感。

另外，在ITU-T和3GPP(The 3rd Generation Partnership Project)中存在对信号频带为50Hz～7kHz的语音进行编码的标准方式(G.722、G.722.1、AMR-WB等)。虽然这些方式能够通过6.6kbit/s～64kbit/s的比特率进行宽带语音信号的编码，但是对宽带语音信号高质量地进行编码需要相对提高比特率。而且从音质的角度来讲，宽带语音与窄带语音相比虽然具有高音质，但是对要求高度的真实感的服务来讲很难说已经足够。

一般来讲，当信号的最大频率达到10～15kHz左右时，能够得到相当于FM广播的真实感，而达到20kHz左右时，能够得到相当于CD的质量。对于具有如此频带的信号，由MPEG(Moving Picture Expert Group)标准化了的以层3方式和AAC方式等为代表的音频编码方式比较适合。但是，如果将这些音频编码方式作为语音通信的编码方式来采用的话，需要设定高比特率以对语音高质量地进行编码。另外还会发生编码迟延变大等的问题。

作为将宽频域的信号通过低比特率高质量地进行编码的方法，具有下述技术：将输入信号的频谱分割为低频部分和高频部分的两个频谱，然后将低频频谱进行复制并置换高频频谱(将高频频谱通过低频频谱代用)，由此降低整体的比特率(譬如参照专利文献1)。该技术将较多的比特分配用于低频频谱的编码而进行高质量的编码，相反，对于高频频谱则进行将编码后的低频频谱进行复制的基本处理，由此可以通过较少的比特分配来进行编码。

另外，作为与该技术类似的技术，还有下述技术：对不能充分分配编码比特的频带，利用其它预定的部分频频频谱信息进行近似处理而提高质量(譬如参照专利文献2)。在没有附加信息的情况下对窄带信号进行频带扩展使其成为宽带信号，因此将窄带信号的低频频谱复制于高频频谱来作为基本处理(譬如参照专利文献3)。

再者，不论在哪种技术中，都将其它频带的频谱进行复制，并在用于使频谱包络线变得平滑而进行的增益调整后，将该复制频谱插入需要进行频谱补充的频带。

[专利文献1]日本专利申请特表2001-521648号公报

[专利文献2]日本专利申请特开平9-153811号公报

[专利文献3]日本专利申请特开平9-90992号公报

发明内容

发明需要解决的问题

但是，在语音信号或音频信号的频谱中，低频频谱的动态范围(频谱振幅的绝对值(绝对振幅)的最大值与最小值的比)比高频频谱的动态范围大的现象很常见。图1为用来说明该现象的图，其示出了音频信号的频谱的一例。该频谱为将采样频率32kHz的音频信号通过30ms的长度来进行频率分析时的对数频谱。

如该图所示，频率为0～8000Hz的低频频谱峰值性很强(存在多个锐利的谱峰)，在该频带的频谱的动态范围很大。与此相反，频率为8～15000Hz的高频频谱的动态范围则很小。对具有这样的频谱特性的信号，如果利用传统的将低频频谱复制于高频频谱的方法的话，即使进行高频频谱的增益调整，也会出现下述的现象，即在高频频谱中出现不必要的谱峰形状。

图2为表示将如图1所示频谱的低频频谱(1000～7000Hz)复制，并通过功率调整而得到高频频谱(10000～16000Hz)时的全频带频谱的图。

如该图所示，当进行上述处理时，在高于10000Hz的频带R1出现了不必要的谱峰形状。该谱峰为原来的高频频谱中所没有的。而且，在将该频谱变换到时域而得到的解码信号中，会发生铃响似的噪声，而导致主观质量降低的问题。如上所述，在将某频带的频谱通过其它频带的频谱代用的技术中，需要恰当地调整插入频谱的动态范围。

因此，本发明旨在提供一种编码装置、解码装置以及编码/解码方法，在将某频带的频谱通过其它频带的频谱代用(置换)的技术中，能够恰当地调整插入频谱的动态范围来提高解码信号的主观质量。

解决该问题的方案

本发明的音频解码装置采用这种结构，包括：变换单元，将对包含于通过输入到音频编码装置的输入信号所生成的音频编码中的低频频谱部分的音频编码进行解码所得的信号变换成频域信号而生成第一低频频谱；变形信息估计单元，使用所述输入信号的频谱轮廓信息估计变形信息，所述变形信息用于对所述第一低频频谱的振幅进行一致性限制；限制单元，使用估计出的所述变形信息，对所述第一低频频谱的振幅进行一致性限制而生成第二低频频谱；以及解码单元，对包含于所述音频编码装置所生成的音频编码中的高频频谱部分的音频编码基于所述第二低频频谱进行解码而生成高频频谱，其中，所述一致性限制使所述第二低频频谱的动态范围接近所述高频频谱部分的动态范围。

本发明还提供一种包括上述音频解码装置的通信终端装置。

本发明还提供一种包括上述音频解码装置的基站装置。

本发明还提供一种音频解码方法，包括：变换步骤，将对包含于通过输入到音频编码装置的输入信号所生成的音频编码中的低频频谱部分的音频编码进行解码所得的信号变换成频域信号而生成第一低频频谱；变形信息估计步骤，使用所述输入信号的频谱轮廓信息估计变形信息，所述变形信息用于对所述第一低频频谱的振幅进行一致性限制；限制步骤，使用估计出的所述变形信息，对所述第一低频频谱的振幅进行一致性限制而生成第二低频频谱；以及解码步骤，对包含于所述音频编码装置所生成的音频编码中的高频频谱部分的音频编码基于所述第二低频频谱进行解码而生成高频频谱，其中，所述一致性限制使所述第二低频频谱的动态范围接近所述高频频谱部分的动态范围。

发明的有益效果

根据本发明，在将某频带的频谱通过其它频带的频谱代用的技术中，能够恰当地调整插入频谱的动态范围而提高解码信号的主观质量。

附图说明

图1是表示音频信号的频谱的示例的图。

图2为表示复制低频频谱并进行功率调整而得到高频频谱时的全频带的频谱的图。

图3是表示实施方式1的编码装置的主要结构的方框图。

图4是表示实施方式1的频谱编码单元内部的主要结构的方框图。

图5是表示实施方式1的频谱变形单元内部的主要结构的方框图。

图6是表示实施方式1的变形单元内部的主要结构的方框图。

图7是表示实施方式1的通过变形单元而得到的变形频谱的例子的图。

图8是表示实施方式1的变形单元的其它变化形式的结构的方框图。

图9是表示实施方式1的分层解码装置的主要结构的方框图。

图10是表示实施方式1的频谱解码单元内部的主要结构的方框图。

图11是表示用于说明实施方式2的频谱编码单元的方框图。

图12是表示实施方式2的频谱编码单元的其它变化形式的结构的方框图。

图13是表示实施方式2的频谱解码单元的主要结构的方框图。

图14是表示实施方式3的频谱编码单元的主要结构的方框图。

图15是表示用于说明实施方式3的变形信息估计单元的方框图。

图16是表示实施方式3的变形单元的主要结构的方框图。

图17是表示实施方式3的频谱解码单元的主要结构的方框图。

图18是表示实施方式4的分层编码装置的主要结构的方框图。

图19是表示实施方式4的频谱编码单元的主要结构的方框图。

图20是表示实施方式4的分层解码装置的主要结构的方框图。

图21是表示实施方式4的频谱解码单元的主要结构的方框图。

图22是表示实施方式5的频谱编码单元的主要结构的图。

图23是表示实施方式5的变换信息估计单元的主要结构的方框图。

图24是表示实施方式5的频谱解码单元的主要结构的图。

图25是用于说明实施方式6的频谱变形方法的图。

图26是表示实施方式6的频谱变形单元内部的主要结构的方框图。

图27是用于说明变形频谱的生成方法的图。

图28是用于说明变形频谱的生成方法的图。

图29是表示实施方式6的频谱变形单元内部的主要结构的方框图。

具体实施方式

以下，参照附图详细说明本发明的实施方式。

(实施方式1)

图3是表示本发明实施方式1的分层编码装置100的主要结构的方框图。在此，以编码信息具有由多层构成的分层结构的情形，也就是进行分层编码(可扩展性编码)的情形为例来说明。

分层编码装置100的各个部分，随着信号的输入执行以下动作。

下采样单元101根据输入信号生成低采样率的信号，并提供给第一层编码单元102。第一层编码单元102对从下采样单元101输出的信号进行编码。将通过第一层编码单元102得到的编码符号提供给复用单元103和第一层解码单元104。然后，第一层解码单元104根据第一层编码单元102输出的编码符号生成第一层解码信号S1。

另一方面，延迟单元105将预定长度的延迟赋予输入信号。该延迟用于校正在下采样单元101、第一层编码单元102以及第一层解码单元104中产生的时间延迟。频谱编码单元106利用由第一层解码单元104生成的第一层解码信号S1，对由延迟单元105输出的、经延迟预定时间的输入信号S2进行频谱编码，并将生成的编码符号输出到复用单元103。

复用单元103对由第一层编码单元102求出的编码符号与由频谱编码单元106求出的编码符号进行复用，并将其作为输出编码符号输出到编码装置100的外部。

图4是表示上述频谱编码单元106内部的主要结构的方框图。

该频谱编码单元106主要包括：频域变换单元111、频谱变形单元112、频域变换单元113、扩展频带频谱编码单元114以及复用单元115。

频谱编码单元106从第一层解码单元104接收具有有效信号频带为0≤k＜FL(k为各子带的频率)的第一信号S1，并且从延迟单元105接收具有有效信号频带为0≤k＜FH(其中FL＜FH)的第二信号S2。频谱编码单元106利用第一信号S1的频带0≤k＜FL的频谱来估计第二信号S2的频带FL≤k＜FH的频谱，并对该估计信息进行编码并输出。

频域变换单元111对输入的第一信号S1进行频率变换，计算出低频频谱的第一频谱S1(k)。另一方面，频域变换单元113对输入的第二信号S2进行频率变换，计算出宽带的第二频谱S2(k)。在此所述的频率变换的方法适用离散傅立叶变换(DFT)、离散余弦变换(DCT)以及变形离散余弦变换(MDCT)等。另外，S1(k)为第一频谱的频率k的子带的频谱、S2(k)为第二频谱的频率k的子带的频谱。

频谱变形单元112将第一频谱S1(k)进行各种各样的变形来改变第一频谱的动态范围，从而调查作为恰当的动态范围的变形方法。而且，将有关该变形的信息(变形信息)进行编码并提供给复用单元115。有关该频谱变形处理的详细内容将在后面叙述。另外，频谱变形单元112将动态范围变得恰当的第一频谱S1(k)输出到扩展频带频谱编码单元114。

扩展频带频谱编码单元114将第二频带S2(k)作为参照信号，估计应当包含于第一频谱S1(k)的高频(FL≤k＜FH)的频谱(扩展频带频谱)，并将有关该估计频谱的信息(估计信息)进行编码提供给复用单元115。在此，扩展频带频谱的估计基于变形后的第一频谱S1’(k)进行。

然后，复用单元115将由频谱变形单元112输出的变形信息的编码符号以及由扩展频带频谱编码单元114输出的有关扩展频带频谱的估计信息的编码符号进行复用并输出。

图5是表示上述频谱变形单元112内部的主要结构的方框图。

频谱变形单元112对第一频谱S1(k)施加变形，该变形为使第一频谱S1(k)的动态范围最接近于第二频谱S2(k)的高频频谱(FL≤k＜FH)的动态范围的变形。接下来，将此时的变形信息进行编码并输出。

缓冲单元121暂时存储输入的第一频谱S1(k)，并根据需要将第一频谱S1(k)提供给变形单元122。

变形单元122按照下述的步骤，对第一频谱S1(k)进行各种各样的变形来生成第一频谱S1’(j，k)，并将其提供给子带功率计算单元123。在此，j为用来识别各种变形处理的索引。

子带功率计算单元123将变形第一频谱S1’(j，k)的频域分割成多个子带，并求出预定范围的子带的功率(子带功率)。譬如，将求解子带功率的范围设定为F1L≤k＜F1H时，对该带宽进行N分割时的子带宽BWS表示为下式(式1)。

BWS＝(F1H-F1L+1)/N (式1)

因此，第n子带的最小频率F1L(n)以及最大频率F1H(n)分别表示为(式2)和(式3)。

F1L(n)＝F1L+n·BWS (式2)

F1H(n)＝F1L+(n+1)·BWS-1 (式3)

其中，n取0～N-1的值。

此时，子带功率P1(j，n)如下式(式4)所示计算。

P 1 (j, n) = \frac{Σ_{k = F 1 L (n)}^{F 1 H (n)} {S 1}^{'} {(j, k)}^{2}}{BWS}

(式4)

另外，也可以如下式(式5)所示计算包含于子带的频谱的平均值。

P 1 (j, n) = \sqrt{\frac{Σ_{k = F 1 L (n)}^{F 1 H (n)} {S 1}^{'} {(j, k)}^{2}}{BWS}}

(式5)

然后将如上所述求出的子带功率P1(j，n)提供给方差计算单元124。

方差计算单元124为了表示子带功率P1(j，n)的偏差程度，根据下式(式6)来计算出方差σ1²(j)。

{σ 1}^{2} (j) = Σ_{n = 0}^{N - 1} {(P 1 (j, n) - P 1 mean (j))}^{2}

(式6)

在此，P1mean(j)表示子带功率P1(j，n)的平均值，并如下式(式7)计算出来。

P 1 mean (j) = \frac{Σ_{n = 0}^{N - 1} P 1 (j, n)}{N}

(式7)

然后将如上所述计算出来的表示变形信息j的子带功率的偏差程度的方差σ1²(j)提供给搜索单元125。

子带功率计算单元126以及方差计算单元127，进行与上述子带功率计算单元123以及方差计算单元124所进行的一系列的处理相同的处理：对输入的第二频谱S2(k)，计算出表示子带功率的偏差程度的方差σ2²(j)。不过，子带功率计算单元126以及方差计算单元127进行的处理与上述处理的不同处如下所述。也就是，将计算第二频谱S2(k)的子带功率的规定范围设定为F2L≤k＜F2H。在此，因为有必要使第一频谱的动态范围接近第二频谱的高频频谱的动态范围，所以设定F2L以满足FL≤F2L＜F2H。而且，没有必要使对应于第二频谱的子带的数量与第一频谱的子带的数量N相一致。不过，设定第二频谱的子带数使第一频谱的子带宽与第二频谱的子带宽基本一致。

搜索单元125通过搜索来确定第一频谱的子带的方差σ1²(j)，使第一频谱的子带的方差σ1²(j)与第二频谱的子带的方差σ2²(j)最为接近。具体来讲，搜索单元125对所有的变形候补0≤j＜J计算出第一频谱的子带的方差σ1²(j)，将该计算值与第二频谱的子带的方差σ2²(j)相比较，确定两者最为接近时的j的值(最优变形信息jopt)，并将该jopt输出到频谱变形单元112的外部以及变形单元128。

变形单元128生成对应于该最优变形信息jopt的经变形的第一频谱S1’(jopt，k)，并将其输出到频谱变形单元112的外部。将最优变形信息jopt传输到复用单元115，并传输经变形的第一频谱S1’(jopt，k)到扩展频带频谱编码单元114。

图6是表示上述变形单元122内部的主要结构的方框图。而且，变形单元128的内部结构基本上与变形单元122相同。

正号/负号提取单元131求出第一频谱的各个子带的符号信息sign(k)，并输出到正号/负号赋予单元134。

绝对值计算单元132对第一频谱的各个子带计算振幅的绝对值，并将该值提供给指数值计算单元133。

指数变量表格135记录用于第一频谱的变形的指数变量α(j)。包含于该表格的变量中的j所对应的值从指数变量表格135输出。具体来讲，在指数变量表格135中，譬如记录着由4个指数变量组成的指数变量候补，即指数变量α(j)＝{1.0，0.8，0.6，0.4}，根据由搜索单元125指定的索引j，选择其中1个指数变量α(j)，并提供给指数值计算单元133。

指数值计算单元133利用从指数变量表格135输出的指数变量，计算从绝对值计算单元132输出的频谱(绝对值)的指数值，也就是计算出对各个子带的振幅绝对值进行α(j)次乘幂所得的值。

正号/负号赋予单元134，对指数值计算单元133输出的指数值，赋予通过正号/负号提取单元131于先前求出的符号信息sign(k)，作为变形第一频谱S1’(j，k)输出。

因此，由变形单元122输出的变形第一频谱S1’(j，k)如下式(式8)表示。

S1′(j，k)＝sign(k)·|S1(k)|^α(j) (式8)

图7为表示通过上述变形单元122(或变形单元128)得到的变形频谱的例子的图。

这里，以取指数变量α(j)＝{1.0，0.6，0.2}的情形为例进行说明。另外，在此为了容易地比较各个频谱，将α(j)＝1.0时的频谱S71向上移动了40dB，将α(j)＝0.6时的频谱S72向上移动了20dB。从该图可以得知，通过指数变量α(j)能够改变频谱的动态范围。

如上所述，根据本实施方式的编码装置(频谱编码单元106)，使用通过第一信号(0≤k＜FL)求出的第一频谱，估计第二信号(0≤k＜FH)求出的第二频谱的高频部分(FL≤k＜FH)，并对估计信息进行编码时，不直接使用第一频谱而是对第一频谱施加变形后再进行上述估计。此时，将表示如何进行变形的信息(变形信息)也一并进行编码，传输到解码端。

对第一频谱施加变形的具体方法为，将第一频谱分割成子带，对每个子带求出包含于各个子带的频谱的绝对振幅的平均(子带平均振幅)，将第一频谱变形以使对这些平均振幅进行统计处理而求出的方差与根据第二频谱的高频部分的频谱同样求出的子带平均振幅的方差最为接近。也就是，将第一频谱变形以使第一频谱的绝对振幅的平均摆动范围与第二频谱的高频频谱的绝对振幅的平均摆动范围成为相等的值。而且，对表示该具体的变形方法的变形信息进行编码。另外，也可以利用包含于各个子带的频谱的功率来代替子带平均振幅。

进一步具体地说，上述具体的变形方法就是通过对第一频谱的频谱进行α乘幂(0≤α≤1)，来控制子带内的频谱的绝对振幅的偏差(摆动)。而且，将有关所使用的α的信息传输到解码端。

通过采用上述结构，即使当第一频谱的动态范围与第二频谱的高频部分的动态范围大小不同时，也能够恰当地调整估计频谱的动态范围，由此提高解码信号的主观质量。

另外，在上述的结构中，通过将第一频谱整体进行α乘幂(0≤α≤1)，对频谱的振幅施加一致性限制。由此能够钝化锐利(陡峭)的谱峰。另外，譬如只是对预定值以上的谱峰进行消峰而变形时，有可能导致频谱变得不连续而产生奇怪的噪声，但是通过采用上述的结构，则能够使频谱变得平滑而防止发生奇怪的噪声。

另外，在本实施方式中，以作为表示频谱的绝对振幅的偏差的程度(摆动幅度)的指标使用方差时的情形为例进行了说明，但本发明并不只限于此，譬如也可以适用标准偏差等其他的指标。

另外，在本实施方式中，以在编码装置100的变形单元122(或变形单元128)中使用指数函数的情形为例进行了说明，但是也可以使用以下示出的方法。

图8是表示变形单元的其他变化形式(变形单元122a)的结构的方框图。对于与变形单元122(或变形单元128)相同的构成要素赋予相同的编号，并省略其说明。

在上述的变形单元122(或变形单元128)中，因为使用指数函数，所以计算量具有变大的趋势。于是，通过不使用指数函数而变化频谱的动态范围的方法来避免计算量的增加。

绝对值计算单元132计算输入的第一频谱S1(k)的各个频谱的绝对值，并将其输出到平均值计算单元142以及变形频谱计算单元143。平均值计算单元142按照下式(式9)来计算频谱的绝对值的平均值S1mean。

S 1 mean = Σ_{k = 0}^{FL - 1} | S 1 (k) |

(式9)

乘数表格144中记录着用于变形频谱计算单元143的乘数的候补，基于搜索单元125指定的索引选择一个乘数，并输出到变形频谱计算单元143。在此，假设乘数表格中记录着乘数g(j)＝{1.0，.0.9，0.8，0.7}的4个候补。

变形频谱计算单元143利用由绝对值计算单元132输出的第一频谱的绝对值与由乘数表格144输出的乘数g(j)，将变形频谱S1’(k)的绝对值通过下式(式10)计算出来，并输出到正号/负号赋予单元134。

|S1′(j，k)|＝g(j)·|S1(k)|+(1-g(j))·S1mean (式10)

正号/负号赋予单元134将由正号/负号提取单元131得到的符号信息sign(k)赋予由变形频谱计算单元143输出的变形频谱S1’(k)的绝对值，生成并输出由下式(式11)表示的最后的变形频谱S1’(k)。

S1′(j，k)＝sign(k)·|S1′(j，k)| (式11)

另外，在本实施方式，以变形单元包括正号/负号提取单元、绝对值计算单元、正号/负号赋予单元的情形为例进行了说明，但当输入的频谱恒定为正时，不需要这些结构。

接下来，详细说明分层解码装置150的结构，该解码装置能够对由上述分层编码装置100生成的编码符号进行解码。

图9是表示本实施方式的分层解码装置150的主要结构的方框图。

分离单元151对输入的编码符号进行分离处理，并生成用于第一层解码单元152的编码符号S51与用于频谱解码单元153的编码符号S52。第一层解码单元152利用通过分离单元151得到的编码符号解码出信号频带0≤k＜FL的解码信号，并将该解码信号S53提供给频谱解码单元153。另外，第一层解码单元152的输出同时连接于解码装置150的输出端予。由此，当需要输出由第一层解码单元152生成的第一层解码信号时，可以经由该输出端子输出。

由分离单元151分离出的编码符号S52与由第一层解码单元152输出的第一层解码信号S53提供给频谱解码单元153。频谱解码单元153进行后述的频谱解码，生成信号频带0≤k＜FH的宽带解码信号，并将其输出。在频谱解码单元153中，将由第一层解码单元152提供的第一层解码信号S53作为第一信号并进行处理。

图10是表示上述频谱解码单元153内部的主要结构的方框图。

该频谱解码单元153输入编码符号S52以及第一层解码信号S53(有效频域为0≤k＜FL的第一信号)。

分离单元161从输入的编码符号S52中，将由上述的编码端的频谱变形单元112生成的变形信息与扩展频带频谱编码信息分离开来，将变形信息输出到变形单元162，将扩展频带频谱编码信息输出到扩展频带频谱生成单元163。

频域变换单元164对输入的时域信号的第一层解码信号S53进行频率变换而计算第一频谱S1(k)。该频率变换的方法使用离散傅立叶变换(DFT)、离散余弦变换(DCT)以及变形离散余弦变换(MDCT)等。

变形单元162基于由分离单元161提供的变形信息，对由频域变换单元164提供的第一频谱S1(k)施加变形来生成变形第一频谱S1’(k)。另外，该变形单元162内部的结构与业已说明的编码端的变形单元122(参照图6)一样，因此省略对其说明。

扩展频带频谱生成单元163，利用变形后的第一频谱S1’(k)，生成应当包含于第一频谱S1(k)的扩展频带FL≤k＜FH的第二频谱的估计值S2”(k)，并将该第二频谱的估计值S2”(k)提供给频谱构成单元165。

频谱构成单元165将由频域变换单元164提供的第一频谱S1(k)与由扩展频带频谱生成单元163提供的第二频谱的估计值S2”(k)结合起来生成解码频谱S3(k)。该解码频谱S3(k)如下式(式12)所示。

S 3 (k) = \{\begin{matrix} S 1 (k) & (0 \leq k < FL) \\ S^{''} 2 (k) & (FL \leq k < FH) \end{matrix}

(式12)

该解码频谱S3(k)提供给时域变换单元166。

时域变换单元166将在解码频谱S3(k)被变换为时域信号后，根据需要进行开窗(windowing)以及叠加(superposition addition)等处理，以避免在帧之间发生不连续的现象，并输出最后的解码信号。

如上所述，根据本实施方式的解码装置(频谱解码单元153)，能够对由本实施方式的编码装置编码的信号进行解码。

(实施方式2)

在本发明的实施方式2中，利用作为内部状态持有第一频谱的音调滤波器来估计第二频谱，并对该音调滤波器的特性进行编码。

本实施方式的分层编码装置的结构与实施方式1所示的分层编码装置相同，因此利用图11的方框图来说明结构的不同之处，即频谱编码单元201。并且，对于与实施方式1所示的频谱编码单元106(参照图4)相同的构成要素赋予相同的编号，并省略对其说明。

内部状态设定单元203使用通过频谱变形单元112生成的变形第一频谱S1’(k)来设定用于滤波单元204的内部状态S(k)。

滤波单元204基于由内部状态设定单元203设定的内部状态S(k)与由延迟系数设定单元206提供的延迟系数T来进行滤波，而计算出第二频谱的估计值S2”(k)。另外，本实施方式对使用通过下式(式13)表示的滤波器的情形进行说明。

P (z) = \frac{1}{1 - Σ_{i = - M}^{M} β_{i} z^{- T + i}}

(式13)

在此，T表示为由延迟系数设定单元206提供的系数，而假设M＝1。如下式(式14)所示，滤波单元204的滤波处理通过主要使用按照升序以降低了频率T的频谱为中心乘上相应的系数β_i并进行相加，来计算出估计值。

S (k) = Σ_{i = - 1}^{1} β_{i} \cdot S (k - T - i)

(式14)

按照该式的处理在FL≤k＜FH的范围内进行。在此，S(k)表示滤波器的内部状态。此时，计算出的S(k)(其中FL≤k＜FH)作为第二频谱的估计值S2”(k)使用。

搜索单元205计算由频域变换单元113提供的第二频谱S2(k)与由滤波单元204提供的第二频谱的估计值S2”(k)的相似程度。

另外，该相似程度存在各种各样的定义，但是在本实施方式中，使用以下的相似程度：首先将滤波器系数β_-1以及β₁视为0，基于最小平方差(aminimum square error)所定义的、按照下式(式15)来计算出的相似程度。

E = Σ_{k = FL}^{FH - 1} S 2 {(k)}^{2} - \frac{{(Σ_{k = FL}^{FH - 1} S 2 (k) \cdot S^{''} 2 (k))}^{2}}{Σ_{k = FL}^{FH} S^{''} 2 {(k)}^{2}}

(式15)

根据该方法，在计算出最优的延迟系数T之后确定滤波器系数β_i。在此E表示S2(k)与S2”(k)之间的最小平方差。另外，上式(式15)的右边第一项为与延迟系数T无关的固定值，因此能够搜索出生成使(式15)的右边第二项为最大的S2”(k)的时延迟系数T。本实施方式中，将(式15)的右边第二项称为相似程度。

延迟系数设定单元206将包含于预先规定的搜索范围TMIN～TMAX的延迟系数T依次输出到滤波单元204。因此，在滤波单元204中，当每次由延迟系数设定单元206提供延迟系数T时，都在具有FL≤k＜FH的范围的S(k)归零后进行滤波，而搜索单元205则每次都计算出相似程度。搜索单元205从TMIN～TMAX的范围中确定使计算出的相似程度为最大时的系数Tmax，将该系数Tmax提供给滤波器系数计算单元207、频谱轮廓编码单元208以及复用单元115。

滤波器系数计算单元207利用由搜索单元205提供的系数Tmax求出滤波器系数β_i。在此，所求滤波器系数β_i使按照下式(式16)的平方差E成为最小。

E = Σ_{k = FL}^{FH - 1} {(S 2 (k) - Σ_{i = - 1}^{1} β_{i} S (k - T_{\max} - i))}^{2}

(式16)

滤波器系数计算单元207将多个β_i的组合预先作为表格来持有，确定使上式(式16)的平方差E成为最小的β_i的组合，将该编码输出到复用单元115，并将滤波器系数β_i提供给频谱轮廓编码单元208。

频谱轮廓编码单元208利用由内部状态设定单元203提供的内部状态S(k)、由搜索单元205提供的延迟系数Tmax以及由滤波器系数计算单元207提供的滤波器系数β_i，进行滤波处理，求出频带为FL≤k＜FH的第二频谱的估计值S2”(k)。接下来，频谱轮廓编码单元208利用第二频谱的估计值S2”(k)和第二频谱S2(k)对频谱轮廓的调整系数进行编码。

在本实施方式中，说明了将该频谱轮廓信息用每个子带的频谱功率来表示的情形。此时、第j个子带的频谱功率如下式(式17)所示。

B (j) = Σ_{k = BL (j)}^{BH (j)} S 2 {(k)}^{2}

(式17)

在此，BL(j)表示第j个子带的最小频率，BH(j)表示第j个子带的最大频率。视如此求出的第二频谱的子带的频谱功率为第二频谱的频率轮廓信息。

同样，频谱轮廓编码单元208按照下式(式18)计算第二频谱的估计值S2”(k)的子带的频谱功率B”(j)，并按照下式(式19)计算每个子带的变化量V(j)。

B^{''} (j) = Σ_{k = BL (j)}^{BH (j)} S^{''} 2 {(k)}^{2}

(式18)

V (j) = \sqrt{\frac{B (j)}{B^{''} (j)}}

(式19)

接下来，频谱轮廓编码单元208对变化量V(j)进行编码并将该编码送到复用单元115。

复用单元115将以下的信息复用并输出：由频谱变形单元112得到的变形信息；由搜索单元205得到的最优延迟系数Tmax的信息；由滤波器系数计算单元207得到的滤波器系数的信息；由频谱轮廓编码单元208得到的频谱轮廓调整系数的信息。

如上所述，根据本发明的实施方式，利用具有作为内部状态的第一频谱的音调滤波器来估计第二频谱，因此只需要对该音调滤波器的特性进行编码，就能够实现低比特率。

在本实施方式中，虽然说明了包括频域变换单元的情形，但是这些结构为将时域作为输入时所需的结构，当直接输入频谱时，则无需频域变换单元。

另外，本实施方式虽然在上述(式13)中以M＝1的情形为例进行了说明，但是M的值不只限定为1，可以使用0以上的整数。

另外，本实施方式虽然以音调滤波器利用上述(式13)的滤波器函数(传递函数)的情形为例进行了说明，但是音调滤波器也可以为一次的音调滤波器。

图12是表示实施方式的频谱编码单元201的其它变化形式(频谱编码单元201a)的结构的方框图。并且，对于与频谱编码单元201相同的构成要素赋予相同的编号，并省略对其说明。

用于滤波单元204的滤波器如下式(式20)一样简略。

P (z) = \frac{1}{1 - z^{- T}}

(式20)

该式为上述(式13)中，取M＝0、β_o＝1时的滤波器函数。

通过该滤波器生成的第二频谱的估计值S2”(k)可以利用下式(式21)，将离开T的内部状态S(k)的低频频谱依次复制而求出。

S(k)＝S(k-T) (式21)

另外，搜索单元205与上述同样地搜索使上述(式15)成为最小的系数T而确定最优的系数Tmax。如此求出的系数Tmax提供给复用单元115。

通过采用上述结构，用于滤波单元204的滤波器的结构可以变得简便，并无需滤波器系数计算单元207，因此通过较少的计算量来进行第二频谱的估计。也就是，根据该结构，编码装置的结构变得简便，因此能够减少编码处理的计算量。

接下来，详细说明解码端的频谱解码单元251的结构，该频谱解码单元能够对由上述频谱编码单元201(或频谱编码单元201a)生成的编码符号进行解码。

图13是表示本实施方式的频谱解码单元251的主要结构的方框图。并且，该频谱解码单元251具有与实施方式1所示的频谱解码单元153(参照图10)相同的基本结构，对于相同的构成要素赋予相同的编号，并省略对其说明。不同之处在于扩展频带频谱生成单元163a的内部结构。

内部状态设定单元252使用变形单元162输出的变形后的第一频谱S1’(k)来设定用于滤波单元253的滤波器的内部状态S(k)。

滤波单元253根据由编码端的频谱编码单元201(201a)生成的编码符号，经由分离单元161而得到有关滤波器的信息。具体来讲，使用频谱编码单元201时，得到延迟系数Tmax以及滤波器系数β_i；使用频谱编码单元201a时，只得到延迟系数Tmax。而且，滤波单元253将由变形单元162生成的变形第一频谱S1’(k)作为滤波器的内部状态S(k)，基于得到的滤波器信息进行滤波而计算出解码频谱S”(k)。该滤波方法有赖于编码端的频谱编码单元201(201a)所用的滤波器函数，使用频谱编码单元201时，在解码端也按照上述(式13)来进行滤波，而使用频谱编码单元201a时，在解码端也按照上述(式20)来进行滤波。

频谱轮廓解码单元254基于由分离单元161提供的频谱轮廓信息来解码频谱轮廓信息。本实施方式以使用每个子带的变化量的量化值Vq(j)的情形为例来说明。

频谱调整单元255在由滤波单元253得到的解码频谱S”(k)上，按照下式(式22)乘上由频谱轮廓解码单元254得到的每个子带的变化量的量化值Vq(j)，由此调整频谱S”(k)的频域FL≤k＜FH的频谱形状，而生成第二频谱的估计值S2”(k)。

S″2(k)＝S″(k)·V_q(j)(BL(j)≤k≤BH(j)，for all j) (式22)

在此，BL(j)以及BH(j)分别表示第j个子带的最小频率、最大频率。将按照上述(式22)计算出的第二频谱的估计值S2”(k)提供给频谱构成单元165。

频谱构成单元165如在实施方式1所述，将第一频谱S1(k)与第二频谱的估计值S2”(k)结合起来生成解码频谱S3(k)，并提供给时域变换单元166。

如上所述，根据本实施方式的解码装置(频谱解码单元251)，能够对由本实施方式的编码装置编码的信号进行解码。

(实施方式3)

图14是表示本发明实施方式3的频谱编码单元的主要结构的方框图。在图14中，与图4具有相同名称以及相同编号的模块具有相同的功能，因此省略对其说明。在本实施方式3中，基于编码端、解码端共用的信息来调整频谱的动态范围。因此，无需输出表示调整频谱的动态范围的动态范围系数的编码符号。因为无需输出将表示调整频谱的动态范围的动态范围系数的编码符号，所以能够降低比特率。

图14中的频谱编码单元301在频域变换单元111与扩展频带频谱编码单元114之间，具有动态范围计算单元302、变形信息估计单元303以及变形单元304来代替图4中的频谱变形单元112。实施方式1中的频谱变形单元112将第一频谱S1(k)进行各种各样的变形来改变第一频谱的动态范围，从而调查作为恰当的动态范围的变形方法，并将该变形信息进行编码且输出。另一方面，本实施方式3则基于编码端以及解码端共用的信息来进行该变形信息的估计，并根据该估计变形信息来进行第一频谱S1(k)的变形。

因此，本实施方式3具有动态范围计算单元302、变形信息估计单元303以及根据该估计变形信息来进行第一频谱S1(k)变形的变形单元304来代替频谱变形单元112。另外，变形信息通过在频谱编码单元以及频谱解码单元的内部分别进行的估计而求出，无需由频谱编码单元301将变形信息作为编码符号输出，因此无需在图4的频谱编码单元106中设置的复用单元115。

由频域变换单元111输出第一频谱S1(k)，提供给动态范围计算单元302以及变形单元304。动态范围计算单元302将第一频谱S1(k)的动态范围量化，并将其结果作为动态范围信息输出。与实施方式1同样，量化动态范围的方法将第一频谱的频域分割成多个子带，求出规定范围的子带的功率(子带功率)，计算出该子带功率的方差，并将该方差作为动态范围信息输出。

接下来，使用图15说明变形信息估计单元303。变形信息估计单元303从由动态范围计算单元302输入动态范围信息，并提供给切换单元305。切换单元305基于所述动态范围信息，从存储于变形信息表格306的估计变形信息的候补中选择1个估计变形信息并输出。变形信息表格306中记录着取0～1之间的值的多个估计变形信息的候补，这些候补通过学习而预先确定，以对应于动态范围信息。

图16是表示变形单元304的主要结构的方框图。与图6具有相同名称以及相同编号的模块具有相同的功能，因此省略对其说明。图16的变形单元304中的指数值计算单元307按照由变形信息估计单元303提供的估计变形信息(取0～1之间的值)，将由绝对值计算单元132输出的频谱的绝对振幅的指数值，即通过估计变形信息进行乘幂的值，输出到正号/负号赋予单元134。正号/负号赋予单元134，对指数值计算单元307输出的指数值，赋予通过正号/负号提取单元131于先前求出的符号信息，作为变形第一频谱输出。

如上所述，根据本实施方式的编码装置(频谱编码单元301)，使用通过第一信号求出的第一频谱(0≤k＜FL)，估计从第二信号求出的第二频谱(0≤k＜FH)的高频部分(FL≤k＜FH)，并将估计信息进行编码时，不直接使用第一频谱而是对第一频谱施加变形后再进行上述估计，由此能够恰当地调整估计频谱的动态范围来提高解码信号的主观质量。此时，对于表示如何进行变形的信息(变形信息)，因为基于在解码端、编码端共用的信息(本实施方式中为第一频谱)来确定变形信息，所以无需将有关变形信息的编码符号传输到解码装置，因此能够降低比特率。

另外，变形信息估计单元303中，也可以使用将第一频谱的动态范围信息作为输入值，将估计变形信息作为输出值的映射函数，来代替利用变形信息表格306而建立第一频谱的动态范围信息与估计变形信息的对应关系。此时，作为函数输出值的估计变形信息限定取0～1之间的值。

图17是表示本实施方式3的频谱解码单元353的主要结构的方框图。在该结构中，与图10具有相同名称以及相同编号的模块具有相同的功能，因此省略对其说明。在频域变换单元164与扩展频带频谱生成单元163之间，具有动态范围计算单元361、变形信息估计单元362以及变形单元363。图10中的变形单元162输入由编码端的频谱变形单元112生成的变形信息，并基于该变形信息对由频域变换单元164提供的第一频谱S1(k)施加变形。相对于此，本实施方式3则与上述频谱编码单元301相同：基于编码端以及解码端的共用的信息来进行该变形信息的估计，并根据该估计变形信息来进行第一频谱S1(k)的变形。

因此，本实施方式3具有动态范围计算单元361、变形信息估计单元362以及变形单元363。另外，与上述频谱编码单元301相同，变形信息通过在频谱解码单元的内部进行的估计而求出，输入的编码符号中未包含变形信息，因此无需图10中的设置于频谱解码单元153的分离单元161。

由频域变换单元164输出第一频谱S1(k)，提供给动态范围计算单元361以及变形单元363。有关动态范围计算单元361、变形信息估计单元362以及变形单元363的接下来的操作，与业已说明的编码端的频谱编码单元301(参照图14)内的动态范围计算单元302、变形信息估计单元303以及变形单元304相同，因此省略对其说明。另外，变形信息估计单元362中的变形信息表格记录着与频谱编码单元301中的变形信息估计单元303中的变形信息表格306相同的估计变形信息的候补。

另外，有关扩展频带频谱生成单元163、频谱构成单元165以及时域变换单元166的操作与实施方式1的图10示意的相同，省略对其说明。

如上所述，根据本实施方式的解码装置(频谱解码单元353)，能够对由本实施方式的编码装置编码的信号进行解码，由此能够恰当地调整估计频谱的动态范围来提高解码信号的主观质量。

另外，本实施方式中，估计变形信息通过变形信息估计单元303求出，但是也可以将该估计变形信息适用于实施方式1的图4示意的频谱编码单元106，并将该估计变形信息提供给频谱变形单元112，频谱变形单元112将由变形信息估计单元303提供的估计变形信息作为基准，将其附近的变形信息从指数变量表格135中选择出来，并从该限定的变形信息中通过搜索单元125确定最恰当的变形信息。在该结构中，最终所选择的变形信息的编码符号表示为对于作为上述基准的估计变形信息的相对值。如此能将正确的变形信息进行编码并向解码单元传输，因此能够得到维持解码信号的主观质量并减少表示变形信息的比特数的效果。

(实施方式4)

本发明的实施方式4中，基于有第一层编码单元提供的音调增益，确定输出给频谱编码单元内的变形单元的估计变形信息。

图18是表示本实施方式的分层编码装置400的主要结构的方框图。在图18中，与图3具有相同名称以及相同编号的模块具有相同的功能，因此省略对其说明。

本实施方式4中的分层编码装置400，将由第一层编码单元402求出的音调增益提供给频谱编码单元406。具体来讲，在第一层编码单元402中，在由第一层编码单元402固有的自适应码本(图中未示出)输出的自适应码矢量上所乘的自适应码矢量增益，作为音调增益输出，并输入给频谱编码单元406。该自适应码矢量增益具有当输入信号的周期性强时取大值，当输入信号的周期性弱时取小值的特点。图19是表示本实施方式4的频谱编码装置406的主要结构的方框图。在图19中，与图14具有相同名称以及相同编号的模块具有相同的功能，因此省略对其说明。变形信息估计单元411使用由第一层编码单元402提供的音调增益来输出估计变形信息。变形信息估计单元411具有上述图15的变形信息估计单元303相同的结构。不过，变形信息表格是对应音调增益而设计的。另外，在本实施方式中，也可以采用利用映射函数的结构来代替利用变形信息表格的结构。

如上所述，根据本实施方式的编码装置(频谱编码单元406)，能够考虑输入信号的周期性而恰当地调整估计频谱的动态范围，来提高解码信号的主观质量。

接下来，详细说明分层解码装置450的结构，该解码装置能够对由上述分层编码装置400生成的编码符号进行解码。

图20是表示本实施方式的分层解码装置450的主要结构的方框图。在图20中，由第一层解码单元452输出的音调增益提供给频谱解码单元453。在第一层解码单元452中，在由第一层解码单元452固有的自适应码本(图中未示出)输出的自适应码矢量上所乘的自适应码矢量增益，作为音调增益输出，并输入给频谱解码单元453。

图21是表示本实施方式4的频谱解码单元453的主要结构的方框图。变形信息估计单元461使用由第一层解码单元452提供的音调增益来输出估计变形信息。变形信息估计单元461具有于上述图15的变形信息估计单元303相同的结构。不过，变形信息表格与变形信息估计单元411中的一样，是对应音调增益而设计的。另外，在本实施方式中，也可以采用利用映射函数的结构来代替利用变形信息表格的结构。

如上所述，根据本实施方式的解码装置(频谱解码单元453)，能够对由本实施方式的编码装置编码的信号进行解码，并能够考虑输入信号的周期性而恰当地调整估计频谱的动态范围，来提高解码信号的主观质量。

另外，也可以采用除了音调增益同时使用音调周期(通过搜索第一层编码单元402中固有的自适应码本的结果而得到的延迟)来估计变形信息的结构。此时，通过利用音调周期，能够进行分别对音调周期短的语音(譬如女性的声音)以及音调周期长的语音(譬如男性的声音)恰当的变形信息的估计，从而提高估计的准确度。

另外，本实施方式中，估计变形信息通过变形信息估计单元411求出，但是也可以与实施方式3相同：将该估计变形信息适用于实施方式1的图4示意的频谱编码单元106，并将该估计变形信息提供给频谱变形单元112，频谱变形单元112将由变形信息估计单元411提供的估计变形信息作为基准，将其附近的变形信息从指数变量表格135中选择出来，并从该限定的变形信息中通过搜索单元125确定最恰当的变形信息。在该结构中，最终所选择的变形信息的编码符号表示为对于作为上述基准的估计变形信息的相对值。如此能对正确的变形信息进行编码并向解码单元传输，因此能够得到维持解码信号的主观质量并减少表示变形信息的比特数的效果。

(实施方式5)

本发明的实施方式5中，基于由第一层编码单元提供的LPC系数，确定输出到频谱编码单元内的变形单元的估计变形信息。

本实施方式5的分层编码装置的结构与上述图18一样。不过，由第一层编码单元402输出给频谱编码单元406的参数为LPC系数而不是音调增益。

实施方式的频谱编码单元406的主要结构为如图22所示的结构。与上述图19的不同之处在于，提供给变形信息估计单元511的参数为LPC系数而不是音调增益以及变形信息估计单元511内部的结构。

图23是表示本实施方式的变形信息估计单元511的主要结构的方框图。变形信息估计单元511包括：判断表格512、类似程度判断单元513、变形信息表格514以及切换单元515。变形信息表格514与图15中的变形信息表格306同样地记录着估计变形信息的候补。不过，该估计变形信息的候补是对应LPC系数而设计的。判断表格512中记录着LPC系数的候补，判断表格512与变形信息表格514设有相互对应的关系。也就是，当从判断表格512中选择第j个的LPC系数的候补时，适合于该LPC系数候补的估计变形信息存储为变形信息表格514的第j个。LPC系数具有能够用较少的参数准确地表现频谱的轮廓(频谱包络)的特点，能够将该频谱轮廓与控制动态范围的估计变形信息对应起来。本实施方式采用了利用该特点的结构。

相似程度判断单元513从判断表格512中求出与第一层编码单元402提供的LPC系数最为相似的LPC系数。该相似程度判断中，通过判断表格512，求出LPC系数之间的距离(失真)、或者求出将LPC系数变换为LSP(Line Spectrum Pair)系数等的其他的参数后的两者的失真，并求出使该失真为最小时的LPC系数。

表示使失真为最小(即相似程度最大)时的判断表格512中的LPC系数候补的索引，由相似程度判断单元513输出，并提供给切换单元515。切换单元515选择该索引表示的估计变形信息的候补，并由变形信息估计单元511输出。

如上所述，根据本实施方式的编码装置(频谱编码单元406)，能够考虑输入信号的频谱轮廓而恰当地调整估计频谱的动态范围，来提高解码信号的主观质量。

接下来，说明本实施方式5的分层解码装置的结构，该解码装置能够对由本实施方式5的分层编码装置生成的编码符号进行解码。

本实施方式5的分层解码装置的结构与上述图20一样。不过，由第一层解码单元452输出给频谱解码单元453的参数为LPC系数而不是音调增益。

实施方式的频谱解码单元453的主要结构如图24所示。与上述图21的不同之处在于，提供给变形信息估计单元561的参数为LPC系数而不是音调增益以及变形信息估计单元561内部的结构。

变形信息估计单元561内部的结构，与图22中的频谱编码单元406中的变形信息估计单元511，即图23所示的相同，存储于判断表格512以及变形信息表格514的信息也是编码端和解码端共用的。

如上所述，根据本实施方式的解码装置(频谱解码单元453)，能够对由本实施方式的编码装置编码的信号进行解码，并能够考虑输入信号的频谱轮廓而恰当地调整估计频谱的动态范围，从而提高解码信号的主观质量。

另外，本实施方式中，估计变形信息通过变形信息估计单元511求出，但是也可以与实施方式4相同：将该估计变形信息适用于实施方式1的图4示意的频谱编码单元106，并将该估计变形信息提供给频谱变形单元112，频谱变形单元112将由变形信息估计单元511提供的估计变形信息作为基准，从指数变量表格135中选择其附近的变形信息，并从该限定的变形信息中通过搜索单元125确定最恰当的变形信息。在该结构中，最终所选择的变形信息的编码符号表示为对于作为上述基准的估计变形信息的相对值。如此能对正确的变形信息进行编码并向解码单元传输，因此能够得到维持解码信号的主观质量并减少表示变形信息的比特数的效果。

(实施方式6)

本发明的实施方式6的分层编码装置的基本结构与实施方式1所示的分层编码装置一样，所以省略对其说明，以下只对与频谱变形单元112的结构不同的频谱变形单元612进行说明。

频谱变形单元612将以下的变形施加于第一频谱S1(k)(0≤k＜FL)，使第一频谱S1(k)的动态范围接近于第二频谱S2(k)的高频部分(FL≤k＜FH)的动态范围。频谱变形单元612对有关该变形的变形信息进行编码且输出。

图25是用于说明本实施方式的频谱变形方法的图。

该图示出了第一频谱S1(k)的振幅的分布。第一频谱S1(k)显示出因频率k(0≤k＜FL)的值而各异的振幅。于是，如果横轴取振幅，纵轴取该振幅出现的概率，则如图所示，出现以振幅的平均值m1为中心的类似正态分布的分布。

本实施方式中，首先将该分布粗分为距离平均值m1较近的组(图中的区域B)和距离平均值m1较远的组(图中的区域A)。接下来，求出这两组的振幅的代表值，具体来讲，求出包含于区域A的频谱的振幅的平均值和包含于区域B的频谱的振幅的平均值。在此，振幅使用将设平均值m1设为零而换算出来时的振幅的绝对值(从各值减去平均值m1)。譬如，区域A由振幅比平均值m1大的和振幅比平均值m1小的两个区域构成，通过设平均值m1为零而换算的处理，则包含于两个区域的频谱的振幅的绝对值具有相同的值。因此，譬如区域A的平均值，相当于将第一频谱中换算后的振幅(绝对值)比较大的频谱汇成一个组并将该组的振幅的代表值计算出来；区域B的平均值，相当于将第一频谱中换算后的振幅(绝对值)比较小的频谱汇成一个组并将该组的振幅的代表值计算出来。由此，这两个代表值为概括地表现第一频谱的动态范围的参数。

其次，在本实施方式，对第二频谱进行与对第一频谱进行的相同的处理，而求出对应于第二频谱的各组的代表值。接下来，求出区域A的第一频谱的代表值与第二频谱的代表值的比(具体来讲为，第二频谱的代表值对第一频谱的代表值的比)，以及求出区域B的第一频谱的代表值与第二频谱的代表值的比。因此，能够大概地计算出第一频谱的动态范围与第二频谱的动态范围的比。本实施方式的频谱变形单元将该比作为频谱的变形信息进行编码且输出。

图26是表示频谱变形单元612内部的主要结构的方框图。

频谱变形单元612大致分为：对第一频谱的上述各组进行代表值计算的系统；对第二频谱的上述各组进行代表值计算的系统；基于这两个系统计算出来的代表值，确定变形信息的变形信息确定单元626；以及，基于该变形信息来生成变形频谱的变形频谱生成单元627。

计算第一频谱的代表值的系统，具体来讲，包括：偏差程度计算单元621-1、第一阈值设定单元622-1、第二阈值设定单元622-1、第一平均频谱计算单元624-1以及第二平均频谱计算单元625-1。计算第二频谱的代表值的系统、基本上与计算第一频谱的代表值的系统具有相同的结构，对图中相同的结构编上相同的编号，编号后面的分支号表示处理系统的不同。并且对于相同的结构要素省略对其说明。

偏差程度计算单元621-1根据输入的第一频谱S1(k)的振幅分布，计算与第一频谱的平均值m1的“偏差程度”，并输出到第一阈值设定单元622-1以及第二阈值设定单元623-1。“偏差程度”具体来讲是第一频谱的振幅分布的标准偏差σ1。

第一阈值设定单元622-1利用由偏差计算单元621-1求出的第一频谱的标准偏差σ1来求出第一阈值TH1。在此第一阈值TH1是指第一频谱中用来指定包含于上述区域A的绝对振幅比较大的频谱的阈值，是将标准偏差σ1乘上预定的常数a的值。

第二阈值设定单元623-1的操作与第一阈值设定单元622-1的操作相同，求出的第二阈值TH2是指第一频谱中用来指定包含于区域B的绝对振幅比较小的频谱的阈值，是将标准偏差σ1乘上预定的常数b(＜a)的值。

第一平均频谱计算单元624-1求出位于第一阈值TH1外侧的频谱，即包含于区域A的频谱的振幅的平均值(以下称为第一平均值)，并输出到变形信息确定单元626。

具体来讲，第一平均频谱计算单元624-1将第一频谱的各个子带的频谱的振幅(但是为换算前的值)与第一频谱的平均值m1加上第一阈值TH1的值(m1+TH1)进行比较，指定具有比该值还大的振幅的频谱(步骤1)。接下来，第一平均频谱计算单元624-1将第一频谱的各个子带的频谱的振幅与第一频谱的平均值m1减去第一阈值TH1的值(m1-TH1)进行比较，指定具有比该值还小的振幅的频谱(步骤2)。然后，对由步骤1以及步骤2求出的频谱的振幅进行上述设平均值m1为零的换算，求出得到的换算值的绝对值的平均值，并输出到变形信息确定单元626。

第二平均频谱计算单元625-1求出位于第二阈值TH2内侧的频谱，即包含于区域B的频谱的振幅的平均值(以下称为第二平均值)，并输出到变形信息确定单元626。具体的操作与第一平均频谱计算单元624-1相同。

上述处理求出的第一平均值以及第二平均值为第一频谱的区域A以及区域B的代表值。

求出第二频谱的代表值的处理基本上与上述相同。不过，第一频谱与第二频谱为不同的频谱，所以相当于第一阈值TH1的第三阈值TH3为在第二频谱的标准偏差σ1上乘上预定的常数c的值；相当于第二阈值TH2的第四阈值TH4为在第二频谱的标准偏差σ1上乘上预定的常数d(＜c)的值。

变形信息确定单元626利用由第一平均频谱计算单元624-1得到的第一平均值、由第二平均频谱计算单元625-1得到的第二平均值、由第三平均频谱计算单元624-2得到的第三平均值以及由第四平均频谱计算单元625-2得到的第四平均值，如以下所示确定变形信息。

即，变形信息确定单元626计算第一平均值与第三平均值的比(以下称为第一增益)，以及第三平均值第四平均值的比(以下称为第二增益)。然后，因为变形信息确定单元626在内部具有预先存储变形信息的多个编码候补的数据表格，将第一增益以及第二增益与这些编码候补相比较，选择最为相似的编码候补，并将表示该编码候补的索引作为变形信息输出。而且，该索引还送到变形频谱生成单元627。

变形频谱生成单元627利用作为输入信号的第一频谱、由第一阈值设定单元622-1得到的第一阈值TH1、由第二阈值设定单元623-1得到的第二阈值TH2以及由变形信息确定单元626输出的变形信息，进行第一频谱的变形处理，并将生成的变形频谱输出。

图27、图28是用于说明变形频谱的生成方法的图。

变形频谱生成单元627利用变形信息，计算第一平均值与第三平均值的比的解码值(以下称为解码第一增益)，以及第二平均值与第四平均值的比的解码值(以下称为解码第二增益)。这些对应关系如图27所示。

接下来，变形频谱生成单元627通过比较第一频谱的振幅值与第一阈值TH1，指定属于区域A的频谱，并将这些频谱乘上解码第一增益。同样地，变形频谱生成单元627通过比较第一频谱的振幅值与第二阈值TH2，指定属于区域B的频谱，并将这些频谱乘上解码第二增益。

另一方面，如图28所示，在第一频谱中，对于夹在第一阈值TH1与第二阈值TH2之间的区域(以下称为区域C)所属的频谱，不存在编码信息。于是，变形频谱生成单元627使用具有解码第一增益与解码第二增益的中心值的增益。譬如，如图28所示，根据基于解码第一增益、解码第二增益、第一阈值TH1以及第二阈值TH2的特性曲线，求出对应某振幅x的解码增益y，并将该增益乘上第一频谱的振幅即可。也就是，解码增益y为解码第一增益以及解码第二增益的线性插值。

图29是表示用于解码装置的频谱变形单元662内部的主要结构的方框图。另外，该频谱变形单元662对应于实施方式1所示的变形单元162。

因为基本操作与上述频谱变形单元612相同，省略对其详细说明。该频谱变形单元662只以第一频谱为处理对象，因此处理系统为一个。

如上所述，根据本实施方式，分别掌握第一频谱的振幅的分布以及第二频谱的振幅的分布，分成绝对振幅比较大的组与绝对振幅比较小的组，并求出各组的振幅的代表值。而且，通过求出第一频谱和第二频谱的各组的振幅的代表值的比，得到第一频谱以及第二频谱之间的动态范围的比，即得到频谱的变形信息，并将其进行编码。由此，无需使用如指数函数那样的计算量大的函数而得到变形信息。

另外，根据本实施方式，利用第一频谱以及第二频谱的振幅的分布求出标准偏差，并基于该标准偏差求出第一阈值～第四阈值。由此设定基于实际的频谱的阈值，因此能够提高变形信息的编码精确度。

另外，根据本实施方式，利用解码第一增益以及解码第二增益对第一频谱进行增益调整，由此控制第一频谱的动态范围。而且，确定解码第一增益以及解码第二增益，以使得第一频谱接近第二频谱的高频部分。因此，第一频谱的动态范围接近第二频谱的高频部分的动态范围。而且，解码第一增益以及解码第二增益的计算无需使用如指数函数那样的计算量大的函数。

另外，本实施方式以解码第一增益比解码第二增益大的情形为例进行了说明，根据语音信号的性质，也有解码第二增益比解码第一增益大的情形。也就是，第二频谱的高频部分动态范围比第一频谱的动态范围大的情形。这样的现象多在输入语音信息为如摩擦音的声音时发生。在该情形也能够适用本实施方式的频谱变形方法。

另外，在本实施方式中，将频谱分成绝对振幅较大的组与绝对振幅较小的组两个组，并以该情形为例进行了说明，但是为了提高动态范围的再现性，也可以分成更多的组。

另外，在本实施方式中，将平均值作为基准来换算振幅，而且基于该换算后的振幅将频谱分为振幅比较大的组和振幅比较小的组，并以该情形为例进行了说明，但是直接使用原来的振幅值，并基于该振幅对频谱进行分组也可以。

另外，在本实施方式中，使用标准偏差来计算频谱的绝对振幅的偏差，并以该情形为例进行了说明，但是并不只限于此，譬如作为与标准偏差同样的统计参数也可以利用方差。

另外，在本实施方式中，使用各组的频谱的绝对振幅的平均值作为各组的频谱振幅的代表值，并以该情形为例进行了说明，但是并不只限于此，譬如也可以利用各组的频谱的绝对振幅的中心值。

另外，在本实施方式中，以使用各频谱的振幅值来调整动态范围的情形为例进行了说明，但是也可以使用频谱的功率值来代替振幅值。

另外，在求出所对应各组的代表值时，譬如像MDCT系数那样，当从一开始频谱的振幅就具有正或者负的符号时，无需将平均值换算为零，只要利用频谱的振幅的绝对值来求出各组所对应的代表值即可。

以上，说明了本发明的各个实施方式。

本发明的编码装置以及解码装置，不为上述各实施方式所限定，可以加以各种变更来实施。

本发明的编码装置以及解码装置，可以配置于移动台通信系统的通信终端装置以及基站装置，并且可以以此提供具有同样作用效果的通信终端装置以及基站装置。

另外，在此举了将本发明适用于可扩展编码方式的例子来说明，本发明还可以适用于其他的编码方式。

另外，在此举了通过硬件来构成本发明的例子来说明，本发明还可以通过软件来实现。譬如，通过编程语言，对本发明的编码方法(解码方法)的算法进行记述，并在内存中保存该程序并通过信息处理装置来实行，从而能够实现与本发明的编码装置(解码装置)相同的功能。

另外，上述的各功能模块，典型地由集成电路LSI(大规模集成电路)来实现。这些既可以分别实行单芯片化，也可以包含其中一部分或者是全部而实行单芯片化。

另外，在此虽然称做LSI，但根据集成度的不同也可以称为IC(集成电路)、系统LSI(系统大规模集成电路)、超LSI(超大规模集成电路)、极大LSI(极大规模集成电路)。

另外，集成电路化的技术不只限于LSI，也可以使用专用电路或通用处理器来实现。也可以利用LSI制造后能够编程的FPGA(Field Programmable Gate Array，现场可编程门阵列)，或可以利用将LSI内部的电路块连接或设定重新配置的可重配置处理器(Reconfigurable Processor)。

再有，如果随着半导体技术的进步或者其他技术的派生，出现了替换LSI集成电路的技术，当然也可以利用该技术来实现功能块的集成化。也有应用生物工程学技术等的可能性。

本说明书根据2004年5月14日申请的日本专利特愿2004-145425、2004年11月5日申请的日本专利特愿2004-322953号以及2005年4月28日申请的日本专利特愿2005-133729。该内容全部包括在此作为参考。

工业实用性

本发明的编码装置、解码装置以及编码/解码的方法能够适用于可扩展编码/解码等。

Claims

1.一种音频解码装置，包括：

变换单元，将对包含于通过输入到音频编码装置的输入信号所生成的音频编码中的低频频谱部分的音频编码进行解码所得的信号变换成频域信号而生成第一低频频谱；

变形信息估计单元，使用所述输入信号的频谱轮廓信息估计变形信息，所述变形信息用于对所述第一低频频谱的振幅进行一致性限制；

限制单元，使用估计出的所述变形信息，对所述第一低频频谱的振幅进行一致性限制而生成第二低频频谱；以及

解码单元，对包含于所述音频编码装置所生成的音频编码中的高频频谱部分的音频编码基于所述第二低频频谱进行解码而生成高频频谱，

其中，所述一致性限制使所述第二低频频谱的动态范围接近所述高频频谱部分的动态范围。

2.如权利要求1所述的音频解码装置，其中，所述限制单元使用从0到1的范围内的预定值对所述第一低频频谱的振幅一致地进行乘幂，由此生成所述第二低频频谱。

3.如权利要求1所述的音频解码装置，其中，所述解码单元使用音调滤波器生成所述高频频谱，所述音调滤波器具有所述第二低频频谱作为内部状态。

4.如权利要求1所述的音频解码装置，其中，所述解码单元生成所述高频频谱包括：通过复制离开延迟系数T的所述第二低频频谱而进行滤波。

5.如权利要求1所述的音频解码装置，其中，所述变形信息估计单元使用表示所述输入信号的周期性的音调信息估计变形信息，所述变形信息用于对所述第一低频频谱的振幅进行一致性限制。

6.如权利要求5所述的音频解码装置，其中，所述变形信息估计单元使用由音调增益与音调周期中的至少一个而构成的所述音调信息来估计所述变形信息。

7.如权利要求1所述的音频解码装置，其中，所述变形信息估计单元包括：

频谱轮廓信息存储单元，存储频谱轮廓信息的多个候补；以及

动态范围信息存储单元，存储动态范围信息的多个候补，

其中，所述变形信息估计单元从所述频谱轮廓信息存储单元中选择与所述输入信号的频谱轮廓信息对应的频谱轮廓信息的候补，并且从所述动态范围信息存储单元中选择与所述选择出的频谱轮廓信息的候补对应的动态范围信息的候补，由此估计所述变形信息。

8.一种包括权利要求1所述的音频解码装置的通信终端装置。

9.一种包括权利要求1所述的音频解码装置的基站装置。

10.一种音频解码方法，包括：

变换步骤，将对包含于通过输入到音频编码装置的输入信号所生成的音频编码中的低频频谱部分的音频编码进行解码所得的信号变换成频域信号而生成第一低频频谱；

变形信息估计步骤，使用所述输入信号的频谱轮廓信息估计变形信息，所述变形信息用于对所述第一低频频谱的振幅进行一致性限制；

限制步骤，使用估计出的所述变形信息，对所述第一低频频谱的振幅进行一致性限制而生成第二低频频谱；以及

解码步骤，对包含于所述音频编码装置所生成的音频编码中的高频频谱部分的音频编码基于所述第二低频频谱进行解码而生成高频频谱，