CN101548318A

CN101548318A - 编码装置、解码装置以及其方法

Info

Publication number: CN101548318A
Application number: CNA2007800444142A
Authority: CN
Inventors: 山梨智史; 押切正浩
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: III Holdings 12 LLC
Priority date: 2006-12-15
Filing date: 2007-12-14
Publication date: 2009-09-30
Anticipated expiration: 2027-12-14
Also published as: EP2101322A1; US8560328B2; EP2101322A4; JP5339919B2; WO2008072737A1; EP2101322B1; JPWO2008072737A1; CN101548318B; US20100017198A1

Abstract

公开了解码装置等，能够根据在编码端的高层选择的编码频带，灵活地计算高精度的高频频谱数据，获得质量更佳的解码信号。该装置中，第一层解码单元(202)对第一层编码信息进行解码而生成第一层解码信号，第二层解码单元(204)对第二层编码信息进行解码而生成第二层解码信号，频谱解码单元(205)使用第二层解码信号和在上采样单元(203)中上采样后的第一层解码信号来进行频带扩展处理，从而生成全频带解码信号，开关(206)基于在控制单元(201)中生成的控制信息，输出第一层解码信号或者全频带解码信号。

Description

编码装置、解码装置以及其方法

技术领域

本发明涉及对信号进行编码而传输的通信系统中使用的编码装置、解码装置以及其方法。

背景技术

在以因特网通信为代表的分组通信系统或移动通信系统等系统中，在传输语音/音频信号时，为了提高语音/音频信号的传输效率，通常使用压缩/编码技术。另外，近年来，对以下技术的需求日益增高，该技术为，一方面单纯地以低比特率对语音/音频信号进行编码，另一方面对更宽的频带的语音/音频信号进行编码。

针对这种需求，开发了各种各样的技术，以对宽带的语音/音频信号进行编码也不使编码后的信息量大幅增加。例如，非专利文献1中举出了如下的方法：将输入信号变换为频域分量，利用低频频谱数据和高频频谱数据之间的相关，计算从低频频谱数据生成高频频谱数据的参数，在解码时使用该参数进行频带扩展。

[非专利文献1]押切正浩、江原宏幸、吉田幸司、“ピツチフイルタリングに基づくスペクトル符号化用いた超広域スケ—ラブル音声符号化の改善”、音講論集2-4-13、pp.297-298、Sep.2004.

发明内容

本发明需要解决的问题

然而，在现有的频带扩展技术中，在解码端的高层中直接利用在低层进行频带扩展得到的、频率的高频部分的频谱数据，所以不能说，可再现足够的精度的高频部分的频谱数据。

本发明的目的是，提供编码装置、解码装置和其方法，能够在解码端使用低频频谱数据计算高精度的高频频谱数据，能够获得质量更佳的解码信号。

解决问题的方案

本发明的编码装置采用的结构包括：第一编码单元，对输入信号中的低频部分即低于规定频率的频带进行编码而生成第一编码数据；第一解码单元，对所述第一编码数据进行解码而生成第一解码信号；第二编码单元，对所述输入信号与所述第一解码信号之残差信号的规定的频带部分进行编码而生成第二编码数据；以及滤波单元，对所述输入信号、所述第一解码信号以及使用所述第一解码信号计算出的计算信号的其中一个信号的所述低频部分进行滤波，从而获得基音(pitch)系数和滤波器系数，该基音系数和滤波器系数为，用于获得所述输入信号的高频部分即高于所述规定频率的频带的系数。

本发明的解码装置为，采用r层的分层结构的可扩展编解码的解码装置，该解码装置采用的结构包括：接收单元，接收在编码装置使用第m层的解码信号计算出的频带扩展参数；以及解码单元，对第n层的解码信号的低频分量使用所述频带扩展参数，从而生成高频分量，其中，r为2以上的整数，m和n为r以下的整数。

本发明的解码装置采用的结构包括：接收单元，接收第一编码数据、第二编码数据、以及基音系数和滤波器系数，所述第一编码数据为，对所述编码装置的输入信号中的低频部分即低于规定频率的频带进行编码而获得的数据，所述第二编码数据为，对解码所述第一编码数据而获得的第一解码频谱与所述输入信号的频谱之残差的规定的频带部分进行编码而获得的数据，所述基音系数和滤波器系数为，对所述输入信号、所述第一解码频谱、以及将所述第一解码频谱和对所述第二编码数据进行解码而获得的第二解码频谱相加而获得的第一相加频谱中的任意一个的所述低频部分进行滤波而获得的、用于获得所述输入信号的高频部分即高于所述规定频率的频带的系数；第一解码单元，对所述第一编码数据进行解码而生成所述低频中的第三解码频谱；第二解码单元，对所述第二编码数据进行解码而生成所述规定的频带部分中的第四解码频谱；以及第三解码单元，使用所述基音系数和滤波器系数，对所述第三解码频谱、所述第四解码频谱、以及使用其双方来生成的第五解码频谱中的任意一个频谱进行频带扩展，从而解码在所述第一解码单元和所述第二解码单元中未解码的频带部分。

本发明的编码方法包括：第一编码步骤，对输入信号中的低频部分即低于规定频率的频带进行编码而生成第一编码数据；解码步骤，对所述第一编码数据进行解码而生成第一解码信号；第二编码步骤，对所述输入信号与所述第一解码信号之残差信号的规定的频带部分进行编码而生成第二编码数据；以及滤波步骤，对所述输入信号、所述第一解码信号以及用所述第一解码信号计算出的计算信号中的任意一个信号的所述低频部分进行滤波，从而获得基音系数和滤波器系数，该基音系数和滤波器系数为，用于获得所述输入信号的高频部分即高于所述规定频率的频带的系数。

本发明的解码方法为，采用r层(r为2以上的整数)的分层结构的可扩展编解码的解码方法，该解码方法包括：接收步骤，接收在编码装置使用第m层(m为r以下的整数)的解码信号计算出的频带扩展参数；以及解码步骤，对第n层(n为r以下的整数)的解码信号的低频分量使用所述频带扩展参数，从而生成高频分量，其中，r为2以上的整数，m和n为r以下的整数。

本发明的解码方法包括：接收步骤，接收第一编码数据、第二编码数据、以及基音系数和滤波器系数，所述第一编码数据为，对所述编码装置的输入信号中的低频部分即低于规定频率的频带进行编码而获得的数据，所述第二编码数据为，对解码所述第一编码数据而获得的第一解码频谱与所述输入信号的频谱之残差的规定的频带部分进行编码而获得的数据，所述基音系数和滤波器系数为，对所述输入信号、所述第一解码频谱、以及将所述第一解码频谱和对所述第二编码数据进行解码而获得的第二解码频谱相加而获得的第一相加频谱的、其中任意一个的所述低频部分进行滤波而获得的、用于获得所述输入信号的高频部分即高于所述规定频率的频带的系数；第一解码步骤，对所述第一编码数据进行解码而生成所述低频中的第三解码频谱；第二解码步骤，对所述第二编码数据进行解码而生成所述规定的频带部分中的第四解码频谱；以及第三解码步骤，使用所述基音系数和滤波器系数，对所述第三解码频谱、所述第四解码频谱、以及使用其双方来生成的第五解码频谱中的任意一个频谱进行频带扩展，从而解码在所述第一解码步骤和所述第二解码步骤中未解码的频带部分。

本发明的有益效果

根据本发明，在编码端的高层中选择编码频带，在解码端进行频带扩展而解码在低层和高层都未能解码的频带的分量，从而能够根据在编码端的高层所选择的编码频带，灵活地计算高精度的高频频谱数据，能够获得质量更佳的解码信号。

附图说明

图1是表示本发明实施方式1的编码装置的主要结构的方框图。

图2是表示本发明实施方式1的第二层编码单元内部的主要结构的方框图。

图3是表示本发明实施方式1的频谱编码单元内部的主要结构的方框图。

图4是用于说明本发明实施方式1的滤波单元的滤波处理的概要的图。

图5是用于说明随着本发明实施方式1的基音系数T的变化，输入频谱的估计值的频谱如何变化的图。

图6是用于说明随着本发明实施方式1的基音系数T的变化，输入频谱的估计值的频谱如何变化的图。

图7是表示本发明实施方式1的基音系数设定单元、滤波单元和搜索单元中进行的处理的步骤的流程图。

图8是表示本发明实施方式1的解码装置的主要结构的方框图。

图9是表示本发明实施方式1的第二层解码单元内部的主要结构的方框图。

图10是表示本发明实施方式1的频谱解码单元内部的主要结构的方框图。

图11是表示本发明实施方式1的滤波单元中生成的解码频谱的图。

图12是表示本发明实施方式1的第一频谱S1(k)的频带与第二频谱S2(k)的频带完全重叠的情况的图。

图13是表示本发明实施方式1的第一频谱S1(k)的频带与第二频谱S2(k)的频带不相接而彼此相隔的情况的图。

图14是表示本发明实施方式2的编码装置的主要结构的方框图。

图15是表示本发明实施方式2的频谱编码单元内部的主要结构的方框图。

图16是表示本发明实施方式3的编码装置的主要结构的方框图。

图17是表示本发明实施方式3的频谱编码单元内部的主要结构的方框图。

具体实施方式

下面，参照附图详细地说明本发明的实施方式。

(实施方式1)

图1是表示本发明实施方式1的编码装置100的主要结构的方框图。

该图中，编码装置100包括：下采样单元101、第一层编码单元102、第一层解码单元103、上采样单元104、延迟单元105、第二层编码单元106、频谱编码单元107以及复用单元108，采用由两个层构成的可扩展结构。另外，编码装置100的第一层中，使用CELP(Code Exited Linear Prediction：码激励线性预测)方式的编码方法，对输入的语音/音频信号进行编码，在第二层编码中，对第一层解码信号与输入信号之残差信号进行编码。编码装置100将输入信号按每N(N为自然数)个样本进行划分，以N个样本为1帧，对每个帧进行编码。

下采样单元101对输入的语音信号和/或音频信号(以下记载为“语音/音频信号”)进行下采样处理，将语音/音频信号的采样频率从Rate1变换为Rate2(Rate1>Rate2)，并输出到第一层编码单元102。

第一层编码单元102对从下采样单元101输入的下采样后的语音/音频信号，进行CELP方式的语音编码，将获得的第一层编码信息输出到第一层解码单元103和复用单元108。具体地说，第一层编码单元102对由声道信息和激励信息构成的语音信号，进行如下的编码：对于声道信息，通过求LPC(线性预测系数：Linear Prediction Coefficient)参数而进行编码，对于激励信息，通过求索引(index)而进行编码，该索引为，用于确定在预先存储的语音模型中使用哪个语音模型的索引，也就是用于确定要生成自适应码本和固定码本的哪个激励矢量的索引。

第一层解码单元103对从第一层编码单元102输入的第一层编码信息，进行CELP方式的语音编码，将获得的第一层解码信号输出到上采样单元104。

上采样单元104对从第一层解码单元103输入的第一层解码信号进行上采样处理，将第一层解码信号的采样频率从Rate2变换为Rate1，然后输出到第二层编码单元106。

延迟单元105通过将输入的语音/音频信号存储到内置的缓存器中，并在规定时间后将其输出，从而将延迟后的语音/音频信号输出到第二层编码单元106。这里，延迟的规定时间是，考虑了在下采样单元101、第一层编码单元102、第一层解码单元103和上采样单元104中产生的算法延迟的时间。

第二层编码单元106对从延迟单元105输入的语音/音频信号与从上采样单元104输入的上采样后的第一层解码信号之残差信号进行增益/形状(shape)量化，从而进行第二层编码，将获得的第二层编码信息输出到复用单元108。第二层编码单元106的内部结构和具体动作在后面描述。

频谱编码单元107将输入的语音/音频信号变换为频域，对获得的输入频谱的低频分量与高频分量之间的相关进行分析，计算用于在解码端进行频带扩展根据低频分量估计高频分量的参数，将其作为频谱编码信息输出到复用单元108。频谱编码单元107的内部结构和具体动作在后面描述。

复用单元108将从第一层编码单元102输入的第一层编码信息、从第二层编码单元106输入的第二层编码信息、以及从频谱编码单元107输入的频谱编码信息进行复用，并将获得的比特流发送到解码装置。

图2是表示第二层编码单元106内部的主要结构的方框图。

该图中，第二层编码单元106包括：频域变换单元161和162、残差MDCT系数计算单元163、频带选择单元164、形状量化单元165、有无预测编码判定单元166、增益量化单元167以及复用单元168。

频域变换单元161使用从延迟单元105输入的延迟后的语音/音频信号，进行改进离散余弦变换(MDCT：Modified Discrete Cosine Transform)，并将获得的输入MDCT系数输出到残差MDCT系数计算单元163。

频域变换单元162使用从上采样单元104输入的上采样后的第一层解码信号进行MDCT，并将获得的第一层MDCT系数输出到残差MDCT系数计算单元163。

残差MDCT系数计算单元163计算从频域变换单元161输入的输入MDCT系数与从频域变换单元162输入的第一层MDCT系数之间的残差，并将获得的残差MDCT系数输出到频带选择单元164和形状量化单元165。

频带选择单元164将从残差MDCT系数计算单元163输入的残差MDCT系数分割为多个子带，从多个子带中选择作为量化对象的频带(量化对象频带)，并将用于表示所选择的频带的频带信息，输出到形状量化单元165、有无预测编码判定单元166以及复用单元168。这里，用于选择量化对象频带的方法有，选择能量最高的频带的方法、或者同时考虑与以前选择的量化对象频带之间的相关和能量来进行选择的方法等。

形状量化单元165使用从残差MDCT系数计算单元163输入的残差MDCT系数中的、与从频带选择单元164输入的频带信息所示的量化对象频带对应的MDCT系数即第二层MDCT系数，进行形状量化，并将获得的形状编码信息输出到复用单元168。另外，形状量化单元165求形状量化的理想增益值，并将求出的理想增益值输出到增益量化单元167。

有无预测编码判定单元166使用从频带选择单元164输入的频带信息，求在当前帧的量化对象频带与先前帧的量化对象频道之间共用的子带(sub-band)的数目。然后，在共用的子带的数目为规定值以上时，有无预测编码判定单元166判定为对频带信息所示的量化对象频带的残差MDCT系数、即第二层MDCT系数进行预测编码，而在共用的子带的数目小于规定值时，判定为不对第二层MDCT系数进行预测编码。有无预测编码判定单元166将判定结果输出到增益量化单元167。

在从有无预测编码判定单元166输入的判定结果表示进行预测编码的判定结果时，增益量化单元167使用在内置的缓存器中存储的先前帧的量化增益值以及内置的增益码本，对当前帧的量化对象频带的增益进行预测编码，从而获得增益编码信息。另一方面，在从有无预测编码判定单元166输入的判定结果表示不进行预测编码的判定结果时，增益量化单元167将从形状量化单元165输入的理想增益值作为量化对象，直接进行量化，从而获得增益编码信息。增益量化单元167将获得的增益编码信息输出到复用单元168。

复用单元168将从频带选择单元164输入的频带信息、从形状量化单元165输入的形状编码信息以及从增益量化单元167输入的增益编码信息进行复用，将获得的比特流作为第二层编码信息发送到复用单元108。

另外，在第二层编码单元106生成的频带信息、形状编码信息和增益编码信息也可以不经由复用单元168而直接输入到复用单元108，与第一层编码信息和频谱编码信息进行复用。

图3是表示频谱编码单元107内部的主要结构的方框图。

该图中，频谱编码单元107包括：频域变换单元171、内部状态设定单元172、基音系数设定单元173、滤波单元174、搜索单元175以及滤波器系数计算单元176。

频域变换单元171对输入的有效频带为0≤k<FH的语音/音频信号进行变频，并计算输入频谱S(k)。这里，变频方法适用离散傅立叶变换(DFT)、离散余弦变换(DCT)、改进离散余弦变换(MDCT)等。

内部状态设定单元172使用其有效频带为0≤k<FH的输入频谱S(k)，设定在滤波单元174中使用的滤波器的内部状态。另外，该滤波器的内部状态的设定在后面描述。

基音系数设定单元173使基音系数T在预先规定的搜索范围Tmin～Tmax内逐渐变化，同时将其依次输出到滤波单元174。

滤波单元174使用由内部状态设定单元172设定的滤波器的内部状态以及从基音系数设定单元173输出的基音系数T，对输入频谱进行滤波，计算输入频谱的估计值S’(k)。该滤波处理的细节在后面描述。

搜索单元175计算用于表示从频域变换单元171输入的输入频谱S(k)和从滤波单元174输出的输入频谱的估计值S’(k)的相似性的参数、即相似度。另外，该相似度的计算处理，在后面详细描述。每当基音系数设定单元173将基音系数T提供给滤波单元174时，都进行该相似度的计算处理，并将使计算出的相似度为最大的基音系数即最优基音系数T’(Tmin～Tmax的范围)提供给滤波器系数计算单元176。

滤波器系数计算单元176使用从搜索单元175提供的最优基音系数T’以及从频域变换单元171输入的输入频谱S(k)来求滤波器系数β_i，并将滤波器系数β_i和最优基音系数T’作为频谱编码信息输出到复用单元108。另外，滤波器系数计算单元176中的滤波器系数β_i的计算处理的细节，在后面描述。

图4是用于说明滤波单元174的滤波处理的概要的图。

为了方便，将全频带(0≤k<FH)的频谱称为S(k)时，作为滤波单元174的滤波函数，使用下式(1)所示的函数。

P (z) = Σ_{i = - M}^{M} \frac{1}{1 - z^{- T + i}}

...式(1)

该式中，T表示从基音系数设定单元173输入的基音系数，M设为M＝1。

如图4所示，S(k)的0≤k<FL的频带存储有输入频谱S(k)作为滤波器的内部状态。另一方面，S(k)的FL≤k<FH的频带存储用下式(2)求出的输入频谱的估计值S’(k)。

S′(k)＝S(k-T) ...式(2)

此算式中，通过滤波处理，从比k低T的频率的频谱S(k-T)求S’(k)。另外，一边使k在FL≤k<FH的范围内从低频率(k＝FL)依序变化，一边反复进行上述式(2)所示的运算，从而能够计算FL≤k<FH中的输入频谱的估计值S’(k)。

每当基音系数设定单元173提供基音系数T时，在FL≤k<FH的范围内，都对S(k)进行清零后，进行以上的滤波处理。也就是说，每当基音系数T变化时，计算S(k)，并将其输出到搜索单元175。

下面说明在搜索单元175中进行的相似度的计算处理以及最合适的基音系数(最优基音系数)T’的导出处理。

首先，对于相似度而言，存在各种各样的定义。这里，以使用下述相似度的情况为例进行说明，该相似度将滤波器系数β_-1和β₁视为0且基于最小平方误差算法根据下式(3)定义。

E = Σ_{k = FL}^{FH - 1} S {(k)}^{2} - \frac{{(Σ_{k = FL}^{FH - 1} S (k) \cdot S' (k))}^{2}}{Σ_{k = FL}^{FH - 1} S' {(k)}^{2}}

...式(3)

使用上述相似度时，在计算最合适的基音系数T’后再决定滤波器系数β_i，关于滤波器系数β_i的计算，在后面描述。这里，E表示S(k)与S’(k)之间的平方误差。该式中，右边输入项为与基音系数T无关的固定值，因此搜索用于生成使右边第二项为最大的S′(k)的基音系数T。这里，如下式(4)所示，将上述的式(3)的右边第二项定义为相似度。也就是说，搜索使下式(4)所示的相似度A为最大的基音系数T’。

A = \frac{{(Σ_{k = FL}^{FH - 1} S (k) \cdot S' (k))}^{2}}{Σ_{k = FL}^{FH - 1} S' {(k)}^{2}}

...式(4)

图5是用于说明随着基音系数T的变化，输入频谱的估计值S’(k)的频谱如何变化的图。

图5A是表示作为内部状态存储的、具有谐波结构的输入频谱S(k)的图。图5B～图5D是表示通过使用三种基音系数T0、T1和T2分别进行滤波而计算出的、输入频谱的估计值S’(k)的频谱的图。

该图所示的例子中，图5C所示的频谱与图5A所示的频谱相似，由此可知，用T1计算的相似度表示最高的值。也就是说，T1最适合作为能够保持谐波结构的基音系数T。

图6与图5同样，是用于说明随着基音系数T的变化，输入频谱的估计值S’(k)的频谱如何变化的图。但是，作为内部状态存储的输入频谱的相位与图5所示的情况不同。图6所示的例子中，也在T1时基音系数T能够保持谐波结构。

在搜索单元175中，使基音系数T变化来搜索使相似度为最大的T，该处理相当于通过逐次逼近法(try and error)搜索频谱的谐波结构的基音(或者其整数倍)。并且，滤波单元174基于此谐波结构的基音，计算输入频谱的估计值S’(k)，因此在输入频谱与估计频谱之间的连接部分，不会破坏谐波结构。输入频谱S(k)与估计频谱S’(k)的连接部分k＝FL的估计值S’(k)是基于相隔了相当于谐波结构的基音(或者其整数倍)T的输入频谱而计算的，考虑到这个事实就可容易理解上述情况。

接着说明滤波器系数计算单元176中的滤波器系数的计算处理。

滤波器系数计算单元176使用搜索单元175提供的最优基音系数T’，求使下式(5)所示的平方失真E最小的滤波器系数β_i。

E = Σ_{k = FL}^{FH - 1} {(S (k) - Σ_{i = - 1}^{1} β_{i} \cdot S (k - T' - i))}^{2}

...式(5)

具体地说，滤波器系数计算单元176预先具有多个β_i(i＝-1、0、1)的组合作为数据表，在确定使上述的式(5)的平方失真E最小的β_i(i＝　-1、0、1)的组合后，输出其索引。

图7是表示在基音系数设定单元173、滤波单元174以及搜索单元175中进行的处理的步骤的流程图。

首先，在ST1010中，基音系数设定单元173将基音系数T和最优基音系数T’设定为搜索范围的下限值Tmin，将最大相似度Amax设定为0。

接着，在ST1020中，滤波单元174对输入频谱进行滤波，计算输入频谱的估计值S’(k)。

接着，在ST1030中，搜索单元175计算输入频谱S(k)与输入频谱的估计值S’(k)的相似度A。

接着，在ST1040中，搜索单元175比较计算出的相似度A和最大相似度Amax。

在ST1040的比较结果，相似度A为最大相似度Amax以下时(ST1040：否)，处理步骤转移到ST1060。

另一方面，在ST1040的比较结果，相似度A大于最大相似度Amax时(ST1040：是)，在ST1050中，搜索单元175用相似度A更新最大相似度Amax，用基音系数T更新最优基音系数T’。

接着，在ST1060中，搜索单元175比较基音系数T和搜索范围的上限值Tmax。

在ST1060的比较结果，基音系数T为搜索范围的上限值Tmax以下时(ST1060：否)，在ST1070中，搜索单元175将T增值1，以使T＝T+1。

另一方面，在ST1060的比较结果，基音系数T大于搜索范围的上限值Tmax时(ST1060：是)，在ST1080中，搜索单元175输出最优基音系数T’。

如上所述，编码装置100在频谱编码单元107中，对于分割为低频部分(0≤k<FL)和高频部分(FL≤k<FH)的两个部分的输入信号的频谱，使用具有低频频谱作为其内部状态的滤波单元174，估计高频频谱的形状。而且将表示低频频谱与高频频谱之间的相关性的、表示滤波单元174的滤波特性的参数T’以及β_i本身传输到解码装置以代替高频频谱，因此能够以低比特率、高质量地对频谱进行编码。这里，表示低频频谱与高频频谱之间的相关性的最优基音系数T’和滤波器系数β_i也为用于根据低频频谱估计高频频谱的估计参数。

另外，频谱编码单元107的滤波单元174使用低频频谱估计高频频谱的形状时，基音系数设定单元173使作为估计的基准的低频频谱与高频频谱之间的频率差即基音系数T变化为各种基音系数T，并将其输出，搜索单元175搜索使低频频谱与高频频谱的相似度为最大的基音系数T’。由此，能够基于整个频谱的谐波结构的基音而估计高频频谱的形状，维持整个频谱的谐波结构而进行编码，提高解码语音信号的质量。

而且，因为能够维持整个频谱的谐波结构而进行编码，所以无需基于谐波结构的基音设定低频频谱的带宽，也就是说，无需使低频频谱的带宽与谐波结构的基音(或者其整数倍)一致，可以任意设定带宽。因此，通过简单的动作，就能够在低频频谱和高频频谱的连接部分平滑地连接频谱，提高解码语音信号的质量。

图8是表示本实施方式的解码装置200的主要结构的方框图。

该图中，解码装置200包括：控制单元201、第一层解码单元202、上采样单元203、第二层解码单元204、频谱解码单元205以及开关206。

控制单元201将从编码装置100传输的、构成比特流的第一层编码信息和第二层编码信息以及频谱编码信息进行分离，将获得的第一编码信息输出到第一层解码单元202，将第二层编码信息输出到第二层解码单元204，并将频谱编码信息输出到频谱解码单元205。另外，根据从编码装置100传输的比特流的结构要素，控制单元201自适应地生成用于控制开关206的控制信息，并将其输出到开关206。

第一层解码单元202对从控制单元201输入的第一层编码信息，进行CELP方式的解码，并将获得的第一层解码信号输出到上采样单元203和开关206。

上采样单元203对从第一层解码单元202输入的第一层解码信号进行上采样处理，将第一层解码信号的采样频率从Rate2变换为Rate1，并输出到频谱解码单元205。

第二层解码单元204使用从控制单元201输入的第二层编码信息，进行增益/形状的反量化，并将获得的第二层MDCT系数、即量化对象频带的残差MDCT系数输出到频谱解码单元205。另外，第二层解码单元204内部的结构和具体动作在后面描述。

频谱解码单元205使用从第二层解码单元204输入的第二层MDCT系数、从控制单元201输入的频谱编码信息、以及从上采样单元203输入的上采样后的第一层解码信号，进行频带扩展处理后，将获得的第二层解码信号输出到开关206。另外，频谱解码单元205内部的结构和具体动作，在后面描述。

从编码装置100传输到解码装置200的比特流由第一层编码信息、第二层编码信息和频谱编码信息构成时，或者上述比特流由第一层编码信息、频谱编码信息构成时，或者上述比特流由第一层编码信息、第二层编码信息构成时，开关206基于从控制单元201输入的控制信息，将从频谱解码单元205输入的第二层解码信号作为解码信号输出。另一方面，在上述比特流仅由第一层编码信息构成时，开关206将从第一层解码单元202输入的第一层解码信号作为解码信号输出。

图9是表示第二层解码单元204内部的主要结构的方框图。

该图中，第二层解码单元204包括：分离单元241、形状反量化单元242、有无预测解码判定单元243以及增益反量化单元244。

分离单元241在从控制单元201输入的第二层编码信息中，分离频带信息、形状编码信息以及增益编码信息，将获得的频带信息输出到形状反量化单元242和有无预测解码判定单元243，将形状编码信息输出到形状反量化单元242，将增益编码信息输出到增益反量化单元244。

形状反量化单元242对从分离单元241输入的形状编码信息进行解码，求与从分离单元241输入的频带信息所示的量化对象频带对应的MDCT系数的形状的值，并将其输出到增益反量化单元244。

有无预测解码判定单元243使用从分离单元241输入的频带信息，求在当前帧的量化对象频带与先前帧的量化对象频道之间共用的子带的数目。然后，在共用的子带的数目为规定值以上时，有无预测解码判定单元243判定对频带信息所示的量化对象频带的MDCT系数进行预测解码，而在共用的子带的数目小于规定值时，判定不对频带信息所示的量化对象频带的MDCT系数进行预测解码。有无预测解码判定单元243将判定结果输出到增益反量化单元244。

在从有无预测解码判定单元243输入的判定结果为表示进行预测解码的判定结果时，增益反量化单元244使用在内置的缓存器中存储的先前帧的增益值以及内置的增益码本，对从分离单元241输入的增益编码信息进行预测解码，从而获得增益值。另一方面，在从有无预测解码判定单元243输入的判定结果为表示不进行预测解码的判定结果时，增益反量化单元244使用内置的增益码本，对从分离单元241输入的增益编码信息直接进行反量化，从而获得增益值。增益反量化单元244使用获得的增益值、以及从形状反量化单元242输入的形状的值，求第二层MDCT系数即量化对象频带的残差MDCT系数，并将其输出。

具有上述结构的第二层解码单元204中的动作是与第二层解码单元106中的动作相反的动作，因此省略其详细说明。

图10是表示频谱解码单元205内部的主要结构的方框图。

该图中，频谱解码单元205包括：频域变换单元251、相加频谱计算单元252、内部状态设定单元253、滤波单元254以及时域变换单元255。

频域变换单元251对从上采样单元203输入的上采样后的第一层解码信号进行变频，计算第一频谱S1(k)，并将其输出到相加频谱计算单元252。这里，上采样后的第一层解码信号的有效频带为0≤k<FL，变频方法使用离散傅立叶变换(DFT)、离散余弦变换(DCT)、改进离散余弦变换(MDCT)等。

从频域变换单元251输入第一频谱S1(k)并且从第二层解码单元204输入第二层MDCT系数(以下记载为第二频谱S2(k))时，相加频谱计算单元252将第一频谱S1(k)和第二频谱S2(k)相加，将相加结果作为相加频谱S3(k)输出到内部状态设定单元253。另外，在只从频域变换单元251输入第一频谱S1(k)，而不从第二解码单元204输入第二频谱S2(k)时，相加频谱计算单元252将第一频谱S1(k)作为相加频谱S3(k)输出到内部状态设定单元253。

内部状态设定单元253使用相加频谱S3(k)，设定在滤波单元254中使用的滤波器的内部状态。

滤波单元254使用由内部状态设定单元253设定的滤波器的内部状态、以及从控制单元201输入的频谱编码信息所包含的最优基音系数T’和滤波器系数β_i，对相加频谱S3(k)进行滤波，从而生成相加频谱的估计值S3’(k)。然后，滤波单元254将由相加频谱S3(k)和相加频谱的估计值S3’(k)构成的解码频谱S’(k)输出到时域变换单元255。此时，滤波单元254使用上述式(1)所示的滤波函数。

图11是表示在滤波单元254中生成的解码频谱S’(k)的图。

滤波单元254不使用低频(0≤k<FL)频谱即第一层MDCT系数，而使用将第一层MDCT系数(0≤k<FL)和第二层MDCT系数(FL’≤k<FL”)相加得到的、频带为0≤k<FL”的相加频谱S3(k)来进行滤波，从而获得相加频谱的估计值S3’(k)。因此，如图11所示，频带信息所示的量化对象频带、也就是由0≤k<FL”的频带构成的频带中的解码频谱S’(k)，是由相加频谱S3(k)构成的，而在频带FL≤k<FH中不与量化对象频带重叠的部分、也就是频带FL”≤k<FH中的解码频带S’(k)，是由相加频谱的估计值S3’(k)构成的。总之，频带FL’≤k<FL”中的解码频谱S’(k)不取通过滤波单元254进行的、使用了相加频谱S3(k)的滤波处理获得的相加频谱的估计值S3’(k)，而取相加频谱S3(k)本身的值。

在图11中，作为例子，表示第一频谱S1(k)的频带与第二频谱S2(k)的频带一部分重叠的情况。根据频带选择单元164中选择量化对象频带的结果，有可能出现第一频谱S1(k)的频带与第二频谱S2(k)的频带完全重叠的情况，或者第一频谱S1(k)的频带与第二频谱S2(k)的频带不相接而彼此离开的情况。

图12是表示第一频谱S1(k)的频带与第二频谱S2(k)的频带完全重叠的情况的图。此时，频带FL≤k<FH中的解码频谱S’(k)取相加频谱的估计值S3’(k)本身的值。这里，因为相加频谱S3(k)的值是将第一频谱S1(k)的值与第二频谱S2(k)的值相加得到的，所以相加频谱的估计值S3’(k)的精度提高，由此解码语音信号的质量提高。

图13是表示第一频谱S1(k)的频带与第二频谱S2(k)的频带不相接而彼此离开的情况的图。此时，滤波单元254使用第一频谱S1(k)来求相加频谱的估计值S3’(k)，进行扩展为频带FL≤k<FH的频带扩展处理。但是，用第二频谱S2(k)置换频带FL≤k<FH中与第二频谱S2(k)的频带对应的估计值S3’(k)的部分。其理由为，第二频谱S2(k)的精度比相加频谱的估计值S3’(k)高，由此解码语音信号的质量提高。

时域变换单元255将从滤波单元254输入的解码频谱S’(k)变换为时域的信号，将其作为第二层解码信号输出。时域变换单元255根据需要进行适当的窗口乘法和重叠相加等处理，从而避免帧间产生的间断。

如上所述，根据本实施方式，在编码端的高层选择编码频带，在解码端将低层和高层的解码频谱相加，使用获得的相加频谱进行频带扩展，解码在低层和高层未能解码的频带的分量。因此，能够根据在编码端的高层选择的编码频带，灵活地计算高精度的高频频谱数据，获得质量更佳的解码信号。

另外，在本实施方式，以第二层编码单元106选择作为量化对象的频带进行第二层编码的情况为例进行了说明，但本发明不限于此，第二层编码单元106还可以对固定的频带的分量进行编码，也可以对与在第一层编码单元102中编码的频带同样的频带的分量进行编码。

另外，在本实施方式，以解码装置200使用频谱编码信息所包含的最优基音系数T’和滤波器系数β_i，对相加频谱S3(k)进行滤波来生成相加频谱的估计值S3’(k)，从而估计高频段的频谱的情况为例进行了说明，但本发明不限于此，解码装置200也可以对第一频谱S1(k)进行滤波，从而估计高频部分的频谱。

另外，在本实施方式，以式(1)中设M＝1的情况为例进行说明，但M不限于此，还能够使用0以上的整数(自然数)。

另外，在本实施方式，第一层适用了CELP型编码/解码方式，但是也可以适用其他的编码/解码方式。

另外，在本实施方式，以进行分层编码(可扩展编码)的编码装置100为例进行了说明，但本发明不限于此，也可以适用于进行分层编码以外的其他方式的编码的编码装置。

另外，在本实施方式，以编码装置100包括频域变换单元161和162的情况为例进行说明，但这些单元是在以时域信号为输入信号的情况下所需的结构要素，本发明不限于此，在频谱直接输入到频谱编码单元107的情况下，可以不具备频域变换单元161和162。

另外，在本实施方式，以在滤波单元174计算基音系数后，在滤波器系数计算单元176计算滤波器系数的情况为例进行了说明，但本发明不限于此，也可以采用不具备滤波器系数计算单元176也不计算滤波器系数的结构。另外还可以采用如下的结构：不具备滤波器系数计算单元176，在滤波单元174中使用基音系数和滤波器系数进行滤波处理，同时搜索最合适的基音系数和滤波器系数。此时使用下式(6)和(7)代替上述的式(1)和(2)。

P (z) = Σ_{i = - M}^{M} \frac{1}{1 - β_{i} \cdot z^{- T + i}}

...式(6)

S' (k) = Σ_{i = - 1}^{1} β_{i} \cdot S (k - T - i)

...式(7)

再有，在本实施方式，以使用低频段的频谱，也就是说，以低频段的频谱为编码的基准，对高频段的频谱编码的情况为例进行了说明，但本发明不限于此，也可以通过其他办法设定作为基准的频谱。例如，虽然从有效利用能量的观点来看不太理想，但也可以使用高频段的频谱对低频段的频谱进行编码，或者将中间频带的频谱作为编码的基准，对其他频带的频谱进行编码。

(实施方式2)

图14是表示本发明实施方式2的编码装置300的主要结构的方框图。另外，编码装置300具有与实施方式1所示的编码装置100(参照图1～图3)相同的基本结构，对相同的结构要素附加相同的标号，并省略其说明。

编码装置300的频谱编码单元307的处理的一部分与编码装置100的频谱编码单元107不同，因此附加不同的标号来表示。

频谱编码单元307将编码装置300的输入信号即语音/音频信号、以及从上采样单元104输入的上采样后的第一层解码信号变换为频域，获得输入频谱和第一层解码频谱。然后，频谱编码单元307分析第一层解码频谱的低频分量与输入频谱的高频分量之间的相关，计算用于在解码端进行频带扩展以根据低频分量估计高频分量的参数，并将其作为频谱编码信息输出到复用单元108。

图15是表示频谱编码单元307内部的主要结构的方框图。另外，频谱编码单元307具有与实施方式1所示的频谱编码单元107(参照图3)相同的基本结构，对相同的结构要素附加相同的标号，并省略其说明。

频谱编码单元307与频谱编码单元107不同的点在于，还具有频域变换单元377。另外，频谱编码单元307的频域变换单元371、内部状态设定单元372、滤波单元374、搜索单元375和滤波器系数计算单元376的处理的一部分与频谱编码单元107的频域变换单元171、内部状态设定单元172、滤波单元174、搜索单元175和滤波器系数单元176不同，因此附加不同的标号来表示。

频域变换单元377对输入的有效频带为0≤k<FH的语音/音频信号进行变频，并计算输入频谱S(k)。这里，变频方法适用离散傅立叶变换(DFT)、离散余弦变换(DCT)、改进离散余弦变换(MDCT)等。

频域变换单元371对从上采样单元104输入的有效频带为0≤k<FH的上采样后的第一层解码信号进行变频，来代替对有效频带为0≤k<FH的语音/音频信号进行变频，计算第一层解码频谱S_DEC1(k)。这里，变频方法适用离散傅立叶变换(DFT)、离散余弦变换(DCT)、改进离散余弦变换(MDCT)等。

内部状态设定单元372使用其有效频带为0≤k<FH的第一层解码频谱S_DEC1(k)代替其有效频带为0≤k<FH的输入频谱S(k)，设定在滤波单元374中使用的滤波器的内部状态。另外，该滤波器的内部状态的设定除了使用相加频谱S_DEC1(k)代替输入频谱S(k)这一点以外，其它与内部状态设定单元172的内部状态的设定相同，因此省略详细的说明。

滤波单元374使用由内部状态设定单元372设定的滤波器的内部状态以及从基音系数设定单元173输出的基音系数T，对第一层解码频谱进行滤波，计算第一层解码频谱的估计值S_DEC1’(k)。该滤波处理除了使用下式(8)代替式(2)这一点以外，其它与滤波单元174的滤波处理相同，因此省略详细的说明。

S_DEC1′(k)＝S_DEC1(k-T) ...式(8)

搜索单元375计算用于表示从频域变换单元377输入的输入频谱S(k)与从滤波单元374输出的第一层解码频谱的估计值S_DEC1’(k)的相似性的参数、即相似度。另外，该相似度的计算处理除了使用下式(9)代替式(4)这一点以外，其它与搜索单元175的相似度的计算处理相同，因此省略详细的说明。

A = \frac{{(Σ_{k = FL}^{FH - 1} S (k) \cdot S_{DEC 1}' (k))}^{2}}{Σ_{k = FL}^{FH - 1} S_{DEC 1}' {(k)}^{2}}

...式(9)

每当基音系数设定单元173将基音系数T提供给滤波单元374时，都进行该相似度的计算，并将使计算出的相似度为最大的基音系数即最优基音系数T’(Tmin～Tmax的范围)提供给滤波器系数计算单元376。

滤波器系数计算单元376使用从搜索单元375提供的最优基音系数T’、从频域变换单元377输入的输入频谱S(k)以及从频域变换单元371输入的第一层解码频谱S_DEC1(k)来求滤波器系数β_i，将滤波器系数β_i和最优基音系数T’作为频谱编码信息输出到复用单元108。另外，滤波器系数计算单元376的滤波器系数β_i的计算处理除了使用下式(10)代替式(5)这一点以外，其它与滤波器系数计算单元176的滤波器系数β_i的计算处理相同，因此省略详细的说明。

E = Σ_{k = FL}^{FH - 1} {(S (k) - Σ_{i = - 1}^{1} β_{i} \cdot S_{DEC 1} (k - T' - i))}^{2}

...式(10)

总之，编码装置300在频谱编码单元307中，使用将有效频带为0≤k<FH的第一层解码频谱S_DEC1(k)作为其内部状态的滤波单元374，估计有效频带为0≤k<FH的第一层解码频谱S_DEC1(k)的高频部分(FL≤k<FH)的形状。由此，编码装置300求出用于表示对于第一层解码频谱S_DEC1(k)的高频部分(FL≤k<FH)的估计值S_DEC1′(k)与输入频谱S(k)的高频部分(FL≤k<FH)之间的相关性的参数、即表示滤波单元374的滤波特性的最优基音系数T’以及滤波器系数β_i，将其传输到解码装置以代替输入频谱的高频部分的编码信息。

本实施方式的解码装置具有与实施方式1的解码装置100相同的结构并进行相同的动作，因此省略其说明。

如上所述，根据本实施方式，在解码端将低层和高层的解码频谱相加，对获得的相加频谱进行频带扩展，不是基于输入频谱的估计值S’(k)与输入频谱S(k)的高频部分(FL≤k<FH)之间的相关性，而是基于第一层解码频谱的估计值S_DEC1′(k)与输入频谱S(k)的高频部分(FL≤k<FH)之间的相关性来求最优基音系数和滤波器系数，这些系数是在求相加频谱的估计值时使用的。因此，能够抑制第一层编码的编码失真对解码端的频带扩展造成的影响，提高解码信号的质量。

(实施方式3)

图16是表示本发明实施方式3的编码装置400的主要结构的方框图。另外，编码装置400具有与实施方式1所示的编码装置100(参照图1～图3)相同的基本结构，对相同的结构要素附加相同的标号，并省略其说明。

编码装置400与编码装置100不同的点在于，还具有第二层解码单元409。另外，编码装置400的频谱编码单元407的处理的一部分与编码装置100的频谱编码单元107的处理不同，因此附加不同的标号来表示。

第二层解码单元409包括与实施方式1的解码装置200中的第二层解码单元204(图8～图10)相同的结构并进行同样的动作，因此省略详细的说明。但是，将第二层解码单元204的输出称为第二层MDCT系数，与此相对这里将第二层解码单元409的输出称为第二层解码频谱并写成S_DEC2(k)。

频谱编码单元407将编码装置400的输入信号即语音/音频信号、以及从上采样单元104输入的上采样后的第一层解码信号变换为频域，获得输入频谱和第一层解码频谱。然后，频谱编码单元407将第一层解码频谱的低频分量和从第二层解码单元409输入的第二层解码频谱相加，对相加结果的相加频谱与输入频谱的高频分量之间的相关进行分析，计算用于在解码端进行频带扩展以根据低频分量估计高频分量的参数，将其作为频谱编码信息输出到复用单元108。

图17是表示频谱编码单元407内部的主要结构的方框图。另外，频谱编码单元407具有与实施方式1所示的频谱编码单元107(参照图3)相同的基本结构，对相同的结构要素附加相同的标号，并省略其说明。

频谱编码单元407与频谱编码单元107不同的点在于，具有频域变换单元471和477、以及相加频谱计算单元478，以代替频域变换单元171。另外，频谱编码单元407的内部状态设定单元472、滤波单元474、搜索单元475和滤波器系数计算单元476的处理的一部分与频谱编码单元107的内部状态设定单元172、滤波单元174、搜索单元175和滤波器系数单元176不同，因此附加不同的标号来表示。

频域变换单元471对从上采样单元104输入的有效频带为0≤k<FH的上采样后的第一层解码信号进行变频，代替对有效频带为0≤k<FH的语音/音频信号进行变频，计算第一层解码频谱S_DEC1(k)，并将其输出到相加频谱计算单元478。这里，变频方法适用离散傅立叶变换(DFT)、离散余弦变换(DCT)、改进离散余弦变换(MDCT)等。

相加频谱计算单元478将从频域变换单元471输入的第一层解码频谱S_DEC1(k)的低频(0≤k<FL)分量和从第二层解码单元409输入的第二层解码频谱S_DEC2(k)相加，并将获得的相加频谱S_SUM(k)输出到内部状态设定单元472。这里，因为第二层解码频谱S_DEC2(k)的频带为，在第二层编码单元106选择为量化对象频带的频带，因此相加频谱S_SUM(k)的频带由低频段(0≤k<FL)和在第二层编码单元106中选择出的量化对象频带构成。

频域变换单元477对输入的有效频带为0≤k<FH的语音/音频信号进行变频，并计算输入频谱S(k)。这里，变频方法适用离散傅立叶变换(DFT)、离散余弦变换(DCT)、改进离散余弦变换(MDCT)等。

内部状态设定单元472使用其有效频带为0≤k<FH的相加频谱S_SUM(k)以代替其有效频带为0≤k<FH的输入频谱S(k)，设定在滤波单元474中使用的滤波器的内部状态。另外，该滤波器的内部状态的设定除了使用相加频谱S_SUM(k)来代替输入频谱S(k)这一点以外，其它与内部状态设定单元172的内部状态的设定相同，因此省略详细的说明。

滤波单元474使用在内部状态设定单元472中设定的滤波器的内部状态以及从基音系数设定单元473输出的基音系数T，对相加频谱S_SUM(k)进行滤波，计算相加频谱的估计值S_SUM’(k)。该滤波处理除了使用下式(11)代替式(2)这一点以外，其它与滤波单元174的滤波处理相同，因此省略详细的说明。

S_SUM′(k)＝S_SUM(k-T) ...式(11)

搜索单元475计算用于表示从频域变换单元477输入的输入频谱S(k)与从滤波单元474输出的相加频谱的估计值S_SUM’(k)的相似性的参数、即相似度。另外，该相似度的计算处理除了使用下式(12)代替式(4)这一点以外，其它与搜索单元175的相似度的计算处理相同，因此省略详细的说明。

A = \frac{{(Σ_{k = FL}^{FH - 1} S (k) \cdot S_{SUM}' (k))}^{2}}{Σ_{k = FL}^{FH - 1} S_{SUM}' {(k)}^{2}}

...式(12)

每当基音系数设定单元173将基音系数T提供给滤波单元474时，都进行该相似度的计算，并将使计算出的相似度为最大的基音系数即最优基音系数T’(Tmin～Tmax的范围)提供给滤波器系数计算单元476。

滤波器系数计算单元476使用从搜索单元475提供的最优基音系数T’、从频域变换单元477输入的输入频谱S(k)以及从相加频谱计算单元478输入的相加频谱S_SUM(k)来求滤波器系数β_i，并将滤波器系数β_i和最优基音系数T’作为频谱编码信息输出到复用单元108。另外，滤波器系数计算单元476的滤波器系数β_i的计算处理除了使用下式(13)代替式(5)这一点以外，其它与滤波器系数计算单元176的滤波器系数β_i的计算处理相同，因此省略详细的说明。

E = Σ_{k = FL}^{FH - 1} {(S (k) - Σ_{i = - 1}^{1} β_{i} \cdot S_{SUM} (k - T' - i))}^{2}

...式(13)

总之，编码装置400在频谱编码单元407中，使用将有效频带为0≤k<FH的相加频谱SSUM(k)作为其内部状态的滤波单元474，估计有效频带为0≤k<FH的相加频谱SSUM(k)的高频部分(FL≤k<FH)的形状。由此，编码装置400求用于表示对于相加频谱SSUM(k)的高频部分(FL≤k<FH)的估计值SSUM′(k)与输入频谱S(k)的高频部分(FL≤k<FH)之间的相关性的参数、即表示滤波单元474的滤波特性的最优基音系数T’以及滤波器系数βi，并将其传输到解码装置以代替输入频谱的高频部分的编码信息。

如上所述，根据本实施方式，在编码端，将第一层解码频谱和第二层解码频谱相加而计算相加频谱，基于相加频谱与输入频谱之间的相关性，求最优基音系数和滤波器系数。另外，在解码端，将低层和高层的解码频谱相加而计算相加频谱，并使用从编码端传输的最优基音系数和滤波器系数，进行用于求相加频谱的估计值的频带扩展。因此，能够进一步抑制第一层编码和第二层编码的编码失真对解码端的频带扩展造成的影响，进一步提高解码信号的质量。

另外，在本实施方式中，以下述情况为例进行了说明：在编码装置将第一层解码频谱和第二层解码频谱相加而计算相加频谱，基于相加频谱与输入频谱之间的相关性，计算在解码装置用于频带扩展的最优基音系数和滤波器系数，但本发明不限于此，也可以采用如下的结构：选择相加频谱和第一层解码频谱中的任意一个频谱作为对象，求其与输入频谱之间的相关性。例如，在重视第一层解码信号的质量的情况下，能够基于第一层解码频谱与输入频谱之间的相关性，计算用于频带扩展的最优基音系数和滤波器系数，在重视第二层解码信号的质量的情况下，能够基于相加频谱与输入频谱之间的相关性，计算用于频带扩展的最优基音系数和滤波器系数。作为上述选择的条件，使用编码装置所输入的辅助信息，或者传输路径的状态(传输速度、频带等)即可，例如在传输路径的利用效率非常高，只能传输第一层编码信息那样的情况下，通过基于第一解码频谱与输入频谱之间的相关性，计算用于频带扩展的最优基音系数和滤波器系数，能够提供质量更佳的输出信号。

另外，如上所述，对最优基音系数和滤波器系数的各种计算方法，还可以追加实施方式1中说明的求输入频谱的低频分量与高频分量之间的相关性的方法。例如，在第一层解码频谱与输入频谱之间的失真非常小的情况下，通过从输入频谱的低频分量和高频分量计算最优基音系数和滤波器系数，能够提供越是高层质量越高的输出信号。

以上，说明了本发明的实施方式。

如上述各个实施方式中的说明，本发明在可扩展编解码中，通过采用以下结构能够获得有益效果：使在编码装置计算频带扩展参数时使用的、第一层解码信号或者用第一层解码信号计算出的计算信号(例如将第一层解码信号和第二层解码信号相加得到的相加信号)的低频分量，与在解码装置为了进行频带扩展适用频带扩展参数的、第一层解码信号或者用第一层解码信号计算出的计算信号(例如将第一层解码信号和第二层解码信号相加得到的相加信号)的低频分量不同。另外，也能够采用如下的结构，使这些各个低频分量彼此相同，或者在编码装置中使用输入信号的低频分量。

另外，在上述各个实施方式中，举出了使用基音系数和滤波器系数作为用于频带扩展的参数的例子，但不限于此。例如，也可以在编码端和解码端，固定一种系数，只将另一种系数作为参数从编码端发送。或者也可以基于这些系数，另外求用于发送的参数，将其作为频带扩展参数，还可以组合使用这些系数。

另外也可以在上述各个实施方式中，编码装置具有计算并编码增益信息的功能，解码装置接收该增益信息用以频带扩展，该增益信息用于在滤波后调整高频段的每个子带(在频率分量的区域将整个频带分割为多个的频带)的能量。也就是说，也可以将在编码装置获得的用于每个子带的能量调整的增益信息，作为用于频带扩展的参数发送给解码装置，在解码装置将该增益信息适用于频带扩展。例如，作为最简单的频带扩展方法，通过在编码装置和解码装置，固定用于根据低频频谱估计高频频谱的基音系数、以及滤波器系数，从而能够只将用于调整每个子带的能量的增益信息，用作频带扩展用的参数。因此，只要使用基音系数、滤波器系数和增益信息这三种信息中的至少一个信息，就能够进行频带扩展。

本发明的编码装置、解码装置以及其方法不限于上述各个实施方式，能够进行各种变更而实施。例如，各个实施方式能够适当地组合而实施。

本发明的编码装置和解码装置能够装载于移动通信系统中的通信终端装置和基站装置，由此能够提供具有与上述同样的作用效果的通信终端装置、基站装置和移动通信系统。

另外，这里，以由硬件构成本发明的情况为例进行说明，但本发明也可以由软件实现。例如，以编程语言描述本发明的编码方法和解码方法的算法，并通过将该程序存储于存储器，以信息处理来执行，从而能够实现与本发明的编码装置及解码装置同样的功能。

另外，用于上述各个实施方式的说明中的各功能块通常被作为集成电路的LSI来实现。这些块既可以被单独地集成为一个芯片，也可以包含一部分或全部地被集成为一个芯片。

虽然此处称为LSI，但根据集成程度，可以被称为IC、系统LSI、超大LSI(Super LSI)、特大LSI(Ultra LSI)。

另外，实现集成电路化的方法不仅限于LSI，也可以使用专用电路或通用处理器来实现。也可以使用可在LSI制造后编程的FPGA(FieldProgrammable Gate Array：现场可编程门阵列)，或者可重构LSI内部的电路单元的连接和设定的可重构处理器。

再者，随着半导体的技术进步或随之派生的其它技术的出现，如果能够出现替代LSI集成电路化的新技术，当然能够利用新技术进行功能块的集成化。还存在着适用生物技术等的可能性。

总结以上所述的本发明的编码装置和解码装置，则能够代表性地表示为如下。

本发明的第一发明是编码装置，包括：第一编码单元，对输入信号中的低频部分即低于规定频率的频带进行编码而生成第一编码数据；第一解码单元，对所述第一编码数据进行解码而生成第一解码信号；第二编码单元，对所述输入信号与所述第一解码信号之残差信号的规定的频带部分进行编码而生成第二编码数据；以及滤波单元，对所述第一解码信号的所述低频部分，或者对使用所述第一解码信号计算出的计算信号中的所述低频部分进行滤波，从而获得用于获得所述输入信号的高频部分即高于所述规定频率的频带的频带扩展参数。

本发明的第二发明是编码装置，在第一发明中，还包括：第二解码单元，对所述第二编码数据进行解码而生成第二解码信号；以及加法单元，将所述第一解码信号和所述第二解码信号相加而生成相加信号，所述滤波单元将所述相加信号作为所述计算信号适用，对所述相加信号的所述低频部分进行滤波，从而获得用于获得所述输入信号的高频部分即高于所述规定频率的频带的所述频带扩展参数。

本发明的第三发明是编码装置，在第一或第二发明中，还包括：增益信息生成单元，计算用于在所述滤波之后调整每个子带的能量的增益信息。

本发明的第四发明是，采用r层的分层结构的可扩展编解码的解码装置，包括：接收单元，接收在编码装置使用第m层的解码信号计算出的频带扩展参数；以及解码单元，对第n层的解码信号的低频分量使用所述频带扩展参数，从而生成高频分量，其中，r为2以上的整数，m和n为r以下的整数。

本发明的第五发明是解码装置，在第四发明中，所述解码单元使用所述频带扩展参数，生成与第m层不同的第n层的解码信号的高频分量，其中，m≠n。

本发明的第六发明是解码装置，在第四或第五发明中，所述接收单元还接收从所述编码装置发送的增益信息，所述解码单元使用所述增益信息以代替所述频带扩展参数，或者使用所述频带扩展参数和所述增益信息，生成所述第n层的解码信号的高频分量。

本发明的第七发明是解码装置，包括：接收单元，接收从编码装置发送的第一编码数据、第二编码数据、以及频带扩展参数，所述第一编码数据为，对所述编码装置的输入信号中的低频部分即低于规定频率的频带进行编码而获得的数据，所述第二编码数据为，对解码所述第一编码数据而获得的第一解码频谱与所述输入信号的频谱之残差的规定的频带部分进行编码而获得的数据，所述频带扩展参数为，对所述第一解码频谱的所述低频部分、或者对将所述第一解码频谱和对所述第二编码数据进行解码而获得的第二解码频谱相加而获得的第一相加频谱的所述低频段部分进行滤波而获得的、用于获得所述输入信号的高频部分即高于所述规定频率的频带的参数；第一解码单元，对所述第一编码数据进行解码而生成所述低频段中的第三解码频谱；第二解码单元，对所述第二编码数据进行解码而生成所述规定的频带部分中的第四解码频谱；以及第三解码单元，使用所述频带扩展参数，对所述第三解码频谱、所述第四解码频谱、以及使用其双方来生成的第五解码频谱中的任意一个频谱进行频带扩展，从而解码在所述第一解码单元和所述第二解码单元中未解码的频带部分。

本发明的第八发明是解码装置，在第七发明中，所述接收单元接收所述第一编码数据、所述第二编码数据以及所述频带扩展参数，所述频带扩展参数为，对所述第一相加频谱的所述低频部分进行滤波而获得的、用于获得所述输入信号的高频段部分即高于所述规定频率的频带的参数。

本发明的第九发明是解码装置，在第七发明中，所述第三解码单元包括：加法单元，将所述第三解码频谱和所述第四频谱相加而生成第二相加频谱；以及滤波单元，使用所述频带扩展参数，对所述第三解码频谱、所述第四解码频谱，或者作为所述第五解码频谱的所述第二相加频谱进行滤波，从而进行所述频带扩展。

本发明的第十发明是解码装置，在第七发明中，所述接收单元还接收从所述编码装置发送的增益信息，所述第三解码单元使用所述增益信息以代替所述频带扩展参数，或者使用所述频带扩展参数和所述增益信息，对所述第三解码频谱、所述第四解码频谱、以及使用其双方来生成的第五解码频谱中的任意一个频谱进行频带扩展，从而解码在所述第一解码单元和所述第二解码单元中未解码的频带部分。

本发明的第十一发明是编码装置/解码装置，在上述第一至第十发明中，频带扩展参数包括基音系数和滤波器系数的至少一方。

2006年12月15日提交的日本专利申请第2006-338341号以及2007年3月2日提交的日本专利申请第2007-053496号所包含的说明书、说明书附图以及说明书摘要的公开内容，全部引用于本申请。

工业实用性

本发明的编码装置等能够适用于移动通信系统中的通信终端装置、基站装置等用途。

Claims

1.编码装置，包括：

第一编码单元，对输入信号中的低频部分即低于规定频率的频带进行编码而生成第一编码数据；

第一解码单元，对所述第一编码数据进行解码而生成第一解码信号；

第二编码单元，对所述输入信号与所述第一解码信号之残差信号的规定的频带部分进行编码而生成第二编码数据；以及

滤波单元，对所述第一解码信号的所述低频部分，或者对使用所述第一解码信号计算出的计算信号的所述低频段部分进行滤波，从而获得用于获得所述输入信号的高频部分即高于所述规定频率的频带的频带扩展参数。

2.如权利要求1所述的编码装置，还包括：

第二解码单元，对所述第二编码数据进行解码而生成第二解码信号；以及

加法单元，将所述第一解码信号和所述第二解码信号相加而生成相加信号，

所述滤波单元将所述相加信号作为所述计算信号适用，对所述相加信号的所述低频部分进行滤波，从而获得用于获得所述输入信号的高频部分即高于所述规定频率的频带的所述频带扩展参数。

3.如权利要求1或2所述的编码装置，还包括：

增益信息生成单元，计算用于在所述滤波之后调整每个子带的能量的增益信息。

4.如权利要求1至3的任一项所述的编码装置，

所述频带扩展参数包括基音系数和滤波器系数的至少一方。

5.解码装置，其采用r层的分层结构的可扩展编解码，该解码装置包括：

接收单元，接收在编码装置使用第m层的解码信号计算出的频带扩展参数；以及

解码单元，对第n层的解码信号的低频分量使用所述频带扩展参数，从而生成高频分量，

其中，r为2以上的整数，m和n为r以下的整数。

6、如权利要求5所述的解码装置，

所述解码单元使用所述频带扩展参数，生成与第m层不同的第n层的解码信号的高频分量，其中，m≠n。

7.如权利要求5或6所述的解码装置，

所述接收单元还接收从所述编码装置发送的增益信息，

所述解码单元使用所述增益信息以代替所述频带扩展参数，或者使用所述频带扩展参数和所述增益信息，生成所述第n层的解码信号的高频分量。

8.解码装置，包括：

接收单元，接收从编码装置发送的第一编码数据、第二编码数据、以及频带扩展参数，所述第一编码数据为，对所述编码装置的输入信号中的低频段部分即低于规定频率的频带进行编码而获得的数据，所述第二编码数据为，对解码所述第一编码数据而获得的第一解码频谱与所述输入信号的频谱之残差的规定的频带部分进行编码而获得的数据，所述频带扩展参数为，对所述第一解码频谱的所述低频部分，或者对将所述第一解码频谱和对所述第二编码数据进行解码而获得的第二解码频谱相加而获得的第一相加频谱的所述低频部分进行滤波而获得的、用于获得所述输入信号的高频部分即高于所述规定频率的频带的参数；

第一解码单元，对所述第一编码数据进行解码而生成所述低频部分中的第三解码频谱；

第二解码单元，对所述第二编码数据进行解码而生成所述规定的频带部分中的第四解码频谱；以及

第三解码单元，使用所述频带扩展参数，对所述第三解码频谱、所述第四解码频谱、以及使用其双方来生成的第五解码频谱中的任意一个频谱进行频带扩展，从而解码在所述第一解码单元和所述第二解码单元中未解码的频带部分。

9.如权利要求8所述的解码装置，所述接收单元接收所述第一编码数据、所述第二编码数据以及所述频带扩展参数，所述频带扩展参数为，对所述第一相加频谱的所述低频部分进行滤波获得的、用于获得所述输入信号的高频段部分即高于所述规定频率的频带。

10.如权利要求8所述的解码装置，

所述第三解码单元包括：

加法单元，将所述第三解码频谱和所述第四解码频谱相加而生成第二相加频谱；以及

滤波单元，使用所述频带扩展参数，对所述第三解码频谱、所述第四解码频谱，或者作为所述第五解码频谱的所述第二相加频谱进行滤波，从而进行所述频带扩展。

11.如权利要求8所述的解码装置，

所述接收单元还接收从所述编码装置发送的增益信息，

所述第三解码单元使用所述增益信息以代替所述频带扩展参数，或者使用所述频带扩展参数和所述增益信息，对所述第三解码频谱、所述第四解码频谱、以及使用其双方来生成的第五解码频谱中的任意一个频谱进行频带扩展，从而解码在所述第一解码单元和所述第二解码单元中未解码的频带部分。

12.如权利要求5至11中任意一项所述的解码装置，

所述频带扩展参数包括基音系数和滤波器系数的至少一方。

13.编码方法，包括：

第一编码步骤，对输入信号中的低频部分即低于规定频率的频带进行编码而生成第一编码数据；

解码步骤，对所述第一编码数据进行解码而生成第一解码信号；

第二编码步骤，对所述输入信号与所述第一解码信号之残差信号的规定的频带部分进行编码而生成第二编码数据；以及

滤波步骤，对所述第一解码信号的所述低频部分，或者对使用所述第一解码信号计算出的计算信号的所述低频部分进行滤波，从而获得用于获得所述输入信号的高频部分即高于所述规定频率的频带的频带扩展参数。

14.解码方法，其采用r层的分层结构的可扩展编解码，该解码方法包括：

接收步骤，接收在编码装置使用第m层的解码信号计算出的频带扩展参数；以及

解码步骤，对第n层的解码信号的低频分量使用所述频带扩展参数，从而生成高频分量，

其中，r为2以上的整数，m和n为r以下的整数。

15.解码方法，包括：

接收步骤，接收从编码装置发送的第一编码数据、第二编码数据、以及频带扩展参数，所述第一编码数据为，对所述编码装置的输入信号中的低频部分即低于规定频率的频带进行编码而获得的数据，所述第二编码数据为，对解码所述第一编码数据而获得的第一解码频谱与所述输入信号的频谱之残差的规定的频带部分进行编码而获得的数据，所述频带扩展参数为，对所述第一解码频谱的所述低频部分，或者对将所述第一解码频谱和对所述第二编码数据进行解码而获得的第二解码频谱相加而获得的第一相加频谱的所述低频部分进行滤波而获得的、用于获得所述输入信号的高频部分即高于所述规定频率的频带的参数；

第一解码步骤，对所述第一编码数据进行解码而生成所述低频部分中的第三解码频谱；

第二解码步骤，对所述第二编码数据进行解码而生成所述规定的频带部分中的第四解码频谱；以及

第三解码步骤，使用所述频带扩展参数，对所述第三解码频谱、所述第四解码频谱、以及使用其双方来生成的第五解码频谱中的任意一个频谱进行频带扩展，从而解码在所述第一解码步骤和所述第二解码步骤中未解码的频带部分。