CN101800049B

CN101800049B - 编码装置和译码装置

Info

Publication number: CN101800049B
Application number: CN2009102658908A
Authority: CN
Inventors: 押切正浩
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Intellectual Property Corp of America
Priority date: 2003-09-16
Filing date: 2004-09-15
Publication date: 2012-05-23
Anticipated expiration: 2024-09-15
Also published as: BRPI0414444A; CN1849648A; JP4789622B2; EP2071565B1; CN100590712C; EP1657710A4; BRPI0414444B1; EP2071565A2; EP1657710A1; CN101800049A; DE602004032587D1; EP2264700A1; JPWO2005027095A1; JP2011039553A; JP5171922B2; EP1657710B1; DE602004021266D1; CN101783141B; CN101783141A; WO2005027095A1

Abstract

能够以低比特率、高品质地对频谱进行编码而不会在频谱的谐波结构上产生扰动的编码装置。在该装置中，内部状态设置部分(106)使用第1频谱S1(k)设置滤波部分(107)的内部状态。音调系数设置部分(109)一点一点地改变音调系数T，同时输出该音调系数。滤波部分(107)基于音调系数T计算第2频谱S2(k)的估计值S’2(k)。搜索部分(108)计算S2(k)与S’2(k)之间的相似度。然后，将根据计算具有最大相似度的音调系数T’应用到滤波器系数计算部分(110)。滤波器系数计算部分(110)使用该音调系数T’获得滤波器系数β_i。

Description

编码装置和译码装置

本申请是申请日为2004年9月15日、申请号为200480025964.6、发明名称为“编码装置和译码装置”的发明专利申请的分案申请。

技术领域

本发明涉及安装在无线通信装置等上，用于对语音信号、音频信号等进行编码的编码装置以及用于对该编码信号进行译码的译码装置。

背景技术

在移动通信系统中，从有效地使用无线电波等的传输路径容量(信道容量)和记录介质的观点上看，将语音信号、音频信号等压缩成低比特率信号的编码技术是特别重要的。

用于对语音信号进行编码的语音编码方案的示例包括由ITU-T(国际电信联盟电信标准化部)标准化的G726、G729等方案。这些方案使用窄带信号(300Hz～3.4kHz)为编码目标并且能够以8kbit/s～32kbit/s的比特率进行高品质的编码。但是，这样的窄带信号是这样的狭窄以致频带最大为3.4kHz，其品质给听众以声音闷声闷气不清楚的印象，并且导致缺少真实感的问题。

另外，还有使用宽带信号(50Hz～7kHz)为编码目标的语音编码方案。这个的典型示例为ITU-T的G722、G722.1和3GPP(第三代合作项目)的AMR-WB等。这些方案能够以6.6kbit/s～64kbit/s的比特率执行宽带语音信号的编码。但是，当要被编码的信号为语音时，虽然宽带信号具有较高的品质，但是当以音频信号为目标或者要求具有真实感的较高品质的语音信号时，这仍然是不够的。

另一方面，当信号的最高频率通常在10～15kHz的量级时，就有可能获得相当于FM无线电的真实感，当最高频率高达20kHz的量级时，就有可能获得可与CD(紧凑盘)相媲美的品质。对于这样的信号，由MPEG(M移动图像专家组)标准化的层III方案及AAC方案表示的音频编码是恰当的。但是，这些音频编码方案具有宽的信号频带要被编码，其导致被编码的信号的比特率增大的问题。

传统的编码技术的示例包括以低比特率对宽频带的信号进行编码的技术(例如，参照专利文献1)。根据这种技术，将输入信号分成低频率域的信号和高频率域的信号，用低频率域的信号的频谱代替高频率域的信号的频谱，并且对其进行编码，由此降低整个比特率。

图1A～图1D示出了用低频率域的频谱替换高频率域的频谱的上述处理的概述。虽然该处理最初用于结合编码处理执行，但是为了简化说明，将描述其中在原有信号上执行上述处理的情况作为示例。

图1A示出了频带被限制为0≤k＜FH上的原有信号的频谱，图1B示出了限制为0≤k＜FL上的信号的频谱(其中，FL＜FH)，图1C示出了使用上述技术、用低频率域(低频带)的频谱来替换高频率域(高频带)的频谱而获得的频谱，以及图1D示出了通过依据有关该替换了的频谱的频谱包络信息、锐化该替换频谱而获得的频谱。在这些图上，横轴表示频率，而纵轴表示频谱强度。

在这种技术中，使用频带为0≤k＜FL的低频频谱(图1B)表示频带为0≤k＜FH的原有信号的频谱(图1A)。更具体地说，高频频谱(FL≤k＜FH)由低频频谱(0≤k＜FL)替换。作为该处理的结果，获得了图1C所示的频谱。另外，为了简化说明，以具有FL＝FH/2的关系的情况为例进行说明。根据有关原有信号的频谱包络的信息、调整在图1C的频谱的高频率域中的频谱的幅值，获得如图1D所示的频谱。这个频谱是通过估计原有信号而获得的频谱。

专利文献1：国际专利申请2001-521648号的国家公开(第15页，图1，图2)。

发明内容

一般来说，众所周知，诸如语音信号和音频信号之类的频谱具有其中每次在某个频率的整数倍[每个预定的音调(pitch)]上出现频谱峰值的谐波结构。该谐波结构是保持语音信号、音频信号等的品质的重要信息，而且如果谐波结构中出现了扰动，则听众就会感觉到品质的恶化。

图2A和图2B是用于说明现有技术的问题的图示。

图2A是通过分析音频信号的频谱而获得的频谱。如该图所示，原有信号具有在频率轴上具有间隔T的谐波结构。另一方面，图2B示出了按照上述技术计算原有信号的频谱的结果而获得的频谱。当比较这两个频谱时，从图2B所示的频谱中看出，在替换源的低频频谱S1和替换目的地的高频频谱S2中保持了谐波结构，而在低频频谱S1和高频频谱S2之间的连接域(频谱S3)中的谐波结构被破坏了。

当将这个计算的频谱转换成时间信号并且收听该信号时，存在有由于这样的谐波结构扰动而使听众们感觉到品质恶化的问题，这个谐波结构的扰动起因于没有考虑谐波结构的形状而执行替换的事实。

本发明的目的是在于提供一种能够以低比特率高品质地对频谱进行编码而没有在该频谱的谐波结构上产生扰动的编码装置及能够对这种编码的信号进行译码的译码装置。

本发明的编码装置采用这样的结构，其包括：获取部分，其获取已被分成低频带和高频带两个频带的频谱；计算部分，其基于频谱的谐波结构、计算指示在所获取的低频带频谱与所获取的高频带频谱之间的相似度的参数；以及编码部分，其对所计算的指示相似度的参数而不是所获取的高频带频谱进行编码。

本发明的译码装置采用这样的结构，其包括：频谱获取部分，其从已被分成低频带和高频带两个频带的频谱中获取低频带的频谱；参数获取部分，其获取指示低频带的频谱与高频带的频谱之间的相似度的参数；以及译码单元，其使用所获取的低频带频谱以及参数、对低频带及高频带的频谱进行译码。

本发明的编码方法包括：获取步骤，获取被分成低频带与高频带两个频带的频谱；计算步骤，基于频谱的谐波结构计算指示在所获取的低频带频谱与所获取的高频带频谱之间的相似度的参数，以及编码步骤，对所计算的指示相似度的参数，而不是对所获取的高频带频谱进行编码。

本发明的译码方法包括：频谱获取步骤，从被分成低频带与高频带两个频带的频谱中获取低频带的频谱；参数获取步骤，获取指示在低频带频谱与高频带频谱之间的相似度的参数；以及译码步骤，使用所获取的低频带频谱及参数、对低频带及高频带的频谱进行译码。

根据本发明的第一方面，提供了一种对分成低频带和高频带的语音信号或音频信号进行编码的可扩展编码装置，包括：第一编码部分，对所述语音信号或所述音频信号的低频带的信号进行编码；第二编码部分，对所述语音信号或所述音频信号的高频带的信号进行编码；第一频谱生成部分，对所述低频带的信号执行频率域转换，以生成低频带的第一频谱；以及第二频谱生成部分，对所述语音信号或所述音频信号执行频率域转换，以生成具有低频带和高频带的第二频谱，其中，所述第二编码部分包括：生成部分，使用所述第一频谱，求所述第二频谱的高频带的估计频谱；搜索部分，搜索指示与所述第二频谱的高频带相似度最高的所述估计频谱的参数；以及编码部分，对指示所述相似度最高的所述估计频谱的参数进行编码，而不是对所述第二频谱的高频带进行编码。

根据本发明的第二方面，提供了一种通信终端装置，包括如上述根据本发明的第一方面提供的可扩展编码装置。

根据本发明的第三方面，提供了一种基站装置，包括如上述根据本发明的第一方面提供的可扩展编码装置。

根据本发明的第四方面，提供了一种对分成低频带和高频带的语音信号或音频信号进行译码的可扩展译码装置，包括：频谱取得部分，从具有低频带及高频带的频谱中获取低频带的频谱；参数获取部分，获取指示使用所述低频带的频谱生成的、且与对应于所述语音信号或所述音频信号的高频带的频谱最相似的估计频谱的参数；以及译码部分，使用所述低频带的频谱及所述参数，对所述低频带的频谱及所述高频带的频谱进行译码。

根据本发明的第五方面，提供了一种通信终端装置，包括如上述根据本发明的第四方面提供的可扩展译码装置。

根据本发明的第六方面，提供了一种基站装置，包括如上述根据本发明的第四方面提供的可扩展译码装置。

根据本发明的第七方面，提供了一种对分成低频带和高频带的语音信号或音频信号进行编码的可扩展编码方法，包括：第一编码步骤，对所述语音信号或所述音频信号的低频带的信号进行编码；第二编码步骤，对所述语音信号或所述音频信号的高频带的信号进行编码；第一频谱生成步骤，对所述低频带的信号执行频率域转换，以生成低频带的第一频谱；以及第二频谱生成步骤，对所述语音信号或所述音频信号执行频率域转换，以生成具有低频带和高频带的第二频谱，其中，所述第二编码步骤包括：生成步骤，使用所述第一频谱，求所述第二频谱的高频带的估计频谱；搜索步骤，搜索指示与所述第二频谱的高频带相似度最高的所述估计频谱的参数；以及编码步骤，对指示所述相似度最高的所述估计频谱的参数进行编码，而不是对所述第二频谱的高频带进行编码。

根据本发明的第八方面，提供了一种对分成低频带和高频带的语音信号或音频信号进行译码的可扩展译码方法，包括：频谱取得步骤，从具有低频带及高频带的频谱中获取低频带的频谱；参数获取步骤，获取指示使用所述低频带的频谱生成的、且与对应于所述语音信号或所述音频信号的高频带的频谱最相似的估计频谱的参数；以及译码步骤，使用所述低频带的频谱及所述参数，对所述低频带的频谱及所述高频带的频谱进行译码。

本发明能够以低比特率高品质地执行频谱的编码而没有对该频谱的谐波结构有任何的破坏。另外，本发明还能够在对该编码的信号进行译码时提高音质。

附图说明

图1A至1D为说明用低频率域的频谱替换高频率域的频谱的传统处理的概要的图示；

图2A和2B是用于说明现有技术的问题的图示；

图3是示出依据实施方式1的无线发送装置的主要结构的框图；

图4是示出依据实施方式1的编码装置的内部结构的框图；

图5是示出依据实施方式1的频谱编码部分的内部结构的框图；

图6是说明依据实施方式1的滤波部分的滤波处理的概要的图示；

图7A至7E是说明第2频谱的估计值的频谱如何随着音调(pitch)系数T的变化而改变的图示；

图8A至8E是说明第2频谱的估计值的频谱如何随着音调系数T的变化而改变的图示；

图9是示出依据实施方式1、由滤波部分、搜索部分、音调系数设置部分执行的处理的一系列算法的示例的流程图；

图10是示出依据实施方式1的无线电接收装置的主要结构的框图；

图11是示出依据实施方式1的译码装置的内部结构的框图；

图12是示出依据实施方式1的频谱译码部分的内部结构的框图；

图13是说明依据实施方式1、由滤波部分生成的已译码频谱的图示；

图14A是示出当依据实施方式1的编码装置应用于有线通信系统时、在发送端的主要结构的框图；

图14B是示出当依据实施方式1的译码装置应用于有线通信系统时、在接收端的主要结构的框图；

图15是示出依据实施方式2的频谱编码部分的主要结构的框图；

图16是说明依据实施方式2、使用滤波器进行滤波的概述的图示；

图17是示出依据实施方式3的频谱编码部分的主要结构的框图；

图18是示出依据实施方式4的频谱译码部分的主要结构的框图；以及

图19是示出依据实施方式5的频谱译码部分的主要结构的框图。

具体实施方式

本发明者着眼于如语音信号、音频信号等(下面统称为音响信号)的特性，也就是说，音响信号在频率轴方向形成谐波结构的特性的事实，发现了使用全频带的频谱中的一些频带的频谱执行剩余频带的频谱的编码的可能性，从而实现了本发明。

也就是说，本发明的实质是，例如，当在对已被分成高频率域与低频率域两个频带的信号频谱进行编码时，为高频率域频谱确定在高频率域与低频率域的频谱之间的相似度，并对指示这个相似度的参数执行编码。

下面将参考附图对本发明的实施方式进行详细说明。

(实施方式1)

图3是示出了当依据本发明的实施方式1的无线编码装置安装在无线通信系统的发送端时，无线发送装置130的主要结构的框图。

这个无线发送装置130包括编码装置120、输入装置131、A/D转换装置132、RF调制装置133和天线134。

输入装置131将人耳朵听得见的声波W11转换成作为电信号的模拟信号，并向A/D变换装置132输出该信号。A/D变换装置132将这个模拟信号转换成数字信号，并向编码装置120输出该信号。编码装置120对所输入的数字信号进行编码，生成编码的信号并向RF调制装置133输出该编码的信号。RF调制装置133调制该编码的信号，生成调制的编码信号并向天线134输出该调制的编码信号。天线134将该调制的编码信号作为无线电波W12发送。

图4是示出上述编码装置120的内部结构的框图。在此，以其中执行分层编码(可扩展性编码)的情况为例进行说明。

编码装置120包括输入端121、下采样部分122、第1层编码部分123、第1层译码部分124、上采样部分125、延迟部分126、频谱编码部分100、多路复用部分127和输出端128。

具有有效频带为0≤k＜FH的信号从A/D转换装置132输入到输入端121。下采样部分122向经由输入端121输入的信号应用下采样，生成具有低采样率的信号并输出该信号。第1层编码部123对这个下采样的信号进行编码，并向多路复用部分(多路调制器)127输出所获得的编码，同时也向第1层译码部分124输出所获得的编码。第1层译码部分124基于该编码生成第1层的译码信号。上采样部125提高第1层编码部分123的译码信号的采样速率。

另一方面，延迟部分126，向经由输入端121输入的信号提供规定长度的延迟。假定这个延迟的长短与当信号通过下采样部分122、第1层编码部分123、第1层译码部分124及上采样部分125时产生的时间延迟具有相同的值。频谱编码部分100使用从上采样部分125输出的信号作为第一信号以及从延迟部分126输出的信号作为第二信号进行频谱编码，并且向多路复用部分127输出生成的编码。多路复用部分127将从第1层编码部分123获得的编码与从频谱编码部分100获得的编码进行多路复用，并且经由输出端128输出该多路复用的参数作为输出编码。将这个输出的编码给予RF调制装置133。

图5是示出上述频谱编码部分100的内部结构的框图。

频谱编码部分100包括输入端102、103，频率域转换部分104、105，内部状态设置部分106、滤波部分107、搜索部分108、音调系数设置部分109、滤波器系数计算部分110、及输出端111。

第一信号从上采样部分125输入到输入端102。这个第一信号是由第1层译码部分124使用由第1层编码部分123编码的编码参数进行译码的信号，并且具有0≤k＜FL的有效频带。另外，有效频带为0≤k＜FH(FL＜FH)的第二信号从延迟部分126输入到输入端103。

频率域转换部分104在从输入端102输入的第一信号上执行频率转换，以计算第一频谱S1(k)。另外，频率域转换部分105在从输入端103输入的第二信号上执行频率转换，以计算第二频谱S2(k)。此处，频率转换方法应用离散傅里叶变换(DFT)、离散余弦变换(DCT)、修改的离散余弦变换(MDCT)等。

内部状态设置部分106使用有效频带为0≤k＜FL的第一频谱S1(k)设置在滤波部分107中使用的滤波器的内部状态。后面将再次进行说明该设置。

音调系数设置部分109在预定音调系数T的搜索范围Tmin到Tmax内一点一点改变该系数的同时，向滤波部分107逐个输出该音调系数T。

滤波部分107基于由内部状态设置部分106设置的滤波器的内部状态以及从音调系数设置部分109输出的音调系数T、执行第二频谱的滤波，并且计算第二频谱的估计值S’2(k)。将在后面描述这个滤波处理的详细情况。

搜索部分108计算相似度，其是指示在从频率域转换部分105输出的第二频谱S2(k)和从滤波部分107输出的第二频谱的估计值S’2(k)之间的类似性的参数。后面将详细描述这个相似度。每次从音调系数设置部分109给出音调系数T时执行这个相似度的计算处理，而且将使所计算的相似度变为最大的音调系数T’(Tmin到Tmax的范围)给予滤波器系数计算部分110。

滤波器系数计算部分110使用从搜索部分108提供的音调系数T’计算滤波器系数βi，并经由输出端111输出该滤波器系数。此时，同时也经由输出端111输出音调系数T’。

接下来，将在下面使用数学表达式详细地描述频谱编码部100的主要部分的具体操作。

图6说明了滤波部分107的滤波处理的概述。

在此，为了方便假定将全频带(0≤k＜FH)的频谱称为“S(k)”，并且将使用由下面的等式所表示的滤波器函数。

P (z) = \frac{1}{1 - Σ_{i = - M}^{M} β_{i} z^{- T + i}}

...(等式1)

在这个等式中，z表示z转换变量，T表示从音调系数设置部分109给出的系数，并且假定M＝1。

如该图所示，作为滤波器的内部状态，将第一频谱S1(k)存储在S(k)的0≤k＜FL频带中。另一方面，将根据以下的过程而获得的第二频谱的估计值S’2(k)存储在S(k)的FL≤k＜FH频带中。

在整个滤波处理中，在S’2(k)中替换由以下的等式(2)所表示的频谱。通过将所有的频谱β_i·S(k-T-i)相加起来而获得该替换的频谱，其中通过将以具有比k低T的频率的频谱S(k-T)为中心、仅相隔i的邻近频谱S(k-T-i)乘以预定的加权系数β_i而获得β_i·S(k-T-i)。

S^{'} 2 (k) = Σ_{i = - 1}^{1} β_{i} \cdot S (k - T - i)

...(等式2)

此时，假定提供给这个滤波器的输入信号为零。即，(等式2)表示(等式1)的零输入。通过在FL≤k＜FH的范围内以频率的递增次序(k＝FL)改变k的同时执行上述计算，计算出在FL≤k＜FH中的第二频谱的估计值S’2(k)。

每次从音调系数设置部分109中给出音调系数T时，通过每次都将S(k)清零、在FL≤k＜FH的范围内执行上述的滤波处理。即，每次音调系数T改变时就计算S(k)，并将其输出到搜索部分108。

接着，将描述由搜索部分108执行的相似度的计算处理以及最优音调系数T的导出处理。

首先，存在有各种相似度的定义。此处，将以其中假定滤波器系数β_-1和β₁为0、使用由基于最小方差方法的以下等式所定义的相似度的情况为例进行说明。

E = Σ_{k = FL}^{FH - 1} S 2 {(k)}^{2} - \frac{{(Σ_{k = FL}^{FH - 1} S 2 (k) \cdot S^{'} 2 (k))}^{2}}{Σ_{k = FL}^{FH - 1} S^{'} 2 {(k)}^{2}}

...(等式3)

在使用了这个相似度的情况下，在计算出最优音调系数T之后确定滤波器系数β_i。这里，E表示S2(k)与S’2(k)之间的方差。在这个等式中，右边的第1项变为与音调系数T无关的固定值，并因此搜索用于生成使右边第2项变为最大的S’2(k)的音调系数T。这个等式的右边第2项被称为“相似度”。

图7A～图7E是说明了第二频谱的估计值S’2(k)的频谱如何随着音调系数T的变化而改变的图。

图7A是说明了具有存储为内部状态的谐波结构的第一频谱的图。此外，图7B～图7D是说明通过使用三种类型的音调系数T0、T1、T2执行滤波而计算出的第二频谱的估计值S’2(k)的频谱的图。图7E示出了要与估计值S’2(k)的频谱进行比较的第二频谱S2(k)的图。

在这个图所示的示例中，由于图7C所示的频谱与图7E所示的频谱相似，并且因此可理解使用T1计算出的相似度表示最高的值。即，T1是作为能够保持谐波结构的音调系数T的最优值。

图8A～图8E也是与图7A～图7E相似的图，但是，存储为内部状态的第一频谱的相位与图7A～图7E的那个不同。然而，在这个图所示的示例中，借此保持谐波结构的音调系数T也是T1。

因此，改变音调系数T并且查找最大相似度T等同于在试探的基础上找出该频谱的谐波结构的音调(或者其整数倍)。这个实施方式中的编码装置基于这个谐波结构的音调计算出第二频谱的估计值S’2(k)，因此在第一频谱与估计频谱之间的连接部分中的谐波结构没有被破坏。考虑到基于由谐波结构的音调T(或者其整数倍)隔开的第一频谱、计算出当k＝FL时连接部分的估计值S’2(k)，这是很容易理解的。

此外，音调系数T表示频谱数据的频率间隔的整数倍(整数值)。然而，实际谐波结构的音调经常是非整数值。因此，通过选择适当的加权系数β_i并且对以T为中心的M个邻近数据应用加权相加，就有可能表示在从T-M到T+M范围内的非整数值的谐波结构的音调。

图9是示出了由滤波部分107、搜索部分108、音调系数设置部分109执行的处理中的一系列算法的示例的流程图。由于已经说明过了这些的处理的概述，所以将省略该流程的详细说明。

接下来，将说明由滤波器系数计算部分110进行的滤波器系数的计算处理。

滤波器系数计算部分110使用从搜索部分108提供的音调系数T’、确定最小化在以下等式中的平方失真E的滤波器系数β_i。

E = Σ_{k = FL}^{FH - 1} {(S 2 (k) - Σ_{i = - 1}^{1} β_{i} S (k - T^{'} - i))}^{2}

...(等式4)

滤波器系数计算部分110事先保持多个β_i(i＝-1，0，1)的组合作为数据表，确定最小化上述(等式4)中的平方失真E的β_i(i＝-1，0，1)的组合，并且输出其索引。

因此，对于已被分成低频率域(0≤k＜FL)和高频率域(FL≤k＜FH)两个部分的输入信号的频谱，这个实施方式中的编码装置使用包括低频频谱作为内部状态的滤波部分107估计高频频谱的形状，对指示滤波部分107的滤波器特性的参数、而不是高频频谱进行编码，并输出该参数，因此，有可能以低比特率高品质地执行频谱的编码。

此外，在上述结构中，当滤波部分107使用低频频谱估计高频频谱的形状时，音调系数设置部分109以各种方式改变在用作估计标准的低频频谱与高频频谱之间的频率差，即，音调系数T，并且输出该频率差，而且搜索部分108检测与在低频频谱和高频频谱之间的最大相似度相对应的T。因此，可能基于整个频谱的谐波结构的音调估计高频频谱的形状，并且能够在维持整个频谱的谐波结构的同时执行编码。

此外，也不需要基于谐波结构的音调设置低频频谱的带宽。即，不需要使低频频谱的带宽与谐波结构的音调(或者其整数倍)相匹配，而且能够任意地设置带宽。这是因为上述结构允许在低频频谱与高频频谱之间的连接部分平滑地连接频谱，而不用使低频频谱的带宽与谐波结构的音调相匹配。

虽然本实施方式已经说明了在(等式1)中M＝1的情况作为示例，但是M并不限于此而且可以使用0或者0以上的整数(自然数)。

此外，虽然本实施方式已经说明了执行分层编码(可扩展性编码)的编码装置作为示例，但是上述频谱编码部分100还可以安装在基于其他方案执行编码的编码装置上。

此外，本实施方式已经说明了其中频谱编码部分100包括频率域转换部分104、105的情况。这些是当时域信号用作输入信号时所必需的部件，但是在其中直接将频谱输入到频谱编码部分100中的模式中，频率域转换部分不是必需的。

此外，在本实施方式已经说明了其中使用低频频谱，即使用低频频谱为编码的标准，对高频频谱进行编码的情况，但是设置用作标准的频谱的方法不限于此。而且还可能使用高频频谱对低频频谱执行编码，或者使用中间频带的频谱为编码的标准、对其他区域的频谱执行编码，虽然从有效利用能量的观点上看，它们都不是所期望的。

图10是示出接收从无线发送装置130发送的信号的无线接收装置180的主要结构的框图。

该无线接收装置180包括天线181、RF解调制装置182、译码装置170、D/A转换装置183以及输出装置184。

天线181接受作为无线电波W12的数字编码的音响信号，生成为电信号的数字接收的编码音响信号，并且将其提供给RF解调制装置182。RF解调制装置182解调制来自天线181的接收的编码音响信号，生成解调制的编码音响信号并且将其提供给译码装置170。

译码装置170接受来自RF解调制装置182的数字解调制的编码音响信号，执行译码处理，生成数字的译码音响信号，并且将其提供给D/A转换装置183。D/A转换装置183转换来自译码装置170的数字译码的语音信号，生成模拟的译码语音信号，并且将其提供给输出装置184。输出装置184将为电信号的模拟译码语音信号转换为空气的振动，并且将其作为音波W13输出，以便人的耳朵听得见。

图11是示出了上述译码装置170的内部结构的框图。这里将以对被分层编码的信号进行译码的情况为例进行说明。

这个译码装置170包括输入端171、分离部分172、第1层译码部分173、上采样部分174、频谱译码部分150以及输出端176、177。

RF解调制装置182将数字解调制的编码音响信号输入到输入端171。分离部分172分离经由输入端171输入的解调制的编码音响信号，生成用于第1层译码部分173的编码和用于频谱译码部分150的编码。第1层译码部分173使用从分离部分172获得的编码对具有信号带宽0≤k＜FL的译码信号进行译码，并将这个译码信号提供给上采样部分174。此外，另一个输出连接到输出端176。当由第1层译码部分173生成的第1层译码信号需要输出时，这允许经由这个输出端176输出该第1层译码信号。

上采样部分174提高从第1层译码部分173提供的第1层译码信号的采样频率。将由分离部分172分离的编码和由上采样部分174生成的上采样的第1层译码信号提供给频谱译码部分150。频谱译码部分150执行稍后描述的频谱译码，生成具有信号频带0≤k＜FH的译码信号，并且经由输出端177输出该译码信号。频谱译码部分150把从上采样部分174提供的上采样的第1层译码信号看作第1信号并且执行处理。

根据这个结构，当需要输出由第1层译码部分173生成的第1层译码信号时，可以从输出端176输出该第1层译码信号。此外，当需要输出频谱译码部分150的品质更高的输出信号时，该输出信号可以从输出端177输出。译码装置170输出从输出端176或者输出端177中的任一个输出的信号，并且将该信号提供给D/A转换装置183。要输出哪个信号取决于应用的设置或者用户的判断。

图12是示出了上述频谱译码部分150的内部结构的框图。

这个频谱译码部分150包括输入端152、153、频率域转换部分154、内部状态设置部分155、滤波部分156、时域转换部分158及输出端159。

经由分离部分172将指示由频谱编码部分100获得的编码的滤波器系数输入到输入端152。此外，将具有有效频带0≤k＜FL的第1信号输入到输入端153。这个第1信号是由第1层译码部分173译码并且由上采样部分174采样的的第1层译码信号。

频率域转换部分154转换从输入端153输入的时域信号的频率，并且计算出第1频谱S1(k)。作为频率转换方法，可以使用离散傅里叶变换(DFT)、离散余弦变换(DCT)、修改的离散余弦变换(MDCT)等。

内部状态设置部分155使用第1频谱S1(k)设置在滤波部分156中使用的滤波器的内部状态。

滤波部分156基于由内部状态设置部分155设置的滤波器内部状态以及从输入端152提供的音调系数T’及滤波系数β执行第1频谱的滤波，并且计算出第2频谱的估计值S’2(k)。在这种情况下，滤波部分156使用(等式1)中所描述的滤波器函数。

时域转换部分158将从滤波部分156获得的译码频谱S’(k)转换成时域信号，并经由输出端159输出该译码频谱。在此，将根据需要执行诸如适当的开窗和叠加加法等之类的处理以避免在帧之间出现不连续。

图13示出了由滤波部分156生成的译码频谱S’(k)。

如该图所示，具有频带0≤k＜FL的译码频谱S’(k)由第1频谱S1(k) 构成，具有频带FL≤k＜FH的译码频谱S’(k)由第2频谱的估计值S’2(k)构成。

因此，本实施方式中的译码装置具有与根据本实施方式的编码方法相对应的结构，因此能够用较少的位数高效地对编码的音响信号进行译码，并且能够输出高品质的音响信号。

虽然在此已经以其中依据本实施方式的编码装置或译码装置应用于无线通信系统的情况为例进行了说明，但是如下所示，依据本实施方式的编码装置或译码装置同样可应用于有线通信系统。

图14A是示出了当依据本实施方式的译码装置应用于有线通信系统时，发送端的主要结构的框图。向与图3所示的部件同样的部件分配相同的参考数字，并且将省略其说明。

有线发送装置140包括编码装置120、输入装置131和A/D转换装置132，而且其输出连接到网络N1。

A/D转换装置132的输入端连接到输入装置131的输出端。编码装置120的输入端连接到A/D转换装置132的输出端。编码装置120的输出端连接到网络N1。

输入装置131将人耳听得见的音波W11转换成作为电信号的模拟信号，并且将其提供给A/D转换装置132。A/D转换装置132将该模拟信号转换成数字信号，并且将该数字信号提供给编码装置120。编码装置120对所输入的数字信号进行编码，生成编码并且向网络N1输出该编码。

图14B是示出了当依据本实施方式的译码装置应用于有线通信系统时，接收端的主要结构的框图。另外，向与图10所示的部件相同的部件分配相同的参考数字，并且将省略其说明。

有线接收装置190包括连接到网络N1的接收装置191、译码装置170、D/A转换装置183及输出装置184。

接收装置191的输入端连接到网络N1。译码装置170的输入端连接到接收装置191的输出端。D/A转换装置183的输入端连接到译码装置170的输出端。输出装置184的输入端连接到D/A转换装置183的输出端。

接收装置191从网络N1接收数字编码的音响信号，生成数字接收的音响信号，并且将该信号提供给译码装置170。译码装置170从接收装置191接收所接收的音响信号，在所接收的音响信号上执行译码处理，生成数字的译码音响信号，并且将其提供给D/A转换装置183。D/A转换装置183转换来自译码装置170的数字的译码语音信号，生成模拟的译码语音信号，并且将其提供给输出装置184。输出装置184将作为电信号的模拟的译码音响信号转换成空气的振动，并且将其作为人的耳朵听得见的音波W13输出。

因此，根据上述结构，能够提供具有与上述无线收发装置类似的操作和效果的有线收发装置。

(实施方式2)

图15是示出了在依据本发明的实施方式2的编码装置中的频谱编码部分200的主要结构的框图。这个频谱编码部分200具有与图5所示的频谱编码部分100相似的基本结构，而且向相同的部件分配相同的参考数字，并且将省略其说明。

本实施方式的特点在于，使在滤波部分中使用的滤波器函数比实施方式1中的那个更简单。

对于滤波部分201中使用的滤波器函数，使用了如下面等式所示的简化的一个。

P (z) = \frac{1}{1 - z^{- T}}

...(等式5)

这个等式对应于在(等式1)中假定M＝0、β₀＝1的滤波器函数。

图16说明了使用了上述滤波器进行滤波的概述。

通过顺序地复制相隔T的低频频谱获得第2频谱的估计值S’2(k)。此外，如同在实施例1的情况那样，搜索部分108通过搜索最小化(等式3)中的E的音调系数T来确定最优音调系数T’。经由输出端111输出以这种方式获得的音调系数T’。在这个结构中，滤波器的特性仅仅由音调系数T所决定。

要注意到，本实施方式的滤波器的特征在于，其以类似于自适应码簿(adaptive codebook)的方式进行操作，其中自适应码簿是作为低速率语音编码的代表性技术的CELP(Code-Excited Linear Prediction，编码激励的线性预测)方案的要素之一。

接下来，将说明对由上述频谱编码部分200编码的信号进行译码的频谱译码部分(未示出)。

这个频谱译码部具有与图12所示的频谱译码部分150相似的结构，因此省略了其详细说明，而且其具有以下的特点。即，当滤波部分156计算第2频谱的估计值S’2(k)时，它使用(等式5)中所描述的滤波器函数，而不是(等式1)中所描述的滤波器函数。仅仅音调系数T’从输入端152提供。即，应当使用(等式1)或(等式5)中的哪一个所描述的滤波器函数，取决于在编码端使用的滤波器函数的类型而确定，并且使用与编码端相同的滤波器函数。

因此，依据本实施方式，使在滤波部分中使用的滤波器函数变得更简单，其导致消除了安装滤波器系数计算部分的必要。因此能够用较少的计算量估计第2频谱(高频频谱)，而且还减少了电路规模。

(实施方式3)

图17是示出了依据本发明的实施方式3的编码装置中的频谱编码部分300的主要结构的框图。这个频谱编码部分300具有与图5所示的频谱编码部分100相似的基本结构，并且向相同的部件分配了相同的参考数字且将省略其说明。

本实施方式的特点在于，还包含轮廓计算部分301和多路复用部分302，并且在估计了第2频谱之后、对有关第2频谱的包络信息执行编码。

搜索部分108将最优音调系数T’输出到多路复用部分302，并且将使用这个音调系数T’生成的第2频谱的估计值S’2(k)输出到轮廓计算部分301。轮廓计算部分301基于从频率域转换部分105提供的第2频谱S2(k)计算有关第2频谱S2(k)的包络信息。这里，以其中由用于每个次能带的频谱功率表示这个包络信息、而且频带FL≤k＜FH被划分成J个次能带的情况为例进行说明。此时，第j个次能带的频谱功率用以下的等式表示。

B (j) = Σ_{k = BL (j)}^{BH (j)} S 2 {(k)}^{2}

...(等式6)

在这个等式中，BL(j)表示第j个次能带的最低频率，BH(j)表示第j个次能带的最高频率。将以这种方式获得的第2频谱的次能带信息看作为有关第2频谱的频谱包络信息。

以类似的方式，根据下式计算出第2频谱的估计值S’2(k)的次能带信息B’(j)。

B^{'} (j) = Σ_{k = BL (j)}^{BH (j)} S^{'} 2 {(k)}^{2}

...(等式7)

并且根据下式计算出每个次能带的变化量V(j)。

V (j) = \sqrt{\frac{B (j)}{B^{'} (j)}}

...(等式8)

接下来，轮廓计算部分301对变化量V(j)进行编码，获得编码后的变化量V_q(j)，并且将其索引输出到多路复用部分302。多路复用部分302多路复用从搜索部分108获得的最优音调系数T’和从轮廓计算部分301输出的变化量V(j)的索引，并且经由输出端111输出该多路复用结果。

因此，因为在估计了高频频谱之后近一步对有关高频频谱的包络信息进行了编码，所以这个实施方式使得提高高频频谱的估计值的精度成为可能。

(实施方式4)

图18是示出了依据本发明实施方式4的频谱译码部分550的主要结构的框图。这个频谱译码部分550具有与图12所示的频谱译码部分150相似的基本结构，并且因此向相同的部件分配了相同的参考数字并且将省略其说明。

本实施方式的特点在于，还包含分离部分551、频谱包络译码部分552及频谱调整部分553。因此，这允许实施方式3所示的频谱编码部分300等对通过对包络信息进行编码以及对高频频谱的估计频谱进行编码而产生的编码执行译码。

分离部分551分离经由输入端152输入的编码，将有关滤波系数的信息提供给滤波部分156，并且将有关频谱包络的信息提供给频谱包络译码部分552。

频谱包络译码部分552从由分离部分551给出的频谱包络信息中，译码出通过对变化量V(j)进行编码而获得的变化量V_q(j)。

频谱调整部553依据以下的等式将从滤波部分156获得的译码频谱S’(k)乘以从频谱包络译码部分552获得的每个次能带的译码的变化量V_q(j)，调整在译码频谱S’(k)的频带FL≤k＜FH中的频谱形状并且生成调整后的译码频谱S3(k)。将该调整后的译码频谱S3(k)输出到时域转换部分158，并将它转换成时域信号。

S3(k)＝S′(k)·V_q(j)(BL(j)≤k≤BH(j)，for all j)...(等式9)

因此，根据本实施方式，有可能对包含包络信息的编码进行译码。

本实施方式已经说明了作为示例的、其中从分离部分511提供的频谱包络信息是通过对如(等式8)所示、每个次能带的变化量V(j)进行编码而获得的值V_q(j)的情况，但是，频谱包络信息并不限于此。

(实施方式5)

图19是示出在依据本发明实施方式5的译码装置中的频谱译码部分650的主要结构的框图。这个频谱译码部分650具有与图18所示的频谱译码部分550相似的基本结构，并且因此向相同的部件分配相同的参考数字并且将省略其说明。

本实施方式的特点在于，还包含LPC频谱计算部分652，以使用利用LPC系数计算出的LPC频谱作为频谱包络信息，估计第2频谱，然后通过将第2频谱与LPC频谱相乘以获得更准确的第2频谱的估计值。

LPC频谱计算部分652根据以下的等式，从经由输入端651输入的LPC系数α(j)中计算出LPC频谱env(k)。

env (k) = | \frac{1}{1 - Σ_{j = 1}^{NP} α (j) e^{- j \frac{2 πjk}{FH}}} |

...(等式10)

其中，NP表示LPC系数的次数。此外，还有可能使用变量r(0＜r＜1)并且改变LPC频谱的特性来计算LPC频谱env(k)。

在这种情况下，LPC频谱env(k)由以下的等式所示。

env (k) = | \frac{1}{1 - Σ_{j = 1}^{NP} α (j) \cdot γ^{j} \cdot e^{- j \frac{2 πjk}{FH}}} |

...(等式11)

其中，可以将r定义为固定值，其也可以采用逐帧改变的值。将以这种方式计算的LPC频谱env(k)输出到频谱调整部分553。

频谱调整部分553依据以下的等式(12)，将从滤波部分156获得的译码频谱S’(k)按照下式乘以从LPC频谱计算部分652获得的LPC频谱env(k)，调整在译码频谱S’(k)的频带FL≤k＜FH中的频谱，并且生成调整后的译码频谱S3(k)。将该调整后的译码频谱S3(k)提供给时域转换部分158，并将其转换成时域信号。

S3(k)＝S′(k)·env(k)(FL≤k＜FH)...(等式12)

因此，根据本实施方式，使用LPC频谱作为频谱包络信息使得获得更准确的第2频谱的估计值成为可能。

依据本发明的编码装置或译码装置可以装载在移动通信系统中的通信终端装置和基站装置上，并且因此能够提供具有与上述的那些相似的操作和效果的通信终端装置及基站装置。

虽然迄今为止已经以本发明由硬件构成的情况为例进行了说明，但是，本发明也可以用软件来实现。

本申请基于2003年9月16日提交的日本专利第2003-323658号。该申请的内容通过引起全部在此并入。

工业可应用性

依据本发明的编码装置和译码装置具有以低比特率执行编码的效果，并且也能够应用于无线通信系统等。

Claims

1.一种对分成低频带和高频带的语音信号或音频信号进行编码的可扩展编码装置，包括：

第一编码部分，对所述语音信号或所述音频信号的低频带的信号进行编码；

第二编码部分，对所述语音信号或所述音频信号的高频带的信号进行编码；

第一频谱生成部分，对所述低频带的信号执行频率域转换，以生成低频带的第一频谱；以及

第二频谱生成部分，对所述语音信号或所述音频信号执行频率域转换，以生成具有低频带和高频带的第二频谱，

其中，所述第二编码部分包括：

生成部分，使用所述第一频谱，求所述第二频谱的高频带的估计频谱；

搜索部分，搜索指示与所述第二频谱的高频带相似度最高的所述估计频谱的参数；以及

编码部分，对指示所述相似度最高的所述估计频谱的参数进行编码，而不是对所述第二频谱的高频带进行编码。

2.如权利要求1所述的可扩展编码装置，其中，

所述参数指示从所述高频带的频谱相隔预定的值的所述低频带的频谱的位置；

所述生成部分通过顺序地复制相隔预定的值的所述低频带的频谱，生成所述估计频谱。

3.如权利要求1所述的可扩展编码装置，其中，所述搜索部分在事先设定的范围内逐次且一点一点地改变所述参数，决定指示使所述相似度最高的所述估计频谱的参数。

4.如权利要求1所述的可扩展编码装置，其中，所述搜索部分决定使包括所述高频带的频谱与所述估计频谱之间的失真最小的所述参数。

5.如权利要求1所述的可扩展编码装置，其中，

所述相似度由互相关值的平方与所述估计频谱的能量之比表示，所述互相关值为包括所述高频带的频谱与所述估计频谱之间的互相关值；

所述搜索部分决定使所述比最大的参数。

6.如权利要求1所述的可扩展编码装置，其中，所述编码部分还对所述高频带的频谱的包络信息进行编码。

7.如权利要求1所述的可扩展编码装置，其中，所述编码部分还对有关所述低频带的频谱与所述高频带的频谱之间的功率比的信息进行编码。

8.一种通信终端装置，包括如权利要求1所述的可扩展编码装置。

9.一种基站装置，包括如权利要求1所述的可扩展编码装置。

10.一种对分成低频带和高频带的语音信号或音频信号进行译码的可扩展译码装置，包括：

频谱取得部分，从具有低频带及高频带的频谱中获取低频带的频谱；

参数获取部分，获取指示使用所述低频带的频谱生成的、且与对应于所述语音信号或所述音频信号的高频带的频谱最相似的估计频谱的参数；以及

译码部分，使用所述低频带的频谱及所述参数，对所述低频带的频谱及所述高频带的频谱进行译码。

11.如权利要求10所述的可扩展译码装置，其中，

所述译码部分通过顺序地复制相隔预定的值的所述低频带的频谱，生成所述高频带的频谱。

12.如权利要求10所述的可扩展译码装置，还包括包络信息获取部分，获取所述高频带的频谱的包络信息，其中，

所述译码部分还使用所述包络信息执行所述译码。

13.一种通信终端装置，包括如权利要求10所述的可扩展译码装置。

14.一种基站装置，包括如权利要求10所述的可扩展译码装置。

15.一种对分成低频带和高频带的语音信号或音频信号进行编码的可扩展编码方法，包括：

第一编码步骤，对所述语音信号或所述音频信号的低频带的信号进行编码；

第二编码步骤，对所述语音信号或所述音频信号的高频带的信号进行编码；

第一频谱生成步骤，对所述低频带的信号执行频率域转换，以生成低频带的第一频谱；以及

第二频谱生成步骤，对所述语音信号或所述音频信号执行频率域转换，以生成具有低频带和高频带的第二频谱，

其中，所述第二编码步骤包括：

生成步骤，使用所述第一频谱，求所述第二频谱的高频带的估计频谱；

搜索步骤，搜索指示与所述第二频谱的高频带相似度最高的所述估计频谱的参数；以及

编码步骤，对指示所述相似度最高的所述估计频谱的参数进行编码，而不是对所述第二频谱的高频带进行编码。

16.一种对分成低频带和高频带的语音信号或音频信号进行译码的可扩展译码方法，包括：

频谱取得步骤，从具有低频带及高频带的频谱中获取低频带的频谱；

参数获取步骤，获取指示使用所述低频带的频谱生成的、且与对应于所述语音信号或所述音频信号的高频带的频谱最相似的估计频谱的参数；以及

译码步骤，使用所述低频带的频谱及所述参数，对所述低频带的频谱及所述高频带的频谱进行译码。