CN1352451A

CN1352451A - 对背景噪音信号进行高质量解码的语音解码器

Info

Publication number: CN1352451A
Application number: CN01134499A
Authority: CN
Inventors: 小泽一范
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2000-11-06
Filing date: 2001-11-06
Publication date: 2002-06-05
Anticipated expiration: 2021-11-06
Also published as: CN1145144C; JP2002140099A; US7024354B2; EP1204092B1; EP1204092A2; US20020087308A1; DE60109111D1; EP1204092A3; DE60109111T2; JP3558031B2

Abstract

响应于语音编码器输出的编码语音信号,语音解码器将该编码语音信号解码为再生语音信号。如果再生语音信号满足预定的条件,如“静默”、“清音”等,语音解码器还进行以下的工作。语音解码器根据再生语音信号计算频谱参数,并根据再生语音信号和频谱参数的计算激励信号。在计算中,还得到激励信号的电平。语音解码器在时间上平滑频谱参数和激励信号电平中的至少一个。语音解码器使用以频谱参数构成的合成滤波器合成激励信号,从而再现语音信号。即使比特率很低,语音信号也有非常好的质量。

Description

对背景噪音信号进行高质量解码的语音解码器

发明背景

本发明涉及对语音信号进行解码的语音解码器，具体地说，本发明涉及能高质量地对背景噪音信号进行解码的解码器，其中背景噪音信号包含在低比特率的语音信号之中。

作为一种对语音信号进行高效编码的方法，CELP(编码激励线性预测编码)是本领域所公知的，其在M.Schroeder和B.Atal的《编码激励线性预测：极低比特率的高质量语音》(ICASSP会议论文集，第937-940页，1985：下文中称为文献1)、Kleijn等人的《CELP中改善的语音质量和高效的向量量化》(ICASSP会议论文集，155-158页，1988：下文中称为文献2)等中有所记述。文献1、2在此引用作为参考。

在常规的方法中，在发送侧，通过线性预测(LPC)分析为每一帧(如20ms长)语音信号提取表示语音信号频谱特征的频谱参数。然后，将每一帧划分为子帧(如5ms长)。对于每一个子帧，根据先前的激励信号，从自适应编码本中提取参数(对应于音调周期的增益参数和延时参数)。通过使用自适应编码本，对子帧的语音信号进行音调预测。对于通过音调预测而得到的激励信号，从包含预定的各种噪音信号的激励编码本(向量量化编码本)中选取最优的激励编码向量，并计算最优的增益。由此，激励信号就被量化。

激励编码向量的选取使得由所选取的噪音信号和上述的残余信号合成的信号之间的偏差能量最小。

由多路复用器单元将表示所选取的编码向量类别的索引、增益、频谱参数、以及自适应编码本的参数加以组合，并发送出去。

另外，为了减少检索激励编码本所需的计算量，提出了各种方法。

例如，有一种ACELP法(代数编码激励线性预测)。这种方法在C.Laflamme等人的《基于代数CELP的16kbps宽带语音编码技术》(ICASSP会议论文集，第13-16页，1991：下文中称为文献3)。在此引用文献3加入到本说明书中。

根据文献3中记述的方法，激励信号由多个脉冲表示，而且每个脉冲的位置由预定数目的比特表示，并被发送。在此每个脉冲的幅度限制为+1.0或-1.0。因此对脉冲检索所需的计算量可以显著地减少。

但是，根据上述的常规方法和技术，存在一个问题，在比特率为8kb/s或更高时才能获得最好的声音质量，但是在较低的比特率下，特别是有背景噪音叠加在语音上时，编码语音的背景噪音部分的声音质量会恶化。例如在蜂窝式电话中进行语音编码的情况下，这个问题非常明显。

根据文献1和文献2中记述的编码方法，编码比特率的降低会导致包含在激励编码本中的比特数的减少，从而导致波形的再现精度降低。波形再现精度的降低在高波形相关性的信号如语音信号上并不明显，但在低波形相关性的信号如背景噪音信号上，却非常明显。

在文献3中记述的编码方法中，激励信号由脉冲的组合表示。脉冲组合适于模拟语音信号，从而得到优异的声音质量。但是在低的比特率下，编码语音的声音质量会显著地降低，因为单个子帧的脉冲数不足以高精度地表示激励信号。

原因如下：激励信号由多个脉冲的组合表示。因此，在语音的元音期，脉冲集中在音调起点的音调脉冲周围。这时，语音信号可以有效地由少量脉冲表示。另一方面，对于随机信号，如背景噪音，必然产生不集中的脉冲。这时就难以用少量的脉冲恰当地表示背景噪音。这样，如果比特率降低，脉冲数减少，背景噪音的声音质量就会显著地降低。

根据上述的常规方法和技术产生的问题，本发明的一个目的是消除上述的问题，并提供一种改进的语音解码器，用以对由上述方法和技术编码而叠加上了背景噪音信号的语音信号进行解码。该改进的语音解码器需要相对较少的计算量，即使比特率很低也可以对语音信号进行解码，而声音质量不会有严重的恶化。

发明概述

为了达到上述的目的，本发明的第一方面提供了一种语音解码器，用以根据再生语音信号的特定条件，将编码语音信号解码为再生语音信号，利用该再生语音信号再现语音信号。

根据本发明第一方面的语音解码器包括：频谱参数计算电路，其响应于再生语音信号，用于根据再生语音信号计算频谱参数；激励信号计算电路，用于根据再生语音信号和频谱参数计算电路计算得到的频谱参数计算激励信号，获取激励信号的电平；平滑电路，响应于频谱参数和激励信号，在时间上平滑频谱参数和激励信号电平中的至少一个，以输出其中至少有一个是经过了平滑的频谱参数和激励信号；合成滤波电路，其具有以平滑电路输出的频谱参数构成的合成滤波器，用于通过使用合成滤波器合成激励信号而再现语音信号；其中激励信号计算电路、平滑电路和合成滤波电路只按照预定的条件工作。

在上述的语音解码器中，激励信号计算电路可以使用频谱参数对再生语音信号进行逆滤波，以计算激励信号。另外，上述的语音解码器可以包括模式判断电路，用以通过从再生语音信号中提取特征量而判断再生语音信号的模式，其中的预定条件包括模式条件，即再生语音信号的模式由模式判断电路判断为预定的模式。在这种情况下，激励信号计算电路、平滑电路和合成滤波电路只在满足模式条件的情况下工作。在此，预定的模式是，例如，“静默”或“清音”。

本发明的第二个方面是提供另一种语音解码器，用于将编码语音信号解码为再生语音信号，并用于使用该再生语音信号再现语音信号。

根据本发明第二方面的语音解码器包括：频谱参数计算电路，其响应于再生语音信号，用于根据再生语音信号计算频谱参数；激励信号计算电路，用于根据再生语音信号和频谱参数计算电路计算得到的频谱参数计算激励信号，获取激励信号的电平；音调预测电路，其根据再生语音信号或激励信号计算音调周期，利用音调周期进行音调预测，从而生成音调预测信号，并通过从激励信号中减去音调预测信号而计算残余信号；增益计算电路，用于计算音调预测信号和残余信号中至少一个的增益，其中音调预测信号和残余信号都是从音调预测电路输出的；平滑电路，响应于频谱参数和增益，在时间上平滑频谱参数和增益中的至少一个，以输出其中至少有一个是经过平滑的频谱参数和激励信号；以及合成滤波电路，其具有以从平滑电路输出的频谱参数构成的合成滤波器，用于基于增益、音调预测信号和残余信号重新生成适当的激励信号，从而使用合成滤波器合成适当的激励信号，以再现语音信号。

在根据本发明第二个方面的语音解码器中，激励信号计算电路可以使用频谱参数对再生语音信号进行逆滤波，以计算激励信号。

本发明的第三个方面提供了一种再现语音信号的方法。包括：第一步，将语音编码器输出的编码语音信号解码，以生成再生语音信号；第二步，根据再生语音信号计算频谱参数；第三步，根据再生语音信号和频谱参数计算激励信号，获取激励信号的电平；第四步，在时间上平滑频谱参数和激励信号电平中的至少一个，以输出其中至少有一个是经过平滑的频谱参数和激励信号；第五步，使用构有频谱参数的合成滤波器合成激励信号，以再现语音信号；其中第二至第五步只在满足预定条件的情况下进行，在不满足预定条件的其它情况下，再生语音信号作为语音信号处理。

在根据本发明第三个方面的语音再现方法中，可以进行第三步，以使用频谱参数对再生语音信号进行逆滤波，从而计算激励信号。另外，上述的再现方法可以包括第六步，通过从再生语音信号中提取特征量而判断再生语音信号的模式，其中的预定条件包括模式条件，即再生语音信号的模式被判断为预定的模式。在此，预定的模式是，例如，“静默”或“清音”。

本发明的第四个方面提供了另一种再现语音信号的方法。包括：第一步，将语音编码器的编码语音信号输出解码，以生成再生语音信号；第二步，根据再生语音信号计算频谱参数；第三步，根据再生语音信号和频谱参数计算激励信号，获取激励信号的电平；第四步，根据再生语音信号或激励信号计算音调周期，利用音调周期进行音调预测，以生成音调预测信号，并从激励信号中减去音调预测信号而计算残余信号；第五步，计算音调预测信号和残余信号中至少一个的增益；第六步，在时间上平滑频谱参数和增益中的至少一个，以输出其中至少有一个是经过平滑的频谱参数和激励信号；第七步，基于增益、音调预测信号以及残余信号重新生成适当的激励信号，然后使用以频谱参数构成的合成滤波器合成适当的激励信号，从而再现语音信号。

在根据本发明第四个方面的语音再现方法中，可以进行第三步，以使用频谱参数对再生语音信号进行逆滤波，从而计算激励信号。

需要理解的是，前面的说明和接下来的详细说明都只是示例性的和解释性的，不对本发明的范围构成限制，本发明的范围由所限定。

附图说明

在说明书中并作为说明书一部分的附图说明了本发明的实施例，并与说明书一起用于解释本发明的原理。附图中：

图1是根据本发明第一个实施例的语音解码器的示意框图；

图2是根据本发明第二个实施例的另一个语音解码器的示意框图；

图3是根据本发明第三个实施例的另一个语音解码器的示意框图；

优选实施例的详细说明

根据一个优选实施例的语音解码器包括：解码电路，用于将编码语音信号解码为再生语音信号；以及再现电路，用于使用再生语音信号再现语音信号。解码电路可以是根据文献1、2或3中公开的技术的常规的语音解码器。再现电路布置在解码电路的下一级。

图1是根据第一个实施例的语音解码器的再现电路的框图。

所示的再现电路包括：频谱参数计算电路10、逆滤波电路20、平滑电路30、以及合成滤波电路40。逆滤波电路20用作激励信号计算电路。

再生语音信号d(n)被供给频谱参数计算电路10，然后在线性预测分析的基础上，通过使用再生语音信号d(n)，按照预定的次数计算频谱参数α_i(i＝1，…，P：例如P＝10)。逆滤波电路20使用频谱参数α_i对再生语音信号d(n)进行逆滤波。逆滤波生成激励信号x(n)。平滑电路30接收频谱参数α_i和逆滤波电路20计算的激励信号x(n)，然后在时间上对频谱参数α_i和激励信号x(n)的RMS中的至少一个进行平滑，从而输出其中至少有一个是经过平滑的频谱参数α_i和激励信号x(n)。合成滤波电路40具有以从平滑电路输出的频谱参数α_i构成的合成滤波器，其使用合成滤波器合成激励信号x(n)，从而再现语音信号。

详细地说，根据第一个实施例的语音解码器如下工作：

当被提供再生语音信号d(n)时，频谱参数计算电路10在线性预测分析的基础上，使用再生语音信号d(n)，按照预定的次数计算频谱参数α_i。为在频谱参数计算电路10中计算频谱参数，可以运用公知的LPC(线性预测编码)分析、Burg分析，等等。在这个实施例中，采用了Burg分析。关于Burg分析的详细情况，可以参考Nakamizo写的《信号分析和系统识别》(1998年出版，Corona)，82-87页(下文中称为文献4)中的说明。将文献4通过引用结合于本说明中。

由频谱参数计算电路10计算的频谱参数α_i送至逆滤波电路20和平滑电路30。

在逆滤波电路20中，按照下面的公式(1)，根据频谱参数计算电路10计算的频谱参数α_i，对再生语音信号d(n)进行逆滤波，从而计算激励信号x(n)。

x (n) = d (n) - Σ_{1 = i}^{10} α_{i} d (n - i) \cdot \cdot \cdot (1)

在平滑电路30中，对频谱参数α_i和激励信号x(n)的RMS中的至少一个在时间上进行平滑，然后都输出到合成滤波电路40。

按照下面的公式(2)对激励信号x(n)的RMS进行平滑。

RMS(m)＝λ RMS(m-1)-(1-λ)RMS(m) …(2)

另一方面，按照下面的公式(3)对频谱参数a_i进行平滑。

\overset{&OverBar;}{{LSP}_{i}} (m) = λ \overset{&OverBar;}{{LSP}_{i}} (m - 1) - (1 - λ) LS P_{i} \cdot \cdot \cdot (3)

在这个实施例中，是在线性频谱对(LSP)上对频谱参数αi进行平滑，然后逆变换成平滑的频谱参数a_i。关于频谱参数α_i和LSP参数之间的变换和逆变换，可以参考Sugamura等人的《使用线性频谱对(LSP)语音分析-合成技术的语音数据压缩》(日本电子通信学会期刊，J64-A，599-606页，1981：下文中称为文献5)。文献5通过引用结合于本说明中。

然后，在合成滤波电路40中，将利用平滑电路30输出的频谱参数α_I来构造合成滤波器，使用合成滤波器合成激励信号x(n)，从而再生语音信号。

图2是根据本发明第二个实施例的语音解码器的再现电路的方框图。

从图1和图2可见，第二个实施例是第一个实施例的改进，除了模式判断电路50之外，它们相互是类似的。因此，在语音解码器中各元件以相似的方式工作的情况下，图2所示的第二个实施例中的语音解码器的元件和图1所示的第一个实施例中的语音解码器的元件标有同样的数字标号。图2所示的逆滤波电路20、平滑电路30和合成滤波电路40在模式判断电路50判断的模式下被控制，从控制的角度讲，与第一个实施例中的这些电路不同。

接收到再生语音信号d(n)时，模式判断电路50按照下面的公式(4)从再生语音信号d(n)中提取特征量。

D_{T} = [Σ_{n = 0}^{N - 1} d (n) d (n - T)] / [Σ_{n = 0}^{N - 1} d^{2} (n - T)] \cdot \cdot \cdot (4)

然后模式判断电路50把提取的特征量与预定的阈值相比较，从而判断再生语音信号d(n)的模式。

模式判断电路50的判断，即所判断的模式，被送至逆滤波电路20、平滑电路30和合成滤波电路40。在这个实施例中，逆滤波电路20、平滑电路30和合成滤波电路40只在满足预定条件的情况下工作。如果满足预定的条件，逆滤波电路20、平滑电路30和合成滤波电路40和第一个实施例一样地工作。如果不满足，逆滤波电路20、平滑电路30和合成滤波电路40不工作，从而再生语音信号作为语音信号输出。

在这个实施例中，预定的条件是再生语音信号d(n)的判断模式与预定的模式一致。预定的模式是，例如，“静默”或“清音”。如果再生语音信号d(n)的判断模式不符合预定的模式，则在这个实施例中，逆滤波电路20、平滑电路30和合成滤波电路40不工作。

图3是根据本发明第三个实施例的语音解码器中再现电路的方框图。

从图1和图3可见，第三实施例是第一个实施例的改进。这个实施例的再现电路除了频谱参数计算电路10、逆滤波电路20、平滑电路30和合成滤波电路40之外，还包括音调预测电路60、增益计算电路70。

在这个实施例中，频谱参数计算电路10和逆滤波电路20与第一个实施例同样地工作。

音调预测电路60由再生语音信号d(n)或激励信号x(n)计算音调周期T。然后音调预测电路60利用音调周期T进行音调预测，从而生成音调预测信号p(n)，并通过从激励信号x(n)中减去音调预测信号p(n)而计算残余信号e(n)。增益计算电路70计算从音调预测电路输出的音调预测信号p(n)和残余信号e(n)中的至少一个的增益。增益计算电路70将计算的增益、音调预测信号p(n)和残余信号e(n)送至平滑电路30。

平滑电路30接收频谱参数α_i、增益、音调预测信号p(n)和残余信号e(n)，然后在时间上平滑频谱参数α_i和增益中的至少一个。平滑电路30将频谱参数α_i、增益、音调预测信号p(n)和残余信号e(n)送至合成滤波电路40，其中频谱参数α_i和增益中至少有一个是经过了平滑处理的。

合成滤波电路40具有利用从平滑电路输出的频谱参数α_i构造的合成滤波器，其基于增益、音调预测信号p(n)和残余信号e(n)重新生成另一个适当的激励信号。该适当的激励信号是使用合成滤波器合成的，并再现为语音信号。

以上结合优选实施例详细地说明了本发明，很容易理解，本发明不限于这些公开的实施例。本发明可以加以改进，并包括此前未说明、但等同于本发明的精神和范围的各种变化、变更、替换或等同配置。因此，本发明不限于以上的说明，本发明的范围只由所附的所限定。

2000年11月6日提出的日本专利申请No.2000-337805的全部公开，包括说明书、权利要求书、附图和摘要，在此整体引用作为参考。

Claims

1.一种用于将编码语音信号解码为再生语音信号，并利用再生语音信号再现语音信号的语音解码器，包括：

频谱参数计算电路，响应于再生语音信号，用于根据再生语音信号计算频谱参数；

激励信号计算电路，用于根据再生语音信号和频谱参数计算电路计算的频谱参数计算激励信号，获取激励信号的电平；

平滑电路，响应于频谱参数和激励信号，用于在时间上平滑频谱参数和激励信号电平中的至少一个，从而输出其中至少有一个是经过了平滑的频谱参数和激励信号；

合成滤波电路，具有以从平滑电路输出的频谱参数构成的合成滤波器，用于使用该合成滤波器合成激励信号，从而再现语音信号；其中

激励信号计算电路、平滑电路和合成滤波电路只在满足预定条件的情况下工作。

2.如权利要求1所述的语音解码器，其特征在于，所述激励信号计算电路利用频谱参数对再生语音信号进行逆滤波，从而计算激励信号。

3.如权利要求1所述的语音解码器，还包括模式判断电路，用于通过从再生语音信号中提取特征量从而判断再生语音信号的模式，其中预定的条件包括模式条件，即再生语音信号的模式被模式判断电路判断为预定的模式，从而激励信号计算电路，平滑电路和合成滤波电路只在满足模式条件的情况下工作。

4.如权利要求3所述的语音解码器，其中所述预定的模式是静默。

5.如权利要求3所述的语音解码器，其中所述预定的模式是“清音”。

6.一种用于将编码语音信号解码为再生语音信号，并利用再生语音信号再现语音信号的语音解码器，包括：

频谱参数计算电路，响应于再生语音信号，根据再生语音信号计算频谱参数；

音调预测电路，由再生语音信号或激励信号计算音调周期，利用音调周期进行音调预测，以生成音调预测信号，并通过从激励信号中减去音调预测信号而计算残余信号；

增益计算电路，用于计算从所述音调预测电路输出的音调预测信号和残余信号中至少一个的增益；

平滑电路，响应于所述频谱参数和激励信号，在时间上平滑所述频谱参数和激励信号电平中的至少一个，从而输出其中至少有一个是经过了平滑的频谱参数和激励信号；

合成滤波电路，具有以从平滑电路输出的频谱参数构成的合成滤波器，用于重新生成基于增益、音调预测信号和残余信号的适当的激励信号，从而使用该合成滤波器合成适当的激励信号，以再现语音信号。

7.如权利要求6所述的语音解码器，其特征在于，激励信号计算电路利用频谱参数对再生语音信号进行逆滤波，从而计算激励信号。

8.一种再现语音信号的方法，包括：

第一步，将语音编码器输出的编码语音信号解码，从而生成再生语音信号；

第二步，根据再生语音信号计算频谱参数；

第三步，根据再生语音信号和频谱参数，计算激励信号，获取激励信号的电平；

第四步，在时间上平滑所述频谱参数和所述激励信号电平中的至少一个，以输出其中至少有一个是经过了平滑的频谱参数和激励信号；

第五步，使用以频谱参数构成的合成滤波器合成激励信号，以再现语音信号；其中

第二至第五步只在满足预定条件的情况下进行，在不满足预定条件的其它情况下，将再生语音信号作为语音信号处理。

9.如权利要求8所述的再现方法，其中进行第三步，以使用所述频谱参数对再生语音信号进行逆滤波，从而计算激励信号。

10.如权利要求8所述的再现方法，还包括第六步，通过从再生语音信号中提取特征量而判断再生语音信号的模式，其中所述预定条件包括模式条件，即再生语音信号的模式被判断为预定的模式。

11.如权利要求10所述的再现方法，其中所述预定的模式是“静默”。

12.如权利要求10所述的再现方法，其中所述预定的模式是“清音”。

13.一种再现语音信号的方法，包括：

第二步，根据再生语音信号计算频谱参数；

第四步，由所述再生语音信号或激励信号计算音调周期，利用音调周期进行音调预测，以生成音调预测信号，并从所述激励信号中减去所述音调预测信号而计算残余信号；

第五步，计算音调预测信号和残余信号中至少一个的增益；

第六步，在时间上平滑所述频谱参数和所述激励信号电平中的至少一个，以输出其中至少有一个是经过了平滑的频谱参数和激励信号；以及

第七步，基于所述增益、音调预测信号以及残余信号，重新生成适当的激励信号，然后使用以频谱参数构成的合成滤波器合成适当的激励信号，从而再现语音信号。

14.如权利要求13所述的再现方法，其中执行所述第三步时，使用所述频谱参数对再生语音信号进行逆滤波，从而计算激励信号。