CN1256000A

CN1256000A - 增强音调的方法和装置

Info

Publication number: CN1256000A
Application number: CN99800071A
Authority: CN
Inventors: 吉田幸司
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1998-01-26
Filing date: 1999-01-26
Publication date: 2000-06-07
Also published as: KR20010005557A; EP0971337A4; WO1999038156A1; KR100338606B1; CA2283202A1; AU2075099A; EP0971337A1

Abstract

LPC逆滤波器301由解码语音来计算残差信号,然后第一滞后值计算器302使用残差信号r(n)来获得第一滞后值T1。然后,第二滞后值计算器303计算第二滞后值T2。第二滞后值T2被计算为以两倍于第一滞后值T1或其整数部分的滞后值为中心、包括该值前后的小数滞后值的范围内与残差信号的相关值或关联值的最大值对应的滞后值。通过使用与第一和第二滞后值对应的信号波形,将音调加权滤波器应用于解码语音。

Description

增强音调的方法和装置

技术领域

本发明涉及一种在语音解码器中增强音调的方法和装置，该语音解码器包括在数字语音通信装置、例如数字蜂窝电话上。

背景技术

传统的数字蜂窝电话等包含语音编码器/解码器，以有效地压缩和发送语音信号信息。语音解码器进行后滤波，以改善感觉品质，防止由编码引起的解码语音品质的恶化。后滤波包括音调增强，用于通过增强解码过的信号的音调周期性来改善感觉品质。一种传统的音调增强方法是基于国际组织ITU-T推荐G729(8 kbps CS-ACELP语音编码方法)的技术。下面使用图1和图2来说明此传统的音调增强方法。

图1是语音解码器中的后滤波器的结构方框图。此后滤波器1由后述的音调增强部2对解码语音进行音调增强，然后由共振峰(formant)增强部3进行语音频谱增强。然后，高频增强部4补偿由共振峰增强部3产生的频谱倾斜，并且最后由增益控制部5进行增益调节，该增益控制部5将后滤波之后的信号功率调节到后滤波之前的信号功率。

图2是音调增强部2的结构方框图。音调增强部2使用LPC逆滤波器21由解码信号来计算残差(residual)信号，该LPC逆滤波器21由用于语音解码的LPC参数构成。在此传统的例子中，LPC逆滤波器对应于图1的共振峰增强部3中的共振峰增强滤波器的分子项，并且也起共振峰增强处理的作用。

滞后值计算器22使用LPC逆滤波器21获得的残差信号来计算滞后值。为了计算滞后值，使用用于语音解码的滞后参数。由滞后参数指示的整数滞后值前后的范围来确定对应于残差信号最大相关值的整数滞后值，然后确定与该整数滞后值前后的最大归一化校正值对应的小数滞后值T。

增益系数计算器23计算控制音调加权滤波器24增益的系数g。这被计算为与滞后值T对应的音调预测增益(归一化相关值)。

最后，音调加权滤波器24对LPC逆滤波器由解码过的信号计算出的残差信号进行音调增强处理。音调加权滤波器Hp(z)由式(1)给出

H_{p} (z) = \frac{1}{1 + γg} (1 + γg z^{- T}) - - - - - . . . (1)

其中γ是控制音调增强度的常数。

另一方面，当将上述传统的音调增强方法应用于进行更有效编码的低比特率(例如4 kbps)的语音编码器时，需要增加音调增强度以进一步抑制由低比特率实现引起的解码语音品质的恶化。在传统的音调增强方法中，需要增加上式(1)中的控制音调增强度的常数γ。

然而，简单地增加常数γ的问题是使语音的自然度恶化，更使感觉品质恶化。

发明概述

本发明的目的是提供一种优良的音调增强方法和装置，能够以不牺牲解码语音自然度的增强度在低比特率语音编码器中进行高音调增强，并且改善感觉品质。

此目的是如下实现的：由至少解码语音或用于语音解码的滞后参数来计算第一滞后值，该第一滞后值指示到与进行音调增强的信号波形类似的信号波形的延迟；根据所述第一滞后值来计算至少另一个滞后值，该另一个滞后值指示到与进行音调增强的所述信号波形类似的另一个信号波形的延迟；并且使用与所述多个滞后值对应的信号波形来增强解码语音。

当应用于低比特率语音编码器时，这能够以高增强度进行音调增强，而不牺牲解码语音的自然度，并且改善感觉品质。

附图的简要描述

图1是进行音调增强的传统后滤波器的结构方框图；

图2是传统后滤波器中的音调增强部的结构方框图；

图3是配备有本发明实施例1后滤波器的无线通信装置的结构方框图；

图4是图3所示的无线通信装置的语音解码器的结构方框图；

图5是本发明实施例1后滤波器的音调增强部的结构方框图；

图6是实施例1音调增强操作的操作过程的流程图；

图7是本发明实施例2后滤波器的音调增强部的结构方框图。

实施本发明的最好方式

下面参照附图，详细说明本发明的实施例。(实施例1)

图3是配备有本发明实施例1后滤波器的无线通信装置的结构方框图。

在此无线通信装置中，发送端通过语音输入装置101、例如话筒将语音转换为电模拟信号，并且将其输出到A/D转换器102。模拟语音信号由A/D转换器102转换为数字语音信号，并且将其输出到语音编码器103。语音编码器103对数字语音信号进行语音编码，并且将编码信息输出到调制器/解调器104。调制器/解调器104对编码语音信号进行数字调制，并且将其发送到无线传输部105。无线传输部105对已调信号进行规定的无线传输处理。此信号经天线106发送。

另一方面，在无线通信装置的接收端，在无线接收部108中对由天线107接收到的信号进行规定的无线接收处理，并且将其发送到调制器/解调器104。调制器/解调器104对接收信号进行解调处理，并且将解调信号输出到语音解码器109。语音解码器109对解调信号进行解码处理，获得数字解码语音信号，并且将此数字解码语音信号输出到D/A转换器110。D/A转换器110将从语音解码器109输出的数字解码语音信号转换为模拟解码语音信号，并且将其输出到语音输出装置111、例如扬声器。最后，语音输出装置111将电模拟语音信号转换为解码语音，并且将其输出。

在上述结构中，语音解码器109具有图4所示的结构。即，当接收数据被输入到分离器201时，从接收数据中提取表示量化LPC的LPC参数代码L、表示固定激励代码向量的固定激励代码S、表示滞后值的滞后参数代码P、以及表示增益信息的增益代码G，并且这些代码被分别输入到LPC解码器207、固定激励码本205、滞后参数解码器203和增益码本206。

LPC解码器207对来自LPC参数代码L的量化LPC进行解码，并且将其输出到合成滤波器208。固定激励码本205存储预定数目的具有不同形状的固定激励代码向量，并且输出通过对输入的固定激励代码S进行解码而获得的固定激励码本索引所指定的固定激励代码向量。此固定激励代码向量由乘法器乘以后述的固定激励码本增益，然后输出到加法器。

自适应激励码本204逐个更新过去产生的激励向量信号，同时对它们进行缓冲，并且使用滞后参数来产生自适应激励代码向量。通过对滞后参数解码器203输入的滞后参数代码P进行解码，来获得此滞后参数。此自适应激励代码向量由乘法器乘以后述的自适应激励码本增益，然后将其输出到加法器。

增益码本206存储预定数目的自适应激励码本增益和固定激励码本增益的组(增益向量)，并且将对输入的增益代码G进行解码而获得的增益码本索引所指定的增益向量的自适应激励码本增益分量和固定激励码本增益分量输出到它们各自的乘法器。

加法器计算从乘法器输入的固定激励代码向量和自适应激励代码向量的总和，以产生激励向量信号，并且将其输出到合成滤波器208和自适应激励码本204。

合成滤波器208使用输入的量化LPC来构造LPC合成滤波器。从加法器输出的激励向量信号被输入到此合成滤波器并且被滤波，合成信号被输出到后滤波器209。

后滤波器209对从合成滤波器208输入的合成信号进行用于改善语音信号的主观品质的处理，例如音调增强、共振峰增强、高频增强和增益控制。对后滤波器209的输出进行预定的后处理，然后将其输出作为输出数据、例如数字化的解码语音信号。

图5是本发明实施例1后滤波器的音调增强部的结构方框图。实施例1的后滤波器的音调增强部包括：LPC逆滤波器101，对解码语音进行LPC逆滤波，以获得残差信号；第一滞后值计算器102，使用用于语音解码的滞后参数由解码语音来计算第一滞后值；第二滞后值计算器103，由第一滞后值和解码语音来计算第二滞后值；第一/第二增益系数计算器104，由第一和第二滞后值和所述解码语音来计算与第一和第二滞后值对应的第一和第二增益系数；以及音调加权滤波器305，使用解码语音、第一和第二滞后值、以及第一和第二增益系数来进行音调加权滤波。

音调加权滤波器105的滤波特性示于式(2)。

H_{p} (z) = \frac{1}{1 + γ_{1} g_{1} + γ_{2} g_{2}} ({1 + γ}_{1} g_{1} z^{- T_{1}} + γ_{2} g_{1} z^{- T_{2}}) - - - - - . . . (2)

其中，T1和T2是第一和第二滞后值，g1和g2是T1和T2音调加权滤波器的增益系数，而γ1和γ2是控制与滞后值T1和T2对应的音调增强度的常数。音调加权滤波器105使用式(2)所示的第一滞后值T1的信号以及第二滞后值T2的信号进行音调增强。

下面根据图6所示的处理过程来说明上述结构的实施例1的音调增强操作。顺便指出，实施例1的音调增强处理是使用某个长度区间的解码语音作为单位来进行的。此区间长度对应于应用音调增强的语音编码/解码处理的编码单位(帧或子帧)。

首先，LPC逆滤波器101由解码语音s(n)(n＝0，1，…，N-1；N：区间长度)来计算残差信号r(n)(n＝0，1，…，N-1)。它使用从编码端发送的用于语音解码的LPC参数作为构成LPC逆滤波器101的LPC系数。对于该LPC系数，可以使用直接对解码语音s(n)进行LPC分析而获得的LPC参数。

然后，第一滞后值计算器102由残差信号r(n)获得第一滞后值T1。可以使用任何方法来计算第一滞后值T1。例如，可以获得与式(3)所示的残差信号的相关值R(k)的最大值、或者式(4)所示归一化相关值Rn(k)的最大值对应的滞后值作为第一滞后值T1。

R (k) = Σ_{n = 0}^{N - 1} γ (n) γ_{k} (n) - - - - - - . . . (3)

R_{n} (k) = \frac{Σ_{n = 0}^{N - 1} γ (n) γ_{k} (n)}{\sqrt{Σ_{n = 0}^{N - 1} γ_{k} {(n)}^{2}}} - - - - - . . . (4)

其中，式(3)和(4)中的rk(n)是滞后值为k(包括小数滞后值)的残差信号。

还可以首先缩窄以整数滞后值为中心的滞后值范围，然后在整数部分之前或之后指定的范围内寻找最佳小数滞后值。还可以在语音解码的过程中将从编码端发送的滞后参数的滞后值本身设置为第一滞后值，或者在其整数部分之前或之后的范围内计算小数滞后值。

这样获得的第一滞后值T1表示到与进行音调增强的信号波形最类似的信号波形的位置所需的延迟量。典型地，如果解码语音信号或残差信号是周期性的信号波形，它指示目标信号波形和一个音调周期之前的信号波形之间的距离。

然后，第二滞后值计算器103使用第一滞后值T1和残差信号来计算第二滞后值T2。第二滞后值计算部103在以两倍于第一滞后值T1(或第一滞后值T1整数部分)的滞后值为中心、包括其前后的小数滞后值的范围内，计算与式(4)的最大值对应的滞后值作为第二滞后值T2。通过这样来寻找第二滞后值，可以将要计算的第二滞后值限制到从第一滞后值起的更合适的范围，并且以更小的运算量来计算第二滞后值。

如果解码语音信号或残差信号是周期性的信号波形，则这样计算出的第二滞后值T2典型地指示从目标信号波形到两个音调周期之前的信号波形的距离。

如果第二滞后值T2的搜索范围超过残差信号的缓冲器长度，则停止第二滞后值的计算，以防止第二滞后值T2的解码语音信号被用于音调增强。这抑制了残差信号和解码语音信号的缓冲器容量(存储器容量)的增加。

然后，第一/第二增益系数计算器304确定第一和第二滞后值的音调加权滤波器的增益系数。第一和第二增益系数g1和g2可以由式(5)和(6)来计算。

g_{1} = \frac{Σ_{n = 0}^{N - 1} γ (n) γ_{T_{1}} (n)}{Σ_{n = 0}^{N - 1} γ_{T_{1}} {(n)}^{2}} - - - - - . . . (5)

g_{2} = \frac{Σ_{n = 0}^{N - 1} γ (n) γ_{T_{2}} (n)}{Σ_{n = 0}^{N - 1} γ_{T_{2}} {(n)}^{2}} - - - - - . . . (6)

如果与g1和g2关联的式(7)和(8)中的值是阈值Th1和Th2或更低，则可以防止具有该滞后值的音调增强。这抑制了将具有低相似性解码语音信号用于音调增强而引起的感觉品质的恶化。

\frac{{(Σ_{n = 0}^{N - 1} γ (n) γ_{T_{1}} (n))}^{2}}{(Σ_{n = 0}^{N - 1} γ_{T_{1}} {(n)}^{2}) (Σ_{n = 0}^{N - 1} γ {(n)}^{2})} - - - - - . . . (7)

\frac{{(Σ_{n = 0}^{N - 1} γ (n) γ_{T_{2}} (n))}^{2}}{(Σ_{n = 0}^{N - 1} γ_{T_{2}} {(n)}^{2}) (Σ_{n = 0}^{N - 1} γ {(n)}^{2})} - - - - - . . . (8)

最后，音调加权滤波器105通过将式(2)所示的音调加权滤波器应用于第二语音来进行音调增强，并且获得音调增强了的输出信号。

然后对音调增强了的输出进行共振峰增强、高频增强和增益控制等处理，成为后滤波器输出。进行这种处理提供了能够以优良的感觉品质进行音调增强的语音解码。

根据实施例1，除第一滞后值计算器102以外，还包括第二滞后值计算器103，计算大约两倍于第一滞后值T1的最佳第二滞后值T2，除具有第一滞后值的解码语音信号以外，还将具有滞后值T2的解码语音信号用于音调增强，从而除与进行音调增强处理的信号最类似的第一滞后值(1个音调周期以前)的信号以外，还使用高波形相似性的第二滞后值(2个音调周期以前)的信号，使得能够通过使用两个或多个过去的类似信号波形更平滑地实现音调增强，并且提供具有高度增强的音调增强，而不牺牲解码语音的自然度。(实施例2)

图7是本发明实施例2后滤波器的音调增强部的功能方框图。实施例2的后滤波器使用LPC逆滤波器输出的残差信号、而不是解码语音信号作为音调加权滤波器105的输入。结构的其余部分与实施例1相同。

实施例2使用残差信号和具有第一和第二滞后值的增益系数进行音调增强。这里，它使用与在音调增强处理的后级中进行的式(9)所示的共振峰增强滤波器的分子项对应的特性作为LPC逆滤波器101的滤波器特性。其中，ai(i＝1，...，Np)是LPC系数，γn和γd是控制共振峰增强度的常数，而1/gf是增益补偿项。

H_{f} (z) = \frac{1}{gf} \frac{1 + Σ_{i = 1}^{Np} γ_{n}^{i} a_{i} z^{- i}}{1 + Σ_{i = 1}^{Np} γ_{d}^{i} a_{i} z^{- i}} - - - - - . . . (9)

根据上述实施例2，LPC逆滤波用于获得当计算音调加权滤波器所用的滞后值和增益系数时所用的残差信号，LPC逆滤波还起共振峰增强滤波器的作用，这减少了运算量。

上述实施例1和2描述了两个滞后值、第一和第二滞后值被用作音调增强所用的滞后值的情况，但是也可以实施使用多于两个滞后值的方法。

在该情况下，当在计算第一滞后值时出现n倍音调误差(错误地将滞后值计算为n倍于原始值的值)，也可以通过使用第一滞后值的大约1/2(或1/n(n＝3，4，…))来改善音调增强的性能。

此外，上述实施例1和2描述了在LPC逆滤波器之后使用残差信号来计算滞后值和增益系数的方法，但是也可以直接从解码语音信号来计算它们。

如上所述，本发明除与进行音调增强的信号波形最类似的第一滞后值(1个音调周期以前)的信号以外，还使用具有高波形相似性的第二滞后值(2个音调周期以前)的信号，从而与使用过去两个或多个类似信号波形相比，能够更平滑地实施音调增强，并且能够以高增强度来进行音调增强，而不牺牲解码语音的自然度。

此外，本发明包括使用程序的音调增强装置，该程序使用存储在例如磁盘、磁光盘和ROM等记录媒体的软件来实施上述音调增强方法。

上述实施例描述了用于CELP型编码器中的情况，但是本发明也适用于其他类型编码器的情况。

本发明基于1998年1月26日提交的日本专利申请No.HEI 10-027710，其整个内容包含于此作为参考。产业上的可应用性

本发明的音调增强方法和装置可以适用于无线通信系统中的基站装置和通信终端装置。

Claims

1、一种音调增强方法，由至少解码语音或用于语音解码的滞后参数来计算第一滞后值，该第一滞后值指示到与进行音调增强的信号波形类似的信号波形所需的延迟；根据所述第一滞后值来计算至少另一个滞后值，该另一个滞后值指示到与进行音调增强的所述信号波形类似的另一个信号波形的延迟；并且使用与所述多个滞后值对应的信号波形来进行解码语音的增强。

2、如权利要求1所述的音调增强方法，其中该另一个滞后值是该第一滞后值的n倍、或该第一滞后值整数部分的n倍、或接近该值。

3、一种音调增强方法，由至少解码语音或用于语音解码的滞后参数来计算第一滞后值，该第一滞后值指示到与进行音调增强的信号波形类似的信号波形所需的延迟；根据所述第一滞后值来计算第二滞后值，该第二滞后值指示到与进行音调增强的所述信号波形类似的另一个信号波形的延迟；由所述第一和第二滞后值和所述解码语音来计算与第一和第二滞后值对应的第一和第二增益系数；并且使用所述解码语音、第一和第二滞后值以及第一和第二增益系数来进行解码语音的音调增强。

4、如权利要求3所述的音调增强方法，其中该第二滞后值是以两倍于第一滞后值或者第一滞后值整数部分的值为中心、包括小数的其前后的候选滞后值中，与解码语音或关联信号的相关值或关联值的最大值对应的滞后值。

5、如权利要求3所述的音调增强方法，其中如果第二滞后值超过用于计算滞后值的解码语音或关联信号的缓冲器长度，则具有所述第二滞后值的解码语音或与所述第二滞后值对应的关联信号不用于音调增强。

6、如权利要求3所述的音调增强方法，其中如果解码语音或关联信号的与第一或第二滞后值对应的归一化相关值不大于阈值，则与所述滞后值对应的解码语音或关联信号不用于音调增强。

7、如权利要求3所述的音调增强方法，它将残差信号用作与用于计算滞后值和相关值的解码语音关联的信号，该残差信号是将LPC逆滤波应用于解码语音而获得的。

8、如权利要求3所述的音调增强方法，它将残差信号、而不是解码语音用作音调加权滤波的输入，该残差信号是将LPC逆滤波应用于解码语音而获得的。

9、一种语音解码方法，它将权利要求1的音调增强方法应用于解码端的后滤波。

10、一种音调增强装置，包括：

第一滞后值计算器，由至少解码语音或用于语音解码的滞后参数来计算第一滞后值，该第一滞后值指示到与进行音调增强的信号波形类似的信号波形所需的延迟；

第二滞后值计算器，根据所述第一滞后值来计算第二滞后值，该第二滞后值指示到与进行音调增强的所述信号波形类似的另一个信号波形的延迟；

第一和第二增益系数计算器，由所述第一和第二滞后值和所述解码语音来计算与第一和第二滞后值对应的第一和第二增益系数；以及

音调加权滤波器，使用所述解码语音、第一和第二滞后值与第一和第二增益系数来进行音调加权滤波。

11、如权利要求10所述的音调增强装置，它包括LPC逆滤波器，该LPC逆滤波器对解码语音进行LPC逆滤波，以获得残差信号，并且使用所述残差信号来计算第一和第二滞后值和增益系数。

12、一种音调增强装置，包括：

LPC逆滤波器，该LPC逆滤波器对解码语音进行LPC逆滤波，以获得残差信号；

第二滞后值计算器，由所述第一滞后值和所述残差信号来计算第二滞后值，该第二滞后值指示到与进行音调增强的所述信号波形类似的另一个信号波形的延迟；

第一和第二增益系数计算器，由所述第一和第二滞后值和所述残差信号来计算与第一和第二滞后值对应的第一和第二增益系数；以及

音调加权滤波器，使用所述残差信号、第一和第二滞后值与第一和第二增益系数来进行音调加权滤波。

13、一种语音解码器，它将权利要求10的音调增强装置应用于解码端的后滤波器的一部分。

14、一种数字语音通信装置，它将权利要求10的音调增强装置应用于解码端的后滤波器的一部分。

15、一种计算机程序产品，包括：

计算机可读媒体；

第一程序指令部，用于指令计算机处理器由至少解码语音或用于语音解码的滞后参数来计算第一滞后值，该第一滞后值指示到与进行音调增强的信号波形类似的信号波形所需的延迟；

第二程序指令部，用于指令计算机处理器根据所述第一滞后值来计算第二滞后值，该第二滞后值指示到与进行音调增强的所述信号波形类似的另一个信号波形的延迟；以及

第三程序指令部，用于指令计算机处理器使用与所述多个滞后值对应的信号波形来进行解码语音的音调增强，

其程序指令部以可执行格式被存储在所述媒体中，并且当由有关处理器执行时，被加载到计算机存储器中以操作计算机。