CN1360716A

CN1360716A - 语音编码系统中的双向音调增强

Info

Publication number: CN1360716A
Application number: CN00809972A
Authority: CN
Inventors: 高扬
Original assignee: Conexant Systems LLC
Current assignee: Conexant Systems LLC
Priority date: 1999-07-02
Filing date: 2000-06-30
Publication date: 2002-07-24
Anticipated expiration: 2020-06-30
Also published as: WO2001003125B1; CN1186766C; WO2001003125A1; JP2003504655A; JP4629937B2; US6704701B1; DE60014904T2; EP1194925B1; DE60014904D1; JP2011048387A; TW473703B; EP1194925A1

Abstract

一种用于语音编码系统的双向音调增强系统。语音数据应用连续运作于具有固有带宽限制的区域,通常的语音编码系统其再生语音数据的音质受到严重的影响。本发明采用正向音调增强和反向音调增强来保持所再生语音的高品质音质。本发明某些实施例中,正向音调增强和反向音调增强在整个语音编码系统中单一部分内进行。例如在语音编码解码电路中,正向及反向音调增强仅在语音编码解码电路的编码器中进行或者仅在语音编码解码电路的解码器中执行。如果需要,正向及反向音调增强按分布式方式进行,至少部分地分别在语音编码解码电路中编码器和解码器每一个内进行。如果需要,用正向音调增强本身来产生反向音调增强。反向音调增强是先前产生的正向音调增强的镜像;反向音调增强是根据该正向音调增强产生的。作为替代,本发明其他实施例中,反向音调增强是独立于正向音调增强产生的,反向音调增强的产生不依赖于先前产生的正向音调增强。通常在码激励线性预测(CELP)中对固定码簿进行反向音调增强,或者作为后处理在解码器中进行。

Description

语音编码系统中的双向音调增强

相关申请的交叉引用

本发明要求1999年7月2日提出的发明名称为“语音编码系统中的双向音调增强”(代理人案卷号：97RSS380P) 的美国临时专利申请U.S.Prov.Ser.No.60/142,092的优先权、以及1999年8月2日提出的发明名称为“语音编码系统中的双向音调增强”(代理人案卷号：97RSS380)的美国专利申请U.S.Ser.No.09/365,444的优先权。背景

1.技术领域

本发明总体涉及语音编码，具体来说，涉及用音调增强来改善所再生语音音质的低比特率语音编码系统。

2.相关技术说明

现有语音编码系统通常在码激励线性预测语音编码系统中采用正向音调增强。这很大程度上是基于现有语音编码解码电路的子帧规模具有相对较大的带宽利用率，可单独用正向音调增强来提供足够的音质这一事实。但对语音编码系统中所用的种种通信介质内的较低比特率来说，所再生语音的音质在合成后无法保持高品质音质。

对运作于这些降低的比特率的现有语音编码系统来说，音调预测期间所产生的音调延迟，通常比总体子帧规模短得多，即占据总体子帧的相对较小部分。该特性对较高(较短)音调的说话者例如女性和孩子来说得到进一步强化。现有激励码簿结构无法在运作于低比特率时提供足够高品质的音质。这主要是因为未充分地对话音信号建立周期性，或者从码簿当中提取的激励向量尚未丰富到足以产生一具有高品质音质的合成语音信号。

随语音编码系统子帧规模变得越大，通常与降低比特率的通信系统相关联，仅正向进行音调增强这一事实造成音质明显越来越差。其中一个原因是，由于缺少许多脉冲而造成子帧内有大量死区。运作于较高比特率的现有语音编码系统中，必然具有较短子帧，这种效果通常无法被人的耳朵在听觉方面所察觉。几乎全部用相对较低比特率的语音编码进行处理的语音编码系统中都意识到这种较低品质音质的效果。

现有系统进一步的局限及缺点，如本申请下面参照附图所给出的那样，通过将这些系统与本发明相比较，就会让本领域技术人员清楚。

发明概述

可在一种采用正向音调增强和反向音调增强的语音编码系统中找到本发明各个方面。本发明某些实施例中，在完整语音编码系统单一部分内进行正向音调增强和反向音调增强。举例来说，具有语音编码解码电路的语音编码系统中，其中语音编码解码电路包含一编码器和一解码器，在该语音编码解码电路中编码器和解码器两者内进行正向音调增强和反向音调增强。作为替代，本发明其他实施例中仅在语音编码解码电路中解码器内进行正向音调增强和反向音调增强。如特定应用所确定的那样，正向音调增强和反向音调增强按分布式方式进行，至少部分地分别在语音编码解码电路中编码器和解码器每一个内进行。

本发明某些实施例中，用正向音调增强本身来产生反向音调增强。反向音调增强是先前产生的正向音调增强的镜像；反向音调增强是根据该正向音调增强产生的。作为替代，本发明其他实施例中，反向音调增强是独立于正向音调增强产生的，反向音调增强的产生不依赖于先前产生的正向音调增强。

按本发明组成的语音编码系统经适当调整后面向那些采用具有有限或受到制约的带宽利用率的通信介质运作的语音编码系统。可在不背离本发明保护范围和实质的情况下，在本发明内采用任何通信介质。这种通信介质例子包括但不局限于无线通信介质、有线电话通信介质、光纤通信介质以及以太网。

本发明其他方面、优点以及新颖特征，在结合附图考虑时从以下对本发明的详细说明当中变得清楚。

图的简要描述

图1是表示按照本发明构造的一个语音音调增强系统实施例的系统框图。

图2是表示按照本发明构造的一个采用语音音调增强的分布式语音编码解码电路实施例的系统框图。

图3是表示按照本发明构造的采用语音音调增强的分布式语音编码解码电路另一实施例的系统框图。

图4是表示按照本发明构造的采用语音音调增强的集成式语音编码解码电路另一实施例的系统框图。

图5是表示按照本发明语音子帧描述正向及反向预测脉冲进行音调增强的示意图。

图6是表示本发明实施例按照本发明采用正向语音音调增强产生反向语音音调增强的功能框图。

图7是表示本发明实施例按照本发明进行独立于正向语音音调增强的反向语音音调增强的功能框图。

附图的详细说明

图1是表示按照本发明构造的一个语音音调增强系统110实施例100的系统框图。音调增强系统110其中包含音调增强处理电路112、语音编码电路114、正向音调增强电路116、反向音调增强电路118以及语音处理电路19。语音音调增强系统110对未增强的语音数据或激励信号120进行运作并产生音调增强的语音数据130。音调增强的语音数据或激励信号130所包含的语音数据具有相对于语音子帧在正向和反向两者方向上进行的音调预测以及音调增强。语音音调增强系统110在本发明某些实施例中仅对激励信号进行运作，语音音调增强系统110在本发明其他实施例中仅对语音数据进行运作。

本发明某些实施例中，语音音调增强系统110独立运作以便用反向音调增强电路118产生反向音调预测。作为替代，正向音调增强电路116和反向音调增强电路118协同运作产生语音编码系统的总体音调增强。本发明其他实施例中用音调增强处理电路112进行监测正向音调增强电路116和反向音调增强电路118的监控运作。语音处理电路119包括但不局限于那些语音处理领域技术人员所知道的那种语音处理电路，以便对语音数据进行运作和操控。语音编码电路114同样包括但不局限于语音编码领域技术人员所知道的电路。该领域技术人员所知道的这种语音编码其中包括码激励线性预测、代数码激励线性预测以及脉冲类激励。

图2是表示按照本发明构造的一个采用语音音调增强的分布式语音编码解码电路200实施例的系统框图。分布式语音编码解码电路200的语音编码器220进行音调增强编码221。用反向脉冲音调预测电路222和正向脉冲音调预测电路223进行音调增强编码221。如上所述，本发明另一实施例中，音调增强编码221在语音子帧内按正向和反向两者方向产生音调预测和音调增强。分布式语音编码解码电路200的语音编码器220在语音子帧内还对语音信号进行主脉冲编码225，其中包括符号编码226和位置编码227两者。分布式语音编码解码电路200的语音编码器220中还采用语音处理电路229，来辅助用语音处理领域技术人员所知道的方法对语音数据进行运作以及操控的语音处理。另外，本发明某些实施例中，语音处理电路229与反向脉冲音调预测电路222和正向脉冲音调预测电路223协同运作。语音数据经分布式语音编码解码电路200的语音编码器220至少某种程度的处理后，经过一通信链路210发送至分布式语音编码解码电路200的语音解码器230。通信链路210是能够传输话音数据的任何通信介质，包括但不局限于无线通信介质、有线电话通信介质、光纤通信介质以及以太网。在不背离本发明保护范围和实质的情况下通信链路210中可包括能够传输语音数据的任何通信介质。分布式语音编码解码电路200的语音解码器230其中包含语音再生电路232、音质补偿电路234以及语音处理电路236。

本发明某些实施例中，语音处理电路229和语音处理电路236在整个分布式语音编码解码电路200内对语音数据进行协同运作。作为替代，语音处理电路229和语音处理电路236对语音数据独立运作，每个分别在语音编码器220和语音解码器230中起个别的语音处理功能。语音处理电路229和语音处理电路236包括但不局限于那些语音处理领域技术人员所知道的那种语音处理电路，以便对语音数据进行运作以及操控。主脉冲编码电路225同样包括但不局限于那些语音编码领域技术人员所知道的电路。这种主脉冲编码电路225的例子包括那些本领域技术人员所知道的那种电路，如本发明另一实施例所述，其他主脉冲编码方法其中包括码激励线性预测、代数码激励线性预测以及脉冲状激励。

图3是表示本发明采用语音音调增强的分布式语音编码解码电路300另一实施例的系统图。分布式语音编码解码电路300的语音编码器320在语音子帧内对语音信号进行主脉冲编码325，其中包括符号编码326和位置编码327两者。分布式语音编码解码电路300的语音编码器320内还采用语音处理电路329，来辅助用语音处理领域技术人员所知道的方法对语音数据进行运作以及操控的语音处理。语音数据经分布式语音编码解码电路300的语音编码器320至少某种程度的处理后，经过一通信链路310发送至分布式语音编码解码电路300的语音解码器330。通信链路310是能够传输话音数据的任何通信介质，包括但不局限于无线通信介质、有线电话通信介质、光纤通信介质以及以太网。在不背离本发明保护范围和实质的情况下通信链路310中可包括能够传输语音数据的任何通信介质。分布式语音编码解码电路300的语音解码器330进行音调增强编码321。用反向脉冲音调预测电路322和正向脉冲音调预测电路323两者进行音调增强编码321。如上面本发明种种实施例所述，音调增强编码321在语音子帧内按正向和反向两者方向产生音调预测和音调增强。分布式语音编码解码电路300的语音解码器330内还采用语音处理电路336，来辅助用语音处理领域技术人员所知道的方法对语音数据进行运作以及操控的语音处理。另外，语音处理电路339在本发明某些实施例中与反向脉冲音调预测电路322和正向脉冲音调预测电路323协同运作。

本发明某些实施例中，语音处理电路329和语音处理电路336在整个分布式语音编码解码电路300内对语音数据进行协同运作。作为替代，语音处理电路329和语音处理电路336对语音数据独立运作，每个分别在语音编码器320和语音解码器330中起个别的语音处理功能。语音处理电路329和语音处理电路336包括但不局限于那些语音处理领域技术人员所知道的那种语音处理电路，以便对语音数据进行运作以及操控。主脉冲编码电路325同样包括但不局限于那些语音编码领域技术人员所知道的电路。这种主脉冲编码电路325的例子包括那些本领域技术人员所知道的那种电路，如本发明另一实施例所述，其他主脉冲编码方法其中包括码激励线性预测、代数码激励线性预测以及脉冲状激励。

图4是表示本发明采用语音音调增强的集成式语音编码解码电路420另一实施例400的系统图。集成式语音编码解码电路420其中包含经低比特率通信链路410与语音解码器424通信的语音编码器。低比特率通信链路410是能够传输话音数据的任何通信介质，其中包括但不局限于无线通信介质、有线电话通信介质、光纤通信介质以及以太网。在不背离本发明保护范围和实质的情况下低比特率通信链路410可包括能够传输语音数据的任何通信介质。在集成式语音编码解码电路420中进行音调增强编码421。音调增强编码421用其中包括的反向脉冲音调预测电路422和正向脉冲音调预测电路423进行。如上面本发明种种实施例所述，反向脉冲音调预测电路422和正向脉冲音调预测电路423在本发明某些实施例中协同运作，在本发明其他实施例中独立运作。

如实施例400所示，反向脉冲音调预测电路422和正向脉冲音调预测电路423包含在整个集成式语音编码解码电路420内。如果需要，在本发明某些实施例中语音编码器422和语音解码器424其中每一个都包括反向脉冲音调预测电路422和正向脉冲音调预测电路423两者。作为替代，在本发明其他实施例中，语音编码器422或者语音解码器424其中一个仅包括反向脉冲音调预测电路422和正向脉冲音调预测电路423其中一个。根据当前的特定应用，用户可选择将反向脉冲音调预测电路422和正向脉冲音调预测电路423置于语音编码器422和语音解码器424其中之一。在不背离本发明保护范围和实质的情况下，本发明中可设想种种实施例，将各种数量的反向脉冲音调预测电路422和正向脉冲音调预测电路423置于语音编码器422和语音解码器424中。举例来说，本发明某些实施例中，将反向脉冲音调预测电路422的预定部分置于语音编码器422中，而反向脉冲音调预测电路422的其余部分则置于语音解码器424中。同样，本发明某些实施例中，正向脉冲音调预测电路423的预定部分置于语音编码器422中，而正向脉冲音调预测电路423的其余部分则置于语音解码器424中。

图5是表示按照本发明进行的描述正向音调增强和反向音调增强的语音子帧510的编码图。用那些语音处理领域技术人员所知道的方法，其中包括但不局限于码激励线性预测、代数码激励线性预测、合成语音编码分析以及脉冲状激励，在语音子帧510中产生一主脉冲M₀ 520。全部用包括上面所述本发明各种实施例所用方法在内的种种语音处理方法，产生正向预测脉冲M1 530、正向预测脉冲M2 540、正向预测脉冲M3 550，并置于语音子帧510内。如上所述，本发明某些实施例中，用种种处理电路进行正向预测脉冲M₁ 530、正向预测脉冲M₂ 540以及正向预测脉冲M₃ 550的产生。另外，按照本发明还产生反向预测脉冲M_-1560和反向预测脉冲M_-2570。

本发明某些实施例中，采用正向预测脉冲M₁ 530、正向预测脉冲M₂ 540以及正向预测脉冲M₃ 550产生反向预测脉冲M_-1 560和反向预测脉冲M_-2 570。作为替代，本发明其他实施例中，独立于正向预测脉冲M₁ 530、正向预测脉冲M₂ 540以及正向预测脉冲M₃ 550产生反向预测脉冲M_-1 560和反向预测脉冲M_-2 570。一例反向预测脉冲M_-1 560和反向预测脉冲M_-2 570的独立产生是在软件中实现的，其中语音子帧510的时间定标在软件中相反。按同样方式利用主脉冲M₀ 520来产生正向预测脉冲M₁ 530、正向预测脉冲M₂ 540及正向预测脉冲M₃ 550和反向预测脉冲M_-1 560及反向预测脉冲M_-2 570这两者。这就是说，在典型正向方向执行一次处理，并在软件中使语音子帧510反向后再在非典型反向方向执行一次处理，但仍采用相同的数学方法，即相对于语音子帧510仅使数据相反。

图6表示本发明实施例600按照本发明采用正向语音音调增强产生反向语音音调增强的功能框图。框610中对语音信号进行处理。框620中对语音数据主脉冲进行编码。另一替代处理框655中，经通信链路发送语音数据信息。本发明实施例中采用该替代处理框655，其中在经编码的语音数据发送用于语音再生后进行正向音调增强和反向音调增强。框630中进行正向音调增强，而框640中则进行反向音调增强。本发明某些实施例中，框640的反向音调增强是框630中产生的正向音调增强的镜像。其他实施例中，框640的反向音调增强不是框630中产生的正向音调增强的镜像。一替代处理框650中，语音数据信息经过一通信链路发送。本发明实施例中采用该替代处理框650，其中在经编码的语音数据发送用于语音再生前进行正向音调增强和反向音调增强。框660中重建/合成该语音信号。

本发明某些实施例中，框640中进行的反向音调增强仅仅是框650中进行的正向音调增强的复制，即框640的反向音调增强是框630中产生的正向音调增强的镜像。举例来说，框650中进行正向音调增强后，用那些语音处理领域技术人员所知道的任何方法，使所形成的音调增强得到简单复制并在语音子帧内相反来产生框640中进行的反向音调增强，用于合成再生语音信号。

图7表示本发明实施例700按照本发明进行独立于正向语音音调增强的反向语音音调增强的功能框图。框图710中对语音信号进行处理。框720中对语音数据主脉冲进行编码。另一替代处理框755中，经通信链路发送语音数据信息。本发明实施例中采用该替代处理框755，其中在经编码的语音数据发送用于语音再生后进行正向音调增强和反向音调增强。框730中进行正向音调增强，而框740中则进行反向音调增强。语音数据反向后进行框740的反向音调增强；独立于框730中进行的正向音调增强进行框740的反向音调增强。该特定实施例与实施例600所示不同之处在于，语音数据相反，而且产生框740的反向音调增强就象正在处理一全新的语音数据集。而实施例600中，利用的是所形成的音调增强本身，只是按相反方向延伸。实施例700的某些实施例中，其就象对每一子帧处理2个语音数据集，在框730中处理一个数据集以便按正向方向产生音调预测，在框740中处理一个数据集以便按反向方向产生音调预测，但它们均对相同的语音数据子帧进行运作。一替代处理框750中，语音数据信息经过一通信链路发送。本发明实施例中采用该替代处理框650，其中在经编码的语音数据发送用于语音再生前进行框730的正向音调增强以及框740的反向音调增强。框760中重建/合成该语音信号。

从上面对本发明和相关附图的详细说明来看，其他修改变动对本领域技术人员来说将变得很清楚。还应清楚，在不背离本发明实质和保护范围的情况下可进行这类其他的修改变动。

Claims

1.一种语音编码解码电路，对语音数据进行音调增强，其特征在于，该语音编码解码电路包括：

一编码器；

一通信上与编码器连接的通信链路；

一通信上经过通信链路与编码器连接的解码器；

一语音编码解码电路内包含的正向音调增强电路，该正向音调增强电路改善用于再生的语音数据的音质；以及

一语音编码解码电路内包含的反向音调增强电路，该反向音调增强电路改善用于再生的语音数据的音质。

2.如权利要求1所述的语音编码解码电路，其特征在于，反向音调增强电路包含在语音编码解码电路的解码器内。

3.如权利要求1所述的语音编码解码电路，其特征在于，反向音调增强电路分布于语音编码解码电路的编码器和解码器中。

4.如权利要求1所述的语音编码解码电路，其特征在于，正向音调增强电路和反向音调增强电路协同运作来改善用于再生的语音数据的音质。

5.如权利要求1所述的语音编码解码电路，其特征在于，正向音调增强电路和反向音调增强电路独立运作来改善用于再生的语音数据的音质。

6.如权利要求1所述的语音编码解码电路，其特征在于，反向音调增强电路对语音子帧进行运作；以及

反向音调增强电路将至少一个反向预测脉冲置于语音子帧内。

7.一种对语音数据进行运作的语音音调增强系统，其特征在于，该语音音调增强系统包括：

一反向音调增强电路，改善用于再生的语音数据的音质；以及

一通信上与反向音调增强电路连接的语音处理电路，该语音处理电路对语音数据进行操控。

8.如权利要求7所述的语音音调增强系统，其特征在于，进一步包括一通信上与反向音调增强电路连接的正向音调增强电路，该正向音调增强电路改善用于再生的语音数据的音质。

9.如权利要求8所述的语音音调增强系统，其特征在于，正向音调增强电路和反向音调增强电路协同运作来改善用于再生的语音数据的音质。

10.如权利要求8所述的语音音调增强系统，其特征在于，正向音调增强电路和反向音调增强电路独立运作来改善用于再生的语音数据的音质。

11.如权利要求7所述的语音音调增强系统，其特征在于，进一步包括一语音编码解码电路，该语音编码解码电路包括一编码器和一解码器；以及

其中反向音调增强电路包含在编码器和解码器其中至少一个内。

12.如权利要求7所述的语音音调增强系统，其特征在于，进一步包括一语音编码解码电路，该语音编码解码电路包括一编码器和一解码器；以及

其中反向音调增强电路分布于编码器和解码器之间。

13.如权利要求7所述的语音音调增强系统，其特征在于，进一步包括一语音编码解码电路，该语音编码解码电路包括一编码器、一解码器、以及一通信链路，该通信链路在通信上与编码器和解码器连接；

其中反向音调增强电路分布于编码器和解码器中；

语音数据包括语音数据第一部分和语音数据第二部分；

在编码器中用反向音调增强电路改善语音数据第一部分的音质；

语音数据第一部分和语音数据第二部分经过通信链路从编码器发送至解码器；以及

在解码器中用反向音调增强电路改善语音数据第二部分的音质。

14.如权利要求7所述的语音音调增强系统，其特征在于，语音音调增强系统用经过码激励的线性预测。

15.如权利要求7所述的语音音调增强系统，其特征在于，反向音调增强电路对语音子帧进行运作；以及

16.一种对语音数据和激励信号其中至少一个进行语音音调增强的方法，其特征在于，该方法包括：

对语音数据和激励信号其中至少一个进行正向音调增强；以及

对语音数据和激励信号其中至少一个进行反向音调增强。

17.如权利要求16所述的方法，其特征在于，使对语音数据和激励信号其中至少一个进行正向音调增强、和对语音数据和激励信号其中至少一个进行反向音调增强独立进行，以改善用于再生的语音数据的音质。

18.如权利要求16所述的方法，其特征在于，使对语音数据和激励信号其中至少一个进行正向音调增强、和对语音数据和激励信号其中至少一个进行反向音调增强协同进行，以改善用于再生的语音数据的音质。

19.如权利要求16所述的方法，其特征在于，使对语音数据和激励信号其中至少一个进行正向音调增强、和对语音数据和激励信号其中至少一个进行反向音调增强均用一语音编码解码电路来进行。

20.如权利要求16所述的方法，其特征在于，进一步包括进行码激励线性预测。