CN101388212B

CN101388212B - 基于噪声整形的语音编解码方法、编解码装置

Info

Publication number: CN101388212B
Application number: CN2007101539565A
Authority: CN
Inventors: 苗磊; 齐峰岩; 胡晨; 许剑峰; 张清; 许丽净; 杜正中; 李伟; 杨毅
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2007-09-15
Filing date: 2007-09-15
Publication date: 2011-05-11
Anticipated expiration: 2027-09-15
Also published as: CN101388212A

Abstract

本发明实施例提供一种基于噪声整形的语音编码方法，包括：对核心编码语音信号进行编码，得到核心码流；所述核心编码语音信号是由噪声整形滤波器反馈的噪声修正信号对原始语音信号修正后得到的语音信号；对所述核心编码语音信号与本地重建语音信号之间的残差信号进行编码，得到第一增强码流；对噪声整形滤波器的状态信息进行编码，得到第二增强码流；将所述第一增强码流、所述第二增强码流和所述核心码流，作为编码结果输出。本发明实施例还提供相应的编解码装置及基于噪声整形的语音解码方法。本发明实施例的技术方案可有效提高编码效率，进而，在解码端能够解码出语音质量较高的解码语音信号。

Description

基于噪声整形的语音编解码方法、编解码装置

技术领域

本发明涉及语音编解码技术领域，尤其涉及一种基于噪声整形的语音编解码方法、编解码装置。

背景技术

用户对高质量语音服务需求的不断提升，相应地促进了宽带语音编解码技术的发展。目前，大多数宽带语音编解码技术采用与窄带语音编解码技术相兼容的做法，在窄带语音编码码流的基础上增加宽带语音编码码流，相应地，在解码端，通过解码窄带语音编码码流与宽带语音编码码流，得到较清晰的语音。

由于传统的窄带语音编解码过程通常会产生可感知的噪声，为满足高质量语音服务需求，会对窄带语音编码作相应的消除噪声处理，如在不增加比特开销的情况下，进行噪声整形；或，增加比特开销，对原始窄带语音信号和本地解码窄带语音信号的残差信号进行量化，且不使用噪声整形；或，在增加比特开销，对原始窄带语音信号和本地解码窄带语音信号的差信号进行量化的同时，进行噪声整形。

基于噪声整形能够在不增加比特开销的情况下，达到一定的消除噪声的效果，因此，现有技术中常采用噪声整形来对窄带语音编码作消除噪声的处理。噪声整形去噪的基本原理包括：根据窄带语音编解码器的编解码特性，对窄带语音编解码过程中所产生的噪声进行如低通或高通等的滤波处理，并将滤波结果反馈到编码输入端，从而对原始语音信号进行修正。

参见图1，图1是现有技术一中基于噪声整形的窄带编码结构示意图。图1所示的现有技术一的编码方案的编码过程简要说明如下：

原始语音信号与噪声整形滤波器产生的反馈信号相加后所产生的语音信号被输入核心(Core)编码器；其中，初始状态下，噪声整形滤波器产生的反馈信号为零；

核心编码器输出的码流被从编码端输出；核心编码器输出的码流还被输入核心解码器，由核心解码器重建语音信号；

将核心解码器得到的解码语音信号与原始语音信号相减，得到残差信号；

残差信号被输入残差增强编码器；残差增强编码器对残差信号进行编码后，将与残差信号对应的增强码流从编码端输出；

残差信号还被输入噪声整形滤波器；噪声整形滤波器对残差信号进行滤波处理后，得到反馈信号，该反馈信号被用作对下一个输入的原始语音信号进行去噪处理。

现有技术一的编码方案一定程度上可提高最终解码得到的语音信号的语音质量，但由于该编码方案较简单，采用残差信号的编码产生的增强码流，对核心码流作了补充，因此，语音质量的提升不明显，相应地，编码效率不高。

参见图2，图2是现有技术二中窄带语音编码结构示意图。与图1所对应的现有技术一相比，现有技术二中，采用对原始语音信号进行线性预测分析，得到用于噪声整形的滤波器的系数。经过线性预测(LP)分析得到的噪声整形滤波器能够较好地抑制编解码过程中产生的噪声，从而可减少核心编码器编码过程中所产生的可感知的噪声。但由于该方案需要对原始语音信号做线性预测分析，因此实现时所要进行的运算复杂度较高，并且，基于线性预测分析得出的噪声整形滤波器，虽然具有较高的编码效率，但在解码端，难以对每一帧语音信号所对应的码流进行独立解码，其帧间相关性较强，因此，导致解码结果不具有很好的健壮性(Robust)，即解码对丢包或语音部分混合(Partial Mixing)时语音信号不连续等情况较敏感，影响解码得到的语音信号的语音质量。

可见，现有基于噪声整形的语音编解码方案尚存在可改进之处。

发明内容

本发明实施例提供一种基于噪声整形的语音编码方法，提高编码效率，减少帧间相关性。

一种基于噪声整形的语音编码方法，包括：

对核心编码语音信号进行编码，得到核心码流；所述核心编码语音信号是由噪声整形滤波器反馈的噪声修正信号对原始语音信号修正后得到的语音信号；

对所述核心编码语音信号与本地重建语音信号之间的残差信号进行编码，得到第一增强码流；

对噪声整形滤波器的状态信息进行编码，得到第二增强码流；

将所述第一增强码流、所述第二增强码流和所述核心码流，作为编码结果输出。

本发明实施例提供一种编码装置，包括：核心编码语音信号生成单元、核心编码单元、语音信号重建单元、残差信号生成单元、残差信号编码单元、状态信息编码单元、噪声整形滤波器和输出单元；其中，

噪声整形滤波器，用于产生对原始语音信号进行噪声修正的噪声修正信号；

核心编码语音信号生成单元，用于将噪声整形滤波器产生的所述噪声修正信号与原始语音信号进行叠加处理，得到核心编码语音信号；

核心编码单元，用于对核心编码语音信号进行编码，得到核心码流；所述核心编码语音信号是由所述噪声修正信号对原始语音信号修正后得到的语音信号；

语音信号重建单元，用于在本地重建语音信号；

残差信号生成单元，用于生成所述核心编码语音信号与语音信号重建单元得出的所述本地重建语音信号之间的残差信号；

残差信号编码单元，用于对所述残差信号进行编码，得到第一增强码流；

状态信息编码单元，用于对噪声整形滤波器的状态信息进行编码，得到第二增强码流；

输出单元，用于将所述核心编码单元得到的所述核心码流、所述残差信号编码单元得到的所述第一增强码流，和所述状态信息编码单元得到的所述第二增强码流，作为编码结果输出。

本发明实施例提供一种基于噪声整形的语音解码方法，包括：

接收编码端发送过来的编码结果，所述编码结果包括：所述编码端对核心编码语音信号进行编码，得到的核心码流；对所述核心编码语音信号与本地重建语音信号之间的残差信号进行编码，得到的第一增强码流；对噪声整形滤波器的状态信息进行编码，得到的第二增强码流；所述核心编码语音信号是由噪声整形滤波器反馈的噪声修正信号对原始语音信号修正后得到的语音信号；

对应于编码端对所述核心编码语音信号的编码，解码所述核心码流，得到与所述核心编码语音信号相对应的解码核心编码语音信号；

对应于编码端对所述残差信号的编码，解码所述第一增强码流，得到与所述残差信号相对应的解码残差信号；

对应于编码端对所述状态信息的编码，解码所述第二增强码流，得到与所述状态信息相对应的解码状态信息；且根据所述解码状态信息，得出与所述噪声修正信号相对应的解码噪声修正信号；

将所述解码核心编码语音信号、所述解码残差信号和所述解码噪声修正信号相加，得到解码语音信号。

本发明实施例还提供一种解码装置，包括：接收单元、核心码流解码单元、第一增强码流解码单元、第二增强码流解码单元和合成单元；其中，

接收单元，用于接收编码装置发送过来的编码结果，所述编码结果包括：所述编码端对核心编码语音信号进行编码，得到的核心码流；对所述核心编码语音信号与本地重建语音信号之间的残差信号进行编码，得到的第一增强码流；对噪声整形滤波器的状态信息进行编码，得到的第二增强码流；所述核心编码语音信号是由噪声整形滤波器反馈的噪声修正信号对原始语音信号修正后得到的语音信号；

核心码流解码单元，用于对应于编码端对所述核心编码语音信号的编码，解码所述核心码流，得到与所述核心编码语音信号相对应的解码核心编码语音信号；

第一增强码流解码单元，用于对应于编码端对所述残差信号的编码，解码所述第一增强码流，得到与所述残差信号相对应的解码残差信号；

第二增强码流解码单元，用于对应于编码端对所述状态信息的编码，解码所述第二增强码流，得到与所述状态信息相对应的解码状态信息；且根据所述解码状态信息，得出与所述噪声修正信号相对应的解码噪声修正信号；

合成单元，用于将所述核心码流解码单元得到的所述解码核心编码语音信号、所述第一增强码流解码单元得到的所述解码残差信号，和所述第二增强码流解码单元得到的所述解码噪声修正信号进行合成，得到解码语音信号。

本发明实施例提供的上述技术方案，从产生原始语音信号与本地重建语音信号之差的根源出发，由于该根源不仅来自于对核心编码语音信号的核心编码所产生的噪声，还来自于噪声整形滤波器对核心编码的噪声整形所产生的噪声，即噪声整形滤波器的当前状态信息，因此，本发明实施例在编码端不仅对残差信号进行编码，还对噪声整形滤波器的当前状态信息进行编码，从而在编码端就能够尽量减少编码过程所产生的噪声，因此，能够有效提高编码效率，进而，在解码端能够解码出语音质量较高的解码语音信号。并且，本发明实施例在编码端就将噪声整形滤波器的噪声整形带来的噪声考虑进来，即在编码端对状态信息进行编码。相应地，解码端在解码时通过解码第二增强码流，得出相应的噪声修正信号，利用噪声修正信号去除噪声整形效应，而不需要利用帧间预测信息进行解码，可有效降低解码端解码的帧间相关性，提高对丢包、Partialmixing等事件的健壮性或不敏感性。

附图说明

图1是现有技术一中基于噪声整形的窄带编码结构示意图；

图2是现有技术二中窄带语音编码结构示意图；

图3是本发明实施例中语音编码框架示意图；

图4是本发明实施例中基于噪声整形的语音编码方法流程图；

图5是本发明实施例中编码装置的结构示意图；

图6是本发明实施例一中语音编码流程图；

图7是本发明实施例二中语音编码流程图；

图8是本发明实施例中另一中语音编码框架示意图；

图9是本发明实施例中基于噪声整形的语音解码方法的流程图；

图10是本发明实施例中基于噪声整形的语音解码框架示意图；

图11是本发明实施例中解码装置的结构示意图；

图12是本发明实施例中语音解码流程图；

图13是利用本发明实施例的语音编解码技术方案与现有技术的语音编解码方案对语音信号进行编码的得到语音信号频谱对比示意图。

具体实施方式

下面将结合附图对本发明实施例提供的技术方案作详细说明。

参见图3，图3是本发明实施例中语音编码框架示意图。其中，当前一帧原始语音信号经过噪声整形滤波器反馈的反馈信号修正后，被输入核心编码器进行编码。本发明实施例中，可称核心编码器的编码对象为核心编码语音信号，可称该反馈信号为噪声修正信号。核心编码器对核心编码语音信号编码后，得到核心码流，该核心码流被从编码端输出。核心码流还被输入核心解码器；由核心解码器对核心码流解码，得到本地重建语音信号。算出本地重建语音信号与核心编码语音信号之间的残差信号。进一步利用残差编码器对残差信号进行编码，得到本发明实施例中的第一增强码流。

实际应用中，语音编码是对原始语音信号的采样得到的样点值进行编码，从时序角度讲，对原始语音信号的编码实际是按时序，依次对原始语音信号中每个样点值编码。为方便实现编码算法，常以帧为单位，将语音信号的样点划分为按时序排列的多个帧，每一帧可包含数量相同的样点值。语音编码即按帧的时序，依次对每一帧语音信号中的每个样点值进行编码。基于本发明实施例采用噪声整形技术进行语音编码，每一帧残差信号的每个样点值会被送入噪声整形滤波器由噪声整形滤波器进行噪声整形或滤波，从噪声整形滤波器输出的信号即为组成噪声修正信号的一个样点值。当前得到的噪声修正信号的样点值将用于修正原始语音信号的下一个样点值；相应地，用作对原始语音信号的当前样点值作修正的噪声修正信号的样点值，实际是对残差信号的上一个样点值经过噪声整形滤波器滤波后，得到的样点值。具体来讲，对当前一帧原始语音信号的当前样点值进行修正时，如果得到的当前一帧残差信号的当前样点值为该帧的初始样点值，则将上一帧残差信号的最后一个样点值经过滤波处理后，得到的上一帧噪声修正信号的最后一个样点值用于修正；如果得到的当前一帧残差信号的当前样点值不是该帧的初始样点值，则将当前一帧残差信号的上一个样点值经过滤波处理得到的样点值，用于修正。

噪声整形是相对于核心编码器对核心编码语音信号的编码来讲的。由于在核心编解码器在当前编解码过程中会产生噪声，该噪声可体现于上述残差信号中，因此，基于噪声整形技术的语音编码技术，并不是直接用核心编码器对当前一帧原始语音信号进行编码，而是利用残差信号的上一个样点值经过噪声整形滤波器滤波后，得到的样点值，也即噪声修正信号的样点值，对原始语音信号的当前样点值进行修正，进而对修正后得到的核心编码语音信号的样点值进行编码。由于原始语音信号通常是连续的信号，因而，利用噪声整形滤波器对残差信号的上一个样点值滤波后，得到的噪声修正信号样点值基本能够体现基本语音特性。因此，可对原始语音信号的当前样点值作以上修正。进一步，修正的作用在于，提前将核心编解码器在编解码过程中可能产生的噪声叠加到原始语音信号上，从而基于核心编码器的编码会产生该噪声的编码特性，尽量减少该噪声，如核心编码器在编码过程中会丢失一些信息，丢失的这些信息即为噪声，则若在利用核心编码器对核心编码语音信号编码之前，将丢失的这些信息先加入到核心编码语音信号中，从而，核心编码器对加入了易丢失的这些信息的核心编码语音信号编码过程中，可减少丢失的信息。由于低频语音信号能够较好地体现语音特性，因此，噪声整形滤波器通常使用低通滤波器，以减少高频语音信号带来的噪声。

本申请发明者进一步研究发现，原始语音信号与本地重建语音信号之间的差异主要来源于两处，一处是核心编解码器在编解码过程中产生的噪声，本发明实施例中，用上述残差信号来体现该噪声；另一处是噪声整形带来的噪声。因此，本发明实施例中，为减少噪声对编码效果的影响，即为提高编码效率，一方面对本发明实施例给出的图3所示残差信号进行编码；另一方面，噪声整形产生的噪声进行编码。因此，如果只将图3所示核心码流与第一增强码流作为编码结果，传送给解码端，则编码端的编码实际是尽量减少了由核心编解码器在编解码过程中产生的噪声，而并没有处理因噪声整形带来的噪声，编码效率相对较低。

本发明实施例提供的基于噪声整形的编解码方案，进一步对因噪声整形带来的噪声进行了相应地处理，主要做法就是提取能够体现噪声整形滤波器状态特性的状态信息，对该状态信息进行编码，从而将噪声整形带来的噪声考虑进去，尽量减少编码端在编码过程中所产生的一切噪声。如图3所示，本发明实施例中，在编码端，会进一步利用噪声整形状态编码器对从噪声整形滤波器提取的当前状态信息进行编码，得到第二增强码流。之后，将核心码流、第一增强码流与第二增强码流作为编码结果从编码端输出。所谓能够体现噪声整形滤波器状态特性的状态信息，实际体现造成噪声整形所带来的噪声的原因，该状态信息可分为输入状态值和输出状态值，其中，输入状态值由输入滤波器的残差信号来体现，相对于当前待编码的原始语音信号的当前样点值而言，该输入状态值不是由将得到的残差信号的当前样点值体现，而是由残差信号中已被输入噪声整形滤波器经过噪声整形的样点值体现；输出状态值与输入状态值相对应，即输出状态值由与体现输入状态值的残差信号的样点值相对应的噪声修正信号的样点值体现。有关本发明实施例提出的状态信息，将在后续实施例中作详细说明。

下面对本发明实施例提供的语音编码技术方案作详细说明。

参见图4，图4是本发明实施例中基于噪声整形的语音编码方法流程图。该流程可包括以下步骤：

步骤401、在编码端，对核心编码语音信号进行编码，得到核心码流；所述核心编码语音信号是由噪声整形滤波器反馈的噪声修正信号对原始语音信号修正后得到的语音信号。

步骤402、在编码端，对核心编码语音信号与本地重建语音信号之间的残差信号进行编码，得到第一增强码流。

步骤403、在编码端，对噪声整形滤波器的状态信息进行编码，得到第二增强码流。

步骤404、在编码端，将所述第一增强码流、所述第二增强码流和所述核心码流，作为编码结果输出。

对应于图4所示的方法流程，本发明实施例还提供一种编码装置。参见图5，图5是该编码装置的结构示意图。该编码装置可包括：核心编码单元、语音信号重建单元、残差信号编码单元、状态信息编码单元、噪声整形滤波器和输出单元；其中，

核心编码单元，用于对核心编码语音信号进行编码，得到核心码流；所述核心编码语音信号是由所述噪声修正信号对原始语音信号修正后得到的语音信号；该单元可以是图3所示核心编码器；

语音信号重建单元，用于在本地重建语音信号；该单元可以是图3所示核心解码器；

残差信号编码单元，用于对核心编码语音信号与语音信号重建单元得出的本地重建语音信号之间的残差信号进行编码，得到第一增强码流；该单元可以是图3所示残差编码器；

状态信息编码单元，用于对噪声整形滤波器的状态信息进行编码，得到第二增强码流；该单元可以是图3所示噪声整形状态编码器；

其中，状态信息编码单元可包括：状态信息获取单元和编码单元；其中，

状态信息获取单元，用于获取所述状态信息；

编码单元，用于对状态信息获取单元获取到的所述状态信息进行编码。

下面结合具体的实施例对本发明实施例提供的上述语音编码方案作详细说明。

实施例一：

本实施例一中，设原始语音信号一帧的样点数是N个，标记当前一帧原始语音信号为s(i)，当前用于噪声整形的噪声修正信号是n_out(i-1)，其中，i＝0，1，...，N-1，N为正整数。

参见图6，图6是本发明实施例一中语音编码流程图。该流程可包括以下步骤：

步骤601、利用噪声修正信号对当前一帧原始语音信号进行修正，得到当前核心编码语音信号。

该步骤601中，标记当前核心编码语音信号为s′(i)，则有：

s′(i)＝s(i)+n_out(i-1)。 (6.1)

步骤602、利用核心编码器对当前核心编码语音信号进行编码，得到核心码流；利用核心解码器对核心码流进行解码，得到本地重建语音信号。

该步骤602中，标记本地重建语音信号为

步骤603、计算核心编码语音信号与本地重建语音信号之间的残差，得到当前残差信号。

该步骤603中，标记当前一帧残差信号为e′(i)，则有：

e^{'} (i) = s^{'} (i) - {\hat{s}}^{'} (i) . - - - (6.2)

步骤604、利用残差编码器对当前残差信号进行量化，生成量化比特流，即第一增强码流。

步骤605、将当前一帧残差信号e′(i)经噪声整形滤波器滤波，得到用于对原始语音信号的下一个样点值作修正的噪声修正信号的样点值，将该噪声修正信号的样点值反馈到原始语音信号的输入端。

该步骤605中，标记用于对原始语音信号的下一个样点值作修正的噪声修正信号的样点值为n_out(i)。

本发明实施例中，设采用零极点滤波器作为噪声整形滤波器，零极点滤波器的表达式如下：

H (z) = \frac{B (z)}{A (z)} = \frac{Σ_{r = 0}^{P} b_{r} z^{- r}}{1 + Σ_{k = 1}^{Q} a_{k} z^{- k}}, - - - (6.3)

其中，与e′(i)相对应的滤波器的系数为b，P为系数b的阶数，第r阶系数为b_r，r＝0，...，P，P是非负整数；且与n_out(i-1)相对应的所述滤波器的系数为a，Q为系数a的阶数，第k阶系数为a_k，k＝1，...，Q；Q为正整数；

由上式(6.3)，可得到步骤605中的n_out(i)与步骤601中的n_out(i-1)的表达式分别如下：

n_{out} (i) = Σ_{r = 0}^{P} b_{r} e^{'} (i - r) - Σ_{k = 1}^{Q} a_{k} n_{out} (i - k), i = 0,1, . . ., N - 1; - - - (6.4)

n_{out} (i - 1) = Σ_{r = 0}^{P} b_{r} e^{'} (i - 1 - r) - Σ_{k = 1}^{Q} a_{k} n_{out} (i - 1 - k), i = 0,1, . . ., N - 1; - - - (6.5)

实际应用中，噪声整形滤波器可以每帧采用不同的滤波器系数，如每帧滤波器系数可由对语音信号进行LP分析获得。

步骤606、获取噪声整形滤波器的当前状态信息，包括输入状态值与输出状态值，对当前状态信息进行编码，得到第二增强码流。

由于当前帧与上一帧是相对而言的，因此，实际应用中，可将所有被处理的帧作为当前帧，提取当前帧的第一个样点值对应的初始状态信息，只对该初始状态信息进行编码；相应地，在解码端，可基于该初始状态信息对应的码流，结合上述式(6.5)，算出n_out(i-1)，因此，只对初始状态信息进行编码，可有效减少比特开销。

则步骤606中取i＝0，得到初始状态信息中的输入状态值为：

e′(-r-1)，r＝0，...，P； (6.6)

若系数b的阶数P＝0，则取输入状态值为e′(-1)，表示可取输入状态值为上一帧残差信号中的最后一个样点值；若P≠0，则可取输入状态值为上一帧残差信号中的多个样点值，如P＝1，则可取输入状态值为上一帧残差信号中的最后一个样点值和倒数第二个样点值；也即，将上一帧残差信号中最后P+1个样点值作为初始状态信息的输入状态值。

得到初始状态信息中的输出状态值为：

n_out(-k-1)，k＝1，...，Q。 (6.7)

若系数a的阶数Q＝1，则取输出状态值为n_out(-1)，表示可取输出状态值为上一帧噪声修正信号中的最后一个样点值；若Q≠0，则可取输出状态值为上一帧噪声修正信号中的多个样点值，如Q＝2，则可取输出状态值为上一帧噪声修正信号中的最后一个样点值和倒数第二个样点值；也即，将上一帧噪声修正信号中的最后Q个样点值作为所述状态信息的输出状态值。

噪声整形状态编码器对状态信息的编码可以是，分别对e′(-r-1)与n_out(-k-1)；或可以是，对e′(-r-1)与b_r的乘积进行编码，对n_out(-k-1)与a_k的乘积进行编码。

实际应用中，如何可供使用的比特数足够多，则从时序角度将在处理每一帧样点值时，可基于初始状态信息，提取该帧中多个当前样点处噪声整形滤波器的状态信息，对提取到的每个状态信息进行编码。

结合图3可得：

s^{'} (i) = s (i) + n_{out} (i - 1) = {\hat{s}}^{'} (i) + e^{'} (i);

进而可得：

s (i) = {\hat{s}}^{'} (i) + e^{'} (i) + (- n_{out} (i - 1))

= {\hat{s}}^{'} (i) + e^{'} (i) + (Σ_{k = 1}^{Q} a_{k} n_{out} (i - 1 - k) - Σ_{r = 0}^{P} b_{r} e^{'} (i - 1 - r)), i = 0,1 . . ., N - 1 .

另外，由于在编码端就对状态信息进行编码，通过解码端去噪声整形来减少残差信号的编码数据，因而在实现高编码效率的同时，避免了解码的帧间相关性，增强了对丢包，partial mixing等不连续语音信号处理的健壮性。

步骤607、将上述编码过程中得到的核心码流、第一增强码流和第二增强码流作为编码结果输出，该编码端的编码流程可结束。

实施例二：

在上述实施例一中，若步骤605中，噪声整形滤波器的系数以及系数的阶数具有以下特点，即P+1＝Q，且b_r＝a_r+1。则对当前状态信息的编码可进一步简化。

参见图7，图7是本发明实施例二中语音编码流程图。该流程可包括以下步骤：

步骤701可与上述关于步骤601的描述类似。

步骤702可与上述关于步骤602的描述类似。

步骤703可与上述关于步骤603的描述类似。

步骤704可与上述关于步骤604的描述类似。

步骤705可与上述关于步骤604的描述类似，并且，如之前提及的，该步骤705中，设P+1＝Q，且b_r＝a_r+1。

步骤706、提取噪声整形滤波器的初始状态信息，包括输入状态值与输出状态值，对状态信息进行编码，得到第二增强码流。

该步骤706中，由于P+1＝Q，且b_r＝a_r+1，则通过计算可得：

e^{'} (- r - 1) - n_{out} (- r - 2) = s (- r - 1) - {\hat{s}}^{'} (- r - 1); - - - (6.8)

因此，实际应用中，可直接取上一帧原始语音信号的所有样点值中最后P+1个样点值，以及取上一帧核心编码语音信号的所有样点值中最后P+1个样点值。计算

s (- r - 1) - {\hat{s}}^{'} (- r - 1)

的差值，共P+1个差值，对每个差值进行编码。即，对初始状态信息的编码可等价于对原始语音信号与本地重建语音信号之差的编码。因此，本实施例二中，只需对原始语音信号与本地重建语音信号之差进行编码，从而可进一步提高编码效率，进而提高语音质量。

参见图8，图8是本发明实施例中另一中语音编码框架示意图。图8所示编码框架与图3所示编码框架的不同之处就在于，图3中，噪声整形状态编码器对噪声整形滤波器的输入状态值与输出状态值进行编码；而图8所示编码框架中，噪声整形状态编码器对原始语音信号与本地重建语音信号之差进行编码。

步骤707可与上述关于步骤607的描述类似。

另外，上述实施例一与实施例二中，对状态信息的量化可以是标量量化或矢量量化，并可进一步采用熵编码技术，压缩量化后的状态信息，减少比特开销。

以上对本发明实施例提供的基于噪声整形的语音编码方案作了详细说明。下面对本发明实施例提供的对应于上述语音编码方案的语音解码方案作详细说明。

本发明实施例提供一种基于噪声整形的语音解码方法。参见图9，图9是该方法的流程图。参见图10，图10是本发明实施例中基于噪声整形的语音解码框架示意图。图9所示流程可包括以下步骤：

步骤901、解码端接收编码端发送过来的编码结果。

编码结果可包括：编码端对核心编码语音信号进行编码，得到的核心码流；对核心编码语音信号与本地重建语音信号之间的残差信号进行编码，得到的第一增强码流；对噪声整形滤波器的当前状态信息进行编码，得到的第二增强码流。

其中，核心编码语音信号是由噪声整形滤波器反馈的噪声修正信号对原始语音信号修正后得到的语音信号。

步骤902、解码端对应于编码端对所述核心编码语音信号的编码，解码所述核心码流，得到与所述核心编码语音信号相对应的解码核心编码语音信号。

对应地，图10中核心解码器对核心码流进行解码。

步骤903、解码端对应于编码端对所述残差信号的编码，解码所述第一增强码流，得到与所述残差信号相对应的解码残差信号。

对应地，图10中残差解码器对第一增强码流进行解码。

步骤904、解码端对应于编码端对所述状态信息的编码，解码所述第二增强码流，得到与所述状态信息相对应的解码状态信息；且根据所述解码状态信息，得出与所述噪声修正信号相对应的解码噪声修正信号。

对应地，图10中状态信息解码器对第二增强码流进行解码。

步骤905、解码端将所述解码核心编码语音信号、所述解码残差信号和所述解码噪声修正信号相加，得到解码语音信号。

对应地，图10中，从核心解码器输出的核心编码语音信号、从残差解码器输出的解码残差信号，以及从状态信息解码器输出的解码状态信息，被叠加后得到最终的解码语音信号。

对应于上述语音解码方法，本发明实施例还提供一种解码装置。参见图11，图11是该解码装置的结构示意图。该解码装置可包括：接收单元、核心码流解码单元、第一增强码流解码单元、第二增强码流解码单元和合成单元；其中，

接收单元，用于接收编码装置发送过来的编码结果。该编码结果包含核心码流、第一增强码流和第二增强码流。

核心码流解码单元，用于对应于编码端对所述核心编码语音信号的编码，解码所述核心码流，得到解码核心编码语音信号；该单元可以是图10所示的核心解码器；

第一增强码流解码单元，用于对应于编码端对所述残差信号的编码，解码所述第一增强码流，得到解码残差信号；该单元可以是图10所示的残差解码器；

第二增强码流解码单元，用于对应于编码端对所述状态信息的编码，解码所述第二增强码流，得到解码状态信息；该单元可以是图10所示的状态信息解码器；

合成单元，用于将所述核心码流解码单元得到的解码核心编码语音信号、所述第一增强码流解码单元得到的解码残差信号，和第二增强码流解码单元得到的解码状态信息相加，得到解码语音信号。

下面结合具体的实施例对本发明实施例中的语音解码方案作详细说明。

参见图12，图12是本发明实施例中语音解码流程图，该流程可包括以下步骤：

步骤1201、对核心码流进行解码得到解码核心编码语音信号。

该步骤1201中，对核心码流的解码过程，是编码端对核心编码语音信号编码过程的逆过程。标记解码核心编码语音信号为

{\hat{s}}^{''} (i), i = 0,1, . . ., N - 1 .

步骤1202、对第一增强码流进行解码，得到解码残差信号。

该步骤中，对第一增强码流的解码过程，是编码端对残差信号编码过程的逆过程。标记解码残差信号为

步骤1203、对第二增强码流进行解码，反量化得到解码所需的噪声整形的解码状态信息。

该步骤中，若编码端P+1≠Q，则该处解码可得到解码输入状态值

{\hat{e}}^{''} (- r - 1), r = 0 . . . P;

以及解码输出状态值

{\hat{n}}^{''}_{out} (- k - 1), k = 1 . . . Q;

若编码端P+1＝Q，且b_r＝a_r+1，则解码状态信息为

[S (- r - 1) - {\hat{s}}^{''} (- r - 1)] .^;

其中，S标记最终可得到的解码语音信号。

步骤1204、利用解码状态信息，计算解码噪声修正信号。

该步骤中，用

标记解码噪声修正信号，若P+1≠Q，则有：

{\hat{n}}^{'}_{out} (i - 1) = Σ_{r = 0}^{P} b_{r} {\hat{e}}^{''} (i - 1 - r) - Σ_{k = 1}^{Q} a_{k} {\hat{n}}^{''}_{out} (i - 1 - k);

若P+1＝Q，且b_r＝a_r+1，则有：

{\hat{n}}^{''}_{out} (i - 1) = Σ_{r = 0}^{P} b_{r} [S (- r - 1) - {\hat{s}}^{''} (- r - 1)] .^.

步骤1205、将解码核心编码语音信号、解码残差信号，和解码噪声修正信号叠加，得到解码语音信号，该流程可结束。

上述步骤1205中，若P+1≠Q，则有：

S (i) = {\hat{s}}^{''} (i) + {\hat{e}}^{''} (i) + (- {\hat{n}}^{''}_{out} (i - 1))

= {\hat{s}}^{''} (i) + {\hat{e}}^{''} (i) + (Σ_{k = 1}^{Q} a_{k} {\hat{n}}^{''}_{out} (i - 1 - k) - Σ_{r = 0}^{P} b_{r} {\hat{e}}^{''} (i - 1 - r)),

若P+1＝Q，且b_r＝a_r+1，则有：

S (i) = {\hat{s}}^{''} (i) + {\hat{e}}^{''} (i) + (- {\hat{n}}^{''}_{out} (i - 1))

= {\hat{s}}^{''} + {\hat{e}}^{''} (i) + (- Σ_{r = 0}^{P} b_{r} [S (- r - 1) - {\hat{s}}^{''} (- r - 1)] .^) .

在解码端由于用解码第二增强码流得到的噪声修正信号，去除噪声整形效应，从而可获得较高质量的语音信号。同时，由于没有利用帧间预测信息，各帧解码相对独立，因此，对丢包补偿和partial mixing都有很强的健壮性。

参见图13，图13是利用本发明实施例的语音编解码技术方案与现有技术的语音编解码方案对语音信号进行编码得到的语音信号频谱对比示意图。其中，核心编解码器均采用G.711给出的编解码器，一帧样点数N＝40，所采用的零极点滤波器为1阶低通滤波器。取P＝0，Q＝1，且b_r＝a_r+1＝m，则该1阶低通滤波器的表示式为：

H (z) = \frac{m}{1 + m * z^{- 1}} .

则本发明实施例在编码端只需如下表示式对应的状态信息进行编码：

e^{'} (- 1) - n_{out} (- 2) = s (- 1) - {\hat{s}}^{'} (- 1) .

本发明实施例在解码端解码语音信号的表示式为：

S (i) = {\hat{s}}^{''} + {\hat{e}}^{''} (i) + (m * {\hat{n}}^{''}_{out} (i - 2) - m * {\hat{e}}^{''} (i - 1)), i = 0,1 . . ., N - 1 .

参见图13，图13中，用“1”标记的曲线是原始语音信号频谱曲线；用“2”标记的曲线是没有采用噪声整形技术得到的解码语音信号频谱曲线；用“3”标记的曲线是采用现有技术二得到的解码语音信号频谱曲线；用“4”标记的曲线是采用本发明实施例的技术方案得到的解码语音信号频谱曲线。从图13所示编码效果可见，采用现有噪声整形技术可消除部分噪声，但与原始语音信号频谱还存在较大差异；采用本发明实施例的技术，可消除更多噪声，得到的解码语音信号频谱与原始语音信号频谱较接近。

综上所述，本发明实施例提供的基于噪声整形的语音编解码技术方案，从产生原始语音信号与本地重建语音信号之差的根源出发，由于该根源不仅来自于对核心编码语音信号的核心编码所产生的噪声，还来自于噪声整形滤波器对核心编码的噪声整形所产生的噪声，即噪声整形滤波器的当前状态信息，因此，本发明实施例在编码端不仅对残差信号进行编码，还对噪声整形滤波器的当前状态信息进行编码，从而在编码端就能够尽量减少编码过程所产生的噪声，因此，能够有效提高编码效率，进而，在解码端能够解码出语音质量较高的解码语音信号。并且，本发明实施例在编码端对噪声整形滤波器的状态信息进行编码，可有效降低解码端解码的帧间相关性，提高对丢包、Partial mixing等事件的健壮性或不敏感性。

另外，本发明实施例中，对相关语音信号的编码，可采用现有的诸多编码算法，本发明实施例的实现不受编码算法的限制。

Claims

1.一种基于噪声整形的语音编码方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，对噪声整形滤波器的状态信息进行编码包括：

获取所述状态信息，对该状态信息进行编码。

3.根据权利要求2所述的方法，其特征在于，噪声整形滤波器的状态信息包括上一帧残差信号和上一帧噪声修正信号。

4.根据权利要求3所述的方法，其特征在于，设所述滤波器为零极点滤波器，设与所述上一帧残差信号相对+应的所述滤波器的系数为b，P为系数b的阶数，第r阶系数为b_r，r＝0，...，P；且设与所述上一帧噪声修正信号相对应的所述滤波器的系数为a，Q为系数a的阶数，第k阶系数为a_k，k＝1，...，Q；其中，P是非负整数，Q为正整数；

获取所述状态信息包括：

获取上一帧残差信号的所有样点值中的最后P+1个样点值，将所述最后P+1个样点值作为所述状态信息的输入状态值；

获取上一帧噪声修正信号的所有样点值中的最后Q个样点值，将所述最后Q个样点值作为所述状态信息的输出状态值。

5.根据权利要求4所述的方法，其特征在于，对该状态信息进行编码包括：对所述输入状态值编码，且对所述输出状态值编码；或，

对所述输入状态值与对应的所述滤波器的系数的乘积进行编码，且对所述输出状态值与对应的所述滤波器的系数的乘积进行编码。

6.根据权利要求2所述的方法，其特征在于，设所述滤波器为零极点滤波器，设与所述上一帧残差信号相对应的所述滤波器的系数为b，P为系数b的阶数，第r阶系数为b_r，r＝0，...，P；且设与所述上一帧噪声修正信号相对应的所述滤波器的系数为a，Q为系数a的阶数，第k阶系数为a_k，k＝1，...，Q；其中，P是非负整数，Q为正整数；

若P+1＝Q，且b_r＝a_r+1，则获取所述状态信息包括：

获取上一帧原始语音信号的所有样点值中最后P+1个样点值；

获取上一帧核心编码语音信号的所有样点值中最后P+1个样点值。

7.根据权利要求6所述的方法，其特征在于，对该状态信息进行编码包括：

计算获取到的上一帧原始语音信号中的每个样点值，和与该样点值对应的被获取到的上一帧核心编码语音信号的样点值之间的差值；

对P+1个差值分别进行编码。

8.一种编码装置，其特征在于，包括：核心编码语音信号生成单元、核心编码单元、语音信号重建单元、残差信号生成单元、残差信号编码单元、状态信息编码单元、噪声整形滤波器和输出单元；其中，

语音信号重建单元，用于在本地重建语音信号；

9.根据权利要求8所述的编码装置，其特征在于，所述状态信息编码单元包括：状态信息获取单元和编码单元；其中，

状态信息获取单元，用于获取所述状态信息；

10.一种基于噪声整形的语音解码方法，其特征在于，包括：

11.根据权利要求10所述的解码方法，其特征在于，解码所述第二增强码流包括：解码得出上一帧原始语音信号中的每个样点值，和与该样点值对应的上一帧核心编码语音信号的样点值之间的差值。

12.根据权利要求10所述的解码方法，其特征在于，在编码端，设所述滤波器为零极点滤波器，设与所述上一帧残差信号相对应的所述滤波器的系数为b，P为系数b的阶数，第r阶系数为b_r，r＝0，...，P；且设与所述上一帧噪声修正信号相对应的所述滤波器的系数为a，Q为系数a的阶数，第k阶系数为a_k，k＝1，...，Q；其中，P是非负整数，Q为正整数；

解码所述第二增强码流包括：解码得出上一帧残差信号的所有样点值中的最后P+1个样点值，和上一帧噪声修正信号的所有样点值中的最后Q个样点值。

13.一种解码装置，其特征在于，包括：接收单元、核心码流解码单元、第一增强码流解码单元、第二增强码流解码单元和合成单元；其中，