CN101388211A

CN101388211A - 一种语音编解码过程中噪声整形的方法及装置

Info

Publication number: CN101388211A
Application number: CNA2007101539546A
Authority: CN
Inventors: 杨毅; 胡晨; 许剑峰; 杜正中; 张清; 许丽净; 苗磊; 李伟; 齐峰岩
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2007-09-15
Filing date: 2007-09-15
Publication date: 2009-03-18

Abstract

本发明公开了一种语音编解码过程中噪声整形的方法，包括：根据解码后的语音信号获取残差信号，对获取的残差信号进行二阶或高阶零极点噪声整形滤波。本发明同时还公开了一种语音编解码过程中噪声整形的装置，包括第一加法器、第二加法器、编码器、本地解码器及二阶或高阶零极点噪声整形滤波器。应用本发明，可以有效抑制量化噪声的中高频部分，提高解码后的语音信号主观听觉质量，而且不需改变原有语音编解码器输出的码流。

Description

一种语音编解码过程中噪声整形的方法及装置

技术领域

本发明涉及噪声整形技术，特别涉及一种语音编解码过程中噪声整形的方法及装置。

背景技术

在语音的编解码过程中，输入信号经编码端编码后，传输到解码端解码，解码后的输出信号与编码前的输入信号之间的差值称为残差信号，残差信号是由于输入信号编码量化误差引起的，也就是说，残差信号是一种量化噪声。

噪声整形(Noise Shaping)技术是利用人耳的掩蔽效应，即一个较弱的声音的听觉感受被一个较强的声音影响的现象，对语音编解码量化过程中产生的残差(量化噪声)信号进行整形，提高输出语音的主观听觉质量的技术。根据人耳的掩蔽效应，通过噪声整形将噪声谱调整为近似语音谱的形状，提高编码后的语音感知质量，使噪声不容易被觉察。

图1为现有噪声整形的结构示意图。如图1所示，包括：编码端预测滤波器、量化器(编码器)、编码端解码器、噪声整形滤波器、解码端解码器、加法器1、加法器2、加法器3、加法器4及解码端预测滤波器，其中，

编码端预测滤波器接收原始语音输入信号d(n)，生成预测信号d(n′)，将预测信号d(n′)输出至加法器1；

加法器1，接收原始语音输入信号d(n)和编码端预测信号d(n′)，计算出原始语音输入信号d(n)与编码端预测信号d(n′)的差值，得到预测残差信号d(n₀)，输出至加法器2；

加法器2，将加法器1输出的编码端预测残差信号d(n₀)以及噪声整形滤波器输出的残差反馈信号f_q(n)相加，获取输入编码器的信号u(n)，分别向编码器及加法器3输出；

量化器(编码器)，对输入编码器的信号u(n)进行量化编码，获取编码后的残差信号u_q(n)，向加法器4及编码端解码器输出；

编码端解码器，接收编码后的残差信号u_q(n)，进行解码，获取编码端解码后的残差信号u_q(n′)，向加法器3输出；

加法器3，将编码端解码器输出的编码端解码后的残差信号u_q(n′)以及加法器2输出的输入编码器的信号u(n)相减，获取残差(量化噪声)信号q(n)，向噪声整形滤波器输出；

噪声整形滤波器，接收加法器3输出的残差信号q(n)，进行整形，将噪声谱调整为近似语音谱的形状，得到残差反馈信号f_q(n)，向加法器2输出；

解码端解码器，用于将接收到的编码后的残差信号u_q(n)进行解码，获取解码端解码后的残差信号u_q(n＂)，向加法器4输出；

加法器4，接收解码端解码器输出的解码端解码后的残差信号u_q(n＂)以及解码端预测滤波器输出的解码端预测信号d′(n₀)，将两信号相加，获取输出的语音信号o(n)，向用户和解码端预测滤波器输出；

解码端预测滤波器，接收加法器4输出的语音信号o(n)，获取解码端预测信号d′(n₀)，向加法器4输出。

由图1中可以看出，在噪声整形的过程中，编码端使用预测滤波器生成编码端预测信号，由于使用预测编码，在解码端也必须使用预测滤波器才能得到输出的语音信号，而且，噪声整形滤波器的选取依赖于选取的预测滤波器，可调整度较低。

针对于噪声整形滤波器的选取依赖于选取的预测滤波器的情况，提出了一种不依赖于预测滤波器的噪声整形技术。

图2为现有噪声整形编码端的另一结构示意图。如图2所示，包括：加法器1、加法器2、编码器、本地解码器及一阶噪声整形滤波器F，其中，加法器1，接收原始语音输入信号d(n)和一阶噪声整形滤波器F输出的残差反馈信号f_q(n)，将两信号相加，得到输入编码器的语音信号d₁(n)，向编码器输出；

编码器，接收输入编码器的语音信号d₁(n)进行量化编码，获取编码后的语音信号d₂(n)，形成码流，向本地解码器及解码端输出；

本地解码器，接收编码后的语音信号d₂(n)，进行解码，获取编码端解码后的语音信号d₃(n)，向加法器2输出；

加法器2，将接收的原始语音输入信号d(n)和编码端解码后的语音信号d₃(n)相减，获取残差信号q(n)，向一阶噪声整形滤波器F输出；

一阶噪声整形滤波器F，采用一阶滤波器结构，其Z函数形式为-0.8Z^-1，接收加法器2输出的残差信号q(n)，进行整形，将噪声谱调整为近似语音谱的形状，得到残差反馈信号f_q(n)，向加法器1输出。

图3为现有一阶噪声整形滤波器F的频率响应示意图。如图3所示，图中横坐标为归一化频率，取值为0～1，纵坐标为增益。

由图2和图3中可以看出，由于该一阶噪声整形滤波器F对残差信号进行整形滤波后输出残差反馈信号至给加法器1，加法器1根据残差反馈信号对原始输入的语音信号进行修正后向编码器输出，编码器编码后向解码端输出，解码端解码获取最终的语音信号，不需要使用预测滤波器，并能消除一定的可感知的量化噪声。

语音信号的能量大部分集中在低频部分，即低频部分语音信号能量较高，当低频部分量化噪声能量稍增加时，由于人耳的掩蔽效应，对解码后的语音信号主观听觉质量影响不大，而对于中高频语音信号，其能量较低，量化噪声对其影响较大。因此，对于图2所示的一阶噪声整形滤波器F，对语音信号进行量化编码产生的低频残差信号整形效果较好，但对语音信号进行量化编码产生的中高频残差信号整形效果较差，未能较好的抑制中高频信号的噪声，使得解码后的语音信号主观听觉质量不高。

发明内容

本发明实施例提供一种语音编解码过程中噪声整形的方法，对语音信号进行量化编码产生的残差信号整形，提高解码后的语音信号主观听觉质量。

本发明实施例还提供一种语音编解码过程中噪声整形的装置，对语音信号进行量化编码产生的残差信号整形，提高解码后的语音信号主观听觉质量。

为达到上述目的，本发明实施例的技术方案具体是这样实现的：

一种语音编解码过程中噪声整形的方法，该方法包括：

根据解码后的语音信号获取残差信号，对获取的残差信号进行二阶或高阶零极点噪声整形滤波。

一种语音编解码过程中噪声整形的装置，该装置包括：第一加法器、第二加法器、编码器、本地解码器、二阶或高阶零极点噪声整形滤波器，其中，

第一加法器，用于获取输入编码器的语音信号，向编码器输出；

编码器，用于接收输入编码器的语音信号，进行量化编码，获取编码后的语音信号，向本地解码器输出；

本地解码器，用于接收编码后的语音信号，进行解码，获取解码后的语音信号，向第二加法器输出；

第二加法器，用于根据解码后的语音信号获取残差信号，向二阶或高阶零极点噪声整形滤波器输出；

二阶或高阶零极点噪声整形滤波器，用于接收第二加法器输出的残差信号，对该残差信号进行整形滤波。

由上述技术方案可见，本发明实施例的一种语音编解码过程中噪声整形的方法及装置，通过采用二阶或高阶零极点噪声整形滤波器对原始语音输入信号与编码端解码后的语音信号的误差，即量化噪声进行整形滤波，利用人耳的掩蔽效应，抑制量化噪声的中高频部分，提高了解码后的语音信号主观听觉质量，而且不需改变原有语音编解码器输出的码流。

附图说明

图1为现有噪声整形的结构示意图。

图2为现有噪声整形编码端的另一结构示意图。

图3为现有一阶噪声整形滤波器F的频率响应示意图。

图4为本发明实施例一种语音编解码过程中噪声整形的装置结构示意图。

图5为本发明实施例二阶零极点噪声整形滤波器的频率响应示意图。

图6为本发明实施例一种语音编解码过程中噪声整形的方法流程示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下参照附图并举实施例，对本发明作进一步详细说明。

本发明实施例是通过二阶零极点噪声整形滤波器对编解码后的残差信号，即量化噪声的频谱在编码端进行整形，抑制量化噪声的中高频部分，利用人耳的掩蔽效应，使得当低频部分的量化噪声能量小于语音能量的时候，主观听觉不易觉察噪声的存在，提高解码后中高频的语音信号主观听觉质量，不需改变原有语音编解码器输出的码流。

为了实现上述目的，本发明提出了一种语音编解码过程中噪声整形的装置。

图4为本发明实施例一种语音编解码过程中噪声整形的装置结构示意图。如图4所示，包括：加法器41、加法器42、编码器43、本地解码器44及二阶零极点噪声整形滤波器45，其中，

加法器41，用于获取输入编码器的语音信号d₁(n)，向编码器43；

编码器43，接收输入编码器的语音信号d₁(n)进行量化编码，获取编码后的语音信号d₂(n)，向本地解码器输出；

本地解码器44，用于接收编码后的语音信号d₂(n)，进行解码，获取编码端解码后的语音信号d₃(n)，向加法器42输出；

加法器42，用于根据解码后的语音信号d₃(n)获取残差信号q(n)，向二阶零极点噪声整形滤波器45输出；

二阶零极点噪声整形滤波器45，用于接收加法器42输出的残差信号q(n)，进行整形滤波。

实际应用中，加法器41将原始语音输入信号和二阶或高阶零极点噪声整形滤波器输出的上一次残差反馈信号相加，获取输入编码器的语音信号。

加法器42获取残差信号q(n)可以通过以下两种方式：

加法器41将获取的输入编码器的语音信号d₁(n)输出给加法器42，加法器42将接收的解码后的语音信号d₃(n)与输入编码器的语音信号d₁(n)相减，获取残差信号q(n)，或，

加法器42接收原始语音输入信号d(n)，将接收的解码后的语音信号d₃(n)与原始语音输入信号d(n)相减，获取残差信号。

下面对本发明实施例涉及的二阶零极点噪声整形滤波器进行说明。

二阶零极点噪声整形滤波器用于对残差信号，即量化误差的频谱在编码端进行整形滤波，其Z函数形式为：

H (z) = \frac{α_{1} z^{- 1} - α_{2} z^{- 2}}{[1 - β_{1} z^{- 1}] [1 - β_{2} z^{- 1}]} - - - (1)

式中，α₁，α₂，β₁，β₂为滤波器的系数，在本实施例中，滤波器系数的选择主要依据零点位置和低频、中高频相应的增益。零点将频带划分为低频部分和中高频部分，即零点的位置为低频和中高频的分界点。如果零点位置偏向坐标原点，即归一化频率较低，则相应的低频部分噪声增益过大，影响主观听觉对低频部分的感受；如果零点位置远离坐标原点，即归一化频率较高，则相应的中高频部分噪声增益抑制过少，起不到抑制中高频噪声的效果。

图5为本发明实施例二阶零极点噪声整形滤波器的频率响应示意图。如图5所示，滤波器系数如下：α₁＝-1.0，α₂＝0.3，β₁＝-0.35，β₂＝0.85，其具体特征为，零点在归一化频率的0.4以下，对应的频率在1600Hz以下，为低频部分，其增益在17dB以下；1600Hz以上为中高频部分，增益在-7dB以下。与图3相比，图5中，在低频部分，量化噪声的增益有所提高，但实际应用中，由于人耳的掩蔽效应，当低频部分的量化噪声能量小于语音能量的时候，主观听觉不易觉察噪声的存在；而在中高频部分，量化噪声的增益明显下降，也就是说，有效地抑制了量化噪声的中高频部分，提高了解码后中高频的语音信号主观听觉质量。

实际应用中，也可以使用高阶零极点噪声整形滤波器对量化噪声进行整形滤波，其Z函数形式为：

H (z) = \frac{λ z^{- l} Σ_{i = 1}^{j} (1 - α_{i} z^{- i})}{Σ_{i = 1}^{k} (1 - β_{i} z^{- i})} - - - (2)

式中，l、j、k均为大于等于1的正整数，分别代表滤波器零、极点的阶数；α_i、β_i为相应的高阶滤波器系数；λ为比例系数。滤波器系数的选择主要还是依据零点位置和低频、中高频相应的增益，零点将频带划分为低频部分和中高频部分，即零点的位置为低频和中高频的分界点，如果零点位置偏向坐标原点，即归一化频率较低，则相应的低频部分噪声增益过大，影响主观听觉对低频部分的感受；如果零点位置远离坐标原点，即归一化频率较高，则相应的中高频部分噪声增益抑制过少，起不到抑制中高频噪声的效果。

具体来说，对于图5所示的二阶零极点噪声整形滤波器，其对应参数为：l＝1，j＝1，k＝2，λ＝-1.0，α₁＝-0.3，β₁＝-0.35，β₂＝0.85。

实际应用中，高阶可以是三阶或更高阶。

图6为本发明实施例一种语音编解码过程中噪声整形的方法流程示意图。参见图6，该流程包含：

步骤601，将原始语音输入信号d(n)和残差反馈信号f_q(n)相加，得到输入编码器的语音信号d₁(n)；

步骤602，对输入编码器的语音信号d₁(n)进行量化编码，获取编码后的语音信号d₂(n)；

本步骤中，编码后的语音信号d₂(n)被分成两路，一路形成向解码端输出，解码端接收输出的码流，对码流进行解码，获取最终的语音信号；另一路作为反馈信号，输出至本地解码器进行解码。

步骤603，对编码后的语音信号d₂(n)进行解码，获取编码端解码后的语音信号d₃(n)，与输入编码器的语音信号d₁(n)相减，获取残差信号q(n)；

本步骤中，获取编码端解码后的语音信号d₃(n)后，也可以是与原始语音输入信号d(n)相减，来获取残差信号q(n)。

步骤604，对获取的残差信号q(n)进行二阶零极点噪声整形滤波，获取残差反馈信号f_q(n)。

本步骤中，也可以获取的残差信号q(n)进行高阶零极点噪声整形滤波，获取的残差反馈信号f_q(n)用于对原始语音输入信号d(n)进行反馈调整。

由上述实施例可见，通过利用人耳的掩蔽效应，使得当低频部分的量化噪声能量小于语音能量的时候，主观听觉不易觉察噪声的存在，通过采用二阶或高阶零极点噪声整形滤波器对原始语音输入信号与编码端解码后的语音信号的误差(量化噪声)进行整形滤波。在量化噪声的低频部分稍许增加的情况下，抑制量化噪声的中高频部分，提高了解码后的语音信号主观听觉质量，而且不需改变原有语音编解码器输出的码流。

以上举较佳实施例，对本发明的目的、技术方案和优点进行了进一步详细说明，所应理解的是，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种语音编解码过程中噪声整形的方法，其特征在于，该方法包括：

2、如权利要求1所述的方法，其特征在于，所述解码后的语音信号的获取过程包括：对上一次获取的残差信号进行二阶或高阶零极点噪声整形滤波，得到残差反馈信号，将原始语音输入信号和该残差反馈信号相加，并将相加后的信号进行量化编码，获取编码后的语音信号，将编码后的语音信号进行解码获取解码后的语音信号。

3、如权利要求1所述的方法，其特征在于，所述获取残差信号包括：将解码后的语音信号与输入编码器的语音信号相减，或将解码后的语音信号与原始语音输入信号相减，获取残差信号。

4、一种语音编解码过程中噪声整形的装置，其特征在于，所述装置包括：第一加法器、第二加法器、编码器、本地解码器、二阶或高阶零极点噪声整形滤波器，其中，

5、如权利要求4所述的装置，其特征在于，所述第一加法器将原始语音输入信号和二阶或高阶零极点噪声整形滤波器输出的上一次残差反馈信号相加，获取输入编码器的语音信号。

6、如权利要求4所述的装置，其特征在于，所述第一加法器进一步将获取的输入编码器的语音信号输出给第二加法器；

所述第二加法器将接收的解码后的语音信号与输入编码器的语音信号相减，获取残差信号。

7、如权利要求4所述的装置，其特征在于，所述第二加法器接收原始语音输入信号，将接收的解码后的语音信号与原始语音输入信号相减，获取残差信号。

8、如权利要求4所述的装置，其特征在于，所述二阶零极点噪声整形滤波器的Z函数为：

H (z) = \frac{α_{1} z^{- 1} - α_{2} z^{- 2}}{[1 - β_{1} z^{- 1}] [1 - β_{2} z^{- 1}]}

式中，α₁，α₂，β₁，β₂为滤波器的系数，依据过零点位置和低频、中高频相应的增益进行选取。

9、如权利要求4所述的装置，其特征在于，所述高阶零极点噪声整形滤波器的Z函数为：

H (z) = \frac{λ z^{- l} Σ_{i = 1}^{j} (1 - α_{i} z^{- i})}{Σ_{i = 1}^{k} (1 - β_{i} z^{- i})}

式中，l、j、k均为大于等于1的正整数，为滤波器零、极点的阶数，α_i、β_i为相应的高阶滤波器系数，λ为比例系数。

10、如权利要求4所述的装置，其特征在于，所述零极点噪声整形滤波器的零点在所述归一化频率的0～0.4范围内，低频增益小于17dB，高频增益小于-7dB。