CN101399040A

CN101399040A - 一种帧错误隐藏的谱参数替换方法

Info

Publication number: CN101399040A
Application number: CNA2007101525365A
Authority: CN
Inventors: 钟睿毅
Original assignee: ZTE Corp
Current assignee: ZTE Corp
Priority date: 2007-09-27
Filing date: 2007-09-27
Publication date: 2009-04-01
Anticipated expiration: 2027-09-27
Also published as: CN101399040B

Abstract

本发明提供了一种帧错误隐藏的谱参数替换方法，所述方法包括：(1)解码器统计最近连续坏帧数量；(2)在当前帧发生帧错误时，根据所述最近连续坏帧数量，将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移，得到的值作为当前帧的导谱频率。本发明与现有的AMR－WB和AMR－WB+语音编解码器的帧错误隐藏的谱参数替换方案相比，能保持解码器解码质量并略有提高，同时节约解码器的内存并减小解码计算复杂度。

Description

一种帧错误隐藏的谱参数替换方法

技术领域

本发明涉及语音解码器的坏帧处理方法，具体的说，涉及一种帧错误隐藏的谱参数替换方法。

背景技术

在通信系统中，语音编码器常用的编码原理是代数码本激励线性预测(ACELP，Algebraic Code Excited Linear Prediction)，这类编码器包括G.729、EVRC、AMR、AMR-WB、AMR-WB+等。其中AMR、AMR-WB、AMR-WB+是第三代移动通信合作伙伴计划(3GPP，3rd Generation Partnership Project)的语音编码标准。

基于ACELP的语音编码器生成的码流都是以语音帧为单位的，有的还把帧分为若干子帧，如AMR。对于每一帧的输入数据，通常为几十毫秒PCM(Pulse Code Modulation，脉冲编码调制)格式数据，发送端的语音编码器要将其编码为一组参数。这些参数一般要经过量化并且传输。接收端的解码器则要将这些参数重新合成为语音信号(常见为PCM格式数据)。

参照图1所示，为基于ACELP的语音编码器语音信号传输示意图。输入语音信号经编码器进行编码后由通信信道传输至解码器，由解码器重新合成语音信号。

线性预测系数(LPC，Linear Predictive Coefficience)表示短时语音的谱形状。语音编码器一般都会将LPC参数进行量化后再传输。为了减少量化误差，一些语音编码器会将LPC转换成线谱频率(LSF，Linear SpectralFrequency)或导谱频率(ISF，Immittance Spectral Frequency)等其他谱参数，再进行量化。使用ISF作为谱参数的语音编码器有AMR-WB、AMR-WB+等。

基于ACELP的语音编码器生成的语音帧的参数一般包括谱参数、自适应码本参数、代数码本参数、自适应码本增益和代数码本增益等。

如果一个语音帧的数据从发送端传输到接收端后，发生错误或者丢失，则称为坏帧。当出现坏帧时，接收端的解码器一般需要对坏帧中的错误参数进行替换，以减少解码后语音质量的下降。

最早的基于ACELP的语音解码器在发生帧错误时，都是简单的重复上一帧的谱参数，如G.729和EVRC(分别参见ITU-T G.729和3GPP23GPP2C.S0014-0)。之后的一些标准，为了进一步提高语音质量，开始利用其他的信息(如最近好帧的自适应平均值、常数平均值等)来替换当前坏帧的谱参数，如AMR-WB和AMR-WB+(参见AMR-WB的帧错误隐藏标准3GPP TS26.191)。

AMR-WB和AMR-WB+使用的谱参数是16阶的导谱频率ISF。在发生帧错误时，AMR-WB和AMR-WB+语音解码器将上一帧的ISF向ISF的部分自适应平均值偏移，得到的值作为错误帧的ISF(参考AMR帧错误隐藏标准3GPPTS 26.191和国际专利WO 02/35520)：

ISF_q(i)＝α*past_ISF_q(i)+(1-α)*ISF_mean(i)i＝0..15

其中

α＝0.9，

ISF_q(i)是当前帧的ISF向量，

past_ISF_q(i)是上一帧的ISF向量，

ISF_mean(i)是ISF的部分自适应平均值，由ISF的自适应平均值和ISF的常数平均值组成：

ISF_mean(i)＝β*ISF_{const_mean}(i)+(1-β)*ISF_{adaptive_mean}(i)，i＝0..15

其中

β＝0.25，

{ISF}_{adaptive_mean} (i) = \frac{1}{3} Σ_{i = 0}^{2} past_{ISF}_{q} (i),

是最近3个好帧的自适应平均值，每次好帧更新一次

ISF_{const_mean}(i)ISF向量的长期平均值常数向量。

在上述的AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换中存在下列缺陷：

a)没有考虑最近坏帧的严重程度。当连续坏帧时，最近好帧的ISF和当前坏帧的相关性应当减弱。

b)使用最近三个好帧的ISF平均值。实际上最近一个好帧的ISF和当前坏帧的ISF的相关度应大于其他好帧，可以忽略其他好帧。

c)基于(b)，如果上一帧是坏帧，那么上一帧的ISF也要通过上一好帧的ISF推断出来。因此在替换当前帧的ISF时，没有必要将上一好帧的ISF和上一帧的ISF分开计算，仅用上一好帧的ISF进行计算即可。

可见，现有的AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换中存在计算冗余的问题。

发明内容

本发明所要解决的技术问题是提供一种帧错误隐藏的谱参数替换方法，在保证解码质量有所提高的情况下，为了解决AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换中存在的计算冗余的问题，提出一个高效的谱参数替换方法。

为了解决上述技术问题，本发明提供了一种帧错误隐藏的谱参数替换方法，所述方法包括以下步骤：

(1)解码器统计最近连续坏帧数量；

(2)在当前帧发生帧错误时，根据所述最近连续坏帧数量，将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移，得到的值作为当前帧的导谱频率。

进一步的，步骤(1)中所述统计最近连续坏帧数量，包括：设置坏帧计数器，当解码器接收到好帧时，将所述坏帧计数器置零；当解码器接收到坏帧时，将所述坏帧计数器加1。

进一步的，步骤(2)中所述将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移，包括：

令

{ISF}_{q} (i) = \frac{1}{bfi_count + 1} * past_{ISF}_{q} (i) + \frac{bfi_count}{bfi_count + 1} * {ISF}_{const_mean} (i),

i＝0..15

其中

ISF_q(i)是当前帧导谱频率的向量，

past_ISF_q(i)是上一好帧的导谱频率向量，

ISF_{const_mean}(i)是导谱频率向量的长期平均值常数向量，

bfi_count是最近连续坏帧的数量。

进一步的，所述方法还包括以下步骤：

(3)解码器按照所述当前帧的导谱频率对所述当前帧进行解码。

在技术上，采用本发明的优势有：

a)当发生连续坏帧时，逐渐减小最近好帧ISF与当前坏帧ISF的相关度，在相同码率和帧错误率情况下获得比AMR-WB和AMR-WB+原帧错误隐藏算法更好的音质。

b)当发生帧错误，需要替换ISF参数时，只使用最近一个好帧的ISF，不使用更早的好帧的ISF。和AMR-WB和AMR-WB+原帧错误隐藏算法相比，节约了解码器的内存和减小了计算复杂度。

c)当发生帧错误，需要替换ISF参数时，只使用最近一个好帧的ISF，不使用上一帧的ISF。和AMR-WB和AMR-WB+原帧错误隐藏算法相比，减小了计算复杂度。

附图说明

图1为基于ACELP的语音编码器语音信号传输示意图。

图2为本发明实施例帧错误隐藏的谱参数替换方法流程图。

具体实施方式

本发明通过统计最近连续坏帧个数，当发生连续坏帧时，逐渐减小最近好帧与当前坏帧的相关度，当发生帧错误时，将上一好帧的ISF向ISF的常数平均值进行自适应偏移，得到的值作为错误帧的ISF。从而本发明只使用最近一个好帧的ISF，不使用更早的好帧的ISF，节约解码器的内存和减小计算复杂度。并且当发生帧错误，需要替换ISF参数时，只使用最近一个好帧的ISF，不使用上一帧的ISF，从而减小了计算复杂度。

下面结合附图对本发明的优选实施例进行详细说明。

参照图2所示，为本发明实施例帧错误隐藏的谱参数替换方法流程图。所述方法包括以下步骤：

步骤201：设置坏帧计数器，解码器判断当前帧是否是坏帧，如果是坏帧，则执行步骤204；如果是好帧，则执行步骤202；

步骤202：将坏帧计数器置零；

步骤203：直接用接收到的好帧的ISF参数更新解码器的ISF输入缓冲区，作为解码器的输入参数，执行步骤206；

步骤204：将坏帧计数器加1，从而统计最近连续坏帧数量；

步骤205：按照统计出的所述最近连续坏帧数量，根据上一好帧的ISF，计算当前的坏帧的ISF，作为解码器输入参数，执行步骤206；

步骤206：解码器按照得到的当前帧的ISF对语音数据进行解码，结束。

总而言之，解码器需要统计最近连续坏帧数量。当接收到好帧时，则将统计数置0。在发生帧错误时，根据最近连续坏帧数量，将上一好帧的ISF向ISF的常数平均值进行自适应偏移，得到的值作为错误帧的ISF：

{ISF}_{q} (i) = \frac{1}{bfi_count + 1} * past_{ISF}_{q} (i) + \frac{bfi_count}{bfi_count + 1} * {ISF}_{const_mean} (i), i = 0 . . 15

其中

ISF_q(i)是当前帧的ISF向量，

past_ISF_q(i)是上一好帧的ISF向量，

ISF_{const_mean}(i)是ISF向量的长期平均值常数向量

bi_count是最近连续坏帧的数量。

本发明提供的改进的帧错误隐藏的ISF谱参数替换方法，与现有的AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换方案相比，能保持解码器解码质量并略有提高，同时节约解码器的内存并减小解码计算复杂度。

当然，上述具体实施方式不是对本发明技术方案的进一步限定，任何熟悉本领域的技术人员对本发明技术特征所作的等同替换或者相应改进，仍在本发明的保护范围之内。

Claims

1、一种帧错误隐藏的谱参数替换方法，其特征在于，所述方法包括以下步骤：

(1)解码器统计最近连续坏帧数量；

2、如权利要求1所述的方法，其特征在于，步骤(1)中所述统计最近连续坏帧数量，包括：设置坏帧计数器，当解码器接收到好帧时，将所述坏帧计数器置零；当解码器接收到坏帧时，将所述坏帧计数器加1。

3、如权利要求1所述的方法，其特征在于，步骤(2)中所述将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移，包括：

令

{ISF}_{q} (i) = \frac{1}{bfi_count + 1} * past_{ISF}_{q} (i) + \frac{bfi_count}{bfi_count + 1} * {ISF}_{const_mean} (i),

i＝0..15

其中：

ISF_q(i)是当前帧导谱频率的向量，

past_ISF_q(i)是上一好帧的导谱频率向量，

ISF_{const_mean}(i)是导谱频率向量的长期平均值常数向量，

bfi_count是最近连续坏帧的数量。

4、如权利要求1所述的方法，其特征在于，所述方法还包括以下步骤：