WO2009115032A1

WO2009115032A1 - 一种语音信号处理方法及装置

Info

Publication number: WO2009115032A1
Application number: PCT/CN2009/070826
Authority: WO
Inventors: 代金良; 张立斌; 舒默特·艾雅
Original assignee: 华为技术有限公司
Priority date: 2008-03-20
Filing date: 2009-03-17
Publication date: 2009-09-24
Also published as: CA2709790C; EP2234102A4; US20100250247A1; CA2709790A1; CN101339766A; US7890322B2; EP2234102A1; CN100550133C; EP2234102B1; RU2435233C1

Description

一种语音信号处理方法及装置本申请要求于 2008年 3月 20日提交中国专利局、申请号为 200810026901.2、发明名称为 "一种语音信号处理方法及装置" 的中国专利申请的优先权，其全部内容通过引用结合在本申请中。技术领域

本发明涉及通信领域，尤其涉及一种语音信号处理方法及一种语音信号处理装置。背景技术

在语音通信中，语音信号一般按帧来处理，每帧语音信号的长度一般为 10 毫秒（ms )到 30ms, 对每帧语音信号，其基本处理流程为：

发送端，语音编码器对每帧语音信号进行编码，并将编码比特封装成语音数据帧；

通信信道，将发送端发出的语音数据帧发送到接收端；

接收端，对接收到的语音数据帧用语音解码器进行解码，恢复出语音信号。对于语音解码器来说，其是否能恢复出语音信号的关键在于能否准确接收发送端所发出的语音数据帧，而这取决于通信信道。而对于通信信道来说，如果通信信道资源较为紧张，那么就可能发生语音数据帧的丟失或语音数据帧出错。目前在语音编解码器中广泛采用的帧差错隐藏（ Frame Erasure Concealment , FEC )技术可有效地解决通信信道丟失语音数据帧或语音数据帧出错时对语音数据帧通信质量所带来的影响。

不同的语音编解码器其采用的 FEC技术可能不同，但一般均包含对恢复出的语音信号进行幅度衰减的操作。

语音解码器上定义了 FEC技术，对语音数据帧进行 FEC处理（对应为差错隐藏帧），但是由于语音信号中并不纯粹是人们发声产生的有声信号，也有可能包括有人们发声间隙的背景噪声信号（相对于有声信号，背景噪声信号为无声信号），背景噪声信号的出现，（对应语音编码器生成的背景噪声帧）会使差错隐藏处理后恢复出来的信号发生能量突变，给听者的听觉造成不适，特别是当背景噪声帧发生丟失时，这种能量突变造成的听觉不适感更为强烈。

发明内容

本发明实施例所要解决的技术问题在于，提供了一种语音信号处理方法及装置，使差错隐藏信号区域与背景噪声信号区域之间的能量过渡自然、平滑，提高听者听觉的舒适感。

为了解决上述技术问题，本发明实施例提出了一种语音信号处理方法，包括：

当差错隐藏帧之后获得的为背景噪声帧时，对获得的所述背景噪声帧对应的背景噪声信号设置能量衰减增益值，使得所述背景噪声帧对应的背景噪声信号能量衰减增益值与其前一帧对应的信号能量衰减增益值相差在阈值范围内；利用所述能量衰减增益值控制所述背景噪声帧对应的背景噪声信号的能量衰减。

相应地，本发明实施例还提供了一种语音信号处理装置，包括：

背景噪声帧获取单元，用于获得差错隐藏帧之后的背景噪声帧；

能量衰减增益值设置单元，用于对获得的所述背景噪声帧对应的背景噪声信号设置能量衰减增益值，使得所述背景噪声帧对应的背景噪声信号能量衰减增益值与其前一帧对应的信号能量衰减增益值相差在阈值范围内；

控制单元，用于利用所述能量衰减增益值控制所述背景噪声帧对应的背景噪声信号的能量衰减。

本发明实施例通过对差错隐藏帧之后获得的背景噪声帧对应的背景噪声信号设置能量衰减增益值，使得所述背景噪声帧对应的背景噪声信号能量衰减增益值与其前一帧对应的信号能量衰减增益值相差在阈值范围内，并利用所述能量衰减增益值控制所述背景噪声帧对应的背景噪声的能量衰减，从而通过设置背景噪声信号能量衰减增益并利用其对背景噪声信号进行能量衰减，使差错隐藏信号区域与背景噪声信号区域之间的能量过渡自然、平滑，提高听者听觉的舒适感。附图说明

图 1是本发明实施例的语音信号处理方法的示意图；

图 2是本发明实施例的语音信号处理所得语音信号幅度示意图；

图 3是本发明实施例的语音信号处理所得另一语音信号幅度示意图；图 4是本发明实施例的语音信号处理所得另一语音信号幅度示意图；图 5是本发明实施例的语音解码器的示意图。具体实施方式

本发明实施例提供了一种语音信号处理方法及装置，可实现通过设置背景噪声信号能量衰减增益并利用其对背景噪声信号进行能量衰减，从而使差错隐藏信号区域与背景噪声信号区域之间的能量过渡自然、平滑，提高听者听觉的舒适感。

下面结合附图，对本发明实施例进行详细说明。

图 1是本发明实施例的语音信号处理方法的示意图，图 2是本发明实施例的语音信号处理所得语音信号幅度示意图。参照该图 1与图 2, 图 1所示方法主要包括：

101 , 在差错隐藏帧之后，获得一个或多个背景噪声帧，在差错隐藏帧之后只获得一个背景噪声帧时，对该背景噪声帧可与下述背景噪声帧 B的处理相同，下面具体以 7个连续的背景噪声帧 B、 C、 D、 E、 F、 G、 H为例进行说明，但不仅限于此，即当前获得的首个背景噪声帧 B的前一帧为差错隐藏帧 A, 除所述首个背景噪声帧 B之外的背景噪声帧前一帧均为背景噪声帧，该背景噪声帧对应的信号为背景噪声信号，例如背景噪声帧 D前一帧为背景噪声帧 C, 具体地，判断当前获得的帧是否为背景噪声帧，可根据帧头中一标志位进行判断；

102, 对所述获得的背景噪声帧 B、 C、 D、 E、 F、 G、 H对应的背景噪声信号设置能量衰减增益值，使得所述背景噪声帧 B、 C、 D、 E、 F、 G、 H对应的背景噪声信号能量衰减增益值分别与其前一帧对应的信号能量衰减增益值相差在阈值范围内，具体地， 102可通过如下方法实现：

首先，获得已保存的差错隐藏帧 A对应的差错隐藏信号能量衰减增益值 α' ; 其次，根据所述差错隐藏帧 Α对应的差错隐藏信号能量衰减增益值 α'设定背景噪声帧起始能量衰减增益值《_stort 该起始能量衰减增益值《与所述差错隐藏帧对应的差错隐藏信号能量衰减增益值 α'相差在所述阈值范围内，具体地，可令" , ="';

再次，将所述起始能量衰减增益值 a_start与小于所述阈值的能量衰减增益值增加值 Δα的和值，设置为所述首个背景噪声帧 Β对应的背景噪声信号能量衰减增益值；除所述首个背景噪声帧 Β之外，将其他背景噪声帧的前一背景噪声帧对应的信号能量衰减增益值与所述能量衰减增益值增加值的和值，设置为所述其他背景噪声帧对应的背景噪声信号能量衰减增益值，具体地，可令：

背景噪声帧 Β对应的背景噪声信号能量衰减增益值 = a_stan + Δ« ,即 c^_oiseB 以。《为前提；

背景噪声帧 C 对应的背景噪声信号能量衰减增益值《„。^=«„。,^₊4« , 即。^以为前提；

背景噪声帧 D 对应的背景噪声信号能量衰减增益值 =«„。^₊Δ« , 即以" 为前提；

背景噪声帧 Ε 对应的背景噪声信号能量衰减增益值《„ _£=_α„ _{β +}Δ« , 即 6_£以 " 为前提；

背景噪声帧 F对应的背景噪声信号能量衰减增益值 ^ =«„ _{£ +}Δ« , 即以 _6£为前提；

背景噪声帧 G对应的背景噪声信号能量衰减增益值《„。^=«„^₊Δ_α , 即

"„。,^以"„„为前提；

背景噪声帧 Η 对应的背景噪声信号能量衰减增益值 _a„ _H =_ai__{e +}A« , 即

//以 "„。,^为前提；

需要说明的是，当获得连续的多个背景噪声帧且存在某一背景噪声帧对应的背景噪声信号能量衰减增益值通过上述相同的叠代过程满足 ≥1时，此时为满足语音信号处理要求，令《„ =1, 为描述筒便，上述设置至少两个背景噪声帧对应的背景噪声信号能量衰减增益值的叠代过程可用如下式子表示： a . = a . -\-Aa

if (a . >1)，作为一种实施方式，所述可为但不仅限于如下两种取值方式中的一种： Δ_{α =}丄，其中 N取 256; _{Δα =} 1 ¾- , 其中 L为预先设定的背景噪声帧个数，具体地， L可取值为 L

100;

103, 利用所述能量衰减增益值控制所述背景噪声帧 B、 C、 D、 E、 F、 G、 H对应的背景噪声信号的能量衰减，具体地， 103可通过如下方法实现：

首先，恢复出所述背景噪声帧 B、 C、 D、 E、 F、 G、 H分别对应的背景噪声信号；

其次，利用所述能量衰减增益值对所述背景噪声信号进行幅度衰减，例如利用背景噪声帧 B对应的背景噪声信号能量衰减增益值对背景噪声帧 B 对应的背景噪声信号进行幅度衰减，利用背景噪声帧 C对应的背景噪声信号能量衰减增益值 ^ , 对背景噪声帧 C对应的背景噪声信号进行幅度衰减等等，具体地，当每个背景噪声帧中背景噪声信号的采样点数为 M时，则利用每个背景噪声帧对应的背景噪声信号能量衰减增益值，对每个背景噪声帧对应的 M个背景噪声信号采样点进行幅度衰减，为描述筒便，上述对每个背景噪声帧对应的 M个背景噪声信号采样样点进行幅度衰减可用如下式子表示，其中 _noi_Se(n)表示 M个背景噪声信号中第个背景噪声信号采样样点的幅度：

if (a . < 1)，

for(n = 0; n < M; n + +)

{noise(n) = noise(n) x a_noise }

实施如图 1所示的本发明实施例的语音信号处理方法，其中 102保证了所述首个背景噪声帧 B对应的背景噪声信号能量衰减增益值与差错隐藏帧 A 对应的差错隐藏信号能量衰减增益值 α'相差不大，并保证了存在至少两个背景噪声帧时，所述背景噪声帧（、 D、 E、 F、 G、 H对应的背景噪声信号能量衰减增益值分别与其前一个背景噪声帧对应的背景噪声信号能量衰减增益值相差不大， 103中采用上述背景噪声帧对应的背景噪声信号能量衰减增益值对所述背景噪声帧对应的背景噪声信号进行能量衰减，可使差错隐藏信号区域与背景噪声信号区域之间的能量过渡自然、平滑，提高听者听觉的舒适感。

作为一种实施方式，上述 102中对所述获得的背景噪声帧 B、 C、 D、 E、 F、 G、 H对应的背景噪声信号设置能量衰减增益值，使得所述背景噪声帧 B、 C、 D、 E、 F、 G、 H对应的背景噪声信县能量衰减增益值分别与其前一帧对应的信号能量衰减增益值相差在阈值范围内还可以通过如下方法实现：

参照图 3 所示的本发明实施例的语音信号处理所得另一语音信号幅度，与图 2所示的本发明实施例的语音信号处理所得语音信号幅度不同的是，此处采用 "进 2退的方法，需要说明的是，下面的 2Δα也应该小于所述阈值，例如，令：

背景噪声帧 Β 对应的背景噪声信号能量衰减增益值^^ = _{art +}2A« , 即 «„ 以为前提；

背景噪声帧 C 对应的背景噪声信号能量衰减增益值^ __C=^^-A« , 即

。^以为前提；

背景噪声帧 D对应的背景噪声信号能量衰减增益值

«„。以 , 为前提；

背景噪声帧 Ε 对应的背景噪声信号能量衰减增益值^__£= - 《

£以为前提；

背景噪声帧 F对应的背景噪声信号能量衰减增益值《„。^

« 以《 _6£为前提；

背景噪声帧 G对应的背景噪声信号能量衰减增益即

«„。,^以 „„为前提；

背景噪声帧 Η对应的背景噪声信号能量衰减增益值 _ai__H =_a„ _{e +}2A« , 即

//以 ,^为前提，

这样，在保证了所述背景噪声帧 B C D E F G H对应的背景噪声信号能量衰减增益值分别与其前一帧对应的信号能量衰减增益值相差在所述阈值范围内的同时，使得背景噪声帧 ^ C D E F G H对应的背景噪声信号能量衰减增益值按照一个大致顺序的顺序增加，直至背景噪声帧对应的背景噪声信号能量衰减增益值为 1 为止即可，因此，采用其他类似的方式也可认为是本发明的其他实施方式，例如：

采用如图 4所示的本发明实施例的语音信号处理所得另一语音信号幅度，其与图 2所示本发明实施例的语音信号处理所得语音信号幅度的主要区别在于，背景噪声帧 B对应的背景噪声信号能量衰减增益值^ ^与所述取值相等，其他背景噪声帧 C D E F G H对应的背景噪声信号能量衰减增益值在 ^ 基础上按照步长 Δα逐步增加。参照图 2, 本发明另一实施例实现语音信号处理的方法包括：

201 , 在差错隐藏帧之后，获得一个或多个背景噪声帧，在差错隐藏帧之后只获得一个背景噪声帧时，对该背景噪声帧可与下述背景噪声帧 B的处理相同，下面具体以 7个连续的背景噪声帧 B、 C、 D、 E、 F、 G、 H为例进行说明，但不仅限于此，即当前获得的首个背景噪声帧 B的前一帧为差错隐藏帧 A, 除所述首个背景噪声帧 B之外的背景噪声帧前一帧均为背景噪声帧，该背景噪声帧对应的信号为背景噪声信号，例如背景噪声帧 D前一帧为背景噪声帧 C, 具体地，判断当前获得的帧是否为背景噪声帧，可根据帧头中一标志位进行判断；

202, 对所述获得的背景噪声帧 B、 C、 D、 E、 F、 G、 H对应的背景噪声信号设置能量衰减增益值，使得所述背景噪声帧 B、 C、 D、 E、 F、 G、 H对应的背景噪声信号能量衰减增益值分别与其前一帧对应的信号能量衰减增益值相差在阈值范围内，所述阈值范围是根据需要获得的语音信号的质量，得出的所述背景噪声帧对应的背景噪声信号能量衰减增益值分别与其前一帧对应的信号能量衰减增益值的差值范围，该阈值即为该差值范围的最大值。 202的具体实现方法请参见 202, 在此不再赘述；

203, 利用所述能量衰减增益值控制所述背景噪声帧 B、 C、 D、 E、 F、 G、 H对应的背景噪声信号的能量衰减。 203的具体实现方法请参见 103, 在此不再赘述。

下面相应地对本发明实施例的语音信号处理装置进行说明，但本发明实施例的语音信号处理装置并不仅限于下面的语音解码器。

图 5是本发明实施例的语音解码器的示意图，参照该图 5与图 2, 图 5所示装置主要包括背景噪声帧获取单元 51、能量衰减增益值设置单元 52、控制单元 53; 能量衰减增益值设置单元 52包括获取单元 521、第一设置单元 522、第二设置单元 523、第三设置单元 524;控制单元 53包括背景噪声信号获取单元 531、处理单元 532, 其中各单元功能如下述：

背景噪声帧获取单元 51 , 获得差错隐藏帧之后的背景噪声帧 B、 C、 D、 E、 F、 G、 H, 即当前获得的首个背景噪声帧 B的前一帧为差错隐藏帧 A, 除所述首个背景噪声帧 B之外的背景噪声帧前一帧为背景噪声帧，该背景噪声帧对应的信号为背景噪声信号，例如背景噪声帧 D前一帧为背景噪声帧 C, 具体地，判断当前获得的帧是否为背景噪声帧，可根据帧头中一标志位进行判断，此为现有技术不再赘述；

获取单元 521, 获得已保存的差错隐藏帧 A对应的差错隐藏信号能量衰减增益值 "'；

第一设置单元 522, 根据所述差错隐藏帧 A对应的差错隐藏信号能量衰减增益值设定背景噪声帧起始能量衰减增益值 α , 该起始能量衰减增益值与所述差错隐藏帧对应的差错隐藏信号能量衰减增益值 α'相差在所述阈值范围内，具体地，可令^ _rt=«';

第二设置单元 523, 将所述起始能量衰减增益值 α 与小于所述阈值的能量衰减增益值增加值 Δα的和值，设置为所述首个背景噪声帧 Β对应的背景噪声信号能量衰减增益值，具体地，可令：

背景噪声帧 Β对应的背景噪声信号能量衰减增益值。_iseB = a_{start +} Δ« ,即。_iseB 以为前提；

第三设置单元 524,除所述首个背景噪声帧 B之外，将其他背景噪声帧的前一背景噪声帧对应的信号能量衰减增益值与所述能量衰减增益值增加值的和值，设置为所述其他背景噪声帧对应的背景噪声信号能量衰减增益值，具体地，可令：

背景噪声帧 C 对应的背景噪声信号能量衰减增益值^ __C=^^₊A« , 即。^以为前提；

背景噪声帧 D 对应的背景噪声信号能量衰减增益值 =_α„。^₊Δ« , 即

«„。以 , 为前提；

背景噪声帧 Ε 对应的背景噪声信号能量衰减增益值《„ _£=_α„ _{β +}Δ« , 即 6_£以 " _e 为前提；

背景噪声帧 F对应的背景噪声信号能量衰减增益值 ^ =«„ _{£ +}Δ« , 即

« 以《 _6£为前提；

背景噪声帧 G对应的背景噪声信号能量衰减增益即

«„。,^以 „„为前提；

//以 „,^为前提；

需要说明的是，当获得连续的多个背景噪声帧且存在某一背景噪声帧对应的背景噪声信号能量衰减增益值通过上述相同的叠代过程满足 ≥1时，此时为满足语音信号处理要求，令《„ = 1 , 为描述筒便，上述计算单元设置至少两个背景噪声帧对应的背景噪声信号能量衰减增益值的叠代过程可用如下式子表示：

a . = a . + Aa

if (a . > 1)，作为一种实施方式，所述可为但不仅限于如下两种取值方式中的一种：

_{Δα =}丄，其中 N取 256;

Ν

Aa - ^' , 其中 L为预先设定的背景噪声帧个数，具体地， L可取值为

L

100;

控制单元 53, 利用所述能量衰减增益值控制所述背景噪声帧 B、 C、 D、 E、 F、 G、 H对应的背景噪声信号的能量衰减，具体地，控制单元 53可包括：

背景噪声信号获取单元 531 , 恢复出所述背景噪声帧^ C、 D、 E、 F、 G、 H分别对应的背景噪声信号；

处理单元 532, 利用所述能量衰减增益值对所述背景噪声信号进行幅度衰减，例如利用背景噪声帧 B对应的背景噪声信号能量衰减增益值。,^ , 对背景噪声帧 B对应的背景噪声信号进行幅度衰减，利用背景噪声帧 C对应的背景噪声信号能量衰减增益值。^ , 对背景噪声帧 C对应的背景噪声信号进行幅度衰减等等，具体地，当每个背景噪声帧中背景噪声信号的采样点数为 M时，则利用每个背景噪声帧对应的背景噪声信号能量衰减增益值，对每个背景噪声帧对应的 M个背景噪声信号采样点进行幅度衰减，为描述筒便，处理单元 532对每个背景噪声帧对应的 M个背景噪声信号采样样点进行幅度衰减可用如下式子表示，其中表示 M个背景噪声信号中第 n个背景噪声信号采样样点的幅度： if (a . < 1)，

for(n = 0; n < M; n + +)

{noise(n) = noise(n) x a_noise }

实施如图 5所示的本发明实施例的语音解码器，其中能量衰减增益值设置单元 52保证了所述首个背景噪声帧 B对应的背景噪声信号能量衰减增益值^ _ 与差错隐藏帧 A对应的差错隐藏信县能量衰减增益值 α'相差不大，第并保证了存在至少两个背景噪声帧时，所述背景噪声帧（、 D E F G H对应的背景噪声信号能量衰减增益值分别与其前一个背景噪声帧对应的背景噪声信号能量衰减增益值相差不大，控制单元 53中采用上述背景噪声帧对应的背景噪声信号能量衰减增益值对所述背景噪声帧对应的背景噪声信号进行能量衰减，可使差错隐藏信号区域与背景噪声信号区域之间的能量过渡自然、平滑，提高听者听觉的舒适感。

作为一种实施方式，上述能量衰减增益值设置单元 52为实现如下功能：对所述获得的背景噪声帧 ^ C D E F G H对应的背景噪声信号设置能量衰减增益值，使得所述背景噪声帧 B C D E F G H对应的背景噪声信号能量衰减增益值分别与其前一帧对应的信号能量衰减增益值相差在阈值范围内，还可以具体用于：

参照图 3 的本发明实施例的语音信号处理所得另一语音信号幅度示意图，与图 2所示的本发明实施例的语音信号处理所得语音信号幅度不同的是，此处采用 "进 2退的方法，需要说明的是，下面的 2Δα也应该小于所述阈值，例如，令：

背景噪声帧 C 对应的背景噪声信号能量衰减增益值^ __C=^^-A« , 即。^以为前提；

背景噪声帧 D对应的背景噪声信号能量衰减增益值 _αι__β=_α„。^₊2Δ« , 即

«„。以 „^为前提；

背景噪声帧 Ε 对应的背景噪声信号能量衰减增益值《„ _£=_α„ _β-Δ« , 即 6_£以 " 为前提；

背景噪声帧 F对应的背景噪声信号能量衰减增益值《„。^ =_αι__{£ +}2Δ«, 即

« 以 _6£为前提；

背景噪声帧 G对应的背景噪声信号能量衰减增益即

«„。,^以为前提；

//以 ,^为前提，

这样，在保证了所述背景噪声帧 B C D E F G H对应的背景噪声信号能量衰减增益值分别与其前一个背景噪声帧对应的背景噪声信号能量衰减增益值相差在所述阈值范围内的同时，使得背景噪声帧（、 D、 E、 F、 G、 H对应的背景噪声信号能量衰减增益值按照一个大致顺序的顺序增加，直至背景噪声帧对应的背景噪声信号能量衰减增益值为 1 为止即可，因此，采用其他类似的方式也可认为是本发明的其他实施方式，例如，上图 4所示的本发明实施例的语音信号处理所得另一语音信号幅度。

需要说明的有如下几点：

1、上述本发明实施例以背景噪声帧 C、 D、 E、 F、 G、 H为例进行说明，而在背景噪声帧数量可多可少的实际情况下，本发明也可以同样适用；

2、上述阈值的取值可以根据实际情况，从如下值中取值但不仅限于： 2Δα、 2.5Δα , 3Δα等，其中 ^{Δα =} ^ ; 根据该阈值的取值范围，可根据实际情况，确定上述本发明实施例中的起始能量衰减增益值以及能量衰减增益值增加值的取值；

3、当发生丟失的为背景噪声帧时，由于根据现有技术的 FEC技术处理得到的差错隐藏信号能量会比没有发生背景噪声帧丟失时衰减得更为剧烈，若此时在差错隐藏帧之后得到背景噪声帧，那么差错隐藏信号区域到背景噪声信号区域的能量过渡会比没有发生背景噪声帧丟失时突变更加明显，在这种情况下应用本发明实施例会有效地使差错隐藏信号区域与背景噪声信号区域之间的能量过渡自然、平滑，提高听者听觉的舒适感。

另外，本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体（Read-Only Memory, ROM )或随机存储记忆体（Random Access Memory, RAM )等。

以上所述是本发明的具体实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

权利要求

1、一种语音信号处理方法，其特征在于，包括：

当差错隐藏帧之后获得的为背景噪声帧时，对获得的所述背景噪声帧对应的背景噪声信号设置能量衰减增益值，使所述背景噪声帧对应的背景噪声信号能量衰减增益值与其前一帧对应的信号能量衰减增益值相差在阈值范围内；利用所述能量衰减增益值控制所述背景噪声帧对应的背景噪声信号的能量衰减。

2、如权利要求 1所述的语音信号处理方法，其特征在于，所述对获得的所述背景噪声帧对应的背景噪声信号设置能量衰减增益值包括：

获得所述差错隐藏帧对应的差错隐藏信号能量衰减增益值；

根据所述差错隐藏帧对应的差错隐藏信号能量衰减增益值设置背景噪声帧起始能量衰减增益值，该起始能量衰减增益值与所述差错隐藏帧对应的差错隐藏信号能量衰减增益值相差在阈值范围内；

将所述起始能量衰减增益值与小于所述阈值的能量衰减增益值增加值的和值，设置为所述差错隐藏帧之后获得的第一个背景噪声帧对应的背景噪声信号能量衰减增益值。

3、如权利要求 2所述的语音信号处理方法，其特征在于，该方法还包括：当所述差错隐藏帧之后获得的为至少两个背景噪声帧时，除所述第一个背景噪声帧之外，将其他背景噪声帧的前一背景噪声帧对应的信号能量衰减增益值与所述能量衰减增益值增加值的和值，设置为所述其他背景噪声帧对应的背景噪声信号能量衰减增益值。

4、如权利要求 3所述的语音信号处理方法，其特征在于，所述能量衰减增益值增加值为 1/256, 或为一设定值，该设定值为：

1与所述起始能量衰减增益值的差值，该差值与预先设定的背景噪声帧个数相比得到所述设定值。

5、如权利要求 4所述的语音信号处理方法，其特征在于，所述预先设定的背景噪声帧个数为 100。

6、如权利要求 1或 2所述的语音信号处理方法，其特征在于，所述阈值为根据需要获得的语音信号的质量，得出的所述背景噪声帧对应的背景噪声信号能量衰减增益值分别与其前一帧对应的信号能量衰减增益值的差值范围的最大值。

7、如权利要求 1至 5中任一项所述的语音信号处理方法，其特征在于，所述起始能量衰减增益值等于所述差错隐藏帧对应的差错隐藏信号能量衰减增益值。

8、如权利要求 1至 5中任一项所述的语音信号处理方法，其特征在于，所述利用所述能量衰减增益值控制所述背景噪声帧对应的背景噪声信号的能量衰减包括：

恢复出所述背景噪声帧对应的背景噪声信号；

利用所述能量衰减增益值对所述背景噪声信号进行幅度衰减。

9、如权利要求 1至 5中任一项所述的语音信号处理方法，其特征在于，所述差错隐藏帧中包含有进行差错隐藏处理的背景噪声帧。

10、一种语音信号处理装置，其特征在于，包括：

能量衰减增益值设置单元，用于对获得的所述背景噪声帧对应的背景噪声信号设置能量衰减增益值，使所述背景噪声帧对应的背景噪声信号能量衰减增益值与其前一帧对应的信号能量衰减增益值相差在阈值范围内；

11、如权利要求 10所述的语音号处理装置，其特征在于，所述能量衰减增益值设置单元包括：

获取单元，用于获得所述差错隐藏帧对应的差错隐藏信号能量衰减增益值；第一设置单元，用于根据所述差错隐藏帧对应的差错隐藏信号能量衰减增益值设定背景噪声帧起始能量衰减增益值，该起始能量衰减增益值与所述差错隐藏帧对应的差错隐藏信号能量衰减增益值相差在阈值范围内；

第二设置单元，用于将所述起始能量衰减增益值与小于所述阈值的能量衰减增益值增加值的和值，设置为所述差错隐藏帧之后获得的第一个背景噪声帧对应的背景噪声信号能量衰减增益值。

12、如权利要求 11所述的语音信号处理装置，其特征在于，当所述差错隐藏帧之后获得的为至少两个背景噪声帧时，所述能量衰减增益值设置单元还包括：

第三设置单元，用于将除所述第一个背景噪声帧之外的其他背景噪声帧的前一背景噪声帧对应的信号能量衰减增益值与所述能量衰减增益值增加值的和值，设置为所述其他背景噪声帧对应的背景噪声信号能量衰减增益值。

13、如权利要求 10或 11所述的语音信号处理装置，其特征在于，所述阈值为根据需要获得的语音信号的质量，得出的所述背景噪声帧对应的背景噪声信号能量衰减增益值分别与其前一帧对应的信号能量衰减增益值的差值范围的最大值。

14、如权利要求 10至 12中任一项所述的语音信号处理装置，其特征在于，所述控制单元包括：

背景噪声信号获取单元，用于恢复出所述背景噪声帧对应的背景噪声信号；处理单元，用于利用所述能量衰减增益值对所述背景噪声信号进行幅度衰减。

15、如权利要求 10至 12中任一项所述的语音信号处理装置，其特征在于，所述差错隐藏帧中包含有进行差错隐藏处理的背景噪声帧。

16、如权利要求 10至 12中任一项所述的语音信号处理装置，其特征在于所述语音信号处理装置为语音解码器。