CN101136201B

CN101136201B - 对音频信号中认为丢失的一部分进行替换的系统及方法

Info

Publication number: CN101136201B
Application number: CN2007101427004A
Authority: CN
Inventors: 朱因韦·陈; 杰斯·赛森; 罗伯塔·W·措普夫
Original assignee: Zyray Wireless Inc
Current assignee: Avago Technologies General IP Singapore Pte Ltd
Priority date: 2006-08-11
Filing date: 2007-08-13
Publication date: 2011-04-13
Anticipated expiration: 2027-08-13
Also published as: EP1887563A1; US20090248405A1; US8280728B2; EP1887563B1; TWI377562B; KR100912045B1; CN101136201A; HK1119479A1; TW200907931A; US8457952B2; KR20080014678A; US20080040122A1

Abstract

本发明提供了一种系统和方法，用于在子带预测话音编码器如ITU-T建议G.722宽带话音编码器中使用激励波形外推法来进行分组丢失隐藏。该系统和方法可用于隐藏子带预测编码器中由分组丢失而造成的质量下降影响，并在将激励外推技术应用到子带预测编码器时，解决一些子带结构性问题。

Description

对音频信号中认为丢失的一部分进行替换的系统及方法

技术领域

本发明涉及语音通信，更具体地说，涉及对音频信号中认为丢失的一部分进行替换的系统和方法。

背景技术

在通过分组网络以数字方式传送语音或音频信号的过程中，编码语音/音频信号通常被分成帧，然后打包到分组中，其中每个分组中包含编码语音/音频数据的一个或多个帧。这些分组随后将通过分组网络进行传送。有时，一些分组会丢失，另一些时候，一些分组到达过晚以致于不再有用，因此被认为像是丢失了一样。这种分组丢失将造成音频质量的明显下降，除非使用特别的技术来隐藏(conceal)分组丢失造成的影响。在现有技术中，已经开发出基于激励信号(有时也称为预测残余信号)的外推法的应用于全频带预测编码器的分组丢失隐藏方法。例如，参见美国专利U.S.Patent No.5615298to chenentitled“Excitation Signal Synthesis during Frame Erasure or PacketLoss”。然而，在将这种技术应用到子带预测编码器如ITU-T建议G.722宽带话音编码器时就会出现问题，这些问题至少在部分上是由这些编码器的结构造成的。子带预测编码器首先使用分解滤波器组合将输入信号分割为不同频带，然后对每个子带信号应用预测编码。在解码器一侧，解码子带信号在合成滤波器组合中合并为全频带输出信号。

发明内容

本发明的实施例可用于隐藏子带预测编码器中由于分组丢失(或分组删除)导致的质量下降影响。当对子带预测编码器应用激励外推技术时，本发明的实施例可解决子带结构性问题。

具体来说，本发明提供了一种在子带预测编码器中对音频信号中认为丢失的一部分进行替换的系统。该系统包括第一激励外推器、第二激励外推器、第一合成滤波器、第二合成滤波器及合成滤波器组合。第一激励外推器用于基于与音频信号的一个或多个先前接收部分相关联的第一子带激励信号，生成第一子带外推激励信号。第二激励外推器用于基于与音频信号的一个或多个先前接收部分相关联的第二子带激励信号，生成第二子带外推激励信号。第一合成滤波器用于对第一子带外推激励信号进行滤波，生成合成第一子带音频信号。第二合成滤波器用于对第二子带外推激励信号进行滤波，生成合成第二子带音频信号。合成滤波器组合用于将至少合成第一子带音频信号和合成第二子带音频信号合并，生成全频输出音频信号，该全频输出音频信号对应于所述音频信号中认为丢失的那一部分。

上述系统还可包括第一解码器和第二解码器。第一解码器用于解码第一子带比特流，该第一子带比特流与音频信号中认为没有丢失的一部分相关联，第二解码器用于解码第二子带比特流，该第二子带比特流与音频信号中认为没有丢失的所述一部分相关联。第一解码器可以是低频自适应差分脉冲编码调制(ADPCM)解码器，第二解码器可以是高频ADPCM解码器。第一合成滤波器可以是低频ADPCM解码器合成滤波器，第二合成滤波器可以是高频ADPCM解码器合成滤波器。

本发明还提供了一种在子带预测编码器中对音频信号中认为丢失的一部分进行替换的方法。依照本方法，基于与音频信号中一个或多个先前接收的部分相关联的第一子带激励信号生成第一子带外推激励信号。基于与音频信号中一个或多个先前接收的部分相关联的第二子带激励信号生成第二子带外推激励信号。在第一合成滤波器中对第一子带外推激励信号进行滤波，生成合成第一子带音频信号。在第二合成滤波器中对第二子带外推激励信号进行滤波，生成合成第二子带音频信号。将至少合成第一子带音频信号和合成第二子带音频信号进行合并，生成全频输出音频信号，该全频输出音频信号对应所述音频信号中认为丢失的那一部分。

上述方法还可进一步包括在第一解码器中解码第一子带比特流，该第一子带比特流与音频信号中认为没有丢失的一部分相关联；还包括在第二解码器中解码第二子带比特流，该第二子带比特流与音频信号中认为没有丢失的所述一部分相关联。第一解码器可以是低频ADPCM解码器，第二解码器可以是高频ADPCM解码器。第一合成滤波器可以使低频ADPCM解码器合成滤波器，第二合成滤波器可以使高频ADPCM解码器合成滤波器。

本发明还提供了另一种在子带预测编码器中对音频信号中认为丢失的一部分进行替换的系统。该系统包括第一合成滤波器组合、全频激励外推器、分解滤波器组合、第一合成滤波器、第二合成滤波器和第二合成滤波器组合。第一合成滤波器组合用于将与音频信号中一个或多个先前接收的部分相关联的至少第一子带激励信号和与音频信号中一个或多个先前接收的部分相关联的第二子带激励信号合并，生成全频激励信号。所述全频激励外推器用于接收所述全频激励信号，从中生成全频外推激励信号。分解滤波器组合用于将全频外推激励信号分割为至少第一子带外推激励信号和第二子带外推激励信号。第一合成滤波器用于对第一子带外推激励信号进行滤波，生成合成第一子带音频信号。第二合成滤波器用于对第二子带外推激励信号进行滤波，生成合成第二子带音频信号。第二合成滤波器组合用于将至少合成第一子带音频信号和合成第二子带音频信号合并，生成全频输出音频信号，该全频输出音频信号对应所述音频信号中认为丢失的那一部分。

上述系统还可进一步包括第一解码器和第二解码器。第一解码器用于解码第一子带比特流，该第一子带比特流与音频信号中认为没有丢失的一部分相关联，第二解码器用于解码第二子带比特流，该第二子带比特流与音频信号中认为没有丢失的所述一部分相关联。第一解码器可以是低频ADPCM解码器，第二解码器可以是高频ADPCM解码器。第一合成滤波器可以是低频ADPCM解码器合成滤波器，第二合成滤波器可以是高频ADPCM解码器合成滤波器。

本发明还提供了另一种在子带预测编码器中对音频信号中认为丢失的一部分进行替换的方法。依据这另一种方法，将与音频信号的一个或多个先前接收部分相关联的第一子带激励信号和与音频信号的一个或多个先前接收部分相关联的第二子带激励信号合并，生成全频激励信号。随后基于全频激励信号生成全频外推激励信号。全频外推激励信号随后被分割为至少第一子带外推激励信号和第二子带外推激励信号。第一子带外推激励信号在第一合成滤波器中进行滤波，生成合成第一子带音频信号。第二子带外推激励信号随后在第二合成滤波器中进行滤波，生成合成第二子带音频信号。将至少合成第一子带音频信号和合成第二子带音频信号进行合并，生成全频输出音频信号，该全频输出音频信号对应所述音频信号中认为丢失的那一部分。

上述方法还可进一步包括在第一解码器中解码第一子带比特流，该第一子带比特流与音频信号中认为没有丢失的一部分相关联；还包括在第二解码器中解码第二子带比特流，该第二子带比特流与音频信号中认为没有丢失的所述一部分相关联。所述第一解码器可以是低频ADPCM解码器，所述第二解码器可以是高频ADPCM解码器。第一合成滤波器可以是低频ADPCM解码器合成滤波器，第二合成滤波器可以是高频ADPCM解码器合成滤波器。

本发明的其它特征和优点以及本发明各种实施例的结构和操作，将结合附图进行详细的描述。应当注意，本发明并非仅限于将要描述的特定实施例。这些实施例仅是出于描述的目的而提供的。对于本领域的技术人员来说，基于本文讲述的方法，还可设计出其它实施例。

根据本发明的一个方面，提供一种在子带预测编码器中对音频信号中认为丢失的一部分进行替换的系统，包括：

第一激励外推器，用于基于与所述音频信号的一个或多个先前接收的部分相关联的第一子带激励信号生成第一子带外推激励信号；

第二激励外推器，用于基于与所述音频信号的一个或多个先前接收的部分相关联的第二子带激励信号生成第二子带外推激励信号；

第一合成滤波器，用于对所述第一子带外推激励信号进行滤波，生成合成第一子带音频信号；

第二合成滤波器，用于对所述第二子带外推激励信号进行滤波，生成合成第二子带音频信号；

合成滤波器组合，用于合并至少所述合成第一子带音频信号和所述合成第二子带音频信号，生成全频输出音频信号，该全频输出音频信号对应于所述音频信号中认为丢失的那一部分。

在本发明所述的系统中，还包括：

第一解码器，用于解码第一子带比特流，该第一子带比特流与所述音频信号中认为没有丢失的一部分相关联；

第二解码器，用于解码第二子带比特流，该第二子带比特流与所述音频信号中认为没有丢失的所述一部分相关联。

在本发明所述的系统中，

所述第一解码器为低频自适应差分脉冲编码调制(ADPCM)解码器；

所述第二解码器为高频ADPCM解码器；

所述第一合成滤波器为低频ADPCM解码器合成滤波器；

所述第二合成滤波器为高频ADPCM解码器合成滤波器。

在本发明所述的系统中，还包括：

比特流解复用器，用于将输入比特流解复用为所述第一子带比特流和所述第二子带比特流。

在本发明所述的系统中，还包括：

用于在分别生成所述合成第一子带音频信号和所述合成第二子带音频信号之后，更新所述第一解码器和所述第二解码器内部状态的逻辑。

在本发明所述的系统中，用于更新所述第一解码器和所述第二解码器的内部状态的所述逻辑包括：

第一逻辑，用于将所述合成第一子带音频信号通过所述第一编码器进行处理；

第二逻辑，用于将所述合成第二子带音频信号通过所述第二编码器进行处理。

第一逻辑，用于对所述第一子带外推激励信号进行量化，使用所述量化第一子带外推激励信号驱动所述第一合成滤波器；

第二逻辑，用于对所述第二子带外推激励信号进行量化，使用所述量化第二子带外推激励信号驱动所述第二合成滤波器。

根据本发明的一个方面，提供一种在子带预测编码器中对音频信号中认为丢失的一部分进行替换的方法，包括：

基于与所述音频信号的一个或多个先前接收的部分相关联的第一子带激励信号生成第一子带外推激励信号；

基于与所述音频信号的一个或多个先前接收的部分相关联的第二子带激励信号生成第二子带外推激励信号；

在第一合成滤波器中对所述第一子带外推激励信号进行滤波，生成合成第一子带音频信号；

在第二合成滤波器中对所述第二子带外推激励信号进行滤波，生成合成第二子带音频信号；

合并至少所述合成第一子带音频信号和所述合成第二子带音频信号，生成全频输出音频信号，该全频输出音频信号对应于所述音频信号中认为丢失的那一部分。

在本发明所述的方法中，还包括：

在第一解码器中解码第一子带比特流，该第一子带比特流与所述音频信号中认为没有丢失的一部分相关联；

在第二解码器中解码第二子带比特流，该第二子带比特流与所述音频信号中认为没有丢失的所述一部分相关联。

在本发明所述的方法中，

所述第二解码器为高频ADPCM解码器；

所述第一合成滤波器为低频ADPCM解码器合成滤波器；

所述第二合成滤波器为高频ADPCM解码器合成滤波器。

在本发明所述的方法中，所述方法还包括：

将输入比特流解复用为所述第一子带比特流和所述第二子带比特流。

在本发明所述的方法中，还包括：

在分别生成所述合成第一子带音频信号和所述合成第二子带音频信号之后，更新所述第一解码器和所述第二解码器的内部状态。

在本发明所述的方法中，更新所述第一解码器和所述第二解码器的内部状态包括：

将所述合成第一子带音频信号通过第一编码器进行处理；

将所述合成第二子带音频信号通过第二编码器进行处理。

对所述第一子带外推激励信号进行量化；

使用所述量化第一子带外推激励信号驱动所述第一合成滤波器；

对所述第二子带外推激励信号进行量化；

使用所述量化第二子带外推激励信号驱动所述第二合成滤波器。

第一合成滤波器组合，用于合并与所述音频信号的一个或多个先前接收的部分相关联的至少第一子带激励信号和与所述音频信号的一个或多个先前接收的部分相关联的第二子带激励信号，生成全频激励信号；

全频激励外推器，用于接收所述全频激励信号，从中生成全频外推激励信号；

分解滤波器组合，用于将所述全频外推激励信号分割为至少第一子带外推激励信号和第二子带外推激励信号；

第二合成滤波器组合，用于合并所述合成第一子带音频信号和所述合成第二子带音频信号，生成全频输出音频信号，该全频输出音频信号对应于所述音频信号中认为丢失的那一部分。

在本发明所述的系统中，还包括：

第一解码器，用于解码第一子带比特流，所述第一子带比特流与所述音频信号中认为没有丢失的一部分相关联；

第二解码器，用于解码第二子带比特流，所述第二子带比特流与所述音频信号中认为没有丢失的所述一部分相关联。

在本发明所述的系统中，所述第一解码器为低频自适应差分脉冲编码调制(ADPCM)解码器；

所述第二解码器为高频ADPCM解码器；

所述第一合成滤波器为低频ADPCM解码器合成滤波器；

所述第二合成滤波器为高频ADPCM解码器合成滤波器。

在本发明所述的系统中，还包括：

合并与所述音频信号的一个或多个先前接收的部分相关联的至少第一子带激励信号和与所述音频信号的一个或多个先前接收的部分相关联的第二子带激励信号，生成全频激励信号；

基于所述全频激励信号，生成全频外推激励信号；

将所述全频外推激励信号分割为至少第一子带外推激励信号和第二子带外推激励信号；

合并所述合成第一子带音频信号和所述合成第二子带音频信号，生成全频输出音频信号，该全频输出音频信号对应于所述音频信号中认为丢失的那一部分。

在本发明所述的方法中，所述方法还包括：

在本发明所述的方法中，

所述第二解码器为高频ADPCM解码器；

所述第一合成滤波器为低频ADPCM解码器合成滤波器；

所述第二合成滤波器为高频ADPCM解码器合成滤波器。

在本发明所述的方法中，还包括：

将所述合成第一子带音频信号通过第一编码器进行处理；

将所述合成第二子带音频信号通过第二编码器进行处理。

对所述第一子带外推激励信号进行量化；

对所述第二子带外推激励信号进行量化；

附图说明

图1是ITU-T G.722子带预测编码的编码器结构示意图；

图2是ITU-T G.722子带预测编码的解码器结构示意图；

图3是依据本发明一个实施例的配置成在子带预测编码器中对认为丢失的那一部分音频信号进行替换的第一系统的结构示意图；

图4是依据本发明一个实施例的在子带预测编码器中用于替换认为丢失的那一部分音频信号的第一方法的流程图；

图5是依据本发明一个实施例的配置成在子带预测编码器中对认为丢失的那一部分音频信号进行替换的第二系统的结构示意图；

图6是依据本发明一个实施例的在子带预测编码器中用于替换认为丢失的那一部分音频信号的第二方法的流程图；

图7是依据本发明一个实施例的计算机系统的结构示意图；

通过下文与附图相结合的具体实施方式部分，本发明的特点和优点将变得更为清晰。另外，附图标记最左边的数字用于标识该附图标记首次出现的那幅附图的编号。

具体实施方式

A.简单介绍

下文中本发明的具体实施方式涉及到附图，其中描述了本发明的示范性实施例。也可能存在其它实施例，在不脱离本发明实质的前提下，对所描述的实施例还可进行修改。因此，下文中具体实施方式的目的并不是限制本发明的范围。本发明的范围是由权利要求定义的。

对于本发明所属技术领域的技术人员来说，正如下文将要描述的那样，很明显，本发明能够通过采用硬件、软件、固件和/或附图中描述的实体的许多不同实施例来实现。用于实现本发明的任何实际的软件代码(结合专用的控制硬件)都无法限制本发明的范围。因此，本文所描述的有关本发明的操作和行为仅供理解本发明，通过下文中所描述的细节，还可以对文中的实施例做出修改和变更。

应当明白，尽管下文本发明具体实施方式中描述的内容是有关话音信号的处理，但本发明还可用于其它类型音频信号的处理。因此，文中的术语“话音”和“话音信号”纯粹是为了描述的方便才使用的，其目的并不是要限定本发明的范围。相关领域的技术人员应当明白，这些术语能够通过更常用的术语“音频”和“音频信号”来替换。此外，尽管文中描述的话音和音频信号被分为帧，但本领域的技术人员应当明白，这些信号还可分成其它不同的段，包括但不限于子帧。因此，本文所描述的对帧所采取的操作也可由对话音或音频信号的其它段(例如子帧)所采用的类似操作所替换。

此外，尽管下文具体实施方式所讨论的是通过分组网络传送音频信号时出现的帧丢失情况(称为“分组丢失”)，但本发明并非仅限于分组丢失隐藏技术(PLC)。例如，在无线网络中，音频信号帧也可能由于信道损坏而出现丢失或删除(erased)。这种情况称为“帧删除”。当这种情况出现时，为避免输出话音质量出现较大的降低，无线系统中的解码器需要执行“帧删除隐藏”(FEC)，以尝试隐藏丢失帧造成的质量下降影响。对于PLC或FEC算法而言，分组丢失和帧删除所指的都是同一个问题：发送的某些帧无法进行解码，于是PLC或FEC算法需要生成波形来填充丢失帧所对应的波形空白，从而隐藏帧丢失所造成的质量下降影响。由于术语FLC和PLC通常是指同一类技术，因此二者可以互换使用。因此，为便于描述，术语“分组丢失隐藏”或PLC在本文中指代上述两种技术。

B.子带预测编码回顾

为了能够更好的理解下文方案中描述的本发明的各个实施例，首先来回顾一下子带预测编码的基本原理。通常子带预测编码器将输入音频信号分割成N个子带(其中N≥2)。在不失一般性的前提下，本文以ITU-T G.722编码器的二带预测编码系统为例来进行描述。本领域的技术人员应该很容易就可将下文描述的内容推广到N带子带预测编码器。

图1是ITU-T G.722子带预测编码的编码器结构100示意图。编码器结构100包括分解滤波器组合(analysis filter bank)110、低频(low-band)自适应差分脉冲编码调制(ADPCM)编码器120、高频(high-band)ADPCM编码器130和比特流复用器140。分解滤波器组合110将输入音频信号分割成低频音频信号和高频音频信号。低频音频信号由低频ADPCM编码器120编码为低频比特流。高频音频信号由高频ADPCM编码器130编码为高频比特流。比特流复用器140将低频比特流和高频比特流复用为单个输出比特流。在本文描述的分组传输应用中，该输出比特流将被打包装入分组中，然后发往子带预测解码器200(如图2所示)。

如图2所示，解码器200包括比特流解复用器210、低频ADPCM解码器220、高频ADPCM解码器230和合成滤波器组合240。比特流解复用器210将输入比特流分成低频比特流和高频比特流。低频ADPCM解码器220将低频比特流解码为解码低频音频信号。高频ADPCM解码器230将高频比特流解码为解码高频音频信号。合成滤波器组合(synthesis filter bank)240随后将解码低频音频信号和解码高频音频信号合并成全频(full-band)输出音频信号。

C.基于激励波形外推法在子带预测编码器中执行分组丢失隐藏的第一实施例

图3是依据本发明第一实施例的系统300的结构示意图。为便于描述，在文中将系统300描述为ITU-T G.722编码器的一部分，但是本领域的技术人员应当明白，本文所描述的发明内容普遍适用于任意N带子带预测编码系统。

如图3所示，系统300包括比特流解复用器310、低频ADPCM解码器320、低频激励外推器322、低频ADPCM解码器合成滤波器324、第一开关326、高频ADPCM解码器330、高频激励外推器332、高频ADPCM解码器合成滤波器334、第二开关336和合成滤波器组合340。比特流解复用器310的功能与图2中的比特流解复用器210基本相同，合成滤波器组合340的功能与图2中的合成滤波器组合240基本相同。

系统300收到的输入比特流被分为一系列的帧。系统300收到的帧可能是“好的”，在这种情况下，该帧适于进行正常解码；系统300收到的帧也可能是“坏的”，在这种情况下，该帧必须进行替换。正如上文中描述的那样，“坏的”帧是由分组丢失造成的。

如果系统300收到的帧是好的，则低频ADPCM解码器320会将低频比特流正常解码为解码低频音频信号。在这种情况下，第一开关326将连接到上方的标记为“好帧”的一端，从而将解码低频音频信号连接到合成滤波器组合340。类似的，高频ADPCM解码器330将高频比特流正常解码为解码高频音频信号。在这种情况下，第二开关336将连接到上方的标记为“好帧”的一端，从而将解码高频音频信号连接到合成滤波器组合340。因此，对于好帧而言，图3中系统的功能与图2中系统200基本相同，唯一的例外之处在于，信号中的低频激励信号将存储在低频激励外推器322中，以便在将来出现坏帧时使用；同理，信号中的高频激励信号将存储在高频激励外推器332中，以便在将来出现坏帧时使用。

如果系统300收到的帧是坏的，则每个子带的激励信号将分别从前一好帧中外推出来，以填充当前坏帧中的空白部分。这一任务由低频激励外推器322和高频激励外推器332来完成。在公知现有技术中，由许多激励外推方法可供使用。美国专利No.5615298提供了这种方法的一个例子，本文引用了其中的全部内容。通常来说，对于话音波形近似周期性的语音帧，激励波形也有些趋于周期性，从而可以以周期性方式进行外推，以此来保持周期性特征。对于话音波形看似更像噪声的非语音帧而言，激励信号也趋于近似噪声，在这种情况下，激励波形可使用随机噪声生成器通过适当的缩放来获取。在话音的过渡区域，可使用周期性外推和噪声生成器输出的混合信号。

每个子带的外推激励信号将通过该子带的预测编码器的合成滤波器进行处理，获得该子带的重建音频信号。具体来说，低频激励外推器322输出的外推低频激励信号将通过低频ADPCM解码器合成滤波器324进行处理，获得合成低频音频信号。类似的，高频激励外推器332输出的外推高频激励信号将通过高频ADPCM解码器合成滤波器334进行处理，获得合成高频音频信号。

在处理坏帧的过程中，第一开关326和第二开关336均将处于下方的标记为“坏帧”的一端。因此，这些开关会将合成低频音频信号和合成高频音频信号连接到合成滤波器组合340，由合成滤波器组合340将它们合并为当前坏帧的合成输出音频信号。

在图3中的系统对坏帧处理完成之前，其需要执行下列至少一项任务：更新低频ADPCM解码器320和高频ADPCM解码器330的内部状态。这种内部状态包括滤波器系数、滤波器存储器和量化器步长(step)大小。更新每个子带ADPCM解码器内部状态的操作在图3中通过从低频ADPCM解码器合成滤波器324到低频ADPCM解码器320的虚线箭头的方式表示出来，以及通过从高频ADPCM解码器合成滤波器334到高频ADPCM解码器330的虚线箭头的方式表示出来。本领域的技术人员应当明白，许多可能方法可用于执行这一任务。

用于更新子带ADPCM解码器320和330内部状态的第一示范性技术是将重建的子带信号通过该子带的对应的ADPCM编码器(分别是图1中的模块120和130)。由于每个子带ADPCM编码器具有与对应子带ADPCM解码器相同的内部状态，在完成对合成子带信号(低频ADPCM解码器合成滤波器324或高频ADPCM解码器合成滤波器334的输出)的整个当前重建帧的编码之后，对合成子带信号的整个重建帧进行编码后留下的滤波器系数、滤波器存储器和量化器步长大小将用于更新该子带的ADPCM解码器对应的内部状态。

作为选择，在第二示范性技术中，每个子带的外推激励信号可进行正常的量化过程和正常的解码器滤波和解码器滤波器系数更新，以此来更新该子带ADPCM解码器的内部状态。在这种情况下，区别于通过单独的步骤来进行这种内部状态的更新，一种更为高效的方法是对外推子带激励信号进行量化，然后使用量化外推激励信号驱动子带解码器合成滤波器(低频ADPCM解码器合成滤波器324或高频ADPCM解码器合成滤波器334)，与此同时，通过低频ADPCM解码器320和高频ADPCM解码器330中所使用的相同的系数更新方法来更新滤波器系数。通过这种方式，内部状态的更新可看作是执行低频ADPCM解码器合成滤波器324和高频ADPCM解码器合成滤波器334任务时的副产品。

还有其它方法可用于更新内部状态。例如，对于某些情况或信号段来说，最好使用先前好帧中先前状态的平均值(版本)来更新当前坏帧末端的内部状态。而在一些情况下(例如，在发生长时间的分组丢失的情况下)，最好将每个子带ADPCM解码器的所有内部状态重新设置为它们的初始状态。

在完成在坏帧末端对子带预测解码器320和330内部状态的适当更新之后，系统便可以开始处理下一帧，不管下一个帧是好帧还是坏帧。

为进一步描述第一实施例，图4描述了一个方法流程图400，系统300按照该方法进行操作，以处理输入比特流中的单个帧。如图4所示，流程图400中的方法开始于步骤402，系统300收到输入比特流中的一个帧。在判断步骤404，系统300判断该帧是好帧还是坏帧。如果该帧是好帧，则执行从步骤406开始的一系列步骤。如果该帧是坏帧，则执行从步骤416开始的一系列步骤。

下面描述在收到好帧时所执行的从步骤406开始的一系列步骤。在步骤406，比特流解复用器310将该好帧的比特流解复用为低频比特流和高频比特流。在步骤408，低频ADPCM解码器320正常解码低频比特流，生成解码低频音频信号。在步骤410，高频ADPCM解码器330正常解码高频比特流，生成解码高频音频信号。在步骤412，合成滤波器组合340将解码低频音频信号和解码高频音频信号合并，生成全频输出音频信号。在步骤414，当前帧的低频激励信号将存储在低频激励外推器322中，以供在以后处理坏帧时使用；同时，当前帧的高频高频激励信号将存储在高频激励外推器322中，以供在以后处理坏帧时使用。在步骤414之后，如步骤428所示，处理好帧的过程将结束。

下面描述在收到坏帧时所执行的从步骤416开始的一系列步骤。在步骤416，基于系统300所处理的一个或多个先前的帧的低频激励信号，低频激励外推器322外推出低频激励信号。在步骤418，基于系统300所处理的一个或多个先前的帧的高频激励信号，高频激励外推器332外推出高频激励信号。在步骤420，低频外推激励信号通过低频ADPCM解码器合成滤波器324处理，获得合成低频音频信号。在步骤422，高频外推激励信号通过高频ADPCM解码器合成滤波器334处理，获得合成高频音频信号。在步骤424，合成滤波器组合340将合成低频音频信号和合成高频音频信号合并，生成全频输出音频信号。在步骤426，对低频ADPCM解码器320和高频ADPCM解码器330的内部状态进行更新。在步骤426之后，如步骤428所示，处理坏帧的过程将结束。

D.基于激励波形外推法在子带预测编码器中执行分组丢失隐藏的第二实施例

在第二实施例中，一个或多个先前接收的好帧(存储在缓存中)的子带激励信号首先通过合成滤波器组合处理，获得先前接收好帧的全频激励信号，然后对该全频激励信号进行外推，以此来填充当前坏帧的空白。该全频外推激励信号随后将通过分解滤波器组合处理，将该信号分割为子带外推激励信号，然后通过子带解码器合成滤波器处理，最终通过合成滤波器组合处理，生成输出音频信号。每个子带的预测解码器更新内部状态的其余步骤与上文参考第一实施例所描述的方法类似。

图5中展示了本发明第二实施例的结构示意图。在图5所示的系统500中，与图3中模块相比，具有相似编号的模块执行相似的功能。例如，模块520和530分别与模块320和330的功能相同。需要重申的是，图5中展示的只是依据本发明第二实施例的一个示范性系统。本领域的技术人员应当明白，除了图5中所描述的二带系统，子带预测编码系统还可以是N带系统，其中N为大于2的整数。类似的，每个子带的预测编码器也无需一定是图5中展示的ADPCM编码器，而可以是任何通用预测编码器，并且可以是前向自适应或后向自适应的。

现在来看图5，当系统500处理好帧的时候，开关526和536均处于上方的标记为“好帧”的一端，比特流解复用器510、低频ADPCM解码器520、高频ADPCM解码器530和合成滤波器组合540的运行方式分别与比特解复用器310、低频ADPCM解码器320、高频ADPCM解码器330和合成滤波器组合540相同，以便正常地解码输入比特流。此外，低频ADPCM解码器520在处理好帧过程中生成的低频激励信号存储在低频激励缓冲器590中。同理，高频ADPCM解码器530在处理好帧过程中生成的高频激励信号存储在高频激励缓冲器550中。

当系统500处理坏帧时，开关526和536均处于下方的标记为“坏帧”的一端。在这种情况下，合成滤波器组合560从低频激励缓冲器590接收低频激励信号，从高频激励缓冲器550接收高频激励信号，然后将两个子带激励信号合并为全频激励信号。全频激励外推器570随后接收该全频激励信号，对其进行外推，以填充当前坏帧中的空白。在一个实施例中，全频激励外推器570将该信号外推到当前坏帧的外面，以补偿合成滤波器组合560和分解滤波器组合580中固有的滤波延迟。分解滤波器组合580随后将该全频外推激励信号分割为低频外推激励信号和高频外推激励信号，以与图1中的分解滤波器组合110相同的方式进行频带分割操作。

低频ADPCM解码器合成滤波器524随后对低频外推激励信号进行滤波，生成合成低频音频信号，高频ADPCM解码器合成滤波器534随后对高频外推激励信号进行滤波，生成合成高频音频信号。这两个子带音频信号通过开关526和536到达合成滤波器组合440，合成滤波器组合440将这两个子带音频信号合并成全频输出音频信号。

与图3中的系统300类似，在图5所示的系统500中，低频ADPCM解码器520和高频ADPCM解码器530的内部状态也需要更新到适当的值，然后才能开始对下一个好帧进行正常解码，否则将出现明显的失真。低频ADPCM解码器520和高频ADPCM解码器530内部状态的更新可采用上文第一实施例中描述的几种方法中的一种。

为进一步描述第二实施例，图6描述了一个方法流程图600，系统500依照该方法操作，处理输入比特流中的单个帧。如图6所示，流程图600中的方法开始于步骤602，系统500接收输入比特流中的帧。在判断步骤604，系统500判断该帧是好帧还是坏帧。如果该帧是好帧，则执行从步骤606开始的一系列步骤。如果该帧是坏帧，则执行从步骤616开始的一系列步骤。

下面描述当收到好帧时从步骤606开始的一系列步骤。在步骤606，比特流解复用器510将好帧的比特流解复用为低频比特流和高频比特流。在步骤608，低频ADPCM解码器520正常解码低频比特流，生成解码低频音频信号。在步骤610，高频ADPCM解码器530正常解码高频比特流，生成解码高频音频信号。在步骤612，合成滤波器组合540合并解码低频音频信号和解码高频音频信号，生成全频输出音频信号。在步骤614，将与当前帧相关联的低频激励信号存储在低频激励缓冲器590中，以供将来处理坏帧时使用，将与当前帧相关联的高频激励信号存储在高频激励缓冲器550中，以供将来处理坏帧时使用。在步骤614后，如步骤630所示，对好帧的处理过程结束。

下面描述当收到坏帧时所执行的从步骤616开始的一系列步骤。在步骤616，合成滤波器组合560从低频激励缓冲器590接收低频激励信号，从高频激励缓冲器550接收高频激励信号，将两个子带激励信号合并为全频激励信号。在步骤618，全频激励外推器570接收该全频激励信号并将其外推，生成全频外推激励信号。在步骤620，分解滤波器组合580将外推全频激励信号分割为低频外推激励信号和高频外推激励信号。在步骤622，低频ADPCM解码器合成滤波器524对低频外推激励信号进行滤波，生成合成低频音频信号，在步骤624，高频ADPCM解码器合成滤波器534对高频外推激励信号进行滤波，生成高频合成音频信号。在步骤626，合成滤波器组合640将两个合成子带音频信号合并为全频输出音频信号。在步骤628，对低频ADPCM解码器520和高频ADPCM解码器530的内部状态进行更新。在步骤628之后，如步骤630所示，对坏帧的处理过程结束。

图5中实施例与图3中实施例的主要区别在于增加了合成滤波器组合560和分解滤波器组合580，以及激励信号现在是在全频域内而不是子带域内进行外推。增加合成滤波器组合560和分解滤波器组合580将明显增加计算复杂度。但是，在全频域内外推激励信号提供了一个好处。这将在下文中进行解释。

当图3中的系统300对高频激励信号进行外推时，会存在一些潜在的问题。首先，如果其不对高频激励信号进行周期性外推，则输出音频信号将无法保留高频音频信号的周期性特征(存在于一些高周期语音信号之中)。另一方面，如果其为高频激励信号执行周期性外推，则就算其使用与低频激励信号外推中所使用的基音周期相同的基音周期，以此来节省计算量和确保两个子带激励信号使用同一基音周期进行外推，可还是会出现另一问题。当对高频激励信号进行周期性外推时，外推高频激励信号将是周期性的，而且在其频谱中呈现和声结构(harmonic structure)。换句话说，高频激励信号频谱中的频谱峰值频率将按整数倍的方式呈现相关性。当该高频激励信号通过高频ADPCM解码器合成滤波器334后，得到的高频音频信号的频谱峰值仍然是和声地相关(harmonically related)。然而，一旦合成滤波器组合340将该高频音频信号与低频音频信号重新合并，高频音频信号的频谱将进行转换，或移动到更高频率上，同时还可能出现镜像现象。因此，在出现镜像现象和频率移动现象之后，将无法保证全频输出音频信号中的高频部分中频谱峰值的频率仍然是低频信号中基音频率的整数倍。这将潜在的造成高周期语音信号输出音频质量的下降。相比之下，图5中的系统500则不会出现这种问题。因为系统500是在全频域内进行激励信号外推的，高频部分中和声峰值的频率仍将确保是基音频率的整数倍。

综上所述，第二实施例的优点是，对于语音信号而言，外推全频激励信号和最终的全频输出音频信号将保留频谱峰值的和声结构。另一方面，第一实施例的优点是具有较低的复杂度，但其无法在较高频子带中保留这种和声结构。

E.硬件和软件实现

为完整的描述本发明的实现方法，下文将提供一种通用计算机系统。本发明可通过硬件或软件和硬件的组合方式来实现。这样一来，本发明便可在计算机系统或其它处理系统环境中实现。图7中展示了这种计算机系统700的一个实施例。在本发明中，例如图4和图6中的所有步骤都可在一个或多个不同的计算机系统700上执行，以实现本发明提供的各种方法。

计算机系统700包括一个或多个处理器，如处理器704。处理器704可以是专用或通用数字信号处理器。处理器704连接到通信架构702(例如总线或网络)。各种软件实现方法将以该示范性计算机系统为硬件基础进行描述。在读完下文中的描述后，本领域的技术人员应当明白如何使用其它计算机系统和/或计算机架构来实现本发明。

计算机系统700还包括主存储器706，优选采用随机访问存储器(RAM)，还可包括辅存储器720。辅存储器720可包括例如硬盘驱动器722和/或可移动存储驱动器724，其代表产品为磁盘驱动器、磁带驱动器、光驱动器或类似的驱动器。可移动存储驱动器724以公知方式对可移动存储单元728进行读写操作。可移动存储单元728代表磁盘、磁带、光盘或类似的存储单元，其由可移动存储驱动器724进行读写。应当明白，可移动存储单元728包括存储有计算机软件和/或数据的计算机用存储介质。

在另一实现方案中，辅存储器720可包括其它类似的装置，用于将计算机程序或其它指令加载到计算机系统700中。这种装置可包括例如可移动存储单元730和接口726。这种装置的例子可包括程序磁带(cartridge)和磁带机接口(如视频游戏设备中所使用的)、可移动存储芯片(如EPROM或PROM)和相关的插槽、以及其它可移动存储单元730和能够将软件和数据从可移动存储单元730传送至计算机系统700的接口726。

计算机系统700还可包括通信接口740。通信接口740使得能够在计算机系统700和外部设备之间传送软件和数据。通信接口740的例子包括调制解调器、网络接口(如以太网接口卡)、通信端口、PCMCIA插槽和卡等。通过通信接口740传送的软件和数据是以信号的形式传送的，该信号可以是电信号、电磁信号、光信号或能够由通信接口740接收的其它信号。这些信号将通过通信路径742提供给通信接口740。通信路径742承载信号，其可使用电线或电缆、光纤、电话线、蜂窝电话链路、RF链路和其它通信信道来实现。

正如这里所使用的一样，术语“计算机程序介质”和“计算机用介质”用于指代如可移动存储单元728和730、安装在硬盘驱动器722上的硬盘和通信接口740所接收的信号一类的介质。这些计算机程序产品用于将软件提供给计算机系统700。

计算机程序(也称为计算机控制逻辑)存储在主存储器706和/或辅存储器720中。计算机程序还可通过通信接口740来接收。这种计算机程序在执行后，可控制计算机系统700实现上文所描述的本发明的内容。具体来说，这些计算机程序在执行后可控制处理器700实现本发明描述的处理过程，如本文所描述的方法。因此，这种计算机程序代表计算机系统700的控制器。当使用软件来实现本发明时，这些软件可存储在计算机程序产品中，使用可移动存储驱动器724、接口726或通信接口740加载到计算机系统700中。

在另一实施例中，本发明的主要方面可主要由硬件来实现，例如硬件组件如应用专用集成电路(ASIC)和门阵列。对于本领域的技术人员来说，也应当明白可采用硬件状态机来执行本文所述功能。

F.结论

虽然上文描述了本发明的各个实施例，但应当明白，上文仅是以举例的方式来描述这些实施例的，这些实施例不会限制本发明的范围。本领域的技术人员应当明白，在不脱离本发明实质和范围的前提下，可对上文实施例的形式和细节进行各种修改。因此，本发明的范围不应受上述示范性实施例的限制，而只能由本发明的权利要求和等效内容来定义。

Claims

1.一种在子带预测编码器中对音频信号中认为丢失的一部分进行替换的系统，其特征在于，包括：

合成滤波器组合，用于合并至少所述合成第一子带音频信号和所述合成第二子带音频信号，生成全频输出音频信号，该全频输出音频信号对应于所述音频信号中认为丢失的那一部分；

第二解码器，用于解码第二子带比特流，该第二子带比特流与所述音频信号中认为没有丢失的所述一部分相关联；

还包括：

用于在分别生成所述合成第一子带音频信号和所述合成第二子带音频信号之后，更新所述第一解码器和所述第二解码器内部状态的装置。

2.根据权利要求1所述的系统，其特征在于，

所述第一解码器为低频自适应差分脉冲编码调制解码器；

所述第二解码器为高频自适应差分脉冲编码调制解码器；

所述第一合成滤波器为低频自适应差分脉冲编码调制解码器合成滤波器；

所述第二合成滤波器为高频自适应差分脉冲编码调制解码器合成滤波器。

3.一种在子带预测编码器中对音频信号中认为丢失的一部分进行替换的方法，其特征在于，包括：

合并至少所述合成第一子带音频信号和所述合成第二子带音频信号，生成全频输出音频信号，该全频输出音频信号对应于所述音频信号中认为丢失的那一部分；

在第二解码器中解码第二子带比特流，该第二子带比特流与所述音频信号中认为没有丢失的所述一部分相关联；

还包括：

4.一种在子带预测编码器中对音频信号中认为丢失的一部分进行替换的系统，其特征在于，包括：

5.根据权利要求4所述的系统，其特征在于，还包括：

6.根据权利要求5所述的系统，其特征在于，

所述第一解码器为低频自适应差分脉冲编码调制解码器；

所述第二解码器为高频自适应差分脉冲编码调制解码器；

7.根据权利要求5所述的系统，其特征在于，还包括：

8.一种在子带预测编码器中对音频信号中认为丢失的一部分进行替换的方法，其特征在于，包括：

基于所述全频激励信号，生成全频外推激励信号；