CN101933086B

CN101933086B - 处理音频信号的方法和设备

Info

Publication number: CN101933086B
Application number: CN2008801258808A
Authority: CN
Inventors: 林宰显; 金东秀; 李显国; 尹圣龙; 房熙锡
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2007-12-31
Filing date: 2008-12-31
Publication date: 2013-06-19
Anticipated expiration: 2028-12-31
Also published as: KR20100086001A; JP5485909B2; EP2229676A4; WO2009084918A1; JP2011509428A; AU2008344134B2; CN101933086A; AU2008344134A1; US9659568B2; CA2711047C; EP2229676A1; CA2711047A1; KR101162275B1; RU2439718C1; US20110015768A1; EP2229676B1

Abstract

公开了一种处理音频信号的方法。本发明包括获得频谱数据和损失信号补偿参数，根据所述频谱数据来检测损失信号，基于所述损失信号补偿参数使用随机信号来产生对应于所述损失信号的第一补偿数据，并且产生对应于所述第一补偿数据的比例因子以及通过向所述第一补偿数据应用所述比例因子来产生第二补偿数据。

Description

处理音频信号的方法和设备

技术领域

本发明涉及一种用于处理音频信号的设备及其方法。尽管本发明适合于宽广范围的应用，但特别适合于处理音频信号的损失信号(losssignal)。

背景技术

通常，掩蔽效应(masking effect)是基于心理声学原理的。由于在大幅信号(large-scale signal)附近的小幅信号(smallscale signal)被大幅信号所阻塞，所以掩蔽效应利用人类听觉系统不擅长识别两者的特性。因为使用掩蔽效应，所以在编码音频信号中数据可能会被部分丢失。

发明内容

技术问题

然而，现有技术的解码器不足以补偿归因于掩蔽和量化的损失信号。

技术方案

据此，本发明针对一种用于处理音频信号的设备及其方法，其充分地消除了由于现有技术的局限性和缺点所导致的一个或多个问题。

本发明的目的是提供一种用于处理音频信号的设备及其方法，通过该设备和方法能够使用相对小的比特信息来补偿在掩蔽和量化过程中丢失的信号。

本发明的另一目的是提供一种用于处理音频信号的设备及其方法，通过该设备和方法能够以适当地组合包括频域上的掩蔽和时域上的掩蔽等的各种方案的方式来执行掩蔽。

本发明的进一步目的是提供一种用于处理音频信号的设备及其方法，通过该设备和方法，不论如语音信号、音频信号等的在特性方面不同的信号，根据它们的特性借助适当的方案处理，都能够使比特率最小化。

有益效果

相应地，本发明提供了以下效果或优点。

首先，本发明能够借助解码处理补偿在掩蔽和量化过程中丢失的信号，由此增强声音质量。

第二，本发明需要相当小的比特信息来补偿损失信号，由此显著地减少了比特数目。

第三，本发明通过执行包括频域上的掩蔽、时域上的掩蔽等的掩蔽方案补偿了由于根据用户选择而不管由于掩蔽所导致的比特压缩被最大化的掩蔽所导致的损失信号，由此使声音质量损失最小化。

第四，本发明借助语音译码方案解码具有语音信号特性的信号并且借助音频译码方案解码具有音频信号特性的信号，由此使得能够自适应地选择解码方案以便匹配每个信号特性。

附图说明

附图图示了本发明的实施例并且与说明书一起用来解释本发明的原理，包括附图以用来提供对本发明的进一步理解并且被并入并构成此说明书的一部分。

在附图中：

图1是根据本发明实施例的损失信号分析器的框图；

图2是根据本发明实施例的损失信号分析方法的流程图；

图3是用于解释比例因子和频谱数据的图；

图4是用于解释比例因子的应用范围的例子的图；

图5是在图1中所示出的掩蔽/量化单元的详细框图；

图6是用于解释根据本发明实施例的掩蔽处理的图；

图7是根据本发明实施例的应用了损失信号分析器的音频信号编码设备的第一例子的图；

图8是根据本发明实施例的应用了损失信号分析器的音频信号编码设备的第二例子的图；

图9是根据本发明实施例的损失信号补偿设备的框图；

图10是根据本发明实施例的损失信号补偿方法的流程图；

图11是用于解释根据本发明实施例的第一补偿数据产生处理的图；

图12是根据本发明实施例的应用了损失信号补偿器的音频信号解码设备的第一例子的图；和

图13是根据本发明实施例的应用了损失信号补偿器的音频信号解码设备的第二例子的图。

具体实施方式

将在以下描述中阐明本发明的附加特征和优点，并且根据所述描述而部分地更加清楚，或者可以通过实施本发明来学习。本发明的目的及其它优点将借助在所描写的说明书及其权利要求以及附图中特别指出的结构来实现和获得。

为了实现这些及其它优点并且根据本发明的目的，如所实施及大致地描述的，一种处理音频信号的方法，包括：获得频谱数据和损失信号补偿参数，基于所述频谱数据检测损失信号，基于所述损失信号补偿参数使用随机信号来产生对应于所述损失信号的第一补偿数据，并且产生对应于所述第一补偿数据的比例因子以及通过向所述第一补偿数据应用所述比例因子来产生第二补偿数据。

优选地，所述损失信号对应于具有等于或小于基准值的频谱数据的信号。

优选地，所述损失信号补偿参数包括补偿等级(level)信息，并且所述第一补偿数据的等级是基于所述补偿等级信息来确定的。

优选地，所述比例因子是使用比例因子基准值和比例因子差值来产生的，并且所述比例因子基准值包括在所述损失信号补偿参数中。

优选地，所述第二补偿数据对应于频谱系数。

为了进一步实现这些及其它优点并且根据本发明的目的，一种用于处理音频信号的设备，包括：去复用器，用于获得频谱数据和损失信号补偿参数；损失信号检测单元，用于基于所述频谱数据来检测损失信号；补偿数据产生单元，用于基于所述损失信号补偿参数使用随机信号来产生对应于所述损失信号的第一补偿数据；和重定比例单元，用于产生对应于所述第一补偿数据的比例因子，所述重定比例单元通过向所述第一补偿数据应用所述比例因子来产生第二补偿数据。

为了进一步实现这些及其它优点并且根据本发明的目的，一种处理音频信号的方法，包括：以通过基于掩蔽阈值应用掩蔽效应来量化输入信号的频谱系数的方式来产生比例因子和频谱数据，使用所述输入信号的频谱系数、所述比例因子和所述频谱数据来确定损失信号，并且产生损失信号补偿参数以补偿所述损失信号。

优选地，所述损失信号补偿参数包括补偿等级信息和比例因子基准值，所述补偿等级信息对应于与所述损失信号的等级有关的信息，并且所述比例因子基准值对应于与所述损失信号的比例有关的信息。

为了进一步实现这些及其它优点并且根据本发明的目的，一种用于处理音频信号的设备，包括：量化单元，用于以通过基于掩蔽阈值应用掩蔽效应来量化输入信号的频谱系数的方式来产生比例因子和频谱数据，和损失信号预测单元，用于使用所述输入信号的频谱系数、所述比例因子和所述频谱数据来确定损失信号，所述损失信号预测单元产生损失信号补偿参数以补偿所述损失信号。

优选地，所述补偿参数包括补偿等级信息和比例因子基准值，所述补偿等级信息对应于与所述损失信号的等级有关的信息，并且所述比例因子基准值对应于与所述损失信号的比例有关的信息。

为了进一步实现这些及其它优点并且根据本发明的目的，一种计算机可读存储介质，包括存储在其中的数字音频数据，所述数字音频数据包括频谱数据、比例因子和损失信号补偿参数，其中所述损失信号补偿参数包括作为用于补偿归因于量化的损失信号的信息的补偿等级信息，并且其中所述补偿等级信息对应于与损失信号的等级有关的信息。

应当理解，以上一般说明和以下详细描述均是示例性的和解释性的，并且旨在提供对所要求保护的本发明的进一步解释。

发明的模式

现在详细地给出本发明的优选实施例的参考，在附图中图示了本发明的例子。

首先，在本发明中的术语可以被解释为以下参考。而且，在此说明书中并未公开的术语可以被解释为与本发明的技术思想匹配的以下意思和原理。应当理解，‘译码’可以被解释为具体情况中的编码或译码。在此公开中的‘信息’是通常包括值、参数、系数、元素等的术语，并且其意义偶尔可以被解释为不同的，本发明并不受此限制。

在此公开中，音频信号从广义来说在概念上与视频信号有所区别并且可以被解释为在再现中在听觉上表示的信号。音频信号从狭义来说在概念上与语音信号有所区别并且可以被解释为没有语音特性或少语音特性的信号。

根据本发明的音频信号处理方法和设备可以变为丢失信号分析设备和方法或损失信号补偿设备和方法，并且可以进一步变为应用了前述设备和方法的音频信号编码方法和设备，或者应用了前述设备和方法的音频信号解码方法和设备。在下面描述中，解释了损失信号分析/补偿设备和方法，然后解释由音频信号编码/解码设备所执行的音频信号编码/解码方法。

图1是根据本发明实施例的音频信号编码设备的框图，并且图2是根据本发明实施例的音频信号编码方法的流程图。

首先参照图1，损失信号分析器100包括损失信号预测单元120并且能够进一步包括掩蔽/量化单元110。在这种情况下，损失信号预测单元120可以包括损失信号确定单元122和比例因子译码单元124。参考图1和图2进行以下描述。

首先，掩蔽/量化单元110使用心理声学模型基于频谱数据来产生掩蔽阈值。掩蔽/量化单元110通过使用掩蔽阈值量化对应于下降混合(downmix DMX)的频谱系数来获得比例因子和频谱数据[步骤S110]。在这种情况下，频谱系数可以包括由MDCT(改进的离散变换)获得的MDCT系数，但本发明并不受此限制。掩蔽阈值被提供用来应用掩蔽效应。

如在以上描述中所提及，掩蔽效应是基于心理声学原理的。由于在大幅信号附近的小幅信号被大幅信号所阻塞，所以掩蔽效应利用人类听觉系统不擅长识别两者的特性。

例如，最大信号存在于对应于频带的中间的数据，并且显著小于最大信号的若干信号可以存在于最大信号的附近。在这种情况下，最大信号变为掩蔽音(masker)并且可以参考掩蔽音可以绘制出掩蔽曲线。由掩蔽曲线所阻塞的小信号变为被掩蔽信号或被掩蔽音(maskee)。因此，如果排除被掩蔽信号并且剩下其余的信号作为有效信号，那么这被称为掩蔽。在这种情况下，通过掩蔽效应消除的损失信号原则上被设置为0并且偶尔可能被解码器重构。稍后将连同描述根据本发明的损失信号补偿方法和设备一起解释这些。

同时，对于根据本发明的掩蔽方案来说，存在各个实施例。稍后将参考图5和图6解释其细节。

为了应用掩蔽效应，如在以上描述中所提及，使用掩蔽阈值。如下解释使用掩蔽阈值的处理。

首先，每个频谱系数可以由比例因子频带单元来划分。可以在每个比例因子频带找出能量E_n。基于心理声学模型理论的掩蔽方案可应用于所获得的能量值。可以从作为比例因子单元的能量值的每个掩蔽音获得掩蔽曲线。然后，能够通过连接各个掩蔽曲线来获得总掩蔽曲线。最后，通过参照掩蔽曲线，能够获得掩蔽阈值E_th，掩蔽阈值E_th是每个比例因子频带的量化基础。

掩蔽/量化单元110通过使用掩蔽阈值执行掩蔽和量化而从频谱系数获得比例因子和频谱数据。首先，如在公式1中所表达的，可以使用比例因子和频谱数据来近似地表示频谱系数，其中比例因子和频谱数据是整数。因此，具有两个整数因子的表达式是量化处理。

[公式1]

X &cong; 2^{\frac{scalefactor}{4}} \times spectral_{data}^{\frac{4}{3}}

在公式1中，‘X’是频谱系数，‘scalefactor’是比例因子，并且‘spectral_data’是频谱数据。

参照公式1，可以观察到没有使用等号。由于比例因子和频谱数据中的每个仅具有整数，所以不可能通过这些值的解来完全地表达随机的X。因此，并未建立相等关系。公式1的右侧可以被表示为公式2中的X′。

[公式2]

X^{'} = 2^{\frac{scalefactor}{4}} \times spectral_{data}^{\frac{4}{3}}

图3是用于解释根据本发明实施例的量化处理的图，并且图4是用于解释比例因子的应用范围的例子的图。

参照图3，图示了用于将频谱系数(例如，a，b，c等)表达为比例因子(例如，A，B，C等)和频谱数据(例如，a′，b′，c’等)的处理的概念。比例因子(例如，A，B，C等)是被应用于组(例如，特定频带，特定间隔等)的因子。因此，能够通过共同地使用表示规定组(例如，比例因子频带)的比例因子来变换属于规定组的系数的大小来提高译码效率。

同时，在量化频谱系数的过程中可能产生误差。而且，能够根据量化把相应的误差信号认为是在原始的系数X和值X′之间的差，其被表示为公式3。

[公式3]

Error＝X-X′

在公式3中，‘X’对应于在公式1中所示出的表达式并且“X′”对应于在公式2中所示出的表达式。

对应于误差信号(Error)的能量是量化误差(E_error)。

使用上面获得的掩蔽阈值(E_th)和量化误差(E_error)，发现比例因子和频谱数据满足被表示为公式4的条件。

[公式4]

E_th＞E_error

在公式4中，‘E_th’指示掩蔽阈值并且‘E_error’指示量化误差。

即，如果满足了以上条件，那么量化误差变得小于掩蔽阈值。因此，这意味着根据量化的噪声能量被掩蔽效应所阻塞。可以说，由于量化的噪声可能不被听者听到。

因此，如果比例因子和频谱数据产生为满足该条件继而被发送，那么解码器使用该比例因子和频谱数据能够产生几乎等于原始音频信号的信号。

如果因为量化分辨率比特率缺乏而不足够而不满足以上条件，那么也可能出现声音质量降级。特别地，如果存在于整个比例因子频带内的所有频谱数据变为0，那么可能相当显著地感受到声音质量降级。此外，即便满足根据心理声学模型的以上条件，个别人也可能会感受到声音质量降级。因此，在其中假定频谱数据不为0的间隔中被变换为0的信号等变为从原始信号中丢失的信号。

图4示出了应用了比例因子的目标的各个例子。

参照图4的(A)，当属于特定帧(frame_N)的k频谱数据存在时，可以观察到比例因子(scf)是对应于一个频谱数据的因子。参照图4的(B)，可以观察到在一个帧内存在比例因子频带(sfb)。而且，还可以观察到应用比例因子的目标包括存在于特定比例因子内的频谱数据。参照图4的(C)，可以观察到应用比例因子的目标包括存在于特定帧内的所有频谱数据。换句话说，可以存在不同比例因子目标。例如，应用比例因子的目标可以包括一个频谱数据、存在于一个比例因子频带内的若干频谱数据、存在于一个帧内的若干频谱数据等。

因此，掩蔽/量化单元通过以上述方式应用掩蔽效应来获得比例因子和频谱数据。

现在参照图1和图2，损失信号预测单元120的损失信号确定单元122通过分析原始的下降混合(频谱系数)和量化的音频信号(比例因子和频谱数据)来确定损失信号[步骤S120]。

特别地，使用比例因子和频谱数据来重构频谱系数。然后，从找出重构的系数和原始的频谱系数之间的差来获得如在公式3中所表示的误差信号(Error)。根据公式4的条件，确定比例因子和频谱数据。即，输出校正的比例因子和校正的频谱数据。偶尔(例如，如果比特率低)，可能不满足公式4的条件。

在确认比例因子和频谱数据之后，确定了相应的损失信号。在这种情况下，根据该条件，损失信号可以是变得等于或小于基准值的信号。作为选择，损失信号可以是相对于基准值随机设置的信号，而不管是否偏离该条件。在这种情况下，基准值可以是0，但本发明并不受此限制。

如果根据以上方式确定了损失信号，那么损失信号确定单元122产生对应于损失信号的补偿等级信息。在这种情况下，补偿等级信息是对应于损失信号等级的信息。在解码器使用补偿等级信息来补偿损失信号的情况下，可以对如下这样的损失信号进行补偿，该损失信号具有小于对应于补偿等级信息的值的绝对值。

比例因子译码单元124接收比例因子，然后为对应于特定区域的比例因子产生比例因子基准值和比例因子差值[步骤S140]。在这种情况下，特定区域可以包括对应于其中存在损失信号的部分区域的区域。例如，属于特定频带的所有信息可以对应于与损失信号相对应的区域，但本发明并不受此限制。

同时，比例因子基准值可以是按照每个帧所确定的值。而且，比例因子差值是从比例因子减去比例因子基准值所得出的值，并且可以是按照为应用比例因子的每个目标(例如，帧，比例因子频带，样本等)确定的值，但本发明并不受此限制。

在步骤S130中产生的补偿等级信息和在步骤S140中产生的比例因子基准值作为损失信号补偿参数被发送到解码器，并且比例因子差值和频谱数据作为原始方案被转送到解码器。

到现在为止，已经解释了用于预测损失信号的处理。在下面描述中，如在以上描述中所提及，参考图5和图6详细解释根据本发明实施例的掩蔽方案。

用于掩蔽方案的各个实施例

参照图5，掩蔽/量化单元110可以包括频率掩蔽单元112、时间掩蔽单元114、掩蔽音确定单元116和量化单元118。

频率掩蔽单元112通过在频域上处理掩蔽来计算掩蔽阈值。时间掩蔽单元114通过在时域上处理掩蔽来计算掩蔽阈值。掩蔽音确定单元116用于确定频率或时域上的掩蔽音。而且，量化单元118使用由频率掩蔽单元112或时间掩蔽单元114计算的掩蔽阈值来量化频谱系数。

参照图6的(A)，可以观察到存在时域的音频信号。音频信号由将特定数目样本编组而以帧为单位来处理。而且，在图6的(B)中示出了对每个帧的数据执行频率变换的结果。

参照图6的(B)，对应于一个帧的数据被表示为一个条(bar)并且纵轴是频率轴。在一个帧内，对应于每个频带的数据可以是由频带单元完成的频域上的掩蔽处理的结果。特别地，可以由在图5中所示出的频率掩蔽单元112执行频域上的掩蔽处理。

同时，在这种情况下，频带可以包括临界频带。而且，临界频带意指在人类听觉器官中对于所有频率区域独立地接收的刺激的间隔单位。因为特定掩蔽音存在于随机临界频带内，所以在该频带内可以执行掩蔽处理。此掩蔽处理不会影响邻近临界频带内的信号。

在图6的(C)中，在每个频带存在的数据当中对应于特定频带的数据大小被表示为纵轴以便于观看数据大小。

参照图6的(C)，横轴是时间轴并且在纵轴方向上按照每个帧(F_n-1，F_n，F_n+1)来指示数据大小。此每帧数据独立地作为掩蔽音。参考此掩蔽音，可以绘制掩蔽曲线。而且，参考此掩蔽曲线，可以在时间方向上执行掩蔽处理。在这种情况下，可以由在图5中所示出的时间掩蔽单元114执行时域上的掩蔽。

在以下描述中，将解释在图5中所示出的用于执行相应功能的每个元件的各个方案。

1.掩蔽处理方向

在图6的(C)中，只参考掩蔽音示出了右方向。然而，如时间上的正向掩蔽处理，时间掩蔽单元114还能够执行时间上的反向掩蔽处理。如果大信号存在于时间轴上的相邻将来，那么当前信号当中的小信号可能不会影响人类的听觉器官，当前信号在时间上略微先于大信号。特别地，在小信号被识别之前，它可以被掩藏在相邻将来的大信号中。当然，用于在反方向上产生掩蔽效应的时间范围可以短于在正方向上的时间范围。

2.掩蔽音计算基准

在确定掩蔽音中，掩蔽音确定单元116可以确定最大信号作为掩蔽音。而且，掩蔽音确定单元116还能够基于属于相应临界频带的信号来确定掩蔽音的大小。例如，通过找出跨越临界频带的整个信号的平均值，找出绝对值的平均值或找出能量的平均值，可以确定掩蔽音的大小。作为选择，可以使用另一表示值作为掩蔽音。

3.掩蔽处理单元

在对频率变换结果执行掩蔽中，频率掩蔽单元112能够改变掩蔽处理单元。特别地，作为频率变换的结果可以在相同的帧内产生在时间上连续的多个信号。例如，在这种频率变换作为小波分组变换(WPT)、频变调制重叠变换(FV-MLT)等的情况下，可以从一个帧内的相同频率区产生在时间上连续的多个信号。在此频率变换的情况下，由在图6中所示出的以帧为单位存在的信号以较小单位存在并且以小单位在信号当中执行掩蔽处理。

4.用于执行掩蔽处理的条件

在确定掩蔽音中，掩蔽音确定单元116能够设置掩蔽音的阈值或者能够确定掩蔽曲线类型。

如果执行频率变换，那么通常信号值趋向于朝向高频率而逐渐地降低。这些小信号可以在不执行掩蔽处理的情况下在量化处理中变为零。因为信号的大小很小，所以掩蔽音的大小也很小。因此，因为掩蔽音消除信号并没有效果，所以掩蔽效应可能变得毫无意义。

因此由于存在掩蔽处理变得毫无意义的情况，所以能够通过建立掩蔽音的阈值只有当掩蔽音等于或大于适当大小时才执行掩蔽处理。对于所有频率范围，此阈值可以相等。利用信号大小朝向高频率而逐渐降低的特性，此阈值可以被设置为朝向高频率而在大小上减小。

另外，掩蔽曲线的形状可以被解释为根据频率具有缓慢或快速的倾斜角。

此外，由于掩蔽效应在信号大小不均匀的部分(即其中存在瞬态信号)中变得更加显著，所以能够基于是瞬态还是静态的特性来设置掩蔽音的阈值。而且，基于此特性，也能够确定掩蔽音的曲线的类型。

5.掩蔽处理的次序

如在以上描述中所提及，掩蔽处理可以被分类为由频率掩蔽单元112在频域的处理以及时间掩蔽单元114在时域的处理。在同时使用两个处理的情况下，可以按以下次序进行它们：

i)首先进行频域上的掩蔽，继而应用时域上的掩蔽；

ii)首先向通过频率变换的根据时间次序排列的信号应用掩蔽，然后在频率轴上进行掩蔽；

iii)频率轴掩蔽原理和时间轴掩蔽原理被同时应用于从频率变换所获得的信号，然后使用从两种方法获得的曲线中所获得的值来应用掩蔽；或者

iv)以上三种方法可组合使用。

在下面描述中，将参考图7解释音频信号编码设备和方法的第一例子，其中向该音频信号编码设备和方法应用了参考图1和图2描述的根据本发明实施例的损失信号分析器。

参照图7，音频信号编码设备200包括多通道编码器210、音频信号编码器220、语音信号编码器230、损失信号分析器240和多路复用器250。

多通道编码器210通过接收多个通道的信号(至少两个通道的信号，以下命名为多通道信号)，继而执行下降混合来产生单声道或立体声下降混合信号。而且，多通道编码器210产生用于把下降混合信号上升混合到多通道信号中所要求的空间信息。在这种情况下，空间信息可以包括通道等级差信息、通道间相关性信息、通道预测系数、下降混合增益信息等。

在这种情况下，由多通道编码器210产生的下降混合信号可以包括时域信号或执行频率变换的频域的信息。另外，下降混合信号可以包括每个频带的频谱系数，但本发明并不限于此。

当然，如果音频信号编码设备200接收单声道信号，那么多通道编码器210并不会下降混合该单声道信号，而是该单声道信号绕过多通道编码器210。

同时，音频信号编码设备200可以进一步包括频带扩展编码器(未在附图中示出)。频带扩展编码器(未在附图中示出)排除了下降混合信号的部分频带(例如，高频频带)的频谱数据并且能够产生用于重构所排除的数据的频带扩展信息。因此，解码器能够只利用其余频带的下降混合和频带扩展信息来重构整个频带的下降混合。

如果下降混合信号具有下降混合信号的特定帧或段很大的音频特性，那么音频信号编码器220根据音频译码方案编码下降混合信号。在这种情况下，音频译码方案可以遵循AAC(高级音频编码)标准或HE-AAC(高效率高级音频编码)标准，但本发明并不受此限制。同时，音频信号编码器可以对应于改进的离散变换(MDCT)编码器。

如果下降混合信号具有下降混合信号的特定帧或段很大的语音特性，那么语音信号编码器230根据语音译码方案编码下降混合信号。在这种情况下，语音译码方案可以遵循AMR-WB(自适应多速率宽带)标准，但本发明并不受此限制。

同时，语音信号编码器230可以进一步使用线性预测编码(LPC)方案。在谐波信号在时间轴上具有高冗余的情况下，可以根据线性预测获得建模以从过去的信号预测当前的信号。在这种情况下，如果采用线性预测译码方案，那么能够提高译码效率。同时，语音信号编码器230也可以对应于时域编码器。

损失信号分析器240接收根据音频或语音译码方案译码的频谱数据，继而执行掩蔽和量化。损失信号分析器240产生损失信号补偿参数以补偿由掩蔽和量化丢失的信号。同时，损失信号分析器240能够为由音频信号编码器220译码的频谱数据产生损失信号补偿参数。由损失信号分析器240执行的功能和步骤可以与参考图1和图2描述的前述损失信号分析器100的那些完全相同。

而且，多路复用器250通过将空间信息、损失信号补偿参数、比例因子(或比例因子差值)、频谱数据等多路复用到一起来产生音频信号比特流。

图8是根据本发明实施例应用了损失信号分析器的音频信号编码设备的第二例子的图。

参照图8，音频信号编码设备300包括用户接口310和损失信号分析器320，并且可以进一步包括多路复用器330。

用户接口310从用户接收输入信号，继而向损失信号分析器320递送用于损失信号分析的命令信号。特别地，在用户选择损失信号预测模式的情况下，用户接口310向损失信号分析器320递送用于损失信号分析的命令信号。在用户选择低比特率模式的情况下，音频信号的一部分可以被强迫设置为0，以匹配低比特率。因此，用户接口310能够向损失信号分析器320递送用于损失信号分析的命令信号。作为替代，用户接口310能够照原样向损失信号分析器320递送关于比特率的信息。

损失信号分析器320可以与参考图1和图2所描述的前述损失信号分析器100类似地配置。然而，只有当从用户接口310接收了用于损失信号分析的命令信号时，损失信号分析器320才产生损失信号补偿参数。在只接收关于比特率的信息而不是用于损失信号分析的命令信号的情况下，损失信号分析器320能够基于所接收的关于比特率的信息通过确定是否产生损失信号补偿参数来执行相应的步骤。

而且，多路复用器330通过将量化的频谱数据(包括比例因子)和由损失信号分析器320产生的损失信号补偿参数多路复用到一起来产生比特流。

图9是根据本发明实施例的损失信号补偿设备的框图，并且图10是根据本发明实施例的损失信号补偿方法的流程图。

参照图9，根据本发明实施例的损失信号补偿设备400包括损失信号检测单元410和补偿数据产生单元420，并且可以进一步包括比例因子获得单元430和重定比例单元440。在下面描述中，参考图9和图10解释在损失信号补偿设备400中补偿损失的音频信号的方法。

首先，损失信号检测单元410基于频谱数据检测损失信号。在这种情况下，损失信号可以对应于具有等于或小于预定值(例如，0)的相应频谱数据的信号。此信号可以具有对应于样本的二进制单位(binunit)。如在以上描述中所提及，因为在掩蔽和量化的过程中可以等于或小于规定值，所以产生损失信号。如果产生损失信号，特别是如果产生具有被设置为0的信号的间隔，那么偶尔产生声音质量降级。即便掩蔽效应使用通过人类听觉器官识别的特性，并不是每个人不都能识别归因于掩蔽效应的声音质量降级。另外，如果掩蔽效应被集中应用于具有相当的信号大小变化的瞬态间隔，那么可能部分地出现声音质量降级。因此，能够通过把适当的信号填充到损失间隔中来增强声音质量。

补偿数据产生单元420使用损失信号补偿参数的损失信号补偿等级信息，继而使用随机信号产生对应于损失信号的第一补偿数据[步骤S220]。在这种情况下，第一补偿数据可以包括具有与补偿等级信息相对应的大小的随机信号。

图11是用于解释根据本发明实施例的第一补偿数据产生处理的图。在图11的(A)中，示出了丢失信号的每频带频谱数据(a′，b′，c’等)。在图11的(B)中，示出了第一补偿数据的等级范围。特别地，补偿数据产生单元420能够对应于补偿等级信息产生具有等于或小于特定值(例如，2)的等级的第一补偿数据。

比例因子获得单元430使用比例因子基准值和比例因子差值来产生比例因子[步骤S230]。在这种情况下，比例因子是编码器用于缩放频谱系数的信息。而且，损失信号基准值可以是对应于其中存在损失信号的间隔的部分间隔的值。例如，此值可以对应于所有样本被设置为0的频带。对于部分间隔来说，可以通过把比例因子基准值与比例因子差值相组合(例如，把它们相加在一起)来获得比例因子。对于其余间隔来说，转送的比例因子差值可以照原样作为比例因子。

重定比例单元400通过利用比例因子对第一补偿数据或转送的频谱数据重定比例来产生第二补偿数据[步骤S240]。特别地，重定比例单元440对其中存在损失信号的区域的第一补偿数据重定比例。而且，重定比例单元440对其余区域的转送的频谱数据重定比例。第二补偿数据可以对应于从频谱数据和比例因子产生的频谱系数。此频谱系数可以被输入到稍后解释的音频信号解码器或语音信号解码器。

图12是根据本发明实施例的应用了损失信号补偿器的音频信号解码设备的第一例子的图。

参照图12，音频信号解码设备500包括去复用器510、损失信号补偿器520、音频信号解码器530、语音信号解码器540和多通道解码器550。

去复用器510从音频信号比特中流提取频谱数据、损失信号补偿参数、空间信息等。

损失信号补偿器520经由转送的频谱数据和损失信号补偿参数使用随机信号来产生对应于损失信号的第一补偿数据。而且，损失信号补偿器520通过向第一补偿数据应用比例因子来产生第二补偿数据。损失信号补偿器520可以是与参考图9和图10描述的前述损失信号补偿设备400起到几乎相同作用的元件。同时，损失信号补偿器520能够仅为具有音频特性的频谱数据产生损失重构信号。

同时，音频信号解码设备500可以进一步包括频带扩展解码器(未在附图中示出)。频带扩展解码器(未在附图中示出)使用对应于损失重构信号的全部或部分频谱数据来产生另一频带(例如，高频频带)的频谱数据。在这种情况下，从编码器转送的频带扩展信息是可用的。

如果对应于损失重构信号的频谱数据(偶尔，包括由频带扩展解码器产生的频谱数据)具有相当大的音频特性，那么音频信号解码器530根据音频译码方案解码频谱数据。在这种情况下，如在以上描述中所提及的，音频译码方案可以遵循AAC标准或HE-AAC标准。

如果频谱数据具有相当大的语音特性，那么语音信号解码器540根据语音译码方案来解码频谱数据。在这种情况下，如在以上描述中所提及的，语音译码方案可以遵循AMR-WBC标准，但本发明并不限于此。

如果经解码的音频信号(即，经解码的损失重构信号)是下降混合，那么多通道解码器550使用空间信息来产生多通道信号(包括立体声信号)的输出信号。

参照图13，音频信号解码设备600包括去复用器610、损失信号补偿器620和用户接口630。

去复用器610接收比特流，继而从接收的比特流中提取损失信号补偿参数、量化的频谱数据等。当然，可以进一步提取比例因子(差值)。

损失信号补偿器620可以是与参考图9和图10描述的前述损失信号补偿设备400起到几乎相同作用的元件。然而，在从去复用器610接收损失信号补偿参数的情况下，损失信号补偿器620向用户接口630通知损失信号补偿参数的接收。如果从用户接口630接收了用于损失信号补偿的命令信号，那么损失信号补偿器620起到补偿损失信号的作用。

在从损失信号补偿器620接收关于损失信号补偿参数的存在的信息的情况下，用户接口630在显示器等上显示接收，以使得用户能够知道信息的存在。

如果用户选择损失信号补偿模式，那么用户接口630向损失信号补偿器620递送用于损失信号补偿的命令信号。因此，应用损失信号补偿器的音频信号解码设备包括上面解释的元件并且可以根据用户做出的选择补偿或不补偿损失信号。

根据本发明，上述音频信号处理方法可以在程序记录介质中被实现为计算机可读代码。计算机可读介质包括其中存储可由计算机系统读取的数据的各种记录装置。计算机可读介质包括例如ROM、RAM、CD-ROM、磁带、软盘、光数据存储装置等并且还包括载波形实现方式(例如，经由因特网传输)。另外，由编码方法产生的比特流被存储在计算机可读记录介质中或者可以经由有线/无线通信网络发送。

工业实用性

据此，本发明适用于编码和解码音频信号。

虽然这里参考其优选实施例描述并图示了本发明，对本领域技术人员来说显然的是，在不脱离本发明的精神和范围的情况下可以对其进行各种改变和变化。因此，本发明旨在覆盖落入所附权利要求及其等效的本发明的修改和改变。

Claims

1.一种处理音频信号的方法，包括：

从音频信号比特流提取频谱数据和损失信号补偿参数，其中所述损失信号补偿参数包括补偿等级信息和比例因子基准值；

基于所述频谱数据来检测损失信号；

基于所述补偿等级信息使用随机信号来产生对应于所述损失信号的第一补偿数据；

使用所述比例因子基准值和比例因子差值产生对应于所有样本被设置为0的频带的比例因子；以及

通过向所述第一补偿数据应用所述比例因子来产生第二补偿数据。

2.如权利要求1所述的方法，其中所述损失信号对应于具有等于或小于基准值的频谱数据的信号。

3.如权利要求1所述的方法，其中所述第一补偿数据的等级是基于所述补偿等级信息来确定的。

4.如权利要求1所述的方法，其中所述第二补偿数据对应于频谱系数。

5.一种用于处理音频信号的设备，包括：

去复用器，用于从音频信号比特流提取频谱数据和损失信号补偿参数，其中所述损失信号补偿参数包括补偿等级信息和比例因子基准值；

损失信号检测单元，用于基于所述频谱数据来检测损失信号；

补偿数据产生单元，用于基于所述补偿等级信息使用随机信号来产生对应于所述损失信号的第一补偿数据；

比例因子获得单元，用于使用所述比例因子基准值和比例因子差值来产生对应于所有样本被设置为0的频带的比例因子；以及

重定比例单元，用于通过向所述第一补偿数据应用所述比例因子来产生第二补偿数据。

6.如权利要求5所述的设备，其中所述损失信号对应于具有等于或小于基准值的频谱数据的信号。

7.如权利要求5所述的设备，其中所述第一补偿数据的等级是基于所述补偿等级信息来确定的。

8.如权利要求5所述的设备，其中所述第二补偿数据对应于频谱系数。

9.一种处理音频信号的方法，包括：

基于掩蔽阈值通过应用掩蔽效应以量化输入信号的频谱系数的方式来产生比例因子和频谱数据；

使用所述输入信号的频谱系数、所述比例因子和所述频谱数据来确定损失信号；

产生补偿等级信息，所述补偿等级信息用于产生对应于所述损失信号的第一补偿数据；以及

使用对应于所有样本被设置为0的频带的比例因子，产生比例因子基准值，

其中，所述补偿等级信息和所述比例因子基准值包括在损失信号补偿参数中。

10.如权利要求9所述的方法，其中所述补偿等级信息对应于与所述损失信号的等级有关的信息，并且其中所述比例因子基准值对应于与所述损失信号的比例有关的信息。

11.一种用于处理音频信号的设备，包括：

量化单元，用于以通过基于掩蔽阈值应用掩蔽效应来量化输入信号的频谱系数的方式来产生比例因子和频谱数据；和

损失信号确定单元，用于使用所述输入信号的频谱系数、所述比例因子和所述频谱数据来确定损失信号，所述损失信号确定单元产生补偿等级信息，所述补偿等级信息用于产生对应于所述损失信号的第一补偿数据；以及

比例因子译码单元，用于使用对应于所有样本被设置为0的频带的比例因子产生比例因子基准值，

12.如权利要求11所述的设备，其中所述补偿等级信息对应于与所述损失信号的等级有关的信息，并且其中所述比例因子基准值对应于与所述损失信号的比例有关的信息。