CN101518103A

CN101518103A - 多通道信号的甜点操纵

Info

Publication number: CN101518103A
Application number: CNA2007800340938A
Authority: CN
Inventors: J·G·H·科彭斯; E·G·P·舒杰斯
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2006-09-14
Filing date: 2007-09-10
Publication date: 2009-08-26
Anticipated expiration: 2027-09-10
Also published as: EP2070392A2; WO2008032255A2; WO2008032255A3; JP2010504017A; CN101518103B; JP5513887B2; RU2009113814A; US8588440B2; RU2454825C2; US20090252338A1

Abstract

如解码器的装置被布置为通过修改空间参数来修改空间M通道音频信号的甜点。具体地，接收机(201)接收N通道音频信号，其中N＜M。所述M通道信号具体可以是MPEG环绕声信号，而N通道信号可以是立体声信号。参数单元(203)确定将所述N通道音频信号与所述空间M通道音频信号相关的空间参数，并且修改单元(207)通过修改至少一个所述空间参数来修改所述空间M通道音频信号的所述甜点。产生单元(205)通过使用所述至少一个修改的空间参数将所述N通道音频信号上混频来产生所述空间M通道音频信号。通过甜点操纵和多通道产生的结合实现了有效的和/或低复杂度的甜点操纵。

Description

多通道信号的甜点操纵

技术领域

本发明涉及多通道信号的甜点(sweet point)操纵，更具体但不唯一地涉及对于MPEG环绕声多通道信号的甜点操纵。

背景技术

过去几十年来，随着数字信号表示和通信日益取代模拟表示和通信，各种源信号的数字编码变得日益重要。例如，如视频和音乐的媒体内容的分发正日益基于数字内容编码。

此外，在过去十年中，已经有倾向于多通道音频、尤其倾向于扩展到常规的立体声信号之外的空间音频的趋势。例如，传统的立体声记录仅包括两个通道，而现代的高级音频系统典型地使用五个或六个通道，如在流行的5.1环绕声系统中那样。这提供了用户可能被各音源环绕的更沉浸的收听体验。

已经为这样的多通道信号的通信开发了各种技术和标准。例如，可根据如高级音频编码(AAC)或杜比数字标准的标准发送表示5.1环绕系统的六个分立的通道。

然而，为了提供向后兼容性，已知将较高数量的通道下混频为较低数量，并且具体地，其经常被用于将5.1环绕声信号下混频为立体声信号，从而允许通过传统的(立体声)解码器来再现立体声信号并且通过环绕声解码器来再现5.1信号。

一个示例是MPEG2向后兼容的编码方法。多通道信号被下混频为立体声信号。在辅助数据部分中编码额外的信号，以允许MPEG2多通道解码器产生多通道信号的表示。MPEG1解码器将忽视辅助数据，并且因此仅解码下混频的立体声。MPEG2中应用的编码方法的主要缺点在于该额外信号所需的额外数据率与编码立体声信号所需的数据率处于同一量级。因此用于将立体声扩展到多通道音频的额外比特率是相当大的。

不需要额外的多通道信息而进行向后兼容的多通道传输的其他现有方法通常可以体现为矩阵环绕方法。矩阵环绕声编码的示例包括如杜比Prologic II和Logic-7的方法。这些方法的共同原理在于它们将输入信号的多个通道与适当的非二次矩阵进行矩阵乘法，从而产生具有降低数量的通道的输出信号。具体地，矩阵编码器在将环绕通道与前通道和中心通道混频之前，通常向环绕通道施加相移。

通道转换的另一原因是编码效率。已经发现，例如环绕声音频信号可以编码为与描述音频信号的空间属性的参数比特流组合的立体声通道音频信号。解码器可以以非常令人满意的精确度再现立体声音频信号。这样，可以获得很大的比特率节约。

因此，在(参数)空间音频编码器中，从原始音频信号提取参数，以便产生具有减少的数量的通道(例如仅仅单个通道)的音频信号加上描述原始音频信号的空间属性的参数集。在(参数)空间音频解码器中，由所发送的空间参数描述的空间属性用于重新创建原始的空间多通道信号。存在可用于描述音频信号的空间属性的若干参数。一个这样的参数是通道间互相关，如立体声信号的左通道和右通道之间的互相关。另一参数是通道的功率比。

这样的技术的具体示例是用于有效编码多通道音频信号的MPEG环绕方法。

MPEG环绕编码器将M通道输入信号下混频为N通道下混频信号，其中N＜M，并且提取空间参数。下混频信号典型地使用如例如MP3或AAC编码器的传统编码器编码。以向后兼容的方式编码空间参数并将其嵌入到比特流中，使得传统的解码器仍然能够解码底层的下混频信号。

在MPEG环绕解码器中，首先使用传统的解码器解码下混频信号。然后通过从比特流提取的空间参数重构多通道信号。

与上述典型的多通道编码不同，MPEG环绕提供了丰富的额外特征集，例如：

非导引解码-当上述空间侧面信息不可用时，MPEG环绕解码器能够创建立体声信号的多通道上混频。在此模式下，解码器计算立体声信号的功率比和相关性，并且将这些特性用于通过查找表获得所需的空间参数。

矩阵兼容性-MPEG环绕编码器能够产生可使用现有矩阵解码方案解码的下混频。创建矩阵环绕下混频，使得它可以通过MPEG环绕解码器反转(invert)，而不会造成解码器性能在感觉上的退步。此外，矩阵环绕下混频改进了非导引模式的性能。

双耳解码-MPEG环绕解码器能够使用空间参数将单声道或立体声下混频信号直接变换为3D双耳立体声信号，而不用作为中间步骤计算多通道信号。

人工(artistic)下混频-MPEG环绕允许传输手动创建的下混频而不是自动的MPEG环绕下混频。

任意树-MPEG环绕比特流支持任意上混频结构的定义，允许任意数量的输出通道。

MPEG环绕编码器旨在对于预定义的扬声器设置(如，例如5.1设置)尽可能精确地表示原始的多通道信号。然而，它不允许关于如典型地在家庭或车辆中存在的不同收听位置和环境的任何灵活性。

通过甜点的操纵(例如，移动和/或拓宽)可以改进可选的收听位置和环境的再现。然而，尽管已知甜点操纵，但是常规的方法趋于不是最佳的，并且通常被应用为需要各个输出通道的高复杂度处理的后处理步骤。

因此，用于操纵甜点的改进的系统将是有利的，并且特别地，允许增加的灵活性、改进的质量、改进的收听体验、降低的复杂度、便利的处理和/或改进的性能的系统将是有利的。

发明内容

因此，本发明寻求优选地单独或以任何组合减轻、减缓或消除一个或多个上述缺点。

根据本发明的第一方面，提供了一种用于修改空间M通道音频信号的甜点的装置，所述装置包括：接收机，用于接收N通道音频信号，N＜M；参数装置，用于确定将所述N通道音频信号与所述空间M通道音频信号相关的空间参数；修改装置，用于通过修改至少一个所述空间参数来修改所述空间M通道音频信号的所述甜点；产生装置，用于通过使用所述至少一个修改的空间上混频参数将所述N通道音频信号上混频来产生所述空间M通道音频信号。

本发明可提供改进的收听体验。本发明可允许通过作为解码过程的一部分直接修改空间参数来进行降低复杂度的甜点操纵。可实现便利的和降低计算需要的处理。所述装置具体地可以是解码器。本发明可允许通过以有利的方式结合解码和甜点操纵来得到改进的性能。

N通道信号具体可以是单声道或立体声信号，而M通道信号具体可以是5.1、6.1或7.1环绕声信号。空间参数具体可以是将空间M通道音频信号与N通道信号的各信号(反之亦然)的不同通道的特性相关的时间和频率变化参数。例如，空间参数可包括各个时间频率块的级别和/或相关性参数。N通道音频信号到空间M通道音频信号的上混频可以是级联的上混频。

根据本发明的任选特征，所述修改装置被布置为通过修改第一空间参数来修改前后平衡，所述第一空间参数指示所述空间M通道音频信号的至少一个前通道和至少一个后通道之间的强度差。

这可以提供改进的收听体验和/或便利的甜点操纵。特别地，该特征可允许通过简单和低复杂度的处理来改进(前/后)非中心收听位置的收听体验。

根据本发明的任选特征，所述第一空间参数是所述至少一个前通道和所述至少一个后通道之间的通道间强度差。

这可以允许尤其低的复杂度和/或有效的实现。特别地，可使用在解码操作中已经使用的空间参数的简单修改来修改甜点。

根据本发明的任选特征，所述修改装置被布置为修改所述通道间强度差的量化索引。

这可允许尤其低的复杂度和/或有效的实现，并且尤其可允许在反映人类音频感觉的同时进行便利的和对用户而言更友好的操纵。可在解码之前修改所述量化索引。

根据本发明的任选特征，所述修改装置还被布置为缩放至少一个前通道，使得降低通过修改所述第一参数导致的所述空间M通道音频信号的前侧通道与中心通道能量比的变化。

这可允许改进的收听体验，并且在许多情况下可允许以最小的感觉失真操纵甜点。具体地，所述修改装置可以基本上维持参数修改后与修改前相同的前侧通道与中心通道能量比。具体地，所述修改装置可以缩放中心通道，或可以例如相对于中心通道基本上相等地缩放侧面通道和/或可以不同地缩放侧面通道。

根据本发明的任选特征，所述修改装置被布置为通过修改第一空间参数来修改中心频散，所述第一空间参数指示所述N通道音频信号的至少一个通道的信号在中心通道和至少一个侧面通道之间的相对分布。

这可提供改进的收听体验和/或便利的甜点操纵。具体地，该特征可允许增加的空间收听体验。

在一些实施例中，所述修改装置被布置为通过修改第一空间参数来修改中心频散，所述第一空间参数指示所述N通道音频信号的至少一个通道和所述空间M通道音频信号的至少一个前通道之间的缩放值。

N通道音频信号的上混频可具体包括通过对于N通道信号的信号值的(K，N)上混频矩阵乘法，将N通道音频信号上混频到K通道信号(N＜K＜＝M)，并且所述第一空间参数可以是上混频矩阵的矩阵系数。

根据本发明的任选特征，所述第一空间参数是通道预测系数。

这可允许尤其低的复杂度和/或有效的实现。特别地，可使用已经在解码操作中典型地使用的空间参数的简单修改来修改甜点。

根据本发明的任选特征，所述修改装置被布置为通过修改第一空间参数来修改左右平衡，所述第一空间参数指示所述N通道音频信号的至少一个通道的信号在至少一个右侧通道和至少一个左侧通道之间的相对分布。

这可提供改进的收听体验和/或便利的甜点操纵。特别地，该特征可允许通过简单和低复杂度的处理来改进(左/右)非中心收听位置的收听体验。

这可允许尤其低的复杂度和/或有效的实现。特别地，可使用已经在解码操作中使用的空间参数的简单修改来修改甜点。

根据本发明的任选特征，所述修改装置被布置为通过修改第一空间参数来修改前后频散，所述第一空间参数指示所述空间M通道音频信号的至少一个前通道和至少一个后通道之间的相对相关性。

这可提供改进的收听体验和/或便利的甜点操纵。特别地，该特征可允许增加的空间收听体验。

根据本发明的任选特征，所述第一空间参数是所述至少一个前通道和所述至少一个后通道之间的通道间相关性系数。

这可允许尤其低的复杂度实现。特别地，可使用已经在解码操作中使用的空间参数的简单修改来修改甜点。

根据本发明的任选特征，所述N通道音频信号对应于所述空间M通道音频信号的下混频，并且所述接收机被布置为接收将所述下混频的N通道音频信号与所述空间M通道音频信号相关的编码器空间参数，并且所述参数装置被布置为根据所述编码器空间参数确定所述空间参数。

这可允许改进的收听体验和/或便利的甜点操纵。特别地，在包括产生N通道音频信号的参数编码器的系统中该特征可允许改进的收听体验。

所述编码器在将空间M通道音频信号下混频为N通道音频信号时可产生空间参数数据。该空间参数数据可发送到所述装置，并且可通过修改该数据来修改甜点。所述空间参数可具体包括编码器空间参数。所述N通道音频信号具体可以是包括参数数据的MPEG环绕信号。

根据本发明的任选特征，所述参数装置被布置为根据所述N通道音频信号的所述通道的信号特性确定所述空间参数。

这可提供改进的收听体验和/或便利的甜点操纵。特别地，在不使用显式参数编码器的系统中该特征可允许改进的收听体验，所述不使用显式参数编码器的系统不发送空间M通道音频信号的参数数据。所述N通道音频信号具体可以是非导引MPEG环绕信号，如矩阵兼容的下混频信号。所述N通道音频信号还可以是传统的立体声信号，例如立体声MP3解码信号或立体声FM信号。

根据本发明的另一方面，提供了一种用于接收空间M通道音频信号的接收机，所述接收机包括：接收器，用于接收N通道音频信号，N＜M；参数装置，用于确定将所述N通道音频信号与所述空间M通道音频信号相关的空间参数；修改装置，用于通过修改至少一个所述空间参数来修改所述空间M通道音频信号的甜点；产生装置，用于通过使用所述至少一个修改的空间参数将所述N通道音频信号上混频来产生所述空间M通道音频信号。

根据本发明的另一方面，提供了一种用于传输音频信号的传输系统，所述传输系统包括：布置为发送N通道音频信号的发送机；以及接收机，包括：接收器，用于接收所述N通道音频信号；参数装置，用于确定将所述N通道音频信号与空间M通道音频信号相关的空间参数，N＜M；修改装置，用于通过修改至少一个所述空间参数来修改所述空间M通道音频信号的甜点；产生装置，用于通过使用所述至少一个修改的空间参数将所述N通道音频信号上混频来产生所述空间M通道音频信号。

根据本发明的另一方面，提供了一种用于播放空间M通道音频信号的音频播放设备，所述音频播放设备包括：接收机，用于接收N通道音频信号，N＜M；参数装置，用于确定将所述N通道音频信号与所述空间M通道音频信号相关的空间参数；修改装置，用于通过修改至少一个所述空间参数来修改所述空间M通道音频信号的甜点；产生装置，用于通过使用所述至少一个修改的空间参数将所述N通道音频信号上混频来产生所述空间M通道音频信号。

根据本发明的另一方面，提供了一种用于修改空间M通道音频信号的甜点的方法，所述方法包括：接收N通道音频信号，N＜M；确定将所述N通道音频信号与所述空间M通道音频信号相关的空间参数；通过修改至少一个所述空间参数来修改所述空间M通道音频信号的所述甜点；通过使用所述至少一个修改的空间参数将所述N通道音频信号上混频来产生所述空间M通道音频信号。

根据本发明的另一方面，提供了一种接收空间M通道音频信号的方法，所述方法包括：接收N通道音频信号，N＜M；确定将所述N通道音频信号与所述空间M通道音频信号相关的空间参数；通过修改至少一个所述空间参数来修改所述空间M通道音频信号的甜点；通过使用所述至少一个修改的空间参数将所述N通道音频信号上混频来产生所述空间M通道音频信号。

根据本发明的另一方面，提供了一种发送和接收音频信号的方法，所述方法包括：发送N通道音频信号的发送机；以及接收机，执行下述步骤：接收所述N通道音频信号；确定将所述N通道音频信号与空间M通道音频信号相关的空间参数，N＜M；通过修改至少一个所述空间参数来修改所述空间M通道音频信号的甜点；通过使用所述至少一个修改的空间参数将所述N通道音频信号上混频来产生所述空间M通道音频信号。

本发明的这些和其他方面、特征和优点将从下面(各)实施例变得清楚并且参照(各)实施例进行说明。

附图说明

仅通过示例参照附图描述本发明的实施例，附图中：

图1是根据本发明一些实施例的用于传送音频信号的传输系统的图示；

图2是根据本发明一些实施例的能够修改空间M通道音频信号的甜点的解码器的图示；

图3是MPEG环绕声系统的扬声器设置的图示；

图4是MPEG环绕解码器的结构的图示；以及

图5是根据本发明一些实施例的修改空间M通道音频信号的甜点的方法的图示。

具体实施方式

下面的描述集中于可应用到MPEG环绕声音频系统的本发明的各实施例。然而，将认识到，本发明不限于该应用，且可应用到许多其他多通道音频系统和标准。

图1图示了根据本发明一些实施例的用于传送音频信号的传输系统100。传输系统100包括通过网络105耦合到接收机103的发送机101，所述网络105具体地可以是因特网。

在具体示例中，发送机101是信号记录设备，并且接收机103是信号播放设备，但是将认识到，在其他实施例中，发送机和接收机可用于其他应用和其他目的。例如，发送机101和/或接收机103可以是转码功能的一部分，并且可以例如提供到其他信号源或目的地的接口。

在支持信号记录功能的具体示例中，发送机101包括接收模拟多通道信号的数字转换器107，所述模拟多通道信号通过采样和模数转换而被转换为数字PCM(脉冲编码调制)信号。

数字转换器107耦合到图1的编码器109，所述编码器109根据编码算法编码PCM信号。在该示例中，编码器109是将M通道信号编码为N通道信号的MPEG环绕编码器，其中M＞N。MPEG环绕解码器由此产生N通道信号以及允许解码器产生M通道信号的空间参数数据。编码器109可以例如将5.1、6.1或7.1环绕声信号编码为立体声信号和空间参数数据。下面的描述将集中于其中将5.1立体声信号编码为立体声信号以及空间参数数据的场景。

编码器109耦合到网络发送机111，所述网络发送机111接收编码信号并与因特网105接口。网络发送机可以通过因特网105发送编码信号到接收机103。

接收机103包括网络接收机113，所述网络接收机113与因特网105接口并且被布置为从发送机101接收编码信号。

网络接收机113耦合到解码器115。解码器115接收编码信号并且根据解码算法解码该信号。在该示例中，解码器在已经修改所接收的参数数据以便修改原始信号的甜点之后，使用所述接收的参数数据从N通道信号解码M通道信号。空间多通道信号的甜点是其中空间感觉不明显偏离于预期空间感觉(例如，如工作室工程师对于标准化的多通道扬声器设置所预期的空间感觉)的区域/位置。

具体地，在该示例中，解码器115是在导引模式下操作的MPEG环绕解码器，在导引模式中，解码是基于由编码器109产生的空间参数数据的。然而，将认识到，在其他实施例中，空间参数数据可由解码器自身产生，并且解码器115具体可以是在非导引模式下操作的MPEG环绕解码器。

在支持信号播放功能的具体示例中，接收机103还包括信号播放器117，所述信号播放器117从解码器115接收解码的音频信号并且将其呈现给用户。具体地，信号播放器117可包括输出解码音频信号所需要的数模转换器、放大器和扬声器。

图2更详细地图示解码器115。

解码器115包括从网络接收机113接收比特流的接收机单元210。该接收机包括编码立体声信号和参数数据两者。

接收机单元201耦合到参数单元203，所述参数单元203确定要用于从立体声信号产生环绕信号的空间参数。空间参数因此是描述M通道信号的通道信号的特性相对于N通道信号的通道信号的特性的参数数据。参数数据可以具体指示应当如何处理N通道信号以产生M通道信号。

在主要示例中，简单地通过从接收的比特流中提取这些参数来产生空间参数，即，使用由编码器109产生的空间参数。然而，将认识到，在其他实施例中，空间参数可例如由解码器自身确定，例如通过根据接收的信号估计这些参数。具体地，解码器115可以是以非导引模式操作的MPEG环绕解码器，因此可从N通道信号的某些特性产生空间参数，所述特性如所接收的立体声信号的通道强度差和相关性特性。

接收机单元201还耦合到解码单元205，所述解码单元205解码立体声信号并将其上混频以产生5.1通道环绕信号。在示例中，上混频按照MPEG环绕标准执行并且基于所确定的空间参数。然而，不直接使用空间参数，而是解码器115包括修改单元207，所述修改单元207耦合到参数单元203和解码单元205，并且改变一个或多个空间参数以便修改所产生的环绕信号的甜点。

因此，图2的解码器115允许通过直接修改在解码/上混频处理中使用的一个或多个空间参数而对输出环绕声信号的甜点进行简单、有效、高性能和低复杂度的操纵。因此，通过整合甜点操纵和解码/上混频，可以实现大大便利和改进的性能。

该方法可用于有效地修改甜点的形状和位置。这对于听者的位置与原始甜点位置不同的情况下的家用和车用应用特别有用。这对于为在不同位置的多个听者创建类似的声音图像感觉也是有用的。因此，该方法允许对用于包括下述的声音阶段控制的最期望的特征进行容易的操纵：

-前后平衡控制可用于逐渐加强到前面或到后面的空间图像。

-中心频散控制可用于创建中心通道的较少(或较多)方向性的感觉。

-左右平衡控制可用于提供强调左边或右边的逐渐偏移。

-相关性或前后频散控制可用于允许对前后相关性进行控制，所述前后相关性有助于所感觉的声音的宽度。

该方法导致对于操纵甜点的非常低的复杂度的解决方案，并且有利地，该方法可用于MPEG环绕的所有操作模式。此外，如下面将描述的，还可能在解码如FM和AM无线电广播中的有限质量的下混频信号时增强空间图像。

在下面，将参照5.1MPEG环绕系统描述不同甜点操纵的更详细的示例。

图3图示MPEG环绕算法的6通道输出配置所依据的扬声器设置。

图4图示用于根据接收的立体声信号和空间参数产生5.1环绕声信号的MPEG环绕上混频结构。在MPEG环绕中，以级联处理执行上混频，其中最初使用两个通道预测系数(CPC)，以便在第一上混频阶段使用下面给出的3×2预增益矩阵创建左、中和右信号(L、C和R)：

U = (\begin{matrix} {CPC}_{1} + 2 & {CPC}_{2} - 1 \\ {CPC}_{1} - 1 & {CPC}_{2} + 2 \\ (1 - {CPC}_{1}) \sqrt{2} & (1 - {CPC}_{2}) \sqrt{2} \end{matrix})

然后，将三个中间通道的每个转换为两个另外的通道。具体地，使用通道间强度差(IID)空间参数将中间的中心通道分离为中心通道和低频增强(LFE)通道。此外，使用两个IID和两个通道间相关性系数(ICC)，以便通过5×5混合矩阵(其中使用去相关的信号来引入由ICC所指示的相关性水平)将中间的左和右信号的每一个分为前通道和环绕通道(L_f、R_f和L_s、R_s)。

在一些实施例中，修改单元207可以通过修改空间参数来修改前后平衡，所述空间参数指示空间M通道音频信号的至少一个前通道和至少一个后通道之间的相对强度差。具体地，修改单元可修改一个或多个IID参数。

下面描述如何设置简单的调谐参数以便将空间图像的重点(甜点)在前面和后面之间逐渐前后移动。因此，可使用简单的调谐参数来将感觉到最佳环绕效果的位置/区域移动到听者的位置。这在听者位于扩音器的中心位置的前面或后面的情况下(如典型的家用和车用应用中)特别有用。

在图2的实施例中，通过修改IID参数实现前后平衡控制，以实现期望的效果。IID参数通常以对数dB标度表示，并且指示前通道和环绕通道之间的相对能量分布。

在下面的具体示例中，为了简要和清楚，将认为左侧和右侧的ICC和IID参数相等。对于MPEG环绕非导引模式通常是这样。对于MPEG环绕导引模式，左侧和右侧的ICC和IID参数典型地是不同的，并且将认识到，所述方法可以容易地扩展到这样的情况。具体地，所述方法可以使用相同的调谐参数S_FB独立地应用到两侧。

在所述方法中，使用IID参数来改变信号的前后分布。具体地，增加IDD在前侧通道设置更多能量，而减小IID给环绕通道分配更多能量。

以dB表示的IID可以通过加上偏移值来更新。

IID_new＝IID_org+Δ_FB

可以从例如由用户或操作者手动设置的简单的调谐参数S_FB确定该偏移值Δ_FB。例如，包括解码器115的播放设备103可包括用于在不同声音环境仿真设置之间进行选择的输入，其中每个设置具有若干相关联的预定甜点调谐参数。

人类听觉系统对于IID的变化的灵敏度随着参考值(正的以及负的)增加而降低。例如，下面的表格图示了IID变化的最小可觉差(JustNoticeable Differences，JND)：

参考IID(dB)	JND(dB)
参考IID(dB)	JND(dB)	0	0.5-1
9	1.2	0	0.5-1
9	1.2	15	1,5-2

为了对IID的整个范围实现类似的加强效果，该非线性效应可以并入到IID更新中：

IID_new＝IID_org+Δ_FB(S_FB，IID_org)

因为听觉系统的非线性行为还反映在MPEG环绕中使用的、用于将索引值映射到IID参数的IID量化矢量中，所以可以通过在索引域的线性更新来实现IID修改。令I_IID，org是与IID_org对应的索引，则可通过计算与该索引对应的新的IID来更新IID，如下给出：

I_IID，new＝I_IID，org+S_FB

因此，可设置具有前后平衡偏移的线性关系的简单的调谐参数S_FB，以修改环绕声信号的甜点的前后平衡。

如果直接使用IID索引不实际(例如，因为其对修改单元不可用)，则可以通过将二阶多项式与IID的MPEG环绕量化矢量(的非负部分)拟合来切换到索引域并从索引域切换回来：

IID = a_{0} \cdot I_{IID}^{2} + a_{1} \cdot I_{IID} + a_{2}

其中

a₀＝0,1444，

a₁＝1,1056，

a₂＝0,8272.

因此，可通过下式将IID映射回到索引域：

I_{IID} = \frac{- a_{1} + \sqrt{a_{1}^{2} - 4 a_{0} \cdot (a_{2} - abs (IID))}}{2 a_{0}}

然后，可通过加上S_FB参数来确定新的索引，由此IID参数可确定为：

IID_new＝sgn(I_IID，new)·(a₀·(I_IID，new)²+a₁·abs(I_IID，new)+a₂)

可选地，可使用基于量化矢量的插值来确定修改的IID。

减小IID值导致在维持相干性和整体能量的同时能量从前通道向环绕通道偏移。然而，该修改不改变中心(以及LFE)通道的能量，因此可能在一定程度上使空间图像变形。增加IID值可能类似地使空间图像变形。

为了降低该影响，优选地，保持前侧通道和中心通道之间的能量比。将中心通道的能量混合到侧面通道中(反之亦然)可能导致内容(例如，声音)无意地泄漏到侧面通道，并因此改变空间图像。下面描述了通过缩放中心通道基本上保持前侧和中心能量比、并且防止中心内容泄漏到侧面通道的方法。

在该方法中，在保持前侧通道和中心通道之间的能量比的约束下缩放前通道：

\frac{E_{L_{f, new}} + E_{R_{f, new}}}{E_{C_{new}}} = \frac{E_{L_{f}} + E_{R_{f}}}{E_{C}}

缩放中心信号对整体能量有影响，并且因此左侧和右侧信号应当同时缩放以补偿能量损失。因此，优选地还应当使总体能量不变：

E_{L_{new}} + E_{R_{new}} + E_{C_{new}} = E_{L} + E_{R} + E_{C}

其中通过下式表示缩放：

L_new＝μ·L，

R_new＝μ·R，

C_new＝λ·C，

在示例中，通过相同的因子缩放左右通道，这是因为假定对于两侧信号空间参数是相等的(对应于MPEG环绕非导引模式)，因此，它们都通过相同的空间参数进一步处理。缩放因子μ和λ可通过将缩放等式插入到能量守恒要求中来计算。这得到：

μ²L²+μ²R²+λ²C²＝L²+R²+C²

导致：

λ = \sqrt{\frac{L^{2} + R^{2}}{C^{2}} \cdot (1 - {μ^{2}}) + 1}

并且

\frac{μ^{2} L^{2} \cdot \frac{10^{\frac{{IID}_{new}}{10}}}{1 + 10^{\frac{{IID}_{new}}{10}}} + μ^{2} R^{2} \cdot \frac{10^{\frac{{IID}_{new}}{10}}}{1 + 10^{\frac{{IID}_{new}}{10}}}}{λ^{2} C^{2}} = \frac{L^{2} \cdot \frac{10^{\frac{IID}{10}}}{1 + 10^{\frac{IID}{10}}} + R^{2} \cdot \frac{10^{\frac{IID}{10}}}{1 + 10^{\frac{IID}{10}}}}{C^{2}}

重写得到：

\frac{μ^{2}}{λ^{2}} = \frac{1 + 10^{\frac{{IID}_{new}}{10}}}{1 + 10^{\frac{IID}{10}}} \cdot 10^{\frac{IID - {IID}_{new}}{10}}

以及因此，

μ^{2} = \frac{E_{ratio} + 1}{r + E_{ratio}}

其中

E_{ratio} = \frac{L^{2} + R^{2}}{C^{2}},

r = \frac{1 + 10^{\frac{IID}{10}}}{1 + 10^{\frac{{IID}_{new}}{10}}} \cdot 10^{\frac{{IID}_{new} - IID}{10}} .

因此，μ和λ的表达式通过下式给出：

μ = \sqrt{\frac{E_{ratio} + 1}{r + E_{ratio}}},

λ = \sqrt{E_{ratio} \cdot (1 - μ^{2}) + 1} = \sqrt{r} \cdot μ .

为了维持整体空间图像而进行的能量分布补偿可通过相对低复杂度的处理执行。具体地，MPEG环绕上混频算法以某个更新速率T更新参数。因此，对每T个采样计算新的上混频矩阵，并且将这些插入各采样之间。上混频信号的缩放可与预增益矩阵结合，因此仅需要对每T个采样确定一次缩放值。

在参数范围为

S_FB∈[-30，...，+30]的情况下，

在感觉上有意义的程度将图像完全向后偏移(-30)和完全向前偏移(+30)，并且在调谐参数值和前/后平衡的感觉偏移之间具有适当线性关系。

此外，从E_ratio的值确定缩放值，E_ratio是中间信号L、R和C的能量比。出于稳定性的原因，可以使这些能量平滑(经低通滤波)。然而，对于MPEG环绕非导引模式，下混频信号L_dmx和R_dmx的这种低通滤波的能量已经是可得到的，因为它们被用于确定下混频信号的IID和ICC参数。这些可与预增益矩阵结合使用，所述预增益矩阵定义为：

U = (\begin{matrix} {CPC}_{1} + 2 & {CPC}_{2} - 1 \\ {CPC}_{1} - 1 & {CPC}_{2} + 2 \\ (1 - {CPC}_{1}) \sqrt{2} & (1 - {CPC}_{2}) \sqrt{2} \end{matrix})

因此，E_ratio可被写为：

E_{ratio} = \frac{L^{2} + R^{2}}{C^{2}} = \frac{1}{2} \cdot \frac{(2 \cdot {CPC}_{1}^{2} + 2 \cdot {CPC}_{1} + 5) \cdot L_{dmx}^{2} + (2 \cdot {CPC}_{2}^{2} + 2 \cdot {CPC}_{2} + 5) \cdot R_{dmx}^{2} +}{({CPC}_{1}^{2} - 2 \cdot {CPC}_{1} + 1) \cdot L_{dmx}^{2} + ({CPC}_{2}^{2} - 2 \cdot {CPC}_{2} + 1) \cdot R_{dmx}^{2} +} . . .

. . . \frac{(2 \cdot {CPC}_{1} \cdot {CPC}_{2} + {CPC}_{1} + {CPC}_{2} - 4) \cdot L_{dmx} \cdot R_{dmx}}{({CPC}_{1} \cdot {CPC}_{2} - {CPC}_{1} - {CPC}_{2} + 1) \cdot L_{dmx} \cdot R_{dmx}},

从而消除了对于前后平衡控制的任何预采样计算的需要。

可以例如通过使用各种等式的查找表或使用低复杂度的近似函数来获得进一步的复杂度降低。

在示例性实施例中，解码器115还可调整中心频散从而增加甜点。具体地，中心频散调谐参数用于将中心通道的图像分散到侧面，以获得较少方向性的中心。因此，该方法允许通过调整空间参数增加感觉到的中心宽度，并且因此空间参数被用于操纵甜点的大小。

在MPEG环绕中，第一上混频阶段使用预增益矩阵(参见例如图4)创建了三个中间信号L、C和R：

U = (\begin{matrix} {CPC}_{1} + 2 & {CPC}_{2} - 1 \\ {CPC}_{1} - 1 & {CPC}_{2} + 2 \\ (1 - {CPC}_{1}) \sqrt{2} & (1 - {CPC}_{2}) \sqrt{2} \end{matrix})

为了增加中心宽度，中心信号C的一部分可以被混频到侧面通道L和R。具体地，可以操纵该第一上混频阶段的空间参数CPC₁和CPC₂，使得中心信号与左右信号混合。如可以从预增益矩阵看到的，CPC参数指示每个立体声信号的能量到每个中间通道的相对分布。因此，调整CPC参数允许能量从中心通道逐渐偏移到侧面通道(或从侧面通道逐渐偏移到中心通道)。当改变中心频散时，通常对称地执行修改，因此相同地改变CPC值。

如由预增益矩阵所证明的，如果CPC参数都等于1，则较低的行仅包含零，因此不产生中心信号。而且，对于该设置，左右信号的增益因子(矩阵系数)增加，并且因此整个中心信号完全分散到左右通道中。相反，当降低CPC时，在左右信号的能量减少的同时中心能量增加。

因此，可通过将CPC参数值向1增加而增加中心频散。这样，中心信号(部分地)混合到侧面通道，导致中心通道信号的更宽的空间图像。

具体地，可根据下式从调谐参数S_CD确定新的CPC值：

{CPC}_{x, new} = \{\begin{matrix} 1 - (1 - S_{CD}) \cdot (1 - {CPC}_{x}), & for S_{CD} &GreaterEqual; 0, \\ (1 + S_{CD}) \cdot (1 + {CPC}_{x}) - 1, & for S_{CD} < 0, \end{matrix}

对于S_CD的负值，CPC值朝-1移动，从而缩窄环绕信号的感觉宽度。调谐参数S_CD的范围可优选地设置为[-1，1]。

在示例性实施例中，解码器115还可将空间声音图像向左或向右移动，从而允许相应地移动甜点。当听者位于原始甜点的左边或右边时，这可能特别有用。

在第一上混频步骤中获得信号能量的左右分布，其中使用预测参数CPC₁和CPC₂产生信号L、C和R。平衡控制使用这些预测参数来实现甜点位置的低复杂度操纵。

具体地，由于CPC₁参数控制左边的下混频通道的贡献，而CPC₂参数控制右边的下混频通道的贡献，所以通过相对于彼此减小各参数，可以将平衡向左或向右偏移。因此，减小CPC₁将使平衡向右偏移，而减小CPC₂将使平衡向左偏移。

具体地，用于平衡控制的CPC参数的调整可以与通过中心频散控制参数进行中心宽度减少的方式类似的方式执行。取决于平衡控制调谐参数S_LR的符号，这些参数或者朝-1的CPC值偏移，或者保持不变：

参数范围：

S_LR∈[-1，...，+1]

提供了合理的平衡控制量，而不会不利地影响与中心能量相关联的感觉效果。

对预增益矩阵的评估表明，不可能在不增加中心信号的能量的情况下通过简单地修改CPC参数来创建绝对的平衡尺度。然而，降低的平衡控制通常就足够了，因为多数典型的甜点位置仅相对较小地偏移中心收听位置。

在示例性实施例中，解码器115还可修改前后频散，从而允许控制感觉到的声音宽度，并因此增加甜点。

具体地，修改在上混频的第二阶段中用来产生左右侧的前通道和环绕通道的IIC参数，以增加或减少相关性，从而影响前/后频散。

具体地，ICC参数的调整类似于用于控制中心频散的CPC参数的调整，除了所调整的ICC参数被限制为从0到1的范围。因此，使用前后频散调谐参数S_CR，新的相关性参数可确定为：

{ICC}_{new} = \{\begin{matrix} (1 + S_{CR}) \cdot ICC & for S_{CR} < 0, \\ 1 - (1 - S_{CR}) \cdot (1 - ICC) & for S_{CR} &GreaterEqual; 0 . \end{matrix}

其中

S_CR∈[-1，...，+1]

下面的表格提供了被修改以实现不同的甜点操纵的具体空间参数的概述：

调谐参数	影响的空间参数	调谐参数	参数范围
调谐参数	影响的空间参数	调谐参数	参数范围	前/后频散	ICC	S_CR	[-1，...，+1]
中心频散	CPC₁和CPC₂	S_CD	[-1，...，+1]	前/后频散	ICC	S_CR	[-1，...，+1]
中心频散	CPC₁和CPC₂	S_CD	[-1，...，+1]	左-右平衡控制	CPC₁或CPC₂	S_LR	[-1，...，+1]
前-后平衡控制	IID(+L+C+R)	S_FB	[-30，...，+30]	左-右平衡控制	CPC₁或CPC₂	S_LR	[-1，...，+1]

在具体实施例中，同时使用所有的调谐参数。然而，应用修改的顺序可能影响实现的质量。

具体地，中心频散和左右平衡控制彼此影响，因为它们使用相同的空间参数。平衡控制维持中心通道中的一些能量，而中心频散调整将中心能量(的一部分)混合到左右两侧。因此，在平衡控制后执行中心频散时，应当由平衡控制衰减的很多能量在侧面通道中结束。因此，可首先执行中心频散调整，允许平衡控制适当地操作。

前后平衡控制在缩放因子的计算中使用CPC参数。典型地，将在上混频处理中使用的实际参数应当用于计算。因此，前后平衡控制的计算可以在中心频散和左右平衡控制的计算后执行。

前/后频散调整的计算不受任何其他给出的调谐参数的影响。相关性调整也不影响其他调谐参数。因此，可在其他计算内中任意命令该参数的修改。

将认识到，所述原理可应用到在导引模式和非导引模式下操作的MPEG环绕解码器。当在非导引模式下操作时，基于接收的立体声信号的特性通过解码器自身确定空间参数，而在导引模式下时，从编码器产生和接收空间参数。

所述方法可提供与非导引模式操作相关的改进的收听体验的具体示例是在接收到没有非常明显的左右通道的立体声信号(例如，常规的立体声信号)的情况下。为了优化该类信号的环绕体验，可通过算法提供具体的收听设置或模式。

常规地，无线电台的不良接收可能导致对于接收机的双通道输出的两类影响(两者的组合也是普遍的)：

-有噪声音。

-非立体声再现或在立体声和单声道之间切换。

实验已经显示，具有静态噪声的立体声信号不显著影响空间图像。噪声在所有输出中终止，如同其对于立体声输出那样。

然而，更动态的噪声更明显地影响接收机输出的空间特性。通常这类噪声导致在无线电接收机中立体声和单声道再现的快速切换。利用标准的MPEG环绕非导引算法，这样的信号导致空间不稳定性，其中当输入切换到单声道时完整的声音跌为中心扬声器。

这对于基于单声道的FM站和所有AM站也是不利的，因为单声道信号(L_dmx＝R_dmx)没有通道间强度差，并且全相关性以及因此的空间参数是恒定的。CPC参数的结果值将大量信号能量置入中心通道，并提供不良的环绕声体验。

此外，由于发送FM立体声信号的方式(单声道(和)信号和差分信号)，下混频的空间性质可能降低，这是因为对于不良接收首先劣化的是差分信号。因此，通过MPEG环绕非导引算法的空间重构比常规的立体声信号远远更容易趋于定向到中心。

因此，对于非导引MPEG环绕系统将无线电信号作为源的主要缺点是操纵算法的空间特性可能丢失、导致信号会聚在前中心扬声器的高概率。

然而，所述解码器提供了可以改进所提供的环绕声体验的低复杂度的甜点操纵。具体地，实现令人满意的单声道信号的空间图像的低复杂度的解决方案可以使用中心频散调谐参数。将该参数设置为例如0.5，导致应置入中心信号的一部分能量分散到侧面信号L和R。对于单声道信号，0dB的IID导致前后扬声器之间的均匀分布。

结果，即使对于单声道输入，该算法也可以有效地将信号分布到所有输出通道上。对于立体声信号，展宽创建了增强的空间图像。

图5图示修改空间M通道音频信号的甜点的方法。该方法在步骤501开始，其中接收N通道音频信号，N＜M。

步骤501后是步骤503，其中确定将N通道音频信号与空间M通道音频信号相关的空间参数。

步骤503后是步骤505，其中通过修改至少一个空间参数来修改空间M通道音频信号的甜点。

步骤505后是步骤507，其中通过使用该至少一个修改的空间参数将N通道音频信号上混频来产生空间M通道音频信号。

将认识到，为了描述清楚，参照不同的功能单元和处理器描述了本发明的实施例。然而，显而易见，可使用不同功能单元或处理器之间的任何适当的功能的分布而不背离本发明。例如，图示为由单独的处理器或控制器执行的功能可由相同的处理器或控制器执行。因此，对于具体功能单元的指代仅被视为指代用于提供所述功能的适当装置，而非指示严格的逻辑或物理的结构或组织。

本发明可以以包括硬件、软件、固件或其任何组合的任何适当形式实现。本发明任选地可以至少部分地实现为在一个或多个数据处理器和/或数字信号处理器上运行的计算机软件。本发明的实施例的元件和组件可以以任何适当方式物理地、功能地和逻辑地实现。实际上，功能可以单个单元、多个单元或作为其他功能单元的一部分实现。这样，本发明可以以单个单元实现，或可以是物理和功能地分布在不同单元和处理器之间。

尽管已经关于一些实施例描述了本发明，但是不意图将本发明限制为这里提出的具体形式。相反，本发明的范围仅由所附权利要求书限定。此外，尽管特征可能好像被描述为与特定实施例相关，但是本领域技术人员将认识到，所述实施例的各种特征可以根据本发明进行组合。在权利要求书中，术语包括不排除其他元件或步骤的存在。

此外，尽管各个列出，但是多个装置、元件或方法步骤可通过例如单个单元或处理器实现。此外，尽管各个特征可包括在不同的权利要求中，但是这些可以有利地组合，并且包含在不同权利要求中不意味着特征的组合不可行和/或不利。而且，将特征包含在一类权利要求中不意味着限制于该类别，而是指示适当时该特征可同等地应用于其他权利要求类别。此外，权利要求中特征的顺序不意味着必须操作各特征的任何特定顺序，特别是，方法权利要求中的各个步骤的顺序不意味着各步骤必须以此顺序执行。而是，各步骤可以以任何适当的顺序执行。此外，单数指代不排除复数。因此，对“一”、“一个”、“第一”、“第二”等的指代不排除复数。权利要求中的参考标号仅提供为说明示例，不应以任何方式解释为限制权利要求的范围。

Claims

1.一种用于修改空间M通道音频信号的甜点的装置，所述装置包括：

接收机(201)，用于接收N通道音频信号，N＜M；

参数装置(203)，用于确定将所述N通道音频信号与所述空间M通道音频信号相关的空间参数；

修改装置(207)，用于通过修改至少一个所述空间参数来修改所述空间M通道音频信号的所述甜点；

产生装置(205)，用于通过使用所述至少一个修改的空间参数将所述N通道音频信号上混频，来产生所述空间M通道音频信号。

2.如权利要求1所述的装置，其中所述修改装置(207)被布置为通过修改第一空间参数来修改前后平衡，所述第一空间参数指示所述空间M通道音频信号的至少一个前通道和至少一个后通道之间的强度差。

3.如权利要求2所述的装置，其中所述第一空间参数是所述至少一个前通道和所述至少一个后通道之间的通道间强度差。

4.如权利要求3所述的装置，其中所述修改装置(207)被布置为修改所述通道间强度差的量化索引。

5.如权利要求2所述的装置，其中所述修改装置(207)还被布置为缩放至少一个前通道，使得减少通过修改所述第一参数导致的所述空间M通道音频信号的前侧通道与中心通道能量比的变化。

6.如权利要求1所述的装置，其中所述修改装置(207)被布置为通过修改第一空间参数来修改中心频散，所述第一空间参数指示所述N通道音频信号的至少一个通道的信号在中心通道和至少一个侧面通道之间的相对分布。

7.如权利要求6所述的装置，其中所述第一空间参数是通道预测系数。

8.如权利要求1所述的装置，其中所述修改装置(207)被布置为通过修改第一空间参数来修改左右平衡，所述第一空间参数指示所述N通道音频信号的至少一个通道的信号在至少一个右侧通道和至少一个左侧通道之间的相对分布。

9.如权利要求8所述的装置，其中所述第一空间参数是通道预测系数。

10.如权利要求1所述的装置，其中所述修改装置(207)被布置为通过修改第一空间参数来修改前后频散，所述第一空间参数指示所述空间M通道音频信号的至少一个前通道和至少一个后通道之间的相对相关性。

11.如权利要求10所述的装置，其中所述第一空间参数是所述至少一个前通道和所述至少一个后通道之间的通道间相关性系数。

12.如权利要求1所述的装置，其中所述N通道音频信号对应于所述空间M通道音频信号的下混频，并且所述接收机(201)被布置为接收将所述下混频的N通道音频信号与所述空间M通道音频信号相关的编码器空间参数，并且所述参数装置(203)被布置为根据所述编码器空间参数确定所述空间参数。

13.如权利要求1所述的装置，其中所述参数装置(203)被布置为根据所述N通道音频信号的所述通道的信号特性确定所述空间参数。

14.如权利要求1所述的装置，其中所述N通道音频信号是MPEG环绕信号。

15.一种用于接收空间M通道音频信号的接收机(103)，所述接收机(103)包括：

接收器(201)，用于接收N通道音频信号，N＜M；

修改装置(207)，用于通过修改至少一个所述空间参数来修改所述空间M通道音频信号的甜点；

16.一种用于传输音频信号的传输系统(100)，所述传输系统包括：

布置为发送N通道音频信号的发送机(101)；以及

接收机(103)，其包括：

接收器(201)，用于接收所述N通道音频信号；

参数装置(203)，用于确定将所述N通道音频信号与空间M通道音频信号相关的空间参数，N＜M；

17.一种用于播放空间M通道音频信号的音频播放设备(103)，所述音频播放设备包括：

接收机(201)，用于接收N通道音频信号，N＜M；

18.一种用于修改空间M通道音频信号的甜点的方法，所述方法包括：

接收(501)N通道音频信号，N＜M；

确定(503)将所述N通道音频信号与所述空间M通道音频信号相关的空间参数；

通过修改至少一个所述空间参数来修改(505)所述空间M通道音频信号的所述甜点；

通过使用所述至少一个修改的空间参数将所述N通道音频信号上混频，来产生(507)所述空间M通道音频信号。

19.一种接收空间M通道音频信号的方法，所述方法包括：

接收(501)N通道音频信号，N＜M；

通过修改至少一个所述空间参数来修改(505)所述空间M通道音频信号的甜点；

20.一种发送和接收音频信号的方法，所述方法包括：

发送N通道音频信号的发送机(101)；以及

接收机(103)，其执行下述步骤：

接收(501)所述N通道音频信号；

确定(503)将所述N通道音频信号与空间M通道音频信号相关的空间参数，N＜M；

21.一种用于执行权利要求18、19和20中的任一的方法的计算机程序产品。