CN108777837B

CN108777837B - 用于音频信号解码的方法和装置

Info

Publication number: CN108777837B
Application number: CN201810453106.5A
Authority: CN
Inventors: F.基勒; J.贝姆
Original assignee: Dolby International AB
Current assignee: Dolby International AB
Priority date: 2013-10-23
Filing date: 2014-10-20
Publication date: 2021-08-24
Anticipated expiration: 2034-10-20
Also published as: MY179460A; KR20210037747A; JP7529371B2; CA2924700C; MY191340A; US20220417690A1; CA3221605A1; ZA201901243B; EP3061270A1; KR102491042B1; AU2022291445B2; JP2016539554A; US20160309273A1; US10694308B2; AU2022291443A1; TWI686794B; CN105637902A; CN108632737B; BR112016009209A8; CA3147196C

Abstract

本公开涉及用于音频信号解码的方法和装置。对于解码，需要特定于给定的扬声器设置并且使用已知的扬声器位置生成的解码矩阵。针对已知位置处的L个扬声器对声场格式的经编码的音频信号进行解码的改进方法包括以下步骤：将至少一个虚拟扬声器的位置添加(10)到L个扬声器的位置；生成(11)3D解码矩阵(D’)，其中使用L个扬声器的位置(公式I)和至少一个虚拟位置(公式II)；对3D解码矩阵(D’)进行向下混合(12)；以及使用规模缩减的3D解码矩阵(公式III)对经编码的音频信号(i14)进行解码(14)。结果，获得多个经解码的扬声器信号(q14)。

Description

用于音频信号解码的方法和装置

本申请是申请号为201480056122.0、申请日为2014年10月20日、发明名称为“使用2D设置对高保真度立体声响复制音频声场表示进行解码以便音频回放的方法和装置”的发明专利申请的分案申请。

技术领域

本发明涉及对音频声场表示进行解码，特别是对经高保真度立体声响复制(Ambisonics)格式化的音频表示，进行解码以便使用2D或近2D设置进行音频回放的方法和装置。

背景技术

准确定位是任何空间音频再现系统的关键目标。这样的再现系统非常适用于会议系统、比赛或者受益于3D声音的其他虚拟环境。3D中的声音场景能够被合成或捕获为自然声场。诸如例如高保真度立体声响复制这样的声场信号携带所期望的声场的表示。需要解码处理以从声场表示获得个体扬声器信号。对经高保真度立体声响复制格式化的信号进行解码也被称为“呈现”。为了合成音频场景，需要涉及空间扬声器布置的平移功能(panningfunction)以便获得给定声源的空间定位。为了记录自然声场，需要麦克风阵列以捕获空间信息。高保真度立体声响复制方法是非常适合于实现这一点的工具。基于声场的球谐函数分解，经高保真度立体声响复制格式化的信号携带所期望的声场的表示。虽然基本的高保真度立体声响复制格式或B格式使用零阶和一阶的球谐函数，但是所谓高阶高保真度立体声响复制(Higher Order Ambisonics，HOA)还使用至少二阶的球谐函数。扬声器的空间布置被称为扬声器设置。对于解码处理，需要解码矩阵(也被称为呈现矩阵)，其特定于给定的扬声器设置并且使用已知的扬声器位置来生成。

常用的扬声器设置是使用两个扬声器的立体声设置、使用五个扬声器的标准环绕设置以及使用多于五个扬声器的环绕设置的扩展。然而，这些熟知的设置受限于二维(2D)，例如没有再现高度信息。用于能够再现高度信息的已知扬声器设置的呈现在声音定位和着色方面具有缺点：或者空间垂直平移以非常不均匀的响度被感知，或者扬声器信号具有强的旁瓣，这对于偏离中心的收听位置特别不利。因此，在将HOA声场描述呈现给扬声器时，所谓的能量保持(energy-preserving)的呈现设计是优选的。这意味着信号声源的呈现导致恒定能量的扬声器信号，而与源的方向无关。换句话说，扬声器呈现器保持由高保真度立体声响复制表示携带的输入能量。来自发明人的国际专利公开WO2014/012945A1[1]描述针对3D扬声器设置具有良好的能量保持和定位性质的HOA呈现器设计。然而，虽然该方法对覆盖所有方向的3D扬声器设置工作得非常好，但是对于2D扬声器设置(像例如5.1环绕这样的)，一些源方向衰减。这特别适用于没有放置扬声器的方向，例如来自顶部。

在F.Zotter和M.Frank的“All-Round Ambisonic Panning and Decoding”[2]中，如果在由扬声器建立的凸包中存在漏洞，则添加“想象的”扬声器。然而，对于在真实扬声器上的回放，省略针对该想象的扬声器所得到的信号。这样，来自该方向(亦即，未安置真实扬声器的方向)的源信号仍然将衰减。而且，那篇论文仅示出想象扬声器的使用以便与VBAP(矢量基幅度平移)一起使用。

发明内容

因此，仍然存在的问题是针对2D(2维)扬声器设置设计能量保持的高保真度立体声响复制呈现器，其中，来自没有放置扬声器的方向的声源较少地衰减或者根本不衰减。2D扬声器设置可以被分类为扬声器的仰角在所定义的小范围内(例如，<10°)使得它们接近于水平面的设置。

本说明书描述用于针对规则的或者不规则的空间扬声器分布对经高保真度立体声响复制格式化的音频声场表示进行呈现/解码的解决方案，其中，呈现/解码提供高度改良的定位和着色性质并且是能量保持的，并且其中，甚至来自没有扬声器可用的方向的声音也被呈现。有利地，来自没有扬声器可用的方向的声音以与在扬声器在相应的方向上可用的情况下应具有的能量和感知响度基本上相同的能量和感知响度来呈现。当然，这些声源的精确定位是不可能的，因为没有扬声器在其方向上可用。

具体地，至少一些所描述的实施例提供用于获得对HOA格式的声场数据进行解码的解码矩阵的新方式。因为至少该HOA格式描述不直接与扬声器位置相关的声场，并且将要获得的扬声器信号未必是以基于信道的音频格式，所以HOA信号的解码总是与呈现音频信号紧密相关。原则上，这也适用于其他音频声场格式。因此，本公开涉及对声场相关的音频格式进行解码和呈现。术语解码矩阵和呈现矩阵被用作同义词。

为了获得具有良好的能量保持性质的用于给定设置的解码矩阵，在没有扬声器可用的位置处添加一个或多个虚拟扬声器。例如，为了获得用于2D设置的改进的解码矩阵，在顶部和底部(对应于仰角角度+90°和-90°，并且2D扬声器以近似0°仰角来放置)添加两个虚拟扬声器。对于该虚拟3D扬声器设置，设计满足能量保持性质的解码矩阵。最后，将来自用于虚拟扬声器的解码矩阵的加权因子与对2D设置的真实扬声器的恒定增益混合。

根据一个实施例，通过以下来生成用于将高保真度立体声响复制格式的音频信号呈现或解码到扬声器的给定集合的解码矩阵(或呈现矩阵)：通过使用常规方法并且使用修改的扬声器位置来生成第一初步解码矩阵，其中，修改的扬声器位置包括扬声器的给定集合的扬声器位置以及至少一个添加的虚拟扬声器位置；以及对第一初步解码矩阵进行向下混合(downmix)，其中，与至少一个添加的虚拟扬声器有关的系数被移除并且被分给与扬声器的给定集合的扬声器有关的系数。在一个实施例中，接着是对解码矩阵进行归一化的随后步骤。得到的解码矩阵适合于将高保真度立体声响复制信号呈现或解码到扬声器的给定集合，其中，甚至来自不存在扬声器的位置的声音也以正确的信号能量被再现。这是由于改进的解码矩阵的结构。优选地，第一初步解码矩阵是能量保持的。

在一个实施例中，解码矩阵具有L行和O_3D列。行数对应于2D扬声器设置中的扬声器的数量，列数对应于根据O_3D＝(N+1)²而取决于HOA阶数N的高保真度立体声响复制系数O_3D的数量。2D扬声器设置的解码矩阵的系数的每个是至少第一中间系数和第二中间系数的和。第一中间系数通过能量保持的3D矩阵设计方法针对2D扬声器设置的当前扬声器位置来获得，其中，能量保持的3D矩阵设计方法使用至少一个虚拟扬声器位置。第二中间系数通过乘以加权因子g的根据所述能量保持的3D矩阵设计方法针对所述至少一个虚拟扬声器位置而获得的系数来获得。在一个实施例中，加权因子g根据

来计算，其中，L是2D扬声器设置中的扬声器的数量。

在一个实施例中，本发明涉及计算机可读存储介质，其上存储有可执行指令以使计算机执行包括上面或在权利要求书中公开的方法的步骤的方法。

在权利要求9中公开利用该方法的装置。

在从属权利要求、下面的描述和附图中公开有利的实施例。

附图说明

参照附图来描述本发明的示例性实施例，附图中：

图1示出根据一个实施例的方法的流程图；

图2示出经向下混合的HOA解码矩阵的示例性结构；

图3示出获得和修改扬声器位置的流程图；

图4示出根据一个实施例的装置的框图；

图5示出由常规解码矩阵产生的能量分布；

图6示出由根据实施例的解码矩阵产生的能量分布；以及

图7示出对于不同频带单独优化的解码矩阵的使用。

具体实施方式

图1示出根据一个实施例对音频信号，特别是声场信号，进行解码的方法的流程图。声场信号的解码一般需要音频信号将被呈现到的扬声器的位置。L个扬声器的这样的扬声器位置

是处理的输入i10。注意，当提及位置时，实际上，在这里是指空间方向，亦即，扬声器的位置由它们的倾斜角θ_l和方位角φ_l来定义，倾斜角θ_l和方位角φ_l被组合成矢量

然后，虚拟扬声器的至少一个位置被添加10。在一个实施例中，作为对该处理的输入i10的所有扬声器位置基本上在相同的平面中，使得它们构成2D设置，并且所添加的至少一个虚拟扬声器在该平面之外。在一个特别有利的实施例中，作为对该处理的输入i10的所有扬声器位置基本上在相同的平面中，并且在步骤10中添加两个虚拟扬声器的位置。两个虚拟扬声器的有利位置在下面描述。在一个实施例中，根据下面的等式(6)来执行该添加。添加步骤10在q10处导致扬声器角度的修改的集合

L_virt是虚拟扬声器的数量。在3D解码矩阵设计步骤11中使用扬声器角度的修改的集合。HOA阶数N(一般是声场信号的系数的阶数)也需要提供i11给步骤11。

3D解码矩阵设计步骤11执行用于生成3D解码矩阵的任何已知方法。优选地，3D解码矩阵适合于能量保持类型的解码/呈现。例如，能够使用在PCT/EP2013/065034中描述的方法。3D解码矩阵设计步骤11导致适合于对L’＝L+L_virt个扬声器信号进行呈现的解码矩阵或呈现矩阵D’，其中L_virt是在“虚拟扬声器位置添加”步骤10中添加的虚拟扬声器位置的数量。

因为仅L个扬声器是在物理上可用的，由3D解码矩阵设计步骤11产生的解码矩阵D’需要适合于在向下混合步骤12中的L个扬声器。该步骤执行解码矩阵D’的向下混合，其中，与虚拟扬声器有关的系数被加权并且被分给与存在的扬声器有关的系数。优选地，任何特定HOA阶的系数(亦即，解码矩阵D’的列)被加权并且被添加到相同HOA阶的系数(亦即，解码矩阵D’的相同列)。一个示例是根据下面的等式(8)的向下混合。向下混合步骤12导致具有L行，亦即具有比解码矩阵D’更少的行，但是具有与解码矩阵D’相同的列数的经向下混合的3D解码矩阵

换句话说，解码矩阵D’的维度是(L+L_virt)×O_3D，而经向下混合的3D解码矩阵

的维度是L×O_3D。

图2示出来自HOA解码矩阵D’的经向下混合的HOA解码矩阵

的示例性结构。HOA解码矩阵D’具有L+2行，这意味着已经将两个虚拟扬声器位置添加到L个可用的扬声器位置；并且具有O_3D列，其中O_3D＝(N+1)²并且N是HOA阶数。在向下混合步骤12中，HOA解码矩阵D’的行L+1和行L+2的系数被加权并且被分给它们各自的列的系数，并且行L+1和行L+2被移除。例如，行L+1和行L+2中的每个的第一系数d’_L+1，1和d’_L+2，1被加权并且添加到每个剩余行的第一系数，诸如d’_1，1。经向下混合的HOA解码矩阵

的得到的系数

是d’_1，1、d’_L+1，1、d’_L+2，1和加权因子g的函数。以相同的方式，例如，经向下混合的HOA解码矩阵

的得到的系数

是d’_2，1、d’_L+1，1、d’_L+2，1和加权因子g的函数，而经向下混合的HOA解码矩阵

的得到的系数

是d’_1，2、d’_L+1，2、d’_L+2，2和加权因子g的函数。

通常，经向下混合的HOA解码矩阵

将在归一化步骤13中被归一化。然而，该步骤13是可选的，因为未经归一化的解码矩阵也可以用于对声场信号进行解码。在一个实施例中，根据下面的等式(9)对经向下混合的HOA解码矩阵

进行归一化。归一化步骤13导致经归一化的经向下混合的HOA解码矩阵D，其具有与经向下混合的HOA解码矩阵

相同的维度L×O_3D。

然后，能够在声场解码步骤14中使用经归一化的经向下混合的HOA解码矩阵D，其中，输入声场信号i14被解码成L个扬声器信号q14。通常，直至扬声器设置被修改为止，不需要修改经归一化的经向下混合的HOA解码矩阵D。因此，在一个实施例中，将经归一化的经向下混合的HOA解码矩阵D存储在解码矩阵储存器中。

图3示出在实施例中如何获得和修改扬声器位置的细节。该实施例包括以下步骤：确定101L个扬声器的位置

和声场信号的系数的阶数N；根据所述位置来确定102L个扬声器基本上在2D平面中；以及生成103虚拟扬声器的至少一个虚拟位置

在一个实施例中，至少一个虚拟位置

是

和

中的一个。

在一个实施例中，生成103与两个虚拟扬声器相对应的两个虚拟位置

和

其中

并且

根据一个实施例，针对已知位置处的L个扬声器对经编码的音频信号进行解码的方法包括以下步骤：确定101L个扬声器的位置

和声场信号的系数的阶数N；根据所述位置来确定102L个扬声器基本上在2D平面中；生成103虚拟扬声器的至少一个虚拟位置

生成11 3D解码矩阵D’，其中，使用L个扬声器的所确定的位置

和至少一个虚拟位置

并且3D解码矩阵D’具有关于所确定的扬声器位置和虚拟扬声器位置的系数；对3D解码矩阵D’进行向下混合12，其中，关于虚拟扬声器位置的系数被加权并且被分给与所确定的扬声器位置有关的系数，并且其中，获得具有关于所确定的扬声器位置的系数的规模缩减的3D解码矩阵

以及使用规模缩减的3D解码矩阵

对经编码的音频信号i14进行解码14，其中获得多个经解码的扬声器信号q14。

在一个实施例中，经编码的音频信号是例如HOA格式的声场信号。

在一个实施例中，虚拟扬声器的至少一个虚拟位置

是

和

中的一个。

在一个实施例中，使用加权因子

对关于虚拟扬声器位置的系数进行加权。

在一个实施例中，该方法具有对规模缩减的3D解码矩阵

进行归一化的另外的步骤，其中获得经归一化的规模缩减的3D解码矩阵D，并且对经编码的音频信号i14进行解码14的步骤使用经归一化的规模缩减的3D解码矩阵D。在一个实施例中，该方法具有将规模缩减的3D解码矩阵

或者经归一化的规模缩减的3D解码矩阵D存储在解码矩阵储存器中的步骤。

根据一个实施例，通过以下来生成用于将声场信号呈现或解码到扬声器的给定集合的解码矩阵：通过使用常规方法并且使用修改的扬声器位置来生成第一初步解码矩阵，其中，修改的扬声器位置包括扬声器的给定集合的扬声器位置以及至少一个添加的虚拟扬声器位置；以及对第一初步解码矩阵进行向下混合，其中，与至少一个添加的虚拟扬声器有关的系数被移除并且被分给与扬声器的给定集合的扬声器有关的系数。在一个实施例中，接着是对解码矩阵进行归一化的随后步骤。得到的解码矩阵适合于将高保真度立体声响复制信号呈现或解码到扬声器的给定集合，其中，甚至来自不存在扬声器的位置的声音也以正确的信号能量被再现。这是由于改进的解码矩阵的结构。优选地，第一初步解码矩阵是能量保持的。

图4a)示出根据一个实施例的装置的框图。针对已知位置处的L个扬声器对声场格式的经编码的音频信号进行解码的装置400包括：添加器单元410，用于将至少一个虚拟扬声器的至少一个位置添加到L个扬声器的位置；解码矩阵生成器单元411，用于生成3D解码矩阵D’，其中，使用L个扬声器的位置

和至少一个虚拟位置

并且3D解码矩阵D’具有关于所确定的扬声器位置和虚拟扬声器位置的系数；矩阵向下混合单元412，用于对3D解码矩阵D’进行向下混合，其中，关于虚拟扬声器位置的系数被加权并且被分给与所确定的扬声器位置有关的系数，并且其中，获得具有关于所确定的扬声器位置的系数的规模缩减的3D解码矩阵

以及解码单元414，用于使用规模缩减的3D解码矩阵

对经编码的音频信号进行解码，其中获得多个经解码的扬声器信号。

在一个实施例中，该装置还包括：归一化单元413，用于对规模缩减的3D解码矩阵

进行归一化，其中，获得经归一化的规模缩减的3D解码矩阵D，并且解码单元414使用经归一化的规模缩减的3D解码矩阵D。

在图4b)中示出的一个实施例中，该装置还包括：第一确定单元4101，用于确定L个扬声器的位置(Ω_L)以及声场信号的系数的阶数N；第二确定单元4102，用于根据所述位置来确定L个扬声器基本上在2D平面中；以及虚拟扬声器位置生成单元4103，用于生成虚拟扬声器的至少一个虚拟位置

在一个实施例中，该装置还包括：多个带通滤波器715b，用于将经编码的音频信号分离成多个频带，其中，生成711b多个单独的3D解码矩阵D_b’，针对每个频带一个，并且分别对每个3D解码矩阵D_b’进行向下混合712b以及可选地进行归一化，并且其中，解码单元714b分别对每个频带进行解码。在该实施例中，该装置还包括多个加法器单元716b，针对每个扬声器一个。每个加法器单元将与相应的扬声器有关的频带加起来。

添加器单元410、解码矩阵生成器单元411、矩阵向下混合单元412、归一化单元413、解码单元414、第一确定单元4101、第二确定单元4102和虚拟扬声器位置生成单元4103中的每个能够由一个或多个处理器实现，并且这些单元中的每个可以与这些单元中的任何其他单元或者其他单元共享相同的处理器。

图7示出针对输入信号的不同频带分别使用优化的解码矩阵的实施例。在该实施例中，解码方法包括使用带通滤波器将经编码的音频信号分离成多个频带的步骤。生成711b多个单独的3D解码矩阵D_b’，针对每个频带一个，并且分别对每个3D解码矩阵D_b’进行向下混合712b以及可选地进行归一化。经编码的音频信号的解码714b对每个频带分别执行。这具有如下优点：能够考虑人类感知中的频率相关的差异，并且能够导致针对不同频带的不同解码矩阵。在一个实施例中，仅一个或多个(但不是所有)解码矩阵如上所述地通过添加虚拟扬声器位置、然后将它们的系数加权并且分给关于存在的扬声器位置的系数来生成。在另外的实施例中，每个解码矩阵如上所述地通过添加虚拟扬声器位置、然后将它们的系数加权并且分给关于存在的扬声器位置的系数来生成。最后，在与频带拆分相逆的操作中，与相同扬声器有关的所有频带在针对每个扬声器一个的频带加法器单元716b中加起来。

添加器单元410、解码矩阵生成器单元711b、矩阵向下混合单元712b、归一化单元713b、解码单元714b、频带加法器单元716b和带通滤波器单元715b中的每个能够由一个或多个处理器来实现，并且这些单元中的每个可以与这些单元中的任何其他单元或者其他单元共享相同的处理器。

本公开的一个方面是获得用于针对2D设置的具有良好的能量保持性质的解码矩阵。在一个实施例中，在顶部和底部(仰角+90°和-90°，并且2D扬声器以近似0°仰角来放置)添加两个虚拟扬声器。对于该虚拟3D扬声器设置，设计满足能量保持性质的呈现矩阵。最后，将来自用于虚拟扬声器的解码矩阵的加权因子与对2D设置的真实扬声器的恒定增益混合。

下面，描述高保真度立体声响复制(具体地，HOA)呈现。

高保真度立体声响复制呈现是根据高保真度立体声响复制声场描述来计算扬声器信号的处理。有时，它也被称为高保真度立体声响复制解码。考虑阶数为N的3D高保真度立体声响复制声场表示，其中，系数的数量是

O_3D＝(N+1)² (1)

时间样本t的系数由具有O_3D个元素的矢量

表示。在呈现矩阵

的情况下，关于时间样本t的扬声器信号通过下式计算

w(t)＝Db(t) (2)

其中，

并且

并且L是扬声器的数量。

扬声器的位置通过它们的倾斜角θ_l和方位角φ_l来定义，倾斜角θ_l和方位角φ_l被组合成矢量

其中l＝1，...，L。离开收听位置的不同扬声器距离使用关于扬声器信道的个体延迟来补偿。

HOA域中的信号能量由下式给出

E＝b^Hb (3)

其中H表示(共轭复数)被转置。扬声器信号的相应能量由下式计算

能量保持解码/呈现矩阵的比值

应当是恒定的，以便实现能量保持的解码/呈现。

原则上，提出针对改进的2D呈现的如下扩展：对于2D扬声器设置的呈现矩阵的设计，添加一个或多个虚拟扬声器。将2D设置理解为扬声器的仰角角度在所定义的小范围内使得它们接近于水平面的设置。这可以由下式表示

在一个实施例中，通常选择阈值θ_thres2d以与5°到10°的范围内的值相对应。

对于呈现设计，定义扬声器角度的修改的集合

最后的(在该示例中，最后两个)扬声器位置是在极坐标系的北极和南极(在垂直方向上，亦即顶部和底部)的两个虚拟扬声器的位置：

因此，用于呈现设计的扬声器的新的数量是L′＝L+2。根据这些修改的扬声器位置，使用能量保持的方法来设计呈现矩阵

例如，能够使用在[1]中描述的设计方法。现在，根据D′得出关于原始扬声器设置的最终呈现矩阵。一种想法是将在矩阵D′中所定义的虚拟扬声器的加权因子混合到真实的扬声器。使用固定增益因子，将该固定增益因子选择为：

中间矩阵

(在本文中也被称为规模缩减的3D解码矩阵)的系数由下式定义

其中l＝1，...，L并且q＝1，...，O_3D (8)

其中，

是

的在第l行、第q列的矩阵元素。在可选的最终步骤中，使用弗罗贝尼乌斯(Frobenius)范数对中间矩阵(规模缩减的3D解码矩阵)进行归一化：

图5和图6示出5.0环绕扬声器设置的能量分布。在两个图中，能量值被示为灰度，并且圆圈指示扬声器位置。使用所公开的方法，特别地，顶部(以及底部，未在这里示出)的衰减明显减小。

图5示出由常规解码矩阵产生的能量分布。围绕z＝0平面的小圆圈代表扬声器位置。可以看到，[-3.9，…，2.1]dB的能量范围被覆盖，这导致6dB的能量差。另外，来自单位球的顶部(以及在底部上，不可见)的信号以非常低的能量被再现，亦即听不到，因为在这里没有扬声器可用。

图6示出由根据一个或多个实施例的解码矩阵产生的能量分布，其中与在图5中相同数量的扬声器位于与在图5中相同的位置。至少提供如下优点：第一，[-1.6，…，0.8]dB的较小的能量范围被覆盖，这导致仅2.4dB的较小的能量差；第二，来自单位球的所有方向的信号使用它们正确的能量再现，即使在这里没有扬声器可用。因为这些信号通过可用的扬声器再现，所以它们的定位是不正确的，但是信号可以正确的响度被听到。在该示例中，来自顶部的和在底部上(不可见)的信号由于使用改进的解码矩阵进行解码而变得可听到。

在实施例中，针对已知位置处的L个扬声器对高保真度立体声响复制格式的经编码的音频信号进行解码的方法包括以下步骤：将至少一个虚拟扬声器的至少一个位置添加到L个扬声器的位置；生成3D解码矩阵D’，其中，使用L个扬声器的位置

和至少一个虚拟位置

并且3D解码矩阵D’具有关于所确定的扬声器位置和虚拟扬声器位置的系数；对3D解码矩阵D’进行向下混合，其中，关于虚拟扬声器位置的系数被加权并且被分给与所确定的扬声器位置有关的系数，并且其中获得具有关于所确定的扬声器位置的系数的规模缩减的3D解码矩阵

以及使用规模缩减的3D解码矩阵

在另外的实施例中，针对已知位置处的L个扬声器对高保真度立体声响复制格式的经编码的音频信号进行解码的装置包括：添加器单元410，用于将至少一个虚拟扬声器的至少一个位置添加到L个扬声器的位置；解码矩阵生成器单元411，用于生成3D解码矩阵D’，其中，使用L个扬声器的位置

和至少一个虚拟位置

并且3D解码矩阵D’具有关于所确定的扬声器位置和虚拟扬声器位置的系数；矩阵向下混合单元412，用于对3D解码矩阵D’进行向下混合，其中，关于虚拟扬声器位置的系数被加权并且被分给与所确定的扬声器位置有关的系数，并且其中获得具有关于所确定的扬声器位置的系数的规模缩减的3D解码矩阵

以及解码单元414，用于使用规模缩减的3D解码矩阵

在又一个实施例中，针对已知位置处的L个扬声器对高保真度立体声响复制格式的经编码的音频信号进行解码的装置包括至少一个处理器和至少一个存储器，存储器存储有指令，当指令在处理器上执行时，实现：添加器单元410，用于将至少一个虚拟扬声器的至少一个位置添加到L个扬声器的位置；解码矩阵生成器单元411，用于生成3D解码矩阵D’，其中，使用L个扬声器的位置

和至少一个虚拟位置

以及解码单元414，用于使用规模缩减的3D解码矩阵

在又一个实施例中，计算机可读存储介质在其上存储有可执行指令，以使计算机执行针对已知位置处的L个扬声器对高保真度立体声响复制格式的经编码的音频信号进行解码的方法，其中该方法包括以下步骤：将至少一个虚拟扬声器的至少一个位置添加到L个扬声器的位置；生成3D解码矩阵D’，其中，使用L个扬声器的位置

和至少一个虚拟位置

以及使用规模缩减的3D解码矩阵

对经编码的音频信号进行解码，其中获得多个经解码的扬声器信号。计算机可读存储介质的另外的实施例能够包括在上面描述的任何特征，具体地，能够包括在引用权利要求1的从属权利要求中公开的特征。

应当理解，本发明已经仅仅通过示例来描述，并且能够进行细节的修改而不脱离本发明的范围。例如，虽然仅关于HOA进行了描述，但是本发明也可以适用于其他声场音频格式。

在描述和(在适当的情况下)权利要求书和附图中公开的每个特征可以独立地或者以任何适当的组合来提供。在适当的情况下，特征可以以硬件、软件或者二者的组合来实现。在权利要求书中出现的标号仅作为例示，对权利要求书的范围将不具有限制作用。

在上面引用了以下参考文献：

[1]第WO2014/012945A1号国际专利公开(PD120032)

[2]F.Zotter和M.Frank，“All-Round Ambisonic Panning and Decoding”，J.Audio Eng.Soc.，2012年，卷60，页807-820