CN110115050B

CN110115050B - 一种用于产生声场的装置和方法

Info

Publication number: CN110115050B
Application number: CN201680087360.7A
Authority: CN
Inventors: 西蒙妮·方塔纳; 费迪南多·奥利弗里; 菲利波·法齐; 菲利普·内尔松
Original assignee: Huawei Technologies Co Ltd; University of Southampton
Current assignee: Huawei Technologies Co Ltd; University of Southampton
Priority date: 2016-06-30
Filing date: 2016-06-30
Publication date: 2020-09-11
Anticipated expiration: 2036-06-30
Also published as: US10375505B2; US20180288559A1; CN110115050A; EP3351022A1; WO2018001490A1

Abstract

本发明涉及一种基于输入音频信号产生声场的装置(100)。所述装置(100)包括：多个换能器(107A至107L)，其中，每个换能器用于被所述换能器的换能器驱动信号q_l驱动，l∈{1，…，L}，l表示第l个换能器；多个滤波器(105A至105L)，用于为每个换能器产生其换能器驱动信号q_l，其中，每个所述滤波器由滤波器传递函数所定义，所述换能器的换能器驱动信号q_l基于所述换能器的所述滤波器传递函数以及所述输入音频信号；控制单元(101)，用于提供或接收维度为L的第一换能器驱动信号矢量q₀，使得J(q；ψ)关于q的梯度在(q₀；ψ₀)中为0，其中，J(q；ψ)是以维度为L的换能器驱动信号矢量q和维度为M×M的权重矩阵ψ为变量的代价函数，ψ₀是维度为M×M的第一权重矩阵；其中，所述控制单元(101)还用于提供维度为L的第二换能器驱动信号矢量

使得所述代价函数J(q；ψ)关于q的梯度在

中为0或接近于0，

是维度为M×M的第二权重矩阵，所述控制单元(101)用于基于以下参数提供所述第二驱动信号矢量

所述第一换能器驱动信号矢量q₀、所述第一权重矩阵ψ₀和所述第二权重矩阵

Description

一种用于产生声场的装置和方法

技术领域

本发明涉及音频信号处理和再生领域。更具体地，本发明涉及一种用于产生声场的装置和方法。

背景技术

扩展空间区域上的空间多区域声场再现，近来因其在同步车载娱乐系统、展览中心的环绕声系统、公共办公空间中的个人扬声器系统以及嘈杂环境中的安静区域等各方面的应用而备受关注。其旨在不使用隔音墙或耳机的前提下，为听众提供个人声音环境。相应的系统也称为个人音频或私人声音区域(private sound zone，PSZ)系统。

通常情况下，声场可以用来将局地气压与环境压力的偏差，即压力变化，描述为空间和时间的函数。这种变化，例如，是由于多个扬声器发出的声音信号所引起的。多区域声场通常可以包括一个或多个声学亮区，还可能包括几个声学暗区和灰区。

已知的个人音频系统通常基于方向性、扬声器阵列定向声音辐射所需的输入能量以及听音区中期望声场的再现准确度，以下简称为质量，之间的性能权衡。例如，正如Mincheol Shin、Filippo M Fazi、Philip A Nelson和Fabio C Hirono(下称Shin等人)于2014年8月发表在声音与振动杂志(J.Sound Vib.)333(16):3794–3817上的文章《采用双层扬声器阵列的受控声场》(Controlled sound field with a dual layer loudspeakerarray)中描述的那样，个人音频系统会以听音区中的质量为代价来实现高方向性。

广泛用于扬声器阵列的输入信号设计的一种信号处理方法是压力匹配(pressurematching，PM)方法。所述PM方法的一种更常见形式是加权压力匹配(weighted pressurematching，WPM)方法，该方法已广泛用于已知的个人音频系统的多种实现中。所述WPM 方法可以通过适当的可调参数来设计输入信号，实现预期的性能权衡。

为了控制这种基于WPM的权衡，已经提出了很多方法，例如，在以下文章中提出的方法：Ji Ho Chang和Finn Jacobsen于2012年6月发表在美国声学学会杂志(J.Acoust.Soc. Am.)131(6):4518上的《基于环形双层扬声器阵列的声场控制》(Soundfield control with a circular double-layer array of loudspeakers)；TerenceBetlehem和Paul D.Teal于2011年5月发表在2011 IEEE国际声学、语音与信号处理会议(Int.Conf.Acoust.Speech Signal Process) 第一卷，第437至440页的《一种用于多区域环绕声的约束优化方法》(A constrained optimization approach for multi-zonesurround sound)；Yefeng Cai、Ming Wu和Jun Yang于 2014年2月发表在美国声学学会杂志135(2):734–741上的《个人音频系统中采用声学造影控制约束下的最小二乘法的声音再现》(Sound reproduction in personal audio systems using the least-squaresapproach with acoustic contrast control constraint)；以及Shin等人的文章。

Chang和Jacobsen，以及Shin等人提出的方法可以称为“固定值参数”法，因为这个方法的原始方案中的可调参数可以由用户设置。相反地，Betlehem和Teal，以及Cai等人提出的方法包括最优参数的迭代计算算法。此时，这些方法可以称为“迭代”法。所述固定值参数法的优点在于滤波计算速度更快(无需计算参数)，但是无法准确预测最终性能。相反地，所述迭代法可以准确预测最终性能，但滤波计算速度较慢。

当前的私人声音区域系统都是针对固定的预定义场景设计的。然而，通常会希望用户能快速改变场景。例如，对于某一环境特定点上的单个听众来说，在还有其他人存在的情况下，可能希望声音具有更好的音质而不是具有高指向性，或者是希望能改变场景，即，改变私人音频区域的位置和数量。

因此，需要一种用于产生声场的改进装置和方法，以特别实现灵活改变声场场景以及期望的方向性/质量权衡。

发明内容

本发明的目的在于提供一种用于产生声场的改进装置和方法，以特别实现灵活改变声场场景以及期望的方向性/质量权衡。

通过独立权利要求的标的物，实现上述以及其他目的。通过从属权利要求、说明书和附图清楚地描述具体的实现方式。

根据第一方面，本发明涉及一种基于输入音频信号产生声场的装置，其中，所述装置包括：多个换能器，其中，每个换能器用于被该换能器的换能器驱动信号q_l驱动，l∈{1，...，L}， l表示第l个换能器；多个滤波器，用于为每个换能器产生其换能器驱动信号q_l，其中，每个所述滤波器由滤波器传递函数所定义，所述换能器的换能器驱动信号q_l基于所述换能器的所述滤波器传递函数以及所述输入音频信号；控制单元，用于提供或接收维度为L的第一换能器驱动信号矢量q₀，使得J(q；ψ)关于q的梯度在(q₀；ψ₀)中为0，其中，J(q；ψ)是以维度为L 的换能器驱动信号矢量q和维度为M×M的权重矩阵ψ为变量的代价函数，ψ₀是维度为M×M 的第一权重矩阵；其中，所述控制单元还用于提供维度为L的第二换能器驱动信号矢量

使得所述代价函数J(q；ψ)关于q的梯度在

中为0或接近于0，

是维度为M×M的第二权重矩阵，所述控制单元用于基于以下参数提供所述第二驱动信号矢量

因此，提供了一种产生声场的改进装置，以特别实现灵活改变声场场景以及期望的方向性/质量权衡。例如，上述第一方面提供的装置可以由用户实时重配置，以适应环境(私人声音区域的位置)的变化，同时可以控制方向性/质量性能权衡。

根据第一方面，在所述装置的第一种实现方式中，所述代价函数由以下等式给出：

其中，

是包括M个控制点的集合的M个目标压力值

且维度为M的目标压力矢量，m∈{1，...，M}，p是包括所述M个控制点的集合的M个压力值p_m的且维度为M的压力矢量， m∈{1，...，M}，β是区间[0，∞)中的正则化参数。

根据第一方面的第一种实现方式，在所述装置的第二种实现方式中，所述控制单元用于基于以下等式和N阶的截短诺依曼级数计算所述第二换能器驱动信号矢量

其中，Z是维度为M×L的转移矩阵，I为维度为L×L的单位矩阵，Δψ表示ψ₀和

之间的差，上标H表示厄米特转置。

根据第一方面的第二种实现方式，在所述装置的第三种实现方式中，所述声场包括声学亮区、声学暗区以及声学灰区，所述代价函数J(q；ψ)由以下等式给出：

其中，在限定条件

下，对于每个m∈B，J(q；ψ)关于q 的梯度在(q₀；ψ₀)中为0，其中，B是所述亮区中的控制点的索引集合，|p_m，min|²是与所述亮区中的相应控制点上的相应的期望最低声能水平相关联的正实数；

p_B表示所述亮区中的控制点的声压，

表示所述亮区中的控制点的期望声压，p_D表示所述暗区中的多个控制点各自的声压，p_G表示所述灰区中多个控制点各自的声压，Z_ml表示所述转移矩阵Z的第m行第l列上的元素，ψ_D表示暗区加权参数，ψ_G表示灰区加权参数，p_B，min表示所述亮区中的控制点的期望最低声能水平。

根据第一方面的第三种实现方式，在所述装置的第四种实现方式中，所述控制单元用于响应于对所述亮区中的控制点的所述期望最低声能水平的调节，提供所述第二换能器驱动信号矢量

根据第一方面或第一方面的第一至第四种实现方式的任一种，在所述装置的第五种实现方式中，所述第一换能器驱动信号矢量q₀由以下等式给出：

其中，Z是维度为M×L的转移矩阵，

是维度为M的目标压力矩阵，β是区间[0，∞)内的正则化参数。

根据第一方面的第一种或第五种实现方式，在所述装置的第六种实现方式中，所述控制单元用于基于标准Tikhonov正则化确定所述正则化参数β。

根据第一方面的第三种实现方式，在所述装置的第七种实现方式中，由以下等式定义所述N阶的截短诺依曼级数：

其中，Δψ_D表示所述暗区加权参数ψ_D的调整量，所述矩阵E由以下等式定义：

其中，所述矩阵A由以下等式定义：

其中，Z_B表示所述亮区的转移矩阵，Z_D表示暗区的转移矩阵，Z_G表示灰区的转移矩阵。

根据第一方面的第七种实现方式，在所述装置的第八种实现方式中，所述控制单元用于通过在区间-0.5≤Δψ_D≤0.5内确定以下等式的根，确定所述暗区加权参数ψ_D的调整量Δψ_D：

其中，

表示定义矢量的转移矩阵的一部分，p_B，min表示所述亮区中的控制点的期望最低声能水平。

根据第一方面的第二种实现方式，在所述装置的第九种实现方式中，所述N阶的截短诺依曼级数取决于频率。

根据第一方面的第九种实现方式，在所述装置的第十种实现方式中，所述N阶的截短诺依曼级数随着频率的增大而减小。

根据第一方面的第九种或第十种实现方式，在所述装置的第十一种实现方式中，所述控制单元用于基于以下等式确定所述N阶的截短诺依曼级数：

其中，ε_MAX表示误差阈值，ε表示由以下等式定义的误差值：

其中，

表示基于所述截短诺依曼级数确定的换能器驱动信号矢量。

根据第一方面或第一方面的第一种至第十一种实现方式中的任一种，在所述装置的第十二种实现方式中，所述装置还包括用于存储所述第一换能器驱动信号矢量q₀的存储器。

根据第二方面，本发明涉及一种基于输入音频信号产生声场的方法，所述方法包括以下步骤：提供或接收维度为L的第一换能器驱动信号矢量q₀，使得J(q；ψ)关于q的梯度在 (q₀；ψ₀)中为0，其中，J(q；ψ)是以维度为L的换能器驱动信号矢量q和维度为M×M的权重矩阵ψ为变量的代价函数，ψ₀是维度为M×M的第一权重矩阵；提供维度为L的第二换能器驱动信号矢量

使得所述代价函数J(q；ψ)关于q的梯度在

中为0或接近于0，

是维度为M×M的第二权重矩阵，其中，基于以下参数提供所述第二驱动信号矢量

用所述第二换能器驱动信号矢量

的对应元素

驱动L个换能器中的每一个换能器，其中，l∈{1，...，L}。

本发明第二方面所述的方法可以由本发明第一方面所述的装置执行。本发明第二方面所述的方法的进一步特征直接取决于本发明第一方面所述的装置的功能以及其不同的实现方式。

根据第三方面，本发明涉及一种包括程序代码的计算机程序，当在计算机上执行时，所述程序代码用于执行本发明第二方面或第二方面的任一种实现方式所述的方法。

本发明可以在硬件和/或软件中实现。

附图说明

本发明的具体实施例将结合以下附图进行描述：

图1示出了一实施例提供的一种用于产生声场的装置的示意图；

图2示出了一实施例提供的一种用于产生声场的装置中实现的第一算法的伪代码；

图3示出了一实施例提供的一种用于产生声场的装置可以产生的三种示例性声场场景；

图4示出了一实施例提供的一种用于产生声场的装置中实现的第二算法的伪代码；

图5示出了一实施例提供的一种用于产生声场的装置中实现的第三算法的伪代码；

图6示出了一实施例提供的一种用于产生声场的装置的不同方面的示意性流程图；

图7示出了一实施例提供的一种用于产生声场的方法的示意图。

在附图中，完全相同或功能上相同的特征使用相同的附图标记表示。

具体实施方式

以下结合附图进行描述，所述附图是本公开的一部分，并通过图解说明的方式示出可以实施本发明的具体方面。可以理解的是，本发明可以应用于其他方面，可以在不超出本发明范围的情况下做出结构上或逻辑上的改变。因此，以下详细的描述并不当作限定，本发明的范围由所附权利要求书界定。

例如，可以理解的是，与所描述的方法有关的内容对于与用于执行方法对应的设备或系统也同样适用，反之亦然。例如，如果描述了一个具体的方法步骤，对应的设备可以包括用于执行所描述的方法步骤的单元，即使此类单元未在图中详细阐述或说明。

此外，在以下具体描述以及权利要求中，描述了包括功能块或处理单元的实施例，这些功能块或处理单元相互连接或交换信号。应当理解的是，本发明还涵盖包括附加功能块或处理单元的实施例，例如，前滤波或后滤波单元和/或前放大或后放大单元，其设置在下面描述的实施例中的功能块或处理单元之间。

最后，应理解，除非另有特别说明，否则此处描述的各种示例性方面的特征可以彼此组合。

图1示出了一实施例提供的一种用于产生声场的装置100的示意图。图1所示的装置 100包括控制单元101、存储器103、多个滤波器105A至105L以及对应多个扬声器形式的换能器107A至107L。每个换能器用于被换能器驱动信号q_l驱动，l∈{1，...，L}，l表示第l个换能器。所述多个滤波器105A至105L用于为所述换能器107A至107L中的每一个生成换能器驱动信号q_l，所述滤波器105A至105L中的每一个由滤波器传递函数所定义，所述换能器的换能器驱动信号q_l基于所述换能器的所述滤波器传递函数以及所述输入音频信号。

如下更详细的描述，所述控制单元101用于：(i)提供或接收维度为L的第一换能器驱动信号矢量q₀，使得J(q；ψ)关于q的梯度在(q₀；ψ₀)中为0，其中，J(q；ψ)是以维度为L的换能器驱动信号矢量q和维度为M×M的权重矩阵ψ为变量的代价函数，ψ₀是维度为M×M的第一权重矩阵；(ii)提供维度为L的第二换能器驱动信号矢量

使得所述代价函数J(q；ψ)关于q的梯度在

中为0或接近于0，

是维度为M×M的第二权重矩阵，所述控制单元101 用于基于以下参数提供所述第二驱动信号矢量

所述第一换能器驱动信号矢量q0、所述第一权重矩阵ψ₀以及所述第二权重矩阵

在图1所示实施例中，所述装置100用于在空间控制区域110范围内产生声场。所述控制区域110或声场可以包括一个或多个声学亮区110a、一个或多个声学暗区110b和/或一个或多个声学灰区110c，这将在下面更详细地描述。

在描述图1所示的装置100的具体细节和实施例之前，介绍一些数学符号。符号

定义一个矢量，其中，[...]^T表示长度为A的行矢量。符号

定义一个长度为B的矢量。给定一个方矩阵Y，Yⁿ定义了方矩阵Y的n倍矩阵积。此处所使用的声学量可以有时间依赖性e^-jωt，其中j是虚数单位，ω表示角频率，t表示时间。

在一个实施例中，所述多个扬声器107A至107L被设置为圆形阵列，第1个扬声器可以通过坐标矢量y₁来识别，其中l∈[-(L-1)/2，(L-1)/2]，其被换能器驱动信号q_l(ω)驱动。因此，馈送至所述扬声器107A至107L的换能器驱动信号的矢量可以表示为换能器驱动信号矢量q^T(ω)＝[q₁(ω)，...，q_L(ω)]。在位于x_m(m＝1，...，M)的第m个控制点上产生的声学信号(输出信号，即，所述扬声器阵列107A至107L在q^T(ω)的驱动下产生的声压)记为 p(x_m，ω)。

在一个实施例中，所述控制区域110可以由M个控制点组成，所述输出信号的矢量由 p^T(ω)＝[p(x₁，ω)，...，p(x_M，ω)]给出。矢量p(ω)和q(ω)呈线性变换相关，即：

p(ω)＝Z(ω)q(ω)， (1)

其中，维度为MxL的植物或转移(功能)矩阵Z(ω)包含将各个控制点上的声压与各个声源，即扬声器的强度关联起来的传递函数。为了清晰起见，在下面的进一步描述中将省略对ω的显性依赖。

在私人声音区域应用中，所述控制区域110(以及植物矩阵)通常被划分为存在期望声音的区域和存在不期望声音的区域。如上所述，这些区域通常分别称为声学亮区110a和声学暗区110b。在一个实施例中，同样也考虑声学灰区110c，这是所述控制区域110的一部分，其中，不要求目标信号的准确再现。通过如上定义，所述转移矩阵Z可以表示为：

对应的声压信号表示为p_B＝Z_Bq、p_D＝Z_Dq和p_G＝Z_Gq。其中，Z_B、Z_D和Z_G分别表示所述亮区110a、所述暗区110b和所述灰区110c中的控制点111a-c各自的转移矩阵。

可以通过驱动包括基于加权压力匹配(weighted-pressurematching，WPM)方法设计的输入信号的所述扬声器107A至107L的阵列来合成所述控制区域110内M个控制点上的在幅度和相位上定义的期望目标信号

各个声学区域(例如，亮区、暗区或灰区)内的目标信号被定义为：

本发明实施例基于WPM代价函数J(q)，所述WPM代价函数J(q)是每个区域中的平方加权再现误差与阵列成本控制项的和，即：

其中，||...||表示l₂范数，

表示包括第m个控制点的再现误差的WPM权重0≤Ψ_m≤1 的平方根

的M×M对角矩阵，β∈[0，∞)称为Tikhonov正则化参数，其用于控制所述扬声器107A至107L的阵列的输入能量。在本公开中，

根据所述WPM权重Ψ_m，可以控制第m个控制点110a-c的再现误差的权重。Ψ_m的值越大，所述第m个控制点的再现准确度越高。

通过将关于q的实部和虚部的代价函数J(q)的偏导数设置为0并求解q，可以找到使得等式(4)中的代价函数最小化的输入信号(即，换能器驱动信号)，即：

在本发明的以下实施例中，将描述所述亮区110a中的单个控制点的情况。然而，本领域技术人员将容易理解到，这些实施例可以扩展到所述亮区110a中具有多于一个控制点的情况。

对于所述亮区110a中一个控制点的情况，上述换能器驱动信号矢量的方案可以表示为：

其中，(·)^H表示复数共轭转置操作，(·)^-1表示矩阵求逆，I表示单位矩阵，(·)^*表示复数共轭操作。

例如，通过设置

其中，数学符号

表示“对于其所有值”，可以得到以下方案：

在下面进一步的描述中使用以下定义：“场景”是M个控制点101a-c的集合以及M个传递函数的相关集合，即，所述亮区110a中的传递函数Z_B、所述暗区110b中的传递函数Z_D、以及所述灰区110c中的传递函数Z_G。“音频质量”(或简称为“质量”)是指听音区，即亮区，中期望声场的再现准确度。

本发明实施例提出了一种WPM的形式，其中，结合所期望的质量性能确定安静区域中的WPM权重。根据这些实施例，所述装置100的用户可以控制质量和方向性之间的权衡。分别用ψ_D和ψ_G来表示黑点和灰点的WPM权重。如上所述，为了简单起见，下面的实施例仅针对一个相关压力为p_B的亮点，即，所述亮区110a中的一个控制点，该亮点是一个标量。

为了产生私人声音区域，根据本发明实施例，所述控制单元101用于求解下面一组等式：

使得

其中，|p_B，min|²表示用户设置的所述听音区110a中的期望最低能量水平，其控制用户所允许的所述亮区110a中的最低声压水平(sound pressure level，SPL)。ψ_G表示所述灰区 110c中的WPM加权因子，其位于范围0≤ψ_G＜1中并优选地设为一个很小的值，例如，0.01≤ψ_G＜0.1。ψ_D表示所述暗区110b的WPM加权因子，其位于范围0＜ψ_D≤1中，是一个用于控制本发明实施例中的方向性/质量权衡的数值。

上述问题的解为：

在一个实施例中，可以通过归一化Tikhonov正则化(normalized Tikhonovregularization， NTR)方法计算正则化因子β，该方法例如在Shin等人的文章中已公开，存储在所述装置 100的所述存储器103中。该正则化因子可以计算如下：

其中，σ₁是转移矩阵Z的最大奇异值，β₀是正实值因子。通过提前计算所述正则化因子的值并将其存储在所述存储器103中，降低了计算ψ_D的系统复杂度，因此，也降低了计算换能器驱动信号的系统复杂度。参数β₀的计算取决于扬声器107A至107L的阵列的几何形状、控制点配置以及输入能量的限制要求，可以遵循Shin等人概述的流程计算所述参数。可以利用以下等式(参见Shin等人的附录A)计算β的值。

其中，β₀可以用于控制所述扬声器107A至107L的阵列的输入能量。可以基于频率区间[0，f_s/2]中的每个频率计算所述滤波器，其中f_s＝48表示被划分为具有均匀频率间隔的 N_FFT/2+1个频率点的采样频率，N_FFT＝8192。在一个实施例中，可以使用建模延迟，以确保所述滤波器是具有因果关系。

通过为给定区域分配一个较大WPM权重值，可以在该区域中获得更高的目标信号再现准确度。因此，为了确保在听众位置的质量，在一个实施例中，可以将一个较大的WPM权重(例如，最大可能值，即，ψ_B＝1)分配给所述亮区110a，并将用户设置的一个较小的值ψ_G分配给所述灰区110c，因为在所述灰区110c中不需要准确的目标信号再现。所述灰区 110c中的控制点可以用于放宽不要求准确再现的区域中的约束条件。对于给定的正则化因子β的值，用户可以通过设置|P_B，min|²的值来控制方向性和质量之间的权衡。所示控制单元101 用于确定ψD的值，以响应于用户的设置，使得所述滤波器满足性能约束条件。换句话说，通过尝试和调节ψ_D，所述控制单元101可以保证所述亮区110a中的能量至少为|P_B，min|²。能量损耗可以用dB表示为：

本发明实施例中使用迭代算法来计算关于给定性能约束条件的最佳WPM权重，如图2 所示。非常简单地，根据本发明实施例，图2所示的算法在所述装置的所述控制单元101中实现，首先确定针对ψ_D＝1情况下的解q，然后迭代地减小ψ_D，只要相应的新解q仍然等式(8)中定义的约束条件。

基于上述WPM方法，所述装置100的实施例可以用于各种设置和应用中，以下称为使用场景，后者由给定的听众/控制区域配置(即，植物矩阵Z_B、Z_D和Z_G的变化)和给定的性能约束条件(即，|P_B，min|²的选择)所定义，以满足用户设置的质量要求。这可以通过人们所处的控制点(亮区或暗区)的声场的准确再现来实现，而未被占用的区域被标记为灰区。通过组合这些类型的区域，可以定义三个主要的用例场景，其构成了所述装置100的不同用途，例如，音频再现、私人通信等。本发明实施例使用所述灰区110c，即，植物矩阵Z_G，这是因为实际上，所述控制区域110可能存在未被其他人占用的部分，其不需要准确的再现(因此，所述控制单元101可以选择一个较小的ψ_G)。在一个实施例中，可以针对M个控制点的集合预先计算矩阵Z(例如，使用分析模型)，并将所述矩阵Z存储在所述装置100的存储器103中。然后，可以通过视频跟踪设备或手机APP获取听众或其他人的位置，以标记每个控制点。

结合图3，可以通过所述装置100的实施例来处理基于上述定义的各种声音区域的各种组合的使用场景。

在图3左侧所示的“拥挤环境场景”中，听众(位于图3示例中的控制点#2)位于存在其他人的拥挤环境中。其他人的位置可能随着时间变化(例如，所述装置100在公共空间中工作)。在这种情况下，除了收听点的位置，整个控制区域110中的SPL都被最小化。在这种情况下，所述控制单元101可以用于基于以下等式确定换能器驱动信号：

在图3中间所示的“单用户场景”中，环境中只有一个用户，因此对方向性性能没有要求。在这种情况下，用户可能想使用所述装置100进行音频再现，以实现保证“音频质量”的目的。从技术角度来看，这是灰点和亮点的组合。在这种情况下，所述控制单元101可以用于基于以下等式确定换能器驱动信号：

在图3右侧所示的“混合场景”中，单个听众位于存在多个人的环境中，未被用户占用的区域被标记为灰区，这是灰点、暗点和亮点的组合。在这种情况下，所述控制单元101可以基于上述等式(9)确定换能器驱动信号。

由于图2所示的算法在某些情况下可能会较耗时且对计算要求高，尤其是对于实时实现而言，本发明实施例使用不同的算法以更有效的方式计算ψ_D的值。

其中，Δψ_D是为了使

满足性能约束条件而需选择的可调节参数的值。利用近似诺依曼级数，可以得到以下等式(以下将进一步详细描述)：

其中，

是近似滤波器(例如，换能器驱动信号)集合，N是诺依曼级数或阶数的项的个数，

换句话说，在本发明实施例中，可以将存储的滤波器集合q(ψ_D＝0.5)更新为满足|p_B，min|²约束条件的一些修改后的滤波器集合

近似准确度取决于N的值。通过将所述诺依曼级数截短到给定的阶N，引入了标称滤波器

与近似滤波器

之间的误差(利用截短的诺依曼级数计算得到)。该误差取决于以及Δψ_D的值和频率。两个滤波器集合之间的误差可以定义为：

其中，滤波器

根据等式(9)计算得到，滤波器

根据等式(15)通过近似计算得到。根据本发明实施例，所述诺依曼级数的阶N为频率相关参数，可以减小计算负荷。更具体地，在一个实施例中，选择的N(ω)随着频率的增加而减小。通过设置ψ_D＝0.5和Δψ_D＝0.5，可以计算CE场景(可以视为供参考的最坏的场景)下计算得到的滤波器。根据本发明实施例，为N选择的值(在给定频率下)为：

其中，ε_MAX是用户设置的误差阈值(单位是dB)(通常为一个很小的值，例如，ε_MAX＝0.001dB)。N的这个值可以存储在所述装置100的存储器103中，由所述控制器 101用于各个场景。根据本发明实施例，在所述装置100的所述控制单元101中实现的上述算法的伪代码如图4所示。

总而言之，当给定一组计算得到的并存储在所述装置100的所述存储器103中的参考滤波器q(ψ_D＝0.5)时，可以通过所述诺依曼级数得到新滤波器

的近似

从实际来看，等式(15)的主要特征是参数Δψ_D(待确定的)是倍增因子。由于已经简化了滤波器

对参数Δψ_D的依赖，因此，在本发明实施例中，可以找到可以使得新的滤波器集合

满足质量约束条件的估计值Δψ_D，记为

即：

对于给定的阶N(足够大)和给定的q，根据本发明实施例，通过找到以下多项式的根来找到的

值：

这将在下文中更详细地描述。计算得到ψ_D的最终值为

根据本发明实施例，在所述装置100的所述控制单元101中实现的Δψ_D的估计值所使用的对应的算法如图5所示。

如上所述，上述实施例可以扩展到控制点的其他阵列几何形状和配置。通常，本发明实施例中实现的WPM方法中，需要已知传递函数矩阵Z。可以针对控制点的任意阵列几何形状和任意分布生成该矩阵。

图6示出了一实施例提供的装置100的不同处理步骤的示意性流程图，这已在上面进行了描述。步骤601中亮点、灰点和暗点的映射是根据听众(亮区)、其他人(暗区)或未被占用区域(灰区)的位置来标记控制点的操作。在步骤603中，提供了一个或多个转移矩阵。步骤605、607和609涉及确定原始滤波器、暗区加权参数的调整量以及更新的滤波器，这些都已在上面描述过。

图7是一实施例提供的一种用于产生声场的方法700的示意图。所述方法700包括以下步骤：701：提供或接收维度为L的第一换能器驱动信号矢量q₀，使得J(q；ψ)关于q的梯度在 (q₀；ψ₀)中为0，其中，J(q；ψ)是以维度为L的换能器驱动信号矢量q和维度为M×M的权重矩阵为变量的代价函数，ψ₀是维度为M×M的第一权重矩阵。703：提供维度为L的第二换能器驱动信号矢量

使得所述代价函数J(q；ψ)关于q的梯度在

中为0，

所述第一换能器驱动信号矢量q0、所述第一权重矩阵ψ₀和所述第二权重矩阵

705：用所述第二换能器驱动信号矢量的对应元素

驱动L个换能器中的每一个换能器。

如上所述，本发明还可以应用于为彼此远离的两个或两个以上亮区提供同一个音频信道的场景。此时，压力p_B变为矢量p_B。例如，两个亮区可以位于所述扬声器107A至107L的阵列的相对侧。

在多信道系统中，可以叠加属于两个不同音频信道的两个波束。因此，可以将不同音频内容传递到不同的亮点。可以使用不同的滤波器，每个波束对应一个滤波器。

在下文中，将描述关于上述等式中的一些更多的数学细节。考虑一个给定的场景，并假设听众想要设定期望的方向性/质量权衡(即，通过设定|p_B，min|²的值)。假设滤波器集合 q(ψ_D＝0.5)，即：

是在一确定场景就计算出来的，且存储在所述装置100的存储器103中。注意，滤波器 q(ψ_D＝0.5)可能不满足性能约束条件|p_B，min|²。如果是这样的话，那么就要找到满足所述性能约束条件的一组新的滤波器

其中：

且-0.5≤Δψ_D≤0.5。使用以下定义：

等式(20)和(21)可以写成：

q＝q(0.5)＝A^-1b (23)

以及

其中，B＝A+C。如果矩阵B接近于可逆矩阵X，即，满足以下关系：

可以看出，以下关系成立：

选择X＝A，由于A是可逆矩阵，所以X也是可逆的。因此，等式(26)中的诺依曼级数可以写成：

将等式(27)带入等式(24)，可以得到：

从以上等式可以看出，可以使用参考集合q更新所述更新后的滤波器集合

更明显的是，计算

时不需要矩阵求逆。实际上，A^-1(以及C)是在计算参考集合q时计算的。上述诺依曼级数包括无限个项，在实践中无法实现。设

以给定的阶N将上述求和操作截短，即：

这表明，可以由

近似得到所述更新后的滤波器集合

由等式(18)的代数运算得到：

将三角不等式用于两个矢量X和y的两个矢量范数，即，||x+y||≤||x||+||y||。根据等式 (15)得到：

等式(31)包含N次多项式，其中Δψ_D是未知的。根据等式(30)和(31)可以得到：

由上可以推出：

对于给定的阶N(足够大)和给定的q，可以通过求解以下等式得到|Δψ_D|的估计值：

因此，通过找到多项式的根，可以得到|Δψ_D|的估计值。上述等式可以简化如下：

其中，x＝|Δψ_D|，

c₀＝|p_B，min|。一些关于多项式f(x)的注释如下：a_n都是正数，x的域是紧凑的，且为了确保J(x)至少有一个实数根，N必须是奇数。如果在给定频率下N的给定值(基于图4所示的算法确定)是偶数，则根据本发明实施例的所述控制单元101用于将N加1，即：

N＝N+1，若N为偶数。

尽管本发明的特定特征或方面可能已经仅结合几种实现方式或实施例中的一种进行公开，但此类特征或方面可以和其它实现方式或实施例中的一个或多个特征或方面相结合，只要对于任何给定或特定的应用是有需要或有利。而且，在一定程度上，术语“包括”、“有”、“具有”或这些词的其他变形在详细的说明书或权利要求书中使用，这类术语和所述术语“包含”是类似的，都是表示包括的含义。同样，术语“示例性地”，“例如”仅表示为示例，而不是最好或最佳的。可以使用术语“耦合”和“连接”及其派生词。应当理解，这些术语可以用于指示两个元件彼此协作或交互，而不管它们是直接物理接触还是电接触，或者它们彼此不直接接触。

尽管本文中已说明和描述特定方面，但所属领域的技术人员应了解，多种替代和/或等效实现方式可由在不脱离本发明的范围的情况下所示和描述的特定方面替代。该申请旨在覆盖本文论述的特定方面的任何修改或变更。

尽管以下权利要求书中的元件是以具有相应标记的特定顺序列举的，但除非对权利要求的阐述另有暗示用于实施部分或所有这些元件的特定顺序，否则这些元件不必限于以所述特定顺序来实施。

通过以上启示，对于本领域技术人员来说，许多替代、修改和变化是显而易见的。当然，所属领域的技术人员容易认识到除本文所述的应用之外，还存在本发明的众多其它应用。虽然已参考一个或多个特定实施例描述了本发明，但所属领域的技术人员将认识到在不偏离本发明的范围的前提下，仍可对本发明作出许多改变。因此，应理解，只要是在所附权利要求书及其等效物的范围内，可以用不同于本文具体描述的方式来实践本发明。

Claims

1.一种基于输入音频信号产生声场的装置(100)，其特征在于，所述装置(100)包括：

多个换能器(107A至107L)，其中，每个换能器用于被对应的换能器驱动信号q_l驱动，l∈{1，...，L}，l表示第l个换能器；

多个滤波器(105A至105L)，用于为每个换能器生成其换能器驱动信号q_l，其中，每个所述滤波器由滤波器传递函数所定义，所述换能器的换能器驱动信号q_l是基于所述换能器的所述滤波器传递函数以及所述输入音频信号；

控制单元(101)，用于提供或接收维度为L的第一换能器驱动信号矢量q₀，使得J(q；ψ)关于q的梯度在(q₀；ψ₀)中为0，其中，J(q；ψ)是以维度为L的换能器驱动信号矢量q和维度为M×M的权重矩阵ψ为变量的基于加权压力匹配WPM代价函数，ψ₀是维度为M×M的第一权重矩阵；其中

所述控制单元(101)还用于提供维度为L的第二换能器驱动信号矢量

使得所述基于WPM代价函数J(q；ψ)关于q的梯度在

中为0或接近于0，

是维度为M×M的第二权重矩阵，

其中，所述控制单元(101)具体用于基于以下参数提供所述第二驱动信号矢量

所述第一换能器驱动信号矢量q₀；

所述第一权重矩阵Ψ₀；

所述第二权重矩阵

其中，所述基于WPM代价函数是每个区域中的平方加权再现误差与阵列成本控制项的和，即：

是包括M个控制点的集合的M个目标压力值且维度为M的目标压力矢量，m∈{1，...，M}，p是包括所述M个控制点的集合的M个压力值p_m的且维度为M的压力矢量，m∈{1，...，M}，β是区间[0，∞)内的正则化参数；其中，

表示包括第m个控制点的再现误差的WPM权重0≤Ψ_m≤1的平方根

的M×M对角矩阵。

2.根据权利要求1所述的装置(100)，其中，所述控制单元(101)用于基于N阶的截短诺依曼级数计算所述第二换能器驱动信号矢量

其中，Z是维度为M×L的转移矩阵，I为维度为K×K的单位矩阵，Δψ表示ψ₀和

之间的差，上标^H表示厄米特转置。

3.根据权利要求2所述的装置(100)，其中，所述声场(110)包括声学亮区(110a)、声学暗区(110b)以及声学灰区(110c)，所述代价函数J(q；ψ)由以下等式给出：

其中，在限定条件

下，对于每个m∈B，J(q；ψ)关于q的梯度在(q₀；ψ₀)中为0，其中，B是所述亮区中的控制点的索引集合，|p_m，min|²是与所述亮区中的相应控制点上的相应的期望最低声能水平相关联的正实数；

p_B表示所述亮区中的控制点的声压，

4.根据权利要求3所述的装置(100)，其中，所述控制单元(101)用于响应于对所述亮区中的控制点的所述期望最低声能水平的调节，提供所述第二换能器驱动信号矢量

5.根据权利要求1所述的装置(100)，其中，所述第一换能器驱动信号矢量q₀是：

其中，Z是维度为M×L的转移矩阵。

6.根据权利要求1或5所述的装置(100)，其中，所述控制单元(101)用于基于标准Tikhonov正则化确定所述正则化参数β。

7.根据权利要求3所述的装置(100)，其中，由以下等式定义所述N阶的截短诺依曼级数：

其中，所述矩阵A由以下等式定义：

8.根据权利要求7所述的装置(100)，其中，所述控制单元(101)用于通过在区间-0.5≤Δψ_D≤0.5内确定以下等式的根，确定所述暗区加权参数ψ_D的调整量Δψ_D：

其中，

9.根据权利要求2所述的装置(100)，其中，所述N阶的截短诺依曼级数取决于频率。

10.根据权利要求9所述的装置(100)，其中，所述N阶的截短诺依曼级数随着频率的增大而减小。

11.根据权利要求9或10所述的装置(100)，其中，所述控制单元(101)用于基于以下等式确定所述N阶的截短诺依曼级数：

其中，

表示基于所述截短诺依曼级数确定的换能器驱动信号矢量。

12.根据权利要求1所述的装置(100)，其中，所述装置还包括用于存储所述第一换能器驱动信号矢量q₀的存储器(103)。

13.一种基于输入音频信号产生声场的方法(700)，其特征在于，所述方法(700)包括以下步骤：

(701)提供或接收维度为L的第一换能器驱动信号矢量q₀，使得J(q；ψ)关于q的梯度在(q₀；ψ₀)中为0，其中，J(q；ψ)是以维度为L的换能器驱动信号矢量q和维度为M×M的权重矩阵ψ为变量的基于加权压力匹配WPM代价函数，ψ₀是维度为M×M的第一权重矩阵；

(703)提供维度为L的第二换能器驱动信号矢量

使得所述基于WPM代价函数J(q；ψ)关于q的梯度在

中为0或接近于0，

所述第一换能器驱动信号矢量q₀；

所述第一权重矩阵ψ₀；

所述第二权重矩阵

(705)用所述第二换能器驱动信号矢量

的对应元素

驱动L个换能器中的每一个换能器，其中，l∈{1，...，L}；

是包括M个控制点的集合的M个目标压力值且维度为M的目标压力矢量，m∈{1，...，M}，p是包括所述M个控制点的集合的M个压力值p的且维度为M的压力矢量，m∈{1，...，M}，β是区间[0，∞)内的正则化参数；其中，

表示包括第m个控制点的再现误差的WPM权重0≤Ψ_m≤1的平方根

的M×M对角矩阵。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有程序代码，当所述程序代码在计算机上被执行时，使得所述计算机执行根据权利要求13所述的方法(700)。