CN113453141A

CN113453141A - 基于房间声学的环绕声渲染

Info

Publication number: CN113453141A
Application number: CN202110293991.7A
Authority: CN
Inventors: S·J·乔伊塞; B·J·赖斯; I·H·纳乌法勒
Original assignee: Apple Inc
Current assignee: Apple Inc
Priority date: 2020-03-24
Filing date: 2021-03-19
Publication date: 2021-09-28
Anticipated expiration: 2041-03-19
Also published as: US10945090B1; CN113453141B; DE102021103210A1

Abstract

本公开涉及基于房间声学的环绕声渲染。一种由房间内的音频系统执行的方法，该音频系统包括具有第一波束成形阵列的第一扬声器和具有第二波束成形阵列的第二扬声器。该方法获得声音节目作为若干输入音频通道。该方法在这些扬声器靠近该房间内的对象时基于这些输入音频通道来执行波束成形算法，以使这些阵列中的每个阵列产生正波束图案和侧波束图案，其中该正波束图案背离该对象，并且该侧波束图案指向该对象，并且这些波束图案包含该声音节目的不同部分。该方法在这些扬声器远离该对象时基于这些输入音频通道的子集执行串扰消除(XTC)算法，以产生用于驱动这些阵列的若干XTC输出信号。

Description

基于房间声学的环绕声渲染

技术领域

本公开的一个方面涉及对声音节目执行音频处理技术以渲染用于通过一个或多个扬声器输出的声音节目。还描述了其他方面。

背景技术

扬声器阵列可生成波束图案以在不同方向上投射声音。例如，波束成形器可接收声音节目(例如，音乐)的输入音频通道并且将这些输入音频通道转换为驱动扬声器阵列的换能器(或驱动器)以产生一个或多个声音波束图案的若干驱动器信号。

发明内容

本公开的一个方面是一种由房间内的音频系统的编程处理器执行的方法，该音频系统包括具有由两个或更多个扬声器驱动器构成的第一扬声器波束成形阵列的第一扬声器和具有由两个或更多个扬声器驱动器构成的第二扬声器波束成形阵列的第二扬声器。该系统获得声音节目作为若干输入音频通道。例如，声音节目可以是环绕声5.1格式(例如，具有五个输入音频通道和一个低频通道)的电影原声带。当扬声器靠近房间内(例如，在阈值距离内)的对象时，系统基于输入音频通道执行波束成形算法，以使第一扬声器波束成形阵列和第二扬声器波束成形阵列中的每一者产生正波束图案(pattern)和侧波束图案。在这种情况下，正波束图案背离对象，并且侧波束图案指向对象。因此，不同的波束图案可包括声音节目的不同部分。例如，就音轨而言，正波束图案可包括中心通道(其具有对话)，而侧波束图案可包括环绕通道的部分(左环绕通道和右环绕通道)。然而，当扬声器远离对象(例如，超过阈值距离)时，该系统可基于输入音频通道的子集执行串扰消除(XTC)算法以产生若干XTC输出信号，该若干XTC输出信号用于驱动扬声器的驱动器中的至少一些驱动器。

以上概述不包括本公开的所有方面的详尽列表。可预期的是，本公开包括可由上文概述的各个方面以及在下文的具体实施方式中公开并且在权利要求书中特别指出的各个方面的所有合适的组合来实践的所有系统和方法。此类组合可具有未在上述发明内容中具体阐述的特定优点。

附图说明

在附图的图示中通过举例而非限制的方式示出了多个方面，在附图中类似的附图标号指示类似的元件。应当指出的是，在本公开中提到“一”或“一个”方面未必是同一方面，并且其意指至少一个。另外，为了简洁以及减少附图的总数，某个附图可能被用于示出不止一个方面的特征，并且对于某个方面，可能并不需要该附图中的所有元素。

图1示出了包括扬声器的音频系统，该扬声器具有由两个或更多个扬声器驱动器构成的扬声器阵列。

图2示出了根据一个方面的具有被配置为输出声音的若干扬声器的房间。

图3示出了对本公开的一个方面的声音节目执行不同音频处理技术的音频系统的框图。

图4是根据本公开的一个方面的用于执行不同音频处理技术的过程的一个方面的流程图。

具体实施方式

现在将参考所附附图来解释本公开的各方面。只要在某个方面中描述的部件的形状、相对位置和其他方面未明确限定，这里本公开的范围就不仅仅局限于所示出的部件，所示出的部件仅用于说明的目的。另外，虽然阐述了许多细节，但应当理解，一些实施方案可在没有这些细节的情况下被实施。在其他情况下，未详细示出熟知的电路、结构和技术，以免模糊对该描述的理解。此外，除非该含义明确相反，否则本文示出的所有范围被认为包括每个范围的端值。

图1示出了音频(或扬声器)系统1，该音频(或扬声器)系统包括被配置为渲染和输出如本文所述的声音节目的大致圆柱形的扬声器2。在一个实施方案中，该系统可包括一个或多个扬声器，该一个或多个扬声器中的每个扬声器均被配置为渲染和输出声音节目的至少一部分。扬声器2是扬声器箱(或扬声器外壳)，其具有扬声器波束成形阵列3，该扬声器波束成形阵列3具有围绕扬声器2的中心竖直轴线并排且周向布置的各个扬声器驱动器(或扬声器换能器)4。扬声器2还包括位于扬声器顶部的独立扬声器驱动器。然而，在其他方面，独立扬声器驱动器可被定位在其他位置(例如，扬声器的底部)。在一个方面，扬声器可具有其他形状，诸如圆环形状，或者大致球形或椭圆形形状，其中驱动器可围绕椭圆体的基本整个表面均匀地分布。

扬声器驱动器2可为电动驱动器，并且可包括专门设计用于不同频带的声音输出的一些驱动器。例如，顶部驱动器可被设计为在低范围频带下比其他驱动器更好、更有效地操作(例如，该驱动器可以是低音扬声器)。而定位在扬声器的圆周周围的驱动器中的至少一些驱动器可被设计为在高范围频带下比顶部驱动器更好、更有效地操作(例如，这些驱动器可以是高音扬声器和中音驱动器)。在一个方面，这些扬声器可以是“全音域”(或“全频”)扬声器驱动器，其尽可能多地再现可听频率范围。

图2示出了根据一个方面的被配置为输出声音的若干扬声器。具体地，该图示出了具有定位在房间20内的收听者21前方的两个扬声器2a和2b的音频系统1。在一个方面，这些扬声器中的每个扬声器可包括彼此相同的部件(例如，每个扬声器的扬声器驱动器、一个或多个处理器)。在另一方面，扬声器可以是不同的电子设备(例如，扬声器2a可以是如本文所示的扬声器箱，并且扬声器2b可以是能够渲染和输出声音节目的不同电子设备，诸如独立扬声器、智能电话或膝上型电脑)。

如图所示，扬声器2a和2b正在输出声音节目的声音。具体地，这些扬声器中的每个扬声器使用其相应的扬声器阵列来发射包括声音节目(例如，音乐作品、电影原声带、播客等)的至少一些部分的声音定向波束图案。例如，这些扬声器中的每个扬声器包括正波束图案22和两个侧波束图案(左侧波束图案23和右侧波束图案24)。在一个方面，波束图案中的每个波束图案可包括声音节目的部分。例如，在声音节目为5.1环绕声格式(例如，中心通道、左通道、右通道、左环绕通道、右环绕通道和低音通道)的电影原声带的情况下，这些波束中的每个波束可包括这些通道中的至少一个或多个通道。具体地讲，正波束22a和22b可包括中心通道，左侧波束图案23a可包括左侧通道，并且右侧波束图案24b可包括右侧通道。在一个方面，这些波束图案中的至少一些波束图案可包括通道的部分。例如，左侧波束图案23a和右侧波束图案24a可包括左环绕通道的部分，而左侧波束图案23b和右侧波束图案24b可包括右环绕通道的一部分。

在一个方面，波束图案可包括其他音频内容。例如，正波束图案可包括主音频内容(例如，相关音频内容)，而侧波束图案中的至少一些侧波束图案包括环境(或漫射)音频内容(例如，不相关音频内容)。

在另一方面，扬声器可以产生其他类型的波束图案。例如，扬声器可产生与具有若干波瓣的定向波束图案叠加的全向波束图案。在一个方面，定向波束图案可为具有四个波瓣的四极波束。

在一个方面，这些扬声器彼此(和/或与另一电子设备)通信地耦接以便输出声音。例如，扬声器可使用例如蓝牙协议或任何无线协议彼此无线地耦接或配对。例如，这些箱体中的每个箱体可通过发送和接收数据分组(例如，互联网协议(IP)分组)来彼此通信(例如，使用IEEE 802.11x标准)。在一个方面，为了有效地通信，这些箱体中的每个箱体能够以“主从”配置通过对等(P2P)分布式无线计算机网络彼此通信。具体地，扬声器2a可被配置为“主”，而扬声器2b为“从”。因此，当输出声音节目时，扬声器2a可将声音节目的至少一部分发送到扬声器2b以用于渲染和输出。在一个方面，除了发送声音节目之外，扬声器2a可执行至少一些音频处理操作，如本文所述。而在一些方面，大部分音频信号处理可由与扬声器配对的另一设备执行。在另一方面，这些扬声器可以彼此有线连接。在一些方面，两个扬声器可以在彼此之间执行(或划分)这些操作中的至少一些操作，如本文所述。

多通道音响系统可执行各种音频处理技术以改善收听者体验。例如，一些系统可使用加宽技术诸如串扰消除(其涉及消除来自一个或多个通道的不期望的效果或声音)来产生听起来比物理扬声器设置更宽的声源。系统还可使用波束成形将声音朝向声音空间(或房间)中的不同位置投射。然而，这两种技术在配置上通常是静态的并且由制造商预先确定。因此，根据系统被部署在其中的房间的声学，这可能导致次优的收听者体验。

为了克服这些缺陷，本公开描述了一种具有一个或多个扬声器的音频系统，该音频系统基于房间声学和/或房间内的扬声器放置来执行不同的音频处理技术。具体地，该音频系统可基于音频系统的扬声器是否靠近对象来执行不同的操作。例如，该音频系统基于若干输入音频通道执行波束成形算法以引导至少一个定向波束图案(例如，正波束图案，诸如图案22a)背离对象，以及引导至少一个定向波束图案(例如，侧波束图案，诸如图案23a)指向对象，以在房间中生成声音反射，以便加宽由音频系统产生的声场的空间宽度。相比之下，当扬声器远离对象时，该音频系统基于输入音频通道的子集执行XTC算法以输出XTC输出信号，以便消除或减少房间中特定点处的一些音频内容。

图3示出了音频系统1的框图，该音频系统被配置为对声音节目执行不同的音频处理技术以渲染用于通过一个或多个扬声器输出的声音节目。具体地，系统1包括扬声器2a和2b、输入音频源31、至少一个麦克风39和若干操作块。麦克风39可以是将被用于将由在声学空间中传播的声波引起的声能转换成电麦克风信号的任何类型的麦克风(例如，差分压力梯度微机电系统(MEMS)麦克风)。在一个方面，该系统可包括更多或更少的元件。例如，该系统可包括两个或更多个麦克风或者三个或更多个扬声器。又如，该系统可仅包括一个扬声器(例如，如图2所示的扬声器2a)。

在一个方面，输入音频源31和/或至少一个麦克风39可为电子设备诸如智能电话或膝上型电脑的一部分。在一个方面，源和/或麦克风39可以是这些扬声器中的至少一个扬声器的一部分。例如，扬声器2a可包括集成在其中的一个或多个麦克风39。又如，音频源31可集成在这些扬声器中的至少一个扬声器内。

输入音频源31被配置为向音频系统1提供声音节目(例如，环绕声格式(诸如5.1、5.1.2、7.1、7.1.4输入音频通道等)的多通道环绕声内容)。在一个方面，该源可以是能够向系统提供(或流式传输)一个或多个输入音频通道的任何设备。为了提供通道，该源可在本地(例如，从内部或外部硬盘驱动器；或从音频回放设备诸如光盘播放器)或远程(例如，通过互联网)检索它们。一旦被检索，该源就可经由通信链路(例如，无线或有线)将通道作为模拟或数字信号提供给音频系统。

在一个方面，如本文所述，由操作块执行的功能诸如(数字)音频信号处理操作可由音频系统1内的电路部件(或元件)来执行。例如，这些操作中的至少一些操作可由这些扬声器中的一个扬声器(例如，扬声器2a)的电路部件来执行。在另一方面，这些功能中的至少一些功能可由扬声器外部的电子部件(诸如音频接收器、通信地耦接到这些扬声器中的每个扬声器的多媒体设备(例如，智能电话))来执行。因此，在这种情况下，这些扬声器可以经由有线或无线方式与电子部件进行通信。然而，在该示例中，通常存在于音频接收器(例如，包括用于执行音频处理操作的一个或多个处理器的控制器)内的电子硬件部件的一部分或全部和扬声器2可位于一个外壳中。在一个方面，音频系统1可以是家用音频系统的一部分，或者可以是集成在车辆内的音频或信息娱乐系统的一部分。在另一个实施方案中，该扬声器可以是能够渲染和输出声音的任何电子设备(诸如智能电话、平板电脑、膝上型电脑或台式计算机)的一部分。

音频系统1包括调谐器32、串扰消除器33、扬声器放置估计器37、房间声学估计器34、混合矩阵35和波束成形器36。扬声器放置估计器37被配置为估计这些扬声器中的至少一个扬声器音频系统中的位置和/或配置。在一个方面，该估计器被配置为确定音频系统内扬声器(例如，同时输出声音的扬声器)的数量。例如，该估计器可从与音频系统和/或彼此配对的每个扬声器接收指示。又如，该估计器可(经由用户界面)获得指示系统中扬声器的数量的用户输入。

在一个方面，扬声器放置估计器37可在声学上确定指示扬声器在系统内的放置的数据，诸如两个或更多个扬声器之间的距离。例如，该估计器可从至少一个麦克风39获得麦克风信号，该麦克风信号包括由音频系统的至少一个其他扬声器(例如，扬声器2b)产生的声音。该麦克风的位置可以是已知的(例如，集成在这些扬声器中的一个扬声器内，诸如扬声器2a)。例如，该估计器可使用麦克风信号来测量脉冲响应，该脉冲响应估计了扬声器2a与扬声器2b之间的距离。

在一些方面，扬声器放置估计器37可通过其他方法来获得其他扬声器的位置。例如，该估计器可从音频系统的这些扬声器中的每个扬声器接收位置数据(例如，GPS)。又如，当这些扬声器无线地耦接在一起时，可经由无线定位来确定位置，诸如测量所接收信号的强度(例如，所接收信号强度(“RSS”))。

在另一方面，扬声器放置估计器37被配置为在声学上确定这些扬声器中的至少一个扬声器是否靠近对象(诸如书柜或扬声器所位于的房间的墙壁)，或者扬声器是否远离对象。具体地，该扬声器放置估计器可在(至少)一个扬声器(例如，2a)处测量房间脉冲响应(RIR)，并且使用所测量的RIR来确定该扬声器是靠近房间内的对象还是远离该对象。例如，扬声器2a可使得扬声器驱动器4中的一者或多者输出音频信号(例如，测试信号)。可被集成在扬声器2a内或其相对于扬声器2a的位置是已知的麦克风39可产生包含输出的音频信号的声音的麦克风信号，并且将该信号提供给估计器，估计器使用该信号来测量RIR。在一个方面，为了确定扬声器2a是靠近还是远离对象，该估计器可将该RIR与预定义的RIR进行比较。在另一方面，该估计器可基于扬声器是否处于距该对象的阈值距离内来确定与该对象的接近度。例如，所测量的RIR可指示扬声器距对象的距离(例如，基于该RIR中的反射)。该估计器确定该距离是否低于阈值(预定义的)距离。在一个方面，该扬声器放置估计器可针对扬声器系统内的这些扬声器中的每个扬声器执行这些操作。在一个方面，该估计器可估计这些扬声器中的每个扬声器距对象的平均距离。

房间声学估计器34被配置为估计扬声器所位于的房间的声学特性(例如，房间的混响水平等)。具体地，该估计器从至少一个麦克风39获得麦克风信号，并且基于该麦克风信号来确定声学特性。在一个方面，该估计器可通过如上所述测量RIR来确定特性。

在另一方面，房间声学估计器34被配置为确定房间(例如，房间20)内的(例如，收听者21的)收听者位置。例如，该估计器可确定相对于扬声器2a和2b中的至少一者的收听者位置。具体地，系统1可基于收听者语音的声音的波达方向(DOA)来确定位置。具体地，该估计器可从包含收听者语音的一个或多个麦克风39获得一个或多个麦克风信号，并且基于包含在这些信号内的延迟来确定DOA。在另一方面，该估计器可基于来自一个或多个电子设备的数据来确定收听者位置，该一个或多个电子设备诸如正由收听者佩戴的可穿戴设备(例如，智能手表、智能眼镜等)或处于收听者位置的智能电话。例如，该估计器可从这些设备中的至少一个设备获得位置数据(例如，GPS数据)。在一些方面，该估计器可获得指示收听者的位置的用户输入。例如，该收听者可经由用户界面向电子设备提供收听者位置。在另一方面，该估计器可从执行图像识别以识别包含在数据内的收听者的至少一个相机(未示出)获得视频数据。

调谐器32用于接收(或获得)声音节目作为M个输入音频通道(或M个通道)，该M个输入音频通道可以是一个或多个输入音频通道。例如，当该声音节目是立体录音时，调谐器接收两个输入音频通道。又如，该调谐器可以接收两个以上的输入音频通道，诸如电影原声带的六个通道(例如，5.1环绕格式)。在一个方面，调谐器32被配置为对所接收的输入音频通道中的至少一些输入音频通道执行音频处理操作。例如，该调谐器可以执行均衡操作、动态范围压缩(DRC)操作等。在一个方面，该调谐器被配置为将输入音频通道上混。例如，就立体录音而言，该调谐器可以将声音节目上混为任何环绕声格式。在一个方面，该调谐器可以通过M个通道中的至少一些通道。这意味着该调谐器可以在不执行音频信号处理操作(诸如DRC操作)的情况下通过本地音频通道。

串扰消除器33被配置为接收M个通道的子集(例如，N个通道)并且基于该N个通道执行XTC算法以产生若干P XTC输出信号。例如，在环绕声格式诸如5.1.2的情况下，该消除器可获得五个音频通道而不获得低音通道“.1”，也不获得高音通道“.2”。在另一方面，该消除器可获得高音通道。在一个方面，该消除器通过混合和/或延迟该N个通道中的至少一些通道来执行算法。具体地，该消除器可将一个通道(例如，右通道)的至少一部分和另一个通道(例如，左通道)以及延迟组合。在一个方面，该消除器可在该N个通道中的至少一些通道上应用一个或多个XTC滤波器以执行XTC。在另一方面，该消除器可执行空间滤波器，诸如头部相关传输函数(HRTF)。在一个方面，该算法可执行预先确定的XTC操作。换句话讲，这些操作中的至少一些操作在受控设置(例如，实验室)中可以是通用的或预先确定的。例如，XTC算法可将预先确定的HRTF应用于通常针对房间中的单个收听者/最佳听音点进行优化的预先确定的位置。因此，该消除器产生P XTC输出信号(或通道)。在一个方面，P XTC输出信号的数量可与N个通道的数量相同或不同。

在一个方面，该消除器可基于房间声学数据和/或扬声器放置数据来调整(或优化)XTC算法。具体地，消除器33可基于对收听者位置的确定来调整XTC输出信号。该消除器可从房间声学估计器34获得收听者位置，并且根据该收听者位置来调整XTC输出信号。例如，消除器33可调整施加到该N个通道的延迟，以便最佳地消除来自房间内不同位置的声音节目的不期望部分。又如，该消除器可根据收听者位置而不是一般位置来应用位置特定的XTC滤波器(例如，HRTF)，以便优化用户体验。消除器33还可基于从估计器37获得的扬声器放置数据来优化XTC算法。例如，消除器33可基于音频系统中扬声器的数量和/或基于系统中这些扬声器之间的已知距离来优化(例如，施加延迟)XTC算法。如本文所述，对XTC算法的优化可在不同的时间间隔(例如，每分钟)执行和/或可基于确定收听者(或扬声器)位置的变化来执行。因此，系统1可跟踪收听者位置并且作为响应优化算法。

混合矩阵35被配置为执行混合操作以将M个通道中的至少一些通道与P XTC输出信号中的至少一些P XTC输出信号混合，从而产生混合信号作为到波束成形器的输入。在一个方面，该混合矩阵被配置为执行附加的音频处理操作。例如，该混合矩阵可根据XTC算法的处理时间对M个通道中的至少一些通道施加延迟。在另一方面，该矩阵可基于房间声学数据来将增益应用于该M个通道(和/或XTC输出信号)中的一者或多者。如本文将描述的，该矩阵可基于房间(的部分)的混响水平将不同增益应用于不同通道。在一个方面，该矩阵可不执行任何混合操作，而是通过M个通道(和/或XTC输出信号)中的至少一些通道直接到达波束成形器36。

波束成形器36被配置为从混合矩阵获得信号并且产生用于扬声器2a和2b中的至少一个扬声器的各个驱动器信号，以便将声音节目的输入音频信号的音频内容渲染为由该扬声器的扬声器阵列发射的一个或多个期望的声音波束图案。在一个方面，从混合矩阵获得的信号可指示要将什么音频内容渲染为特定波束图案。在另一方面，由扬声器阵列产生的波束图案可由波束成形器根据各自应用于波束成形器输入音频信号的波束成形器权重向量来成形和操纵。在一个方面，由扬声器阵列产生的波束图案可根据多个预先配置的波束图案(诸如正波束图案和一个或多个侧波束图案)中的任一者从输入音频通道来定制。在一个方面，波束成形器可基于从扬声器放置估计器37获得的扬声器放置数据来调整一个或多个波束图案。此类数据(例如，扬声器之间的距离、扬声器的数量和/或是否存在靠近扬声器的对象)可向波束成形器通知波束宽度和/或波束将被引导的角度。因此，波束成形器产生单独的驱动器信号，这些驱动器信号(无线地)被传输到扬声器2a和2b中的一者或多者。

图4是根据本公开的一个方面的由音频系统1执行以执行不同音频处理技术的过程40的一个方面的流程图。具体地，过程40基于是否存在对象诸如靠近本文所述的音频系统1的至少一个扬声器(例如，2a和/或2b)的墙壁来确定是否执行XTC操作和/或波束成形操作。在一个方面，过程40可在音频系统的初始设置期间(例如，当收听者首先激活系统时)执行。在另一方面，方法40可周期性地执行(例如，一小时一次、一天一次)。在另一方面，该过程可在音频系统内的至少一个元件(例如，扬声器2a)从一个位置移动到另一个位置(例如，由运动传感器诸如耦接到扬声器的加速度计指示的)时执行。又如，该过程可在确定收听者位置已改变后执行。例如，如本文所述，系统可跟踪收听者位置(例如，基于收听者语音的DOA)。在确定收听者位置已改变(例如，从当前位置移动至少阈值距离)后，可执行过程40。

过程40开始于获得声音节目作为两个或更多个输入音频通道(在框41处)。如本文所述，该声音节目可以包括两个以上的输入音频通道，诸如可以包括5.1.2环绕格式的电影原声带。过程40确定至少一个扬声器是否靠近对象，诸如扬声器所位于的房间内的墙壁(在决策框42处)。例如，参考图2，扬声器放置估计器37可基于所测量的RIR来确定扬声器中的一个(或两个)是否靠近墙壁。

如果是，则过程40基于M个通道来执行波束成形算法，以使这些扬声器中的每个扬声器产生背离对象的正波束图案和指向对象的至少一个侧波束图案(在框43处)。例如，参考图2，当扬声器2a和2b靠近收听者21前方的墙壁时，这两个扬声器产生背离墙壁的相应正波束图案22并且产生指向墙壁的至少一个侧波束图案(例如，23和/或24)。在一个方面，扬声器可以朝向预先确定的方向引导波束图案。例如，正波束图案可垂直于对象投影，而侧波束以相对于正波束图案方向的不同角度指向对象，如图所示。为了波束成形，音频系统1可将M个通道从调谐器32传递到混合矩阵35，而不向该混合矩阵提供XTC输出信号。换句话讲，当确定扬声器靠近墙壁时，串扰消除器33可被去激活。因此，该混合矩阵可基于M个通道为波束成形器产生一个或多个输入，波束成形器36使用该一个或多个输入来产生正波束图案和侧波束图案。

在一个方面，该波束成形器可产生具有预先确定的特性(例如，预定义的波束角度、波束宽度、延迟等)的预先配置的波束图案。在另一方面，该波束成形器可产生根据收听者位置进行配置的波束图案。例如，该波束成形器的特性可被配置为针对收听者位置而优化波束图案。

方法40确定对象是否为不对称的(在决策框44处)。具体地，房间声学估计器34基于来自对象的声音反射的声能级来确定该对象是否不对称。例如，在音频系统包括靠近对象诸如墙壁的两个扬声器2a和2b的情况下，当一个扬声器的麦克风比另一个扬声器的麦克风感测到更多声音反射时，该墙壁可能为不对称的。当这些扬声器中的一个扬声器靠近墙壁的拐角时可引起附加的声音反射，而当该扬声器靠近墙壁的平坦侧面时可感测到较少的声音反射。因此，房间声学估计器可从每个扬声器的至少一个麦克风获得麦克风信号，该麦克风信号包含从对象到扬声器的声音反射。使用这些麦克风信号，估计器34确定这些声音反射的声能是否相同(或相似)。如果不是，这意味着确定对象是不对称的，则该估计器可向混合矩阵35指示差值，该混合矩阵35被配置为将(例如，不同的)增益值应用到扬声器的一个或多个正波束图案和/或一个或多个侧波束图案(在框45处)。例如，如果扬声器2a靠近墙壁的拐角，而扬声器2b靠近墙壁的平坦侧面，则该混合矩阵可将第一增益应用于左侧波束图案23b和右侧波束图案24b中的至少一者，并且将小于第一增益的第二增益应用于左侧波束图案23a和右侧波束图案24b中的至少一者。通过应用不同的增益，扬声器系统可平衡来自对象的声音反射的声能，以便提供收听者体验到的声能的更好的平衡。

返回决策框42，如果扬声器不靠近对象，则过程40基于总输入音频通道的子集来执行XTC算法以产生(第一)若干XTC输出信号(在框46处)，该(第一)若干XTC输出信号用于驱动第一波束成形阵列和第二波束成形阵列的驱动器中的至少一些驱动器。具体地，返回图3，当扬声器放置估计器37确定这些扬声器中的一个或多个扬声器远离墙壁(例如，超过距离阈值)时，串扰消除器33被激活并且从N个通道产生P XTC输出信号，如本文所述。一旦产生，混合矩阵35就可将P XTC输出信号与M个通道中的至少一些通道混合。在一个方面，该波束成形器从混合矩阵获得混合信号并产生一个或多个波束图案。例如，波束成形器可发射正波束图案(例如，22a和22b)。在另一方面，在执行XTC算法时，由于扬声器不靠近墙壁，所以扬声器系统不产生侧波束图案。在另一方面，混合矩阵35可引导波束成形器36输出通过扬声器阵列的特定扬声器驱动器的P XTC输出信号中的至少一些P XTC输出信号。

过程40确定收听者位置是否为已知的(在决策框47处)。具体地，房间声学估计器34确定收听者位置，如本文所述。如果该位置为已知的，则过程40执行XTC算法以基于收听者位置产生第二(经调整的)XTC输出信号，该第二(经调整的)XTC输出信号针对收听者位置而进行优化(在框48处)。例如，消除器33可根据收听者位置来调整施加到N个通道的延迟中的至少一些延迟。在一个方面，该消除器可基于收听者相对于扬声器的位置来选择适当的空间滤波器，诸如HRTF。

一些方面可执行本文所述的过程的变型。例如，这些过程中的至少一些的特定操作可以不以所示出和所描述的确切顺序执行。可不在连续的一系列操作中执行该特定操作，并且可在不同方面中执行不同的特定操作。例如，本文所述的操作中的至少一些操作是可执行或可不执行的操作性操作。具体地讲，可任选地执行被示出为具有虚线或虚线边界的框。在另一方面，相对于其他框所述的其他操作也可以是任选的。

在一些方面，音频系统可执行如本文所述的XTC算法和波束成形算法两者。例如，过程40可省略在框42处执行的操作，而是执行框46(以及决策框47和/或框48)和框43(以及框44和45)的操作。在一个方面，当执行XTC算法和波束成形算法两者时，音频系统可将XTC应用于从每个扬声器发射的正波束图案和/或侧波束图案。这与仅执行XTC能够应用于仅正波束图案和/或特定扬声器驱动器的46的操作形成对比。在另一方面，系统内的不同扬声器可以执行不同的算法。例如，当扬声器2a靠近墙壁时，该扬声器可执行波束成形算法(例如，通过发射正波束图案和侧波束图案)，而当扬声器2b远离墙壁时，该扬声器可执行XTC算法。

如上所述，过程40的操作可根据多个扬声器(例如，扬声器2a和2b)来执行。然而，在一个方面，当扬声器系统1仅包括一个扬声器(例如，扬声器2)时，可执行本文所述的操作。在这种情况下，本文所述的操作中的至少一些操作可仅针对一个扬声器来执行。例如，对对象是否不对称的确定(在决策框44处)可基于由扬声器产生的至少一个侧波束图案引导的方向。例如，如果扬声器2正在产生沿第一方向(例如，相对于正波束图案22)指向对象的左侧波束图案23以及产生右侧波束图案24，则扬声器放置估计器37可确定来自该对象的沿第一方向的声音反射的声能以及来自该对象的沿第二方向的声音反射的声能。如果声能不相等，诸如沿第一方向存在更多声能，则音频系统可将比要应用于左侧波束图案的增益更多的增益应用于右侧波束图案。

要使用的个人信息应遵循通常公认为满足(和/或超过)维护用户隐私的政府和/或行业要求的实践和隐私政策。例如，任何信息都应该被管理以便降低未经授权或无意访问或使用的风险，并且应清楚地通知用户任何经授权使用的性质。

如前所述，本公开的一个方面可为其上存储有指令的非暂态机器可读介质(诸如微电子存储器)，所述指令对一个或多个数据处理部件(这里一般性地称为“处理器”)进行编程以执行网络操作、信号处理操作以及音频信号处理操作(例如，波束成形操作、XTC操作等)。在其他方面，可通过包含硬连线逻辑的特定硬件部件来执行这些操作中的一些操作。另选地，可通过所编程的数据处理部件和固定硬连线电路部件的任何组合来执行那些操作。

虽然已经在附图中描述和示出了某些方面，但是应当理解，此类方面仅仅是对广义公开的说明而非限制，并且本公开不限于所示出和所述的具体结构和布置，因为本领域的普通技术人员可以想到各种其他修改型式。因此，要将描述视为示例性的而非限制性的。

在一些方面，本公开可包括语言例如“[元素A]和[元素B]中的至少一者”。该语言可以是指这些元素中的一者或多者。例如，“A和B中的至少一者”可以是指“A”、“B”、或“A和B”。具体地讲，“A和B中的至少一者”可以是指“A中至少一者和B中至少一者”或者“至少A或B任一者”。在一些方面，本公开可包括语言例如“[元素A]、[元素B]、和/或[元素C]”。该语言可以是指这些元素中任一者或其任何组合。例如，“A、B和/或C”可以是指“A”、“B”、“C”、“A和B”、“A和C”、“B和C”或“A、B和C”。

Claims

1.一种由房间内的音频系统的经编程的处理器执行的信号处理方法，所述音频系统包括第一扬声器和第二扬声器，所述第一扬声器具有两个或更多个扬声器驱动器的第一扬声器波束成形阵列，所述第二扬声器具有两个或更多个扬声器驱动器的第二扬声器波束成形阵列，所述方法包括：

获得声音节目作为多个输入音频通道；

当所述扬声器靠近所述房间内的对象时，基于所述多个输入音频通道来执行波束成形算法，以使所述第一扬声器波束成形阵列和所述第二扬声器波束成形阵列中的每一者产生正波束图案和侧波束图案，其中所述正波束图案被引导远离所述对象，并且所述侧波束图案被引导指向所述对象，其中所述侧波束图案和所述正波束图案包含所述声音节目的不同部分；以及

当所述扬声器远离所述对象时，基于所述多个输入音频通道的子集执行串扰消除(XTC)算法以产生多个XTC输出信号，所述多个XTC输出信号用于驱动所述第一扬声器波束成形阵列和所述第二扬声器波束成形阵列的所述驱动器中的至少一些驱动器。

2.根据权利要求1所述的方法，还包括：

在所述第一扬声器和所述第二扬声器中的一者处测量房间脉冲响应(RIR)；以及

使用所测量的RIR来确定所述扬声器是靠近所述对象还是远离所述对象。

3.根据权利要求1所述的方法，其中所述正波束图案中的每个正波束图案包括所述声音节目的主音频内容，并且所述侧波束图案中的每个侧波束图案包括所述声音节目的环境音频内容。

4.根据权利要求1所述的方法，所述方法还包括确定所述房间内的相对于所述第一扬声器和所述第二扬声器的收听者位置。

5.根据权利要求4所述的方法，还包括：在确定所述房间内的所述收听者位置后，调整所述多个XTC输出信号以考虑所述收听者位置。

6.根据权利要求5所述的方法，其中驱动所述第一扬声器波束成形阵列和所述第二扬声器波束成形阵列的所述驱动器中的所述至少一些驱动器包括基于所调整的多个XTC输出信号和所述多个输入音频通道来执行所述波束成形算法，以使所述第一扬声器波束成形阵列和所述第二扬声器波束成形阵列中的每一者产生正波束图案。

7.根据权利要求1所述的方法，还包括：

从所述第一扬声器的第一麦克风获得第一麦克风信号，所述第一麦克风信号包含从所述对象到所述第一扬声器的声音反射；

从所述第二扬声器的第二麦克风获得第二麦克风信号，所述第二麦克风信号包含从所述对象到所述第二扬声器的声音反射；

使用所述第一麦克风信号来确定包含在其中的声音反射的第一声能，并且使用所述第二麦克风信号来确定包含在其中的声音反射的第二声能；以及

基于所述第一声能将第一增益应用于由所述第一扬声器产生的所述侧波束图案，并且将第二增益应用于由所述第二扬声器产生的所述侧波束图案。

8.一种音频系统，所述音频系统包括：

第一扬声器，所述第一扬声器具有两个或更多个驱动器的第一波束成形阵列；

第二扬声器，所述第二扬声器具有两个或更多个驱动器的第二波束成形阵列，其中这两个扬声器均位于房间内；

处理器；和

存储器，所述存储器具有存储在其中的指令，所述指令在被执行时使得所述音频系统：

获得声音节目作为多个输入音频通道；

当所述扬声器靠近所述房间内的对象时，基于所述多个输入音频通道来执行波束成形算法，以使所述第一波束成形阵列和所述第二波束成形阵列中的每一者产生正波束图案和侧波束图案，其中所述正波束图案被引导远离所述对象，并且所述侧波束图案被引导指向所述对象，其中所述侧波束图案和所述正波束图案包含所述声音节目的不同部分；以及

当所述扬声器远离所述房间内的所述对象时，基于所述多个输入音频通道的子集执行串扰消除(XTC)算法以产生多个XTC输出信号，所述多个XTC输出信号用于驱动所述第一波束成形阵列和所述第二波束成形阵列的所述驱动器中的至少一些驱动器。

9.根据权利要求8所述的音频系统，其中所述存储器还具有用于以下操作的指令：

10.根据权利要求8所述的音频系统，其中所述正波束图案中的每个正波束图案包括所述声音节目的主音频内容，并且所述侧波束图案中的每个侧波束图案包括所述声音节目的环境音频内容。

11.根据权利要求8所述的音频系统，其中所述存储器还具有用于以下操作的指令：确定所述房间内的相对于所述第一扬声器和所述第二扬声器的收听者位置。

12.根据权利要求11所述的音频系统，其中所述存储器还具有用于以下操作的指令：在确定所述房间内的所述收听者位置后，调整所述多个XTC输出信号以考虑所述收听者位置。

13.根据权利要求12所述的音频系统，其中用于驱动所述第一波束成形阵列和所述第二波束成形阵列的所述驱动器中的所述至少一些驱动器的所述指令包括基于所调整的多个XTC输出信号和多个延迟的输入音频通道来执行所述波束成形算法，以使所述第一波束成形阵列和所述第二波束成形阵列中的每一者产生正波束图案。

14.根据权利要求8所述的音频系统，其中所述存储器还具有用于以下操作的指令：

15.一种由房间内的音频系统的经编程的处理器执行的信号处理方法，所述音频系统包括扬声器，所述扬声器具有两个或更多个驱动器的波束成形阵列，所述方法包括：

获得声音节目的三个或更多个输入音频通道；

确定所述扬声器是否处于距对象的阈值距离内；

响应于确定所述扬声器处于所述阈值距离内，

使用所述波束成形阵列来产生被引导远离所述对象的第一定向波束图案和被引导指向所述对象的第二定向波束图案，其中所述第一定向波束图案和所述第二定向波束图案包含所述声音节目的不同部分；以及

响应于确定所述扬声器不处于所述阈值距离内，

基于所述三个或更多个输入音频通道的子集执行串扰消除(XTC)算法以产生多个XTC输出信号，以及

利用所述多个XTC输出信号来驱动所述波束成形阵列的所述两个或更多个驱动器。

16.根据权利要求15所述的方法，其中确定所述扬声器是否处于距所述对象的阈值距离内包括：

在所述扬声器处测量房间脉冲响应(RIR)；以及

使用所测量的RIR来确定所述扬声器是否处于距所述对象的所述阈值距离内。

17.根据权利要求15所述的方法，其中所述第一定向波束图案包括所述声音节目的主音频内容，并且所述第二定向波束图案包括所述声音节目的环境音频内容。

18.根据权利要求15所述的方法，还包括：

确定所述房间内的相对于所述扬声器的收听者位置；以及

在确定所述房间内的所述收听者位置后，调整所述多个XTC输出信号以考虑所述收听者位置。

19.根据权利要求15所述的方法，还包括：使用所述波束成形阵列来产生在第一方向上被引导指向所述对象的第三定向波束图案，其中所述第二定向波束图案在不同于所述第一方向的第二方向上被引导指向所述对象。

20.根据权利要求19所述的方法，还包括：

从至少一个麦克风获得麦克风信号，所述麦克风信号包含来自所述对象的声音反射；

使用所述麦克风信号来确定沿所述第一方向的声音反射的第一声能并且确定沿所述第二方向的声音反射的第二声能；以及

基于所述第一声能将第一增益应用于所述第三定向波束图案，并且基于不同于所述第一声能的所述第二声能将第二增益应用于所述第二定向波束图案。