CN116405840A - 用于任意声音方向呈现的扩音器系统 - Google Patents
用于任意声音方向呈现的扩音器系统 Download PDFInfo
- Publication number
- CN116405840A CN116405840A CN202211561899.5A CN202211561899A CN116405840A CN 116405840 A CN116405840 A CN 116405840A CN 202211561899 A CN202211561899 A CN 202211561899A CN 116405840 A CN116405840 A CN 116405840A
- Authority
- CN
- China
- Prior art keywords
- speaker
- audio
- sound
- geometric model
- location
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 52
- 238000009877 rendering Methods 0.000 claims description 7
- 238000010521 absorption reaction Methods 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 96
- 238000005457 optimization Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/02—Spatial or constructional arrangements of loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R9/00—Transducers of moving-coil, moving-strip, or moving-wire type
- H04R9/06—Loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/18—Methods or devices for transmitting, conducting or directing sound
- G10K11/26—Sound-focusing or directing, e.g. scanning
- G10K11/34—Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
- G10K11/341—Circuits therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R9/00—Transducers of moving-coil, moving-strip, or moving-wire type
- H04R9/02—Details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/34—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means
- H04R1/345—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means for loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/403—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2203/00—Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
- H04R2203/12—Beamforming aspects for stereophonic sound reproduction with loudspeaker arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2205/00—Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
- H04R2205/022—Plurality of transducers corresponding to a plurality of sound channels in each earpiece of headphones or in a single enclosure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2205/00—Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
- H04R2205/024—Positioning of loudspeaker enclosures for spatial sound reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2400/00—Loudspeakers
- H04R2400/11—Aspects regarding the frame of loudspeaker transducers
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明的一个实施方案阐述了一种为扬声器系统生成音频的技术。所述技术包括:接收音频输入信号、与所述音频输入信号相关联的第一位置、所述扬声器系统的第一几何模型以及所述扬声器系统附近的一个或多个表面的第二几何模型。所述技术还包括:基于所述音频输入信号、所述第一位置以及所述第一几何模型和所述第二几何模型为所述扬声器系统中的多个扬声器驱动器生成多个输出信号。所述技术还包括:将所述多个输出信号传输到所述多个扬声器驱动器,其中所述多个扬声器驱动器发出与所述多个输出信号相对应的音频,所发出的音频在所述第一位置处呈现与所述音频输入信号相对应的声音。
Description
技术领域
本公开的实施方案整体涉及音频处理系统,并且更具体地涉及用于任意声音方向呈现的扩音器系统。
背景技术
娱乐系统,诸如在电影院、高级家庭影院、音乐场所等中实现的音频/视频系统,继续提供包括高分辨率视频和多通道音频音轨的日益沉浸式的体验。例如,商业电影院系统通常启用多个不同的音频通道,所述音频通道被传输到放置在收听者的前面、后面和侧面的单独扬声器。此类音频/视频系统还可包括被传输到放置在收听者上方的单独扬声器的音频通道。因此,收听者体验到从四面八方和上方环绕收听者的三维(3D)声场。
收听者在经由非商业音频系统收听音频时,可能也想体验沉浸式3D声场。一些高级家庭音频装备诸如耳机和头戴式耳机,实现了可再现被收听者解释为源自收听者周围特定位置的声音的头相关传递函数(HRTF)。因此,HRTF和其他类似技术在受支持的系统上收听音频时提供沉浸式收听体验。
现有音频系统的一个缺点是,这些系统呈现似乎源自某些位置或方向(如果不在这些位置处或沿这些方向添加单独扬声器)的音频的能力有限。例如,环绕声系统可支持由扬声器从正面、背面和侧面指向收听者生成的二维(2D)声音。环绕声系统也可经由安装在收听者上方的扬声器或指向上方的另外的扬声器生成似乎源自收听者上方的声音并且生成从天花板反射之后才到达收听者的声音。在另一示例中,由音频系统的扬声器发出的声音可被人或物体阻挡或彼此干扰。当这种阻挡或干扰发生和/或当收听者移动或转动他/她的头时,声音可能失真或以其他方式质量降低。这种失真或质量降低可另外使收听者无法将声音感知为源自所期望位置,从而导致收听者的声音感知中的空间分辨率的损失。
如前所述,本领域需要的是用于提高音频系统的空间分辨率的更有效的技术。
发明内容
本发明的各种实施方案阐述了一种为扬声器系统生成音频的计算机实现的方法。所述方法包括:接收音频输入信号、与所述音频输入信号相关联的第一位置、所述扬声器系统的第一几何模型以及所述扬声器系统附近的一个或多个表面的第二几何模型。所述技术还包括:基于所述音频输入信号、所述第一位置、所述第一几何模型和所述第二几何模型为所述扬声器系统中的多个扬声器驱动器生成多个输出信号。所述技术还包括:将所述多个输出信号传输到所述多个扬声器驱动器,其中所述多个扬声器驱动器发出与所述多个输出信号相对应的音频,所述音频在所述第一位置处呈现与所述音频输入信号相对应的声音。
其他实施方案包括但不限于一个或多个计算机可读介质,所述一个或多个计算机可读介质包括用于执行本公开技术的一个或多个方面的指令和实现本公开技术的一个或多个方面的系统。
本公开技术相对于现有技术的至少一个技术优势在于,利用本公开技术,可使用较少的扬声器单元生成似乎源自全3D声场内的任意位置的声音。因此,本公开技术增加了在声场内传输的声音的空间覆盖范围和分辨率,而不需要将另外的扬声器单元放置在声音似乎源自的位置处。本公开技术的另一技术优势是能够以考虑扬声器单元周围的环境以及环境内收听者的定位和取向的方式生成声音。因此,本公开技术减少了与物体对声音的阻挡、由不同扬声器产生的声音之间的干扰和/或收听者的定位或取向的改变相关联的失真、音频质量损失和/或空间分辨率损失。这些技术优势提供对现有技术方法的一项或多项技术改进。
附图说明
为了能够详细理解各种实施方案的上述特征的方式,可通过参考各种实施方案来对上文简要概括的本发明概念进行更具体的描述,其中一些实施方案在附图中示出。然而,应当注意,附图仅示出本发明概念的典型实施方案,并且因此不应被视为以任何方式限制范围,并且存在其他同等有效的实施方案。
图1A示出被配置来实现各种实施方案的一个或多个方面的扬声器系统。
图1B示出根据各种实施方案的图1A的示例性扬声器单元的剖面图。
图2是根据各种实施方案的可结合或耦接到图1A的扬声器系统来实现的计算设备的框图。
图3是根据各种实施方案的图1A的音频处理引擎的更详细图解。
图4示出根据各种实施方案的在环境内创建虚拟声源的示例。
图5是根据各种实施方案的用于将音频输入路由到扬声器系统中的一个或多个扬声器单元的方法步骤的流程图。
图6是根据各种实施方案的用于在扬声器单元上生成音频输出的方法步骤的流程图。
具体实施方式
在以下描述中,阐述了许多具体细节以提供对各种实施方案的更透彻的理解。然而,对于本领域技术人员将显而易见的是,本发明概念可在没有这些具体细节中的一个或多个的情况下实践。
系统概述
图1A示出被配置来实现各种实施方案的一个或多个方面的扬声器系统100。如图1A所示,扬声器系统100包括但不限于彼此耦接的系统控制器102和音频处理引擎104以及多个扬声器单元106(1)-106(X)。扬声器单元106(1)-106(X)中的每一者单独称为扬声器单元106。
在一个或多个实施方案中,每个扬声器单元106包括指向不同方向以生成3D声场的多个扬声器驱动器(例如,换能器)。更具体地,图1B示出根据各种实施方案的图1A的示例性扬声器单元106的剖面图。如图1B所示,示例性扬声器单元106包括在立方体扬声器壳体的不同面上的五个扬声器驱动器140-148。示例性扬声器单元任选地包括扬声器壳体的与包括扬声器驱动器148的面相对的面(未示出)上的第六扬声器驱动器(未示出)。因此,扬声器驱动器140-148(连同任选的第六扬声器驱动器)指向彼此正交的方向(例如,向上、向下、向左、向右、向前和/或向后)。
当扬声器驱动器基本上指向收听者的方向并且扬声器驱动器与收听者之间的路径未被阻塞时,给定扬声器驱动器发出的声音可经由直接路径到达扬声器壳体附近的收听者。例如,当扬声器驱动器146整体指向收听者的方向并且沿扬声器驱动器146与收听者之间的直线上没有物体时,扬声器驱动器146发出的声音可直接到达收听者。
扬声器驱动器发出的声音可替代地或另外地经由间接路径到达收听者,所述间接路径包括将声音从表面反射之后才到达收听者。继续上面的示例,扬声器驱动器148发出的声音可在声音从通常位于扬声器驱动器148前面的墙壁、窗户或另一表面反射之后经由第一间接路径到达收听者。扬声器驱动器140发出的声音可在声音从扬声器壳体上方的天花板或另一表面反射之后经由第二间接路径到达收听者。扬声器驱动器142发出的声音可在声音从扬声器壳体下方的地板或另一表面反射之后经由第三间接路径到达收听者。扬声器驱动器144发出的声音可在声音从通常位于扬声器驱动器144前面的墙壁、角落或另一表面反射之后经由第四间接路径到达收听者。如下文进一步详细描述,由一个或多个扬声器驱动器140-148发出的声音可用于沿与扬声器驱动器140-148指向的方向不一致的方向生成波束。
虽然图1B的示例性扬声器单元106被示出为具有指向正交方向的扬声器驱动器140-148,但是本领域技术人员将理解扬声器单元106可包括扬声器的其他配置或布置。例如,扬声器单元106可包括指向相同的方向和/或位于扬声器壳体的相同面上的两个或更多个扬声器驱动器。在另一示例中,扬声器单元106可包括位于扬声器壳体的一些或所有面上的扬声器驱动器,所述扬声器壳体具有四面体、金字塔形、八面体、十二面体、二十面体、球形、环形和/或另一种类型的多面体或3D形状。在第三个示例中,扬声器单元106可包括各种数量和/或配置的不同类型的扬声器驱动器(例如,高音扬声器、中音驱动器、低音扬声器等)。
返回到图1A的讨论,系统控制器102和音频处理引擎104被配置来控制扬声器单元106上的音频输出的生成,使得由扬声器单元106呈现的声音被收听者感知为源自任意位置或方向。系统控制器102的输入包括影响扬声器单元106的声音的呈现的多个模型108。
模型108包括但不限于音频空间表征122、一个或多个收听者位姿124、一个或多个扬声器位姿126、一个或多个扬声器驱动器特性128和/或一个或多个声学边界参数130。音频空间表征122包括与感知的位置或方向相关的信息,与一个或多个音频输入信号120相关联的各种声音将源自这些位置或方向。例如,音频空间表征122可包括二维(2D)、3D、球形和/或表示声音将源自其的位置和/或方向的其他坐标。
收听者位姿124包括扬声器系统附近的一个或多个收听者的定位和取向。例如,收听者位姿124可包括表示每个收听者的定位的坐标和表示收听者和/或收听者的耳朵的取向的一个或多个矢量。此外,收听者位姿124可更新以反映收听者的定位和/或取向的改变。例如,相机、深度传感器、加速度计、陀螺仪和/或另一种类型的传感器或跟踪系统(未示出)可用于在实时或接近实时基础上跟踪和更新用于扬声器系统附近的一个或多个收听者的收听者位姿124。替代地,收听者位姿124可以是固定的和/或预先指定的(例如,如剧院、收听室和/或其他类型的收听环境中的“已知”或“理想”收听者位置)。
扬声器位姿126包括扬声器单元106中扬声器驱动器的定位和取向。例如,扬声器位姿126可包括表示每个扬声器单元的中心的定位的坐标,以及表示扬声器单元的取向的一个或多个矢量。当扬声器系统包括或支持具有不同数量和/或配置的扬声器驱动器的扬声器单元106时,扬声器位姿126可另外指定扬声器驱动器的配置、扬声器驱动器的类型、壳体大小、壳体形状和/或影响每个扬声器单元106中扬声器驱动器的定位和/或取向的其他属性。与收听者位姿124一样,扬声器位姿126可以多种方式提供和/或确定。例如,扬声器单元160中和/或周围的一个或多个传感器可用于确定扬声器单元160在房间和/或另一环境中的定位和取向。在另一示例中,收听者和/或另一用户可手动指定扬声器单元160和/或每个扬声器单元160中的扬声器驱动器在给定环境内的定位和取向。
扬声器驱动器特性128包括影响每个扬声器单元106中的扬声器驱动器发出声音的属性。例如,扬声器驱动器特性128可包括(但不限于)与每个扬声器单元106和/或每个扬声器单元106中的各个扬声器驱动器相关联的频率响应、壳体材料和/或扬声器驱动器材料。
声学边界参数130包括与扬声器系统附近的表面相关的属性。例如,声学边界参数130可包括可影响扬声器单元106产生的声音的吸收、衍射、折射和/或反射的地板、天花板、一面或多面墙壁、一个或多个窗户、一扇或多扇门、一个或多个角落、一个或多个物体、一个或多个收听者和/或其他物理实体的3D几何模型。声学边界参数130还可包括表征给定表面对声音的吸收或反射的参数。与收听者位姿124和扬声器位姿126一样,声学边界参数130可由相机、一个或多个麦克风、深度传感器和/或另一种类型的传感器确定。例如,声学边界参数130可基于由一个或多个扬声器单元106和/或另一音频源发出的声音在收听位置处由一系列麦克风测量。声学边界参数130也可或替代地由扬声器系统附近的收听者和/或另一用户提供。例如,用户可手动生成放置扬声器系统的房间的布局和/或执行一次或多次扫描以确定房间的布局。用户还可指定房间中每个表面的材料、反射特性和/或吸收特性。
在一个或多个实施方案中,系统控制器102包括基于模型108执行与扬声器单元106发出的声音相关的空间优化的空间取向引擎112。例如,空间取向引擎112可确定每个区(例如,扬声器系统周围的3D空间区域)可生成的最大声音、每个区可生成的最大静音、基于扬声器单元106和/或扬声器单元106中各个扬声器驱动器的频率响应应用于音频输入信号120的频率响应优化和/或针对每个收听者的差分收听者左耳和右耳优化。
音频处理引擎104基于空间取向引擎112执行的空间优化执行与音频输入信号120相关的处理。首先,音频处理引擎104跨扬声器单元106执行音频输入信号120的音频路由和分割114。例如,音频处理引擎104可将音频输入信号120分割成多个音频通道和/或与音频空间表征122中不同位置相关联的声音。音频处理引擎104还可确定每个音频通道或声音将被路由到的各个扬声器单元106和/或扬声器驱动器。
接下来,音频处理引擎104执行波束组合116,所述波束组合确定可用于相对于收听者位姿124中的收听者位置在对应位置处呈现与音频通道相关联的声音的波束图型。例如,音频处理引擎104可确定将由两个或更多个扬声器单元106和/或扬声器驱动器生成的两个或更多个波束的波束图型,当两个或更多个波束的波束图型组合时,生成被在给定收听者位置处的收听者感知到源自某个方向的声音。
然后音频处理引擎104执行波束形成118,所述波束形成确定在给定可由各个扬声器单元106和/或扬声器驱动器发出的音频的情况下将如何形成每个波束组合116中的波束。例如,音频处理引擎104可确定将由一个或多个扬声器单元106中的各个扬声器驱动器发出的给定音频的延迟、振幅、相位和/或其他基于时间或基于频率的属性。当扬声器驱动器发出音频时,所传输的声音相长干扰,以在一个或多个方向上形成一个或多个声束。所传输的声音还或替代地相消干扰以形成在一个或多个其他方向上抑制声音的一个或多个零点。下文将参照图3进一步详细地描述音频处理引擎104的操作。
图2是根据各种实施方案的可结合或耦接到图1A的扬声器系统来实现的计算设备200的框图。注意,本文描述的计算设备200是说明性的并且任何其他技术上可行的配置都落入本发明的范围内。例如,计算设备200的硬件部件和/或软件部件可在单个计算设备上实现和/或跨多个计算设备分布。在另一示例中,计算设备200的各种硬件部件和/或软件部件可被合并、重新布置、省略和/或用具有类似或不同功能性的其他部件替换。
如图所示,计算设备200包括但不限于经由存储器桥205和通信路径213耦接到并行处理子系统212的中央处理单元(CPU)202和系统存储器204。存储器桥205进一步经由通信路径206耦接到I/O(输入/输出)桥207,并且I/O桥207又耦接到交换机216。
在操作中,I/O桥207被配置来从输入设备208,诸如键盘、鼠标、触摸屏、麦克风等接收用户输入信息,并且经由通信路径206和存储器桥205将输入信息转发到CPU 202以供处理。交换机216被配置来提供I/O桥207与计算设备200的其他部件诸如网络适配器218和各种任选的附加卡220和221之间的连接。
I/O桥207耦接到系统盘214,所述系统盘可被配置来存储内容、应用程序和数据以供CPU 202和并行处理子系统212使用。通常来说,系统盘214提供用于应用程序和数据的非易失性存储,并且可包括固定硬盘或可移动硬盘驱动器、闪存存储器设备和CD-ROM(光盘只读存储器)、DVD-ROM(数字多功能光盘-ROM)、蓝光、HD-DVD(高清DVD)或其他磁性、光学或固态存储设备。最后,尽管未明确示出,其他部件诸如通用串行总线或其他端口连接、光盘驱动器、数字多功能光盘驱动器、电影记录设备等也可连接到I/O桥207。
在各种实施方案中,存储器桥205可以是北桥芯片,而I/O桥207可以是南桥芯片。此外,通信路径206和213以及计算设备200内的其他通信路径可使用任何技术上合适的协议来实现,包括但不限于AGP(加速图形端口)、超传输或本领域已知的任何其他总线或点对点通信协议。
在一些实施方案中,并行处理子系统212包括将像素传送到显示设备210的图形子系统,所述显示设备可以是任何常规的阴极射线管、液晶显示器、发光二极管显示器等。例如,并行处理子系统212可包括图形处理单元(GPU)和一个或多个相关联的设备驱动程序。GPU可集成到CPU 202的芯片组中,或者GPU可驻留在分立的GPU芯片上。
应当理解,本文所示的系统是说明性的,并且变型和修改是可能的。可根据需要修改连接拓扑结构,包括桥的数量和布置、CPU的数量和并行处理子系统的数量。例如,系统存储器204可直接连接到CPU 202而不是通过存储器桥205,并且其他设备将经由存储器桥205与系统存储器204和CPU 202通信。在另一示例中,并行处理子系统212可连接到I/O桥207或直接连接到CPU 202,而不是连接到存储器桥205。在第三示例中,I/O桥207和存储器桥205可集成到单个芯片中,而不是作为一个或多个分立设备存在。在第四示例中,CPU202的功能性可由数字信号处理器(DSP)补充或实现。最后,在某些实施方案中,可省略图2中所示的一个或多个部件。例如,可取消交换机216,并且网络适配器218和附加卡220、221将直接连接到I/O桥207。在另一示例中,可省略显示设备210和/或输入设备208。
在一些实施方案中,计算设备200被配置来执行或实现驻留在系统存储器204中的系统控制器102和/或音频处理引擎104。系统控制器102和/或音频处理引擎104可存储在系统盘214和/或其他存储设备中并且在执行时加载到系统存储器204中。
更具体地,计算设备200被配置来执行与在一个或多个扬声器单元106上呈现任意声音方向相关的处理。如上所述,系统控制器102基于模型108执行与扬声器单元106发出的声音相关的空间优化,所述模型描述了声音的一个或多个感知位置或方向、扬声器单元106和/或扬声器单元106中的扬声器驱动器的定位和取向、扬声器单元106附加的一个或多个收听者的定位和取向、与扬声器单元106附近的声学边界相关的位置和/或属性和/或与扬声器单元106和/或扬声器单元106中的扬声器驱动器生成声音相关的特性。例如,系统控制器102可在接收器、放大器、电视、移动设备、控制台和/或通过有线连接和/或无线连接与音频处理引擎104和/或扬声器单元106通信的另一计算设备上执行。
在空间优化完成之后,系统控制器102生成包括音频分量和/或方向分量的输出。例如,音频分量可包括已通过由系统控制器102基于频率响应优化、差分收听者耳朵优化和/或其他优化调整的音频通道、声音和/或音频输入信号120的其他部分。方向分量可包括各个声音、音频通道、波束和/或音频输入信号120的其他部分的感知方向。
音频处理引擎104使用系统控制器102产生的空间优化输出来生成被传输到各个扬声器单元106和/或每个扬声器单元中的扬声器驱动器的各种输出。对应的扬声器单元106和/或扬声器驱动器使用输出以呈现由收听者感知到的源自某些位置的声音。例如,音频处理引擎104可在与系统控制器102相同的计算设备中执行,以基于来自系统控制器102的空间优化输出对多个扬声器单元106执行波束形成相关处理。替代地或另外地,音频处理引擎104的单独实例可驻留在每个扬声器单元106上,并且基于来自系统控制器102的特定于扬声器单元的空间优化输出(例如,将由扬声器单元中的扬声器驱动器输出的特定声音或音频通道、与声音或音频通道相关联的波束或零点的方向等)生成扬声器单元中的各个扬声器驱动器的输出。
如下文进一步详细描述,音频处理引擎104通过分别处理从系统控制器102接收的音频通道的高频分量、低频分量和中频分量、声音和/或音频输入信号230的其他部分生成到给定扬声器单元106中的各个扬声器驱动器的音频输出。然后音频处理引擎104将音频输出传输到扬声器驱动器以使扬声器驱动器传输与音频输入信号230的部分相对应的音频。然后组合该传输的音频以在系统控制器102指定的一个或多个相应位置处呈现一个或多个声音。
在扩音器系统上呈现任意声音方向
图3是根据各种实施方案的图1A的音频处理引擎104的更详细图解。如图3所示,音频处理引擎104的输入包括一维音频输入302,诸如由单个扬声器单元106中的N个扬声器驱动器(例如,在图1B的示例性扬声器单元106中多达N=6个正交扬声器驱动器)播放的单个声音或音频通道。音频处理引擎104的输入还包括与音频输入302相关联的一个或多个波束和零点方向304。例如,波束和零点方向304可包括坐标、矢量和/或一个或多个声束将指向的位置或方向的其他表示。波束和零点方向304还可或替代地包括坐标、矢量和/或一个或多个零点(例如,静音区域或基本没有声音的区域)将被呈现的位置或方向的其他表示。
音频处理引擎104将一维音频输入302划分为高频分量、低频分量和中频分量。例如,音频处理引擎104可将音频输入302划分为频率高于第一阈值(例如,2-3kHz)的高频分量、频率落在第二阈值(例如,200-300Hz)之下的低频分量,以及频率落在第一阈值与第二阈值之间的中频分量。
接下来,音频处理引擎104分别执行使用高频分量的高频处理308、使用低频分量的低频处理312和使用中频分量的中频波束形成320。更具体地,音频处理引擎104执行低频处理312,所述低频处理根据低频分量生成单个低频输出322以传输到扬声器单元160中的所有扬声器驱动器。扬声器驱动器使用低频输出322来生成声音的相同低频部分,从而允许扬声器驱动器作为扬声器单元160内的超低音操作。
音频处理引擎104还执行高频处理308,所述高频处理根据音频输入302的高频分量生成高频输出310的1xN矩阵。矩阵中的每个元素与不同的扬声器驱动器相对应并且包括将由扬声器驱动器传输的高频音频。例如,可基于波束和零点方向304与扬声器单元106中的各个扬声器驱动器指向的方向之间的一般对应来生成高频输出310。因此,表示更大声和/或更引人注目的声音的高频输出可传输到通常面向与波束相同方向的扬声器驱动器,而表示更轻柔和/或不太明显的声音(或没有声音)的高频输出可传输到背离波束方向的扬声器驱动器。
音频处理引擎104进一步执行中频波束形成320,所述中频波束形成生成用于音频输入302的中频分量的1xN波束形成器滤波器组314。特别地,音频处理引擎104包括在波束形成器滤波器组314中生成N个带通滤波器的控制逻辑306,其中每个带通滤波器与扬声器单元106中的不同扬声器驱动器相对应。在控制逻辑306生成波束形成器滤波器组314中的滤波器之后,音频处理引擎104将滤波器应用于中频分量以产生中频输出324的1xN矩阵。每个中频输出表示将由扬声器单元106中的对应扬声器驱动器传输的中频音频。中频波束形成320产生的N个中频输出324可在相位、振幅、延迟和/或其他基于时间或基于频率的属性方面变化。这些属性变化导致由扬声器单元106中的多个扬声器驱动器发出的中频音频相长干扰或相消干扰,从而在对应的波束和零点方向304处形成中频波束和零点。
在根据给定音频输入302生成单个低频输出322、N个高频输出310和N个中频输出324之后,音频处理引擎104执行这些输出的求和316以生成N个音频输出信号318。例如,音频处理引擎104可通过将单个低频输出322、特定于扬声器驱动器的高频输出和特定于扬声器驱动器的中频输出求和来为扬声器单元106中的每个扬声器驱动器生成不同的音频输出信号。然后音频处理引擎104将音频输出信号318传输到扬声器单元106和/或扬声器单元106中的扬声器驱动器,以使扬声器驱动器发出与音频输出信号318相对应的声音。
在一个或多个实施方案中,音频处理引擎104的一个或多个实例为多个扬声器单元106和/或扬声器驱动器生成音频输出信号318,使得收听者将这些扬声器单元和/或驱动器形成的多个波束感知为源自给定位置或方向的单个声音。如下文关于图4进一步详细描述,这些音频输出信号318可被定时使得波束基本上同时抵达收听者,从而避免可能由波束在稍微不同的时间到达引起的滞后辨别。
音频处理引擎104任选地对从系统控制器102接收的另外的一维音频输入执行高频处理308、低频处理312和中频波束形成320。例如,音频处理引擎104可为扬声器单元106发出的每个声音生成高频输出310、低频输出322和中频输出324。然后音频处理引擎104针对给定时间步长或间隔内的所有音频输入(例如,所有音频输入表示在给定时间处将发出的一个或多个声音)执行高频输出310、低频输出322和中频输出324的求和316,并且将对应的音频输出信号318传输到扬声器单元106和/或扬声器单元106中的各个扬声器驱动器。然后扬声器驱动器生成与所传输的音频输出信号318相对应的音频,所述音频任选地与来自其他扬声器单元106和/或其他类型的扩音器中的扬声器驱动器的音频组合以在3D声场内产生一个或多个声音。
图4示出根据各种实施方案的在环境内创建虚拟声源的示例。如图4所示,即使与感知方向414相对应的区域没有任何扬声器或扬声器驱动器,在收听者位置404处的收听者仍感知到虚拟声源源自感知方向414。相反,虚拟声源由位于收听者一侧的一个扬声器单元400生成的第一波束406和位于收听者另一侧的第二扬声器单元402生成的第二波束406形成。
更具体地,波束406以一定角度指向声学反射表面(例如,墙壁、窗户、柱子等),这导致源自波束406与表面相遇处的点的反射波束410指向收听者位置404。类似地,波束408以可能不同的角度指向表面,这导致源自波束408与表面相遇处的点的另一反射波束412指向收听者位置404。反射波束410、412两者到达收听者位置404处导致在收听者位置404处的收听者感知经由波束406、408和反射波束410、412传输的声音源自感知方向414。
另外,波束406和408可分别由扬声器单元400和402生成,以避免可由优先效应引起的感知方向414上的失真。例如,系统控制器102和/或音频处理引擎104的一个或多个实例可使用一个或多个模型108来生成到扬声器单元400和402的各种控制和/或音频输出信号。这些控制和/或音频输出信号使扬声器单元400和402以特定振幅、方向和时间分别传输形成波束406和波束408的音频,这导致反射波束410、412同时抵达收听者位置404。反射波束410、412在收听者位置404处的这种同时抵达防止较早到达的反射波束的方向支配感知方向414。
在一个或多个实施方案中,扬声器单元400、402中的每个包括容纳在扬声器壳体中的一个或多个扬声器驱动器。例如,扬声器单元400可包括波束形成条形音箱,并且扬声器单元402可包括具有指向正交方向的扬声器驱动器的扬声器单元(例如,图1B的扬声器单元106)。通常来讲,一个或多个虚拟声源可基于收听者位置404附近的一个或多个扬声器单元(例如,扬声器单元400、402)的布置和/或收听者位置404周围的声学反射表面的布局,在给定收听者位置404处生成。例如,三个、四个或更多扬声器单元可用于生成被收听者位置404处的收听者感知为从不同感知方向到达的声音、波束和/或虚拟声源。
图5是根据各种实施方案的用于将音频输入路由到扬声器系统中的一个或多个扬声器单元的方法步骤的流程图。尽管结合图1A至图4的系统描述了方法步骤,但本领域技术人员将理解,被配置来以任何次序执行方法步骤的任何系统都落在本发明的范围内。
如图所示,在步骤502中,系统控制器102接收包括音频空间表征、收听者位姿、一个或多个扬声器驱动器位姿和声学边界参数的输入。在一些实施方案中,输入与一个或多个模型108相对应。例如,系统控制器102可从音频输入源接收音频空间表征,所述音频空间表征包括一个或多个音频输入的感知位置或方向的坐标、矢量和/或其他表示。系统控制器102可使用一个或多个传感器以确定扬声器系统周围的环境的布局,所述布局包括收听者位姿、扬声器驱动器位姿和/或声学边界参数。系统控制器102还可或替代地从用户接收收听者位姿、扬声器驱动器位姿和/或声学边界参数。
接下来,在步骤504中,系统控制器102基于接收到的输入和一个或多个扬声器单元的特性,为将由一个或多个扬声器单元(例如,在扬声器壳体内具有正交扬声器驱动器、条形音箱和/或扬声器驱动器的其他布置的扬声器单元)发出的每个声音生成一组或多组方向分量和音频分量。例如,系统控制器102可将频率响应优化、差分收听者左耳和右耳优化和/或其他类型的优化应用于一个或多个音频输入信号中的每个以生成与将由一个或多个扬声器单元发出的声音的一个或多个音频分量相对应的音频输入302。系统控制器102还可为参与发出声音的每个扬声器单元确定每个区(例如,扬声器系统附近的空间的3D区域)的最大声音、每个区的最大静音、一个或多个波束和零点方向304和/或与由扬声器系统的音频的传输相关的另一方向分量。
更具体地,系统控制器102可为参与生成声音的每个扬声器单元确定给定声音的一组不同的方向分量和音频分量。系统控制器102还生成每个声音的一组或多组方向分量和音频分量,以便由对应的一个或多个扬声器单元发出的组合音频为具有给定位置和取向的收听者(即,在步骤502中接收到的收听者位姿)呈现来自感知方向的声音。然后系统控制器102针对在给定时间要发出的每个声音重复该处理,使得在那个时间参与发出一个或多个声音的给定扬声器单元与在步骤504中生成的一组或多组对应的方向分量和音频分量相关联。如下文进一步详细描述,用于多个声音的多组方向分量和音频分量可在扬声器驱动程序层处另外地组合或叠加,以确定由扬声器单元中的各个扬声器驱动器输出的音频。
在步骤506中,系统控制器102和/或音频处理引擎104为在步骤504中生成的每组方向分量和音频分量生成用于对应的扬声器单元中的一个或多个扬声器的一个或多个音频输出信号。例如,系统控制器102和/或音频处理引擎104可为每个相应的方向分量和音频分量组生成音频输出信号,所述音频输出信号使对应的扬声器单元基于每个相应的方向分量和音频分量组来呈现声束和零点,如下文关于图6进一步详细描述。
当系统控制器102和/或音频处理引擎104确定在步骤504中生成的多组方向分量和音频分量与给定扬声器单元(即,扬声器单元用于发出与多组方向分量和音频分量相对应的多个并发声音)相关联时,系统控制器102和/或音频处理引擎104可为要由扬声器单元中的每个扬声器驱动器发出的每个声音计算单独的音频输出信号。然后系统控制器102和/或音频处理引擎104可将扬声器单元中每个扬声器驱动器的音频输出信号求和、叠加或以其他方式组合成扬声器驱动器的单个组合音频输出信号。
在步骤508中,系统控制器102和/或音频处理引擎104将在步骤506中生成和/或组合的音频输出信号传输到对应的一个或多个扬声器单元和/或一个或多个扬声器驱动器。传输的音频输出信号使一个或多个扬声器单元和/或一个或多个扬声器驱动器发出与音频输出信号相对应的声音。由多个扬声器驱动器和/或扬声器单元发出的声音可用于呈现与在步骤504中确定的方向分量和音频分量相对应的声束和零点。
在步骤510,系统控制器102确定是否继续路由音频输入。例如,系统控制器102可继续将音频输入路由到一个或多个扬声器单元和/或一个或多个扬声器驱动器,同时一个或多个扬声器单元用于在各个位置处呈现声音。如果系统控制器102确定音频输入的路由将继续,则系统控制器102可为将由一个或多个扬声器单元发出的另外的声音重复步骤502-508。一旦系统控制器102确定音频输入的路由将被中断,系统控制器102就中断与输入相关的处理。
图6是根据各种实施方案的用于在扬声器单元上生成音频输出的方法步骤的流程图。尽管结合图1A至图5的系统描述了方法步骤,但是本领域技术人员将理解,被配置来以任何次序执行方法步骤的任何系统都落在本发明的范围内。
如图所示,在步骤602中,音频处理引擎104接收将由扬声器单元呈现的声音的方向分量和音频分量。例如,音频处理引擎104可接收方向和音频分量作为一维音频输入302以及与在图5的步骤504期间由系统控制器102确定的音频输入相关联的一个或多个波束和零点方向304。
接下来,在步骤604中,音频处理引擎104为扬声器单元中所有扬声器驱动器生成低频输出322。例如,音频处理引擎104可在低频输出322中包括声音低于第一阈值的所有频率。
在步骤606中,音频处理引擎104基于扬声器单元中各个扬声器驱动器的方向性生成多个高频输出310。例如,音频处理引擎104可为扬声器单元106中N个扬声器驱动器生成N个高频输出310。每个高频输出可包括声音中超过第二阈值的频率。每个高频输出的强度可能与对应的扬声器驱动器指向的方向与从音频输入创建的声束的方向之间的角度成反比。换句话说,可为通常指向波束方向的扬声器驱动器生成非零高频输出310,同时可为不指向波束方向的扬声器驱动器生成零值高频输出310。
在步骤608中,音频处理引擎104为音频输入的中频分量生成波束形成器滤波器组314。中频分量可包括声音中落在第一阈值与第二阈值之间的频率,并且波束形成器滤波器组314可包括用于扬声器单元106中N个扬声器驱动器(或用于扬声器壳体内的条形音箱或扬声器驱动器的另一布置中的N个扬声器驱动器)的N个带通滤波器。在步骤610中,音频处理引擎104将波束形成器滤波器组314中的滤波器应用于中频分量以生成多个中频输出324。例如,音频处理引擎104可将中频分量与带通滤波器组合以为扬声器单元106中的N个扬声器驱动器生成N个中频输出324。中频输出324可包括不同的振幅、相位和/或延迟,以允许扬声器驱动器传输在对应方向处形成一个或多个波束的音频。
在步骤612中,音频处理引擎104对每个扬声器驱动器的低频输出322、中频输出324和高频输出310求和。例如,音频处理引擎104可将低频输出、中频输出和高频输出组合成每个扬声器驱动器的单个音频输出。
在步骤614中,音频处理引擎104将求和的输出传输到对应的扬声器驱动器。继而,扬声器驱动器生成与求和的输出相对应的音频,以在一个或多个位置处呈现声音。
在步骤616中,音频处理引擎104确定是否继续为给定扬声器单元生成输出。例如,音频处理引擎104可继续为扬声器单元生成输出,以用于将由扬声器单元传输的另外的声音和/或从系统控制器102接收的另外的输入。如果音频处理引擎104确定要继续为扬声器单元生成输出,则音频处理引擎104可为将由扬声器单元发出的另外的声音重复步骤602-616。这些声音可由扬声器单元同时输出和/或在不同时间输出。一旦音频处理引擎104确定到扬声器单元的输出的生成将被中断(例如,在音频轨道或文件的回放完成之后),音频处理引擎104中断与输出相关的处理。
在一个或多个实施方案中,步骤602-616由音频处理引擎104的一个或多个实例单独执行。音频处理引擎104的这些实例可在扬声器壳体内的一个或多个扬声器单元106、条形音箱和/或扬声器驱动器的其他布置上执行。音频处理引擎104的一个或多个实例还可或替代地在一个或多个设备(例如,放大器、接收器、计算机系统等)上执行,所述一个或多个设备与多个扬声器单元分离并且耦接到多个扬声器单元,并且用于为扬声器单元生成音频输出。然后,扬声器单元可使用来自音频处理引擎104的一个或多个实例的音频输出以生成音频束和/或零点,所述音频束和/或零点到达在给定定位和取向处的收听者以便收听者听到似乎源自收听者周围的各个位置的声音。
此外,音频处理引擎104的给定实例可多次执行步骤602-616以处理从系统控制器102接收到的声音的多个并发方向分量和音频分量,并且使扬声器单元发出具有这些方向分量和音频分量的多个声音。更具体地,音频处理引擎104可同时和/或顺序执行多次步骤602-610以根据在图5的步骤504中由系统控制器102确定的多组音频分量和方向分量生成多组低频输出、中频输出和高频输出。音频处理引擎104还可同时多次执行步骤612-614,以组合与多个方向分量和音频分量相对应的多组频率输出、中频输出和高频输出,并且将组合的输出传输到扬声器单元中对应的扬声器驱动器。这些组合的输出可使扬声器单元发出与由系统控制器102确定的多个方向分量和音频分量相对应的多个并发声音。
总之,本公开技术支持在3D声场内的任意方向上呈现声音。一种系统控制器接收音频输入信号、与音频输入信号相关联的声音将被呈现的一个或多个位置、扬声器系统的第一几何模型以及扬声器系统附近的一个或多个表面的第二几何模型。系统控制器执行空间优化,所述空间优化生成将由扬声器系统中的每个扬声器呈现的声音的方向分量和音频分量。系统控制器将方向分量和音频分量传输到音频处理引擎。音频处理引擎使用来自系统控制器的方向分量和音频分量为扬声器中所有扬声器驱动器生成每个声音的单个低频输出、基于扬声器驱动器的方向性和声束的方向的多个高频输出以及用于形成波束的多个中频输出。将用于每个扬声器驱动器的低频输出、中频输出和高频输出求和并且传输到扬声器驱动器,以使扬声器驱动器传输包括低频分量、中频分量和/或高频分量的音频。每个扬声器驱动器可另外叠加与来自音频处理引擎的多个声音相对应的多个输出,以有助于多个声音的传输。然后由多个扬声器驱动器和/或多个扬声器传输的声音可用于在各个方向生成波束和/或零点。这些波束和/或零点可另外组合以为在给定收听者位置处的收听者呈现各种感知位置处的声音。
扬声器系统包括可在多个方向上传输声音的一个或多个扬声器单元。例如,每个扬声器单元可包括六个扬声器驱动器,所述扬声器驱动器基本上彼此正交并且在立方体扬声器壳体的不同面上。六个扬声器驱动器可指向上、下、左、右、前和后。扬声器驱动器发出的声音因此可经由一个或多个直接路径和/或间接路径到达收听者。可另外改变声音的振幅、相位、延迟和/或其他属性以形成从各个方向到达收听者的声束。
本公开技术相对于现有技术的一个技术优势在于,利用本公开技术,可使用较少的扬声器单元生成似乎源自全3D声场内的任意位置的声音。因此,本公开技术增加了在声场内传输的声音的空间覆盖范围和分辨率,而不需要将另外的扬声器单元放置在声音似乎源自的位置处。本公开技术的另一技术优势是能够以考虑扬声器单元周围的环境以及环境内收听者的定位和取向的方式生成声音。因此,本公开技术减少了与物体对声音的阻挡、由不同扬声器产生的声音之间的干扰和/或收听者的定位或取向的改变相关联的失真、音频质量损失和/或空间分辨率损失。这些技术优势提供对现有技术方法的一项或多项技术改进。
1.在一些实施方案中,一种用于为扬声器系统生成音频的计算机实现的方法,所述方法包括:接收音频输入信号、与所述音频输入信号相关联的第一位置、所述扬声器系统的第一几何模型以及所述扬声器系统附近的一个或多个表面的第二几何模型;基于所述音频输入信号、所述第一位置、所述第一几何模型和所述第二几何模型为所述扬声器系统中的多个扬声器驱动器生成多个输出信号;以及将所述多个输出信号传输到所述多个扬声器驱动器,其中所述多个扬声器驱动器发出与所述多个输出信号相对应的音频,所发出的音频在所述第一位置处呈现与所述音频输入信号相对应的声音。
2.如条款1所述的计算机实现的方法,其中生成所述多个输出信号包括:生成低频输出,所述低频输出被传输到所述多个扬声器驱动器;基于所述第一位置和所述多个扬声器驱动器发出所述音频的多个方向生成一个或多个高频输出;以及生成一个或多个中频输出,所述一个或多个中频输出用于形成用于在所述第一位置处呈现所述声音的一个或多个波束图型。
3.如条款1或2所述的计算机实现的方法,其还包括:基于与感知不到声音相关联的第二位置生成所述多个输出信号。
4.如条款1-3中任一项所述的计算机实现的方法,其中所发出的音频包括从第一扬声器驱动器直接发出到收听者的第一声音分量或来自第二扬声器驱动器的从表面反射之才到达所述收听者的第二声音分量中的至少一者。
5.如条款1-4中任一项所述的计算机实现的方法,其中所述第一声音分量和所述第二声音分量被生成为同时抵达所述收听者。
6.如条款1-5中任一项所述的计算机实现的方法,其中所述第一几何模型包括与所述多个扬声器驱动器相关联的定位和取向。
7.如条款1-6中任一项所述的计算机实现的方法,其中所述第二几何模型还包括与收听者相关联的定位和取向。
8.如条款1-7中任一项所述的计算机实现的方法,其中接收所述第二几何模型包括:在所述扬声器系统附近的第二位置处执行一次或多次声学测量。
9.如条款1-8中任一项所述的计算机实现的方法,其中所述一个或多个表面包括墙壁、地板、天花板、角落或物体中的至少一者。
10.如条款1-9中任一项所述的计算机实现的方法,其中所述多个扬声器驱动器包括沿第一方向发出声音的第一扬声器驱动器、沿与所述第一方向基本上相反的第二方向发出声音的第二扬声器驱动器、沿与所述第一方向和所述第二方向基本上正交的第三方向发出声音的第三扬声器驱动器,以及沿与所述第三方向基本上相反并且与所述第一方向和所述第二方向基本上正交的第四方向发出声音的第四扬声器驱动器。
11.在一些实施方案中,一个或多个非暂时性计算机可读介质存储指令,所述指令在由一个或多个处理器执行时,使所述一个或多个处理器执行以下步骤:接收第一音频输入信号、与所述第一音频输入信号相关联的第一位置、扬声器系统的第一几何模型以及所述扬声器系统附近的一个或多个表面的第二几何模型;基于所述第一音频输入信号、所述第一位置、所述第一几何模型和所述第二几何模型为所述扬声器系统中的多个扬声器驱动器生成多个第一输出信号;以及将所述多个第一输出信号传输到所述多个扬声器驱动器,其中所述多个扬声器驱动器发出与所述多个第一输出信号相对应的音频,所发出的音频在所述第一位置处呈现与所述第一音频输入信号相对应的第一声音。
12.如条款11所述的一个或多个非暂时性计算机可读介质,其中所述指令进一步使所述一个或多个处理器执行以下步骤:基于与所述多个扬声器驱动器相关联的一个或多个特性来调整所述第一音频输入信号。
13.如条款11或12所述的一个或多个非暂态计算机可读介质,其中生成所述多个第一输出信号包括:生成低频输出,所述低频输出被传输到所述多个扬声器驱动器;基于所述第一位置和所述多个扬声器驱动器发出所述音频的多个方向生成一个或多个高频输出;以及生成一个或多个中频输出,所述一个或多个中频输出用于形成用于在所述第一位置处呈现所述声音的一个或多个波束图型。
14.如条款11-13中任一项所述的一个或多个非暂时性计算机可读介质,其中所述第二几何模型包括与所述一个或多个表面相关联的声学边界、与所述一个或多个表面相关联的吸收参数以及与所述一个或多个表面相关联的反射参数。
15.如条款11-14中任一项所述的一个或多个非暂态计算机可读介质,其中所发出的音频包括从第一扬声器驱动器直接发出到收听者的第一声音分量或来自第二扬声器驱动器的从表面反射之后才到达所述收听的第二分量中的至少一者。
16.如条款11-15中任一项所述的一个或多个非暂时性计算机可读介质,其中所述指令进一步使所述一个或多个处理器执行以下步骤:基于第二音频输入信号、与所述第二音频输入信号相关联的第二位置、所述第一几何模型和所述第二几何模型生成多个第二输出信号;将所述多个第二输出信号与所述多个第一输出信号组合以为所述多个扬声器驱动器中的每个生成相应组合输出信号;以及将所组合的多个输出信号传输到所述多个扬声器驱动器,其中所述多个扬声器驱动器发出与所发出的音频相对应的音频,所发出的音频在所述第一位置处呈现与所述第一音频输入信号相对应的所述第一声音并且在第二位置处呈现与所述第二音频输入信号相对应的第二声音。
17.如条款11-16中任一项所述的一个或多个非暂时性计算机可读介质,其中接收所述第一几何模型和所述第二几何模型包括:基于描述所述扬声器系统周围的环境的用户输入生成所述第一几何模型或所述第二几何模型中的至少一者。
18.在一些实施方案中,一种扬声器系统包括:多个第一扬声器驱动器,所述多个第一扬声器驱动器容纳在第一扬声器壳体内;存储器,所述存储器存储指令;以及处理器,所述处理器耦接到所述存储器并且在执行所述指令时被配置来:接收音频输入信号、与所述音频输入信号相关联的第一位置、所述扬声器系统的第一几何模型以及所述扬声器系统附近的一个或多个表面的第二几何模型;基于所述第一音频输入信号、所述第一位置、所述第一几何模型和所述第二几何模型为所述多个第一扬声器驱动器生成多个第一输出信号;并且将所述多个第一输出信号传输到所述多个第一扬声器驱动器,其中所述多个第一扬声器驱动器发出与所述多个第一输出信号相对应的音频,所发出的音频在所述第一位置处呈现与所述音频输入信号相对应的声音。
19.如条款18所述的扬声器系统,其中所述多个第一扬声器驱动器包括沿第一方向发出声音的第一扬声器驱动器、沿与所述第一方向基本上相反的第二方向发出声音的第二扬声器驱动器、沿与所述第一方向和所述第二方向基本上正交的第三方向发出声音的第三扬声器驱动器、沿与所述第三方向基本上相反并且与所述第一方向和所述第二方向基本上正交的第四方向发出声音的第四扬声器驱动器、沿与所述第一方向、所述第二方向、所述第三方向和所述第四方向基本上正交的第五方向发出声音的第五扬声器驱动器,以及沿与所述第五方向基本上相反并且与所述第一方向、所述第二方向、所述第三方向和所述第四方向基本上正交的第六方向发出声音的第六扬声器驱动器。
20.如条款18或19所述的扬声器系统,其还包括多个第二扬声器驱动器,所述多个第二扬声器驱动器容纳在第二扬声器壳体内,并且其中所述处理器在执行所述指令时进一步被配置来:基于所述音频输入信号、与所述音频输入信号相关联的第二位置、所述第一几何模型和所述第二几何模型为所述多个第二扬声器驱动器生成多个第二输出信号;并且将所述多个第二输出信号传输到所述多个第二扬声器驱动器,其中所述多个第二扬声器驱动器发出与所述多个第二输出信号相对应的音频,所发出的音频在所述第二位置处呈现所述声音。
权利要求中任一项所述的权利要求要素中的任一个和/或本申请中描述的任何要素的呈任何形式的任何和所有组合均落入本发明和保护的预期范围内。
已出于说明目的而呈现了对各种实施方案的描述,但这些描述并非意图是详尽性的或受限于所公开的实施方案。在不脱离所描述的实施方案的范围和精神的情况下,许多修改和变化对于本领域的普通技术人员来说是显而易见的。
本实施方案的各方面可体现为系统、方法或计算机程序产品。因此,本公开的各方面可采用以下形式:完全硬件实施方案、完全软件实施方案(包括固件、常驻软件、微代码等)或将软件方面与硬件方面组合的实施方案,上述实施方案在本文中通常都可称为“模块”、“系统”或“计算机”。此外,本公开中描述的任何硬件和/或软件技术、过程、功能、部件、发动机、模块或系统可被实现为电路或电路组。此外,本公开的各方面可采取体现在一个或多个计算机可读介质中的计算机程序产品的形式,所述计算机可读介质具有在其上体现的计算机可读程序代码。
可利用一个或多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是例如但不限于电子、磁性、光学、电磁、红外或半导体系统、装置或设备或者前述的任何合适的组合。计算机可读存储介质的更具体示例(非详尽列表)将包括以下介质:具有一根或多根导线的电连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式光盘只读存储器(CD-ROM)、光学存储设备、磁性存储设备或前述的任何合适的组合。在本文档的上下文中,计算机可读存储介质可以是可包含或存储供指令执行系统、装置或设备使用或者与所述指令执行系统、装置或设备结合使用的程序的任何有形介质。
上文参考根据本公开的实施方案的方法、装置(系统)和计算机程序产品的流程图图解和/或框图来描述本公开的各方面。将理解,流程图图解和/或框图的每个框以及流程图图解和/或框图中的框的组合可由计算机程序指令实现。这些计算机程序指令可提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器以产生机器。指令在经由计算机的处理器或其他可编程数据处理装置执行时,使得能够实现流程图和/或框图的一个或多个框中所指定的功能/动作。此类处理器可以是但不限于通用处理器、专用处理器、应用特定处理器或现场可编程门阵列。
附图中的流程图和框图示出根据本公开的各种实施方案的系统、方法和计算机程序产品的可能实现方式的架构、功能和操作。就这一点而言,流程图或框图中的每个框均可表示代码的模块、片段或部分,所述代码包括用于实现一个或多个指定的逻辑功能的一个或多个可执行指令。还应注意,在一些替代实现方式中,框中提到的功能可不按附图中提到的顺序出现。例如,连续示出的两个框事实上可基本上同时地执行,或所述框有时可以相反的次序执行,具体情形要取决于所涉及的功能。还应注意,框图和/或流程图图解中的每个框以及框图和/或流程图图解中的框的组合可由执行指定功能或动作的基于专用硬件的系统或专用硬件与计算机指令的组合来实现。
虽然前述内容针对本公开的实施方案,但在不脱离本公开的基本范围的情况下可设想本公开的其他和另外的实施方案,并且本公开的范围由随附权利要求书加以确定。
Claims (20)
1.一种用于为扬声器系统生成音频的计算机实现的方法,所述方法包括:
接收音频输入信号、与所述音频输入信号相关联的第一位置、所述扬声器系统的第一几何模型以及所述扬声器系统附近的一个或多个表面的第二几何模型;
基于所述音频输入信号、所述第一位置、所述第一几何模型和所述第二几何模型为所述扬声器系统中的多个扬声器驱动器生成多个输出信号;以及
将所述多个输出信号传输到所述多个扬声器驱动器,其中所述多个扬声器驱动器发出与所述多个输出信号相对应的音频,所发出的音频在所述第一位置处呈现与所述音频输入信号相对应的声音。
2.如权利要求1所述的计算机实现的方法,其中生成所述多个输出信号包括:
生成低频输出,所述低频输出被传输到所述多个扬声器驱动器;
基于所述第一位置和所述多个扬声器驱动器发出所述音频的多个方向生成一个或多个高频输出;以及
生成一个或多个中频输出,所述一个或多个中频输出用于形成用于在所述第一位置处呈现所述声音的一个或多个波束图型。
3.如权利要求1所述的计算机实现的方法,其还包括:基于与感知不到声音相关联的第二位置生成所述多个输出信号。
4.如权利要求1所述的计算机实现的方法,其中所发出的音频包括从第一扬声器驱动器直接发出到收听者的第一声音分量或来自第二扬声器驱动器的从表面反射之后才到达所述收听者的第二声音分量中的至少一者。
5.如权利要求4所述的计算机实现的方法,其中所述第一声音分量和所述第二声音分量被生成为同时抵达所述收听者。
6.如权利要求1所述的计算机实现的方法,其中所述第一几何模型包括与所述多个扬声器驱动器相关联的定位和取向。
7.如权利要求1所述的计算机实现的方法,其中所述第二几何模型还包括与收听者相关联的定位和取向。
8.如权利要求1所述的计算机实现的方法,其中接收所述第二几何模型包括:在所述扬声器系统附近的第二位置处执行一次或多次声学测量。
9.如权利要求1所述的计算机实现的方法,其中所述一个或多个表面包括墙壁、地板、天花板、角落或物体中的至少一者。
10.如权利要求1所述的计算机实现的方法,其中所述多个扬声器驱动器包括沿第一方向发出声音的第一扬声器驱动器、沿与所述第一方向基本上相反的第二方向发出声音的第二扬声器驱动器、沿与所述第一方向和所述第二方向基本上正交的第三方向发出声音的第三扬声器驱动器,以及沿与所述第三方向基本上相反并且与所述第一方向和所述第二方向基本上正交的第四方向发出声音的第四扬声器驱动器。
11.一个或多个非暂时性计算机可读介质,其存储指令,所述指令在由一个或多个处理器执行时,使所述一个或多个处理器执行以下步骤:
接收第一音频输入信号、与所述第一音频输入信号相关联的第一位置、扬声器系统的第一几何模型以及所述扬声器系统附近的一个或多个表面的第二几何模型;
基于所述第一音频输入信号、所述第一位置、所述第一几何模型和所述第二几何模型为所述扬声器系统中的多个扬声器驱动器生成多个第一输出信号;以及
将所述多个第一输出信号传输到所述多个扬声器驱动器,其中所述多个扬声器驱动器发出与所述多个第一输出信号相对应的音频,所发出的音频在所述第一位置处呈现与所述第一音频输入信号相对应的第一声音。
12.如权利要求11所述的一个或多个非暂时性计算机可读介质,其中所述指令进一步使所述一个或多个处理器执行以下步骤:基于与所述多个扬声器驱动器相关联的一个或多个特性来调整所述第一音频输入信号。
13.如权利要求11所述的一个或多个非暂时性计算机可读介质,其中生成所述多个第一输出信号包括:
生成低频输出,所述低频输出被传输到所述多个扬声器驱动器;
基于所述第一位置和所述多个扬声器驱动器发出所述音频的多个方向生成一个或多个高频输出;以及
生成一个或多个中频输出,所述一个或多个中频输出用于形成用于在所述第一位置处呈现所述第一声音的一个或多个波束图型。
14.如权利要求11所述的一个或多个非暂时性计算机可读介质,其中所述第二几何模型包括与所述一个或多个表面相关联的声学边界、与所述一个或多个表面相关联的吸收参数以及与所述一个或多个表面相关联的反射参数。
15.如权利要求11所述的一个或多个非暂时性计算机可读介质,其中所发出的音频包括从第一扬声器驱动器直接发出到收听者的第一声音分量或来自第二扬声器驱动器的从表面反射之后才到达所述收听者的第二分量中的至少一者。
16.如权利要求11所述的一个或多个非暂时性计算机可读介质,其中所述指令进一步使所述一个或多个处理器执行以下步骤:
基于第二音频输入信号、与所述第二音频输入信号相关联的第二位置、所述第一几何模型和所述第二几何模型生成多个第二输出信号;
将所述多个第二输出信号与所述多个第一输出信号组合以为所述多个扬声器驱动器中的每一个生成相应组合输出信号;以及
将所组合的多个输出信号传输到所述多个扬声器驱动器,其中所述多个扬声器驱动器发出与所发出的音频相对应的音频,所发出的音频在所述第一位置处呈现与所述第一音频输入信号相对应的所述第一声音并且在第二位置处呈现与所述第二音频输入信号相对应的第二声音。
17.如权利要求11所述的一个或多个非暂时性计算机可读介质,其中接收所述第一几何模型和所述第二几何模型包括:基于描述所述扬声器系统周围的环境的用户输入生成所述第一几何模型或所述第二几何模型中的至少一者。
18.一种扬声器系统,其包括:
多个第一扬声器驱动器,所述多个第一扬声器驱动器容纳在第一扬声器壳体内;
存储器,所述存储器存储指令;以及
处理器,所述处理器耦接到所述存储器并且在执行所述指令时被配置来:
接收音频输入信号、与所述音频输入信号相关联的第一位置、所述扬声器系统的第一几何模型以及所述扬声器系统附近的一个或多个表面的第二几何模型;
基于所述第一音频输入信号、所述第一位置、所述第一几何模型和所述第二几何模型为所述多个第一扬声器驱动器生成多个第一输出信号;并且
将所述多个第一输出信号传输到所述多个第一扬声器驱动器,其中所述多个第一扬声器驱动器发出与所述多个第一输出信号相对应的音频,所发出的音频在所述第一位置处呈现与所述音频输入信号相对应的声音。
19.如权利要求18所述的扬声器系统,其中所述多个第一扬声器驱动器包括:
沿第一方向发出声音的第一扬声器驱动器;
沿与所述第一方向基本上相反的第二方向发出声音的第二扬声器驱动器;
沿与所述第一方向和所述第二方向基本上正交的第三方向发出声音的第三扬声器驱动器;
沿与所述第三方向基本上相反并且与所述第一方向和所述第二方向基本上正交的第四方向发出声音的第四扬声器驱动器;
沿与所述第一方向、所述第二方向、所述第三方向和所述第四方向基本上正交的第五方向发出声音的第五扬声器驱动器;以及
沿与所述第五方向基本上相反并且与所述第一方向、所述第二方向、所述第三方向和所述第四方向基本上正交的第六方向发出声音的第六扬声器驱动器。
20.如权利要求18所述的扬声器系统,其还包括多个第二扬声器驱动器,所述多个第二扬声器驱动器容纳在第二扬声器壳体内,并且其中所述处理器在执行所述指令时进一步被配置来:
基于所述音频输入信号、与所述音频输入信号相关联的第二位置、所述第一几何模型和所述第二几何模型为所述多个第二扬声器驱动器生成多个第二输出信号;并且
将所述多个第二输出信号传输到所述多个第二扬声器驱动器,其中所述多个第二扬声器驱动器发出与所述多个第二输出信号相对应的音频,所发出的音频在所述第二位置处呈现所述声音。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/548,396 US20230188893A1 (en) | 2021-12-10 | 2021-12-10 | Loudspeaker system for arbitrary sound direction rendering |
US17/548,396 | 2021-12-10 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116405840A true CN116405840A (zh) | 2023-07-07 |
Family
ID=84360859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211561899.5A Pending CN116405840A (zh) | 2021-12-10 | 2022-12-07 | 用于任意声音方向呈现的扩音器系统 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230188893A1 (zh) |
EP (1) | EP4195697A1 (zh) |
CN (1) | CN116405840A (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20240064465A1 (en) * | 2022-08-16 | 2024-02-22 | Franco L D'Ascanio | Thermally efficient speaker |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7643640B2 (en) * | 2004-10-13 | 2010-01-05 | Bose Corporation | System and method for designing sound systems |
US9485556B1 (en) * | 2012-06-27 | 2016-11-01 | Amazon Technologies, Inc. | Speaker array for sound imaging |
US20170195795A1 (en) * | 2015-12-30 | 2017-07-06 | Cyber Group USA Inc. | Intelligent 3d earphone |
US10721578B2 (en) * | 2017-01-06 | 2020-07-21 | Microsoft Technology Licensing, Llc | Spatial audio warp compensator |
US11617050B2 (en) * | 2018-04-04 | 2023-03-28 | Bose Corporation | Systems and methods for sound source virtualization |
CA3135849A1 (en) * | 2019-04-02 | 2020-10-08 | Syng, Inc. | Systems and methods for spatial audio rendering |
-
2021
- 2021-12-10 US US17/548,396 patent/US20230188893A1/en active Pending
-
2022
- 2022-11-21 EP EP22208540.9A patent/EP4195697A1/en active Pending
- 2022-12-07 CN CN202211561899.5A patent/CN116405840A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4195697A1 (en) | 2023-06-14 |
US20230188893A1 (en) | 2023-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220116723A1 (en) | Filter selection for delivering spatial audio | |
EP3095254B1 (en) | Enhanced spatial impression for home audio | |
US9271102B2 (en) | Multi-dimensional parametric audio system and method | |
RU2710524C2 (ru) | Звуковая система | |
US10299064B2 (en) | Surround sound techniques for highly-directional speakers | |
AU2004320207A1 (en) | Audio apparatus and method | |
CA2918677C (en) | Method for processing of sound signals | |
JP2022525902A (ja) | オーディオ装置およびその処理の方法 | |
EP4195697A1 (en) | Loudspeaker system for arbitrary sound direction rendering | |
CN113632505A (zh) | 装置、方法、声音系统 | |
KR102534768B1 (ko) | 오디오 출력 장치 및 제어방법 | |
WO2015023685A1 (en) | Multi-dimensional parametric audio system and method | |
US20120224700A1 (en) | Sound image control device and sound image control method | |
US11284194B2 (en) | Techniques for generating spatial sound via head-mounted external facing speakers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |