CN106537941B - 虚拟声音系统和方法 - Google Patents
虚拟声音系统和方法 Download PDFInfo
- Publication number
- CN106537941B CN106537941B CN201580034887.9A CN201580034887A CN106537941B CN 106537941 B CN106537941 B CN 106537941B CN 201580034887 A CN201580034887 A CN 201580034887A CN 106537941 B CN106537941 B CN 106537941B
- Authority
- CN
- China
- Prior art keywords
- gain
- user
- sound field
- signal
- head
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Abstract
提供响应于用户运动而更新声场的方法和系统。所述方法和系统计算开销低于现有的更新声场的方法,并且还适用于任意扬声器配置。所述方法和系统提供通过使用“虚拟扬声器”而实现的动态双耳声场渲染。不是将扬声器信号馈送到物理扬声器中,信号改为通过对应于这些扬声器的空间位置的左和右HRIR(头部相关输入响应)来滤波。左耳信号和右耳信号的总和接着被馈送到用户的音频输出装置中。
Description
相关申请的交叉引用
本申请主张2014年11月11日申请的第62/078,050号美国临时专利申请的优先权,该美国临时专利申请的全部公开内容以引用方式并入本文中。
背景技术
在许多情形下,需要产生一种声场,该声场包含与该声场内的信号源(所述信号源可以是虚拟源)的位置相关的信息。此信息导致收听者将声音感知为源于虚拟源的位置,即,信号被感知为源于相对于收听者的位置的3维空间中的位置。例如,伴随着电影的音频可作为环绕声输出使得为观看者提供更逼真的体验。另一实例发生在计算机游戏的上下文中,其中输出给用户的音频信号包含空间信息,以使得用户将音频感知为不是来自扬声器,而是来自3维空间中的(虚拟)位置。
含有空间信息的声场可例如使用借以接收双耳信号的耳机扬声器而传送给用户。双耳信号包含足以重新创建涵盖一个或更多个虚拟信号源的虚拟声场的信息。在此情形下,需要考量用户的头部运动以维持稳定的声场,以此来例如保留音频和视频的关系(例如,同步、重合等)。不能维持稳定的声场或音场例如因用户急速低头而导致用户将虚拟源(例如,汽车)感知为飞到空中。虽然很常见,不考虑用户的头部运动导致源位置在用户的头部内的内化(internalized)。
发明内容
本发明内容以简化形式介绍一系列概念,以提供对本公开的一些方面的基本理解。本发明内容不是本公开的详尽概括,并且不希望标识本公开的关键或重要元素或限定本公开的范围。本发明内容仅呈现本公开的概念中的一些作为下文提供的具体实施方式的序言。
本公开总的来说涉及用于信号处理的方法和系统。更具体来说,本发明的方面涉及处理含有空间信息的音频信号。
本公开的一个实施例涉及一种用于更新声场的方法,该方法包括:通过确定对应于多个物理扬声器的空间位置的头部相关输入响应(HRIR)而产生多个物理扬声器的虚拟扬声器;使用与用户相关联的头部追踪数据和基于直接增益优化的至少一个摇移函数来稳定空间声场;以及把稳定的声场提供到与用户相关联的音频输出装置。
在另一实施例中,在用于更新声场的方法中稳定空间声场包含将摇移函数应用到每个虚拟扬声器信号馈送。
在另一实施例中,用于更新声场的方法还包括:对多个物理扬声器的每个信号计算增益;以及将所计算的增益存储在查找表中。
在又一实施例中,用于更新声场的方法还包括:基于从检测的用户的运动得出的旋转声场计算而确定修改的扬声器信号的增益。
在又一实施例中,用户的音频输出装置是耳机装置,并且用于更新声场的方法还包括:从耳机装置获得与用户相关联的头部追踪数据。
在另一实施例中,用于更新声场的方法还包括:把每个修改的增益与对应的HRIR对组合;以及将组合的增益和HRIR发送到用户的音频输出装置。
本公开的另一实施例涉及一种更新声场的系统,该系统包括:至少一个处理器;以及非暂时性计算机可读介质,耦接到至少一个处理器,非暂时性计算机可读介质上存储了指令,所述指令在由至少一个处理器执行时,导致至少一个处理器:通过确定对应于多个物理扬声器的空间位置的头部相关输入响应(HRIR)而产生多个物理扬声器的虚拟扬声器;使用与用户相关联的头部追踪数据和基于直接增益优化的摇移函数来稳定空间声场;以及把稳定的声场提供到与用户相关联的音频输出装置。
在另一实施例中,用于更新声场的系统中的至少一个处理器被进一步导致:将摇移函数应用到每个虚拟扬声器信号馈送。
在另一实施例中,用于更新声场的系统中的至少一个处理器被进一步导致:对多个物理扬声器的每个信号计算增益;并且将所计算的增益存储在查找表中。
在又一实施例中,用于更新声场的系统中的至少一个处理器被进一步导致:基于从检测的用户的运动而得出的旋转声场计算而确定修改的扬声器信号的增益。
在又一实施例中,用户的音频输出装置是耳机装置,并且用于更新声场的系统中的至少一个处理器被进一步导致:从耳机装置获得与用户相关联的头部追踪数据。
在又一实施例中,用于更新声场的系统中的至少一个处理器被进一步导致:把每个修改的增益与对应的HRIR对组合;以及将组合的增益和HRIR发送到用户的音频输出装置。
本公开的又一实施例涉及一种提供音频信号的方法,该音频信号包含与声场中至少一个虚拟源相对于用户的位置的定位相关联的空间信息,该方法包括:获得包含多个信号分量的第一音频信号,所述信号分量中的每一个对应于位于声场中的多个虚拟扬声器中的相应一个;获得用户运动的指示;通过基于用户运动的指示将相应阶的摇移函数应用到所述信号分量中的每一个而确定多个摇移的信号分量,其中摇移函数利用直接增益补偿函数;以及将包含摇移的信号分量的第二音频信号输出给用户。
在一个或更多个实施例中,本文所述的方法和系统可视情况包含以下额外特征中的一个或更多个:修改的扬声器信号的增益是作为原始扬声器增益的加权总和来确定;基于指示源的定位质量的客观判据对所有摇移角来心理声学优化所述查找表;用户的音频输出装置是耳机装置;包含经摇移的信号分量的第二音频信号通过用户的耳机装置而输出;和/或用户运动的指示是获自用户的耳机装置。
本文所公开的处理器和存储器系统中的一些或全部的实施例还可被配置成执行上文所公开的方法实施例中的一些或全部。上文所公开的方法中的一些或全部的实施例还可被表示为体现在暂时性或非暂时性处理器可读存储介质(例如,光学或磁性存储器)上的指令或表示为经由通信网络(例如,因特网或电话连接)而提供到处理器或数据处理装置的传播信号。
本公开的方法和系统的适用性的进一步的范围将从下文给出的具体实施方式变得更清楚。然而,应理解,具体实施方式和具体实例虽然指示方法和系统的实施例,但仅通过说明的方式给出,这是因为对于本领域的技术人员来说,本文所公开的概念的精神和范围内的各种改变和修改将从此具体实施方式变得更清楚。
附图说明
对于本领域的技术人员来说,本公开的这些和其它目标、特征和特性将结合权利要求书和附图而从下文具体实施方式的研究变得更清楚,所有这些形成本说明书的一部分。其中:
图1A是图示根据本文所述的一个或更多个实施例的使用对应于一种设置中的所有扬声器的空间位置的头部相关输入响应(HRIR)的测量而进行的虚拟扬声器再现的实例系统的框图。
图1B是图示根据本文所述的一个或更多个实施例的与HRIR卷积的扬声器信号的播放的实例系统的框图。
图2是图示根据本文所述的一个或更多个实施例的用于将扬声器信号与对应于扬声器的空间位置的HRIR测量组合以形成2声道双耳流的实例系统的框图。
图3A是图示根据本文所述的一个或更多个实施例的在不同摇移角下从实例摇移方法引起的个别扬声器的实例增益函数的图形表示。
图3B是图示根据本文所述的一个或更多个实施例的在不同摇移角下从实例摇移方法引起的个别扬声器的实例增益函数的图形表示。
图4A是图示根据本文所述的一个或更多个实施例的在实例摇移方法的状况下的能量和速度向量的量值的实例分析的图形表示。
图4B是图示根据本文所述的一个或更多个实施例的不同摇移角的总发射能量的实例分析的图形表示。
图5A是图示根据本文所述的一个或更多个实施例的能量向量方向与预期摇移角之间的绝对度数差的实例的图形表示。
图5B是图示根据本文所述的一个或更多个实施例的速度向量方向与预期摇移角之间的绝对度数差的实例的图形表示。
图5C是图示根据本文所述的一个或更多个实施例的能量向量方向与速度向量方向之间的绝对度数差的实例的图形表示。
图6是图示根据本文所述的一个或更多个实施例的用于响应于用户运动而更新声场的实例方法的流程图。
图7是图示根据本文所述的一个或更多个实施例的被布置成响应于用户运动而更新声场的实例计算装置的框图。
本文所提供的标题仅是为了方便起见,并且未必影响本公开所主张的内容的范围或含义。
在附图中,为了便于理解且为了方便起见,相同参考数字和任何缩略词识别具有相同或类似结构或功能性的元件或动作。将在下文具体实施方式中详细描述附图。
具体实施方式
现将描述本公开的方法和系统的各种实例和实施例。下文描述提供具体细节以贯彻地理解这些实例并实现这些实例的描述。然而,本领域的技术人员将理解,可在没有许多这些细节的情况下实践本文所述的一个或更多个实施例。同样,本领域的技术人员还将理解本公开的一个或更多个实施例可包含本文中未详细描述的其它特征。此外,可未在下文中示出或描述一些熟知的结构或功能,以便避免不必要地混淆相关描述。
除了避免可能的负面用户体验(例如,上文所论述的负面用户体验)之外,稳定声场的维持引发声场的较有效的外化(externalization),或换句话说,较有效地产生声源处于收听者的头部外部或声场包含位于受控制的位置处的源的感觉。因此,明显需要修改所产生的声场,以补偿用户运动(例如,用户头部围绕x、y和/或z轴(当使用笛卡尔系统来表示空间时)的旋转或移动)。
此问题可通过如下方式来解决:使用头部追踪装置来检测头部定向(orientation)的改变;以及一旦检测到改变,就计算虚拟源相对于用户的新位置;以及重新计算新虚拟源位置的3维声场。然而,此做法计算成本巨大。因为大多数应用(例如,计算机游戏场景)涉及多个虚拟源,所以高计算成本使得此做法不可行。此外,此做法使得有必要有权使用每一虚拟源所产生的原始信号以及每一虚拟源的当前空间位置,这也可导致额外计算负担。
根据用户运动来旋转(rotating)或摇移(panning)声场的问题的现有解决方案包含使用经振幅摇移的声源。然而,这些现有做法导致含有受损的距离线索的声场,这是因为这些现有做法忽略重要信号特性,例如,直达混响比、轻微头部运动以及具有不正确的波前曲线的声学视差。此外,这些现有解决方案还给出受损的方向定位精度,这是因为这些现有解决方案必须与次佳的扬声器放置(例如,尚未针对游戏系统而设计的5.1或7.1环绕声扬声器系统)抗衡。
维持稳定声场会加强音频源处于收听者的头部外部的感觉。此过程的效力在技术上具有挑战性。已识别的一个重要因素是,即使较小的无意识头部运动也会帮助解决前后混乱。在双耳收听中,此问题在使用未个人化的头部相关转移函数(HRTF)时最频繁地发生。接着,通常难以在头部的前部与后部的虚拟声源之间区别。
因此,本公开的实施例涉及响应于用户运动而更新声场的方法和系统。如下文更详细地描述,本公开的方法和系统计算成本比用于更新声场的现有做法低,并且还适用于任意扬声器配置。
根据本文所述的一个或更多个实施例,所述方法和系统提供通过使用“虚拟扬声器”而实现的动态双耳声场渲染。并不是将扬声器信号馈送到物理扬声器中,信号改为通过对应于这些扬声器的空间位置的左和右头部相关脉冲响应(HRIR)来滤波。左耳信号和右耳信号的总和接着被馈送到用户的音频输出装置(如耳机)中。例如,可利用下式以便获得左耳耳机馈送:
其中*表示卷积,且hLi是对应于第i扬声器定位的左耳HRIR,并且qi是其信号馈送。该过程对于右耳信号馈送来说是类似的。
在根据本公开的一个或更多个实施例的虚拟扬声器做法中,在所谓的“甜蜜点”(例如,通常确保最佳定位精度的扬声器阵列的中心处的物理点)处测量HRIR,因此减轻了例如立体声系统的常见限制。
图1A和图1B图示从扬声器的ITU 5.0(应注意,0.1声道可被排除,因为0.1声道不传达空间信息)阵列形成虚拟扬声器的实例。
明确地说,图1A和图1B示出实例虚拟扬声器再现系统和方法(100、150),借此,测量对应于给定设置中的所有扬声器的空间位置的HRIR(图1A)并将其与扬声器信号组合(例如,形成2声道双耳流,如下文进一步描述)以向用户播放(图1B)。
在实践中,声场稳定(stabilization)是指虚拟扬声器需要在3维(3-D)声场中“重定位”以抵消用户的头部运动。然而,应理解,此过程等同于将摇移函数(panningfunction)应用到虚拟扬声器馈送。根据本公开的一个或更多个实施例,提供一种稳定系统以应用可用在利用头部追踪的声场稳定化的过程中的最佳和最成本有效的摇移方案。
旋转声场计算导致应用到扬声器信号的新的扬声器增益系数。这些经修改的增益是作为所有原始扬声器增益的加权总和而导出:
或简写为,
g′=G(ΦH)g. (3)
其中[L,R,C,Ls,Rs]T和[L',R',C',Ls',Rs']T是原始的5.0扬声器馈送以及因头部旋转达角度ΦH所致的经变换的5.0扬声器馈送。此操作可被视为等同于将摇移函数应用到每一离散扬声器馈送。下文提供了关于根据本公开的一个或更多个实施例的用于计算矩阵G(ΦH)的过程的额外细节。
为了使虚拟扬声器应用到旋转信号,每一重新计算的扬声器增益需要与该对应的HRIR对卷积(例如,组合)。图2是用于将扬声器信号与对应于一组扬声器的空间位置的HRIR测量值组合以形成2声道双耳流(LOUT 250和ROUT 260)的实例系统200的框图。根据至少一个实施例,实例系统和过程(200)可用于5扬声器空间阵列,并且可包含声场旋转(210),这在形成双耳输出以呈现给用户的过程中考虑头部追踪数据(220)以及低频效果(LFE)230。
通过直接增益优化进行的声场稳定
下文描述计算用于本公开的系统中的矩阵G(ΦH)的增益系数的过程。应注意,虽然下文描述基于ITU 5.0环绕声扬声器布局(其中“0.1”声道被排除),但所提供的方法和系统可扩展并适用于各种其它扬声器布置和布局,包含如7.1、9.1和其它规则及不规则的布置和布局。
本公开的方法和系统基于并利用能量和速度向量定位,这已被证明适用于预测多扬声器系统中的高频和低频定位,并且已被广泛用作设计例如音频解码器的工具。向量方向是低频源和中高频源的感知角度的良好预测因素,并且每一向量的长度是定位的“质量”或“良好程度”的良好预测因素。能量和速度向量是针对多声道音频系统中的一组给定扬声器增益而计算。可区别分别在x、y和z方向上的向量的分量。然而,为了简单起见,并且为了避免混淆本公开的相关特征,在下文实例中,仅说明水平再现,以使得能量向量可被定义为:
e=[ex ey] (4)
其中ex和ey是分别在x和y方向上的向量分量,N是阵列中的扬声器的总数,并且gi是位于水平角Φi处的第i扬声器的实增益。Pe的物理含义可被视为系统的总能量。可被定义为下式的能量向量的量值或范数可被视为特定方向上的能量浓度的量度:
最大能量浓度的方向可由下式给出:
类似地,速度向量可被定义为:
v=[vx vy] (10)
可被定义为下式的速度向量的量值或范数可被视为来自模拟方向上的声源的N个扬声器的净声学速度与原本从此方向上的单个声源引起的速度的比:
重要的是注意到,虽然在能量向量中进行平方的增益的正负号始终是正号,但在速度向量中,正负号被保留并且也可以是负号。此事实的实际含意是速度向量的范数可通过使用从直径上相反的方向“拉动”压力的异相扬声器来调整。针对物理源,速度向量的量值始终是1,但针对虚拟源,由于可能的异相分量,速度向量的量值可以大于1。
可被定义为下式的速度向量方向简单地指示空气粒子振荡的净方向:
根据本公开的一个或更多个实施例,所描述的系统和方法可利用具有以例如一度(1°)的方位分辨率计算的增益系数的查找表。查找表的使用是将头部追踪实施到ITU 5.0到双耳降混的简单且低成本的方式。针对所有偏移角心理声学优化查找表中的增益,使得满足最好质量定位的各种目标预测因素。这些目标预测因素可包含但不限于如下所列:
(i)能量向量长度||re||应接近一。
(ii)速度向量长度||rv||应接近一。
(iii)所再现的能量应实质上与摇移角(panning angle)无关。
(iv)速度和能量向量方向和应紧密匹配。
(v)能量向量的角度应适度地接近摇移角
(vi)速度向量的角度应适度地接近摇移角
上文所述的实例目标(i)到(vi)可分别表达为:
(i)||re||≈1
(ii)||rv||≈1
(iii)Pe≈1
(iv)
(v)
(vi)
可使用多变量成本函数f(g)=f(g1,g2,g3,g4,g5)的最小值的非线性无约束搜索来执行优化,其中gi是扬声器增益。作为部分二次函数fk(g)的总和的总成本函数被设计和符号分析,并且反映如上所述的一组实例目标(i)到(vi)。符号分析依序执行以导出成本函数的梯度:
及其海森式:
其中J(ξ(x))表示该函数的雅克比式。此做法具有优点在于,特别在海森式的估计中,利用有限差进行的梯度估计被避免,并且数值误差的风险也被避免。部分二次成本函数和所得总成本函数是:
f1(g)=(1-||re||)2
f2(g)=(1-||rv||)2
f3(g)=(1-Pe)2
f(g)=f1(g)+f2(g)+f3(g)+f4(g)+f5(g)+f6(g) (18)
根据本文所述的至少一个实施例,该过程使用具有相等的权重的上述实例部分二次成本函数,这是宽带信号的定位的质量与实施的简单性之间的权衡(例如,在游戏音频引擎中)。根据一个或更多个其它实施例,该过程可将不同加权方案用于低频频带和中频频带到高频频带,其中较大权重被给予低频下的f2(g)和f6(g),并且较大权重被给予中频和高频下的f1(g)和f5(g)。为了让此情形发生,可使用搁架滤波器(shelf filter)以把多声道输入划分为低频流和中频/高频流。
图3A和图3B示出根据本公开的一个或更多个实施例的在不同摇移角下从上文所述的偏移过程引起的个别扬声器的增益函数
为了最小化函数f(g),该过程可例如将MATLAB例程fminunc用于执行一些初始猜想附近的函数的最小值的大规模搜索。在MATLAB脚本路由的一个实例中,脚本预期将5×360矩阵作为输入。在每一列中,存在被使用以便将声源定位在给定角度的5个扬声器增益。
应注意,在优化的过程中,选择初始猜想以使得例如参数中的一些已预先优化通常是良好实践。在这种情况下,以一度(1°)增量计算的成对的恒定功率摇移(PCPP)增益函数是用作进一步优化的开始点的良好候选者的实例。将PCPP增益函数用作初始估计,该过程可在(平均)少至7次迭代之后收敛在结果上。
图4A和图4B示出根据本公开的方法和系统的一个或更多个实施例的能量和速度向量的量值以及不同摇移角的总发射能量Pe的分析。
图5A到图5C是根据本文所述的一个或更多个实施例的能量向量方向与预期摇移角之间的绝对度数差(如误差)(图5A)、速度向量方向与预期摇移角之间的绝对度数差(图5B)以及能量向量方向与速度向量方向之间的绝对度数差(图5C)的实例。
所获得的结果证实尤其在阵列的前部的所获得的偏移函数的强性能,还证实在剩余区域处的与迄今为止最好的做法相当的性能。总发射能量的波动跨越整个摇移域实际上不存在,这使得该方法在此方面与PCPP相当。阵列的前部处的速度-能量向量方向失配围绕50°的疑难点大幅减小(图5A到图C)并且在阵列的其它区域处也较小。
应了解,本文所述的优化是基于定位精度的所计算的目标预测因素(上文所述),而不是基于所需操作/MAC的数量方面的改进。然而,应强调的是,增益优化可被离线执行,并且结果接着存储在查找表中。用于头部追踪装置的预先计算的增益的应用是引入关注的做法,这是因为,考虑新的用户的头部定向仅使得有必要通过从查找表读取的所得增益因子来缩放多声道信号。此外,不需要声道的其它处理。
在预期的定位改进方面,实验结果证实,本公开的摇移方法和系统特别在正面方向和侧向方向上胜过摇移做法。
图6图示根据本文所述的一个或更多个实施例的用于响应于用户运动而更新声场的实例过程(600)。
在框605中,可产生对应多个物理扬声器的虚拟扬声器。例如,可通过确定对应于物理扬声器的空间位置的HRIR来产生虚拟扬声器。
在框610中,可对每个扬声器信号确定优化增益值(例如,以上文所述的方式)。应注意,根据本文所述的一个或更多个实施例,框610在用于更新声场的实例过程(600)中是可选的。
在框615中,可使用与用户相关联(如与检测的用户的运动相关联)的头部追踪数据和基于直接增益优化的摇移函数来稳定用户的空间声场。例如,根据至少一个实施例,头部追踪数据可获自或基于用户的耳机装置所提供的信息/指示。
在框620中,可将被稳定的声场提供到用户的音频输出装置(例如,耳机装置)。
图7是根据本文所述的一个或更多个实施例的被布置成响应于用户运动而更新声场的示范性计算机(700)的高极框图。例如,根据至少一个实施例,计算机(700)可被配置成提供通过使用“虚拟扬声器”而实现的动态双耳声场渲染。不是将扬声器信号馈送到物理扬声器中,而是信号改为通过对应于这些扬声器的空间位置的左HRIR和右HRIR来滤波。左耳信号和右耳信号的总和接着被馈送到用户的音频输出装置(如耳机)中。在很基本的配置(701)中,计算装置(700)通常包含一个或更多个处理器(710)以及系统存储器(720)。存储器总线(730)可用于处理器(710)与系统存储器(720)之间的通信。
取决于期望的配置,处理器(710)可以是任何类型,包含(但不限于)微处理器(μP)、微控制器(μC)、数字信号处理器(DSP)或其任何组合。处理器(710)可包含一级或更多级的高速缓存(例如,一级高速缓存(711)和二级高速缓存(712))、处理器核心(713)和寄存器(714)。处理器核心(713)可包含算术逻辑单元(ALU)、浮点单元(FPU)、数字信号处理核心(DSP核心)或其任何组合。存储器控制器(715)还可与处理器(710)一起使用,或在一些实施方案中,存储器控制器(715)可以是处理器(710)的内部部分。
取决于期望的配置,系统存储器(720)可以是任何类型,包含(但不限于)易失性存储器(例如,RAM)、非易失性存储器(例如,ROM、闪速存储器等)或其任何组合。系统存储器(720)通常包含操作系统(721)、一个或更多个应用程序(722)和程序数据(724)。根据本文所述的一个或更多个实施例,应用程序(722)可包含响应于用户运动而更新声场的系统(723),该系统可被配置成提供通过使用“虚拟扬声器”而实现的动态双耳声场呈现,其中扬声器信号通过对应于物理扬声器的空间位置的左HRIR和右HRIR来滤波,并且左耳信号和右耳信号的总和接着被馈送到用户的音频输出装置(例如,耳机)中。
程序数据(724)可包含存储指令,所述指令在由一个或更多个处理装置执行时,实施用于响应于用户运动而更新声场的系统(723)和方法。此外,根据至少一个实施例,程序数据(724)可包含空间位置数据(725),其中空间位置数据(725)可与关于给定设置中的扬声器的物理位置的数据有关。根据至少一些实施例,应用程序(722)可被布置成通过程序数据(724)在操作系统(721)上操作。
计算装置(700)可具有额外特征或功能性以及额外接口,以促进基本配置(701)与任何所需装置和接口之间的通信。
系统存储器(720)是计算机存储介质的实例。计算机存储介质包含(但不限于)RAM、ROM、EEPROM、闪速存储器或其它存储器技术、CD-ROM、数字多功能光盘(DVD)或其它光学存储装置、磁带盒、磁带、磁盘存储装置或其它磁性存储装置或可用于存储期望信息且可由计算装置700存取的任何其它介质。任何此种计算机存储介质可以是装置(700)的一部分。
计算装置(700)可被实施为例如以下各者的小外形尺寸的便携式(或移动)电子装置的一部分:蜂窝电话、智能电话、个人数据助理(PDA)、个人媒体播放器装置、平板计算机(平板)、无线网页监视装置、个人头戴式耳机装置、专用装置或包含上述功能中的任一个的混合式装置。计算装置(700)还可被实施为包含台式计算机与非台式计算机配置两者的个人计算机。
前文详细描述已经由使用框图、流程图和/或实例而阐述装置和/或过程的各种实施例。因为这些框图、流程图和/或实例含有一个或更多个功能和/或操作,所以本领域的技术人员应理解,可通过广泛范围的硬件、软件、固件或实际上其任何组合而个别地和/或集体地实施这些框图、流程图或实例内的每一功能和/或操作。根据至少一个实施例,可经由专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)或其它集成格式而实施本文所述的主题的若干部分。然然,本领域的技术人员将认识到,本文所公开的实施例的一些方面整体地或部分地可等同地实施在集成电路中,实施为在一个或更多个计算机上运行的一个或更多个计算机程序,实施为在一个或更多个处理器上运行的一个或更多个程序,实施为固件或实施为实际上其任何组合,并且设计电路和/或编写软件和/或固件的代码将根据本公开在本领域的技术人员的能力范围之内。此外,本领域的技术人员将了解,本文所述的主题的机构能够以各种形式作为程序产品而分发,并且本文所述的主题的说明性实施例适用,而不管用于实际上执行分发的非暂时性信号承载介质的特定类型。非暂时性信号承载介质的实例包含(但不限于)以下各者:可读类型的介质,例如,软盘、硬盘驱动器、压缩光盘(CD)、数字视频光盘(DVD)、数字磁带、计算机存储器等;以及传输类型的介质,例如,数字和/或模拟通信介质(例如,光缆、波导、有线通信链路、无线通信链路等)。
关于本文中实质上任何复数和/或单数术语的使用,本领域的技术人员可根据上下文和/或应用的需要,而从复数转化为单数和/或从单数转化为复数。为了清楚起见,可在本文中明确阐述各种单数/复数置换。
因此,已描述本主题的特定实施例。其它实施例处于随附权利要求书的范围内。例如,权利要求书中所述的动作可按不同次序执行且仍实现期望结果。此外,附图所描绘的过程未必需要所示出的特定次序或依序次序来实现期望结果。在某些实施方案下,多任务和并行处理可以是有利的。
Claims (18)
1.一种用于更新声场的方法(600),所述方法包括:
通过确定对应于多个物理扬声器的空间位置的头部相关脉冲响应对而产生所述多个物理扬声器的虚拟扬声器(605);
使用与用户相关联的头部追踪数据和应用于所述虚拟扬声器信号馈送中的每一个的至少一个摇移函数来稳定包括虚拟扬声器信号馈送集的空间声场(615),其中所述摇移函数基于直接增益优化,所述直接增益优化利用能量向量和速度向量定位,所述能量向量和速度向量针对增益系数集而计算以满足定位的至少一个目标预测因素,每个增益系数对应于所述虚拟扬声器信号馈送集中的一个信号馈送;
过滤被稳定的声场得到经过滤的被稳定的声场,所述经过滤的被稳定的声场利用与所述多个物理扬声器的所述空间位置对应的所述头部相关脉冲响应对过滤;以及
把所述经过滤的被稳定的声场提供到与所述用户相关联的音频输出装置(620)。
2.根据权利要求1所述的方法,还包括:
对所述多个物理扬声器的每个信号计算增益;以及
把所计算的增益存储在查找表中。
3.根据权利要求2所述的方法,还包括:
基于从检测的所述用户的运动得出的旋转声场计算来确定扬声器信号的修改的增益。
4.根据权利要求3所述的方法,其中所述扬声器信号的修改的增益被确定为原始扬声器增益的加权总和。
5.根据权利要求2所述的方法,其中基于指示源的定位质量的客观判据对所有摇移角来心理声学优化所述查找表。
6.根据权利要求1所述的方法,其中所述用户的所述音频输出装置是耳机装置。
7.根据权利要求6所述的方法,还包括:
从所述耳机装置获得与所述用户相关联的所述头部追踪数据。
8.根据权利要求3所述的方法,还包括:
把每个修改的增益与对应的头部相关脉冲响应对组合;以及
把组合的增益和头部相关脉冲响应发送到所述用户的所述音频输出装置,其中所述能量向量和速度向量是针对多声道音频系统中的一组给定扬声器增益而计算。
9.一种用于更新声场的系统,所述系统包括:
至少一个处理器;以及
非暂时性计算机可读介质,耦接到所述至少一个处理器,所述非暂时性计算机可读介质上存储有指令,所述指令在由所述至少一个处理器执行时,使所述至少一个处理器:
通过确定对应于多个物理扬声器的空间位置的头部相关脉冲响应对而产生所述多个物理扬声器的虚拟扬声器;
使用与用户相关联的头部追踪数据和应用于所述虚拟扬声器信号馈送中的每一个的至少一个摇移函数来稳定包括虚拟扬声器信号馈送集的空间声场,其中所述摇移函数基于直接增益优化,所述直接增益优化利用能量向量和速度向量定位,所述能量向量和速度向量针对增益系数集而计算以满足定位的至少一个目标预测因素,每个增益系数对应于所述虚拟扬声器信号馈送集中的一个信号馈送;
过滤被稳定的声场得到经过滤的被稳定的声场,所述经过滤的被稳定的声场利用与所述多个物理扬声器的所述空间位置对应的所述头部相关脉冲响应对过滤;以及
把所述经过滤的被稳定的声场提供到与所述用户相关联的音频输出装置。
10.根据权利要求9所述的系统,其中使所述至少一个处理器:
对所述多个物理扬声器的每个信号计算增益;并且
把所计算的增益存储在查找表中。
11.根据权利要求10所述的系统,其中使所述至少一个处理器:
基于从所检测的所述用户的运动得出的旋转声场计算来确定扬声器信号的修改的增益。
12.根据权利要求11所述的系统,其中所述扬声器信号的修改的增益被确定为原始扬声器增益的加权总和。
13.根据权利要求10所述的系统,其中基于指示源的定位质量的客观判据对所有摇移角来心理声学优化所述查找表。
14.根据权利要求9所述的系统,其中所述用户的所述音频输出装置是耳机装置,并且其中所述至少一个处理器被进一步导致:
从所述耳机装置获得与所述用户相关联的所述头部追踪数据。
15.根据权利要求11所述的系统,其中至少一个处理器被进一步导致:
把每个修改的增益与对应的头部相关脉冲响应对组合;并且
把组合的增益和头部相关脉冲响应发送到所述用户的所述音频输出装置,其中所述能量向量和速度向量是针对多声道音频系统中的一组给定扬声器增益而计算。
16.一种提供音频信号的方法,所述音频信号包含与声场中至少一个虚拟源相对于用户的位置的定位相关联的空间信息,所述方法包括:
获得包含多个信号馈送的第一音频信号,所述信号馈送的每一个对应于位于所述声场中的多个虚拟扬声器中的相应一个;
获得用户运动的指示;
通过基于所述用户运动的指示应用摇移函数而确定多个摇移的信号馈送,所述摇移函数被应用到所述信号馈送中的每一个,所述摇移函数利用直接增益优化函数,所述直接增益优化利用能量向量和速度向量定位,并且所述能量向量和速度向量针对增益系数集而计算以满足定位的至少一个目标预测因素,每个增益系数对应于所述虚拟扬声器信号馈送集中的一个信号馈送;
过滤被稳定的声场得到经过滤的被稳定的声场,所述经过滤的被稳定的声场利用与所述多个物理扬声器的所述空间位置对应的所述头部相关脉冲响应对过滤;以及
把包含所述摇移的和经过滤的被稳定地信号馈送的第二音频信号输出给所述用户。
17.根据权利要求16所述的方法,其中包含所述摇移的信号馈送的所述第二音频信号是通过所述用户的耳机装置而输出,其中所述能量向量和速度向量是针对多声道音频系统中的一组给定扬声器增益而计算。
18.根据权利要求17所述的方法,其中所述用户运动的指示从所述用户的所述耳机装置获得。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462078050P | 2014-11-11 | 2014-11-11 | |
US62/078,050 | 2014-11-11 | ||
PCT/US2015/059911 WO2016077317A1 (en) | 2014-11-11 | 2015-11-10 | Virtual sound systems and methods |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106537941A CN106537941A (zh) | 2017-03-22 |
CN106537941B true CN106537941B (zh) | 2019-08-16 |
Family
ID=54602065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580034887.9A Active CN106537941B (zh) | 2014-11-11 | 2015-11-10 | 虚拟声音系统和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10063989B2 (zh) |
EP (1) | EP3141002B1 (zh) |
CN (1) | CN106537941B (zh) |
WO (1) | WO2016077317A1 (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106537941B (zh) | 2014-11-11 | 2019-08-16 | 谷歌有限责任公司 | 虚拟声音系统和方法 |
KR20160122029A (ko) * | 2015-04-13 | 2016-10-21 | 삼성전자주식회사 | 스피커 정보에 기초하여, 오디오 신호를 처리하는 방법 및 장치 |
GB201604295D0 (en) | 2016-03-14 | 2016-04-27 | Univ Southampton | Sound reproduction system |
US9832587B1 (en) * | 2016-09-08 | 2017-11-28 | Qualcomm Incorporated | Assisted near-distance communication using binaural cues |
US10278003B2 (en) | 2016-09-23 | 2019-04-30 | Apple Inc. | Coordinated tracking for binaural audio rendering |
GB2554447A (en) * | 2016-09-28 | 2018-04-04 | Nokia Technologies Oy | Gain control in spatial audio systems |
US10492019B2 (en) | 2017-02-27 | 2019-11-26 | International Business Machines Corporation | Binaural audio calibration |
US10015618B1 (en) * | 2017-08-01 | 2018-07-03 | Google Llc | Incoherent idempotent ambisonics rendering |
EP3698555B1 (en) * | 2017-10-18 | 2023-08-23 | DTS, Inc. | Preconditioning audio signal for 3d audio virtualization |
CN108156561B (zh) | 2017-12-26 | 2020-08-04 | 广州酷狗计算机科技有限公司 | 音频信号的处理方法、装置及终端 |
IL307545A (en) * | 2018-02-15 | 2023-12-01 | Magic Leap Inc | Dual listening positions for mixed reality |
US10313819B1 (en) * | 2018-06-18 | 2019-06-04 | Bose Corporation | Phantom center image control |
CN108966113A (zh) * | 2018-07-13 | 2018-12-07 | 武汉轻工大学 | 基于角度的声场重建方法、音频设备、存储介质及装置 |
TWI698132B (zh) * | 2018-07-16 | 2020-07-01 | 宏碁股份有限公司 | 音效輸出裝置、運算裝置及其音效控制方法 |
CN110740415B (zh) * | 2018-07-20 | 2022-04-26 | 宏碁股份有限公司 | 音效输出装置、运算装置及其音效控制方法 |
GB2591066A (en) * | 2018-08-24 | 2021-07-21 | Nokia Technologies Oy | Spatial audio processing |
EP3618466B1 (en) * | 2018-08-29 | 2024-02-21 | Dolby Laboratories Licensing Corporation | Scalable binaural audio stream generation |
JP7194271B2 (ja) | 2018-10-05 | 2022-12-21 | マジック リープ, インコーポレイテッド | 近接場オーディオレンダリング |
US11463795B2 (en) * | 2019-12-10 | 2022-10-04 | Meta Platforms Technologies, Llc | Wearable device with at-ear calibration |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014001478A1 (en) * | 2012-06-28 | 2014-01-03 | The Provost, Fellows, Foundation Scholars, & The Other Members Of Board, Of The College Of The Holy & Undiv. Trinity Of Queen Elizabeth Near Dublin | Method and apparatus for generating an audio output comprising spatial information |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6421446B1 (en) * | 1996-09-25 | 2002-07-16 | Qsound Labs, Inc. | Apparatus for creating 3D audio imaging over headphones using binaural synthesis including elevation |
AUPP271598A0 (en) | 1998-03-31 | 1998-04-23 | Lake Dsp Pty Limited | Headtracked processing for headtracked playback of audio signals |
GB0815362D0 (en) * | 2008-08-22 | 2008-10-01 | Queen Mary & Westfield College | Music collection navigation |
US8000485B2 (en) * | 2009-06-01 | 2011-08-16 | Dts, Inc. | Virtual audio processing for loudspeaker or headphone playback |
US8587631B2 (en) * | 2010-06-29 | 2013-11-19 | Alcatel Lucent | Facilitating communications using a portable communication device and directed sound output |
EP2645748A1 (en) * | 2012-03-28 | 2013-10-02 | Thomson Licensing | Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal |
US9913064B2 (en) | 2013-02-07 | 2018-03-06 | Qualcomm Incorporated | Mapping virtual speakers to physical speakers |
US9338552B2 (en) * | 2014-05-09 | 2016-05-10 | Trifield Ip, Llc | Coinciding low and high frequency localization panning |
CN106537941B (zh) | 2014-11-11 | 2019-08-16 | 谷歌有限责任公司 | 虚拟声音系统和方法 |
-
2015
- 2015-11-10 CN CN201580034887.9A patent/CN106537941B/zh active Active
- 2015-11-10 EP EP15797561.6A patent/EP3141002B1/en active Active
- 2015-11-10 US US14/937,647 patent/US10063989B2/en active Active
- 2015-11-10 WO PCT/US2015/059911 patent/WO2016077317A1/en active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014001478A1 (en) * | 2012-06-28 | 2014-01-03 | The Provost, Fellows, Foundation Scholars, & The Other Members Of Board, Of The College Of The Holy & Undiv. Trinity Of Queen Elizabeth Near Dublin | Method and apparatus for generating an audio output comprising spatial information |
Also Published As
Publication number | Publication date |
---|---|
EP3141002A1 (en) | 2017-03-15 |
CN106537941A (zh) | 2017-03-22 |
US20160134987A1 (en) | 2016-05-12 |
WO2016077317A1 (en) | 2016-05-19 |
EP3141002B1 (en) | 2020-01-08 |
US10063989B2 (en) | 2018-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106537941B (zh) | 虚拟声音系统和方法 | |
CN104919822B (zh) | 对不同重放扬声器组的空间音频信号的分段式调整 | |
US10448158B2 (en) | Sound reproduction system | |
US9883316B2 (en) | Method of generating multi-channel audio signal and apparatus for carrying out same | |
US20180220253A1 (en) | Differential headtracking apparatus | |
CN105264914B (zh) | 音频再生装置以及方法 | |
CN107251579A (zh) | 驱动扬声器阵列的装置和方法 | |
WO2006025531A1 (ja) | 音響処理装置 | |
CN103826194B (zh) | 一种多声道系统中声源方向和距离重建的方法与装置 | |
CN105637902A (zh) | 使用2d设置对高保真度立体声响复制音频声场表示进行解码以便音频回放的方法和装置 | |
CN111316671B (zh) | 信号处理设备和方法以及程序 | |
JP2009077379A (ja) | 立体音響再生装置、立体音響再生方法及びコンピュータプログラム | |
CN105144753A (zh) | 声音处理设备和方法以及程序 | |
JP2012049967A (ja) | 音響信号変換装置およびそのプログラム、ならびに、3次元音響パンニング装置およびそのプログラム | |
CN105122846A (zh) | 声音处理装置及声音处理系统 | |
KR102656969B1 (ko) | 불일치 오디오 비주얼 캡쳐 시스템 | |
CN103503485A (zh) | 用于产生具有强化的空间效应的声音信号的方法及设备 | |
CN108632709B (zh) | 一种沉浸式宽带3d声场重放方法 | |
US20150350788A1 (en) | Acoustic control apparatus | |
CN108476365A (zh) | 音频处理装置和方法以及程序 | |
CN109068262A (zh) | 一种基于扬声器的声像个性化重现方法及装置 | |
CN109923877A (zh) | 对立体声音频信号进行加权的装置和方法 | |
Young et al. | Loudspeaker Positions with Sufficient Natural Channel Separation for Binaural Reproduction | |
JP5983421B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
KR20140000948A (ko) | 패닝을 이용한 입체음향 구현 기법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: American California Applicant after: Google limited liability company Address before: American California Applicant before: Google Inc. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |