CN107396278A - 用于创作和渲染音频再现数据的非暂态介质和设备 - Google Patents

用于创作和渲染音频再现数据的非暂态介质和设备 Download PDF

Info

Publication number
CN107396278A
CN107396278A CN201710507398.1A CN201710507398A CN107396278A CN 107396278 A CN107396278 A CN 107396278A CN 201710507398 A CN201710507398 A CN 201710507398A CN 107396278 A CN107396278 A CN 107396278A
Authority
CN
China
Prior art keywords
audio object
virtual source
audio
data
yield value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710507398.1A
Other languages
English (en)
Other versions
CN107396278B (zh
Inventor
安东尼奥·马特奥斯舒莱
尼古拉斯·R·泰辛戈斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Dolby Laboratories Licensing Corp
Original Assignee
Dolby International AB
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB, Dolby Laboratories Licensing Corp filed Critical Dolby International AB
Publication of CN107396278A publication Critical patent/CN107396278A/zh
Application granted granted Critical
Publication of CN107396278B publication Critical patent/CN107396278B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

公开了用于创作和渲染音频再现数据的非暂态介质和设备。可以针对音频对象在其内可以移动的空间限定多个虚拟源位置。用于渲染音频数据的建立步骤可以包括:接收再现扬声器位置数据并且根据再现扬声器位置数据和每个虚拟源位置预先计算每个虚拟源的增益值。增益值可以在“运行时”期间被存储和使用,在“运行时”期间针对再现环境的扬声器渲染音频再现数据。在运行时期间,针对每个音频对象,可以计算来自由音频对象位置数据和音频对象大小数据限定的区域或空间内的虚拟源位置的贡献。可以至少部分地基于所计算出的贡献计算再现环境的每个输出声道的一组增益值。每个输出声道可以与再现环境的至少一个再现扬声器相对应。

Description

用于创作和渲染音频再现数据的非暂态介质和设备
本申请是申请日为2014年3月10日、发明名称为“针对任意扬声器 布局渲染具有表观大小的音频对象”以及申请号为201480009029.4的发 明专利申请的分案申请。
相关申请的交叉引用
本申请要求于2013年3月28日提交的西班牙专利申请 No.P201330461以及于2013年6月11日提交的美国临时专利申请 No.61/833,581的优先权,这两个专利申请中的每个专利申请在此通过引 用以其全部内容合并到本文中。
技术领域
本公开内容涉及音频再现数据的创作和渲染。具体地,本公开内容涉 及针对再现环境(如影院音响再现系统)来创作和渲染音频再现数据。
背景技术
由于在1927年引入了有声电影,所以出现了用于捕获电影声轨的艺 术意图并且在影院环境中对其进行重放的技术的稳定发展。在二十世纪三 十年代,唱片的同步声音由电影的变积式(variable area)声音代替,在 二十世纪四十年代使用剧场声学考虑和改进的扬声器设计连同早期引入 的多轨记录和可操纵的重放(使用控制音调来移动声音)一起对此进行了 进一步改进。在二十世纪五六十年代,电影的涂磁道(magnetic striping) 允许剧院中的多声道回放、将环绕声声道和高达五个屏幕声道引入高级剧 院中。
在二十世纪七十年代,杜比提出了在后期制作中和在胶片上降噪以及 对与3个屏幕声道和单声道环绕声道的混合(mixes)进行编码和分配的 经济有效的方法。在二十世纪八十年代,使用杜比频谱记录(SR)降噪 和验证程序(如THX)进一步提高了影院音响的品质。在二十世纪九十 年代期间,杜比使用提供分离的左屏幕声道、中心屏幕声道、右屏幕声道、 左环绕阵列和右环绕阵列以及用于低频效果的超低音扬声器声道的5.1声 道格式将数字声音引入电影。2010年提出的杜比环绕声7.1通过将现有的 左环绕声道和右环绕声道分成四个“区”增加了环绕声道的数量。
随着声道数量增加以及扬声器布局从平面二维(2D)阵列转变成包 括高度的三维(3D)阵列,创作和渲染声音的任务正变得越来越复杂。 期待改进的方法和装置。
发明内容
本公开内容中描述的主题的一些方面可以在用于渲染包括没有参照 任何特定再现环境创建的音频对象的音频再现数据的工具中来实现。如本 文中所使用的,术语“音频对象”可以指代音频信号和相关联的元数据的 流。元数据可以至少表示音频对象的位置和音频对象的表观大小。然而, 元数据还可以表示渲染约束数据、内容类型数据(例如,会话、效果等)、 增益数据、轨迹数据等。一些音频对象可以是静止的,而其他音频对象可 以具有随时间变化的元数据:这样的音频对象可以移动,可以改变大小和 /或可以具有随时间变化的其他属性。
当音频对象在再现环境中被回放或被监视时,可以至少根据位置元数 据和大小元数据来渲染音频对象。渲染步骤可以包括:计算一组输出声道 中的每个声道的一组音频对象增益值。每个输出声道可以与再现环境中的 一个或更多个再现扬声器相对应。
本文中描述的一些实现包括可以在渲染任何特定音频对象之前发生 的“建立”步骤。在本文中还可以被称为第一级或级1的建立步骤可以包 括:在音频对象可以在其内移动的空间中限定多个虚拟源位置。如本文中 所使用的,“虚拟源位置”是静止点源的位置。根据这样的实现,建立步 骤可以包括:接收再现扬声器位置数据并且根据再现扬声器位置数据和虚 拟源位置预先计算每个虚拟源的虚拟源增益值。如本文中所使用的,术语 “扬声器位置数据”可以包括表示再现环境的一些或所有扬声器的位置的 位置数据。位置数据可以被设置为再现扬声器位置的绝对坐标,例如笛卡 尔坐标、球面坐标等。可替代地或另外,位置数据可以被设置为相对于其 他再现环境位置(例如再现环境的声学“最佳听音位置(sweet spots)”) 的坐标(例如,如笛卡尔坐标或角坐标)。
在一些实现中,虚拟源增益值可以在“运行时”期间被存储和使用, 在该“运行时”期间,针对再现环境的扬声器渲染音频再现数据。在运行 时期间,针对每个音频对象,可以计算来自由音频对象位置数据和音频对 象大小数据限定的区域或空间内的虚拟源位置的贡献。计算来自虚拟源位 置的贡献的步骤可以包括:计算在建立步骤期间针对由音频对象的大小和 音频对象的位置限定的音频对象区域或空间内的虚拟源位置确定的多个 预先计算出的虚拟源增益值的加权平均值。可以至少部分地基于所计算出 的虚拟源贡献来计算再现环境的每个输出声道的一组音频对象增益值。每 个输出声道可以与再现环境的至少一个再现扬声器相对应。
根据本公开的一方面,公开了一种存储有软件的非暂态介质,所述软 件包括用于控制至少一个设备执行下面的操作的指令:接收包括一个或更 多个音频对象的音频再现数据,音频对象包括音频信号和相关联的元数 据,元数据至少包括音频对象位置数据和音频对象大小数据;针对一个或 更多个音频对象中的音频对象,计算由音频对象位置数据和音频对象大小 数据限定的音频对象区域或空间内的各个虚拟源位置处的虚拟源的虚拟源增益值;以及至少部分地基于所计算出的虚拟源增益值来计算多个输出 声道中的每个输出声道的一组音频对象增益值,其中,每个输出声道与再 现环境的至少一个再现扬声器相对应,并且虚拟源位置中的每个虚拟源位 置与再现环境内的各个静止位置相对应,其中,计算一组音频对象增益值 的处理包括:计算音频对象区域或空间内的虚拟源的虚拟源增益值的加权 平均值。
根据本公开的另一方面,还公开了一种设备,包括:接口系统;以及 适于执行以下操作的逻辑系统:从接口系统接收包括一个或更多个音频对 象的音频再现数据,音频对象包括音频信号和相关联的元数据,元数据至 少包括音频对象位置数据和音频对象大小数据;针对一个或更多个音频对 象中的音频对象,计算由音频对象位置数据和音频对象大小数据限定的音 频对象区域或空间内的各个虚拟源位置处的虚拟源的虚拟源增益值;以及至少部分地基于所计算出的虚拟源增益值来计算多个输出声道中的每个 输出声道的一组音频对象增益值,其中,每个输出声道与再现环境的至少 一个再现扬声器相对应,并且虚拟源位置中的每个虚拟源位置与再现环境 内的各个静止位置相对应,其中,计算一组音频对象增益值的处理包括: 计算音频对象区域或空间内的虚拟源的虚拟源增益值的加权平均值。
因此,本文中描述的一些方法包括:接收包括一个或更多个音频对象 的音频再现数据。音频对象可以包括音频信号和相关联的元数据。元数据 可以包括至少音频对象位置数据和音频对象大小数据。所述方法可以包 括:计算来自由音频对象位置数据和音频对象大小数据限定的音频对象区 域或空间内的虚拟源的贡献。所述方法可以包括:至少部分地基于所计算 出的贡献来计算多个输出声道中的每个输出声道的一组音频对象增益值。 每个输出声道可以与再现环境中的至少一个再现扬声器相对应。例如,再 现环境可以是影院音响系统环境。
计算来自虚拟源的贡献的步骤可以包括:计算所述音频对象区域或空 间内的虚拟源的虚拟源增益值的加权平均值。所述加权平均值的权重可以 取决于音频对象的位置、音频对象的大小和/或所述音频对象区域或空间 内的每个虚拟源位置。
所述方法还可以包括:接收包括再现扬声器位置数据的再现环境数 据。所述方法还可以包括:根据再现环境数据限定多个虚拟源位置,并且 针对每个虚拟源位置计算多个输出声道中的每个输出声道的虚拟源增益 值。在一些实现中,每个虚拟源位置可以与再现环境内的位置相对应。然 而,在一些实现中,至少一些虚拟源位置可以与再现环境外部的位置相对 应。
在一些实现中,虚拟源位置可以沿x轴、y轴和z轴被均匀地间隔开。 然而,在一些实现中,在所有方向上,间距可以不同。例如,虚拟源位置 可以具有沿x轴和y轴的第一均匀间距和沿z轴的第二均匀间距。计算多 个输出声道中的每个输出声道的一组音频对象增益值的步骤可以包括:独 立计算来自沿x轴、y轴和z轴的虚拟源的贡献。在替代实现中,虚拟源 位置可以被非均匀地间隔开。
在一些实现中,计算多个输出声道中的每个输出声道的音频对象增益 值的步骤可以包括:确定要在位置x0、y0、z0处渲染的各种大小的音频对 象的增益值(gl(xo,yo,zo;s))。例如,音频对象增益值(gl(xo,yo,zo;s))可以被表达 为:
其中,(xvs,yvs,zvs)表示虚拟源位置,gl(xvs,yvs,zvs)表示虚拟源位置xvs,yvs,zvs的声道l的增益值,并且w(xvs,yvs,zvs;xo,yo,zo;s)表示至少部分地基于音频 对象的位置(xo,yo,zo)、音频对象的大小和虚拟源位置(xvs,yvs,zvs)确定的 gl(xvs,yvs,zvs)的一个或更多个加权函数。
根据一些这样的实现,gl(xvs,yvs,zvs)=gl(xvs)gl(yvs)gl(zvs),其中,gl(xvs)、 gl(yvs)和gl(zvs)表示x、y和z的独立的增益函数。在一些这样的实现中, 加权函数可以因式分解为(factor as):
w(xvs,yvs,zvs;xo,yo,zo;s)=wx(xvs;xo;s)wy(yvs;yo;s)wz(zvs;zo;s),
其中,wx(xvs;xo;s),wy(yvs;yo;s)和wz(zvs;zo;s)表示xvs、yvs和zvs的独立的加 权函数。根据一些这样的实现,p可以是音频对象大小的函数。
一些这样的方法可以包括:将所计算出的虚拟源增益值存储在存储系 统中。计算来自音频对象区域或空间内的虚拟源的贡献的步骤可以包括: 从存储系统检索所计算出的、与音频对象位置和音频对象大小相对应的虚 拟源增益值,并且在所计算出的源增益值之间进行插值。在所计算出的虚 拟源增益值之间进行插值的步骤可以包括:确定音频对象位置附近的多个 邻近虚拟源位置;确定所计算出的、每个邻近虚拟源位置的虚拟源增益值; 确定音频对象位置和每个邻近虚拟源位置之间的多个距离;以及根据多个 距离在所计算出的虚拟源增益值之间进行插值。
在一些实现中,再现环境数据可以包括再现环境边界数据。所述方法 可以包括:确定音频对象区域或空间包括再现环境边界外部的外部区域或 空间,并且至少部分地基于所述外部区域或空间来施加衰落因子(fade-out factor)。一些方法可以包括:确定音频对象可以在距再现环境边界的阈值 距离内,并且不向在再现环境的相对边界上的再现扬声器提供扬声器馈送 信号。在一些实现中,音频对象区域或空间可以是矩形、矩形棱柱、圆形、 球形、椭圆形和/或椭圆体。
一些方法可以包括对至少一些音频再现数据进行去相关。例如,所述 方法可以包括:对用于具有超过阈值的音频对象大小的音频对象的音频再 现数据进行去相关。
本文中描述了替代方法。一些这样的方法包括:接收包括再现扬声器 位置数据和再现环境边界数据的再现环境数据,并且接收包括一个或更多 个音频对象和相关联的元数据的音频再现数据。元数据可以包括音频对象 位置数据和音频对象大小数据。所述方法可以包括:确定由音频对象位置 数据和音频对象大小数据限定的音频对象区域或空间包括再现环境边界 外部的外部区域或空间,并且至少部分地基于外部区域或空间来确定衰落 因子。所述方法可以包括:至少部分地基于相关联的元数据和衰落因子来 计算多个输出声道中的每个输出声道的一组增益值。每个输出声道可以与 再现环境中的至少一个再现扬声器相对应。衰落因子可以与外部区域成比 例。
所述方法还可以包括:确定音频对象可以在距再现环境边界的阈值距 离内,并且不向在再现环境的相对边界上的再现扬声器提供扬声器馈送信 号。
所述方法还可以包括:计算来自音频对象区域或空间内的虚拟源的贡 献。所述方法可以包括:根据再现环境数据限定多个虚拟源位置,以及针 对每个虚拟源位置计算多个输出声道中的每个输出声道的虚拟源增益。虚 拟源位置可以被均匀地间隔开或者可以被非均匀地间隔开,这取决于具体 实现。
一些实现可以在存储有软件的一个或更多个非暂态介质中体现。软件 可以包括用于对用于接收包括一个或更多个音频对象的音频再现数据的 一个或更多个装置进行控制的指令。音频对象可以包括音频信号和相关联 的元数据。元数据可以包括至少音频对象位置数据和音频对象大小数据。 软件可以包括用于下述操作的指令:针对一个或更多个音频对象中的音频 对象计算来自由音频对象位置数据和音频对象大小数据限定的区域或空间内的虚拟源的贡献,并且至少部分地基于所计算出的贡献来计算多个输 出声道中的每个输出声道的一组音频对象增益值。每个输出声道可以与再 现环境的至少一个再现扬声器相对应。
在一些实现中,计算来自虚拟源的贡献的步骤可以包括:计算来自音 频对象区域或空间内的虚拟源的虚拟源增益值的加权平均值。所述加权平 均值的权重可以取决于音频对象的位置、音频对象的大小和/或音频对象 区域或空间内的每个虚拟源位置。
软件可以包括用于接收包括再现扬声器位置数据的再现环境数据的 指令。软件可以包括用于下述操作的指令:根据再现环境数据限定多个虚 拟源位置,并且针对每个虚拟源位置计算多个输出声道中的每个输出声道 的虚拟源增益值。每个虚拟源位置可以与再现环境内的位置相对应。在一 些实现中,至少一些虚拟源位置可以与再现环境外部的位置相对应。
根据一些实现,虚拟源位置可以被均匀地间隔开。在一些实现中,虚 拟源位置可以具有沿x轴和y轴的第一均匀间距和沿z轴的第二均匀间 距。计算多个输出声道中的每个输出声道的一组音频对象增益值的步骤可 以包括:独立计算来自沿x轴、y轴和z轴的虚拟源的贡献。
本文中描述了各种装置和设备。一些这样的设备可以包括接口系统和 逻辑系统。接口系统可以包括网络接口。在一些实现中,设备可以包括存 储器装置。接口系统可以包括逻辑系统和存储器装置之间的接口。
逻辑系统可以适用于:从接口系统接收包括一个或更多个音频对象的 音频再现数据。音频对象可以包括音频信号和相关联的元数据。元数据可 以包括至少音频对象位置数据和音频对象大小数据。逻辑系统可以适用 于:针对一个或更多个音频对象中的音频对象来计算来自由音频对象位置 数据和音频对象大小数据限定的音频对象区域或空间内的虚拟源的贡献。 逻辑系统可以适用于:至少部分地基于所计算出的贡献来计算多个输出声道中的每个输出声道的一组音频对象增益值。每个输出声道可以与再现环 境中的至少一个再现扬声器相对应。
计算来自虚拟源的贡献的步骤可以包括:计算音频对象区域或空间内 的虚拟源的虚拟源增益值的加权平均值。用于加权平均值的权重可以取决 于音频对象的位置、音频对象的大小和音频对象区域或空间内的每个虚拟 源位置。逻辑系统可以适用于:从接口系统接收包括再现扬声器位置数据 的再现环境数据。
逻辑系统可以适用于:根据再现环境数据限定多个虚拟源位置,并且 针对每个虚拟源位置计算多个输出声道中的每个输出声道的虚拟源增益 值。每个虚拟源位置可以与再现环境内的位置相对应。然而,在一些实现 中,至少一些虚拟源位置可以与再现环境外部的位置相对应。虚拟源位置 可以被均匀地间隔开或可以被非均匀地间隔开,这取决于实现。在一些实 现中,虚拟源位置可以具有沿x轴和y轴的第一均匀间距和沿z轴的第二 均匀间距。计算多个输出声道中的每个输出声道的一组音频对象增益值的 步骤可以包括:独立计算来自沿x轴、y轴和z轴的虚拟源的贡献。
设备还可以包括用户接口。逻辑系统可以适用于:经由用户接口接收 用户输入(如音频对象大小数据)。在一些实现中,逻辑系统可以适用于 对输入的音频对象大小数据进行缩放。
在附图和下面的描述中阐述了在本说明书中描述的主题的一个或更 多个实现的细节。根据描述、附图和权利要求,其他特征、方面和优点将 变得明显。注意,下面的图的相对尺寸可能并未按比例绘出。
附图说明
图1示出了具有杜比环绕声5.1配置的再现环境的示例;
图2示出了具有杜比环绕声7.1配置的再现环境的示例;
图3示出了具有Hamasaki 22.2环绕声配置的再现环境的示例;
图4A示出了描绘在虚拟再现环境中的不同高度处的扬声器区的图形 用户接口(GUI)的示例;
图4B示出了另一再现环境的示例;
图5A是提供音频处理方法的概述的流程图;
图5B是提供建立处理的示例的流程图;
图5C是提供根据预先计算的虚拟源位置的增益值计算接收的音频对 象的增益值的运行时处理的示例的流程图;
图6A示出了与再现环境有关的虚拟源位置的示例;
图6B示出了与再现环境有关的虚拟源位置的替代示例;
图6C至图6F示出了将近场声像调节(panning)技术和远场声像调 节技术应用于不同位置处的音频对象的示例;
图6G示出了在边长等于1的正方形的每个角落处具有一个扬声器的 再现环境的示例;
图7示出了来自由音频对象位置数据和音频对象大小数据限定的区 域内的虚拟源的贡献的示例;
图8A和图8B示出了再现环境内的两个位置处的音频对象;
图9是概述了至少部分地基于音频对象的多大区域或空间延伸到再 现环境的边界外部来确定衰落因子的方法的流程图;
图10是提供创作装置和/或渲染装置的部件的示例的框图;
图11A是表示可以用于音频内容创建的一些部件的框图;以及
图11B是表示可以用于再现环境中的音频回放的一些部件的框图。
各个附图中的相同附图标记和名称表示相同的要素。
具体实施方式
下面的描述涉及出于描述本公开内容的一些新颖方面的目的的一些 实现以及可以实现这些新颖方面的背景的示例。然而,可以按照各种不同 的方式来应用本文中的教示。例如,当根据具体的再现环境描述了各种实 现时,本文中的教示能够广泛地适用于其他已知的再现环境以及在以后可 能引入的再现环境。此外,可以在各种创作工具和/或渲染工具中实现所 描述的实现,各种创作和/或渲染工具可以以多种硬件、软件、固件等来实现。因此,本公开内容的教示并不意在限于附图中示出的实现和/或本 文中描述的实现,而是具有广泛的适用性。
图1示出了具有杜比环绕声5.1配置的再现环境的示例。在二十世纪 九十年代开发了杜比环绕声5.1,但该配置仍然广泛部署在影院音响系统 环境中。投影仪105可以被配置成:将(例如,用于电影的)视频图像投 影在屏幕150上。音频再现数据可以与视频图像同步并且由声音处理器 110进行处理。功率放大器115可以将扬声器馈送信号提供给再现环境100 的扬声器。
杜比环绕声5.1配置包括左环绕阵列120和右环绕阵列125,这两个 阵列中的每个阵列包括由单个声道成组驱动(gang-driven)的一组扬声 器。杜比环绕声5.1配置还包括左屏幕声道130、中心屏幕声道135和右 屏幕声道140的独立声道。为了低频效应(LFE)设置了用于超低音扬声 器145的独立声道。
在2010年,杜比通过引入杜比环绕声7.1提供了对数码影院音响 (digitalcinema sound)的增强。图2示出了具有杜比环绕声7.1配置的 再现环境的示例。数字投影仪205可以被配置成接收数字视频数据并且将 视频图像投影到屏幕150上。视频再现数据可以由声音处理器210进行处 理。功率放大器215可以向再现环境200的扬声器提供扬声器馈送信号。
杜比环绕声7.1配置包括左侧环绕阵列220和右侧环绕阵列225,这 两个环绕阵列中的每个阵列可以由单个声道来驱动。与杜比环绕声5.1一 样,杜比环绕声7.1配置包括左屏幕声道230、中心屏幕声道235、右屏 幕声道240和超低音扬声器245的独立声道。然而,杜比环绕声7.1通过 将杜比环绕声5.1的左环绕声道和右环绕声道分成下述四个区来增加环绕 声道的数量:除了左侧环绕阵列220和右侧环绕阵列225以外,还包括用 于左后环绕扬声器224的独立声道和用于右后环绕扬声器226的独立声 道。增加再现环境200内环绕区的数量可以显著提高声音的定位。
为了创建更身临其境的环境,一些再现环境可以被配置有由数量增加 的声道驱动的数量增加的扬声器。此外,一些再现环境可以包括在各个高 度处部署的扬声器,一些高度可以位于再现环境的座位区上方。
图3示出了具有Hamasaki 22.2环绕声配置的再现环境的示例。日本 的NHK科技研究实验室开发了Hamasaki 22.2作为超高清电视的环绕声 部件。Hamasaki 22.2提供24个扬声器声道,这24个扬声器声道可以用 于驱动在三个层中布置的扬声器。再现环境300的上扬声器层310可以由 9个声道来驱动。中间扬声器层320可以由10个声道来驱动。低扬声器 层330可以由5个声道来驱动,这5个声道中的2个声道用于超低音扬声 器345a和超低音扬声器345b。
因此,现代的趋势是不仅包括更多扬声器和更多声道,而且还包括不 同高度处的扬声器。随着声道数量增加和扬声器布局从2D阵列转变成3D 阵列,定位和渲染声音的任务变得越来越困难。因此,本受让人(assignee) 已经开发了各种工具和相关的用户接口,所述各种工具和相关的用户接口 增加了功能性和/或降低了3D音频声音系统的创作复杂度。参照于2012 年4月20日提交的题为“System and Tools for Enhanced 3D AudioAuthoring and Rendering”(“创作和渲染应用”)的美国临时专利申请No. 61/636,102(在此通过引用将其全部内容合并到本文中)的图5A至图19D 详细描述了一些这样的工具。
图4A示出了描绘虚拟再现环境中的不同高度处的扬声器区的图形用 户接口(GUI)的示例。可以根据来自逻辑系统的指令、根据从用户输入 装置接收的信号等将GUI400例如显示在显示装置上。下面参照图10描 述一些这样的装置。
如本文中参考虚拟再现环境(如虚拟再现环境404)所使用的,术语 “扬声器区”一般指代可以具有或不具有与实际再现环境的再现扬声器一 对一对应关系的逻辑结构。例如,“扬声器区位置”可以与或不与电影再 现环境的特定再现扬声器位置相对应。替代地,术语“扬声器区位置”一 般可以指代虚拟再现环境的区域。在一些实现中,虚拟再现环境的扬声器 区可以例如通过使用虚拟技术(如Dolby HeadphoneTM(有时称为MobileSurroundTM))与虚拟扬声器相对应,该虚拟技术使用一组双声道立体声 耳机来实时创建虚拟环绕声环境。在GUI 400中,在第一高度处存在七 个扬声器区402a并且在第二高度处存在两个扬声器区402b,从而在虚拟 再现环境404中形成总共九个扬声器区。在该示例中,扬声器区1至3 位于虚拟再现环境404的前方区域405中。前方区域405可以与例如屏幕 150所处的电影再现环境的区域相对应,与电视机屏幕所处的家庭的区域 相对应等。
在此,扬声器区4一般与左区域410中的扬声器相对应,并且扬声器 区5与虚拟再现环境404的右区域415中的扬声器相对应。扬声器区6与 左后区域412相对应,并且扬声器区7与虚拟再现环境404的右后区域 414相对应。扬声器区8与上区域402a中的扬声器相对应,扬声器区9 与上区域420b中的扬声器相对应,上区域420b可以是虚拟天花板区域。 因此,如创作和渲染应用中更详细描述的,图4A中所示的扬声器区1至 9的位置可以与或不与实际再现环境的再现扬声器的位置相对应。此外, 其他实现可以包括较多或较少扬声器区和/或高度。
在创作和渲染应用中描述的各种实现中,用户接口(如GUI 400)可 以用作创作工具和/或渲染工具的一部分。在一些实现中,创作工具和/或 渲染工具可以通过存储在一个或更多个非暂态介质上的软件来实现。创作 工具和/或渲染工具可以(至少部分地)由硬件、固件等如下面参照图10 描述的逻辑系统和其他装置来实现。在一些创作实现中,相关联的创作工 具可以用于创建相关联的音频数据的元数据。元数据可以例如包括表示三 维空间中的音频对象的位置和/或轨迹的数据、扬声器区约束数据等。可 以相对于虚拟再现环境404的扬声器区402而不是相对于实际再现环境的 特定扬声器布局来创建元数据。渲染工具可以接收音频数据和相关联的元 数据,并且可以针对再现环境计算音频增益和扬声器馈送信号。可以根据 幅值相移处理(amplitude panning process)来计算这样的音频增益和扬 声器馈送信号,该幅值相移处理可以创建声音来自再现环境中的位置P 的感知。例如,可以根据下面的等式将扬声器馈送信号提供给再现环境的 再现扬声器1至再现扬声器N:
xi(t)=gix(t),i=1,...N (等式1)
在等式1中,xi(t)表示要被施加至扬声器i的扬声器馈送信号,gi表 示相应声道的增益系数(gain factor),x(t)表示音频信号,t表示时间。可 以例如根据以下中描述的幅值相移方法来确定增益系数:V.Pulkki, “Compensating Displacement of Amplitude-Panned Virtual Sources”(关 于虚拟、合成和娱乐音频的音频工程师协会(AES)国际会议),第二章, 第3页至第4页,其在此通过引用被合并到本文中。在一些实现中,增益 可能是频率相关的。在一些实现中,通过用x(t-△t)代替x(t)可以引入时间 延迟。
在一些渲染实现中,参考扬声器区402创建的音频再现数据可以被映 射至各种再现环境的扬声器位置,各种再现环境可以处于杜比环绕声5.1 配置、杜比环绕声7.1配置、Hamasaki 22.2配置或其他配置中。例如, 参照图2,渲染工具可以将扬声器区4和扬声器区5的音频再现数据映射 至具有杜比环绕声7.1配置的再现环境的左侧环绕阵列220和右侧环绕阵 列225。可以将扬声器区1、2和3的音频再现数据分别映射至左屏幕声 道230、右屏幕声道240和中心屏幕声道235。可以将扬声器区6和扬声 器区7的音频再现数据映射至左后环绕扬声器224和右后环绕扬声器226。
图4B示出了另一再现环境的示例。在一些实现中,渲染工具可以将 扬声器区1、2和3的音频再现数据映射至再现环境450的相应屏幕扬声 器455。渲染工具可以将扬声器区4和5的音频再现数据映射至左侧环绕 阵列460和右侧环绕阵列465,并且可以将用于扬声器区8和9的音频再 现数据映射至左头顶扬声器470a和右头顶扬声器470b。可以将用于扬声 器区6和7的音频再现数据映射至左后环绕扬声器480a和右后环绕扬声 器480b。
在一些创作实现中,创作工具可以用于创建音频对象的元数据。如上 所述,术语“音频对象”可以指代音频数据信号和相关联的元数据的流。 元数据可以表示音频对象的3D位置、音频对象的表观大小、渲染约束以 及内容类型(例如,对话、效果)等。取决于实现,元数据可以包括其他 类型的数据,例如增益数据、轨迹数据等。一些音频对象可以是静止的, 而另一些音频对象可以运动。可以根据相关联的元数据来创作或渲染音频 对象细节,该相关联的元数据在其他事物中可以表示音频对象在给定时间 点在三维空间中的位置。当在再现环境中监视或回放音频对象时,可以根 据与再现环境的再现扬声器布局有关的音频对象的位置元数据和大小元 数据来渲染音频对象。
图5A是提供音频处理方法的概述的流程图。下面参照图5B以及下 列等等来描述更详细的示例。这些方法可以包括比本文中所示和描述的块 更多或更少的块,而并不一定按照本文中所示的次序来执行。这些方法可 以至少部分地由诸如如图10至图11B中所示和下面描述的设备等设备来 执行。在一些实现中,这些方法可以至少部分地通过存储在一个或更多个 非暂态介质中的软件来实现。软件可以包括用于控制一个或更多个装置来 执行本文中描述的方法的指令。
在图5A所示的示例中,方法500开始于确定与特定再现环境有关的 虚拟源位置的虚拟源增益值的建立步骤(块505)。图6A示出了与再现环 境有关的虚拟源位置的示例。例如,块505可以包括:确定与再现环境 600a的再现扬声器位置625有关的虚拟源位置605的虚拟源增益值。虚 拟源位置605和再现扬声器位置625仅仅是示例。在图6A所示的示例中,虚拟源位置605沿x轴、y轴和z轴被均匀地间隔开。然而,在替代实现 中,虚拟源位置605可以被不同地间隔开。例如,在一些实现中,虚拟源 位置605可以具有沿x轴和y轴的第一均匀间距和沿z轴的第二均匀间距。 在其他实现中,虚拟源位置605可以被非均匀地间隔开。
在图6A所示的示例中,再现环境600a和虚拟源空间602a是共同延 伸的,以使得每个虚拟源位置605与再现环境600a内的位置相对应。然 而,在替代实现中,再现环境600和虚拟源空间602可以不是共同延伸的。 例如,至少一些虚拟源位置605可以与再现环境600外部的位置相对应。
图6B示出了与再现环境有关的虚拟源位置的替代示例。在该示例中, 虚拟源空间602b延伸到再现环境600b外部。
返回至图5A,在该示例中,在渲染任意特定音频对象之前发生块505 的建立步骤。在一些实现中,可以将在块505中确定的虚拟源增益值存储 在存储系统中。在根据至少一些虚拟源增益值来计算接收的音频对象的音 频对象增益值的“运行时”步骤期间(块510)可以使用存储的虚拟源增 益值。例如,块510可以包括:至少部分地基于与音频对象区域或空间内 的虚拟源位置相对应的虚拟源增益值来计算音频对象增益值。
在一些实现中,方法500可以包括可选块515(其涉及对音频数据进 行去相关)。块515可以是运行时步骤的一部分。在一些这样的实现中, 块515可以包括频域中的卷积。例如,块515可以包括:对每个扬声器馈 送信号施加有限脉冲响应(“FIR”)滤波器。
在一些实现中,可以根据音频对象大小和/或创作者的艺术意图执行 或不执行块515的步骤。根据一些这样的实现,通过表示(例如,通过相 关联的元数据中包括的去相关标记)当音频对象大小大于或等于大小阈值 时应当打开去相关而如果音频对象大小在大小阈值以下则应当关闭去相 关,创作工具可以将音频对象大小与去相关相联系。在一些实现中,可以 根据关于大小阈值和/或其他输入值的用户输入来控制(例如,增加、减 少或禁用)去相关。
图5B是提供建立步骤的示例的流程图。因此,图5B中所示的所有 块是可以在图5A的块505中执行的步骤的示例。在此,建立步骤开始于 接收到再现环境数据(块520)。再现环境数据可以包括再现扬声器位置 数据。再现环境数据还可以包括表示再现环境的边界(如墙壁、天花板等) 的数据。如果再现环境是电影院,则再现环境数据还可以包括电影屏幕位 置的表示。
再现环境数据还可以包括表示输出声道与再现环境的再现扬声器的 相关性的数据。例如,再现环境可以具有杜比环绕声7.1配置,例如如图 2所示和上面描述的配置。因此,再现环境数据还可以包括表示Lss声道 与左侧环绕扬声器220之间的相关性、Lrs声道与左后环绕扬声器224之 间的相关性等的数据。
在该示例中,块525包括根据再现环境数据限定虚拟源位置605。虚 拟源位置605可以被限定在虚拟源空间内。在一些实现中,虚拟源空间可 以与音频对象可以在其中移动的空间相对应。如图6A和图6B所示,在 一些实现中,虚拟源空间602可以与再现环境600的空间共同延伸,而在 其他实现中,至少一些虚拟源位置605可以与再现环境600外部的位置相 对应。
此外,取决于具体实现,虚拟源位置605可以在虚拟源空间602内均 匀间隔或不均匀间隔。在一些实现中,虚拟源位置605可以沿所有方向均 匀间隔。例如,虚拟源位置605可以形成Nx×Ny×Nz虚拟源位置605的直 角坐标网。在一些实现中,N的值可以在5至100的范围内。N的值可以 至少部分地取决于再现环境中的再现扬声器的数量:可以期望在每个再现 扬声器位置之间包括两个或更多个虚拟源位置605。
在其他实现中,虚拟源位置605可以具有沿x轴和y轴的第一均匀间 距和沿z轴的第二均匀间距。虚拟源位置605可以形成Nx×Ny×Mz虚拟源 位置605的直角坐标网。例如,在一些实现中,与沿x轴或y轴相比,沿 z轴可以存在较少的虚拟源位置605。在一些这样的实现中,N的值可以 在10至100的范围内,而M的值可以在5至10的范围内。
在该示例中,块530包括计算每个虚拟源位置605的虚拟源增益值。 在一些实现中,块530包括:针对每个虚拟源位置605计算再现环境的多 个输出声道中的每个声道的虚拟源增益值。在一些实现中,块530可以包 括:应用基于矢量的幅值相移(“VBAP”)算法、成对声像调节算法或类 似的算法来计算位于每个虚拟源位置605处的点源的增益值。在其他实现 中,块530可以包括:应用可分离算法来计算位于每个虚拟源位置605 处的点源的增益值。如本文中所使用的,“可分离”算法是下述算法:特 定扬声器的增益可以被表达为可以针对虚拟源位置的每个坐标分别计算 的两个或更多个因子的乘积。示例包括在各种现有混合控制台声像调节器 (包括但不限于Pro ToolsTM软件)和由AMS Neve提供的数字电影控制 台中实现的声像调节器中实现的算法。下面提供一些二维示例。
图6C至图6F示出了将近场声像调节技术和远场声像调节技术应用 于不同位置处的音频对象的示例。首先参照图6C,音频对象基本上在虚 拟再现环境400a的外部。因此,在该实例中将应用一个或更多个远场声 像调节方法。在一些实现中,远场声像调节方法可以基于本领域普通技术 人员已知的基于矢量的幅值相移(VBAP)等式。例如,远场声像调节方法可以基于以下中描述的VBAP等式:V.Pulkki,“Compensating Displacement ofAmplitude-Panned Virtual Sources”(关于虚拟、合成和 娱乐音频的AES国际会议),第2.3章第4页,其在此通过引用被合并到 本文中。在替代实现中,其他方法(例如涉及相应的声学平面或球面波的 合成的方法)可以用于对远场音频对象和近场音频对象进行声像调节。在 以下中描述了相关方法:D.de Vries,“Wave Field Synthesis”(AES专著, 1999年),其在此通过引用被合并到本文中。
现在参照图6D,音频对象610在虚拟再现环境400a内部。因此,在 该实例中将应用一个或更多个近场声像调节方法。一些这样的近场声像调 节方法将使用包围虚拟再现环境400a中的音频对象610的很多扬声器区。
图6G示出了在边长等于1的正方形的每个角落处具有一个扬声器的 再现环境的示例。在该示例中,x-y轴的原点(0,0)与左(L)屏幕扬 声器130重合。因此,右(R)屏幕扬声器140的坐标为(1,0),左环 绕(Ls)扬声器120的坐标为(0,1),右环绕(Rs)扬声器125的坐标 为(1,1)。音频对象位置615(x,y)是至左扬声器的右边的x单位以 及距屏幕150的y单位。在该示例中,四个扬声器中的每个扬声器接收与 每个扬声器沿x轴和y轴的距离成比例的因子cos/sin。根据一些实现,可 以如下计算增益:
如果1=L,Ls,则G_l(x)=cos(pi/2*x)
如果1=R,Rs,则G_l(x)=sin(pi/2*x)
如果1=L,R,则G_l(y)=cos(pi/2*y)
如果l=Ls,Rs,则G_l(y)=sin(pi/2*y)
总增益是乘积:G_l(x,y)=G_l(x)G_l(y)。通常,这些函数取决于所有扬 声器的所有坐标。然而,G_1(x)不取决于源的y-位置,并且G_1(y)不取 决于其x-位置。为了说明简单计算,假设音频对象位置615为(0,0), 则左扬声器的位置为G_L(x)=cos(0)=1,G_L(y)=cos(0)=1。总增益为 乘积:G_L(x,y)=G_L(x)G_L(y)=1。类似的计算产生G_Ls=G_Rs=G_R=0。
当音频对象进入或离开虚拟再现环境400a时,可以期望在不同的声 像调节模式之间进行混合。例如,当音频对象610从图6C中所示的音频 对象位置615移动至图6D中所示的音频对象位置615时或者当音频对象 610从图6D中所示的音频对象位置615移动至图6C中所示的音频对象 位置615时,可以应用根据近场声像调节方法和远场声像调节方法计算出 的增益的混合。在一些实现中,成对声像法则(pair-wise panning law) (例如,能量保持正弦或幂定律(energy-preserving sine or power law)) 可以用于在根据近场声像调节方法和远场声像调节方法计算的增益之间 进行混合。在替代实现中,成对声像法则可以是幅值保持而不是能量保持, 以使得和等于1而不是平方和等于1。还可以对由此得到的经处理的信号 进行混合,以例如使用两种声像调节方法独立地处理音频信号并且使两个 由此得到的音频信号交叉衰落。
现在返回至图5B,无论在块530中使用的算法如何,都可以将由此 得到的增益值存储在存储系统中(块535),以在运行时操作期间使用。
图5C是提供根据虚拟源位置的预先计算的增益值计算接收的音频对 象的增益值的运行时步骤的示例的流程图。图5C中所示的所有块是可以 在图5A的块510中执行的步骤的示例。
在该示例中,运行时步骤开始于接收到包括一个或更多个音频对象的 音频再现数据(块540)。在该示例中,音频对象包括音频信号和相关联 的元数据,元数据包括至少音频对象位置数据和音频对象大小数据。参考 图6A,例如,音频对象610至少部分地由音频对象位置615和音频对象 空间620a来限定。在该示例中,接收的音频对象大小数据表示音频对象 空间620a与矩形棱柱的空间相对应。然而,在该示例中,如图6B所示, 接收的音频对象大小数据表示音频对象空间620b与球形的空间相对应。 这些大小和形状仅仅是示例;在替代实现中,音频对象可以具有多个其他 大小和/或形状。在一些替代示例中,音频对象的区域或空间可以是矩形、 圆形、椭圆形、椭圆体或球扇形(spherical sector)。
在该实现中,块545包括:计算来自由音频对象位置数据和音频对象 大小数据限定的区域或空间内的虚拟源的贡献。在图6A和图6B所示的 示例中,块545可以包括:计算来自音频对象空间620a或音频对象空间 620b内的虚拟源位置605处的虚拟源的贡献。如果音频对象的元数据随 时间发生变化,则可以根据新的元数据值再次执行块545。例如,如果音频对象大小和/或音频对象位置发生变化,则不同的虚拟源位置605可以 落入音频对象空间620内,和/或在先前计算中使用的虚拟源位置605可 以距音频对象位置615的距离不同。在块545中,将根据新的音频对象大 小和/或位置来计算相应的虚拟源贡献。
在一些示例中,块545可以包括:从存储系统接收所计算出的、与音 频对象位置和音频对象大小相对应的虚拟源位置的虚拟源增益值,并且在 计算出的虚拟源增益值之间进行插值。在计算出的虚拟源增益值之间进行 插值的步骤可以包括:确定音频对象位置附近的多个邻近虚拟源位置;确 定每个邻近虚拟源位置的所计算出的虚拟源增益值;确定音频对象位置和 每个邻近虚拟源位置之间的多个距离;并且根据所述多个距离在计算的虚拟源增益值之间进行插值。
计算来自虚拟源的贡献的步骤可以包括:计算由音频对象的大小限定 的区域或空间内的虚拟源位置的所计算出的虚拟源增益值的加权平均值。 加权平均值的权重可以取决于例如音频对象的位置、音频对象的大小和所 述区域或空间内的每个虚拟源位置。
图7示出了来自由音频对象位置数据和音频对象大小数据限定的区 域内的虚拟源的贡献的示例。图7描述了垂直于z轴获得的音频环境200a 的横截面。因此,从沿着z轴的、观察者向下看向音频环境200a的角度 绘制了图7。在该示例中,音频环境200a是具有杜比环绕声7.1配置(例 如如图2中所示和上面描述的配置)的影院音响系统环境。因此,再现环 境200a包括左侧环绕扬声器220、左后环绕扬声器224、右侧环绕扬声器 225、右后环绕扬声器226、左屏幕声道230、中心屏幕声道235、右屏幕 声道240和超低音扬声器245。
音频对象610具有由音频对象空间620b表示的大小,在图7中示出 了音频对象空间620b的矩形横截面区域。假设在图7中所示的时间的时 刻下的音频对象位置615,12个虚拟源位置605包括在由x-y平面中的音 频对象空间620b包围的区域中。取决于音频对象空间620b沿z方向的延 伸和虚拟源位置605沿z轴的间距,在音频对象空间620b内可以包括或不包括另外的虚拟源位置605s。
图7示出了来自由音频对象610的大小限定的区域或空间内的虚拟源 位置605的贡献。在该示例中,用来描述每个虚拟源位置605的圆形的直 径与来自相应的虚拟源位置605的贡献相对应。最靠近音频对象位置615 的虚拟源位置605a被示为最大,表示来自相应的虚拟源的贡献最大。第 二最大贡献来自次靠近音频对象位置615的虚拟源位置605b处的虚拟源。 虚拟源位置605c做出了较小贡献,该虚拟源位置605c距音频对象位置 615较远但仍然在音频对象空间620b内。在音频对象空间620b外部的虚 拟源位置605d被示为最小,这表示在该示例中相应的虚拟源未做出贡献。
返回图5C,在该示例中,块550包括:至少部分地基于计算出的贡 献来计算多个输出声道中的每个输出声道的一组音频对象增益值。每个输 出声道可以与再现环境的至少一个再现扬声器相对应。块550可以包括对 由此得到的音频对象增益值进行归一化。例如,对于图7中所示的实现, 每个输出声道可以对应于单个扬声器或一组扬声器。
计算多个输出声道中的每个输出声道的音频对象增益值的步骤可以 包括:确定要在位置x0、y0、z0处渲染的各种大小的音频对象的增益值 (gl size(xo,yo,zo;s))。在本文中,有时可以将该音频对象增益值称为“音频对 象大小贡献”。根据一些实现,音频对象增益值(gl size(xo,yo,zo;s))可以表达为:
在等式2中,表示虚拟源位置,表示虚拟源 位置xvs,yvs,zvs的声道l的增益值,w(xvs,yvs,zvs;xo,yo,zo;s)表示至少部分地 基于音频对象的位置(xo,yo,zo)、音频对象的大小和虚拟源位置确定的的权重。
在一些示例中,分量p可以具有1与10之间的值。在一些实现中,p 可以是音频对象大小s的函数。例如,如果s相对较大,则在一些实现中 p可以相对较小。根据一些实现,可以如下来确定p:
如果s≤0.5,则p=6
如果s>0.5,则p=6+(-4)(s-0.5)/(smax-0.5)
其中,smax与内部放大的大小sinternal的最大值(下面描述)相对应,并且 其中,音频对象大小s=1可以与具有大小(例如,直径)等于再现环境的 边界之一的长度(例如,等于再现环境的一面墙壁的长度)的音频对象相 对应。
如果虚拟源位置沿着轴均匀分布并且如果例如如上所述加权函数和 增益函数是可分离的,则部分地根据用于计算虚拟源增益值的算法,可以 简化等式2。如果满足这些条件,则可以被表达为 glx(xvs)gly(yvs)glz(zvs),其中glx(xvs)、glx(yvs)和glz(zvs)表示虚拟源位置的x坐标、 y坐标和z坐标的独立的增益函数。
类似地,w(xvs,yvs,zvs;xo,yo,zo;s)可以分解成因子为 wx(xvs;xo;s)wy(yvs;yo;s)wz(zvs;zo;s),其中,wx(xvs;xo;s)、wy(yvs;yo;s)和 wz(zvs;zo;s)表示虚拟源位置的x坐标、y坐标和z坐标的独立的加权函数。 在图7中示出了一个这样的示例。在该示例中,可以独立于被表达为 wy(yvs;yo;s)的加权函数720来计算被表达为wx(xvs;xo;s)的加权函数710。 在一些实现中,加权函数710和加权函数720可以是高斯函数,而加权函 数wz(zvs;zo;s)可以是余弦函数和高斯函数的乘积。
如果w(xvs,yvs,zvs;xo,yo,zo;s)可以分解成因子 wx(xvs;xo;s)wy(yvs;yo;s)wz(zvs;zo;s),则等式2简化成:
[fl x(xo;s)fl y(yo;s)fl z(zo;s)]1/p,其中
以及
函数f可以包括关于虚拟源的所有需要的信息。如果沿每个轴对可能 的对象位置进行离散化,则可以将每个函数f表示为矩阵。在块505的建 立步骤期间(参见图5A)可以预先计算每个函数f并且将每个函数f例 如作为矩阵或作为查找表存储在存储系统中。在运行时(块510),可以 从存储系统检索查找表或矩阵。运行时步骤可以包括:考虑到音频对象位 置和音频对象大小,在这些矩阵的最靠近的相应值之间进行插值。在一些 实现中,插值可以是线性的。
在一些实现中,音频对象大小贡献gl size可以与音频对象位置的“音频 对象近场增益(audio object neargain)”结果结合。如本文中所使用的, “音频对象近场增益”是基于音频对象位置615所计算出的增益。可以使 用用于计算每个虚拟源增益值的同一算法来执行增益计算。根据一些这样 的实现,可以例如作为音频对象大小的函数在音频对象大小贡献和音频对 象近场增益结果之间执行交叉衰落计算。这样的实现可以提供音频对象的 平滑声像调节和平滑增长,并且可以允许最小音频对象大小和最大音频对 象大小之间的平滑转变。在一个这样的实现中,
其中
s<sxfade,α=cos((s/sxfade)(π/2)),β=sin((s/sxfade)(π/2)) s≥sxfade,α=0,β=1,
并且其中,表示先前计算的gl size的归一化版本。在一些这样的实现中, sxfade=0.2。然而,在替代实现中,sxfade可以具有其他值。
根据一些实现,在其可能值的范围的较大部分中可以增大音频对象大 小值。在一些创作实现中,例如,用户可以面临音频对象大小值suser∈[0,1], 该音频对象大小值suser∈[0,1]被映射成由算法用于较大范围例如范围[0, smax]的实际大小,其中,smax>1。该映射可以确保:当用户将大小设置成 最大时,增益变得真正独立于对象的位置。根据一些这样的实现,可以根 据连接多对点(suser,sinternal)的分段线性函数(piece-wise linearfunction) 来进行这样的映射,其中,suser表示用户选择的音频对象大小,sinternal表 示由算法确定的相应的音频对象大小。根据一些这样的实现,可以根据连 接多对点(0,0)、(0.2,0.3)、(0.5,0.9)、(0.75,1.5)和(1,smax)的 分段线性函数来进行映射。在一个这样的实现中,smax=2.8。
图8A和图8B示出了再现环境内的两个位置中的音频对象。在这些 示例中,音频对象空间620b是半径小于再现环境200a的长度或宽度的二 分之一的球形。根据杜比7.1来配置再现环境200a。在图8A中描绘的时 间的时刻下,音频对象位置615相对更靠近再现环境200a的中心。在图 8B中描绘的时间下,音频对象位置615已经移动靠近再现环境200a的边界。在该示例中,边界是电影院的左墙壁并且与左侧环绕扬声器220的位 置重合。
出于美学原因,期望可以对接近再现环境的边界的音频对象的音频对 象增益计算进行修改。在图8A和图8B中,例如,当音频对象位置615 在距再现环境的左边界805的阈值距离内时,无扬声器馈送信号被提供至 再现环境的相对边界上的扬声器(在此,右侧环绕扬声器225)。在图8B 所示的示例中,如果音频对象位置615也大于距屏幕的阈值距离,则当音 频对象位置615在距再现环境的左边界805的阈值距离(其可以是不同的 阈值距离)内时,无扬声器馈送信号被提供至与左屏幕声道230、中心屏 幕声道235、右屏幕声道240相对应的扬声器或超低音扬声器245。
在图8B所示的示例中,音频对象空间620b包括左边界805外部的 区域或空间。根据一些实现,增益计算的衰落因子可以至少部分地基于多 少左边界805处在音频对象空间620b内和/或音频对象的多少区域或空间 延伸到这样的边界的外部。
图9是略述至少部分地基于音频对象的多少区域或空间延伸到再现 环境的边界的外部来确定衰落因子的方法的流程图。在块905中,接收再 现环境数据。在该示例中,再现环境数据包括再现扬声器位置数据和再现 环境边界数据。块910包括接收包括一个或更多个音频对象和相关联的元 数据的音频再现数据。在该示例中,元数据包括至少音频对象位置数据和 音频对象大小数据。
在该实现中,块915包括:确定由音频对象位置数据和音频对象大小 数据限定的音频对象区域或空间包括再现环境边界外部的外部区域或空 间。块915还可以包括:确定多大比例的音频对象区域或空间处在再现环 境边界的外部。
在块920中,确定衰落因子。在该示例中,衰落因子可以至少部分地 基于外部的区域。例如,衰落因子可以与外部区域成比例。
在块925中,可以至少部分地基于相关联的元数据(在该示例中,音 频对象位置数据和音频对象大小数据)和衰落因子来计算多个输出声道中 的每个输出声道的一组音频对象增益值。每个输出声道可以与再现环境的 至少一个再现扬声器相对应。
在一些实现中,音频对象增益计算可以包括:计算来自音频对象区域 或空间内的虚拟源的贡献。虚拟源可以与可以参考再现环境数据限定的多 个虚拟源位置相对应。虚拟源位置可以被均匀地间隔开或被不均匀地间隔 开。对于每个虚拟源位置,可以计算多个输出声道中的每个输出声道的虚 拟源增益值。如上所述,在一些实现中,在建立步骤期间可以计算并存储 这些虚拟源增益值,然后对这些虚拟源增益值进行检索以供在运行时操作期间使用。
在一些实现中,可以将衰落因子应用于与再现环境内的虚拟源位置相 对应的所有虚拟源增益值。在一些实现中,可以如下修改gl size
其中
如果dbound≥s,,则衰落因子=1,
如果dbound<s,则衰落因子=dbound/s,
其中,dbound表示音频对象位置和再现环境的边界之间的最小距离,并且 gl bound表示沿边界的虚拟源的贡献。例如,参考图8B,gl bound可以表示在 音频对象空间620b内并且靠近边界805的虚拟源的贡献。在该示例中, 与图6A的情况一样,不存在位于再现环境外部的虚拟源。
在替代实现中,可以如下修改gl size
其中,gl outside表示基于位于再现环境外部但是在音频对象区域或空间内的 虚拟源的音频对象增益。例如,参考图8B,gl outside可以表示在音频对象 空间620b内并且在边界805外部的虚拟源的贡献。在该示例中,与图6B 的情况一样,在再现环境内部和再现环境外部两者均存在虚拟源。
图10是提供创作和/或渲染设备的部件的示例的框图。在该示例中, 装置1000包括接口系统1005。接口系统1005可以包括网络接口(例如 无线网络接口)。可替代地或另外,接口系统1005可以包括通用串行总线 (USB)接口或其他这样的接口。
装置1000包括逻辑系统1010。逻辑系统1010可以包括处理器(如 通用单芯片处理器或通用多芯片处理器)。逻辑系统1010可以包括数字信 号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA) 或其他可编程逻辑装置、分立门或晶体管逻辑或分立硬件部件或者其组 合。逻辑系统1010可以被配置成控制装置1000的其他部件。虽然在图 10中示出了装置1000的部件之间没有接口,但是逻辑系统1010可以被 配置有用于与其他部件进行通信的接口。其他部件可以被配置成或不被配 置成当需要时彼此进行通信。
逻辑系统1010可以被配置成:执行音频创作和/或渲染功能,包括但 不限于本文中描述的类型的音频创作和/或渲染功能。在一些这样的实现 中,逻辑系统1010可以被配置成:(至少部分地)根据存储在一个或更多 个非暂态介质中的软件进行操作。非暂态介质可以包括与逻辑系统1010 相关联的存储器(如随机存取存储器(RAM)和/或只读存储器(ROM))。 非暂态介质可以包括存储系统1015的存储器。存储系统1015可以包括一 个或更多个适当类型的非暂态存储介质(如闪速存储器、硬盘驱动器等)。
显示系统1030可以包括一个或更多个适当类型的显示器,这取决于 装置1000的表现形式。例如,显示系统1030可以包括液晶显示器、等离 子显示器、双稳态显示器等。
用户输入系统1035可以包括被配置成接收来自用户的输入的一个或 更多个装置。在一些实现中,用户输入系统1035可以包括覆盖显示系统 1030的显示器的触摸屏。用户输入系统1035可以包括鼠标、跟踪球、手 势检测系统、操纵杆、存在于显示系统1030上的一个或更多个GUI和/ 或菜单、按钮、键盘、开关等。在一些实现中,用户输入系统1035可以包括麦克风1025:用户可以经由麦克风1025向装置1000提供语音命令。 逻辑系统可以被配置成:用于语音识别并且用于根据这样的语音命令控制 装置1000的至少一些操作。
电力系统1040可以包括一个或更多个适当的储能装置(如镍镉电池 或锂离子电池)。电力系统1040可以被配置成接收来自电气插座的电力。
图11A是表示可以用于音频内容创建的一些部件的框图。系统1100 可以例如用于混音室(mixing studio)和/或配音阶段中的音频内容创建。 在该示例中,系统1100包括音频和元数据创作工具1105和渲染工具1110。 在该实现中,音频和元数据创作工具1105和渲染工具1110分别包括音频 连接接口1107和1112,音频连接接口1107和1112可以被配置成经由 AES/EBU、MADI、会话等进行通信。音频和元数据创作工具1105和渲 染工具1110分别包括网络接口1109和1117,网络接口1109和1117可以 被配置成通过TCP/IP或任何其他合适的协议来发送和接收元数据。接口 1120被配置成将音频数据输出至扬声器。
系统1100可以例如包括现有创作系统(如Pro ToolsTM)系统,其将 元数据创建工具(即,如本文中描述的声像调节器)作为插件运行。声像 调节器也可以在与渲染工具1110连接的独立系统(例如,PC或混合控制 台)上运行,或者可以在与渲染工具1110相同的物理装置上运行。在后 一种情况下,声像调节器和渲染器可以例如通过共享的存储器来使用本地 连接。也可以将声像调节器GUI设置在平板装置、膝上型电脑等上。渲 染工具1110可以包括渲染系统,该渲染系统包括被配置成用于实现与图 5A至图5C和图9中描述的方法一样的渲染方法的声音处理器。渲染系 统可以包括例如包括用于音频输入/输出的接口和适当的逻辑系统的个人 计算机、膝上型电脑等。
图11B是表示可以用于再现环境(例如,电影院)中的音频回放的 一些部件的框图。在该示例中,系统1150包括影院服务器1155和渲染系 统1160。影院服务器1155和渲染系统1160分别包括网络接口1157和 1162,网络接口1157和1162可以被配置成通过TCP/IP或任何其他适当 的协议来发送和接收音频对象。接口1164被配置成将音频数据输出至扬声器。
对本领域的普通技术人员而言,对在本公开内容中描述的实现的各种 修改容易是显而易见的。在不背离本公开内容的精神或范围的情况下,本 文中限定的一般原理可以适用于其他实现。因此,权利要求并不意在限于 本文中所示的实现,但是意在使本公开内容、本文中公开的原理和新颖的 特征与最广的范围一致。
根据本公开的实施例,还公开了以下技术方案,包括但不限于:
1.一种方法,包括:
接收包括一个或更多个音频对象的音频再现数据,所述音频对象包括 音频信号和相关联的元数据,所述元数据包括至少音频对象位置数据和音 频对象大小数据;
针对所述一个或更多个音频对象中的音频对象,计算来自由所述音频 对象位置数据和所述音频对象大小数据限定的音频对象区域或空间内的 虚拟源的贡献;以及
至少部分地基于所计算出的贡献来计算多个输出声道中的每个输出 声道的一组音频对象增益值,其中,每个输出声道与再现环境的至少一个 再现扬声器相对应。
2.根据方案1所述的方法,其中,计算来自虚拟源的贡献的步骤包 括:计算所述音频对象区域或空间内的虚拟源的虚拟源增益值的加权平均 值。
3.根据方案2所述的方法,其中,用于所述加权平均值的权重取决 于所述音频对象的位置、所述音频对象的大小和所述音频对象区域或空间 内的每个虚拟源位置。
4.根据方案1所述的方法,还包括:
接收包括再现扬声器位置数据的再现环境数据。
5.根据方案4所述的方法,还包括:
根据所述再现环境数据限定多个虚拟源位置;以及
针对所述虚拟源位置中的每个虚拟源位置,计算所述多个输出声道中 的每个输出声道的虚拟源增益值。
6.根据方案5所述的方法,其中,所述虚拟源位置中的每个虚拟源 位置与所述再现环境内的位置相对应。
7.根据方案5所述的方法,其中,所述虚拟源位置中的至少一些虚 拟源位置与所述再现环境外部的位置相对应。
8.根据方案5所述的方法,其中,所述虚拟源位置沿x轴、y轴和z 轴被均匀地间隔开。
9.根据方案5所述的方法,其中,所述虚拟源位置具有沿x轴和y 轴的第一均匀间距和沿z轴的第二均匀间距。
10.根据方案8或9所述的方法,其中,所述计算所述多个输出声道 中的每个输出声道的一组音频对象增益值的步骤包括:独立计算来自沿x 轴、y轴和z轴的虚拟源的贡献。
11.根据方案5所述的方法,其中,所述虚拟源位置被非均匀地间隔 开。
12.根据方案5所述的方法,其中,所述计算所述多个输出声道中的 每个输出声道的音频对象增益值的步骤包括:确定要在位置x0、y0、z0处 渲染的各种大小的音频对象的增益值(gl(xo,yo,zo;s)),所述增益值 (gl(xo,yo,zo;s))被表达为:
其中,(xvs,yvs,zvs)表示虚拟源位置,gl(xvs,yvs,zvs)表示所述虚拟源位置 xvs,yvs,zvs的声道l的增益值,并且w(xvs,yvs,zvs;xo,yo,zo;s)表示至少部分 地基于所述音频对象的位置(xo,yo,zo)、所述音频对象的大小和所述虚拟源 位置(xvs,yvs,zvs)确定的gl(xvs,yvs,zvs)的一个或更多个加权函数。
13.根据方案12所述的方法,其中,gl(xvs,yvs,zvs)=gl(xvs)gl(yvs)gl(zvs), 其中,gl(xvs)、gl(yvs)和gl(zvs)表示x、y和z的独立的增益函数。
14.根据方案12所述的方法,其中,所述加权函数因式分解为: w(xvs,yvs,zvs;xo,yo,zo;s)=wx(xvs;x0;s)wy(yvs;yo;s)wz(zvs;zo;s)并且其中, wx(xvs;xo;s)、wy(yvs;yo;s)和wz(zvs;zo;s)表示xvs、yvs和zvs的独立的加权 函数。
15.根据方案12所述的方法,其中,p是音频对象大小的函数。
16.根据方案4所述的方法,还包括:将所计算出的虚拟源增益值存 储在存储系统中。
17.根据方案16所述的方法,其中,计算来自所述音频对象区域或 空间内的虚拟源的贡献的步骤包括:
从所述存储系统检索所计算出的、与音频对象位置和音频对象大小相 对应的虚拟源增益值;以及
在所计算出的虚拟源增益值之间进行插值。
18.根据方案17所述的方法,其中,在所计算出的虚拟源增益值之 间进行插值的步骤包括:
确定所述音频对象位置附近的多个邻近虚拟源位置;
确定所计算出的、每个所述邻近虚拟源位置的虚拟源增益值;
确定所述音频对象位置和每个所述邻近虚拟源位置之间的多个距离; 以及
根据所述多个距离在所计算出的虚拟源增益值之间进行插值。
19.根据方案1所述的方法,其中,所述音频对象区域或空间是矩形、 矩形棱柱、圆形、球形、椭圆形或椭圆体中至少之一。
20.根据方案1所述的方法,其中,所述再现环境包括影院音响系统 环境。
21.根据方案1所述的方法,还包括:对至少一些所述音频再现数据 进行去相关。
22.根据方案1所述的方法,还包括:对用于具有超过阈值的音频对 象大小的音频对象的音频再现数据进行去相关。
23.根据方案1所述的方法,其中,所述再现环境数据包括再现环境 边界数据,所述方法还包括:
确定所述音频对象区域或空间包括再现环境边界外部的外部区域或 空间;以及
至少部分地基于所述外部区域或空间来施加衰落因子。
24.根据方案23所述的方法,还包括:
确定音频对象在距再现环境边界的阈值距离内;以及
不向在所述再现环境的相对边界上的再现扬声器提供扬声器馈送信 号。
25.一种方法,包括:
接收包括再现扬声器位置数据和再现环境边界数据的再现环境数据;
接收包括一个或更多个音频对象和相关联的元数据的音频再现数据, 所述元数据包括音频对象位置数据和音频对象大小数据;
确定由所述音频对象位置数据和所述音频对象大小数据限定的音频 对象区域或空间包括再现环境边界外部的外部区域或空间;
至少部分地基于所述外部区域或空间确定衰落因子;以及
至少部分地基于所述相关联的元数据和所述衰落因子来计算多个输 出声道中的每个输出声道的一组增益值,其中,每个输出声道与所述再现 环境的至少一个再现扬声器相对应。
26.根据方案25所述的方法,其中,所述衰落因子与所述外部区域 成比例。
27.根据方案25所述的方法,还包括:
确定音频对象处在距再现环境边界的阈值距离内;以及
不向在所述再现环境的相对边界上的再现扬声器提供扬声器馈送信 号。
28.根据方案25所述的方法,还包括:
计算来自所述音频对象区域或空间内的虚拟源的贡献。
29.根据方案28所述的方法,还包括:
根据所述再现环境数据限定多个虚拟源位置;以及
针对每个所述虚拟源位置计算多个输出声道中的每个输出声道的虚 拟源增益。
30.根据方案29所述的方法,其中,所述虚拟源位置被均匀地间隔 开。
31.一种存储有软件的非暂态介质,所述软件包括用于控制至少一个 设备以执行下面的操作的指令:
接收包括一个或更多个音频对象的音频再现数据,所述音频对象包括 音频信号和相关联的元数据,所述元数据包括至少音频对象位置数据和音 频对象大小数据;
针对所述一个或更多个音频对象中的音频对象,计算来自由所述音频 对象位置数据和所述音频对象大小数据限定的音频对象区域或空间内的 虚拟源的贡献;以及
至少部分地基于所计算出的贡献来计算多个输出声道中的每个输出 声道的一组音频对象增益值,其中,每个输出声道与再现环境的至少一个 再现扬声器相对应。
32.根据方案31所述的非暂态介质,其中,计算来自虚拟源的贡献 的步骤包括:计算所述音频对象区域或空间内的虚拟源的虚拟源增益值的 加权平均值。
33.根据方案32所述的非暂态介质,其中,用于所述加权平均值的 权重取决于所述音频对象的位置、所述音频对象的大小和所述音频对象区 域或空间内的每个虚拟源位置。
34.根据方案31所述的非暂态介质,其中,所述软件包括用于接收 包括再现扬声器位置数据的再现环境数据的指令。
35.根据方案34所述的非暂态介质,其中,所述软件包括用于以下 操作的指令:
根据所述再现环境数据限定多个虚拟源位置;以及
针对所述虚拟源位置中的每个虚拟源位置,计算所述多个输出声道中 的每个输出声道的虚拟源增益值。
36.根据方案35所述的非暂态介质,其中,所述虚拟源位置中的每 个虚拟源位置与所述再现环境内的位置相对应。
37.根据方案35所述的非暂态介质,其中,所述虚拟源位置中的至 少一些虚拟源位置与所述再现环境外部的位置相对应。
38.根据方案35所述的非暂态介质,其中,所述虚拟源位置沿x轴、 y轴和z轴被均匀地间隔开。
39.根据方案35所述的非暂态介质,其中,所述虚拟源位置具有沿x 轴和y轴的第一均匀间距和沿z轴的第二均匀间距。
40.根据方案38或39所述的非暂态介质,其中,所述计算所述多个 输出声道中的每个输出声道的一组音频对象增益值的步骤包括:独立计算 来自沿x轴、y轴和z轴的虚拟源的贡献。
41.一种设备,包括:
接口系统;以及
适用于以下操作的逻辑系统:
从所述接口系统接收包括一个或更多个音频对象的音频再现数据,所 述音频对象包括音频信号和相关联的元数据,所述元数据包括至少音频对 象位置数据和音频对象大小数据;
针对一个或更多个所述音频对象中的音频对象,计算来自由所述音频 对象位置数据和所述音频对象大小数据限定的音频对象区域或空间内的 虚拟源的贡献;以及
至少部分地基于所计算出的贡献来计算多个输出声道中的每个输出 声道的一组音频对象增益值,其中,每个输出声道与再现环境的至少一个 再现扬声器相对应。
42.根据方案41所述的设备,其中,计算来自虚拟源的贡献的步骤 包括:计算所述音频对象区域或空间内的虚拟源的虚拟源增益值的加权平 均值。
43.根据方案42所述的设备,其中,用于所述加权平均值的权重取 决于所述音频对象的位置、所述音频对象的大小和所述音频对象区域或空 间内的每个虚拟源位置。
44.根据方案41所述的设备,其中,所述逻辑系统适用于:从所述 接口系统接收包括再现扬声器位置数据的再现环境数据。
45.根据方案44所述的设备,其中,所述逻辑系统适用于:
根据所述再现环境数据限定多个虚拟源位置;以及
针对所述虚拟源位置中的每个虚拟源位置,计算所述多个输出声道中 的每个输出声道的虚拟源增益值。
46.根据方案45所述的设备,其中,所述虚拟源位置中的每个虚拟 源位置与所述再现环境内的位置相对应。
47.根据方案45所述的设备,其中,所述虚拟源位置中的至少一些 虚拟源位置与所述再现环境外部的位置相对应。
48.根据方案45所述的设备,其中,所述虚拟源位置沿x轴、y轴和 z轴被均匀地间隔开。
49.根据方案45所述的设备,其中,所述虚拟源位置具有沿x轴和y 轴的第一均匀间距和沿z轴的第二均匀间距。
50.根据方案48或49所述的设备,其中,所述计算所述多个输出声 道中的每个输出声道的一组音频对象增益值的步骤包括:独立计算来自沿 x轴、y轴和z轴的虚拟源的贡献。
51.根据方案51所述的设备,还包括存储器装置,其中,所述接口 系统包括在所述逻辑系统和所述存储器装置之间的接口。
52.根据方案51所述的设备,其中,所述接口系统包括网络接口。
53.根据方案51所述的设备,还包括用户接口,其中,所述逻辑系 统适用于:经由所述用户接口接收用户输入,包括但不限于输入音频对象 大小数据。
54.根据方案53所述的设备,其中,所述逻辑系统适用于:对所述 输入音频对象大小数据进行缩放。

Claims (10)

1.一种存储有软件的非暂态介质,所述软件包括用于控制至少一个设备执行下面的操作的指令:
接收包括一个或更多个音频对象的音频再现数据,所述音频对象包括音频信号和相关联的元数据,所述元数据至少包括音频对象位置数据和音频对象大小数据;
针对所述一个或更多个音频对象中的音频对象,计算由所述音频对象位置数据和所述音频对象大小数据限定的音频对象区域或空间内的各个虚拟源位置处的虚拟源的虚拟源增益值;以及
至少部分地基于所计算出的虚拟源增益值来计算多个输出声道中的每个输出声道的一组音频对象增益值,其中,每个输出声道与再现环境的至少一个再现扬声器相对应,并且所述虚拟源位置中的每个虚拟源位置与所述再现环境内的各个静止位置相对应,
其中,计算所述一组音频对象增益值的处理包括:计算所述音频对象区域或空间内的虚拟源的虚拟源增益值的加权平均值。
2.根据权利要求1所述的非暂态介质,其中,用于所述加权平均值的权重取决于所述音频对象的位置、所述音频对象的大小和所述音频对象区域或空间内的每个虚拟源位置。
3.根据权利要求1所述的非暂态介质,其中,所述软件包括用于接收包括再现扬声器位置数据的再现环境数据的指令。
4.根据权利要求3所述的非暂态介质,其中,所述软件包括用于以下操作的指令:
根据所述再现环境数据限定多个虚拟源位置;以及
针对所述多个虚拟源位置中的每个虚拟源位置,计算所述多个输出声道中的每个输出声道的虚拟源增益值。
5.根据权利要求3所述的非暂态介质,其中,所述虚拟源位置中的至少一些虚拟源位置与所述再现环境外部的位置相对应。
6.根据权利要求3所述的非暂态介质,其中,所述虚拟源位置沿x轴、y轴和z轴被均匀地间隔开。
7.根据权利要求3所述的非暂态介质,其中,所述虚拟源位置具有沿x轴和y轴的第一均匀间距和沿z轴的第二均匀间距。
8.根据权利要求6所述的非暂态介质,其中,计算所述多个输出声道中的每个输出声道的一组音频对象增益值的处理包括:独立计算沿x轴、y轴和z轴的虚拟源的虚拟源增益值。
9.一种设备,包括:
接口系统;以及
适于执行以下操作的逻辑系统:
从所述接口系统接收包括一个或更多个音频对象的音频再现数据,所述音频对象包括音频信号和相关联的元数据,所述元数据至少包括音频对象位置数据和音频对象大小数据;
针对所述一个或更多个音频对象中的音频对象,计算由所述音频对象位置数据和所述音频对象大小数据限定的音频对象区域或空间内的各个虚拟源位置处的虚拟源的虚拟源增益值;以及
至少部分地基于所计算出的虚拟源增益值来计算多个输出声道中的每个输出声道的一组音频对象增益值,其中,每个输出声道与再现环境的至少一个再现扬声器相对应,并且所述虚拟源位置中的每个虚拟源位置与所述再现环境内的各个静止位置相对应,
其中,计算所述一组音频对象增益值的处理包括:计算所述音频对象区域或空间内的虚拟源的虚拟源增益值的加权平均值。
10.根据权利要求9所述的设备,其中,用于所述加权平均值的权重取决于所述音频对象的位置、所述音频对象的大小和所述音频对象区域或空间内的每个虚拟源位置。
CN201710507398.1A 2013-03-28 2014-03-10 用于创作和渲染音频再现数据的非暂态介质和设备 Active CN107396278B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
ESP201330461 2013-03-28
ES201330461 2013-03-28
US201361833581P 2013-06-11 2013-06-11
US61/833,581 2013-06-11
CN201480009029.4A CN105075292B (zh) 2013-03-28 2014-03-10 用于创作和渲染音频再现数据的方法和设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201480009029.4A Division CN105075292B (zh) 2013-03-28 2014-03-10 用于创作和渲染音频再现数据的方法和设备

Publications (2)

Publication Number Publication Date
CN107396278A true CN107396278A (zh) 2017-11-24
CN107396278B CN107396278B (zh) 2019-04-12

Family

ID=51625134

Family Applications (4)

Application Number Title Priority Date Filing Date
CN201480009029.4A Active CN105075292B (zh) 2013-03-28 2014-03-10 用于创作和渲染音频再现数据的方法和设备
CN201710508250.XA Active CN107426666B (zh) 2013-03-28 2014-03-10 用于创作和渲染音频再现数据的非暂态介质和设备
CN201710507398.1A Active CN107396278B (zh) 2013-03-28 2014-03-10 用于创作和渲染音频再现数据的非暂态介质和设备
CN201710507397.7A Active CN107465990B (zh) 2013-03-28 2014-03-10 用于创作和渲染音频再现数据的非暂态介质和设备

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN201480009029.4A Active CN105075292B (zh) 2013-03-28 2014-03-10 用于创作和渲染音频再现数据的方法和设备
CN201710508250.XA Active CN107426666B (zh) 2013-03-28 2014-03-10 用于创作和渲染音频再现数据的非暂态介质和设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201710507397.7A Active CN107465990B (zh) 2013-03-28 2014-03-10 用于创作和渲染音频再现数据的非暂态介质和设备

Country Status (18)

Country Link
US (6) US9674630B2 (zh)
EP (3) EP3282716B1 (zh)
JP (6) JP5897778B1 (zh)
KR (5) KR102586356B1 (zh)
CN (4) CN105075292B (zh)
AU (6) AU2014241011B2 (zh)
BR (4) BR122017004541B1 (zh)
CA (1) CA2898885C (zh)
ES (1) ES2650541T3 (zh)
HK (5) HK1215339A1 (zh)
IL (6) IL309028A (zh)
IN (1) IN2015MN01790A (zh)
MX (1) MX342792B (zh)
MY (1) MY172606A (zh)
RU (3) RU2630955C9 (zh)
SG (1) SG11201505429RA (zh)
UA (1) UA113344C2 (zh)
WO (1) WO2014159272A1 (zh)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY172402A (en) 2012-12-04 2019-11-23 Samsung Electronics Co Ltd Audio providing apparatus and audio providing method
US20170086005A1 (en) * 2014-03-25 2017-03-23 Intellectual Discovery Co., Ltd. System and method for processing audio signal
CN106797525B (zh) * 2014-08-13 2019-05-28 三星电子株式会社 用于生成和回放音频信号的方法和设备
PT3089477T (pt) * 2015-04-28 2018-10-24 L Acoustics Uk Ltd Aparelho de reprodução de um sinal de áudio multicanal e método para a produção de um sinal de áudio multicanal
EP3314916B1 (en) 2015-06-25 2020-07-29 Dolby Laboratories Licensing Corporation Audio panning transformation system and method
US9847081B2 (en) 2015-08-18 2017-12-19 Bose Corporation Audio systems for providing isolated listening zones
US9854376B2 (en) * 2015-07-06 2017-12-26 Bose Corporation Simulating acoustic output at a location corresponding to source position data
US9913065B2 (en) 2015-07-06 2018-03-06 Bose Corporation Simulating acoustic output at a location corresponding to source position data
US11128978B2 (en) * 2015-11-20 2021-09-21 Dolby Laboratories Licensing Corporation Rendering of immersive audio content
EP3174316B1 (en) * 2015-11-27 2020-02-26 Nokia Technologies Oy Intelligent audio rendering
WO2017098772A1 (ja) * 2015-12-11 2017-06-15 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP6820613B2 (ja) 2016-01-19 2021-01-27 スフィアオ サウンド リミテッド 没入型オーディオ再生のための信号合成
US9949052B2 (en) * 2016-03-22 2018-04-17 Dolby Laboratories Licensing Corporation Adaptive panner of audio objects
RU2743732C2 (ru) 2016-05-30 2021-02-25 Сони Корпорейшн Способ и устройство для обработки видео- и аудиосигналов и программа
CN109479178B (zh) 2016-07-20 2021-02-26 杜比实验室特许公司 基于呈现器意识感知差异的音频对象聚集
EP3293987B1 (en) * 2016-09-13 2020-10-21 Nokia Technologies Oy Audio processing
JP2019533404A (ja) * 2016-09-23 2019-11-14 ガウディオ・ラボ・インコーポレイテッド バイノーラルオーディオ信号処理方法及び装置
US10297162B2 (en) * 2016-12-28 2019-05-21 Honeywell International Inc. System and method to activate avionics functions remotely
CN110383856B (zh) 2017-01-27 2021-12-10 奥罗技术公司 用于平移音频对象的处理方法和系统
WO2018202642A1 (en) 2017-05-04 2018-11-08 Dolby International Ab Rendering audio objects having apparent size
CN110603821A (zh) 2017-05-04 2019-12-20 杜比国际公司 渲染具有表观大小的音频对象
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
CN113891233B (zh) * 2017-11-14 2024-04-09 索尼公司 信号处理设备和方法、及计算机可读存储介质
CN111434126B (zh) * 2017-12-12 2022-04-26 索尼公司 信号处理装置和方法以及程序
JP7146404B2 (ja) * 2018-01-31 2022-10-04 キヤノン株式会社 信号処理装置、信号処理方法、及びプログラム
CN111601935A (zh) 2018-03-30 2020-08-28 住友建机株式会社 挖土机
US11617050B2 (en) 2018-04-04 2023-03-28 Bose Corporation Systems and methods for sound source virtualization
EP3824463A4 (en) 2018-07-18 2022-04-20 Sphereo Sound Ltd. AUDIO PANORAMIC DETECTION AND SYNTHESIS OF THREE-DIMENSIONAL (3D) AUDIO CONTENT FROM ENVELOPING CHANNEL LIMITED SOUND
US11368806B2 (en) 2018-08-30 2022-06-21 Sony Corporation Information processing apparatus and method, and program
US11503422B2 (en) * 2019-01-22 2022-11-15 Harman International Industries, Incorporated Mapping virtual sound sources to physical speakers in extended reality applications
US11545166B2 (en) * 2019-07-02 2023-01-03 Dolby International Ab Using metadata to aggregate signal processing operations
CN117061951A (zh) * 2019-07-30 2023-11-14 杜比实验室特许公司 跨具有不同回放能力的设备的动态处理
GB2587371A (en) * 2019-09-25 2021-03-31 Nokia Technologies Oy Presentation of premixed content in 6 degree of freedom scenes
US11483670B2 (en) * 2019-10-30 2022-10-25 Sonos, Inc. Systems and methods of providing spatial audio associated with a simulated environment
WO2021098957A1 (en) * 2019-11-20 2021-05-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio object renderer, methods for determining loudspeaker gains and computer program using panned object loudspeaker gains and spread object loudspeaker gains
CN114946199A (zh) * 2019-12-12 2022-08-26 液态氧(Lox)有限责任公司 生成与虚拟声源相关联的音频信号
WO2021121698A1 (en) * 2019-12-19 2021-06-24 Telefonaktiebolaget Lm Ericsson (Publ) Audio rendering of audio sources
KR20210142382A (ko) * 2020-05-18 2021-11-25 에스케이하이닉스 주식회사 그리드 게인 계산 회로, 이미지 센싱 장치 및 그 동작방법
CN112135226B (zh) * 2020-08-11 2022-06-10 广东声音科技有限公司 Y轴音频再生方法以及y轴音频再生系统
US11982738B2 (en) 2020-09-16 2024-05-14 Bose Corporation Methods and systems for determining position and orientation of a device using acoustic beacons
US11696084B2 (en) 2020-10-30 2023-07-04 Bose Corporation Systems and methods for providing augmented audio
US11700497B2 (en) 2020-10-30 2023-07-11 Bose Corporation Systems and methods for providing augmented audio
US11750745B2 (en) 2020-11-18 2023-09-05 Kelly Properties, Llc Processing and distribution of audio signals in a multi-party conferencing environment
GB2607885B (en) * 2021-06-11 2023-12-06 Sky Cp Ltd Audio configuration
CN113596673A (zh) * 2021-07-14 2021-11-02 宁波旗芯电子科技有限公司 Ar眼镜扬声器的定向发声方法、装置和发声设备
GB2613558A (en) * 2021-12-03 2023-06-14 Nokia Technologies Oy Adjustment of reverberator based on source directivity
CN114173256B (zh) * 2021-12-10 2024-04-19 中国电影科学技术研究所 一种还原声场空间及姿态追踪的方法、装置和设备
CN115103293B (zh) * 2022-06-16 2023-03-21 华南理工大学 一种面向目标的声重放方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006091540A2 (en) * 2005-02-22 2006-08-31 Verax Technologies Inc. System and method for formatting multimode sound content and metadata
US20100092014A1 (en) * 2006-10-11 2010-04-15 Fraunhofer-Geselischhaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a number of loudspeaker signals for a loudspeaker array which defines a reproduction space
WO2013006330A2 (en) * 2011-07-01 2013-01-10 Dolby Laboratories Licensing Corporation System and tools for enhanced 3d audio authoring and rendering

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2343347B (en) * 1998-06-20 2002-12-31 Central Research Lab Ltd A method of synthesising an audio signal
AU756265B2 (en) * 1998-09-24 2003-01-09 Fourie, Inc. Apparatus and method for presenting sound and image
US8363865B1 (en) 2004-05-24 2013-01-29 Heather Bottum Multiple channel sound system using multi-speaker arrays
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
DE102005008366A1 (de) 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ansteuern einer Wellenfeldsynthese-Renderer-Einrichtung mit Audioobjekten
JP4973919B2 (ja) * 2006-10-23 2012-07-11 ソニー株式会社 出力制御システムおよび方法、出力制御装置および方法、並びにプログラム
WO2009046909A1 (en) * 2007-10-09 2009-04-16 Koninklijke Philips Electronics N.V. Method and apparatus for generating a binaural audio signal
EP2056627A1 (en) * 2007-10-30 2009-05-06 SonicEmotion AG Method and device for improved sound field rendering accuracy within a preferred listening area
RU2437247C1 (ru) * 2008-01-01 2011-12-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для обработки звукового сигнала
US8315396B2 (en) * 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
JP5326910B2 (ja) * 2009-01-20 2013-10-30 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
WO2011044153A1 (en) 2009-10-09 2011-04-14 Dolby Laboratories Licensing Corporation Automatic generation of metadata for audio dominance effects
TWI557723B (zh) * 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
WO2011119401A2 (en) * 2010-03-23 2011-09-29 Dolby Laboratories Licensing Corporation Techniques for localized perceptual audio
JP5655378B2 (ja) 2010-06-01 2015-01-21 ヤマハ株式会社 音像制御装置、およびプログラム
US20110317841A1 (en) * 2010-06-25 2011-12-29 Lloyd Trammell Method and device for optimizing audio quality
KR101747299B1 (ko) * 2010-09-10 2017-06-15 삼성전자주식회사 데이터 객체 디스플레이 방법 및 장치와 컴퓨터로 읽을 수 있는 저장 매체
UA107304C2 (uk) * 2011-07-01 2014-12-10 Система та інструментальні засоби для удосконаленої авторської розробки та представлення тривимірних аудіоданих
TW202339510A (zh) * 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
EP2727108B1 (en) 2011-07-01 2015-09-09 Dolby Laboratories Licensing Corporation Sample rate scalable lossless audio coding
MY172402A (en) * 2012-12-04 2019-11-23 Samsung Electronics Co Ltd Audio providing apparatus and audio providing method
US9338420B2 (en) * 2013-02-15 2016-05-10 Qualcomm Incorporated Video analysis assisted generation of multi-channel audio data
RS1332U (en) 2013-04-24 2013-08-30 Tomislav Stanojević FULL SOUND ENVIRONMENT SYSTEM WITH FLOOR SPEAKERS

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006091540A2 (en) * 2005-02-22 2006-08-31 Verax Technologies Inc. System and method for formatting multimode sound content and metadata
US20100092014A1 (en) * 2006-10-11 2010-04-15 Fraunhofer-Geselischhaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a number of loudspeaker signals for a loudspeaker array which defines a reproduction space
WO2013006330A2 (en) * 2011-07-01 2013-01-10 Dolby Laboratories Licensing Corporation System and tools for enhanced 3d audio authoring and rendering

Also Published As

Publication number Publication date
UA113344C2 (xx) 2017-01-10
JP2016511990A (ja) 2016-04-21
RU2017130902A3 (zh) 2020-12-08
IL239782A0 (en) 2015-08-31
AU2014241011A1 (en) 2015-07-23
JP6250084B2 (ja) 2017-12-20
MX342792B (es) 2016-10-12
KR102160406B1 (ko) 2020-10-05
IL239782A (en) 2016-06-30
EP2926571B1 (en) 2017-10-18
IL245897A0 (en) 2016-07-31
KR102332632B1 (ko) 2021-12-02
JP6877510B2 (ja) 2021-05-26
KR20200113004A (ko) 2020-10-05
RU2742195C2 (ru) 2021-02-03
AU2016200037B2 (en) 2018-02-01
HK1215339A1 (zh) 2016-08-19
BR122017004541A2 (pt) 2019-09-03
EP3282716B1 (en) 2019-11-20
MY172606A (en) 2019-12-05
US20210352426A1 (en) 2021-11-11
AU2018202867B2 (en) 2019-10-24
AU2020200378B2 (en) 2021-08-05
HK1245557B (zh) 2020-05-08
JP2020025310A (ja) 2020-02-13
CN105075292B (zh) 2017-07-25
EP3282716A1 (en) 2018-02-14
HK1246552B (zh) 2020-07-03
IL245897B (en) 2019-05-30
AU2016200037A1 (en) 2016-01-28
RU2630955C9 (ru) 2017-09-29
KR101619760B1 (ko) 2016-05-11
JP2016146642A (ja) 2016-08-12
BR122022005121B1 (pt) 2022-06-14
CA2898885A1 (en) 2014-10-02
CN105075292A (zh) 2015-11-18
IL266096A (en) 2019-06-30
US9674630B2 (en) 2017-06-06
IL290671B1 (en) 2024-01-01
US11019447B2 (en) 2021-05-25
MX2015010786A (es) 2015-11-26
JP7280916B2 (ja) 2023-05-24
JP2018067931A (ja) 2018-04-26
US20160007133A1 (en) 2016-01-07
KR102586356B1 (ko) 2023-10-06
HK1249688A1 (zh) 2018-11-02
EP3668121A1 (en) 2020-06-17
JP2021114796A (ja) 2021-08-05
CN107426666A (zh) 2017-12-01
IL309028A (en) 2024-02-01
US20180167756A1 (en) 2018-06-14
US11564051B2 (en) 2023-01-24
US11979733B2 (en) 2024-05-07
KR20150103754A (ko) 2015-09-11
AU2020200378A1 (en) 2020-02-13
KR20160046924A (ko) 2016-04-29
CN107396278B (zh) 2019-04-12
RU2017130902A (ru) 2019-02-05
RU2764227C1 (ru) 2022-01-14
BR122017004541B1 (pt) 2022-09-06
BR112015018993A2 (pt) 2017-07-18
IN2015MN01790A (zh) 2015-08-28
JP6607904B2 (ja) 2019-11-20
CN107426666B (zh) 2019-06-18
KR20230144652A (ko) 2023-10-16
KR20210149191A (ko) 2021-12-08
AU2014241011B2 (en) 2016-01-28
US20230269551A1 (en) 2023-08-24
HK1246553A1 (zh) 2018-09-07
US20200336855A1 (en) 2020-10-22
JP5897778B1 (ja) 2016-03-30
EP2926571A1 (en) 2015-10-07
IL287080B (en) 2022-04-01
IL287080A (en) 2021-12-01
BR112015018993B1 (pt) 2023-11-28
US10652684B2 (en) 2020-05-12
US9992600B2 (en) 2018-06-05
IL290671B2 (en) 2024-05-01
AU2021261862B2 (en) 2023-11-09
WO2014159272A1 (en) 2014-10-02
RU2630955C2 (ru) 2017-09-14
RU2015133695A (ru) 2017-02-20
CA2898885C (en) 2016-05-10
ES2650541T3 (es) 2018-01-19
BR122022005104B1 (pt) 2022-09-13
SG11201505429RA (en) 2015-08-28
US20170238116A1 (en) 2017-08-17
IL266096B (en) 2021-12-01
AU2024200627A1 (en) 2024-02-22
CN107465990A (zh) 2017-12-12
JP2023100966A (ja) 2023-07-19
IL290671A (en) 2022-04-01
CN107465990B (zh) 2020-02-07
AU2021261862A1 (en) 2021-12-02
AU2018202867A1 (en) 2018-05-17

Similar Documents

Publication Publication Date Title
CN105075292B (zh) 用于创作和渲染音频再现数据的方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1245557

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant