CN105340300B - 用于音频呈现的低音管理 - Google Patents
用于音频呈现的低音管理 Download PDFInfo
- Publication number
- CN105340300B CN105340300B CN201480035176.9A CN201480035176A CN105340300B CN 105340300 B CN105340300 B CN 105340300B CN 201480035176 A CN201480035176 A CN 201480035176A CN 105340300 B CN105340300 B CN 105340300B
- Authority
- CN
- China
- Prior art keywords
- audio
- signal
- frequency
- low
- bass
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/308—Electronic adaptation dependent on speaker or headphone connection
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G11/00—Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general
- H03G11/008—Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general of digital or coded signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
- H04R3/14—Cross-over networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/07—Generation or adaptation of the Low Frequency Effect [LFE] channel, e.g. distribution or signal processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Abstract
提供了用于对低频音频数据进行处理的改进的方法和装置。低音提取过程可以包括对所接收的音频对象信号应用低通滤波器以产生所提取的低频音频信号。可以在将音频对象呈现成扬声器馈送信号的处理之前执行低音提取过程。低音管理过程可以包括将所提取的低频音频信号传送至能够再现低频音频信号的一个或更多个扬声器。
Description
相关申请的交叉引用
本申请要求于2013年6月18日提交的美国临时专利申请No.61/836,519的优先权,在此通过引用将其全部内容合并到本文中。
技术领域
本公开内容涉及对音频数据进行处理。具体地,本公开内容涉及对声音再现系统的低频音频数据进行处理。
背景技术
自从在1927年引入了有声电影,用于捕获电影声轨的艺术意图并且再现该内容的技术已有稳定发展。在二十世纪七十年代,杜比提出了对与3个屏幕声道和单声道环绕声道的混合进行编码和分配的经济高效的手段。在二十世纪九十年代期间,杜比使用5.1声道格式将数字声音引入影院,5.1声道格式提供分离的左屏幕声道、中心屏幕声道和右屏幕声道、左环绕阵列和右环绕阵列以及用于低频效果的超低音扬声器声道。2010年提出的杜比环绕声7.1通过将现有的左环绕声道和右环绕声道分成四个“区”增加了环绕声道的数量。
影院音频再现系统和家庭影院音频再现系统两者都变得越来越多用途且复杂。家庭影院音频再现系统包括越来越多的扬声器。随着声道增多以及扬声器布局从平面二维(2D)阵列转变成包括高度的三维(3D)阵列,在播放环境中再现声音正变成越来越复杂的过程。改进的音频处理方法会是人们所希望的。
发明内容
提供了用于处理低频音频数据的改进的且高效的方法。可以在用于呈现音频对象的工具中实现本公开内容中所描述的主题的一些方面。如本文中所用的,术语“音频对象”指代可以在不参考任何特定播放环境的情况下创建或“创作”的音频信号(在本文中被称为“音频对象信号”)和关联元数据。关联元数据可以包括音频对象位置数据、音频对象增益数据、音频对象大小数据、音频对象轨迹数据等。如本文中所使用的,术语“呈现”指代将音频对象变换成用于特定播放环境的扬声器馈送信号的过程。可以至少部分地根据关联元数据并且根据播放环境数据来执行呈现过程。播放环境数据可以包括播放环境中的扬声器的数量的指示以及每个扬声器在该播放环境内的位置的指示。播放环境数据也可以包括能够再现低频音频信号的一个或更多个扬声器的指示。
根据本文中描述的一些实现,低音提取过程可以涉及对所接收的音频对象信号应用低通滤波器以产生所提取的低频音频信号。可以在将音频信号呈现成扬声器馈送信号的过程之前执行低音提取过程。低音管理过程可以涉及将所提取的低频音频信号传送至能够再现低频音频信号的一个或更多个扬声器。
当对基于声道的音频数据进行处理时,可以执行本文中提供的一些低音管理方法。例如,杜比最近开发了能够对所接收的基于“遗留(legacy)”声道的音频数据如杜比环绕声5.1音频数据或杜比环绕声7.1音频数据实现阵列处理方法的基于声道的音频呈现系统。如果阵列处理方法使用功率相等水平并且将同相信号复制到附近扬声器,则可能导致低音积聚。然而,如果在这样的阵列处理方法之前执行低音提取过程,则可以减轻或避免低音积聚。
根据本文中描述的一些实现,方法可以涉及接收包括音频对象的音频数据。音频对象可以包括音频对象信号和关联元数据。关联元数据可以包括音频对象的位置元数据。该方法可以涉及对音频对象信号应用涉及低通滤波器的低音提取过程以产生所提取的低频音频信号。该方法可以涉及接收播放环境数据。播放环境数据可以包括播放环境中的扬声器的数量的指示、每个扬声器在播放环境中的位置的指示以及能够再现低频音频信号的一个或更多个扬声器的指示。
该方法可以涉及在低音提取过程之后至少部分地基于播放环境数据和关联元数据将音频对象的音频信号呈现成一个或更多个扬声器馈送信号。每个扬声器馈送信号可以对应于播放环境的扬声器的至少之一。该方法可以涉及对所提取的低频音频信号执行低音管理过程。低音管理过程可以涉及将所提取的低频音频信号传送至能够再现低频音频信号的一个或更多个扬声器。
低音管理过程可以涉及限制至少一些低频音频信号的幅度。低音管理过程可以涉及将所提取的低频音频信号与扬声器馈送信号进行组合。
音频数据可以包括与扬声器位置相对应的音频音床信号。该应用过程可以涉及对音频音床信号中的至少一些应用低音提取过程。
该方法可以涉及对音频音床信号应用上混或下混过程。上混或下混过程可以至少部分地基于播放环境中的扬声器的数量。根据一些实现,音频数据可以被接收并且被通过包括扬声器阵列处理的上混而处理。
该方法可以涉及在应用低音提取过程之前对音频数据进行预处理。预处理可以涉及根据音频对象元数据或播放环境数据的至少之一来应用增益。
音频数据可以包括声场表示数据。该方法可以涉及对声场表示数据的第一部分的不同副本应用低音提取过程和高通滤波器。该方法可以涉及对声场表示数据的第二部分的不同副本应用高通滤波器但不应用低音提取过程。对声场表示数据的第一部分和第二部分应用的高通滤波器可以是同一高通滤波器或者可以不是同一高通滤波器。
在一些实现中,音频数据可以是从解码器接收的。替代地或另外地,音频数据可以作为脉冲编码调制流或者作为类似的数据流被接收。
在一些实现中,所接收的音频数据可以包括低频效果音频声道。低音管理过程可以涉及将所提取的低频音频信号与低频效果音频声道的低频效果音频数据进行混合。该方法可以涉及在混合之前将所提取的低频音频信号与低频效果音频声道校平(leveling)。校平过程可以涉及对低频效果音频数据进行放大和/或对所提取的低频音频信号进行衰减。
该方法可以涉及对音频对象信号中的至少一些应用高通滤波器以产生高通滤波音频信号。呈现过程可以涉及将高通滤波音频信号呈现成一个或更多个高通滤波扬声器馈送信号。
可以至少部分地通过存储有软件的非暂态介质来实现本文中描述的各种实现。该软件可以包括用于控制至少一个设备接收包括音频对象的音频数据的指令。音频对象可以包括音频对象信号和关联元数据如音频对象的位置元数据。
该软件可以包括指令,该指令用于控制至少一个设备对音频对象信号应用涉及低通滤波器的低音提取过程,以产生所提取的低频音频信号。该软件可以包括用于控制至少一个设备接收播放环境数据的指令。播放环境数据可以包括播放环境中的扬声器的数量的指示、每个扬声器在播放环境内的位置的指示以及能够再现低频音频信号的一个或更多个扬声器的指示。该软件可以包括以下指令:其用于控制至少一个设备在低音提取过程之后至少部分地基于播放环境数据和包括位置元数据的关联元数据将音频对象的音频信号呈现成一个或更多个扬声器馈送信号。每个扬声器馈送信号可以对应于播放环境的扬声器的至少之一。
该软件可以包括用于控制至少一个设备对所提取的低频音频信号执行低音管理过程的指令。低音管理过程可以涉及将所提取的低频音频信号传送至能够再现低频音频信号的一个或更多个扬声器。
在一些实现中,低音管理过程可以涉及限制至少一些低频音频信号的幅度。低音管理过程可以涉及将所提取的低频音频信号与扬声器馈送信号进行组合。
音频数据可以包括与扬声器位置相对应的音频音床信号。该应用过程可以涉及对音频音床信号中的至少一些应用低音提取过程。
软件可以包括用于控制至少一个设备对音频音床信号应用上混或下混过程的指令。上混或下混过程可以至少部分地基于播放环境中的扬声器数量。音频数据可以被接收并且通过包括扬声器阵列处理的上混而处理。
软件可以包括用于控制至少一个设备在应用低音提取过程之前对音频数据进行预处理的指令。例如,预处理可以涉及根据音频对象元数据或播放环境数据的至少之一来应用增益。
在一些实现中,音频数据可以包括声场表示数据。软件可以包括以下指令:其用于控制至少一个设备对声场表示数据的第一部分的不同副本应用低音提取过程和高通滤波器。软件可以包括以下指令:其用于控制至少一个设备对声场表示数据的第二部分的不同副本应用高通滤波器但不应用低音提取过程。在一些实现中,对声场表示数据的第一部分和第二部分应用的高通滤波器可以是同一高通滤波器或者可以不是同一高通滤波器。
在一些实现中,音频数据可以是从解码器接收的。替代地或另外地,音频数据可以作为脉冲编码调制流或者作为类似的数据流被接收。
所接收的音频数据可以包括低频效果音频声道。低音管理过程可以涉及将所提取的低频音频信号与低频效果音频声道的低频效果音频数据进行混合。
软件可以包括用于控制至少一个设备在混合之前将所提取的低频音频信号与低频效果音频声道校平的指令。校平过程可以涉及对低频效果音频数据进行放大和/或对所提取的低频音频信号进行衰减。
软件可以包括以下指令:其用于控制至少一个设备对音频对象信号中的至少一些应用高通滤波器来产生高通滤波音频信号。呈现过程可以包括将高通滤波音频信号呈现成一个或更多个高通滤波扬声器馈送信号。
可以至少部分地通过包括接口和逻辑系统的设备来提供本文中描述的一些实现。逻辑系统可以包括通用单芯片或多芯片处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他可编程逻辑装置、分立门或晶体管逻辑、或者分立硬件部件中至少之一。该设备可以包括存储器装置。接口可以包括逻辑系统和存储器装置之间的接口。替代地或另外地,接口可以包括网络接口。
逻辑系统可以能够接收包括音频对象的音频数据。音频对象可以包括音频对象信号和关联元数据如音频对象的位置元数据。逻辑系统可以能够对音频对象信号应用涉及低通滤波器的低音提取过程以产生所提取的低频音频信号。
逻辑系统可以能够接收播放环境数据。播放环境数据可以包括播放环境中的扬声器的数量的指示、每个扬声器在播放环境内的位置的指示以及能够再现低频音频信号的一个或更多个扬声器的指示。
逻辑系统可以能够在低音提取过程之后至少部分地基于播放环境数据和关联元数据将音频对象的音频信号呈现成一个或更多个扬声器馈送信号。每个扬声器馈送信号可以对应于播放环境的扬声器的至少之一。
逻辑系统可以能够对所提取的低频音频信号执行低音管理过程。低音管理过程可以涉及将所提取的低频音频信号传送至能够再现低频音频信号的一个或更多个扬声器。低音管理过程可以包括限制至少一些低频音频信号的幅度。低音管理过程可以包括将所提取的低频音频信号与扬声器馈送信号进行组合。
音频数据可以包括与扬声器位置相对应的音频音床信号。应用过程可以包括对音频音床信号中的至少一些应用低音提取过程。
逻辑系统可以能够对音频音床信号应用上混或下混过程。上混或下混过程可以至少部分地基于播放环境中的扬声器的数量。音频数据可以被接收并且通过包括扬声器阵列处理的上混而处理。
逻辑系统可以还能够在应用低音提取过程之前对音频数据进行预处理。例如,预处理可以涉及根据音频对象元数据或播放环境数据中至少之一来应用增益。
音频数据可以包括声场表示数据。逻辑系统可以能够对声场表示数据的第一部分的不同副本应用低音提取过程和高通滤波器。逻辑系统可以被配置成用于对声场表示数据的第二部分的不同副本应用高通滤波器但不应用低音提取过程。对声场表示数据的第一部分和第二部分应用的高通滤波器可以是同一高通滤波器或者可以不是同一高通滤波器。
在一些实现中,音频数据可以是从解码器接收的。替代地或另外地,音频数据可以被接收为脉冲编码调制流。
所接收的音频数据可以包括低频效果音频声道。低音管理过程可以涉及将所提取的低频音频信号与低频效果音频声道的低频效果音频数据进行混合。逻辑系统可以还能够在混合之前将所提取的低频音频信号与低频效果音频声道校平。校平过程可以涉及对低频效果音频数据进行放大和/或对所提取的低频音频信号进行衰减。
逻辑系统可以还能够对音频对象信号中的至少一些应用高通滤波器以产生高通滤波音频信号。呈现过程可以涉及将高通滤波音频信号呈现成一个或更多个高通滤波扬声器馈送信号。
在下面的附图和描述中阐述了本说明书中描述的主题的一个或更多个实现的细节。根据描述、图和权利要求,其他特征、方面和优点将变得明显。注意,下面的图的相对尺寸可能并未按比例绘制。
附图说明
图1示出了具有杜比环绕声5.1配置的播放环境的示例。
图2示出了具有杜比环绕声7.1配置的播放环境的示例。
图3A和图3B示出了包括高度扬声器配置的家庭影院播放环境的两个示例。
图4A示出了描绘了虚拟播放环境中的不同高度处的扬声器区的图形用户接口(GUI)的示例。
图4B示出了另一个播放环境的示例。
图5是提供了当对从左扬声器位置移动至中心扬声器位置的音频对象执行幅值移位(panning)过程时低音积聚的示例的图。
图6示出了在立方体的每个角落中具有扬声器的播放环境。
图7A指示宽带输入信号随时间的幅度。
图7B指示在播放环境的角落与中心之间移位四次的音频对象的、由图7A中所示的输入信号产生的超低音扬声器信号中的低音积聚。
图8是示出用于减轻或消除低音积聚的低音管理过程的流程图。
图9是描绘音频处理系统的一个示例的框图。
图10是示出替选音频处理系统的框图。
图11是提供创作和/或呈现设备的部件的示例的框图。
不同的附图中的相同的附图标记和名称指示相同的要素。
具体实施方式
出于描述本公开内容的一些创新方面以及可以实现这些创新的方面的上下文示例的目的,下面的描述针对某些实现。然而,可以以各种不同的方式应用本文中的教示。例如,虽然已经根据特定播放环境描述了各种实现,但是本文中的教示能够广泛地适用于其他已知的播放环境以及在未来可能被引入的播放环境。此外,可以至少部分地在各种装置和系统如硬件、软件、固件、基于云的系统等中实现所描述的实现。因此,本公开内容的教示并不意在限于图中所示的和/或本文中描述的实现,而是具有广泛的适用性。
图1示出了具有杜比环绕声5.1配置的播放环境的示例。在该示例中,播放环境是影院播放环境。虽然在二十世纪九十年代开发出了杜比环绕声5.1,但是该配置仍然被广泛部署在家庭播放环境和影院播放环境中。在影院播放环境中,投影仪105可以被配置成将视频图像例如电影投影到屏幕150上。音频数据可以与视频图像同步,并且被声音处理器110处理。功率放大器115可以对播放环境100的扬声器提供扬声器馈送信号。
杜比环绕声5.1配置包括用于左环绕阵列122的左环绕声道120和用于右环绕阵列127的右环绕声道125。杜比环绕声5.1配置还包括用于左扬声器阵列132的左声道130、用于中心扬声器阵列137的中心声道135和用于右扬声器阵列142的右声道140。在影院环境中,可以将这些声道分别称为左屏幕声道、中心屏幕声道和右屏幕声道。对超低音扬声器145提供单独的低频效果(LFE)声道144。
在2010年,杜比通过引入杜比环绕声7.1提供了对数字影院声音的增强。图2示出了具有杜比环绕声7.1配置的播放环境的示例。数字投影仪205可以被配置成接收数字视频数据以及将视频图像投影到屏幕150上。可以通过声音处理器210对音频数据进行处理。功率放大器215可以对播放环境200的扬声器提供扬声器馈送信号。
与杜比环绕声5.1一样,杜比环绕声7.1配置包括用于左扬声器阵列132的左声道130、用于中心扬声器阵列137的中心声道135、用于右扬声器阵列142的右声道140和用于超低音扬声器145的LFE声道144。杜比环绕声7.1配置包括左侧环绕(Lss)阵列220和右侧环绕(Rss)阵列225,这两个环绕阵列中的每个可以由单个声道驱动。
然而,杜比环绕声7.1通过将杜比环绕声5.1的左环绕声道和右环绕声道分成四个区而增加了环绕声道的数量:除了左侧环绕阵列220和右侧环绕阵列225以外,还包括用于左后环绕(Lrs)扬声器224和右后环绕(Rrs)扬声器226的单独的声道。增加播放环境200中的环绕区可以显著提高对声音的定位。
为了创建更沉浸式的环境,一些播放环境可以被配置有由增多的声道驱动的增多的扬声器。此外,一些播放环境可以包括部署在不同高度处的扬声器,这些扬声器中的一些扬声器可以是被配置成产生来自播放环境的座位区域上方的区域的声音的“高度扬声器”。
图3A和图3B示出了包括高度扬声器配置的家庭影院播放环境的两个示例。在这些示例中,播放环境300a和播放环境300b包括杜比环绕声5.1配置的主要特征,包括左环绕扬声器322、右环绕扬声器327、左扬声器332、右扬声器342、中心扬声器337和超低音扬声器145。然而,播放环境300包括杜比环绕声5.1配置的用于高度扬声器的扩展,其可以被称为杜比环绕声5.1.2配置。
图3A示出了在家庭影院播放环境的天花板360上安装有高度扬声器的播放环境的示例。在该示例中,播放环境300a包括位于左上中(Ltm)位置的高度扬声器352和位于右上中(Rtm)位置的高度扬声器357。在图3B所示的示例中,左扬声器332和右扬声器342是被配置成从天花板360反射声音的杜比高度扬声器。如果被正确地配置,反射声音可以被听者365感知为如同声源源自天花板360。然而,仅通过示例的方式提供了扬声器的数量和配置。一些当前的家庭影院实现提供多至34个扬声器位置,并且设想的家庭影院实现可以允许甚至更多的扬声器位置。
因此,现代的趋势是不仅包括更多扬声器和更多声道,而且还包括不同高度处的扬声器。随着声道增多以及扬声器布局从2D转变至3D,对声音进行定位和呈现的任务变得日益困难。
因此,杜比已经开发了各种工具,包括但不限于用户接口,该用户接口提高功能性和/或降低3D音频声音系统的创作复杂度。一些这样的工具可以用于创建音频对象和/或针对音频对象的元数据。
图4A示出了描绘虚拟播放环境中的不同高度处的扬声器区的图形用户接口(GUI)的示例。可以根据来自逻辑系统的指令、根据从用户输入装置接收的信号等将GUI 400例如显示在显示装置上。下面参照图11对一些这样的装置进行描述。
如本文中使用的,参考虚拟播放环境如虚拟播放环境404,术语“扬声器区”一般指代可以与实际播放环境的扬声器具有或者不具有一一对应关系的逻辑构造。例如,“扬声器区位置”可以与或者不与影院播放环境的特定扬声器位置相对应。替代地,术语“扬声器区位置”可以一般指代虚拟播放环境的区域。在一些实现中,虚拟播放环境的扬声器区可以例如通过使用虚拟技术如杜比耳机TM(有时称为移动环绕声TM)与虚拟扬声器相对应,该虚拟技术使用一组两声道立体声耳机实时创建虚拟环绕声环境。在GUI 400中,在第一高度处有7个扬声器区402a并且在第二高度处有两个扬声器区402b,在虚拟播放环境404中形成总共9个扬声器区。在该示例中,扬声器区1至3在虚拟播放环境404的前方区域405中。前方区域405可以例如与电影播放环境中屏幕150所处的区域、家庭中电视屏幕所处的区域等相对应。
在此,扬声器区4一般对应于左区域410中的扬声器,并且扬声器区5对应于虚拟播放环境404的右区域415中的扬声器。扬声器区6对应于左后区域412,并且扬声器区7对应于虚拟播放环境404的右后区域414。扬声器区8对应于上部区域420a中的扬声器,并且扬声器区9对应于上部区域420b中的扬声器,上部区域420a和上部区域420b可以是虚拟天花板区域。因此,图4A中所示的扬声器区1至9的位置可以与实际播放环境的扬声器的位置相对应或者不相对应。此外,其他实现可以包括更多或更少扬声器区和/或高度。
在本文中描述的各种实现中,可以将用户接口如GUI 400用作创作工具和/或呈现工具的一部分。在一些实现中,可以通过存储在一个或更多个非暂态介质上的软件来实现创作工具和/或呈现工具。可以(至少部分地)通过硬件、固件等如下面参照图11描述的逻辑系统和其他装置来实现创作工具和/或呈现工具。在一些创作实现中,相关联的创作工具可以被用于创建相关联的音频数据的元数据。元数据例如可以包括指示音频对象在三维空间中的位置和/或轨迹的数据、扬声器区约束数据等。可以关于虚拟播放环境404的扬声器区402而不是关于实际播放环境的特定扬声器布局来创建元数据。呈现工具可以接收音频数据和关联元数据,并且可以针对播放环境计算音频增益和扬声器馈送信号。可以根据幅值移位过程来计算这样的音频增益和扬声器馈送信号,幅值移位过程可以创建声音来自播放环境中的位置P的感知。例如,可以根据下面的等式将扬声器馈送信号提供至播放环境的扬声器1至扬声器N:
xi(t)=gix(t),i=1,...N (等式1)
在等式1中,xi(t)表示要应用于扬声器i的扬声器馈送信号,gi表示相应声道的增益因子,x(t)表示音频信号,以及t表示时间。例如可以根据以下文献中描述的幅值移位方法来确定增益因子:V.Pulkki,Compensating Displacement of Amplitude-PannedVirtual Sources,第2部分,第3页至第4页(音频工程学会(AES)关于虚拟、合成和娱乐音频的国际会议),在此通过引用将其合并到本文中。在一些实现中,增益可以是与频率有关的。在一些实现中,可以通过用x(t-Δt)代替x(t)来引入时间延迟。
在一些呈现实现中,参考扬声器区402创建的音频再现数据可以被映射至范围广泛的播放环境的扬声器位置,该播放环境可以具有杜比环绕声5.1配置、杜比环绕声7.1配置、滨崎(Hamasaki)22.2配置或其他配置。例如,参考图2,呈现工具可以将扬声器区4和扬声器区5的音频再现数据映射至具有杜比环绕声7.1配置的播放环境的左侧环绕阵列220和右侧环绕阵列225。扬声器区1、扬声器区2和扬声器区3的音频再现数据可以分别被映射至左屏幕声道230、右屏幕声道240和中心屏幕声道235。扬声器区6和扬声器区7的音频再现数据可以被映射至左后环绕扬声器224和右后环绕扬声器226。
图4B示出了另一个播放环境的示例。在一些实现中,呈现工具可以将扬声器区1、扬声器区2和扬声器区3的音频再现数据映射至播放环境450的相应屏幕扬声器455。呈现工具可以将扬声器区4和扬声器区5的音频再现数据映射至左侧环绕阵列460和右侧环绕阵列465,并且可以将扬声器区8和扬声器区9的音频再现数据映射至左头顶扬声器470a和右头顶扬声器470b。扬声器区6和扬声器区7的音频再现数据可以被映射至左后环绕扬声器480a和右后环绕扬声器480b。
在一些创作实现中,创作工具可以用于创建音频对象的元数据。元数据可以指示对象的3D位置、呈现约束以及内容类型(例如对话、效果等)。根据实现,元数据可以包括其他类型的数据如宽度数据、增益数据、轨迹数据等。一些音频对象可以是静止的,而其他音频对象可以运动。
根据音频对象的关联元数据来呈现音频对象,关联元数据包括指示音频对象在给定时间点在三维空间中的位置的位置元数据。当在播放环境中播放或监视音频对象时,使用存在于播放环境中的扬声器根据位置元数据来呈现音频对象,而不是如传统的基于声道的系统如杜比5.1和杜比7.1的情况那样将音频对象输出至预定物理声道。
在传统的基于声道的系统中,由于低音处理一般特定于产品的输出配置和播放环境的输出配置,所以低频或“低音”音频信号的管理接近播放处理序列结束时发生。低频可以被静态地传送通过分频网络(cross-over network)并且被全音域扬声器输出端再现。在下面的表格中概述了两个普通的低音管理配置:
使用基于音频对象的系统和播放环境中的多个可能的扬声器配置,增加了传统的低音管理系统的低音过载的风险并且增加了复杂度。具体地,由于以幅度累加低音,所以存在以不期望的高幅度播放低音信号的可能性。该现象(有时被称为“低音积聚”)可能在对运动音频对象执行幅值移位过程时发生。
图5是提供当对从左扬声器位置移动至中心扬声器位置的音频对象执行幅值移位过程时低音积聚的示例的曲线图。在曲线图500中,曲线505表示中心扬声器在每个移位位置处的幅度,而曲线510表示左扬声器在每个移位位置处的幅度。曲线515表示每个移位位置处的低音幅度。因为在每个移位位置处低音幅度被累加,所以音频对象的低音幅度达到大于适当水平的3dB的最大幅度。
在三维播放环境中可能发生低音积聚的更极端的示例。图6示出了在立方体的每个角落具有扬声器的播放环境。在该示例中,播放环境600的下左角落的(x,y,z)坐标为(0,0,0),播放环境600的上右角落的坐标为(1,1,1),并且中心的坐标为(0.5,0.5,0.5)。在图6中,示出了音频对象沿着从(0,0,0)延伸至(1,1,1)的线移动。当对位于播放环境600的中心(0.5,0.5,0.5)处的音频对象执行幅值移位过程时,可能存在来自播放环境600中的所有扬声器的贡献,并且低音积聚可能大于9dB。
图7A指示宽带输入信号随时间的幅度。图7B指示在播放环境的角落与中心之间移位四次的音频对象的、由图7A中所示的输入信号产生的超低音扬声器信号中的低音积聚。在该示例中,播放环境具有与图3A中所示的和上面描述的扬声器配置类似的杜比5.1.2扬声器配置(包括L扬声器、R扬声器、C扬声器、Ls扬声器、Rs扬声器、Ltm扬声器和Rtm扬声器以及超低音扬声器)。如图7B所示,被提供给超低音扬声器的信号中的低音积聚接近6dB。
在其他上下文中也可能发生低音积聚。例如,杜比最近开发了能够对所接收的基于“遗留”声道的音频数据如杜比环绕声5.1音频数据或杜比环绕声7.1音频数据实现阵列处理方法的声道音频呈现系统。在本文中,也可以将这种阵列处理方法称为“扬声器阵列处理方法”。如果播放环境包括非标准扬声器位置并且/或者包括比所接收的基于声道的音频数据的输入声道更多的输出声道,则一些阵列处理方法可以涉及将遗留声道的音频功率扩散至附近扬声器。一些这种阵列处理方法可以涉及对播放环境的位于靠近基于遗留声道的音频数据的标准扬声器位置(例如,靠近杜比环绕声5.1的左环绕扬声器位置或右环绕扬声器位置)的扬声器的输入音频信号进行复制。
一些这种阵列处理方法可以涉及与输入音频信号同相并且在相等功率水平的输入音频信号的复制。如果阵列处理方法使用功率相等水平并且将同相信号复制到附近扬声器,则可能导致低音积聚。例如,对于被阵列处理至附近扬声器(例如,左环绕1、左环绕2等)的左环绕扬声器馈送,如果应用传统的低音管理技术,则可能发生低音积聚。在具有4个阵列处理扬声器的场景中,预期在低音再现输出端(例如,在超低音扬声器的声道中)将存在大约6dB的低音积聚。
图8是示出用于减轻或消除低音积聚的低音管理过程的流程图。与本文中描述的其他方法一样,方法800的操作不一定按照所指示的次序执行。此外,这些方法可以包括比所示和/或描述的更多或更少的块。可以至少部分地通过逻辑系统如图11中所示并且下面描述的逻辑系统1110来实现这些方法。此外,可以通过存储有软件的非暂态介质来实现这样的方法。该软件可以包括用于控制一个或更多个装置至少部分地执行本文中描述的方法的指令。
在该示例中,方法800开始于块805,块805涉及接收包括音频对象的音频数据。音频对象包括音频对象信号和关联元数据。关联元数据包括指示音频对象在三维空间中的位置的位置元数据,关联元数据也可以包括音频对象增益信息、对象位置信息、音频对象大小信息等。在一些实现中,由系统的一个或更多个元件如图9至图11中所示的元件来执行块805。
图9是描绘音频处理系统的一个示例的框图。在该实现中,(至少部分地)通过音频处理系统900的低音提取模块910来执行图8的块810。在此,低音提取模块910从解码器915接收包括音频对象605的音频数据。然而,在替选实现中,解码器915可以是可选的或者可以被省略。例如,低音提取模块910可以以不要求解码的格式(例如脉冲编码调制流)接收音频数据。
返回至图8,块810涉及对音频对象信号应用涉及低通滤波器的低音提取过程以产生所提取的低频音频信号。在一些实现中,低通滤波器可以使60Hz以下的频率通过,而在其他实现中,低通滤波器可以使80Hz以下的频率、100Hz以下的频率、200Hz以下的频率等通过。在替选实现中,低通滤波器可以使更高的频率或更低的频率通过。在图9所示的示例中,在块810中,低音提取模块910对与所接收的音频对象605相对应的音频对象信号应用低音提取过程,以产生所提取的低音信号925。
在图9所描绘的示例中,在块805中,低音提取模块910也可以从解码器915接收音频音床信号920。在此,音频音床信号920被接收为与扬声器位置相对应的音床声道。因此,在该实现中,块810也涉及对音频音床信号920中的至少一些应用低音提取过程。
在图9所示的实现中,低音提取模块910也可以被配置成对音频对象信号和音频音床信号920中的至少一些应用高通滤波器。在此,低音提取模块910将高通滤波音频信号输出至呈现器945。在该示例中,高通滤波音频信号包括高通滤波音床信号935和高通滤波音频对象信号940。然而,在一些替选实现中,低音提取模块910可以不被配置成对音频对象信号和/或音频音床信号920应用高通滤波器。
在该示例中,图8的块815包括接收播放环境数据如由图9中的呈现器945接收的播放环境数据905。播放环境数据可以包括例如播放环境中的扬声器的数量的指示、每个扬声器在播放环境内的位置的指示以及能够再现低频音频信号的一个或更多个扬声器的指示。
在该示例中,图8的块820涉及将音频对象的音频信号呈现成一个或更多个扬声器馈送信号。在此,在低音提取过程之后执行呈现过程,并且呈现过程至少部分地基于播放环境数据以及与音频对象相关联的元数据(包括位置元数据)。每个扬声器馈送信号可以对应于播放环境的扬声器的至少之一。在图9所示的实现中,块820涉及将高通滤波音频对象信号940呈现成高通滤波扬声器馈送信号950a。
然而,本文中提供的一些实现不一定涉及基于音频对象的处理如块820的呈现过程。本文中提供的低音管理方法不限于音频对象上下文,而是也可以在对遗留音频数据进行处理时应用。如上所述,一些阵列处理方法可以涉及确定播放环境被配置成用于数量不同于(例如,超过)输入声道的数量的多个输出声道。这样的方法可以涉及对播放环境的位于接近基于声道的音频数据的标准扬声器位置的扬声器的基于输入声道的音频信号进行复制。本文中提供的一些低音管理方法涉及在阵列处理方法的信号复制过程之前应用低音提取过程。
因此,无论是对基于声道的音频数据还是对与音频对象相关联的音频音床信号进行处理,音频处理系统900都可以被配置成用于对所接收的音频数据进行上混或下混。上混或下混过程可以至少部分地基于播放环境中的扬声器的数量。例如,音频处理系统900的混合模块可以被配置成:接收播放环境数据905;根据播放环境数据905,基于播放环境中的扬声器的数量确定输出声道的数量;将输出声道的数量与所接收的输入声道的数量进行比较;以及相应地上混或下混所接收的输入声道的音频数据。
在该实现中,块825涉及对所提取的低频音频信号执行低音管理过程。低音管理过程可以涉及将所提取的低频音频信号传送至播放环境的能够再现低频音频信号的一个或更多个扬声器。
在图9所示的示例中,低音管理模块960被配置成接收所提取的低音信号925。在该示例中,低音管理模块960还被配置成从低频效果(LFE)声道接收LFE音频数据930。在此,低音管理模块960还被配置成用于将所提取的低音信号925与LFE音频数据930混合。
图9还描绘了可选块955,可选块955表示可选的附加处理。这样的附加处理可以涉及减轻混响效果、时间对准、均衡化等。在一些实现中,例如,可选块955可以被配置成接收高通滤波扬声器馈送信号950a,对这些信号进行处理并且输出高通滤波扬声器馈送信号950b。在一些实现中,可选块955可以被配置成对所提取的低音信号925和/或LFE音频数据930进行处理。然而,在一些实现中,不存在可选块955。
在该实现中,低音管理模块960还被配置成用于在混合之前将所提取的低音信号925与LFE音频数据930校平。校平过程可以涉及对LFE音频数据930进行放大和/或对所提取的低音信号925进行衰减。在图9中所示的示例中,LFE音频数据930被放大10dB。在一些实现中,在最终的低音管理之前,可以在声学上的相等水平将所提取的低音信号925和LFE音频数据930加在一起。根据一些这样的实现,该相加可以与低音提取过程一样早地发生。
低音管理过程还可以包括限制至少一些低频音频信号的幅度。例如,低音管理模块960包括限幅器970,限幅器970可以被配置成限制通过将LFE音频数据930与所提取的低音信号925进行组合而得到的信号的幅度。从限幅器970输出的低音再现扬声器馈送975可以被提供至播放环境的能够再现低频音频信号的一个或更多个扬声器。低音管理模块可以将高通滤波扬声器馈送信号例如作为受限范围扬声器馈送信号980输出至播放环境的将不用于再现低频音频信号的一个或更多个扬声器。
在一些实现中,块825的低音管理过程可以涉及将所提取的低频音频信号与扬声器馈送信号例如从块820的呈现过程得到的扬声器馈送信号进行组合。对这些信号进行组合可以适合于以下实现:播放环境不包括超低音扬声器,例如上面的配置2的播放环境。例如,如果播放环境的左扬声器和右扬声器是低音播放扬声器,则低音管理模块可以将左扬声器和右扬声器的所呈现的音频数据(例如,高通滤波扬声器馈送信号950b的相应部分)与LFE音频数据930和所提取的低音信号925组合。
图10是示出了替选音频处理系统的框图。在该示例中,音频处理系统1000被配置成用于在应用低音提取过程之前对音频数据进行预处理。此外,音频处理系统1000被配置成用于处理包括声场表示数据的音频数据,在该示例中声场表示数据是高阶高保真度立体声响复制TM(HOA)数据1015。在此,低音提取模块910包括音频对象低音提取模块1005和HOA低音提取模块1010,后者被配置成用于处理HOA数据1015。可以存在其他低音提取模块以从以除了HOA之外的格式表示的声场数据提取低音。
在该实现中,预处理模块1020接收音频对象信号1030a、音频音床信号920a、与音频对象605相关联的元数据1025以及播放环境数据905。预处理模块1020可以被配置成用于根据音频对象元数据或播放环境数据905中至少之一对音频对象信号1030a应用增益。例如,预处理模块1020可以根据与音频对象相关联的音频对象增益元数据来应用增益。
在一些实现中,预处理模块1020可以被配置成防止“削波(clipping)”或播放环境中的扬声器的扬声器过载。例如,在根据音频对象增益元数据对多个音频对象应用增益之后,预处理模块1020可以被配置成估计要应用到扬声器馈送信号的总增益。如果总增益超过预定阈值,则预处理模块1020可以被配置成降低总增益以避免使扬声器过载。在该示例中,预处理模块1020被配置成向音频对象低音提取模块1005提供经预处理的音频对象信号1030b和经预处理的音频音床信号920b。
在此,音频对象低音提取模块1005被配置成对经预处理的音频对象信号1030b和经预处理的音频音床信号920b进行复制,从而创建两个基本上相同的实例。在该示例中,音频对象低音提取模块1005被配置成对经预处理的音频对象信号1030b的第一实例应用高通滤波器,并且将所得到的高通滤波音频对象信号940转发至呈现器945。在此,音频对象低音提取模块1005被配置成对经预处理的音频对象信号1030b的第二实例应用低通滤波器,并且将所提取的低音信号925a转发至增益降低元件1032。在该示例中,增益降低元件1032通过将所提取的低音信号925a的幅度减小10dB来对LFE音频数据930和所提取的低音信号925a的幅度进行校平。在其他实施方式中,不对所提取的低音信号925a进行衰减而通过对由LFE音频数据930表示的LFE音频信号进行放大来实现校平。
类似地,在该示例中,音频对象低音提取模块1005被配置成对经预处理的音频音床信号920b的第一实例应用高通滤波器并且将所得到的高通滤波音床信号935a转发至可选的音床声道上混/下混模块1037。如上所述,音床声道上混/下混模块1037可以被配置成(例如,根据播放环境数据905)将播放环境的输出声道的数量与输入声道的数量进行比较,并且相应地对高通滤波音床信号935a进行上混、下混或者使高通滤波音床信号935a通过。在该示例中,音床声道上混/下混模块1037已经确定播放环境的输出声道的数量超过了输入音床声道的数量,对高通滤波音床信号935a应用了下混处理,并且将经下混的高通滤波音床信号935b转发至了呈现器945。在此,音频对象低音提取模块1005被配置成对经预处理的音频音床信号920b的第二实例应用低通滤波器,并且将所提取的低音信号925b转发至增益降低元件1032。
在该示例中,HOA低音提取模块1010被配置成用于对声场表示数据的第一部分的不同副本应用低音提取过程和高通滤波器并且用于对声场表示数据的第二部分应用高通滤波器但不应用低音提取过程。HOA低音提取模块1010可以被配置成保持声场表示数据的第一部分和第二部分之间的相位。由于可以从信号的第一部分提取HOA信号的低频数据,所以HOA低音提取模块1010从该第一部分提取低音。其他低音提取模块(未示出)可以从以其他格式表示的声场信号的一部分或全部提取低音。
在图10所示的示例中,声场表示数据是HOA数据1015,具体地,是高阶B格式高保真度立体声响复制TM数据。在其他实现中,HOA低音提取模块1010可以被配置成接收和处理不同类型的声场表示数据如G格式数据和/或UHJ格式数据。在此,HOA低音提取模块1010被配置成与其他声道不同地地对HOA数据1015的W声道数据进行处理。在该示例中,其他声道被高通滤波并且所得到的高通滤波数据1035被提供至HOA矩阵模块1045。然而,在该实现中,HOA低音提取模块1010被配置成对W声道数据进行复制,使得存在W声道数据的两个基本相同的实例。一个实例被高通滤波并且所得到的高通滤波W声道数据1040被提供至HOA矩阵模块1045。W声道数据的另一个实例被低通滤波并且所得到的所提取的W声道低音信号1042被发送至增益降低元件1032。在该示例中,音频处理系统1000被配置成将由增益降低元件1032输出的所提取的低音信号925与LFE音频数据930组合并且被输出为低音再现扬声器馈送975。
在该示例中,HOA矩阵模块1045被配置成对高通滤波数据1035和高通滤波W声道数据1040进行处理,并且将高通滤波扬声器馈送信号1050输出至呈现器945。在一些实现中,HOA矩阵模块1045可以被配置成例如通过参考查找表或其他这样的数据结构来根据非时变过程对高通滤波数据1035和高通滤波W声道数据1040进行处理。
在该示例中,呈现器945被配置成至少部分地基于播放环境数据905和元数据1025产生高通滤波音频对象信号940的扬声器馈送信号。呈现器945可以被配置成将高通滤波音床信号935b和高通滤波扬声器馈送信号1050与由呈现器945产生的其他扬声器馈送信号组合并且输出受限范围扬声器馈送信号980。
图11是提供创作和/或呈现设备的部件示例的框图。在该示例中,装置1100包括接口系统1105。接口系统1105可以包括网络接口如无线网络接口。替代地或另外地,接口系统1105可以包括通用串行总线(USB)接口或其他这样的接口。
装置1100包括逻辑系统1110。逻辑系统1110可以包括处理器如通用单芯片或多芯片处理器。逻辑系统1110可以包括数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他可编程逻辑装置、分立门或晶体管逻辑、或者分立硬件部件、或者其组合。逻辑系统1110可以被配置成对装置1100的其他部件进行控制。虽然在图11中未示出装置1100的部件之间的接口,但是逻辑系统1110可以被配置有用于与其他部件进行通信的接口。根据需要,其他部件可以被配置成或者不被配置成用于彼此通信。
逻辑系统1110可以被配置成执行音频处理功能,音频处理功能包括但不限于本文中描述的各种类型的音频创作、呈现和/或低音管理功能。在一些这样的实现中,逻辑系统1110可以被配置成(至少部分地)根据存储在一个或更多个非暂态介质中的软件进行操作。非暂态介质可以包括与逻辑系统1110相关联的存储器如随机存取存储器(RAM)和/或只读存储器(ROM)。非暂态介质可以包括存储器系统1115的存储器。存储器系统1115可以包括一个或更多个适当类型的非暂态存储介质如闪速存储器、硬盘驱动器等。
取决于装置1100的表现形式,显示系统1130可以包括一个或更多个适当类型的显示器。例如,显示系统1130可以包括液晶显示器、等离子显示器、双稳态显示器等。
用户输入系统1135可以包括被配置成接受来自用户的输入的一个或更多个装置。在一些实现中,用户输入系统1135可以包括置于显示系统1130的显示器上的触摸屏。用户输入系统1135可以包括鼠标、跟踪球、姿势检测系统、操纵杆、在显示系统1130上展现的一个或更多个GUI和/或菜单、按钮、键盘、开关等。在一些实现中,用户输入系统1135可以包括麦克风1125:用户可以通过麦克风1125为装置1100提供语音命令。逻辑系统可以被配置成用于语音识别以及用于根据这样的语音命令来控制装置1100的至少一些操作。
电力系统1140可以包括一个或更多个适当的能量存储装置如镍镉电池或锂离子电池。电力系统1140可以被配置成从电插座接收电力。
对于本领域的普通技术人员而言,对本公开内容中描述的实现的各种修改是显见的。在不偏离本公开内容的精神或范围的情况下,可以将本文中限定的一般原理应用于其他实现。因此,权利要求并不意在限于本文中所示的实现,而是意在与符合本公开内容、本文中所公开的原理和新颖特征的最广的范围一致。
Claims (43)
1.一种音频处理方法,包括:
接收包括音频对象的音频数据,所述音频对象包括音频对象信号和关联元数据,所述关联元数据包括所述音频对象的位置元数据;
对所述音频对象信号应用涉及低通滤波器的低音提取过程,以产生提取的低频音频信号;
对所述音频对象信号中的至少一些应用高通滤波器,以产生高通滤波音频信号;
接收播放环境数据,所述播放环境数据包括播放环境中的扬声器的数量的指示、每个扬声器在所述播放环境内的位置的指示以及能够再现低频音频信号的一个或更多个扬声器的指示;
在所述低音提取过程之后,至少部分地基于所述播放环境数据和所述关联元数据将所述音频对象的所述高通滤波音频信号呈现成一个或更多个高通滤波扬声器馈送信号,其中每个扬声器馈送信号对应于所述播放环境的所述扬声器的至少之一;以及
对所述提取的低频音频信号执行低音管理过程,其中所述低音管理过程涉及将所述提取的低频音频信号传送至能够再现低频音频信号的所述一个或更多个扬声器,
其中,所述音频数据包括声场表示数据,并且所述音频处理方法还包括:
对所述声场表示数据的第一部分的不同副本应用低音提取过程和高通滤波器;以及
对所述声场表示数据的第二部分的不同副本应用高通滤波器但不应用低音提取过程。
2.根据权利要求1所述的音频处理方法,其中,所述低音管理过程涉及限制至少一些低频音频信号的幅度。
3.根据权利要求1或权利要求2所述的音频处理方法,其中,所述低音管理过程涉及将所述提取的低频音频信号与所述扬声器馈送信号组合。
4.根据权利要求1所述的音频处理方法,其中,所述音频数据包括与扬声器位置相对应的音频音床信号,并且其中所述应用过程涉及对所述音频音床信号中的至少一些应用低音提取过程。
5.根据权利要求4所述的音频处理方法,还包括对音频音床信号应用上混或下混过程,所述上混或下混过程至少部分地基于所述播放环境中的扬声器的数量。
6.根据权利要求1所述的音频处理方法,还包括在应用所述低音提取过程之前对所述音频数据进行预处理。
7.根据权利要求6所述的音频处理方法,其中,所述预处理涉及根据所述音频对象元数据或所述播放环境数据中至少之一来对所述音频对象信号应用增益。
8.根据权利要求1所述的音频处理方法,其中,对所述声场表示数据的所述第一部分和所述第二部分应用的所述高通滤波器是同一高通滤波器。
9.根据权利要求1所述的音频处理方法,其中,所述音频数据是从解码器接收的。
10.根据权利要求1所述的音频处理方法,其中,所述音频数据是作为脉冲编码调制流接收的。
11.根据权利要求1所述的音频处理方法,其中,所接收的音频数据包括低频效果音频声道,其中所述低音管理过程还包括将所述提取的低频音频信号与所述低频效果音频声道的低频效果音频数据进行混合。
12.根据权利要求11所述的音频处理方法,还包括在混合之前将所述提取的低频音频信号与所述低频效果音频声道进行校平,所述校平过程涉及以下操作的至少之一:对所述低频效果音频数据进行放大或者对所提取的低频效果音频信号进行衰减。
13.根据权利要求1所述的音频处理方法,其中,接收所述音频数据并且通过上混对所述音频数据进行处理,所述上混包括扬声器阵列处理。
14.一种音频处理设备,包括:
接口;以及
逻辑系统,所述逻辑系统能够:
接收包括音频对象的音频数据,所述音频对象包括音频对象信号和关联元数据,所述关联元数据包括所述音频对象的位置元数据;
对所述音频对象信号应用涉及低通滤波器的低音提取过程,以产生提取的低频音频信号;
对所述音频对象信号中的至少一些应用高通滤波器,以产生高通滤波音频信号;
接收播放环境数据,所述播放环境数据包括播放环境中的扬声器的数量的指示、每个扬声器在所述播放环境内的位置的指示以及能够再现低频音频信号的一个或更多个扬声器的指示;
在所述低音提取过程之后,至少部分地基于所述播放环境数据和所述关联元数据将所述音频对象的高通滤波音频信号呈现成一个或更多个高通滤波扬声器馈送信号,其中每个扬声器馈送信号对应于所述播放环境的所述扬声器的至少之一;以及
对所述提取的低频音频信号执行低音管理过程,其中所述低音管理过程涉及将所述提取的低频音频信号传送至能够再现低频音频信号的所述一个或更多个扬声器,
其中,所述音频数据包括声场表示数据,并且其中所述逻辑系统还能够:
对所述声场表示数据的第一部分的不同副本应用低音提取过程和高通滤波器;以及
对所述声场表示数据的第二部分的不同副本应用高通滤波器但不应用低音提取过程。
15.根据权利要求14所述的音频处理设备,其中,所述低音管理过程涉及限制至少一些低频音频信号的幅度。
16.根据权利要求14或权利要求15所述的音频处理设备,其中,所述低音管理过程涉及将所述提取的低频音频信号与所述扬声器馈送信号组合。
17.根据权利要求14所述的音频处理设备,其中,所述音频数据包括与扬声器位置相对应的音频音床信号,并且其中所述应用过程涉及对所述音频音床信号中的至少一些应用低音提取过程。
18.根据权利要求17所述的音频处理设备,还包括对音频音床信号应用上混或下混过程,所述上混或下混过程至少部分地基于所述播放环境中的扬声器的数量。
19.根据权利要求14所述的音频处理设备,其中,所述逻辑系统还能够在应用所述低音提取过程之前对所述音频数据进行预处理。
20.根据权利要求19所述的音频处理设备,其中,所述预处理涉及根据所述音频对象元数据或所述播放环境数据中至少之一来对所述音频对象信号应用增益。
21.根据权利要求14所述的音频处理设备,其中,对所述声场表示数据的所述第一部分和所述第二部分应用的所述高通滤波器是同一高通滤波器。
22.根据权利要求14所述的音频处理设备,其中,所述音频数据是从解码器接收的。
23.根据权利要求14所述的音频处理设备,其中,所述音频数据是作为脉冲编码调制流接收的。
24.根据权利要求14所述的音频处理设备,其中,所接收的音频数据包括低频效果音频声道,并且其中所述低音管理过程还包括将所述提取的低频音频信号与所述低频效果音频声道的低频效果音频数据进行混合。
25.根据权利要求24所述的音频处理设备,其中,所述逻辑系统还能够在混合之前将所述提取的低频音频信号与所述低频效果音频声道进行校平,所述校平过程涉及以下操作的至少之一:对所述低频效果音频数据进行放大或者对所提取的低频效果音频信号进行衰减。
26.根据权利要求14所述的音频处理设备,其中,所述音频数据被接收并且通过上混进行处理,所述上混包括扬声器阵列处理。
27.根据权利要求14所述的音频处理设备,其中,所述逻辑系统包括以下装置中的至少之一:通用单芯片或多芯片处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他可编程逻辑装置、或者分立硬件部件。
28.根据权利要求27所述的音频处理设备,其中,所述分立硬件部件包括分立门或分立晶体管逻辑。
29.根据权利要求14所述的音频处理设备,还包括存储器装置,其中所述接口包括所述逻辑系统和所述存储器装置之间的接口。
30.根据权利要求14所述的音频处理设备,其中,所述接口包括网络接口。
31.一种存储有软件的非暂态介质,所述软件包括用于控制至少一个设备进行以下操作的指令:
接收包括音频对象的音频数据,所述音频对象包括音频对象信号和关联元数据,所述关联元数据包括所述音频对象的位置元数据;
对所述音频对象信号应用涉及低通滤波器的低音提取过程,以产生提取的低频音频信号;
对所述音频对象信号中的至少一些应用高通滤波器,以产生高通滤波音频信号;
接收播放环境数据,所述播放环境数据包括播放环境中的扬声器的数量的指示、每个扬声器在所述播放环境内的位置的指示以及能够再现低频音频信号的一个或更多个扬声器的指示;
在所述低音提取过程之后,至少部分地基于所述播放环境数据和所述关联元数据将所述音频对象的高通滤波音频信号呈现成一个或更多个高通滤波扬声器馈送信号,其中每个扬声器馈送信号对应于所述播放环境的所述扬声器的至少之一;以及
对所述提取的低频音频信号执行低音管理过程,其中所述低音管理过程涉及将所述提取的低频音频信号传送至能够再现低频音频信号的所述一个或更多个扬声器,
其中,所述音频数据包括声场表示数据,并且其中所述软件包括用于控制所述至少一个设备进行以下操作的指令:
对所述声场表示数据的第一部分的不同副本应用低音提取过程和高通滤波器;以及
对所述声场表示数据的第二部分的不同副本应用高通滤波器但不应用低音提取过程。
32.根据权利要求31所述的非暂态介质,其中,所述低音管理过程涉及限制至少一些低频音频信号的幅度。
33.根据权利要求31或权利要求32所述的非暂态介质,其中,所述低音管理过程涉及将所述提取的低频音频信号与所述扬声器馈送信号组合。
34.根据权利要求31所述的非暂态介质,其中,所述音频数据包括与扬声器位置相对应的音频音床信号,并且其中所述应用过程涉及对所述音频音床信号中的至少一些应用低音提取过程。
35.根据权利要求34所述的非暂态介质,其中,所述软件包括用于控制所述至少一个设备对音频音床信号应用上混或下混过程的指令,所述上混或下混过程至少部分地基于所述播放环境中的扬声器的数量。
36.根据权利要求31或权利要求32所述的非暂态介质,其中,所述软件包括用于控制所述至少一个设备在应用所述低音提取过程之前对所述音频数据进行预处理的指令。
37.根据权利要求36所述的非暂态介质,其中,所述预处理涉及根据所述音频对象元数据或所述播放环境数据中至少之一来对所述音频对象信号应用增益。
38.根据权利要求31所述的非暂态介质,其中,对所述声场表示数据的所述第一部分和所述第二部分应用的所述高通滤波器是同一高通滤波器。
39.根据权利要求31或权利要求32所述的非暂态介质,其中,所述音频数据是从解码器接收的。
40.根据权利要求31或权利要求32所述的非暂态介质,其中,所述音频数据是作为脉冲编码调制流接收的。
41.根据权利要求31或权利要求32所述的非暂态介质,其中,所接收的音频数据包括低频效果音频声道,其中所述低音管理过程还包括将所述提取的低频音频信号与所述低频效果音频声道的低频效果音频数据进行混合。
42.根据权利要求41所述的非暂态介质,其中,所述软件包括用于控制所述至少一个设备在混合之前将所述提取的低频音频信号与所述低频效果音频声道进行校平的指令,所述校平过程涉及以下操作的至少之一:对所述低频效果音频数据进行放大或者对所述提取的低频音频信号进行衰减。
43.根据权利要求31或权利要求35所述的非暂态介质,其中,接收所述音频数据并且通过上混对所述音频数据进行处理,所述上混包括扬声器阵列处理。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361836519P | 2013-06-18 | 2013-06-18 | |
US61/836,519 | 2013-06-18 | ||
PCT/US2014/042654 WO2014204911A1 (en) | 2013-06-18 | 2014-06-17 | Bass management for audio rendering |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105340300A CN105340300A (zh) | 2016-02-17 |
CN105340300B true CN105340300B (zh) | 2018-04-13 |
Family
ID=51177171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480035176.9A Active CN105340300B (zh) | 2013-06-18 | 2014-06-17 | 用于音频呈现的低音管理 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9723425B2 (zh) |
EP (2) | EP3474575B1 (zh) |
JP (1) | JP6276402B2 (zh) |
CN (1) | CN105340300B (zh) |
WO (1) | WO2014204911A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3335436B1 (en) * | 2015-08-14 | 2021-10-06 | DTS, Inc. | Bass management for object-based audio |
KR102423753B1 (ko) * | 2015-08-20 | 2022-07-21 | 삼성전자주식회사 | 스피커 위치 정보에 기초하여, 오디오 신호를 처리하는 방법 및 장치 |
WO2017165837A1 (en) * | 2016-03-24 | 2017-09-28 | Dolby Laboratories Licensing Corporation | Near-field rendering of immersive audio content in portable computers and devices |
EP3868129B1 (en) * | 2018-10-16 | 2023-10-11 | Dolby Laboratories Licensing Corporation | Methods and devices for bass management |
EP3726858A1 (en) * | 2019-04-16 | 2020-10-21 | Fraunhofer Gesellschaft zur Förderung der Angewand | Lower layer reproduction |
CN112599133A (zh) * | 2020-12-15 | 2021-04-02 | 北京百度网讯科技有限公司 | 基于车辆的语音处理方法、语音处理器、车载处理器 |
CN113905322A (zh) * | 2021-09-01 | 2022-01-07 | 赛因芯微(北京)电子科技有限公司 | 基于双耳音频通道元数据和生成方法、设备及存储介质 |
CN113938811A (zh) * | 2021-09-01 | 2022-01-14 | 赛因芯微(北京)电子科技有限公司 | 基于音床音频通道元数据和生成方法、设备及存储介质 |
CN114040317B (zh) * | 2021-09-22 | 2024-04-12 | 北京车和家信息技术有限公司 | 音响的声道补偿方法及装置、电子设备和存储介质 |
CN114363790A (zh) * | 2021-11-26 | 2022-04-15 | 赛因芯微(北京)电子科技有限公司 | 串行音频块格式元数据生成方法、装置、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1748442A (zh) * | 2003-06-25 | 2006-03-15 | 哈曼国际工业有限公司 | 多声道声音处理系统 |
CN1906971A (zh) * | 2003-11-26 | 2007-01-31 | 弗劳恩霍夫应用研究促进协会 | 产生低频声道的设备与方法 |
WO2013006338A2 (en) * | 2011-07-01 | 2013-01-10 | Dolby Laboratories Licensing Corporation | System and method for adaptive audio signal generation, coding and rendering |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI105522B (fi) | 1996-08-06 | 2000-08-31 | Sample Rate Systems Oy | Järjestely kotiteatteri- tai muussa äänentoistolaitteistossa |
JP3788537B2 (ja) | 1997-01-20 | 2006-06-21 | 松下電器産業株式会社 | 音響処理回路 |
US7236838B2 (en) | 2000-08-29 | 2007-06-26 | Matsushita Electric Industrial Co., Ltd. | Signal processing apparatus, signal processing method, program and recording medium |
US20040252844A1 (en) | 2001-05-09 | 2004-12-16 | Christensen Knud Bank | Method of interacting with the acoustical modal structure of a room |
US7443987B2 (en) | 2002-05-03 | 2008-10-28 | Harman International Industries, Incorporated | Discrete surround audio system for home and automotive listening |
KR100608005B1 (ko) | 2004-09-06 | 2006-08-02 | 삼성전자주식회사 | 서브 우퍼 채널 신호의 위상 보정 방법 및 그 장치 |
US7826626B2 (en) | 2004-09-07 | 2010-11-02 | Audyssey Laboratories, Inc. | Cross-over frequency selection and optimization of response around cross-over |
JP2006129372A (ja) | 2004-11-01 | 2006-05-18 | Kenwood Corp | 信号処理装置及び音響再生システム |
US7974417B2 (en) | 2005-04-13 | 2011-07-05 | Wontak Kim | Multi-channel bass management |
US8238576B2 (en) * | 2005-06-30 | 2012-08-07 | Cirrus Logic, Inc. | Level dependent bass management |
US20090116653A1 (en) | 2005-07-11 | 2009-05-07 | Hajime Yoshino | Audio signal processing device, audio signal processing method, program thereof, and recording meduim containing the program |
JP2007053553A (ja) | 2005-08-17 | 2007-03-01 | Matsushita Electric Ind Co Ltd | 音声再生装置 |
US20080075302A1 (en) | 2006-09-12 | 2008-03-27 | Mediatek Inc. | Multiple audio channel bass management method and system |
US20120014524A1 (en) | 2006-10-06 | 2012-01-19 | Philip Vafiadis | Distributed bass |
JP2010506232A (ja) * | 2007-02-14 | 2010-02-25 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号の符号化及び復号化方法並びにその装置 |
US20100220864A1 (en) | 2007-10-05 | 2010-09-02 | Geoffrey Glen Martin | Low frequency management for multichannel sound reproduction systems |
EP2239958A3 (en) | 2009-03-06 | 2015-06-24 | LG Electronics Inc. | An apparatus for processing an audio signal and method thereof |
CN102804810B (zh) * | 2009-05-01 | 2015-10-14 | 哈曼国际工业有限公司 | 频谱管理系统 |
PL3079152T3 (pl) | 2010-07-02 | 2018-10-31 | Dolby International Ab | Dekodowanie audio z selektywnym późniejszym filtrowaniem |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
US20120308042A1 (en) | 2011-06-01 | 2012-12-06 | Visteon Global Technologies, Inc. | Subwoofer Volume Level Control |
WO2013006330A2 (en) * | 2011-07-01 | 2013-01-10 | Dolby Laboratories Licensing Corporation | System and tools for enhanced 3d audio authoring and rendering |
ES2534283T3 (es) | 2011-07-01 | 2015-04-21 | Dolby Laboratories Licensing Corporation | Ecualización de conjuntos de altavoces |
RS1332U (en) | 2013-04-24 | 2013-08-30 | Tomislav Stanojević | FULL SOUND ENVIRONMENT SYSTEM WITH FLOOR SPEAKERS |
-
2014
- 2014-06-17 US US14/899,481 patent/US9723425B2/en active Active
- 2014-06-17 EP EP18199090.4A patent/EP3474575B1/en active Active
- 2014-06-17 EP EP14738968.8A patent/EP3011764B1/en active Active
- 2014-06-17 WO PCT/US2014/042654 patent/WO2014204911A1/en active Application Filing
- 2014-06-17 JP JP2016521499A patent/JP6276402B2/ja active Active
- 2014-06-17 CN CN201480035176.9A patent/CN105340300B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1748442A (zh) * | 2003-06-25 | 2006-03-15 | 哈曼国际工业有限公司 | 多声道声音处理系统 |
CN1906971A (zh) * | 2003-11-26 | 2007-01-31 | 弗劳恩霍夫应用研究促进协会 | 产生低频声道的设备与方法 |
WO2013006338A2 (en) * | 2011-07-01 | 2013-01-10 | Dolby Laboratories Licensing Corporation | System and method for adaptive audio signal generation, coding and rendering |
Also Published As
Publication number | Publication date |
---|---|
JP2016524883A (ja) | 2016-08-18 |
US20160150347A1 (en) | 2016-05-26 |
EP3011764A1 (en) | 2016-04-27 |
WO2014204911A1 (en) | 2014-12-24 |
EP3474575A1 (en) | 2019-04-24 |
CN105340300A (zh) | 2016-02-17 |
JP6276402B2 (ja) | 2018-02-07 |
EP3011764B1 (en) | 2018-11-21 |
EP3474575B1 (en) | 2020-05-27 |
US9723425B2 (en) | 2017-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105340300B (zh) | 用于音频呈现的低音管理 | |
US11019447B2 (en) | Rendering of audio objects with apparent size to arbitrary loudspeaker layouts | |
US20230388738A1 (en) | System and tools for enhanced 3d audio authoring and rendering | |
CN109040946B (zh) | 使用元数据处理的耳机的双耳呈现 | |
RU2731025C2 (ru) | Система и способ для генерирования, кодирования и представления данных адаптивного звукового сигнала | |
JP6055576B2 (ja) | 任意のスピーカー・レイアウトへのオーディオ・オブジェクトのパン | |
CN108777836A (zh) | 用于音频信号解码的解码矩阵的确定方法和装置 | |
CN106961647A (zh) | 音频再生装置以及方法 | |
CN106688253A (zh) | 在包括环绕扬声器和/或高度扬声器的再现环境中呈现音频对象 | |
Vilkaitis et al. | Ambisonic Sound Design for Theatre with Virtual Reality Demonstration-A Case Study | |
Ekeberg | Space, Place and dematerialization | |
MAGLIOZZI | An ambisonics based VST plug in for 3D music production |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |