CN105103222A - 用于响度和动态范围控制的元数据 - Google Patents

用于响度和动态范围控制的元数据 Download PDF

Info

Publication number
CN105103222A
CN105103222A CN201480018634.8A CN201480018634A CN105103222A CN 105103222 A CN105103222 A CN 105103222A CN 201480018634 A CN201480018634 A CN 201480018634A CN 105103222 A CN105103222 A CN 105103222A
Authority
CN
China
Prior art keywords
drc
sound signal
audio
metadata
yield value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480018634.8A
Other languages
English (en)
Other versions
CN105103222B (zh
Inventor
F·鲍姆加特
E·A·阿拉曼彻
S·K·O·斯特罗默尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apple Inc
Original Assignee
Apple Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apple Computer Inc filed Critical Apple Computer Inc
Priority to CN202010164205.9A priority Critical patent/CN111370007B/zh
Priority to CN202311381485.9A priority patent/CN117275493A/zh
Publication of CN105103222A publication Critical patent/CN105103222A/zh
Application granted granted Critical
Publication of CN105103222B publication Critical patent/CN105103222B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/20Automatic control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Abstract

向音频信号应用音频归一化增益值以产生归一化信号。处理该归一化信号以根据若干个预定义的DRC特性中的所选择的一个预定义的DRC特性来计算动态范围控制(DRC)增益值。对音频信号进行编码,并且提供DRC增益值作为与经编码的音频信号相关联的元数据。还描述了若干个其它实施例并要求对其进行保护。

Description

用于响度和动态范围控制的元数据
本非临时专利申请要求于2013年3月29日提交的美国临时专利申请61/806,570的较早提交日期的权益。
本发明的实施例总体上涉及音频信号的编码和解码以及使用与经编码的信号相关联的元数据来改善消费电子最终用户设备中的经解码的信号的回放质量。还描述了其他实施例。
背景技术
数字音频内容出现在很多不同情况中,例如包括音乐和电影文件。在大部分情况下,对音频信号进行编码以用于降低数据速率的目的,使得媒体文件或流的传输或递送消耗更小的带宽并且更快,由此允许同时进行许多其他传输。可在不同类型的最终用户设备中接收媒体文件或流,其中在通过内置或可拆卸扬声器向消费者进行呈现之前,对经编码的音频信号进行解码。这样有助于满足消费者通过因特网获得数字媒体的需求。数字音频节目的创建者和分销者有几种行业标准可用,可将其用于对音频内容进行编码和解码。这包括由高级电视系统协会于2005年6月14日发布的数字音频压缩标准(AC-3,E-AC-3),版本B,文档A/52B(“ATSC标准”)、欧洲电信标准协会基于ISO/IEC13818-7中的MPEG-2传输流的ETSITS101154数字视频广播(DVB)、由国际标准化组织(ISO)发布的高级音频编码(AAC)(“MPEG-2AAC标准”)以及ISO/IEC14496-3(“MPEG-4音频”)。
越来越多的最终用户设备用于回放数字音频,包括台式计算机、膝上型计算机、便携式手持设备(例如,智能电话)、家用电视和车载媒体系统。这些设备具有不同的模拟信号路径、扬声器和声学环境。而且,音频信号的动态范围在不同节目之间有变化。此外,数字音频节目的生产者(包括创建者,有时甚至包括分销者)常常希望通过以数字方式修改音频信号来提高其节目的平均响度,使其平均响度高若干个dB。然而,这样做还需要降低所得音频信号的峰值水平,以便避免剪辑(这会导致不期望的听觉失真)。这是使用动态范围控制(DRC)来实现的,其压缩音频信号的高低水平,使得所得音频信号能够匹配在更窄的包络(由此避免剪辑)内。不过,所有这些因素都带来一个问题:由最终用户感知到的响度可能会在不同最终用户设备之间以及在同一设备上的连续节目之间都有显著变化,从而导致回放期间的不愉快的用户体验。
软件工具诸如AppleInc.的SoundCheckTM程序自动调节歌曲的回放音量以希望获得相同的感知响度,因此例如与1970年代的老歌相比,动态范围更小但平均响度更大的近期流行唱片会被调低。而且,音频节目可包括与经编码的音频信号相关联并且描述相关联的音频信号的元数据部分。元数据可包括由最终用户设备中的软件用于控制例如对话水平、DRC和经解码的音频信号的任何下混频的信息,以便改变消费者在回放期间的体验。
发明内容
希望有一种系统性但仍然灵活的方式来使用任何常规编码/解码(编解码)和相关联的元数据构造来控制向消费者递送的音频质量。在下文中更详细地描述了本发明的至少如下实施例。
在一个实施例中,一种用于对音频信号编码的方法包括向音频信号应用音频归一化增益值,以便产生归一化信号。处理归一化信号以针对归一化信号来计算多个动态范围控制(DRC)增益值。根据若干个预定义的DRC特性中的所选择的一个预定义的DRC特性来计算DRC增益值。对音频信号进行编码,并且提供增益值作为与经编码的信号相关联的元数据。然后可在回放处理的解码级中将所提供的DRC增益值应用于经解码的音频信号,以在回放期间调节经解码的音频信号的动态范围。
在另一个实施例中,几个预定义的DRC特性对于编码器和解码器设备是“已知”的。将在编码设备中使用的DRC特性索引传送到解码器设备。这使得最终用户设备的解码器设备能够根据本地参数来修改所提供的DRC增益值(用于压缩经解码的音频信号),该本地参数例如用户输入(包括回放音量和/或响度归一化开关设置)、用户上下文(或使用最终用户设备的条件,例如深夜、车中等)和待用于回放经解码的音频信号的数模转换器和扬声器的动态范围。
在另一个实施例中,可在编码设备中计算关于例如多声道音频信号的DRC压缩版本或下混频版本的响度信息或响度参数。然后可提供响度信息作为与经编码的多声道音频信号相关联的元数据。在一个实施例中,在编码设备处,测量输入多声道音频信号的下混频版本的响度参数,并且其中可能在先前向输入信号应用或未应用DRC的情况下已获得下混频信号。
各种响度参数可由编码级与例如用于在编码级中产生下混频信号的下混频增益一起提供,作为与输入信号的经编码的版本相关联的元数据。包含在元数据中的响度信息可包括以下各项中的一者或多者:节目响度(如整个音频节目的主观响度度量中那样,例如根据ITUBS.1770所计算的)、真峰值(诸如根据ITUBS.1770所测量得)、锚定响度、响度范围、响度范围上限、最大瞬时响度和短期响度。这种元数据还可包括已选择以为输入音频信号生成DRC增益值的DRC特性的索引,该DRC增益值也可包括在元数据中。
在解码设备中,DRC处理器能够基于1)在元数据中获得的DRC特性的索引,2)在元数据中获得的DRC增益值,和3)本地参数例如包括用户输入诸如音量设置和响度归一化开/关设置来为DRC调节或生成不同的增益值。于是,在回放处理期间可实时实现动态范围控制,而无需解码设备计算经解码的音频信号的每帧响度值(或DRC输入水平)。在一个实施例中,在对音频文件或流进行解码时,与音频文件或流相关联的元数据由运行于解码器设备中的媒体播放器读取,并用于(在数模转换之前)自动(即,无需用户输入并且对于用户而言是透明的)调节经解码的数字音频内容的响度。取决于用户输入和用户所选择的回放模式的动态范围(例如,线外扬声器相对于内置扬声器),可这样做来改善用户回放音频文件或流中的内容的体验。
在另一个实施例中,根据由用户设置的回放音量和/或由编码设备测量并经由元数据提供的真峰值和/或基于目标净空(数字音频信号的峰值水平及其剪辑水平之间的差异)来控制解码设备中所应用的DRC压缩量,目标净空值可在解码设备中基于用户回放音量设置和可从用于回放的数模转换和扬声器设备获得的动态范围来计算。
在又一个实施例中,可在解码级中限定目标DRC特性,并且可通过i)找出使用哪个编码级DRC特性,以及ii)比较两个DRC特性以确定如何修改所接收的DRC增益值来实现这个目标。于是,在解码器处基于从元数据所提取的DRC特性索引(指向由编码器使用的DRC特性)、在编码级处设置的所提取的DRC增益值,并基于表示采用不同目标DRC特性索引的特定本地条件来实时修改动态范围调节。
在另一个实施例中,产生关于DRC压缩音频内容信号的响度信息和/或混频音频内容信号,并作为元数据嵌入经编码的多声道数字音频文件或流中。然后,在解码(在解码级中)之后使用这一特定元数据,以通过定制经解码的多声道音频内容的下混频来改善用户体验。
在又一个实施例中,改变解码级中(在驱动扬声器之前向经解码的音频内容信号)应用的DRC压缩量,以便避免扬声器的输入处的剪辑。DRC压缩的这种变化可以是以下各项的函数:a)由用户设置的回放音量,b)(从经编码的音频文件或流提取的)真峰值和/或c)(在应用DRC压缩之后)数模转换器(DAC)的输入处的目标净空。例如,在低回放音量下存在更多净空,使得可应用更小的DRC压缩,这继而将允许经解码的音频信号中更高的峰值被传送到扬声器。
以上发明内容不包括本发明的所有方面的详尽列表。可以预期的是,本发明包括可根据上文概述的各个方面以及在下文的具体实施方式中公开并且在随该专利申请提交的权利要求中特别指出的各种方面的所有的合适组合来实施的所有系统和方法。此类组合具有未在上述发明内容中具体阐述的特定优点。
附图说明
本发明的实施例以举例的方式进行说明,而不仅限于各个附图的图示,在附图中类似的附图标号指示类似的元件。应当指出,本公开中提到“一”或“一个”实施例未必是同一实施例,并且它们表示至少一个实施例。而且,可使用给定数字示出本发明多于一个实施例的特征,并且对于给定实施例而言可不需要所有元件。
图1是数字音频编码级或编码设备的相关部件的框图。
图2示出了可用于编码级中的几个示例性DRC特性。
图3是解码器级或解码器设备的相关部件的框图,尤其是在回放经解码的音频信号期间执行的解码器级或解码器设备。
图4示出了可用于解码级中以产生新的DRC增益值的几个示例性DRC特性。
图5是解码级中的部件的框图,该部件具有接收经解码的多声道音频信号的下混频处理器。
图6示出了适用于解码级中以产生新的增益值的几个示例性DRC特性。
图7是适于特定下混频情形的数字音频编码级或编码设备的相关部件的框图。
具体实施方式
本文中将本发明的若干个实施例描述为数字音频编码和解码中的元数据增强,以用于在回放经编码的音频文件或具有指定元数据的经编码的音频流期间进行响度归一化和动态范围控制(DRC)。虽然阐述了许多细节,但应当理解,本发明的一些实施例可在没有这些细节的情况下实施。在其他情况下,未详细示出熟知的电路、结构和技术,以免模糊对本具体实施方式的理解。例如,本文在根据MPEG标准实现比特率减小而编码的上下文中描述了特定细节,但本发明的实施例还适用于其他形式的音频编码和解码,包括无损数据压缩诸如苹果无损音频编解码(ALAC)。
参考图1,其示出了根据本发明实施例的编码器级或编码器设备的框图。可使用这一框图来不仅描述数字音频编码器设备,而且描述一种用于对音频信号进行编码的方法。数字音频信号是由编码器2来编码的,然后可使用复用器(mux)8与元数据组装在一起。所得的经编码的音频或经编码的音频比特流包含嵌入式元数据,该嵌入式元数据包括数字音频每帧的动态范围控制(DRC)增益值。尽管未示出,但在经编码的信号中嵌入元数据的替代方式是通过图1中称为辅助数据声道7的独立元数据声道提供元数据(在这种情况下包括每帧的DRC增益值)。对音频信号进行编码可涉及有损数据速率减小编码,或者其可涉及无损数据压缩。而且,音频信号可以是脉冲代码调制(PCM)的数字音频序列或其他经采样的单声道或多声道音频信号(这里也称为音频节目),其可包括多个声道的音频,例如六声道5.1环绕、2声道立体声等。
元数据包括由DRC处理器4所计算的(每帧)DRC增益值。由如图所示的乘法器符号所代表的归一化器或调节器向输入数字音频信号应用音频归一化增益值(例如GLN)以产生归一化信号。(由DRC处理器4)处理归一化信号以根据若干个预定义的DRC特性中的所选择的一个预定义的DRC特性来计算若干个DRC增益值。DRC特性可存储在编码设备内的作为DRC处理器4的一部分的存储器内。图2中给出了DRC特性的实例,其中沿x轴的DRC输入水平是指短期响度值(这里也称为DRC输入水平),并且待应用沿y轴的增益值范围来实现对输入音频信号的压缩或膨胀效应。图2中的增益值这里也称为DRC增益值。
音频归一化是向音频记录(也称为音频节目或音频信号)应用恒定量的增益以使音频信号的平均值或峰值达到目标水平(归一化值)。当在整个信号或音频节目间应用相同量的增益时,信号的信噪比和相对动态行为在很大程度上是不变的。归一化与动态范围压缩或动态范围控制(DRC)不同,其向输入的音频信号应用时变的增益水平,以在最小范围到最大范围内匹配结果。实例包括峰值归一化,其中改变增益以使最高数字样本值(例如,脉冲代码调制的PCM值)或模拟信号峰值达到给定水平。
另一种类型的音频归一化基于节目响度的度量。这里,改变所应用的增益(在图1中被具体示出为节目响度归一化增益或GLN)以使例如整个音频节目期间的平均响度达到目标水平。节目响度的实例包括平均功率的度量,例如RMS值,或人所感知的响度的度量,例如由国际电信联盟(ITU)建议BS.1770“Algorithmstomeasureprogrammeloudnessandtrue-peakaudiolevel”所提供的。根据输入信号的动态范围和目标水平,节目响度归一化可能导致峰值高于给定记录或传输或回放介质的极限。在此类情况下,可使用DRC来防止这种情况下的剪辑,这继而可能改变音频信号的信噪比和相对动态行为。
DRC能够通过缩窄或“压缩”音频信号的动态范围来减小响亮声音的音量或放大安静的声音。压缩通常用于声音记录、再现和广播中。用于应用压缩的电子硬件单元或音频软件有时被称为压缩器。压缩器常常具有若干个控件,例如包括阈值(例如,单位为dB)、增益减小的比例或量(增益值)、改变应用压缩的速率并使该效果顺利实现的攻击和释放控件以及硬/软膝盖控件。
DRC特性(如本文中使用的短语)给出了输入音频信号的短期响度度量(这里也称为图4中的“响度[dB]”或图2中的DRC输入水平)和能够应用于该输入音频信号的增益值之间的关系,该短期度量是在一个时间段内计算的,该时间段可以是数字音频信号的帧或分组的量级,例如5毫秒-100毫秒之间的时段。也可将此称为压缩器配置文件(其中,增益值用于压缩或扩展输入音频信号)。图2中示出了可用于编码级中的几个示例性DRC特性,而图4和图6示出了可用于解码级中的示例性DRC特性(在下文中描述)。
可使用任何适当的过程来选择编码级中的当前DRC特性。响应于接收到选择,DRC处理器4访问所存储的DRC特性并向输入信号应用被访问的配置文件(在这种情况下为增益归一化数字音频信号),由此产生每帧的DRC增益值。DRC处理器4可如下生成DRC增益值。处理归一化音频信号,以便计算响度的短期度量,例如针对该输入音频信号的大约一帧的量级进行计算。然后使用响度的所计算的短期度量作为查找表的输入,该查找表反映DRC特性中的一个DRC特性诸如图2所示的那些DRC特性或任何其他适当的DRC特性,以获得DRC增益值。例如,如果音频帧是柔和的,则可能会获得更正性的DRC增益,如果音频帧是响亮的,则可能是更负性的DRC增益值。在一个实施例中,可使输入数字音频的每个帧与独立产生的DRC增益值相关联。然后提供DRC增益值作为与经编码的音频信号相关联的元数据,例如嵌入相同的比特流内。此类编码设备可以是媒体服务器的一部分,该媒体服务器响应于来自例如运行于最终用户设备中的客户端程序的请求通过因特网向该请求最终用户设备传输音频节目(例如,作为音乐文件或电影文件的一部分)。或者,可提供经编码的音频比特流以用于存储任何形式的适当的记录介质。
在一个实施例中,可将DRC处理器4视为与编码器2并行操作,除了DRC处理器4的输入是输入到编码器2中的音频信号的归一化版本之外。在图1的实例中,归一化值GLN可以是标量,对于整个音频节目都是固定的,并且乘以数字音频信号的信号样本。可在通过DRC处理器4来传送(归一化)音频信号“之前”计算归一化增益值GLN。可基于先前由音频测量模块6计算的响度参数例如节目响度(由图1中标记为GLN的框)来计算归一化增益。这可由音频测量模块6在第一次通过输入音频信号时在DRC处理器4执行第二次通过(通过输入音频信号的归一化版本)之前完成。然后基于例如(i)初始数字音频节目的实测响度(例如,为整个初始音频节目计算的节目响度)和(ii)目标或期望响度之间的比率来进行GLN的计算。参见下文了解如何计算示例性GLN的更多详情。
在另一个实施例中,可响应于输入音频信号中的音频内容的类型基于分别与若干个不同类型的音频内容相关联的若干个预先确定的目标响度值来自动选择音频归一化增益值。例如,如果音频节目为经典音乐,则在目标节目为流行音乐或对话或脱口秀或惊险动作运动图片的情况下选择不同的目标响度值。
图1示出了穿过以下三个信号处理块的音频测量模块6的输入信号:乘法器(用于动态范围调节)、下混频处理器20(以实现多声道音频信号的下混频)以及预调节滤波器9。不过,这仅仅是图1所示的一个实施例。在其他实施例中,可省略那三个信号处理块中的一个或多个信号处理块。例如,如果未对音频信号(音频节目)指示进行下混频,则可从编码级省去下混频处理器20,使得音频信号仅进行动态范围调节和预调节(在由音频测量模块6处理之前)。作为另一个实例,可省略预调节滤波器9,同时仍然指示进行下混频和动态范围调节,在这种情况下,音频信号将仅进行动态范围调节和下混频(在由音频测量模块6处理之前)。
仍然参考图1,除了作为元数据的DRC增益之外,编码设备还可以在新的元数据传输字段中提供所选择的DRC特性的索引作为另一个元数据(与经编码的音频信号相关联)。在图1的实例中,使用辅助数据声道7来提供索引,而DRC增益与经编码的音频信号嵌在一起。辅助声道与递送编码音频的主要数据声道分开。存在若干种手段可用于提供与经编码的音频信号相关联的元数据。图1仅示出了一种机制,其中已(由复用器)将DRC增益值与经编码的音频一起嵌入同一比特流(“主要”数据声道)中,而通过辅助数据声道处理器7来供应响度参数。在另一种手段中,组装器或格式化器将DRC增益值与经编码的音频信号一起布置到例如单个文件内的帧或分组中。在又一种手段中,可增加压缩器,当在同一文件或比特流中与音频信号一起被嵌入时,压缩器减小DRC增益值的比特率。在又一种手段中,辅助数据声道处理器7将DRC增益值布置到辅助数据声道中(除了其他元数据之外)。
除了当前DRC特性的索引之外,元数据还可包括由编码级中的音频测量模块6所计算的节目响度值,以及还任选包括真峰值。可根据任何适当的已知的技术例如根据ITU-BS.1770-3基于输入音频信号来执行音频测量以计算节目响度和真峰值。在另一个实施例中,如图1中所示,该音频测量可使用由DRC处理器4所计算的DRC增益值,以便计算响度参数(例如,节目响度和真峰值),然后将其提供作为其他元数据。换言之,可基于输入音频信号的DRC调节或压缩版本为音频节目计算节目响度值和真峰值(无GLN归一化)。如图1中所示,这里要指出的是经压缩的音频信号可以是由下混频处理器20处理的多声道音频信号,这导致产生特定的下混频音频信号并被馈送到音频测量模块6的输入。在这里,下混频处理是任选的,因为可省略或跳过下混频处理器20,从而对经压缩的音频信号执行音频测量而无需下混频。
在另一个实施例中,为了(在音频测量模块6中)执行音频测量,使用了任选的预调节滤波器9,已基于1)输入音频信号的特征或特性和/或2)预期将接收并执行经编码的音频比特流的回放的最终用户设备的特性来配置该预调节滤波器。在图1中可以看出,可在输入到模块6中之前,由滤波器9对输入音频信号进行预调节,在模块6中将对其执行响度计算。预调节滤波器9例如可以是高通滤波器、带通滤波器或其组合,它们对特定回放设备的数字模拟转换和扬声器(换能器)级的频率响应或传递函数建模,该回放设备例如是消费电子设备诸如台式计算机、膝上型计算机、平板电脑、智能电话或被设计成通过因特网接收数字内容并通过附带的显示监视器进行回放的数字媒体播放器。
现在转向图3,其为解码级或解码设备的相关部件的框图。图3中的框图不仅为数字音频解码器设备或解码级提供支持,还提供了用于对音频进行解码的方法,如下文所述的。所示的解码器设备具有解码器10,其接收由解复用器13从经解码的音频比特流提取的经编码的音频信号。该比特流可包括嵌入式元数据,例如,DRC增益值、DRC特性的索引(在编码级中使用)以及响度参数。如上文结合编码设备所示的,替代方式是在独立的辅助数据声道7(参见图1)中包括一些或全部元数据。在两种情况下,提供经编码的音频信号作为解码器10的输入,作为响应,解码器10产生经解码的音频信号。解码器10可与图1的编码器2互补,从而能够恢复基本类似于编码级的初始输入音频信号的信号。经解码的音频信号通过任选的信号处理块14,16传送,直到其到达数模转换器(DAC)18和功率放大器(未示出),在此将其转换成模拟形式并用于驱动换能器(扬声器)19。
解码设备还具有接收与编码音频信号相关联的元数据的DRC_1处理器12,其中元数据包括在编码级中所计算的DRC增益值。DRC_1处理器12可修改那些增益值以产生新的或经修改的增益值。这种修改可基于局部参数,该局部参数包括用于回放经解码的音频信号的换能器19(例如,内置扬声器或外部扬声器、无线附接的扬声器或有线附接的扬声器)、功率放大器(未示出)和模数转换器(DAC)19组合的用户输入和/或动态范围。然后将经修改的增益值应用于经解码的信号(这种调节由乘法器符号表示),之后被馈送到任选的混频和另外的音频处理块(框14,16),然后到达DAC18。因此将经修改的DRC增益值应用于经解码的音频信号以产生所谓的经解码级DRC调节的音频信号。后者可由混频器14与来自如图所示的其他音频源的经其他解码级DRC调节的音频信号组合(即,通过其他动态范围调节单元15),之后被馈送到DAC18。
在一个实施例中,在解码级中所接收的元数据包括先前选择的或当前的DRC特性的索引(如图1中所示,在编码级中根据其所计算的DRC增益值)。在一个实例中,可在DRC_1处理器12中存储所选择的DRC特性或当前DRC特性的副本并与此类索引相关联。这被称为编码级DRC特性。相反,DRC_1处理器12还可包含如图所示的若干个所谓的解码级DRC特性。后者中的一者用于如下所述产生新的或经修改的增益值。
在一个实施例中,DRC_1处理器12“反转”由编码级的DRC处理器4执行的操作,以便通过向当前DRC特性应用(来自所接收的元数据)所接收的DRC增益值来获得从存储在处理器12中的所选择的或当前DRC特性开始的短期响度或DRC输入水平(例如单位为dB)。然后使用该恢复的短期响度值作为解码级DRC特性中的所选择的一个解码级DRC特性的输入,以便获得新的或经修改的增益值。后者在这里被称为解码级或解码器DRC增益值。解码级和编码级DRC特性中的每一者都可以查找表格的方式存储。
对解码级DRC特性的选择可根据以下各项中的一者或多者:用户上下文(包括深夜、步行、跑步、在车中以及手机和内置扬声器)以及扬声器信号路径动态范围。在那种情况下的图3的解码设备可嵌入最终用户设备内,诸如常常处于相当不同的用户上下文中的移动电话、膝上型计算机或平板电脑。这样的上下文可被熟知的电子传感器硬件和软件检测到,包括环境光和位置、取向或运动传感器。可由最终用户设备的制造商预先确定换能器信号路径动态范围,并可存储或通过其他方式提供给DRC_1处理器12,以用于在解码过程期间使用。换能器动态范围可包括DAC18的动态范围。在存在更大动态范围的情况下,DRC_1处理器12可选择允许在经解码的音频信号的短期响度的预期范围内保持更大动态范围的解码级DRC特性。
在另一个实施例中,也如在图3中所示的,解码级中的所接收的元数据还可包括若干个响度参数,其可以是以下各项中的一者或多者:节目响度、真峰值、响度范围、最大瞬时响度和短期响度。在产生经修改的或新的DRC增益值(基于每个帧)时,可由DRC_1处理器12使用一个或多个此类值。
如上所述,解码级中的DRC_1处理器12(也称为解码器DRC处理器)可使用所选择的解码级DRC特性来生成其经修改的DRC增益值。上文指出,后者可以是处理器12中所存储得并且可根据用户输入或用户上下文来控制信号访问的若干个预定义的DRC特性中的一个预定义的DRC特性。图4示出了可使用的解码级DRC特性的若干个实例。这些解码级DRC特性包括用于深夜用途的一种解码级DRC特性、用于汽车内或车辆内用途的另一种解码级DRC特性以及用于具有有限动态范围的扬声器或换能器19的另一种解码级DRC特性。
根据本发明的另一个实施例,图1和图3的部件组合可获得用于对音频信号进行编码和解码的系统。在编码级中存储了若干编码器动态范围控制(DRC)特性。这些特性中的每个特性都使DRC增益值与短期响度值相关,其中每个响度值都可指音频信号在预先确定的时段内的平均功率,例如在数字音频的大约一帧的量级内,例如在5毫秒长和100毫秒长之间。选择解码器DRC特性中的一个解码器DRC特性,然后用于产生编码器级增益值。然后提供这些编码器级增益值作为与经编码的音频信号相关联的元数据。上文给出了并结合图1描述了这种编码器级的几个实例。
编码器级具有不仅存储编码器DRC特性还存储若干个解码器DRC特性的处理器。后者中的每一者都使DRC增益值与短期响度值相关,该短期响度值可类似于在编码器级所计算的那些短期响度值,以用于确定编码器DRC增益值。解码器级中的处理器使用来自编码器级的编码器级增益值来计算解码器级增益值。在特定情况下,解码器级中的处理器使用所选择的编码器DRC特性的索引和基于元数据的编码器级增益值,以便计算其解码器级增益值。上文给出了并结合图3描述了这种情况的实例。解码器级最终可(在用作例如最终用户设备中的回放处理的一部分时)对经编码的音频信号进行解码,然后应用解码器级增益值以(在经解码的音频信号上)实现期望的动态范围调节。
根据本发明的又一个实施例,一种用于提供经编码的音频和关联的元数据的方法涉及对多声道音频信号进行下混频。如图1中所示,由音频测量模块6基于通过下混频处理器20传送的多声道数字音频信号来计算一组响度参数,其中这些参数描述多声道音频信号的下混频的响度配置文件。例如,可由下混频处理器20来将六或七声道音频信号处理成两声道或立体声信号;更一般地,下混频是将N个声道的音频信号转换成具有M个声道的音频信号,其中N大于M。
对多声道音频信号进行编码,并且将经编码的信号与和其相关联的元数据一起提供,其中在这种情况下元数据包括描述下混频的响度配置文件的所计算的一组响度参数。元数据还可包括多声道音频信号的基础声道布局。例如,基础声道布局可通过识别六个声道的每个声道给出5.1环绕多声道音频信号的详情,六个声道例如是前中、右前、左前、环绕左、环绕右和重低音。然后可由解码级来接收经编码的多声道音频信号及其相关联的元数据,例如参见下文描述的图5,其中对经编码的音频信号进行解码并进行处理,以便根据包括在元数据中的一组响度参数和基础声道布局来产生下混频。元数据还可包括下混频增益,在编码级中将其用于计算包括在元数据中的响度参数所针对的特定下混频。注意,在此类实施例中,不需要由解码级(在通过本地扬声器回放期间)为动态范围执行任何调节。例如,可通过采用常规方式来实施此类方案,其中如果在解码级中所接收的元数据不包含DRC增益值,则不对经解码的信号执行DRC调节。
图5示出了本发明的另一个实施例,其中除了响度参数诸如与下混频相关的真峰值和节目响度之外,与经编码的多声道音频信号相关联的元数据还可包括DRC增益值。该附图以类似于图3中的一些方式描绘了解码级,即其可包含解复用器13,之后的解码器13,任选地还包含音频处理16以及DAC18。在此,同样地,与经编码的音频信号相关联的所接收的元数据提供DRC增益值。这些DRC增益值要用于解码级中以在处理经解码的音频信号之前对经解码的音频信号进行动态范围调节,以产生下混频。换言之,经编码的多声道音频信号由解码器10解码,然后由新DRC增益值或由初始DRC增益值(后者是从解复用器13获得的)来对一个或多个经解码的声道进行调节。这发生于下混频模块20产生特定下混频之前。下混频模块20可使用也从元数据提取的下混频增益值(如上所述)。在另一个实施例中,使用新的增益值针对动态范围来调节经解码的音频信号,该新的增益值是由DRC_1处理器12使用例如类似于上文结合图3所述的流程来计算的。这里,可能影响新的增益值的本地参数可以是类似的,并且包括用户音量设置和响度归一化通断开关。这些本地参数可支配对若干个可用的解码级DRC特性的特定一个解码级DRC特性的选择,以用于产生新的DRC增益值。
作为前一段中所述方式的替代,可设计由(解码级中)DRC_1处理器12产生的DRC增益值以应用于下混频模块20的下游。为了示出此类实施例,可以修改图5中的解码级,使得在其中示出的乘法器的输入(其他输入从DRC_1处理器12接收DRC增益值)会被定位在下混频模块20的下游(DAC18的上游)。在这种情况下,DRC_1处理器12可产生基于通过元数据(从编码级)所接收的初始DRC增益值的经修改的DRC增益值,或者可通过初始DRC增益值向调节器或乘法器块传送。针对这种情况,产生特定形式的初始DRC增益值的对应编码级可如图7中所示。
参考图7,除了至少以下方面之外,其示出了可类似于图1的编码设备的编码设备。在这里,(由DRC处理器4)计算DRC增益,使得然后可直接在解码器设备中将它们应用于下混频。与图1相比,图7的DRC处理器4还对下混频信号进行操作,该下混频信号是由下混频处理器20产生的,该下混频处理器20接收初始多声道输入音频信号,并作为响应,对其他输入接收归一化增益值GLN的归一化器(或乘法器)进行馈送。编码器2可仍然通过与图1相同的方式处理初始输入音频信号,以产生经编码的信号。
返回到图5,在其中的解码级可从编码级(未示出)接收其经编码的音频信号和元数据,在解码级中,产生输入多声道音频信号的特定下混频。当前DRC增益值是在编码级中使用输入多声道音频信号和/或其特定下混频来计算的,然后作为元数据与多声道音频信号的编码版本一起提供(例如,通过使用例如图1中的复用器8将经编码的音频信号与当前DRC增益值组装在一起作为单个经编码的比特流或文件内的元数据)。也可能有其他手段用于将经编码的音频信号与计算的一组响度参数以及基础声道布局,以及任选的当前DRC参数(其全部是与经编码的音频信号相关联的元数据)一起提供。实例包括:组装器或格式化器,该组装器或格式化器将DRC增益值与音频信号一起布置到单个文件内的帧或分组中;复用器,该复用器产生包含DRC增益值的比特流,该DRC增益值已与经编码的音频信号的帧进行时间复用;压缩器,该压缩器当在同一文件或同一比特流中与经编码的音频信号一起嵌入DRC增益值时,减小其数据速率;和辅助数据声道处理器,该辅助数据声道处理器将DRC增益值布置到与主要数据声道分开的辅助数据声道中(其中,后者包含正递送到图5的解码级的经编码的音频信号)。
注意,如前所述,如果与经编码的多声道音频信号相关联的元数据未指定作出动态范围调节,或者仅仅未包含DRC增益值或DRC参数(例如,未提到DRC特性的有效索引),则处理经解码的音频信号以产生下混频而不对经解码的音频信号执行任何动态范围调节。这可如图5中所示那样,DRC_1处理器12将提供其所有新的增益值为0dB,从而表示不对经解码的音频信号的动态范围执行任何调节。
如果DRC_1处理器12未接收到DRC参数作为元数据,则可由处理器12根据可从图6所示的实例选择的解码级DRC特性(或其他适当的DRC特性)来产生新的增益值。图6示出了三种不同的DRC特性,其中每个DRC特性都与不同的用户音量设置或水平相关联。可以看出,随着音量增大,在短期响度值增大时,由DRC特性限定的压缩量增加。
可能受益于本文所述的技术的编解码的实例包括MPEG和ATSC提出的标准,例如AAC和AC-3,尽管包含控制经解码的音频信号响度和动态范围的机制的其他标准或方法也可能受益。
可作为元数据存储的示例性音频测量
音频测量模块6可以是待由处理器执行的软件例程或硬连线的数字音频处理逻辑电路的布置,其针对给定的数字音频文件来计算或提供一个或多个响度参数。可将该例程用于一定范围的音频产品例如媒体播放器中以用于音乐内容的响度归一化。可在数字音频编码过程期间在经编码的音频文件中将所计算的音频测量作为元数据进行存储。例如,MPEG当前提供能够存储此类元数据的比特流字段。此类字段的当前用途包括存储参考响度、数字音频的每帧的动态范围控制(DRC)增益以及下混频加权因子。根据本发明的实施例,在MPEG-4音频系统框架的“样本描述扩展”中限定了新的“框”,以存储元数据(如下文进一步所述的)。
节目响度是一种可以是数字音频文件的整个内容的平均响度估计的音频测量。可根据ITU-BS.1770-3来计算该实例。可在编码级中在向音频内容信号应用动态范围压缩之后,计算节目响度,例如参见图1,其中在由滤波器9进行预调节之前针对动态范围来调节未归一化音频信号并馈送到音频测量模块6(同时跳过下混频处理器20)。在另一个实施例中,可由编码级中的音频测量模块6来计算节目响度,以用于对音频内容信号进行下混频,例如参见图1。
真峰值是一种可以是来自音频文件的音频比特流的最大样本大小(例如,以4×过采样速率)的音频测量。可根据ITU-BS.1770-3来计算该实例。
响度范围可以是基于ITUBS.1770或根据欧洲广播协会(EBU)规范的音频测量。其测量针对数字音频给定块的大小(例如400ms块)的响度统计分布,并产生低百分比响度分布和高百分比响度分布的差异以描述动态范围。指示响度范围的其他音频测量是可能的。
元数据增强
本发明的实施例是MPEG-4系统框架的“样本描述扩展”部分中的新“框”,可利用用于每个音轨(音频节目)的静态元数据来填充MPEG-4系统框架,该静态元数据例如节目响度、锚定响度、真峰值和响度范围。MPEG-4样本描述扩展内的新框的另外的每个音轨或每个音频节目内容可包括:诸如在0.4秒窗口上的最大瞬时响度、诸如在0.3秒窗口上的最大短期响度、为包括高度声道和其他声道的回放系统限定声道布局的声道映射、DRC声道映射、DRC特性的索引、下混频系数、立体声下混频的节目响度、立体声下混频的锚定响度和立体声下混频的真峰值。尽管如上所述可能还有其他辅助数据声道用于向回放处理器传送元数据,但这里的特定方式可具有如下优点:静态元数据可用,而不对音频比特流进行解码;增加锚定响度(akadialnorm)以支持电影/TV内容音量归一化;了解编码器中使用的DRC特性能够帮助预测DRC增益的效果;了解DRC特性可用于修改解码器处的DRC特性;可通过不会过时的方式限定下能够支持大于5.1的多声道音频格式的混频系数;以及对下混频响度和剪辑更好地进行控制。
元数据用途
使用节目响度或锚定响度适于进行响度归一化。锚定响度通常基于所提取的语音片段并可仅适用于电影/电视剧内容。
关于动态范围控制(DRC),可使得若干个元数据值可用,该若干个元数据值描述所记录的音频内容的动态范围的各方面(参见下表)。动态范围的大小可能在回放期间在调节DRC时是有用的,例如,如果动态范围小或甚至能够关闭DRC,则DRC可较不激进。此外,可根据用户输入、音量设置和DAC动态范围和扬声器动态范围来设置目标动态范围,并选择DRC特性,使得将范围减小到该目标。这也可考虑针对更小空间的合理动态范围限制(收听环境)。真峰值和最大响度值可能在估计净空时是有用的,例如在响度归一化导致正增益[dB]时或在需要净空以避免剪辑下混频时。然后可调节DRC特性以接近净空目标。
描述动态范围的各个方面的示例性元数据
在编码器级中使用DRC处理器以使用预定义的DRC特性中的所选择的一个预定义的DRC特性来生成增益值。可在新的MPEG-4框中传输所选择的DRC特性的索引。可在现有字段中(在轻和/或重压缩期间)传输(每帧)增益值。
例如,如图1中所看出的,在DRC处理器4的输入处应用节目响度归一化增益GLN以确保相对于所选择的DRC特性来确保适当水平的对准。可基于由音频测量模块6产生的节目响度值LPL和DRC目标响度值LCTL[dB],根据GLN=LCTL–LPL[dB]计算归一化增益,例如LCTL=-31dB。
根据本发明的实施例,在解码级中改变所提取的DRC增益值,以实际实现定制DRC,该定制DRC可适于通过例如改变为(与编码级中使用的)不同的DRC特性而适应各种状况。现在由于能够理解所提取的索引的含义,为回放处的处理赋予在编码级中应用哪个DRC特性的了解。可证明这种变化的局部条件包括:深夜模式;噪声环境(例如,移动车辆内部的噪声);回放系统限制(例如,膝上型计算机、平板电脑或智能电话的内部扬声器,这与外部扬声器或耳机相反);用户偏好;和内容的动态范围。例如,参见图4,在这种状况中DRC特性是有用的。
在一个实施例中,对于1kHz处的正弦输入,可用的DRC特性应当基于压缩器的稳态输入/输出水平。这保持了与使用k加权的响度估计的压缩器的兼容性。这里假设将DRC特性应用于响度归一化音频信号。这对于在正确水平(如果适用的话)下具有DRC死区是非常重要的,并针对具有各种响度水平的内容产生更相容的结果,尤其是如果利用打开的响度归一化来回放此类内容时。
下混频
下混频是指操控音频,其中混合若干个不同的音频声道以产生更低数量的声道。这里,如果必要的话,可通过音频节目产生设施来控制下混频。例如,一些内容可能需要在下混频之前对环绕声道进行更大的衰减,以维持智能性。
如果设置了DRC_presentation_mode,则在生成下混频时,当前DVB和MPEG需要使用DRC。这样可能导致下混频中动态范围损失。相反,在适当时候为了维持动态范围,在此本发明的实施例是一种自适应方案,其中在高回放音量期间下混频仅需要DRC压缩,如图5所示。然后调整DRC的应用以仅降低最响片段的水平(例如,参见图6)。此外,现在可在解码级处提取在编码级处由音频测量模块6(参见图1)计算并作为元数据提供的立体声下混频的真峰值,并用于估计需要在下混频之前向经解码的信号应用多少DRC压缩。注意,尽管图5示出了在处理经解码的信号以发往下混频处理器20之前,向经解码的信号应用来自处理器12的DRC增益值的实施例,替代地在这里在下混频之后应用DRC增益值,例如直接指向下混频处理器20的输出。
在使用下混频并且DRC压缩独立活动的情况下,如果必要可修改DRC特性,使得为下混频实现足够大的净空。该方案提供了更大的灵活性。而且,可针对解码级中的响度,例如使用相对于完整刻度(LKFS)值(作为元数据所接收的)的K加权响度对立体声下混频进行归一化。这些LKFS值是在编码级中由音频测量模块6基于初始多声道数字音频信号的下混频版本(参见图1)所计算的响度参数。这样确保了多声道内容和立体声内容将在立体声系统上以相同的水平回放。
发明描述
1)一种用于对音频信号进行编码和解码的系统,包括:在其中存储多个编码器动态范围控制(DRC)特性的编码器级,其中该编码器DRC特性中的每个编码器DRC特性使增益值与响度值相关,该编码器级使用编码器DRC特性中的所选择的一个编码器DRC特性产生编码器级增益值并提供编码器级增益值作为与经编码的音频信号相关联的元数据;和具有处理器的解码器级,该处理器存储a)所述多个编码器DRC特性,以及b)多个解码器DRC特性,其中所述解码器DRC特性中的每个解码器DRC特性使增益值与响度值相关,并使用来自编码器级的编码器级增益值来计算解码器增益值。
2)根据表述1所述的系统,其中所述编码器级提供所选择的编码器DRC特性的索引,并且所述解码器级中的所述处理器使用所述索引和所述编码器级增益值来计算解码器级增益值。
3)根据表述1所述的系统,其中所述解码器级对经编码的音频信号进行解码,然后对经解码的音频信号应用解码器级增益值,以实现动态范围控制。
4)一种用于对音频进行解码的方法,包括:接收经编码的音频信号和与其相关联的元数据,其中所述元数据可包括多组响度参数中的一个一组响应参数,其中所述多组响应参数包括a)描述相应下混频的响度配置文件的一组响应参数,和b)描述基础声道布局的响度配置文件的一组响应参数;对经编码的音频信号进行解码以产生经解码的音频信号;以及根据包括在元数据中的所述一组响度参数来处理经解码的音频信号以产生下混频。
5)根据表述4所述的方法,其中与经编码的音频信号相关联的元数据还包括DRC参数,该方法还包括:在处理经解码的音频信号以产生下混频之前或之后,根据DRC参数对经解码的音频信号进行动态范围调节。
6)根据表述4所述的方法,其中与经编码的音频信号相关联的元数据不指定进行动态范围调节或不包含DRC参数,并且其中处理经解码的音频信号以产生下混频而不在产生下混频之前对经解码的音频信号进行动态范围调节。
7)一种数字音频解码器设备,包括:解码器,所述解码器接收经编码的音频信号并产生经解码的音频信号;和下混频处理器,所述下混频处理器接收经解码的音频信号和与其相关联的元数据,其中所述元数据包括一组响度参数,所述一组响度参数为以下各项中的一者:a)描述相应下混频的响度配置文件的一组响应参数或b)描述基础声道布局的响度配置文件的一组响应参数,其中所述下混频处理器根据包括在元数据中的该组响度参数来产生下混频音频信号。
8)一种用于提供经编码的音频和相关联元数据的方法,包括:基于描述多声道音频信号下混频响度配置文件的多声道音频信号来计算一组响度参数;对多声道音频信号进行编码;并且提供a)经编码的多声道音频信号和b)作为元数据与其相关联的所计算的一组响度参数和多声道音频信号的基础声道布局。
9)根据表述8所述的方法,还包括:产生多声道音频信号的下混频;使用下混频来计算动态范围控制(DRC)增益值;以及将经编码的音频信号与所计算的DRC增益值组装在一起作为与经编码的音频信号相关联的元数据。
10)一种数字音频编码器设备,包括:响度参数计算器,所述响度参数计算器计算描述多声道音频信号的下混频的响度配置文件的一组响度参数;编码器,所述编码器对多声道音频信号进行编码;和与所计算的一组响度参数和多声道音频信号的基础声道布局一起提供经编码的音频信号作为与经编码的音频信号相关联的元数据。
11)一种用于对音频进行解码的方法,包括:接收经编码的音频信号和与其相关联的元数据,其中所述元数据包括一组响度参数;对经编码的音频信号进行解码以产生经解码的音频信号;以及根据以下各项中的一者来处理经解码的音频信号以实现经解码的音频信号的动态范围压缩:a)包括在元数据中的该组响度参数,b)回放音量或c)目标净空。
如上所述,本发明的实施例可为存储有指令的机器可读介质(诸如微电子存储器),所述指令对一个或多个数据处理部件(一般在此称为“处理器)编程以执行上述数字音频处理操作,该数字音频处理操作包括编码、解码、响度测量、滤波、混合、相加、反转、比较和决策。此类指令可以是媒体播放器应用程序的一部分。在其他实施例中,可通过包含硬连线逻辑部件(例如,专用数字滤波器块、状态机)的特定硬件部件来执行这些操作中的一些操作。可替代地,可通过经编程的数据处理部件和固定硬连线电路部件的任何组合来执行那些操作。
虽然已描述并且在附图中示出了某些实施例,但应当理解,此类实施例仅用于说明广义的发明而非对其进行限制,并且本发明并不限于所示和所述的特定构造和布置,因为对于本领域普通技术人员而言可想到各种其它修改。例如,尽管在一个实施例中将编码级和解码级中的每一者都描述成例如在通过因特网进行通信的音频内容消费机器以及在音频内容消耗机器中操作,但也可以在同一机器内进行编码和解码例如作为代码转换过程的一部分。因此要将描述视为示例性的而非限制性的。

Claims (19)

1.一种用于对音频信号进行编码的方法,包括:
向音频信号应用音频归一化增益值以产生归一化信号;然后
处理所述归一化信号以针对所述归一化信号计算多个动态范围控制(DRC)增益值,其中根据多个预定义的DRC特性中的所选择的一个预定义的DRC特性来计算所述DRC增益值;
对所述音频信号进行编码;以及
提供所述DRC增益值作为与经编码的音频信号相关联的元数据。
2.根据权利要求1所述的方法,还包括:
提供所选择的DRC特性的索引作为经编码的音频信号的元数据。
3.根据权利要求1所述的方法,其中所述音频归一化增益值是节目响度归一化增益值。
4.根据权利要求1所述的方法,其中提供所述DRC增益值作为元数据包括:
将所述DRC增益值与经编码的音频信号一起嵌入主要数据声道中;以及
在与所述主要数据声道相关联的辅助数据声道中与其他元数据一起提供所选择的DRC特性的所述索引。
5.根据权利要求4所述的方法,其中所述其他元数据包括节目响度值和真峰值。
6.根据权利要求1所述的方法,还包括:
向源自所述音频信号或所述归一化信号中的一者的信号应用所述DRC增益值,以产生动态范围经调节的信号;以及
基于所述动态范围经调节的信号来执行音频测量,以计算节目响度值;以及
使用所述节目响度值来计算所述音频归一化增益值。
7.根据权利要求6所述的方法,还包括:
基于所述音频信号的特性和/或基于预计接收经编码的音频信号的回放设备的特性来配置滤波器;以及
在执行所述音频测量之前,使用所述滤波器来预调节所述动态范围经调节的信号。
8.根据权利要求1所述的方法,还包括:
响应于所述音频信号中的音频内容的类型基于分别与多个不同类型的音频内容相关联的多个预先确定的目标响度值来自动选择所述音频归一化增益值。
9.一种数字音频编码器设备,包括:
归一化器,所述归一化器向音频信号应用音频归一化增益值以产生归一化音频信号;
DRC处理器,所述DRC处理器处理所述归一化音频信号以针对所述归一化音频信号来计算多个动态范围控制(DRC)增益值,其中根据多个预定义的DRC特性中的所选择的一个预定义的DRC特性来计算所述DRC增益值;
编码器,所述编码器接收所述音频信号;和
用于提供所述DRC增益值作为与经编码的音频信号相关联的元数据的装置。
10.根据权利要求9所述的设备,还包括用于提供所选择的DRC特性的索引作为与经编码的音频信号相关联的元数据的装置。
11.根据权利要求9所述的设备,还包括:
音频测量单元,所述音频测量单元基于所述音频信号来计算响度参数;和
用于提供所述响度参数作为与经编码的信号相关联的元数据的装置。
12.根据权利要求11所述的设备,还包括:
下混频处理器,所述下混频处理器计算所述音频信号的下混频,其中所述音频测量单元基于所述下混频来计算所述响度参数。
13.根据权利要求11所述的设备,还包括预调节滤波器,所述音频信号在被输入到所述音频测量单元之前通过所述预调节滤波器来传递。
14.一种用于对音频进行解码的方法,包括:
接收经编码的音频信号;
接收与经编码的音频信号相关联的元数据,所述元数据包括多个动态范围控制(DRC)增益值;
对经编码的音频信号进行解码以产生经解码的音频信号;
从多个可用DRC特性中选择当前DRC特性,并基于所述当前DRC特性来修改所述DRC增益值;以及
将经修改的DRC增益值应用于经解码的音频信号以产生DRC经调节的音频信号。
15.根据权利要求14所述的方法,其中所接收的元数据进一步包括先前所选择的DRC特性的索引,在生成经编码的音频信号时根据所述索引来计算所述DRC增益值,并且其中所选择的当前DRC特性与所述索引相关联。
16.根据权利要求14所述的方法,其中所接收的元数据进一步包括选自由以下各项组成的组的多个值:节目响度、真峰值、响度范围、最大瞬时响度和短期响度值。
17.根据权利要求14所述的方法,其中从所述多个可用DRC特性中选择所述当前DRC特性进一步基于以下各项中的一者或多者:包括深夜、步行、跑步和汽车的用户上下文;以及扬声器动态范围。
18.一种数字音频解码器设备,包括:
解码器,所述解码器接收经编码的音频信号并产生经解码的音频信号;
DRC处理器,所述DRC处理器接收与经编码的音频信号相关联的元数据,其中所述元数据包括多个动态范围控制(DRC)增益值,所述DRC处理器从多个所存储的DRC特性中选择当前DRC特性并基于所述当前DRC特性来修改所述DRC增益值;和
乘法器,所述乘法器将经修改的DRC增益值应用于经解码的音频信号以产生DRC经调节的音频信号。
19.根据权利要求18所述的设备,其中所述DRC处理器将接收与经编码的音频信号相关联的其他元数据,所述其他元数据包括先前所选择的DRC特性的索引,在生成经编码的音频信号时根据所述索引来计算所述DRC增益值,并且其中由所述DRC处理器所选择的所述当前DRC特性与所述索引相关联。
CN201480018634.8A 2013-03-29 2014-03-27 用于响度和动态范围控制的元数据 Active CN105103222B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010164205.9A CN111370007B (zh) 2013-03-29 2014-03-27 用于响度和动态范围控制的元数据
CN202311381485.9A CN117275493A (zh) 2013-03-29 2014-03-27 用于响度和动态范围控制的元数据

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361806570P 2013-03-29 2013-03-29
US61/806,570 2013-03-29
US14/225,950 US9559651B2 (en) 2013-03-29 2014-03-26 Metadata for loudness and dynamic range control
US14/225,950 2014-03-26
PCT/US2014/031992 WO2014160849A2 (en) 2013-03-29 2014-03-27 Metadata for loudness and dynamic range control

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CN202010164205.9A Division CN111370007B (zh) 2013-03-29 2014-03-27 用于响度和动态范围控制的元数据
CN202311381485.9A Division CN117275493A (zh) 2013-03-29 2014-03-27 用于响度和动态范围控制的元数据

Publications (2)

Publication Number Publication Date
CN105103222A true CN105103222A (zh) 2015-11-25
CN105103222B CN105103222B (zh) 2020-03-17

Family

ID=51620877

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202010164205.9A Active CN111370007B (zh) 2013-03-29 2014-03-27 用于响度和动态范围控制的元数据
CN202311381485.9A Pending CN117275493A (zh) 2013-03-29 2014-03-27 用于响度和动态范围控制的元数据
CN201480018634.8A Active CN105103222B (zh) 2013-03-29 2014-03-27 用于响度和动态范围控制的元数据

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN202010164205.9A Active CN111370007B (zh) 2013-03-29 2014-03-27 用于响度和动态范围控制的元数据
CN202311381485.9A Pending CN117275493A (zh) 2013-03-29 2014-03-27 用于响度和动态范围控制的元数据

Country Status (9)

Country Link
US (4) US9559651B2 (zh)
EP (2) EP2956936B1 (zh)
KR (1) KR101761041B1 (zh)
CN (3) CN111370007B (zh)
AU (1) AU2014241222B2 (zh)
ES (1) ES2738494T3 (zh)
HK (1) HK1215489A1 (zh)
TW (1) TWI562138B (zh)
WO (1) WO2014160849A2 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105531759A (zh) * 2013-09-12 2016-04-27 杜比实验室特许公司 用于下混合音频内容的响度调整
CN105845151A (zh) * 2016-05-30 2016-08-10 百度在线网络技术(北京)有限公司 应用于语音识别前端的音频增益调整方法和装置
CN109286922A (zh) * 2018-09-27 2019-01-29 珠海市杰理科技股份有限公司 蓝牙提示音处理方法、系统、可读存储介质和蓝牙设备
CN110121707A (zh) * 2016-12-30 2019-08-13 谷歌有限责任公司 确定语义上不同的响应以提供作为包括在电子通信中的建议
CN111108760A (zh) * 2017-09-29 2020-05-05 苹果公司 用于空间音频的文件格式
CN113257273A (zh) * 2014-10-01 2021-08-13 杜比国际公司 高效drc配置文件传输
CN113647120A (zh) * 2019-03-14 2021-11-12 高迪奥实验室公司 用于控制响度级的音频信号处理方法和装置

Families Citing this family (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8090120B2 (en) 2004-10-26 2012-01-03 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8788080B1 (en) 2006-09-12 2014-07-22 Sonos, Inc. Multi-channel pairing in a media system
US9202509B2 (en) 2006-09-12 2015-12-01 Sonos, Inc. Controlling and grouping in a multi-zone media system
US8483853B1 (en) 2006-09-12 2013-07-09 Sonos, Inc. Controlling and manipulating groupings in a multi-zone media system
TWI529703B (zh) 2010-02-11 2016-04-11 杜比實驗室特許公司 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
US8923997B2 (en) 2010-10-13 2014-12-30 Sonos, Inc Method and apparatus for adjusting a speaker system
US11429343B2 (en) 2011-01-25 2022-08-30 Sonos, Inc. Stereo playback configuration and control
US11265652B2 (en) 2011-01-25 2022-03-01 Sonos, Inc. Playback device pairing
US9171549B2 (en) * 2011-04-08 2015-10-27 Dolby Laboratories Licensing Corporation Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams
US8938312B2 (en) 2011-04-18 2015-01-20 Sonos, Inc. Smart line-in processing
US9042556B2 (en) 2011-07-19 2015-05-26 Sonos, Inc Shaping sound responsive to speaker orientation
WO2013078056A1 (en) * 2011-11-22 2013-05-30 Dolby Laboratories Licensing Corporation Method and system for generating an audio metadata quality score
US8811630B2 (en) 2011-12-21 2014-08-19 Sonos, Inc. Systems, methods, and apparatus to filter audio
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
US9729115B2 (en) 2012-04-27 2017-08-08 Sonos, Inc. Intelligently increasing the sound level of player
US9524098B2 (en) 2012-05-08 2016-12-20 Sonos, Inc. Methods and systems for subwoofer calibration
JP6174129B2 (ja) 2012-05-18 2017-08-02 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
USD721352S1 (en) 2012-06-19 2015-01-20 Sonos, Inc. Playback device
US9219460B2 (en) 2014-03-17 2015-12-22 Sonos, Inc. Audio settings based on environment
US9690539B2 (en) 2012-06-28 2017-06-27 Sonos, Inc. Speaker calibration user interface
US9668049B2 (en) 2012-06-28 2017-05-30 Sonos, Inc. Playback device calibration user interfaces
US9690271B2 (en) 2012-06-28 2017-06-27 Sonos, Inc. Speaker calibration
US9706323B2 (en) 2014-09-09 2017-07-11 Sonos, Inc. Playback device calibration
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
EP2873073A1 (en) * 2012-07-12 2015-05-20 Dolby Laboratories Licensing Corporation Embedding data in stereo audio using saturation parameter modulation
US8930005B2 (en) 2012-08-07 2015-01-06 Sonos, Inc. Acoustic signatures in a playback system
US8965033B2 (en) 2012-08-31 2015-02-24 Sonos, Inc. Acoustic optimization
US9008330B2 (en) 2012-09-28 2015-04-14 Sonos, Inc. Crossover frequency adjustments for audio speakers
UA122050C2 (uk) 2013-01-21 2020-09-10 Долбі Лабораторіс Лайсензін Корпорейшн Аудіокодер і аудіодекодер з метаданими гучності та границі програми
KR102660144B1 (ko) 2013-01-21 2024-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화
CN105074818B (zh) 2013-02-21 2019-08-13 杜比国际公司 音频编码系统、用于产生比特流的方法以及音频解码器
USD721061S1 (en) 2013-02-25 2015-01-13 Sonos, Inc. Playback device
CN104080024B (zh) 2013-03-26 2019-02-19 杜比实验室特许公司 音量校平器控制器和控制方法以及音频分类器
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
CN110083714B (zh) 2013-04-05 2024-02-13 杜比实验室特许公司 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CN109785851B (zh) 2013-09-12 2023-12-01 杜比实验室特许公司 用于各种回放环境的动态范围控制
CN111580772B (zh) * 2013-10-22 2023-09-26 弗劳恩霍夫应用研究促进协会 用于音频设备的组合动态范围压缩和引导截断防止的构思
US9226087B2 (en) 2014-02-06 2015-12-29 Sonos, Inc. Audio output balancing during synchronized playback
US9226073B2 (en) 2014-02-06 2015-12-29 Sonos, Inc. Audio output balancing during synchronized playback
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
CN110808723A (zh) 2014-05-26 2020-02-18 杜比实验室特许公司 音频信号响度控制
US9367283B2 (en) 2014-07-22 2016-06-14 Sonos, Inc. Audio settings
CN106797523B (zh) * 2014-08-01 2020-06-19 史蒂文·杰伊·博尼 音频设备
USD883956S1 (en) 2014-08-13 2020-05-12 Sonos, Inc. Playback device
JP6683618B2 (ja) * 2014-09-08 2020-04-22 日本放送協会 音声信号処理装置
US10127006B2 (en) 2014-09-09 2018-11-13 Sonos, Inc. Facilitating calibration of an audio playback device
US9891881B2 (en) 2014-09-09 2018-02-13 Sonos, Inc. Audio processing algorithm database
US9952825B2 (en) 2014-09-09 2018-04-24 Sonos, Inc. Audio processing algorithms
US9910634B2 (en) 2014-09-09 2018-03-06 Sonos, Inc. Microphone calibration
US10163446B2 (en) * 2014-10-01 2018-12-25 Dolby International Ab Audio encoder and decoder
WO2016057530A1 (en) 2014-10-10 2016-04-14 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
KR101701396B1 (ko) * 2014-10-28 2017-02-01 주식회사 엑티저 오디오 신호 처리 장치 및 방법
US9973851B2 (en) 2014-12-01 2018-05-15 Sonos, Inc. Multi-channel playback of audio content
US9584911B2 (en) * 2015-03-27 2017-02-28 Cirrus Logic, Inc. Multichip dynamic range enhancement (DRE) audio processing methods and apparatuses
US10664224B2 (en) 2015-04-24 2020-05-26 Sonos, Inc. Speaker calibration user interface
WO2016172593A1 (en) 2015-04-24 2016-10-27 Sonos, Inc. Playback device calibration user interfaces
USD768602S1 (en) 2015-04-25 2016-10-11 Sonos, Inc. Playback device
US20170085972A1 (en) 2015-09-17 2017-03-23 Sonos, Inc. Media Player and Media Player Design
USD920278S1 (en) 2017-03-13 2021-05-25 Sonos, Inc. Media playback device with lights
USD906278S1 (en) 2015-04-25 2020-12-29 Sonos, Inc. Media player device
USD886765S1 (en) 2017-03-13 2020-06-09 Sonos, Inc. Media playback device
US10248376B2 (en) 2015-06-11 2019-04-02 Sonos, Inc. Multiple groupings in a playback system
EP4156180A1 (en) 2015-06-17 2023-03-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Loudness control for user interactivity in audio coding systems
US9729118B2 (en) 2015-07-24 2017-08-08 Sonos, Inc. Loudness matching
US9538305B2 (en) 2015-07-28 2017-01-03 Sonos, Inc. Calibration error conditions
US9877134B2 (en) * 2015-07-28 2018-01-23 Harman International Industries, Incorporated Techniques for optimizing the fidelity of a remote recording
US9837086B2 (en) * 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US9712912B2 (en) 2015-08-21 2017-07-18 Sonos, Inc. Manipulation of playback device response using an acoustic filter
US9736610B2 (en) 2015-08-21 2017-08-15 Sonos, Inc. Manipulation of playback device response using signal processing
EP3531714B1 (en) 2015-09-17 2022-02-23 Sonos Inc. Facilitating calibration of an audio playback device
US9693165B2 (en) 2015-09-17 2017-06-27 Sonos, Inc. Validation of audio calibration using multi-dimensional motion check
US10341770B2 (en) 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
US11106423B2 (en) 2016-01-25 2021-08-31 Sonos, Inc. Evaluating calibration of a playback device
US10003899B2 (en) 2016-01-25 2018-06-19 Sonos, Inc. Calibration with particular locations
US9886234B2 (en) 2016-01-28 2018-02-06 Sonos, Inc. Systems and methods of distributing audio to one or more playback devices
TWI720153B (zh) * 2016-03-29 2021-03-01 日商新力股份有限公司 送訊裝置、送訊方法、收訊裝置、收訊方法及收送訊系統
US9860662B2 (en) 2016-04-01 2018-01-02 Sonos, Inc. Updating playback device configuration information based on calibration data
US9864574B2 (en) 2016-04-01 2018-01-09 Sonos, Inc. Playback device calibration based on representation spectral characteristics
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
US9794710B1 (en) 2016-07-15 2017-10-17 Sonos, Inc. Spatial audio correction
US9860670B1 (en) 2016-07-15 2018-01-02 Sonos, Inc. Spectral correction using spatial calibration
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
USD827671S1 (en) 2016-09-30 2018-09-04 Sonos, Inc. Media playback device
USD851057S1 (en) 2016-09-30 2019-06-11 Sonos, Inc. Speaker grill with graduated hole sizing over a transition area for a media device
US10412473B2 (en) 2016-09-30 2019-09-10 Sonos, Inc. Speaker grill with graduated hole sizing over a transition area for a media device
US10712997B2 (en) 2016-10-17 2020-07-14 Sonos, Inc. Room association based on name
CN110679083B (zh) 2017-03-31 2023-11-17 杜比国际公司 动态范围控制反演
KR102441950B1 (ko) 2017-08-11 2022-09-08 삼성전자 주식회사 오디오 신호의 크기에 기반하여 오디오 신호를 증폭하는 방법 및 이를 구현한 전자 장치
US10171054B1 (en) * 2017-08-24 2019-01-01 International Business Machines Corporation Audio adjustment based on dynamic and static rules
TWI651718B (zh) * 2017-09-12 2019-02-21 華碩電腦股份有限公司 音訊處理方法及音訊處理裝置
KR102491646B1 (ko) * 2017-11-30 2023-01-26 삼성전자주식회사 오디오 신호의 음량에 따라 설정된 해상도에 기반하여, 오디오 신호를 처리하는 방법 및 그 전자 장치
CN109979475A (zh) * 2017-12-26 2019-07-05 深圳Tcl新技术有限公司 解决回声消除失效的方法、系统及存储介质
US10778168B2 (en) 2018-01-07 2020-09-15 The Nielsen Company (Us), Llc Methods and apparatus for volume adjustment
WO2019161191A1 (en) 2018-02-15 2019-08-22 Dolby Laboratories Licensing Corporation Loudness control methods and devices
US11011180B2 (en) * 2018-06-29 2021-05-18 Guoguang Electric Company Limited Audio signal dynamic range compression
US10911013B2 (en) 2018-07-05 2021-02-02 Comcast Cable Communications, Llc Dynamic audio normalization process
US11430463B2 (en) * 2018-07-12 2022-08-30 Dolby Laboratories Licensing Corporation Dynamic EQ
US11206484B2 (en) 2018-08-28 2021-12-21 Sonos, Inc. Passive speaker authentication
US10299061B1 (en) 2018-08-28 2019-05-21 Sonos, Inc. Playback device calibration
WO2020123424A1 (en) * 2018-12-13 2020-06-18 Dolby Laboratories Licensing Corporation Dual-ended media intelligence
JP7332781B2 (ja) * 2019-07-09 2023-08-23 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオコンテンツのプレゼンテーションに依存しないマスタリング
US10734965B1 (en) 2019-08-12 2020-08-04 Sonos, Inc. Audio calibration of a portable playback device
JP7434792B2 (ja) * 2019-10-01 2024-02-21 ソニーグループ株式会社 送信装置及び受信装置、並びに音響システム
KR102295287B1 (ko) * 2019-12-26 2021-08-30 네이버 주식회사 오디오 신호 처리 방법 및 시스템
US11398216B2 (en) * 2020-03-11 2022-07-26 Nuance Communication, Inc. Ambient cooperative intelligence system and method
US11381209B2 (en) * 2020-03-12 2022-07-05 Gaudio Lab, Inc. Audio signal processing method and apparatus for controlling loudness level and dynamic range
CN113470692B (zh) * 2020-03-31 2024-02-02 抖音视界有限公司 音频处理方法、装置、可读介质及电子设备
US11907611B2 (en) 2020-11-10 2024-02-20 Apple Inc. Deferred loudness adjustment for dynamic range control
KR20220071954A (ko) * 2020-11-24 2022-05-31 가우디오랩 주식회사 오디오 신호의 정규화를 수행하는 방법 및 이를 위한 장치
CN112700784B (zh) * 2020-12-24 2023-12-15 惠州市德赛西威汽车电子股份有限公司 一种基于itu-r bs.1770的响度校准方法及存储介质
CN112951266B (zh) * 2021-02-05 2024-02-06 杭州网易云音乐科技有限公司 齿音调整方法、装置、电子设备及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1465146A (zh) * 2001-07-07 2003-12-31 三星电子株式会社 移动通信系统中的数据发送和接收方法
CN1663249A (zh) * 2002-06-24 2005-08-31 松下电器产业株式会社 元数据生成装置、其生成方法以及检索装置
CN1684523A (zh) * 2003-11-26 2005-10-19 三星电子株式会社 用于编码/解码具有辅助信息的音频比特流的方法和设备
CN1973434A (zh) * 2004-07-01 2007-05-30 杜比实验室特许公司 用于校正影响音频信息的播放响度和动态范围的元数据的方法
US20110208528A1 (en) * 2008-10-29 2011-08-25 Dolby International Ab Signal clipping protection using pre-existing audio gain metadata
CN102171755A (zh) * 2008-09-30 2011-08-31 杜比国际公司 音频元数据的编码变换

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4295428B2 (ja) 2000-12-06 2009-07-15 富士通マイクロエレクトロニクス株式会社 Firフィルタ、firフィルタの制御方法、およびfirフィルタを有する半導体集積回路、firフィルタでフィルタリングされたデータを送信する通信システム
US20040228455A1 (en) * 2003-05-13 2004-11-18 Texley Eric M. Dynamic range compression modification of a digital telephone switch for individual hearing characteristics
JP4486646B2 (ja) 2003-05-28 2010-06-23 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の感知音量を計算し調整する方法、装置及びコンピュータプログラム
US7398207B2 (en) 2003-08-25 2008-07-08 Time Warner Interactive Video Group, Inc. Methods and systems for determining audio loudness levels in programming
TWI233091B (en) * 2003-11-18 2005-05-21 Ali Corp Audio mixing output device and method for dynamic range control
CN101006726A (zh) 2004-06-24 2007-07-25 韩国电子通信研究院 支持定位方案的扩展描述、以及使用它的即时电视服务与系统
US7456093B2 (en) 2004-07-03 2008-11-25 Taiwan Semiconductor Manufacturing Co., Ltd. Method for improving a semiconductor device delamination resistance
KR100561440B1 (ko) * 2004-07-24 2006-03-17 삼성전자주식회사 채널 변경에 따른 음량 자동 보정 장치 및 그 방법
US8090120B2 (en) 2004-10-26 2012-01-03 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TW200638335A (en) * 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
BRPI0716854B1 (pt) * 2006-09-18 2020-09-15 Koninklijke Philips N.V. Codificador para codificar objetos de áudio, decodificador para decodificar objetos de áudio, centro distribuidor de teleconferência, e método para decodificar sinais de áudio
US9053753B2 (en) * 2006-11-09 2015-06-09 Broadcom Corporation Method and system for a flexible multiplexer and mixer
US8463413B2 (en) * 2007-03-09 2013-06-11 Lg Electronics Inc. Method and an apparatus for processing an audio signal
EP2146522A1 (en) 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
US8284959B2 (en) 2008-07-29 2012-10-09 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US20100263002A1 (en) 2009-04-09 2010-10-14 At&T Intellectual Property I, L.P. Distribution of modified or selectively chosen media on a procured channel
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
TWI529703B (zh) * 2010-02-11 2016-04-11 杜比實驗室特許公司 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
TWI525987B (zh) * 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
US8736700B2 (en) * 2010-09-30 2014-05-27 Apple Inc. Techniques for synchronizing audio and video data in an image signal processing system
EP2801095A1 (en) 2012-01-06 2014-11-12 Sony Mobile Communications AB Smart automatic audio recording leveler
CN103325380B (zh) * 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
US9991861B2 (en) * 2012-08-10 2018-06-05 Bellevue Investments Gmbh & Co. Kgaa System and method for controlled dynamics adaptation for musical content
KR102660144B1 (ko) 2013-01-21 2024-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9607624B2 (en) 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
CN109785851B (zh) * 2013-09-12 2023-12-01 杜比实验室特许公司 用于各种回放环境的动态范围控制

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1465146A (zh) * 2001-07-07 2003-12-31 三星电子株式会社 移动通信系统中的数据发送和接收方法
CN1663249A (zh) * 2002-06-24 2005-08-31 松下电器产业株式会社 元数据生成装置、其生成方法以及检索装置
CN1684523A (zh) * 2003-11-26 2005-10-19 三星电子株式会社 用于编码/解码具有辅助信息的音频比特流的方法和设备
CN1973434A (zh) * 2004-07-01 2007-05-30 杜比实验室特许公司 用于校正影响音频信息的播放响度和动态范围的元数据的方法
CN102171755A (zh) * 2008-09-30 2011-08-31 杜比国际公司 音频元数据的编码变换
US20110208528A1 (en) * 2008-10-29 2011-08-25 Dolby International Ab Signal clipping protection using pre-existing audio gain metadata

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DOLBY LABORATORIES: "A Guide to Dolby Metadata", 《HTTP://WWW.DOLBY.COM/UPLOADEDFILES/ASSETS/US/DOC/PROFESSIONAL/18_METADATA.GUIDE.PDF》 *
DOLBY METADATA CHUNK: "Specification of the Broadcast Wave Format;a format for audio data files", 《HTTP://WWW.DOCIN.COM/P-534342070.HTML》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105531759B (zh) * 2013-09-12 2019-11-26 杜比实验室特许公司 用于下混合音频内容的响度调整
CN105531759A (zh) * 2013-09-12 2016-04-27 杜比实验室特许公司 用于下混合音频内容的响度调整
CN113257273A (zh) * 2014-10-01 2021-08-13 杜比国际公司 高效drc配置文件传输
CN105845151A (zh) * 2016-05-30 2016-08-10 百度在线网络技术(北京)有限公司 应用于语音识别前端的音频增益调整方法和装置
CN105845151B (zh) * 2016-05-30 2019-05-31 百度在线网络技术(北京)有限公司 应用于语音识别前端的音频增益调整方法和装置
CN110121707B (zh) * 2016-12-30 2023-10-31 谷歌有限责任公司 确定语义不同的响应以提供作为包括在电子通信中的建议
CN110121707A (zh) * 2016-12-30 2019-08-13 谷歌有限责任公司 确定语义上不同的响应以提供作为包括在电子通信中的建议
CN111108760A (zh) * 2017-09-29 2020-05-05 苹果公司 用于空间音频的文件格式
CN111108760B (zh) * 2017-09-29 2021-11-26 苹果公司 用于空间音频的文件格式
US11272308B2 (en) 2017-09-29 2022-03-08 Apple Inc. File format for spatial audio
CN109286922B (zh) * 2018-09-27 2021-09-17 珠海市杰理科技股份有限公司 蓝牙提示音处理方法、系统、可读存储介质和蓝牙设备
CN109286922A (zh) * 2018-09-27 2019-01-29 珠海市杰理科技股份有限公司 蓝牙提示音处理方法、系统、可读存储介质和蓝牙设备
CN113647120A (zh) * 2019-03-14 2021-11-12 高迪奥实验室公司 用于控制响度级的音频信号处理方法和装置
CN113647120B (zh) * 2019-03-14 2023-08-08 高迪奥实验室公司 用于控制响度级的音频信号处理装置
US11791789B2 (en) 2019-03-14 2023-10-17 Gaudio Lab, Inc. Audio signal processing method and device for controlling loudness level

Also Published As

Publication number Publication date
WO2014160849A3 (en) 2014-11-27
US20140294200A1 (en) 2014-10-02
EP2956936A2 (en) 2015-12-23
AU2014241222A1 (en) 2015-10-08
EP3540733A1 (en) 2019-09-18
TWI562138B (en) 2016-12-11
US10644666B2 (en) 2020-05-05
KR101761041B1 (ko) 2017-07-25
TW201443886A (zh) 2014-11-16
US10958229B2 (en) 2021-03-23
EP2956936B1 (en) 2019-04-24
CN111370007B (zh) 2023-10-27
CN105103222B (zh) 2020-03-17
AU2014241222B2 (en) 2016-10-27
US20210351754A1 (en) 2021-11-11
US9559651B2 (en) 2017-01-31
HK1215489A1 (zh) 2016-08-26
US20200169233A1 (en) 2020-05-28
KR20150122760A (ko) 2015-11-02
US20170201219A1 (en) 2017-07-13
CN117275493A (zh) 2023-12-22
CN111370007A (zh) 2020-07-03
ES2738494T3 (es) 2020-01-23
WO2014160849A2 (en) 2014-10-02
US11563411B2 (en) 2023-01-24

Similar Documents

Publication Publication Date Title
CN105103222A (zh) 用于响度和动态范围控制的元数据
JP6778781B2 (ja) エンコードされたオーディオ拡張メタデータベースのダイナミックレンジ制御
JP6750061B2 (ja) エンコードされたオーディオメタデータベースのイコライゼーション
JP6945092B2 (ja) 効率的なdrcプロファイル伝送
CN103119846B (zh) 利用对白水平归一化对音频流进行混合
US20140044268A1 (en) System and method for controlled dynamics adaptation for musical content
Wolters et al. Loudness normalization in the age of portable media players

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1215489

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant