CN102754151B - 用于对便携式装置内的音频信号的响度进行非破坏性标准化的系统和方法 - Google Patents

用于对便携式装置内的音频信号的响度进行非破坏性标准化的系统和方法 Download PDF

Info

Publication number
CN102754151B
CN102754151B CN201180009098.1A CN201180009098A CN102754151B CN 102754151 B CN102754151 B CN 102754151B CN 201180009098 A CN201180009098 A CN 201180009098A CN 102754151 B CN102754151 B CN 102754151B
Authority
CN
China
Prior art keywords
parameter
dynamic range
range compression
signal
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180009098.1A
Other languages
English (en)
Other versions
CN102754151A (zh
Inventor
杰弗里·C·里德米勒
哈拉尔德·H·蒙特
米夏埃尔·舒格
梅尔廷·沃尔特斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Dolby Sweden AB
Dolby Laboratories Licensing Corp
Original Assignee
Dolby International AB
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB, Dolby Laboratories Licensing Corp filed Critical Dolby International AB
Priority to CN201410039751.4A priority Critical patent/CN103795364B/zh
Publication of CN102754151A publication Critical patent/CN102754151A/zh
Application granted granted Critical
Publication of CN102754151B publication Critical patent/CN102754151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Stereophonic System (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

许多便携式回放装置无法以一致的响度和可理解度对具有宽带宽和宽动态范围的编码音频内容进行解码和回放,除非编码音频内容是专门为这些装置准备的。可以通过使编码内容包括一些元数据来克服该问题,该元数据根据相对于另一已知压缩简档的差分值或绝对值来指定适当的动态范围压缩简档。回放装置还可自适应地对回放音频施加增益和限制。公开了在编码器、转码器和解码器中的实现。

Description

用于对便携式装置内的音频信号的响度进行非破坏性标准化的系统和方法
对相关申请的引用
本申请要求2010年2月11日提交的美国专利临时申请61/303,643的优先权,其全部内容通过引用合并于此。
技术领域
本申请总体涉及对音频信号的编码和解码,并且更具体地,涉及可用于针对较宽范围的回放装置和收听环境对音频信号进行编码和解码的技术。
背景技术
手持式和其它类型的便携式装置的日益普及已经对用于在这些装置上回放的媒体内容的创作者和分发者产生了新的机会和挑战,同样也已经对装置的设计者和制造者产生了新的机会和挑战。许多便携式装置能够回放广泛的媒体内容类型和格式,包括通常与用于HDTV(高清电视)、Blu-ray(蓝光)或DVD(数字多功能盘)的高质量、宽带宽和宽动态范围的音频内容相关联的那些媒体内容类型和格式。便携式装置可用于在其自身的内部声换能器上或者在诸如耳机的外部换能器上回放该类型的音频内容;然而,这些便携式装置通常无法在变化的媒体格式和内容类型中以一致的响度和可理解度来再现该内容。
发明内容
本发明涉及提供用于对音频信号进行编码和解码、以在包括手持式和其它类型的便携式装置的多种装置上进行回放的改进方法。
所附独立权利要求中阐述了本发明的各个方面。
本发明的各种特征及其优选实施例可通过参考以下论述和附图而得到更好的理解,在附图中,相同的附图标记在多幅图中指的是相同的元件。附图和以下论述的内容仅作为示例来阐述,并且不应理解为表示对本发明的范围的限制。
附图说明
图1是回放装置的示意框图。
图2是编码装置的示意框图。
图3至图5是转码装置的示意框图。
图6是可用于实现本发明的各个方面的装置的示意框图。
具体实施方式
A.介绍
本发明涉及用于对音频信息进行编码和解码,以在具有挑战性的收听环境(诸如手持式和其它类型的便携式装置的用户所遇到的收听环境)中进行回放。诸如以下所描述的公开标准描述了音频编码和解码的一些示例:由高级电视业务顾问委员会有限公司(Advanced Television SystemsCommittee,Inc.)在2005年6月14日公布的“Digital Audio CompressionStandard(AC-3,E-AC-3)”,修订B,文档A/52B(此处称为“ATSC标准”),以及由国际标准组织(ISO)公布的ISO/IEC 13818-7,高级音频编码(AAC)(此处称为“MPEG-2 AAC标准”)和ISO/IEC 14496-3,子部分4(此处称为“MPEG-4音频标准”)。只是作为示例而给出了遵照这些标准的编码和解码处理。本发明的原理也可用于遵照其它标准的编码系统。
发明人发现,遵照一些编码标准的装置的可用特征通常不足以用于手持式和其它类型的便携式装置的典型的应用和收听环境。当这些类型的装置被用于对遵照这些标准的编码输入信号的音频内容进行解码时,所解码的音频内容通常以如下响度水平被再现:该响度水平显著低于通过对专门为在这些装置上回放而准备的编码输入信号进行解码而获得的音频内容的响度水平。
遵照例如ATSC标准的编码输入信号(此处称为“遵照ATSC的编码信号”)包含编码音频信息以及用于描述该信息可以如何解码的元数据。一些元数据参数标识动态范围压缩简档,该动态范围压缩简档指定当对编码音频信息进行解码时可如何对音频信息的动态范围进行压缩。可以保持解码信号的完全动态范围,或者可以在解码时以不同的程度来对其进行压缩,以满足不同应用和收听环境的要求。其它元数据标识编码音频信息的响度的某种度量,诸如编码信号中的对话的水平或平均节目水平。该元数据可被解码器用于调整解码信号的幅度,以在回放期间实现指定的响度或参考再现水平。在一些应用中,可以指定或假设一个或多个参考再现水平,而在其它应用中,用户可对参考再现水平的设置进行控制。例如,用于对遵照ATSC的编码信号进行编码和解码的编码处理假设要以两个参考再现水平之一回放对话。一个水平是比限幅水平低31dB,其中限幅水平是最大的可能数字值或满量程(FS)值,这个比限幅水平低31dB的水平在这里标记为-31dBFS。使用该水平的解码模式有时称为“线模式(LineMode)”,并且旨在用于适合较宽动态范围的应用和环境中。另一水平被设置为-20dBFS。使用该第二水平的解码模式有时称为“RF模式”,其旨在用在如在通过对射频(RF)信号调制而进行广播时所遇到的应用和环境中,其中需要较窄的动态范围以避免过调制。
对于另一示例,遵照MPEG-2 AAC标准和MPEG-4音频标准的编码信号包括用于标识编码音频信息的平均响度水平的元数据。对遵照MPEG-2 AAC和MPEG-4音频的编码信号进行解码的处理可允许收听者指定期望的回放水平。解码器使用该期望的回放水平和平均响度元数据来调整解码信号的幅度,以实现期望的回放水平。
当手持式和其它类型的便携式装置被用于根据这些元数据参数来对遵照ATSC、遵照MPEG-2 AAC以及遵照MPEG-4音频的编码信号的音频内容进行解码和回放时,动态范围和响度水平通常是不适合的,这是由于这些类型的装置所遇到的不利的收听环境或者由于因在这些装置中使用的较低操作电压而导致的电限制。
遵照其它标准的编码信号使用类似类型的元数据,并且可包括用于指定期望的回放响度水平的规定。对这些信号进行解码的便携式装置通常遇到相同的问题。
本发明可用于改进手持式和便携式装置的用户的收听体验,而不需要专门为这些装置准备的内容。
B.装置概述
图1是包括本发明的各个方面的一种类型的接收器/解码器装置10的示意框图。装置10从信号路径11接收编码输入信号,在反格式化器12中应用适当的处理以从输入信号提取编码音频信息和相关联的元数据,将编码音频信息传递到解码器14并且沿信号路径13传递元数据。编码音频信息包括表示听觉刺激的谱内容的编码子带信号,并且元数据指定多种参数的值,这多种参数包括一个或多个解码控制参数以及用于根据动态范围压缩简档来指定动态范围压缩的一个或多个参数。术语“动态范围压缩简档”指的是诸如增益因子、压缩进行(compress attack)次数和压缩释放(compress release)次数的特征,这些特征定义了动态范围压缩器的操作特性。
解码器14对编码音频信息应用解码处理以获得解码子带信号,该解码子带信号被传递到动态范围控制16。可响应于从信号路径13接收的解码控制参数来调节解码处理的操作和功能。可用于调节解码处理的操作和功能的解码控制参数的示例是用于标识音频信道的数量和配置的参数,其中该音频信道由编码音频信息表示。
动态范围控制16可选地调整解码音频信息的动态范围。该调整可响应于从信号路径13和/或从控制信号接收的元数据而被启动或关闭以及调节,其中可响应于来自收听者的输入来提供该控制信号。例如,可响应于收听者操作开关或者选择用于装置10的操作选项来提供控制信号。
在遵照例如ATSC标准、MPEG-2 AAC标准或MPEG-4音频标准的实施中,编码输入信号包括以段或帧的序列布置的编码音频信息。各个帧包含如下编码子带信号:这些编码子带信号表示具有其完全动态范围的音频信号的谱分量。动态范围控制16可不采取动作,这允许以最大的动态范围量来回放音频信号,或者动态范围控制16可修改解码子带信号,以按照不同的程度来压缩动态范围。
合成滤波器组18对解码子带信号应用可由动态范围控制16调整的一组合成滤波器,并且在其输出处提供可以是数字或模拟信号的时域音频信号。
增益-限制器20在本发明的一些实施中用于调整时域音频信号的幅度。增益-限制器20的输出沿着路径21传递,以用于随后由声换能器进行呈现。
图2是包括本发明的各个方面的编码器/发送器装置30的示意框图。装置30从信号路径31接收表示听觉刺激的音频输入信号。装置30对音频信号应用一组分析滤波器,以获得作为输入音频信号的频域表示的子带信号或者表示输入音频信号的一组带限信号。元数据计算器34对音频输入信号和/或从音频输入信号获得的一个或多个信号(诸如来自分析滤波器组32的子带信号或音频输入信号的变型形式)进行分析,以计算指定多种参数的值的元数据,这多种参数包括编码控制参数、一个或多个解码控制参数以及用于根据动态范围压缩简档来指定动态范围压缩的一个或多个参数。元数据计算器34可对时域信号、频域信号或者时域和频域信号的组合进行分析。也可响应于从路径33接收的一个或多个元数据参数来调节由元数据计算器34执行的计算。编码器36对分析滤波器组32的输出应用编码处理,以获得包括编码子带信号的编码音频信息,该编码音频信息被传递到格式化器38。可响应于从路径33接收的编码控制参数来调节编码处理。编码处理还可生成沿着路径33的其它解码控制参数,以供在装置10中执行的处理用于对编码音频信息进行解码。格式化器38将编码音频信息和元数据中的至少一些元数据汇编成为具有适合于传输或存储的格式的编码输出信号,该元数据包括一个或多个解码控制参数以及用于指定动态范围压缩的一个或多个参数。
在遵照例如ATSC标准、MPEG-2 AAC标准或MPEG-4音频标准的实施中,编码输出信号包括以段或帧的序列布置的编码音频信息。各个帧包含如下编码子带信号:这些编码子带信号表示具有其完全动态范围的音频信号的谱分量,并且具有用于以参考再现水平进行回放的幅度。
反格式化器12、解码器14、合成滤波器组18、分析滤波器组32、编码器36以及格式化器38在设计和操作方面可以是传统的。一些示例包括遵照上述公开标准的相应部件。在这些标准中指定或提出的部件的实施适合用于本发明,但并非必需这些部件。这些部件的特定实施都不是必须的。
图3至图5是包括上述装置10和装置30中的一些部件的转码器装置40的不同实施的示意框图。这些部件与它们的对应部件基本上相同地工作。图3所示的装置40能够将从路径11接收的编码输入信号转码成遵照相同编码标准的变型形式。在该实施中,装置40从信号路径11接收编码输入信号,在反格式化器12中应用适当的处理以从编码输入信号提取第一编码音频信息和相关联的元数据,将第一编码音频信息传递到解码器14和格式化器38,并且沿着信号路径43传递元数据。第一编码音频信息包括表示听觉刺激的谱内容的编码子带信号,并且元数据指定多种参数的值,这多种参数包括一个或多个解码控制参数以及用于根据第一动态范围压缩简档来指定动态范围压缩的一个或多个参数。解码器14对第一编码音频信息应用解码处理以获得解码子带信号。可响应于从信号路径43接收的一个或多个解码控制参数来调节解码处理的操作和功能。子带信号可以是听觉刺激的频域表示或者表示听觉刺激的一组带限信号。
元数据计算器44对解码子带信号和/或从解码子带信号得到的一个或多个信号进行分析,以计算用于根据第二动态范围压缩简档来指定动态范围压缩的一个或多个参数值。例如,可通过对解码子带信号应用合成滤波器组18来得到一个或多个信号。可响应于从路径43接收的元数据来调节由元数据计算器44执行的计算。如果合成滤波器组18的输出不需要用于元数据计算,则可从该实施中省略合成滤波器组18。
图4中示出了装置40的另一实施。该实施与图3所示的实施类似,但是包括编码器36。包括编码器36允许装置40将遵照第一编码标准的、从路径11接收的编码输入信号转码成遵照第二编码标准的编码输出信号,该第二编码标准可与第一编码标准相同或不同,只要两个编码标准的子带信号兼容即可。这可在该实施中通过使编码器36对子带信号应用编码处理以获得遵照第二编码标准的第二编码音频信息来实现。第二编码音频信息被传递到格式化器38。可响应于从路径43接收的元数据来调节编码处理。编码处理还可生成沿着路径43的其它元数据,以供在装置10中执行的处理用于对编码音频信息解码。格式化器38将从路径43接收的元数据和其接收的编码音频信息汇编成具有适合于传输或存储的格式的编码输出信号。
图5中示出了装置40的又一实现。该实现包括合成滤波器组18,该合成滤波器组18被应用于解码子带信号,以获得编码音频信息的时域或宽带表示。包括合成滤波器组18和分析滤波器组32允许装置40在基本上任意编码标准选择之间进行转码。合成滤波器组18的输出被传递到分析滤波器组32,分析滤波器组32生成子带信号,以供编码器36进行编码。编码器36对分析滤波器组32的输出应用编码处理,以获得第二编码音频信息,该第二编码音频信息被传递到格式化器38。编码处理还可生成沿着路径43的其它元数据,以供在装置10中执行的处理用于对编码音频信息解码。元数据计算器44可根据其对从解码器14接收的子带信号、合成滤波器组18的输出以及分析滤波器组32的输出中的任意或全部的分析来计算元数据参数值。
以下更详细地描述装置10和装置30的一些方面。这些描述适用于装置40的相应特征。这些方面是按照遵照上述ATSC标准的方法和装置的特征和特性来描述的。这些具体特征和特性仅作为示例来讨论。这些实施中的根本原理直接适用于遵照其它标准的方法和装置。
C.接收器/解码器
上述回放问题可通过使用下述三种不同技术中的一种或多种来解决。第一技术使用增益限制并且可通过仅在装置10中的特征来实施。第二技术和第三技术使用动态范围压缩,并且其实施需要在装置10和装置30两者中的特征。
1.增益-限制器
第一技术以RF模式而不是以线模式来操作装置10,以使得其利用动态范围控制16对遵照ATSC的编码输入信号进行解码,动态范围控制16提供较高的动态范围压缩水平和较高的参考再现水平。增益-限制器20提供额外的增益,从而将有效参考再现水平提高到从-14dBFS到-8dBFS的值。经验结果表明等于-11dBFS的参考水平对于很多应用给出良好结果。
增益-限制器20还应用限制操作,以防止放大的数字信号超过0dBFS。限制器的操作特性可以影响再现音频的感知质量,但是没有特定限制器对本发明而言是必须的。限制器可基本上以任意可能期望的方式来实施。优选地,限制器被设计成提供“软”限制功能而非“硬”限幅功能。
2.差分压缩值
第二技术允许装置10在动态范围控制16中应用一个或多个修改的动态范围压缩参数。反格式化器12从编码输入信号获得差分动态范围压缩(DRC)参数值,并且沿着路径13将差分参数值与传统的DRC参数值一起传递到动态范围控制16。动态范围控制16通过对传统的DRC参数值和对应的差分DRC参数值进行算术组合来计算所需的一个或多个DRC参数值。在该情形中不需要使用增益-限制器20。
由生成编码输入信号的编码器/发送器装置30在编码输入信号中提供差分DRC参数值。这在以下进行描述。
如果编码输入信号不包含这些差分DRC值,则装置10可以使用根据上述第一技术的增益-限制器20。
3.独特压缩简档
第三技术允许装置10在动态范围控制16中应用根据新动态范围压缩简档的动态范围压缩。反格式化器12从编码输入信号获得新简档的一个或多个DRC参数值,并且沿路径13将它们传递到动态范围控制16。在该情形中不需要使用增益-限制器20。
由生成编码输入信号的编码器/发送器装置30在编码输入信号中提供新动态范围压缩简档的DRC参数值。这在以下进行描述。
如果编码输入信号不包含新DRC简档的一个或多个DRC参数值,则装置10可以使用根据上述第一技术的增益-限制器20。
D.编码器/发送器
1.差分压缩值
在装置10中通过使用从编码输入信号提取的差分DRC参数值来实施上述第二技术的处理。这些差分参数值由生成编码信号的装置30来提供。
装置30提供一组差分DRC参数值,这组差分DRC参数值表示将存在于编码信号中的一组DRC参数值与新DRC简档的一组对应的基本参数值之间的差,并且是防止解码音频信号样本超过0dBFS以实现较高的参考再现水平所需的。用于计算DRC参数值的特定方法都不是本发明必须的。在由高级电视业务顾问委员会有限公司(Advanced Television SystemsCommittee,Inc.)在2009年11月4日公布的“ATSC RecommendedPractice:Techniques for Estalishiing an Maintaining Audio Loudness forDigital Television”,文档A/85(尤其是在第9节和附录F)中以及在Robinson等人的“Dynamic Range Control via Metadata”,预印号5028,107th AES convention,纽约,1999年9月中公开了遵照ATSC标准的用于计算参数值的公知方法。
如果编码输出信号遵照ATSC标准、MPEG-2 AAC标准或MPEG-4音频标准,则参考再现水平增加到从-14dBFS到-8dBFS的值。经验结果表明等于-11dBFS的参考水平对于很多应用给出良好结果。
对于遵照ATSC的编码输出信号,元数据计算器34计算对于该标准中指定的对应的基本参数“compr”的差分参数值。格式化器38可将差分参数值汇编成各个编码信号帧的标记为“addbsi”(额外比特流信息)和/或“auxdata”(辅助数据)的部分。如果差分参数值被汇编成“addbsi”部分或“auxdata”部分,则编码信号将与所有遵照ATSC的解码器兼容。不能识别差分参数值的那些解码器仍然可以通过忽略“addbsi”和“auxdata”部分而正确地对编码信号帧进行处理和解码。参考以上引用的A/52b文献文档以得到更多细节。
对于遵照MPEG-2 AAC标准或MPEG-4音频标准的编码输出信号,格式化器38可将差分参数值汇编成各个编码信号帧的在两个标准中被标记为“Fill_Element”或“Data_Stream_Element”的部分。如果差分参数值被汇编成这些部分之一,则编码信号将与所有遵照MPEG-2 AAC标准和MPEG-4音频标准的解码器兼容。参考以上引用的ISO/IEC 13818-7和ISO/IEC 14496-3文档以得到更多细节。
可计算差分参数值,并以大于、等于或小于对应的基本参数值在编码信号中的速率的速率来将差分参数值插入到编码信号中。差分值的速率可变化。用于表示先前的差分值是否应该再次使用的标志或比特也可包括在编码信号中。
2.独特压缩简档
在装置10中通过使用从编码输入信号提取的、新动态范围压缩简档的DRC参数值来实施上述第三技术的处理。这些参数值由生成编码信号的装置30来提供。
装置30通过计算如下参数值来得到新DRC简档的DRC参数值:这些参数值是防止解码音频信号样本超过0dBFS以得到较高的参考再现水平所需的。
如果编码输出信号遵照ATSC标准、MPEG-2 AAC标准或MPEG-4音频标准,则元数据计算器34基于参考再现水平增加到从-14dBFS到-8dBFS的值这一假设来计算DRC压缩值。经验结果表明等于-11dBFS的参考水平对于很多应用给出良好结果。格式化器38可将DRC简档的参数值汇编成各个编码信号帧的如上所述的用于差分参数的部分。帧的这些部分的使用允许编码信号与遵照各个标准的所有解码器兼容。
E.实现
包括本发明的各个方面的装置可以以多种方式来实现,这些方式包括用于由计算机或某种其它装置执行的软件,该其他装置包括耦合到与通用计算机中发现的部件类似的部件的更专用的部件(诸如数字信号处理器(DSP)电路)。图6是可用于实施本发明的方面的装置70的示意框图。处理器72提供计算资源。RAM 73是被处理器72用于进行处理的系统随机存取存储器(RAM)。ROM 74表示某种形式的持久存储装置(诸如只读存储器(ROM)),其用于存储操作装置70所需的程序并且可以用于执行本发明的各个方面。I/O控制75表示用于利用通信信道76、77接收输入信号和发送输出信号的接口电路。在所示出的实施例中,所有主要的系统部件均连接到总线71,总线71可表示多于一个物理或逻辑总线;然而,总线架构不是实现本发明必须的。
在由通用计算机系统实现的实施例中,可包括额外的部件,用于与诸如键盘或鼠标和显示器的装置接口,以及用于控制具有存储介质(诸如磁带或磁盘、或者光学介质)的存储装置78。存储介质可用于记录用于操作系统、用途以及应用的指令的程序,并且可包括实施本发明的各个方面的程序。
实践本发明的各个方面所需的功能可以由以多种方式实施的部件来执行,这些部件包括分立逻辑部件、集成电路、一个或多个ASIC和/或程序控制处理器。这些部件实现的方式对本发明并不重要。
本发明的软件实施可通过多种机器可读介质(诸如贯穿包括从超声频率到紫外线频率的频谱的调制通信信道或基带)或者使用基本上任何记录技术表达信息的存储介质(包括磁带、卡或盘、光卡或光盘、以及包括纸的介质上的可检测标记)来表达。

Claims (24)

1.一种用于对编码输入信号进行解码以生成音频输出信号的方法,其中,所述方法包括:
接收包括编码音频信息和相关联的元数据的所述编码输入信号,所述相关联的元数据包括一个或多个解码控制参数以及一个或多个第一参数,所述一个或多个第一参数根据第一动态范围压缩简档来指定动态范围压缩,并且所述相关联的元数据可选地包括一个或多个第二参数,所述一个或多个第二参数根据第二动态范围压缩简档来指定动态范围压缩,其中,所述一个或多个第一参数具有下述值:根据生成所述编码音频信息的编码处理而设置所述值,以表示具有用于以第一参考再现水平进行回放的、不超过限幅水平的幅度的听觉刺激;并且其中,所述一个或多个第二参数具有下述值:根据生成所述编码音频信息的编码处理而设置所述值,以表示具有用于以第二参考再现水平进行回放的、不超过所述限幅水平的幅度的所述听觉刺激,所述第二参考再现水平高于所述第一参考再现水平;
对所述编码音频信息应用解码处理,以获得表示所述听觉刺激的谱内容的子带信号,其中,响应于所述一个或多个解码控制参数来调节所述解码处理;
修改所述子带信号,以获得具有改变的动态范围特性的修改子带信号,其中,如果所述元数据包括所述一个或多个第二参数,则响应于所述一个或多个第二参数来调节所述修改,或者如果所述元数据不包括所述一个或多个第二参数,则响应于所述一个或多个第一参数来调节所述修改;
对所述修改子带信号应用合成滤波器组,以获得时域音频信号;以及
如果所述元数据不包括所述一个或多个第二参数,则响应于所述元数据而对所述时域音频信号施加增益并应用限制器,其中,所述增益的施加修改所述时域音频信号,以获得具有用于以所述第二参考再现水平进行回放的幅度的所述音频输出信号,并且其中,所述限制器的应用防止所述音频输出信号的幅度超过所述限幅水平。
2.根据权利要求1所述的方法,其中,所述一个或多个第二参数表示所述第一动态范围压缩简档和所述第二动态范围压缩简档的对应参数之间的差。
3.根据权利要求1或2所述的方法,其中,所述编码输入信号遵照ATSC标准、MPEG-2AAC标准或MPEG-4音频标准,所述第一参考再现水平对应于低于所述限幅水平20dB的幅度,并且所述第二参考再现水平对应于低于所述限幅水平11dB的幅度。
4.一种用于对表示听觉刺激的音频输入信号进行编码的方法,其中,所述方法包括:
接收所述音频输入信号;
对所述音频输入信号应用分析滤波器组,以生成表示所述音频输入信号的谱内容的子带信号;
分析从所述音频输入信号得到的一个或多个信号,以计算元数据,所述元数据包括一个或多个第一参数以及一个或多个第二参数,所述一个或多个第一参数根据第一动态范围压缩简档来指定动态范围压缩,而所述一个或多个第二参数根据第二动态范围压缩简档来指定动态范围压缩,其中,所述一个或多个第一参数具有下述值:所述值被设置为表示具有用于以第一参考再现水平进行回放的、不超过限幅水平的幅度的所述听觉刺激,并且其中,所述一个或多个第二参数具有下述值:所述值被设置为表示具有用于以第二参考再现水平进行回放的、不超过所述限幅水平的幅度的所述听觉刺激;
对所述子带信号应用编码处理,以获得编码音频信息;以及
将所述编码音频信息和所述元数据汇编成具有适合于传输或存储的格式的编码输出信号,其中,所述一个或多个第二参数表示所述第一动态范围压缩简档和所述第二动态范围压缩简档的对应参数之间的差。
5.根据权利要求4所述的方法,其中,所述编码输出信号遵照ATSC标准、MPEG-2AAC标准或MPEG-4音频标准,所述第一参考再现水平对应于低于所述限幅水平20dB的幅度,并且所述第二参考再现水平对应于低于所述限幅水平11dB的幅度。
6.一种用于对编码输入信号进行转码以生成编码输出信号的方法,其中,所述方法包括:
接收包括第一编码音频信息和相关联的元数据的所述编码输入信号,所述相关联的元数据包括一个或多个解码控制参数以及一个或多个第一参数,所述一个或多个第一参数根据第一动态范围压缩简档来指定动态范围压缩,其中,所述一个或多个第一参数具有下述值:根据生成所述第一编码音频信息的第一编码处理而设置所述值,以表示具有用于以第一参考再现水平进行回放的、不超过限幅水平的幅度的听觉刺激;
对所述第一编码音频信息应用解码处理,以获得表示所述听觉刺激的谱内容的子带信号,其中,响应于所述一个或多个解码控制参数来调节所述解码处理;
分析从所述子带信号获得的一个或多个信号,以计算一个或多个第二参数,所述一个或多个第二参数根据第二动态范围压缩简档来指定动态范围压缩,其中,所述一个或多个第二参数具有下述值:所述值被设置为表示具有用于以第二参考再现水平进行回放的、不超过所述限幅水平的幅度的所述听觉刺激;以及
将第二编码音频信息、所述一个或多个第一参数以及所述一个或多个第二参数汇编成具有适合于传输或存储的格式的编码输出信号,其中,所述第二编码音频信息是所述子带信号的编码表示。
7.根据权利要求6所述的方法,其中,所述一个或多个第二参数表示所述第一动态范围压缩简档和所述第二动态范围压缩简档的对应参数之间的差。
8.根据权利要求6或7所述的方法,还包括:对所述子带信号应用合成滤波器组以获得所述一个或多个信号,其中所述一个或多个信号被分析以计算指定动态范围压缩的所述一个或多个第二参数。
9.根据权利要求6或7所述的方法,还包括:对所述子带信号应用第二编码处理,以生成所述第二编码音频信息。
10.根据权利要求6或7所述的方法,其中,所述第二编码音频信息是所述第一编码音频信息。
11.根据权利要求6或7所述的方法,其中,所述编码输入信号遵照ATSC标准、MPEG-2AAC标准或MPEG-4音频标准,并且所述第一参考再现水平对应于低于所述限幅水平20dB的幅度。
12.根据权利要求6或7所述的方法,其中,所述编码输出信号遵照ATSC标准、MPEG-2AAC标准或MPEG-4音频标准,并且所述第二参考再现水平对应于低于所述限幅水平11dB的幅度。
13.一种用于对编码输入信号进行解码以生成音频输出信号的设备,其中,所述设备包括:
用于接收包括编码音频信息和相关联的元数据的所述编码输入信号的装置,所述相关联的元数据包括一个或多个解码控制参数以及一个或多个第一参数,所述一个或多个第一参数根据第一动态范围压缩简档来指定动态范围压缩,并且所述相关联的元数据可选地包括一个或多个第二参数,所述一个或多个第二参数根据第二动态范围压缩简档来指定动态范围压缩,其中,所述一个或多个第一参数具有下述值:根据生成所述编码音频信息的编码处理而设置所述值,以表示具有用于以第一参考再现水平进行回放的、不超过限幅水平的幅度的听觉刺激;并且其中,所述一个或多个第二参数具有下述值:根据生成所述编码音频信息的编码处理而设置所述值,以表示具有用于以第二参考再现水平进行回放的、不超过所述限幅水平的幅度的所述听觉刺激,所述第二参考再现水平高于所述第一参考再现水平;
用于对所述编码音频信息应用解码处理,以获得表示所述听觉刺激的谱内容的子带信号的装置,其中,响应于所述一个或多个解码控制参数来调节所述解码处理;
用于修改所述子带信号,以获得具有改变的动态范围特性的修改子带信号的装置,其中,如果所述元数据包括所述一个或多个第二参数,则响应于所述一个或多个第二参数来调节所述修改,或者如果所述元数据不包括所述一个或多个第二参数,则响应于所述一个或多个第一参数来调节所述修改;
用于对所述修改子带信号应用合成滤波器组,以获得时域音频信号的装置;以及
用于如果所述元数据不包括所述一个或多个第二参数,则响应于所述元数据而对所述时域音频信号施加增益并应用限制器的装置,其中,所述增益的施加修改所述时域音频信号,以获得具有用于以所述第二参考再现水平进行回放的幅度的所述音频输出信号,并且其中,所述限制器的应用防止所述音频输出信号的幅度超过所述限幅水平。
14.根据权利要求13所述的设备,其中,所述一个或多个第二参数表示所述第一动态范围压缩简档和所述第二动态范围压缩简档的对应参数之间的差。
15.根据权利要求13或14所述的设备,其中,所述编码输入信号遵照ATSC标准、MPEG-2AAC标准或MPEG-4音频标准,所述第一参考再现水平对应于低于所述限幅水平20dB的幅度,并且所述第二参考再现水平对应于低于所述限幅水平11dB的幅度。
16.一种用于对表示听觉刺激的音频输入信号进行编码的设备,其中,所述设备包括:
用于接收所述音频输入信号的装置;
用于对所述音频输入信号应用分析滤波器组,以生成表示所述音频输入信号的谱内容的子带信号的装置;
用于分析从所述音频输入信号得到的一个或多个信号,以计算元数据的装置,所述元数据包括一个或多个第一参数以及一个或多个第二参数,所述一个或多个第一参数根据第一动态范围压缩简档来指定动态范围压缩,而所述一个或多个第二参数根据第二动态范围压缩简档来指定动态范围压缩,其中,所述一个或多个第一参数具有下述值:所述值被设置为表示具有用于以第一参考再现水平进行回放的、不超过限幅水平的幅度的所述听觉刺激,并且其中,所述一个或多个第二参数具有下述值:所述值被设置为表示具有用于以第二参考再现水平进行回放的、不超过所述限幅水平的幅度的所述听觉刺激;
用于对所述子带信号应用编码处理,以获得编码音频信息的装置;以及
用于将所述编码音频信息和所述元数据汇编成具有适合于传输或存储的格式的编码输出信号的装置,其中,所述一个或多个第二参数表示所述第一动态范围压缩简档和所述第二动态范围压缩简档的对应参数之间的差。
17.根据权利要求16所述的设备,其中,所述编码输出信号遵照ATSC标准、MPEG-2AAC标准或MPEG-4音频标准,所述第一参考再现水平对应于低于所述限幅水平20dB的幅度,并且所述第二参考再现水平对应于低于所述限幅水平11dB的幅度。
18.一种用于对编码输入信号进行转码以生成编码输出信号的设备,其中,所述设备包括:
用于接收包括第一编码音频信息和相关联的元数据的所述编码输入信号的装置,所述相关联的元数据包括一个或多个解码控制参数以及一个或多个第一参数,所述一个或多个第一参数根据第一动态范围压缩简档来指定动态范围压缩,其中,所述一个或多个第一参数具有下述值:根据生成所述第一编码音频信息的第一编码处理而设置所述值,以表示具有用于以第一参考再现水平进行回放的、不超过限幅水平的幅度的听觉刺激;
用于对所述第一编码音频信息应用解码处理,以获得表示所述听觉刺激的谱内容的子带信号的装置,其中,响应于所述一个或多个解码控制参数来调节所述解码处理;
用于分析从所述子带信号获得的一个或多个信号,以计算一个或多个第二参数的装置,所述一个或多个第二参数根据第二动态范围压缩简档来指定动态范围压缩,其中,所述一个或多个第二参数具有下述值:所述值被设置为表示具有用于以第二参考再现水平进行回放的、不超过所述限幅水平的幅度的所述听觉刺激;以及
用于将第二编码音频信息、所述一个或多个第一参数以及所述一个或多个第二参数汇编成具有适合于传输或存储的格式的编码输出信号的装置,其中,所述第二编码音频信息是所述子带信号的编码表示。
19.根据权利要求18所述的设备,其中,所述一个或多个第二参数表示所述第一动态范围压缩简档和所述第二动态范围压缩简档的对应参数之间的差。
20.根据权利要求18或19所述的设备,还包括:用于对所述子带信号应用合成滤波器组以获得所述一个或多个信号的装置,其中所述一个或多个信号被分析以计算指定动态范围压缩的所述一个或多个第二参数。
21.根据权利要求18或19所述的设备,还包括:用于对所述子带信号应用第二编码处理,以生成所述第二编码音频信息的装置。
22.根据权利要求18或19所述的设备,其中,所述第二编码音频信息是所述第一编码音频信息。
23.根据权利要求18或19所述的设备,其中,所述编码输入信号遵照ATSC标准、MPEG-2AAC标准或MPEG-4音频标准,并且所述第一参考再现水平对应于低于所述限幅水平20dB的幅度。
24.根据权利要求18或19所述的设备,其中,所述编码输出信号遵照ATSC标准、MPEG-2AAC标准或MPEG-4音频标准,并且所述第二参考再现水平对应于低于所述限幅水平11dB的幅度。
CN201180009098.1A 2010-02-11 2011-02-03 用于对便携式装置内的音频信号的响度进行非破坏性标准化的系统和方法 Active CN102754151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410039751.4A CN103795364B (zh) 2010-02-11 2011-02-03 用于对编码输入信号进行解码的方法和设备

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US30364310P 2010-02-11 2010-02-11
US61/303,643 2010-02-11
PCT/US2011/023531 WO2011100155A1 (en) 2010-02-11 2011-02-03 System and method for non-destructively normalizing loudness of audio signals within portable devices

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201410039751.4A Division CN103795364B (zh) 2010-02-11 2011-02-03 用于对编码输入信号进行解码的方法和设备

Publications (2)

Publication Number Publication Date
CN102754151A CN102754151A (zh) 2012-10-24
CN102754151B true CN102754151B (zh) 2014-03-05

Family

ID=43881135

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201410039751.4A Active CN103795364B (zh) 2010-02-11 2011-02-03 用于对编码输入信号进行解码的方法和设备
CN201180009098.1A Active CN102754151B (zh) 2010-02-11 2011-02-03 用于对便携式装置内的音频信号的响度进行非破坏性标准化的系统和方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201410039751.4A Active CN103795364B (zh) 2010-02-11 2011-02-03 用于对编码输入信号进行解码的方法和设备

Country Status (18)

Country Link
US (7) US8903729B2 (zh)
EP (3) EP3444816B8 (zh)
JP (2) JP5666625B2 (zh)
KR (1) KR101381588B1 (zh)
CN (2) CN103795364B (zh)
AR (1) AR080156A1 (zh)
BR (2) BR112012019880B1 (zh)
CA (6) CA3114177C (zh)
CL (1) CL2012002213A1 (zh)
CO (1) CO6511277A2 (zh)
EA (1) EA023730B9 (zh)
ES (1) ES2916403T3 (zh)
MX (1) MX2012008954A (zh)
MY (1) MY169981A (zh)
SG (1) SG182632A1 (zh)
TW (2) TWI447709B (zh)
UA (1) UA105277C2 (zh)
WO (1) WO2011100155A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11842743B2 (en) 2015-03-13 2023-12-12 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11431312B2 (en) 2004-08-10 2022-08-30 Bongiovi Acoustics Llc System and method for digital signal processing
US10848118B2 (en) 2004-08-10 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US10158337B2 (en) 2004-08-10 2018-12-18 Bongiovi Acoustics Llc System and method for digital signal processing
US10848867B2 (en) 2006-02-07 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US10701505B2 (en) 2006-02-07 2020-06-30 Bongiovi Acoustics Llc. System, method, and apparatus for generating and digitally processing a head related audio transfer function
TWI501580B (zh) 2009-08-07 2015-09-21 Dolby Int Ab 資料串流的鑑別
TWI413110B (zh) 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
JP5771618B2 (ja) 2009-10-19 2015-09-02 ドルビー・インターナショナル・アーベー 音声オブジェクトの区分を示すメタデータ時間標識情報
TWI447709B (zh) 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
TWI525987B (zh) 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5719966B2 (ja) * 2011-04-08 2015-05-20 ドルビー ラボラトリーズ ライセンシング コーポレイション 2つのエンコードされたビットストリームからのオーディオストリームの混合において使用するためのメタデータの自動設定
CN107403624B (zh) 2012-05-18 2021-02-12 杜比实验室特许公司 用于音频信号的动态范围调整及控制的方法和设备
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
IN2015DN04001A (zh) 2012-11-07 2015-10-02 Dolby Int Ab
US9411881B2 (en) 2012-11-13 2016-08-09 Dolby International Ab System and method for high dynamic range audio distribution
CN107578781B (zh) * 2013-01-21 2021-01-29 杜比实验室特许公司 利用响度处理状态元数据的音频编码器和解码器
CN109036443B (zh) 2013-01-21 2023-08-18 杜比实验室特许公司 用于在不同回放设备之间优化响度和动态范围的系统和方法
TR201802631T4 (tr) 2013-01-21 2018-03-21 Dolby Laboratories Licensing Corp Program Ses Şiddeti ve Sınır Meta Verilere Sahip Sesli Enkoder ve Dekoder
BR122022020326B1 (pt) * 2013-01-28 2023-03-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Método e aparelho para reprodução de áudio normalizado de mídia com e sem metadados de ruído integrado em novos dispositivos de mídia
JP6250071B2 (ja) 2013-02-21 2017-12-20 ドルビー・インターナショナル・アーベー パラメトリック・マルチチャネル・エンコードのための方法
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9883318B2 (en) 2013-06-12 2018-01-30 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
WO2015038475A1 (en) 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Dynamic range control for a wide variety of playback environments
WO2015038522A1 (en) * 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
US20150095320A1 (en) * 2013-09-27 2015-04-02 Trooclick France Apparatus, systems and methods for scoring the reliability of online information
JP6588899B2 (ja) * 2013-10-22 2019-10-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ装置のための組合せダイナミックレンジ圧縮および誘導クリッピング防止のための概念
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
US20150146099A1 (en) * 2013-11-25 2015-05-28 Anthony Bongiovi In-line signal processor
US9276544B2 (en) 2013-12-10 2016-03-01 Apple Inc. Dynamic range control gain encoding
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
US9608588B2 (en) 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
US10021484B2 (en) * 2014-02-27 2018-07-10 Sonarworks Sia Method of and apparatus for determining an equalization filter
US10063207B2 (en) * 2014-02-27 2018-08-28 Dts, Inc. Object-based audio loudness management
CA3155815A1 (en) 2014-03-24 2015-10-01 Dolby International Ab METHOD AND DEVICE FOR APPLYING DYNAMIC RANGE COMPRESSION TO A HIGHER ORDER SURROUND SIGNAL
RU2678487C2 (ru) 2014-03-25 2019-01-29 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство аудиокодера и устройство аудиодекодера, имеющие эффективное кодирование усиления при управлении динамическим диапазоном
US10820883B2 (en) 2014-04-16 2020-11-03 Bongiovi Acoustics Llc Noise reduction assembly for auscultation of a body
WO2015197516A1 (en) * 2014-06-27 2015-12-30 Thomson Licensing Method for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values
JP6555263B2 (ja) * 2014-06-30 2019-08-07 ソニー株式会社 情報処理装置および方法
EP2963948A1 (en) * 2014-07-02 2016-01-06 Thomson Licensing Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation
CN113257274A (zh) 2014-10-01 2021-08-13 杜比国际公司 高效drc配置文件传输
EP3518236B8 (en) * 2014-10-10 2022-05-25 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
US10109288B2 (en) 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US9590580B1 (en) 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
TWI594231B (zh) * 2016-12-23 2017-08-01 瑞軒科技股份有限公司 分頻壓縮電路,音訊處理方法以及音訊處理系統
US11089349B2 (en) * 2017-01-20 2021-08-10 Hanwha Techwin Co., Ltd. Apparatus and method for playing back and seeking media in web browser
US10924078B2 (en) * 2017-03-31 2021-02-16 Dolby International Ab Inversion of dynamic range control
CN110033781B (zh) * 2018-01-10 2021-06-01 盛微先进科技股份有限公司 音频处理方法、装置及非暂时性电脑可读媒体
CA3168578A1 (en) 2018-04-09 2019-10-17 Dolby International Ab Methods, apparatus and systems for three degrees of freedom (3dof+) extension of mpeg-h 3d audio
CA3096877A1 (en) 2018-04-11 2019-10-17 Bongiovi Acoustics Llc Audio enhanced hearing protection system
WO2020028833A1 (en) 2018-08-02 2020-02-06 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function
EP3809709A1 (en) * 2019-10-14 2021-04-21 Koninklijke Philips N.V. Apparatus and method for audio encoding
CN112732069A (zh) * 2021-02-20 2021-04-30 上海创感传感技术有限公司 一种电子设备状态修改方法和装置
CN112992159B (zh) * 2021-05-17 2021-08-06 北京百瑞互联技术有限公司 一种lc3音频编解码方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1973434A (zh) * 2004-07-01 2007-05-30 杜比实验室特许公司 用于校正影响音频信息的播放响度和动态范围的元数据的方法
EP2149983A1 (en) * 2008-07-29 2010-02-03 Lg Electronics Inc. A method and an apparatus for processing an audio signal

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2373975B (en) 2001-03-30 2005-04-13 Sony Uk Ltd Digital audio signal processing
US7328151B2 (en) * 2002-03-22 2008-02-05 Sound Id Audio decoder with dynamic adjustment of signal modification
US7072477B1 (en) 2002-07-09 2006-07-04 Apple Computer, Inc. Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US7398207B2 (en) * 2003-08-25 2008-07-08 Time Warner Interactive Video Group, Inc. Methods and systems for determining audio loudness levels in programming
US7729673B2 (en) 2004-12-30 2010-06-01 Sony Ericsson Mobile Communications Ab Method and apparatus for multichannel signal limiting
JP2007109328A (ja) 2005-10-14 2007-04-26 Kenwood Corp 再生装置
US20080025530A1 (en) 2006-07-26 2008-01-31 Sony Ericsson Mobile Communications Ab Method and apparatus for normalizing sound playback loudness
US8239191B2 (en) * 2006-09-15 2012-08-07 Panasonic Corporation Speech encoding apparatus and speech encoding method
DE102006048685A1 (de) 2006-10-14 2008-04-17 Mtu Aero Engines Gmbh Turbinenschaufel einer Gasturbine
US20090253457A1 (en) 2008-04-04 2009-10-08 Apple Inc. Audio signal processing for certification enhancement in a handheld wireless communications device
US8645129B2 (en) * 2008-05-12 2014-02-04 Broadcom Corporation Integrated speech intelligibility enhancement system and acoustic echo canceller
US9197181B2 (en) * 2008-05-12 2015-11-24 Broadcom Corporation Loudness enhancement system and method
US8315396B2 (en) 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
JP2010135906A (ja) 2008-12-02 2010-06-17 Sony Corp クリップ防止装置及びクリップ防止方法
TWI447709B (zh) 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
PL2381574T3 (pl) 2010-04-22 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób do modyfikacji wejściowego sygnału audio
JP5903758B2 (ja) 2010-09-08 2016-04-13 ソニー株式会社 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8989884B2 (en) 2011-01-11 2015-03-24 Apple Inc. Automatic audio configuration based on an audio output device
JP2012235310A (ja) 2011-04-28 2012-11-29 Sony Corp 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8965774B2 (en) 2011-08-23 2015-02-24 Apple Inc. Automatic detection of audio compression parameters
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
JP2013102411A (ja) 2011-10-14 2013-05-23 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム
RU2586874C1 (ru) 2011-12-15 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для устранения артефактов амплитудного ограничения
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
EP2757558A1 (en) 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
BR122022020326B1 (pt) 2013-01-28 2023-03-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Método e aparelho para reprodução de áudio normalizado de mídia com e sem metadados de ruído integrado em novos dispositivos de mídia
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9607624B2 (en) 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
JP2015050685A (ja) 2013-09-03 2015-03-16 ソニー株式会社 オーディオ信号処理装置および方法、並びにプログラム
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
US9300268B2 (en) 2013-10-18 2016-03-29 Apple Inc. Content aware audio ducking
JP6588899B2 (ja) 2013-10-22 2019-10-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ装置のための組合せダイナミックレンジ圧縮および誘導クリッピング防止のための概念
US9240763B2 (en) 2013-11-25 2016-01-19 Apple Inc. Loudness normalization based on user feedback
US9276544B2 (en) 2013-12-10 2016-03-01 Apple Inc. Dynamic range control gain encoding
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
US9608588B2 (en) 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
US9654076B2 (en) 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
RU2678487C2 (ru) 2014-03-25 2019-01-29 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство аудиокодера и устройство аудиодекодера, имеющие эффективное кодирование усиления при управлении динамическим диапазоном
PL3800898T3 (pl) 2014-05-28 2023-12-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Procesor danych i transport danych kontrolnych użytkownika do dekoderów audio i modułów renderowania
JPWO2015182491A1 (ja) 2014-05-30 2017-04-20 ソニー株式会社 情報処理装置および情報処理方法
CN106471574B (zh) 2014-06-30 2021-10-12 索尼公司 信息处理装置和信息处理方法
TWI631835B (zh) 2014-11-12 2018-08-01 弗勞恩霍夫爾協會 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器
US20160315722A1 (en) 2015-04-22 2016-10-27 Apple Inc. Audio stem delivery and control
US10109288B2 (en) 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
AU2016270282B2 (en) 2015-05-29 2019-07-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for volume control
PL3311379T3 (pl) 2015-06-17 2023-03-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kontrola głośności dla interaktywności użytkownika w systemach kodowania audio
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US9934790B2 (en) 2015-07-31 2018-04-03 Apple Inc. Encoded audio metadata-based equalization
US10341770B2 (en) 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1973434A (zh) * 2004-07-01 2007-05-30 杜比实验室特许公司 用于校正影响音频信息的播放响度和动态范围的元数据的方法
EP2149983A1 (en) * 2008-07-29 2010-02-03 Lg Electronics Inc. A method and an apparatus for processing an audio signal

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
An Analysis of Audio for Digital Cable Television Recommendations for the Digital Transition via Audio Metadata;Jeffrey C.Riedmiller;《the 2001 NCTA Technical Papers》;20011231;1-18 *
Jeffrey C.Riedmiller.An Analysis of Audio for Digital Cable Television Recommendations for the Digital Transition via Audio Metadata.《the 2001 NCTA Technical Papers》.2001,1-18.
ROBINSON D.ReplayGain - a proposed standard.《http://www.replaygain.org/》.2001,1-11.
ROBINSON D.ReplayGain- a proposed standard.《http://www.replaygain.org/》.2001,1-11. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11842743B2 (en) 2015-03-13 2023-12-12 Dolby International Ab Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element

Also Published As

Publication number Publication date
CA3201814A1 (en) 2011-08-18
TW201205559A (en) 2012-02-01
US11341982B2 (en) 2022-05-24
JP6133263B2 (ja) 2017-05-24
US20230343347A1 (en) 2023-10-26
EP4047602A1 (en) 2022-08-24
SG182632A1 (en) 2012-08-30
US20190325886A1 (en) 2019-10-24
TW201506912A (zh) 2015-02-16
CA3075793A1 (en) 2011-08-18
US9646622B2 (en) 2017-05-09
TWI447709B (zh) 2014-08-01
CA3114177A1 (en) 2011-08-18
CA2995461C (en) 2020-04-28
JP2015045886A (ja) 2015-03-12
CL2012002213A1 (es) 2012-11-30
US10566006B2 (en) 2020-02-18
EP3444816A1 (en) 2019-02-20
CA2787466C (en) 2016-04-05
MY169981A (en) 2019-06-19
BR122019025627B1 (pt) 2021-01-19
US8903729B2 (en) 2014-12-02
CN103795364A (zh) 2014-05-14
EP2534656B1 (en) 2018-09-05
EP3444816B1 (en) 2022-04-13
CN102754151A (zh) 2012-10-24
CA3075793C (en) 2021-05-18
ES2916403T3 (es) 2022-06-30
KR20120124484A (ko) 2012-11-13
CA2787466A1 (en) 2011-08-18
US11670315B2 (en) 2023-06-06
US11948592B2 (en) 2024-04-02
BR112012019880B1 (pt) 2020-10-13
US20150043754A1 (en) 2015-02-12
EA023730B1 (ru) 2016-07-29
AR080156A1 (es) 2012-03-14
EA023730B9 (ru) 2016-11-30
EP2534656A1 (en) 2012-12-19
US20220358944A1 (en) 2022-11-10
CA2918302A1 (en) 2011-08-18
CA2918302C (en) 2018-04-03
CO6511277A2 (es) 2012-08-31
TWI529703B (zh) 2016-04-11
CA3114177C (en) 2023-08-01
EA201270712A1 (ru) 2013-01-30
US20120310654A1 (en) 2012-12-06
US20170213566A1 (en) 2017-07-27
JP2013519918A (ja) 2013-05-30
CA2995461A1 (en) 2011-08-18
KR101381588B1 (ko) 2014-04-17
EP3444816B8 (en) 2022-05-25
US10418045B2 (en) 2019-09-17
MX2012008954A (es) 2012-08-23
UA105277C2 (ru) 2014-04-25
BR112012019880A2 (pt) 2016-04-26
JP5666625B2 (ja) 2015-02-12
US20200176008A1 (en) 2020-06-04
WO2011100155A1 (en) 2011-08-18
CN103795364B (zh) 2016-08-24

Similar Documents

Publication Publication Date Title
CN102754151B (zh) 用于对便携式装置内的音频信号的响度进行非破坏性标准化的系统和方法
CN109785851B (zh) 用于各种回放环境的动态范围控制
CN102792588A (zh) 用于在单个回放模式中结合响度测量的系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20121024

Assignee: Dongguan de video technology Co. Ltd. Kit

Assignor: Dolby International AB|Dolby Laboratories Licensing Corp

Contract record no.: 2015990000860

Denomination of invention: System and method for non-destructively normalizing loudness of audio signals within portable devices

Granted publication date: 20140305

License type: Common License

Record date: 20151020

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20121024

Assignee: Zhejiang Tianle Digital Electrical Appliances Co.,Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2016990000265

Denomination of invention: System and method for non-destructively normalizing loudness of audio signals within portable devices

Granted publication date: 20140305

License type: Common License

Record date: 20160701

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20121024

Assignee: Shenzhen Sowell Technology Co., Ltd.

Assignor: Dolby Laboratories Licensing Corp,|Dolby International AB

Contract record no.: 2016990000396

Denomination of invention: System and method for non-destructively normalizing loudness of audio signals within portable devices

Granted publication date: 20140305

License type: Common License

Record date: 20160913

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model