CN111326165A - 音频编码器装置、音频解码器装置、及其操作方法 - Google Patents
音频编码器装置、音频解码器装置、及其操作方法 Download PDFInfo
- Publication number
- CN111326165A CN111326165A CN201911392325.8A CN201911392325A CN111326165A CN 111326165 A CN111326165 A CN 111326165A CN 201911392325 A CN201911392325 A CN 201911392325A CN 111326165 A CN111326165 A CN 111326165A
- Authority
- CN
- China
- Prior art keywords
- dynamic range
- range control
- dfr
- node
- control frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 85
- 230000005236 sound signal Effects 0.000 claims abstract description 74
- 230000002123 temporal effect Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 238000009877 rendering Methods 0.000 claims 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
本发明提供一种音频编码器装置,包括:音频编码器,用于从包括连续音频帧的音频信号产生经编码的音频比特流;动态范围控制编码器,用于从对应于音频信号且包括连续动态范围控制帧的动态范围控制序列产生经编码的动态范围控制比特流,其中动态范围控制帧中的每个动态范围控制帧包括一个或多个节点,其中一个或多个节点中的每个节点包括用于音频信号的增益信息及指示增益信息所对应的时间点的时间信息;其中动态范围控制编码器用于使得对于动态范围控制帧中的每个动态范围控制帧,经编码的动态范围控制比特流包括对应的比特流部分。
Description
本申请是申请人为弗朗霍夫应用科学研究促进协会、申请日为2015年3月20日、申请号为201580015978.8、发明名称为“音频编码器装置、音频解码器装置、及其操作方法”的分案申请。
技术领域
在此文件的上下文中的动态范围控制(DRC)涉及一种以受控制方式减小音频信号的动态范围的数字信号处理技术[1]。通过减小响亮声音分量的位准(level)和/或放大音频信号的软部分来实现动态范围的期望减小。
背景技术
用于DRC的典型应用为使音频信号的动态性质适应于收听环境。例如,当在吵杂环境中收听音乐时,应减小动态范围以便允许整体信号放大而不对所得经放大信号进行削波。在此情况下,应例如借助于限制器来衰减高信号峰值。另外,应相对于响亮部分来放大软信号分量以便改良其在吵杂收听环境中的可懂度。
发明内容
本发明的目标为提供一种用于在音频传输的上下文中的动态范围控制的增强型概念。
此目标由一种音频编码器装置实现,该音频编码器装置包括:
音频编码器,用于从包括连续音频帧的音频信号产生经编码的音频比特流;
动态范围控制编码器,用于从对应于所述音频信号且包括连续动态范围控制帧的动态范围控制序列产生经编码的动态范围控制比特流,其中所述动态范围控制帧中的每个动态范围控制帧包括一个或多个节点,其中所述一个或多个节点中的每个节点包括用于所述音频信号的增益信息及指示所述增益信息所对应的时间点的时间信息;
其中所述动态范围控制编码器用于使得对于所述动态范围控制帧中的每个动态范围控制帧,所述经编码的动态范围控制比特流包括对应的比特流部分;
其中所述动态范围控制编码器用于执行移位过程,其中将所述动态范围控制帧中的一个参考动态范围控制帧的节点中的一个或多个节点选择为经移位节点,其中所述一个参考动态范围控制帧的一个或多个经移位节点中的每一个的比特表示被嵌入于对应于所述一个参考动态范围控制帧之后的动态范围控制帧的比特流部分中,其中所述动态范围控制帧中的一个参考动态范围控制帧的节点中的每个剩余节点的比特表示被嵌入至对应于所述一个参考动态范围控制帧的比特流部分中。
本发明解决使用音频信号的编码来进行音频传输的情形,其中并不直接地将增益信息应用于音频信号,而是连同经编码的音频信号一起进行编码及传输。在解码器处,可解码音频信号及增益信息且可将增益信息应用于对应的音频信号。如下文较详细地所解释,本发明实现增益信息的有效编码。更精确地,其避免经编码的动态范围控制比特流中的比特率峰值。
可通过音频信号x(k)与时变增益值g(k)的简单相乘来表达将动态范围控制应用于音频信号的过程:
y(k)=g(k)x(k) (1)
其中k表示样本时间索引。增益g(k)的值可例如基于音频信号x(k)的均方根的短期估计而计算。[1]中论述关于用于确定合适增益值的策略的较多细节。在下文中,我们将时变增益g(k)称为增益序列。
在下文中,解释动态范围控制增益序列的编码。首先,将动态范围控制增益序列划分成所谓的增益样本的动态范围控制帧,其含有固定数目的增益样本。通常,将动态范围控制帧的时间帧大小选择为等于对应的音频编码器的音频帧的时间大小。在每个动态范围控制帧内,较佳地在均匀时间网格上选择所谓的节点。
此网格的间隔限定最高可用时间分辨率,即,两个节点之间的最小样本距离等于具有最高可用时间分辨率的样本。每个节点由动态范围控制帧内的样本位置、用于该位置的增益信息(其可被表达为增益值)及可选的关于增益值在节点位置处的斜率的信息表示。对于以下论述,将有用的是限定可在一个帧内选择的节点的最大数目。
动态范围控制编码器例如通过使用成对的连续增益节点的经量化差分值而编码来自节点的增益信息。在解码器处,通过基于节点的经传输信息(增益值、动态范围控制帧内的样本位置及斜率信息(在适用时))来使用样条内插或线性内插而尽可能良好地重建原始增益序列。
一种用于编码动态范围控制增益序列的有效方法为使用成对的连续节点的增益差的经量化值(通常以dB为单位)以及这些节点在所考虑的动态范围控制帧内的样本位置的时间差。斜率信息通常并不被表示为两个节点之间的差。由于对于帧内的第一节点并不存在先前节点,因此并不以差分方式来编码其增益值,而是明确地编码该值。第一节点的时间差通常被确定为至该动态范围控制帧的开始的偏移。
然后,编码器可将例如预定霍夫曼表(码本)的固定码字分配至成对节点的增益及时间差中的每一个。
在动态范围控制解码器处,解码该动态范围控制比特流且重建经传输节点的位置处的相关信息(增益值、动态范围控制帧内的样本位置及斜率信息(在适用时))。通过成对的经传输及经解码节点之间的内插来获得用于帧内的剩余增益样本的增益值。如果已传输增益节点的斜率信息,则内插可基于样条,或可选地,如果仅成对节点之间的增益差可用且斜率信息被丢弃,则可以使用线性内插。
原则上,动态范围控制编码器/解码器链可以两种模式进行操作。所谓的全帧模式涉及在解码对应于参考动态范围控制帧的经接收动态范围控制比特流之后可紧接地在内插之后基于经解码节点确定参考动态范围控制帧的每个样本位置处的增益的情况。这暗示必须在每个帧边界处(即,在对应于参考动态范围控制帧的最后样本的样本位置处)传输节点。如果动态范围控制帧长度为N,则这意味着最后传输的节点必须位于参考动态范围控制帧内的样本位置N处。
本发明避免这个缺点,由于其基于被称作“延迟模式”的第二模式。在此情况下,无需针对参考动态范围控制帧内的最后样本位置传输节点。因此,动态范围控制解码器必须等待解码参考动态范围控制帧之后的动态范围控制帧,以便在参考动态范围控制帧内的最后节点之后执行所有增益值的期望内插。这是因为必须知道后续动态范围控制帧的第一节点的信息以执行参考动态范围控制帧的最后节点与后续动态范围控制帧的第一节点之间的内插,以便经由内插而确定两者之间的增益值。
实际上,由使用延迟模式以用于编码动态范围控制信息造成的延迟并非问题。这是因为通常伴随动态范围控制编码方案的音频编解码器在随后应用编码及解码步骤时也引入一个音频帧的固有延迟。这种音频编解码器的重要示例为ISO/IEC 13818-7、高级音频编码(MPEG-2AAC)、ISO/IEC 14496-3、子部分4(MPEG-4AAC),或ISO/IEC 23003-3、部分3、统一语音及音频编码(USAC)。这种音频编码方案需要参考音频帧及参考音频帧之后的音频帧,以便计算(使用重迭相加结构)对应于参考动态范围控制音频帧的正确音频样本。
重要的是应注意,充分地近似原始动态范围控制增益序列所需要的节点的数目在动态范围控制帧之间显著地变化。此情形由如下事实引起:与仅必须编码缓慢改变的增益值的情况相比较,需要较多节点以表示高度时变增益。这个观察暗示用以传输增益序列所需的比特率可在帧之间显著地变化。一些帧可要求编码大数目的节点,从而引起高比特率峰值。此情形尤其是在包括经编码动态范围控制比特流及经编码音频比特流的联合比特流中传输音频信号及动态范围控制增益序列时(其应具有几乎恒定比特率)是不合乎需要的。接着,动态范围控制相关的比特率中的峰值减小用于音频编码器的可用比特率,此情形常常引起解码之后的音频质量的退化。然而,使用用于动态范围控制增益序列的编码的目前技术水平的方法,仅通过减小经选择以表示帧内的增益序列的节点的数目来实现一定帧中的动态范围控制相关的比特率的减小。此情形再次可在原始增益序列与动态范围控制解码过程之后重建的增益序列之间导致大误差。本发明通过减小经编码动态范围控制比特流的峰值比特率来克服这些缺点,而不增加原始序列与经重建动态范围控制序列之间的误差。
在此部分中,呈现根据本发明的动态范围控制增益序列的编码。与并不使用所提出方法的情况相比较,本发明允许在不改变所得比特流序列的情况下控制参考动态范围控制帧所需要的峰值比特率。所提出方法利用由目前技术水平的音频编码器引入的一个帧的固有延迟以通过将一个帧内的节点中的一些的传输分布至下一后续动态范围控制帧来减小节点的数目的峰值。下文中呈现所提出方法的细节。
如上文所解释,当与相对于动态范围控制增益引入帧延迟的音频编码方案进行组合时,在应用于音频信号之前将经解码动态范围控制增益延迟一个帧。这意味着将参考动态范围控制帧的节点应用于参考动态范围控制帧之后的动态范围控制帧处的有效音频解码器输出。此暗示:在默认延迟模式中,足以在无直接地对解码器处的对应音频输出信号的延迟的情况下与参考动态范围控制帧之后的动态范围控制帧的节点一起传输参考动态范围控制帧的节点且应用对应动态范围控制增益。
在本发明中利用此事实以便减小在一个动态范围控制帧内传输的节点的最大数目。根据本发明,将参考动态范围控制帧的节点中的一些移位至后续动态范围控制帧,此可在编码之前进行。如下文中将论述,经移位节点可在后续动态范围控制帧中的第一节点“之前”以仅用于编码增益差及斜率信息。为了编码时间差信息,可应用不同方法。
根据本发明的优选实施例,在参考动态范围控制帧的节点的数目大于预定阈值的情况下开始移位过程。
根据本发明的优选实施例,在参考动态范围控制帧的节点的数目与待嵌入于对应于参考动态范围控制帧的比特流部分中的来自参考动态范围控制帧之前的动态范围控制帧的经移位节点的数目的总和大于预定阈值的情况下开始移位过程。
根据本发明的优选实施例,在参考动态范围控制帧的节点的数目与待嵌入于对应于参考动态范围控制帧的比特流部分中的来自参考动态范围控制帧之前的动态范围控制帧的经移位节点的数目的总和大于参考动态范围控制帧之后的动态范围控制帧的节点的数目的情况下开始移位过程。
独立于开始移位过程所限定的条件,不应将参考动态范围控制帧的第一节点移位至后续动态范围控制帧,由于其值需要用于在参考动态范围控制帧的开始处内插增益控制值。此外,节点应仅移位一次,以便在解码比特流时避免延迟。
根据本发明的优选实施例,一各或多个节点的时间信息表示成使得可通过使用该时间信息来识别一个或多个经移位节点。
根据本发明的优选实施例,一个或多个经移位节点的时间信息由从个别节点所属的动态范围控制帧的开始至个别节点在个别节点所属于的动态范围控制帧内的时间位置的时间差与大于或等于个别动态范围控制帧之后的动态范围控制帧的时间大小的偏移值的总和表示。
根据本发明的优选实施例,在对应于参考动态范围控制帧之后的动态范围控制帧的比特流部分的第一位置处的经移位节点的比特表示的增益信息由绝对增益值表示,且其中在对应于参考动态范围控制帧之后的动态范围控制帧的比特流部分的第一位置处的节点的比特表示之后的位置处的经移位节点的每个比特表示的增益信息由等于个别经移位节点的比特表示的增益值与个别节点的比特表示之前的节点的比特表示的增益值的差的相对增益值表示。
根据本发明的优选实施例,在参考动态范围控制帧的一个或多个经移位节点的比特表示被嵌入于对应于参考动态范围控制帧之后的动态范围控制帧的比特流部分中的情况下,在一个或多个经移位节点的比特表示的一个或多个位置之后的对应于参考动态范围控制帧之后的动态范围控制帧的比特流部分的第一位置处的后续动态范围控制帧的节点的比特表示的增益信息由等于个别节点的比特表示的增益值与个别节点的比特表示之前的经移位节点的比特表示的增益值的差的相对增益值表示。
根据本发明的优选实施例,音频帧的时间大小等于动态范围控制帧的时间大小。
根据本发明的优选实施例,动态范围控制帧中的一个的一各或多个节点选自均匀时间网格。
根据本发明的优选实施例,一个或多个节点中的每个节点包括斜率信息。
根据本发明的优选实施例,动态范围控制编码器用于使用熵编码技术(诸如,霍夫曼编码或算术编码)来编码节点。
编码器可将例如预定霍夫曼表(码本)的固定码字分配至成对节点的增益及时间差中的每个。表1及表2中分别给出用于编码成对连续节点的时间差的合适霍夫曼表的示例。
表1:用于DRC增益节点的时间差的编码的霍夫曼表的示例。
表2:用于DRC增益节点的时间差的编码的霍夫曼表的示例,其中Z=ceil(log2(2*nNodesMax))
在本发明的另一方面中,目标由一种音频解码器装置实现,该音频解码器装置包括:
音频解码器,用于解码经编码的音频比特流,以便再现包括连续音频帧的音频信号;
动态范围控制解码器,用于解码经编码的动态范围控制比特流,以便再现对应于音频信号且包括连续动态范围控制帧的动态范围控制序列;
其中对于动态范围控制帧中的每个动态范围控制帧,经编码的动态范围控制比特流包括对应的比特流部分;
其中经编码的动态范围控制比特流包括节点的比特表示,其中节点中的一个节点的每个比特表示包括用于音频信号AS的增益信息及指示增益信息所对应的时间点的时间信息;
其中经编码的动态范围控制比特流包括选自动态范围控制帧中的一个参考动态范围控制帧的节点的经移位节点的比特表示,该比特表示嵌入于对应于一个参考动态范围控制帧之后的动态范围控制帧的比特流部分中,其中将动态范围控制帧中的一个参考动态范围控制帧的节点中的每个剩余节点的比特表示嵌入至对应于一个参考动态范围控制帧的比特流部分中;且
其中动态范围控制解码器用于解码动态范围控制帧中的一个参考动态范围控制帧的剩余节点中的每个剩余节点的比特表示,以便再现动态范围控制帧中的一个参考动态范围控制帧的每个剩余节点;用于解码选自动态范围控制帧中的一个参考动态范围控制帧的节点的经移位节点中的每个经移位节点的比特表示,以便再现选自动态范围控制帧中的一个参考动态范围控制帧的节点的经移位节点中的每个经移位节点;及用于组合所再现的剩余节点与所再现的经移位节点,以便重建参考动态范围控制帧。
动态范围控制解码器接收动态范围控制比特流。可以下列方式来解码对应于节点信息(样本位置、增益值及斜率信息(在适用时))的动态范围控制比特流:
基于例如霍夫曼码本中示出的规则,从接收的码字确定用于两个节点之间的时间差的值(例如,为两个节点之间的最小距离的整数倍)。通过将时间差值加至针对先前节点所计算的样本位置值来获得当前经解码节点的对应样本位置。
在解码参考动态范围控制帧的节点之后,解码后续动态范围控制帧的节点。
如果后续动态范围控制帧内所确定的样本位置对应于大于后续动态范围控制帧的长度的值,则动态范围控制解码器知道当前时间节点信息涉及最初位于参考动态范围控制帧中的节点。
为了获得参考动态范围控制帧内的正确样本位置,从所计算出的样本位置减去偏移。实际示例为减去对应于动态范围控制帧的长度的值(此暗示编码器已将相同值加至原始样本位置)。偏移值的典型示例为动态范围控制帧的时间大小。
在解码整个后续动态范围控制帧中的所有节点的时间信息且在适用时校正时间信息之后,解码器知道多少节点已移位回至参考动态范围控制帧(而不在编码器处明确地提供此信息)及其在参考动态范围控制帧内位于哪个样本位置。
动态范围控制解码器进一步通过解码比特流中的差分增益信息来确定接收帧的所有节点的增益值信息。
从时间信息的解码步骤,解码器知道必须将多少经解码增益值分配给参考动态范围控制帧的节点(及分配给的样本位置)及将哪些增益值分配给参考动态范围控制帧中的节点。
类似于增益值的解码过程而执行斜率信息的解码及至正确节点的分配。
在解码后续动态范围控制帧的所有节点之后,可保证经由内插针对参考动态范围控制帧的每个样本计算增益值所需要的所有节点为可用的。在内插步骤之后,可将每个样本的动态范围控制增益值应用于对应的正确音频样本。
根据本发明的优选实施例,动态范围控制解码器用于通过使用时间信息来识别一个或多个经移位节点。
根据本发明的优选实施例,动态范围控制解码器用于解码一个或多个经移位节点的时间信息,该时间信息由从个别节点所属的动态范围控制帧的开始至各别节点在个别节点所属的动态范围控制帧内的时间位置的时间与大于或等于个别动态范围控制帧之后的动态范围控制帧的时间大小的偏移值的总和表示。
根据本发明的优选实施例,动态范围控制解码器用于解码在对应于参考动态范围控制帧之后的动态范围控制帧的比特流部分的第一位置处的经移位节点的比特表示的增益信息,该增益信息由绝对增益值表示,且其中在对应于参考动态范围控制帧之后的动态范围控制帧的比特流部分的第一位置处的节点的比特表示之后的位置处的经移位节点的每个比特表示的增益信息由等于个别经移位节点的比特表示的增益值与个别节点的比特表示之前的节点的比特表示的增益值的差的相对增益值表示。
根据本发明的优选实施例,动态范围控制解码器用于解码在一个或多个经移位节点的比特表示的一个或多个位置之后的对应于参考动态范围控制帧之后的动态范围控制帧的比特流部分的第一位置处的后续动态范围控制帧的节点的比特表示的增益信息,该增益信息由等于个别节点的比特表示的增益值与个别节点的比特表示之前的经移位节点的比特表示的增益值的差的相对增益值表示。
根据本发明的优选实施例,音频帧的时间大小等于动态范围控制帧的时间大小。
根据本发明的优选实施例,动态范围控制帧中的一个的一个或多个节点选自均匀时间网格。
根据本发明的优选实施例,一个或多个节点中的每个节点包括斜率信息。
根据本发明的优选实施例,动态范围控制解码器用于使用熵解码技术来解码节点的比特表示。
目标进一步由一种系统获得,该系统包括根据本发明的音频编码器装置及根据本发明的音频解码器装置。
本发明进一步提供一种用于操作音频编码器的方法,该方法包括如下步骤:
从包括连续音频帧的音频信号产生经编码的音频比特流;
从对应于音频信号且包括连续动态范围控制帧的动态范围控制序列产生经编码的动态范围控制比特流,其中动态范围控制帧中的每个动态范围控制帧包括一个或多个节点,其中一个或多个节点中的每个节点包括用于音频信号的增益信息及指示增益信息所对应的时间点的时间信息;
其中对于动态范围控制帧中的每个动态范围控制帧,经编码的动态范围控制比特流包括对应的比特流部分;
执行移位过程,其中将动态范围控制帧中的一个参考动态范围控制帧的节点中的一个或多个节点选择为经移位节点,其中将一个参考动态范围控制帧的一个或多个经移位节点中的每个的比特表示嵌入于对应于一个参考动态范围控制帧之后的动态范围控制帧的比特流部分中,其中将动态范围控制帧中的一个参考动态范围控制帧的节点中的每个剩余节点的比特表示嵌入至对应于一个参考动态范围控制帧的比特流部分中。
本发明进一步提供一种用于操作音频解码器的方法,该方法包括如下步骤:
解码经编码的音频比特流,以便再现包括连续音频帧的音频信号;
解码经编码的动态范围控制比特流,以便再现对应于音频信号且包括连续动态范围控制帧的动态范围控制序列;
其中对于动态范围控制帧中的每个动态范围控制帧,经编码的动态范围控制比特流包括对应的比特流部分;
其中经编码的动态范围控制比特流包括节点的比特表示,其中节点中的一个节点的每个比特表示包括用于音频信号AS的增益信息及指示增益信息所对应的时间点的时间信息;
其中经编码的动态范围控制比特流包括选自动态范围控制帧中的一个参考动态范围控制帧的节点的经移位节点的比特表示,该比特表示嵌入于对应于一个参考动态范围控制帧之后的动态范围控制帧的比特流部分中,其中将动态范围控制帧中的一个参考动态范围控制帧的节点中的每个剩余节点的比特表示嵌入至对应于一个参考动态范围控制帧的比特流部分中;且
其中解码动态范围控制帧中的一个参考动态范围控制帧的剩余节点中的每个剩余节点的比特表示,以便再现动态范围控制帧中的一个参考动态范围控制帧的每个剩余节点;
其中解码选自动态范围控制帧中的一个参考动态范围控制帧的节点的经移位节点中的每个经移位节点的比特表示,以便再现选自动态范围控制帧中的一个参考动态范围控制帧的节点的经移位节点中的每个经移位节点;且
其中组合再现的剩余节点与再现的经移位节点,以便重建参考动态范围控制帧。
在另一方面中,本发明提供一种程序,其用于当在处理器上运行时执行根据本发明的该方法。
附图说明
随后关于附图论述本发明的优选实施例,其中:
图1以示意图说明根据本发明的音频编码器装置的实施例;
图2以示意图说明在音频编码的上下文中应用的动态范围控制的原理;
图3以示意图说明用于动态范围控制增益序列的编码的不同模式;
图4以示意图说明在音频编码的上下文中的动态范围控制的应用;
图5以示意图说明根据本发明的用于节点的移位过程;
图6以示意图说明根据本发明的时间信息的编码;
图7以示意图说明根据本发明的增益信息的编码;
图8以示意图说明根据本发明的斜率信息的编码;及
图9以示意图说明根据本发明的音频解码器装置的实施例。
具体实施方式
图1以示意图说明根据本发明的音频编码器装置1的实施例。音频编码器装置1包括:
音频编码器2,用于从包括连续音频帧AFP、AFR、AFS的音频信号AS产生经编码的音频比特流ABS;
动态范围控制编码器3,用于从对应于音频信号AS且包括连续动态范围控制帧DFP、DFR、DFS的动态范围控制序列DS产生经编码的动态范围控制比特流DBS,其中动态范围控制帧DFP、DFR、DFS中的每个动态范围控制帧DFP、DFR、DFS包括一个或多个节点A0…A5;B0…B2;C0,其中一个或多个节点A0…A5;B0…B2;C0中的每个节点包括用于音频信号AS的增益信息GA0…GA5;GB0…GB2;GC0及指示增益信息GA0…GA5;GB0…GB2;GC0所对应的时间点的时间信息TA0…TA5;TB0…TB2;TC0;
其中动态范围控制编码器3用于使得对于动态范围控制帧DFP、DFR、DFS中的每个动态范围控制帧DFP、DFR、DFS,经编码的动态范围控制比特流DBS包括对应的比特流部分DFP'、DFR'、DFS';
其中动态范围控制编码器2用于执行移位过程,其中将动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的节点B0…B2中的一个或多个节点B1、B2选择为经移位节点B1、B2,其中将一个参考动态范围控制帧DFR的一个或多个经移位节点B1、B2中的每个的比特表示B'1、B'2嵌入于对应于一个参考动态范围控制帧DFR之后的动态范围控制帧DFS的比特流部分DFS'中,其中将动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的节点B0…B2中的每个剩余节点B0的比特表示B'0嵌入至对应于一个参考动态范围控制帧DFR的比特流部分DFR'中。
与未使用所提出方法的情况相比较,本发明允许在不改变所得比特流序列DBS的情况下控制参考动态范围控制帧DFR所需要的峰值比特率。所提出方法利用由目前技术水平的音频编码器引入的一个帧的固有延迟以通过将一个帧内的节点中的一些的传输分布至下一后续动态范围控制帧来减小节点的数目的峰值。下文中呈现所提出方法的细节。
如上文所解释,当与相对于动态范围控制增益引入帧延迟的音频编码方案进行组合时,在应用于音频信号之前将经解码动态范围控制增益延迟一个帧。这意味着将参考动态范围控制帧的节点应用于参考动态范围控制帧之后的动态范围控制帧处的有效音频解码器输出。此暗示:在默认延迟模式中,足以在无直接地对解码器处的对应音频输出信号的延迟的情况下与参考动态范围控制帧之后的动态范围控制帧的节点一起传输参考动态范围控制帧的节点且应用对应动态范围控制增益。
在本发明中利用此事实以便减小在一个动态范围控制帧内传输的节点的最大数目。根据本发明,将参考动态范围控制帧的节点中的一些移位至后续动态范围控制帧,此可在编码之前进行。如下文中将论述,经移位节点可在后续动态范围控制帧中的第一节点“之前”以仅用于编码增益差及斜率信息。为了编码时间差信息,可应用不同方法。
在图1所示出的示例中,先前动态范围控制帧DFP包含六个节点A0…A5,其中节点A4、A5移位至比特流部分DFR'中。此外,参考动态范围控制帧DFR含有三个节点B0…B2。经移位节点A4、A5及参考动态范围控制帧DFR的节点B0…B2的数目的总和等于五,其大于后续动态范围控制帧DFS的节点C0的数目,使得开始移位过程,以便节点B1、B2移位至比特流部分DFS'中。尽管动态范围控制帧DFS、DFR、DFP内的节点的最大数目等于六,但比特流部分DFS'、DFR'、DFP'自身内的节点的最大数目等于四,使得避免比特流峰值。
根据本发明的优选实施例,音频帧AFP、AFR、AFS的时间大小等于动态范围控制帧DFP、DFR、DFS的时间大小。
根据本发明的优选实施例,动态范围控制帧DFP、DFR、DFS中的一个的一个或多个节点A0…A5;B0…B2;C0选自均匀时间网格。
根据本发明的优选实施例,动态范围控制编码器3用于使用熵编码技术来编码节点A0…A5;B0…B2;C0。
在另一方面中,本发明提供一种用于操作音频编码器1的方法,该方法包括如下步骤:
从包括连续音频帧AFP、AFR、AFS的音频信号AS产生经编码的音频比特流ABS;
从对应于音频信号AS且包括连续动态范围控制帧DFP、DFR、DFS的动态范围控制序列DS产生经编码的动态范围控制比特流DBS,其中动态范围控制帧DFP、DFR、DFS中的每个动态范围控制帧DFP、DFR、DFS包括一个或多个节点A0…A5;B0…B2;C0,其中一个或多个节点A0…A5;B0…B2;C0中的每个节点包括用于音频信号AS的增益信息GA0…GA5;GB0…GB2;GC0及指示增益信息所对应的时间点的时间信息TA0…TA5;TB0…TB2;TC0;
其中对于动态范围控制帧DFP、DFR、DFS中的每个动态范围控制帧DFP、DFR、DFS,经编码的动态范围控制比特流DBS包括对应的比特流部分DFP'、DFR'、DFS';
执行移位过程,其中将动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的节点B0…B2中的一个或多个节点B1、B2选择为经移位节点B1、B2,其中将一个参考动态范围控制帧DFR的一个或多个经移位节点B1、B2中的每个的比特表示B'1、B'2嵌入于对应于一个参考动态范围控制帧DFR之后的动态范围控制帧DFS的比特流部分DFS'中,其中将动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的节点B0…B2中的每个剩余节点B0的比特表示B'0嵌入至对应于一个参考动态范围控制帧DFR的比特流部分DFR'中。
图2以示意图说明在音频编码的上下文中应用的动态范围控制的原理。
可通过音频信号x(k)与时变增益值g(k)的简单相乘来表达将DRC应用于信号的过程:
y(k)=g(k)x(k) (1)
其中k表示样本时间索引。增益g(k)的值由例如基于输入信号x(k)的均方根的短期估计而计算。[1]中论述关于用于确定合适增益值的策略的较多细节。在下文中,我们将时变增益g(k)称为增益序列。
本发明参考音频信号AS及动态范围控制序列DS均被编码及传输的应用场景。在此情况下,并不将动态范围控制增益直接地应用于音频信号AS,而是与经编码的音频信号ABS一起进行编码及传输。在解码器4处,解码音频信号AS及动态范围控制序列DS,且将动态范围控制信息应用于对应音频信号AS。
在一个方面中,本发明提供一种系统,其包括根据本发明的音频编码器装置1及根据本发明的音频解码器装置4。
图3以示意图说明用于动态范围控制增益序列的编码的不同模式,即,全帧模式(A)及延迟模式(B)。帧n中接收的增益节点被展示为圆圈,且帧n+1中接收的增益节点被展示为正方形。实线说明直至DRC帧n+1的内插DRC增益。
原则上,动态范围控制编码器/解码器链可以两种模式进行操作。所谓的全帧模式涉及在解码对应于特定动态范围控制帧的经接收动态范围控制比特流之后可紧接地在内插之后基于经解码节点确定动态范围控制帧的每个样本位置处的增益的情况。此暗示必须在每个帧边界处(即,在对应于动态范围控制帧的最后样本的样本位置处)传输节点。如果动态范围控制帧长度为N,则这意味着最后传输的节点必须位于帧内的样本位置N处。在图3中的顶部处说明由“A”表示的此情形。如所展示,可紧接地将第n帧的动态范围控制增益应用于对应音频帧。
第二模式被称作“延迟模式”,且其在图3的下部部分“B”中予以说明。在此情况下,不存在针对帧n内的最后样本位置所传输的节点。因此,DRC解码器必须等待解码DRC帧n+1,以便执行在帧n内的最后节点之后的所有增益值的期望内插。这是因为必须知道帧n+1的第一节点的信息以执行帧n的最后节点与帧n+1中的第一节点之间的内插以便经由内插而确定两者之间的增益值。
图4以示意图说明在音频编码的上下文中的动态范围控制的应用,其中音频编码器相对于动态范围编码方案引入一个帧延迟。
图5以示意图说明根据本发明的用于节点的移位过程。左侧展示当使用目前技术水平的方法时的情形,而右侧展示所提出方法,其中每个正方形对应于节点A0…A5;B0…B2;C0。
根据本发明的优选实施例,在参考动态范围控制帧DFR的节点B0…B2的数目大于预定阈值的情况下开始移位过程。
根据本发明的优选实施例,在参考动态范围控制帧DFR的节点B0…B2的数目与待嵌入于对应于参考动态范围控制帧DFR的比特流部分DFR'中的来自参考动态范围控制帧DFR之前的动态范围控制帧DFP的经移位节点A4、A5的数目的总和大于预定阈值的情况下开始移位过程。
根据本发明的优选实施例,在参考动态范围控制帧DFR的节点B0…B2的数目与来自待嵌入于对应于参考动态范围控制帧DFR的比特流部分DFR'中的参考动态范围控制帧DFR之前的动态范围控制帧DFP的经移位节点A4、A5的数目的总和大于参考动态范围控制帧DFR之后的动态范围控制帧DFS的节点C0的数目的情况下开始移位过程。
如上文所解释,当与相对于动态范围控制帧引入帧延迟的音频编码方案进行组合时,在应用于音频信号之前将经解码动态范围控制增益延迟一个帧。在考虑图5中的左侧的情况下,这意味着将第n帧的节点Ai应用于帧n+1处的有效音频解码器输出。此暗示:在默认延迟模式中,将足以在直接地对解码器处的对应音频输出信号的延迟的情况下传输节点Ai连同帧n+1中的节点B0且应用对应DRC增益。
在所提出方法中利用此事实以减小在一个帧内传输的节点额最大数目。图4中的右侧说明此情形。在编码之前将节点A4及A5移位至帧n+1,即,在给定示例中将帧n中的节点的最大数目从6减小至4。如下文中将论述,节点A4及A5在帧n+1中的第一节点(即,B0)“之前”以仅用于编码增益差及斜率信息。为了编码时间差信息,必须应用不同方法。
图6以示意图说明根据本发明的时间信息的编码。
根据本发明的优选实施例,将一个或多个节点A0…A5;B0…B2;C0的时间信息TA0…TA5;TB0…TB2;TC0表示成使得可通过使用时间信息TA4、TA5;TB1、TB2来识别一个或多个经移位节点A4、A5;B1、B2。
根据本发明的优选实施例,一个或多个经移位节点A4、A5;B1、B2的时间信息TA4、TA5;TB1、TB2由从各别节点A4、A5;B1、B2所属的动态范围控制帧DFP、DFR的开始至各别节点A4、A5;B1、B2在各别节点A4、A5、B1、B2所属的动态范围控制帧DFP、DFR内的时间位置的时间差t_A4、t_A5;t_B1、t_B2与大于或等于各别动态范围控制帧DFP、DFR之后的动态范围控制帧DFR、DFS的时间大小的偏移值drcFrameSize的总和表示。
首先,我们考虑成对的节点之间的时间差的编码。在图6中,针对根据图4的示例描绘用于确定成对的节点的时间差的情形,其中t_Ai表示节点Ai在帧内的可能节点位置网格上的样本位置。如早先所论述,可在均匀时间网格上选择节点,其中此网格的间隔限定最高可用时间分辨率deltaTmin。因此,在样本中给出时间信息t_Ai,其中两个节点之间的时间差始终为deltaTmin的整数倍。
以差分方式(即,相对于先前节点的位置)来编码节点的时间位置信息。如果节点为帧内的第一节点,则相对于帧的开始来确定时间差。图6的左侧描绘在未应用节点移位的情况下的情形。在此情况下,节点A4的差分时间信息tDrcDelta_A4被计算为tDrcDelta_A4=t_A4-t_A3。接着使用适当霍夫曼表中的对应项(例如,根据表1或表2)来编码此差分时间值。作为另一示例,我们查看节点B0的经编码时间差。由于其为帧n+1的第一节点,因此相对于帧的开始来确定对应时间差,即,tDrcDelta_B0=t_B0。
我们现在考虑针对使用节点移位的所提出节点储集层技术的节点位置的编码。对于图6的右侧所展示的示例,节点A4及A5已移位至下一帧以供编码。节点A0至A3的表示尚未改变,且经编码时间差因此也未改变。对于节点B0的经编码位置信息同样如此。然而,现在不同地处理节点A4及节点A5的时间信息。如图6所展示,通过加上偏移drcFrameSize而在编码器处修改指示节点A4的样本位置的原始值t_A4。由于所得位置信息超过在规则编码的情况下将可能的最大值,因此偏移向解码器指示必须在先前帧的上下文内进一步处理对应节点。此外,解码器知道通过从经解码值减去偏移drcFrameSize来获得原始样本位置t_A4。
接下来,我们考虑实际上针对图6的右侧所展示的情形而编码的时间差信息的计算。出于编码效率原因,相对于节点B0来计算节点A4的差分位置信息。与先前针对图6的左侧所论述的情形相对比,现在根据tDrcDelta_A4=t_A4+drcFrameSize-t_B0(即,通过包括偏移)来计算差分时间信息。类似地,对于节点A5,我们获得tDrcDelta_A5=t_A5+drcFrameSize-t_A4–drcFrameSize,其显然与tDrcDelta_A5=t_A5-t_A4相同。使用正确霍夫曼表的对应码字项(例如,根据表1或表2)来编码这些差分时间值。
用于解码时间位置信息的方法可被概述如下。解码器基于来自比特流的对应码字来提取节点的时间差信息。通过将时间差信息加至先前节点的时间信息来获得时间信息。如果所得样本位置大于drcFrameSize,则解码器知道必须如同目前节点为先前帧中的最后节点一样处理目前节点,即,必须将其附加至先前帧中解码的节点。通过从经解码时间值减去偏移值drcFrameSize来确定正确样本位置。如果在经解码帧中出现较多经移位节点,则以类似方式来应用相同处理步骤。
在解码及校正整个帧的时间信息之后,解码器知道多少节点已移位回至先前帧(而不在编码器处明确地提供此信息)及其在先前帧内位于哪个样本位置。将在下文所描述的解码增益及斜率信息的上下文中进一步利用关于经移位节点的数目的信息。
图7以示意图说明根据本发明的增益信息的编码。
根据本发明的优选实施例,处于对应于参考动态范围控制帧DFR之后的动态范围控制帧DFS的比特流部分DFS'的第一位置处的经移位节点B1的比特表示B'1的增益信息GB1由绝对增益值g_B1表示,且其中在节点B1(其处于对应于参考动态范围控制帧DFR之后的动态范围控制帧DFS的比特流部分DFS'的第一位置处)的比特表示B'1之后的位置处的经移位节点B2的每个比特表示B'2的增益信息GB2由等于各别经移位节点B2的比特表示B'2的增益值g_B2与各别节点B2的比特表示B'2之前的节点B1的比特表示B'1的增益值g_B1的差的相对增益值表示。
根据本发明的优选实施例,在参考动态范围控制帧DFR的一个或多个经移位节点B1、B2的比特表示B'1、B'2被嵌入于对应于参考动态范围控制帧DFR之后的动态范围控制帧DFS的比特流部分DFS'中的情况下,处于一个或多个经移位节点B1、B2的比特表示B'1、B'2的一个或多个位置之后的对应于参考动态范围控制帧DFR之后的动态范围控制帧DFS的比特流部分DFS'的第一位置处的后续动态范围控制帧DFS的节点C0的比特表示C'0的增益信息GC0由等于各别节点C0的比特表示C'0的增益值g_C0与各别节点C0的比特表示C'0之前的经移位节点B2的比特表示B'2的增益值g_B2的差的相对增益值表示。
在图7中,针对根据图5的示例描绘用于确定用于成对节点的增益差的情形,其中g_Ai表示节点Ai的增益值。
首先,考虑用于节点A4的差分增益值。对于图7的左侧所描绘的无节点储集的方法,从先前节点A3与节点A4的增益值差(以dB为单位)计算差分增益值gainDelta_A4,即,gainDelta_A4=g_A4-g_A3。接着使用适当霍夫曼表中的对应项来编码此差分增益值。此外,我们考虑图7的左侧上的帧n+1的第一节点。由于B0为帧的第一节点,因此并不以差分方式而是根据初始增益值gainInitial的特定编码来编码其增益值,即,将增益值编码为其实际值:gainDelta_B0=g_B0。
对于右侧所展示的情形,其中节点A4已移位至下一帧n+1,经编码增益信息的值不同。可看出,在经移位之后,相对于编码增益差,节点A4变成帧n+1中的第一节点。因此,并不以差分方式来编码其增益值,而是如上文所描述来应用初始增益值的特定编码。对于左侧及右侧所展示的两种情形,A5的差分增益值将保持相同。由于在使用节点储集的情况下节点B0现在跟随节点A5,因此将从节点B0及A5的增益差确定其增益信息,即,gainDelta_B0=g_B0-g_A5。应注意,当应用节点储集技术时仅确定增益差的方式改变,而对于每个节点,经重建增益值保持相同。明显地,在解码帧n及n+1的整个增益相关信息之后,针对节点A0至B0所获得的增益值相同于左侧中获得的增益值,且可“及时”计算节点以用于将DRC增益应用于对应音频帧。
如先前段落中所论述,在解码时间差信息之后知道经移位节点的数目及其在先前帧内的样本位置。如图6的右侧所说明,来自帧n的经移位节点的增益值从帧n+1的经接收增益信息的开始紧接地起动。因此,关于经移位节点的数目的信息足以使解码器将每个增益值分配至正确帧内的正确样本位置。考虑图6中的右侧所展示的示例,解码器知道帧n+1的前两个经解码增益值必须附加至先前帧的最后增益值,而第三增益值对应于当前帧中的第一节点的正确增益值。
图8以示意图说明根据本发明的斜率信息的编码。
根据本发明的优选实施例,一个或多个节点A0…A5;B0…B2;C0中的每个节点A0…A5;B0…B2;C0包括斜率信息SA0…SA5;SB0…SB2;SC0。
接下来,考虑图8所说明的斜率信息的编码。并非在成对节点之间以差分方式来编码节点的斜率信息,而是针对每个节点独立地编码斜率信息。因此,在使用节点储集及不使用节点储集层的两种情况下,斜率相关信息保持不变。如在编码增益值的情况下,对于使用所提出节点移位及不使用所提出节点移位的两种情况,用于产生用于斜率信息的码字的霍夫曼表保持相同。类似于解码增益值的情况而执行斜率信息至正确帧内的正确样本位置的分配。
在针对帧n+1所接收的所有节点信息已被解码且在适用时移位回至先前帧n之后,可以常见方式来执行用于帧n的使用样条函数或线性内插的增益内插且将增益值应用于对应音频帧。
图9以示意图说明根据本发明的音频解码器装置的实施例。音频解码器装置4包括:
音频解码器5,用于解码经编码的音频比特流ABS以便再现包括连续音频帧AFP、AFR、AFS的音频信号AS;
动态范围控制解码器6,用于解码经编码的动态范围控制比特流DBS以便再现对应于音频信号AS且包括连续动态范围控制帧DFP、DFR、DFS的动态范围控制序列DS;
其中对于动态范围控制帧中的每个动态范围控制帧DFP、DFR、DFS,经编码的动态范围控制比特流DBS包括对应的比特流部分DFP'、DFR'、DFS';
其中经编码的动态范围控制比特流DBS包括节点A0…A5;B0…B2;C0的比特表示A’0…A’5;B’0…B’2;C’0,其中节点中的一个节点的每个比特表示包括用于音频信号AS的增益信息GA0…GA5;GB0…GB2;GC0及指示增益信息GA0…GA5;GB0…GB2;GC0所对应的时间点的时间信息TA0…TA5;TB0…TB2;TC0;
其中经编码的动态范围控制比特流DBS包括选自动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的节点B0…B2的经移位节点B1、B2的比特表示B'1、B'2,比特表示B'1、B'2嵌入于对应于一个参考动态范围控制帧DFR之后的动态范围控制帧DFS的比特流部分中,其中将动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的节点B0…B2中的每个剩余节点B0的比特表示B'0嵌入至对应于一个参考动态范围控制帧DFR的比特流部分DFR'中;且
其中动态范围控制解码器6用于解码动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的剩余节点B'0中的每个剩余节点B0的比特表示B'0,以便再现动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的每个剩余节点B0;用于解码选自动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的节点B0…B2中的经移位节点B1、B2中的每个经移位节点B1、B2的比特表示B'1、B'2,以便再现选自动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的节点的经移位节点B1、B2中的每个经移位节点B1、B2;及用于组合所再现的剩余节点B0与所再现的经移位节点B1、B2以便重建参考动态范围控制帧DFR。
根据本发明的优选实施例,动态范围控制解码器6用于通过使用时间信息TA4,TA5;TB1,TB2来识别一个或多个经移位节点A4,A5;B1,B2。
根据本发明的优选实施例,动态范围控制解码器6用于解码一个或多个经移位节点A4,A5;B1,B2的时间信息TA4,TA5;TB1,TB2,该时间信息由从各别节点A4、A5、B1、B2所属的动态范围控制帧DFP、DFR的开始至各别节点A4、A5、B1、B2在各别节点A4、A5、B1、B2所属的动态范围控制帧DFP、DFR内的时间位置的时间差t_A4、t_A5;t_B1、t_B2与大于或等于各别动态范围控制帧DFP、DFR之后的动态范围控制帧DFR、DFS的时间大小的偏移值drcFrameSize的总和表示。
根据本发明的优选实施例,动态范围控制解码器6用于解码处于对应于参考动态范围控制帧DFR之后的动态控制帧DFS的比特流部分DFS'的第一位置处的经移位节点B1的比特表示B'1的增益信息GB1,该增益信息GB1由绝对增益值g_B1表示,且其中在节点B1(其处于对应于参考动态范围控制帧DFR之后的动态范围控制帧DFS的比特流部分DFS'的第一位置处)的比特表示B'1之后的位置处的经移位节点B2的每个比特表示B'2的增益信息GB2由等于各别经移位节点B2的比特表示B'2的增益值g_B2与各别节点B2的比特表示B'2之前的节点B1的比特表示B'1的增益值g_B1的差的相对增益值表示。
根据本发明的优选实施例,动态范围控制解码器6用于解码处于一个或多个经移位节点B1、B2的比特表示B'1、B'2的一个或多个位置之后的对应于参考动态范围控制帧DFR之后的动态范围控制帧DFS的比特流部分DFS'的第一位置处的后续动态范围控制帧DFS的节点C0的比特表示C'0的增益信息GC0,增益信息GC0由等于各别节点C0的比特表示C'0的增益值g_C0与各别节点C0的比特表示C'0之前的经移位节点B2的比特表示B'2的增益值g_B2的差的相对增益值表示。
根据本发明的优选实施例,音频帧AFP、AFR、AFS的时间大小等于动态范围控制帧AFP、AFR、AFS的时间大小。
根据本发明的优选实施例,动态范围控制帧DFP、DFR、DFS中的一个的一个或多个节点A0…A5;B0…B2;C0选自均匀时间网格。
根据本发明的优选实施例,一个或多个节点A0…A5;B0…B2;C0中的每个节点A0…A5;B0…B2;C0包括斜率信息SA0…SA5;SB0…SB2;SC0。
根据本发明的优选实施例,动态范围控制解码器6用于使用熵解码技术来解码节点的比特表示A’0…A’5;B’0…B’2;C’0。
在另一方面中,本发明提供一种用于操作音频解码器的方法,该方法包括如下步骤:
解码经编码的音频比特流ABS以便再现包括连续音频帧AFP、AFR、AFS的音频信号AS;
解码经编码的动态范围控制比特流DBS以便再现对应于音频信号AS且包括连续动态范围控制帧DFP、DFR、DFS的动态范围控制序列DS;
其中对于动态范围控制帧中的每个动态范围控制帧DFP、DFR、DFS,经编码的动态范围控制比特流DBS包括对应的比特流部分DFP'、DFR'、DFS';
其中经编码的动态范围控制比特流DBS包括节点A0…A5;B0…B2;C0的比特表示A’0…A’5;B’0…B’2;C’0,其中节点中的一个节点的每个比特表示包括用于音频信号AS的增益信息GA0…GA5;GB0…GB2;GC0及指示增益信息GA0…GA5;GB0…GB2;GC0所对应的时间点的时间信息TA0…TA5;TB0…TB2;TC0;
其中经编码的动态范围控制比特流DBS包括选自动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的节点B0…B2的经移位节点B1、B2的比特表示B'1、B'2,比特表示B'1、B'2被嵌入于对应于一个参考动态范围控制帧DFR之后的动态范围控制帧DFS的比特流部分中,其中将动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的节点B0…B2中的每个剩余节点B0的比特表示B'0嵌入至对应于一个参考动态范围控制帧DFR的比特流部分DFR'中;且
其中解码动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的剩余节点B'0中的每个剩余节点B0的比特表示B'0,以便再现动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的每个剩余节点B0;
其中解码选自动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的节点B0…B2的经移位节点B1、B2中的每个经移位节点B1、B2的比特表示B'1、B'2,以便再现选自动态范围控制帧DFP、DFR、DFS中的一个参考动态范围控制帧DFR的节点的经移位节点B1、B2中的每个经移位节点B1、B2;且
其中组合所再现的剩余节点B0与所再现的经移位节点B1、B2以便重建参考动态范围控制帧DFR。
关于所描述实施例=的解码器,编码器及方法,将提到以下内容:
尽管已在装置的上下文中描述一些方面,显然的是,这些方面也表示对应方法的描述,其中块或装置对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中所描述的方面也表示对应装置的对应块或项目或特征的描述。
取决于特定的实施要求,本发明的实施例可以以硬件或软件实施。可使用具有存储于其上的电子可读控制信号的数字存储介质,例如软性磁盘、DVD、CD、ROM、PROM、EPROM、EEPROM或闪存,执行实施方案,这些电子可读控制信号与可编程计算机系统协作(或能够协作)以使得执行各个方法。
根据本发明的一些实施例包括具有电子可读控制信号的数据载体,这些电子可读控制信号能够与可编程计算机系统协作,使得执行本文中所描述的方法中的一个。
通常,本发明的实施例可被实施为具有程序代码的计算机程序产品,当计算机程序产品运行于计算机上时,程序代码操作性地用于执行这些方法中的一个。程序代码可例如储存于机器可读载体上。
其他实施例包括储存于机器可读载体或非暂时性存储介质上的用于执行本文中所描述的方法中的一个的计算机程序。
换言之,因此,本发明方法的实施例为具有程序代码的计算机程序,当计算机程序运行于计算机上时,该程序代码用于执行本文中所描述的方法中的一个。
因此,本发明方法的另一实施例为包括记录于其上的,用于执行本文中所描述的方法中的一个的计算机程序的数据载体(或数字存储介质,或计算机可读介质)。
因此,本发明方法的另一实施例为表示用于执行本文中所描述的方法中的一个的计算机程序的数据流或信号序列。数据流或信号序列可例如用于经由数据通信连接(例如,经由因特网)而被传送。
另一实施例包括用于或适于执行本文中所描述的方法中的一个的处理构件,例如,计算机或可编程逻辑器件。
另一实施例包括安装有用于执行本文中所描述的方法中的一个的计算机程序的计算机。
在一些实施例中,可编程逻辑器件(例如,现场可编程门阵列)可用于执行本文中所描述的方法的功能性中的一些或所有。在一些实施例中,现场可编程门阵列可与微处理器协作,以便执行本文中所描述的方法中的一个。大体而言,优选地由任何硬件装置执行这些方法。
虽然已依据若干实施例而描述本发明,但存在属于本发明的范围的更改、排列及等同。还应注意,存在实施本发明的方法及组成物的许多替代性方式。因此,希望将以下所附权利要求解译为包括如属于本发明的真实精神及范围的所有更改、排列及等同。
附图标记:
1…音频编码器装置
2…音频编码器
3…动态范围控制编码器
4…音频解码器装置
5…音频解码器
6…动态范围控制解码器
ABS…经编码的音频比特流
AS…音频信号
AFP…先前音频帧
AFR…参考音频帧
AFS…后续音频帧
DBS…经编码的动态范围控制比特流
DS…动态范围控制序列
DFP…先前动态范围控制帧
DFR…参考动态范围控制帧
DFS…后续动态范围控制帧
A0…A5…先前动态范围控制帧的节点
B0…B2…参考动态范围控制帧的节点
C0…后续动态范围控制帧的节点
DFP'…对应于先前动态范围控制帧的比特流部分
range…控制帧
DFR'…对应于参考动态范围控制帧的比特流部分
DFS'…对应于后续动态范围控制帧的比特流部分
TA0…TA5…先前动态范围控制帧的节点的时间信息
TB0…TB2…参考动态范围控制帧的节点的时间信息
TC0…后续动态范围控制帧的节点的时间信息
t_A0…t_A5…先前动态范围控制帧的节点的时间差
t_B0…t_B2…参考动态范围控制帧的节点的时间差
t_C0…后续动态范围控制帧的节点的时间差
GA0…GA5…先前动态范围控制帧的节点的增益信息
GB0…GB2…参考动态范围控制帧的节点的增益信息
GC0…后续动态范围控制帧的节点的增益信息
g_A0…g_A5…先前动态范围控制帧的节点的增益值
g_B0…g_B2…参考动态范围控制帧的节点的增益值
g_C0…后续动态范围控制帧的节点的增益值
SA0…SA5…先前动态范围控制帧的节点的斜率信息
SB0…SB2…参考动态范围控制帧的节点的斜率信息
SC0…后续动态范围控制帧的节点的斜率信息
参考文献:
[1]D.Giannoulis,M.Massberg,J.D.Reiss,“Digital Dynamic RangeCompressor Design–A Tutorial and Analysis”J.Audio Engineering Society,Vol.60,No.6,June 2012.in
Claims (25)
1.一种音频编码器装置,包括:
音频编码器(2),用于从包括连续音频帧(AFP,AFR,AFS)的音频信号(AS)产生经编码的音频比特流(ABS);
动态范围控制编码器(3),用于从对应于所述音频信号(AS)且包括连续动态范围控制帧(DFP,DFR,DFS)的动态范围控制序列(DS)产生经编码的动态范围控制比特流(DBS),其中所述动态范围控制帧(DFP,DFR,DFS)中的每个动态范围控制帧(DFP,DFR,DFS)包括一个或多个节点(A0…A5;B0…B2;C0),其中所述一个或多个节点(A0…A5;B0…B2;C0)中的每个节点包括用于所述音频信号(AS)的增益信息(GA0…GA5;GB0…GB2;GC0)及指示所述增益信息(GA0…GA5;GB0…GB2;GC0)所对应的时间点的时间信息(TA0…TA5;TB0…TB2;TC0);
其中所述动态范围控制编码器(3)用于使得对于所述动态范围控制帧(DFP,DFR,DFS)中的每个动态范围控制帧(DFP,DFR,DFS),所述经编码的动态范围控制比特流(DBS)包括对应的比特流部分(DFP’,DFR’,DFS’);
其中所述动态范围控制编码器(3)用于执行移位过程,其中将所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的节点(B0…B2)中的一个或多个节点(B1,B2)选择为经移位节点(B1,B2),其中所述一个参考动态范围控制帧(DFR)的一个或多个经移位节点(B1,B2)中的每一个的比特表示(B’1,B’2)被嵌入于对应于所述一个参考动态范围控制帧(DFR)之后的动态范围控制帧(DFS)的比特流部分(DFS’)中,其中所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的节点(B0…B2)中的每个剩余节点(B0)的比特表示(B’0)被嵌入至对应于所述一个参考动态范围控制帧(DFR)的比特流部分(DFR’)中。
2.如权利要求1所述的音频编码器装置,其中在所述参考动态范围控制帧的节点的数目大于预定阈值的情况下开始所述移位过程。
3.如权利要求1所述的音频编码器装置,其中在所述参考动态范围控制帧的节点的数目与待嵌入于对应于所述参考动态范围控制帧的比特流部分中的来自所述参考动态范围控制帧之前的动态范围控制帧的经移位节点的数目的总和大于预定阈值的情况下开始所述移位过程。
4.如权利要求1所述的音频编码器装置,其中在所述参考动态范围控制帧(DFR)的节点(B0…B2)的数目与待嵌入于对应于所述参考动态范围控制帧(DFR)的比特流部分(DFR’)中的来自所述参考动态范围控制帧(DFR)之前的动态范围控制帧(DFP)的经移位节点(A4,A5)的数目的总和大于所述参考动态范围控制帧(DFR)之后的动态范围控制帧(DFS)的节点(C0)的数目的情况下开始所述移位过程。
5.如权利要求1所述的音频编码器装置,其中将所述一个或多个节点(A0…A5;B0…B2;C0)的所述时间信息(TA0…TA5;TB0…TB2;TC0)表示成使得能够通过使用时间信息(TA4,TA5;TB1,TB2)识别所述一个或多个经移位节点(A4,A5;B1,B2)。
6.如前述权利要求中任一项所述的音频编码器装置,其中所述一个或多个经移位节点(A4,A5;B1,B2)的所述时间信息(TA4,TA5;TB1,TB2)由从各个节点(A4,A5;B1,B2)所属的动态范围控制帧(DFP;DFR)的开始至所述各个节点(A4,A5;B1,B2)在所述各个节点(A4,A5;B1,B2)所属的动态范围控制帧(DFP;DFR)内的时间位置的时间差(t_A4,t_A5;t_B1,t_B2)与大于或等于各个动态范围控制帧(DFP;DFR)之后的动态范围控制帧(DFR;DFS)的时间大小的偏移值(drcFrameSize)的总和表示。
7.如权利要求1所述的音频编码器装置,其中处于对应于所述参考动态范围控制帧(DFR)之后的动态范围控制帧(DFS)的比特流部分(DFS’)的第一位置处的经移位节点(B1)的比特表示(B’1)的增益信息(GB1)由绝对增益值(g_B1)表示,且其中在处于对应于所述参考动态范围控制帧(DFR)之后的动态范围控制帧(DFS)的比特流部分(DFS’)的第一位置处的所述节点(B1)的比特表示(B’1)之后的位置处的经移位节点(B2)的每个比特表示(B’2)的增益信息(GB2)由等于个别的经移位节点(B2)的比特表示(B’2)的增益值(g_B2)与个别节点(B2)的比特表示(B’2)之前的节点(B1)的比特表示(B’1)的增益值(g_B1)的差的相对增益值表示。
8.如权利要求1所述的音频编码器装置,其中在所述参考动态范围控制帧(DFR)的一个或多个经移位节点(B1,B2)的比特表示(B’1,B’2)被嵌入于对应于所述参考动态范围控制帧(DFR)之后的动态范围控制帧(DFS)的比特流部分(DFS’)中的情况下,在所述一个或多个经移位节点(B1,B2)的比特表示(B’1,B’2)的一个或多个位置之后的对应于所述参考动态范围控制帧(DFR)之后的动态范围控制帧(DFS)的比特流部分(DFS’)的第一位置处的后续动态范围控制帧(DFS)的节点(C0)的比特表示(C’0)的增益信息(GC0)由等于个别节点(C0)的比特表示(C’0)的增益值(g_C0)与个别节点(C0)的比特表示(C’0)之前的经移位节点(B2)的比特表示(B’2)的增益值(g_B2)的差的相对增益值表示。
9.如权利要求1所述的音频编码器装置,其中所述音频帧(AFP,AFR,AFS)的时间大小等于所述动态范围控制帧(DFP,DFR,DFS)的时间大小。
10.如权利要求1所述的音频编码器装置,其中所述动态范围控制帧(DFP,DFR,DFS)中的一个的一个或多个节点(A0…A5;B0…B2;C0)选自均匀时间网格。
11.如权利要求1所述的音频编码器装置,其中所述一个或多个节点(A0…A5;B0…B2;C0)中的每个节点(A0…A5;B0…B2;C0)包括斜率信息(SA0…SA5;SB0…SB2;SC0)。
12.如权利要求1所述的音频编码器装置,其中所述动态范围控制编码器(3)用于使用熵编码技术编码所述节点(A0…A5;B0…B2;C0)。
13.一种音频解码器装置,包括:
音频解码器(5),用于解码经编码的音频比特流(ABS),以便再现包括连续音频帧(AFP,AFR,AFS)的音频信号(AS);
动态范围控制解码器(6),用于解码经编码的动态范围控制比特流(DBS),以便再现对应于所述音频信号(AS)且包括连续动态范围控制帧(DFP,DFR,DFS)的动态范围控制序列(DS);
其中对于所述动态范围控制帧中的每个动态范围控制帧(DFP,DFR,DFS),所述经编码的动态范围控制比特流(DBS)包括对应的比特流部分(DFP’,DFR’,DFS’);
其中所述经编码的动态范围控制比特流(DBS)包括节点(A0…A5;B0…B2;C0)的比特表示(A’0…A’5;B’0…B’2;C’0),其中所述节点中的一个节点的每个比特表示包括用于所述音频信号(AS)的增益信息(GA0…GA5;GB0…GB2;GC0)及指示所述增益信息(GA0…GA5;GB0…GB2;GC0)所对应的时间点的时间信息(TA0…TA5;TB0…TB2;TC0);
其中所述经编码的动态范围控制比特流(DBS)包括选自所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的节点(B0…B2)的经移位节点(B1,B2)的比特表示(B’1,B’2),所述比特表示(B’1,B’2)嵌入于对应于所述一个参考动态范围控制帧(DFR)之后的动态范围控制帧(DFS)的比特流部分中,其中将所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的节点(B0…B2)中的每个剩余节点(B0)的比特表示(B’0)嵌入至对应于所述一个参考动态范围控制帧(DFR)的比特流部分(DFR’)中;且
其中所述动态范围控制解码器(6)用于解码所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的剩余节点(B’0)中的每个剩余节点(B0)的比特表示(B’0),以便再现所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的每个剩余节点(B0);用于解码选自所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的节点(B0…B2)的经移位节点(B1,B2)中的每个经移位节点(B1,B2)的比特表示(B’1,B’2),以便再现选自所述动态范围控制帧(DFP,DFR,DFS)的一个参考动态范围控制帧(DFR)的节点的经移位节点(B1,B2)中的每个经移位节点(B1,B2);及用于组合再现的剩余节点(B0)与再现的经移位节点(B1,B2),以便重建所述参考动态范围控制帧(DFR)。
14.如权利要求13所述的音频解码器装置,其中所述动态范围控制解码器(6)用于通过使用时间信息(TA4,TA5;TB1,TB2)识别一个或多个经移位节点(A4,A5;B1,B2)。
15.如权利要求13所述的音频解码器装置,其中所述动态范围控制解码器(6)用于解码一个或多个经移位节点(A4,A5;B1,B2)的时间信息(TA4,TA5;TB1,TB2),所述时间信息(TA4,TA5;TB1,TB2)由从各个节点(A4,A5;B1,B2)所属的动态范围控制帧(DFP;DFR)的开始至各个节点(A4,A5;B1,B2)在各个节点(A4,A5;B1,B2)所属的动态范围控制帧(DFP;DFR)内的时间位置的时间差(t_A4,t_A5;t_B1,t_B2)与大于或等于各个动态范围控制帧(DFP;DFR)之后的动态范围控制帧(DFR;DFS)的时间大小的偏移值(drcFrameSize)的总和表示。
16.如权利要求13所述的音频解码器装置,其中所述动态范围控制解码器(6)用于解码处于对应于所述参考动态范围控制帧(DFR)之后的动态范围控制帧(DFS)的比特流部分(DFS’)的第一位置处的、由绝对增益值表示的经移位节点(B1)的比特表示(B’1)的增益信息(GB1),且其中在处于对应于所述参考动态范围控制帧(DFR)之后的动态范围控制帧(DFS)的比特流部分(DFS’)的第一位置处的节点(B1)的比特表示(B’1)之后的位置处的经移位节点(B2)的每个比特表示(B’2)的增益信息(GB2)由等于个别的经移位节点B2的比特表示B’2的增益值(g_B2)与个别节点(B2)的比特表示(B’2)之前的节点(B1)的比特表示(B’1)的增益值(g_B1)的差的相对增益值表示。
17.如权利要求13所述的音频解码器装置,其中所述动态范围控制解码器(6)用于解码在一个或多个经移位节点(B1,B2)的比特表示(B’1,B’2)的一个或多个位置之后的对应于所述参考动态范围控制帧(DFR)之后的动态范围控制帧(DFS)的比特流部分(DFS’)的第一位置处的后续动态范围控制帧(DFS)的节点(C0)的比特表示(C’0)的增益信息(GC0),所述增益信息(GC0)由等于个别节点(C0)的比特表示(C’0)的增益值(g_C0)与个别节点(C0)的比特表示(C’0)之前经移位节点(B2)的比特表示(B’2)的增益值(g_B2)的差的相对增益值表示。
18.如权利要求13所述的音频解码器装置,其中所述音频帧(AFP,AFR,AFS)的时间大小等于所述动态范围控制帧(DFP,DFR,DFS)的时间大小。
19.如权利要求13所述的音频解码器装置,其中所述动态范围控制帧(DFP,DFR,DFS)中的一个的一个或多个节点(A0…A5;B0…B2;C0)选自均匀时间网格。
20.如权利要求13所述的音频解码器装置,其中所述一个或多个节点(A0…A5;B0…B2;C0)中的每个节点(A0…A5;B0…B2;C0)包括斜率信息(SA0…SA5;SB0…SB2;SC0)。
21.如权利要求13所述的音频解码器装置,其中所述动态范围控制解码器(6)用于使用熵解码技术解码所述节点的比特表示(A’0…A’5;B’0…B’2;C’0)。
22.一种系统,包括如权利要求1至12中任一项所述的音频编码器装置(1)及如权利要求13至21中任一项所述的音频解码器装置(4)。
23.一种用于操作音频编码器的方法,所述方法包括如下步骤:
从包括连续音频帧(AFP,AFR,AFS)的音频信号(AS)产生经编码的音频比特流(ABS);
从对应于所述音频信号(AS)且包括连续动态范围控制帧(DFP,DFR,DFS)的动态范围控制序列(DS)产生经编码的动态范围控制比特流(DBS),其中所述动态范围控制帧(DFP,DFR,DFS)中的每个动态范围控制帧(DFP,DFR,DFS)包括一个或多个节点(A0…A5;B0…B2;C0),其中所述一个或多个节点(A0…A5;B0…B2;C0)中的每个节点包括用于所述音频信号(AS)的增益信息(GA0…GA5;GB0…GB2;GC0)及指示所述增益信息所对应的时间点的时间信息(TA0…TA5;TB0…TB2;TC0),
其中对于所述动态范围控制帧(DFP,DFR,DFS)中的每个动态范围控制帧(DFP,DFR,DFS),所述经编码的动态范围控制比特流(DBS)包括对应的比特流部分(DFP’,DFR’,DFS’);
执行移位过程,其中将所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的节点(B0…B2)中的一个或多个节点(B1,B2)选择为经移位节点(B1,B2),其中所述一个参考动态范围控制帧(DFR)的一个或多个经移位节点(B1,B2)中的每一个的比特表示(B’1,B’2)被嵌入于对应于所述一个参考动态范围控制帧(DFR)之后的动态范围控制帧(DFS)的比特流部分(DFS’)中,其中所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的节点(B0…B2)中的每个剩余节点(B0)的比特表示(B’0)被嵌入至对应于所述一个参考动态范围控制帧(DFR)的比特流部分(DFR’)中。
24.一种用于操作音频解码器的方法,所述方法包括如下步骤:
解码经编码的音频比特流(ABS),以便再现包括连续音频帧(AFP,AFR,AFS)的音频信号(AS);
解码经编码的动态范围控制比特流(DBS),以便再现对应于所述音频信号(AS)且包括连续动态范围控制帧(DFP,DFR,DFS)的动态范围控制序列(DS);
其中对于所述动态范围控制帧中的每个动态范围控制帧(DFP,DFR,DFS),所述经编码的动态范围控制比特流(DBS)包括对应的比特流部分(DFP’,DFR’,DFS’);
其中所述经编码的动态范围控制比特流(DBS)包括节点(A0…A5;B0…B2;C0)的比特表示(A’0…A’5;B’0…B’2;C’0),其中所述节点中的一个节点的每个比特表示包括用于所述音频信号(AS)的增益信息(GA0…GA5;GB0…GB2;GC0)及指示所述增益信息(GA0…GA5;GB0…GB2;GC0)所对应的时间点的时间信息(TA0…TA5;TB0…TB2;TC0);
其中所述经编码的动态范围控制比特流(DBS)包括选自所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的节点(B0…B2)的经移位节点(B1,B2)的比特表示(B’1,B’2),所述比特表示(B’1,B’2)嵌入于对应于所述一个参考动态范围控制帧(DFR)之后的动态范围控制帧(DFS)的比特流部分中,其中将所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的节点(B0…B2)中的每个剩余节点(B0)的比特表示(B’0)嵌入至对应于所述一个参考动态范围控制帧(DFR)的比特流部分(DFR’)中;且
其中解码所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的剩余节点(B’0)中的每个剩余节点(B0)的比特表示(B’0),以便再现所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的每个剩余节点(B0);
其中解码选自所述动态范围控制帧(DFP,DFR,DFS)中的一个参考动态范围控制帧(DFR)的节点(B0…B2)的经移位节点(B1,B2)中的每个经移位节点(B1,B2)的比特表示(B’1,B’2),以便再现选自所述动态范围控制帧(DFP,DFR,DFS)的一个参考动态范围控制帧(DFR)的节点的经移位节点(B1,B2)中的每个经移位节点(B1,B2);
其中组合再现的剩余节点(B0)与再现的经移位节点(B1,B2),以便重建所述参考动态范围控制帧(DFR)。
25.一种计算机程序,用于当其在处理器上运行时执行如权利要求23或24所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911392325.8A CN111326165B (zh) | 2014-03-25 | 2015-03-20 | 音频编码器装置、音频解码器装置、及其操作方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14161605 | 2014-03-25 | ||
EP14161605.2 | 2014-03-25 | ||
CN201911392325.8A CN111326165B (zh) | 2014-03-25 | 2015-03-20 | 音频编码器装置、音频解码器装置、及其操作方法 |
PCT/EP2015/055945 WO2015144587A1 (en) | 2014-03-25 | 2015-03-20 | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
CN201580015978.8A CN106165014B (zh) | 2014-03-25 | 2015-03-20 | 音频编码器装置、音频解码器装置、及其操作方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580015978.8A Division CN106165014B (zh) | 2014-03-25 | 2015-03-20 | 音频编码器装置、音频解码器装置、及其操作方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111326165A true CN111326165A (zh) | 2020-06-23 |
CN111326165B CN111326165B (zh) | 2023-12-12 |
Family
ID=52727126
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911392325.8A Active CN111326165B (zh) | 2014-03-25 | 2015-03-20 | 音频编码器装置、音频解码器装置、及其操作方法 |
CN201580015978.8A Active CN106165014B (zh) | 2014-03-25 | 2015-03-20 | 音频编码器装置、音频解码器装置、及其操作方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580015978.8A Active CN106165014B (zh) | 2014-03-25 | 2015-03-20 | 音频编码器装置、音频解码器装置、及其操作方法 |
Country Status (20)
Country | Link |
---|---|
US (3) | US10074377B2 (zh) |
EP (1) | EP3123469B1 (zh) |
JP (1) | JP6259930B2 (zh) |
KR (1) | KR101890216B1 (zh) |
CN (2) | CN111326165B (zh) |
AR (1) | AR099836A1 (zh) |
AU (1) | AU2015238519B2 (zh) |
BR (1) | BR112016021382B1 (zh) |
CA (1) | CA2942743C (zh) |
ES (1) | ES2678068T3 (zh) |
MX (1) | MX355089B (zh) |
MY (1) | MY186155A (zh) |
PL (1) | PL3123469T3 (zh) |
PT (1) | PT3123469T (zh) |
RU (1) | RU2678487C2 (zh) |
SG (1) | SG11201607940WA (zh) |
TR (1) | TR201809427T4 (zh) |
TW (1) | TWI585751B (zh) |
WO (1) | WO2015144587A1 (zh) |
ZA (1) | ZA201607193B (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2005299410B2 (en) | 2004-10-26 | 2011-04-07 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
TWI447709B (zh) | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
JP6174129B2 (ja) | 2012-05-18 | 2017-08-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
IN2015MN01766A (zh) | 2013-01-21 | 2015-08-28 | Dolby Lab Licensing Corp | |
IL287218B (en) | 2013-01-21 | 2022-07-01 | Dolby Laboratories Licensing Corp | Audio encoder and decoder with program loudness and boundary metada |
EP2959479B1 (en) | 2013-02-21 | 2019-07-03 | Dolby International AB | Methods for parametric multi-channel encoding |
CN107093991B (zh) | 2013-03-26 | 2020-10-09 | 杜比实验室特许公司 | 基于目标响度的响度归一化方法和设备 |
US9635417B2 (en) | 2013-04-05 | 2017-04-25 | Dolby Laboratories Licensing Corporation | Acquisition, recovery, and matching of unique information from file-based media for automated file detection |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
CN109903776B (zh) | 2013-09-12 | 2024-03-01 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
CN110675884B (zh) | 2013-09-12 | 2023-08-08 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
SG11201607940WA (en) | 2014-03-25 | 2016-10-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
CN105142067B (zh) | 2014-05-26 | 2020-01-07 | 杜比实验室特许公司 | 音频信号响度控制 |
EP3518236B8 (en) | 2014-10-10 | 2022-05-25 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002271207A (ja) * | 2001-03-13 | 2002-09-20 | Asahi Kasei Microsystems Kk | データ変換装置およびデータ圧縮装置およびデータ伸長装置 |
US20050228651A1 (en) * | 2004-03-31 | 2005-10-13 | Microsoft Corporation. | Robust real-time speech codec |
US20060235679A1 (en) * | 2005-04-13 | 2006-10-19 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Adaptive grouping of parameters for enhanced coding efficiency |
CN101241701A (zh) * | 2004-09-17 | 2008-08-13 | 广州广晟数码技术有限公司 | 音频解码 |
CN101587711A (zh) * | 2008-05-23 | 2009-11-25 | 华为技术有限公司 | 基音后处理方法、滤波器以及基音后处理系统 |
US20100161322A1 (en) * | 2008-12-19 | 2010-06-24 | Electronics And Telecommunications Research Institute | Encoding and decoding apparatuses for improving sound quality of g.711 codec |
CN102203854A (zh) * | 2008-10-29 | 2011-09-28 | 杜比国际公司 | 使用预先存在的音频增益元数据的信号削波保护 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5701390A (en) * | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
RU2144222C1 (ru) * | 1998-12-30 | 2000-01-10 | Гусихин Артур Владимирович | Способ сжатия звуковой информации и система для его реализации |
US6785655B1 (en) * | 2000-05-15 | 2004-08-31 | Lsi Logic Corporation | Method for independent dynamic range control |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
KR100754439B1 (ko) * | 2003-01-09 | 2007-08-31 | 와이더댄 주식회사 | 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법 |
KR101087588B1 (ko) * | 2004-07-02 | 2011-11-29 | 닐슨 미디어 리서치 인코퍼레이티드 | 압축 디지털 비트스트림을 믹싱하는 방법 및 장치 |
US8521314B2 (en) * | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
US8600179B2 (en) * | 2009-09-17 | 2013-12-03 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding image based on skip mode |
TWI447709B (zh) * | 2010-02-11 | 2014-08-01 | Dolby Lab Licensing Corp | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
US9443534B2 (en) * | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
JP5650227B2 (ja) * | 2010-08-23 | 2015-01-07 | パナソニック株式会社 | 音声信号処理装置及び音声信号処理方法 |
US9117455B2 (en) * | 2011-07-29 | 2015-08-25 | Dts Llc | Adaptive voice intelligibility processor |
WO2013041875A2 (en) * | 2011-09-22 | 2013-03-28 | Earsoft Limited | Dynamic range control |
JP6174129B2 (ja) * | 2012-05-18 | 2017-08-02 | ドルビー ラボラトリーズ ライセンシング コーポレイション | パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム |
US9332373B2 (en) * | 2012-05-31 | 2016-05-03 | Dts, Inc. | Audio depth dynamic range enhancement |
US9460729B2 (en) * | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
US9607624B2 (en) * | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
SG11201607940WA (en) | 2014-03-25 | 2016-10-28 | Fraunhofer Ges Forschung | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
-
2015
- 2015-03-20 SG SG11201607940WA patent/SG11201607940WA/en unknown
- 2015-03-20 KR KR1020167029370A patent/KR101890216B1/ko active IP Right Grant
- 2015-03-20 CA CA2942743A patent/CA2942743C/en active Active
- 2015-03-20 BR BR112016021382-3A patent/BR112016021382B1/pt active IP Right Grant
- 2015-03-20 PL PL15711734T patent/PL3123469T3/pl unknown
- 2015-03-20 ES ES15711734.2T patent/ES2678068T3/es active Active
- 2015-03-20 MY MYPI2016001726A patent/MY186155A/en unknown
- 2015-03-20 PT PT157117342T patent/PT3123469T/pt unknown
- 2015-03-20 MX MX2016012421A patent/MX355089B/es active IP Right Grant
- 2015-03-20 AU AU2015238519A patent/AU2015238519B2/en active Active
- 2015-03-20 CN CN201911392325.8A patent/CN111326165B/zh active Active
- 2015-03-20 EP EP15711734.2A patent/EP3123469B1/en active Active
- 2015-03-20 CN CN201580015978.8A patent/CN106165014B/zh active Active
- 2015-03-20 WO PCT/EP2015/055945 patent/WO2015144587A1/en active Application Filing
- 2015-03-20 JP JP2016559243A patent/JP6259930B2/ja active Active
- 2015-03-20 RU RU2016141556A patent/RU2678487C2/ru active
- 2015-03-20 TR TR2018/09427T patent/TR201809427T4/tr unknown
- 2015-03-24 TW TW104109407A patent/TWI585751B/zh active
- 2015-03-25 AR ARP150100878A patent/AR099836A1/es active IP Right Grant
-
2016
- 2016-09-22 US US15/272,653 patent/US10074377B2/en not_active Ceased
- 2016-10-19 ZA ZA2016/07193A patent/ZA201607193B/en unknown
-
2019
- 2019-05-06 US US16/404,503 patent/USRE49107E1/en active Active
-
2022
- 2022-05-20 US US17/664,381 patent/US20220277756A1/en not_active Abandoned
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002271207A (ja) * | 2001-03-13 | 2002-09-20 | Asahi Kasei Microsystems Kk | データ変換装置およびデータ圧縮装置およびデータ伸長装置 |
US20050228651A1 (en) * | 2004-03-31 | 2005-10-13 | Microsoft Corporation. | Robust real-time speech codec |
CN101241701A (zh) * | 2004-09-17 | 2008-08-13 | 广州广晟数码技术有限公司 | 音频解码 |
US20060235679A1 (en) * | 2005-04-13 | 2006-10-19 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Adaptive grouping of parameters for enhanced coding efficiency |
CN101587711A (zh) * | 2008-05-23 | 2009-11-25 | 华为技术有限公司 | 基音后处理方法、滤波器以及基音后处理系统 |
CN102203854A (zh) * | 2008-10-29 | 2011-09-28 | 杜比国际公司 | 使用预先存在的音频增益元数据的信号削波保护 |
US20100161322A1 (en) * | 2008-12-19 | 2010-06-24 | Electronics And Telecommunications Research Institute | Encoding and decoding apparatuses for improving sound quality of g.711 codec |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
USRE49107E1 (en) | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control | |
JP6753499B2 (ja) | 復号化装置および方法、並びにプログラム | |
JP6768735B2 (ja) | オーディオ装置のための組合せダイナミックレンジ圧縮および誘導クリッピング防止のための概念 | |
TW201503108A (zh) | 後設資料驅動動態範圍控制 | |
JP2006276877A (ja) | 変換符号化されたデータの復号方法及び変換符号化されたデータの復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |