CN107591158B

CN107591158B - 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统

Info

Publication number: CN107591158B
Application number: CN201710814631.0A
Authority: CN
Inventors: J·瑞德米勒; K·J·罗尔登; K·克约尔林; H·普恩哈根; V·麦尔考特; L·塞勒斯德姆
Original assignee: Dolby International AB; Dolby Laboratories Licensing Corp
Current assignee: Dolby International AB; Dolby Laboratories Licensing Corp
Priority date: 2012-05-18
Filing date: 2013-05-02
Publication date: 2020-10-27
Anticipated expiration: 2033-05-02
Also published as: EP2850612A1; US20180151189A1; JP6552555B2; JP2022166205A; JP6174129B2; HK1249654A1; US10388296B2; HK1246964A1; US20160322061A1; CN104303229A; US10522163B2; CN112185400A; US20190341066A1; US10074379B2; CN112185398B; US10217474B2; JP6853408B1; CN112185400B; JP2019197216A; CN112185399B

Abstract

本公开涉及用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统。以比特流(P)为基础，通过从比特流导出m通道核心信号(Y)和多通道编码参数(α)重构n通道音频信号(X)，此处1≤m＜n。从比特流还导出量化核心信号的编码器侧动态范围限制的预处理动态范围控制参数，即预处理DRC参数(DRC2)。在基于预处理DRC参数消除任何编码器侧动态范围限制的同时通过根据多通道编码参数的参数合成获得n通道音频信号。在特定的实施例中，重构进一步包括量化可能的解码器侧动态范围压缩的经补偿的后处理DRC参数的使用。优选地，由不同解码器侧组件执行编码器侧范围限制消除和范围压缩。消除和压缩可以由DRC预处理器协调。

Description

用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统

本申请是申请号为201380025886.9、申请日为2013年5月2日、发明名称为“用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统”的发明专利申请的分案申请。

相关申请的交叉引用

本申请要求2012年5月18日提交的美国临时专利申请No.61/649036、2012年7月25日提交的美国临时专利申请No.61/664507和2012年10月12日提交的美国临时专利申请No.61/713005的优先权，这些申请的全部内容通过引用并入此。

技术领域

文中公开的本发明主要涉及视听媒体分布(distribution)。特别地，其涉及在解码期间允许较高比特率模式和较低比特率模式两者以及无缝模式转换的自适应分布格式。本发明进一步涉及用于根据该分布格式编码和解码信号的方法和设备。

背景技术

已知参数立体声和多通道编码方法在收听质量方面可扩展且有效率，这使得它们在低比特率应用中特别有吸引力。然而，在比特率限制具有暂时性特性(如，网络抖动、负载变化)的情况下，可以通过使用自适应分布格式获得可用网络资源的所有好处，其中在正常条件期间使用相对较高的比特率且在网络功能差时使用较低比特率。

现有的自适应分布格式和相关联的编码(解码)技术可从它们的带宽效率、计算效率、抗误码、算法延迟和进一步的在视听媒体分布中关于比特率切换事件对于正在享受被解码的媒体的人而言有多明显的角度被提高。传统解码器可以预期仍与较新的、专用的设备并行使用这一事实在向后兼容性必须被维持的范围内对这样的潜在提高造成限制。

用于确保在视听信号回放期间更一致的动态范围的动态范围控制(DRC)技术在本领域广为人知。可以参见T.Carroll and J.Riedmiller,“Audio for Digital Tevision”,published as chapter 5.18of E.A.Williams et al.(eds.),NAB EngineeringHandbook,10^th ed.(2007)，Academic Press和其中引用的参考文献以获得概述。这样的技术可以允许在信号本身以全动态范围广播时接收器修改视听信号的动态范围以适应相对不复杂的回放设备，实现更加完善的设备。DRC的简单实现可以使用编码在从0到1的间隔中的增益因子的元数据字段，解码器可以选择应用或不应用该因子。

使用已知的DRC技术，被编码的视听信号可以和如下这样的元数据一起被传输，该元数据使得用户能够压缩或增大(boost)回放动态范围的能力以适应他或她的偏好或人工地使动态范围适应可用回放设备。然而，已知的DRC技术可能与自适应比特率编码方式不兼容，并且在两个比特率之间切换可能有时会伴随动态范围不一致，在传统设备中尤其如此。本发明解决了该顾虑。

附图说明

现在将参考附图描述本发明的实施例，其中：

图1a、1b、3、7和10是根据本发明的示例实施例的音频编码系统的一般化框图。

图2a、2b、2c、4、6和13是根据本发明的示例实施例的音频解码系统的一般化框图。

图5示出了在音频编码系统中的参数分析级的一部分。

图8图解了涉及相同长度的时间块的基于预处理和后处理DRC参数的的经补偿的后处理DRC参数值的计算。

图9图解了涉及不同长度的时间块的基于预处理和后处理DRC参数的的经补偿的后处理DRC参数值的计算。

图11和12示出了在音频解码系统中的参数合成级的一部分。

所有图都是示意的且一般仅示出解释本发明所必要的部分，而其他部分可以被省略或仅被建议。除非另有指示，否则在不同图中的相似附图标记指代相似部分。

具体实施方式

Ⅰ.概述

如此处使用的，“音频信号”可以是纯音频信号或视听信号或多媒体信号中的音频部分。

本发明的示例实施例提出了允许以带宽经济方式的视听媒体的分布的方式和设备。特别地，示例性实施例提出了允许传统接收器和更现代的设备两者输出具有一致的对话水平(level)的音频部分的视听媒体分布的编码格式。特别地，示例性实施例提出了具有自适应比特率的编码格式，其中在两个比特率之间的切换不需要伴有尖锐的对话水平变化，否则它可能在回放期间成为音频信号或信号中的音频部分中可察觉的伪像。

本发明的示例性实施例提供了具有在独立权利要求中阐述的特征的编码方法、编码器、解码方法、解码器、计算机程序产品和媒体编码格式。

本发明的第一实施例提供了用于基于比特流P重构n通道音频信号X的解码系统。该解码系统至少可在参数编码模式中操作并包括：

●解复用器，用于接收该比特流并输出编码核心信号

和一或多个多通道编码参数，该一或多个多通道编码参数共同由α指示；

●核心信号解码器，用于接收编码核心信号并输出m通道核心信号，其中1≤m＜n；

●参数合成级，用于接收核心信号和多通道编码参数，并且通过使用依赖多通道编码参数的增益形成核心信号的通道的线性组合以输出n通道信号。

在该第一实施例中，该比特流进一步包括一或多个预处理DRC参数DRC2，其定量地表征已经在产生比特流的编码器中执行的动态范围限制操作。基于预处理DRC参数，该解码系统可操作以消除编码器侧动态范围限制。优选地，该信号被划分为时间块且该预处理DRC参数DRC2被定义为具有该信号的一个时间块的分辨率；因而，参数DRC2的每个值应用到至少一个时间块，且可能将每个时间块与特定于该时间块的特定值相关联。仍然在不偏离本发明范围的情况下，参数DRC2的值可以对于若干个连续块为常数。例如，参数DRC2的值可以仅每个时间帧(其包括多个时间块)更新一次，从而在该时间帧上参数DRC2为常数。

与第一示例性实施例相关联的优点是该预处理DRC参数DRC2为解码系统提供了以如此的时间间隔将音频信号恢复为它的原始动态范围的选项，不管出于任何原因编码器已经按该时间间隔执行动态范围限制(或压缩)。该恢复可以相当于消除该动态范围限制，即，提高(或增大)该动态范围。在编码器中限制动态范围的一个可能原因可能是为了避免削波(clipping)。恢复是否被应用可以例如取决于人工输入的用户输入、自动检测的回放设备的特性、从外部源获得的目标DRC水平或其他因素。该目标DRC水平可以表达将由解码系统应用的原始后处理动态范围控制(由后处理DRC参数DRC1量化)的一部分。它可以由参数f∈[0,1]表示，该参数将待被应用的DRC的量从DRC1修改到f×DRC1(在对数单元中)。

在一个简单的实施例中，该DRC2参数可以以在对数形式中表示为正dB值的宽谱(或宽带)增益因子的形式被编码，其量化信号已经经历的相对振幅减小。因此，假设DRC2＝x>0，在编码器侧的相对振幅变化是10^-x/20<1，所以该消除可以随后包含在解码器侧以10^+x/20>1对信号放大。

实际的消除可以是完全的或部分的，取决于目标DRC水平以及输入DRC水平(或解码器输入DRC水平)，即在没有任何动态范围压缩或动态范围增大情况下重构之后n通道音频信号将具有的DRC水平。输入DRC水平可以是减少了对应于预处理DRC参数DRC2的量的原始动态范围。目标DRC水平可以是减少了对应于参数f和后处理DRC参数DRC1的乘积，即f×DRC1(对数形式)的量的原始动态范围。在之前提到的简单实现中，条件f×DRC1<DRC2可以意味着部分消除，即，消除对应于DRC2-f×DRC1而不是DRC2的量。例如，如果目标DRC水平对应于输入DRC水平(即，原始地由产生比特流的编码器编码的音频信号的动态范围)，这可以被表达为f＝0，那么需要按照量DRC2进行完整消除。如果目标DRC水平小于输入DRC水平，如0<f<1且f×DRC1<DRC2的情况，那么部分消除动态范围限制就足够了。如果目标DRC水平大于输入DRC水平，如f×DRC1>DRC2，可以通过在解码器中执行进一步动态范围压缩，即以对应于f×DRC1-DRC2的量压缩，实现指定的DRC水平。在这种情况下，不需要最初消除预处理DRC。最后，如果目标DRC水平是由DRC1量化的完全DRC量，如通过f＝1表达，则取决于DRC1<DRC2还是DRC1>DRC2，执行编码器侧动态范围限制的部分消除或进一步压缩。

在第二实施例中，提供了用于以比特流为基础重构n通道音频信号X的方法。根据该方法，接收包含编码核心信号

一个或多个多通道编码参数α和预处理DRC参数DRC2(如上定义的)中的每一个的比特流触发以下动作：

●编码核心信号被编码为m通道核心信号Y，此处1≤m＜n；

●执行参数空间合成，以使得n通道信号基于核心信号和多通道编码参数被重构。

根据第二示例性实施例，解码包括基于参数DRC2消除编码器侧动态范围限制。

第一和第二示例性实施例功能上相似且基本共享相同的优点。

在第一示例性实施例的进一步发展中，解码系统进一步接收作为比特流的一部分并在系统处于参数编码模式中时仍然如此的一或多个经补偿的后处理DRC参数DRC3，该参数量化可以由解码器应用的DRC。DRC的应用可以服从于人工用户输入、自动检测的回放设备的特性等；因而，将由解码器应用的DRC可以被完全实现、部分实现或根本不实现。一般而言，预处理DRC参数DRC2在相对于输入DRC水平增大动态范围方面有用，而经补偿的后处理DRC参数DRC3在从输入DRC水平对动态范围进行任何调整(也包括范围压缩)方面有用。DRC3参数可以以对数形式被表示为正或负的dB值。因此，假设DRC3＝y>0，那么在解码器侧将要发生的相对振幅变化与10^-y/20成比例，该值是(0,1)区间中的标量。相反地，DRC3的负值将引起解码器侧上的扩大。

在以上的进一步发展中，解码系统包括可操作以基于参数DRC2消除编码器侧动态范围压缩的DRC处理器。可选择地，DRC处理器可操作以消除已在编码器侧应用的动态范围压缩，如以上讨论的参数f表达地。

在进一步的发展中，解码系统进一步包括控制DRC处理器和核心信号解码器并负责实现目标DRC水平的DRC预处理器。如此，该DRC预处理器可以确定目标DRC水平(如，f×DRC1)大于还是小于输入DRC水平，该输入DRC水平可以是初始被编码并随后被由预处理DRC参数DRC2量化的编码器侧DRC减少的音频信号的动态范围。如果基于该决定的结果，被解码的音频信号需要被增强，那么DRC预处理器(i)指示DRC处理器部分或完全消除编码器侧动态范围限制。相反，如果被解码的音频信号需要被压缩(例如，f×DRC1>DRC2，那么DRC预处理器指示DRC处理器(ii)部分或完全实现如参数DRC3量化的将被应用的解码器侧DRC。如果目标DRC水平与输入DRC水平区别不大(例如，f×DRC1≈DRC2)，那么DRC预处理器不需要采取任何行动。在通常操作中，没有关于相同时间块执行操作(i)和操作(ii)两者。

在示例性实施例中，解码系统进一步可在离散解码模式中操作，以基于含有编码n通道信号

的比特流重构音频信号。因此，本实施例提供了双模式或多模式解码系统。从自适应编码的角度来看，该离散编码模式可以代表高比特率模式，而参数编码模式典型地对应于较低比特率模式。

在示例性实施例中，解码系统是双模式类型，即，它可在参数编码模式或离散编码模式中操作。该解码系统被允许在这些模式中的每一个中应用解码器侧DRC。在离散编码模式中，该解码系统使用后处理DRC参数DRC1作为DRC的指导。然而在参数编码模式中，至少在某些时间块中基于潜在地与编码器侧的动态范围限制相关地被导出的核心信号生成n通道音频信号。为了应对已经发生的动态范围变化(即，在某些时间块中的动态范围限制)，解码系统使用经补偿的后处理DRC参数DRC3作为DRC的指导。参数DRC1和DRC3两者都可以从比特流中导出，但是在该系统的正常操作期间，在给定时间块中不能得到这两种参数类型而只能得到其中任一种。包括参数DRC1和DRC3两者将相当于当参数DRC2存在时发送冗余信息。本示例性实施例的解码系统使用参数DRC2以使得参数DRC1适应参数DRC1的标度或使得参数DRC3适应参数DRC1的标度。例如，解码系统可以包括DRC下补偿器，该下补偿器接收参数DRC2和DRC3并基于此输出将由解码器系统应用的经恢复的后处理DRC参数。经恢复的后处理DRC参数将随后可与后处理DRC参数DRC1比较(处于同一标度)。换言之，由经恢复的DRC参数表达的解码器侧DRC定量地等同于核心信号的编码器侧动态范围限制和由经补偿的后处理DRC参数DRC3表达的解码器侧DRC的组合。在以上所提到的简单实现中，各个DRC参数之间的关系可以如下：由DRC2+DRC3获得经恢复的DRC参数，其等于DRC1。

在本发明的第二方面中，示例性实施例提供了用于将划分成时间块的n通道音频信号X编码成比特流P的编码系统。该编码系统包括：

●参数分析级，用于接收n通道信号并基于此并且在编码系统的参数编码模式中输出m通道核心信号Y和一或多个多通道编码参数α，其中1≤m＜n；以及

●核心信号编码器，用于接收核心信号并输出编码核心信号

在该编码系统中，参数分析级被配置为以时间段为基础执行自适应动态范围限制，并输出量化所应用的动态范围限制的预处理DRC参数DRC2。该时间段可以是一个时间块或多个连续时间块，比如包含六个时间块的时间帧。该编码系统被配置为将预处理DRC参数DRC2和比特流一起传输，优选地但不是必须地作为其一部分。通过传输预处理DRC参数DRC2，编码系统允许解码系统接收比特流以消除参数分析级已经施加在核心信号上的动态范围限制。如果动态范围限制以时间块为基础被执行，那么参数DRC2具有时间块分辨率。可选择地，如果动态范围限制以帧为基础被执行，那么参数DRC2具有一帧的分辨率。换言之，每个时间块与参数DRC2的特定值或与对之前定义的值的参考相关联，但是该值可以以帧为基础或以块为基础被更新。更进一步，在参数分析级中的动态范围限制可以直接在核心信号上被执行(例如，通过在核心信号上应用动态范围限制)或间接被执行(例如，通过在从其导出核心信号的信号上应用动态范围限制)。

根据之前示例性实施例的进一步发展，编码系统可在参数编码模式和离散编码模式两者中操作。为了允许在解码器侧的DRC，编码器被配置为导出量化将被应用的解码器侧DRC的一个或多个后处理DRC参数DRC1。在离散编码模式中输出参数DRC1。然而，在参数编码模式中，参数DRC1已被补偿以应对已经由参数分析级执行的任何动态范围限制。该补偿过程的输出包括经补偿的后处理DRC参数DRC3。补偿过程的主导原则可以是由后处理DRC参数表达的解码器侧DRC将会与由参数分析级施加的动态范围限制(如由参数DRC2量化)和解码器侧DRC(如由经补偿的后处理DRC参数DRC3量化)的组合定量地等同。优选地，例如通过使用相应的线性或对数单位，所有三种参数类型以可兼容的标度被表达。在之前提到的简单实现中，DRC参数之间的关系可以如下(仍然在对数标度上)：经补偿的后处理DRC参数作为DRC1–DRC2被获得。

在第二方面内的进一步示例性实施例中，编码方法包括：

●接收划分成时间块的n通道音频信号X；

●以时间块为基础执行动态范围限制并生成一个或多个预处理DRC参数DRC2(该参数量化所应用的动态范围限制)的同时，生成m通道核心信号Y和一个或多个多通道编码参数α；以及

●输出含有核心信号、多通道编码参数和预处理DRC参数DRC2的比特流P。

在进一步的示例性实施例中，本发明提供了包括具有用于执行根据以上描述的示例性实施例的解码方法或编码方法的计算机可执行指令的计算机可读介质的计算机程序产品。该计算机程序产品可以在通用计算机中执行，该通用计算机不必须包括专用的硬件组件。

在更进一步的示例性实施例中，本发明提供了用于音频信号存储或传输的数据结构。该结构包括m通道核心信号Y、一个或多个混合参数α以及量化编码器侧动态范围限制的一个或多个预处理DRC参数DRC2。该结构可容许通过下混合信号通道(以及可能地，去相关的信号中的通道)的n通道线性组合(其中所述一个或多个混合参数控制线性组合中的至少一个增益)并通过消除编码器侧动态范围限制的解码。特别的，本发明提供了存储根据以上数据结构构建的信息的计算机可读介质。在该数据结构中，预处理DRC参数DRC2可以被编码为代表指数的3比特字段和代表尾数的相关联4比特字段；在解码时该指数和尾数被结合为对应于增益值的标量值。可替代地，预处理DRC参数DRC2可以被编码为代表指数的2比特字段和代表尾数的相关联5比特字段。

在从属权利要求中限定了进一步的示例性实施例。注意到本发明涉及特征的所有组合，即使该特征在相互不同的权利要求中被描述仍是如此。

Ⅱ.示例性实施例：编码侧

图1a以一般化框图的形式示出了根据示例性实施例的双模式编码系统1。n通道音频信号X被提供给上部部分和下部部分中的每一个，该上部部分至少在编码系统1的离散编码模式中是工作的，该下部部分至少在系统1的参数编码模式中是工作的。

该上部部分通常包括与编码器11并行布置的离散模式DRC分析器10，这两者都接收音频信号X作为输入。基于该信号，编码器11输出编码n通道信号

而DRC分析器10输出量化将被应用的解码器侧DRC的一个或多个后处理DRC参数DRC1。来自两个单元10、11的并行输出由离散模式复用器12收集，该复用器输出比特流P。

编码系统1的下部部分包括与参数模式DRC分析器21并行布置的参数分析级22，参数模式DRC分析器21和参数分析级22接收n通道音频信号X。基于n通道音频信号X，该参数分析级22输出一个或多个多通道编码参数(共同由α表达)、和m通道(1≤m＜n)核心信号Y，该核心信号Y接着由核心信号编码器23处理，该核心信号编码器23基于此输出编码的核心信号

如附图标记g↓所表示的，参数分析级22在需要的时间块中实现动态范围限制。控制何时应用动态范围控制的可能的条件可以是“无削波条件”或“范围中条件”，意味着在核心信号具有高振幅的时间段中，该信号被处理以使其适配在限定的范围内。该条件可以以一个时间块或包含若干个时间块的时间帧为基础被实施。优选地，该条件是通过施加宽谱增益减少而不是只截去峰值或使用类似方法被实施。如在本领域广为人知地，存在用于使得暂时动态范围限制操作较不明显的技术(如果该限制仅是时间块的特定集合需要的，则例如逐渐施加和/或释放该限制)。特别地，该系统1可以包括被配置为平滑化DRC参数的反馈回路(未示出)。例如，将被输出的目前参数值可以作为前一段的参数值的一部分0<a<1和通过在目前段中“无削波条件”的实施产生的参数值的一部分(1-a)的和被获得。后处理DRC参数DRC1和预处理DRC参数DRC2当然可以被独立地并通过不同的常数a值被平滑化。

图5示出了参数分析级22的可能实现，其包括预处理器527和参数分析处理器528。该预处理器527负责对n通道信号X执行动态范围限制，因此它输出动态范围受限的n通道信号X_C，该信号被供给到参数分析处理器528。该预处理器527进一步输出预处理DRC系数DRC2的逐块或逐帧的值。与来自参数分析处理器528的多通道编码参数α和m通道核心信号Y一起，该参数DRC2被包括在参数分析级22的输出中。

再一次参考图1a，注意离散模式DRC分析器10与参数模式DRC分析器21功能类似，其输出量化将被应用的解码器侧的一个或多个后处理DRC参数DRC1。然而，由参数模式DRC分析器21提供的参数DRC1在参数编码模式中未被包含于比特流中，而是经历补偿以使得由参数分析级22执行的动态范围限制被应对。为了该目的，DRC上补偿器(up compensator)24接收后处理DRC参数DRC1和预处理DRC参数DRC2。对于每个时间块，DRC上补偿器24导出一个或多个经补偿的后处理DRC参数DRC3的值，该值为使得经补偿的后处理DRC参数DRC3和预处理DRC参数DRC2的组合动作定量地等同于由后处理DRC参数DRC1量化的DRC。换言之，DRC上补偿器24被配置为减少由DRC分析器21输出的后处理DRC参数，这通过已经被参数分析级22实现的后处理DRC参数的分享(如果有)实现。将被包含在比特流中的是经补偿的后处理DRC参数DRC3。仍然涉及系统1的下部部分，参数模式复用器25收集经补偿的后处理DRC参数DRC3、预处理DRC参数DRC2、多路通道编码参数α和编码核心信号

并基于它们形成比特流P。在可能的实现中，经补偿的后处理DRC参数DRC3和预处理DRC参数DRC2可以以对数形式被编码为影响解码器侧振幅缩放的dB值。经补偿的后处理DRC参数DRC3可以具有任何符号。然而，从“无削波条件”等的实现产生的预处理DRC参数DRC2可以在所有时刻由非负值dB表示。

对于编码系统1的上部和下部部分两者共同的，选择器26(表示任何硬件或软件实现的信号选择手段)依赖于实际的编码模式确定来自编码系统1的上部或下部部分的比特流是否构成编码系统1的最终输出。类似地，可以在系统1的输入侧提供用于将音频信号X引至系统1的上部部分或下部部分的开关(图1a中未示出)。输入侧开关可以与输出侧开关26对应地被驱动。

参考图1a以及以下将要讨论的图，比特流P可被以遵从Dolby Digital Plus(DD+或EAC3、增强AC3)的格式被编码。随后该比特流至少包括元数据字段dynrng和compr。根据DD+的一个规定，dynrng具有一个时间块的分辨率，而compr具有一帧(包括四或六个时间块)的分辨率。就这些元数据字段的重要性而言，如上限定的后处理DRC参数DRC1对应于dynrng或compr，这取决于例如“严重压缩”是否被激活，其以确保单声下混合将不会超过特定峰值水平的方式起作用。在一般情况下，dynrng和nompr字段两者都被传输，决定使用哪一个是解码器的职责。因此，后处理DRC参数DRC1(因此可以具有块分辨率或帧分辨率)可在格式的传统部分中被传输，并将被传统解码器理解。然而，预处理DRC参数DRC2在DD+格式中缺少对等部分，并且优选地在新的元数据字段中被编码。预处理DRC参数DRC2与确保信号在从5.1格式(n＝6)下混合到立体声格式(m＝2)时将不会削波的dynrng和/或compr的部分有关。经补偿的后处理DRC参数DRC3是通过扣除由预处理DRC参数DRC2量化的削波阻止而补偿dynrng或compr值之后的结果；因此它可以在DD+比特流中的dynrng或compr字段中被传输。

用于预处理DRC参数DRC2的新元数据字段可以包括7比特(xxyyyyy)，这里在x位置的比特代表[0，3]中的整数且在y位置的比特代表[0，31]中的整数。预处理DRC参数DRC2作为增益因子(1+y/32)×2^x被获得。

DD+格式中的另一元数据参数是dialnorm，它是内容的音量水平(可能是时间上平均的)。在示例实施例中，目标输出参考水平L_T是在解码器配置中的设定，可能由用户控制。为了达到目标输出参考水平L_T，解码系统将应用由差值dialnorm－L_T量化的静态衰减。为了获得要应用的总衰减，解码系统将通过由(未补偿)后处理DRC参数DRC1或经补偿的后处理DRC参数DRC3或表达为后处理DRC参数的部分f×DRC1的目标DRC规定的任何附加衰减扩大该差值。这会分别获得：dialnorm－L_T+DRC1或dialnorm－L_T+DRC3或dialnorm－L_T+f×DRC1。如果这三个线性组合中的一个为正号，那么它规定将在解码系统中应用非零量的总衰减；负号规定该信号将有效地被增大。

图7示出了根据进一步的示例实施例的与图1a中所示编码系统1功能类似的编码系统701。由于已经使用了类似的参考符号且与信号相关的附图标记与图1a中的一致，所以认为编码系统701的工作原理的详细说明不是必需的。然而，一个重要的区别在于这样的事实：一个DRC分析器721完成了图1a中离散模式DRC分析器10和参数模式DRC分析器21两者的任务。为了该目的，该DRC分析器721接收将由编码系统701编码的n通道音频信号X；它向离散模式复用器712和DRC上补偿器724两者提供后处理DRC参数DRC1(该参数是分析器721以n通道音频信号X为基础生成的)，其中后一组件724与图1a的编码系统1中的上补偿器24功能相同。

图3示出了编码系统301，其比图1a中的那个相对简单因为它不产生任何后处理DRC参数作为输出。如此，接收由编码系统301产生的比特流P的解码器将不必需能够执行动态范围压缩。然而，这样的解码器将能够消除由编码系统301应用的动态范围限制；典型地，这相当于在n通道音频信号X包括相对高振幅的峰值的时间块中增大动态范围。

在图3中，编码系统301的上部部分(至少在编码系统301的离散编码模式中工作)至多需要包括被配置为以将由系统301编码的n通道信号X为基础提供编码n通道信号

的编码器311。对应于离散编码模式的下部部分包含比图1a中的编码系统的类似部分少的组件，即，基于n通道音频信号X输出预处理DRC参数DRC2、多通道编码参数α和m通道核心信号Y的参数分析级322。在核心信号Y已经在核心信号编码器323中被处理之后(该编码器将其变换为编码核心信号

)，参数分析级322的输出的集合通过参数模式复用器325被组合为比特流P。被布置在编码系统301的上部部分和下部部分两者的下游的选择器326负责依赖于编码系统301的目前编码模式输出由上部部分和下部部分中的任一个产生的比特流。

在图10中所示的编码系统1001代表进一步的简化。该编码系统1001适于处理在适于存储或传输而无进一步编码操作的格式中的n通道音频信号X。因此，在离散编码模式中，音频信号可以被从编码系统1001中输出而不经过任何进一步的处理，如图10中所示选择器1026的位置所示。在参数编码模式中，参数分析级1022分析n通道音频信号X以输出预处理DRC参数DRC2、多通道编码参数α和m通道核心信号Y。当如所说明的，n通道音频信号是适于传输或存储的格式时，参数分析级22也被配置为在n通道音频信号上操作。在图10中的编码系统中，核心信号Y也是允许传输或允许存储的格式，使得该信号和多通道编码参数α以及参数DRC2一起可以由参数模式复用器1025组合为将在参数编码模式中从编码系统1001输出的比特流。

图1b图解了根据示例实施例的单模式编码系统。n通道音频信号X被提供给DRC分析器21和参数分析级22，两者被并行布置。基于n通道音频信号X，参数分析级22输出一个或多个多通道编码参数(共同由α表示)和m通道(1≤m＜n)核心信号Y，核心信号接下来由核心信号编码器23处理，该编码器基于该核心信号输出编码核心信号

参数分析级22在需要动态范围限制的时间块中实现动态范围限制。DRC上补偿器24接收后处理DRC参数DRC1和预处理DRC参数DRC2。对于每个时间块(在本示例中，产生后处理DRC参数DRC1的值的分辨率是一个时间块)，DRC上补偿器24导出一个或多个经补偿的后处理DRC参数DRC3的值，这些值使得经补偿的后处理DRC参数DRC3和预处理DRC参数DRC2的组合动作定量地等同于由后处理DRC参数DRC1量化的DRC。

图8更详细地图解了图1和7中的DRC上补偿器24、724的一种可能的功能。每个DRC上补偿器24、724被配置为基于预处理DRC参数DRC2和后处理DRC参数DRC1产生经补偿的后处理DRC参数DRC3。每个柱指代信号的时间帧。每个时间帧与预处理DRC参数DRC2的值和后处理DRC参数DRC1的值相关联；在图8和9中，它们可以为带负号的dB_FS单位。如图字(legent)所示，实线示出后处理DRC参数DRC1，而另外两种DRC参数类型对应于不同的阴影图案。基于预处理DRC参数DRC2和经补偿的后处理DRC参数DRC3的组合动作定量地等同于由后处理DRC参数DRC1表达的解码器侧DRC的条件，产生经补偿的后处理DRC参数DRC3的每个值。然而图8和9被简化至根据特定方法(参加以上引用的Carroll和Riedmiller的论文)的DRC参数的效果可能不能由标量的、线性的数量忠实地图示的程度。图8和图9大概展现了以上讨论的简化实施例的相对完整的图，其中DRC参数作为标量被编码。

图8图解了其中后处理DRC参数DRC1在每个时间帧内恒定的情况，类似于如上解释的DD+格式中的参数。不需要一直是这个情况。例如，传统类型的DRC分析器可以被配置为分析固定数量的p₁个时间块的段，其中p₁可以等于4、6、8、16、24、32、64或某些其它的明显小于整个节目(例如，无线电表演的歌曲、音轨、插曲)中典型出现的时间块的数量的整数。该数p₁可以匹配也可以不匹配预处理DRC参数的每个更新之间的帧的数量p₂。图8指示p₁＝6且p₂＝6的特定的情况。优选地，数p₁足够的小以使得后处理DRC参数DRC1至少在音频信号X的每秒被重新估算一次，更优选地，在音频信号X的每秒被重新估算几十或几百次。

图9示出了类似DD+格式中的dynrng参数、p₁＝1的使用情况。然而，每次基于p₂＝6个时间块执行参数分析级22、722中的动态范围限制，使得结果对于每个第六时间块产生预处理DRC参数DRC2的新值。每个最窄的柱代表时间块。上补偿器24、724可以被配置为以如下方式确定经补偿的后处理DRC参数DRC3的每个值：由后处理DRC参数DRC1表达的解码器侧DRC定量地等同于由各个参数分析级22、722在每个时间块上施加的动态范围限制和由经补偿的后处理DRC参数DRC3量化的解码器侧DRC的组合。

Ⅲ.示例实施例：解码器侧

图2a示出了以比特流P为基础重构n通道音频信号的单模式解码系统51。该比特流P包括编码核心信号

多通道编码参数α、预处理DRC参数DRC2和经补偿的后处理DRC参数DRC3，这些量由被布置在解码系统51的输入处的解复用器70从比特流提取。核心信号解码器71接收编码核心信号

并基于其输出m通道核心信号Y(1≤m＜n)。与解码有关地，该核心信号解码器71进一步执行如由经补偿的后处理DRC参数DRC3的量化的DRC。核心信号解码器71可以操作以实行由经补偿的后处理DRC参数DRC3表示的完全DRC或其一部分；这一决定可以由用户手动地控制，或可以基于回放设备的特性的检测。在信号解码器71的下游布置有DRC处理器74，该处理器通过消除如由预处理DRC参数DRC2量化的编码器侧被施加的动态范围限制，恢复核心信号的动态范围限制，如附图标记g↑表示的。DRC处理器74输出中间信号Y_C，该信号除了动态范围之外与核心信号Y等同，并被输入到参数合成级72。参数合成级72形成中间信号Y_C中的m个通道的n通道线性组合，其中所应用的增益可由多通道编码参数α控制，并输出重构的n通道音频信号X。在参数合成级72中的线性组合可以进一步包括从中间信号Y_C或核心信号Y导出的去相关信号。该去相关信号可以附加地经历非线性处理，例如伪像衰减。该去相关信号可以在核心信号修改单元或去相关器(未示出)中被产生。在以上段落中概述的简单实施例中，DRC处理器74中对施加到编码器侧的动态范围限制的消除可以相当于由对应于量化预处理范围限制的参数DRC2的逆的因子以宽谱方式缩放该信号。

图2b示出了解码系统51，该系统比图2a中的系统进行了更多的发展。该解码系统51，提供了分别协调核心信号解码器71和DRC处理器74的DRC相关行为的DRC预处理器77。另一方面，核心信号处理器71可操作以压缩信号的动态范围，直到由经补偿的后处理DRC参数DRC3限定的限度，或压缩该动态范围。另一方面，DRC处理器74可操作以完全增大动态范围，直到它在编码之前所具有的水平，或部分增大动态范围。伴随这样的设置，典型地可以通过仅在核心信号解码器71和DRC处理器74之一中激活DRC处理来实现给定的目标DRC水平。如果该经补偿的后处理DRC参数DRC3指示动态范围压缩，那么同时操作两个单元可能意味着某些程度的相互对抗动作(互相消除)，这可能对输出质量造成负面影响。

DRC预处理器77接收预处理DRC参数DRC2和经补偿的后处理DRC参数DRC3两者。DRC预处理器77进一步访问预定义或可变(如用户定义)的DRC目标水平(由参数f表达，如f×DRC1)和对应于由DRC2减小的原始动态范围的信号的输入DRC水平。该DRC预处理器77基于这两个DRC水平的比较确定是通过在核心信号解码器71中的动态范围压缩还是DRC处理器74中的动态范围增大来实现DRC目标水平。为了这一目的，DRC预处理器77输出专用控制信号k₇₁、k₇₄，这些信号被提供到核心信号解码器71和DRC处理器74中的每一个。

现在将讨论要从DRC预处理器77分别向核心信号解码器71和DRC处理器74提供的控制信号k₇₁、k₇₄的行为。第一控制信号k₇₁控制如由经补偿的后处理DRC信号DRC3量化的解码器侧DRC的哪个部分将被核心信号解码器71应用。在之前讨论的简单实施例中，所得相对增益变化由因子

给出，使得最大值k₇₁＝1对应于最大动态范围压缩，而最小信号值对应于不进行动态范围压缩。第二控制信号k₇₄控制DRC处理器74以什么样的程度消除编码器侧动态范围限制。在以上讨论的简单实施例中，DRC74以因子

改变增益，其中最小值k₇₄＝0对应于没有消除且最大值对应于完全消除、将信号恢复到它原始动态范围的100％。DRC预处理器77可以被配置为依赖于目标水平与输入DRC水平相比对应于动态范围增大还是动态范围压缩而不同地执行目标水平，输入DRC水平被理解为由量DRC2减少(或压缩)的原始动态范围。此外，DRC预处理器77可以被配置为在最小值和最大值之间插值以实现对应于经补偿的后处理DRC参数DRC3或预处理DRC参数DRC2的一部分的目标DRC水平。也可以使用插值来实现由未补偿后处理DRC参数DRC1的一部分表达的目标DRC水平。可基于参数f和DRC1计算DRC2和DRC3的部分中的每一个，如下。现在将在所述简单实施例的上下文中描述DRC预处理器77可以如何响应由后处理DRC参数DRC1的部分f表达的特定目标DRC水平。鉴于之前段落中的讨论，DRC预处理器77将在[0，1]中的值分配给下式中的参数k₇₁、k₇₄

f×DRC1＝k₇₄×DRC2+k₇₁×DRC3，

此处预定义f∈[0，1]、DRC2≥0且DRC1＝DRC2+DRC3(对数标度)。从以上可断定DRC1和DRC2可以是正或负。如上指出的，如果核心信号解码器71的动作是范围压制的(DRC3＝y＞0)，那么通常希望避免同时操作核心信号解码器71和DRC处理器74。这相当于取k₇₁＝0或k₇₄＝0来解以上方程。

进一步的可能表示是可能在对数标度上的、依赖响度的增益因子。例如，一对增益因子可以与对话水平一起被传输。将在比对话水平更响亮的时间段中应用第一增益因子，而将在更安静的时间段中应用第二增益因子。因为第一和第二增益因子可以被分配相互独立的值，所以这允许动态范围压缩和扩展。

图2c示出双模式解码系统51，该系统被配置为接收含有被参数编码或离散编码的音频信号的比特流P。在解码系统51的参数模式中，参数模式解复用器70的下游的上部部分是活跃的，以类似于图2a中所示系统的功能提供n通道音频信号X。在离散模式中，比特流P被提供给离散模式解复用器60，其提取编码n通道信号

和一个或多个后处理DRC参数DRC1。根据目前模式操作在解码系统51的输入和输出侧处的选择器52、82(表征任何硬件或软件实现的信号选择手段)；这些选择器可以被联动地操作，使得两者都一直在它们的上部位置或它们的下部位置。在离散模式中，编码n通道信号

由解码器61处理，该解码器可操作以根据后处理DRC参数DRC1执行DRC。离散和参数编码模式之间的对话水平的一致性由以下事实确保：解码系统51被配置为在离散模式中使用经补偿的后处理DRC参数DRC3以替代(未补偿)后处理DRC参数DRC1。参数DRC1和DRC3之间的关系已在之前讨论过。

图4是简化的解码系统451的一般化框图，该系统缺少执行后处理DRC的能力。然而，图4中的解码系统451可操作以消除编码器侧应用的如由预处理DRC参数DRC2量化的动态范围限制，更准确地，参数合成级472被配置为完全或部分消除该动态范围限制，如符号g↑所表示的。

图11和图12示出图4中出现的参数合成级472的两种可能实现。类似的实现在图13中所示的类型的编码系统中同样有用，下面将进一步讨论。在第一种可能的实现中，如图11中所示的，预调节器1174对m通道核心信号Y执行动态范围限制消除，因此获得m通道中间信号Y_C。该中间信号Y_C随后被参数合成处理器1175处理，该处理器形成中间信号Y_C(可能地，附加的去相关信号)中通道的线性组合，其中在线性组合内应用的增益可被多通道编码参数α控制，该参数也被供给到参数合成处理器1175。

图12中示出的第二实现代表替代性实现。在第二实现中，参数合成作为处理步骤位于动态范围限制消除之前。这一事实自身表明参数合成处理器1275被布置在后调节器1276的上游。后调节器1276负责消除如由预处理DRC参数DRC2量化的编码器侧动态范围限制。因此，从参数合成处理器1275提供给后调节器1276的信号与动态范围受限的n通道信号X_C相关。

图13示出根据更进一步的示例实施例的解码系统1351，其中解码器侧DRC被布置在系统1351的离散模式部分和参数模式部分两者的下游的DRC处理器1383影响。如在已经参考图2a、2b、2c和4描述的解码系统中，本解码系统1351也可以消除如由预处理DRC参数DRC2量化的已经在编码器侧应用的任何动态范围限制。DRC处理器1383意图在离散编码模式(其中(未补偿)后处理DRC参数DRC1被包含于所接收的比特流P中)和参数编码模式(其中经补偿的后处理DRC参数DRC3被接收)中发挥功能。注意到，解码系统1351与图2b中所示的系统51不同之处在于后处理DRC在n通道输出信号上，即参数合成级1372的下游被实现。在图2b的系统51中，对应的操作在核心信号解码器71中发生。

DRC处理器1383从用户、存储器、回放设备上执行的硬件诊断或某些其他外部或内部数据源接收目标DRC水平f。例如，目标DRC水平f可以代表用户希望解码系统1351实现的完全后处理DRC的一部分。如将看到的，解码系统1351的结构具有如下的优点：只需要DRC处理器1383以考虑参数f的值；这使得部分DRC的实现变得方便。为了这一目的，提供了配置为将经补偿的后处理DRC参数DRC3转换为(非补偿)后处理DRC参数DRC1的标度的DRC下补偿器(down compensator)1373。实际上，从参数合成级1372输出的n通道音频信号X将经历编码器侧动态范围限制的消除；因此，根据经补偿的后处理DRC参数DRC3应用DRC将承受非常小的范围压缩。为了阻止这一情况，DRC下补偿器1373基于预处理DRC参数DRC2恢复经补偿的后处理DRC参数DRC3，从而经恢复的后处理DRC参数被获得并在参数编码模式中被供给DRC处理器1383。如已经指出的，由经恢复的DRC参数表达的解码器侧DRC定量等同于已经施加在核心信号上的编码器侧动态范围限制和由经补偿的后处理DRC参数DRC3表达的解码器侧DRC的组合，如图8和9所示的。

在替代实施例中，解码系统1351可以在没有离散模式解复用器1360和解码器1361的情况下被实现。图13中的DRC参数选择器1381、1382随后被DRC处理器1383和每个DRC下补偿器1373(从其接收经恢复的后处理DRC参数)和参数合成级1372(其提供n通道音频信号X)之间的连接取代。这一替代实施例是简化的，因为它以单一、参数编码模式操作。进一步，它可能更简单地实现，因为可以使用传统类型DRC处理器1383(其不必被配置为处理经补偿的后处理DRC参数)。

图6示出了用于将接收的比特流P解码为m通道音频信号的传统解码系统651。在参数编码模式中，位于参数模式解复用器670下游的上部部分工作，输出编码m通道核心信号

和经补偿的后处理DRC参数DRC3。编码m通道核心信号

由第一解码器671解码为m通道核心信号Y。在离散编码模式中，将被输出的音频信号由位于离散模式解复用器660的下游的下部部分产生，其从比特流P提取编码n通道信号

和(未补偿)后处理DRC参数DRC1。编码n通道信号

由第二解码器661解码，然后在下混合级662中下混合成为m通道信号Y。此信号Y和与参数模式相关地提到的信号Y两者被供应到两种模式共有的DRC处理器683。在参数模式中，DRC处理器683的量化特性由经补偿的后处理DRC参数DRC3控制，而在离散模式中，这些特性由(未补偿)后处理DRC参数DRC1控制。这样，可维持从解码系统651输出的m通道音频信号的一致对话水平。应指出，本解码系统651可以是传统类型，因为它可以以类似的(如果不是相同的)方式对待经补偿的和未补偿的后处理DRC参数。

Ⅳ.附图中的附图标记

Ⅴ.等同、延伸、替换和其他

在本领域技术人员学习以上的描述之后，本发明的进一步实施例将会变得显而易见。虽然本描述和附图公开了实施例和示例，但是本发明并不限于这些具体的示例。在不偏离本发明的范围的情况下可以做出许多修改和变化，本发明的范围由所附权利要求限定。出现在权利要求中的任何附图标记不应被理解为限定它们的范围。

文中以上公开的系统和方法可以被实现为软件、硬件或它们的组合。在硬件实现中，以上描述中所提及的功能单元间的任务划分不一定对应于物理单元的划分；相反地，一个物理元件可以具有多种功能，且一个任务可以由若干个物理元件协作完成。某些组件或所有组件可以被实现为由数字信号处理器或微处理器执行的软件，或被实现为硬件或专用集成电路。这样的软件可以被分布到计算机可读介质上，该介质可以包括计算机存储介质(或非暂态介质)和通信介质(或暂态介质)。如本领域技术人员所熟知的，术语计算机存储介质包括在用于比如计算机可读指令、数据结构、程序模型或其他数据的信息的存储的任何方法或技术中实现的易失性和非易失性、可拆装和不可拆装介质。计算机存储介质包括，但不限于，RAM、ROM、EEPROM、闪存或其他存储技术、CDROM、数字式激光视盘(DVD)或其他光学盘存储器、磁盒、磁带、磁性盘存储器或其他磁存储设备或可以被用于存储所需信息且可以由计算机存取的任何其他介质。进一步，技术人员都熟知通信介质典型地具体化计算机可读指令、数据结构、程序模块或在比如载波或其他传送机制的调制数据信号中的其他数据，且包含任何信息输送介质。

Claims

1.一种用于输入音频信号的动态范围控制DRC的控制方法，所述方法包括：

通过解码系统接收具有输入音频信号和编码器生成的DRC元数据的比特流，所述编码器生成的DRC元数据包含多个DRC增益集合，所述多个DRC增益集合包括适于被应用于输入音频信号以防止削波或限制的第一DRC增益集合，和基于用户输入或回放设备的特性的自动检测或被应用于输入音频信号的目标DRC水平的第二DRC增益集合；以及

选择性地将DRC增益集合中的一个或多个作为总增益的至少一部分应用于输入音频信号。

2.根据权利要求1所述的方法，其中，所述总增益是至少部分地基于修改参数被确定的。

3.根据权利要求1所述的方法，其中，输入音频信号包括多个时间帧，每个时间帧包括多个时间块；并且其中，所述第一DRC增益集合和所述第二DRC增益集合之一或两者包括被应用于输入音频信号中的特定时间块的特定增益值。

4.根据权利要求1所述的方法，其中，输入音频信号包括多个时间帧，每个时间帧包括多个时间块；并且其中，所述第一DRC增益集合和所述第二DRC增益集合之一或两者包括要被应用于输入音频信号中的特定时间帧中的所有时间块的特定增益值。

5.根据权利要求1所述的方法，其中，所述第一DRC增益集合代表预处理DRC增益；其中所述第二DRC增益集合代表经补偿的后处理DRC增益；并且其中，预处理DRC增益和经补偿的后处理DRC增益的组合代表后处理DRC增益。

6.根据权利要求1所述的方法，其中，特定DRC增益集合是所述第一DRC增益集合；并且其中，所述第一DRC增益集合被所述解码系统使用以消除由编码系统执行的DRC操作的至少一部分。

7.根据权利要求1所述的方法，其中，特定DRC增益集合是所述第二DRC增益集合；并且其中，所述解码系统使用所述第二DRC增益集合以执行除了由所述第一DRC增益集合代表的编码系统所执行的编码器侧DRC操作之外的另外的DRC操作。

8.根据权利要求1所述的方法，其中，输入音频信号被划分为时间块，并且DRC增益集合被定义为具有输入音频信号的一个时间块的分辨率。

9.根据权利要求8所述的方法，其中，DRC增益集合被应用于输入音频信号的至少一个时间块。

10.一种用于输入音频信号的动态范围控制DRC的控制方法，所述方法包括：

通过解码系统接收具有输入音频信号和编码器生成的DRC元数据的比特流，所述编码器生成的DRC元数据包含多个DRC增益集合，

所述多个DRC增益集合包括：

第一DRC增益集合，其量化要被应用于输入音频信号以防止削波或限制的解码器侧DRC，其中所述第一DRC增益集合中的所有增益具有相同的符号，和

第二DRC增益集合，其量化要被应用于输入音频信号的解码器侧DRC，其中所述解码器侧DRC基于目标DRC水平被修改，其中，所述目标DRC水平对应于要被应用于输入音频信号的解码器侧DRC的一部分；其中所述第二DRC增益集合的增益能具有任何符号；以及

11.一种适于执行根据权利要求1到10中任一项所述的方法的音频捕获设备。

12.一种非暂态计算机可读存储介质，存储有计算机代码指令，所述计算机代码指令在被一个或多个处理器执行时使得执行根据权利要求1到10中任一项所述的方法。

13.一种用于输入音频信号的动态范围控制DRC的控制设备，包括：

一个或多个处理器；

非暂态计算机可读存储介质，存储有计算机代码指令，所述计算机代码指令在被所述一个或多个处理器执行时使得执行根据权利要求1到10中任一项所述的方法。

14.一种用于输入音频信号的动态范围控制DRC的控制装置，包括用于执行根据权利要求1到10中任一项所述的方法的部件。