CN105164918B

CN105164918B - 具有动态阈值的频带压缩

Info

Publication number: CN105164918B
Application number: CN201480024349.7A
Authority: CN
Inventors: A·J·西费尔德特
Original assignee: Dolby Laboratories Licensing Corp
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 2013-04-29
Filing date: 2014-04-14
Publication date: 2018-03-30
Anticipated expiration: 2034-04-14
Also published as: EP2992605A1; JP2016518788A; US9762198B2; JP2016195439A; CN108365827B; HK1215108A1; WO2014179021A1; JP6436934B2; CN108365827A; US20160072467A1; JP5969727B2; EP2992605B1; CN105164918A; HK1222478A1; HK1258837A1

Abstract

公开了用于动态调整压缩器的阈值的系统、装置、方法和计算机可读存储介质的示例。处理具有多个频带分量的输入音频信号。可以确定时变阈值。压缩器对每个频带分量执行具有对应时变阈值的压缩运算，以产生增益。每个增益应用于受延迟的对应频带分量，以产生受处理的带分量，其相加以产生输出信号。在一些实现方式中，例如使用失真能听度模型来确定输出信号的感知谱的时变估计以及由感知谱估计引起的失真谱的时变估计。可以预测在存在感知谱估计的情况下的失真谱估计的能听度测量，并且将其用于调整时变阈值。

Description

具有动态阈值的频带压缩

相关申请的交叉引用

该专利申请要求2013年4月29日Alan J.Seefeldt提交的题为“DistortionReducing Multi-band Compressor with Dynamic Thresholds based on a DistortionAudibility Model”的共同未决和共同受让美国临时专利申请No.61/817,175(代理人案号No.D13064USP1)的优先权，出于所有目的通过引用而完整合并到此。

技术领域

该专利申请总体上涉及音频呈现，具体地说，涉及在呈现期间的失真减小。

背景技术

一些音频回放设备(如智能电话和平板设备)包括具有有限输出能力的放大器和扬声器。在这些设备中，音频回放可能在感知上是失真的，并且一般随着回放级别在呈现期间增加而强烈地失真。失真的特性一般对于回放设备是频率依赖性的。例如，当在特定频率处的输出信号达到或超过特定级别时，电视柜可能在受激发的特定频率处展现谐振响应，产生恼人的震颤。

多带压缩可以在回放之前应用于音频信号，以减少失真并且尝试最大化回放设备上的回放级别。为信号的每个频带指定失真阈值。压缩器将独立增益应用于每个带，以确保每个带中的信号级别不超过对应失真阈值。

发明内容

所公开的是实现用于响应于输入音频信号而动态调整压缩器的阈值的技术的系统、装置、方法和计算机可读存储介质的一些示例。在一些实现方式中，处理具有多个频带分量的输入信号。可以根据所述频带分量来确定时变阈值。每个时变阈值通常与相应的频带分量对应。压缩器对每个频带分量执行具有对应时变阈值的压缩运算，以产生多个增益，其中，每个增益与各个频带分量对应。每个增益应用于受延迟的对应频带分量，以产生多个受处理的频带分量，其被相加以产生输出信号。

在一些实现方式中，确定所述输出信号的感知谱的时变估计。此外，例如，根据失真模型的响应来确定感知谱估计所引起的失真谱的时变估计。预测在存在感知谱估计的情况下的所述失真谱估计的能听度测量。可以根据所预测的能听度测量来调整所述时变阈值。

在一些实现方式中，预测所述能听度测量包括：根据感知谱估计来计算掩蔽阈值；确定失真谱估计与掩蔽阈值之间的差值；以及把所确定的差值的正数值相加，以产生预测的能听度测量。可以基于感知谱估计参照调性谱来计算所述掩蔽阈值。所述调性谱包括区分类似噪声的频带分量与类似音调的频带分量的调性值。所确定的差值的相加的正数值可以加权以使得一个或更多个上频带分量和一个或更多个下频带分量具有比上频带分量与下频带分量之间的频带分量更低的权重。

在一些实现方式中，至少部分地根据固定标称阈值来确定时变阈值。因此，可以根据对应频带分量并且根据相应的固定阈值来确定每个时变阈值。在这些实现方式中，可以归一化失真的所预测的能听度测量。可以参照一个或更多个固定阈值并且根据应用于偏移值的归一化的能听度测量来提升或降低所述时变阈值。

在一些实现方式中，用于响应于输入音频信号而动态调整压缩阈值的装置包括：一个或更多个控制器，可操作为使得一些或所有上述操作得以执行。此外，该装置可以包括：滤波模块，能够对所述输入信号进行滤波，以产生所述频带分量；以及多带滤波器，包括多个带通滤波器，其中，每个带通滤波器与相应的频带分量相对应。所述装置可以还包括：一个或更多个放大器，被耦合以接收并且放大所述输出信号，以产生放大的输出信号；以及一个或更多个扬声器，被耦合以接收并且播放放大的输出信号。

在一些实现方式中，非瞬时计算机可读存储介质存储可由计算设备运行以使得一些或所有上述操作得以执行的指令。计算设备的非限定性示例包括服务器和台式计算机以及便携式手持设备(如智能电话、平板设备、膝上型设备、便携式音乐播放器等)。在一些实例中，一个或多个服务器可以被配置为使用所公开的技术中的一个或更多个来处理输入音频信号，并且作为基于云的服务的一部分而在互联网上把被处理的输出信号组流传送到用户的设备。

附图说明

所包括的附图目的是说明性的，并且仅用于提供用于所公开的本发明的系统、装置、方法和计算机可读存储介质的可能结构和操作的示例。这些附图绝非限制本领域技术人员在不脱离所公开的实现方式的精神和范围的情况下可以进行的形式和细节方面的任何改变。

图1示出根据一些实现方式的包括用于响应于输入音频信号而动态调整压缩器的阈值的失真能听度模型(DAM)的压缩器100的示例。

图2示出根据一些实现方式执行的用于响应于输入音频信号而动态调整压缩器的阈值的方法200的示例。

图3示出根据一些实现方式执行的用于响应于输入音频信号而动态调整压缩器的阈值的方法300的另一示例。

图4示出根据一些实现方式执行的用于在存在感知谱估计的情况下预测失真谱估计的能听度测量的方法400的示例。

图5A示出根据一些实现方式的显示器设备上所显示的输入音频信号的频带分量的能量级别的图形表示500A的示例。

图5B示出根据一些实现方式的显示器设备上所显示的由听者感知的所估计的输出信号谱的对应能量级别的图形表示500B的示例。

图6示出根据一些实现方式的用于呈现音频信号的包括压缩器100的回放系统600的示例。

具体实施方式

所公开的是实现用于响应于输入音频信号而动态调整压缩器的阈值的技术的系统、装置、方法和计算机可读存储介质的一些示例。一些所公开的技术包括失真能听度模型，以确定由多带压缩器可以应用的动态阈值。失真能听度模型被配置为在存在输入信号的情况下以依赖于动态信号的方式预测由该输入信号所引起的失真的感知能听度。这种所预测的能听度可以用于动态修改压缩器的阈值。包括所公开的技术的一些设备和系统因此能够在最小感知失真的情况下增加回放级别。

在一些实现方式中，失真能听度模型被配置为预测听者所收听到的信号谱的时变估计以及该信号所引起的失真谱的时变估计。失真能听度模型然后在存在信号谱估计的情况下预测该失真谱估计的能听度。以此方式，可以相应地动态调整压缩器的一个或更多个时变阈值。

用于动态调整压缩阈值的所公开的技术可以结合其它压缩处理而得以使用，并且可以实现于各种设备和系统(如智能电话、平板设备、膝上型计算机、便携式音乐播放器、电视、监视器以及基于服务器的系统)中。

实现所公开的技术的一些设备和系统在传统多带压缩器上改进，其显著地改动音色——听者感知的属性，其中，相等响度和音程的两种声音可以感知为不相似。当特定频率达到失真阈值而其它频率未达到时，一些传统压缩器因改动这些频率之间的相对平衡而引入缺点。所得声音显现为畸变，导致不自然的收听体验。

此外，如果增益过度地强势，则可能不必要地减少回放级别。如果每个带中的阈值被设置以消除用于在该带处居中的窄带信号的感知失真，则源自穿过压缩器的宽带信号的衰减一般多于在感知上消除任何所引起的失真所要求的衰减。这归因于这种事实：宽带信号可以大大掩蔽宽带信号引起的一些失真，而窄带信号在掩蔽其所引起的失真时可能是远更无效的。

图1示出根据一些实现方式的包括用于响应于输入音频信号而动态调整压缩器的阈值的失真能听度模型(DAM)的压缩器100的示例。在图1中，以滤波器组104为形式的滤波模块接收输入音频信号x[n]。滤波器组104被配置为对输入信号x[n]进行滤波，以将输入信号x[n]分离为多个频带分量x₁[n]-x_B[n]。在一些实现方式中，滤波器组104被配置作为实现为B个带通滤波器的多带滤波器，其中，每个带通滤波器与各个频带分量对应。例如，滤波器组104的每个带b可以被配置为输出如等式1所表示的那样被计算为与带通滤波器响应h_b[n]卷积的输入信号x[n]的频带分量x_b[n]：

x_b[n]＝h_b[n]*x[n],b＝1…B (1)

在图1中，DAM 108具有被耦合以接收从滤波器组104输出的频带分量x₁[n]-x_B[n]的输入。提供给DAM 108的每个频带分量x_b[n]与各个固定压缩阈值L_b配对，如图1所示。DAM108被配置为计算并且输出时变阈值D₁[n]-D_B[n]。在一些实现方式中，每个时变阈值D_b[n]被计算为各个频带分量x_b[n]的函数。在一些其它实现方式中，并非对于每个带独立地计算，每个时变阈值D_b[n]被计算为跨过带b＝1……B的所有频带分量x₁[n]-x_B[n]和固定阈值L_b的函数，如等式2所表示的那样：

D_b[n]＝DAM({x_i[n],L_i|i＝1...B}) (2)

每个频带分量x_b[n]连同表示该带b中的信号在其之上将开始产生失真的级别的各个时变阈值D_b[n]一起被提供作为对压缩函数(CF)112_b的输入。每个压缩函数112_b被配置为处理频带分量x_b[n]和时变阈值D_b[n]，以产生时变增益g_b[n]，其表示用于将带b保持在其限制阈值L_b之下的增益，如等式3中所表示的那样：

g_b[n]＝CF(x_b[n],D_b[n]) (3)

通过相加所有频带分量x₁[n]-x_B[n]的延迟版本乘以它们的对应增益信号g₁[n]-g_B[n]来计算受处理的输出信号y[n]。在图1中，乘法器单元116被配置为将增益信号乘以延迟的频带分量，即y_b[n]＝g_b[n]x_b[n-d]，以产生受处理的带分量y₁[n]-y_B[n]，其然后在相加单元120处相加以产生输出信号y[n]。例如，延迟d可以被设计为考虑与增益信号的计算关联的任何处理延迟。等式4示出生成受处理的信号y[n]的表示：

图2示出根据一些实现方式执行的用于响应于输入音频信号而动态调整压缩器的阈值的方法200的示例。参照图1的示例来描述图2。在图2的204，如上所述，接收频带分量x₁[n]-x_B[n]作为对DAM 108的输入。在208，DAM 108根据频带分量x₁[n]-x_B[n]来确定时变阈值D₁[n]-D_B[n]。在212，每个CF 112_b被配置为使用对应的时变阈值D_b[n]来对于对应的频带分量x_b[n]执行压缩运算，以产生增益g₁[n]-g_B[n]。在216，每个增益g_b[n]例如使用乘法器单元116而应用于对应的频带分量x_b[n]的延迟版本，以产生受处理的带分量y₁[n]-y_B[n]。在220，受处理的带分量y₁[n]-y_B[n]在相加单元120处相加，以产生输出信号y[n]，其可以然后存储在存储器设备中和/或提供给附加的处理模块。

图3示出根据一些实现方式执行的用于响应于输入音频信号而动态调整压缩器的阈值的方法300的另一示例。方法300的操作304-320基本上与上述方法200的操作204-220相同。在图3中，在生成输出信号y[n]之后，在324，可以估计听者所收听到的输出信号y[n]的功率谱的时变估计。为此，平滑运算可以应用于受处理的带分量y₁[n]-y_B[n]。例如，可以通过快速起音/慢速释放(fast-attack/slow-release)单极点平滑器来平滑每个受处理的带分量y_b[n]＝g_b[n]x_b[n-d]。s_b[n]表示听者所感知的输出信号谱的估计，并且在等式5中计算：

为了减少出自压缩阈值的随后调制的假声，在一些实例中，可以期望利用比等式5中所使用的稍微更快的攻击和稍微更慢的释放时间，以用于掌控增益g₁[n]-g_B[n]的起音和释放。在这些实例中，可以按分贝(dB)为单位来表示听者所感知的所估计的输出信号谱，如等式6所示：

S_b[n]＝10log₁₀(s_b[n]) (6)

在图3中，在328，确定由感知谱估计s_b[n]所引起的失真谱的时变估计。例如，可以通过将s_b[n]馈送到失真生成模型中来估计s_b[n]在回放系统中所引起的失真。可以通过测量并且表征单独回放系统来生成该模型。在一些情况下，用于具有小扬声器的设备的通用模型是足够的，并且假设带b中的信号将在带b中的信号级别之下的某固定偏移的级别处引起进入包括b以及在b之上的所有带的失真。

在一些实现方式中，在任何给定带中的失真谱估计是通过生成到该带中的失真的在所有带上的最大值来给出的。因此，第一频带分量的第一估计失真可以被确定为到第一频带分量中并且到比第一频带分量更高的频率的频带分量的至少一部分中引起的失真的最大值。这是因为，任何单个带通常产生包括到自身并且大于自身的带中的失真。可以如等式7中所示那样以从最低带到最高的顺序方式来计算充当结合图1和图2以上描述的时变阈值的失真谱估计D₁[n]-D_B[n]，其中，用于固定偏移的值D_offset的示例是40dB：

D₁[n]＝S₁[n]-D_offset (7)

D_b[n]＝max{D_b-1[n],S_b[n]-D_offset} b＝2...B

在图3中，在332，例如，使用图1的DAM 108预测在存在感知谱估计s_b[n]的情况下的失真谱估计D_b[n]的能听度测量。如下所述，图4示出用于预测该能听度测量的技术的示例。

在图3中，在336，根据所预测的能听度测量A[n]来调整时变阈值中的一个或更多个。在一些实现方式中，所预测的能听度测量A[n]被归一化，并且参照固定阈值L_b中的一个或更多个而且根据应用于偏移值的归一化能听度测量来提升或降低时变阈值D_b[n]中的一个或更多个。例如，所预测的能听度测量可以归一化于0至1之间，然后被利用以调整时变阈值D₁[n]-D_B[n]，如等式8所示：

在等式8的示例中，归一化限制被选取，以使得当归一化的所预测的能听度测量A_norm[n]等于0时，所引起的失真良好地受输出信号掩蔽，并且当A_norm[n]等于1时，失真处于能听度的边沿。因此，当A_norm[n]等于0时，时变阈值D₁[n]-D_B[n]可以得以提升，以允许更响的回放，但当A_norm[n]等于1时，阈值D₁[n]-D_B[n]保持在其标称值。故此，可以根据下式从固定阈值L_b来计算阈值D₁[n]-D_B[n]：

D_b[n]＝L_b+(1-A_norm[n])L_offset (9)

在等式9中，当A_norm[n]等于零时，阈值D_b[n]在其标称值之上提升达L_offset dB。在一种情况下，将L_offset设置在6dB的范围中得到用于宽带信号的感知响度的感知上实质性的增加，而没有所感知的失真的增加。在其它情况下，对于特定回放设备修整L_offset。

图4示出根据一些实现方式的用于在存在感知谱估计的情况下预测失真谱估计的能听度测量的方法400的示例。在404，据感知谱估计s_b[n]计算掩蔽阈值M_b[n]。用于掩蔽阈值M_b[n]的一个模型是在感知谱估计之下的固定偏移M_offset，如等式10所示，其中，用于M_offset的值的示例是10dB：

M_b[n]＝S_b[n]-M_offset (10)

替代地，可以使用掩蔽模型，掩蔽模型根据掩蔽信号的调性来考虑掩蔽的变化性。通常已知的是，类似音调的信号的掩蔽能力显著小于类似噪声的信号。因此，可以基于s_b[n]参照调性谱来计算掩蔽阈值M_b[n]。调性谱包括区分类似噪声的频带分量与类似音调的频带分量的调性值。可以使用已知的技术来表征每个带中的s_b[n]的调性，以生成调性谱T_b[n]，其中，T_b[n]从0到1变化。0指示类似噪声的信号，1表示类似音调的信号。利用该调性谱，可以如等式11所表示的那样计算掩蔽阈值：

M_b[n]＝S_b[n]-(T_b[n]M_tone+(1-T_b[n])M_noise) (11)

在一种测试情况下，M_tone＝30dB并且M_noise＝10dB是适当值的示例，从而得到比类似噪声的信号小20dB的用于音调信号的掩蔽。

在图4中，在408，在各带上对失真谱估计D_b[n]与掩蔽阈值M_b[n]进行比较，以确定D_b[n]与M_b[n]之间的任何差值。在412，所确定的差值的任何正数值相加，以产生所预测的能听度测量A[n]。在一些实现方式中，A[n]被计算为D_b[n]与M_b[n]之间的差值的正数值的加权和，如等式12所示：

在等式12中，在一些实现方式中，可以针对比中频带更少地加权的高频带和低频带在感知上激励加权W_b。

在一些其它实现方式中，并非利用显式失真生成和掩蔽模型，可以反而据信号谱S_b[n]的函数来推导失真能听度的测量。一个这样的示例是该谱的在各带上的标准差，如等式13所示：

当标准差很低时，所有带的值大致相同，说明S_b[n]大致是宽带的。在此情况下，S_b[n]应适度良好地掩蔽失真。如果标准差相对较高，则S_b[n]的值显著变化，以指示失真将是可听的谱中的可能“空洞”。因此，等式13中的值A[n]非常粗略地匹配等式12中的值A[n]的行为。来自等式13的能听度值可以然后使用与关于失真生成和掩蔽模型所使用的不同的归一化限制根据等式8而得以归一化，并然后如等式9中那样得以利用，以调整阈值D_b[n]。

图5A示出根据一些实现方式的在显示器设备上所显示的输入音频信号的频带分量的能量级别的图形表示500A的示例。图5B示出根据一些实现方式的在显示器设备上所显示的由听者感知的所估计的输出信号谱的对应能量级别的图形表示500B的示例。

在图5A和图5B的示例中，图1的压缩器100如上所述处理输入音频信号x[n]。在图5A中，输入信号的二十个频带分量x₁[n]-x₂₀[n]通过图1的滤波器组104生成，并且被分隔开达人类听力的模仿(mimic)感知分辨率。馈送图1的压缩函数112的每个频带分量x_b[n]的信号能量由图5A中的条504表示。如上所述计算的用于每个频带分量的时变阈值D₁[n]-D₂₀[n]由空白分段508表示。从压缩函数112输出的增益g₁[n]-g₂₀[n]由分段512描述。

在图5B中，感知谱估计S₁[n]-S₂₀[n]的能量级别由条514表示。据上述的感知谱估计s_b[n]计算出的掩蔽阈值M₁[n]-M₂₀[n]在图5B中由分段516表示。由图1的DAM 108所生成的时变阈值D₁[n]-D₂[n]在图5B中由空白分段520表示。在图1中，在存在通过压缩器100播放音频信号的情况下在听者将感知任何所引起的失真之前，DAM108将图5B的时变阈值D₁[n]-D₂₀[n]520增加到最大可能级别。通常，对于宽带信号，时变阈值D₁[n]-D₂₀[n]将增加到它们的标称地设置的级别L_b之上，这是因为信号自身将掩蔽任何所引起的失真的非常重要的部分。对于窄带信号，时变阈值将很可能保留在它们的标称级别附近，这是因为信号将提供任何所引起的失真的很少掩蔽。

图6示出根据一些实现方式的用于呈现音频信号的包括压缩器100的回放系统600的示例。在图6中，控制器604被配置为实现上述的压缩器100。例如，以上参照图2-图4所描述的操作中的一个或更多个可以被控制器604执行或被使得由控制器604执行。控制器604可以具有各种不同配置，如以下更详细地解释的那样。此外，控制器604在图6的情况下可以在用户设备上实现，或在一些情况下，在一个或更多个服务器上实现。

在对于图6所示的示例的替选示例中，实现控制器604的服务器可以在合适的网络上将音频组流传送到用户的设备。本领域技术人员应理解，该网络提供服务器与用户设备(如智能电话或平板设备)之间的通信。网络可以是各种网络环境的任何子集或组合，包括例如基于TCP/IP的网络、电信网络、无线网络、缆线网络、公共网络、私有网络、广域网、局域网、互联网、World Wide Web、内部网、外部网等。

返回图6，回放系统600包括数模转换器(DAC)608，数模转换器(DAC)608被耦合为从压缩器100接收输出信号y[n]并且将y[n]转换为模拟信号。虽然DAC 608在该示例中被实现为控制器604的一个处理模块，但本领域技术人员应理解，DAC 608可以被构建为相对于控制器604的分离单元，并且在一些实例中，构建为相对于控制器604所处的服务器或用户的设备的分离设备。

在图6中，预放大器612被耦合为接收并且拉升由DAC 608所输出的模拟信号的信号强度。可以使用各种类型的预放大器，如电流灵敏预放大器、寄生电容预放大器、电荷灵敏预放大器或其某种组合。本领域技术人员应理解，在一些替选示例中，可以从系统600中省略预放大器612。

在图6中，功率放大器616被耦合以接收并且放大来自预放大器612的所拉升的信号，以产生适合于驱动一个或更多个扬声器620的放大的输出信号。在从系统600省略预放大器612的情况下，功率放大器616可以用集成放大器替换。系统600的放大器和扬声器可以是如上所述的用户的设备的组件。在一些实现方式中，与用户的设备集成的或处于连接到用户的设备的分离设备的形式的显示器可以被控制，以显示展示输出信号的频带以及表征该信号的其它信息(如图5A和图5B中所呈现的信息)的图形数据。在一些其它情形中，图6的放大器612和扬声器620是公共地址(PA)系统、戏剧或音乐会声音系统或家用系统(如立体声或家庭影院系统)的一部分。

可以通过一个或更多个计算设备来实现在此所描述的技术。例如，专用计算设备的控制器可以硬连线，以执行所公开的操作或使得这些操作得以执行，并且可以包括持续地被编程以执行操作或使得操作得以执行的数字电子电路(如一个或更多个专用集成电路(ASIC)或现场可编程门阵列(FPGA))。在一些实现方式中，组合具有定制编程的定制硬连线逻辑、ASIC和/或FPGA以实现这些技术。

在一些其它实现方式中，通用计算设备可以包括合并有被编程以使得所公开的操作中的一个或更多个被依照固件、存储器、其它存储体或其组合中的程序指令而执行的中央处理单元(CPU)的控制器。通用计算设备的示例包括服务器、网络设备和用户设备(如智能电话、平板设备、膝上型设备、台式计算机、便携式媒体播放器、其它各种便携式手持设备)以及任何其它包括数据处理硬件和/或程序逻辑的设备，以实现所公开的操作或使得操作得以实现并且执行。计算设备可以包括监视器、打印机、或其它合适的用于将在此所提及的任何结果提供给用户的显示器。

在此使用的术语“存储介质”和“存储媒介”指代存储使得计算机或机器的类型以特定方式操作的数据和/或指令的任何介质。在此所描述的任何模型、模块、单元、引擎和操作可以实现为可由控制器的处理器使用任何合适的计算机语言运行的软件代码或被使得由其实现。软件代码可以存储为用于存储和/或传输的计算机可读介质上的一系列指令或命令。合适的计算机可读介质的示例包括随机存取存储器(RAM)、只读存储器(ROM)、磁介质(如硬驱或软盘)、光学介质(如压缩盘(CD)或DVD(数字多功能盘))、固态驱动器、闪存、以及任何其它存储器芯片或盒。计算机可读介质可以是这些存储设备的任何组合。以软件/程序代码所编码的计算机可读介质可以随兼容设备(如上述用户设备或服务器)一起封装或与其它设备分离地提供。任何这些计算机可读介质可以驻留在单个计算设备或整个计算机系统上或其中，并且可以处于系统或网络内的其它计算机可读介质当中。

存储介质不同于传输介质，但可以与传输介质结合而被使用。传输介质参与在存储介质之间传递信息。例如，传输介质包括同轴电缆、铜线和光纤。传输介质也可以采用如在无线电波和红外数据通信期间生成的声波或光波的形式。

尽管在此参照特定计算范例和软件工具，但所公开的技术不限于硬件和软件的任何特定组合，也不限于用于由计算设备或数据处理装置所运行的指令的任何特定源。各种实现方式所基于的程序指令可以与各种编程语言、软件工具和数据格式中的任一种对应，并且存储于任何类型的非瞬时计算机可读存储介质或存储器设备中，并且可以在单机计算设备上根据各种计算模型(包括例如客户机/服务器模型、点对点模型)或根据其中可以在不同位置处作用或采用各种功能的分布式计算模型而运行。此外，在此对特定协议的引用仅是示例的方式。可以采用本领域技术人员已知的合适的替代方式。

还应注意，在此所使用的术语“扬声器”可以仅通过示例的方式包外放扬声器(包括外壳中安装的直接辐射电动态驱动器)、喇叭外放扬声器、压电扬声器、磁致伸缩扬声器、静电外放扬声器、带和平面磁外放扬声器、弯曲波外放扬声器、平坦板外放扬声器、分布模式外放扬声器、Heil空气运动换能器、等离子体弧扬声器、数字扬声器及其任何组合。

虽然已经参照该申请的具体实现方式特别地示出并且描述了其主题内容，但本领域技术人员应理解，在不脱离本公开的精神和范围的情况下，可以进行所公开的实现方式的形式和细节的改变。附图中示出这些实现方式中的一些的示例，阐述具体细节以提供其透彻理解。应注意，可以在没有一些或所有这些具体细节的情况下实践这些实现方式。此外，为了提高清楚性，尚未详细描述公知特征。最后，虽然在此已经参照一些实现方式讨论了优点，但应理解，范围不应受限于对这些优点的讨论。而是应参照所附权利要求来确定范围。

Claims

1.一种用于响应于输入音频信号来动态调整压缩器的阈值的方法，所述方法包括：

接收具有多个频带分量的输入音频信号；

根据所述多个频带分量来确定多个时变阈值，每个时变阈值与相应的频带分量相对应；

通过压缩器对每个频带分量执行具有对应的时变阈值的压缩运算以产生多个增益，每个增益与相应的频带分量相对应；

将每个增益应用于受延迟的对应的频带分量，以产生多个被处理的频带分量；

把被处理的频带分量相加以产生输出信号；

确定所述输出信号的感知谱的时变估计；

确定由感知谱的时变估计所引起的失真谱的时变估计；

在存在感知谱的时变估计的情况下预测失真谱的时变估计的能听度测量；以及

根据所预测的能听度测量来调整所述时变阈值中的一个或更多个。

2.如权利要求1所述的方法，其中，根据失真模型对所述感知谱的时变估计的响应来确定所述失真谱的时变估计。

3.如权利要求2所述的方法，其中，所述失真谱的时变估计包括第一频带分量的第一估计失真，所述第一估计失真被确定为被引起进入所述第一频带分量中并且进入比所述第一频带分量更高频率的频带分量的至少一部分中的失真的最大值。

4.如权利要求1所述的方法，其中，确定感知谱的时变估计包括：

将平滑运算应用于被处理的频带分量。

5.如权利要求1所述的方法，其中，在存在所述感知谱的时变估计的情况下预测所述失真谱的时变估计的能听度测量包括：

根据感知谱的时变估计来计算掩蔽阈值；

确定所述失真谱的时变估计与所述掩蔽阈值之间的差值；以及

把所确定的差值的正数值相加，以产生预测的能听度测量。

6.如权利要求5所述的方法，其中，所述掩蔽阈值是基于感知谱的时变估计参照调性谱来计算的，所述调性谱包括区分噪声的频带分量与音调的频带分量的调性值。

7.如权利要求5所述的方法，其中，所确定的差值的相加的正数值被加权以使得一个或更多个上频带分量和一个或更多个下频带分量具有比上频带分量与下频带分量之间的频带分量更低的权重。

8.如权利要求1所述的方法，其中，根据多个固定阈值来进一步确定所述时变阈值。

9.如权利要求8所述的方法，其中，根据频带分量并且根据所述多个固定阈值来确定每个时变阈值。

10.如权利要求8所述的方法，其中，根据对应的频带分量并且根据相应的固定阈值来确定每个时变阈值。

11.如权利要求8所述的方法，还包括：

归一化所预测的能听度测量；以及

参照所述固定阈值中的一个或更多个并且根据应用于偏移值的归一化的能听度测量来提升或降低所述时变阈值中的一个或更多个。

12.如权利要求1所述的方法，还包括：

在存储介质上存储所述输出信号的数据。

13.一种用于响应于输入音频信号来动态调整压缩阈值的装置，所述装置包括：

一个或更多个控制器，能操作为使得执行如权利要求1所述的方法。

14.如权利要求13所述的装置，其中，所述一个或更多个控制器进一步能操作为使得执行如权利要求2-12中的一项或更多项所述的方法。

15.如权利要求13所述的装置，还包括：

滤波模块，能够对所述输入音频信号进行滤波以产生所述多个频带分量。

16.如权利要求15所述的装置，其中，所述滤波模块包括：

多带滤波器，包括多个带通滤波器，每个带通滤波器与相应的频带分量相对应。

17.如权利要求13所述的装置，还包括：

一个或更多个放大器，被耦合以接收所述输出信号，所述一个或更多个放大器能够放大所述输出信号以产生放大的输出信号；以及

一个或更多个扬声器，被耦合以接收并且播放放大的输出信号。

18.如权利要求17所述的装置，还包括：

显示器设备，被耦合以接收所述输出信号或放大的输出信号，所述显示器设备能够显示与所接收到的信号相关联的图形数据。

19.一种非瞬时计算机可读存储介质，存储能由计算设备运行以使得执行用于响应于输入音频信号来动态调整压缩器的阈值的方法的指令，所述方法包括如权利要求1所述的方法。

20.如权利要求19所述的非瞬时计算机可读存储介质，其中，所述用于响应于输入音频信号来动态调整压缩器的阈值的方法还包括如权利要求2所述的方法。