CN103248982B

CN103248982B - 基于信号响度调适信号增益时的峰值检测

Info

Publication number: CN103248982B
Application number: CN201310042064.3A
Authority: CN
Inventors: W.赫斯; F.贝伦
Original assignee: Harman Becker Automotive Systems GmbH
Current assignee: Harman Becker Automotive Systems GmbH
Priority date: 2012-02-01
Filing date: 2013-02-01
Publication date: 2018-07-03
Anticipated expiration: 2033-02-01
Also published as: JP6067391B2; CN103248982A; EP2624449A1; EP2624449B1; JP2013162517A; US20130195279A1; US9219455B2

Abstract

本发明的多种实施方案涉及用于调适信号增益的系统，其包括峰值检测器(36)，其被配置来接收包含连续信号块的音频输入信号(18)以及动态地建立音频输入信号(18)的当前输入信号级；以及响度确定单元(31)，其被配置来基于人类听力的心理声学模型动态地确定音频输入信号(18)的当前信号块的被感知的响度。此外，该系统还包括时间常数生成单元(32)，其被配置来基于当前信号块的被感知的响度和先前信号块的被感知的响度确定时间常数，其中该时间常数描述信号增益的变化。增益确定单元(35)被配置来基于时间常数和当前输入信号级确定针对当前信号块的信号增益。

Description

基于信号响度调适信号增益时的峰值检测

技术领域

本发明的多种实施方案涉及用于调适信号增益的方法和用于调适信号增益的系统。

背景技术

在本领域中，已知有很多不同的包含音乐和/或语音的音频信号源。音乐信号可以存储在CD、DVD或任何其它存储介质上。特别是随着新型压缩方案（如MPEG）的发展，具有不同体裁和艺术家的音频信号存储在存储介质上，并且可与将向用户全部播放的播放清单组合。

在车辆环境中，乘客所感知的音频信号包含音频信号自身和路面轮胎噪声、空气动力噪声以及引擎噪声。不同音频源的不同音频信号通常具有不同的信号和动态压缩级。通常，音频信号的不同轨道具有不同的信号级范围，其被用户感知为具有不同的响度级。甚至有可能音频信号的一个轨道覆盖很宽的信号级范围，例如，在古典音乐中就可能出现这种情况。

特别是在车辆环境中，所接收的音频信号应该始终可由用户感知，这意味着其应该最好在任何时候都超过车辆中出现的噪声。当音频输出信号级的部分低于噪声级时，其变得过于安静。然而，平均音频输出级的静态增长可导致强烈增加的最大信号级。同时，最大音频信号级不应该超过一定级别，在该级上可能会发生用户听力损伤或用户的感知是痛苦或分散注意力的。

已知允许基于被感知的响度动态地调适音频输出信号的增益的方法。然而，如果响度在短时间尺度内变化，则这些方法不提供必要的可调适性以跟上响度的快速变化。

发明内容

因此，存在允许对车辆中的音频信号的响度级进行动态和自动校正的需求。

这种需求由独立权利要求的特征来满足。在独立权利要求中，描述了本发明的实施方式。

根据第一个方面，提供了一种调适信号增益的方法。该方法包括接收包含连续信号块的音频输入信号和建立音频输入信号的当前输入信号级。该方法还包括使用音频输入信号的当前信号块内的信号级范围基于人类听力的心理声学模型确定音频输入信号的当前信号块的被感知的响度。该方法还包括基于时间常数和当前输入信号级确定当前信号块的信号增益，其中该时间常数描述信号增益从某一个信号块到另外一个信号块的变化，并且其中基于当前信号块的被感知的响度和先前信号块的被感知的响度确定该时间常数。该方法还包括用所确定的信号增益来放大音频输入信号以获得音频输出信号。

通过基于时间常数以及当前输入信号级确定信号增益，可有可能根据输出信号级来确定信号增益。可从输入信号级和信号增益预测输出信号级。

每个信号块可包含预定数量的数字采样，例如，64、256或1024个数字采样。数字采样可与确定当前信号级的数字值相关。换句话说：当前信号级可指定义音频输入信号的最小信息片的信号级。可是，一般可能组合这些数字采样中的一些用于所述建立当前输入信号，例如，5或10或30个数字采样或信号块的数字采样。通过确定信号块的被感知的响度，可有可能获得对被感知的响度的良好估计以及检测到暂停等（其中显著存在信号噪声）。这是因为当确定被感知的响度时，一定数量的数字采样可用来确定。换句话说，数字响度的计算可依赖于一定数量的数字采样的信号范围和特性，即，依赖于一些平均的统计数据。例如，当确定响度时，在一个信号块中可考虑256个数字采样。从而，信号级的极快变化或短的峰值可能不会严重影响被感知的响度。

应该理解，响度的确定和时间常数的确定可针对包含不同数量的数字采样的信号块。例如，可针对包含256个采样的块确定响度，而针对包含1024个采样的块确定时间常数。例如，对于这四个较小块（256个采样）的响度的平均值或加权平均值可用来确定对于相应的较大块（1024个采样）的时间常数。这可在确定时间常数时将延迟时间引入系统。

基于时间常数并且基于当前输入信号级确定针对当前信号块的信号增益可涉及：将时间常数用作输入并将当前输入信号级用作进一步的输入来确定针对当前信号块的信号增益。换句话说：直接影响信号增益的所述确定的参数可能是时间常数和当前输入信号级。

随后，例如，可确定信号增益使得音频输出信号的输出信号级总是小于预定的阈值。可定义预定的阈值以满足音频信号的数字处理所施加的要求。具体来讲，数字处理音频信号可对于最大可实现的信号级施加限制。通常，可提供数字净空以满足音频输出信号的信号级不超过0分贝全量程（0dBFS）的要求，分贝全量程意指相对于系统可以表示的最大振幅的分贝数。此外，可定义预定的阈值以不超过用户选择的最大声压或设定预定的阈值以避免听力损害或分散注意力。

根据该方面的方法还可包括确定时间常数。

具体来讲，可使用上升时间常数以获得音频输出信号的两个连续信号块之间的提高的信号增益，并可使用下降时间常数以获得音频输出信号的两个连续信号块之间的降低的信号增益。通过使用上升和下降时间常数，会有可能调适从信号块到信号块的信号增益使得实现音频输出信号的平均响度。

可以对一定数量的信号块平均得到的音频输出信号的平均输出信号级等于预定的值的方式确定信号增益。这可对应于等于预定的响度的预定的值的音频输出信号的平均响度。例如，音频输入信号可包含具有很小响度值的通路和具有很大响度值的其它通路，即，音频输入信号可具有信号级的大动态范围。在诸如车辆的环境中，可能存在大的诸如来自该环境的噪声的背景信号。如果存在大的噪声级，用户可能难以感知具有低响度的音频信号的通路。因此，通过使用上升和下降时间常数以调适信号增益使得实现音频输出信号的预定的响度，音频输出信号可更适于在有背景噪声的环境中播放。

例如，用户可根据其需求指定预定的值和/或预定的响度。此外，可有可能调适基于时间常数确定信号增益的程度。也可有可能根据各种参数（如背景信号级，这意指噪声级、车辆种类、车辆的行驶速度、有无导航指令等）自动确定预定的值。可通过确定时间常数使得如果当前信号块的信号级低于预定的值则使用上升时间常数且相应地如果该信号级高于预定的值则使用下降时间常数来实现平均输出信号级并因此实现平均响度。如果当前信号级与预定的值的偏差更大，则由时间常数提供的绝对信号增益变化可更大。

应该理解，用户可有可能经由专用音量调节装置调节总音量级。这种音量调节可例如放大信号处理序列中下游的音频输出信号。因而，基于时间常数和当前输入信号级确定信号增益可涉及调适音频信号的动态范围，而调节音量可涉及在信号处理序列中下游的后处理步骤中的播放音量的总体和均匀的转变。

具体来讲，可以下降时间常数在连续信号块之间允许比上升时间常数更大的最大绝对信号增益变化的方式确定时间常数。通过限制如经由上升和下降时间常数来定义的音频信号的连续信号块之间的最大绝对信号增益变化，可有可能保留音频输出信号的动态范围，同时依然相应地调适音频输出信号的平均响度。例如，在音频输入信号的寂静部分（即，零信号级）期间，可以快速减小信号增益以不放大噪声。因而，可能有必要在寂静部分结束后经由上升时间常数来增大信号增益，以相应地放大音频输入信号，使得用户可感知其内容。而如果存在包含例如处于低信号级的音乐或语音的音频轨道的安静部分，则可经由上升时间常数增大信号增益以提供可听度。

根据当前方面的方法还可包括基于输入信号级和当前信号增益建立音频输出信号的估计的输出信号级。通过确定输入信号级和信号增益，可有可能在放大音频输入信号前建立输出信号级以获得音频输出信号。

如果估计的输出信号级高于预定的阈值，则可增大上升或下降时间常数可允许的最大绝对信号增益变化。如上所述，这可增加控制输出信号级时的灵活性。

根据当前方面的方法还可包括在将信号输出前将延迟时间包括到音频输入信号中，其中延迟时间与确定信号增益所需的时间相关。因为可能需要多种计算以确定信号增益，如确定音频输入信号的当前信号块的被感知的响度、建立音频输入信号的当前输入信号级、确定时间常数以及基于此确定信号增益，所以延迟可能是有利的，以便经由例如处理器的方式来执行全部这些计算。另一方面，可能需要限制延迟，因为伴随着更长的延迟时间，可能会出现更高的硬件要求，如存储器要求。此外，对于与视频源有关的播放，声音和视频的同步播放可能是必不可少的。因此，可能需要相对于两个相反趋势（即，用于信号分析的延迟时间，以及降低硬件要求）来优化延迟。

对于此方面，可进一步基于音频输入信号的信号统计数据确定被感知的响度。信号统计数据可确定音频输入信号的信号级的特定参数，如动态范围、信号级变化率、最大信号级、最小信号级，信号级直方图等，并基于这些参数确定被感知的响度。经由信号统计数据，可有可能检测到音频输入信号中的寂静暂停，例如，经由数字采样的值的某一分布。

根据另一个方面，提供了用于调适信号增益的系统。该系统包括峰值检测器，其被配置来接收包含连续信号块的音频输入信号以及动态地建立音频输入信号的当前输入信号级。此外，该系统包括响度确定单元，其被配置来使用音频输入信号的当前信号块的信号级范围基于人类听力的心理声学模型动态地确定音频输入信号的当前信号块的被感知的响度。该系统还包括时间常数生成单元，其被配置来基于当前信号块的被感知的响度和先前信号块的被感知的响度确定时间常数，其中该时间常数描述信号增益从一个信号块到另一个信号块的变化。此外，该系统包括增益确定单元，其被配置来基于时间常数和当前输入信号级确定针对当前信号块的信号增益。此外，该系统包括增益单元，其被配置来使用信号增益放大音频输入信号以获得音频输出信号。

对于具有此种配置的系统，可获得如相对于上述另一个方面所讨论的那样的效果。

附图说明

将参照附图进一步详细描述本发明。

图1示意性地图示了一种根据实施方案的用于调适信号增益的系统。

图1b示意性地图示了作为图1的系统的一部分的峰值检测器。

图2示意性地图示了图1的用于调适信号增益的系统的更详细的视图。

图3示意性地图示了用于调适信号增益的方法的时间常数。

图4示意性地图示了基于所确定的信号级和响度的信号增益的调适。

图5示意性地示出了车内声音的组成部分。

图6示意性地示出了具有已调适的信号增益的车内声音的组成部分。

图7是调适信号增益的方法的流程图。

具体实施方式

在下文中，将通过参照示例性实施方案和附图进一步详细解释本发明。所图示的实施方案涉及用于调适信号增益的技术。

在图1中，示出了一种系统，其允许调适信号增益。从音频源获得的音频输入信号18进入峰值检测器36。娱乐或音频输入信号18可以是2.0、5.1或7.1音频信号或其它格式。峰值检测器分析音频输入信号18以建立音频输入信号18的当前输入信号级。音频输入信号从峰值检测器36转发到音频信号分析单元30，在该音频信号分析单元30中使用人类听力的心理声学模型并使用信号静力学确定响度。

音频输入信号18还输入到包括增益单元41和延迟元件42的信号控制器40。可以使用用户接口50控制由增益单元41施加到音频输入信号以获得音频输出信号19的增益，其中可以确定是否或以何种程度将增益确定单元（未在图1中示出）所确定的增益用于音频输出信号19。例如，这可以对应于用户打开/关闭基于响度的信号增益确定的可能性。音频输出信号经由扬声器60输出或馈送到后处理阶段，例如，基于音量设定的均匀放大。

在图1b中，给出了峰值检测器36的更详细的视图。峰值检测器36包括处理器36d和用于接收音频输入信号18的接收接口36a。峰值检测器36还包括用于输出音频输入信号18的输出接口36b。此外，峰值检测器36包括接口36c。处理器36d被调适来建立音频输入信号18的当前输入级。例如，当前输入级可与当前数字采样的信号级相关或可与由一定数量的数字采样组成的当前信号块的最大信号级相关。此音频输入信号18经由接口36c输出。

转回到图1，在信号分析单元30中，指示了基于人类听力的心理声学模型确定响度。心理声学模型用来估计响度、声音的定位，以及确定噪声是否在音频输入信号中作为主要因素存在，例如，在暂停期间或在两条轨道之间。信号统计数据是用于确定是否带有噪声的暂停在音频信号中存在的第二个依据。举例来说，可以确定娱乐音频信号的信号强度。单独基于心理声学模型或基于其与统计信号模型的结合，可通过动态地确定调适时间常数来确定响度调适，如下文将相对于图2更详细地描述的。

尽管单独地讨论了图1的不同实体，但应该理解不同实体可组合在一个单元中。可将不同实体实施为硬件或软件或其组合。例如，峰值检测器36可以是信号控制器40或信号分析单元30的一部分。因而，图1b的接口36c可以是内部接口或可仅实施为软件代码。

在图2中，示出了音频信号分析单元30的更详细的视图。音频信号分析单元30包括估计接收到的音频输入信号的响度的响度确定单元31。响度确定单元31可以使用本领域中已知的方法以及如尤其在ITU-R BS 1770-1（“Algorithms to Measure Audio ProgramLoudness and to a Peak Audio Level”）中所描述的那样来确定响度。此外，响度确定单元31可使用人类听力的双耳模型来确定响度和确定当听到所述音频输入信号时用户是否以及在哪里可能将音频输入信号18定位。

这种双耳模型模拟音频输入信号的空间感知并允许确定是否音频输入信号主要包含噪声或任何其它输入信号，如音乐或语音。在EP 1 522 868 A1中、在文献W.Lindemann“Extension of a Binaural Cross-Correlation Model by Contralateral InhibitionI.Simulation of Lateralization for Stationary Signals”，美国声学学会期刊，1986年12月,1608-1622页,80(6)卷中或在W.Hess等人在音频工程学会大会论文，第115次大会，2003年10月中的文献“Acoustical Evaluation of Virtual Rooms by Means ofBinaural Activity Patterns”中更详细地描述了音频输入信号的定位。这种定位技术允许区别噪声与其它声音信号，并有助于避免当在音频输入信号中仅检测到噪声时此噪声连同增加的信号增益被输出。该技术还允许在检测到暂停时重新设定调适时间常数。

具体来讲，当确定响度时，可能需要在某个时段内（即，针对一定数量的数字采样）分析或处理音频输入信号18的信号级。因此，针对音频输入信号的信号块确定被感知的响度。每个信号块具有特定的持续时间，即，包含特定数量的信号采样。在一个实施方案中，信号块可具有1或2毫秒的持续时间，或包含例如256个采样。通过确定针对每个音频信号块的响度，延迟时间被引入到系统中。

此外，响度确定单元31可以额外地使用统计信号处理来检测信号暂停，即，其中仅存在噪声的信号块。这可以作为暂停检测单元33的一部分发生。在音频输入信号18的统计分析中，确定该音频输入信号的不同采样的实际信号级。举例来说，如果音频输入信号18的信号块的采样的信号级符合高斯分布，则可推断出信号块包含噪声而没有其它音频信号。这更详细地说明了确定针对一定数量的数字采样（即，信号块，在其中可获得统计数据）的响度的必要性。不会过度强调很短的峰值等。

音频信号分析单元30从而使用响度估计的结果来计算被引入到音频输入信号中的时间常数。在图2中，时间常数生成单元32表示时间常数的计算。时间常数指定信号增益从信号块到信号块或从一组相应的信号块到一组相应的信号块的变化。换句话说，分组成信号块的数字采样的数量对于响度的确定（例如，为256）和对于时间常数的计算（例如，为1024）可以不同。在任何情况下，由于信号块的形成，延迟时间均被引入到系统中。时间常数生成单元32耦接到增益确定单元35。

在图2的实施方案中，响度确定单元31、时间常数生成器32、暂停检测单元33和增益确定单元35作为单独的单元被示出。然而，本领域的技术人员应该清楚，不同的单元可合并成较少的单元并且这些单元可组合在几个单元或甚至一个单元中。此外，可通过硬件元件或通过软件或通过硬件和软件的组合来设计信号分析单元。

增益确定单元35基于时间常数确定用来放大音频输入信号18的信号增益。响度确定单元31通过提供分贝响度等价物(dBLEQ)来提供针对音频输入信号的某一部分（例如，包含几个采样的信号块）的响度。确定增益使得当输出音频信号时实现预定的响度，例如如图6的下部中所示出的-12分贝。这里，相对于参照响度（例如在特定参照设定下的1k赫兹正弦信号的响度）来指定响度。这可以定义dBLEQ量程。

配置时间常数使得从信号块到信号块的最大绝对信号增益变化被限制。这样做是为了提高如用户所感知到的音频质量。例如，可保留快速信号动态（例如，快节奏等），同时使用较高的信号增益来放大低响度的相对长的通路。换句话说，保留快速动态，同时基于响度的信号增益调适针对慢信号动态。由于受到限制的最大绝对信号增益变化，时间常数进一步将延迟时间引入到系统中。

因此，时间常数的确定是第一延迟时间源，而被限制到最大绝对变化的通过时间常数所进行的信号增益调适是第二延迟时间源。通常，可能期望具有较长的延迟时间以提高确定响度时的准确性和时间常数的准确性。另一方面，硬件要求可对最大可接受的延迟时间施加限制，例如，由于有限的存储器。

此外，由于这样的延迟时间，会发生例如在一个信号块内或在两个连续信号块内在几个数字采样内有信号级的即时上升的情况。因为所确定的响度的延迟时间和/或时间常数的调适的延迟时间，这可能会造成未能足够快速地降低信号增益而使得输出信号级高于最大级（即，预定的阈值）的情况。由于达到数字全量程（即，0dBFS）的硬件原因，可达到最大级。因而，可能发生音频剪辑，从而导致如用户所感知的音频播放质量的非期望的降级。

为了在输入信号级发生从非常寂静到非常响的快速变化时避免输出信号级变得大于0分贝全量程，可能会提供增强的数字净空。然而，数字净空导致衰减的总体输出信号级并因此不得不在信号处理期间对其进行补偿。这对于满足相对于最大声压级的系统要求是必需的。这样一种为了扩展的数字净空的补偿通常要求在信号处理的不同阶段的系统的调整，其可以是复杂并耗时的。

对于此方面，在实施方案中，增益确定单元35被配置来不仅基于时间常数而且也基于从峰值检测器36获得的输入信号级确定增益。通过基于输入信号级和时间常数预测输出信号级，可能能够调适信号增益使得音频输出信号的信号级保持在预定的阈值以下和/或保持在0分贝全量程以下。

在图3中，进一步图示了时间常数。通过时间常数26a、26b、26c单独地示出音频输入信号的不同块61、62、63、64。时间常数26a、26b、26c指示应该如何经由信号增益70的调适将响度从一个采样到下一个采样进行调适。时间常数可以是上升时间常数26a或下降时间常数26b或恒定时间常数26c。上升时间26a常数指示信号增益如何从一个采样到下一个采样增加，而下降时间常数26b指示增益从一个采样到下一个降低。恒定时间常数26c使增益70保持不变。这在图3下部中进行了图示。基于使用时间常数的响度调适，通过例如图2的增益确定单元确定针对每个块的增益70。从而可在始于先前块的增益的线性斜坡中获得针对特定块的增益。不同的增益变化是可能的。

可先确定针对比图3中描述的那些块61-64小的块（即，包含更少的数字采样的块）的响度。形成平均值可产生针对图3的块61-64的响度。

在一个实施方案中，以上升时间常数可以比下降时间常数可以降低增益更快速地提高增益（即，上升时间常数可允许的最大绝对信号增益变化大于下降时间常数可允许的最大绝对信号增益变化）的方式确定时间常数26。举例来说，如果在两条轨道之间或在某一轨道内确定了信号暂停，则不应该增加输出音频信号级以避免噪声的放大，即，应该将小信号增益施加到音频输入信号。当新轨道开始时，高信号级可直接发生在非常低的信号级之后。可能不得不快速地调适响度估计的上升时间常数以避免在新轨道开始时的输出信号级太小。下降时间常数可仅允许同增加相比信号级的较慢降低。

而在另一个实施方案中，以下降时间常数可以比上升时间常数可以增加增益更快速地降低增益的方式确定时间常数26。当要避免在轨道的结尾处或在暂停中的噪声的放大时，可能需要这样。

此外，时间常数是调适时间常数，意指与时间常数关联的反应时间随着推进轨道的播放时间而降低，即，增加增益调适的延迟时间，以在轨道内获得更长的播放时间。换句话说，时间常数将在轨道开始时迅猛地调适增益，而对于轨道的结尾，调适强度降低。这可以对于提高和降低时间常数有效。平滑的响度估计也保证了以像人类感知响度的方式的响度预测。通过人类听觉系统消除了快速峰值和骤降。如果确定了轨道中或两条轨道之间的暂停，则可重新设定调适时间常数。先前图2中的暂停检测单元33表示在信号分析单元30中进行的暂停检测。

在图4中，进一步图示了增益确定单元35中的增益的调适。在图4的上部中，描述了音频输入信号（例如，音乐轨道）的依据时间的估计的响度。未描述轨道的不同块。基于所描述的响度，调适增益70，如图4的下部中所示。例如，标记为T1的时间间隔内的估计的响度几乎保持恒定。仅仅出现响度的快速变化，由于如相对于图3先前讨论的时间常数所引入的延迟时间，对于增益70的调适，不考虑这种快速变化。

随后，在标记为T2的时间间隔中，发生了响度的平稳增加。结果，增益相应地降低。通过如之前讨论的下降时间常数实现了这种情况。相应情况发生在标记为T3的时间间隔中，其中响度平稳地降低，从而导致增益70的平稳增加。这通过提高时间常数来实现。

在标记为T4的时间间隔中，出现如相对于时间间隔T1所讨论的相似情况。随后，在时间间隔T5中，发生了响度的快速增加。经由下降时间常数，增益70相应地降低。然而，通过下降时间常数的最大可允许的变化率来限制增益70的最大变化。在时间间隔T5的结尾处处，这导致了用增益70放大音频输入信号使得音频输出信号的信号级变得接近预定的阈值的情况。

为了避免输出信号级达到预定的阈值，在时间间隔T6中，增益70快速地降低。由于从峰值检测器36获得的输入，这发生在增益确定单元35中，参见图2。基于音频输入信号级并基于从时间常数生成单元32获得的时间常数，可能能够例如经由处理器在增益确定单元35中预测或建立仅仅基于时间常数确定的输出信号级将高于预定的阈值。这种建立可以在未实际放大音频输入信号以获得音频输出信号的情况下发生。

换句话说：系统的延迟时间由于时间常数的使用和针对信号块的响度确定而被指示信号增益过高的峰值检测所覆盖。通过这样，将输出信号级维持在预定的阈值以下变得可能。

时间间隔T7对应于时间间隔T1和T4（其中未执行增益的调适）。同样地，在时间间隔T9中，未发生增益的调适。在时间间隔T8中，由于估计的响度的下降，经由上升时间常数执行增益70的平稳增加。

如从图4可以看出的，可能能够使用保留快速动态的时间常数在增益调适中维持特定的延迟时间，而同时避免输出信号级变得大于预定的阈值。

在图5的上部中，在全量程中示出了音频输入信号的信号级，意指0分贝全量程分配到数字域中的最大可能信号级。如可从图5的上部看出的，信号级和因此还有对应于如用户感知的信号的响度级变化很大。在图5的下部中，从信号输入级估计对应的响度。在本申请中，可通过双耳定位模型来估计响度。在图6中，示出了图5的信号的经过调节的级别。举例来说，范围R1中的信号采样被调适到较低信号级，而范围R2中的信号被调适到较高信号级，以便使用户获得良好感知。类似地，以剧烈降低的信号级输出范围R3中的信号。

在图6的下部中，示出了上部中经过调节的级别的对应估计的响度。当图5的下部与图6的下部相比时，可以推断：同如图5所示的响度估计相比，如图6所示出的响度估计可能更适合在有背景噪声的情况下播放。相对于图5的响度估计，图6的响度估计可被更好地感知。在这里达到平滑、相对恒定的响度并将其可视化。具体来讲，获得-12分贝的平均响度级。此外，在范围R3中，避免具有高于阈值的信号输出级。

在图7中，图示示出根据实施方案的方法的流程图。该方法开始于步骤S1。在步骤S2中，接收音频输入信号。音频信号可以例如是从诸如CD、DVD、无线电、硬盘驱动器等音频源获得的娱乐音频信号。

接下来，在步骤S3中，建立音频输入信号的当前输入信号级。这称为峰值检测。可针对单一数字采样或针对包含一定数量的数字采样的信号块确定输入信号级。

随后，在步骤S4中，娱乐音频信号分析发生例如在信号分析单元中。这包括音频输入信号的响度的确定。响度针对音频输入信号的信号块而确定。这对应于使用延迟时间的响度的确定。基于所确定的响度，在步骤S4中确定时间常数，其指定信号增益从信号块到信号块的调适。具体来讲，确定时间常数使得信号增益从块到块的变化率不超过最大绝对信号增益变化。这对应于使用延迟时间的响度的调节。

此外，在步骤S4中，基于所确定的时间常数，例如在增益确定单元中确定信号增益。信号增益还基于在步骤S3中已经作为峰值检测的部分而建立的当前输入信号级而确定。基于当前输入信号级和信号增益，可能能够预测信号输出级。在步骤S5中指示了这种情况，其中例如经由时间常数检查是否所确定的信号输出级高于预定的阈值。如果信号输出级高于阈值，则在步骤S6中，调适信号增益使得将信号输出级维持在步骤S6中的预定的阈值之下。为此，可基于输入信号级和信号增益建立音频输出信号的估计的输出信号级。

随后，在步骤S7中，使用在例如增益单元中所确定的信号增益来放大或衰减音频输入信号。在步骤S8中，将音频输出信号向例如扬声器输出或输出用于进一步的后处理。通常，进一步的后处理可以包括步骤S9，即，基于用户的音量设定的音频输出信号的放大。该方法在步骤S10终止。

尽管本文公开了本发明的具体实施方式，但是在不脱离本发明范围的情况下可以做出多种变化和修改。从各个方面均要将这些实施方式当成是说明性和非限制性的，并且符合权利要求书的含义和等同范围内的全部变化均将包含在权利要求书中。

Claims

1.一种调适信号增益的方法，所述方法包括：

-接收包含连续信号块(61,62,63,64)的音频输入信号(18)，

-建立所述音频输入信号(18)的当前输入信号级，

-使用所述音频输入信号(18)的当前信号块(61,62,63,64)的信号级范围基于人类听力的心理声学模型确定所述音频输入信号(18)的所述当前信号块(61,62,63,64)的被感知的响度，

-基于时间常数(26a,26b,26c)并基于所述当前输入信号级确定所述当前信号块(61,62,63,64)的信号增益(70)，所述时间常数(26a,26b,26c)描述所述信号增益(70)从一个信号块(61,62,63,64)到另一信号块(61,62,63,64)的变化，

其中基于所述当前信号块(61,62,63,64)的所述被感知的响度和先前信号块(61,62,63,64)的所述被感知的响度确定所述时间常数(26a,26b,26c)，

-用所确定的信号增益(70)来放大所述音频输入信号(18)以获得音频输出信号(19)。

2.根据权利要求1所述的方法，其中

确定所述信号增益(70)，使得所述音频输出信号(19)的输出信号级总是小于预定的阈值。

3.根据权利要求1或2所述的方法，还包括：

-确定所述时间常数。

4.根据权利要求1或2所述的方法，其中上升时间常数(26a,26b,26c)被用来获得所述音频输出信号(19)的两个连续信号块(61,62,63,64)之间的提高的信号增益(70)，而下降时间常数(26a,26b,26c)用来获得所述音频输出信号(19)的两个连续信号块(61,62,63,64)之间的降低的信号增益(70)。

5.根据权利要求1或2所述的方法，其中，以对一定数量的信号块(61,62,63,64)平均后得到的所述音频输出信号(19)的平均输出信号级等于预定的值的方式，来确定所述信号增益(70)。

6.根据权利要求1或2所述的方法，其中，以对一定数量的信号块(61,62,63,64)平均后得到的所述音频输出信号(19)的平均响度等于预定的值的方式，来确定所述信号增益(70)。

7.根据权利要求1或2所述的方法，其中，以下降时间常数(26a,26b,26c)在连续信号块(61,62,63,64)之间比上升时间常数(26a,26b,26c)允许更大的最大绝对信号增益变化的方式，来确定所述时间常数(26a,26b,26c)。

8.根据权利要求7所述的方法，还包括：

-基于所述当前输入信号级和所述信号增益(70)建立所述音频输出信号(19)的估计的输出信号级。

9.根据权利要求8所述的方法，其中如果所述估计的输出信号级高于预定的阈值，则增加上升或下降时间常数(26a,26b,26c)可允许的所述最大绝对信号增益变化。

10.根据权利要求1或2所述的方法，还包括：

-在将音频输入信号输出前将延迟时间包括到所述音频输入信号(18)中，其中所述延迟时间与确定所述信号增益(70)所需的时间相关。

11.根据权利要求1或2所述的方法，其中每个信号块(61,62,63,64)包含预定数量的数字采样。

12.根据权利要求1或2所述的方法，其中进一步基于所述音频输入信号(18)的信号统计数据来确定所述被感知的响度。

13.一种用于调适信号增益(70)的系统，包括：

-峰值检测器(36)，其被配置来接收包含连续信号块(61,62,63,64)的音频输入信号(18)，并动态地建立所述音频输入信号(18)的当前输入信号级，

-响度确定单元(31)，其被配置来使用所述音频输入信号(18)的当前信号块(61,62,63,64)的信号级范围基于人类听力的心理声学模型动态地确定所述音频输入信号(18)的所述当前信号块(61,62,63,64)的被感知的响度，

-时间常数生成单元(32)，其被配置来基于所述当前信号块(61,62,63,64)的所述被感知的响度和先前信号块的所述被感知的响度来确定时间常数(26a,26b,26c)，所述时间常数(26a,26b,26c)描述所述信号增益(70)从一个信号块(61,62,63,64)到另一个信号块(61,62,63,64)的变化，

-增益确定单元(35)，其被配置来基于所述时间常数(26a,26b,26c)并基于所述当前输入信号级来确定所述当前信号块(61,62,63,64)的所述信号增益(70)，

-增益单元(41)，其被配置来使用所述信号增益(70)来放大所述音频输入信号(18)以获得音频输出信号(19)。

14.根据权利要求13所述的系统，其被配置来执行根据权利要求2-12中任一项所述的方法。