CN104221284A

CN104221284A - 用于调平音频信号的响度变化的系统及方法

Info

Publication number: CN104221284A
Application number: CN201380019366.7A
Authority: CN
Inventors: 安德鲁·P·赖利; 迈克尔·史密瑟斯; 杰弗里·里德米勒
Original assignee: Dolby Laboratories Licensing Corp
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 2012-04-12
Filing date: 2013-04-02
Publication date: 2014-12-17
Anticipated expiration: 2033-04-02
Also published as: US10090817B2; US20150078585A1; EP2837094A1; WO2013154868A1; JP5827442B2; JP2015516762A; US20180234065A1; EP2837094B1; US9960742B2; CN104221284B; US9806688B2; US20180034429A1

Abstract

描述了用于对音频信号的响度变化进行调平的系统及方法。实施方式根据特定标准的响度测量使用感知调平算法和基于标准的响度测量一起来使音频处理伪声最小化，并且确保经处理的音频的测量响度接近于所要求的测量。可以离线地或者实时地使用这些系统和方法。

Description

用于调平音频信号的响度变化的系统及方法

相关申请的交叉引用

本申请要求于2012年4月12日提交的美国临时专利申请No.61/623,253和于2012年12月19日提交的美国临时专利申请No.61/739,545的优先权，在此通过引用将它们中的每个的全部内容合并到本文中。

技术领域

本公开内容一般地涉及信号处理，更具体地，涉及用于对音频信号的响度变化进行调平的系统及方法。

背景技术

在许多情况下，尤其对于广播电视网络，响度调平或者音频信号的响亮部分与柔和部分之间范围的自动减小是所希望的。差的创作实践导致电视节目、广告或这两者中响度级的广泛变化，并且具有明显不同的响度级的节目或广告频繁地连接。电视观众经常发觉他们自己对他们的电视或声音重放系统调节音量控制以弥补这些变化；然而，这些观众的反应时间经常不够快得足以避免烦扰。另外，一些节目(例如电影)具有非常高的动态范围。对家庭收听来说这些范围通常太宽，其中，听到对话所要求的音量位置可能产生很高响度级的音效和音乐，这可能干扰家中的其他人。

现有的用于响度调平的方法包括压缩器方法和限制器方法。这些方法在时间上对音频信号水平或功率进行积分。积分时间越短，算法就能够越快地测量和调整响度的短期波动。积分时间越长，平均响度受到的影响就越大，但是短期波动持续。通常，这些方法通过同时对整个音频信号，即，所有频率进行增益调整来进行操作。这可能导致可听伪声，例如“喘息效应”或“抽气效应”。最近，开发出了用于响度测量和调整的心理声学方法，例如于2007年4月26日公开的Seefeldt等人的美国专利申请公开No.2007/0092089A1中所描述的，在此通过引用将其全部内容合并到本文中。这些算法使用谱分析和人类听觉模型以随频率变化和随所测量的响度级变化的方式来调整音频。这些方法在调整毫秒到秒的时间尺度的短期响度中表现很好，具有非常少的可听伪声。

区别于响度级，也存在用于客观地测量音频信号的感知响度的方法。示例包括A加权、B加权和C加权功率测量以及响度的心理声学模型，例如在“Acoustics-Method for calculating loudness level”ISO 532(1997)和美国专利申请公开No.2007/0092089A1中所描述的。加权的功率测量通过以下方式操作：获得输入音频信号；施加加强更可被感知的敏感频率而削弱较不可被感知的敏感频率的已知的滤波器；然后在预定时间长度上对经滤波的信号的功率求平均。最近开发出的ITU-R BS.1770-2客观响度测量标准使用类似于B加权的加权滤波器，并且根据最终平均功率计算来消除音频信号的安静的或静音的部分。

心理声学方法通常更复杂，并且旨在更好地对人耳的工作进行建模。这种心理声学方法将信号划分成模仿耳朵的频率响应和灵敏度的频带，然后在考虑心理声学现象的情况下对这些带进行操作和积分，心理声学现象例如频率掩蔽和时间掩蔽以及具有变化的信号强度的响度的非线性感知。所有这些方法的目的在于得出与音频信号的主观印象密切匹配的数值测量。通常，这些方法对测量音频信号的例如其中音频信号长度是30秒或更多并且通常是数分钟或数小时的长期感知的响度是有用的。多年来，这些客观测量算法的发展和接受伴随有主观测试，即将客观算法的测量与人的收听进行比较。

最近，对于广播电视音频信号，尤其对于商业，对保持一致的响度的需求增长。政府的法规已经推动了这种需求，例如联邦通信委员会出版No.FCC 11-84，“Notice of Proposed Rulemaking：Implementation of theCommercial Advertisement Loudness Mitigation(CALM)Act”。由于广播者拥有具有已知的平均响度和动态的创作好的内容以及具有未知的平均响度和可能宽的动态的未知内容的混合，所以他们频繁地使用与最终到达电视观众的实时音频信号一致的响度调平设备。然而，当对音频信号进行水平调整时，通常对于短期行为优化响度调平器以使伪声最小化，因此，当使用长期测量进行测量时，所调平的音频信号不一定一致。即，所调平的音频的部分例如30秒或更多的所测量的响度是不一致的。

发明内容

因此，在本领域中需要能够执行短期无伪声的响度调平同时确保所调平的音频的长期响度与已知的测量标准匹配的实时调平方法。本发明的实施方式通过提供对音频信号的响度变化进行调平的系统和方法满足该需求和其他需求。

根据一种实施方式，描述了一种对音频信号的响度变化进行调平的方法。该方法包括：接收音频信号和音频信号的期望响度；消除音频信号中的伪声；测量音频信号的实际响度；使用音频信号的期望响度与实际响度之间的差来计算增益值；以及使用增益值来修改音频信号。

根据另一实施方式，描述了一种对音频信号的响度变化进行调平的系统。该系统包括：短期响度调平模块，其被配置成接收音频信号和音频信号的期望响度，并且消除音频信号中的伪声；长期响度调平模块，其被配置成测量音频信号的实际响度；响度到增益模块，其被配置成使用音频信号的期望响度与实际响度之间的差来计算增益值；以及音频修改模块，其被配置成使用增益值来值修改音频信号。在一种实施方式中，短期响度调平模块、长期响度调平模块、响度到增益模块和音频修改模块中的至少之一被包括在处理器中。

根据另一实施方式，描述了一种嵌入有计算机可执行指令的计算机可读介质，该指令用于执行以下步骤：接收音频信号和音频信号的期望响度；消除音频信号中的伪声；测量音频信号的实际响度；使用音频信号的期望响度与实际响度之间的差来计算增益值；以及使用增益值修改音频信号。

根据下面的详细描述，简单地通过示出示例实施方式和实现，包括对于实施本发明所预期的最佳方式，本发明的其他方面、特征和优点容易显见。在不脱离本发明的精神和范围的情况下，本发明也能够具有其他不同的实施方式，并且可以在各种方面对其若干细节进行修改。因此，附图和描述本质上被视为是说明性的而并非限制性的。

附图说明

图1是示出根据实施方式的用于实时地对音频信号的响度变化进行调平的系统的示意功能框图。

图2是示出根据实施方式的用于离线地对音频信号的响度变化进行调平的系统的示意功能框图。

图3是示出根据实施方式的用于实时地使用输入信号调整对响度变化进行调平的系统的示意功能框图。

图4是示出根据实施方式的用于离线地使用输入信号调整对响度变化进行调平的系统的示意功能框图。

图5是示出根据实施方式的用于实时地使用输入基准水平调整对响度变化进行调平的系统的示意功能框图。

图6是示出根据实施方式的用于离线地使用输入基准水平调整对响度变化进行调平的系统的示意功能框图。

图7是具有用于使机器执行本文中所描述的一种或更多种方法中的任意方法的指令集的机器的图形表示。

具体实施方式

描述了用于对音频信号的响度变化进行调平的系统及方法。在下面的描述中，为了说明的目的，阐述了大量具体细节以提供对示例实施方式的透彻理解。然而，对本领域技术人员来说显见的是，可以在没有这些具体细节的情况下或使用等同布置来实践实施方式。在一些情况下，以框图的形式示出了公知的结构和装置，以避免对实施方式的不必要的混淆。

现在参照附图，在附图中贯穿若干视图相同的附图标记指代相同的或相应的部分，图1是示出根据实施方式的用于实时地对响度变化进行调平的系统的示意功能框图。将音频信号110和音频信号的期望响度140输入到短期响度调平模块120中。短期响度调平模块120调整音频信号110以使听觉调平伪声如“抽气效应”和“喘息效应”最小化。短期响度调平模块120可以通过美国专利申请公开No.2007/0092089A1中所描述的方法来实现该调整，在此通过引用将其全部内容合并到本文中。

在一种实施方式中，短期响度调平模块120对数字脉冲编码调制(“PCM”)音频的5毫秒的时间间隔即5毫秒周期进行操作。在另一实施方式中，如在模拟系统中，短期响度调平模块120连续地进行操作。在又一实施方式中，短期响度调平模块120对数字系统中的每个PCM采样进行操作。

短期响度调平模块120也采用音频信号的期望响度140作为输入。在音频信号是PCM信号的数字系统中，以相对于全尺度PCM的分贝(dB)为单位表示期望响度140。例如，期望响度140可以是-24dB FS(全尺度)。

然后，将由短期响度调平模块120处理的音频信号传递至长期响度调平模块130。长期响度调平模块130根据所选择的客观响度测量标准例如ITU-R BS.1770-3(08/2012)来测量音频信号的实际响度。长期响度调平模块130每个周期，即，每当测量音频信号的实际响度时输出单个响度数。响度数表示音频信号的实际响度。在音频信号是PCM信号的数字系统中，以相对于全尺度PCM的分贝(dB)为单位表示响度数。

在一种实施方式中，将长期响度调平模块130设置为标称积分时间，例如30秒。该积分时间是长期响度调平模块130用来计算单个响度数的PCM采样的时间间隔。该功能可以比积分时间间隔更频繁地操作；然而，每当操作时，它输出这样的数：该数表示其接收到的最后一个“积分时间间隔”PCM采样上的测量。

在一种实施方式中，长期响度调平模块130以与短期响度调平模块120相同的速度例如每5毫秒进行操作。在其他实施方式中，长期响度调平模块130以比短期响度调平模块120更慢或更快的速度进行操作。例如，长期响度调平模块130可以每20毫秒进行操作，或者短期响度调平模块120每执行其功能4次长期响度调平模块130操作1次。

在一种实施方式中，长期响度调平模块130可以包括以下操作方式：仅当通常表示0.5秒的时间间隔的PCM采样的块由ITU-R BS.1770-1(2006-2007)(在此通过引用将其全部内容合并到本申请中)中所描述的算法分类为“会话”时才发生PCM采样的积分(以计算单个响度数)。该方法仅选通对音频信号的会话部分的响度测量。或者，对于实现对响度测量和控制的监管要求的地理区域(例如，荷兰、德国、奥地利、法国)，长期响度调平模块130可以以单独遵守ITU-R BS.1770-2(03/2011)或者ITU-R BS.1770-3(08/2012)(其指定基于水平的选通技术，并且在此通过引用将它们的全部内容合并到本文中)的模式来操作。

响度到增益模块150获得响度数并且将它与期望响度140比较。具体地，响度到增益模块150计算期望响度140与响度数之间的差，并且输出增益值。被音频修改模块170施加于所调平的音频以产生经修改的音频信号190的该增益使经调平的音频信号的长期测量更接近期望响度140。

增益值的计算包括一些速率限制以防止增益值变化太快和引起听觉伪声。当处理开始并且长期响度调平模块130还未接收足够的音频采样以输出相应的响度数时，这尤为重要。在一种实施方式中，响度到增益模块150以与长期响度调平模块130相同的速度例如20毫秒进行操作，并且在每20毫秒计算的每个增益值之间线性内插施加于经调平的音频信号的实际增益值。

可以根据以下等式来计算增益值(用分贝)。

D＝期望响度-响度数 (以dB为单位) [1]

H＝max(min(D，G_prev+T)，G_prev-T) [2]

G_{curr} = G_{prev} + \max (\min (D - H, \frac{R_{up}}{S}), \frac{R_{down}}{S}) - - - [3]

GV＝max(min(G_curr，Ｌ)，-L) [4]

其中:

T是滞后值，即增益调整中的变化需要超过该值以使增益值移动例如0.1dB。

R_up是每个时间间隔所允许的增益的最大增加，例如每秒0.04dB。

R_down是每个时间间隔所允许的增益的最大下降，例如每秒0.08dB。

S是增益值每秒被更新的次数，例如每秒50次。

G是响度到增益函数的内部状态，通常初始化为0dB。

L是对增益值设置的界限，例如±4dB。

GV是增益值。

图2是示出根据实施方式的用于离线地对响度变化进行调平的系统的示意功能框图。在离线调平中，捕获并存储整个音频信号，然后通过关于图1描述的方法对整个音频信号进行处理。短期响度调平模块220对音频信号210进行处理并且将其存储在存储器225中。长期响度调平模块230对整个音频信号或节目计算单个响度数。响度到增益模块250计算期望响度240与响度数之间的差作为增益值。将该增益值施加于音频修改模块270以产生经修改的音频信号290。

输入信号调整

输入到上面关于图1和图2描述的系统的音频信号可以具有与期望响度差距很大的平均水平。在这种情况下，系统几乎总是一致地对音频信号进行增强或者衰减。音频信号如已经被创作好了的音频信号，即它们具有相当一致的平均水平，但是例如由于当连接和配置各种广播音频设备时基准水平的不匹配，可以改变它们的整体水平。例如，期望响度可以是-24dBFS(全尺度)，并且输入音频信号的平均水平一致地在-36dB FS(全尺度)左右。在这样的示例中，短期响度调平模块总是将音频信号增强大约12dB。

在一种实施方式中，如果音频信号已经接近期望响度，则系统不会对音频信号进行调整。换言之，系统可以实施空带。因此，仅对空带以外的信号，即比期望响度显著更响亮或显著更安静的信号进行修改以使信号在水平上更接近期望响度。示例空带是比期望响度安静4dB和比期望响度响亮4dB之间的范围。

如果音频节目被创作好了但仅仅是被移动，则在将信号传递到短期响度调平模块之前，根据一种实施方式可以应用慢增益调整来移动音频信号的水平使得它的平均水平与期望响度大致相同。因此，短期响度调平模块将不会对音频信号产生很大影响，并且仅对短期过响信号进行衰减，并且仅对短期非常安静的信号进行增强。

图3和图4是分别示出根据实施方式的用于实时地和离线地使用输入基准水平调整来调平响度变化的系统的示意功能框图。将音频信号310传递到输出响度数的第一长期响度调平模块313。在音频是PCM信号的数字系统中，通常以相对于全尺度PCM的dB为单位来表示该数。在一种实施方式中，由长期响度调平模块313使用的客观响度测量方法与由图1的长期响度调平模块130使用的客观响度测量方法相同。

将长期响度调平模块313设置为标称积分时间，例如10秒。该积分时间是被模块用来计算单个响度数的PCM采样的时间间隔。长期响度调平模块313可以比积分时间间隔更频繁地操作；然而，每当操作时，它输出表示对已接收的最后一个“积分时间间隔”PCM采样进行测量的数。长期响度调平模块313可以以与短期响度调平模块120相同的速度例如每5毫秒或者以更慢或更快的速度进行操作。在一个示例中，长期响度调平模块313每20毫秒进行操作，或者短期响度调平模块120每操作4次长期响度调平模块313操作1次。

第一响度到增益模块314获得从长期响度调平模块313接收的响度数并且将它与期望响度140进行比较。响度到增益模块314计算期望响度与响度数之间的差，并且输出第一增益值。由第一音频修改模块317施加于音频信号310的该增益使音频信号310的长期测量更接近期望响度140。

第一增益值的计算包括速率限制以防止增益值变化太快和引起听觉伪声。当系统开始操作时这是尤为重要的，因为长期响度调平模块313尚未接收到足够的音频采样以输出相应的响度数。在一种实施方式中，响度到增益模块315以与长期响度调平模块313相同的速度例如每20毫秒进行操作，并且在每20毫秒计算的每个第一增益值之间线性内插施加于经调平的音频信号的实际增益。可以根据等式1至等式4计算第一增益值。

在实时调平中，在将音频信号310以第一增益值增益调整之后，将其传递到短期响度调平模块120并且根据关于图1描述的用于实时调平的系统对其进行处理。即，将经调整的音频信号传递至短期响度调平模块120、长期响度调平模块130、响度到增益模块150和音频修改模块170，以产生经修改的音频信号391。

在使用离线调平的实施方式中，长期响度调平模块313可以针对整个音频信号测量一个响度数。然后，可以通过期望响度140和来自长期响度调平模块313的测量之间的差对整个音频信号进行增益调整。一旦被调整，然后根据参照图2描述的系统对音频信号310进行处理。即，将经调整的音频信号传递至短期响度调平模块220、存储器225、长期响度调平模块230、响度到增益模块250和音频修改模块270，以产生经修改的音频信号392。

输入基准水平

在一种实施方式中，参照图1至图4描述的短期响度调平模块具有称为输入基准水平的输入。输入基准水平指示被传递到短期响度调平模块的音频信号的标称水平或平均水平。短期响度调平模块执行如下两个操作：在输入基准水平附近调整或调平音频信号，以及施加由期望响度与输入基准水平之间的差确立的固定增益。

在一个示例中，85对应于-31dB全尺度(FS)的标称水平或平均水平。输入基准水平(IRL)用分贝表示，并且可以通过下面等式5来计算。

IRL＝54-平均水平(dBFS) [5]

例如，-20dB全尺度(FS)的标称值对应于输入基准水平74。

作为示例，假设使用数字PCM信号，如果期望响度是-24dB FS并且输入音频信号的标称水平被输入基准水平指示为-10dB FS，则短期响度调平模块：(a)在-10dB FS的两侧对音频进行调平，即对明显比-10dBFS更安静的部分音频信号进行增强，而对明显比-10dB FS更响亮的部分音频信号进行衰减；以及(b)施加-24--10＝-14dB的大增益(bulk gain)，即14dB的衰减。换言之，短期响度调平模块的空带被移动到以输入基准水平或者在本示例中的-10dB FS为中心。

图5和图6分别示出了根据实施方式的用于实时地或离线地使用输入基准水平调整对响度变化进行调平的系统的示意功能框图。将音频信号传递至第一长期响度调平模块413。在音频是PCM信号的数字系统中，通常以相对于全尺度PCM的dB为单位来表示该数。在一种实施方式中，由长期响度调平模块413使用的客观响度测量方法与由图1的长期响度调平模块130使用的客观响度测量方法相同。

将长期响度调平模块413设置为标称积分时间，例如10秒。该积分时间是被模块用来计算单个响度数的PCM采样的时间间隔。长期响度调平模块413可以比积分时间间隔更频繁地操作；然而，每当它操作时，它输出表示对已经接收的最后一个“积分时间间隔”PCM采样进行测量的数。长期响度调平模块413可以以与短期响度调平模块120相同的速度例如每5毫秒或者以更慢或更快的速度操作。在一个示例中，长期响度调平模块413每20毫秒进行操作，或者短期响度调平模块120每操作4次长期响度调平模块413操作1次。

响度到基准水平模块415执行等式1至等式4的计算，然后根据下面的等式使用期望响度440将增益值转换成输入基准水平：

IRL＝54-期望响度+GV [6]

在实时调平时，在将音频信号410通过输入基准水平调整之后，将其传递至短期响度调平模块120，并且根据参照图1描述的用于实时调平的系统对其进行处理。即，将经调整的音频信号传递至短期响度调平模块120、长期响度调平模块130、响度到增益模块150和响度修改模块170，以产生经修改的音频信号491。

在离线调平中，在音频信号410由输入基准水平调整之后，根据参照图2描述的系统对其进行处理。即，将经调整的音频信号传递至短期响度调平模块220、存储器225、长期响度调平模块230、响度到增益模块250和音频调整模块270，以产生经修改的音频信号492。

图7以计算机系统500的示例形式示出了机器的图形表示，在计算机系统500中可以执行用于使机器执行本文中所讨论的方法中的任意一种或更多种方法的指令集。在替代实施方式中，机器作为独立装置操作或可以连接(例如，连网)至其他机器。在连网的部署中，机器在服务器-客户机网络环境中可以以服务器或客户端的身份作为主机进行操作，或者在点到点(或者分布式)网络环境中作为对等机进行操作。机器可以是个人计算机(PC)、平板计算机、机顶盒(STB)、个人数字助理(PDA)、蜂窝电话、web设备、网络路由器、交换机或网桥、游戏控制台、电视机、CD播放器、DVD播放器、BD播放器、电子阅读器或者能够执行指定要由机器采取的动作的指令集(顺序或以其他方式)的任何机器。此外，尽管仅示出了单个机器，但是也可以采用术语“机器”来包括单独地或共同地执行指令集(或多个指令集)以执行本文中所讨论的方法中的任意一种或更多种方法的机器的任何集合。

根据一些实施方式，计算机系统500包括处理器550(例如，中央处理单元(CPU)、图形处理单元(GPU)或两者)、主存储器560(例如，只读存储器(ROM)、闪存、诸如同步DRAM(SDRAM)或Rambus DRAM(RDRAM)的动态随机存取存储器(DRAM)等)和/或静态存储器570(例如，闪存、静态随机存取存储器(SRAM)等)，它们经由总线595相互通信。

根据一些实施方式，计算系统500还可以包括视频显示单元510(例如，液晶显示器(LCD)、发光二极管显示器(LED)、电致发光显示器(ELD)、等离子显示面板(PDP)、有机发光二极管显示器(OLED)、表面传导电子发射显示器(SED)、纳米晶体显示器、3D显示器或者阴极射线管(CRT))。根据一些实施方式，计算机系统500还可以包括字母数字输入装置515(例如，键盘)、光标控制装置520(例如，控制器或鼠标)、磁盘驱动单元530、信号生成装置540(例如，扬声器)和/或网络接口装置580。

磁盘驱动单元530包括其上存储有实现本文中所描述的方法或功能中的任意一种或更多种方法或功能的一个或多个指令集(例如，软件536)的计算机可读介质534。在由计算机系统500、主存储器560和处理器550执行软件期间，软件536也可以全部地或至少部分地驻留在主存储器560内和/或处理器550内。处理器550和主存储器560也可以构成分别具有指令554和564的计算机可读介质。此外，还可以经由网络接口装置580在网络590上发送或接收软件536。

尽管在示例实施方式中将计算机可读介质534示为单个介质，但是可以采用术语“计算机可读介质”包括存储一个或更多个指令集的单个介质或多个介质(例如，集中式或分布式数据库，和/或相关联的高速缓冲存储器和服务器)。还可以采用术语“计算机可读介质”包括能够存储、编码或携带由机器执行并且使机器执行所公开的实施方式的技术中的任意一种或更多种方法的指令集的任何介质。因此，可以采用术语“计算机可读介质”包括固态存储器以及光介质和磁介质，但不限于此。

应当理解的是，本文中所描述的处理和技术并非固有地与任何特定设备有关，并且可以由部件的任何合适的组合来实现。此外，可以根据本文中所描述的教示来使用各种通用装置。构造专用设备来执行本文中所描述的方法也证明是有利的。本领域的技术人员应当理解，硬件、软件和固件的许多不同的组合将适合于实践所公开的实施方式。

已经描述了与特定示例相关的实施方式，其意在在所有方面是说明性的而不是限制性的。此外，尽管已经结合大量示例和实现描述了实施方式，但是应当理解的是，可以在本发明的实施方式的范围内对示例做出各种修改和等同布置。

考虑本文中所公开的实施方式的说明书和实践，对于本领域技术人员而言其他实施方式将是明显的。可以单独地或以任意组合来使用所描述实施方式的各种方面和/或部件。意在将说明书和示例视为仅示例性的，而下面的权利要求表明本公开内容的真正范围和精神。

Claims

1.一种对音频信号的响度变化进行调平的方法，所述方法包括：

接收所述音频信号以及所述音频信号的期望响度；

消除所述音频信号中的伪声；

测量所述音频信号的实际响度；

使用所述音频信号的所述期望响度与所述实际响度之间的差来计算增益值；以及

使用所述增益值来修改所述音频信号。

2.根据权利要求1所述的方法，其中，所述音频信号是脉冲编码调制(PCM)信号。

3.根据权利要求1所述的方法，其中，根据客观响度测量标准来测量所述音频信号的所述实际响度。

4.根据权利要求1所述的方法，其中，当所述音频信号仅包括会话时测量所述音频信号的所述实际响度。

5.根据权利要求1所述的方法，其中，间隔地测量所述音频信号的所述实际响度。

6.根据权利要求1所述的方法，还包括：

存储所述音频信号，

其中，跨整个所述音频信号地测量所述音频信号的所述实际响度。

7.根据权利要求1所述的方法，还包括：

在消除所述音频信号中的伪声之前，将所述音频信号调整为具有与所述期望响度相等的平均响度。

8.根据权利要求1所述的方法，还包括：

在消除所述音频信号中的伪声之前，将与所述音频信号的所述期望响度和平均响度之间的差相当的固定增益施加于所述音频信号。

9.一种对音频信号的响度变化进行调平的系统，所述系统包括：

短期响度调平模块，被配置成：接收所述音频信号以及所述音频信号的期望响度，并且消除所述音频信号中的伪声；

长期响度调平模块，被配置成：测量所述音频信号的实际响度；

响度到增益模块，被配置成：使用所述音频信号的所述期望响度与所述实际响度之间的差来计算增益值；以及

音频修改模块，被配置成：使用所述增益值来修改所述音频信号。

10.根据权利要求9所述的系统，其中，所述短期响度调平模块、所述长期响度调平模块、所述响度到增益模块和所述音频修改模块中的至少之一被包括在处理器中。

11.根据权利要求9所述的系统，其中，所述音频信号是脉冲编码调制(PCM)信号。

12.根据权利要求9所述的系统，其中，所述长期响度调平模块被配置成根据客观响度测量标准来测量所述音频信号的所述实际响度。

13.根据权利要求9所述的系统，其中，所述长期响度调平模块被配置成当所述音频信号仅包括会话时测量所述音频信号的所述实际响度。

14.根据权利要求9所述的系统，其中，所述长期响度调平模块被配置成间隔地测量所述音频信号的所述实际响度。

15.根据权利要求9所述的系统，还包括：

存储器，

其中，所述长期响度调平模块被配置成跨整个所述音频信号地测量所述音频信号的所述实际响度。

16.根据权利要求9所述的系统，还包括：

响度到基准水平模块，被配置成将与所述音频信号的所述期望响度和平均响度之间的差相当的固定增益施加于所述音频信号。

17.一种嵌入有计算机可执行指令的计算机可读介质，所述计算机可执行指令用于执行以下步骤：

接收所述音频信号以及所述音频信号的期望响度；

消除所述音频信号中的伪声；

测量所述音频信号的实际响度；

使用所述增益值来修改所述音频信号。

18.根据权利要求17所述的计算机可读介质，其中，所述音频信号是脉冲编码调制(PCM)信号。

19.根据权利要求17所述的计算机可读介质，其中，根据客观响度测量标准来测量所述音频信号的所述实际响度。

20.根据权利要求17所述的计算机可读介质，其中，当所述音频信号仅包括会话时测量所述音频信号的所述实际响度。

21.根据权利要求17所述的计算机可读介质，其中，间隔地测量所述音频信号的所述实际响度。

22.根据权利要求17所述的计算机可读介质，还包括：

存储所述音频信号，

23.根据权利要求17所述的计算机可读介质，还包括：

24.根据权利要求17所述的计算机可读介质，还包括：