CN102016984B

CN102016984B - 用于动态声音传送的系统和方法

Info

Publication number: CN102016984B
Application number: CN2009801158414A
Authority: CN
Inventors: J·C·塔恩泽
Original assignee: Dolby Laboratories Licensing Corp
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 2008-05-02
Filing date: 2009-05-01
Publication date: 2013-08-28
Anticipated expiration: 2029-05-01
Also published as: MY151363A; KR101541452B1; CA2722883A1; CN102016984A; AU2009242464B2; BRPI0911587A2; KR20110002494A; ES2548977T3; EP2283484A4; WO2009135192A1; JP2013117734A; BRPI0911587B1; US8085941B2; CA2722883C; AU2009242464A1; JP2011523086A; US20090274310A1; KR20130115382A; EP2283484B1; JP6104629B2

Abstract

一种用于例如音频重放系统(例如双向通信系统、移动电话、MP3播放器等)的动态范围操控系统获得重放位置处的环境噪声的度量，并且基于该度量以及基于待重放的音频信号而调整提供给扬声器的驱动信号的增益。

Description

用于动态声音传送的系统和方法

技术领域

本发明涉及例如在双向通信系统(诸如蜂窝式电话和无线电话机)中的音频重放。

背景技术

环境噪声有时可能干扰音频信息的传送。例如在远端谈话者处在离近端收听者远的位置处的双向通信系统中，在对收听者的位置处的噪声状况一无所知的情况下，谈话者可能不采取措施来补偿破坏性噪声事件(瞬时的或是持续的)的发生。例如，不知道在收听者位置处有车辆经过的谈话者可能不提高他/她的话音来保持收听者的可听度，而且即使系统能够电气地和机械地处理这种补偿，谈话者的话语也可能不被收听者听到或者理解。收听者在这些情况下不能辨析谈话者的讲话的原因是公知的被称为“掩蔽”的心理物理现象，即，当足够大声时，本地噪声遮盖(或者说，掩蔽)了所重放的远端声音信号。这个问题当然不仅限于双向通信系统，并且环境噪声可以相似地干扰预先记录的话音、正在重放的任何预先存储的音频信息。

发明内容

如在此所述，一种动态范围操控系统包括：第一输入，被配置为提供信息信号；第二输入，被配置为提供噪声指示信号；以及处理器，被配置为接收所述信息信号和所述噪声指示信号，并且生成基于所述信息信号和所述噪声信号的功率的确定而增益受控的输出信号。

进而如在此所述，一种音频重放设备包括：信息源，被配置为提供信息信号；扬声器，被配置为根据重放驱动信号呈现音频信息；噪声指示信号源，被配置为提供基于在所述扬声器的位置处的环境噪声的噪声指示信号；以及处理器，被配置为作为所述信息信号和所述噪声指示信号的函数生成所述重放驱动信号，所述处理器实现基于所述信息信号和所述噪声信号的功率的确定的重放信号的增益控制。

此外，在此描述了一种用于补偿重放位置处的环境噪声的方法。该方法包括：接收指示环境噪声的环境噪声信号；接收信息信号；以及生成输出信号，所述输出信号作为所述环境噪声信号和所述信息信号中的功率的函数被控制增益。

附图说明

合并到说明书中并且构成说明书的一部分的附图示出一个或多个实施例的示例，并且连同示例实施例的描述一起用于说明实施例的原理和实现方式。

在附图中：

图1A是使得两个用户能够远距离地彼此通信的双向音频通信系统100的示图。

图1B是图1A的通信系统100的通信设备102的框图。

图2是动态声音传送系统的框图。

图3是可以构成图2的处理器202(以及图1B的控制器110)的一部分的动态范围操控系统300的框图。

图4是与标准短时傅立叶变换(STFT)处理有关的框图。

图5是动态范围操控处理的流程图。

图6是图5的处理的实现中所使用的处理模块或电路的框图。

图7A是各种压缩/扩展曲线的图示。

图7B是分频带(sub-band)的增益轮廓。

图7C是用于驱动扬声器206的重放信号的电平的轮廓。

具体实施方式

在此在用于动态声音传送的系统和方法的上下文中描述示例实施例。本领域技术人员应认识到，以下描述仅仅是说明性的，并非意图以任何方式进行限制。其它实施例对于受益于此公开的本领域技术人员而言将容易地被想到。现将详细参照附图中所示的示例实施例的实现。相同的附图标记将在可能的程度一直在附图中使用，并且以下的描述用于表示相同或相似的事物。

为了清楚，没有示出和描述在此所描述的各实现的所有常规特征。当然，应理解，在任何这样的实际实现的开发中，必须做出大量实现特有的判断以实现开发者的特定目的(例如遵从应用和商业有关的约束)，并且这些特定目的将因实现以及开发的不同而变化。此外，应理解，这样的开发努力可能是复杂且耗时的，但对于受益于本公开的本领域技术人员来说将仍是常规工程动作。

根据本发明，可以使用各种类型的操作系统、计算平台、计算机程序和/或通用机器来实现在此描述的组件、处理步骤和/或数据结构。另外，本领域技术人员应认识到，在不脱离在此公开的本发明的构思的范围和精神的情况下，也可以使用具有较不通用特性的设备，例如硬连线的设备、现场可编程门阵列(FPGA)、专用集成电路(ASIC)等。其中，包括一系列处理步骤的方法通过计算机或机器被实现，并且这些处理步骤可被存储为机器可读的一系列指令，它们可被存储于有形介质上，该有形介质例如为计算机存储设备(例如ROM(只读存储器)、PROM(可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、FLASH存储器、跳线驱动器(Jump Drive)等)、磁存储介质(例如磁带、磁盘驱动器等)、光存储介质(例如CD-ROM、DVD-ROM、纸卡、纸带等)、以及其它类型的程序存储器。

在使用数字信号处理所实现的处理的上下文中呈现在此描述的示例实施例。应认识到，可以通过可替换的实现方式(例如使用模拟电路)来实现每一处理步骤。虽然支持模拟实现的硬件将显得不同于数字域中的硬件实现，但各相应处理步骤的基本特性是等同的。因而，在此描述的处理预期可应用于模拟域或数字域中的任何硬件实现。

图1A是使得两个用户能够远程地进行彼此通信的双向音频通信系统100的示图。每位用户配备有通信设备102，图1B的框图更详细地示出通信设备102。各通信设备102包括麦克风104、扬声器106、收发器108以及处理器或控制器110。在第一通信“电路”中，远程或远端位置处的用户的话音由该用户的位置处的通信设备102的麦克风104拾取，并且通过无线方式或另外的方式被发送，以由本地或近端用户的位置处的通信设备102的扬声器106重放。相似地，在第二通信“电路”中，本地或近端位置处的用户的话音由近端通信设备102的麦克风104拾取，并且由远程或远端位置处的扬声器106重放。

通信系统100被看作双向系统，因为它包含所描述的两个通信“电路”。然而，应理解，在此描述的实现单独涉及通信“电路”，故此不限于双向系统。甚而，它们也可应用于单向系统，在该单向系统中，本地或近端用户仅能够收听到远程用户，并且未被配备为可对远端用户说话，反之亦然。甚至更一般地，在此描述的实现可应用于这样的系统，即不管音频信息(诸如音乐、声音信号和预先记录的话音)的源的状态或位置如何，该系统都可专用于重放或者呈现音频信息，而不需要包含远程用户或音频源。这样的系统包括例如便携式音频系统以及非便携式音频系统，例如随身听、光盘播放器、家庭立体声、电视机、个人数字助理(PDA)等。在这样的系统中，不同于双向通信系统100，重放不一定被实时实现，也就是说，音频信息不一定是在其被创建的同时呈现。

返回图1B，在该示例中预期由收发器108发送的信息是声音信号(例如用户的话音)，其被麦克风104拾取并且被转换为电信号，该电信号被直接地或经由所描述的控制器110转发到收发机。当经过控制器110时，拾取的信息可根据要在通信系统100的各设备102之间观测的协议和/或特定应用被包装(packaging)为合适传输的形式。在这种包装操作(其可以是多种类型的调制中的一种)之后，例如，信息被转发到收发器108以便传输。反之，收发器108用于通过无线方式或其它方式将其接收到的信息转发到控制器110，该控制器110用于“解包(unpackaging)”，并且如下详述的那样用于处理并且操控，以使得当信息在扬声器106进行重放期间被转换为声学形式时，该信息依旧是可懂的——或者尽可能多地保留其原始消息或特征——而不管倾听中的用户所处的噪声环境如何。

收发机108被配置为进行信息的发送和/或接收，并且可表现为单个组件的形式。可替换地，可使用专用于这两种功能中的每一种的分离组件。发送操作可经由例如经调制的无线电信号无线地进行、或者使用传统电缆连接以有线方式进行、或者甚至使用光纤或通过视线光学地进行。

由于在图1A和图1B的示例中，远端谈话者处于远离近端收听者的位置处，因此谈话者可能不知道收听者的位置处的噪声状况，并且由于谈话者可能不知道在收听者的远距位置处的破坏性噪声事件(瞬时的或持续的)的发生，因而谈话者可能不采取措施来补偿它们的发生。给出一个简单的示例，未察觉到在收听者位置之处有车辆经过的谈话者可能不提高话音来保持他/她的对于收听者的可听度，并且即使该系统能够电气地和机械地处理这种补偿，但他/她的话语可能不被收听者听到或者理解。收听者在这些情况下不能辨析谈话者的讲话的原因是被称为“掩蔽”的公知心理物理现象，即，当足够大声时，本地噪声遮盖(或者说，掩蔽)了重放的远端声音信号。然而，如在此所述的，可以使得控制器110察觉到破坏性音频事件，并且该控制器(如果必要的话，其它组件)可被配备以采取必要措施来补偿它或者使得它的影响最小化。

如上所述，虽然在此的描述可是在双向通信系统的上下文中，但这并非意图进行限制，还可想到这样的系统，该系统专用于实时地或以其它方式重放音频信息(诸如音乐、声音信号和预先记录的话音)，而不管音频信息的源的状态或特性如何。图2示出这种通用化的应用，其中，在动态声音传送系统200中，处理器202对音频信息源204提供的音频信息进行操作，在以输出驱动或重放信号的形式将其传送给用于向用户进行呈现或重放的扬声器206之前，操控该信息并且采取必要措施来补偿受危及的收听环境状况。在系统200中，在重放位置处的环境音频噪声的表示或权重是由音频噪声指示器208生成的。在这些情况下，倘若尚未可用，那么重放系统可以配备一个麦克风。操控和补偿被实时进行，并且可是连续的或表现为离散瞬时采样的形式。表示或权重(下文中可以称之为环境噪声指数(indicia)或噪声指数)被提供给处理器202，处理器202使用它以及来自信息源204的信息信号在重放时进行必要的补偿。

可得出该指数的指示器208可以是简单的麦克风或麦克风(例如图1B的示例麦克风104)的阵列，其用于检测重放位置处的环境噪声。可替换地(或者作为补充)，噪声指数可被从在该系统中的其它地方执行的、或是在用于相同或相关的目的的或者用于完全不同目的的被连接的系统中执行的辅助处理操作得出。例如，在双向系统中，噪声指数可以是从在近端处被使用以在存在环境噪声的情况下增强外送音频信号的降噪算法而得出的。环境噪声的确定可通过这种降噪算法以各种方式获得，并且这种确定操作可被用于提供动态声音传送系统200改进重放所需的噪声指数。外送音频信号的降噪算法一般使用多频带方法，以产生通过相乘而应用于外送噪声信号的一组衰减值。所述衰减值可以是“0”至“1”之间的数。当应用于外送的有噪声的信号时，该衰减值通过衰减被认为大部分是或仅是噪声的有噪声的信号的部分，而不衰减或较少程度地衰减被看作期望信号的部分，来减少该信号中的噪声。动态声音传送系统200可以通过从“1”减去各衰减值来获得噪声指数。动态声音传送系统200可以将由此得出的“抗衰减”值应用于原始的有噪声的信号，由此从噪声指示器208得出噪声指数。此外，在以下详细讨论的一种变型中，可希望通过如下方式来使用衰减值自身：1)对它们进行平方，以便它们表示功率百分比，2)对各频带中得到的值进行求和，以获得每频带的非噪声功率的总百分比量度，3)计算各频带中的原始的有噪声的信号的总功率，4)将噪声百分比(其为100％减去非噪声功率百分比)乘以总功率，以得到各频带中的仅噪声的功率量度。

如下文更详细的解释的那样，图2的动态声音传送系统200可被配置为作为多频带动态范围处理器操作，其使用压缩操作来调整要在有噪声的近端环境中被重放的信号的动态范围。系统200可以将选择性的增益控制应用于被用于驱动扬声器206的输出重放信号，所述增益控制是来自信息源204的音频信息以及来自噪声指示器208的环境噪声状况(噪声指数)二者的函数。根据特定情况，输出驱动信号的各部分可以不经受压缩，或者甚至经受向下扩展。

图3是动态范围操控系统300的框图，该动态范围操控系统300可以构成图2的处理器202(以及图1B的控制器110)的一部分。处理器202可以包括具有与以下描述的功能不同的功能的其它处理模块或电路。虽然如上所述，动态范围操控系统300所执行的处理可以实现为单频带或多频带处理，但图3的示例涉及多频带方法。在此，多频带处理中的每个频带将称为分频带，将在两个分频带处理的上下文中讨论该示例实施例，但这并非意图进行限制。在示例实施例中，两个分频带之间的截频被选择为在大约1kHz处。低于1kHz的音频信号通常包含可指示语音响度的语音的元音声，而高于1kHz的音频信号通常包含更富含信息的辅音声。更具体地且仅作为示例，下分频带从大约50Hz延伸到大约1kHz，而上分频带从大约1kHz延伸到大约3.5kHz。作为两个分频带示例，信号处理模块306提供下分频带动态范围操控处理，而信号处理模块308提供上分频带动态范围操控处理。单频带实现仅需要信号处理模块306，其然后将被配置为包括整个期望的频谱，而多分频带实现需要如图3中虚线所示的信号处理模块所指示的附加的信号处理模块。

动态范围操控系统300在其第一输入301处接收音频噪声指示信号，并且将该信号提供给第一频率分解(frequency decomposition)模块302，在此，该信号被解析为频率单元(frequency bin)或频带。如上所述，音频噪声指示信号指示重放位置处的环境噪声。动态范围操控系统300在第二输入303处接收音频信息信号，并且将其提供给第二频率分解模块304。频率分解模块304同样将此音频信息信号解析为频率单元或频带。

在图1A和图1B的双向通信系统中，该音频信息信号代表来自远程远端位置的谈话者的话音，该话音由远端位置处的通信设备102的麦克风104拾取并且被发送到近端通信设备102，在此处该话音被重放。然而，更一般的是，音频信息来自于图2所示的信息源204，并且可以例如是所存储的音乐、预先记录的话音等，并且不一定限于被实时重放。

在示例性的两个分频带实施例中，频率分解模块302和304均将标准短时傅立叶变换(STFT)处理应用于来自输入301和303的各输入信号。参照图4的流程图400说明该处理。取得信号的时间采样(402)，并且将其划分为多个帧(404)，对这些帧加窗(window)(406)(包括乘法的加窗技术是已知的)。可以执行零填充(408)，并且在该示例中使用快速傅立叶变换(FFT)将被填充的时间数据的帧变换(410)到频域。其它可用的变换方法包括余弦变换、Hartley变换、小波变换等。作为示例，对于384个采样的帧，使用16比特字和8ksps(每秒千次采样)的采样率，这些采样通过完美重构音频窗而被加窗并且被填充为512个采样以增加结果的频率分辨率。因而获得总数257个频率“单元”(包括Nyquist频率和DC半单元(half-bin))。56个采样的帧前进(frame advance)用于每秒操作传送143帧。因而，控制处理以每秒143次的子采样率而操作，该采样率大大高于语音和收听的调制率(-30Hz)，但小于8ksps的原始采样率，以节省计算机功率。

在频域示例实施例中，各频率单元被集合成组或分频带。在该示例中，从1kHz到3.5kHz的单元的组形成一个分频带(“上分频带”)，从50Hz到1kHz的单元的组形成分离的、第二分频带(“下分频带”)。因而，分别构成音频噪声指示信号和信息信号的频域表示的两个单元集合均被划分为两个单元组或分频带，对于噪声指示信号和音频信息信号中的每一个提供高分频带和低分频带。

上述实施例是在频域中执行的。然而，在可替换的时域实施例中，可以通过带通滤波器实现频率分解。对于两个分频带的示例，存在两个带通滤波器的两个集合，其中，每个这种集合包括使得下分频带的关联频率范围通过的一个带通滤波器以及使得上分频带的关联频率范围通过的一个带通滤波器。两个带通滤波器的集合之一与噪声指示信号相关联，并且带通滤波器的集合中的一个与音频信息信号相关联。因而，在该示例性实施例中，存在执行频率分解处理的四个带通滤波器。

通过参照图5和图6描述的子处理器306、308产生动态范围操控控制信号，图5示出该处理的流程图，图6是在其实现中所使用的处理模块或电路的框图。对于数据的每一帧，对每一分频带执行图5所示的处理。对于下分频带和上分频带中的每一个，关联的子处理器306、308进行帧功率确定，其形成应用于被输出到扬声器206(图2)的重放驱动信号的增益控制的基础。为了分别得出对于噪声和信息信号的帧功率确定，将各信号的各频率单元的幅值进行平方，并且在分频带的频率范围上将来自该分频带的所有单元的结果相加在一起。这在图5的501、501’以及图6的601、601’被示出。每一帧功率确定操作通过601、601’(例如601a，图6)内的平方电路或模块以及模块601、601’的求和电路(例如601b，图6)而得以完成，该平方电路或模块执行幅值的平方运算以形成单元功率值，该求和电路执行每一信号的各分频带内的单元功率值的求和运算。所得的单元功率总和值然后被对数转换器603、603’(图6)转换(图5的503和503’)为对数单元功率总和值，为每个帧提供总共四个帧功率值：一个与下分频带中的噪声信号相关联，一个与下分频带中的信息信号相关联，一个与上分频带中的噪声信号相关联，一个与上分频带中的信息信号相关联。当然，平方运算仅是很多可能的功率确定方法之一，其它方法也可被想到。在本示例中，下分频带处理将噪声下分频带帧功率值的包括单元号3到单元号64在内的各单元功率值进行求和，并且也对信息下分频带帧功率值进行此处理。上分频带处理对于噪声上分频带帧功率值和信息上分频带帧功率值将包括单元号65到单元号224在内的各单元功率值进行求和。然后，如果希望的话，如图6中的604、604’所示，每一结果可通过乘以归一化值而得以归一化，归一化值例如可以是10，并且其可以对于每一分频带和每一信号而不同。

由此所获得的帧功率值因帧不同而变化，噪声帧功率值尤其如此，并且希望减少这种变化性。因此，所得的四个帧功率值的流穿过平滑滤波器605和605’，平滑滤波器605和605’跟踪各个帧功率值。优选的是，平滑化操作是在对数域中执行的，从而这四个流首先如上所述被转换为对数功率值的流。平滑化操作在图5中的505和505’被示出，并且通常是由图6中的低通平滑滤波器605和605’所执行的低通滤波处理。任何这样的低通滤波器是可应用的，但在此特定示例中，使用以下方程所描述的滤波器：

其中，P_i是当前帧、信号和分频带的被跟踪的功率，P_i-1是先前帧的被跟踪的功率，α和β是滤波器系数，S_i是当前帧、信号和分频带的经求和的功率，i是帧指数。在本示例中，使用值α＝0.83(典型值在从大约0.5到大约0.95的范围中)，β＝0.134(典型值在从大约0.01到大约0.5的范围中)。

因为噪声帧功率值具有比信息帧功率值更大的变化性，并且还可能需要较慢的响应来防止“泵激”声音特性被引入压缩系统的最终输出，所以通过应用(507)跟踪滤波器607(它们属于低通滤波器的类别，并且任何这样的滤波器通常可应用于该功能)来对两个分频带噪声帧功率值进行进一步平滑化。在示例性两个分频带系统中，该平滑化操作由如下方程描述：

N_i＝N_i-1+δ·|P_i-N_i-1|·(P_i-N_i-1) (2)

其中，N_i是当前帧和分频带的经平滑化的和被跟踪的噪声功率，N_i-1是先前帧的经平滑化的和被跟踪的噪声功率，δ是滤波器平滑系数。例如使用值δ＝0.4(典型值在从大约0.1到大约0.8的范围中)。

在此描述的示例性实施例中，平滑滤波器605和605’可以具有相同特性，并且如果它们被实现为DSP(数字信号处理器)代码，则相同代码可以用于这两个滤波器，并且通过添加跟踪滤波器607来实现用于噪声分量的跟踪滤波。可替换地，平滑滤波器605和跟踪滤波器607可被组合为单个滤波器，其可以具有大于滤波器605’的时间常数的时间常数。

从经平滑化的和被跟踪的噪声功率，根据以下方程对于每一分频带计算(509，609)压缩拐点值(knee value)：

K_i＝N_i+μ (3)

其中，K_i是当前帧的压缩拐点值，μ是偏移因子。使用值μ＝-1.2。

参照图7A中的曲线来解释压缩拐点值的意义，图7A以实线示出单位增益/零压缩曲线，以虚线示出由被示出在大约52dB处的阈值分离的向下扩展和适度压缩的组合，并且以点划线示出被阈值分离的向下扩展和强压缩。这三条“压缩”曲线中的每条曲线表示在不同的本地噪声电平的响应，其中，实线表示在低的60dB近端噪声电平的响应，虚线表示在较大的75dB近端噪声电平的响应，点划线表示在大的90dB近端噪声电平的响应。相关联的噪声电平自身是以水平线示出，实线噪声对应于实线“压缩”曲线，以此类推。压缩曲线的在各条对应噪声电平线之上的部分(或者更精确地说，在各条对应噪声电平线之下大约5dB以上的部分)表示可被近端收听者以合理的可懂度有效听到的部分。也就是说，已知人类可以理解大约-5dB信噪比(SNR)之上的语音。

在图7A的图线中可见，对于三条“压缩”曲线，虽然在它们之间对应噪声量不同，并且在它们之间压缩量不同，但基于相应近端噪声的可懂度范围中的每条“压缩”曲线的部分对于所有三条曲线是相似的。换句话说，通过使用相应于近端环境噪声而对压缩参数进行自动调整的控制处理，重放的驱动信号的动态范围可被调整，当本地噪声增加时将信号压缩到较小的动态范围，从而源自人的典型安静动态范围的信号将被压缩到表示近端噪声掩蔽电平之上的可听区域的动态范围。图线中的绝对电平是示例，但它们构成可以应用于通信系统的电平的合理表示。在示例图线中，各轴被定标为等效声学dB SPL。因而，输入信号轴表示在示例双向通信系统中用户能够直接倾听远端谈话者的情况下在用户耳朵处的远端信号的等效声学电平，输出信号轴表示扬声器所传送的声音的实际声学电平，噪声信号轴表示本地噪声的实际声学电平。

在511和611，该压缩拐点值连同经平滑化的信号功率一起被用于创建压缩增益(或衰减)，随后其被应用于输入信息信号的各分频带，以创建用于驱动扬声器206(图2)的输出信号。压缩增益定义如下：

G_{i} = if {K_{i} < η, 0, else if [P_{i} &GreaterEqual; η, (\frac{K_{i} - η}{μ - η}) \cdot (μ - P_{i}), else (\frac{K_{i} - η}{η}) \cdot P_{i}]} - - - (4)

其中，G_i是当前帧和分频带的以对数形式表示的压缩增益，η和μ是压缩增益参数。在该示例中，使用η＝0.4(典型值在大约0.1至大约2之间)，μ＝10(典型值在从大约1到大约100的范围中)。该方程的结果是图7B所示的增益轮廓，其中，在图7B中，出于绘图的目的，来自方程(4)的增益通过乘以10而转换为dB。

对于给定时刻并且对于特定分频带，方程4定义了压缩曲线，其中，压缩拐点值是单个变量。该方程的运算使得：各参数限定了表示安静状态下的最小等效可听SPL的最小输入信号电平、表示最大等效声学SPL的最大信号电平、以及表示当收听者在噪声环境中时意图保持可听度的最低声学SPL的压缩拐点阈值电平。对于图7A所示的曲线所示出的示例性实施例，最小等效输入声压级通过以上给出的参数值而设定为大约20dB。在该点(在图的绘线部分的左边)处，20dB SPL的等效输入信号电平将产生20dB SPL的等效输出信号电平，其以图表示是三条压缩曲线在曲线图的左侧边之外相交的点。此外，对于图7A所示的曲线所示出的示例性实施例，最大等效输入声压级通过参数值被设定为大约110dB。在该最大点(在图的绘线部分的右边)处，110dB SPL的等效输入信号电平将产生110dB SPL的等效输出信号电平。这在图上被看作是三条压缩曲线在曲线图的右侧边之外相交的点。第三，还对于图7A所示的曲线所示出的示例性实施例，压缩拐点阈值电平(在其之上产生压缩的输入信号的电平)通过以上给出的参数值而设定为大约52dB。在该输入信号电平处，压缩拐点(增益)值应用于信号。因而，在输入信号电平和压缩拐点值二者皆以对数项(dB)表示时，在该输入信号电平点处的压缩曲线的高度等于输入信号电平加上压缩拐点值。

使得该单一值压缩控制形象化的一种方式是：认识到最小点和最大点基本上是固定的，并且在这两个固定点处输出电平等于输入电平。为了有助于该形象化，假设橡胶带在这两个点之间被拉伸，并且通过在压缩拐点阈值电平的位置处将橡胶带升高等于压缩拐点值的量来应用压缩拐点值，则橡胶带将显现出即例如图7A所示的曲线的压缩曲线的形状。因而，通过应用方程4，单个压缩拐点值确定整个压缩曲线。

这种压缩控制方法的一个特征是在压缩拐点阈值的左边被创建的向下扩展，这由该区域中的压缩曲线的比1更陡峭的斜率(图7A)表现出。通过将该阈值选择为仅仅小于最低期望输入信号电平，防止了输入信号中所包括的低电平噪声分量的过度放大，并且作为替代，这些不需要的分量被抑制。

在方程4定义压缩增益G_i之后，该增益可被转换为如下线性形式：

{Gf}_{i} = 10^{\frac{G_{i}}{2}} - - - (5)

其中，Gf_i是当前帧和信号分频带的线性增益因子。因而，如方程(5)所示，对于该示例性实施例，通过如下操作将压缩增益从对数域转换回到线性域：将方程(4)给出的值除以“2”，并且计算10的该值次幂，以产生线性增益因子。这在图5中的513示出，由图6中的反对数转换器和扩展器613的一部分执行。该操作对于每一分频带产生每帧一个线性增益因子。

此时，存在与每一数据帧对应的两个分频带线性增益因子。通过将适当的线性增益因子分配给与每一分频带中的所有单元相关联的每一单元号，这些因子被扩展回到257个分离单元的增益因子(图5的513、图6的613)。零值被分配给不在任何分频带内的那些单元。由于相邻的分频带通常将具有不同的线性增益因子，因此如果不应用频率平滑化操作，则在跨越相邻分频带边界的增益中将存在阶跃，并且这样可能产生可听信号失真。在压缩增益被转换回线性域并且扩展为分离单元增益因子(513)之后，可应用跨越各频率单元增益因子的平滑化操作(图5的515)。如图6中的卷积器/样条内插器更详细示出的，平滑化操作可被可选地应用。通过使用已知为核(kernel)的一组递减值(其可以例如读自表614，或者据方程或其它这样的方法而算出)，卷积器/样条内插器615通过对平滑核与单元增益因子进行卷积来对跨越相邻分频带之间的过渡区的单元增益值进行平滑化。可替换地，已知为样条的短核可以乘以单元增益因子，以对跨越边界的因子进行平滑化。用于跨频率进行平滑化的其它方法是本领域公知的，并且可想到任何这样的方法。平滑化处理产生一组单元压缩增益，一个单元压缩增益与每一频率单元相关联。在517、617，这些得到的单元压缩增益通过将每一单元中的信息信号乘以对应的单元压缩增益而被应用于该信号。在图5中的519和图6中的619示出得到的每一分频带的经处理的输出信号。

在应用单元压缩增益之后，得到的衰减后的频率多频带信号519、619在公知的逆STFT交叠和相加处理中被组合。这被示出为图3中的信号重组(recomposition)块310。这种重组的结果是在312的经压缩的全频带输出信号，其为用于驱动扬声器206(图2)的输出信号。可替换地，在示例性时域实现中，在517、617(图5和图6)将每一限带分频带信号乘以其对应的分频带线性增益因子，并且在重组步骤或电路310中将每一分频带的多个经处理的输出信号加起来，以在312提供经压缩的全频带输出信号，其为用于驱动扬声器206(图2)的输出信号。

图7B所示的增益轮廓绘图示出分频带的增益轮廓。在图7B的增益轮廓绘图中，垂直轴是应用于被用于驱动扬声器206的重放信息信号的关联分频带的增益。可见，其为输入的来自指示器208的本地(近端)环境噪声的电平以及输入的来自信息源204的信息信号的瞬时电平二者的函数。图7C是用于驱动扬声器206的重放信号的电平的轮廓，其示出为输入的来自指示器208的本地(近端)环境噪声的电平和输入的来自信息源204的信息信号的瞬时电平二者的函数。

应注意，在用于噪声和信息信号二者的处理中，使用信号功率而非它们的幅值。通过使用信号功率，用于实现处理后的输出信号的计算能力需求得以最小化。然而，可替换地，也可以使用幅值，并且也想到这种操作。此外，通过滤波器在对数域而不是线性域执行平滑化操作，因而提供围绕对数平均值的对数对称性，这与线性域中的滤波操作明显不同。由于人的听力中的响度知觉被认为遵从对数特性，因此与线性域处理相比，该处理给出非常自然的声音结果。不过，这些特征并非意图进行限制，也可设想线性以及其它非线性的可替换方案。

如此所述，通过以上布置而实现的一个优点是通过控制压缩拐点值(在压缩阈值处应用的增益的值)来控制压缩操作。换句话说，在最大spl(例如110db spl，范围从90到120)以及在最小spl(例如20db spl，范围从10到40)处可将输出信号电平保持为输入信号电平(增益＝1)。然后，计算将在压缩拐点阈值处应用的瞬时增益(例如52db spl，范围从40到75)。压缩拐点阈值是这样的输入信号电平，即在该输入信号电平处，随着输入信号增大越过压缩拐点阈值，出现从向下扩展到压缩的转变。确定作为近端噪声的函数的将在压缩阈值处应用的增益(压缩拐点值)，并且得出基于该压缩拐点值的压缩/扩展曲线。通过这三个点之间的线性内插而简单地确定压缩曲线上的所有其它点(见图7A)。因而，对于任何一个帧和任何一个频带所应用的增益是输入信号振幅和压缩/扩展曲线的函数，并且压缩/扩展曲线自身是近端噪声电平的函数。因而，通过远端信号的振幅和近端噪声的振幅二者来控制所应用的增益。该方法意味着，仅需要计算一个数，并且这一个数可以定义整个压缩/扩展曲线(每帧、每分频带)。

因而，应理解，功率量度本身不是最重要的。更重要的是，所实现的是简化的计算操作，该计算操作不需要“简档”或存储，并且提供相应于远端信号电平和近端噪声电平两者的适当的压缩/扩展量。

虽然已经描述并且示出各实施例和应用，但具有本发明利益的本领域技术人员应理解，在不脱离在此公开的本发明构思的情况下，除了上述之外的很多修改是可能的。例如，跟踪信号(无论噪声或信息)的功率本质上是一种包络检测的形式，从而任何类型的包络检测(或包络跟随/跟随器)是在本发明的范围之内的。因此，本发明仅由所附权利要求的精神来限定。

Claims

1.一种动态声音传送方法，包括：

接收指示环境噪声的环境噪声信号；

接收信息信号；

作为所述环境噪声信号的电平的函数确定在预定信息信号阈值电平处的增益；

基于所述增益产生压缩/扩展曲线；以及

将作为所述信息信号的振幅和所述压缩/扩展曲线的函数的另一增益应用于所述信息信号以产生增益受控的输出信号。

2.根据权利要求1的方法，其中，所述压缩/扩展曲线基于所述增益以及基于在所述阈值电平之下的第一预定曲线点和在所述阈值电平之上的第二预定曲线点。

3.根据权利要求1的方法，所述方法对于所述环境噪声信号和所述信息信号中的至少一个在频带基础上执行，所述频带基础使用两个或更多个频带。

4.根据权利要求1的方法，进一步包括将所述环境噪声信号和所述信息信号中的至少一个解析为频率单元。

5.根据权利要求4的方法，进一步包括将各频率单元中的信号幅值进行平方，并然后对平方的信号幅值进行求和。

6.根据权利要求1的方法，其中，所述环境噪声信号是从包括一个或多个麦克风的麦克风系统获得的。

7.根据权利要求1的方法，其中，所述环境噪声信号是从用于与动态声音传送相同或相关的目的或者不同的目的的辅助处理操作获得的。

8.根据权利要求1的方法，其中，被表达为增益对信息信号电平的所述压缩/扩展曲线包括将在预定信息信号阈值电平处的增益与在所述阈值电平之下的第一预定曲线增益点连接以及与在所述阈值电平之上的第二预定曲线增益点连接的基本直的线。

9.一种动态声音传送设备，包括：

用于接收指示环境噪声的环境噪声信号的装置；

用于接收信息信号的装置；

用于作为所述环境噪声信号的电平的函数确定在预定信息信号阈值电平处的增益的装置；

用于基于所述增益产生压缩/扩展曲线的装置；以及

用于将作为所述信息信号的振幅和所述压缩/扩展曲线的函数的另一增益应用于所述信息信号以产生增益受控的输出信号的装置。

10.根据权利要求9的设备，其中，所述压缩/扩展曲线基于所述增益以及基于在所述阈值电平之下的第一预定曲线点和在所述阈值电平之上的第二预定曲线点。

11.根据权利要求9的设备，其中，所述用于确定的装置、用于产生的装置和用于应用的装置分别对于所述环境噪声信号和所述信息信号中的至少一个在频带基础上进行确定、产生和应用，所述频带基础使用两个或更多个频带。

12.根据权利要求9的设备，进一步包括用于将所述环境噪声信号和所述信息信号中的至少一个解析为频率单元的装置。

13.根据权利要求12的设备，进一步包括用于将各频率单元中的信号幅值进行平方的装置，以及用于对平方的信号幅值进行求和的装置。

14.根据权利要求9的设备，其中，所述环境噪声信号是从包括一个或多个麦克风的麦克风系统获得的。

15.根据权利要求9的设备，其中，所述环境噪声信号是从用于与动态声音传送相同或相关的目的或不同的目的的辅助处理操作获得的。

16.根据权利要求9的设备，其中，被表达为增益对信息信号电平的所述压缩/扩展函数包括将在预定信息信号阈值电平处的增益与在所述阈值电平之下的第一预定曲线增益点连接以及与在所述阈值电平之上的第二预定曲线增益点连接的基本直的线。

17.一种动态范围操控系统，包括：

第一输入，被配置用于提供指示环境噪声的环境噪声信号；

第二输入，被配置用于提供信息信号；

处理器，被配置用于：

接收所述信息信号；

基于所述增益产生压缩/扩展曲线；以及

18.根据权利要求17的系统，其中，所述压缩/扩展曲线基于所述增益以及基于在所述阈值电平之下的第一预定曲线点和在所述阈值电平之上的第二预定曲线点。

19.根据权利要求17的系统，其中，所述处理器能够对于所述环境噪声信号和所述信息信号中的至少一个在频带基础上操作，所述频带基础使用两个或更多个频带。

20.根据权利要求17的系统，其中，所述处理器将所述环境噪声信号和所述信息信号中的至少一个解析为频率单元。

21.根据权利要求20的系统，其中，所述处理器将各频率单元中的信号幅值进行平方，并然后对平方的信号幅值进行求和。

22.根据权利要求17的系统，其中，所述环境噪声信号是从包括一个或多个麦克风的麦克风系统获得的。

23.根据权利要求17的系统，其中，所述环境噪声信号是从用于与动态声音传送相同或相关目的或者不同目的的辅助处理获得的。

24.根据权利要求17的系统，其中，被表达为增益对信息信号电平的所述压缩/扩展曲线包括将在预定信息信号阈值电平处的增益与在所述阈值电平之下的第一预定曲线增益点连接以及与在所述阈值电平之上的第二预定曲线增益点连接的基本直的线。

25.一种音频重放系统，包括：

噪声指示信号源，被配置用于提供指示环境噪声的环境噪声信号；

信息源，被配置用于提供信息信号；

处理器，被配置用于：

基于所述增益产生压缩/扩展曲线；以及

将作为所述信息信号的振幅和所述压缩/扩展曲线的函数的另一增益应用于所述信息信号以产生增益受控的输出信号；以及

扬声器，被配置用于根据所述增益受控的输出信号呈现音频信息。

26.根据权利要求25的系统，其中，所述压缩/扩展曲线基于所述增益以及基于在所述阈值电平之下的第一预定曲线点和在所述阈值电平之上的第二预定曲线点。

27.根据权利要求25的系统，其中，所述处理器能够对于所述环境噪声信号和所述信息信号中的至少一个在频带基础上操作，所述频带基础使用两个或更多个频带。

28.根据权利要求25的系统，其中，所述处理器将所述环境噪声信号和所述信息信号中的至少一个解析为频率单元。

29.根据权利要求28的系统，其中，所述处理器将各频率单元中的信号幅值进行平方，并然后对平方的信号幅值进行求和。

30.根据权利要求25的系统，进一步包括一个或多个麦克风，所述一个或多个麦克风与噪声标记产生电路耦合以向其提供信号。

31.根据权利要求25的系统，其中，被表达为增益对信息信号电平的所述压缩/扩展曲线包括将在预定信息信号阈值电平处的增益与在所述阈值电平之下的第一预定曲线增益点连接以及与在所述阈值电平之上的第二预定曲线增益点连接的基本直的线。